張士男 彭 絮 張閃閃
(1.對外經(jīng)濟(jì)貿(mào)易大學(xué)圖書館,北京100029;2.中國科學(xué)技術(shù)信息研究所,北京100038)
商業(yè)信息資源價(jià)格的持續(xù)高漲使人們獲取知識的代價(jià)過于高昂[1]。雖然近年來我國圖書館的經(jīng)費(fèi)始終保持增長態(tài)勢,但圖書館經(jīng)費(fèi)漲幅和資源價(jià)格漲幅間的差距越來越大,圖書館經(jīng)費(fèi)的“購買力”不斷下降成為趨勢[2]。開放獲取允許任何人都可以及時(shí)、免費(fèi)、不受任何限制地通過網(wǎng)絡(luò)獲取各類文獻(xiàn),開放獲取學(xué)術(shù)信息資源迅猛增長,正呈現(xiàn)逐步“成為學(xué)術(shù)研究主流資源”的趨勢[3],這為掣肘于資源采購經(jīng)費(fèi)的圖書館打開一扇窗。黃金霞[4]等從再利用的角度出發(fā),重新界定了廣義的開放資源,并按照來源將其歸納為出版類資源、倉儲類資源和交互式資源3 類。出版類資源強(qiáng)調(diào)同行評議、出版途徑、網(wǎng)絡(luò)免費(fèi)獲取,包括開放期刊、開放圖書、開放會議論文等。筆者以開放期刊和開放圖書為例,從影響用戶使用行為和資源再利用的維度,對商業(yè)與經(jīng)濟(jì)領(lǐng)域出版類開放學(xué)術(shù)資源現(xiàn)狀進(jìn)行調(diào)研分析,思考小型圖書館開放資源再利用的方式。
開放獲取學(xué)術(shù)信息搜索引擎極大地方便了用戶了解開放學(xué)術(shù)資源當(dāng)前進(jìn)展,開放獲取期刊目錄(Directory of Open Access Journals,簡稱 DOAJ)和開放獲取圖書目錄(Directory of Open Access Books,簡稱DOAB)通過目錄揭示開放獲取資源,最大限度地實(shí)現(xiàn)了開放資源的集成揭示,詳見表1。筆者以上述兩個(gè)平臺為數(shù)據(jù)來源,從其官網(wǎng)下載CSV格式元數(shù)據(jù)文件作為初始數(shù)據(jù),并對其進(jìn)行學(xué)科遴選、回查官網(wǎng)補(bǔ)充缺省項(xiàng)、處理亂字符、規(guī)范化表達(dá)元數(shù)據(jù)值等數(shù)據(jù)處理,對其收錄的商業(yè)與經(jīng)濟(jì)領(lǐng)域開放資源情況進(jìn)行統(tǒng)計(jì)分析,以期為財(cái)經(jīng)類院校圖書館資源建設(shè)和服務(wù)提供參考。數(shù)據(jù)存儲和處理工具為Excel,初始數(shù)據(jù)采集時(shí)間為2018年10月24日。
表1 開放獲取學(xué)術(shù)信息搜索引擎基本信息
續(xù)表1
DOAJ 采用美國國會圖書館分類法(Library of Congress Classification,簡稱LCC)進(jìn)行資源組織,不再設(shè)立商業(yè)與經(jīng)濟(jì)一級學(xué)科,而是將其細(xì)分為若干細(xì)類分散在一級大類“社會科學(xué)”之下。DOAB雖然在其頁面保留了商業(yè)與經(jīng)濟(jì)一級學(xué)科,但在其可下載的元數(shù)據(jù)信息中,同樣使用LCC 進(jìn)行主題標(biāo)引。結(jié)合平臺資源組織特點(diǎn),通過映射分析,確定商業(yè)與經(jīng)濟(jì)領(lǐng)域的學(xué)科范疇。
筆者從兩個(gè)維度進(jìn)行數(shù)據(jù)分析:一是影響用戶使用行為的語種、時(shí)間分布維度;二是與圖書館對開放資源再利用密切相關(guān)的開放程度、數(shù)據(jù)質(zhì)量控制維度。
DOAJ 共收錄了來自128個(gè)國家的12198種開放獲取學(xué)術(shù)期刊,其中9191種期刊的343.5 萬余篇文獻(xiàn)支持全文檢索和利用,包含879種商業(yè)與經(jīng)濟(jì)領(lǐng)域期刊。
(1)語種分布
879種期刊涵蓋32種語言,62.68%(551種)期刊為單語種期刊,8.87%(78種)期刊為雙語種期刊,使用排名Top3 的語種分別是英語(76.11,669種%)、印度尼西亞語(17.18%,151種)和西班牙語(16.38%,144種)。
(2)時(shí)間分布
879種期刊共有34種開放獲取起始年限,最早可供用戶獲取的期刊起始年是1961年。每年收錄的期刊數(shù)量整體呈現(xiàn)上漲趨勢。47.33%(416種)期刊全文從提交到出版時(shí)間間隔為12個(gè)星期以內(nèi),39.93%(351種)期刊全文從提交到出版時(shí)間間隔為13至24個(gè)星期。
圖1 期刊開放獲取起始年分布
圖2 每年收錄商業(yè)與經(jīng)濟(jì)領(lǐng)域期刊數(shù)量分布
(3)開放程度
·知識共享許可協(xié)議。期刊和論文在元數(shù)據(jù)層面的使用遵循CC by sa[7]。在全文數(shù)據(jù)層面,97.16%(854種)期刊遵循CC 知識共享許可協(xié)議,2.50%(22種)期刊遵循期刊自己的協(xié)議,0.34%(3種)期刊無法確定。使用最多的3種協(xié)議是CC by(41.75%,367種)、CC by-nc-nd(19.80%,174種)和CC by-nc(16.15%,142種)。
·機(jī)讀性。78.84%(693種)期刊全文允許第三方進(jìn)行數(shù)據(jù)抓取,49.72%(437種)期刊的全文具有永久標(biāo)識符,永久標(biāo)識符的類型包括DOI、Handles、ARK、IJDS Article ID、UDK、Doc、URN German National Library,其中95.88%(419種)期刊以DOI 作為期刊論文永久標(biāo)識符。
·數(shù)據(jù)重用。DOAJ 提供OAI-PMH 服務(wù),允許第三方機(jī)構(gòu)獲取期刊和論文層面元數(shù)據(jù),支持第三方按照學(xué)科領(lǐng)域進(jìn)行數(shù)據(jù)收割[8],提供期刊元數(shù)據(jù)CSV 格式文件下載。此外,DOAJ 還推出了兩個(gè)插件,允許用戶在自己的頁面嵌入預(yù)定義檢索結(jié)果或檢索框[9]。DOAJ 承諾其提供的所有服務(wù)和元數(shù)據(jù)免費(fèi)重用[10]。為了更加方便用戶重用數(shù)據(jù),提供更加優(yōu)質(zhì)的服務(wù),DOAJ 將優(yōu)化其OAI-PMH 接口以減少深分頁和高內(nèi)存使用;定期創(chuàng)建整個(gè)數(shù)據(jù)集的轉(zhuǎn)儲,便于用戶更容易地訪問其完整的數(shù)據(jù),而不會對其基礎(chǔ)設(shè)施造成壓力[11]。
·數(shù)據(jù)存儲。24.57%(216種)期刊具有明確的數(shù)據(jù)倉儲政策,倉儲政策包括Sherpa/Romeo、Diadorim、Dulcinea、string、Digital Library of Slovenia、Deutsche Nationalbibliothek、SEER、Open Harvester System、Open Aire 和WorldCat,其中75%(162種)期刊遵循Sherpa/Romeo 政策。34.47%(303種)期刊通過3種方式實(shí)現(xiàn)長期保存,包括加入數(shù)字資源長期保存計(jì)劃或項(xiàng)目(LOCKSS、CLOCKSS 或 Portico)(16.95%,149種)納入國家圖書館倉儲進(jìn)行保存(16.50%,145種)和其他(6.71%,59種)。
(4)質(zhì)量控制
DOAJ 在數(shù)據(jù)質(zhì)量控制方面實(shí)施了多項(xiàng)舉措。包括發(fā)布新的資源遴選標(biāo)準(zhǔn),在期刊質(zhì)量審核方面尤其注重出版的質(zhì)量和科學(xué)的質(zhì)量[12],并從2014年3月起正式實(shí)施該標(biāo)準(zhǔn)。推出再申請行動,即所有2014年3月以前收錄的期刊必須提出一份再申請,不符合新的收錄標(biāo)準(zhǔn)和沒有在有效時(shí)間內(nèi)提出再申請的期刊將被剔除,DOAJ 在2013年到2016年5月間剔除了3776種期刊[13],這是增加期刊信息準(zhǔn)確性和價(jià)值的一項(xiàng)重要舉措。統(tǒng)計(jì)顯示99.54%(875種)商業(yè)與經(jīng)濟(jì)領(lǐng)域期刊通過再申請。關(guān)注期刊可達(dá)性,剔除208種不再出版的期刊,避免錯誤鏈接混淆用戶[14],收錄的期刊可達(dá)性較高[15]。保證數(shù)據(jù)實(shí)時(shí)更新,每天清晨自動從歐洲PMC 平臺收割元數(shù)據(jù),采集最新論文[16]。
DOAB 共收錄282個(gè)出版機(jī)構(gòu)的1.3 萬余種同行評議學(xué)術(shù)著作(含200個(gè)圖書章節(jié)),包含商業(yè)與經(jīng)濟(jì)領(lǐng)域圖書463種(含4個(gè)圖書章節(jié))。
(1)語種分布
463種圖書涵蓋11個(gè)語種,使用排名Top3的語種分別是英語(76.46%,354種)、德語(8.21%,38種)和葡萄牙語(4.54%,21種)。全部圖書均為單一語種圖書。
(2)時(shí)間分布
40.17%(186種)圖書近3年出版,60.26%(279種)圖書近5年出版。近5年出版的圖書中,有69.53%(194種)出版當(dāng)年實(shí)現(xiàn)開放獲取,有18.28%(51種)出版次年實(shí)現(xiàn)開放獲取,其中一種圖書為預(yù)印本《Melting Hadrons,Boiling Quarks:From Hagedorn Temperature to Ultra-Relativistic Heavy-Ion Collisions at CERN: With a Tribute to Rolf Hagedorn》,該書由Springer于2016年正式出版,2015年11月收錄至DOAB。每年收錄圖書數(shù)量整體呈現(xiàn)上漲趨勢。
圖3 DOAB每年收錄商業(yè)與經(jīng)濟(jì)領(lǐng)域圖書數(shù)量分布
(3)開放程度
·知識共享許可協(xié)議。圖書元數(shù)據(jù)層面的使用遵循CC0 1.0。全文數(shù)據(jù)層面則差異較大,81.43%(382種)的圖書遵循CC知識共享許可協(xié)議,15.77%(73種)的圖書遵循出版機(jī)構(gòu)自身的許可協(xié)議,1.73%(8種)的圖書遵循的共享許可協(xié)議未知。使用最多的3種協(xié)議是CC by-nc-nd(30.89%,143種)、CC by-nc(19.65%,91種)和CC by(17.71%,82種)。
·機(jī)讀性。提供可進(jìn)行元數(shù)據(jù)收割的OAI 協(xié)議,并提供了相應(yīng)的技術(shù)參數(shù)。
·數(shù)據(jù)重用。DOAB中全部圖書都可以免費(fèi)閱讀、分享和非商業(yè)性使用。書目元數(shù)據(jù)允許CSV文件下載和OAI 收割,被刪除的記錄也可以通過OAI進(jìn)行檢索,支持用戶使用OAI 按照時(shí)間(創(chuàng)建、刪除或修改)和學(xué)科進(jìn)行個(gè)性化數(shù)據(jù)定制,并將元數(shù)據(jù)嵌入本地館藏或書目目錄[17]。支持將DOAB檢索框嵌入第三方應(yīng)用系統(tǒng)[18],實(shí)現(xiàn)第三方系統(tǒng)和平臺資源的無縫連接。
·數(shù)據(jù)存儲。DOAB不再次進(jìn)行圖書內(nèi)容的存儲,而是提供圖書在出版機(jī)構(gòu)網(wǎng)站的鏈接。
(4)質(zhì)量控制
DOAB只與出版機(jī)構(gòu)合作,如與Springer等知名出版機(jī)構(gòu)合作,收錄其出版的開放圖書,這些出版機(jī)構(gòu)在DOAB 網(wǎng)站被一一列出,方便用戶查閱其同行評議程序和許可政策[19]。DOAB 所收錄的圖書具備兩個(gè)特點(diǎn):一是在開放存取許可條件下可在出版機(jī)構(gòu)網(wǎng)站和知識庫獲取全文;二是圖書出版前應(yīng)接受獨(dú)立的或外部的同行評審,以便進(jìn)行質(zhì)量控制[20]。保持每日更新收錄書籍的元數(shù)據(jù)[21]。
綜合分析商業(yè)與經(jīng)濟(jì)領(lǐng)域出版類開放資源分布情況,發(fā)現(xiàn)開放期刊和開放圖書的發(fā)展有如下特點(diǎn):(1)使用的主要語言是英語,期刊單語種與多語種并存,圖書全部為單語種。(2)收錄資源數(shù)量整體呈增長趨勢,尤其是近兩年增速較快。(3)資源開放程度整體較高。二者分別在元數(shù)據(jù)層面和全文數(shù)據(jù)層面進(jìn)行了知識產(chǎn)權(quán)說明,允許用戶在CC 知識共享許可協(xié)議下使用元數(shù)據(jù),在全文數(shù)據(jù)層面也是主要遵循CC 知識共享許可協(xié)議,這為資源再利用提供了政策支持。相對而言,圖書開放限定比期刊更為嚴(yán)格,期刊開放限定在向最大開放性和規(guī)范性演化,越來越多的期刊遵循CC by協(xié)議,而圖書更多遵循CC by-nc-nd協(xié)議。(4)為推廣資源再利用提供技術(shù)支持。支持第三方機(jī)構(gòu)通過OAI進(jìn)行元數(shù)據(jù)收割,并提供相應(yīng)的技術(shù)參數(shù);提供元數(shù)據(jù)CSV 格式文件下載;支持用戶在本地頁面嵌入檢索框;支持個(gè)性化數(shù)據(jù)定制。此外,除了在第三方機(jī)構(gòu)嵌入檢索框外,DOAJ 還支持在第三方系統(tǒng)嵌入預(yù)定義的檢索結(jié)果,除了支持用戶按照學(xué)科進(jìn)行個(gè)性化數(shù)據(jù)定制外,DOAB 還支持用戶按照時(shí)間(創(chuàng)建、刪除或修改)進(jìn)行個(gè)性化數(shù)據(jù)定制。此外,DOAJ 為增強(qiáng)其在中國的使用推廣,進(jìn)行了戰(zhàn)略性遷移,其檢索功能不再使用谷歌服務(wù)器javascript服務(wù)[22]。(5)重視數(shù)據(jù)質(zhì)量控制,資源可達(dá)性高,保持?jǐn)?shù)據(jù)每日更新。
從以上調(diào)研可以看出,一方面,開放知識系統(tǒng)在加強(qiáng)內(nèi)容建設(shè)和質(zhì)量控制的同時(shí),積極推進(jìn)資源重用,提供政策支持和技術(shù)支持。另一方面,開放資源分布在不同的網(wǎng)站上,如果圖書館不加以組織和揭示,用戶仍難以有效利用。這將對小型圖書館加強(qiáng)外文資源保障、提升信息服務(wù)能力有所啟示。
以筆者所在學(xué)校為例,對外文電子書的經(jīng)費(fèi)投入在 2015年、2016年和 2017年分別為 19 萬元、30萬元和30 萬元,每年新增外文電子書為1110種、940種和549種,盡管經(jīng)費(fèi)投入逐年上漲,但實(shí)際購買力在下降。DOAB 中僅2017年就收錄了商業(yè)與經(jīng)濟(jì)領(lǐng)域圖書101種,這些圖書是對館藏外文電子書很好的一個(gè)補(bǔ)充,且開放知識系統(tǒng)中收錄的資源規(guī)模逐年穩(wěn)步上升,資源可達(dá)性強(qiáng),具有一定的持續(xù)性。圖書館在將開放資源納入館藏的過程中,應(yīng)注意以下幾個(gè)方面:首先,發(fā)布開放資源使用聲明,促進(jìn)開放資源合理使用。在知識共享協(xié)議下使用不等于合理使用,在向用戶強(qiáng)調(diào)遵循開放資源本身協(xié)議的同時(shí),要強(qiáng)調(diào)非商業(yè)性使用、不允許惡意下載等。其次,利用開放知識系統(tǒng)提供的工具,將開放資源嵌入圖書館OPAC 系統(tǒng),使其成為圖書館資源體系的有機(jī)構(gòu)成。例如,通過OAI 進(jìn)行DOAJ 和DOAB 元數(shù)據(jù)收割,將其整合到圖書館OPAC 系統(tǒng)中加以組織和揭示,方便用戶直接進(jìn)行檢索,或是在圖書館主頁嵌入DOAJ 和DOAB 檢索框。再次,定期對本地?cái)?shù)據(jù)重新建立索引,以便查詢最新結(jié)果,例如,DOAJ 每星期更新索引,用戶可通過OAIPMH 或 API 重新索引、更新、下載 DOAJ 文章元數(shù)據(jù)[23],圖書館可根據(jù)其重新建立索引的時(shí)間定期對本地?cái)?shù)據(jù)進(jìn)行處理。最后,通過一段時(shí)間的使用,搜集用戶反饋,梳理并在網(wǎng)上列出用戶常見問題。
學(xué)科館員可以充分利用開放資源特點(diǎn),拓寬學(xué)科服務(wù)路徑,提升學(xué)科服務(wù)能力。①將開放資源納入學(xué)科導(dǎo)航平臺。開放學(xué)術(shù)資源已經(jīng)在科學(xué)研究中發(fā)揮重要作用,Tina Baich[24]對印第安納大學(xué)2012和2013 學(xué)年館際互借中開放資源的知識共享情況進(jìn)行分析,發(fā)現(xiàn)用戶對開放資源的需求呈現(xiàn)增長態(tài)勢。開放資源數(shù)據(jù)質(zhì)量可靠,更新及時(shí),DOAB 和DOAJ 支持用戶按照學(xué)科進(jìn)行資源定制,為將開放資源納入學(xué)科資源門戶提供可靠支持。但由于不同開放知識系統(tǒng)采用不同的知識組織體系進(jìn)行資源標(biāo)引和組織,因此,在利用開放資源建立學(xué)科門戶時(shí),首要解決的問題是明確不同開放知識系統(tǒng)中的學(xué)科領(lǐng)域范疇。②為科研人員進(jìn)行成果發(fā)布提供咨詢服務(wù),促進(jìn)學(xué)術(shù)交流。開放獲取是一種日漸流行的學(xué)術(shù)交流模式,傳統(tǒng)學(xué)術(shù)成果發(fā)表流程繁瑣,出版周期長,影響了科學(xué)成果的及時(shí)發(fā)表與交流,學(xué)科館員可對學(xué)科領(lǐng)域開放期刊進(jìn)行深入分析,為科研人員論文發(fā)表提供咨詢。引導(dǎo)科研人員選擇合適的出版機(jī)構(gòu)發(fā)表專著成果,例如,引導(dǎo)科研人員選擇與DOAB 合作的出版機(jī)構(gòu)進(jìn)行成果發(fā)布,同時(shí)向DOAB提出申請,DOAB則會與相應(yīng)出版機(jī)構(gòu)取得聯(lián)系,實(shí)現(xiàn)專著的開放獲取,促進(jìn)學(xué)術(shù)交流。
蔣巖波等[25]對全國45 所財(cái)經(jīng)院校圖書館數(shù)字資源建設(shè)情況進(jìn)行調(diào)研,發(fā)現(xiàn)近七成圖書館雖然建設(shè)了網(wǎng)絡(luò)資源鏈接或?qū)Ш剑嵌鄶?shù)館所建內(nèi)容比較凌亂,有的只是簡單地羅列網(wǎng)絡(luò)免費(fèi)網(wǎng)站鏈接,并沒有實(shí)現(xiàn)對開放資源的有效組織。對開放資源的組織可以從兩個(gè)層面出發(fā),一是開放資源網(wǎng)絡(luò)來源的組織,從包含的資源類型、學(xué)科領(lǐng)域、語種等多個(gè)角度進(jìn)行揭示并支持檢索,幫助用戶快速定位擬查找的信息源。二是對開放資源數(shù)據(jù)的組織,知識組織體系是任何用來定義并組織和表述真實(shí)世界物體的術(shù)語和符號的系統(tǒng),在具體應(yīng)用中被泛指為語義工具,包括同義詞環(huán)、敘詞表、分類表和本體等[26]。通過利用語義關(guān)系豐富的知識組織體系進(jìn)行資源組織和揭示,能夠提高科研人員獲取準(zhǔn)確文獻(xiàn)數(shù)據(jù)集的效率。中國科學(xué)院以某類開放資源為對象,分別對開放獲取期刊和論文、開放科技課件、開放會議、開放社會信息等開放資源進(jìn)行集成,并提供檢索、瀏覽、下載、期刊投稿推薦等服務(wù)[27]。這為我們帶來啟發(fā)。圖書館可以以某一學(xué)科單一類別的開放資源為抓手,如以經(jīng)濟(jì)學(xué)領(lǐng)域開放圖書為例,從多個(gè)開放資源信息源中獲取初始數(shù)據(jù),對其進(jìn)行主題分析和集成展示,形成領(lǐng)域資源庫,引入合適的或創(chuàng)建新的知識組織體系進(jìn)行資源標(biāo)引,支持語義檢索,幫助科研人員發(fā)現(xiàn)更多相關(guān)的全文數(shù)據(jù),促進(jìn)知識發(fā)現(xiàn)。
在全球開放獲取運(yùn)動的推動下,商業(yè)與經(jīng)濟(jì)領(lǐng)域信息資源開放獲取正在有條不紊地進(jìn)行。為推進(jìn)開放資源的應(yīng)用,開放資源搜索引擎也在不斷推陳出新,加強(qiáng)內(nèi)容建設(shè),不斷擴(kuò)大資源規(guī)模,提升資源質(zhì)量,并推出簡單易用的小工具。在圖書館資源采購經(jīng)費(fèi)緊張、知識獲取代價(jià)高昂、學(xué)術(shù)信息交流需求日益迫切的情況下,圖書館應(yīng)抓住契機(jī),將開放資源納入本地館藏,利用其不斷完善的自身學(xué)科資源建設(shè),并對開放資源進(jìn)行有效組織,提供更高層次的知識服務(wù),促進(jìn)學(xué)術(shù)信息交流。