李峰,孫博陽,孫媛媛
(北京師范大學(xué)圖書館,北京 100875)
國(guó)外電子資源知識(shí)庫研究現(xiàn)狀
李峰,孫博陽,孫媛媛
(北京師范大學(xué)圖書館,北京 100875)
梳理國(guó)外電子資源知識(shí)庫研究現(xiàn)狀,有助于理清知識(shí)庫在電子資源全生命周期管理中的作用,明晰電子資源知識(shí)庫與下一代圖書館服務(wù)平臺(tái)和資源發(fā)現(xiàn)系統(tǒng)的關(guān)系。本文選取2011年以來電子資源知識(shí)庫領(lǐng)域的重要研究成果,從商業(yè)型電子資源知識(shí)庫和社區(qū)型電子資源知識(shí)庫兩個(gè)角度介紹典型案例,歸納出電子資源知識(shí)庫的發(fā)展趨勢(shì)是支持?jǐn)?shù)據(jù)多樣性、數(shù)據(jù)維護(hù)自動(dòng)化和關(guān)聯(lián)數(shù)據(jù)應(yīng)用。
知識(shí)庫;電子資源;圖書館服務(wù)平臺(tái);發(fā)現(xiàn)服務(wù)
自20世紀(jì)90年代中期以來,電子資源管理成為困擾圖書館的難題之一。2002—2004年數(shù)字圖書館聯(lián)盟開展Electronic Resources Management Initiative項(xiàng)目,此后,ERMS(Electronic Resources Management System)系列產(chǎn)品也開始問世,但ERMS并沒有完全解決電子資源管理問題。鏈接服務(wù)和發(fā)現(xiàn)服務(wù)被陸續(xù)引入圖書館。這些服務(wù)的彼此分離,造成不同系統(tǒng)電子資源數(shù)據(jù)不一致及管理工作流程冗余。例如,管理員需要在發(fā)現(xiàn)系統(tǒng)和鏈接服務(wù)系統(tǒng)分別勾選圖書館訂購(gòu)的電子資源,訪問平臺(tái)的任何變化都影響后臺(tái)和讀者界面的相關(guān)信息。為此,“下一代圖書館解決方案”被提出,它將圖書館所有類型資源和工作流程進(jìn)行一體化管理,Breeding稱其為圖書館服務(wù)平臺(tái)(Library Services Platforms,LSP)[1],目前LSP已逐漸進(jìn)入成熟期。
LSP將圖書館集成管理系統(tǒng)、電子資源管理系統(tǒng)、鏈接服務(wù)統(tǒng)一,是面向發(fā)現(xiàn)系統(tǒng)、數(shù)字資產(chǎn)系統(tǒng)、機(jī)構(gòu)存儲(chǔ)系統(tǒng)、學(xué)習(xí)管理系統(tǒng),及圖書館其他Web服務(wù)界面的開放平臺(tái)。在LSP中,電子資源知識(shí)庫是唯一的數(shù)據(jù)池,滿足不同檢索和管理機(jī)制需要。
電子資源知識(shí)庫包含全球電子資源元數(shù)據(jù)、電子資源館藏?cái)?shù)據(jù)、電子資源訪問地址、圖書館采購(gòu)數(shù)據(jù)、訪問許可等,還可接納圖書館本地?cái)?shù)字資源數(shù)據(jù)。電子資源知識(shí)庫不僅與圖書館服務(wù)產(chǎn)品打包發(fā)售,還有專門知識(shí)庫供應(yīng)商市場(chǎng)與研究社區(qū)共建的開放知識(shí)庫,出現(xiàn)多個(gè)聯(lián)合知識(shí)庫項(xiàng)目。本文擬對(duì)當(dāng)前典型案例進(jìn)行介紹,以預(yù)測(cè)電子資源知識(shí)庫未來發(fā)展趨勢(shì)。
知識(shí)庫是一個(gè)廣義的概念,通常用在人工智能、知識(shí)決策系統(tǒng)領(lǐng)域。圖書情報(bào)領(lǐng)域?qū)χR(shí)庫的研究集中在機(jī)構(gòu)知識(shí)庫和利用維基百科來構(gòu)建知識(shí)庫方面[2],而本文研究對(duì)象是電子資源知識(shí)庫。在電子資源管理領(lǐng)域,知識(shí)庫的概念可回溯至20世紀(jì)90年代末,其與鏈接服務(wù)同時(shí)出現(xiàn)[3]。電子資源知識(shí)庫是鏈接服務(wù)的數(shù)據(jù)基石,包含全球電子期刊、電子圖書等元數(shù)據(jù)。這些數(shù)據(jù)不僅包含題名、ISSN、ISBN、出版社等書目信息元數(shù)據(jù),還包括訪問平臺(tái)、訪問控制方式、訪問URL、資源覆蓋時(shí)間等館藏信息元數(shù)據(jù)。圖書館員在中心知識(shí)庫標(biāo)識(shí)出圖書館訂購(gòu)的電子資源或上傳本地電子資源到知識(shí)庫,讀者就可在圖書館獲得全文鏈接,實(shí)現(xiàn)對(duì)電子資源“合適版本”的獲取。
Diven將電子資源知識(shí)庫稱為圖書館電子資源的地址簿,用于標(biāo)識(shí)和維護(hù)電子資源信息,其內(nèi)容包括電子資源提供商、數(shù)據(jù)庫包、訪問平臺(tái)、題名、標(biāo)識(shí)符,及可訪問性等信息[4];Wilson指出電子資源知識(shí)庫覆蓋圖書館電子資源主體,包括來自不同內(nèi)容平臺(tái)的電子期刊、電子圖書、圖書章節(jié)及其他內(nèi)容[5]。電子資源知識(shí)庫目標(biāo)是跟蹤內(nèi)容包的內(nèi)容。
在圖書館服務(wù)平臺(tái)框架中,電子資源知識(shí)庫關(guān)聯(lián)鏈接服務(wù)、發(fā)現(xiàn)服務(wù)、A-Z列表等,在用戶從檢索到獲取全文資源的過程中起中心作用;還支持圖書館內(nèi)部工作,如采訪、館藏維護(hù)、館藏分析、使用統(tǒng)計(jì)等。電子資源知識(shí)庫成為電子資源全生命周期管理與服務(wù)的數(shù)據(jù)核心,是解決圖書館服務(wù)系統(tǒng)間數(shù)據(jù)共享和數(shù)據(jù)維護(hù)的關(guān)鍵要素,是當(dāng)前電子資源管理生態(tài)系統(tǒng)必不可少的一部分。以電子資源知識(shí)庫為中心的電子資源管理生態(tài)圈,如圖1所示。
圖1 以電子資源知識(shí)庫為中心的電子資源管理生態(tài)圈
電子資源知識(shí)庫建設(shè)和電子資源供應(yīng)鏈全程相關(guān),相關(guān)利益方包括出版商、數(shù)據(jù)集成商、圖書館服務(wù)供應(yīng)商、圖書館、標(biāo)準(zhǔn)委員會(huì)、科研管理機(jī)構(gòu)和圖書館聯(lián)盟。利益方在知識(shí)庫對(duì)電子資源管理的作用方面已達(dá)成共識(shí)。對(duì)圖書館而言,確保知識(shí)庫數(shù)據(jù)準(zhǔn)確至關(guān)重要,但任何一個(gè)圖書館都無力完全承擔(dān)這樣的工作,只能通過商業(yè)公司或以聯(lián)盟的形式進(jìn)行建設(shè)。目前電子資源知識(shí)庫在結(jié)構(gòu)、內(nèi)容和格式上都沒有成熟標(biāo)準(zhǔn)可依,根據(jù)不同的服務(wù)架構(gòu)設(shè)計(jì)和對(duì)服務(wù)目標(biāo)的理解,電子資源知識(shí)庫有商業(yè)型和社區(qū)型兩條發(fā)展路線。
3.1 商業(yè)型電子資源知識(shí)庫
電子資源知識(shí)庫越來越多地作為圖書館軟件相關(guān)產(chǎn)品的內(nèi)部組件,包括鏈接服務(wù)系統(tǒng)、電子資源管理系統(tǒng)、發(fā)現(xiàn)系統(tǒng)、圖書館服務(wù)平臺(tái)等產(chǎn)品。ProQuest、Ex Libris、EBSCO和OCLC是目前主流的商業(yè)型電子資源知識(shí)庫提供商,各知識(shí)庫提供商都有專業(yè)隊(duì)伍負(fù)責(zé)知識(shí)庫數(shù)據(jù)的建設(shè)和相關(guān)數(shù)據(jù)政策的制定,同時(shí)各知識(shí)庫提供商間也存在不同程度地合作與分享。數(shù)據(jù)入庫前需先從內(nèi)容提供者處獲取元數(shù)據(jù)(如與數(shù)據(jù)庫商、出版商聯(lián)系購(gòu)買,或通過網(wǎng)絡(luò)爬蟲抓取),之后對(duì)元數(shù)據(jù)進(jìn)行糾錯(cuò)、補(bǔ)充、轉(zhuǎn)換格式等數(shù)據(jù)清洗工作。商業(yè)型電子資源知識(shí)庫的利用方式多種多樣,如以物理文件傳輸、在客戶端安裝知識(shí)庫、采用遠(yuǎn)程訪問供應(yīng)商端知識(shí)庫或SaaS平臺(tái)模式。
3.2 社區(qū)型電子資源知識(shí)庫
第一個(gè)社區(qū)型電子資源知識(shí)庫項(xiàng)目Jointly Administered Knowledge Environment,由耶魯大學(xué)于1999年發(fā)起[6]。國(guó)外對(duì)社區(qū)型電子資源知識(shí)庫的概念沒有統(tǒng)一說法,一般稱為“Community-Managed Knowledge Bases”。國(guó)內(nèi)還沒有對(duì)社區(qū)型電子資源知識(shí)庫的相關(guān)介紹。
電子資源元數(shù)據(jù)經(jīng)常改變,如期刊增刪、期刊拆分、覆蓋范圍與URL變化等。圖書館員在使用中發(fā)現(xiàn)鏈接全文的錯(cuò)誤,并提交給商業(yè)型電子資源知識(shí)庫商,知識(shí)庫商將修改后的結(jié)果反饋給圖書館,這個(gè)過程是比較煩瑣的。更新商業(yè)型電子資源知識(shí)庫商提供數(shù)據(jù)的滯后性是創(chuàng)建社區(qū)型電子資源知識(shí)庫的一個(gè)主要驅(qū)動(dòng)因素。
社區(qū)型電子資源知識(shí)庫建設(shè)的范圍和目的分為兩方面:一方面包含與電子資源生命周期相關(guān)的ERMS元數(shù)據(jù),完成訂購(gòu)、許可管理、利用率統(tǒng)計(jì)、追蹤電子資源變化等,供內(nèi)部工作使用;另一方面,包含發(fā)現(xiàn)服務(wù)中使用的電子資源元數(shù)據(jù),其目的是支持內(nèi)部ERMS、外部分配、以及與其他社區(qū)資源的信息共享。社區(qū)型電子資源知識(shí)庫既支持后臺(tái)操作的電子資源跟蹤業(yè)務(wù),又考慮終端用戶的需求。社區(qū)型電子資源知識(shí)庫建設(shè)的參與者通常為學(xué)術(shù)研究機(jī)構(gòu)的圖書館員,此外,還包括電子資源圖書館員、期刊專家、編目員、采訪人員、系統(tǒng)管理員[4]。
3.3 兩種類型電子資源知識(shí)庫的對(duì)比分析
由于社區(qū)型電子資源知識(shí)庫與商業(yè)型電子資源知識(shí)庫的建設(shè)目標(biāo)和參與對(duì)象不同,二者存在差別(見表1)。
(1)商業(yè)型電子資源知識(shí)庫的優(yōu)缺點(diǎn)。商業(yè)型電子資源知識(shí)庫一般由專業(yè)圖書館軟件公司提供,公司負(fù)責(zé)與出版商、數(shù)據(jù)庫商談判,單獨(dú)收集元數(shù)據(jù),存在大量重復(fù)工作。公司通過擴(kuò)大自身知識(shí)庫的覆蓋范圍、改善電子資源元數(shù)據(jù)質(zhì)量,提高競(jìng)爭(zhēng)力。其優(yōu)勢(shì)在于資金投入有保障,可提供長(zhǎng)期穩(wěn)定的服務(wù)。圖書館作為使用方無須在數(shù)據(jù)獲取方面花費(fèi)精力,僅對(duì)數(shù)據(jù)中的錯(cuò)誤提供修改建議,但由于圖書館不直接參與電子資源知識(shí)庫建設(shè),造成電子資源元數(shù)據(jù)錯(cuò)誤反饋過程較煩瑣。商業(yè)型電子資源知識(shí)庫只面向購(gòu)買用戶使用,盡管各公司也有一定合作共享,但由于彼此存在競(jìng)爭(zhēng)關(guān)系,單一軟件商的資源覆蓋率可能存在短板。既是資源商也是知識(shí)庫商的公司,在數(shù)據(jù)開放性上會(huì)有所保留。
表1 商業(yè)型電子資源知識(shí)庫與社區(qū)型電子資源知識(shí)庫的特點(diǎn)對(duì)比
(2)社區(qū)型電子資源知識(shí)庫的優(yōu)缺點(diǎn)。社區(qū)型電子資源知識(shí)庫在以下兩方面具有獨(dú)特的優(yōu)勢(shì)。一方面,可以減少重復(fù)勞動(dòng)。如圖書館員發(fā)現(xiàn)某一電子資源的元數(shù)據(jù)發(fā)生變化,然后在社區(qū)型電子資源知識(shí)庫中更新元數(shù)據(jù),其他圖書館員可以直接使用該元數(shù)據(jù),而無須登錄獨(dú)立的倉儲(chǔ),重建新的數(shù)據(jù)描述該資源。另一方面,社區(qū)型電子資源知識(shí)庫立足本社區(qū)資源和合作項(xiàng)目,充分揭示與商業(yè)知識(shí)庫有所區(qū)別的本地資源,有利于社區(qū)資源共享。由于社區(qū)型電子資源知識(shí)庫通常以項(xiàng)目資助的形式發(fā)展,資助的減少、人員的變化都會(huì)影響社區(qū)型電子資源知識(shí)庫的建設(shè),因此穩(wěn)定性較差。社區(qū)型電子資源知識(shí)庫一般與LSP項(xiàng)目配合運(yùn)作,普及率不如商業(yè)型電子資源知識(shí)庫。
4.1 典型案例介紹
(1)Ex Libris SFX Global Knowledge Base和ProQuest KnowledgeWorks。軟件商Ex Libris公司于2000年首次推出鏈接服務(wù)產(chǎn)品SFX與配套的中心知識(shí)庫,此后陸續(xù)開發(fā)了電子資源管理系統(tǒng)Verde、資源發(fā)現(xiàn)系統(tǒng)Primo、圖書館服務(wù)平臺(tái)Alma等,知識(shí)庫數(shù)據(jù)是支撐這些系統(tǒng)的核心。以Alma為例,其中心知識(shí)庫分為機(jī)構(gòu)知識(shí)庫、網(wǎng)絡(luò)知識(shí)庫和社區(qū)知識(shí)庫三個(gè)層級(jí),分別支撐圖書館電子資源生命周期的工作流程、館際圖書館數(shù)據(jù)共享和業(yè)務(wù)合作以及全球范圍內(nèi)的用戶數(shù)據(jù)共享[5]。圖書館對(duì)本地獨(dú)有資源數(shù)據(jù)可自定政策,在機(jī)構(gòu)知識(shí)庫、網(wǎng)絡(luò)知識(shí)庫和社區(qū)知識(shí)庫提供不同范圍的開放共享。這種模式既可避免數(shù)據(jù)與工作流程重復(fù),又提高了圖書館管理元數(shù)據(jù)的靈活度。
ProQuest公司在收購(gòu)Serial Solution后,從單純的內(nèi)容提供商拓展為圖書館服務(wù)提供商。Serial Solution公司的KnowledgeWorks,是其早期推出的電子資源知識(shí)庫之一,也是Serial Solution旗下所有產(chǎn)品的基礎(chǔ),包括360Link、360Resource Manager、360Search、Summon。
2016年,ProQuest和Ex Libris合并,2017年以來,ProQuest的知識(shí)庫與Alma自有的知識(shí)庫相互融合,同時(shí)ProQuest將LSP產(chǎn)品開發(fā)重點(diǎn)從Intota轉(zhuǎn)移到Alma上,形成強(qiáng)強(qiáng)聯(lián)合的局面。
(2)EBSCO Integrated Knowledge Base。EBSCO公司作為內(nèi)容提供商,也向圖書館提供電子資源管理、EBSCO全文鏈接服務(wù)、發(fā)現(xiàn)服務(wù)EDS以及EBSCO A-Z列表界面等。EBSCO的知識(shí)庫是Global Knowledge Base,其涵蓋的資源元數(shù)據(jù)極其豐富。雖然EBSCO沒有自己的圖書館服務(wù)平臺(tái)產(chǎn)品,但其是Innovative的合作伙伴,并且二者合作密切,其中Innovative的圖書館服務(wù)平臺(tái)產(chǎn)品Sierra利用的正是EBSCO的知識(shí)庫。因此,EBSCO也成為知識(shí)庫提供商。由于EBSCO有自己的軟件服務(wù)商合作伙伴,所以EBSCO在將元數(shù)據(jù)開放給競(jìng)爭(zhēng)對(duì)手ProQuest(Ex Libris)方面,歷經(jīng)多次談判,過程并不十分順暢[7]。
EBSCO的產(chǎn)品分析師描述了EBSCO在電子資源訂閱管理服務(wù)和知識(shí)庫間創(chuàng)建映射的方式。在訂閱時(shí),用戶的訂單中包含付款和資源覆蓋范圍的信息。這些信息導(dǎo)入用戶的知識(shí)庫,在這個(gè)知識(shí)庫中EBSCO知道如何根據(jù)訂閱信息激活館藏。知識(shí)庫也可以用來管理其他類型的數(shù)據(jù),例如統(tǒng)計(jì)數(shù)據(jù)。EBSCO的Usage Consolidation產(chǎn)品允許圖書館導(dǎo)入符合COUNTER標(biāo)準(zhǔn)的統(tǒng)計(jì),并與知識(shí)庫中相關(guān)的館藏進(jìn)行關(guān)聯(lián)。使用數(shù)據(jù)與館藏關(guān)聯(lián)而不是與題名關(guān)聯(lián),對(duì)于創(chuàng)建復(fù)雜的指標(biāo)是必需的[6]。
(3)OCLC WorldCat Knowledge Base。OCLC是全球性圖書館合作組織,致力于為組織成員和圖書館社區(qū)提供大量共享的技術(shù)服務(wù)。World Share Management Services是OCLC開發(fā)的圖書館服務(wù)平臺(tái),與Alma類似,其覆蓋電子資源管理全生命周期,集成鏈接服務(wù)、WorldCat Discovery及OCLC的資源共享系列服務(wù)。World Share Management Services的知識(shí)庫WorldCat Knowledge Base是實(shí)現(xiàn)上述服務(wù)的數(shù)據(jù)核心。OCLC的知識(shí)庫和其他商業(yè)型電子資源知識(shí)庫相比,更鼓勵(lì)圖書館員參與知識(shí)庫建設(shè)。由于OCLC是一個(gè)非盈利機(jī)構(gòu),所以WorldCat Knowledge Base不僅包含豐富的資源元數(shù)據(jù),還是唯一包含EBSCO和ProQuest資源的知識(shí)庫[8]。
OCLC在功能設(shè)計(jì)上也獨(dú)具特色,其知識(shí)庫是World-Cat的增強(qiáng)部分,知識(shí)庫與WorldCat平臺(tái)集成不需要額外付費(fèi)。圖書館管理電子館藏與管理書目記錄類似,WorldCat Knowledge Base方便圖書館對(duì)WorldCat的電子館藏記錄進(jìn)行管理,圖書館易于通過WorldCat平臺(tái)展示與分享圖書館的電子館藏,實(shí)現(xiàn)電子資源全工作流程管理。
(4)KB+(Knowledge Base Plus)。KB+是來自JISC Collections的服務(wù),目標(biāo)是為英國(guó)學(xué)術(shù)社區(qū)建立共享知識(shí)庫。該項(xiàng)目旨在獲取和表示機(jī)構(gòu)的訂購(gòu)資源信息,包括期刊包、電子資源許可和機(jī)構(gòu)權(quán)利等。知識(shí)庫信息公開可用,支持ERMS功能與發(fā)現(xiàn)服務(wù)。項(xiàng)目最初關(guān)注電子資源元數(shù)據(jù)的收集,這些元數(shù)據(jù)可以用于跟蹤和描述英國(guó)高等教育包的訂購(gòu)和續(xù)訂,包括NESLi2(UK’s National Initiative for Licensing E-Journals),SHEDL(Scottish Higher Education Digital Library)和WHEEL(Wales Higher Education Electronic Library)。KB+源于英國(guó)高等教育圖書館聯(lián)盟的需求,參與者包括英國(guó)學(xué)術(shù)聯(lián)盟、非英國(guó)學(xué)術(shù)聯(lián)盟、出版商、圖書館和電子資源系統(tǒng)提供商、訂購(gòu)代理等。同時(shí),該項(xiàng)目團(tuán)隊(duì)雇傭Sero Consulting開發(fā)數(shù)據(jù)模型,用于支持內(nèi)部ERMS功能以及KB+存儲(chǔ)的API。為更廣泛地共享英國(guó)高等教育信息,該項(xiàng)目團(tuán)隊(duì)還邀請(qǐng)ProQuest和其他商業(yè)數(shù)據(jù)庫提供商討論KB+和商業(yè)型電子資源知識(shí)庫系統(tǒng)的互操作[4]。目前,ProQuest、EBSCO及Ex Libris都從KB+獲取數(shù)據(jù),補(bǔ)充自身知識(shí)庫[9]。
在該項(xiàng)目中,電子資源的數(shù)據(jù)結(jié)構(gòu)及相關(guān)標(biāo)準(zhǔn)、模型需遵循COUNTER、ONIX Messages和KBART。KB+要求第三方提供的數(shù)據(jù)格式必須滿足上述規(guī)則。為保證數(shù)據(jù)質(zhì)量,KB+承擔(dān)數(shù)據(jù)驗(yàn)證工作。為讓更多圖書館使用KB+數(shù)據(jù),其數(shù)據(jù)在使用上除支持相關(guān)開發(fā)標(biāo)準(zhǔn)外,還遵循數(shù)據(jù)交換標(biāo)準(zhǔn)ONIX和SUSHI。
(5)GOKb(Global Open Knowledge Base)。開放圖書館環(huán)境項(xiàng)目正在研發(fā)開源的圖書館服務(wù)平臺(tái),目標(biāo)之一是建設(shè)全球開放知識(shí)庫GOKb。GOKb旨在通過對(duì)不同層次、不同組織間GOKb數(shù)據(jù)的創(chuàng)建,減少知識(shí)庫創(chuàng)建過程中的重復(fù)工作,在國(guó)家、組織和機(jī)構(gòu)層面達(dá)到更有效的數(shù)據(jù)收集。GOKb知識(shí)庫采用CC0許可協(xié)議,數(shù)據(jù)允許被任何人以任何形式使用。GOKb支持資源的全生命周期管理,從采訪(打包和試用)、許可(激活和購(gòu)買)、管理(故障查找和管理變化)到評(píng)估。
2011年,GOKb與KB+在數(shù)據(jù)模型方面達(dá)成合作,確定利用同一數(shù)據(jù)模型進(jìn)行知識(shí)庫建設(shè);2012年,GOKb得到梅隆基金會(huì)和OLE資助,主要目的是支持ERMS和改善電子資源供應(yīng)鏈中的工作流;2012—2015年,GOKb的合作者們共同創(chuàng)建數(shù)據(jù)模型、數(shù)據(jù)元素集、揭示數(shù)據(jù)的接口、支持?jǐn)?shù)據(jù)導(dǎo)入和維護(hù)的工具,并于2014年12月公開發(fā)布第一個(gè)試用版;2015年,梅隆基金會(huì)為北卡羅來納州立大學(xué)圖書館提供額外的資助,用于第二階段開發(fā),內(nèi)容包括現(xiàn)有軟件與服務(wù)的加強(qiáng)、擴(kuò)展至新的領(lǐng)域(電子書和關(guān)聯(lián)數(shù)據(jù))、擴(kuò)大與加強(qiáng)社區(qū)建設(shè)[10]。
GOKb從全局層面管理資源包、題名、平臺(tái)商、組織和許可等元數(shù)據(jù),而非國(guó)家或地區(qū)層面[4]。GOKb有3個(gè)基本接口:數(shù)據(jù)的批導(dǎo)入和規(guī)范化接口、查看和編輯數(shù)據(jù)元素的網(wǎng)絡(luò)接口、GOKb數(shù)據(jù)抽取和導(dǎo)出的API(GOKb API)接口。GOKb數(shù)據(jù)可通過API獲取,用戶通過API與本地系統(tǒng)集成[11]。
4.2 典型案例對(duì)比分析
電子資源知識(shí)庫的數(shù)據(jù)格式、更新維護(hù)周期、系統(tǒng)交互性和數(shù)據(jù)使用政策都不完全相同。對(duì)6個(gè)常見電子資源知識(shí)庫相關(guān)信息比較,如表2所示。數(shù)據(jù)主要來自Wilson的報(bào)告[5-6],其中Innovative Central Knowledge Base是2016年發(fā)布的,部分信息暫無。
(1)典型案例的共同點(diǎn)。在服務(wù)方式方面,目前各電子資源知識(shí)庫提供的服務(wù)方式基本相同,大部分支持SaaS。這種服務(wù)方式對(duì)于圖書館而言,無須購(gòu)置硬件,無需本地安裝,減輕維護(hù)管理的壓力。在標(biāo)準(zhǔn)方面,各大知識(shí)庫都支持KBART(Knowledge Bases and Related Tools)。KBART提供所需要的數(shù)據(jù)字段包括DOI、題名、覆蓋范圍和深度等,同時(shí)推薦通用的文件格式、更新頻率指南、知識(shí)庫和鏈接解析器間數(shù)據(jù)交換方法。KBART格式的價(jià)值在其同時(shí)支持人讀和機(jī)讀,對(duì)出版商而言也是低價(jià)實(shí)現(xiàn)高效知識(shí)庫元數(shù)據(jù)傳輸?shù)姆椒╗12]。
(2)典型案例的區(qū)別。上述電子資源知識(shí)庫由于各自發(fā)展背景不同,呈現(xiàn)不同的特點(diǎn)。商業(yè)型電子資源知識(shí)庫在可持續(xù)性和數(shù)據(jù)質(zhì)量方面有一定保障,但是商業(yè)公司的立場(chǎng)是非中立的,可能存在元數(shù)據(jù)獲取來源上的阻撓因素。商業(yè)型電子資源知識(shí)庫的用戶范圍與該公司產(chǎn)品的用戶數(shù)量有關(guān),社區(qū)型電子資源知識(shí)庫完全開放給個(gè)人、機(jī)構(gòu)以及公司使用。如Ex Libris、ProQuest、OCLC和EBSCO都在使用KB+數(shù)據(jù)。KB+是基于項(xiàng)目建設(shè)的知識(shí)庫,與之配套的電子資源管理平臺(tái)功能開發(fā)還不完善,不能適應(yīng)圖書館所有的電子資源管理需求。圖書館只能下載數(shù)據(jù),再導(dǎo)入其管理系統(tǒng)加以利用,否則需要依賴KB+項(xiàng)目的后續(xù)發(fā)展。商業(yè)型電子資源知識(shí)庫的開放性較差,僅有少數(shù)公司提供API,并且只開放給使用該知識(shí)庫的用戶。OCLC通過WorldCat Knowledge Base API提供文章、電子期刊、電子圖書的引用;另外OCLC的WorldCat Knowledge Base與其他商業(yè)型電子資源知識(shí)庫相比,更鼓勵(lì)圖書館員參與知識(shí)庫的建設(shè)。在更新維護(hù)周期方面,ProQuest、EBSCO和OCLC基本可以保證每月更新1次,Ex Libris公司可以實(shí)現(xiàn)每周更新1次。社區(qū)型電子資源知識(shí)庫允許參與館隨時(shí)更新數(shù)據(jù),但通常情況下,每個(gè)電子資源包配有一個(gè)管理者。
表2 6個(gè)常見電子資源知識(shí)庫相關(guān)信息對(duì)比表
隨著圖書館服務(wù)平臺(tái)的廣泛使用,電子資源知識(shí)庫作為支撐數(shù)據(jù)核心,其在數(shù)據(jù)多樣性、數(shù)據(jù)維護(hù)自動(dòng)化和關(guān)聯(lián)數(shù)據(jù)應(yīng)用等方面,有許多需要進(jìn)一步深入研究的問題。
5.1 數(shù)據(jù)多樣性
電子資源知識(shí)庫的評(píng)價(jià)標(biāo)準(zhǔn)之一是能否代表圖書館購(gòu)買和訂閱的全部電子資源。目前電子資源知識(shí)庫的關(guān)注點(diǎn)仍是電子期刊和電子圖書,為適應(yīng)學(xué)術(shù)出版的發(fā)展趨勢(shì),電子資源知識(shí)庫供應(yīng)商需進(jìn)一步獲取非標(biāo)準(zhǔn)格式的元數(shù)據(jù);電子資源知識(shí)庫也需超越商業(yè)出版領(lǐng)域,獲取機(jī)構(gòu)存儲(chǔ)的學(xué)術(shù)產(chǎn)出以及科研數(shù)據(jù)集等。隨著非標(biāo)準(zhǔn)格式元數(shù)據(jù)在知識(shí)庫出現(xiàn),傳統(tǒng)識(shí)別符(如ISBN、ISSN)已無法適用,有必要擴(kuò)充元數(shù)據(jù)字段記錄附加標(biāo)識(shí)。
除去非傳統(tǒng)格式,電子資源知識(shí)庫也需要適應(yīng)越來越多的開放獲取學(xué)術(shù)出版物。開放獲取資源的分散性對(duì)知識(shí)庫是一個(gè)巨大的挑戰(zhàn)。一方面,開放獲取資源可通過多種途徑獲取,內(nèi)容提供商不一定為知識(shí)庫提供題名列表;另一方面,開放獲取出版物的開放程度不同也增加了獲取復(fù)雜度。混合型開放獲取期刊是知識(shí)庫環(huán)境中的一個(gè)特別關(guān)注點(diǎn),因?yàn)槠浒_放獲取內(nèi)容和需要訂閱、付費(fèi)的文章。為幫助發(fā)現(xiàn)系統(tǒng)確定在混合開放獲取期刊中可開放獲取的文章,電子資源知識(shí)庫需要包含文章級(jí)別的開放獲取元數(shù)據(jù)。雖然目前還沒有辦法建立提供描述期刊文章開放性的標(biāo)準(zhǔn)書目元數(shù)據(jù),但美國(guó)國(guó)家信息標(biāo)準(zhǔn)協(xié)會(huì)的Access License and Indicators對(duì)這一方面進(jìn)行研究,并在2015年年初發(fā)布相關(guān)推薦標(biāo)準(zhǔn)[13]。
5.2 數(shù)據(jù)維護(hù)自動(dòng)化
電子資源知識(shí)庫需持續(xù)資源錄入,以自動(dòng)或人工的方式保證全面性、一致性和正確性。隨著知識(shí)庫的發(fā)展,電子資源管理工作將越來越自動(dòng)化。電子資源知識(shí)庫系統(tǒng)的館藏維護(hù),曾耗費(fèi)大量人力,今后將從自動(dòng)化流程中獲益。一些知識(shí)庫提供商開始為圖書館提供特定訂閱的自動(dòng)維護(hù)。如OCLC與Pubget合作,自動(dòng)處理來自提供商平臺(tái)的電子期刊館藏?cái)?shù)據(jù)。使用WorldCat知識(shí)庫和Pubget圖書館的用戶,可在Pubget系統(tǒng)中注冊(cè)管理登錄信息享受檢索服務(wù),并把館藏?cái)?shù)據(jù)推送到OCLC,這些數(shù)據(jù)可自動(dòng)匹配到WorldCat知識(shí)庫。出版商和知識(shí)庫提供商的合作使得電子資源包的館藏維護(hù)變得自動(dòng)化。通過ProQuest和OCLC的合作,EBL和Ebrary的電子書訂閱可去除人工參與。在OCLC WorldCat Knowledge Base知識(shí)庫中,圖書館可要求EBL和Ebrary提供給OCLC館藏?cái)?shù)據(jù)。這些電子圖書的館藏?cái)?shù)據(jù)可在OCLC WorldCat Knowledge Base知識(shí)庫中自動(dòng)激活。另外,OCLC宣布了兩個(gè)合作者:一是和Ingram合作,自動(dòng)維護(hù)MyiLibrary電子書的館藏;二是和Elsevier合作,維護(hù)來自Science Direct平臺(tái)的電子書和電子期刊的館藏。電子資源館藏的管理若以數(shù)據(jù)的自動(dòng)維護(hù)形式開展,圖書館就可有機(jī)會(huì)在數(shù)據(jù)交換方面發(fā)揮更大的作用。
5.3 關(guān)聯(lián)數(shù)據(jù)應(yīng)用
關(guān)聯(lián)數(shù)據(jù)創(chuàng)造了圖書館資源和外部世界進(jìn)行互聯(lián)的機(jī)會(huì),可以拓展圖書館發(fā)現(xiàn)服務(wù)的廣度和深度,將電子資源知識(shí)庫數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù),可使其他系統(tǒng)更易于使用知識(shí)庫內(nèi)容。如GOKb項(xiàng)目的下一步計(jì)劃包括將知識(shí)庫數(shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)形式開放,擴(kuò)大數(shù)據(jù)的利用領(lǐng)域[10]。GOKb使用的關(guān)聯(lián)數(shù)據(jù)模型利用了現(xiàn)有關(guān)聯(lián)數(shù)據(jù)詞表中的許多屬性,如SKOS、RDF Schema、FOAF、DC和BIBFRAME[14]。
[1]BREEDING M.Agents of Change[J].Library Journal,2012, 137(6):30-36.
[2]張斌,魏扣,郝琦.國(guó)內(nèi)外知識(shí)庫研究現(xiàn)狀述評(píng)與比較[J].圖書情報(bào)知識(shí),2016(3):15-25.
[3]SOMPLEL H C D.Reference linking in a hybrid library environment:frameworks for linking[J/OL].D-Lib Magazine,1999,5(4)[2016-06-01].http://www.dlib.org/dlib/april99/van_de_sompel/04van_de_sompel-pt1.html.
[4]DIVEN Y B.Communities of knowledge:creating and connecting resource metadata[J/OL].Serials Review,2013,39(3):162-166[2016-05-26]. http://dx.doi.org/10.1080/00987913.2013.10766386.
[5]WILSON K.Knowledge base and link resolver study:general findings[R/OL].(2012-05-01)[2016-06-01].http://www.libr-arytechnology.org/docs/16908.pdf.
[6]WILSON K.The knowledge base at the center of the universe[J/OL].Library Technology Reports,2016,52(6)[2016-11-16].https://journals.ala.org/ltr/issue/view/606.
[7]EBSCO and Ex Libris[EB/OL].[2017-6-13].https://www.orbiscascade.org/ebsco-ex-libris/.
[8]WorldCat consists of three components:a bibliographic catalog, a knowledge base,and a registry for library information[EB/OL].[2017-06-13].https://www.oclc.org/en/worldcat/inside-worldcat.html#kb.
[9]KB+. Welcome to Knowledge Base[EB/OL].[2016-12-16].https://www.kbplus.ac.uk/kbplus/.
[10]HANSON E M,SONG X Y, WILSON K.Managing serials data as a community: partnering with the Global Open Knowledge base(GOKb)[J/OL].Serials Review,2015,41(3):146-152[2016-06-01].http://dx.doi.org/10.1080/00987913.2015.1064853.
[11]WILSON K B.Bringing GOKb to life:data, integrations, and development[C]//Proceedings of the Charleston Library Conference,September 22,2015.[S.1.]:[s.n],2015.
[12]Knowledge base and related tools(KBART)[EB/OL].[2016-12-16].http://www.niso.org/workrooms/kbart/.
[13]NIOS.Access license and indicators[EB/OL].(2015-01-05)[2016-12-16].http://www.niso.org/apps/group_public/download.php/14226/rp-22-2015_ALI.pdf.
[14]Organization name linked data[EB/OL].[2016-12-16].http://www.lib.ncsu.edu/ld/onld/.
A Review of Research on Overseas Electronic Resources Knowledge Bases
LI Feng, SUN BoYang, SUN YuanYuan
(Beijing Normal University Library, Beijing 100875, China)
Doing research on overseas electronic resources knowledge bases contributes to make clear the role of knowledge bases in electronic resources lifecycle management and the relationship between knowledge bases and library service platform or discovery service. We retrieved research fi ndings on electronic resources knowledge bases published since 2011. Based on pertinent literature, the paper introduces cases including commercial knowledge bases and communitycurated knowledge bases, and summarizes development trend of knowledge bases. The development trend of knowledge bases is supporting data diversity, automatic maintenance and linked data applications.
Knowledge Base; Electronic Resources; Library Services Platform; Discovery Service
G250.7
10.3772/j.issn.1673-2286.2017.07.010
李峰,女,1982年生,碩士,館員,研究方向:數(shù)字圖書館技術(shù),E-mail:lif@lib.bnu.edu.cn。
孫博陽,女,1969年生,碩士,副研究館員,研究方向:數(shù)字圖書館技術(shù),E-mail:sunby@lib.bnu.edu.cn。
孫媛媛,女,1978年生,碩士,館員,研究方向:信息服務(wù),E-mail:sunyy@lib.bnu.edu.cn。
2017-05-10)