●羅 錚,周群英(嘉興職業(yè)技術(shù)學(xué)院 圖書館,浙江 嘉興 314036)
2006年,被譽為互聯(lián)網(wǎng)之父的Tim Berners-Lee在《關(guān)聯(lián)數(shù)據(jù)構(gòu)建筆記》等一系列文章中分析了Web的發(fā)展和演化,提出發(fā)展數(shù)據(jù)網(wǎng)絡(luò)的思想,而數(shù)據(jù)網(wǎng)絡(luò)的核心和關(guān)鍵則是關(guān)聯(lián)數(shù)據(jù)(Linkeddata)。[1]自關(guān)聯(lián)數(shù)據(jù)的概念提出以來,得到了廣泛認同和快速發(fā)展,并受到圖書館、政府部門、企業(yè)等多方面的重視和關(guān)注。關(guān)聯(lián)數(shù)據(jù)對于我國圖書情報界來說尚屬于較新穎的研究領(lǐng)域;筆者通過檢索發(fā)現(xiàn),我國尚未有關(guān)于公共圖書館應(yīng)用關(guān)聯(lián)數(shù)據(jù)的研究文獻。那么何謂關(guān)聯(lián)數(shù)據(jù)?一般比較認同維基百科給出的定義:關(guān)聯(lián)數(shù)據(jù)是語義網(wǎng)的主題之一,描述了通過可鏈接的URI方式來發(fā)布、分享、連接Web中各類資源的方法。[2]我國學(xué)者劉煒先生認為,關(guān)聯(lián)數(shù)據(jù)強調(diào)建立已有信息的語義標注和實現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),具有框架簡潔、標準化、自助化、去中心化、低成本的特點。[3]關(guān)聯(lián)數(shù)據(jù)的基本原理是用一種可利用分布數(shù)據(jù)集及其自主內(nèi)容格式,基于標準的知識表示與檢索協(xié)議、可逐步擴展的機制來實現(xiàn)可動態(tài)關(guān)聯(lián)的知識對象網(wǎng)絡(luò),并支持在此基礎(chǔ)上的知識組織和知識發(fā)現(xiàn)。因此,關(guān)聯(lián)數(shù)據(jù)對于公共圖書館的知識組織將起到一定的作用。
圖書館擁有大量的結(jié)構(gòu)化數(shù)據(jù),國外圖書館界對于關(guān)聯(lián)數(shù)據(jù)的應(yīng)用已引起了足夠重視并進行大力推廣,比較典型的是美國國會圖書館和瑞典國家圖書館。美國國會圖書館以簡單知識組織系統(tǒng)(SKOS)格式將國會標題表(LCSH)全部關(guān)聯(lián)數(shù)據(jù)化,并且提供LCSH詞表的下載,成為關(guān)聯(lián)數(shù)據(jù)應(yīng)用的成功范例,推動了關(guān)聯(lián)數(shù)據(jù)在全世界的實用。美國國會圖書館除了將權(quán)威文檔LCSH發(fā)布為關(guān)聯(lián)數(shù)據(jù)外,還要創(chuàng)建不同資源之間的關(guān)聯(lián)(如LCSH與瑞典聯(lián)合目錄LIBRIS進行關(guān)聯(lián))。另外,美國國會圖書館的其他詞表,如:國會圖書館分類法、人名規(guī)范文檔等,都可以轉(zhuǎn)化為以RDF表示的關(guān)聯(lián)數(shù)據(jù),這就為圖書館數(shù)據(jù)的發(fā)布提供了很好的條件??梢哉J為,美國國會圖書館已經(jīng)看到了使用關(guān)聯(lián)數(shù)據(jù)的潛在好處,如降低服務(wù)器的負載,其做法可以作為國際上其他圖書館的實踐范例。瑞典國家圖書館早在 2008年便將瑞典聯(lián)合目錄(LIBRIS)發(fā)布為關(guān)聯(lián)數(shù)據(jù),為大學(xué)圖書館和公共圖書館、博物館和檔案館提供在線編目服務(wù)。LIBRIS是世界上第一個被整體發(fā)布為關(guān)聯(lián)數(shù)據(jù)的聯(lián)合目錄,主要由瑞典國家圖書館負責(zé)管理,開放其200多個成員館的大約650萬條書目記錄、20萬條規(guī)范文檔記錄。瑞典國家圖書館已經(jīng)開始創(chuàng)建從聯(lián)合目錄到維基百科(DBpedia)的鏈接,為圖書館界開展關(guān)聯(lián)數(shù)據(jù)的發(fā)布及應(yīng)用提供了寶貴的經(jīng)驗和思路。
關(guān)聯(lián)數(shù)據(jù)不但減輕了Web網(wǎng)絡(luò)中整合分布式異構(gòu)數(shù)據(jù)源的復(fù)雜性,同時也推動了圖書館對關(guān)聯(lián)數(shù)據(jù)的新應(yīng)用。關(guān)聯(lián)數(shù)據(jù)對于圖書館在Web上發(fā)布書目數(shù)據(jù)和規(guī)范數(shù)據(jù)具有重要意義,與網(wǎng)絡(luò)時代的圖書情報工作關(guān)系非常密切,是互聯(lián)網(wǎng)發(fā)展到語義網(wǎng)時代,對網(wǎng)上資源和數(shù)字對象進行“編目”和“規(guī)范控制”的基礎(chǔ)性技術(shù),是圖書館進行信息資源發(fā)布和建設(shè)的核心技術(shù)之一。如上文所述,目前國際上已經(jīng)有一些圖書館開始采用和發(fā)布關(guān)聯(lián)數(shù)據(jù),如瑞典國家圖書館、美國國會圖書館等。在新信息化環(huán)境下,增強公共圖書館的社會服務(wù)能力和服務(wù)水平顯得尤為迫切。知識發(fā)現(xiàn)對于公共圖書館服務(wù)非常重要,關(guān)聯(lián)數(shù)據(jù)為公共圖書館的知識發(fā)現(xiàn)服務(wù)提供了良好的途徑。關(guān)聯(lián)數(shù)據(jù)創(chuàng)造了把公共圖書館的知識和外部世界相互連接起來的機會,可以增強和擴展公共圖書館的知識發(fā)現(xiàn)平臺,改善公共圖書館的服務(wù)面貌,從而提升其社會價值。我國公共圖書館界也應(yīng)該重視這一技術(shù),及早投入一定的資源和人力進行研究開發(fā)和應(yīng)用推廣,使公共圖書館大量的權(quán)威數(shù)據(jù)在互聯(lián)網(wǎng)上占據(jù)一席之地。
公共圖書館歷來就是學(xué)術(shù)研究的重要陣地之一。特別是近幾年來在公共圖書館設(shè)立碩士、博士學(xué)位授權(quán)點,科研成果不斷增多,開展的學(xué)術(shù)交流活動也不斷增加。公共圖書館越來越多地參與出版和學(xué)術(shù)交流過程中不同階段的活動。例如,聯(lián)絡(luò)館員幫助研究者發(fā)現(xiàn)他們研究成果的引文影響力;同樣,圖書館員也開發(fā)和利用機構(gòu)倉儲系統(tǒng)來幫助機構(gòu)保存、管理和再利用那些已經(jīng)出版的和沒有出版的研究資料。目前,已經(jīng)有一些機構(gòu)倉儲軟件開始支持語義服務(wù)和關(guān)聯(lián)數(shù)據(jù),通過為倉儲內(nèi)的資源提供統(tǒng)一的標識以及資源之間的關(guān)系,實現(xiàn)對語義數(shù)據(jù)的存儲和語義服務(wù)。另外,類似于其他公共圖書館資源集合,機構(gòu)倉儲也需要考慮系統(tǒng)的互操作性,關(guān)聯(lián)數(shù)據(jù)將會在應(yīng)用系統(tǒng)的互操作性方面提供更好的支持。在學(xué)術(shù)研究過程中,用戶希望可以看到研究成果被引用的情況和再利用的情況,希望能夠通過研究出版物找到原始文獻、原始數(shù)據(jù)以及發(fā)現(xiàn)更多的作者。如果借助于關(guān)聯(lián)數(shù)據(jù),公共圖書館可以幫助用戶發(fā)現(xiàn)更多關(guān)于作者的信息以及他們?nèi)绾蔚玫劫Y助的信息,允許用戶下載原始的研究數(shù)據(jù)。
美國國會圖書館以簡單知識組織系統(tǒng)格式將國會標題表關(guān)聯(lián)數(shù)據(jù)化;瑞典聯(lián)合目錄使用的詞匯表包含了元數(shù)據(jù)、簡單知識組織和書目本體等,這一點對于我們具有較大的啟發(fā):我國公共圖書館界也可以利用關(guān)聯(lián)數(shù)據(jù)更好地實現(xiàn)知識單元的組織。國外的一些圖書館常常通過實施資源發(fā)現(xiàn)服務(wù)來擴展其目錄檢索界面,瀏覽動態(tài)更新的結(jié)果,展示更多的館藏信息。關(guān)聯(lián)數(shù)據(jù)可以為擴展公共圖書館的書目信息提供結(jié)構(gòu)化的數(shù)據(jù)基礎(chǔ),為用戶提供新的知識訪問服務(wù);關(guān)聯(lián)數(shù)據(jù)允許公共圖書館關(guān)聯(lián)到更廣泛的信息資源,不僅可以幫助用戶判斷是否是所需要的圖書、期刊資源,還可以幫助用戶獲取圖書館以外的信息。公共圖書館還可以將自己的資源發(fā)布為關(guān)聯(lián)數(shù)據(jù),使用戶再鏈接返回到圖書館。關(guān)聯(lián)數(shù)據(jù)為公共圖書館提供了知識資源之間的鏈接,使發(fā)現(xiàn)和共享網(wǎng)絡(luò)中不同類型的知識資源成為可能。關(guān)聯(lián)數(shù)據(jù)在數(shù)據(jù)層建立了鏈接機制,數(shù)據(jù)的結(jié)構(gòu)信息被很好地進行描述,并通過URI來確保機器能夠自動鏈接各種數(shù)據(jù),為信息聚合的智能化和自動化提供了基礎(chǔ)。公共圖書館可利用關(guān)聯(lián)數(shù)據(jù)源中的關(guān)聯(lián)關(guān)系,實現(xiàn)有序地組織、集成和關(guān)聯(lián)知識單元,進行知識內(nèi)容的關(guān)聯(lián)和深層展示,實現(xiàn)多類型知識單元的整合和集成,為用戶提供多層次的知識關(guān)聯(lián)集成服務(wù)。
在現(xiàn)代信息網(wǎng)絡(luò)飛速發(fā)展的時代,公共圖書館迫切需要拓展和豐富信息服務(wù)的手段和方式,增強自身的競爭力,而知識集成和資源發(fā)現(xiàn)已成為圖書館領(lǐng)域的關(guān)鍵問題之一。公共圖書館應(yīng)該加快提高資源發(fā)現(xiàn)內(nèi)容和傳遞服務(wù)質(zhì)量的步伐,以幫助用戶實現(xiàn)資源發(fā)現(xiàn)的相關(guān)性和便捷性;而關(guān)聯(lián)數(shù)據(jù)正是更好地實現(xiàn)資源發(fā)現(xiàn)的途徑之一。關(guān)聯(lián)數(shù)據(jù)創(chuàng)造了把公共圖書館的資源和外部世界相互連接起來的機會,可以增強和擴展公共圖書館的資源發(fā)現(xiàn)平臺,以及支持公共圖書館在學(xué)術(shù)交流環(huán)境下作為創(chuàng)建者和出版者的作用。在關(guān)聯(lián)數(shù)據(jù)云圖中,有許多關(guān)聯(lián)資源可以作為公共圖書館的資源庫和知識庫,可以利用云圖中的關(guān)聯(lián)開放數(shù)據(jù)進行公共圖書館資源的擴展和關(guān)聯(lián),為用戶提供更豐富、更有意義的檢索結(jié)果。公共圖書館不僅只是利用現(xiàn)有的關(guān)聯(lián)數(shù)據(jù),還可以將一些特色數(shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù),增加用戶返回圖書館的途徑。這樣,公共圖書館不但可以擴展其關(guān)聯(lián)數(shù)據(jù),而且增強自身的社會價值。
隨著國際上圖書館將自身關(guān)聯(lián)數(shù)據(jù)發(fā)布在Web網(wǎng)上的實踐,越來越多的圖書館也展開了發(fā)布關(guān)聯(lián)數(shù)據(jù)的嘗試。但是,問題也隨之出現(xiàn):關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中的數(shù)據(jù)并不是一成不變的,新的數(shù)據(jù)會不斷加入,過時的數(shù)據(jù)需要修改或刪除,數(shù)據(jù)之間的鏈接也隨之變化。一旦某個數(shù)據(jù)源有所變動,數(shù)據(jù)源之間的關(guān)聯(lián)可能會產(chǎn)生斷鏈,這會引起關(guān)聯(lián)數(shù)據(jù)的應(yīng)用隨之也發(fā)生錯誤,進而導(dǎo)致關(guān)聯(lián)數(shù)據(jù)失效。目前的一般做法是忽略這些問題,當具體的應(yīng)用發(fā)現(xiàn)斷鏈時再解決。雖然當前的網(wǎng)絡(luò)結(jié)構(gòu)允許一定數(shù)量死鏈接的存在,但過多的死鏈接將使客戶端發(fā)出大量的無效HTTP請求,從而影響數(shù)據(jù)網(wǎng)絡(luò)的效率。為了降低應(yīng)用層對斷鏈的處理,公共圖書館對數(shù)據(jù)源應(yīng)該保證關(guān)聯(lián)關(guān)系的有效性。同樣,公共圖書館對關(guān)聯(lián)數(shù)據(jù)源也應(yīng)提供監(jiān)測和修正機制,以維護數(shù)據(jù)參照的完整性。
公共圖書館服務(wù)的用戶范圍很廣,類型多樣。如何改善服務(wù)質(zhì)量、使不同的用戶滿意顯得特別重要。從用戶的角度看,關(guān)聯(lián)數(shù)據(jù)的最大好處是可以提供多個分布式異構(gòu)數(shù)據(jù)源的整合關(guān)聯(lián)的訪問。關(guān)聯(lián)數(shù)據(jù)瀏覽器允許不同的用戶在不同數(shù)據(jù)源之間進行瀏覽,不過目前在關(guān)聯(lián)數(shù)據(jù)的導(dǎo)航和檢索結(jié)果顯示方面還不盡人意,需要進一步完善。例如,關(guān)聯(lián)數(shù)據(jù)瀏覽器的導(dǎo)航控制應(yīng)該為用戶提供實體之間的前進和后退功能,關(guān)聯(lián)數(shù)據(jù)瀏覽器需要從傳統(tǒng)以文件為中心轉(zhuǎn)向以實體為中心的瀏覽視圖,改變?yōu)橛脩籼峁?yīng)用服務(wù)的角度和焦點。另外,用戶不僅需要查看實體之間的鏈接,還需要方便地分析公共圖書館的數(shù)據(jù)源。因此,公共圖書館利用關(guān)聯(lián)數(shù)據(jù)時應(yīng)改善用戶界面,提高其交互性能。
[1]伯納斯·李.關(guān)聯(lián)數(shù)據(jù)開啟互聯(lián)網(wǎng)新紀元[EB/OL]. [2011 互06 互16].http://www.chinaelections.org/NewsInfo.a(chǎn)sp?NewsID=169269.
[2]Wikipedia,Linked data [EB/OL]. [2011 互06 互16].http://en.wikipedia.org/wiki/linked_data.
[3]劉煒.關(guān)聯(lián)數(shù)據(jù)的意義與實現(xiàn)[EB/OL].[2011-06-16].http://202.114.9.60/dl6/pdf/24pdf.