周俊燁
(武漢大學(xué)信息管理學(xué)院 武漢 430072)
為了更好地滿足人們的精神文化追求,圖書館、檔案館、博物館(Libraries Archives and Museums,簡稱LAM)的數(shù)字資源整合工作迫在眉睫。在LAM的數(shù)字資源整合領(lǐng)域,英國、美國、德國和加拿大等國都采取了一些措施[1]:加拿大將國家圖書館和國家檔案館合二為一,建立了新的國家圖書檔案館(Library and Archives Canada,LAC),美國建立了世界數(shù)字圖書館(World Digital Library,WDL),英國組建了博物館、圖書館和檔案館理事會(Museums, Libraries and Archives Council,MLA)。 這 些LAM資源整合案例全部是為了滿足公眾共享社會文化資源的需求,改善圖書館、檔案館和博物館公共文化服務(wù)的現(xiàn)狀,結(jié)合互聯(lián)網(wǎng)手段與電子通信技術(shù),構(gòu)建的面向公眾的現(xiàn)代化服務(wù)平臺。我國在改善LAM數(shù)字資源整合現(xiàn)狀、提升公共文化服務(wù)水平方面也緊跟國際步伐,開展了部分實踐,如2002年推出的“全國文化信息資源共享工程”[2]。但這些實踐多局限于系統(tǒng)內(nèi)部的數(shù)字資源共享,缺乏建立一體化服務(wù)平臺、實現(xiàn)跨機構(gòu)數(shù)字資源整合的意識。基于語義網(wǎng)的關(guān)聯(lián)數(shù)據(jù)技術(shù)的產(chǎn)生,為LAM數(shù)字資源的整合帶來了新的契機。
筆者經(jīng)調(diào)查發(fā)現(xiàn),目前國內(nèi)對利用關(guān)聯(lián)數(shù)據(jù)進行LAM數(shù)字資源整合的研究成果寥寥無幾,僅可找到2012年鄭燃等發(fā)表的《基于關(guān)聯(lián)數(shù)據(jù)的圖書館、檔案館和博物館數(shù)字資源整合研究》一文。國內(nèi)基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源整合研究,重點在圖書館,研究成果主要為對應(yīng)用模式的探索。檔案館的相關(guān)研究成果,目前僅有石華于2015年發(fā)表的《基于關(guān)聯(lián)數(shù)據(jù)的語義數(shù)字檔案館框架設(shè)計研究》一文。博物館領(lǐng)域內(nèi)的相關(guān)研究,亦僅有易軍凱于2014年的發(fā)表《一種基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字博物館語義融合方法》一文。
為充分發(fā)揮關(guān)聯(lián)數(shù)據(jù)在LAM數(shù)字資源整合中的價值,筆者基于對關(guān)聯(lián)數(shù)據(jù)基本原理的理解,論述了關(guān)聯(lián)數(shù)據(jù)應(yīng)用于LAM數(shù)字資源整合的可行性,構(gòu)建了基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架,并通過具體案例分析,設(shè)計了基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺,最后,對基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合過程中可能存在的問題進行了論述。
關(guān)聯(lián)數(shù)據(jù)技術(shù)由“萬維網(wǎng)之父”Tim Berners-Lee于2006年提出,隨后互聯(lián)網(wǎng)協(xié)會(W3C)推出一種用于發(fā)布和聯(lián)接各種數(shù)據(jù)、信息和知識的標(biāo)準(zhǔn),即開放關(guān)聯(lián)數(shù)據(jù)(Link Open Data,LOD)[3],推動了關(guān)聯(lián)數(shù)據(jù)在全世界的研究應(yīng)用。
Tim Berners-Lee認為,關(guān)聯(lián)數(shù)據(jù)在理念上就是一箱箱的數(shù)據(jù),能夠通過開放標(biāo)準(zhǔn)關(guān)聯(lián)在一起,從而萌發(fā)出新的價值和應(yīng)用。從應(yīng)用角度看,關(guān)聯(lián)數(shù)據(jù)可視為一種建立在Web網(wǎng)絡(luò)標(biāo)準(zhǔn)之上的結(jié)構(gòu)化數(shù)據(jù)發(fā)布與共享方法[4]。這樣就可以將一個個資源孤島通過各種邏輯關(guān)系整合為統(tǒng)一的數(shù)據(jù)空間,提高Web網(wǎng)絡(luò)的智能化水平。關(guān)聯(lián)數(shù)據(jù)將各類實體和概念都轉(zhuǎn)換為機器可讀或可理解的方式,并用特定的邏輯關(guān)系將它們鏈接起來,再借助互聯(lián)網(wǎng)將結(jié)構(gòu)化的數(shù)據(jù)發(fā)布出去,最終形成一個語義網(wǎng)。
關(guān)聯(lián)數(shù)據(jù)是通過構(gòu)建對象間的關(guān)聯(lián),最終將其整合成全球語義網(wǎng)的重要途徑。為了統(tǒng)一規(guī)范標(biāo)準(zhǔn),Tim Berners-Lee規(guī)定了關(guān)聯(lián)數(shù)據(jù)發(fā)布的四原則:使用URI(統(tǒng)一資源標(biāo)識符)作為任何事物的標(biāo)志;使用HTTP URIs 以便任何人都可以訪問這些標(biāo)志;當(dāng)有人訪問某個標(biāo)志時,使用RDF、SPARQL標(biāo)準(zhǔn)提供有用的信息;盡可能提供相關(guān)的URI以便人們發(fā)現(xiàn)更多的事物[5]。關(guān)聯(lián)數(shù)據(jù)的基本原則是在遵循URI復(fù)用原則的前提下,以HTTP URIs命名與解析機制為依據(jù),以RDF數(shù)據(jù)模型為基礎(chǔ)[6]。這不僅是在關(guān)聯(lián)數(shù)據(jù)的運用中建立了明確的統(tǒng)一規(guī)范和實踐模式,還在關(guān)聯(lián)數(shù)據(jù)資源的聯(lián)系和整合中起到了不可替代的作用。
總的來說,以互聯(lián)網(wǎng)統(tǒng)一規(guī)范和基本框架為基礎(chǔ)的技術(shù)支撐提供了關(guān)聯(lián)數(shù)據(jù)構(gòu)建的可能性和便利性,以語義聯(lián)系為基礎(chǔ)的邏輯性概念和便于人機交互的規(guī)范化語言保證了關(guān)聯(lián)數(shù)據(jù)語義問題處理的高效性,同時URI復(fù)用原則與RDF數(shù)據(jù)鏈接機制也在數(shù)字資源的整合實踐中作出了巨大的貢獻。
關(guān)聯(lián)數(shù)據(jù)因其可透過浮于信息表層的內(nèi)容,深入資源內(nèi)部包含的客觀實體和抽象概念間的聯(lián)系,以邏輯關(guān)系為基礎(chǔ),借助靈活的語義鏈接機制建立數(shù)據(jù)間的聯(lián)接,將一個個信息孤島拼湊起來形成一個完整的語義網(wǎng)絡(luò)[7],而被視為在跨部門、跨領(lǐng)域情況下進行數(shù)字資源整合的有效方法。具體而言,關(guān)聯(lián)數(shù)據(jù)共享機制主要依靠URI復(fù)用原則、RDF鏈接機制和LOD發(fā)布,即提倡積極使用URI復(fù)用原則揭示資源內(nèi)部的關(guān)系,并借助RDF鏈接機制讓資源對象間建立語義關(guān)聯(lián),將結(jié)構(gòu)化數(shù)據(jù)或文本內(nèi)容以數(shù)據(jù)集的形式發(fā)布在萬維網(wǎng)上特別是開放關(guān)聯(lián)數(shù)據(jù)LOD中,使所有用戶都能夠通過網(wǎng)絡(luò)自由開放地檢索、存取與利用LAM數(shù)據(jù)。其具體共享機制見圖1。
圖1 關(guān)聯(lián)數(shù)據(jù)共享機制[8]
3.1.1 廣泛的合作基礎(chǔ)
圖書館、檔案館與博物館是收藏我國民族文化資源的主要部門, 它們有許多共同點與互補點,這是合作的基礎(chǔ)與動力。 第一,在機構(gòu)屬性上,圖書館、檔案館和博物館同屬于公共文化服務(wù)機構(gòu),是記錄和傳承社會文化遺產(chǎn)的重要部門,在保留本國文化精髓,滿足民眾精神文化需求方面有著不可或缺的重要作用。第二,在資源屬性上,圖書館的圖書、檔案館的檔案和博物館的館藏實物,同屬于文化資源,都是本國文化所留存的社會文化遺產(chǎn)。第三,在服務(wù)方式上,三者都是以免費公益的方式,向全社會公眾開放,保證公眾公平獲取信息,致力于提高全社會文化素養(yǎng),增強全民族文化軟實力[9]。所以,在目標(biāo)、關(guān)注點相同且面臨共同挑戰(zhàn)的情況下,LAM的數(shù)字資源整合存在廣泛的合作基礎(chǔ)。
3.1.2 強大的技術(shù)支持
信息技術(shù)的高速發(fā)展為LAM數(shù)字資源整合奠定了技術(shù)基礎(chǔ),突出體現(xiàn)在解決網(wǎng)絡(luò)異構(gòu)問題上。網(wǎng)絡(luò)異構(gòu)指的是計算機快速更新?lián)Q代,各機構(gòu)使用的網(wǎng)絡(luò)系統(tǒng)不盡相同,缺乏定時的交流與溝通,系統(tǒng)間因不能互相通信而形成一個個信息孤島,導(dǎo)致網(wǎng)絡(luò)異構(gòu)環(huán)境的產(chǎn)生。我國圖書館、檔案館和博物館的現(xiàn)狀就是這樣,館際缺乏最基本的協(xié)調(diào)與合作,館藏數(shù)字資源的整合遙不可及。關(guān)聯(lián)數(shù)據(jù)的出現(xiàn)則能更好地解決這一問題。
3.1.3 元數(shù)據(jù)的整合和互操作的實現(xiàn)
LAM擁有豐富的數(shù)字資源且對元數(shù)據(jù)進行了規(guī)范控制,但由于管理體制和館藏發(fā)展政策等原因,各機構(gòu)實施的元數(shù)據(jù)標(biāo)準(zhǔn)、遵循的協(xié)議都不同。如果LAM都以統(tǒng)一的關(guān)聯(lián)數(shù)據(jù)形式建設(shè)館藏資源,就能實現(xiàn)元數(shù)據(jù)的整合與互操作,促進館藏資源的充分利用,改善資源重復(fù)建設(shè)現(xiàn)象,進而提高LAM的知識服務(wù)質(zhì)量。
3.1.4 先進的自身意識
在關(guān)聯(lián)開放數(shù)據(jù)(LOD)項目的推動下,目前有超過130 億條傳統(tǒng)網(wǎng)頁上的數(shù)據(jù),例如維基百科、地理數(shù)據(jù)集和政府?dāng)?shù)據(jù)集等,已經(jīng)自動半自動地轉(zhuǎn)換成了關(guān)聯(lián)數(shù)據(jù),構(gòu)建了龐大的數(shù)據(jù)網(wǎng)絡(luò)[10]。關(guān)聯(lián)數(shù)據(jù)的產(chǎn)生讓LAM三機構(gòu)間、LAM和相關(guān)部門間的數(shù)字資源共建共享工作越來越簡單,LAM意識到建立與分布LAM關(guān)聯(lián)數(shù)據(jù)的責(zé)任,開始將注意點轉(zhuǎn)移到數(shù)字資源整合。LAM應(yīng)當(dāng)利用先進的存儲技術(shù)如云存儲技術(shù),對以館藏資源為基礎(chǔ)建立的關(guān)聯(lián)數(shù)據(jù)進行處理,全方位多層次地滿足用戶多樣化個性化的信息要求,進一步提升用戶對公共文化服務(wù)的滿意度。
如圖2所示,館藏數(shù)字資源一般要通過5個基本流程才能實現(xiàn)整合。
圖2 基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源整合過程[11]
幾乎所有LAM都進入了館藏數(shù)字化進程。為方便機器可讀或可理解,也為后期的整合奠定基礎(chǔ),LAM在其數(shù)字資源整合過程中應(yīng)做到以下幾點:第一,要以規(guī)范化的形式即RDF(資源描述框架)描述館藏數(shù)字資源,創(chuàng)建關(guān)聯(lián)數(shù)據(jù)。第二,為了實現(xiàn)館藏資源的開放共享,需要將創(chuàng)建好的關(guān)聯(lián)數(shù)據(jù)通過互聯(lián)網(wǎng)發(fā)布,發(fā)布過程要遵循關(guān)聯(lián)數(shù)據(jù)四原則,尤其提倡URI的復(fù)用原則以便于體現(xiàn)資源的內(nèi)在關(guān)聯(lián)。第三,通過RDF語義鏈接機制建立所發(fā)布資源間的內(nèi)外部關(guān)聯(lián)關(guān)系。內(nèi)部關(guān)聯(lián)關(guān)系是指在形成RDF記錄時建立的與其他內(nèi)容對象的關(guān)聯(lián)描述,而外部關(guān)聯(lián)關(guān)系的構(gòu)建主要指的是建立一個數(shù)據(jù)庫。具體而言,關(guān)聯(lián)數(shù)據(jù)瀏覽器能利用RDF 機制為公眾提供對象間的瀏覽服務(wù),把得到的RDF 對象進一步加工,建立能提供訪問服務(wù)的RDF 數(shù)據(jù)庫。這個數(shù)據(jù)庫既可以是虛擬數(shù)據(jù)庫也可以是實際數(shù)據(jù)庫。第四,為了提高用戶使用滿意度,適應(yīng)用戶的使用習(xí)慣,需要將瀏覽界面做得更加友好、人性化。因此要根據(jù)用戶所需資源的類型,將與該對象相關(guān)的所有信息以可視化的形式展現(xiàn)給用戶,提供直觀便利的關(guān)聯(lián)數(shù)據(jù)瀏覽服務(wù),即構(gòu)建統(tǒng)一視圖。最后,為了避免關(guān)聯(lián)數(shù)據(jù)源在開放環(huán)境中因數(shù)據(jù)更改成丟失而造成斷鏈或錯鏈現(xiàn)象,必須定時掃描和修補關(guān)聯(lián)數(shù)據(jù)的URI鏈接,維護關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)的正常運行。
語義網(wǎng)的誕生在一定程度上減少了用戶在利用數(shù)字資源過程中的不便,這些不便產(chǎn)生的原因主要是傳統(tǒng)的Web網(wǎng)絡(luò)由大量缺乏關(guān)聯(lián)的動態(tài)或靜態(tài)文檔構(gòu)成。Web的智能化得益于數(shù)字資源的有效整合,而實現(xiàn)數(shù)字資源有效整合的一個重要方法就是建立數(shù)據(jù)之間的語義關(guān)聯(lián),通過URI來實現(xiàn)語義關(guān)聯(lián),提高計算機的數(shù)據(jù)處理效率,使得Web更加智能化[12]。
圖3 基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架[13]
如圖3所示,基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架由底部至頂部主要包括數(shù)據(jù)發(fā)布層、數(shù)據(jù)關(guān)聯(lián)層與數(shù)據(jù)集成應(yīng)用層三部分。數(shù)據(jù)發(fā)布層是資源主體將來源渠道不同的數(shù)據(jù)用資源描述框架進行描述,并在遵循關(guān)聯(lián)數(shù)據(jù)四原則的基礎(chǔ)上將數(shù)據(jù)發(fā)布到萬維網(wǎng)上以便其他用戶瀏覽。數(shù)據(jù)關(guān)聯(lián)層是將不同領(lǐng)域內(nèi)可能存在特定關(guān)聯(lián)關(guān)系的資源借助RDF鏈接機制聯(lián)系起來,形成一個數(shù)據(jù)網(wǎng)絡(luò)。數(shù)據(jù)集成應(yīng)用層指利用關(guān)聯(lián)數(shù)據(jù)技術(shù)向用戶提供各種服務(wù)。
研究者以基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源集成一般框架為基礎(chǔ),結(jié)合各個機構(gòu)的實際情況與差異點,創(chuàng)建了基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架(見圖4),主要分為數(shù)據(jù)及標(biāo)引、關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建和發(fā)布、關(guān)聯(lián)數(shù)據(jù)的具體應(yīng)用三部分。
圖4 基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架[14]
3.3.1 LAM數(shù)字資源的元數(shù)據(jù)標(biāo)引
數(shù)字資源的整合需要在充分考慮元數(shù)據(jù)的基礎(chǔ)上進行,不應(yīng)該只是相關(guān)資源的簡單集合。通過關(guān)聯(lián)數(shù)據(jù)的方法,將基于元數(shù)據(jù)標(biāo)引的數(shù)字資源進行聚合,首先需要利用URI對有關(guān)數(shù)據(jù)集合進行統(tǒng)一標(biāo)識,其次就是數(shù)據(jù)集合的關(guān)聯(lián)過程,即將具有關(guān)聯(lián)關(guān)系的數(shù)據(jù)集通過RDF機制鏈接起來。數(shù)字資源的整合過程不是單純的分類或者按序調(diào)整,而是語義層面的深度關(guān)聯(lián),從而形成以元數(shù)據(jù)為基礎(chǔ)的、高效的數(shù)字資源整合[15]。
3.3.2 關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布
LAM數(shù)字資源進行元數(shù)據(jù)標(biāo)引后,需要利用規(guī)范格式即資源描述框架(RDF/XML)對數(shù)字資源特定的一些屬性作出轉(zhuǎn)換性的描述,建立HTTP URI以利于機器可讀和可理解,所生成的用來揭示資源對象內(nèi)部關(guān)聯(lián)關(guān)系的RDF數(shù)據(jù)則要通過互聯(lián)網(wǎng)發(fā)布出去以供公眾瀏覽和檢索[16]。將RDF數(shù)據(jù)發(fā)布到互聯(lián)網(wǎng)上有兩種選擇,一是利用HTTP的內(nèi)容協(xié)商機制,該機制能根據(jù)客戶端信息請求的類型決定返回HTML的表示形式還是RDF的表示形式;二是采用帶“#”號的URI方式定位到RDF中具體的數(shù)字資源[17]。除此之外,LAM在使用該數(shù)字資源整合框架時還要設(shè)置一個開放許可的訪問接口,用戶可以通過這個接口,用RDF標(biāo)準(zhǔn)化的檢索語言SPARQL和預(yù)定義函數(shù)進行相關(guān)檢索,還可不受空間限制調(diào)用本地數(shù)據(jù)。
3.3.3 關(guān)聯(lián)數(shù)據(jù)的瀏覽與檢索
關(guān)聯(lián)數(shù)據(jù)發(fā)布后,其應(yīng)用除了互聯(lián)與維護外,最主要的就是瀏覽與檢索。用戶有這類需求時,既可以選擇專門的關(guān)聯(lián)數(shù)據(jù)瀏覽器,也可以利用專門的關(guān)聯(lián)數(shù)據(jù)搜索引擎。另外,由于關(guān)聯(lián)數(shù)據(jù)的RDF鏈接機制已將一個個資源孤島通過各種邏輯關(guān)系整合為統(tǒng)一的數(shù)據(jù)空間,用戶可以借助導(dǎo)航在不同數(shù)據(jù)源間進行訪問。目前,被廣泛使用的關(guān)聯(lián)數(shù)據(jù)瀏覽器有Tabulator Browser、Disco Hyperdata Browser、OpenLink Data Web Browser、Object-viewer、Marbles等,而常用的關(guān)聯(lián)數(shù)據(jù)搜索引擎有Falcons、Sindice、Watson、SWSE(Semantic Web Search Engine)、Swoogle 等[18]。
A市圖書館、檔案館、博物館分布在該市不同地點,其隸屬部門、館藏發(fā)展政策均存在較大差異,三者間并無合作。筆者現(xiàn)想將基于關(guān)聯(lián)數(shù)據(jù)的LAM數(shù)字資源整合框架在A市實踐,針對A市的基本情況提出了基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺設(shè)計方案。
4.1.1 分類法使用情況與特點
A市LAM館藏資源分類方法各不相同,圖書館分類以《中國圖書館分類法》為準(zhǔn),博物館的館藏大多為實物型,主要根據(jù)外部特征來分類,檔案館使用的分類依據(jù)是《中國檔案分類法》。
4.1.2 服務(wù)模式與特點
圖書館、博物館、檔案館因不同的館藏資源和服務(wù)目的而形成了不同的服務(wù)模式[19]:①圖書館所提供的服務(wù)有文獻資源流通服務(wù)、信息服務(wù)、讀者教育服務(wù)、技術(shù)服務(wù)以及數(shù)字圖書館服務(wù)等。②檔案館除了提供檢索、瀏覽、參考咨詢以及培訓(xùn)等服務(wù)外,還提供保密保管服務(wù),但開放服務(wù)有所欠缺。③博物館因其館藏資源的特殊性,向公眾提供參觀游覽、講解教育、數(shù)字博物館等服務(wù)。
4.1.3 資源建設(shè)情況與特點
圖書館、檔案館收集和保存的資源主要是文獻型資源,而博物館的資源則大多為實物型,部分資源可能因與各館都有關(guān)聯(lián)而被各館同時收藏。LAM如果不進行資源整合,就會造成館藏資源重復(fù)建設(shè)。
LAM云服務(wù)平臺即在對所有館藏數(shù)字資源進行整合的前提下,根據(jù)用戶的需求查找和檢索資源,并及時反饋給用戶的一站式檢索和服務(wù)平臺。用戶通過這個云服務(wù)平臺,不用輾轉(zhuǎn)三處,只需聯(lián)網(wǎng)就可以不受時間和空間的限制,享受LAM提供的公共文化服務(wù)。在關(guān)聯(lián)技術(shù)的幫助下,LAM所提供的信息服務(wù)也更加全面、準(zhǔn)確和高效。
由圖5可知,基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺總體框架包括兩大模塊:LAM云服務(wù)平臺和LAM關(guān)聯(lián)數(shù)據(jù)處理平臺。LAM云服務(wù)平臺主要包括:LAM基礎(chǔ)設(shè)施與基礎(chǔ)平臺服務(wù)、LAM公共云服務(wù)平臺(公有云)、LAM本地云服務(wù)平臺(私有云)和LAM混合云服務(wù)平臺(混合云)。LAM的基礎(chǔ)設(shè)施與基礎(chǔ)平臺建設(shè)如計算機、數(shù)據(jù)庫、存儲系統(tǒng)等由各館自行負責(zé),各館也可選擇由第三方承建。LAM公共云服務(wù)平臺主要負責(zé)各館數(shù)字資源共建共享,減少資源重復(fù)建設(shè)。公共云服務(wù)平臺還會定期發(fā)布一些關(guān)于館際合作、交流之類的信息,這些都由特定的工作人員負責(zé)。LAM本地云服務(wù)平臺主要包括本地應(yīng)用平臺與應(yīng)用系統(tǒng),負責(zé)各館自身的館藏資源數(shù)字化、館藏資源發(fā)展、特色數(shù)據(jù)庫建設(shè)、向公眾提供宣傳教育和參考咨詢等。LAM混合云服務(wù)平臺主要任務(wù)是將LAM云服務(wù)平臺中的其他平臺整合到一起,進行統(tǒng)一的集成管理,實現(xiàn)公有云與私有云之間的互操作。
圖5 基于關(guān)聯(lián)數(shù)據(jù)的LAM云服務(wù)平臺總體框架[20]
LAM關(guān)聯(lián)數(shù)據(jù)處理平臺就是當(dāng)用戶有了具體的信息資源需求,并向LAM云服務(wù)平臺提出請求時,LAM云服務(wù)平臺會用統(tǒng)一的格式將用戶請求轉(zhuǎn)換為機器語言,即對用戶請求進行資源描述,以便于機器更好地理解。系統(tǒng)會根據(jù)之前的資源描述在數(shù)據(jù)庫內(nèi)進行查找與定位,一旦發(fā)現(xiàn)與用戶需求相匹配的資源,系統(tǒng)會對其進行預(yù)置,將資源位置記錄下來。在所有查找工作結(jié)束后,系統(tǒng)根據(jù)之前的記錄對所有符合條件的對象進行調(diào)度,最后,LAM將依據(jù)關(guān)聯(lián)規(guī)則知識庫創(chuàng)建的關(guān)聯(lián)數(shù)據(jù)發(fā)布在Web網(wǎng)絡(luò)上。
關(guān)聯(lián)數(shù)據(jù)最突出的優(yōu)勢在于將之前沒有關(guān)聯(lián)但相似的對象聯(lián)系起來,并在進一步聚合后將與之有關(guān)的全部數(shù)據(jù)進行加工處理,最終以統(tǒng)一視圖的形式呈現(xiàn)在公眾面前?,F(xiàn)有的關(guān)聯(lián)數(shù)據(jù)搜索引擎能夠提供不同數(shù)據(jù)源間隨意瀏覽的服務(wù),但針對數(shù)據(jù)整合而采取的用戶交互模式并不適用且存在難點[21]。因此,LAM應(yīng)采取有效措施,改進現(xiàn)有的用戶交互模式,如設(shè)置與互聯(lián)網(wǎng)瀏覽器類似的前進和后退功能或創(chuàng)建用戶能夠?qū)Ξ?dāng)前視圖中的數(shù)據(jù)資源進行添加或去除的機制。
LAM 要利用訪問接口才能購買、租用或開發(fā)資源庫[22],假如這些資源庫接口都不開放的話,系統(tǒng)封閉,關(guān)聯(lián)數(shù)據(jù)就不起作用。為了保證數(shù)據(jù)源全面可靠,LAM要吸引更多的數(shù)據(jù)供應(yīng)者為構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)提供服務(wù)。另外,LAM數(shù)字資源整合模式的開放許可標(biāo)準(zhǔn)必須在守法的前提下均衡考慮各方利益,為數(shù)據(jù)供應(yīng)者發(fā)布關(guān)聯(lián)數(shù)據(jù)提供方便和動力。
關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)面向用戶開放,且處于持續(xù)更新中,數(shù)據(jù)源若在開放環(huán)境或更新過程中發(fā)生改變、損壞或丟失,斷鏈或錯鏈隨之產(chǎn)生,系統(tǒng)也會發(fā)生錯誤,甚至無法運行。為了避免這種情況,減少不必要的人力、物力和財力損失,LAM需要實時監(jiān)測數(shù)據(jù)源并對斷鏈或錯鏈及時采取措施,可以安裝監(jiān)控插件,并安排專人負責(zé)管理,以更好地維護數(shù)據(jù)源之間的關(guān)聯(lián)。
LAM的數(shù)字資源都較為豐富,館藏資源的類型、數(shù)據(jù)存儲格式、元數(shù)據(jù)規(guī)范各不相同, 資源載體功能互異,描述方法不一,信息的選擇、組織和揭示有一定難度[23]?;陉P(guān)聯(lián)數(shù)據(jù)的整合模式實施時,需要首先解決將關(guān)系性數(shù)據(jù)等非關(guān)聯(lián)性數(shù)據(jù)轉(zhuǎn)換為關(guān)聯(lián)性數(shù)據(jù)的問題。我們可以建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),采用統(tǒng)一的元數(shù)據(jù)對來自各館的數(shù)字資源進行編目,確保各館在資源組織過程中的一致性。
本文以關(guān)聯(lián)數(shù)據(jù)有關(guān)知識為理論基礎(chǔ),探索將其運用于LAM數(shù)字資源整合的可能性,進而構(gòu)建出一個整合模式,并通過案例假設(shè)讓該模式在A市試點,挖掘其與云服務(wù)的聯(lián)系,提出了云服務(wù)平臺的設(shè)計方案。當(dāng)前的研究只集中在理論層面,該LAM數(shù)字資源整合模式與云服務(wù)平臺有待在實踐中進行相關(guān)效度檢驗,提出評測指標(biāo),才能進一步完善。但仍可作為LAM數(shù)字資源整合的一種可行方案,為今后的研究提供參考和借鑒。
(來稿時間:2018年4月)