彭 楨 包海峰 徐濼燚
(南京大學(xué)檔案館,江蘇南京,210046)
支持元數(shù)據(jù)和服務(wù)共享的三類互操作協(xié)議比較*
彭 楨 包海峰 徐濼燚
(南京大學(xué)檔案館,江蘇南京,210046)
在信息技術(shù)進步的浪潮中,出現(xiàn)了各類廣泛分布、異構(gòu)、自治的檢索系統(tǒng)和發(fā)布系統(tǒng)。隨著用戶數(shù)量和所要求的服務(wù)質(zhì)量的提升,對使用統(tǒng)一檢索接口而覆蓋諸多信息發(fā)布系統(tǒng)的呼聲日益高漲,互操作協(xié)議在此種背景下應(yīng)運而生。根據(jù)作用機制的不同,互操作協(xié)議可以分為聯(lián)邦、元數(shù)據(jù)收割、信息搜集三種類型。文章從互操作系統(tǒng)的實現(xiàn)到效果,包括聯(lián)合服務(wù)能力、存儲和維護開銷、數(shù)據(jù)安全性和保密性幾個方面,結(jié)合實際案例對互操作協(xié)議的實施和變更進行比較和評估,從而明確各類協(xié)議的優(yōu)缺點及適用性,依據(jù)“適度代價獲取充分功能”的原則,為廣大服務(wù)提供商和用戶提供參考。
互操作協(xié)議 元數(shù)據(jù)標(biāo)準(zhǔn) 數(shù)字檔案館 OAIster歐洲數(shù)字圖書館PERSIVAL
不同的領(lǐng)域中,“互操作性”(Interoperability)有著不同的定義。美國電氣和電子工程師協(xié)會(Institute of Electrical and Electronics Engineers,US IEEE)將其定義為“兩個或多個系統(tǒng)相互使用已被交換的信息的能力”。而在歐洲面向公眾管理部門、企業(yè)及市民互操作性 電 子 服務(wù) 項 目(IDABC,Interoperable Delivery of European eGovernment Services to Public Administrations,Businesses and Citizens)中,互操作性是指信息和通信技術(shù)(Information and Communication Technology,ICT)系統(tǒng)的能力,以及系統(tǒng)對于所支持的業(yè)務(wù)流程中不同實體間交換數(shù)據(jù),共享信息和知識的能力。就其本質(zhì)而言,互操作性是在異質(zhì)實體(包括異種體系結(jié)構(gòu)、異種操作系統(tǒng)、異種網(wǎng)絡(luò)和異種語言等)中獲得資源透明調(diào)用的能力。延伸至數(shù)字檔案館領(lǐng)域,互操作性表現(xiàn)為在滿足檔案的保密性、安全性需求的基礎(chǔ)上,實現(xiàn)數(shù)字檔案館間交換檔案元數(shù)據(jù)、查詢數(shù)字檔案和提供增值服務(wù)的能力。它要求技術(shù)(軟件體系結(jié)構(gòu)和通信協(xié)議等)、內(nèi)容(元數(shù)據(jù)及其語義等)和組織(數(shù)字檔案館性質(zhì)所要求的認(rèn)證和訪問原則等)三方面的合作。
根據(jù)作用機制的不同,互操作協(xié)議可以分為以下三種類型:
1.1 元數(shù)據(jù)收割(Harvesting)
各系統(tǒng)之間建立松散聯(lián)盟,從而實現(xiàn)一些基本功能的共享。在應(yīng)用層面上,采用一致的公共互操作協(xié)議從各自館藏中收割出元數(shù)據(jù)使其可以被服務(wù)提供方獲取,并用來提供諸如數(shù)據(jù)挖掘及參考鏈接等增值服務(wù)。著名的OAI-PMH協(xié)議即屬于此種類型,采用該協(xié)議及其變種的項目有NDLTD、OAIster及CALIS等,相關(guān)軟件有Greenstone、ARC等。
1.2 聯(lián)邦(Federated)
各系統(tǒng)之間建立緊密聯(lián)盟,并采用統(tǒng)一的通信協(xié)議或軟件系統(tǒng)。這是最早出現(xiàn)的解決不同數(shù)字檔案館間互操作需求的模式。服務(wù)器負(fù)責(zé)更新和處理查詢,客戶端則與最終用戶連接,負(fù)責(zé)從中獲取查詢,發(fā)送至各個服務(wù)器,而后接收查詢結(jié)果并將其整合,或者利用中間層,由中間層與各個服務(wù)器相聯(lián)系,客戶端只需要與中間層聯(lián)系。屬于這種模式的互操作協(xié)議有Z39.50、SRW/SRU等。采用這類模式實施的項目有NCSTRL、PERSIVAL及MOBIUS等,相關(guān)的軟件有INNOPAC、YAZ等。
1.3 信息搜集(Gathering)
各系統(tǒng)利用各自公開訪問途徑搜集信息,通過一定的互操作手段進行整合,整合手段因?qū)嶋H情況各異。通常情況下,此種互操作模式會降低檢索成果的查準(zhǔn)率和查全率,低于直接通過查詢各成員館得到的結(jié)果。由于這項短板,該模式常見于商業(yè)引擎中。以谷歌學(xué)術(shù)為例,目前谷歌學(xué)術(shù)能作為字段進行差別檢索的只有三個,分別為作者、出版物和出版時間,遠(yuǎn)低于專業(yè)的學(xué)術(shù)檢索系統(tǒng)。
在檔案界,互操作協(xié)議被廣泛使用,已涌現(xiàn)出一大批有參考價值的案例,如英國的檔案利用項目(A2A,Acess to Archives)、澳大利亞的澳大利亞科學(xué)家歷史資源集(Bright Sparcs,Scientist Present in Australia's History Resource Collection Strategy)、蘇州工業(yè)園區(qū)檔案館項目,以及接下來本文詳細(xì)介紹的OAIster、歐洲知識門戶和PERSIVAL。William Arms根據(jù)互操作協(xié)議所提供的功能和實施代價這兩個主要指標(biāo),給出了一種評價數(shù)字圖書館互操作的“功能—代價”曲線模型,而俞力則根據(jù)信息系統(tǒng)互操作的LISI評價模型對各項互操作策略進行了評估。本文在前人研究的基礎(chǔ)上,對檔案界的互操作系統(tǒng),從實現(xiàn)到效果,包括聯(lián)合服務(wù)和用戶體驗、存儲和維護開銷、數(shù)據(jù)安全性和保密性幾個方面,結(jié)合實際案例對互操作協(xié)議的實施和變更進行比較和評估,從而明確各類協(xié)議的優(yōu)缺點及適用性,依據(jù)“適度代價獲取充分功能”的原則,為廣大服務(wù)提供商和用戶提供參考。
3.1 OAI及OAIster
OAI-PMH協(xié)議是OAI協(xié)議的一 部 分 。 OAI(Open Archives Initiative,開放文檔先導(dǎo)元數(shù)據(jù)收割協(xié)議)是一項簡單、靈活的元數(shù)據(jù)互操作協(xié)議,其目標(biāo)是通過元數(shù)據(jù)收割模式實現(xiàn)在Web上發(fā)布信息的不同組織之間的互操作,形成一個與應(yīng)用無關(guān)的互操作框架,同時支持選擇性收割以完成系統(tǒng)間元數(shù)據(jù)的循環(huán)交換。
OAIster是密歇根大學(xué)2002年發(fā)起的聯(lián)合目錄項目,其整合對象為從開放存取數(shù)字資源集合所獲取的數(shù)字資源。該項目以O(shè)AIPMH協(xié)議為藍(lán)本,截止至2014年12月17日,覆蓋了超過1500個成員館 。2009年 OCLC(Online Computer Library Center,聯(lián)機計算機圖書館中心)參與到這個項目的建設(shè)和維護中,目標(biāo)是將OAIster建設(shè)成一個所有開放存取數(shù)字資源庫的自助服務(wù)貢獻模型,以確保其對豐富開放資源的存取能力具有可持續(xù)性。它目前是全球最大的開放檔案資料數(shù)據(jù)庫。
3.2 SRW/U及歐洲圖書館
SRW/U (the Search and RetrieveWeb Service/theSearch and Retrieve via URL)則是為了解決Z39.50基于OSI模型建立而無法直接與WEB連接及Z39.50協(xié)議過于復(fù)雜等問題而提出的Z39.50 ZING協(xié)議的一個組成部分。該協(xié)議的目標(biāo)是在通用的框架結(jié)構(gòu)下實現(xiàn)對各種網(wǎng)絡(luò)資源的整合。
SRW/U由美國國會圖書館(LC,the Library of Congress)負(fù)責(zé)維護管理,2004年2月發(fā)布了SRU 1.1版本,目前已更新至2.0版本,是OASIS (Organization for the Advancement of Structured Information Standards,結(jié)構(gòu)化信息標(biāo)準(zhǔn)促進組織)認(rèn)可的標(biāo)準(zhǔn)之一。根據(jù)通信協(xié)議不同,SRW/U分為按參數(shù)傳遞的形式分為兩類:基于SOAP協(xié)議的SRW與基于HTTP協(xié)議的SRU。
LC、OCLC、牛津大學(xué)等信息服務(wù)機構(gòu)均發(fā)布了自己的SRU服務(wù)接口平臺。歐洲圖書館:歐洲知識的門戶(The European Library: Gateway to Europe's Knowledge)項目由芬蘭、德國等多個國家參與,涉及不同的語種,而這些圖書館在本地查詢中多數(shù)都利用了Z39.50,因此項目采用了SRU和CQL來實現(xiàn)互操作。
3.3 SDARTS及PERSIVAL計劃
STARTS/SDLIP/SDARTS協(xié)議是由美國斯坦福大學(xué)、哥倫比亞大學(xué)等機構(gòu)完成的一組搜索協(xié)議,各個協(xié)議功能如下:STARTS協(xié)議定義對數(shù)據(jù)源的查詢請求、查詢格式以及數(shù)據(jù)源提供的關(guān)于回復(fù)內(nèi)容和格式;SDLIP協(xié)議定義兩種信息資源之間的互操作行為,以及不同公共接口類型與相應(yīng)的中間件LSP;SDARTS協(xié)議為針對常見數(shù)據(jù)集類型的封裝器參考執(zhí)行程序工具包。
PERSIVAL(Personalized Retrieval and Summarization of Image, Video,and Language Resources,個人圖像視頻及語言資源檢索及概要計劃)是由哥倫比亞大學(xué)計算機系發(fā)起的項目,旨在為分散的醫(yī)療檔案提供統(tǒng)一的檢索入口。
Rong Shi在 設(shè) 計 LFDL(Lightweight Federated Digital Library,輕量級聯(lián)合數(shù)字圖書館)互操作實現(xiàn)機制時,提出了優(yōu)秀的互操作協(xié)議應(yīng)該滿足不需要改變原有數(shù)據(jù)體系結(jié)構(gòu)、聯(lián)合服務(wù)能力強、維護簡單、安全性高等要求。本文根據(jù)檔案的特點及檔案管理的長期保存、定密分級的需求,覆蓋互操作協(xié)議的實現(xiàn)及效果的整個運作周期,將比較的標(biāo)準(zhǔn)歸結(jié)為三個方面,分別是聯(lián)合服務(wù)能力、存儲和維護開銷、數(shù)據(jù)安全性和保密性。
4.1 聯(lián)合服務(wù)能力
聯(lián)合服務(wù)能力,即整合檢索結(jié)果并在此基礎(chǔ)上提供服務(wù)的能力。聯(lián)合服務(wù)要求準(zhǔn)確而且全面地整合數(shù)據(jù)以提供優(yōu)化的檢索,同時也要求在此基礎(chǔ)上發(fā)展出更多樣完備的增值服務(wù)。
表1 三個典型案例的檢索服務(wù)及個性化設(shè)置
OAI-PMH協(xié)議的優(yōu)勢在于,每一個信息資源條目都有全球獨一無二的OAI ID,理論上所有的OAI資源庫可以整合到一起。但這也帶來了問題,通用性要求數(shù)據(jù)提供方所提供的數(shù)據(jù)必須是DC標(biāo)準(zhǔn),而DC標(biāo)準(zhǔn)的針對性較弱,對部分存在特殊專業(yè)要求信息資源的揭示不夠深入、全面。該協(xié)議以元數(shù)據(jù)收割實現(xiàn)互操作,只有在服務(wù)提供者第一次為數(shù)據(jù)提供者收割時,會完整地收割整個資源庫的歷史數(shù)據(jù),之后為定期收割新增或變動數(shù)據(jù),導(dǎo)致收割到的數(shù)據(jù)和數(shù)據(jù)提供方的實時數(shù)據(jù)存在著時間差,因此這種實現(xiàn)方式能提供的檢索服務(wù)并不是完全同步的。且該協(xié)議規(guī)定的數(shù)據(jù)提供方只向服務(wù)提供方提供元數(shù)據(jù)資源,無法為增值服務(wù)提供支持。
相應(yīng)的,SRW/U可以根據(jù)需要使用任何元數(shù)據(jù)格式,預(yù)設(shè)的元數(shù)據(jù)標(biāo)準(zhǔn)有DC、Onix、MODS等。處于同一聯(lián)邦內(nèi)的數(shù)字檔案館必須采用同一種元數(shù)據(jù)格式。除元數(shù)據(jù)外,也能共享其他增值服務(wù)類型。歐洲數(shù)字圖書館中,還包括其他機構(gòu)提供的開放關(guān)聯(lián)數(shù)據(jù),不僅包括傳統(tǒng)的書目記錄,還有用戶標(biāo)簽與評論、社會網(wǎng)絡(luò)活動及用戶照片與視頻等。以檢索“Renaissance”為例,反饋的結(jié)果不但有與之相關(guān)的信息資源條目,還有對于這些條目按照時間、國家、格式等的分布統(tǒng)計及相關(guān)鏈接,支持進一步檢索。
SDARTS協(xié)議并不支持某一種現(xiàn)有的元數(shù)據(jù)標(biāo)準(zhǔn),而是在STARTS中規(guī)定了必須和可供選擇的元數(shù)據(jù)屬性。必須提供的元數(shù)據(jù)屬性有數(shù)據(jù)源支持的字段(Fields Supported)、支持的修飾語(Modifiers Supported)、分值分布區(qū)間(Score Range)、排序算法ID(Ranking-algorithm Id)、樣本檢索結(jié) 果 地 址(Sample Data Base Results)、數(shù)據(jù)源鏈接(Linkage)等。
SRW/U和SDARTS協(xié)議都是分布式檢索模式,分布式數(shù)據(jù)庫能夠在各自的存儲位置上得到及時和專業(yè)的維護、更新,用戶可即時查詢最新數(shù)據(jù)。表1為三種案例個性化設(shè)置及檢索功能的簡要對比。
4.2 存儲及維護開銷
在數(shù)字檔案館領(lǐng)域,周麗霞將檔案元數(shù)據(jù)概念分為檔案信息內(nèi)容元數(shù)據(jù)、檔案對象元數(shù)據(jù)、資源集合元數(shù)據(jù)、管理與服務(wù)機制元數(shù)據(jù)、管理過程與系統(tǒng)元數(shù)據(jù)、檔案元數(shù)據(jù)這六個層次。檔案自其產(chǎn)日起,其第一及第二層元數(shù)據(jù)相對穩(wěn)定、保持不變。第三及第四層元數(shù)據(jù)則會根據(jù)檔案的組織、管理情況產(chǎn)生變化,變化產(chǎn)生的時間沒有規(guī)律性,需要及時維護和更新。下文將從存儲維護和處理查詢兩個方面進行論述。
OAI-PMH協(xié)議要求將元數(shù)據(jù)收割到服務(wù)提供方進行集中式目錄存儲,因此服務(wù)提供方必須及時對這部分?jǐn)?shù)據(jù)進行再組織和更新。在更新過程中,數(shù)據(jù)提供方需要保證所提供元數(shù)據(jù)的質(zhì)量以及運行的穩(wěn)定性。按照更新條件的不同,具體的收割機制可以分為歷史數(shù)據(jù)收割、新增或變動數(shù)據(jù)收割兩類。收割協(xié)議通過收割規(guī)范化、結(jié)構(gòu)化的元數(shù)據(jù),得到完備且精確的結(jié)果集。綜上所述,OAI-PMH協(xié)議將計算、存儲的開銷根據(jù)數(shù)據(jù)提供方和服務(wù)提供方的不同角色進行分配。因此可以根據(jù)相應(yīng)的硬件條件和數(shù)據(jù)要求作出調(diào)整策略。檢索方面,查詢壓力主要由服務(wù)提供方承擔(dān),并且隨著記錄的增多,開銷會不斷增長。
SRW/U使用模塊化的整合方式,即將信息檢索視為各個不同模塊檢索服務(wù)的集合。以歐洲數(shù)字圖書館為例,服務(wù)器響應(yīng)檢索要求的具體過程為:將用戶提交的請求中所包含的URL參數(shù)轉(zhuǎn)換為封裝的SOAP包,再由后臺的各個檢索模塊接收SOAP包后提交查詢請求,獲取初步檢索結(jié)果;隨后確認(rèn)用戶的身份權(quán)限,根據(jù)用戶個人信息、上下文信息以及用戶請求資源情況,將初步檢索結(jié)果生成統(tǒng)一的XML文檔提供給應(yīng)用層。在整個過程中,查詢經(jīng)由網(wǎng)站統(tǒng)一入口被分散到各個單獨的檢索系統(tǒng)中,再進行綜合,不產(chǎn)生額外的存儲開銷,查詢壓力由各個組成部分共同承擔(dān)。
PERSIVAL項目中,利用了自然語言處理(NLP,Natural Language Processing)的研究成果。在身份及背景數(shù)據(jù)確定后,系統(tǒng)在數(shù)據(jù)庫檢索相關(guān)結(jié)果的同時,根據(jù)該用戶的歷史記錄(如醫(yī)療記錄)以及權(quán)限等信息,按檢索者的適合程度,重新組織、整合、顯現(xiàn)檢索結(jié)果。通過自然語言處理,PERSIVAL為現(xiàn)有分散的多媒體信息提供了一個包含檢索結(jié)果摘要、相關(guān)文件與影像全文、檢索結(jié)果的解釋說明、建議檢索詞匯以及檢索歷史記錄的用戶接口。相關(guān)信息的搜集、篩選、鑒別在完全通過客戶端軟件的自然語言處理機制來實現(xiàn),因此PERSIVAL不產(chǎn)生額外的存儲開銷,需要安裝客戶端程序和配置相應(yīng)的檢索環(huán)境,檢索過程也更為復(fù)雜。
4.3 數(shù)據(jù)安全性和保密性
下文從機制和具體實現(xiàn)方式兩個方面論述數(shù)據(jù)的安全性和保密性。
對于OAI-PMH協(xié)議,內(nèi)部運用的元數(shù)據(jù)標(biāo)準(zhǔn)DC的“dc rights”屬性用以攜帶權(quán)限信息的以及服務(wù)提供方元數(shù)據(jù)等級映射機制,在此基礎(chǔ)上可建構(gòu)基于OAI的等級安全權(quán)限機制。在具體實現(xiàn)過程中,數(shù)據(jù)提供者元數(shù)據(jù)收割請求的發(fā)送和返回都是通過HTTP協(xié)議來完成的,協(xié)議中規(guī)定傳遞參數(shù)方式為GET或POST。如果采用前者則會帶來安全問題,因為用戶名和密碼會出現(xiàn)在訪問的URL上,如果頁面被緩存或者其他人可以訪問客戶這臺機器,就可以從歷史記錄獲得該用戶的賬號和密碼。相應(yīng)的,此種方式的傳輸及計算成本較小,可根據(jù)實際情況選取參數(shù)傳遞方式。
SRU基于HTTP協(xié)議,也是通過GET和POST方式獲取數(shù)據(jù),其具體實現(xiàn)與上述OAI-PMH的描述相同。而SRW遵循SOAP通信協(xié)議,根據(jù)Web Service規(guī)范把查詢請求封裝成SOAP包,使用POST發(fā)送。從使用者的角度,Web Service是部署在web上的對象,具有對象的良好封裝性和安全性。綜上所述,SRU/SRW的安全性不同。由于這兩種協(xié)議均不存在集中的元數(shù)據(jù)存儲,因此保密性相對較高。
PERSIVAL出于數(shù)據(jù)版權(quán)以及醫(yī)療記錄隱私權(quán)的考慮,必須對使用者權(quán)限有所控制,對數(shù)據(jù)隱秘性有所保護。在用戶界面上,系統(tǒng)開始處理檢索者輸入的檢索策略之前,首先要確定的是檢索者的身份,包括其形態(tài)類別、醫(yī)療行為的提供者或是接受者、對于醫(yī)療信息的掌握程度、是否為預(yù)定醫(yī)療行為的接受者等信息。此外,由于數(shù)據(jù)通過客戶端封裝,本地也不保存相關(guān)信息,該系統(tǒng)的安全性也相對較高。
電子文件長期保存和利用已成為當(dāng)代數(shù)字檔案館建設(shè)的重要課題。根據(jù)《文獻管理長期保存的電子文檔文件格式》(GB/T 23286.1-2009),“長期”被定義為“足夠長的時間段,信息在該時間段內(nèi)被存儲,期間可能會發(fā)生一系列技術(shù)變遷,包括新的媒體和數(shù)據(jù)格式支持、用戶群體的變更”。不同于傳統(tǒng)檔案,電子文件對軟件和硬件有較強的依賴性,國內(nèi)外均有管理不善導(dǎo)致大量電子檔案記錄無法被讀取的教訓(xùn)。而在技術(shù)改革過程中,產(chǎn)生了各類廣泛分布、異構(gòu)、自治的檢索系統(tǒng)和發(fā)布系統(tǒng)。這些分散的數(shù)據(jù)和分離的系統(tǒng)正面臨著“比特腐化”的威脅。而統(tǒng)一的、支持多種文件類型和增值服務(wù)、覆蓋諸多信息發(fā)布系統(tǒng)的檢索接口是解決技術(shù)退化、讀取依賴的方法之一,統(tǒng)一的入口能強化電子文件資源的利用和控制。
在以上案例中可以看出,現(xiàn)有的互操作協(xié)議及實現(xiàn)方式中并沒有絕對的優(yōu)勢方。為了滿足不同的用戶需求,OAIster資源庫建立了SRU模式的檢索入口;除此之外,通過OAI-PMH所收割的元數(shù)據(jù)也可提供至SRW/U系統(tǒng)作為架構(gòu)的基礎(chǔ),如Andy Powell所描述的JISC信息環(huán)境。而OCLC OAIcat通過對數(shù)據(jù)庫引擎、數(shù)據(jù)存儲格式映射機制進行抽象,可以為任意數(shù)據(jù)庫系統(tǒng)建立OAI元數(shù)據(jù)接口,包括SRW/U。同時Thomas Habing也致力于研究OAI-PMH和Z39.50之間的互操作網(wǎng)關(guān)機制。揚長補短、彼此兼容是現(xiàn)有互操作實現(xiàn)方案的發(fā)展趨勢。根據(jù)電子文件長期保存成熟度模型(Digital Preservation Capability Maturity Model,DPCMM),成熟的長期保存機制也包括了電子文件生命周期管理,上文所論述的互操作協(xié)議目前在統(tǒng)一管理電子文件本體方面能力較弱。此外,深化結(jié)合對特定領(lǐng)域的研究也是互操作協(xié)議的發(fā)展方向,主要體現(xiàn)在元數(shù)據(jù)標(biāo)準(zhǔn)的制定和發(fā)展。元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)實現(xiàn)多層次和多功能的結(jié)合,這樣元數(shù)據(jù)的選擇和組合可以根據(jù)實際的需要細(xì)化到不同的層次,以滿足實際應(yīng)用需求。
*本文系國家社科基金項目“基于互操作協(xié)議的檔案信息資源整合模式研究”(批準(zhǔn)號:11CTQ030)的階段性成果。
[1]What is interoperability for European eGovernment Services[EB/OL].
[2016-06-10]http://ec.europa.eu/idabc/en/document/5313/5883.html.
[2]吳育芳.數(shù)字圖書館互操作協(xié)議比較研究[J].圖書館界,2011(1):38-41.
[3]Mehdi Alipour Hafezi.Interoperability models in digital libraries:an overview[EB/OL].[2016-06-10].http://www.emeraldinsight.com/0264-0473.htm.
[4]OpenArchives Initiative Protocol for Metadata Harvesting[EB/OL].
[2016-06-10]http://www.openarchives.org/pmh/tools/tools.php.
[5]Gateway to Library Catalogs Z39.50.[EB/OL].[2016-06-10].http://www.loc. gov/z3950/.
[6]徐濼燚.互操作協(xié)議在檔案信息資源整合中的應(yīng)用探討[J].檔案與建設(shè),2016(5):32-35.
[7]William Y.Arms Diane Hillmann.A Spectrum of Interoperability The Site for Science Prototype for the NSDL[EB/OL].[2016-06-10].http://www.dlib.org/dlib/january02/arms/01arms.html.
[8]俞力.數(shù)字圖書館互操作策略研究[J].圖書館學(xué)研究,2011(3):41-44.
[9]The OAIster database at a glance[EB/OL].2016[2016-06-10].http://www.oclc. org/oaister/about.en.html
[10]Projects-PERSIVAL[EB/OL].[2016-06-10].http://www.cs.columbia.edu/nlp/ projects.cgi#persival
[11]Rong Shi.LIGHTWEIGHT FEDERATION OF NON-COOPERATINGDIGITAL LIBRARIES[D].Norfolk:Old Dominion University,2004.
[12]周麗霞,朱德紅.數(shù)字檔案館數(shù)字資源長期保存涉及的元數(shù)據(jù)內(nèi)容[J].黑龍江檔案,2013(3):13.
[13]包海峰、陳剛.基于OAI互操作協(xié)議的檔案信息資源整合模式研究[J].檔案與建設(shè),2012(12):13-16.
[14]GB/T 23286.1-2009,文獻管理長期保存的電子文檔文件格式[S].北京:中國標(biāo)準(zhǔn)出版社,2009.
[15]錢毅.數(shù)字檔案文件長久保存策略芻議[J].檔案學(xué)通訊,2007(3):81-85.
[16]包海峰,彭楨,徐濼燚,陳剛.檔案元數(shù)據(jù)標(biāo)準(zhǔn)比較研究[J].檔案與建設(shè),2014(2):19-23.
彭 楨,南京大學(xué)檔案館助理館員,研究方向為數(shù)字化檔案館。
包海峰,南京大學(xué)檔案館副館長,中國檔案學(xué)會自動化委員會委員,研究方向為數(shù)字化檔案館。徐濼燚,南京大學(xué)檔案館助理館員,研究方向為數(shù)字化檔案館。
Comparison of Metadata-sharing and Service-supported Interoperability Protocols
Peng Zhen,Bao Haifeng,Xu Luoyi
(Nanjing University Archives,Nanjing,Jiangsu,210046)
In the process of information technology development,there are all kinds of retrieval and distribution systems which are heterogeneous,autonomous and quite different from each other. The number of users has increased as well as the service required by them which covers a lot of information system only through a unified search interface.In this situation the interoperability protocol came into being.Due to different mechanisms,interoperability protocols can be divided into federal,metadata harvesting and collecting models.This article compare the realization and maintenance expense of all aspects concerned by the three models and give some suggestions on the principle of"moderate expense to derive full function".
Interoperability Protocol;Metadata Standards;Digital Archives;OAIster;The Euro?pean Digital Library;PERSIVAL
G270.7