[摘要]本文首先闡述了數(shù)字資源長(zhǎng)期協(xié)同保存的含義、意義,介紹了國(guó)外數(shù)字資源長(zhǎng)期協(xié)同保存現(xiàn)狀,并提出構(gòu)建基于LOCKSS的數(shù)字資源長(zhǎng)期協(xié)同保存網(wǎng)絡(luò)。
[關(guān)鍵詞]數(shù)字資源;長(zhǎng)期保存;信息保存;協(xié)同;保存網(wǎng)絡(luò)
[中圖分類號(hào)]G250.7[文獻(xiàn)標(biāo)識(shí)碼] A
引言
目前網(wǎng)絡(luò)環(huán)境下,海量的數(shù)字資源面臨著長(zhǎng)期保存的危機(jī)問題,每時(shí)每該都會(huì)有大量數(shù)字資源失去價(jià)值甚至消失,大部分?jǐn)?shù)字資源分布于不同的網(wǎng)絡(luò)、地域,如果要把資源的價(jià)值發(fā)揮出來,就需要不同機(jī)構(gòu)長(zhǎng)期協(xié)同保存,從數(shù)字資源長(zhǎng)期協(xié)同保存及可持續(xù)性信息服務(wù)能力角度,數(shù)字資源保存是提供信息服務(wù)的前提與基礎(chǔ)。
1數(shù)字資源長(zhǎng)期協(xié)同保存
1.1數(shù)字資源保存
數(shù)字資源就是數(shù)字化信息資源,是經(jīng)過數(shù)字技術(shù)處理,通過網(wǎng)絡(luò)以數(shù)字形式發(fā)布、存取、利用的信息資源總和。數(shù)字資源具有分布離散性、復(fù)合性、動(dòng)態(tài)開放性、交互性、關(guān)聯(lián)性、嵌套性、集合性、可重組性、軟硬件強(qiáng)依賴性等復(fù)雜性特征[1]。目前,數(shù)字資源已經(jīng)成為國(guó)家的重要戰(zhàn)略資源或數(shù)字資本[2]。隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、電子商務(wù)、電子政務(wù)、學(xué)術(shù)科研、數(shù)字出版等電子化事務(wù)活動(dòng)的普及和發(fā)展,數(shù)字資源數(shù)量急劇增長(zhǎng),越來越多的有價(jià)值的信息內(nèi)容只能以數(shù)字形式來管理、保存、利用,數(shù)字資源每年還以50%-100%的速度增長(zhǎng),而且整序數(shù)字信息的異構(gòu)資源系統(tǒng)數(shù)量也急劇增加,數(shù)字資源局部有序化但整體呈無序化的狀況日趨嚴(yán)重,使用戶對(duì)其存取、管理和服務(wù)的質(zhì)量要求與日俱增,如何優(yōu)化數(shù)字資源利用環(huán)境,如何組織、有效獲取和長(zhǎng)期保存信息成為人們關(guān)注的重點(diǎn)。數(shù)字資源保存指的是長(zhǎng)期的存儲(chǔ)、保存和存取、訪問數(shù)字資源。維基百科全書Wiki有關(guān)數(shù)字資源保存定義指的是在一定時(shí)間內(nèi)管理數(shù)字信息,是一系列的過程和活動(dòng),保障所有類型文件、科學(xué)和文化遺產(chǎn)能夠以數(shù)字化的格式提供訪問、利用[3]。數(shù)字資源長(zhǎng)期協(xié)同保存就是對(duì)組織機(jī)構(gòu)擁有的數(shù)字資源進(jìn)行長(zhǎng)期協(xié)同存儲(chǔ)的相關(guān)活動(dòng)。數(shù)字資源協(xié)同保存是一項(xiàng)涉及多個(gè)主體機(jī)構(gòu)對(duì)數(shù)字資源的長(zhǎng)期保存及管理活動(dòng),通過長(zhǎng)期協(xié)同保存,能夠確保數(shù)字資源未來的可讀性、可用性、可理解性、完整性和真實(shí)性,并能夠?yàn)楣娞峁┬畔⒎?wù)。
1.2國(guó)外研究現(xiàn)狀
從20世紀(jì)90年代中期開始,國(guó)外圍繞數(shù)字資源長(zhǎng)期保存研究已經(jīng)從數(shù)字資源保存價(jià)值、意義、保存流程規(guī)范、保存過程涉及的多方權(quán)益以及合作與共享等較為宏觀層面的研究向數(shù)字資源保存對(duì)象、保存專門技術(shù)、保存方法評(píng)估、保存成本核算等較為微觀的角度演化[4]。在數(shù)字資源協(xié)同保存技術(shù)方面,大多依據(jù)OAIS(Open Archival Information System)參考模型,開發(fā)一些數(shù)字保存軟件與工具,比如DSpace、Fedora、Green-stone等,都結(jié)合自身的保存需要與保存對(duì)象的特點(diǎn),為各個(gè)數(shù)字資源保存機(jī)構(gòu)開展數(shù)字資源長(zhǎng)期協(xié)同保存提供了充足的技術(shù)支持;美國(guó)國(guó)家數(shù)字信息基礎(chǔ)設(shè)施和保存計(jì)劃(NDIPP計(jì)劃)于2000年實(shí)施;美國(guó)eScholarship數(shù)字資源庫(kù)自從2002年4月已經(jīng)在加州大學(xué)圖書館啟動(dòng);2002年11月發(fā)布麻省理工學(xué)院的數(shù)字資源庫(kù)DSpace;隨后俄亥俄州立大學(xué)、加州理工學(xué)院、佛羅里達(dá)州立大學(xué)、加利福尼亞大學(xué)等都開展數(shù)字資源長(zhǎng)期協(xié)同保存實(shí)踐活動(dòng);其他國(guó)家如英國(guó)、德國(guó)、荷蘭、加拿大等也實(shí)施數(shù)字資源長(zhǎng)期協(xié)同保存項(xiàng)目。如數(shù)字信息保存聯(lián)合會(huì)(DPC)、PADI(Preserving Access to Digital Information)等。
對(duì)于數(shù)字資源長(zhǎng)期協(xié)同保存中的合作策略等方面,LizBishoff提出數(shù)字遺產(chǎn)的協(xié)同保存目前只是起步階段,面臨著信息保存技術(shù)、經(jīng)費(fèi)、保存及管理策略等方面的制約因素,通過數(shù)字資源協(xié)同保存,能夠減少數(shù)字交換中間出現(xiàn)的諸多問題[5]。在數(shù)字資源長(zhǎng)期協(xié)同保存及可持續(xù)性研究方面,Lavoie(2003)最早研究數(shù)字資源長(zhǎng)期協(xié)同保存可持續(xù)性問題。Bradley(2005)指出數(shù)字資源長(zhǎng)期協(xié)同保存可持續(xù)性的最大威脅來自長(zhǎng)期保存經(jīng)費(fèi)欠保障。Hunter(2006)認(rèn)為數(shù)字資源的保存價(jià)值是影響保存投資的關(guān)鍵因素。JISC(2007)的espida項(xiàng)目使用平衡計(jì)分卡方法評(píng)估數(shù)字資源的保存價(jià)值。美國(guó)BRTF課題組(2008,2010)發(fā)布了兩個(gè)研究報(bào)告,探討數(shù)字資源長(zhǎng)期協(xié)同保存可持續(xù)性經(jīng)濟(jì)風(fēng)險(xiǎn),提出實(shí)現(xiàn)數(shù)字長(zhǎng)期保存經(jīng)濟(jì)可持續(xù)性的一般原則。
2數(shù)字資源長(zhǎng)期協(xié)同保存的意義
在社會(huì)信息化長(zhǎng)期建設(shè)過程中,必定會(huì)形成大量的數(shù)字信息資源,要構(gòu)建數(shù)字資源長(zhǎng)期協(xié)同保存網(wǎng)絡(luò),并實(shí)施長(zhǎng)期數(shù)字保存戰(zhàn)略,協(xié)同保存網(wǎng)絡(luò)是一個(gè)虛擬化的系統(tǒng)平臺(tái),整合了異地分布的多個(gè)機(jī)構(gòu)或長(zhǎng)期保存系統(tǒng),為用戶提供協(xié)同工作與信息共享的環(huán)境,能夠協(xié)調(diào)與整合數(shù)字資源,實(shí)現(xiàn)保存職責(zé)與成本的分散,更好地完成數(shù)字資源長(zhǎng)期保存的目標(biāo)。但是在其長(zhǎng)期保存過程中面臨著諸多問題亟待解決,如何以最優(yōu)成本、最佳效益進(jìn)行保存?如何保持其特色及進(jìn)一步的開發(fā)利用?特別是如何提供有特色的信息服務(wù)?因此,從數(shù)字信息資源開發(fā)利用的角度來探討數(shù)字資源長(zhǎng)期協(xié)同保存,具有一定的理論及實(shí)際應(yīng)用價(jià)值。
2.1有利于豐富數(shù)字資源保存與開發(fā)利用的理論。增強(qiáng)數(shù)字資源長(zhǎng)期保存實(shí)踐,從多個(gè)角度對(duì)數(shù)字資源協(xié)同保存進(jìn)行研究,有助于社會(huì)信息化建設(shè)健康運(yùn)營(yíng),可以提高數(shù)字資源長(zhǎng)期保存的經(jīng)濟(jì)效益和社會(huì)效益。
2.2有利于推動(dòng)社會(huì)信息化的進(jìn)程。通過數(shù)字資源建設(shè),形成有特色的數(shù)字資源協(xié)同保存模式,進(jìn)而對(duì)整個(gè)社會(huì)信息化建設(shè)進(jìn)程產(chǎn)生有利影響。
2.3有利于提高數(shù)字資源保存項(xiàng)目投資決策的科學(xué)性。數(shù)字資源保存項(xiàng)目需要投資,由于不確定因素存在多重風(fēng)險(xiǎn),通過數(shù)字資源協(xié)同保存機(jī)制,為投資決策提供參考,降低或規(guī)避投資風(fēng)險(xiǎn)。也有助于從長(zhǎng)期保存協(xié)作網(wǎng)絡(luò)整體上進(jìn)行協(xié)調(diào)和組織,形成數(shù)字資源長(zhǎng)期保存布局的合理性。
2.4有利于數(shù)字資源的共享水平。通過嘗試開展現(xiàn)實(shí)數(shù)字資源協(xié)同保存管理,可以推動(dòng)不同地域、文化、主題的數(shù)字資源保存項(xiàng)目經(jīng)驗(yàn)交流,共享長(zhǎng)期保存經(jīng)費(fèi)、人才等資源,使數(shù)字資源長(zhǎng)期協(xié)同保存的受益面最大化。
3建立數(shù)字資源長(zhǎng)期協(xié)同保存網(wǎng)絡(luò)
我國(guó)數(shù)字資源長(zhǎng)期協(xié)同保存還處于初步發(fā)展階段,在組織機(jī)構(gòu)管理方面,可以借鑒CALIS文獻(xiàn)共建共享的組織模式,以國(guó)家圖書館、國(guó)家博物館、中央檔案館為全國(guó)數(shù)字資源保存中心,以各地區(qū)高校圖書館、省圖書館作為地方數(shù)字資源協(xié)作保存的管理中心,具體由全國(guó)數(shù)字資源長(zhǎng)期協(xié)同保存管理委員會(huì)統(tǒng)一管理。此外,在數(shù)字資源長(zhǎng)期協(xié)同保存管理委員會(huì)內(nèi)部設(shè)置一個(gè)學(xué)術(shù)指導(dǎo)委員會(huì)和技術(shù)顧問委員會(huì)來組織協(xié)調(diào)工作。數(shù)字資源協(xié)同保存中心分為兩個(gè)級(jí)別:一個(gè)是國(guó)家級(jí)協(xié)同保存中心,一個(gè)是地區(qū)協(xié)同保存中心。我國(guó)數(shù)字資源長(zhǎng)期協(xié)作保存的經(jīng)費(fèi)來源主要由國(guó)家財(cái)政部撥款,管理委員會(huì)還會(huì)應(yīng)積極的爭(zhēng)取社會(huì)其他組織或機(jī)構(gòu)的資金資助,可以合理引進(jìn)風(fēng)險(xiǎn)投資基金,保證數(shù)字資源長(zhǎng)期協(xié)同保存的經(jīng)濟(jì)基礎(chǔ)。
在保存技術(shù)方面,應(yīng)構(gòu)建基于LOCKSS的協(xié)同保存網(wǎng)絡(luò),LOCKSS系統(tǒng)是一個(gè)基于Java技術(shù)的開放性源碼的分布式系統(tǒng),LOCKSS項(xiàng)目為資源生產(chǎn)機(jī)構(gòu)、出版機(jī)構(gòu)、保存機(jī)構(gòu)、發(fā)行機(jī)構(gòu)、圖書館之間長(zhǎng)期數(shù)字資源保存項(xiàng)目提供了良好的協(xié)作平臺(tái),目前已經(jīng)成為國(guó)際上比較成熟的應(yīng)用方案之一,世界上已經(jīng)有80多個(gè)圖書館機(jī)構(gòu)、50多家出版社加入了LOCKSS項(xiàng)目[6]。LOCKSS具有經(jīng)濟(jì)成本低廉、分布式保存、安全性高、支持標(biāo)準(zhǔn)化協(xié)議、資源及技術(shù)共享等優(yōu)勢(shì),LOCKSS提出了從數(shù)字資源生產(chǎn)、采集、整理、出版、發(fā)布到永久性保存與利用等一整套解決方案。
在數(shù)據(jù)采集工作環(huán)節(jié),LOCKSS通過類似于搜索引擎的網(wǎng)絡(luò)爬蟲程序代碼,按照一定的合法授權(quán),從出版商網(wǎng)站采集數(shù)字資源相關(guān)內(nèi)容;在數(shù)據(jù)保存工作環(huán)節(jié),各成員機(jī)構(gòu)通過網(wǎng)絡(luò)把各自采集、生產(chǎn)的數(shù)字資源存儲(chǔ)到本地服務(wù)器中,并進(jìn)行數(shù)據(jù)管理,各個(gè)服務(wù)器協(xié)同保同,可以通過Peer-to-Peer的輪詢和評(píng)價(jià)機(jī)制對(duì)數(shù)字資源內(nèi)容進(jìn)行輪詢和投票,檢測(cè)數(shù)字資源內(nèi)容的完整性、真實(shí)性與安全性,一旦發(fā)現(xiàn)問題,則通過其他LOCKSS系統(tǒng)修改數(shù)字資源內(nèi)容,并進(jìn)行相應(yīng)的記錄;在數(shù)據(jù)訪問與利用工作環(huán)節(jié),LOCKSS采取點(diǎn)到點(diǎn)的通信方式,如果被請(qǐng)求的數(shù)字對(duì)象不在本地服務(wù)器中,則把信息請(qǐng)求通過網(wǎng)絡(luò)轉(zhuǎn)達(dá)給其他合作機(jī)構(gòu),如果有合作機(jī)構(gòu)可以提供數(shù)字資源,將會(huì)通過協(xié)調(diào)機(jī)制將數(shù)字資源最終返回檢索結(jié)果給用戶;針對(duì)數(shù)字資源存儲(chǔ)管理環(huán)節(jié),通過協(xié)調(diào)管理機(jī)制,能夠?qū)τ脩?、資源進(jìn)行動(dòng)態(tài)管理,可以對(duì)數(shù)字資源狀態(tài)進(jìn)行跟蹤、監(jiān)控,有效地控制對(duì)保存數(shù)字的資源得以有效的利用。
構(gòu)建基于LOCKSS的數(shù)字資源協(xié)同作保存網(wǎng)絡(luò),成員機(jī)構(gòu)首先選擇和建立目標(biāo)數(shù)字資源,獲取生產(chǎn)商、出版商、管理委員會(huì)的授權(quán)許可,可以開發(fā)針對(duì)成員機(jī)構(gòu)用戶的LOCKSS插件,在硬件、軟件及網(wǎng)絡(luò)基礎(chǔ)設(shè)施方面,能夠提供滿足要求的計(jì)算機(jī)及網(wǎng)絡(luò)設(shè)備,完成簡(jiǎn)易的安裝與配置,無需中心級(jí)管理和協(xié)調(diào),就可以構(gòu)建一個(gè)LOCKSS數(shù)字資源長(zhǎng)期協(xié)同保存網(wǎng)絡(luò)。
4結(jié)束語
數(shù)字資源長(zhǎng)期協(xié)同保存是目前網(wǎng)絡(luò)環(huán)境下的必然趨勢(shì),降低了數(shù)字保存經(jīng)濟(jì)成本,提高了資源共建共享的水平,加快了社會(huì)信息化建設(shè)進(jìn)程。但是在數(shù)字資源長(zhǎng)期協(xié)同保存過程中,由于不同保存機(jī)構(gòu)對(duì)信息需求、信息價(jià)值理解以及信息保存及服務(wù)方式都存在著區(qū)別,其數(shù)字資源保存行為、保存模式、保存政策、管理策略、協(xié)作保存的可持續(xù)發(fā)展等問題,都需要進(jìn)一步地探討。
參考文獻(xiàn)
[1]黃雛莉.敖字資源長(zhǎng)期保存策略研究[J].圖書館學(xué)刊,2009,(7):68-70.
[2]李偉超.數(shù)字保存系統(tǒng)質(zhì)量保證體系研究[D].南京:南京大學(xué),2010,(6).
[3]數(shù)字資源保存.[EB/OL][2013-03-16]. http://en.wikipedia.org/wiki/Main_Page.
[4]閻軍,國(guó)彬.2007年國(guó)外數(shù)字資源長(zhǎng)期保存研究述評(píng)[J].圖書館建設(shè),2008,173(11):102-105.
[5]Bishoff.DigtitalpreservationAssessent: Readying Cultural Heritage Institutiongs for Digital Preservation[OL].http://www. ils.unc.edu/digccurr2007/papers/bishoff_paper_8-3.pdf.
[6]吳振新,等.LOCKSS數(shù)字資源長(zhǎng)期保存策略[J].現(xiàn)代圖書情報(bào)技術(shù),2006,(2): 35-39.
作者簡(jiǎn)介:李偉超(1976-),男,博士,副教授,研究方向:數(shù)字信息資源管理。