□胡紹軍 劉 翔
數(shù)字資源長(zhǎng)期保存是對(duì)數(shù)字資源進(jìn)行攝入、保存、管理,在一定條件下提供服務(wù)或轉(zhuǎn)移保存的活動(dòng)[1],近年來(lái),數(shù)據(jù)長(zhǎng)期保存已成為數(shù)字圖書(shū)館研究的一個(gè)重大課題。
2007年10月,參加北京iPRES會(huì)議的代表在本國(guó)或本機(jī)構(gòu)長(zhǎng)期保存的具體實(shí)踐基礎(chǔ)上,提出了在合作的基礎(chǔ)上進(jìn)行長(zhǎng)期保存的規(guī)劃,內(nèi)容主要包括保存網(wǎng)絡(luò)的建立、職責(zé)分配及政策制定等[2]。2008年11月,在北京召開(kāi)的“數(shù)字圖書(shū)館高層論壇”又發(fā)出呼吁:全國(guó)圖書(shū)館和其他文獻(xiàn)資源機(jī)構(gòu),積極參加全國(guó)數(shù)字文獻(xiàn)資源合作長(zhǎng)期保存體系,共建共享、可信賴(lài)管理、可靠服務(wù)、公開(kāi)認(rèn)證,盡快實(shí)現(xiàn)主要數(shù)字文獻(xiàn)資源的長(zhǎng)期保存[3]。
NSTL曾經(jīng)對(duì)中國(guó)采購(gòu)和使用數(shù)字文獻(xiàn)資源較多的圖書(shū)館進(jìn)行了調(diào)查。結(jié)果顯示,我國(guó)圖書(shū)館界在保存模式上更傾向于合作保存,其中,大學(xué)及專(zhuān)業(yè)圖書(shū)館中選擇合作保存模式的機(jī)構(gòu)數(shù)量占多數(shù)[4]。從目前看,國(guó)內(nèi)外圖書(shū)館界對(duì)數(shù)字資源的長(zhǎng)期保存策略更傾向于合作保存模式,其中,美國(guó)斯坦福大學(xué)領(lǐng)導(dǎo)實(shí)施的LOCKSS項(xiàng)目是一個(gè)遵循OAIS規(guī)范的長(zhǎng)期保存系統(tǒng),以低成本、高安全性、分布式存儲(chǔ)、支持協(xié)作保存、服務(wù)穩(wěn)定,及遵循標(biāo)準(zhǔn)化協(xié)議的開(kāi)發(fā)運(yùn)行策略在歐美引起廣泛關(guān)注,中科院也在積極參與這個(gè)項(xiàng)目[5]。LOCKSS與ZADL在架構(gòu)上具有許多相同之處,其合作保存模式對(duì)ZADL開(kāi)展數(shù)字資源合作保存有借鑒意義。
ZADL是在浙江省教育廳領(lǐng)導(dǎo)下,全省高校共同參與的浙江省高校數(shù)字圖書(shū)館建設(shè)項(xiàng)目,總投資1.3億元。ZADL的總體目標(biāo)是要聯(lián)合全省高校圖書(shū)館,以Cernet為依托,以CALIS和CALIS華東南地區(qū)文獻(xiàn)信息中心為后盾,基本建成全省研究級(jí)學(xué)科文獻(xiàn)保障體系的基礎(chǔ)框架,為浙江省高等教育提供可靠的文獻(xiàn)信息保障。其具體目標(biāo)為:建成全省高校共享的國(guó)內(nèi)一流的數(shù)字化文獻(xiàn)信息資源庫(kù);建立覆蓋全省高校的數(shù)字圖書(shū)館服務(wù)體系,包括省級(jí)服務(wù)中心和5個(gè)分中心,向全省高校用戶提供數(shù)字資源服務(wù)。目前,ZADL一期已經(jīng)上線統(tǒng)一身份認(rèn)證、聯(lián)合目錄、統(tǒng)一檢索、文獻(xiàn)傳遞、虛擬參考咨詢、特色數(shù)據(jù)庫(kù)6大應(yīng)用系統(tǒng),初步實(shí)現(xiàn)了全省高校文獻(xiàn)資源的整合與揭示。
在組織架構(gòu)上,ZADL由技術(shù)組、服務(wù)組和資源組協(xié)同工作,保障ZADL日常的正常運(yùn)行,為實(shí)現(xiàn)ZADL的聯(lián)合保存提供了組織保障。
在技術(shù)架構(gòu)上,ZADL由省中心與5個(gè)分中心組成,各分中心通過(guò)與省中心的核心交換機(jī)互聯(lián)構(gòu)成了一個(gè)星型的高速互聯(lián)的網(wǎng)絡(luò),依托這個(gè)高速網(wǎng)絡(luò)和各中心的存儲(chǔ)資源可以構(gòu)成一張基于IP SAN的網(wǎng)絡(luò)存儲(chǔ)架構(gòu),及總?cè)萘拷?00TB的存儲(chǔ)資源,為實(shí)現(xiàn)ZADL的聯(lián)合保存提供了硬件平臺(tái)的支撐。
在合作模式上,ZADL是一個(gè)松散型的高校圖書(shū)館聯(lián)盟組織,這與LOCKSS很相似。目前的LOCKSS已經(jīng)由單個(gè)圖書(shū)館的長(zhǎng)期保存行為擴(kuò)大至圖書(shū)館之間的合作,從本質(zhì)上更傾向于保障圖書(shū)館的利益[6],這與ZADL的建設(shè)目標(biāo)是一致的。
ZADL目前整合的各類(lèi)數(shù)字資源總數(shù)已達(dá)428種,其中大部分資源購(gòu)買(mǎi)的是使用權(quán),通過(guò)授權(quán)遠(yuǎn)程訪問(wèn)獲取資源。對(duì)于浙江省高等教育文獻(xiàn)資源保障體系重點(diǎn)建設(shè)項(xiàng)目,數(shù)字資源的長(zhǎng)期保存與永續(xù)使用是ZADL后續(xù)建設(shè)必須面臨和解決的課題。PREMIS認(rèn)為,數(shù)字保存的目標(biāo)是維持?jǐn)?shù)字資源的長(zhǎng)期可生存能力(要求被保存數(shù)字對(duì)象的比特流完整無(wú)缺并且能夠從它所存儲(chǔ)的載體之上讀?。⒖沙尸F(xiàn)能力(指的是能夠?qū)⒈忍亓鬓D(zhuǎn)變?yōu)橐环N可以被人看,能夠被計(jì)算機(jī)處理的能力)和可理解能力(包括提供足夠的信息使得這些被呈現(xiàn)的內(nèi)容可以被目標(biāo)用戶理解和認(rèn)識(shí))[7]。保證數(shù)字信息的長(zhǎng)期讀取涉及到很多方面,其中,最重要的還是數(shù)字信息保存技術(shù)策略的選擇。如圖1所示,本文將就ZADL合作保存中一些關(guān)鍵技術(shù)進(jìn)行研究和探索。
圖1 ZADL數(shù)字資源合作保存數(shù)據(jù)流圖
元數(shù)據(jù)最基本的用途就是管理數(shù)據(jù),從而實(shí)現(xiàn)查詢、閱讀、交換和共享。數(shù)字保存活動(dòng)中,出現(xiàn)了許多用于支持?jǐn)?shù)字資源長(zhǎng)期保存的元數(shù)據(jù)規(guī)范和框架,這些已有的規(guī)范在世界各地不同行業(yè)領(lǐng)域得到發(fā)展。對(duì)于ZADL這種松散型的數(shù)字圖書(shū)館聯(lián)盟,可以采用基于OAI-PMH的元數(shù)據(jù)收割協(xié)議收割ZADL成員館擁有的所有數(shù)字資源的元數(shù)據(jù)及其他符合要求的有較高學(xué)術(shù)價(jià)值的免費(fèi)數(shù)字資源元數(shù)據(jù),在省中心建立元數(shù)據(jù)倉(cāng)儲(chǔ),存儲(chǔ)、管理和維護(hù)數(shù)字資源元數(shù)據(jù),各中心、成員館作為聯(lián)盟成員都可以像對(duì)單獨(dú)一個(gè)倉(cāng)儲(chǔ)操作一樣檢索和利用這些倉(cāng)儲(chǔ)中的元數(shù)據(jù)。為此,需要解決以下幾個(gè)關(guān)鍵問(wèn)題:
3.1.1 元數(shù)據(jù)互操作
由于不同的領(lǐng)域存在著多種元數(shù)據(jù)格式,當(dāng)用不同元數(shù)據(jù)格式進(jìn)行資源描述、檢索和利用時(shí),就需要解決多種元數(shù)據(jù)格式間的釋讀、轉(zhuǎn)換問(wèn)題,即實(shí)現(xiàn)元數(shù)據(jù)的互操作,達(dá)到不同元數(shù)據(jù)格式間的信息共享、轉(zhuǎn)換、跨系統(tǒng)檢索。ZADL數(shù)字資源體系是由文獻(xiàn)、圖片、視頻、音頻、圖紙等構(gòu)成的主題教學(xué)、科研資源庫(kù),涵蓋了采用不同元數(shù)據(jù)標(biāo)準(zhǔn)的多種類(lèi)型的數(shù)字資源,可以通過(guò)解決資源描述過(guò)程中語(yǔ)義方面的差別,在語(yǔ)義層面上實(shí)現(xiàn)互操作,即采用元數(shù)據(jù)映射實(shí)現(xiàn)元數(shù)據(jù)的互操作。在映射過(guò)程中,被采用的標(biāo)準(zhǔn)格式應(yīng)該在元素組成、元素語(yǔ)義定義和應(yīng)用領(lǐng)域等方面具有普遍適應(yīng)性,本身有較廣泛的應(yīng)用,能被多數(shù)系統(tǒng)識(shí)別。
在OAI-PMH元數(shù)據(jù)采集協(xié)議中,允許不同格式的元數(shù)據(jù)結(jié)構(gòu)并存,但指定以DC作為互操作的元數(shù)據(jù),采用元數(shù)據(jù)映射方法,支持不同元數(shù)據(jù)之間的互操作,此種方式轉(zhuǎn)換脈絡(luò)清晰,便于元數(shù)據(jù)的擴(kuò)展及管理。由于ZADL數(shù)字資源類(lèi)型具有復(fù)雜性和多樣性,參與互操作的元數(shù)據(jù)格式會(huì)很多,映射過(guò)程也會(huì)較為復(fù)雜,因此同樣可以選擇DC作為中介元數(shù)據(jù)轉(zhuǎn)換格式,其他各種格式都向這一中心格式轉(zhuǎn)換,從而實(shí)現(xiàn)以中心元數(shù)據(jù)格式為中介的元數(shù)據(jù)格式轉(zhuǎn)換。
具體方法是:應(yīng)用DC元數(shù)據(jù)集并擴(kuò)展DC元數(shù)據(jù)核心集,建立DC與不同元數(shù)據(jù)資源映射表,由ZADL服務(wù)提供者(省中心和各分中心)選擇性收割數(shù)據(jù)提供者發(fā)布的元數(shù)據(jù),經(jīng)過(guò)整合映射后將不同的數(shù)字資源元數(shù)據(jù)盡可能映射成DC數(shù)據(jù)存放在本地,解決元數(shù)據(jù)的互操作問(wèn)題。并在此基礎(chǔ)上,對(duì)ZADL用戶提供搜索引擎服務(wù),實(shí)現(xiàn)倉(cāng)儲(chǔ)元數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一,和跨系統(tǒng)的廣泛檢索,向用戶提供一個(gè)統(tǒng)一的數(shù)據(jù)檢索界面,確保系統(tǒng)對(duì)用戶的一致性服務(wù)。
3.1.2 元數(shù)據(jù)獲取
(1)自建資源元數(shù)據(jù)收割
對(duì)于ZADL成員館自建的數(shù)字資源,可以通過(guò)OAI-PMH收割元數(shù)據(jù),包括OPAC數(shù)據(jù)庫(kù)、本校學(xué)位論文庫(kù)、學(xué)校文庫(kù)、特色資源數(shù)據(jù)庫(kù)等。由于這些數(shù)字資源由圖書(shū)館自己控制,可以通過(guò)編程的方式為這些數(shù)字資源添加OAI接口,元數(shù)據(jù)倉(cāng)儲(chǔ)通過(guò)此接口定期批量收割元數(shù)據(jù)。ZADL特色資源數(shù)據(jù)庫(kù)目前已經(jīng)實(shí)現(xiàn)了基于OAI-PMH協(xié)議自動(dòng)收割各成員館的元數(shù)據(jù)。
(2)引進(jìn)資源元數(shù)據(jù)獲取
對(duì)于開(kāi)放底層數(shù)據(jù)接口的,比如超星電子圖書(shū)、Apabi電子圖書(shū)、OA資源等,可以參照自建資源元數(shù)據(jù)收割方式獲取元數(shù)據(jù)。
對(duì)于有底層數(shù)據(jù)接口,但不對(duì)外開(kāi)放的,如中國(guó)期刊網(wǎng)、萬(wàn)方數(shù)據(jù)網(wǎng)等,可由ZADL通過(guò)與數(shù)據(jù)商進(jìn)行談判、協(xié)商、適當(dāng)付費(fèi)等靈活方式獲取。
對(duì)于沒(méi)有提供OAI數(shù)據(jù)接口,不能通過(guò)元數(shù)據(jù)收割方式獲取元數(shù)據(jù)的數(shù)字資源,通過(guò)談判協(xié)商等靈活方式讓數(shù)據(jù)商定期或不定期導(dǎo)出元數(shù)據(jù),經(jīng)過(guò)規(guī)范處理后再導(dǎo)入到ZADL元數(shù)據(jù)倉(cāng)儲(chǔ)中。
3.2.1 建立基于SAN的三級(jí)合作存儲(chǔ)體系
如圖2所示,ZADL采用SAN分布式存儲(chǔ)策略,ZADL各中心、成員館之間的關(guān)系類(lèi)似于LOCKSS聯(lián)盟中的各個(gè)Caches,彼此之間互連,呈網(wǎng)狀結(jié)構(gòu)分布。這種結(jié)構(gòu)下,只要建立相應(yīng)的合作機(jī)制,就可以實(shí)現(xiàn)Caches間互相備份支持的目標(biāo),以及相互之間的協(xié)作保存,確保資源完整性和永久保存。
(1)自建資源合作保存:ZADL自建特色庫(kù)及隨書(shū)光盤(pán)資源,由省中心、分中心和成員館聯(lián)合保存。省中心保存全部自建資源,分中心按區(qū)域聯(lián)合保存自建資源,成員館建立高速的Cache,通過(guò)與各分中心同步保存日常本館常用的資源,形成一個(gè)三級(jí)的聯(lián)合保存模式。
(2)引進(jìn)資源合作保存:由省中心——分中心——成員館按責(zé)任分工聯(lián)合保存,互為備份容災(zāi),確保資源的永續(xù)服務(wù)。
圖2 ZADL合作存儲(chǔ)架構(gòu)
省中心——分中心——成員館三級(jí)合作保存模式,有利于ZADL及各分中心資源訪問(wèn)和保存,可以實(shí)現(xiàn)資源的合理布局,避免重復(fù)保存,防止因數(shù)據(jù)損壞造成服務(wù)中斷,以及因信息缺失造成內(nèi)容方面的遺漏。在服務(wù)上,各中心與所服務(wù)高校間的網(wǎng)絡(luò)狀分布,可以避免服務(wù)對(duì)象在地理布局上的“孤島”現(xiàn)象。
3.2.2 優(yōu)化存儲(chǔ)資源,綠化ZADL存儲(chǔ)網(wǎng)絡(luò)
隨著數(shù)據(jù)增長(zhǎng)率的快速上升和持續(xù)的能量匱乏,存儲(chǔ)系統(tǒng)自身的能耗狀況已引起國(guó)際上數(shù)據(jù)中心的廣泛重視,綠色存儲(chǔ)開(kāi)始成為人們關(guān)注的焦點(diǎn)。美國(guó)五角大樓已經(jīng)開(kāi)始使用Data Domain公司的數(shù)據(jù)復(fù)制工具幫助減少了軍方數(shù)據(jù)中心的能量消耗。國(guó)際上也開(kāi)始采用降低能耗的存儲(chǔ)技術(shù),如:對(duì)于離線數(shù)據(jù)和長(zhǎng)期存檔數(shù)據(jù),繼續(xù)使用磁帶庫(kù);采用各種RAID級(jí)別和分層存儲(chǔ),最大程度地利用資源;實(shí)施高效的存儲(chǔ)系統(tǒng)支持整合等等[8]。
ZADL省中心及各分中心現(xiàn)擁有的SAN存儲(chǔ)容量約600TB左右,依托位于省中心的萬(wàn)兆核心交換及存儲(chǔ)虛擬化技術(shù)為ZADL存儲(chǔ)的動(dòng)態(tài)調(diào)用提供了可能,可以實(shí)現(xiàn)存儲(chǔ)資源的共享及最大化資源的利用,但同時(shí)也耗費(fèi)了大量的能源。因此,在存儲(chǔ)冗余性和系統(tǒng)高效性之間,必須找到一個(gè)好的平衡點(diǎn)?;谀壳癦ADL已經(jīng)建成的分布式網(wǎng)絡(luò)架構(gòu),可以通過(guò)構(gòu)建層疊存儲(chǔ)來(lái)綠化ZADL存儲(chǔ)網(wǎng)絡(luò):
(1)對(duì)于時(shí)間敏感性的資源如近年的數(shù)字資源和性能敏感性的資源如元數(shù)據(jù)存儲(chǔ)在ZADL省中心的SAN存儲(chǔ),依托ZADL IP SAN供所有ZADL分中心共享。
(2)對(duì)于訪問(wèn)量較低資源可采用磁帶庫(kù)離線存儲(chǔ)于各分中心;各成員館可采用低成本的SAS存儲(chǔ)構(gòu)建本館的Cache,用于從分中心獲取常訪問(wèn)的資源,提高終端用戶的訪問(wèn)效率。
通過(guò)構(gòu)建資源自動(dòng)調(diào)度系統(tǒng),對(duì)于經(jīng)常訪問(wèn)的離線資源可自動(dòng)調(diào)入分中心的SAN存儲(chǔ)提高訪問(wèn)效率,而分中心SAN存儲(chǔ)網(wǎng)絡(luò)中訪問(wèn)量低的資源則自動(dòng)調(diào)入分中心磁帶庫(kù)離線存儲(chǔ),降低整個(gè)系統(tǒng)的能源消耗,構(gòu)建ZADL綠色存儲(chǔ)網(wǎng)絡(luò)。
由于數(shù)字資源的載體易受到外界環(huán)境條件的影響,因此,必須對(duì)保存的數(shù)字資源進(jìn)行定期檢測(cè),以保證數(shù)據(jù)真實(shí)性和完整性。ZADL可以借鑒LOCKSS模式,通過(guò)P2P對(duì)等式的分布式保存系統(tǒng),采用輪詢和評(píng)價(jià)機(jī)制對(duì)緩存內(nèi)容進(jìn)行輪詢(Pool)和投票(Vote),確保ZADL電子資源數(shù)據(jù)的完整性和安全性[9]。
圖3 數(shù)據(jù)檢測(cè)與恢復(fù)拓?fù)鋱D
如圖3所示,ZADL各個(gè)中心均建設(shè)了基于FC SAN和IP SAN的存儲(chǔ)基礎(chǔ)設(shè)施并通過(guò)教科網(wǎng)實(shí)現(xiàn)了高速互聯(lián),依托這些基礎(chǔ)設(shè)施為探索ZADL的合作保存系統(tǒng)構(gòu)建提供了硬件及網(wǎng)絡(luò)環(huán)境的保障。整個(gè)ZADL體系可以劃分為5個(gè)三角形區(qū)塊,每個(gè)三角形區(qū)塊的分中心依托ZADL的元數(shù)據(jù)倉(cāng)儲(chǔ)來(lái)對(duì)其臨近的分中心進(jìn)行數(shù)字對(duì)象的輪詢。同時(shí),省中心會(huì)對(duì)每個(gè)分中心的數(shù)字對(duì)象進(jìn)行輪詢。考慮到對(duì)于海量的數(shù)字對(duì)象資源進(jìn)行輪詢操作是非常耗費(fèi)網(wǎng)絡(luò)和服務(wù)器資源的作業(yè),為提高輪詢的效率采用統(tǒng)計(jì)學(xué)的T檢驗(yàn)方法來(lái)篩選抽檢數(shù)字對(duì)象。對(duì)于丟失損壞的數(shù)字對(duì)象,立即通過(guò)IP SAN網(wǎng)絡(luò)補(bǔ)充修復(fù),實(shí)現(xiàn)分中心本地資源的動(dòng)態(tài)更新、損壞修復(fù)、丟失補(bǔ)缺等功能,形成ZADL安全穩(wěn)固的數(shù)據(jù)保存系統(tǒng)。
在ZADL組織層面上,各中心組成緊耦合的合作保存體系,模型的5個(gè)三角形區(qū)塊可以相對(duì)獨(dú)立地運(yùn)行;在系統(tǒng)層面上,基于統(tǒng)計(jì)學(xué)抽樣輪詢策略的松耦合架構(gòu)不但保證運(yùn)行效率而且提高了安全性。
在數(shù)字圖書(shū)館數(shù)據(jù)保存策略中,遷移是目前實(shí)際運(yùn)行中使用比較成熟和頻繁的方法。為保證當(dāng)前存儲(chǔ)的數(shù)字信息總能被當(dāng)前系統(tǒng)讀取,采用數(shù)據(jù)“遷移”的方法,持續(xù)地將數(shù)字信息從舊的軟硬件環(huán)境轉(zhuǎn)換到新的計(jì)算機(jī)環(huán)境,是一種隨著技術(shù)變化定期改變信息格式的處理過(guò)程。考慮到ZADL聯(lián)合保存所涉及的資源眾多,遷移工程量較大,同時(shí)遷移過(guò)程中會(huì)出現(xiàn)信息遺漏、失真等問(wèn)題,因此,可依托ZADL元數(shù)據(jù)和對(duì)象數(shù)據(jù)的分布式倉(cāng)儲(chǔ)系統(tǒng),依據(jù)ZADL資源評(píng)估體系和對(duì)ZADL統(tǒng)一檢索系統(tǒng)日志數(shù)據(jù)的分析,對(duì)核心對(duì)象數(shù)據(jù)采用風(fēng)干的方式予以數(shù)據(jù)風(fēng)干,抽取數(shù)據(jù)的文本內(nèi)容予以長(zhǎng)期保存,通過(guò)構(gòu)建專(zhuān)用的基于元數(shù)據(jù)的檢索系統(tǒng)支持在線檢索,格式化成通用文檔格式如PDF格式予以展現(xiàn)。當(dāng)前遵循UOML協(xié)議的文檔均可方便地風(fēng)干,如CAJ、PDG格式等。
ZADL 采 用 SAE(Security Attribute Exchange),即安全屬性交換,也可稱(chēng)為以虛擬聯(lián)合的方式實(shí)現(xiàn)ZADL聯(lián)盟的聯(lián)邦認(rèn)證,其模式為聯(lián)邦認(rèn)證的混合模式。SAE使用以SAML V2為基礎(chǔ)的協(xié)議集,通過(guò)HTTP GET、POST以及redirect的方式在交互方之間傳輸用戶實(shí)體信息。它實(shí)現(xiàn)了一種讓不同域名下應(yīng)用交換認(rèn)證用戶實(shí)體信息的機(jī)制,構(gòu)建了浙江省高校圖書(shū)館間的認(rèn)證機(jī)制。經(jīng)過(guò)認(rèn)證的用戶可以依托基于元數(shù)據(jù)倉(cāng)儲(chǔ)的統(tǒng)一檢索系統(tǒng),通過(guò)安全高效的資源調(diào)度系統(tǒng)獲取所需資源。其中,本分中心的資源本地獲取,其他分中心的資源依托ZADL統(tǒng)一檢索系統(tǒng)及文獻(xiàn)傳遞系統(tǒng)延時(shí)獲取。
在數(shù)字資源長(zhǎng)期保存中,管理是從整體上進(jìn)行宏觀規(guī)劃、組織和控制,是數(shù)字資源長(zhǎng)期保存的基礎(chǔ)與保障。內(nèi)容主要包括:資源選擇、責(zé)任體系及合作機(jī)制、知識(shí)產(chǎn)權(quán)等。
在開(kāi)展數(shù)字資源長(zhǎng)期保存工作前,第一個(gè)需要解決的問(wèn)題就是如何確定保存資源的范圍。事實(shí)上,保存所有數(shù)字資源不僅沒(méi)有必要而且也很難做到,因此如何做到恰當(dāng)?shù)剡x擇合適的資源作為長(zhǎng)期保存的對(duì)象就成為了首要問(wèn)題。高校圖書(shū)館的性質(zhì)與任務(wù)決定了ZADL在數(shù)字資源的長(zhǎng)期保存中,應(yīng)對(duì)需保存資源的范圍進(jìn)行評(píng)估與界定,如對(duì)教學(xué)、科研有特別意義的,容易丟失的、與未來(lái)有關(guān)聯(lián)的、有重要價(jià)值的數(shù)字資源及重要的科學(xué)數(shù)據(jù),特別是“原始數(shù)據(jù)”等相關(guān)元素[10]。其次,是要建立一套評(píng)價(jià)數(shù)字資源館藏級(jí)別的模式,將數(shù)字資源分成不同的保存等級(jí),等級(jí)的不同決定了資源的存儲(chǔ)介質(zhì)和應(yīng)履行的存儲(chǔ)職責(zé)的不同。如:國(guó)家圖書(shū)館就建立了長(zhǎng)期保存、不定期保存、臨時(shí)保存三級(jí)保存制度,規(guī)定了相應(yīng)的存儲(chǔ)介質(zhì)、存儲(chǔ)職責(zé)[11]。
目前,ZADL各中心都具備了適合長(zhǎng)期保存的軟硬件環(huán)境和存檔條件,都有條件成為承擔(dān)保存任務(wù)的責(zé)任體,各自應(yīng)當(dāng)具備什么權(quán)限就成為考慮的核心和關(guān)鍵問(wèn)題,其相互之間如何進(jìn)行保存資源種類(lèi)的分配,會(huì)對(duì)整個(gè)網(wǎng)絡(luò)的有效運(yùn)行產(chǎn)生重要影響。因此,要建立彼此間的責(zé)任體系,形成長(zhǎng)期保存資源和責(zé)任體之間的組合,明確各責(zé)任體之間的義務(wù)、責(zé)任與利益關(guān)系,形成相應(yīng)的合作與責(zé)任分擔(dān)機(jī)制等,作為開(kāi)展合作保存的組織保障。
數(shù)字時(shí)代,出版商實(shí)行的是授權(quán)制度,也就是說(shuō)目前圖書(shū)館采購(gòu)的很多外購(gòu)資源庫(kù)均未獲得資源的所有權(quán),而只是以獲取“使用權(quán)”的方式購(gòu)買(mǎi)和利用數(shù)字資源。因此,如果未獲得版權(quán)所有者的許可,也沒(méi)有法律“合理使用”、“法定許可”等條款的支持,數(shù)字資源長(zhǎng)期保存工作就很容易觸犯知識(shí)產(chǎn)權(quán)法。為此,國(guó)外一些成熟的做法可以為ZADL所借鑒。
一是借鑒LOCKSS的許可證管理模式,通過(guò)ZADL與數(shù)字資源出版商進(jìn)行談判與協(xié)商,由聯(lián)盟向出版商獲取建立數(shù)字館藏的法律授權(quán)(許可權(quán)),以對(duì)遠(yuǎn)程訪問(wèn)資源進(jìn)行收集、保存,并允許成員對(duì)所有ZADL館藏資源進(jìn)行訪問(wèn),明確資源合理使用范圍與法律責(zé)任,規(guī)避長(zhǎng)期保存與使用上的知識(shí)產(chǎn)權(quán)問(wèn)題。許可權(quán)一般包括[12]:收集和保護(hù)當(dāng)前獲得的資料,可以使用這些與最初的許可證條款一致的資料等;允許通過(guò)ZADL獲得授權(quán)的出版商表單搜索在線電子資源,越權(quán)采集將被拒絕。
其次,ZADL可以聯(lián)盟的形式與出版商協(xié)商,在集團(tuán)購(gòu)買(mǎi)談判中增加“永久保存”協(xié)議條款,獲得對(duì)物理媒介的許可,以長(zhǎng)期保存這些數(shù)字資源。目前,英國(guó)教育信息系統(tǒng)聯(lián)合委員會(huì)JISC已經(jīng)制訂了數(shù)字資源采購(gòu)協(xié)議模型,其中就包括長(zhǎng)期保存條款;荷蘭國(guó)家圖書(shū)館已經(jīng)與ELSEVIER、KLUWER、BIOMED等出版商簽訂了長(zhǎng)期保存條約;NSTL也專(zhuān)門(mén)對(duì)資源采購(gòu)中的“數(shù)字資源長(zhǎng)期保存要求”做出規(guī)定[13]。
目前,歐美等國(guó)都在建立適應(yīng)本國(guó)的數(shù)字資源長(zhǎng)期保存政策來(lái)確保數(shù)字資源長(zhǎng)期保存的順利開(kāi)展,高校聯(lián)盟的合作保存也有了比較成功的案例,如英國(guó)的CEDARS、美國(guó)的LOCKSS項(xiàng)目等。我國(guó)高校數(shù)字圖書(shū)館聯(lián)盟的建設(shè)已經(jīng)取得了一定的成績(jī),但聯(lián)盟的合作保存研究和實(shí)踐目前還很少。ZADL二期建設(shè)如能在這方面做些成績(jī),對(duì)我國(guó)高校文獻(xiàn)資源保障體系的可持續(xù)發(fā)展和資源的可持續(xù)利用將是一件有意義的工作。
1 張曉林等.?dāng)?shù)字文獻(xiàn)資源長(zhǎng)期保存協(xié)議框架.現(xiàn)代圖書(shū)情報(bào)技術(shù),2008(11):1-6
2 吳振新等.?dāng)?shù)字資源長(zhǎng)期保存:當(dāng)前進(jìn)展和最佳實(shí)踐——2007年數(shù)字資源長(zhǎng)期保存國(guó)際會(huì)議(iPRES2007)綜述.現(xiàn)代圖書(shū)情報(bào)技術(shù),2007(11):1-5
3 全國(guó)圖書(shū)館界呼吁建設(shè)國(guó)家數(shù)字文獻(xiàn)資源長(zhǎng)期保存服務(wù)體系.現(xiàn)代圖書(shū)情報(bào)技術(shù),2008(11):71
4 張玫等.中國(guó)圖書(shū)館數(shù)字文獻(xiàn)資源長(zhǎng)期保存現(xiàn)狀調(diào)查.圖書(shū)情報(bào)知識(shí),2009(3):49
5 吳曉駿,黃玨.LOCKSS與電子期刊長(zhǎng)期保存應(yīng)用研究.情報(bào)資料工作,2007(5):45
6 張艷敏,馬秀峰.中外數(shù)字資源長(zhǎng)期保存策略比較研究.圖書(shū)館學(xué)研究,2009(6):29
7 張智雄.如何長(zhǎng)期保存數(shù)字資源.[2011-10-25].http://www.edu.cn/bf_6472/20080910/t20080910_324287.shtml,2008(5):99
8 Rich Castagna.綠色存儲(chǔ)專(zhuān)刊.[2011-10-25].http://www.searchstorage.com.cn
9 How it works.[2011-08-25].http://www.lockss.org/lockss/How-It-Works# Collecting
10 數(shù)字資源長(zhǎng)期保存的關(guān)鍵問(wèn)題探討.[2011-10-25].http://www.syue.com/Paper/Culture/Study/261975.html
11 邢軍.國(guó)家圖書(shū)館數(shù)字資源長(zhǎng)期保存現(xiàn)狀與研究.[2011-10-25].http://blog.sina.com.cn/s/blog_599ea7890102dr65.html
12 Lockss:For-Librarians.[2011-08-25].http://www.lockss.org/lockss/For-Librarians# Obtaining.2FConfirming-Publisher-Permissions-2
13 宛玲等.?dāng)?shù)字資源長(zhǎng)期戰(zhàn)略保存的管理與技術(shù)策略.現(xiàn)代圖書(shū)情報(bào)技術(shù),2005(1):58