董一鳳
(哈爾濱體育學院圖書館 黑龍江 哈爾濱 150008)
數(shù)字資源長期保存的目的就是確保數(shù)字比特流能長期得到運行與其內容得到長久獲取的信息管理活動,早在20世紀90年代一些發(fā)達國家就著手研究數(shù)字資源存取保護問題。例如,北歐五國包括(瑞士、挪威、丹麥、芬蘭和冰島)在1991年就頒布國家檔案館了《電子文件的存取與保護》;在這之后其他歐洲各國相繼成立了由大學、圖書館、檔案館及出版界的著名學者、專家組成的保護與存取歐洲委員會,英文簡稱為ECPA;1993年12月澳大利亞也成立了澳大利亞數(shù)字信息調研組,簡稱為TF2001PADI;美國于1994年12月成立了保護與存取委員會,他們對數(shù)字信息的長期保存問題進行了調研并且對其保護措施提出了建設性意見,并制定了數(shù)字信息的管理指南和規(guī)范及數(shù)字信息的長期存取與保護等。
在數(shù)字資源管理與保護方面也取得了長足的進展。以美國為例,美國斯坦福大學的LOCKSS項目意為通過建立各個副本保證數(shù)據(jù)的安全,即通過建立出版商與圖書館之間的協(xié)作關系,允許圖書館在本地收藏、管理電子期刊,并提供用戶服務的信息系統(tǒng)[2]。美國國家航空局和宇航局的空間數(shù)據(jù)系統(tǒng)咨詢委員會所推出的關于數(shù)字信息長期保存和利用的基本框架體系——開放檔案信息系統(tǒng)參照模型簡稱OAIS,目前,該機構的數(shù)字信息長期保存體系已成為國際標準,為其他國家所公認。
可見,國外發(fā)達國家的數(shù)字資源無論在資源整合與保存,還是在合作上都取得了積極的進展。歸納起來主要體現(xiàn)在:
第一,政府的高度重視,并制定數(shù)字資源長期保存的標準規(guī)范,以此建立不同層次的合作機制與制定合理的保護策略。在信息化社會越發(fā)普及的當今,無論從政府組織,還是跨國集團或高校圖書館與出版機構都成為數(shù)字保存運作的主要實施者。
第二,政府在數(shù)字信息長久保存上,實現(xiàn)永久性的電子文件檔案館,通過網(wǎng)絡合作實現(xiàn)數(shù)據(jù)與信息的共享與利用,實現(xiàn)資源的動態(tài)更新、損壞修復、丟失補遺等功能,從而確保了數(shù)字資源的完整性。
第三,建立出版商與圖書館、圖書館與圖書館之間的協(xié)作平臺,提出了從電子資源出版、發(fā)布到永久性保存與利用等一整套解決方案,例如,美國最新報告表明,每年世界上生產的信息量在千兆兆位以上,即世界上每人平均大約250MB,這些巨量的信息中有90%以上是數(shù)字資源,[3]這些數(shù)字信息的長期保存需要一整套完善措施的支持。
以上不難看出,發(fā)達國家政府適應信息化社會的發(fā)展要求,越來越對數(shù)字資源的長期保存、利用更加重視。
目前,在對數(shù)字資源長期保存上還沒有一個公認的模式,但有幾種具有代表性的研究模式主要體現(xiàn)在:
第一,(英文簡稱為OAIS模型)這一觀點認為,數(shù)字保存系統(tǒng)的目標是要確保被保存的信息對于目標團體而言是獨立可理解的,也就是說,在沒有專家的幫助下,目標團體仍能夠獨立地理解被保存的信息,為了達到這一要求,在保存過程中,既要保存存檔對象,也要保存針對對象的描述和說明信息[4]。
第二,還有(簡稱PREMIS)該模式認為,數(shù)字保存的目標是維持數(shù)字資源的長期可生存能力,也就是要求被保存的數(shù)字對象的比特流完整無缺,并且能夠從它所存儲的載體上讀出。數(shù)字保存目標要求數(shù)字資源的可呈現(xiàn)能力,也就是能夠將比特流轉變?yōu)橐环N可以被人看被計算機處理的能力。
第三種模式(英文簡稱Priscilla Caplan),這一研究認為,從下到上,從低到高的要求數(shù)字信息保存的目標分別為:可獲得性,即選擇獲得技術;可識別性,即描述;可理解性,即文檔記錄;完整性,即安全存儲;持久生存能力,即媒體管理;可呈現(xiàn)能力,即格式技術策略;被保存對象的真實性,即真實還原技術[4]。
雖然發(fā)達國家在數(shù)字資源長期保存技術開發(fā)方面取得較大的成績,但還存在較突出的問題,有學者研究認為,目前尚未有國家建立統(tǒng)一的國家體系進行數(shù)字資源的典藏與保存,對數(shù)字資源及非印本資源的呈繳也缺乏相應政策和法律支持,這些為數(shù)字資源長期保存造成不利影響[6]。在2008年數(shù)字資源長期保存國際會議(Ipres2008)參加會議的專家一致認為,技術不是數(shù)字保存的關鍵問題,而政策、法律、跨界合作等的不足才是制約數(shù)字保存的瓶頸??梢姡瑥募夹g上升到法律、法規(guī)是確保數(shù)字資源長期保存、利用的新課題,有待于進行探討。
我國的數(shù)字資源長期保存與歐洲國家相比,無論是系統(tǒng)目標確定,還是具體技術環(huán)節(jié)或細節(jié)等方面仍然存在這一定的差距,但也取得了一些成果,例如,我國目前主要的軟件開發(fā)系統(tǒng)有:中國科學院國家科學圖書館的NSTLH NSL聯(lián)合資助的對電子出版物構建長期保存系統(tǒng);國家圖書館“網(wǎng)絡信息資源保存試驗項目”簡稱WICP,目前建立有2110中報紙、1800個報紙網(wǎng)站以及80個網(wǎng)站的PDF文件的數(shù)據(jù)庫;中國Web信息博物館,目前已經(jīng)有30億以中文為主的網(wǎng)頁,并已月均45000完網(wǎng)頁的速度在增長。此外,還有清華大學圖書館開發(fā)出來的元數(shù)據(jù)框架、標引機制和元數(shù)據(jù)編碼的系統(tǒng)軟件等。
與國外數(shù)字資源長期保存相比,還存在一些問題與不足,主要體現(xiàn)在以下幾個方面。有學者研究認為,數(shù)字資源長期保存所涉及經(jīng)濟投入,例如巨大投資、可持續(xù)投資以及投資額不明確;知識產權問題,例如永久使用權、保存權與國家尚未制定責任體系的相應政策與有關技術開發(fā)中的選擇什么技術策略與方法[7]。
由于互聯(lián)網(wǎng)的普及,網(wǎng)絡數(shù)字資源越來越豐富,人們也更注重從網(wǎng)上獲取數(shù)字資源,但怎樣收集與保存也成為突出的問題。有學者指出,我國互聯(lián)網(wǎng)信息采集系統(tǒng)采集信息的準確性和效率較低,對動態(tài)網(wǎng)頁和數(shù)據(jù)庫中的深層網(wǎng)頁采集質量不高[8]。
我國還缺乏合作性質的保存網(wǎng)絡組織機構,雖然有學者在研究協(xié)作保存網(wǎng)絡的數(shù)字資源問題,但仍然體現(xiàn)出不同程度的分散性,不僅不利于數(shù)字資源的整合,還會導致重要資源內容遺漏、利用率低下以及人力物力等浪費現(xiàn)象。
數(shù)字資源長期保存的主體,政府部門、數(shù)字信息創(chuàng)造者、出版商、數(shù)字信息保存機構、軟硬件的開發(fā)者與非營利組織在軟件開發(fā)的責任、作用與表現(xiàn),從相關的研究中,雖有學者對之在模式上進行探討[9],但在法律、政策上還缺乏必要的保障與對相應責任的追究等。
還有學者以數(shù)字圖書館信息資源保存為依托,提出對信息進行必要的壓縮、鑒定與選擇、選擇適當?shù)膬Υ婷襟w以及采用新技術(仿真、更新與遷移)[10]。
標準是數(shù)字資源長期保存建設過程中不可忽視的重要問題之一,是保證數(shù)字資源長期保存各環(huán)節(jié)互相操作的基礎,貫穿于數(shù)字資源生命周期的全過程[11]。標準也是緩解技術更新與數(shù)字信息讀出矛盾的一劑良方。
我國目前這項技術還處在實驗階段,還沒有形成被廣泛認可的統(tǒng)一標準。有學者研究認為,管理是國家從整體上對數(shù)字資源的長期保存進行宏觀規(guī)劃、組織和控制,是數(shù)字資源長期保存的基礎與保障。它的內容有:保存政策、責任體系及合作機制、知識產權等。保存政策是有效實施數(shù)字資源長期保存的管理上的保證,涉及技術、組織、法律及權益等管理,包括確定長期保存目標,完善管理機構,制定長期保存的規(guī)范流程,明確有關人員或組織職責,確定技術標準和最佳實踐,制定長期保存的延續(xù)性計劃,建立對實施效果的評價機制,完善保存政策的反饋系統(tǒng)等[12]。
(1)由政府牽頭,加大對我國數(shù)字資源的調查、歸類與整合,并依托網(wǎng)絡組織以及高校與企事業(yè)單位等組織,進行結構調整,建立數(shù)字資源長期保存的不同層次的系統(tǒng),同時要配合制定相應法律、法規(guī),使之規(guī)范化、制度化。從發(fā)達國家對數(shù)字資源長期保存的實踐上看,他們對數(shù)字資源的整合、開發(fā)與使用都具有較強的體系性、嚴謹性與安全性,貫穿控攝整個信息社會的內部要素,對他們的技術方法與手段進行更多的借鑒,在國家相關政策的指導下構建有中國特色的數(shù)字資源長期保存體系。
(2)在對我國數(shù)字資源長期保存基礎構建中,注重我國數(shù)字長期保存經(jīng)驗的繼承,通過與發(fā)達國家的比較,對我國數(shù)字資源的分布進行宏觀比較,對政府、企事業(yè)單位等數(shù)字保存進行資源整合,避免資源“割據(jù)”現(xiàn)象,對此在所用經(jīng)費的來源、使用以及系統(tǒng)模型的開發(fā)等方面要形成清晰權利責任體系。
(3)國家要對數(shù)字資源保存系統(tǒng)進行統(tǒng)一規(guī)劃,在對資源的合作保存、選擇性保存以及最大減小保存前的顧慮,明確不同數(shù)字資源保存組織之間的關聯(lián),在實踐中發(fā)揮其功效。
數(shù)字資源是信息社會中主要載體,對其長期保存不僅是技術層面上的問題,也是社會(法律、道德等)層面上的問題,隨著信息社會的不斷發(fā)展,數(shù)字資源的長期保存也來越來越多受到注目。通過對國外數(shù)字資源長期保存現(xiàn)狀的分析,我們看到作為信息社會載體的數(shù)字資源保存的理論探討與實際應用非常龐雜,同時它選擇什么技術,還取決于待保護的數(shù)據(jù)類型,格式,內容結構和關系復雜性及原始軟硬件平臺。因此,我們在了解國際上大量有價值的信息及技術動態(tài)的同時,對我國數(shù)字資源長期保存基礎構建進行初步探討,目的在于促進我國相關領域對數(shù)字資源長期保存工作的重視和發(fā)展。
[1]俞敏,編譯.韓國國家圖書館的網(wǎng)頁存檔系統(tǒng)[J].AwebArchiving System of the National Libraryofkorea:OASIS.http://www.ndigo,Jp/en/publication/cdnlao/058/583.htwl[2007-4-7].
[2]吳振新,等.LOCKSSS數(shù)字資源長期保存策略[J].現(xiàn)代圖書館技術,2006(2):35-37.
[3]圣才學習網(wǎng).數(shù)字圖書館理論基[EB//OL].(2006.10)[2010-10-19].http//www.100xuexi.
[4]張智雄.如何長期保存數(shù)字資源2006年教育行業(yè)信息存儲大會上的講話.[EB//OL].(2006.4)[2006-6-12].http//www.cnki.net.China.AcademicJournalElectronic Publishing House.AIIrights reserued.
[5]李丹等.協(xié)作與實踐:數(shù)字資源長期保存工具及方法[J].圖書館理論與實踐,2009(11)70-72.
[6]苑玲.國外數(shù)字資源長期保存的最新發(fā)展及對我國的啟示[J].中國圖書館學報,2004(2)24-25.
[7]蘇雪梅.網(wǎng)絡數(shù)字信息采集與保存的探討[J].預防醫(yī)學報,2004(6):647.
[8]謝永憲.數(shù)字長期保存的相關主體及合作模式研究[J].圖書館學研究,2009(3):42.
[9]石得萬.數(shù)字圖書館信息資源保存面臨的挑戰(zhàn)與對策[J].圖書館論壇,2002(8)47-48.
[10]徐恩元,李瀾楠.市場經(jīng)濟條件下信息資源有效配置問題初探[J].情報雜志,2005(11).
[11]王芳.陽光下的政府:政府信息行為的路徑與激勵[M].南開大學出版社,2006:65.