欒 榮
(綏化學院圖書館,黑龍江 綏化 152061)
欒 榮 女,1976年生,發(fā)表論文10余篇。
網絡社會作為現(xiàn)實社會的一種充實與豐富,其全方位的滲透為數(shù)字信息的廣泛應用奠定了一個堅實的基礎,同時也促使圖書情報與檔案界加大了對數(shù)字信息管理的深入研究。由于數(shù)字信息對設備的依賴性,以及數(shù)字信息的不安全性與不穩(wěn)定性等特點,嚴重影響了數(shù)字信息的有效性存取。確保數(shù)字信息保存質量,采取有效措施保護好稍縱即逝的數(shù)字資源,其不僅是技術層面上的問題,更是人類發(fā)展中一項重大的歷史責任。
數(shù)字信息在被利用時雖然非??旖莘奖?,但由于其保存質量受多方面因素的影響,使得大量有價值的數(shù)字信息資源不能得到應有的保存。
存儲載體是存貯數(shù)字信息資源的實體或記錄信息的材料,數(shù)字信息資源的保存質量與其依附的存儲載體密切相關。目前常用的存儲載體有軟盤、硬盤、磁帶、軟驅、服務器等。這些存儲載體保存的條件不論如何完備,也只是延長其使用期限,例如:光盤在使用時由于受數(shù)據(jù)記錄質量、紅外線照射、盤面污損、外力損傷等因素影響,其物理壽命一般在5~200年之間;又如磁帶,由于受保存地點溫度、濕度、灰塵、使用不當?shù)纫蛩氐挠绊?,其物理壽命一般?~30年之間;再如硬盤,由于受到震動、撞擊、電壓不穩(wěn)、病毒的侵入等因素影響,其物理壽命一般也僅在5~10年之間。
數(shù)字資源的長期保存需要以技術發(fā)展作為保障,電子產品更新?lián)Q代速度極快,硬件、軟件的技術更新使數(shù)字信息的長期讀取充滿了未知數(shù),技術老化被許多業(yè)內人士看作是對數(shù)字存儲的最大威脅,甚至認為技術過時造成的危害比媒體損失更嚴重。我們在對一些文獻進行數(shù)字化轉換時,數(shù)字信息的內容以數(shù)字編碼的形式存貯于各種介質的載體上,人們利用文件格式對數(shù)據(jù)和有關數(shù)據(jù)的信息進行編碼,各種電子出版物其格式也不盡相同,且其不斷地更新,這樣就給數(shù)字信息資源的保存帶來了一定的困難。
數(shù)字信息資源在使用與保存的過程中,其諸多環(huán)節(jié)都涉及到了相應的知識產權和版權問題。多數(shù)情況遵循的是在一定范圍和程度內的“合理使用”,但在目前,人們對“合理使用”的范圍并沒有明確的界定,其界限也不易準確把握,由于沒有相應法律條款的支持,就使得數(shù)字信息資源在保存的過程中,很容易觸犯到一些如版權法、合同法、繳送制度等的規(guī)定,所以,對于知識產權的界定,以及對相關法律法規(guī)的完善,已是迫在眉睫。
對數(shù)字信息保存要有充足的經費作后盾。數(shù)字信息保存是一個動態(tài)、持續(xù)的過程,在數(shù)字信息資源長期保存的每一個環(huán)節(jié)中,都會涉及到成本運營。保存數(shù)字信息所需要的成本支出類型與保存?zhèn)鹘y(tǒng)紙介質信息所需成本支出類型截然不同,數(shù)字信息長期保存的維護費用要比傳統(tǒng)文獻維護費用高昂,而且數(shù)字資源的保存具有不確定性,難以精確計算,其保存成本具有不可預測性。數(shù)字信息資源保存過程中的任何一個環(huán)節(jié)如果缺少了經費支持,都會影響到保存質量。
我國開展數(shù)字資源長期保存工作較一些發(fā)達國家相比起步較晚,目前仍處于初級階段,自主研發(fā)內容不夠,這方面的問題已經引起了國內相關人士的重視,已相繼啟動了國家圖書館的WICP項目和中國Web信息博物館。
2.1.1 WICP 項目
WICP(Web Information Collection and Preservation)項目,即網絡信息資源的采集與保存試驗項目。該項目積極探索信息資源采集與保存的相關法律、技術、標準等問題。由國家圖書館啟動的這一項目表明這個問題本身已經受到關注,并已有所行動,雖然還只是課題層次,但它會提供操作框架和技術構想以及可供利用的成果。
2.1.2 中國Web信息博物館
中國Web信息博物館是2002年在國家“973”和“985”項目支持下,由北京大學網絡實驗室開發(fā)建設的中國網頁歷史信息存儲與展示系統(tǒng),它包括歷史網頁存儲系統(tǒng)和回放系統(tǒng)兩部分。它匯集了中國所有靜態(tài)網頁,全面展現(xiàn)中國互聯(lián)網信息的歷史,并提供歷史網頁的存盤和回放,目前已經維護有30億中文為主的網頁,并以平均每日4500萬網頁的速度擴大規(guī)模。
2.2.1 美國的 NDIIPP 計劃
NDIIPP是“國家數(shù)字信息基礎結構及保存”的簡稱,是由美國國家圖書館發(fā)起旨在保存數(shù)字資源的聯(lián)合行動。該計劃決定讓國會圖書館承擔領導全國數(shù)字信息長期保存的任務,并讓美國重要政府部門和擁有收集與保存數(shù)字內容專長的實體進行合作,并鼓勵廣大民營行業(yè)機構參與此項計劃,該計劃試圖保存電子圖書、中文期刊、數(shù)字音樂、數(shù)字電視、數(shù)字錄像、網站這6種媒體類型的信息。經過多年的努力,該研究工作已取得實質性的進展,它提出了美國國家數(shù)字信息保存的技術框架,包括信息保存網絡和數(shù)字保存結構兩大部分。該框架的建立,不僅對其本國,而且對于整個世界數(shù)字信息保存都具有重大的指導意義。
2.2.2 澳大利亞的PANDORA項目
澳大利亞的PANDORA項目,即保護和存取澳大利亞網絡信息資源項目,它于1996年由澳大利亞國家圖書館創(chuàng)建。目前已經建立了用戶可以直接訪問的國家聯(lián)機出版物知識庫,該項目旨在建立一個經過選擇的澳大利亞網絡信息資源歸案系統(tǒng)的同時,為保護和存取澳大利亞電子資源制定政策和程序,采用選擇性的存取策略,側重收集重要的且具長期保存價值的聯(lián)機出版物和網站。該項目的啟動,確定了澳大利亞網絡出版物和其他Web信息的長期存取目標。
2.2.3 荷蘭國家圖書館的NEDLIB項目
此項目即網絡化歐洲存儲圖書館項目,于1998年1月啟動,具體由荷蘭國家圖書館領導,歐洲委員會遠程信息處理應用計劃提供資助,參與單位包括荷蘭、芬蘭、法國、挪威、瑞士等7個國家圖書館,一個國家檔案館,兩個資訊通信科技組織以及3家出版社。此計劃的目標是要建立歐洲地區(qū)各國的共同電子儲存系統(tǒng),確保電子出版品能在現(xiàn)在與未來為人們所利用,其中最重要的貢獻就是各個圖書館都能獨立地使用此系統(tǒng),達到共同寄存與使用的目的,實現(xiàn)資源的共建與共享。
2.2.4 德國的 NESTOR 項目
此項目是由德國教育和研究委員會資助,于2003年6月開通,該項目由德國國家圖書館負責,聯(lián)合了6個學術機構合作進行,此項目的主要目的是增強人們對數(shù)字資源長期保存的意識和理念,建設信息網絡平臺,建立穩(wěn)定的組織模型,便于合作項目的開展,增強機構間的合作,形成本國和國際戰(zhàn)略聯(lián)盟,共同解決數(shù)字資源長期保存問題。近些年來,德國逐漸意識到數(shù)字資源的長期保存是一個非常重要的課題,由于德國實行聯(lián)邦制,每個聯(lián)邦都有推進科學和技術的責任與義務,因此,解決的方案就需要依靠通力合作來完成。
2.2.5 英國的 CEDARS 項目
此項目即高校研究圖書館聯(lián)盟數(shù)字存檔樣書項目,由英國國家圖書館以及繼續(xù)教育基金會聯(lián)合信息系統(tǒng)委員會資助建立,具體工作由里茲大學、牛津大學和劍橋大學實施,主要致力于研究數(shù)字保存的策略、方法和實際問題,包括數(shù)字對象的獲取、長期保存、有效描述和永久獲取等項目的研究。
3.1.1 數(shù)據(jù)備份
數(shù)據(jù)備份即是對重要的數(shù)據(jù)資料,如文檔、數(shù)據(jù)庫、記錄、進度等備份下來,生成一個備份文件放在安全的存儲空間內,當重要的數(shù)據(jù)丟失、誤刪或被病毒破壞時,將其恢復到作數(shù)據(jù)備份時的狀態(tài)。但備份所保存的數(shù)據(jù)信息不夠全面,無法滿足用戶對信息的檢索需求。
3.1.2 仿真
仿真是一種計算機系統(tǒng)模仿另一種計算機系統(tǒng),是對數(shù)字對象的原始面貌進行保存,它可以保存數(shù)字對象的功能以及數(shù)字信息的初始格式、內容等。仿真技術適合于超文本、多媒體等復雜的,以及其所依賴的運行條件無法在新、舊技術平臺之間進行遷移的數(shù)字信息,仿真是延遲技術淘汰的方法之一。
3.1.3 遷移
遷移是目前廣泛使用的一種數(shù)字資源長期保存技術,遷移是定期地把數(shù)字信息從不穩(wěn)定的媒體轉換到穩(wěn)定的媒體上;從舊計算機的環(huán)境轉換到新計算機環(huán)境;將數(shù)字信息從各種不同格式上遷移至易于管理的、最簡單且符合標準的格式上,以保證數(shù)據(jù)可以被當前的計算機系統(tǒng)讀取。遷移不同于仿真可以保持數(shù)據(jù)的原貌,遷移主要是保存數(shù)據(jù)內容間的關系[2],但其會造成版式、鏈接、結構等信息有一定程度的丟失,降低了數(shù)字信息的保存與利用價值。
3.1.4 技術保存
由于某些數(shù)據(jù)無法脫離原始的運行環(huán)境,因此,就要將數(shù)據(jù)、產生數(shù)據(jù)的原始軟件、操作系統(tǒng)和硬件平臺一起保存下來,為日后運行此數(shù)據(jù)信息時提供運行的技術,能對數(shù)據(jù)的長期保存起到一定作用,但由于其保存時所需要的維護費用較高,加之無法滿足遠程用戶的需求,因此,這種方法不被大多數(shù)人看好。
3.2.1 增強人們對數(shù)字資源長期保存的意識
網絡的飛速發(fā)展,為人們利用、獲取信息提供了便捷的條件,一些人只重視如何快、精、準地獲取到自己所需的信息,而對于數(shù)字信息長期保存意識薄弱,沒有給予足夠重視,沒有認識到數(shù)字資源信息丟失的危害性與嚴重性。早期數(shù)字信息的損毀已向我們昭示,如果不及時采取措施保護數(shù)字信息,我們留給未來的只能是一段空白記憶。思維指導人們的言行,我們要加大宣傳力度,形成一種數(shù)字信息保存的社會氛圍。
3.2.2 對保存的數(shù)字信息進行選擇
據(jù)統(tǒng)計,全球現(xiàn)共有40億淺層網面,同時還有5500億深層網頁,這些網絡資源包括多達220種語言和文字的信息,數(shù)字化信息資源已成為人類最大的信息資源。在對數(shù)字信息進行長期保存的實踐中,人們面對這些海量的信息要有所取舍,以確定保存的對象、保存的層次,在選擇所要保存的信息資源時一定要有原則性、針對性,把好質量關。
3.2.3 加強數(shù)字資源長期保存的標準化建設
在當前的環(huán)境下,形成的數(shù)據(jù)格式以及存取數(shù)據(jù)的軟件與硬件呈日益多元化發(fā)展,數(shù)字信息、信息生產與管理的標準化建設已成為一項極為緊迫的任務。當前,公共標準的缺乏是數(shù)字信息難以長期保存的根源之一。由于缺乏相關的、可被廣泛接受的標準,增加了數(shù)字信息在新舊平臺間轉換的難度,同時也使數(shù)字信息長期保存的費用增多。
3.2.4 建立完善的責任制與合作機制
數(shù)字信息保存不同于傳統(tǒng)出版物的保存,網絡環(huán)境下,網絡出版物的生產者、保存者和利用者的關系發(fā)生了改變,他們在數(shù)字信息資源長期保存中形成了協(xié)作關系,他們之間權利與責任相互依存,又相互制約,而且還需要在這一過程中進一步探討與細化一些具體環(huán)節(jié)。
3.2.5 建設完善的法律保障體系
在進行數(shù)字資源長期保存的同時,我們應從法律的角度為長期保存數(shù)字資源提供完善的保障體系,制定嚴格的法律、法規(guī),保護數(shù)字資源不被修改、竊取,從而進一步保證數(shù)字信息的真實性與完整性。數(shù)字信息資源產權保護主要包括知識產權和信息隱私權保護。信息資源共享是人們開發(fā)與利用信息資源的根本目標,而知識產權問題已成了實現(xiàn)信息資源共享的最大阻力之一[3]。為推進數(shù)字化信息資源長期保存的步伐,在法律制度許可的范圍內,要把握好法律尺度與資源共享最大化之間的平衡點。
[1] 肖英.數(shù)字信息保存成本研究[J].圖書館雜志,2004(11).
[2] 王暉.數(shù)字信息長期保存的技術策略[J].情報探索,2008(10).
[3] 馬海群.數(shù)字信息資源管理的制度需求分析[J].圖書館,2009(1).
[4] 黃旭,畢強.國內外數(shù)字資源長期保存研究現(xiàn)狀與進展[J].圖書館學研究,2009(1).
[5] 楊文建.數(shù)字文獻長期保存的非技術因素分析[J].圖書館論壇,2009(4).