文·于熒熒
隨著數(shù)字時(shí)代中信息技術(shù)的換代更迭,對(duì)數(shù)字檔案存儲(chǔ)提出了要求越來(lái)越高,各國(guó)都在為改進(jìn)和推進(jìn)數(shù)字檔案存儲(chǔ)作出不懈努力,以尋求長(zhǎng)久、安全、合適的解決方案。目前,保護(hù)數(shù)字檔案的目的已不僅僅是保護(hù)其在物理性能上不受損害,而是要建立以信息完整性為主要特征的電子檔案管理與維護(hù)體系,這便涉及到從數(shù)據(jù)保護(hù)到隱私立法以及知識(shí)產(chǎn)權(quán)保護(hù)等多方面問(wèn)題。眾多法律和監(jiān)管的框架會(huì)對(duì)數(shù)字檔案的實(shí)體保存、訪問(wèn)利用產(chǎn)生深刻影響,這也要求我們從數(shù)字檔案的各個(gè)層面去開(kāi)展研究,以創(chuàng)建有利于數(shù)字檔案保護(hù)和利用的法律環(huán)境。
數(shù)字檔案信息存在著來(lái)自物理、技術(shù)、人為、機(jī)構(gòu)等多方面的威脅。其中,物理威脅源于自然事件或時(shí)間等因素,包括介質(zhì)、硬件、存儲(chǔ)設(shè)施的故障等。技術(shù)威脅包括歸檔格式的過(guò)時(shí)或破壞性軟件導(dǎo)致的錯(cuò)誤。人為威脅包括檔案管護(hù)的失誤,內(nèi)部和外部的攻擊等。機(jī)構(gòu)威脅包括目標(biāo)任務(wù)的改變、法律制度的瓦解等(見(jiàn)表1)。值得用戶(hù)信賴(lài)的數(shù)據(jù)庫(kù)應(yīng)當(dāng)了解其系統(tǒng)內(nèi)部存在的威脅與風(fēng)險(xiǎn)。
表1 數(shù)字檔案存在的一般風(fēng)險(xiǎn)
網(wǎng)絡(luò)服務(wù)故障 信息的可訪問(wèn)性因文件名稱(chēng)的解析、目錄的錯(cuò)誤放置和管理的失敗而丟失。組件過(guò)時(shí)介質(zhì)、硬件、軟件的組件因時(shí)間推移出現(xiàn)與其他系統(tǒng)組件不兼容的情況,或因文件格式過(guò)時(shí)而阻止內(nèi)容解碼和呈現(xiàn)。操作員錯(cuò)誤 操作員在處理系統(tǒng)組件時(shí)引入無(wú)法檢測(cè)的錯(cuò)誤,或是操作系統(tǒng)在恢復(fù)任務(wù)期間產(chǎn)生錯(cuò)誤。自然災(zāi)害 洪水、火災(zāi)、地震等。外部入侵 恐怖襲擊、黑客攻擊等。內(nèi)部入侵 內(nèi)部人員欺詐、報(bào)復(fù)或惡作劇等行為。組織機(jī)構(gòu)和經(jīng)濟(jì)的瓦解與困難數(shù)據(jù)庫(kù)運(yùn)行機(jī)構(gòu)因無(wú)法承擔(dān)高昂的運(yùn)行成本導(dǎo)致數(shù)據(jù)庫(kù)無(wú)法運(yùn)行,或因組織機(jī)構(gòu)解散、破產(chǎn)或任務(wù)變更等使其離了有關(guān)部門(mén)的監(jiān)管。
上述列舉的風(fēng)險(xiǎn)印證了一個(gè)事實(shí),即數(shù)字檔案存儲(chǔ)不僅僅是技術(shù)問(wèn)題,更是組織和管理問(wèn)題,甚至說(shuō)要保持?jǐn)?shù)字檔案存儲(chǔ)的持久性與完整性,組織和管理更為重要。德國(guó)數(shù)字資源長(zhǎng)期保存網(wǎng)絡(luò)(Nestor)項(xiàng)目組認(rèn)為,能夠長(zhǎng)期運(yùn)行的數(shù)字存儲(chǔ)庫(kù)是一個(gè)復(fù)雜且相互關(guān)聯(lián)的系統(tǒng)。所以,存儲(chǔ)檔案的數(shù)據(jù)庫(kù)不僅需要持續(xù)的監(jiān)控、規(guī)劃和維護(hù),也需要主動(dòng)行動(dòng)和實(shí)施戰(zhàn)略等,為其執(zhí)行數(shù)字保存任務(wù)提供堅(jiān)實(shí)的保障。這是一項(xiàng)極其昂貴而復(fù)雜的工作,需要營(yíng)造包括檔案管理者、利益相關(guān)者、資助者以及與其他檔案數(shù)據(jù)庫(kù)項(xiàng)目在內(nèi)的協(xié)作環(huán)境,來(lái)應(yīng)對(duì)已經(jīng)產(chǎn)生和即將產(chǎn)生的大量數(shù)字檔案。
數(shù)字檔案存儲(chǔ)系統(tǒng)的可信度是衡量系統(tǒng)優(yōu)劣的重要因素。在確定系統(tǒng)可信度時(shí),要通盤(pán)考慮、協(xié)調(diào)統(tǒng)一,建立可以確保數(shù)據(jù)庫(kù)正常運(yùn)行的一系列組織與程序,包括科學(xué)的標(biāo)準(zhǔn)規(guī)定、先進(jìn)的治理方式、完善的組織結(jié)構(gòu)、合適的人員配備、健康的財(cái)務(wù)狀況、可持續(xù)的資金供給能力、合法的經(jīng)營(yíng)合同許可、應(yīng)承擔(dān)的責(zé)任義務(wù)以及能夠與之相匹配的數(shù)據(jù)和隨時(shí)承接項(xiàng)目的繼承者,以保證數(shù)據(jù)庫(kù)系統(tǒng)的順利運(yùn)行并完成其相應(yīng)的使命。
加拿大多倫多大學(xué)教授羅斯(Ross)、英國(guó)格拉斯哥大學(xué)教授安德魯(Andrew)提出,數(shù)據(jù)庫(kù)必須用多種方法和手段來(lái)建立并維持其可信狀態(tài)。為獲取公眾對(duì)檔案管理的信任,必須對(duì)數(shù)據(jù)庫(kù)進(jìn)行定期審核和認(rèn)證,將審核清單作為客觀評(píng)估的工具,成為本地信息收集、評(píng)估或國(guó)際或國(guó)家認(rèn)證過(guò)程的組成部分。使用審核清單,以自我評(píng)估為起點(diǎn)是數(shù)據(jù)庫(kù)了解其功能的一種有效機(jī)制,這一機(jī)制的建立可以在一定程度上抵御某些潛在威脅以及系統(tǒng)內(nèi)部固有的風(fēng)險(xiǎn)。
審核和認(rèn)證目前國(guó)內(nèi)外尚無(wú)一套核心的標(biāo)準(zhǔn)和要求,而要實(shí)現(xiàn)這種統(tǒng)一的標(biāo)準(zhǔn)和要求,又有眾多困難。應(yīng)該說(shuō)在數(shù)字檔案管理中,并非所有的數(shù)據(jù)庫(kù)都是“平等的”。就國(guó)家而言,有地方、區(qū)域、國(guó)家和國(guó)際層面的數(shù)據(jù)庫(kù)以及數(shù)字檔案館;就數(shù)字檔案館而言,還可分為國(guó)家檔案館、地方檔案館、社區(qū)檔案館、機(jī)構(gòu)檔案館、商業(yè)檔案館和學(xué)校檔案館等。此外,存儲(chǔ)庫(kù)類(lèi)型(機(jī)構(gòu)存儲(chǔ)庫(kù)、開(kāi)放存取存儲(chǔ)庫(kù)、數(shù)字存儲(chǔ)庫(kù))的激增,也使檔案分層管理的需要變得更加清晰。對(duì)這些存儲(chǔ)庫(kù)而言,其主要目的并非保存或明確優(yōu)先級(jí),因而選擇認(rèn)證將在無(wú)形之中給他們帶來(lái)許多壓迫感,這也是他們不會(huì)進(jìn)行認(rèn)證的原因之一。雖然美國(guó)芝加哥的研究圖書(shū)館中心(CRL)、英國(guó)數(shù)字保存研究中心(DCC)、德國(guó)Nestor項(xiàng)目組已為此做出很多努力,然而要達(dá)到數(shù)據(jù)庫(kù)完全標(biāo)準(zhǔn)化仍還有很長(zhǎng)的路要走。
關(guān)于審核和認(rèn)證清單,可大體分為三個(gè)部分。一是組織基礎(chǔ)設(shè)施,二是數(shù)字檔案管理,三是基礎(chǔ)設(shè)施和安全(見(jiàn)表2)。在經(jīng)歷嚴(yán)格的審核之后,定期將審核和認(rèn)證結(jié)果向公眾公布,既增強(qiáng)透明度,也有利于獲得公眾對(duì)檔案工作的信任。
表2 審核和認(rèn)證清單項(xiàng)目及具體要求
數(shù)字對(duì)象的管理數(shù)據(jù)庫(kù)的數(shù)字對(duì)象管理職責(zé),主要體現(xiàn)在“組織”和技術(shù)等方面,比如攝取管理和提供長(zhǎng)期訪問(wèn)數(shù)字對(duì)象所需的存儲(chǔ)庫(kù)功能、流程和過(guò)程。這些要求根據(jù)存檔功能可分為6組,即允許在OAIS系統(tǒng)模型下進(jìn)行;在攝取的初始階段,解決數(shù)字內(nèi)容的獲取問(wèn)題;在攝取的最后階段,將獲取的數(shù)字內(nèi)容放入表格中變?yōu)闄n案信息包(AIP)進(jìn)行長(zhǎng)期保存;在不斷變化的技術(shù)環(huán)境中,建立保持聲像、文件檔案最新?tīng)顟B(tài)的策略和機(jī)制;使用AIP進(jìn)行長(zhǎng)期保存的最低條件;允許系統(tǒng)內(nèi)定位和管理數(shù)字對(duì)象的最小級(jí)元數(shù)據(jù);具備使要保存的數(shù)字對(duì)象準(zhǔn)確生成、傳播并保持真實(shí)版本的能力。技術(shù)基礎(chǔ)設(shè)施和安全可以分為三層,一是一般系統(tǒng)基礎(chǔ)結(jié)構(gòu)要求;二層是基于系統(tǒng)基礎(chǔ)設(shè)施要求的適當(dāng)技術(shù),以及與之相適應(yīng)的為數(shù)據(jù)庫(kù)指定社區(qū)使用服務(wù)的有關(guān)技術(shù)、策略和附加標(biāo)準(zhǔn)與要求;三是安全性,包括從IT系統(tǒng)(服務(wù)器,防火墻或路由器)到消防系統(tǒng)再到洪水檢測(cè)中涉及人為因素的部分。
眾所周知,所有數(shù)據(jù)庫(kù)建設(shè)的最終目的都是使檔案內(nèi)容能夠長(zhǎng)期保存和使用。為能夠更好地處理數(shù)據(jù)庫(kù)和用戶(hù)之間的關(guān)系,更從容地應(yīng)對(duì)因檔案存儲(chǔ)內(nèi)容和技術(shù)過(guò)時(shí)而帶來(lái)的挑戰(zhàn),歸檔前存檔機(jī)構(gòu)與檔案提供者應(yīng)簽訂存檔協(xié)議,通過(guò)制定書(shū)面標(biāo)準(zhǔn)、規(guī)范存儲(chǔ)對(duì)象、明確存儲(chǔ)形式和檔案管理者、提供者應(yīng)盡的義務(wù)等,促進(jìn)數(shù)據(jù)庫(kù)管理規(guī)范化,并規(guī)避未來(lái)可能發(fā)生的麻煩。
數(shù)據(jù)庫(kù)能夠標(biāo)識(shí)它所存儲(chǔ)的數(shù)字對(duì)象屬性,這一過(guò)程從數(shù)據(jù)庫(kù)的任務(wù)聲明就開(kāi)始了。比如,有的存儲(chǔ)庫(kù)可能只承諾保留文本內(nèi)容,而不以電子檔案方式在屏幕上顯示其確切外觀;有的則可能承諾保留電子檔案的確切外觀和布局,而其他則可能選擇在攝取過(guò)程中使數(shù)據(jù)得到規(guī)范化。
此外,還可以根據(jù)自己的館藏特色來(lái)制定存儲(chǔ)方案。每個(gè)檔案館館藏檔案內(nèi)容是不同的,為了實(shí)現(xiàn)館藏檔案利用最大化,精準(zhǔn)滿(mǎn)足各種需求,我們應(yīng)根據(jù)各自館藏檔案的特點(diǎn)編制、開(kāi)發(fā)符合自身特點(diǎn)的詞庫(kù)與軟件,形成具有自身館藏特色的數(shù)據(jù)庫(kù)系統(tǒng)。
事實(shí)上,數(shù)字檔案的存儲(chǔ)并非僅局限于文書(shū)檔案,還應(yīng)包含不同載體的檔案。如瓦努阿圖文化信息網(wǎng)(VCIN)中的電影和有聲檔案館(NFFSA)保存的照片、音頻和視頻,國(guó)家博物館的人工制品,國(guó)家遺產(chǎn)登記冊(cè)檔案中的文字、音頻和視頻,國(guó)家圖書(shū)館的書(shū)籍和報(bào)紙等。用戶(hù)不僅能夠從中查看所有可公開(kāi)訪問(wèn)的檔案信息,還能夠清楚地了解不同檔案之間的關(guān)聯(lián)。比如用戶(hù)若想研究文化儀式,不僅可以在國(guó)家博物館的數(shù)據(jù)庫(kù)中,看其藏品是如何運(yùn)用到由國(guó)家攝影、NFFSA錄制的特定儀式中,查看該藏品的數(shù)字化照片,還可以瀏覽國(guó)家圖書(shū)館保存的與其內(nèi)容相關(guān)的電子文檔,收聽(tīng)錄音,查看NFFSA中有關(guān)儀式的照片和錄像。這樣,用戶(hù)就能夠非常便捷、全面地了解博物館中的藏品。
以多樣化、全覆蓋的格式來(lái)保存檔案內(nèi)容也是實(shí)現(xiàn)檔案真實(shí)性、持久性的路徑之一。如美國(guó)佛羅里達(dá)圖書(shū)館自動(dòng)化中心(FCLA)的數(shù)字保存?zhèn)}儲(chǔ)軟件(DAITSS)實(shí)現(xiàn)了基于格式轉(zhuǎn)換的主動(dòng)保存策略,包括向前遷移、規(guī)范化和本地化。DAITSS能夠完全處理AIFF、AVI、JPEG、JP2、JPX、PDF、純文本、QuickTime、TIFF、WAVE、XML和XML DTD12種不同的文件格式,并且在數(shù)據(jù)攝?。╥ngest)階段實(shí)現(xiàn)了幾種格式的標(biāo)準(zhǔn)化。目前,澳大利亞國(guó)家檔案館已盡可能實(shí)現(xiàn)了現(xiàn)有數(shù)據(jù)存儲(chǔ)格式的全覆蓋。
了解數(shù)據(jù)是如何以及在何處創(chuàng)建,并通過(guò)重新定義傳統(tǒng)的訪問(wèn)概念來(lái)確保數(shù)據(jù)訪問(wèn)可行性是確保其可以被使用的第一步。由于我們無(wú)法預(yù)見(jiàn)數(shù)字檔案的所有用途,因此就要盡可能地保持多樣的、開(kāi)放的訪問(wèn)渠道以突破館藏的極限,以增加訪問(wèn)系統(tǒng)的預(yù)期壽命;要在積極與用戶(hù)互動(dòng)的同時(shí),暢通用戶(hù)的利用和反饋渠道,努力完善數(shù)據(jù)庫(kù)系統(tǒng),并在此基礎(chǔ)上預(yù)測(cè)未來(lái)用戶(hù)的訪問(wèn)需求;對(duì)于要攝取的各類(lèi)型數(shù)字對(duì)象,存儲(chǔ)庫(kù)應(yīng)制定相應(yīng)的書(shū)面標(biāo)準(zhǔn),可以由存儲(chǔ)庫(kù)管理者單獨(dú)制定,也可以與其他機(jī)構(gòu)聯(lián)合制定。書(shū)面標(biāo)準(zhǔn)中要準(zhǔn)確指定需傳輸?shù)臄?shù)字對(duì)象、與對(duì)象關(guān)聯(lián)的文檔以及對(duì)訪問(wèn)的各種限制。此外,存儲(chǔ)庫(kù)還要清楚地列出與該數(shù)字檔案相關(guān)聯(lián)的其他信息。
數(shù)字革命改變了檔案工作者的工作范圍,需要檔案工作者擁有信息化、數(shù)字化方面的知識(shí)、技能與品質(zhì),以滿(mǎn)足用戶(hù)對(duì)檔案信息創(chuàng)建和系統(tǒng)訪問(wèn)的個(gè)性化需求,保護(hù)數(shù)字檔案免受信息技術(shù)變革的沖擊,并用創(chuàng)新的技術(shù)和手段來(lái)推進(jìn)檔案工作的發(fā)展。
1.要有相應(yīng)的知識(shí)儲(chǔ)備。包括擁有檔案學(xué)理論知識(shí)與檔案工作實(shí)踐經(jīng)驗(yàn),明晰檔案與其他信息管理領(lǐng)域之間的關(guān)系,熟知現(xiàn)代組織中檔案的形成流程、不同的歸檔選擇和相應(yīng)的技術(shù)要求,掌握發(fā)現(xiàn)、保存和管理元數(shù)據(jù)的法律、制度、監(jiān)管和治理框架,以及平臺(tái)系統(tǒng)中的檔案來(lái)源、背景、標(biāo)記語(yǔ)言和保證或控制檔案質(zhì)量的方法;了解電子商務(wù)、電子政務(wù)運(yùn)作的基本概念和信息、通信技術(shù)的安全管理制度,以及審計(jì)和規(guī)范化測(cè)評(píng)的方法、規(guī)則。
2.要有一定的技能和品質(zhì)。包括交流能力、研究能力和影響力,應(yīng)急管理能力和業(yè)務(wù)工作創(chuàng)新能力,靈活和準(zhǔn)確的判斷力,咨詢(xún)和談判能力,風(fēng)險(xiǎn)評(píng)估和管理能力,系統(tǒng)設(shè)計(jì)和推廣能力,準(zhǔn)備業(yè)務(wù)案例的能力,建模和分析能力(包括功能和工作流程分析)等。
找出解決數(shù)字檔案存儲(chǔ)難點(diǎn)的辦法,不是一朝一夕、一個(gè)部門(mén)的所能完成的,需要檔案工作者、檔案研究者、檔案機(jī)構(gòu)以及相關(guān)部門(mén)間共同努力、不懈探索,以尋得最佳解決方案。在這一方面我們已經(jīng)取得了一些成績(jī),但前進(jìn)的路還很漫長(zhǎng),需要我們做好打持久戰(zhàn)的準(zhǔn)備并建立必勝的信念,以助推檔案工作不斷向數(shù)字化、信息化的進(jìn)程邁進(jìn)。