王麗芬
(哈爾濱軸承集團(tuán)公司 黑龍江 哈爾濱 150000)
隨著現(xiàn)代信息技術(shù)的迅速發(fā)展和電子文件的大量產(chǎn)生,數(shù)字化檔案建設(shè)已成為我國檔案界關(guān)注的熱點(diǎn)問題。數(shù)字化檔案與傳統(tǒng)檔案相比,具有數(shù)字化資源豐富、海量存儲、檢索便捷、傳輸快速、高度開放、信息共享等優(yōu)點(diǎn),但同時也存在一些缺陷和不足。因此,我們應(yīng)該清醒地認(rèn)識到數(shù)字化檔案建設(shè)還存在著諸多問題,亟待深入研究解決。
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,目前,人們對數(shù)字化檔案具有參考價值這一點(diǎn)已無異議。然而,由于一系列技術(shù)和立法問題還未解決,數(shù)字化檔案目前還不具備法律憑證效力。因此,確認(rèn)數(shù)字化檔案的憑證價值就成為數(shù)字檔案館建設(shè)中無法回避的難題。
數(shù)字化檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質(zhì)檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而要確認(rèn)數(shù)字化檔案的憑證價值,恐怕不僅僅是改變觀念的問題。要真正認(rèn)識數(shù)字化檔案,確認(rèn)其憑證價值,可能還需要走很長的路。數(shù)字化檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機(jī)設(shè)備加以讀取,它的非人工識讀性使得其與其他載體檔案有著質(zhì)的區(qū)別。數(shù)字化檔案完全脫離了以往人們對檔案“原件”的認(rèn)識,從而引起人們對其原始性、可靠性的懷疑,而且有些數(shù)字化檔案即使載體保存完好,內(nèi)容也可能在無形中丟失,它不像紙質(zhì)檔案那樣載體與內(nèi)容結(jié)合緊密。
其一,數(shù)字化檔案具有易復(fù)制、易修改、易刪除的特點(diǎn),使得檔案“原件”的概念變得難以確認(rèn)。其二,計算機(jī)軟、硬件技術(shù)不斷更新?lián)Q代,迫使數(shù)字化檔案必須不斷適應(yīng)新的“生存環(huán)境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判斷其原始性。其三,數(shù)字檔案不再具有特定的字跡,人們可以根據(jù)需要以不同的字體、字號將其輸出,傳統(tǒng)的字跡鑒定技術(shù)無法分辨數(shù)字化檔案的原始性。其四,數(shù)字化檔案對背景信息和元數(shù)據(jù)具有很強(qiáng)的依賴性。電子文件的背景信息常常與文件內(nèi)容信息相分離保存,一旦失去背景信息,文件的內(nèi)容即便仍有意義,但也不再具有憑證價值。
傳統(tǒng)檔案之所以具有憑證價值,在一定程度上取決于嚴(yán)格的管理制度,而目前從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴(yán)格而科學(xué)的標(biāo)準(zhǔn)體系和業(yè)務(wù)管理制度,一些標(biāo)準(zhǔn)、制度雖已制定,但全面推行、切實(shí)執(zhí)行尚需時日。
數(shù)字化檔案信息的長期存儲問題是數(shù)字化檔案建設(shè)的一個具體而又棘手的難題。
現(xiàn)代介質(zhì)的存儲設(shè)備還不可能解決計算機(jī)數(shù)據(jù)存儲問題。一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質(zhì)載體相比,其壽命相差甚遠(yuǎn),而且還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,如10年前還經(jīng)常使用的5.25英寸的軟盤,現(xiàn)在已經(jīng)沒有一臺普通電腦可以讀取其內(nèi)容了。
計算機(jī)語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現(xiàn)行的機(jī)器語言描述的數(shù)據(jù),還能百分之百地還原。
數(shù)字化檔案必須依賴于計算機(jī)設(shè)備才能讀取,這個特征對其長期存儲帶來很多問題,如設(shè)備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來;電子文件對其它設(shè)備環(huán)境的不兼容性,使其只能在某種設(shè)備上處理,而不能在其他設(shè)備上處理;不同軟件環(huán)境形成的電子文件存貯在載體上,有時難以呼喚;電子文件加密后,不解密就無法識別;技術(shù)設(shè)備更新時,不及時解決格式轉(zhuǎn)換問題,也無法讀取等。
檔案數(shù)字化工作的生命線在于其能夠保持檔案原貌。然而,就目前的研究水平而言,還難以保質(zhì)保量地完成館藏檔案數(shù)字化的任務(wù)。數(shù)字化的主要方式是掃描加工,在這一過程中造成數(shù)字化檔案失真還有以下幾個方面的原因:其一,技術(shù)參數(shù)選擇不當(dāng)。針對不同色調(diào)、紙質(zhì)和字跡,有時需調(diào)整不同的技術(shù)參數(shù),如分辨率、明暗度、對比度等,選擇不當(dāng)會直接影響掃描的質(zhì)量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復(fù)勞動,難免有時失誤,如掃描檔案或打錯順序、或存錯、或在建索引時鏈接錯誤等,如不及時發(fā)現(xiàn),將直接導(dǎo)致數(shù)字化檔案失真。其三,轉(zhuǎn)換過程中的失真。在進(jìn)行數(shù)字化檔案的遷移或提供利用時,往往需要將掃描后形成的圖像文件轉(zhuǎn)換成另一種格式的文件,如果格式選擇不當(dāng),同樣會導(dǎo)致數(shù)據(jù)發(fā)生變化。
網(wǎng)絡(luò)系統(tǒng)中的硬件技術(shù)之一是必需有足夠的寬帶,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實(shí)現(xiàn)多網(wǎng)互連、高速互訪,實(shí)現(xiàn)跨平臺、跨系統(tǒng)、跨語種的互相轉(zhuǎn)換和鏈接。毫無疑問,足夠的寬帶條件和用戶對網(wǎng)絡(luò)信息傳輸?shù)男枨髮⑹菣n案數(shù)字化建設(shè)中的矛盾體。
數(shù)字化檔案是以信息源、網(wǎng)絡(luò)、數(shù)據(jù)庫為基礎(chǔ)的,其相關(guān)技術(shù)是較復(fù)雜、較先進(jìn)并且不斷發(fā)展的,它幾乎囊括了計算機(jī)網(wǎng)絡(luò)技術(shù)所需要解決的所有問題。如數(shù)字化圖像的存儲與壓縮、數(shù)據(jù)組織技術(shù)、信息檢索技術(shù)、多語言平臺互換互訪技術(shù)、海量信息存儲與調(diào)配技術(shù)等,既是計算機(jī)網(wǎng)絡(luò)技術(shù)的難關(guān),也是制約數(shù)字化檔案建設(shè)發(fā)展的難題。同時,數(shù)字化檔案的建設(shè)和運(yùn)行需要解決一些特殊問題,為此必須開發(fā)應(yīng)用一系列新技術(shù),如身份認(rèn)定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等。
在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應(yīng)用軟件及存儲載體等不斷地被新產(chǎn)品所替代。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字化信息就很難被新的硬件設(shè)備和軟件系統(tǒng)讀出?!凹夹g(shù)過時”的陰影一直會籠罩著數(shù)字信息。專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個致命弱點(diǎn),就是每次遷移總會丟失一定的相關(guān)信息,這些丟失的信息積累起來會造成數(shù)字化檔案信息無法準(zhǔn)確恢復(fù)原貌。