摘 要:電子檔案文件保存技術(shù)在“互聯(lián)網(wǎng)+”時代面臨一系列問題與挑戰(zhàn),為解決這個難題,本文試圖在電子檔案長期保存的技術(shù)中提出從技術(shù)路線、文件格式、存儲載體、元數(shù)據(jù)管理和軟件功能等方面的需求。
關(guān)鍵詞:電子檔案文件 長期保存 技術(shù)
中圖分類號:G27文獻(xiàn)標(biāo)識碼:A文章編號:1003-9082(2020)03-00-01
隨著互聯(lián)網(wǎng)時代的到來,新科技新技術(shù)的飛速發(fā)展,政府無紙化辦公逐步推進(jìn),紙質(zhì)版檔案文件慢慢將被電子檔案文件替代,以幾何級的速度迅速增加。
電子文件(檔案)是指國家機(jī)構(gòu)、社會組織或者個人在履行其法定職責(zé)或處理事務(wù)過程中,通過計(jì)算機(jī)等電子設(shè)備形成、辦理、傳輸和存儲的數(shù)字格式的各種信息記錄。
如何長期保存電子檔案,這一課題迅速擺在每一個檔案文件管理者的面前。電子文件(檔案)長期保存,是指用一種可靠的,科學(xué)合理的方式,長期維護(hù)電子文件(檔案)真實(shí)完整有效的行為。重要的信息資源是電子文件(檔案)。它們是從事政治、軍事、經(jīng)濟(jì)、科技、文化、等活動的國家機(jī)關(guān)、社會團(tuán)體和個人形成的對國家和社會具有重要價值的各種文字、圖表、音像等形式的直接歷史記載。它們也是社會數(shù)字資產(chǎn)不可或缺的一部分。實(shí)現(xiàn)電子文件(檔案)的長期保存,既是文件與檔案部門的重要問題,也是全人類的共同使命。
電子文件(檔案)長期保存的解決問題,一定要確定長期保存電子文件(檔案)的要求,制度、管理、技術(shù)、安全等方面包括其中。必須明確電子文件長期保存的要求,包含制度、管理、技術(shù)、安全等方面。本文是重點(diǎn)是從技術(shù)層面進(jìn)行探討,包括技術(shù)路線、文件格式、存儲載體、軟件功能和元數(shù)據(jù)管理等。
2012年,全國電子文件管理工作聯(lián)席會議發(fā)布了《電子文件真實(shí)性保障和長期保存等關(guān)鍵技術(shù)研究》課題。本文對電子文件長期保存的關(guān)鍵技術(shù)進(jìn)行了研究,并提出了初步的解決方案。電子文件(檔案)長期保存的研究成果,在國內(nèi)外相關(guān)部門都沒有提出完整、權(quán)威的技術(shù)要求。目前這方面的難題遠(yuǎn)遠(yuǎn)超出取得的成績,這與電子文檔管理面臨的五大技術(shù)挑戰(zhàn)相關(guān)。
一是數(shù)據(jù)規(guī)模大,在這個信息資源持續(xù)快速增長的大數(shù)據(jù)時代,管理部門面臨電子文件(檔案)日益增多的形勢,管理部門面臨著電子文件(檔案)不斷膨脹、承載范圍超出管理部門能力的局面。
二是格式多樣化,它主要體現(xiàn)在多樣性的電子文件的數(shù)字格式,這意味著管理部門需要處理電子文件各種不斷變化的格式。
三是類型復(fù)雜性,電子文件不僅格式多樣,而且數(shù)據(jù)類型也越來越繁雜。除了傳統(tǒng)類型的文本、圖形、圖像、音頻和視頻文件外,各種新的媒體文件和數(shù)據(jù)文件也是層出疊現(xiàn),讓人目不暇接。
四是生命周期短,在信息技術(shù)飛速成長的前提下,具有生命周期相對較短的特點(diǎn)是硬件、軟件、文件格式、存儲載體等。倘若不是按照文件生命周期的特點(diǎn)來定制解決方案,問題就無法解決,將會使問題更加復(fù)雜。
五是技術(shù)變化快,信息技術(shù)一直處于不斷成長蛻變的過程中,如何使用相對穩(wěn)定前瞻的技術(shù)發(fā)現(xiàn)、傳遞和處理過去的電子文件,保證改進(jìn)后的新技術(shù)含量的方法與以往保存技術(shù)的相容性和連續(xù)性是管理部門面臨的挑戰(zhàn)。
面對以上這些問題和挑戰(zhàn),我們文件和檔案部門和從事這項(xiàng)工作的工作人員應(yīng)該如何解決呢?在對國內(nèi)外相關(guān)研究項(xiàng)目進(jìn)行分析、總結(jié)的基礎(chǔ)上,充分考慮電子文件(檔案)的特點(diǎn),從技術(shù)路線、文件格式、存儲載體、存儲方式等方面提出了電子文件(檔案)長期保存的技術(shù)要求,元數(shù)據(jù)管理和軟件功能。各部分技術(shù)要求的主要內(nèi)容如下:
1.技術(shù)路線:技術(shù)路線需求主要包括更新、遷移、仿真、封裝、再生五個方面內(nèi)容。
信息更新是指原始的技術(shù)環(huán)境下,適時重寫信息數(shù)據(jù),將數(shù)據(jù)流從舊存儲介質(zhì)轉(zhuǎn)移到新存儲介質(zhì)上,防止由于存儲介質(zhì)物理性能變化而引起信息丟失的方法。例如:將過去的磁盤、光盤上的信息轉(zhuǎn)存到硬盤中存儲,因?yàn)檫^去的磁盤、光盤容易損壞,信息易丟失。遷移是持續(xù)的將電子信息從一種技術(shù)環(huán)境轉(zhuǎn)移到另一種技術(shù)環(huán)境,這意味著基于字符的信息可以從一種存儲介質(zhì)傳輸?shù)搅硪环N存儲介質(zhì),以便長期保存電子信息。仿真是用一個計(jì)算機(jī)系統(tǒng)克隆另一個計(jì)算機(jī)系統(tǒng),使兩者的操作系統(tǒng)功能完全的相同,也就是說,前者接收的數(shù)據(jù)與后者相同,并且后者相同的程序可以執(zhí)行。封裝技術(shù)是指通過規(guī)范電子檔案文件的封裝過程,為電子檔案文件提供統(tǒng)一的封裝格式,保證電子檔案文件及其元數(shù)據(jù)的完整合一性。封裝技術(shù)是指電子檔案的封裝過程,為電子檔案提供統(tǒng)一的封裝格式,確保電子檔案(文件)及其元數(shù)據(jù)的完整性。再生性保護(hù)技術(shù)是一種保護(hù)措施,如建筑物數(shù)據(jù)、圖紙等,能將過去一些有價值的電子信息及時轉(zhuǎn)換成微型或紙質(zhì)媒體。
2.文件格式:文件格式需求主要包括格式開放、文件自包含、格式字描述、可轉(zhuǎn)換、支持技術(shù)認(rèn)證機(jī)制等方面內(nèi)容,結(jié)合各種格式電子檔案的特點(diǎn),對其進(jìn)行了擴(kuò)展。
格式開放主要包括公開發(fā)布的相應(yīng)標(biāo)準(zhǔn)和技術(shù)規(guī)范,確保簡潔明了的格式標(biāo)準(zhǔn)和技術(shù)規(guī)范,不受專利、許可等限制。文件自包含主要是指文件中呈現(xiàn)的所有信息必須完全包括所有字體的字形描述信息或嵌入式字體程序信息、光柵圖像、矢量圖形、顏色信息、音視頻編碼信息等。格式自描述主要指設(shè)置標(biāo)準(zhǔn)元數(shù)據(jù)集可以與國際國內(nèi)相關(guān)標(biāo)準(zhǔn)建立映射),以文本方式(通常是XML)嵌入到文件中,并且易于提取和檢索等。支持電子檔案其他格式和長期保存格式的相互轉(zhuǎn)換,還支持電子檔案過時的長期保存格式向新的長期保存格式的轉(zhuǎn)換。支持?jǐn)?shù)字簽名的技術(shù)認(rèn)證機(jī)制,各種操作系統(tǒng)和硬件平臺支持使用數(shù)字簽名,并且數(shù)字簽名的所有信息都是完全獨(dú)立的。
3.存儲載體:一般來說,電子檔案的存儲周期比存儲載體的壽命長,這使得電子檔案的長期保存受到存儲載體技術(shù)發(fā)展的制約,就電子文件(檔案)的存儲載體類型而言,磁性載體目前比較成熟和普遍,光學(xué)載體和電(半導(dǎo)體)載體三類,每種載體都有自己的應(yīng)用領(lǐng)域。一般有以下幾種存儲方式:
在線存儲,電子檔案一般直接存儲在信息系統(tǒng)中,通過應(yīng)用軟件可以實(shí)時存取,在目前的技術(shù)條件下,硬盤和基于硬盤的各種存儲系統(tǒng)(磁盤陣列、NAS存儲、SAN存儲、集群存儲等)仍然是主流的存儲方式;對于具有高安全性要求的數(shù)據(jù),可以考慮使用特殊的WORM磁盤(一次寫入和幾次讀取硬盤)。
在線備份與在線存儲結(jié)合使用,定期將數(shù)據(jù)備份到本地備份設(shè)備,彌補(bǔ)了在線存儲中數(shù)據(jù)丟失等安全風(fēng)險。目前,磁帶機(jī)(庫)設(shè)備(以磁帶為載體)或虛擬磁帶庫設(shè)備(以硬盤為載體)是主流。
本地備份、異地保存:一種是將在線備份數(shù)據(jù)直接發(fā)送到磁帶或光盤到另一個地方存儲;另一種是在本地再做一次備份,送到另一個地方保管,他們大多使用光盤作為備份介質(zhì),為了避免數(shù)據(jù)損壞或修改,要求采用一次性寫入只讀光盤。近線存儲可用于實(shí)時性要求較低的數(shù)據(jù)。
在以往的解決方案中,以光盤為存儲載體的光盤庫等設(shè)備主要用于近線存儲,隨著硬盤成本的降低和安全性的提高,近線存儲也逐漸采用各種基于硬盤的存儲系統(tǒng)。
異地(容災(zāi))存儲,通常,數(shù)據(jù)通過網(wǎng)絡(luò)直接傳輸?shù)竭h(yuǎn)程存儲設(shè)備,例如,當(dāng)今廣泛使用的網(wǎng)絡(luò)云硬盤也是以硬盤為基礎(chǔ),以硬盤為主要載體的各種存儲系統(tǒng)。主要防止地震、水災(zāi)、火災(zāi)等不可抗力對信息資源的破壞。
異質(zhì)備份,對于特別重要的電子文件,為了電子文件的長期存儲和安全存儲,如將電子文件從數(shù)字信號轉(zhuǎn)換為模擬信號并存儲在縮微膠卷上的多格式備份。
4.元數(shù)據(jù)管理:元數(shù)據(jù)保證并證明了電子檔案的真實(shí)性和憑證價值,它對電子檔案的保護(hù)和長期保存、電子檔案的有效管理、電子檔案的方便查詢和利用具有重要作用。
5.軟件功能:軟件功能需求包括存儲策略管理、存儲環(huán)境管理、備份載體管理、文件倉庫、文件檢測、格式轉(zhuǎn)換、文件遷移、文件提取和系統(tǒng)管理。軟件功能需求是電子檔案長期保存需求的固化,把理論研究成果轉(zhuǎn)化為實(shí)際應(yīng)用是關(guān)鍵。
以上歸納總結(jié)的電子檔案文件長期保存需求,特別是軟件功能需求還需在電子檔案文件接受和長期保存系統(tǒng)建設(shè)工程項(xiàng)目中得到實(shí)踐驗(yàn)證。但是隨著信息技術(shù)不斷高速的發(fā)展,各種新技術(shù)新媒體文件、數(shù)據(jù)文件層出不窮,電子檔案文件的管理人員和研發(fā)人員還需要結(jié)合實(shí)際應(yīng)用過程中反饋的問題進(jìn)行進(jìn)一步的梳理總結(jié),提煉電子檔案文件長期保存的新技術(shù),使其更為完備。
參考文獻(xiàn)
[1]王賀芹.電子文件及電子檔案管理初探[J].現(xiàn)代圖書情報技術(shù),2002:66-68+77.
[2]邱曉威.電子文件與電子檔案的管理問題與對策[J].中國檔案,1999,(03):32-34.
[3]劉偉晏.電子文件歸檔后的保存、維護(hù)與利用[J].中國檔案,1999,(05):31-33.
[4]馮惠玲.電子文件與紙質(zhì)文件管理的共存與互動[J].中國檔案,2003,(12):40-42.
[5]魏招秀.談電子檔案的長期保存[J].蘭臺世界,2010(24):14-15.
作者簡介:孫進(jìn),男,(1971-)安徽巢湖人,安徽省檔案學(xué)會會員,主要從事信息技術(shù)和檔案管理研究。