1 數(shù)字檔案信息標準問題
這是制約數(shù)字檔案信息長期保存的首要“瓶頸”。數(shù)字檔案信息的長期保存主要涉及兩個方面,一是防止數(shù)字檔案信息被非法變更與破壞,另一個是維護數(shù)字檔案信息的長期真實可讀性。前者,IT界極為重視,國內(nèi)外已開發(fā)了不少技術(shù)產(chǎn)品來防范非法變更與破壞數(shù)字檔案信息,只要技術(shù)措施與管理手段科學(xué)地融合,就有可能在一定程度上解決問題。然而,對于維護數(shù)字檔案信息長期有效讀出,全球范圍都在研究與努力,但至今,仍在探索完美的解決方案。因為,它涉及的問題太多,其中,最重要的是標準問題。標準是緩解技術(shù)更新與數(shù)字檔案信息讀出矛盾的一劑“良方”,但在這方面存在一些問題,一是某些標準,特別是行業(yè)標準嚴重滯后。二是完全按照標準操作,目前,還有難度。制定標準應(yīng)當廣泛地征求相關(guān)技術(shù)人員的意見,但現(xiàn)在有些行業(yè)標準的制定,僅僅是少數(shù)人在撰寫,有些甚至是“閉門造車”,使指導(dǎo)與規(guī)范大家行為的標準嚴重滯后于國際發(fā)展水平。三是現(xiàn)實工作中存在標準兼容與選擇的問題,如A軟件與B軟件都是符合標準的,但A與B又各有特點,這個特點就不在標準范圍之內(nèi)了,這為我們提出了一個棘手的問題,我們應(yīng)當以哪個軟件為主。如果以A軟件為主,則B軟件形成的非標準數(shù)據(jù),或另類標準特色信息就要向A軟件形成的平臺上遷移。因此,作為被保存的數(shù)字檔案信息應(yīng)當采用最穩(wěn)定的技術(shù)與通用的標準歸檔,與行業(yè)標準及國際標準相互兼容,這也是我們首先應(yīng)考慮解決的問題。令人遺憾的是,至今,尚未形成一套全球公認的數(shù)字檔案信息長期保存的國際標準。
2 數(shù)字檔案信息安全問題
隨著數(shù)字檔案信息的日益增多,數(shù)字檔案信息較易受到干擾和攻擊,給數(shù)字檔案信息長期保存帶來嚴峻的安全“瓶頸”。那么,如何解決數(shù)字檔案信息的安全問題呢?筆者認為,具體實施數(shù)字檔案信息安全管理可從以下五個方面著手:一是采用社會法律、法規(guī)手段,建立數(shù)字檔案信息安全管理標準和規(guī)則。二是加強檔案信息用戶認證。檔案信息用戶認證在數(shù)字檔案信息的安全中屬于技術(shù)措施的第一道大門,主要目的是提供訪問控制和不可抵賴的作用。檔案信息用戶認證方法按其層次不同,可以根據(jù)檔案信息用戶持有的證件、檔案信息用戶密碼、檔案信息用戶特有的生物特征三種因素提供認證。三是授權(quán)。這主要為特許檔案信息用戶提供合適的訪問權(quán)限,并監(jiān)控檔案信息用戶的活動,使其不越權(quán)使用。四是加密。加密是檔案信息安全應(yīng)用中最早開展的有效手段之一,數(shù)據(jù)通過加密,可以保證在存取與傳送的過程中不被非法查看、篡改、竊取等。五是審計、監(jiān)控和數(shù)據(jù)備份。保證數(shù)字檔案信息的安全,重要的是,國家或部門應(yīng)當制定一個備份機制與規(guī)范,對記錄的備份規(guī)范時間要求、格式要求與份數(shù)要求予以規(guī)范,并給予財力的支持。備份規(guī)范也要考慮不同的工作環(huán)境,對于數(shù)字檔案記錄保存部門,應(yīng)規(guī)定定期備份。
3 數(shù)字檔案信息管理問題
在數(shù)字檔案信息資源長期保存中,管理是從整體上進行宏觀規(guī)劃、組織和控制,是數(shù)字檔案信息資源長期保存的基礎(chǔ)與保障。但現(xiàn)今,在管理上缺乏統(tǒng)一規(guī)劃、統(tǒng)籌兼顧,“各自為是”的現(xiàn)象較嚴重。數(shù)字檔案信息管理的主要內(nèi)容包括:保存政策、責(zé)任體系及合作機制、知識產(chǎn)權(quán)等。保存政策是有效實施數(shù)字檔案信息資源長期保存的管理上的保證,內(nèi)容應(yīng)該涉及技術(shù)、組織、人文、法律、權(quán)益管理等方面,還應(yīng)該包括國際國內(nèi)合作、商業(yè)運作、相關(guān)者培訓(xùn)、質(zhì)量管理和審計策略等內(nèi)容。對于保存目標,許多專家認為,基本的選擇標準是首先保存那些容易丟失的、與未來有關(guān)聯(lián)的、有重要價值的數(shù)字檔案信息資源,保存重要的科學(xué)數(shù)據(jù),特別是“原始數(shù)據(jù)”。數(shù)字檔案信息資源長期保存不僅僅是檔案館的職責(zé),內(nèi)容創(chuàng)造者也應(yīng)當承擔(dān)相應(yīng)的責(zé)任。為了有效實施對數(shù)字檔案信息的長期保存,需要數(shù)字檔案信息對象生產(chǎn)者(如機關(guān)、團體、企事業(yè)單位)、提供者(如檔案館)、傳播者(網(wǎng)站)等之間相互合作,需要檔案館之間相互合作,需要國家、國際層面上的合作。另外,數(shù)字檔案信息資源長期保存中還面臨一些法律問題,在制定數(shù)字檔案信息資源長期保存策略時,不僅要考慮版權(quán)法,而且,還要考慮相應(yīng)軟件版權(quán)保護問題。目前,數(shù)字檔案信息資源所有者主要通過許可方式授權(quán)合法檔案信息用戶使用數(shù)字檔案信息資源。如果我們希望長期保存這些數(shù)字檔案信息資源,就在協(xié)議中增加“永久保存”條款。進行數(shù)字檔案信息資源的長期保存,如果未獲得版權(quán)所有者的許可,也沒有法律“合理使用”、“法定許可”等條款的支持,就很容易觸犯知識產(chǎn)權(quán)法。如何有效地解決這些問題,還有待于進一步研究。
4 數(shù)字檔案信息存儲介質(zhì)的選擇問題
數(shù)字媒介的高創(chuàng)新性使信息技術(shù)日新月異,各種大容量的存儲介質(zhì)不斷涌現(xiàn)。這使得數(shù)字檔案信息存儲的熱點將不再是技術(shù)本身,而是如何選擇存儲介質(zhì)高效地對存儲資源進行管理。存儲媒體的好壞是影響數(shù)字檔案信息長期存取的一大因素。因此,要保證數(shù)字檔案信息的長期存取,就必須涉及存儲媒體的選擇問題。我國國家標準《電子文件歸檔與電子檔案管理規(guī)范》對長期歸檔保存的檔案媒體選擇進行了推薦,“本標準推薦采用的媒體,按優(yōu)先順序分別是:只讀式光盤、一次寫入光盤、硬磁盤、可擦式光盤等。禁正使用軟盤作為歸檔電子文件長期保存的媒體”。選擇數(shù)字檔案信息存儲媒體時,需要考慮多種因素,如相關(guān)的國際、國家標準或推薦意見、數(shù)字檔案信息的生命周期(產(chǎn)生、利用、歸檔、刪除或永久性歸檔保存)、存儲媒體的自身因素(媒體壽命、存儲容量、系統(tǒng)獨立性、成本)、部門的具體情況(如保存目的、效益、經(jīng)濟承受能力)。筆者認為,媒體選擇標準不是絕對的,機構(gòu)在選擇存儲介質(zhì)時,既要考慮到符合標準的檔案信息數(shù)據(jù)保存要求,也要權(quán)衡自身的經(jīng)濟承受能力?;谝陨峡紤]因素,提出如下參考選擇方案。
其一,數(shù)字檔案信息直接存儲器介質(zhì)。它是檔案信息數(shù)據(jù)產(chǎn)生后直接進行記錄的介質(zhì)。這類介質(zhì)極多,應(yīng)視檔案信息數(shù)據(jù)重要程度的不同加以選用。對于重要的檔案信息數(shù)據(jù),5.25英寸的MO光盤因記錄數(shù)據(jù)比較穩(wěn)定,更適于作為存儲介質(zhì)。WORM光盤適于檔案信息數(shù)據(jù)量不大的記錄的錄入,WORM磁帶適于檔案信息數(shù)據(jù)量很大的記錄的寫入。對于一般的檔案信息數(shù)據(jù),硬盤、MO盤都可以作為記錄介質(zhì)。
其二,數(shù)字檔案信息備份介質(zhì)。對于海量檔案信息數(shù)據(jù)備份介質(zhì),磁帶存儲技術(shù)是一種安全、可靠、易使用和相對投資小的備份方式,其容量大,可以在相對比較短的時間內(nèi)備份大容量的檔案信息數(shù)據(jù),并可十分簡單地對原有系統(tǒng)進行恢復(fù),因而,磁帶是備份大容量檔案信息數(shù)據(jù)的理想介質(zhì)。對于檔案信息數(shù)據(jù)量較小的文件備份,自動光盤機、自動光盤庫以及硬盤等存儲設(shè)備都可用來備份。活動硬盤作為備份介質(zhì)使用較多,它比光盤具有更多的有利于檔案信息數(shù)據(jù)的讀寫的優(yōu)勢,如讀取檔案信息數(shù)據(jù)更快等,但其易丟失檔案信息數(shù)據(jù)的弱點,使它不能用作長期存儲數(shù)據(jù)的介質(zhì),只適合于備份當前重要檔案的信息數(shù)據(jù),并短期保存。
其三,檔案信息數(shù)據(jù)存儲介質(zhì)。WORM盤、WORM磁帶都可以考慮作為檔案信息數(shù)據(jù)存儲介質(zhì)。
其四,用于檔案信息數(shù)據(jù)交換的臨時存儲介質(zhì)。一般說來,軟盤具有廣泛的通用性和便于攜帶的特點,可作為普通計算機用戶交換檔案信息數(shù)據(jù)的介質(zhì),但其不穩(wěn)定性,不適于作為重要檔案信息數(shù)據(jù)的交換介質(zhì)。相對而言,活動硬盤以及U盤等更合適。
5 數(shù)字檔案信息保存的關(guān)鍵技術(shù)問題
隨著數(shù)字檔案信息保存研究的發(fā)展,多種應(yīng)用技術(shù)方案應(yīng)運而生。確定某種方案是否適用,需要充分考慮它的可行性、可持續(xù)性、實用性和合理性。目前,常用的保存數(shù)字檔案信息的關(guān)鍵技術(shù)方法主要有:
其一是遷移(Migration)。遷移是目前實際運行中使用比較成熟和頻繁的方法。為保證當前存儲的數(shù)字檔案信息總能被當前系統(tǒng)讀取,采用數(shù)據(jù)“遷移”的方法,持續(xù)地將數(shù)字檔案信息從舊的軟硬件環(huán)境轉(zhuǎn)換到新的計算機環(huán)境,是一種隨著技術(shù)變化定期改變信息格式的處理過程。遷移主要有兩種情況,一是把數(shù)字檔案信息從種類繁多的格式下遷移到當前廣泛使用的幾個標準格式中;二是將數(shù)字檔案信息從穩(wěn)定性低的媒體遷移到穩(wěn)定性更高的媒體上,從對軟硬件環(huán)境依賴強的格式遷移到對軟硬件環(huán)境依賴程度低的格式下。但在遷移中,可能會破壞文件的原貌、格式、結(jié)構(gòu)甚至是內(nèi)容,所以,在遷移過程中要格外小心。
其二是仿真(Emulation)。仿真與遷移都是為了解決數(shù)字檔案信息的讀取問題。但與遷移不同,它不是著眼于信息的格式,而是關(guān)注讀取信息的應(yīng)用軟件環(huán)境。所謂“仿真”,就是制作一個仿真器,模仿數(shù)字檔案信息產(chǎn)生時的軟硬件環(huán)境,使數(shù)字檔案信息能夠以原始狀態(tài)重現(xiàn),而不管現(xiàn)在的技術(shù)環(huán)境如何。仿真法不僅能使在過時系統(tǒng)上形成的數(shù)字檔案信息以原始面貌(初始格式、版面與內(nèi)容等)顯示出來,其功能性也隨之得到保護。因而,仿真引起了人們的重視,它有助于保護、辨認那些極大依賴特殊硬件與軟件而又無法在新、舊技術(shù)平臺間進行遷移的數(shù)字檔案信息等(如超文本、多媒體等復(fù)雜文件)。仿真被視為理想的保存策略,但由于其技術(shù)的復(fù)雜性,仿真還處于研究和試驗階段,沒有真正可操作的系統(tǒng)能投入使用。
其三是數(shù)據(jù)恢復(fù)(Resume)。數(shù)據(jù)恢復(fù)是從原始的字節(jié)流中恢復(fù)數(shù)字資源的原貌,并保證數(shù)據(jù)資源的可讀性和可用性。數(shù)據(jù)恢復(fù)包括數(shù)據(jù)災(zāi)難恢復(fù)、數(shù)據(jù)格式恢復(fù)等。數(shù)據(jù)恢復(fù)是具有技術(shù)挑戰(zhàn)的技術(shù)方法,值得注意的是,如果已經(jīng)無法獲取數(shù)字檔案信息資源的原貌,就無法評估數(shù)據(jù)恢復(fù)的成果。因此,在正常的檔案館數(shù)字檔案信息資源保存過程中,不贊成使用這種方法作為長期保存的技術(shù)方法,而是采用更為實際的運作方法。該方法僅在其長期保存方法無法發(fā)揮作用時使用。總之,確定某種方案是否適用,需要充分考慮它的可行性、可持續(xù)性、實用性和合理性。
(作者單位:河南省濮陽市林業(yè)科學(xué)院 來稿日期:2012-02-17)