毛海帆/江西省檔案館、中國(guó)人民大學(xué)電子文件管理研究中心
轉(zhuǎn)換和遷移活動(dòng)貫穿于電子檔案管理全過(guò)程,成功與否關(guān)系到電子檔案的長(zhǎng)久保存,也是電子檔案真實(shí)性、可靠性、完整性和可用性的重要保障。近年來(lái),我國(guó)檔案界對(duì)電子檔案遷移與格式轉(zhuǎn)換作了相關(guān)研究,形成了一系列成果;出臺(tái)的相關(guān)重要標(biāo)準(zhǔn)也對(duì)轉(zhuǎn)換和遷移術(shù)語(yǔ)也進(jìn)行了界定,并對(duì)兩大活動(dòng)提出了基本要求。但是,由于標(biāo)準(zhǔn)適用范圍不同等客觀原因?qū)е滦g(shù)語(yǔ)定義存在著差異,電子檔案轉(zhuǎn)換和遷移的實(shí)際操作程序與要求還有待進(jìn)一步明確和細(xì)化。為此,本文以國(guó)內(nèi)和國(guó)際上重要的標(biāo)準(zhǔn)為基礎(chǔ),通過(guò)對(duì)相關(guān)定義、基本要求進(jìn)行解析,結(jié)合電子檔案管理實(shí)際情況加以歸納和總結(jié),以便為電子檔案管理過(guò)程中的轉(zhuǎn)換與遷移實(shí)踐提供可操作的參照。
2001年以來(lái),國(guó)內(nèi)外相繼發(fā)布和實(shí)施了多個(gè)涉及電子檔案轉(zhuǎn)換和遷移的重要標(biāo)準(zhǔn),定義了轉(zhuǎn)換與遷移術(shù)語(yǔ),并對(duì)轉(zhuǎn)換和遷移活動(dòng)的實(shí)施給出了原則性要求,主要包括5項(xiàng)國(guó)家和行業(yè)標(biāo)準(zhǔn)、3項(xiàng)國(guó)際標(biāo)準(zhǔn)。國(guó)內(nèi)5項(xiàng)標(biāo)準(zhǔn)分別是《電子文件歸檔與電子檔案管理規(guī)范》(GB/T18894-2016)、《電子檔案管理基本術(shù)語(yǔ)》(DA/T58-2014)、《信息與文獻(xiàn) 電子辦公環(huán)境中文件管理原則與功能要求》(GB/T 34840)下包含的三個(gè)具體標(biāo)準(zhǔn)(包括概述和原則、數(shù)字文件管理系統(tǒng)指南與功能要求、業(yè)務(wù)系統(tǒng)中文件管理指南與功能要求)。國(guó)際標(biāo)準(zhǔn)化組織的3項(xiàng)標(biāo)準(zhǔn)包括《數(shù)字檔案轉(zhuǎn)換和遷移過(guò)程》(ISO 13008/FDIS:2012(E))、《信息與文獻(xiàn) 文件管理體系:基礎(chǔ)與術(shù)語(yǔ)》(ISO 30300:2011)、《信息與文獻(xiàn) 文件管理 第1部分:概念與原則》(ISO 15489-1:2016)等。
根據(jù)標(biāo)準(zhǔn)適用范圍的不同,定義的轉(zhuǎn)換、遷移術(shù)語(yǔ)涵蓋面有大小之分,轉(zhuǎn)換與遷移活動(dòng)應(yīng)遵循的原則或?qū)嵤┣疤嵊兴煌B/T18894-2016是針對(duì)電子檔案進(jìn)行轉(zhuǎn)換、遷移的術(shù)語(yǔ)定義,明確原則與要求,具有針對(duì)性,且同時(shí)適用于機(jī)關(guān)和綜合檔案館的電子檔案轉(zhuǎn)換與遷移活動(dòng)。13008/FDIS:2012(E)是關(guān)于電子檔案轉(zhuǎn)換和遷移的專(zhuān)門(mén)標(biāo)準(zhǔn),明確說(shuō)明不適用于模擬格式向數(shù)字格式的轉(zhuǎn)換。ISO30300:2011、ISO15489-2016等標(biāo)準(zhǔn)是文件管理宏觀層面的重要標(biāo)準(zhǔn),其關(guān)于轉(zhuǎn)換、遷移術(shù)語(yǔ)的定義,將紙質(zhì)等傳統(tǒng)載體和計(jì)算機(jī)存儲(chǔ)載體、模擬格式和數(shù)字格式納入其中,這決定了術(shù)語(yǔ)含義和實(shí)施原則所規(guī)范的對(duì)象更為寬泛,如果不加區(qū)分完全按其要求開(kāi)展電子檔案轉(zhuǎn)換、遷移活動(dòng),恐有不嚴(yán)謹(jǐn)之處。
當(dāng)管理、存儲(chǔ)電子檔案的數(shù)字檔案館(室)應(yīng)用系統(tǒng)、存儲(chǔ)系統(tǒng)等要停用或更新?lián)Q代時(shí),或者出現(xiàn)要將兩個(gè)或以上應(yīng)用系統(tǒng)的電子檔案、元數(shù)據(jù)整合在一個(gè)系統(tǒng)中的需求時(shí),都要從源系統(tǒng)將電子檔案及其元數(shù)據(jù)讀出再寫(xiě)入目標(biāo)系統(tǒng)中,這便是電子檔案的遷移。上述各項(xiàng)標(biāo)準(zhǔn)在遷移術(shù)語(yǔ)中均將電子檔案定義為遷移對(duì)象,不同的是,根據(jù)電子檔案真實(shí)性、可靠性、完整性和可用性保障要求,GB/T18894-2016、ISO 13008/FDIS:2012(E)兩個(gè)標(biāo)準(zhǔn)將電子檔案元數(shù)據(jù)也列為遷移和轉(zhuǎn)換對(duì)象。
根據(jù)長(zhǎng)期保存要求將電子檔案由當(dāng)前格式(即計(jì)算機(jī)文件格式)轉(zhuǎn)換為長(zhǎng)期保存格式,比如將電子檔案由WPS格式轉(zhuǎn)換為PDF/A格式、XML格式等,是維護(hù)電子檔案可用性的重要措施,前述各項(xiàng)標(biāo)準(zhǔn)的轉(zhuǎn)換術(shù)語(yǔ)中均包括了格式轉(zhuǎn)換。通過(guò)ISO30300:2011等標(biāo)準(zhǔn)的術(shù)語(yǔ)可看出,其定義的轉(zhuǎn)換對(duì)象僅有格式一種。GB/T18894-2016、GB/T 34840.3-2017、DA/T58-2014等三項(xiàng)標(biāo)準(zhǔn)的轉(zhuǎn)換術(shù)語(yǔ)還將載體(存儲(chǔ)載體)定義為轉(zhuǎn)換對(duì)象。
各項(xiàng)標(biāo)準(zhǔn)轉(zhuǎn)換術(shù)語(yǔ)定義了既相同又不同的轉(zhuǎn)換對(duì)象,源自標(biāo)準(zhǔn)各自的適用范圍。在電子檔案保存期間,至少備份活動(dòng)存在載體轉(zhuǎn)換需求,比如將備份設(shè)備由物理帶庫(kù)變更為藍(lán)光光盤(pán)庫(kù)或者反之,將已達(dá)到三級(jí)預(yù)警線的光盤(pán)中的電子檔案及其元數(shù)據(jù)轉(zhuǎn)存到另一種離線備份介質(zhì)之中,而且轉(zhuǎn)換成功完成后,源備份系統(tǒng)或源離線備份介質(zhì)需要予以銷(xiāo)毀。這是GB/T18894-2016等標(biāo)準(zhǔn)將載體定義為轉(zhuǎn)換對(duì)象的緣故。ISO30300:2011等標(biāo)準(zhǔn)適用于紙質(zhì)等傳統(tǒng)載體檔案,在其管理過(guò)程中不可能把檔案原件的紙張轉(zhuǎn)換為其他載體,通過(guò)數(shù)字化生成紙質(zhì)檔案數(shù)字副本后,也不可能將紙質(zhì)檔案原件予以銷(xiāo)毀,故不可能把記錄載體納入其轉(zhuǎn)換術(shù)語(yǔ)之中。
綜上所述,根據(jù)電子檔案管理實(shí)際和標(biāo)準(zhǔn)的定義,電子檔案轉(zhuǎn)換對(duì)象包括存儲(chǔ)載體、格式和元數(shù)據(jù)等三種,電子檔案遷移的對(duì)象則包括電子檔案及其元數(shù)據(jù)等兩種。
GB/T18894-2016、ISO 13008/FDIS:2012(E)等兩項(xiàng)標(biāo)準(zhǔn)均明確實(shí)施電子檔案轉(zhuǎn)換與遷移必須以維護(hù)電子檔案的真實(shí)性、可靠性、完整性和可用性為前提或目的,這即是電子檔案轉(zhuǎn)換與遷移的原則。實(shí)施電子檔案轉(zhuǎn)換或遷移的動(dòng)因是某類(lèi)軟硬件系統(tǒng)生命周期完結(jié),或做技術(shù)更新?lián)Q代,或者當(dāng)前格式不符合長(zhǎng)期保存要求,即將失去技術(shù)維護(hù)、面臨淘汰的危險(xiǎn)等,轉(zhuǎn)換或遷移活動(dòng)結(jié)束后,依據(jù)授權(quán)要將存儲(chǔ)于源系統(tǒng)、源存儲(chǔ)介質(zhì)或源格式中的電子檔案及元數(shù)據(jù)徹底清除。此時(shí),已經(jīng)存儲(chǔ)在目標(biāo)系統(tǒng)或計(jì)算機(jī)文件格式中的電子檔案如果不具備真實(shí)性、可靠性、完整性和可用性,可以直接判定轉(zhuǎn)換或遷移活動(dòng)不成功。
DA/T58-2014、ISO15489-1:2016、ISO30300:2011等標(biāo)準(zhǔn)在定義轉(zhuǎn)換、遷移術(shù)語(yǔ)時(shí),明確的前提是檔案原有信息不變或不改變電子檔案的格式,這一要求只能滿足電子檔案管理的部分需求。如果以它為指導(dǎo),則轉(zhuǎn)換和遷移過(guò)程是否可靠、電子檔案存儲(chǔ)使用的新格式是否符合長(zhǎng)期保存要求、電子檔案及其元數(shù)據(jù)是否一一對(duì)應(yīng)和是否記錄了轉(zhuǎn)換過(guò)程等,都存在不確定性。此外,筆者對(duì)遷移活動(dòng)不得改變文件格式的前提存疑。比如數(shù)據(jù)庫(kù)類(lèi)電子文件,不同廠商或品牌的數(shù)據(jù)庫(kù)文件格式從后綴名到內(nèi)部存儲(chǔ)結(jié)構(gòu)等都存在不同程度的差異。ISO30300:2011在遷移定義中給出的將數(shù)據(jù)庫(kù)文件從Oracle數(shù)據(jù)庫(kù)管理系統(tǒng)轉(zhuǎn)移到SQL Server數(shù)據(jù)庫(kù)管理系統(tǒng)的示例,其結(jié)果已經(jīng)改變了文件格式,前者的文件格式后綴名為.DBF或.ORA,后者的文件格式后綴名為.MDF。如果將數(shù)據(jù)庫(kù)文件從關(guān)系型數(shù)據(jù)庫(kù)遷移到NoSql數(shù)據(jù)庫(kù)(即非關(guān)系型數(shù)據(jù)庫(kù))中,二者存儲(chǔ)電子檔案的編碼標(biāo)準(zhǔn)、格式名稱(chēng)等具有更大的異構(gòu)性。所以,對(duì)于采用數(shù)據(jù)庫(kù)文件格式存儲(chǔ)的電子檔案,僅要求轉(zhuǎn)換、遷移后保持其原有內(nèi)容信息或格式不變是不能滿足電子檔案管理需要的,必須以保障電子檔案的真實(shí)性、可靠性、完整性和可用性作為轉(zhuǎn)換和遷移活動(dòng)的原則。
GB/T18894-2016第10章第2節(jié)、第9章第5節(jié)主要用于規(guī)范電子檔案轉(zhuǎn)換和遷移活動(dòng),再次明確了在轉(zhuǎn)換或遷移全程維護(hù)電子檔案真實(shí)性、可靠性、完整性和可用性的原則,列舉了實(shí)施轉(zhuǎn)換和遷移的主要?jiǎng)右?,?duì)轉(zhuǎn)換和遷移程序(八個(gè)步驟)、源電子檔案及其元數(shù)據(jù)的處置、臺(tái)賬登記和管理過(guò)程元數(shù)據(jù)采集等提出了基本要求,并向標(biāo)準(zhǔn)使用者推薦可參照的國(guó)際標(biāo)準(zhǔn)——ISO/FDIS13008:2012(E)。鑒于標(biāo)準(zhǔn)處于上位和篇幅控制等原因,GB/T18894-2016沒(méi)有對(duì)程序的每一個(gè)步驟給出進(jìn)一步要求,ISO/FDIS13008:2012(E)提出的各項(xiàng)管理要求是可以參考和借鑒的,該標(biāo)準(zhǔn)重點(diǎn)強(qiáng)調(diào)要根據(jù)組織機(jī)構(gòu)及其業(yè)務(wù)框架確定轉(zhuǎn)換和遷移的實(shí)施要求,要編制轉(zhuǎn)換或遷移規(guī)劃(業(yè)務(wù)需求、行政管理需求和技術(shù)需求等),要建立轉(zhuǎn)換或遷移程序,控制風(fēng)險(xiǎn),記錄過(guò)程元數(shù)據(jù),在轉(zhuǎn)換或遷移前、后應(yīng)分別進(jìn)行測(cè)試、驗(yàn)證,并進(jìn)行全程跟蹤等。
結(jié)合GB/T18894-2016等標(biāo)準(zhǔn)明確的要求和具體實(shí)踐,在轉(zhuǎn)換和遷移活動(dòng)中保障電子檔案真實(shí)性、可靠性、完整性和可用性,要融合管理和技術(shù)等方面的要求予以實(shí)施,主要包括四方面措施:
第一,建立并落實(shí)管理制度。要明確職責(zé)與分工、實(shí)施程序、安全保障、檔案管理、保障措施等,涉及技術(shù)、業(yè)務(wù)、財(cái)務(wù)、采購(gòu)、紀(jì)檢、保密、后勤等職能部門(mén)。
第二,明確并有效執(zhí)行規(guī)定的程序。GB/T18894-2016所述程序包括八個(gè)步驟,即確認(rèn)轉(zhuǎn)換或遷移需求、評(píng)估轉(zhuǎn)換或遷移風(fēng)險(xiǎn)、制定轉(zhuǎn)換或遷移方案、審批轉(zhuǎn)換或遷移方案、轉(zhuǎn)換或遷移測(cè)試、實(shí)施轉(zhuǎn)換或遷移、評(píng)估轉(zhuǎn)換或遷移結(jié)果、報(bào)告轉(zhuǎn)換或遷移結(jié)果。
第三,全程監(jiān)控與檢查。轉(zhuǎn)換或遷移項(xiàng)目實(shí)施主要責(zé)任部門(mén)要依據(jù)制度、實(shí)施方案等,對(duì)轉(zhuǎn)換或遷移測(cè)試、實(shí)施轉(zhuǎn)換或遷移、評(píng)估轉(zhuǎn)換或遷移結(jié)果等步驟進(jìn)行全過(guò)程監(jiān)控、督查,及時(shí)處理出現(xiàn)的問(wèn)題,保證項(xiàng)目順利實(shí)施。
第四,整理并歸檔保存過(guò)程記錄臺(tái)賬。規(guī)范轉(zhuǎn)換或遷移臺(tái)賬管理,目的是為經(jīng)過(guò)轉(zhuǎn)換或遷移的電子檔案的真實(shí)性、可靠性、完整性和可用性提供證據(jù),使過(guò)程可回溯、可查核。每個(gè)步驟的主要情況、結(jié)果、責(zé)任信息、時(shí)間等都應(yīng)記錄,轉(zhuǎn)換或遷移活動(dòng)完成后要整理、歸檔。GB/T18894-2016附錄A提供了可參照使用的電子檔案離線存儲(chǔ)介質(zhì)管理、格式轉(zhuǎn)換與遷移登記表樣式。對(duì)于格式轉(zhuǎn)換,應(yīng)通過(guò)管理過(guò)程元數(shù)據(jù),以全自動(dòng)在實(shí)施轉(zhuǎn)換的應(yīng)用系統(tǒng)中予以記錄。
根據(jù)項(xiàng)目的實(shí)際情況,完成轉(zhuǎn)換、遷移程序有時(shí)耗時(shí)較長(zhǎng),各步驟的執(zhí)行不一定緊密相連,應(yīng)根據(jù)實(shí)際予以掌控。依據(jù)存儲(chǔ)載體轉(zhuǎn)換項(xiàng)目的規(guī)模和復(fù)雜程度,對(duì)八個(gè)步驟可以作適當(dāng)取舍,一旦確定必須認(rèn)真執(zhí)行。比如,需轉(zhuǎn)換的電子檔案及其元數(shù)據(jù)離線存儲(chǔ)介質(zhì)數(shù)量不多時(shí),可以根據(jù)實(shí)際情況考慮免去制定轉(zhuǎn)換或遷移方案、審批轉(zhuǎn)換或遷移方案等兩個(gè)步驟,由主要責(zé)任部門(mén),即信息化部門(mén)直接確定計(jì)劃并執(zhí)行即可。
第一步,確認(rèn)轉(zhuǎn)換或遷移需求。轉(zhuǎn)換和遷移動(dòng)因出現(xiàn)后,對(duì)源系統(tǒng)及其技術(shù)架構(gòu)、設(shè)計(jì)文檔、格式、電子檔案及元數(shù)據(jù)數(shù)量等,從標(biāo)準(zhǔn)化程度、技術(shù)支持及開(kāi)放度、轉(zhuǎn)換或遷移對(duì)象的范圍與規(guī)模等作進(jìn)一步調(diào)研、檢測(cè)和論證。確需實(shí)施,則提出擬用技術(shù)、軟硬件設(shè)備和測(cè)試環(huán)境、安全保障、采購(gòu)、經(jīng)費(fèi)等需求。對(duì)于重要的格式轉(zhuǎn)換、在線存儲(chǔ)系統(tǒng)轉(zhuǎn)型、近線備份系統(tǒng)轉(zhuǎn)型、應(yīng)用軟件及基礎(chǔ)軟件更新升級(jí)等項(xiàng)目,程序的啟動(dòng)可以提前到設(shè)計(jì)、論證階段,同步跟進(jìn)調(diào)研轉(zhuǎn)換或遷移的經(jīng)費(fèi)、技術(shù)、基礎(chǔ)設(shè)施等的需求。
第二步,評(píng)估轉(zhuǎn)換或遷移風(fēng)險(xiǎn)。主要從三個(gè)方面進(jìn)行安全風(fēng)險(xiǎn)評(píng)估,包括:擬采用技術(shù)的標(biāo)準(zhǔn)化程度及可靠性、兼容性和安全性等;轉(zhuǎn)換或遷移環(huán)境的安全與可用,包括網(wǎng)絡(luò)、場(chǎng)地、供電、計(jì)算機(jī)病毒防范、人員管理等;轉(zhuǎn)換或遷移保障條件,包括職責(zé)落實(shí)、專(zhuān)業(yè)技術(shù)人員配備、經(jīng)費(fèi)等。
第三步,制定轉(zhuǎn)換或遷移方案。結(jié)合前兩個(gè)步驟工作成果,編制轉(zhuǎn)換或遷移方案,明確動(dòng)因、源系統(tǒng)及轉(zhuǎn)換或遷移對(duì)象情況、目標(biāo)、技術(shù)路線與架構(gòu)、安全風(fēng)險(xiǎn)管控、采購(gòu)與經(jīng)費(fèi)需求等。對(duì)于重大的轉(zhuǎn)換或遷移項(xiàng)目,應(yīng)組織相關(guān)專(zhuān)家對(duì)轉(zhuǎn)換或遷移方案進(jìn)行論證。
第四步,審批轉(zhuǎn)換或遷移方案。將轉(zhuǎn)換或遷移方案提交單位領(lǐng)導(dǎo)審批,通過(guò)審批后即可開(kāi)展采購(gòu)、系統(tǒng)建設(shè)、人員培訓(xùn)等一系列工作中。
第五步,轉(zhuǎn)換或遷移測(cè)試。在正式開(kāi)始轉(zhuǎn)換或遷移前,在目標(biāo)系統(tǒng)中或按照預(yù)定的方法,采用不同數(shù)量級(jí)的電子檔案及元數(shù)據(jù)進(jìn)行操作、驗(yàn)證,直到確認(rèn)可行性。
第六步,實(shí)施轉(zhuǎn)換或遷移。通過(guò)測(cè)試后,正式實(shí)施電子檔案、元數(shù)據(jù)的轉(zhuǎn)換或遷移,并緊密監(jiān)控。
第七步,評(píng)估轉(zhuǎn)換或遷移結(jié)果。轉(zhuǎn)換或遷移過(guò)程完成后,可對(duì)結(jié)果進(jìn)行評(píng)估,形成評(píng)估報(bào)告,如有必要可進(jìn)行第三方檢測(cè)與評(píng)估。應(yīng)依據(jù)方案、采購(gòu)需求等,對(duì)目標(biāo)系統(tǒng)中的電子檔案及元數(shù)據(jù)進(jìn)行評(píng)估,包括:電子檔案及元數(shù)據(jù)數(shù)量,電子檔案及元數(shù)據(jù)內(nèi)容信息真實(shí)性與完整性,計(jì)算機(jī)文件格式,正確呈現(xiàn)與檢索、利用,電子檔案內(nèi)在的歷史聯(lián)系,電子檔案與元數(shù)據(jù)的一一對(duì)應(yīng),管理過(guò)程元數(shù)據(jù)采集,計(jì)算機(jī)病毒,信息泄漏等。
第八步,報(bào)告轉(zhuǎn)換或遷移結(jié)果。向單位和相關(guān)方面報(bào)告轉(zhuǎn)換或遷移項(xiàng)目實(shí)施的評(píng)估結(jié)果。完成了電子檔案及元數(shù)據(jù)轉(zhuǎn)換或遷移程序后,應(yīng)經(jīng)過(guò)一段時(shí)間(半年、一年或更長(zhǎng)時(shí)間)實(shí)際應(yīng)用的驗(yàn)證,未發(fā)現(xiàn)存儲(chǔ)在目標(biāo)系統(tǒng)、載體或格式中的電子檔案的真實(shí)性、可靠性、完整性和可用性存在問(wèn)題,方能提出對(duì)源系統(tǒng)、載體或格式中的電子檔案等的銷(xiāo)毀、徹底刪除等處置意見(jiàn),經(jīng)單位審批并獲得授權(quán)后方能執(zhí)行。
當(dāng)前,檔案信息化建設(shè)進(jìn)入了新的發(fā)展階段,應(yīng)用系統(tǒng)規(guī)模、新技術(shù)應(yīng)用、檔案數(shù)字資源數(shù)量等已經(jīng)發(fā)生有了較大變化和提升,隨著信息技術(shù)升級(jí)換代、設(shè)備生命周期完結(jié)等情況的出現(xiàn),電子檔案及元數(shù)據(jù)轉(zhuǎn)換、遷移需求會(huì)周期性出現(xiàn),所需面對(duì)的電子檔案及其元數(shù)據(jù)存儲(chǔ)、備份的技術(shù)環(huán)境也越來(lái)越復(fù)雜。檔案部門(mén)需要從小項(xiàng)目開(kāi)始實(shí)踐,按照規(guī)范要求進(jìn)行實(shí)際操練,鍛煉隊(duì)伍、積累經(jīng)驗(yàn),建立電子檔案及元數(shù)據(jù)轉(zhuǎn)換、遷移的工作機(jī)制,為電子檔案的真實(shí)性、完整性和可用性提供保障。