宋亮亮
廣州市國(guó)家檔案館 廣東 廣州 510046
新施行的《檔案法》第三十七條規(guī)定“電子檔案與傳統(tǒng)載體檔案具有同等效力,可以以電子形式作為憑證使用”。這從法律層面明確了電子檔案的法律效力,可以極大地促進(jìn)檔案工作逐步過渡到“單套制”“單軌制”管理模式。同時(shí)它又規(guī)定了電子檔案具有法律效力的前提是“來源可靠、程序規(guī)范、要素合規(guī)”。要做到“來源可靠、程序規(guī)范、要素合規(guī)”,保證電子檔案的真實(shí)性、完整性、可用性和安全性(簡(jiǎn)稱“四性”)是關(guān)鍵。為保證電子檔案“四性”,依托信息管理環(huán)境,利用技術(shù)手段對(duì)其進(jìn)行檢測(cè),是保證電子檔案“四性”的重要措施之一。
根據(jù)《文書類電子檔案檢測(cè)一般要求》[1]中的定義,電子檔案的“四性”包括真實(shí)性、完整性、可用性和安全性?!八男浴钡臋z測(cè)要求,主要是針對(duì)電子檔案易變、易逝、信息與載體可分離等特性而設(shè)計(jì)的。
真實(shí)性指電子檔案的內(nèi)容、邏輯結(jié)構(gòu)和背景與形成時(shí)的原始狀況相一致的性質(zhì)。它是檔案的原始特征之一,也是檔案的價(jià)值所在,反映了社會(huì)各項(xiàng)活動(dòng)的歷史原貌,是構(gòu)成電子檔案價(jià)值屬性的前提,也是確保電子檔案具有法律效力的重要基礎(chǔ)。電子檔案的真實(shí)性檢測(cè)主要是依托信息環(huán)境,通過管理環(huán)節(jié)和技術(shù)手段來檢驗(yàn)其是否符合真實(shí)性,如來源和內(nèi)容真實(shí)性、元數(shù)據(jù)準(zhǔn)確性等。
完整性指電子檔案的內(nèi)容、結(jié)構(gòu)和背景信息齊全且沒有破壞、變異或丟失的性質(zhì)。它是評(píng)估檔案管理工作價(jià)值的重要依據(jù)之一,是確保電子檔案法律效力的重要保障。電子檔案的完整性檢測(cè)主要是通過管理環(huán)節(jié)和技術(shù)手段檢查電子檔案內(nèi)容及其元數(shù)據(jù)是否完整,如元數(shù)據(jù)項(xiàng)是否完整、必填著錄項(xiàng)是否完整,歸檔為范圍是否完整等。
可用性指電子檔案可以被檢索、呈現(xiàn)和理解的性質(zhì)。它是電子檔案存在和具有保存價(jià)值的基礎(chǔ),如果電子檔案不能正常使用,再有價(jià)值的檔案也會(huì)失去存在的實(shí)際意義??捎眯詸z測(cè)是指通過管理和技術(shù)措施驗(yàn)證電子檔案、載體、應(yīng)用軟件是否符合可用性要求的過程,如內(nèi)容數(shù)據(jù)可讀性、軟硬件環(huán)境合規(guī)性等。
安全性指電子檔案的管理過程可控、數(shù)據(jù)存儲(chǔ)可靠,未被破壞、未被非法訪問的性質(zhì)。它是真實(shí)性、完整性、可用性的基礎(chǔ),是電子檔案具有安全保管和長(zhǎng)期可用的環(huán)境要求。安全性檢測(cè)主要是檢測(cè)電子檔案是否存在安全性缺陷,如病毒感染、安全漏洞、保管環(huán)境等方面。
電子文件歸檔、電子檔案移交接收和電子檔案長(zhǎng)期保存是電子檔案管理的三個(gè)關(guān)鍵環(huán)節(jié)[2]。歸檔環(huán)節(jié)是業(yè)務(wù)部門將具有保存價(jià)值且辦理完畢的電子文件及相關(guān)信息收集、整理并向檔案部門移交,該環(huán)節(jié)中需通過“四性”檢測(cè)手段嚴(yán)格把關(guān)歸檔電子文件質(zhì)量。移交接收環(huán)節(jié)是立檔單位將電子檔案向檔案館移交、檔案館進(jìn)行接收的過程,該環(huán)節(jié)中立檔單位和檔案館都需要通過“四性”檢測(cè)手段保證電子檔案移交接收過程可信、質(zhì)量可靠。在長(zhǎng)期保存環(huán)節(jié),電子檔案進(jìn)入長(zhǎng)期保存庫前需進(jìn)行“四性”檢測(cè),嚴(yán)防不合要求的電子檔案進(jìn)入長(zhǎng)期保存庫。
(1)真實(shí)性。電子檔案的真實(shí)性檢測(cè)主要是依托信息環(huán)境,通過管理環(huán)節(jié)和技術(shù)手段來檢驗(yàn)其是否符合真實(shí)性,如來源和內(nèi)容真實(shí)性、元數(shù)據(jù)準(zhǔn)確性等。
1)來源真實(shí)性檢測(cè)。主要是針對(duì)固化信息有效性進(jìn)行檢測(cè),如對(duì)電子文件、電子檔案中包含的數(shù)字摘要、電子簽名、電子印章、時(shí)間戳等技術(shù)措施的固化信息進(jìn)行有效性驗(yàn)證。
2)元數(shù)據(jù)準(zhǔn)確性檢測(cè)。檢測(cè)目的是保證電子文件和電子檔案元數(shù)據(jù)長(zhǎng)度、類型、格式、值域等符合規(guī)范要求。檢測(cè)方法包括:對(duì)信息包元數(shù)據(jù)中著錄字段的長(zhǎng)度和數(shù)據(jù)庫中該字段設(shè)置長(zhǎng)度進(jìn)行檢測(cè),如題名限制為500字符,超過500字符則為檢測(cè)不通過;對(duì)信息包和數(shù)據(jù)庫中的元數(shù)據(jù)項(xiàng)進(jìn)行類型和字段格式檢測(cè),如系統(tǒng)定義日期為date格式,若著錄字段內(nèi)信息不符合date格式(如其他string格式,number格式等),則為檢測(cè)不通過;對(duì)信息包和數(shù)據(jù)庫中的元數(shù)據(jù)項(xiàng)進(jìn)行值域范圍檢測(cè),如保管期限值域?yàn)椤癥、D30、D10”,在此值域外則為檢測(cè)不通過;又如密級(jí)值域?yàn)椤盁o秘、秘密、機(jī)密、絕密”,在此值域外則為檢測(cè)不通過;對(duì)信息包和數(shù)據(jù)庫中的檔號(hào)規(guī)范性進(jìn)行檢測(cè),如按件管理的檔號(hào)結(jié)構(gòu)應(yīng)符合“全宗號(hào)-檔案門類代碼·年度-保管期限·機(jī)構(gòu)(問題)代碼·件號(hào)”,例如“Z109-WS·2020-Y-BGS-0001”;又如檢測(cè)檔號(hào)的連續(xù)性,若該目錄件號(hào)為0005,那么檢測(cè)前面4條是否存在,是否有缺號(hào)等。
3)內(nèi)容真實(shí)性檢測(cè)。檢測(cè)目的是保證電子文件、電子檔案內(nèi)容數(shù)據(jù)電子屬性的一致性。檢測(cè)方法是系統(tǒng)自動(dòng)捕獲電子檔案內(nèi)容數(shù)據(jù)的電子屬性(如文件大小、文件名、文件類型、創(chuàng)建時(shí)間等),與元數(shù)據(jù)中記錄的電子屬性進(jìn)行對(duì)比,結(jié)果一致為檢測(cè)通過,不一致為不通過。
4)元數(shù)據(jù)與內(nèi)容關(guān)聯(lián)一致性檢測(cè)。檢測(cè)目的是保證電子文件、電子檔案內(nèi)容數(shù)據(jù)和目錄數(shù)據(jù)的關(guān)聯(lián)。檢測(cè)方法是通過計(jì)算機(jī)系統(tǒng),根據(jù)元數(shù)據(jù)中記錄的文件存儲(chǔ)路徑,檢測(cè)文件內(nèi)容數(shù)據(jù)是否存在。存在即判斷為檢測(cè)通過,否則不通過。如數(shù)據(jù)表內(nèi)有值,追蹤到電子文件表沒有值,或者兩表都有值,但是追蹤不到物理文件,則均為檢測(cè)不通過。
5)信息包真實(shí)性檢測(cè)。檢測(cè)目的是保證信息包信息組織結(jié)構(gòu)和內(nèi)容符合要求。檢測(cè)方法是首先判斷說明文件和目錄文件是否符合規(guī)范,如:信息包要包含說明文件.txt、文件目錄.xml、其他文件夾(含移交包內(nèi)容、日期、大小等信息),以及電子文件、電子檔案文件夾(包含各個(gè)層級(jí)的文件夾與電子文件)等;其次判斷文件夾名稱和信息包目錄結(jié)構(gòu)是否符合規(guī)范,如:說明文件存放與本載體有關(guān)的信息應(yīng)命名為“說明文件.TXT”,文件級(jí)電子檔案目錄文件應(yīng)命名為“文件目錄.XML”,案卷級(jí)電子檔案目錄文件應(yīng)命名為“案卷目錄.XML”,存放電子檔案內(nèi)容數(shù)據(jù)及其元數(shù)據(jù)的,根據(jù)電子檔案歸檔方式,應(yīng)按照“年度—類別—文件”或“年度—類別—案卷”的層次設(shè)置,其他文件夾內(nèi)存放各種其他附屬性質(zhì)的文件應(yīng)采用TXT、XML或者其他符合長(zhǎng)期保存要求的格式等。
(2)完整性。完整性檢測(cè)主要是通過管理環(huán)節(jié)和技術(shù)手段檢查電子檔案內(nèi)容及其元數(shù)據(jù)是否完整。如元數(shù)據(jù)項(xiàng)是否完整、必填著錄項(xiàng)是否完整,歸檔為范圍是否完整等。
1)數(shù)據(jù)總量檢測(cè)。檢測(cè)目的是保證電子文件、電子檔案數(shù)據(jù)在不同環(huán)節(jié)流程中總量相符。檢測(cè)方法由計(jì)算機(jī)系統(tǒng)自動(dòng)統(tǒng)計(jì)總件數(shù)和總字節(jié)數(shù),并與相應(yīng)的登記表或元數(shù)據(jù)記錄進(jìn)行數(shù)量比對(duì),判斷數(shù)據(jù)總量是否相符。
2)元數(shù)據(jù)完整性檢測(cè)。檢測(cè)目的是保證元數(shù)據(jù)項(xiàng)和過程信息完整、連續(xù)。檢測(cè)方法是對(duì)提前定義的元數(shù)據(jù)項(xiàng)進(jìn)行檢測(cè),判斷是否存在缺項(xiàng)情況,必填項(xiàng)是否為空,具有連續(xù)編號(hào)性質(zhì)的元數(shù)據(jù)項(xiàng)是否按順序編號(hào),是否從指定的起始號(hào)開始編號(hào),元數(shù)據(jù)中包含的處理過程信息是否完整等。如根據(jù)系統(tǒng)模板內(nèi)設(shè)置的必錄項(xiàng)與數(shù)據(jù)包中的目錄進(jìn)行檢測(cè),判斷元數(shù)據(jù)必填項(xiàng)是否為空,如常見的題名、文件日期、目錄號(hào)、案卷號(hào)、件號(hào)等,檢測(cè)不通過則顯示是哪些數(shù)據(jù)未錄入,如文件日期未填或其他必錄項(xiàng)未填等。逐一檢測(cè)數(shù)據(jù)包中的目錄元數(shù)據(jù)是否有處理過程信息,如修改人、修改時(shí)間、修改記錄等。對(duì)目錄中的頁號(hào)進(jìn)行檢測(cè),規(guī)定頁號(hào)必須從1開始,然后根據(jù)每份目錄中的頁數(shù),來檢測(cè)后續(xù)目錄的頁號(hào)是否準(zhǔn)確、連續(xù),連續(xù)則顯示為檢測(cè)通過,否則不通過。
3)內(nèi)容完整性檢測(cè)。檢測(cè)目的是保證電子文件、電子檔案內(nèi)容數(shù)據(jù)完整不缺失。檢測(cè)方法是通過人工打開電子文件、電子檔案內(nèi)容和附件數(shù)據(jù),判斷是否存在缺失、遺漏等情況。
4)信息包完整性檢測(cè)。檢測(cè)目的是保證信息包中內(nèi)容數(shù)據(jù)齊全、完整。檢測(cè)方法是通過計(jì)算機(jī)系統(tǒng)自動(dòng)比對(duì)元數(shù)據(jù)中記錄的文件數(shù)量與信息包中實(shí)際包含的文件數(shù)量是否相符。
(3)可用性。可用性檢測(cè)是指通過管理和技術(shù)措施驗(yàn)證電子檔案、載體、應(yīng)用軟件是否符合可用性要求的過程。如內(nèi)容數(shù)據(jù)可讀性、軟硬件環(huán)境合規(guī)性等。
1)元數(shù)據(jù)可用性檢測(cè)。檢測(cè)目的是保證元數(shù)據(jù)可以正常讀取和訪問。檢測(cè)方法是對(duì)信息包中存放元數(shù)據(jù)的XML文件是否可以正常解析和讀取,如果能則檢測(cè)通過,否則不通過;檢測(cè)是否可以正常連接數(shù)據(jù)庫,是否可以正常操作目錄數(shù)據(jù)表,如果能則檢測(cè)通過,否則不通過。
2)內(nèi)容可用性檢測(cè)。檢測(cè)目的是保證內(nèi)容格式符合相關(guān)要求,并保證內(nèi)容數(shù)據(jù)可讀。文書、科技、專業(yè)類電子檔案,其正本、定稿、公文處理單必須是版式文件格式,如OFD、PDF、PDF/A,其他附屬文件則要求為通用格式,圖像類是JPG、TIF,圖形類是SVG、STEP,音頻類是WAV、MP3,視頻類是AVI、MP4、MPG,社交媒體類是HTML、MHT。內(nèi)容數(shù)據(jù)可讀則需要人工打開文件進(jìn)行檢測(cè)。
3)軟硬件環(huán)境檢測(cè)。主要是對(duì)電子屬性信息中記錄的軟硬件環(huán)境信息進(jìn)行檢測(cè),判斷電子文件、電子檔案環(huán)境信息是否符合相關(guān)要求。
4)信息包可用性檢測(cè)。檢測(cè)目的是確保信息包中的電子檔案可讀可用。檢測(cè)方法是要求信息包中不能包含非公開壓縮算法,不能加密等,以減少信息包對(duì)技術(shù)的依賴性。
(4)安全性。安全性檢測(cè)主要是檢測(cè)電子檔案是否存在安全性缺陷,如病毒感染、安全漏洞、保管環(huán)境等方面。
1)信息包病毒檢測(cè)。檢測(cè)目的是保證數(shù)據(jù)沒有感染病毒。檢測(cè)方法是針對(duì)系統(tǒng)環(huán)境,檢測(cè)操作系統(tǒng)是否安裝了國(guó)內(nèi)殺毒軟件,如奇虎360、瑞星殺毒等。如檢測(cè)到安裝了殺毒軟件,則調(diào)用殺毒軟件接口,檢測(cè)電子檔案是否感染木馬、病毒等。
2)載體安全性檢測(cè)。檢測(cè)目的是判斷載體是否符合安全性要求。檢測(cè)方法包括對(duì)載體能否正常讀取,判斷是否含有非歸檔文件,人工判斷載體外觀是否正常等。在歸檔環(huán)節(jié)還需對(duì)歸檔光盤進(jìn)行合格性檢測(cè),主要是依據(jù)奇偶校驗(yàn)內(nèi)碼錯(cuò)誤(PIE)、奇偶校驗(yàn)外碼錯(cuò)誤(POF)、塊錯(cuò)誤率(BLER)、不可校正錯(cuò)誤(E32)等指標(biāo)進(jìn)行檢測(cè)。其中CD-R光盤的BLER<50、E32=0,DVD±R光盤的PIE<80、POF=0。
3)過程檢測(cè)。檢測(cè)目的是判斷歸檔、移交和接收過程是否安全可控,檢測(cè)方法是按照國(guó)家安全保密要求從技術(shù)和管理等方面采取措施,確保信息包在歸檔、移交和接收過程中安全可控。
4)系統(tǒng)和保管環(huán)境檢測(cè)。檢測(cè)目的是避免軟件系統(tǒng)存在安全漏洞,載體保管環(huán)境符合長(zhǎng)期保存要求。檢測(cè)方法是采用專業(yè)的漏洞掃描工具檢測(cè)電子檔案長(zhǎng)期保存的計(jì)算機(jī)系統(tǒng)是否存在安全漏洞,人工判斷電子檔案長(zhǎng)期保存的各類載體是否符合要求,如裝盒平放或豎立存放,遠(yuǎn)離強(qiáng)磁場(chǎng)、強(qiáng)熱源,保管環(huán)境溫度光盤為17℃~20℃,磁帶和磁盤為15℃~27℃,相對(duì)濕度光盤20%~50%,磁帶和光盤為40%~60%等。
本文從檢測(cè)意義、檢測(cè)環(huán)節(jié)、檢測(cè)內(nèi)容和技術(shù)指標(biāo)等方面對(duì)電子檔案“四性”檢測(cè)進(jìn)行了探索與研究,為電子檔案信息管理系統(tǒng)建設(shè)中“四性”檢測(cè)功能的實(shí)現(xiàn)提供了參考和借鑒。但目前國(guó)內(nèi)檔案界對(duì)于電子檔案“四性”檢測(cè)的研究還處于起步階段,除文書類以外的其他類別電子檔案檢測(cè)缺少相應(yīng)的標(biāo)準(zhǔn)和要求。在今后的學(xué)術(shù)研究和實(shí)踐應(yīng)用中,應(yīng)更加重視各類別電子檔案“四性”檢測(cè)的標(biāo)準(zhǔn)規(guī)范和技術(shù)手段,為電子檔案的憑證價(jià)值、查考價(jià)值和保存價(jià)值提供技術(shù)保障。