王 華 王 瑾/浙江省能源集團(tuán)有限公司
馮萍萍/浙江浙能電力股份有限公司蕭山發(fā)電廠
企業(yè)重要業(yè)務(wù)平臺電子文件歸檔與電子檔案集成利用項目,是浙江省檔案局推薦、國家檔案局與國家國國家發(fā)展和改革委員會聯(lián)合發(fā)文批準(zhǔn)的項目,也是浙江省唯一一家列入國家“企業(yè)電子文件歸檔和電子檔案管理”的第一批試點項目。該項目對浙能集團(tuán)和全省檔案工作的意義十分重大,得到到國家檔案局、省政府、省檔案局、浙能集團(tuán)等各方的政策支持與相關(guān)保障。
該項目主要解決浙能集團(tuán)重要業(yè)務(wù)系統(tǒng)中辦公OA系統(tǒng)、合同系統(tǒng)、CAD系統(tǒng)通過接口與SEAS檔案管理系統(tǒng)的歸檔集成問題,著重解決業(yè)務(wù)系統(tǒng)電子文件歸檔與電子檔案管理問題,并通過四性檢測、CA認(rèn)證等解決電子文件與電子檔案安全性保障問題,同步開展基于大數(shù)據(jù)技術(shù)的電子檔案開發(fā)利用與研究,最終形成可推廣的規(guī)范性文件,以期為集團(tuán)型企業(yè)電子文件歸檔和電子檔案管理的研究與推廣起到示范作用。
合同系統(tǒng)、OA系統(tǒng)、CAD系統(tǒng)與檔案系統(tǒng)的歸檔集成通過接口方式實現(xiàn)。在檔案管理系統(tǒng)數(shù)據(jù)歸檔集成中,平臺針對結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的特點,分別采用Web Services接口和sFTP接口,其中元數(shù)據(jù)、指令消息、路程數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)使用Web Services接口進(jìn)行交互,電子文件、影像、圖紙等非結(jié)構(gòu)化數(shù)據(jù)使用更為高效和安全的sFTP協(xié)議進(jìn)行傳輸。通過調(diào)用檔案管理系統(tǒng)提供的Web Services和sFTP接口,數(shù)據(jù)被收集、保存到檔案管理系統(tǒng)中。數(shù)據(jù)交換通過標(biāo)準(zhǔn)的XML文件格式進(jìn)行交互,實現(xiàn)業(yè)務(wù)系統(tǒng)電子文件在線歸檔。下面筆者以合同系統(tǒng)為例,描述業(yè)務(wù)系統(tǒng)與檔案系統(tǒng)的歸檔集成。
用戶在合同管理系統(tǒng)中辦理流程,流程結(jié)束后會形成一些結(jié)果性文件,用戶選取需要歸檔的電子文件及元數(shù)據(jù)(XML格式),通過接口歸檔到檔案管理系統(tǒng)預(yù)歸檔庫,進(jìn)而歸檔到檔案管理系統(tǒng)檔案庫,由檔案管理系統(tǒng)對電子檔案進(jìn)行管理與利用。
接口技術(shù)開發(fā)原則與技術(shù)要求主要包括以下幾點:第一,需支持多語言和基于規(guī)范的平臺,不受限于特定的操作系統(tǒng)或硬件平臺;第二,通信方式(訪問協(xié)議)需使用國際標(biāo)準(zhǔn);第三,編碼采用UTF-8編碼傳輸數(shù)據(jù);第四,能支撐高并發(fā)且運行穩(wěn)定;第五,需網(wǎng)絡(luò)化,無需任何插件等。
Web Service使用標(biāo)準(zhǔn)技術(shù),應(yīng)用程序資源在各網(wǎng)絡(luò)上均可用。這是因為Web Service基于HTTP 、XML和SOAP等標(biāo)準(zhǔn)協(xié)議,所以即使用不同語言編寫并且在不同操作系統(tǒng)上運行,也可以進(jìn)行通信。因此,Web Service適用于網(wǎng)絡(luò)上不同系統(tǒng)之間的通信。
在綜合檔案管理系統(tǒng)中建立具有三層結(jié)構(gòu)的“合同預(yù)歸檔庫”與“合同檔案庫”,分別為合同項目級(相當(dāng)于案卷級)、合同文件級(項目所包含的文件條目)、合同電子文件級,檔案系統(tǒng)默認(rèn)將合同系統(tǒng)的選定字段信息全部接收,以保證合同檔案信息的完整性。合同系統(tǒng)與檔案系統(tǒng)案卷級字段對應(yīng)關(guān)系如下:公司代碼—全宗、合同編號—檔號、合同名稱—案卷題名、公司名稱—立卷單位、公司名稱—主要責(zé)任者、相對方全稱—次要責(zé)任者、履行期限—履行期限、簽訂日期—日期等。
電子檔案的四性即真實性、完整性、可用性和安全性,檔案系統(tǒng)必須具備四性保障的功能。根據(jù)國家檔案局要求,該項目對檔案系統(tǒng)進(jìn)行了進(jìn)一步開發(fā),著重對電子文件歸檔的四性保障進(jìn)行有效檢測。制訂了OA系統(tǒng)、合同系統(tǒng)、CAD系統(tǒng)接口歸檔電子文件元數(shù)據(jù)標(biāo)準(zhǔn),根據(jù)元數(shù)據(jù)項制訂詳細(xì)的四性檢測項目。
一是真實性保障。主要通過IT技術(shù)和管理相結(jié)合的方式,保證電子文件在收集、移交、檢測、整理和電子檔案保管、利用、遷移、移交進(jìn)館等過程中操作的不可抵賴性、數(shù)據(jù)存儲的完整性、用戶身份的真實性,保證電子文件和電子檔案信息不被非法更改,并保證電子文件和電子檔案的內(nèi)容、結(jié)構(gòu)和背景信息經(jīng)過傳輸、遷移等處理后與形成時的原始狀況相一致。檢測方式是檢查電子文件的背景信息以及打開文件并查看其內(nèi)容,技術(shù)上通過“數(shù)字簽名”使系統(tǒng)自動監(jiān)控和發(fā)現(xiàn)文件是否被修改,并結(jié)合人工方式判斷內(nèi)容是否完整、是否真實。
二是完整性保障。主要是確保電子文件的內(nèi)容信息、背景信息、結(jié)構(gòu)信息等沒有缺損。檔案系統(tǒng)檢測可根據(jù)電子文件歸檔和電子檔案管理要求進(jìn)行設(shè)置和調(diào)整,可自行定義檔案名稱、類別、編號、適用范圍等文檔庫的屬性信息,還可自定義哪些字段可以為空、哪些字段不可為空。管理員根據(jù)不同的檔案門類設(shè)置好相應(yīng)的必輸項,系統(tǒng)在接收時會進(jìn)行自動檢測,并提醒管理員元數(shù)據(jù)是否完整。
三是可用性保障。主要是保障電子文件和電子檔案的長期保存。一是采用PDF/A的格式作為電子文件存儲格式,通過格式轉(zhuǎn)換后進(jìn)行數(shù)據(jù)封裝;二是對各種類型電子文件的瀏覽編輯軟件環(huán)境進(jìn)行備份。其檢查主要是檢查電子文件是否具有可理解性和可利用性,包括軟件的完好性、信息的可識別性、存儲系統(tǒng)的可靠性、軟件的兼容性等,可采用檔案管理員人工檢查結(jié)合軟件系統(tǒng)自動檢查的方式進(jìn)行。還要進(jìn)行有效性檢查,即在技術(shù)上判定文件是否可讀并加以提示。
四是安全性保障。主要是對電子文件的安全性采取保障措施。對于安全性的檢查主要體現(xiàn)為檢查文件是否感染了病毒,因此在公司網(wǎng)絡(luò)內(nèi)部署查殺病毒軟件是一個較好的方式。此外,建議由企業(yè)科信部定期給出查殺病毒報告。
當(dāng)前,企業(yè)已不再局限于對信息進(jìn)行保存和檢索,而是重視依托新時代的信息技術(shù)實現(xiàn)對信息的分析和加工重組,由此衍生出大數(shù)據(jù)概念。檔案是信息資源的重要組成部分,檔案工作更需要適應(yīng)新時代社會的要求,從傳統(tǒng)的“重保管、輕利用”的模式向“重保管更重利用”的模式轉(zhuǎn)變。檔案的“重保管更重利用”模式,是在遵循檔案管理規(guī)范和保管要求的同時,對檔案進(jìn)行分門別類的開發(fā)利用,并作為全新的檔案管理模式,為企業(yè)進(jìn)行大數(shù)據(jù)分析提供必要的決策支持。
盡管目前集團(tuán)檔案數(shù)據(jù)還達(dá)不到大數(shù)據(jù)的規(guī)模,但集團(tuán)所擁有的數(shù)據(jù)來源廣泛、格式眾多,并且隨著集團(tuán)下屬單位檔案系統(tǒng)的部署,檔案數(shù)據(jù)量快速增長。在此情形下,集團(tuán)迫切要求對海量海量檔案數(shù)據(jù)進(jìn)行分析,挖掘其中的信息價值。該項目除了應(yīng)用大數(shù)據(jù)技術(shù)對電子檔案信息開發(fā)利用進(jìn)行研究、針對檔案數(shù)據(jù)與不同屬性字段進(jìn)行分組統(tǒng)計外,還對檔案數(shù)據(jù)進(jìn)行大數(shù)據(jù)研究和分析,以O(shè)A系統(tǒng)、合同系統(tǒng)文件審批流程中流轉(zhuǎn)速度的快慢、審批所需時間的多少為研究對象,通過對單個樣本進(jìn)行分析,以及與整體樣本的平均速度進(jìn)行比較,分析出單個樣本的工作效率,進(jìn)而分析集團(tuán)的管理效率,從而提高管理效率。
根據(jù)國家檔案局電子檔案試點項目的要求,對納入檔案數(shù)據(jù)庫的歸檔文件實現(xiàn)數(shù)字簽名與電子簽章數(shù)字認(rèn)證,同時考慮后期將數(shù)字認(rèn)證在全集團(tuán)進(jìn)行推廣。數(shù)字認(rèn)證能夠滿足對數(shù)據(jù)的完整性要求,防止數(shù)據(jù)被篡改或抵賴,確保數(shù)據(jù)私密性并實現(xiàn)身份認(rèn)證,從而保證網(wǎng)上交易數(shù)據(jù)的完整性和可信性。該項目雖然可采用MD5的方法進(jìn)行數(shù)據(jù)真實性校驗,但為保證數(shù)據(jù)的真實性,應(yīng)采用數(shù)字簽名技術(shù)進(jìn)行驗證。
該項目鑒于三個接口系統(tǒng)具有復(fù)雜性,選擇OA辦公系統(tǒng)歸檔到檔案系統(tǒng)的電子文件進(jìn)行跨系統(tǒng)傳輸?shù)臄?shù)字認(rèn)證,主要包括CA認(rèn)證與電子驗簽、CA認(rèn)證對電子簽名與電子簽章的有效性問題、電子驗簽對電子文件各種格式的有效性問題。CA認(rèn)證應(yīng)用跨系統(tǒng)傳輸,檔案系統(tǒng)接到文件后不再做可視化(改變源文件)處理,以避免歸檔后的文件對CA仍有依賴。
[1]李向前.論檔案工作中電子文件的“四性”保 障[EB/OL]. http://www.docin.com/p-699637273.html.