◆何曉軍
(浙江省平湖市檔案局 浙江 314200)
大數(shù)據(jù)環(huán)境下數(shù)字檔案安全監(jiān)管平臺建設(shè)與研究
◆何曉軍
(浙江省平湖市檔案局 浙江 314200)
在數(shù)字檔案大數(shù)據(jù)環(huán)境下,通過數(shù)字檔案安全監(jiān)管平臺的建設(shè),可以充分、實時的了解備份中心數(shù)據(jù)現(xiàn)況,并能發(fā)現(xiàn)問題及時解決,從而避免各種安全隱患的發(fā)生。
數(shù)字檔案;監(jiān)管信息安全
近幾年,隨著檔案信息化建設(shè)的飛速發(fā)展和數(shù)字檔案館的不斷建設(shè),數(shù)字檔案成為館藏資源的重要增長點,其數(shù)據(jù)量呈幾何級數(shù)增長,檔案部門備份中心數(shù)據(jù)量將越來越大,價值也越來越高,數(shù)字檔案大數(shù)據(jù)時代的到來,也帶來了許多安全風(fēng)險。2014年5月中央兩辦《關(guān)于加強和改進新形勢下檔案工作的意見》提出要保障檔案信息安全要采取措施,確保電子文件、電子檔案長期保存和利用。2017年6月國家檔案局局長李明華在全國檔案安全工作會議上指出要進一步做好檔案數(shù)據(jù)的安全備份,建設(shè)適用的電子檔案存儲應(yīng)用系統(tǒng),實現(xiàn)電子檔案在備份階段的可驗證性、可維護性、可遷移性和可管理性,進一步降低存儲成本和風(fēng)險,確保電子檔案在長期保存過程中的安全有效。因此,在數(shù)字檔案大數(shù)據(jù)環(huán)境下,如何充分、實時的了解備份中心數(shù)據(jù)現(xiàn)況,并能發(fā)現(xiàn)問題及時解決,從而避免各種安全隱患的發(fā)生成為檔案部門面臨的亟需解決的重大問題。
數(shù)字檔案信息的存儲、傳輸和利用是以計算機、存儲設(shè)備、應(yīng)用軟件系統(tǒng)和網(wǎng)絡(luò)為基礎(chǔ)的。數(shù)字檔案載體在保存環(huán)境中也容易受溫度、濕度、磁場等環(huán)境因素影響,計算機硬件、存儲介質(zhì)故障、電源掉電等都可以導(dǎo)致數(shù)據(jù)的丟失;軟件故障包括系統(tǒng)參數(shù)設(shè)置不當(dāng),或由于應(yīng)用程序沒有優(yōu)化造成運行時系統(tǒng)資源沒有合理分配,或數(shù)據(jù)庫參數(shù)設(shè)置不當(dāng)?shù)纫部稍斐蓴?shù)據(jù)丟失等情況。
數(shù)字檔案是以電子文件的形式存儲的,它通過計算機系統(tǒng)進行識別、編輯、管理和利用。因此數(shù)字檔案具有易被修改、編輯和刪除的特點,且在海量存儲的數(shù)字檔案里這種修改、編輯和刪除等操作往往不易被發(fā)覺。確保數(shù)字檔案的原始性難度較大,直接影響了數(shù)字檔案的真實性和權(quán)威性。
無實時檢測預(yù)警和實時保全功能。隨著電子文件廣泛應(yīng)用,數(shù)字檔案和全文數(shù)據(jù)庫成為數(shù)字檔案館藏資源的重要增長點,其數(shù)據(jù)量呈幾何級數(shù)增長,面對海量規(guī)模的存儲數(shù)據(jù),目前很多檔案館仍采用人工隨機檢測方式對數(shù)據(jù)進行檢測,這樣,管理人員很難對數(shù)據(jù)安全情況進行實時全面掌控,當(dāng)數(shù)據(jù)中心發(fā)生各種偶然性錯誤或意外情況的時候,很難在第一時間對數(shù)據(jù)進行補救。
目前,我國在數(shù)字檔案利用方面的法律、法規(guī)還不健全,檔案數(shù)字化過程中以及電子文件的形成到歸檔保存都缺乏嚴(yán)格規(guī)范的程序管理,缺乏科學(xué)統(tǒng)一的標(biāo)準(zhǔn)體系和業(yè)務(wù)管理制度。數(shù)字檔案的日常管理和利用存在麻痹思想、工作脫節(jié)、職責(zé)不明確,對數(shù)字檔案信息構(gòu)成威脅。
平湖市數(shù)字檔案館目前館藏有檔案目錄數(shù)據(jù)221萬余條,全文掃描900余萬頁,涉及文書、民生、照片、音視頻等多種門類。為實現(xiàn)館藏大數(shù)據(jù)級數(shù)字檔案的安全存儲和有效監(jiān)管,市檔案局在深入分析研究各種備份系統(tǒng)長期應(yīng)用操作的基礎(chǔ)上,于 2016年建立了數(shù)字檔案安全監(jiān)管平臺。
數(shù)字檔案安全監(jiān)管平臺擁有對于已存在備份數(shù)據(jù)的可用性及完整性針對性的保護措施。包括數(shù)據(jù)初始化平臺、備份平臺、檢測預(yù)警平臺及數(shù)據(jù)保全平臺;初始化平臺對數(shù)據(jù)進行初始化掃描工作;備份平臺通過備份技術(shù)分別備份兩份相同的數(shù)據(jù);檢測預(yù)警和數(shù)據(jù)保全兩個平臺通過與備份平臺的信息交互實現(xiàn)備份數(shù)據(jù)的安全監(jiān)管,確保備份數(shù)據(jù)規(guī)范化、標(biāo)準(zhǔn)化管理。該系統(tǒng)提供了一種安全檢測預(yù)警及數(shù)據(jù)保全的方法,將備份數(shù)據(jù)的安全監(jiān)管和業(yè)務(wù)平臺緊密結(jié)合起來,保證了業(yè)務(wù)備份數(shù)據(jù)的安全,從而避免各種隱患的發(fā)生。
數(shù)字檔案安全監(jiān)管平臺技術(shù)原理示意圖如圖1所示。
圖1 數(shù)字檔案安全監(jiān)管平臺技術(shù)原理示意圖
該平臺具備保障數(shù)據(jù)自身完整性及可用性的引擎,主要包括數(shù)據(jù)掃描引擎、數(shù)據(jù)校驗引擎,數(shù)據(jù)備份引擎及保全、報警引擎等。關(guān)鍵技術(shù)簡介如下:
(1)掃描技術(shù):基于MD5算法設(shè)計與實現(xiàn),MD5算法在網(wǎng)絡(luò)安全的諸多方面都得到廣泛的應(yīng)用,基于 MD5掃描技術(shù)具有高處理速度、低資源占用率的特點。平臺能夠同時掃描校驗兩個數(shù)據(jù)相同的備份區(qū)。
(2)校驗技術(shù):基于 MD5 校驗原理;對一個文件做 MD5運算,得到的計算結(jié)果與初始化模版里的校驗碼相比較,如果一致表示該文件完整,否則表示該文件異常。
(3)動態(tài)備份技術(shù):動態(tài)備份技術(shù)具備鏡像備份數(shù)據(jù)生成功能,接收來的數(shù)據(jù)能自動記錄入庫數(shù)據(jù)相關(guān)信息,生成一份鏡像區(qū)備份數(shù)據(jù),相當(dāng)于備份數(shù)據(jù)的再備份。在同時掃描校驗兩個數(shù)據(jù)相同的備份區(qū)時,如果發(fā)現(xiàn)一個區(qū)的某個數(shù)據(jù)文件的 MD5值與初始化模版里的校驗碼不一致,則將另一個區(qū)對應(yīng)數(shù)據(jù)備份到臨時區(qū),保證同一數(shù)據(jù)文件有兩個正確的備份數(shù)據(jù)。
數(shù)字檔案安全監(jiān)管平臺具備數(shù)據(jù)同步、加密、掃描檢測、預(yù)警、恢復(fù)等功能,使用該平臺可以幫助管理人員充分、實時的了解備份中心數(shù)據(jù)現(xiàn)況,發(fā)現(xiàn)問題,立即解決,從而避免各種安全隱患的發(fā)生。
數(shù)字檔案安全監(jiān)管平臺業(yè)務(wù)流程示意圖如圖2所示。
圖2 數(shù)字檔案安全監(jiān)管平臺業(yè)務(wù)流程示意圖
(1)數(shù)據(jù)同步接收與打包功能。平臺可以同步接收備份數(shù)據(jù),包括離線數(shù)據(jù)接收,接收移動介質(zhì)備份來的數(shù)據(jù);在線數(shù)據(jù)同步,對同一網(wǎng)絡(luò)的數(shù)據(jù)進行自動同步。接收來的數(shù)據(jù)同步到數(shù)據(jù)保全平臺,并自動記錄入庫數(shù)據(jù)相關(guān)信息;平臺實現(xiàn)對零散的文件進行規(guī)范性的匯總打包,支持將包含大量文件的文件夾進行無損打包,便于大數(shù)據(jù)的管理。
(2)數(shù)據(jù)加密與解密功能。平臺根據(jù)數(shù)據(jù)的實際情況可以選擇是否加密。數(shù)據(jù)加密采用密鑰,利用硬件加密原理,對數(shù)據(jù)進行加密,防止數(shù)據(jù)被竊取查看,保護備份數(shù)據(jù)的安全;對已加密的數(shù)據(jù),需結(jié)合硬件密鑰進行操作,進行數(shù)據(jù)解密,防止數(shù)據(jù)被惡意利用。
(3)鏡像備份數(shù)據(jù)與數(shù)字摘要生成功能。平臺對同步接收來的數(shù)據(jù)生成一份鏡像備份數(shù)據(jù),兩份數(shù)據(jù)同時存在;采用MD5算法對入庫數(shù)據(jù)進行檢測,生成原始唯一數(shù)字摘要,用于后期數(shù)據(jù)校驗。
(4)數(shù)據(jù)掃描與監(jiān)測功能。平臺支持自定義監(jiān)控周期設(shè)置,支持每月、每周、每天等各時段來制定系統(tǒng)工作周期和檢測計劃,進行數(shù)據(jù)自動監(jiān)測;支持全區(qū)、自定義在線檢測,自動判斷備份數(shù)據(jù)的有效及可用性,對所有數(shù)據(jù)進行檢測,避免因數(shù)據(jù)異常不能及時發(fā)現(xiàn)而帶來的更嚴(yán)重后果。
(5)系統(tǒng)預(yù)警功能。平臺具備預(yù)警功能,對異常情況或保全結(jié)束后自動觸發(fā)預(yù)警信息,讓管理人員實時掌控數(shù)據(jù)狀態(tài);具備實時監(jiān)控狀態(tài)展現(xiàn)功能,管理員可以直接查看具體異常數(shù)據(jù)信息。具備管理員手機號碼設(shè)置功能,通過外接SIM卡讀卡器,及時將報警信息發(fā)送到手機。
(6)實時數(shù)據(jù)保全與恢復(fù)功能。平臺檢測到數(shù)據(jù)異常時,第一時間進行數(shù)據(jù)保全,重新建立起與原數(shù)據(jù)一致的原始數(shù)據(jù),使異常數(shù)據(jù)得到控制,并實現(xiàn)自動修復(fù),確保備份數(shù)據(jù)長期保管的一致性和完整性。平臺具備數(shù)據(jù)恢復(fù)功能,如果本單位應(yīng)用系統(tǒng)數(shù)據(jù)出現(xiàn)災(zāi)害時可以通過數(shù)據(jù)保全系統(tǒng)辦理數(shù)據(jù)調(diào)取恢復(fù),系統(tǒng)提供快速搜索定位工具,讓用戶的數(shù)據(jù)調(diào)取恢復(fù)更便捷,數(shù)據(jù)調(diào)取時系統(tǒng)將自動進行數(shù)據(jù)一致性的檢測,保證用戶恢復(fù)數(shù)據(jù)的完整性,對已加密的數(shù)據(jù),需結(jié)合密鑰先進行數(shù)據(jù)解密。
(7)硬件設(shè)備監(jiān)管功能。平臺能夠?qū)诵牡挠布鎯υO(shè)備進行監(jiān)管,主要監(jiān)管指標(biāo)包括硬盤、CPU、內(nèi)存等核心部件是否正常工作,發(fā)現(xiàn)問題能及時報警,保證用戶設(shè)備使用的安全。
(8)系統(tǒng)日常管理與審計功能。平臺具備數(shù)據(jù)管理信息統(tǒng)計分析、數(shù)據(jù)檢測信息統(tǒng)計分析、數(shù)據(jù)預(yù)警信息統(tǒng)計分析、數(shù)據(jù)入庫信息統(tǒng)計分析等管理,實時了解系統(tǒng)運行情況,幫助管理者及時掌握數(shù)據(jù)狀態(tài)。具備記錄數(shù)據(jù)檢測日志、入庫日志、利用日志、登錄日志等,全面跟蹤系統(tǒng)保證數(shù)據(jù)保全系統(tǒng)安全、正常、高效的運行。具備單位管理、部門管理、角色管理、人員管理、權(quán)限管理等功能,通過對部門、人員、角色的設(shè)置,實現(xiàn)平臺的訪問權(quán)限控制和行為審計。
面對海量規(guī)模的數(shù)字檔案存儲數(shù)據(jù),目前很多檔案館仍采用人工隨機檢測方式對數(shù)據(jù)進行檢測,這樣,管理人員很難對數(shù)據(jù)安全情況進行實時全面掌控,當(dāng)數(shù)據(jù)中心發(fā)生各種偶然性錯誤或意外情況的時候第一時間對數(shù)據(jù)進行補救。數(shù)字檔案安全監(jiān)管平臺的建設(shè)與運用,能夠有效保障數(shù)字檔案的安全管理和長期可用,是完善檔案安全體系建設(shè)的重要補充,同時也提高了檔案部門的抗風(fēng)險能力。
進入信息社會,電子文件、電子檔案的環(huán)境依賴性、易修改性決定了電子文件的原始性即憑證價值更易破壞,固化電子文件、電子檔案證據(jù)措施,為還原數(shù)字行為事實真相、預(yù)防和解決各種糾紛,就顯得更加必要、更加緊迫。數(shù)據(jù)保全的開展是發(fā)揮電子檔案憑證作用的一次探索,利用技術(shù)手段可及時發(fā)現(xiàn)和避免電子檔案的篡改,對電子檔案的原始性進行了確保。
檔案信息大數(shù)據(jù)及智慧化發(fā)展是趨勢,檔案信息數(shù)據(jù)的安全、可用是發(fā)展的保障條件,平臺的建設(shè)與運用能夠主動地發(fā)現(xiàn)大數(shù)據(jù)管理、存儲方面存在的安全隱患,從而規(guī)范建設(shè),建立安全防護屏障,為大數(shù)據(jù)及智慧檔案發(fā)展打下安全保障的基礎(chǔ)。
[1] 李明華.在全國檔案安全工作會議上的講話[J].中國檔案,2017.
[2] 李洪湖.檔案數(shù)據(jù)安全存儲及智慧監(jiān)管平臺建設(shè)實踐分析[J].浙江檔案,2017.
[3] 崔海莉.“大數(shù)據(jù)”時代檔案信息安全管理新思考[J].檔案學(xué)研究,2015.
[4] 周美蘭.大數(shù)據(jù)環(huán)境下檔案信息安全管理的探討[J].蘭臺世界,2015.