文/王靖元
當前,大數(shù)據(jù)信息化已經(jīng)成為新時代一大發(fā)展潮流。異地檔案查詢系統(tǒng)的建網(wǎng),實為檔案事業(yè)發(fā)展的一大最佳選擇。本文通過分析研究,提出異地檔案查詢系統(tǒng)設計方案,無疑為提升檔案的服務功能與開發(fā)利用,又開辟了新的有益的路徑。
當前,數(shù)字化的浪潮在各國乃至各行各業(yè)間引發(fā)了巨大的變革,我國也將建設“數(shù)字中國”作為國家發(fā)展的重大戰(zhàn)略。在這樣的時代背景與國家戰(zhàn)略背景下,檔案部門應該將檔案工作數(shù)字化作為工作的一大重點,這是責無旁貸的最佳選擇。另一方面,政府部門的首要任務是服務人民,對檔案單位來說不斷提升檔案服務的便捷程度恰恰是人民之需求,檔案系統(tǒng)的數(shù)字化不僅是在順應時代發(fā)展、響應國家號召,也在很大程度上滿足了人民的需求。
時下,在各地各級檔案館、檔案局中,檔案工作的主要內(nèi)容一般為檔案收集與整理、檔案管理、檔案檢索服務三項,數(shù)字化系統(tǒng)在前兩項中已經(jīng)有了較為成熟的應用,許多地區(qū)的檔案局、檔案館都有一套服務于檔案的收集、存儲、管理全生命周期的系統(tǒng),這類系統(tǒng)也在面向公眾的檔案檢索服務中發(fā)揮了一定作用。近年來隨著小程序的興起,軟件開發(fā)與使用的門檻都有明顯的降低,一部分檔案部門也緊隨技術(shù)發(fā)展的步伐,開發(fā)出微信或支付寶平臺上的小程序?qū)iT用于提供檔案查詢服務,查檔案的人無需反復跑路,在小程序中就可與檔案人員交流,確定所需檔案的位置。
“建設數(shù)字中國”,業(yè)已成為國家發(fā)展的重大戰(zhàn)略。近年來,信息技術(shù)的飛速發(fā)展給各行各業(yè)帶來了發(fā)展的勃勃生機,不過其作用區(qū)域僅限于檔案單位所在的地區(qū),各地的檔案單位并未結(jié)連成“網(wǎng)”,如果所查檔案存儲在異地,查詢起來就會十分麻煩。要想使檔案查詢服務的便捷度有質(zhì)的提升,建立一個連接各地檔案單位的異地檔案查詢是十分必要的。為此,本文就從檔案系統(tǒng)數(shù)字化現(xiàn)狀、異地查檔系統(tǒng)架構(gòu)、模塊實現(xiàn)方案等三個方面,論述數(shù)字化時代異地檔案查詢系統(tǒng)的實施方案
上述這兩種系統(tǒng)已經(jīng)覆蓋了檔案工作主要的三項內(nèi)容,不過對于檔案不在生活所在地的人來說,查檔案最麻煩的短板仍未得到解決,要查一些檔案還是免不了長途跋涉,解決這一問題的唯一方法便是建立異地檔案查詢機制。目前,并沒有一套完善的異地檔案查詢系統(tǒng)。在新冠疫情期間,遂寧市與北京海淀區(qū)聯(lián)合開展了異地查檔服務[1],但這一服務主要還是基于工作人員之間的協(xié)調(diào),合作也僅限于達成約定的幾個地區(qū)之間,沒有普遍意義。總的來說,我國檔案系統(tǒng)的數(shù)字化在異地查檔上的應用還是較為空缺,盡快補足實為所需。
由于實體檔案是以檔案局或檔案館為單位統(tǒng)一集中管理的,因此異地查檔系統(tǒng)將每個檔案單位抽象為系統(tǒng)中的一個節(jié)點。在系統(tǒng)中,檔案的數(shù)字信息分布于不同節(jié)點之上,由于每個檔案單位既需要提供檔案查詢服務,又需要請求別的檔案單位幫它查詢檔案,因此系統(tǒng)中的每個節(jié)點都要同時扮演客戶端與服務端的雙重角色。采用分布式架構(gòu)的模式可以實現(xiàn)異地查檔系統(tǒng)所需的功能,總體架構(gòu)的層次結(jié)構(gòu)如圖1所示,當通過一個節(jié)點的客戶端查詢檔案時,客戶端會向“異地查檔系統(tǒng)中間件”發(fā)送查詢請求,如果所查檔案位于本地,中間件就直接從本節(jié)點上的數(shù)據(jù)中查詢,如果檔案位于異地,就通過互聯(lián)網(wǎng)訪問對應節(jié)點的中間件,目的節(jié)點以本地查詢的方式查詢到檔案數(shù)據(jù)后返回給本地節(jié)點。最終查詢到檔案信息后,由本地節(jié)點上運行的中間件將數(shù)據(jù)返回給客戶端。
圖1 異地查檔系統(tǒng)總體架構(gòu)
在異地檔案查詢的業(yè)務信息中,所查檔案的位置范圍是可以確定的,因此客戶端發(fā)送給中間件的查詢請求會帶有檔案的位置信息,即指定的檔案單位,因此每個節(jié)點的中間件中還應維護一份所有檔案單位的目錄,供客戶端選擇。
由于目前各地檔案單位數(shù)字化水平不一致,投入使用的數(shù)字化系統(tǒng)采用的技術(shù)與信息存儲和傳輸格式?jīng)]有明確的標準,想要直接建立起這樣一個系統(tǒng)幾乎是不可能的,因此,本文將異地檔案查詢系統(tǒng)的構(gòu)建分為兩個階段:
階段一:實現(xiàn)檔案館之間請求數(shù)據(jù)與回復數(shù)據(jù)的通道
在這一階段中,在一個節(jié)點收到檔案查詢請求之后,將由工作人員完成檔案的查詢,再將檔案數(shù)據(jù)發(fā)送給“異地查檔系統(tǒng)中間件”,這一階段中檔案查詢客戶端需要同時具有“請求查詢檔案”和“回復檔案數(shù)據(jù)”兩個功能,如圖2。
圖2 異地查檔系統(tǒng):階段一
在這一階段中還應規(guī)定客戶端與中間件通信的消息格式,以便于在進入第二個階段最大程度上保留第一個階段開發(fā)的結(jié)果。消息格式采用的標準將在下一節(jié)中詳細介紹。
階段二:本地節(jié)點實現(xiàn)自動從數(shù)據(jù)庫中完成查詢,返回檔案數(shù)據(jù)
這一階段的主要目標是在各檔案單位部署具有統(tǒng)一接口的“檔案查詢服務”。對于還未對檔案進行數(shù)字化管理的單位,可以直接部署系統(tǒng)配套的“檔案查詢服務”;對于已經(jīng)有數(shù)字化管理系統(tǒng)的單位,可以選擇部署新系統(tǒng)的服務,也可以選擇部署一個“檔案查詢服務代理”,從舊系統(tǒng)查詢數(shù)據(jù)返回給中間件,這一階段的架構(gòu)如圖三,其中節(jié)點A對應使用新系統(tǒng)的方案,節(jié)點B對應使用服務代理的方案。
圖3 異地查檔系統(tǒng):階段二
安全性:
由于檔案信息涉及到個人、群體或國家的秘密,檔案系統(tǒng)工作人員接受過良好的保密培訓,日常工作也都會近距離接觸檔案,因此系統(tǒng)最重要的便是確保檔案數(shù)據(jù)在傳輸中不會泄露。在網(wǎng)絡中,任何數(shù)據(jù)都是以同樣的形式傳輸?shù)模_保數(shù)據(jù)的安全性必須使用加密算法進行加密。檔案數(shù)據(jù)的加密可以使用非對稱加密的RSA算法與對稱加密的AES算法相結(jié)合的方式實現(xiàn)。
目前,RSA算法是應用最為廣泛的非對稱加密算法之一,在RSA公開密鑰密碼體制中包含一組密鑰對,即公鑰和私鑰,一般公鑰對外公開,而私鑰是私密的,由用戶保管[2]。AES算法是一種分組密碼算法,在擴散性混淆性等方面具有明顯優(yōu)勢[3]。
在異地查檔系統(tǒng)中,信息加密發(fā)生在“異地查檔系統(tǒng)中間件”內(nèi)部,每個節(jié)點上運行的每個中間件服務有各自的RSA私鑰,在一次數(shù)據(jù)傳輸?shù)倪^程中,發(fā)送數(shù)據(jù)的節(jié)點生成一段隨機的128位的AES密鑰,通過AES算法對發(fā)送的數(shù)據(jù)進行加密,再用自己的RSA私鑰加密本次生成的AES密鑰,將這兩份加密好的數(shù)據(jù)發(fā)給中央節(jié)點的中間件,由于各節(jié)點的RSA私鑰之間不能互相解密,所以中央節(jié)點需要用自己的RSA公鑰對收到的AES密鑰數(shù)據(jù)進行解密再加密,然后發(fā)送給目標節(jié)點。目標節(jié)點得到數(shù)據(jù)后,先通過RSA私鑰解密得到AES密鑰,再通過AES算法解密得到原始數(shù)據(jù)。
數(shù)據(jù)傳輸格式:
傳輸?shù)臄?shù)據(jù)由數(shù)據(jù)頭、AES密鑰、數(shù)據(jù)體三部分構(gòu)成,由于敏感信息已經(jīng)加密,可以采用明文傳輸?shù)腍TTP協(xié)議[4],將數(shù)據(jù)頭加入HTTP請求頭,ARS密鑰和數(shù)據(jù)體封裝到HTTP請求體中進行傳輸。數(shù)據(jù)頭中的信息應包含請求發(fā)起節(jié)點代號,目的節(jié)點代號等表示信息。
毋庸置疑,面對大數(shù)據(jù)信息化的發(fā)展總趨勢,構(gòu)建檔案異地查詢系統(tǒng),勢在必行。而如何加快這個進程,這就需要有關(guān)領導重視與支持,相關(guān)專業(yè)人員深入研究、提出解決方案,各行各業(yè)勇于踐行,形成一個共同為實現(xiàn)“建設數(shù)字中國”發(fā)展戰(zhàn)略而拼搏奮力的“數(shù)字大軍”,完全可以預見,實現(xiàn)檔案異地查詢目標指日可待。