卞咸杰/鹽城師范學(xué)院
2000年,《全國檔案事業(yè)發(fā)展“十五”計劃》明確提出“組織各級國家檔案館建立區(qū)域性檔案資料目錄中心,實現(xiàn)檔案信息資源共享”;2002年,《全國檔案信息化建設(shè)實施綱要》進一步提出“在逐步推進地區(qū)性館際互聯(lián)的基礎(chǔ)上,不斷促進全國范圍內(nèi)的檔案信息資源共享”。近20年來,我國檔案信息資源共享建設(shè)取得一定進展,許多省市檔案部門在實踐中獲得成功經(jīng)驗,如浙江省寧波市、湖州市、麗水市、海寧市等地檔案部門構(gòu)建了區(qū)域性檔案信息資源整合共享平臺[1];南京市檔案局以“南京市文檔目錄數(shù)據(jù)中心”及“南京檔案”網(wǎng)站為龍頭建設(shè)網(wǎng)站群,為全市檔案信息資源整合和利用搭建統(tǒng)一平臺;四川省、江蘇省高校檔案研究會(理事會)分別推動本省高校檔案信息資源共享[2]?!笆濉逼陂g,我國初步建成以局域網(wǎng)、政務(wù)網(wǎng)、因特網(wǎng)為平臺,以檔案信息管理系統(tǒng)為支撐,以檔案目錄中心、基礎(chǔ)數(shù)據(jù)庫、檔案利用平臺、檔案網(wǎng)站信息發(fā)布為基礎(chǔ)的檔案信息化體系。但目前檔案信息資源共享平臺的數(shù)據(jù)共享范圍主要局限于系統(tǒng)內(nèi)部和區(qū)域性、行業(yè)性范圍內(nèi),數(shù)據(jù)交互在服務(wù)器系統(tǒng)內(nèi)部實現(xiàn),在不同類型的設(shè)備上很難做到數(shù)據(jù)的實時同步,不同平臺間的檔案“信息孤島”現(xiàn)象仍然突出,如果要實現(xiàn)數(shù)據(jù)在移動設(shè)備上的共享就要開發(fā)相應(yīng)的平臺,否則檔案信息數(shù)據(jù)無法實時同步。
大數(shù)據(jù)時代,檔案信息資源的質(zhì)量得到提升、數(shù)量愈發(fā)龐大,資源的數(shù)字化、網(wǎng)絡(luò)化、自動化程度也越來越高,異構(gòu)平臺的檔案信息資源數(shù)據(jù)交互成為檔案信息資源建設(shè)的重要發(fā)展方向,信息的表現(xiàn)形式呈現(xiàn)出文本信息資源、超文本信息資源、多媒體信息資源、超媒體信息資源和自媒體等并存的局面。由此,檔案信息資源共享平臺建設(shè)呈現(xiàn)出智能化、共享與互聯(lián)互通和均衡化的特點。一是智能化。檔案信息資源是非常重要的知識資源,是人類勞動成果的結(jié)晶,其從傳統(tǒng)的紙質(zhì)形式發(fā)展到現(xiàn)代的電子介質(zhì)形式,所記錄與表達的內(nèi)容越來越豐富,海量的檔案信息資源數(shù)據(jù)處理將從傳統(tǒng)的人工輔助計算機處理轉(zhuǎn)向智能應(yīng)用自動處理。二是共享與互聯(lián)互通。為充分開發(fā)利用現(xiàn)有的檔案信息,必須對檔案信息進行有效配置與合理共享,實現(xiàn)檔案信息資源的最大價值,大數(shù)據(jù)時代數(shù)據(jù)共享(如實時交通路況、實時天氣預(yù)報等)為我們帶來了諸多便利,未來的檔案信息資源平臺也應(yīng)實現(xiàn)可共享與互聯(lián)互通。三是均衡化。不同地區(qū)的經(jīng)濟發(fā)展狀況和人才擁有情況不同,導(dǎo)致了檔案信息資源收集與利用不均衡的現(xiàn)象,實現(xiàn)平臺信息共享之后可以有效縮小不同平臺之間數(shù)據(jù)信息差距,實現(xiàn)檔案信息資源服務(wù)均衡發(fā)展。
檔案信息化應(yīng)用系統(tǒng)在設(shè)計開發(fā)之初,局限于本單位、本部門自身業(yè)務(wù)需求的實現(xiàn),缺乏整體性的統(tǒng)一規(guī)劃與統(tǒng)一標準,導(dǎo)致現(xiàn)有的各檔案信息資源共享平臺存在兩大缺陷。一是平臺的數(shù)據(jù)共享范圍主要局限在系統(tǒng)內(nèi)部或區(qū)域性、行業(yè)性范圍內(nèi),不同機構(gòu)系統(tǒng)之間的數(shù)據(jù)很難共享,無法實現(xiàn)檔案信息數(shù)據(jù)無縫交互。二是平臺的數(shù)據(jù)交互在不同類型的設(shè)備上很難做到實時同步,各應(yīng)用系統(tǒng)的信息不能暢通地注入檔案信息資源庫中。
因此,檔案信息資源共享平臺建設(shè)要實現(xiàn)《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》提出的檔案利用便捷化、檔案管理信息化和檔案安全高效化的要求,必須加強三大管理中心建設(shè)。一是檔案信息資源共享平臺綜合管理中心建設(shè),需要實現(xiàn)平臺角色管理、平臺用戶管理、平臺角色權(quán)限管理、檔案信息資源導(dǎo)入與錄入、檔案信息資源檢索、檔案信息資源智能分析等功能。二是檔案信息資源共享平臺存儲服務(wù)中心建設(shè),需要實現(xiàn)檔案信息資源文件存儲、檔案信息資源結(jié)構(gòu)化數(shù)據(jù)存儲等功能。三是檔案信息資源共享平臺數(shù)據(jù)交互管理中心建設(shè),需要實現(xiàn)數(shù)據(jù)交互服務(wù)檢索模塊、數(shù)據(jù)交互服務(wù)管理模塊(具備檔案信息資源新增、刪除、修改等功能)、數(shù)據(jù)交互服務(wù)權(quán)限控制模塊、數(shù)據(jù)交互服務(wù)的服務(wù)管理模塊等的建設(shè)。
檔案信息資源共享平臺各系統(tǒng)或多或少存在異構(gòu)性,跨平臺操作對耦合程度要求高,這使得數(shù)據(jù)難以暢通流轉(zhuǎn)。檔案信息資源共享平臺的數(shù)據(jù)交互需要實現(xiàn)在不同設(shè)備之間的信息實時交互,目前可選擇的數(shù)據(jù)交互技術(shù)主要有以下三種:Web Service、WCF(Windows Communication Foundation)、Web API。根據(jù)檔案信息資源共享平臺逐步向移動化方向發(fā)展的特點,筆者建議采用Web API數(shù)據(jù)交互技術(shù)。Web API可用于構(gòu)建傳統(tǒng)的PC與移動客戶端之間檔案信息資源數(shù)據(jù)交互的服務(wù),從技術(shù)特點來看,Web API利用HTTP協(xié)議的各個方面來表達服務(wù),可以服務(wù)于不同的客戶端、操作系統(tǒng)及瀏覽器。
檔案信息資源共享平臺主體功能包含檔案信息的搜集、查詢、維護及數(shù)據(jù)統(tǒng)計分析,相應(yīng)地在數(shù)據(jù)交互上就需要有檔案信息增刪改等操作的服務(wù)、檔案信息查詢服務(wù)、檔案信息后端分析服務(wù)。用戶利用檔案信息既可以使用電腦,也可以使用手持設(shè)備如智能手機、Pad等。對于檔案信息服務(wù)平臺而言,不管采用何種方式都不能直接對檔案信息數(shù)據(jù)庫進行操作,所有數(shù)據(jù)操作必須經(jīng)過Web API數(shù)據(jù)交互技術(shù)構(gòu)建的服務(wù),這樣確保每一次服務(wù)調(diào)用都是統(tǒng)一的,保證數(shù)據(jù)操作的一致性。
檔案信息資源共享平臺最終要實現(xiàn)檔案利用便捷化、檔案管理信息化和檔案數(shù)據(jù)標準化,克服因檔案信息載體不同、館藏類別豐富、操作系統(tǒng)多樣、瀏覽器眾多和支持設(shè)備的差異等給檔案信息資源共享帶來的障礙,打破檔案“信息孤島”的格局,最終成為檔案信息資源的綜合管理中心、存儲服務(wù)中心和數(shù)據(jù)交互管理中心。檔案信息資源共享平臺數(shù)據(jù)交互服務(wù)的目標定位應(yīng)包括如下三點。
第一,實現(xiàn)檔案信息資源共享平臺數(shù)據(jù)高度集成。通過數(shù)據(jù)交互技術(shù)將檔案信息資源歸類匯總,使數(shù)據(jù)交換更加準確、便捷、高效和通暢,不僅能集成已有系統(tǒng),而且能使未來新建系統(tǒng)融合到整體架構(gòu)中,與數(shù)字檔案館系統(tǒng)進行數(shù)據(jù)交換和信息共享,提供更加全面的檔案信息服務(wù)。第二,實現(xiàn)檔案信息資源的智能化管理與應(yīng)用。通過檔案信息資源共享平臺數(shù)據(jù)交互,檔案信息資源數(shù)據(jù)的獲取自動從其他平臺獲取,減少檔案工作人員重復(fù)性數(shù)據(jù)操作,進一步將檔案部門工作人員從繁瑣的事務(wù)性工作中解放出來。第三,實現(xiàn)檔案信息資源的開放與共享。滿足對各種異構(gòu)與同構(gòu)平臺、數(shù)據(jù)源及各類應(yīng)用間的數(shù)據(jù)交換需求,利用大數(shù)據(jù)技術(shù)對檔案信息資源進行智能分析,抽取有價值的檔案信息并進行加工,形成對用戶有價值的分析報告,為用戶做出更好的決策提供參考。
檔案信息資源共享平臺采用N層架構(gòu)的方式,包括數(shù)據(jù)庫層、數(shù)據(jù)訪問層、業(yè)務(wù)邏輯層、Web API服務(wù)接口層、應(yīng)用層等,其中Web API服務(wù)接口層是未來實現(xiàn)跨平臺應(yīng)用的關(guān)鍵,要對任一平臺的檔案信息數(shù)據(jù)進行增、刪、改、查等操作均需要調(diào)用Web API服務(wù)接口,不能直接對數(shù)據(jù)庫進行操作。對于應(yīng)用層,如果采用傳統(tǒng)的開發(fā)模式,需要開發(fā)相應(yīng)的APP應(yīng)用、Web應(yīng)用、微信應(yīng)用,因應(yīng)用所處平臺有所差別,開發(fā)的技術(shù)要求不完全相同,對此可采用Web API數(shù)據(jù)交互技術(shù)構(gòu)建的服務(wù)框架結(jié)合響應(yīng)式頁面的方式,這樣平臺的實現(xiàn)比較容易,一次實現(xiàn)就可以讓檔案信息資源共享平臺在不同的設(shè)備上使用,升級維護成本也可以降低很多。
大數(shù)據(jù)時代許多檔案信息以非結(jié)構(gòu)化或半結(jié)構(gòu)化的形式存儲,這使得現(xiàn)有的平臺不能適應(yīng)半結(jié)構(gòu)化數(shù)據(jù)的分析處理模式。為此,檔案信息資源共享平臺前端框架宜采用Bootstrap設(shè)計,可以在不同的移動設(shè)備上顯示平臺的內(nèi)容,從而自動適應(yīng)手機、平板、PC等主流移動設(shè)備及瀏覽器[3],檔案信息數(shù)據(jù)交互服務(wù)的應(yīng)用服務(wù)器環(huán)境為Windows Server 2008,Web服務(wù)器部署采用IIS,數(shù)據(jù)庫服務(wù)器采用Microsoft SQL Server 2008,開發(fā)工具采用微軟的Visual Studio 2015,新建的項目類型為Web API,在項目構(gòu)建后需要三個Web API子項目分別實現(xiàn)檔案信息維護、查詢、分析等數(shù)據(jù)交互服務(wù)。檔案信息維護數(shù)據(jù)交互服務(wù)包括信息的新增與修改、多媒體類型數(shù)據(jù)交互處理、檔案類型數(shù)據(jù)交互處理等;檔案信息查詢數(shù)據(jù)交互服務(wù)主要處理檔案信息查詢條件的選擇、查詢結(jié)果返回服務(wù),該服務(wù)需要支持動態(tài)的結(jié)果集,即不同的檔案信息的信息(如人員信息、內(nèi)容信息等),查詢處理的數(shù)據(jù)格式應(yīng)是不同的返回格式,以支持數(shù)據(jù)交互服務(wù)使用者的不同需求;檔案信息分析數(shù)據(jù)交互服務(wù)主要是檔案信息分析,通過對平臺檔案數(shù)據(jù)進行分析利用形成相應(yīng)的價值,平臺的數(shù)據(jù)交互服務(wù)會自動分析數(shù)據(jù)交互行為,并定期將分析的結(jié)果發(fā)送至相關(guān)檔案用戶。
檔案信息資源共享平臺數(shù)據(jù)交互Web API服務(wù)設(shè)計采用令牌+簽名認證的方式以保證請求的安全性,具體方法為:首先實現(xiàn)檔案信息資源共享平臺認證服務(wù),該服務(wù)采用Web API技術(shù),任何用戶要使用平臺數(shù)據(jù)必須要通過該認證服務(wù)并得到對應(yīng)的令牌;其次用戶根據(jù)認證通過的令牌信息以及請求的參數(shù)和服務(wù)器端提供的簽名算法計算出簽名后再訪問指定的Web API;再次檔案信息資源共享平臺服務(wù)器端每次接收到請求就獲取對應(yīng)用戶的令牌和請求參數(shù),服務(wù)器端就會作出反應(yīng),對計算簽名和客戶端簽名進行比對,驗證通過則正常訪問相應(yīng)的Web API,驗證失敗則顯示具體的失敗信息。采用令牌+簽名認證可以確保服務(wù)使用者的合法性,因為在平臺正常運行過程中會遇到惡意攻擊者,他們會篡改地址參數(shù)并進行惡意攻擊,這樣會對服務(wù)器的安全及性能造成不利影響??梢圆捎萌罩鞠到y(tǒng)應(yīng)對,遇到異常服務(wù)使用情況系統(tǒng)能及時記錄相應(yīng)的數(shù)據(jù)源頭信息,便于對攻擊源頭進行控制,這樣可以確保用戶利用檔案信息資源共享平臺進行數(shù)據(jù)交互。
Web API作為檔案信息數(shù)據(jù)請求的一種服務(wù),在用戶并發(fā)請求不斷增加以及請求的檔案信息數(shù)據(jù)量變大的情況下,提升其性能是實現(xiàn)檔案信息數(shù)據(jù)交互關(guān)鍵點,平臺從三個方面提升數(shù)據(jù)交互服務(wù)的性能:首先是采用JSON(JavaScript Object Notation,JS對象標記) 進行數(shù)據(jù)傳輸[4],每次請求都涉及原始檔案數(shù)據(jù)轉(zhuǎn)換成JSON格式數(shù)據(jù),轉(zhuǎn)換技術(shù)采用的是微軟提供的Json.NET;其次是對Web API傳輸?shù)臄?shù)據(jù)進行壓縮,對需要交傳輸?shù)淖址畔?、?shù)據(jù)流信息、文件等內(nèi)容進行壓縮,壓縮的方法可采用微軟提供的GZipStream類;再次是使用緩存技術(shù),將無變化的檔案信息數(shù)據(jù)設(shè)置緩存過期時間,在某一段時間內(nèi)不會去重新請求從服務(wù)器獲取數(shù)據(jù),直接在本地瀏覽器緩存中獲取,這也是提升數(shù)據(jù)交互性能的重要方式;最后是采用異步方法,對于部分功能會在某個時間段會出現(xiàn)并發(fā)現(xiàn)象,比如系統(tǒng)上線時用戶注冊,解決類似這樣的問題需要用到異步方法,這樣用戶就不需要長時間在前臺頁面等待后臺操作完成。
總之,隨著大數(shù)據(jù)時代的到來,公眾對檔案信息資源的需求越來越多樣化,呈現(xiàn)在用戶面前的檔案信息已經(jīng)由傳統(tǒng)的紙質(zhì)檔案向多媒體檔案轉(zhuǎn)變[5],尤其是移動檔案信息資源共享平臺的發(fā)展呈現(xiàn)出個性化服務(wù)功能逐漸拓展、服務(wù)資源更加集成、提供利用更加人性化的趨勢[6]。隨著移動互聯(lián)網(wǎng)成為信息時代發(fā)展的主流,檔案信息資源共享平臺在實現(xiàn)形式上趨于云端化、移動化、智能化,這就要求檔案信息能夠在不同的設(shè)備間互聯(lián)互通。在檔案信息平臺數(shù)據(jù)和平臺用戶不斷增長的情況下,采用Web API技術(shù)構(gòu)建檔案信息數(shù)據(jù)交互服務(wù)平臺,能夠滿足檔案信息網(wǎng)站程序、APP程序(IOS、Android)、桌面應(yīng)用程序以及目前熱門微信應(yīng)用等不同系統(tǒng)的數(shù)據(jù)交互需求,并支持更廣泛客戶端(包括瀏覽器、手機和平板電腦等移動設(shè)備)的數(shù)據(jù)交互,真正滿足檔案信息數(shù)據(jù)交互服務(wù)跨平臺需求。