楊中營(yíng)
在北京數(shù)字檔案館(電子文件中心)建設(shè)項(xiàng)目(以下簡(jiǎn)稱北京數(shù)字檔案館)中,應(yīng)用系統(tǒng)建設(shè)是整個(gè)建設(shè)項(xiàng)目的重點(diǎn),它為北京數(shù)字檔案館提供系統(tǒng)功能支撐,是各項(xiàng)檔案業(yè)務(wù)信息化的具體實(shí)現(xiàn),是數(shù)字檔案館建設(shè)水平的直接體現(xiàn)。
一、建設(shè)目標(biāo)
北京數(shù)字檔案館應(yīng)用系統(tǒng)建設(shè)的目標(biāo)是建立“四個(gè)平臺(tái)”:即,建立全市統(tǒng)一的電子文件中心平臺(tái),實(shí)現(xiàn)市、區(qū)檔案移交單位對(duì)列入進(jìn)館范圍的電子文件的綜合管理;建立全市統(tǒng)一的檔案接收平臺(tái),轉(zhuǎn)變現(xiàn)有的電子檔案接收模式,實(shí)現(xiàn)對(duì)市、區(qū)檔案移交單位電子檔案的網(wǎng)絡(luò)移交接收;建立全市統(tǒng)一的檔案管理平臺(tái),轉(zhuǎn)變現(xiàn)有電子檔案的管理模式,建立電子檔案憑證價(jià)值保護(hù)機(jī)制,實(shí)現(xiàn)檔案數(shù)字資源長(zhǎng)期保存;建立全市統(tǒng)一的檔案利用平臺(tái),轉(zhuǎn)變檔案利用模式,實(shí)現(xiàn)檔案數(shù)字資源的有效整合和分層次、多渠道的共享利用。
二、體系框架
北京數(shù)字檔案館是覆蓋市和區(qū)檔案局(館)、檔案移交單位以及普惠社會(huì)公眾的區(qū)域性檔案數(shù)字資源綜合管理平臺(tái)。平臺(tái)可通過在線或離線的方式與中央檔案館國(guó)家檔案局、各省級(jí)檔案局(館)和其他機(jī)構(gòu)實(shí)現(xiàn)檔案數(shù)字資源共享交換。
三、總體邏輯架構(gòu)
北京數(shù)字檔案館的總體邏輯架構(gòu)包括基礎(chǔ)設(shè)施支撐層、數(shù)據(jù)資源層、應(yīng)用支撐層、應(yīng)用層、展現(xiàn)層和服務(wù)對(duì)象層6個(gè)層次,以及貫穿于各個(gè)層次的標(biāo)準(zhǔn)規(guī)范和安全保障2大體系。
(一)基礎(chǔ)設(shè)施支撐層:包括市檔案館專網(wǎng)基礎(chǔ)設(shè)施支撐層、政務(wù)外網(wǎng)與因特網(wǎng)基礎(chǔ)設(shè)施支撐層,是系統(tǒng)運(yùn)行的基礎(chǔ)環(huán)境層。在市檔案館專網(wǎng)基礎(chǔ)設(shè)施支撐層上,采用虛擬化技術(shù),構(gòu)建存儲(chǔ)資源池,通過對(duì)資源池全生命周期管理和資源池運(yùn)維監(jiān)控,提供數(shù)據(jù)存儲(chǔ)、容災(zāi)備份等服務(wù),采用傳統(tǒng)方式構(gòu)建服務(wù)器和網(wǎng)絡(luò)系統(tǒng),并在專網(wǎng)進(jìn)行相應(yīng)的安全管理。在政務(wù)外網(wǎng)與因特網(wǎng)基礎(chǔ)設(shè)施支撐層上,政務(wù)外網(wǎng)系統(tǒng)采用虛擬化技術(shù),構(gòu)建相應(yīng)的計(jì)算資源池(不包括數(shù)據(jù)庫(kù)服務(wù)器、安全管理相關(guān)服務(wù)器)、網(wǎng)絡(luò)資源池(只包括虛擬化服務(wù)器上虛擬出來的VM的網(wǎng)絡(luò)資源,基礎(chǔ)網(wǎng)絡(luò)系統(tǒng)采用物理部署方式)和存儲(chǔ)資源池,并通過對(duì)資源池全生命周期管理和資源池運(yùn)維監(jiān)控,提供計(jì)算服務(wù)、數(shù)據(jù)存儲(chǔ)、負(fù)載管理、備份容災(zāi)服務(wù)、安全域劃分和網(wǎng)絡(luò)服務(wù)等服務(wù)。因特網(wǎng)采用傳統(tǒng)的方式構(gòu)建服務(wù)器和網(wǎng)絡(luò)系統(tǒng),并與政務(wù)外網(wǎng)共享存儲(chǔ)資源池。
(二)數(shù)據(jù)資源層:包括基礎(chǔ)信息庫(kù)、檔案內(nèi)容庫(kù)、業(yè)務(wù)過程庫(kù)、輔助信息庫(kù)、標(biāo)準(zhǔn)規(guī)范庫(kù)、運(yùn)行維護(hù)庫(kù)、電子檔案身份證庫(kù)和統(tǒng)計(jì)信息庫(kù)等數(shù)據(jù)庫(kù)。
(三)應(yīng)用支撐層:包括憑證性保障支撐、流媒體服務(wù)、工作流引擎、格式轉(zhuǎn)換、文件傳輸中間件、應(yīng)用中間件、OCR識(shí)別服務(wù)、報(bào)表管理、認(rèn)證授權(quán)支撐、全文檢索和授時(shí)服務(wù)支撐等組件,以及用于用戶定制所需的組件管理、配置管理和業(yè)務(wù)流程管理等標(biāo)準(zhǔn)接口。
(四)應(yīng)用層:包括電子文件中心(數(shù)字檔案室)、檔案數(shù)字資源接收、檔案數(shù)字資源征集、檔案數(shù)字資源綜合管理、檔案數(shù)字資源利用服務(wù)、電子檔案身份證管理、元數(shù)據(jù)智能捕獲與封裝、查詢統(tǒng)計(jì)、數(shù)據(jù)交換、全面運(yùn)行控制等應(yīng)用。同時(shí),通過用戶定制界面實(shí)現(xiàn)面向用戶的個(gè)性化定制功能。
(五)展現(xiàn)層:分別在政務(wù)外網(wǎng)、因特網(wǎng)、專網(wǎng)建設(shè)門戶系統(tǒng)。在政務(wù)外網(wǎng)和專網(wǎng)門戶主界面中集成應(yīng)用系統(tǒng)的相關(guān)功能,實(shí)現(xiàn)對(duì)應(yīng)用系統(tǒng)的功能整合。在因特網(wǎng)門戶提供信息發(fā)布、開放檔案查閱利用等相關(guān)功能。
(六)服務(wù)對(duì)象層:包括市、區(qū)兩級(jí)檔案局(館),檔案移交單位以及社會(huì)公眾。
(七)標(biāo)準(zhǔn)規(guī)范體系:包括指導(dǎo)原則、檔案業(yè)務(wù)、信息技術(shù)和運(yùn)行管理等四類標(biāo)準(zhǔn)。
(八)安全保障體系:包括技術(shù)安全體系和管理安全體系。其中,技術(shù)安全體系包括物理、通信網(wǎng)絡(luò)、計(jì)算環(huán)境、區(qū)域邊界和安全管理中心等方面;管理安全體系包括安全管理機(jī)構(gòu)、安全管理制度、人員安全管理、系統(tǒng)建設(shè)管理和系統(tǒng)運(yùn)維管理等方面。
四、總體技術(shù)架構(gòu)
在總體技術(shù)架構(gòu)上,遵循SOA標(biāo)準(zhǔn),進(jìn)行多層架構(gòu)設(shè)計(jì),具有良好的靈活性和可擴(kuò)展性。北京數(shù)字檔案館系統(tǒng)平臺(tái)分為9層,分別是基礎(chǔ)設(shè)施、技術(shù)平臺(tái)、安全服務(wù)、消息服務(wù)、數(shù)據(jù)服務(wù)、業(yè)務(wù)服務(wù)、展示服務(wù)、應(yīng)用和用戶。具體如下圖所示:
(一)基礎(chǔ)設(shè)施:包括數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)、負(fù)載均衡、機(jī)房及配套設(shè)施,共同組成系統(tǒng)運(yùn)行的基礎(chǔ)保障環(huán)境。
(二)技術(shù)平臺(tái):提供公用的系統(tǒng)支撐工具、監(jiān)控管理以及相關(guān)組件。
(三)安全服務(wù):提供身份認(rèn)證、數(shù)字簽名、權(quán)限控制、安全審計(jì)、電子檔案身份證等安全管理服務(wù)。
(四)消息服務(wù):提供統(tǒng)一的系統(tǒng)消息管理服務(wù),包括消息生成、消息分發(fā)等。
(五)數(shù)據(jù)服務(wù):提供統(tǒng)一的數(shù)據(jù)管理服務(wù),包括元數(shù)據(jù)管理、報(bào)表服務(wù)、數(shù)據(jù)交換、格式轉(zhuǎn)換、在線瀏覽、數(shù)據(jù)存儲(chǔ)、介質(zhì)管理、數(shù)據(jù)備份和數(shù)據(jù)分析等。
(六)業(yè)務(wù)服務(wù):提供統(tǒng)一的業(yè)務(wù)邏輯管理,包括計(jì)劃管理、檔案收集、檔案整理、歸檔入庫(kù)、移交接收、檔案征集、技術(shù)保護(hù)、檔案編研、數(shù)字化加工、專題管理、檔案鑒定、長(zhǎng)期保存、檔案檢索、檔案統(tǒng)計(jì)、庫(kù)房管理、全宗卷管理、借閱管理、抵館利用、跨館利用、異地出證等。
(七)展示服務(wù):提供客戶端訪問展示機(jī)制管理,根據(jù)不同情況提供不同的客戶端展現(xiàn)形式和應(yīng)用形式。
(八)應(yīng)用:為整個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)構(gòu)建的實(shí)例,包括電子文件中心系統(tǒng)(數(shù)字檔案室系統(tǒng))、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務(wù)系統(tǒng)、綜合統(tǒng)計(jì)查詢系統(tǒng)和電子檔案身份證管理系統(tǒng)等。endprint
(九)用戶:提供人機(jī)交互展示頁面。
五、應(yīng)用架構(gòu)
根據(jù)建設(shè)目標(biāo)和總體邏輯架構(gòu),項(xiàng)目設(shè)計(jì)開發(fā)了五大應(yīng)用系統(tǒng),即電子文件中心系統(tǒng)(數(shù)字檔案室系統(tǒng))、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源征集系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務(wù)系統(tǒng)。
同時(shí),項(xiàng)目還設(shè)計(jì)開發(fā)了電子檔案身份證管理系統(tǒng)、元數(shù)據(jù)智能捕獲系統(tǒng)、綜合統(tǒng)計(jì)查詢系統(tǒng)、數(shù)據(jù)交換管理系統(tǒng)、全面運(yùn)行控制系統(tǒng)等核心子系統(tǒng),這些核心子系統(tǒng)分別從憑證性保障、元數(shù)據(jù)捕獲、查詢統(tǒng)計(jì)、數(shù)據(jù)交換、系統(tǒng)運(yùn)維等不同方面為北京數(shù)字檔案館提供核心技術(shù)保障或系統(tǒng)支撐。應(yīng)用架構(gòu)如下圖所示。
六、數(shù)據(jù)架構(gòu)
根據(jù)文件生命周期理論,項(xiàng)目規(guī)劃設(shè)計(jì)了檔案數(shù)據(jù)在形成、歸檔、銷毀、移交、長(zhǎng)期保存等不同生命周期階段之間的流轉(zhuǎn)方向和流轉(zhuǎn)過程;同時(shí)也規(guī)劃設(shè)計(jì)了處于同一生命周期階段的檔案數(shù)據(jù)的存儲(chǔ)、備份、分布、共享交換和利用等。具體如圖5所示。
七、系統(tǒng)部署
在北京數(shù)字檔案館建設(shè)項(xiàng)目中,應(yīng)用系統(tǒng)橫跨三個(gè)網(wǎng)絡(luò),分別是因特網(wǎng)、政務(wù)外網(wǎng)和市檔案館專網(wǎng)。應(yīng)用系統(tǒng)在三個(gè)網(wǎng)絡(luò)上的部署情況如表1所示。
八、檔案數(shù)字資源分庫(kù)管理方案
為確保檔案數(shù)字資源在安全保管和長(zhǎng)久保存的同時(shí)提高利用效率,項(xiàng)目根據(jù)分庫(kù)管理的理念,在綜合考慮網(wǎng)絡(luò)劃分和應(yīng)用系統(tǒng)部署的情況下,對(duì)檔案數(shù)字資源(包含原文和目錄)進(jìn)行了分庫(kù)管理設(shè)計(jì),將檔案數(shù)字資源分為長(zhǎng)期保存庫(kù)、利用庫(kù)和管理庫(kù)(臨時(shí)庫(kù))。具體如表2所示。
九、技術(shù)實(shí)現(xiàn)
(一)關(guān)鍵技術(shù)路線
項(xiàng)目基于Web Service的J2EE技術(shù)架構(gòu)開發(fā)建設(shè),采取構(gòu)件技術(shù)進(jìn)行系統(tǒng)搭建,便于后期不斷完善和擴(kuò)展。采用XML和FTP技術(shù)相結(jié)合的方式,實(shí)現(xiàn)檔案數(shù)字資源的共享交換。
(二)高性能設(shè)計(jì)
針對(duì)大數(shù)據(jù)量并發(fā)的壓力,為保證系統(tǒng)的穩(wěn)定、高效運(yùn)行,項(xiàng)目從數(shù)據(jù)傳輸、服務(wù)響應(yīng)、數(shù)據(jù)訪問、數(shù)據(jù)存儲(chǔ)等多方面進(jìn)行設(shè)計(jì)和開發(fā)建設(shè),滿足高性能要求。在數(shù)據(jù)傳輸方面,采用HTTP壓縮和文件壓縮技術(shù);在服務(wù)響應(yīng)方面,采用負(fù)載均衡和集群部署的技術(shù);在數(shù)據(jù)訪問方面,采用了緩存技術(shù);在數(shù)據(jù)存儲(chǔ)方面,對(duì)數(shù)據(jù)庫(kù)進(jìn)行了優(yōu)化升級(jí)。
(三)統(tǒng)籌建設(shè)數(shù)字檔案室與數(shù)字檔案館
采用集約化建設(shè)理念,將數(shù)字檔案室納入數(shù)字檔案館項(xiàng)目一并建設(shè),通過建設(shè)北京數(shù)字檔案館一個(gè)項(xiàng)目同時(shí)實(shí)現(xiàn)數(shù)字檔案館和數(shù)字檔案室兩大功能,一舉兩得,避免了各單位的重復(fù)建設(shè),節(jié)約了政府投資。
(四)應(yīng)用了電子檔案身份證技術(shù)
項(xiàng)目應(yīng)用了一項(xiàng)保證電子檔案憑證性的核心技術(shù)——即電子檔案身份證技術(shù)。該技術(shù)通過為每一份電子檔案建立一個(gè)電子檔案身份證,將電子檔案身份證保存在電子檔案身份證庫(kù)中,當(dāng)需要驗(yàn)證電子檔案的原始性時(shí),即可從身份證庫(kù)中取出其身份證對(duì)其進(jìn)行驗(yàn)證,從而為電子檔案的憑證性保障提供技術(shù)保證。
(五)虛擬檔案庫(kù)房管理
項(xiàng)目設(shè)計(jì)開發(fā)了虛擬檔案庫(kù)房技術(shù),通過建立虛擬檔案庫(kù)房,可以實(shí)現(xiàn)檔案實(shí)體的靈活排放和虛擬展示,檔案保管人員通過系統(tǒng)即可形象直觀地進(jìn)行檔案庫(kù)房管理,極大提高了工作效率。
(六)四性檢測(cè)工具開發(fā)
項(xiàng)目研究制定了檔案數(shù)字資源四性檢測(cè)方案,設(shè)計(jì)開發(fā)了檔案數(shù)字資源四性檢測(cè)工具,可以實(shí)現(xiàn)對(duì)電子檔案和傳統(tǒng)載體檔案數(shù)字副本及元數(shù)據(jù)、目錄的準(zhǔn)確性、完整性、可用性和安全性進(jìn)行自動(dòng)檢測(cè),極大減少人工檢測(cè)的工作量,工作效率提升顯著。
(七)身份證識(shí)別和射頻IC卡技術(shù)應(yīng)用
項(xiàng)目應(yīng)用了二代身份證識(shí)別技術(shù),實(shí)現(xiàn)抵館利用人員身份信息的自動(dòng)讀取登記,提高工作效率,避免操作失誤。項(xiàng)目還應(yīng)用射頻IC卡技術(shù)。利用接待人員可為抵館利用人員建立自助查檔臨時(shí)賬戶,并將賬戶信息寫入IC卡,抵館利用人員可持IC卡實(shí)現(xiàn)自助查檔,極大減輕利用接待人員工作量的同時(shí),還能提升利用者的查檔體驗(yàn)和查檔效果。
(八)多重檢索
項(xiàng)目提供了模糊檢索、單庫(kù)檢索、跨庫(kù)檢索、組合檢索和全文檢索等多種檢索方式,滿足不同用戶的個(gè)性化檢索需求,實(shí)現(xiàn)檔案數(shù)字資源“準(zhǔn)確、快速、全面”地查找和定位。
十、結(jié)語
北京數(shù)字檔案館已經(jīng)完成了電子文件中心系統(tǒng)、檔案數(shù)字資源接收系統(tǒng)、檔案數(shù)字資源綜合管理系統(tǒng)、檔案數(shù)字資源利用服務(wù)系統(tǒng)等應(yīng)用系統(tǒng)(涉及41個(gè)業(yè)務(wù)流程,包含17個(gè)子系統(tǒng)、335個(gè)功能模塊)的設(shè)計(jì)開發(fā),基本實(shí)現(xiàn)了對(duì)檔案室、檔案館檔案業(yè)務(wù)工作的全覆蓋,對(duì)傳統(tǒng)載體檔案輔助管理以及電子檔案管理的全覆蓋。完成了與OA系統(tǒng)、媒資系統(tǒng)、CA系統(tǒng)電子檔案身份證系統(tǒng)等的集成,完成了系統(tǒng)安裝、系統(tǒng)部署、系統(tǒng)培訓(xùn)、第三方測(cè)試以及等保三級(jí)測(cè)評(píng)等。目前系統(tǒng)正在全面試運(yùn)行,我們將持續(xù)優(yōu)化完善應(yīng)用系統(tǒng),以便更好地滿足檔案工作需要,更好地優(yōu)化檔案工作流程,更好地引領(lǐng)檔案工作發(fā)展。endprint