安生永
(河北省科學院 應用數(shù)學研究所,河北 石家莊 050081)
作為重要文獻信息資源的城建檔案,承載了城市的發(fā)展和記憶,是國家對一個城市規(guī)劃、建設和管理的重要依據(jù)。隨著以計算機技術和網(wǎng)絡通訊技術為基礎的全球信息化趨勢的形成,使得檔案信息也快速向數(shù)字化方向發(fā)展和轉變。傳統(tǒng)模式下的檔案館要順應時代發(fā)展潮流,實現(xiàn)從封閉式管理向開放式和數(shù)字式管理的轉變。面對檔案數(shù)字化和信息化發(fā)展的機遇,如果缺乏相對完善的數(shù)字檔案管理方案及基礎設施架構設計,城建檔案的信息化進程必然會受到影響與制約[1]。本文將云計算技術應用到城建檔案信息管理的業(yè)務中,以解決當前城建檔案信息管理系統(tǒng)中存在的諸多問題,將信息化管理方案和檔案館規(guī)范統(tǒng)一的業(yè)務流程整合到云計算架構體系上,給出城建檔案綜合信息管理系統(tǒng)的架構設計方法。
近些年來,隨著我國城建檔案數(shù)字化進程的不斷加快,我國現(xiàn)有的城建檔案信息化建設經(jīng)歷了單機單用戶、多機多部門獨立系統(tǒng)的應用及局域網(wǎng)絡化級應用等三個階段,檔案數(shù)據(jù)存量的不斷增加,城建檔案的逐年開放及利用的增多增加了人們對檔案信息的重視。但是滿足檔案信息共享的同時,又要考慮檔案信息的安全問題,保證檔案信息的真實準確性,一直是阻礙檔案信息進行信息共享的根本問題。
當前一些城建檔案館大都有根據(jù)自己的實際情況自行開發(fā)或者定制的一套城建檔案管理軟件,進行了檔案的數(shù)據(jù)數(shù)字化或城建檔案館日常工作業(yè)務管理。但由于各地發(fā)展水平不同,業(yè)務規(guī)范不同,沒有形成統(tǒng)一的數(shù)據(jù)存儲格式。不同的城建檔案館使用不同的電腦、軟件和外存儲設備來存儲數(shù)據(jù)和圖像,在不同的城建檔案機構之間,各大類建筑檔案資料在數(shù)據(jù)互通性、標準性方面存在問題。
通過計算機及網(wǎng)絡技術在城建檔案館的廣泛應用,雖然推動和促進了城建檔案信息化管理的飛速發(fā)展,但同時也出現(xiàn)了許多期待解決的實際問題。如何保證數(shù)字檔案的原始性、真實性、保密性、時效性是目前城建檔案計算機管理的核心問題,否則數(shù)字化檔案也失去了它本身的社會價值。目前在城建檔案的信息輸入、數(shù)據(jù)存儲、網(wǎng)絡共享和提供利用過程中都存在數(shù)據(jù)丟失、數(shù)據(jù)竊取、病毒入侵等諸多不安全因素,這些問題都制約了城建檔案信息化和數(shù)字化的深入發(fā)展[2]。云計算技術自被提出以來,有關理論和實踐不斷飛速發(fā)展,使得新型的云計算服務有望從基礎設施層面上解決這些長期以來困擾城建檔案信息化管理和服務中的問題,也必將成為當前檔案信息化管理系統(tǒng)的未來發(fā)展方向之一。
城建檔案應用系統(tǒng)主要業(yè)務是以城建檔案館對建設單位業(yè)務指導和數(shù)字資源采集為主要服務對象,實施檔案的數(shù)字化存儲、管理與維護,提供數(shù)字檔案信息的網(wǎng)絡傳輸、利用服務,并架構于一個完整的標準化計算體系基礎之上的數(shù)字檔案館[3]。
本文把城建檔案信息管理的業(yè)務分為以下五大類:
(1)城建檔案資料登記審批和監(jiān)管業(yè)務:需要外部企業(yè)參與就可完成的業(yè)務,主要包括:責任書登記管理、建筑工程指導管理、工程項目入館登記管理、聲像入館登記管理、執(zhí)法情況管理,發(fā)卷管理。
本類業(yè)務隨著建筑單位進度的不同復雜程度也不同,這類業(yè)務的共同點是需要與外部建設單位進行信息的交互。本類業(yè)務涉及部門繁多,一個業(yè)務可能需要多個部門的協(xié)作才能完成,信息交流量大而且流程復雜。
(2)城建檔案資料的檔案著錄業(yè)務:不需要與外部部門協(xié)作就能完成的業(yè)務,主要包括:工程項目著錄管理、工程案卷著錄管理、工程文件著錄管理、工程入庫資料打印、已入庫檔案維護管理、檔案利用統(tǒng)計管理、檔案館藏統(tǒng)計管理。
本類業(yè)務涉及部門簡單,檔案信息數(shù)字化輸入信息流量大。為了方便用戶使用,城建檔案的數(shù)字化采用的有多種形式:主要有(1)文本信息錄入,建立建設工程項目、案卷和文件數(shù)據(jù)庫。(2)對建筑圖紙圖片進行數(shù)化儀數(shù)化。(3)數(shù)碼視頻技術。(4)對圖像圖片進行二維、三維矢量化處理。通過地理信息系統(tǒng)做出實時的顯示,能快速方便的瀏覽查閱,為國家城市基礎設施建設提供科學的規(guī)劃和決策支持。為城建檔案館從城建檔案的實體保管基地變成提供利用方便的城建檔案信息控制中心,打下數(shù)據(jù)基礎。
(3)行政辦公管理業(yè)務:城建檔案館對館內工作的日常管理和制度的落實執(zhí)行,主要包括:公文管理、考核管理、科室管理、館內大事管理、編研成果管理、照片管理、思想論壇等。
這些業(yè)務主要由檔案館內部各科室共同完成。
(4)建設單位信息上報業(yè)務:
城建檔案館接收各個項目建設單位的信息上報。
業(yè)務主要包括:建筑工程項目級、建筑工程案卷級、建筑工程文件級城建檔案信息的收集和上報。
這些業(yè)務主要由各工程項目建設單位完成。
(5)城建檔案信息網(wǎng)上發(fā)布業(yè)務:
城建檔案館網(wǎng)上業(yè)務主要包括:館內簡介、館藏介紹、檔案查詢、政策法規(guī)、工作動態(tài)、編研成果、網(wǎng)上辦公、服務指導。
城建檔案空間信息的檢索和網(wǎng)絡查詢,基于Intranet的城建檔案系統(tǒng)和基于MIS的城建檔案系統(tǒng)的信息資源整合,也可用于提高城建檔案部門日常業(yè)務的標準化,規(guī)范化。將傳統(tǒng)的各種原始檔案(如紙張、照片、錄音、錄像、磁帶、電子文件等)通過掃描、轉換、轉化、壓縮等各種手段形成便于計算機識別和利用的數(shù)字文件(如圖像文件、聲音文件、錄像文件等),進而對這些文件進行識別、壓縮、加密,利用云計算環(huán)境存放于各種海量存儲介質上(如硬盤、磁盤陣列、光盤庫、光盤塔、磁帶等),并通過局域網(wǎng)、廣域網(wǎng)、企業(yè)內部網(wǎng)、國際互聯(lián)網(wǎng)向檔案利用者提供查詢信息。以滿足實現(xiàn)多用戶查詢服務需要和Internet網(wǎng)絡查詢需要。
查詢是有權限限制的,例如在Internet上可能只能看到檔案頁、圖形,而不能打印和存盤。而且根據(jù)不同權限的會員登錄可以看到不同的數(shù)字內容來增加保密性。
云計算是并行計算(Parallel Computing)、分布式計算(Distributed Computing)和網(wǎng)格計算(Grid Computing)的發(fā)展,或者說是這些計算機科學概念的商業(yè)實現(xiàn)[4]。從用戶需求角度分類,云計算分為公共云、私有云和混合云幾種類型。從應用角度分類,云計算的應用,主要包含軟件即服務、效用計算、云計算的網(wǎng)絡服務、平臺即服務、自理服務供給商、服務商業(yè)平臺、網(wǎng)絡集成等[5]。
用戶只需要通過一個計算機或者智能移動終端,就可以使用云計算平臺的所有業(yè)務和數(shù)據(jù)處理能力,而不必考慮這些數(shù)據(jù)和服務在什么地方,由誰來維護。云計算架構服務層根據(jù)服務類型劃分為:應用程序、平臺層和基礎設施[6];層次是可以分割的,某一層次可以單獨完成一項用戶的請求而不需要其它層次為其提供必要的服務和支持[7]。
云計算平臺可以合并大量的網(wǎng)絡計算和各種應用定制服務,可靈活利用虛擬化技術來配置擴展每一個服務器的計算能力,將各自的資源通過云計算平臺有機結合起來,提供大數(shù)據(jù)計算和高安全性的存儲能力[8]。
結合云計算的架構模式和城建檔案信息化管理系統(tǒng)的特點,筆者給出了一種適用于當前國情及其管理模式的城建檔案信息系統(tǒng)的總體設計。
基礎設施層包括對平臺起支撐作用的軟硬件的總和。硬件基礎包括:計算機終端、智能移動設備終端,大型數(shù)據(jù)存儲設備、網(wǎng)絡設備等[9]。軟件基礎包括:城建管理業(yè)務接口服務、系統(tǒng)應用服務、數(shù)據(jù)存儲服務、信息隊列服務等。這些基礎服務資源由分布式云計算統(tǒng)一管理,并對外提供統(tǒng)一的服務。根據(jù)國家城建管理信息化管理業(yè)務的特點,把城建信息化管理信息系統(tǒng)主要部署在混合云中。如圖1所示。
圖1 城建檔案系統(tǒng)混合云架構
4.1.1 私有云
各級別城建檔案館都擁有一部分軟硬件資源,通常情況下IT資源的供給量都是滿足軟件使用最大峰值的,導致了在峰值過后,單位內部出現(xiàn)了大量的閑置IT資源[10]。為了更好的利用這些資源,滿足新業(yè)務的需要,并且基于城建檔案館內部存儲了大量國家規(guī)定的各級涉密信息而考慮,在城建檔案館內部搭建云計算平臺,對涉及國家機密級的敏感信息進行保護,并為檔案館內部的信息化管理個性需求提供服務,存儲個體檔案館需要的信息,稱之為私有云。
4.1.2 公共云
部署在互聯(lián)網(wǎng)上,為國家城建檔案館所有有權限用戶提供其定制的服務,這些服務一般部署在國家或者各省檔案中心主機托管場所,服務軟件和數(shù)據(jù)庫由運營商維護,稱之為公共云。把遠程容災備份數(shù)據(jù)和與其它部門協(xié)作的檔案資料登記、監(jiān)管和信息上報的服務部署在公用云上,很好地解決了數(shù)據(jù)孤島和信息不對稱的問題,容易地實現(xiàn)系統(tǒng)的整合,也避免了重復開發(fā)和資源浪費,而且各地級市城建檔案館可以彼此通過專網(wǎng)組成一個公共云,更好的解決了數(shù)據(jù)的安全性問題,并且可以做到標準組件的公用。
4.1.3 混合云
現(xiàn)在大部分城建檔案館都已經(jīng)具有能滿足一部分應用需求的企業(yè)網(wǎng)信息化系統(tǒng),如果摒棄不用需要耗費的大量時間和金錢來進行數(shù)據(jù)轉換和重復開發(fā),如果將現(xiàn)有應用設計成云計算組件接口,那么可以將現(xiàn)有的應用程序與云平臺混合使用,就構成了混合云。
總之,根據(jù)城建檔案業(yè)務特點、用戶分布情況以及檔案資料的保密級別,本應用以混合云部署為主。
應用以Web群集服務的方式建立城建檔案管理信息系統(tǒng),把城建檔案主體業(yè)務應用程序通過云計算平臺部署在中央集群服務器中,每個省市建立多個Web集群云計算平臺中心,通過混合云或者私有云將多個省市中心云計算平臺主機互聯(lián)成群集,通過網(wǎng)絡負載均衡就能夠提供關鍵任務的可靠性。本系統(tǒng)將進行負載均衡的網(wǎng)絡設計結構為對稱結構,在結構之中每個服務器都處于同樣對等的位置,并且又相互獨立。能將負載非常均衡的分配給每個云計算中心的Web群集服務器,杜絕了負載會集中到某一個Web群集服務器上的現(xiàn)象發(fā)生,用較小的資金投入獲得最大的性能回報。具體步驟為:第一、確定Web服務器、FTP服務器和數(shù)據(jù)庫服務器設備,通過選擇負載平衡器來進行合理的配備。第二、配置不同的組件映像。通過網(wǎng)絡負載均衡提高了諸如Web服務器、FTP服務器和其它關鍵任務服務器上的因特網(wǎng)服務器程序的可用性和可伸縮性[11]。將靜態(tài)內容上載到存儲云并把內容傳送給Web服務器和FTP服務器。第三、把用戶的業(yè)務定制流程代碼部署在架構里,并且可以靈活組合應用。第四、確定新的映像模式并對網(wǎng)絡安全性和伸縮性問題進行處理。第五,在云計算平臺部署城建檔案系統(tǒng)應用,為用戶提供服務。
根據(jù)城建檔案的業(yè)務的需求和云計算架構設計特點,本系統(tǒng)把項目功能劃分為以下幾個模塊[12]:
(1)用戶認證模塊:對檔案館內部操作人員和合作建設單位操作人員的用戶注冊、信息維護和權限分配等功能。
(2)業(yè)務定制模塊:取得權限的用戶可以靈活定制各項業(yè)務操作流程,有選擇的獲取服務項目。并且根據(jù)流量來計費。
(3)目錄及文件管理模塊:提供對檔案館各密級文檔的各種在線監(jiān)控功能和管理功能。
(4)應用程序模塊:把一些常用的功能封裝成標準組件,供云用戶選擇使用。
(5)遠程備份容災模塊:對城建檔案館數(shù)據(jù)庫在私有云和公共云上的遠程存儲進行分配管理。
介紹了基于云計算的城建檔案信息系統(tǒng)設計。闡述了云計算技術的優(yōu)勢及在城建檔案信息化發(fā)展中的作用。指出了云計算雖然能夠解決重復開發(fā)、資源浪費、系統(tǒng)整合和信息孤島等問題,但在城建檔案信息化應用中存在的問題也同樣需要重視,如云中數(shù)據(jù)的安全問題,城建檔案將這些龐大數(shù)據(jù)存在云中的同時,信息的安全保密以及授權問題等。隨著這些難題的解決,云計算技術在城建檔案信息化中的應用將得到完善。
[1]尹雪梅.從云計算到個人數(shù)字檔案館[J].山西檔案,2009,(2):18-22.
[2]陳濤.云存儲技術在圖書館隨書光盤管理工作中的應用[J].科技情報開發(fā)與經(jīng)濟,2012(5):59-61.
[3]劉振鵬,張寧,卞昭玲.云計算技術在檔案館中的應用[J].蘭臺世界,2010,(8).
[4]Foster I,Zhao Yong.Cloud Computing and Grid Computing 360-DegreeCompared[M]//2008GridComputing Environmerits Workshop,IEEE.Austin,Texas:[s.n.],2008.
[5]張建成,宋麗華,鹿全禮,郭銳,劉永泉.云計算方案分析研究.計算機技術與發(fā)展[J].2012(02):165-l71.
[6]Aymerich F M,F(xiàn)enu G,Surcis S.An Approach to a Cloud Computing Network[C]//2008First Imernational Conferenceon Applications 0fDigital Information and Web Technologies.IEEE.Czech Republie:Technical University of Ostrava,2008:113-118.
[7]Yousef L,Butrico M,Silva D D.Toward a Unified Ontology of Cloud Computing[M]//2008Grid Computing Environments Workshop,IEEE.Austin,Texas:[s.n.],2008.
[8]De S K,Krishna P R.Clustering web transactions using roughapproximation[J].Fuzzy Sets and Systems,2004,148:131-138
[9]方國偉,Bill Liu.詳解微軟 Windows Azure云計算平臺[M].北京:電子工業(yè)出版社,2011.
[10]杜海寧.基于云計算的圖書館海量數(shù)據(jù)存儲研究[J].圖書與情報,2010(3):99-101.
[11]徐子巖.實戰(zhàn)Windows Azure:微軟云計算平臺技術詳解[M].北京:電子工業(yè)出版社,2011.
[12]張秀菊,閆彥,楊建軍.基于云計算的港口綜合管理信息系統(tǒng)的研究[].科技創(chuàng)新導報[J].2010(08):29-30.