孟 宇,張 濤,趙政文
(1.西北工業(yè)大學(xué)軟件與微電子學(xué)院,西安 710072;2.西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,西安 710072)
目前,云計(jì)算技術(shù)已經(jīng)開始向開放、互通、融合的方向發(fā)展。近年來,各國政府紛紛將云計(jì)算技術(shù)與軟件產(chǎn)業(yè)的發(fā)展結(jié)合起來,國內(nèi)的云計(jì)算技術(shù)開始步入成熟期,大型企業(yè)已將云計(jì)算運(yùn)用到企業(yè)運(yùn)營中。我國的數(shù)字化檔案館針對目前檔案數(shù)據(jù)分散管理及檔案資源利用率不高等問題,借鑒國外電子文件管理策略,開始將云計(jì)算技術(shù)引入到檔案數(shù)字化管理中,構(gòu)建基于云計(jì)算的數(shù)字檔案云系統(tǒng)平臺(tái),實(shí)現(xiàn)海量檔案數(shù)據(jù)資源的統(tǒng)一管理及共享,使用戶更方便、高效地利用檔案資源。
經(jīng)過近年的建設(shè)和發(fā)展,我國檔案信息化建設(shè)已經(jīng)取得了一定成就,很多省、市均建立了自己的數(shù)字檔案館,然而,省、市經(jīng)濟(jì)發(fā)展的不平衡和數(shù)字檔案建設(shè)策略的差異造成我國數(shù)字檔案信息化事業(yè)發(fā)展失衡,各檔案館各自為營,分散管理。現(xiàn)在,國內(nèi)的檔案信息化總的來說存在以下幾方面問題:
檔案資源分布不均:省級(jí)檔案館相對有更好的資源(包括管理員、檔案室和計(jì)算機(jī)設(shè)備等),而地方檔案館由于資金來源有限,往往面臨著設(shè)備老化等狀況,其網(wǎng)絡(luò)建設(shè)信息化資源配置也存在巨大差距。
檔案資源更新速度慢:各種信息技術(shù)飛速發(fā)展,要求數(shù)字檔案館能夠?yàn)橛脩籼峁┳钚碌臋n案檢索以及相關(guān)信息服務(wù)以適應(yīng)新形勢的發(fā)展,這給部分區(qū)域檔案信息化建設(shè)帶來了很大壓力。
檔案資源共享程度低:數(shù)字檔案管理的最終目的就是信息共享,但目前各區(qū)域檔案資源的共享程度仍然有限。
這些問題造成了我國在數(shù)字檔案信息化建設(shè)過程中重復(fù)投入,資源利用率不高。云計(jì)算的出現(xiàn)將是我國數(shù)字檔案信息化平臺(tái)建設(shè)強(qiáng)有力的技術(shù)支持。將云計(jì)算引入數(shù)字檔案館,會(huì)使數(shù)字檔案館發(fā)生巨大變化。數(shù)字檔案館在原有軟、硬件發(fā)展的基礎(chǔ)上,利用云計(jì)算技術(shù)的應(yīng)用特點(diǎn),可建立一個(gè)統(tǒng)一、開放、靈活的檔案信息化平臺(tái)。
利用云計(jì)算技術(shù)可以將各地方檔案館的檔案數(shù)據(jù)整合到檔案云系統(tǒng)數(shù)據(jù)中心的服務(wù)器中,制定統(tǒng)一的訪問規(guī)則并對檔案資源進(jìn)行歸類、管理和定制,檔案用戶通過統(tǒng)一的訪問界面即可訪問來自各地的數(shù)字檔案資源。
“云”中大量的服務(wù)器集群可以容納TB級(jí)甚至PB級(jí)的檔案數(shù)據(jù),并可以隨時(shí)增加和更新。其超強(qiáng)的計(jì)算能力能更好地計(jì)算和分析海量數(shù)據(jù),并能夠?yàn)槌瑥?fù)雜的計(jì)算提供快速、高效的技術(shù)支持,為數(shù)字檔案館日益增長的數(shù)據(jù)提供了解決途徑。
云計(jì)算避免了現(xiàn)今檔案館各自為營的現(xiàn)象,消除信息孤島,在各檔案館之間構(gòu)建數(shù)據(jù)共享空間,通過網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)聯(lián)通。這樣,各檔案館就可以分享檔案云系統(tǒng)的數(shù)據(jù)資源和基礎(chǔ)設(shè)施,實(shí)現(xiàn)數(shù)據(jù)的全面共享,一旦某臺(tái)服務(wù)器出現(xiàn)問題,云中的服務(wù)器將在極短時(shí)間內(nèi)將數(shù)據(jù)拷貝到別的服務(wù)器中,啟動(dòng)新的服務(wù)器提供服務(wù),進(jìn)而提高了檔案資源的利用率。
利用云計(jì)算技術(shù),檔案館不用將大量投資用在硬件配置和更新上,只需支付相對低價(jià)的租賃費(fèi)即可獲得所需的各項(xiàng)服務(wù)。服務(wù)器的日常維護(hù)和升級(jí)由云服務(wù)提供商來提供,而且客戶端的配置沒有限制。這樣,數(shù)字檔案館的建設(shè)成本可以大大降低,可以將更多的時(shí)間和資金利用在開展其他檔案業(yè)務(wù)上。
根據(jù)上述云計(jì)算在檔案館建設(shè)上的優(yōu)勢,提出檔案云的概念,將有限的硬件和軟件集中起來,把檔案館相關(guān)業(yè)務(wù)進(jìn)行包裝,對外提供相關(guān)檔案服務(wù)。為實(shí)現(xiàn)數(shù)字檔案的檢索利用和充分共享,檔案云應(yīng)對各層所提供的各種檔案資源進(jìn)行有效記錄和描述,建立檔案云的數(shù)字檔案索引庫,用戶可根據(jù)對數(shù)字檔案的需求進(jìn)行檢索,從而完成后續(xù)的檔案管理等操作。
如圖1所示,檔案云由區(qū)域云組成,每個(gè)區(qū)域云由若干已存在的數(shù)字檔案館組成,將為各省、市級(jí)檔案館提供相應(yīng)檔案服務(wù)的政務(wù)中心或是檔案檢索中心進(jìn)行擴(kuò)充,每個(gè)區(qū)域云設(shè)立一個(gè)管理機(jī)構(gòu),實(shí)現(xiàn)對區(qū)域云資源的管理。最后,各個(gè)區(qū)域云互聯(lián)形成我國的檔案云,整個(gè)檔案云設(shè)立一個(gè)管理機(jī)構(gòu)進(jìn)行綜合調(diào)控和數(shù)據(jù)管理。
圖1 “檔案云”示意圖
檔案云的提出首先促進(jìn)了各地檔案資源整合,并能夠縮短數(shù)據(jù)集中過程,在檔案云的范圍內(nèi)向用戶提供更廣泛更迅速的檔案服務(wù)。其次可以在一定程度上提升檔案館建設(shè)進(jìn)程,通過集中優(yōu)勢硬件和在已有數(shù)字檔案館的基礎(chǔ)上建立云服務(wù),能夠加速經(jīng)濟(jì)欠發(fā)達(dá)地區(qū)檔案館的建設(shè),通過網(wǎng)絡(luò)提供高速、簡潔的檔案服務(wù),方便數(shù)據(jù)共享。
檔案云是云計(jì)算技術(shù)在數(shù)字檔案領(lǐng)域的遷移,是檔案信息化的基礎(chǔ)架構(gòu),包含了數(shù)字檔案云系統(tǒng)所必須的一切軟硬件計(jì)算資源,向用戶提供以數(shù)字檔案為媒介的服務(wù)。在此首先介紹基于云計(jì)算的數(shù)字檔案云平臺(tái)系統(tǒng)的總體架構(gòu),然后討論基于該架構(gòu)的功能模塊和運(yùn)作模式。
一個(gè)通用的云計(jì)算平臺(tái)一般包括存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、計(jì)算設(shè)備、安全設(shè)備等,并可提供多種服務(wù)模式,如基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)等。檔案云系統(tǒng)利用網(wǎng)絡(luò)將地方檔案館分散的服務(wù)器整合成為大型的服務(wù)器集群,組成計(jì)算資源池,將各種資源包括計(jì)算服務(wù)、存儲(chǔ)服務(wù)、寬帶資源等都抽象成服務(wù),由檔案云體系中的軟件進(jìn)行統(tǒng)一管理。該體系中的檔案信息是分布式的,以數(shù)據(jù)流的形式分布存儲(chǔ)在各個(gè)數(shù)字檔案的節(jié)點(diǎn)上,這是檔案云的一個(gè)基本架構(gòu),主要分基礎(chǔ)設(shè)施、服務(wù)平臺(tái)、檔案云應(yīng)用和客戶終端,如圖2所示。
圖2 “檔案云”總體架構(gòu)
基礎(chǔ)設(shè)施主要是由云計(jì)算數(shù)字檔案管理應(yīng)用程序的數(shù)字管理節(jié)點(diǎn)、計(jì)算機(jī)專用網(wǎng)絡(luò)安全防火墻、公用和私有的硬件設(shè)施等構(gòu)成。將各級(jí)檔案館的服務(wù)器通過網(wǎng)絡(luò)互聯(lián)在虛擬軟件環(huán)境下,形成一個(gè)統(tǒng)一的軟件集群和數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn),向上一層提供文檔的計(jì)算服務(wù)和存儲(chǔ)需求。
檔案云平臺(tái)提供的云環(huán)境包括用戶定制和構(gòu)建數(shù)字檔案館時(shí)基于Web云應(yīng)用所需的所有軟、硬件及中間件,使用戶更快更有效地開發(fā)和部署自己的檔案館。
該檔案云系統(tǒng)將數(shù)字檔案館中查詢利用、檔案鑒定、虛擬檔案室等功能模塊封裝成云應(yīng)用,以服務(wù)的形式提供給用戶。用戶在使用檔案資源完成相關(guān)操作時(shí),無需搭建檔案館運(yùn)行環(huán)境或安裝相關(guān)軟件,只要在云終端登錄到檔案云系統(tǒng)的統(tǒng)一界面,通過付費(fèi)租用所需功能,便可完成相應(yīng)操作。
檔案云系統(tǒng)中的很多功能是其他功能運(yùn)行的基礎(chǔ),因此,將這些基礎(chǔ)功能進(jìn)行整合,構(gòu)建出檔案云系統(tǒng)基礎(chǔ)功能模塊,介于系統(tǒng)應(yīng)用層與平臺(tái)層之間,使檔案云應(yīng)用依靠基礎(chǔ)應(yīng)用層完成交付。
圖3 檔案云系統(tǒng)功能模塊具體設(shè)計(jì)
如圖3所示,“檔案云”SaaS應(yīng)用層依靠基礎(chǔ)應(yīng)用層實(shí)現(xiàn)交付,專注于虛擬化數(shù)字檔案館建設(shè)的業(yè)務(wù)需求。這種方式雖然犧牲了一些系統(tǒng)靈活性,但是能夠以較低的投入快速實(shí)現(xiàn)新功能,為平臺(tái)后期建設(shè)及功能拓展提供了便利。為實(shí)現(xiàn)“檔案云”系統(tǒng)的功能需求,在基礎(chǔ)應(yīng)用層中設(shè)計(jì)了一些功能模塊,這些功能構(gòu)成了軟件即服務(wù)平臺(tái)的關(guān)鍵技術(shù)。其中,系統(tǒng)包括大規(guī)模多租戶支持、定價(jià)收費(fèi)、認(rèn)證安全及可視化圖形引擎、報(bào)表引擎等組件作為基礎(chǔ)應(yīng)用服務(wù)平臺(tái)的關(guān)鍵技術(shù),與應(yīng)用層共同向用戶提供數(shù)字化檔案館的云服務(wù)。
數(shù)字檔案云系統(tǒng)是在傳統(tǒng)數(shù)字檔案館的基礎(chǔ)上,建立可伸縮的檔案云平臺(tái),使各中小檔案館利用網(wǎng)絡(luò)進(jìn)行資源共享,并可通過統(tǒng)一的服務(wù)接口定制自己的數(shù)字化檔案館,從而管理企業(yè)和政府現(xiàn)行的政策性文件和歸檔的歷史檔案信息。平臺(tái)中的服務(wù)可以是具體的服務(wù)器集群,也可以是數(shù)字檔案館的具體應(yīng)用。通過檔案云系統(tǒng)平臺(tái),用戶通過各種終端設(shè)備連接檔案云服務(wù),以按需付費(fèi)的方式定制所需功能,下面簡單介紹一下系統(tǒng)中提供的云應(yīng)用。
檔案著錄是在編制檔案目錄時(shí),對檔案內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過程。本文中檔案云所提供的檔案數(shù)據(jù)著錄云應(yīng)用主要是將傳統(tǒng)的紙質(zhì)文檔轉(zhuǎn)換為數(shù)字化檔案,為之后的檔案查詢等其他操作提供基礎(chǔ)。
基于上述系統(tǒng)設(shè)計(jì)策略,如圖4所示,檔案云服務(wù)提供信息處理,文檔中轉(zhuǎn)、發(fā)布和訪問以及對各種格式的數(shù)據(jù)存儲(chǔ),如數(shù)據(jù)庫、電子檔案等。作為檔案著錄人員可以通過網(wǎng)絡(luò)訂制應(yīng)用程序及防火墻的安全保護(hù),訪問檔案云服務(wù)器提供的相應(yīng)應(yīng)用,進(jìn)行數(shù)字檔案的數(shù)據(jù)著錄過程。作為數(shù)據(jù)著錄管理人員的用戶通過網(wǎng)絡(luò)訪問訂制的應(yīng)用程序直接訪問檔案云內(nèi)部的節(jié)點(diǎn),繼而訪問數(shù)據(jù)庫服務(wù)器,對數(shù)據(jù)進(jìn)行維護(hù)和審核。它可以實(shí)現(xiàn)文檔一體化管理,大大提高了檔案有效性,減少了工作量,避免造成檔案歸檔過程中的信息丟失。
圖4 數(shù)字檔案著錄云應(yīng)用示意圖
其主要工作流程是:多個(gè)數(shù)字檔案著錄人員通過網(wǎng)絡(luò)并發(fā)地訪問該云應(yīng)用,進(jìn)行數(shù)據(jù)著錄,提交到檔案云中心分類存儲(chǔ),提高了著錄數(shù)據(jù)的有效性和完整性;同時(shí),著錄管理人員通過網(wǎng)絡(luò)可以查詢到已經(jīng)著錄成功的電子文檔,對其進(jìn)行審核,審核通過以后將數(shù)據(jù)存儲(chǔ),進(jìn)行信息共享。該數(shù)字檔案系統(tǒng)的正常運(yùn)轉(zhuǎn)提供完整的歸檔記錄和數(shù)據(jù)存儲(chǔ)支持,以及一個(gè)全新、開放、有效的信息收集空間,使得數(shù)字檔案館的信息資源價(jià)值最大化。
檔案借閱查詢利用是信息利用和檔案管理的重點(diǎn)和難點(diǎn)之一,它是一個(gè)數(shù)字檔案館發(fā)布數(shù)據(jù)、檔案查詢和使用信息資源的技術(shù)平臺(tái),主要包括檔案查詢借閱平臺(tái)、庫房管理平臺(tái),用以提供檔案信息搜索、借閱申請、借閱管理、歸還管理、催還管理、查詢統(tǒng)計(jì)、圖形化庫房管理、庫房出入庫等功能。借助網(wǎng)絡(luò)平臺(tái),實(shí)現(xiàn)對檔案的查詢、借閱、歸還、統(tǒng)計(jì)、庫房進(jìn)行全過程管理,提高工作效率,方便檔案的查詢利用。
5.2.1 查閱管理
以簡單搜索表單和分類導(dǎo)航頁面為主要查詢工具,面向?yàn)g覽器用戶實(shí)現(xiàn)簡單查詢、組合查詢和分類查詢等功能,并且針對不同的用戶或角色,進(jìn)行查詢權(quán)限控制。云應(yīng)用提供的自助查閱受理和服務(wù)主要有:完成檔案利用者的在線注冊、資格審核、檔案查詢、檔案查閱審核、預(yù)約、借出和歸還、催還等功能。
5.2.2 庫房管理
主要是配合上述的查閱、查詢管理和服務(wù),提供實(shí)體檔案的出入庫管理、檔案物理位置信息服務(wù)和檔案庫房溫濕度、光照遠(yuǎn)程監(jiān)控管理等功能。在庫房瀏覽首頁,將顯示所有庫房的整體排列,任意進(jìn)入一個(gè)庫房,將展示庫房內(nèi)部的排架布置圖片,并顯示庫房名稱、庫房編號(hào)以及庫房長和寬。繼續(xù)選擇,可以進(jìn)入下一級(jí)排架展示圖片,并顯示排架條碼、格子類型、規(guī)格與排架行列,同時(shí)也顯示其上實(shí)際安放的檔案。同時(shí)采用無線傳輸?shù)姆绞綄旆恐袡n案出入庫的管理信息實(shí)時(shí)地更新在無線終端上,方便庫房管理人員進(jìn)行檔案存儲(chǔ)和管理。
檔案鑒定就是鑒別和判定檔案的價(jià)值,挑選出有價(jià)值的檔案交檔案機(jī)構(gòu)保存,剔除無保存價(jià)值的檔案予以銷毀。用戶通過網(wǎng)絡(luò)首先檢索需要鑒定的檔案加入待確認(rèn)鑒定列表中,檢查待確認(rèn)鑒定列表中的檔案信息,確認(rèn)檔案是否需要鑒定。若需要?jiǎng)t加入待鑒定列表,否則將檔案從待確認(rèn)鑒定列表中移除。檔案的鑒定和鑒定審核結(jié)束后,對確定需要對外公開的檔案自動(dòng)公開,需要銷毀的檔案加入檔案銷毀列表,否則將檔案駁回重新鑒定,并填寫審核意見。通過對檔案鑒定流程的控制可以更方便對數(shù)字檔案進(jìn)行公開和信息共享。
根據(jù)以上研究和分析,初步開發(fā)出來的數(shù)字檔案館的檔案云平臺(tái),通過虛擬化軟件對底層的物理服務(wù)器進(jìn)行虛擬化部署和管理,構(gòu)建小型數(shù)據(jù)中心,形成小型虛擬資源池。中層的云基礎(chǔ)架構(gòu),則可以通過開源的分布式計(jì)算模型,來構(gòu)建一種可擴(kuò)展、高性能的數(shù)據(jù)處理體系,從而完成數(shù)字化檔案資源建設(shè)的部署和管理等業(yè)務(wù)工作。而面向用戶的云終端的桌面顯示開發(fā)技術(shù)及相應(yīng)的架構(gòu)技術(shù)則可以通過網(wǎng)絡(luò)編程技術(shù)完成配置和部署,建立個(gè)性化的云計(jì)算交互界面。
圖5 “檔案云”實(shí)現(xiàn)圖
在檔案云系統(tǒng)中,用戶只需為自己所需要的功能付費(fèi),因此,該系統(tǒng)建立了檔案云租戶管理功能,統(tǒng)一規(guī)范了各種云應(yīng)用的使用權(quán)限及計(jì)費(fèi)方式。
將云計(jì)算理念加入到數(shù)字檔案館的服務(wù)中,提出了一個(gè)基于云計(jì)算的數(shù)字檔案信息化平臺(tái)的構(gòu)建和運(yùn)作模式。利用檔案云的統(tǒng)一性、靈活性和開放性將有助于加速數(shù)字檔案館的建設(shè)進(jìn)程,促進(jìn)檔案信息共享。目前該“檔案云”系統(tǒng)已在某省數(shù)字檔案館試運(yùn)行并獲得一定成效,但是將云計(jì)算充分運(yùn)用到數(shù)字檔案館中仍面臨巨大挑戰(zhàn)。
[1]馬張華.網(wǎng)絡(luò)信息資源組織[M].北京:北京大學(xué)出版社.2007.
[2]張建勛,古志民,鄭超.云計(jì)算研究進(jìn)展綜述[J].計(jì)算機(jī)應(yīng)用研究,2010,27(2):429 -433.
[3]劉振鵬,張寧,卞昭玲.云計(jì)算技術(shù)在檔案館中的應(yīng)用探討[J].蘭臺(tái)世界,2010(16):17-18.
[4]陶新權(quán),孫青,王亞.云計(jì)算在圖書館中的應(yīng)用[J].大學(xué)圖書館學(xué)報(bào),2010(2):54-58.
[5]張葉紅.“云計(jì)算”環(huán)境下圖書館信息資源共享模式初探[J].圖書館學(xué)研究,2010(11):30.
[6]王萍,張際平.云計(jì)算與網(wǎng)絡(luò)學(xué)習(xí)[J].現(xiàn)代教育技術(shù),2008(11):81-84.
[7]蔡學(xué)鏞.漫談云計(jì)算[J].程序員,2008(11):50 -51.
[8]Guangyou Xu,Yuanchun Shi.Pervasive Compute[J].Computer Learned Journal,2003,26(9):1042 -1050.
[9]Huai Jinpeng,Hu Chunming,Li Jianxin,et al.CROWN:SeviceorientedGrid Middleware System and Trust Management[J].Science in China(Series E:Information Sciences),2006:36(10):1127 -1155.