王濤
(中原工學(xué)院,河南 鄭州 451191)
檔案信息資源共享云平臺研究
王濤
(中原工學(xué)院,河南 鄭州 451191)
本文闡述了云計算的基本特點,試圖從總體實施策略、應(yīng)用系統(tǒng)構(gòu)建、數(shù)據(jù)中心構(gòu)建和內(nèi)容構(gòu)建四個方面來構(gòu)建檔案信息資源共享云平臺。
云計算;檔案;信息資源;共享平臺
云計算是一種基于互聯(lián)網(wǎng)的服務(wù)模式,這種模式提供便捷的、按需的網(wǎng)絡(luò)訪問,它將計算任務(wù)分布在可配置的計算資源共享池(資源包括網(wǎng)絡(luò),服務(wù)器,存儲,應(yīng)用軟件,服務(wù)),只需投入很少的管理工作,或與服務(wù)供應(yīng)商進行很少的交互情況下這些資源池可以迅速投入使用。由于采用軟件自動管理,而不需人工干預(yù),云計算有利于創(chuàng)新和降低成本。
基于云計算的檔案信息資源共享平臺的實質(zhì)就是:以互聯(lián)網(wǎng)為平臺,運用云計算技術(shù)和理念,向用戶提供檔案信息資源共享服務(wù)的云系統(tǒng)。對于檔案工作人員而言,云計算環(huán)境下的檔案信息資源共享平臺建設(shè)主要針對的是資源和軟、硬件基礎(chǔ)設(shè)施這兩個方面的建設(shè)。檔案工作人員只需要關(guān)心互聯(lián)網(wǎng)中云計算服務(wù)商能否提供各種應(yīng)用所需的硬件設(shè)施,所租用設(shè)施的性價比如何,是否能夠順利支持各項檔案業(yè)務(wù)的開展。用戶則無需了解由那家服務(wù)商來提供資源,資源存于何處,只需按照自己的需求享用服務(wù)。
2.1 總體方案
2.1.1 資源采集。檔案信息資源共享云平臺根據(jù)用戶需求,對分布在各個檔案機構(gòu)的信息資源進行采集。由各個檔案機構(gòu)云共享平臺提出需求,采取整個服務(wù)平臺統(tǒng)一采購的方式,主要包括各類終端設(shè)備、軟硬件設(shè)備、各類檔案信息資源等,既可以使資金效用最大化又可提供最優(yōu)質(zhì)服務(wù)。
2.1.2 檔案資源整合?;谠朴嬎愕臋n案信息資源共享平臺,采用標準的信息服務(wù)規(guī)范構(gòu)建,從而構(gòu)建包含規(guī)?;瘮?shù)據(jù)中心、虛擬服務(wù)器等基礎(chǔ)設(shè)施的統(tǒng)一信息資源服務(wù)平臺。統(tǒng)一標準構(gòu)建的云計算信息資源共享平臺可運用虛擬化技術(shù)將分散于各個檔案機構(gòu)的異構(gòu)信息資源進行無縫遷移、整合、歸檔,同時利用元數(shù)據(jù)收割技術(shù),重新組建表單,構(gòu)建云計算數(shù)據(jù)處理中心。整合后的檔案信息資源不僅能更好地滿足用戶不斷增長的個性化信息需求,又可以協(xié)調(diào)各成員機構(gòu)的信息資源布局,突出各自館藏資源特色,避免重復(fù)建設(shè)和資源浪費。
2.1.3 檔案信息資源安全保護。首先,面對嚴峻復(fù)雜的網(wǎng)絡(luò)安全形勢,各節(jié)點檔案機構(gòu)應(yīng)采取積極措施,確保存儲在云共享平臺中的信息資源安全可用。各節(jié)點檔案機構(gòu)應(yīng)定期對自己的館藏信息資源進行更新、維護、備份,以確保數(shù)據(jù)的可用性、可靠性。對于云計算服務(wù)商來說,管理和存儲數(shù)據(jù)可采用采用虛擬化海量存儲技術(shù)和基于信息生命周期的網(wǎng)絡(luò)存儲技術(shù)。其次,為避免云共享平臺信息資源在存儲、傳輸過程中被惡意下載或篡改,保證其完整性與保密性,應(yīng)建設(shè)完備的公共密鑰和數(shù)字簽名平臺,使各成員機構(gòu)通過加密及數(shù)字簽名技術(shù)保證便捷的使用平臺服務(wù),為整個云共享平臺創(chuàng)造一個安全可靠的網(wǎng)絡(luò)運行環(huán)境。第三,根據(jù)用戶不同類型的信息需求,嚴格控制其操作權(quán)限,控制不同級別用戶對共享平臺的訪問權(quán)限[1]。
2.1.4 良好的用戶服務(wù)。云共享平臺可以為用戶提供統(tǒng)一的操作界面、良好的用戶交互服務(wù)和一系列應(yīng)用程序。用戶通過統(tǒng)一友好的服務(wù)界面提交信息請求,云共享平臺通過解析和規(guī)范化處理后發(fā)布至節(jié)點服務(wù)器,節(jié)點服務(wù)器中的數(shù)據(jù)庫與查詢信息進行關(guān)鍵詞匹配并及時將結(jié)果反饋至云共享平臺,由其進一步挖掘、分析、提取,將完整的信息資源提供給用戶。
2.2 應(yīng)用體系構(gòu)建
基于云計算的檔案信息資源共享平臺需從微觀和技術(shù)層面來研究和解決數(shù)據(jù)管理、系統(tǒng)集成和應(yīng)用服務(wù)問題?;谠朴嬎愕臋n案信息資源共享平臺應(yīng)用體系架構(gòu)是云計算共享模式的充實和完善,在應(yīng)用體系架構(gòu)的基礎(chǔ)上,才能構(gòu)建出更加合理的檔案信息資源共享服務(wù)模式?;谠朴嬎愕臋n案信息資源共享平臺的應(yīng)用體系,如圖所示。
云基礎(chǔ)設(shè)施平臺提供共享所需的信息技術(shù)基礎(chǔ)設(shè)施資源,包括操作系統(tǒng)、存儲空間、軟硬件設(shè)備、網(wǎng)絡(luò)資源等。通過云共享平臺虛擬化技術(shù)整合外網(wǎng)、專網(wǎng)和內(nèi)網(wǎng)所屬各個檔案機構(gòu)的軟硬件資源,實現(xiàn)資源池化,減少重復(fù)建設(shè)?;A(chǔ)設(shè)施層通過整合云存儲和云數(shù)據(jù)管理服務(wù),實現(xiàn)了海量數(shù)據(jù)的動態(tài)存儲、分級存數(shù)和應(yīng)用服務(wù),并對檔案數(shù)據(jù)進行安全監(jiān)控,建立安全可靠的云計算環(huán)境,為各級各類檔案信息資源應(yīng)用系統(tǒng)提供高安全性的數(shù)據(jù)中心。
應(yīng)用平臺層主要提供應(yīng)用部署環(huán)境和應(yīng)用系統(tǒng)開發(fā)環(huán)境,定義統(tǒng)一的Web注冊服務(wù)和發(fā)布接口、數(shù)據(jù)交換對接接口、應(yīng)用集成接口,屏蔽底層云基礎(chǔ)設(shè)施的復(fù)雜性,以實現(xiàn)跨部門檔案信息資源分布、動態(tài)的應(yīng)用集成需求,提供各類檔案信息資源系統(tǒng)部署的中間件環(huán)境。
應(yīng)用服務(wù)層以設(shè)施層和平臺層為基礎(chǔ),提供多樣化的共享應(yīng)用服務(wù),包括統(tǒng)一身份認證服務(wù)、訪問控制服務(wù)、工作流引擎服務(wù)、通用報表、決策支持等。系統(tǒng)平臺可以提供跨機構(gòu)的信息共享目錄和交換應(yīng)用體系,以及元數(shù)據(jù)和語義管理應(yīng)用。檔案信息資源應(yīng)用商店提供軟件按需使用服務(wù),避免各級檔案部門重復(fù)建設(shè)各種信息資源應(yīng)用程序,提升信息資源共享能力。
基于云計算的檔案信息資源共享體系架構(gòu)中的三個層次既可以單獨提供應(yīng)用服務(wù),也可以統(tǒng)一起來提供新的服務(wù),有利于增加系統(tǒng)彈性,加快跨部門、跨區(qū)域的檔案信息資源共享系統(tǒng)建設(shè)效率。基于該架構(gòu)的共享云平臺提供了檔案信息資源共享的服務(wù)平臺、數(shù)據(jù)平臺、應(yīng)用平臺、網(wǎng)絡(luò)平臺,為全面整合分散在各地區(qū)、各部門的檔案信息資源,組織各部門的檔案信息資源,提供了統(tǒng)一的云共享平臺[2]。
2.3 數(shù)據(jù)中心構(gòu)建
基于云計算的檔案信息資源共享平臺的實現(xiàn),它要依賴于相對獨立的檔案信息資源云數(shù)據(jù)中心。這個中心應(yīng)為一個獨立的機構(gòu),如云計算服務(wù)商等。目前,針對檔案信息資源共享應(yīng)用的實際情況,建立檔案信息資源云數(shù)據(jù)中心可以采用兩種模式:一是外包,在現(xiàn)有的云計算服務(wù)平臺基礎(chǔ)上,將檔案信息資源共享工作外包給云計算提供商。二是自建,構(gòu)建相對獨立的檔案信息資源共享云共享中心。這兩種模式均各有優(yōu)劣,第一種模式可以降低構(gòu)建檔案信息資源共享平臺的成本,構(gòu)建周期短,方便靈活、易于修改。第二種模式具有較強的專業(yè)性和針對性,尤其是目前云計算服務(wù)平臺發(fā)展尚不成熟,有利于保持檔案信息資源體系的獨立和完整,在保障數(shù)據(jù)安全方面更具有優(yōu)勢。
2.4 內(nèi)容構(gòu)建
2.4.1 元數(shù)據(jù)注冊系統(tǒng)的設(shè)計
在云共享平臺中檔案信息資源元數(shù)據(jù)注冊系統(tǒng)(Metadata Registry,MR)是發(fā)布、登記、管理和檢索檔案資源元數(shù)據(jù)的定義信息、置標方案、轉(zhuǎn)換規(guī)則、著錄規(guī)則和應(yīng)用指南等的標準規(guī)范系統(tǒng),并支持“云計算”中檔案信息資源元數(shù)據(jù)規(guī)范的發(fā)現(xiàn)、識別、解析、調(diào)用、接口、查找、交流以及在此基礎(chǔ)上實現(xiàn)檔案信息資源元數(shù)據(jù)轉(zhuǎn)換、挖掘和復(fù)用[2]。因此,基于云計算的檔案信息資源共享平臺建立一個權(quán)威可靠,具有可持續(xù)性和可擴展性的檔案信息資源元數(shù)據(jù)規(guī)范及登記管理機制是設(shè)計元數(shù)據(jù)注冊系統(tǒng)的重要目標。
2.4.2 構(gòu)建符合“云計算”服務(wù)的管理系統(tǒng)
運用“云計算”服務(wù)技術(shù)后,檔案機構(gòu)只需將所有檔案信息資源交給云計算服務(wù)商,并與其簽署服務(wù)提供及信息安全協(xié)議,而檔案部門的工作人員在無需了解存儲的過程、存儲所在的服務(wù)器位置的情況下,就可完成檔案信息資源存儲。然而,由于檔案往往會涉及國家安全、信息保密等問題,具有“封閉性”的特點,在進行挑選、鑒定工作之后才可將檔案信息資源公開。各檔案機構(gòu)應(yīng)當制定統(tǒng)一標準,將適合公開的檔案信息資源存放于“公有”云共享平臺中,直接面向用戶提供檔案信息資源查找、利用等服務(wù)[3],而那些不適合公開的檔案信息資源,則應(yīng)存放在自建架構(gòu)的檔案信息資源“私有”云共享平臺中,通過身份認證后方可查詢,這樣可以提供智能化、個性化的服務(wù),更有利于保護信息安全。
2.4.3 建立統(tǒng)一的元數(shù)據(jù)倉儲系統(tǒng)
要建立一個包含元數(shù)據(jù)訪問和元數(shù)據(jù)倉儲的檔案信息資源元數(shù)據(jù)訪問和聚集的平臺,從而實現(xiàn)異地檔案信息資源元數(shù)據(jù)的集成。另外,要建立一種檔案信息資源元數(shù)據(jù)交換的途徑和交換協(xié)議,從而可以通過這個途徑來實現(xiàn)檔案信息資源元數(shù)據(jù)在不同系統(tǒng)中的互訪,進一步把分布、異構(gòu)的檔案信息資源集成在一起實現(xiàn)檔案信息資源元數(shù)據(jù)管理。
云計算技術(shù)為檔案信息化建設(shè)、實現(xiàn)檔案信息資源共享提供了新思路和新理念。云計算將必然會給檔案信息資源共享工作帶來新的發(fā)展機遇,并以其獨特優(yōu)勢有效解決目前檔案信息資源共享中存在的種種問題,或許它將在檔案信息資源共享和社會信息化進程方面產(chǎn)生深刻的影響。
[1]祝鑫一,陳均.淺析數(shù)字檔案館的云服務(wù)平臺構(gòu)架[J].蘭臺世界,2013(1)中:17-18.
[2]王銳等.政務(wù)信息“共享云”及其建設(shè)策略研究[J].情報學(xué)報,2013(2):78-82.
[3]鄭玲玲.基于城鄉(xiāng)與區(qū)域一體的城建檔案數(shù)據(jù)集成管理應(yīng)用研究——以東莞市數(shù)字城建檔案管理平臺為例[J].檔案學(xué)通訊,2010(5):91-94.
G203
A
1671-0037(2014)04-43-1.5
本文系2013年河南省檔案局科技計劃項目“基于云計算的檔案信息資源共享系統(tǒng)研究”(2013-X-13)的研究成果。
王濤,男,館員,研究方向:信息資源管理。