黃新榮龐文琪王曉杰
(1.南京大學(xué)信息管理學(xué)院,江蘇南京,210093;2.西北大學(xué)公共管理學(xué)院,陜西西安,710127;3.陜西省檔案局,陜西西安,710100)
IT技術(shù)日新月異,云計算、大數(shù)據(jù)等新技術(shù)不斷涌現(xiàn),基于信息技術(shù)的電子文件管理也不斷地發(fā)展,云存儲、檔案云等新的電子文件管理概念已不僅僅是在概念階段,而且開始被眾多公司和檔案館探索實踐。云計算強調(diào)服務(wù)的理念,其所具備的巨大優(yōu)勢為數(shù)字檔案館建設(shè)提供了新的發(fā)展途徑,而在其基礎(chǔ)上衍生出的云歸檔(Cloud Archive)成為眾多企業(yè)和機關(guān)檔案室使用“云”的最佳方案。什么是云歸檔?能否將云歸檔作為檔案部門的新型歸檔方式?本文試圖通過對國內(nèi)外云歸檔的實踐進行分析,探索云環(huán)境下檔案管理的新模式。
歸檔一詞,大家并不陌生,在我國是指業(yè)務(wù)部門將辦理完畢的文件進行整理后向檔案部門移交的過程。這一過程完成了文件向檔案的轉(zhuǎn)化,一般是由業(yè)務(wù)或文書人員向機關(guān)檔案工作人員或檔案室移交。在網(wǎng)絡(luò)環(huán)境下,歸檔往往表現(xiàn)為工作人員將業(yè)務(wù)系統(tǒng)中(如OA系統(tǒng))處理完畢的電子文件向電子檔案管理系統(tǒng)移交。不論是OA系統(tǒng),還是電子檔案管理系統(tǒng),其一般的運行模式都是由各單位自己購買服務(wù)器,運行相應(yīng)的軟件系統(tǒng),自己對系統(tǒng)進行維護,這是典型的網(wǎng)絡(luò)歸檔形式。伴隨著云計算的出現(xiàn),云歸檔逐漸被人們所重視。
云歸檔是在云計算的基礎(chǔ)上衍生出的一種新的檔案網(wǎng)絡(luò)歸檔形式,由云計算服務(wù)提供商按照檔案管理的政策要求,遠程地為用戶提供安全的存儲、歸檔服務(wù),以滿足用戶長期保存電子文件的需求。其和網(wǎng)絡(luò)歸檔的最大區(qū)別在于用戶所使用的電子檔案歸檔服務(wù)是由云計算服務(wù)商所提供的,所有的硬件維護、軟件運行、系統(tǒng)備份等操作,都由專業(yè)的云計算服務(wù)商來提供,檔案用戶只是租用云計算服務(wù)商所提供的服務(wù)。檔案用戶只需要一臺電腦、一條網(wǎng)線就可以接入云歸檔系統(tǒng),完成復(fù)雜的操作,再不需要購買昂貴的服務(wù)器及管理軟件。
和云歸檔相關(guān)的另一個概念是云備份(Cloud Backup),但云歸檔與云備份是完全不同的。全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會(SNIA)對兩者的區(qū)別給出了如下的解釋:“對于云備份來說,云計算是一種備份數(shù)據(jù)的簡單存儲,而對于云計算歸檔和存儲來說,云計算是執(zhí)行具體操作的所在,以便于確保數(shù)據(jù)的長期存儲、保存以及存在?!保?]云備份是在正本損毀或崩潰時用于恢復(fù)數(shù)據(jù),而云歸檔是為了滿足將來企業(yè)查詢的需要或者遵從數(shù)據(jù)管理政策,如合規(guī)性審計(compliance audit)的需要而進行的。兩者的區(qū)別見表1。云備份不能取代云歸檔,云歸檔也不能取代云備份,兩者各有側(cè)重。
和傳統(tǒng)的網(wǎng)絡(luò)歸檔相比,云歸檔具有非常多的優(yōu)勢:
1.3.1 低成本
云歸檔代替?zhèn)鹘y(tǒng)的磁帶、磁盤等離線歸檔方式,可以極大地降低檔案管理者歸檔工作的成本投入。以云的方式進行歸檔工作,檔案管理方只需根據(jù)合同向云服務(wù)商支付相應(yīng)的服務(wù)費或流量費,而無需購買服務(wù)器等昂貴的基礎(chǔ)設(shè)施,同時也就減輕了檔案管理方的庫房壓力。此外,云歸檔產(chǎn)品的開發(fā)、升級、維護工作也全部交由專業(yè)的云服務(wù)商完成,檔案管理方無需配備專業(yè)人員,減少了相應(yīng)的人力投入。
1.3.2 海量存儲
云歸檔以Internet為基礎(chǔ),采用云存儲等技術(shù),可以為檔案管理者提供幾乎無限的存儲空間。隨著電子文件產(chǎn)生數(shù)量的迅猛增長,每個檔案管理者所需要的存儲空間也在迅速增加。在傳統(tǒng)的網(wǎng)絡(luò)歸檔方式下,檔案管理者需要自己不斷購買磁盤陣列、磁帶庫等產(chǎn)品,以滿足自己不斷增大的存儲需求。而在云歸檔的方式下,云服務(wù)商可以根據(jù)檔案管理者的存儲需求動態(tài)地分配存儲空間,節(jié)省了檔案管理者的開支。
1.3.3 低風(fēng)險
云歸檔服務(wù)商可以為用戶提供穩(wěn)定安全的數(shù)據(jù)歸檔服務(wù),授權(quán)用戶可以通過任一聯(lián)網(wǎng)設(shè)備上傳歸檔電子文件、進行檔案檢索,而無需擔(dān)心因本地機中毒、崩潰等問題所造成的數(shù)據(jù)泄密、丟失。此外,云歸檔服務(wù)商還通過多種數(shù)據(jù)保護技術(shù)(如:Autonomy公司采用不同格式將數(shù)據(jù)同步寫入不同物理設(shè)備并位于不同位置,這樣即使整塊磁盤丟失也無法獲取任何有用信息)、權(quán)限管理和加密技術(shù)(如:Symantec公司使用一個256位的AES密鑰對數(shù)據(jù)存放過程加密)等方式來不斷提升云歸檔的安全性。不僅如此,云歸檔服務(wù)還具備有較強的災(zāi)備能力,一旦存儲歸檔數(shù)據(jù)的云遭到破壞,服務(wù)商就會用異步云的備份即時遠程恢復(fù)數(shù)據(jù)。
1.3.4 功能豐富
云歸檔服務(wù)能夠滿足客戶多種媒體形式的數(shù)據(jù)存儲需求,適應(yīng)了多媒體時代的數(shù)據(jù)存儲要求。它以統(tǒng)一的歸檔平臺為基礎(chǔ),可以實現(xiàn)數(shù)據(jù)的動態(tài)實時檢索,利用數(shù)據(jù)生命周期管理的功能將訪問量較少的信息從主站點分離,提高數(shù)據(jù)檢索速度。同時,還具備有全部歸檔數(shù)據(jù)(包括電子郵件、文件、SharePoint、IM、數(shù)據(jù)庫等)的重復(fù)數(shù)據(jù)刪除功能,節(jié)約了存儲空間,提高了檢索結(jié)果的準(zhǔn)確率。此外,服務(wù)商內(nèi)置的數(shù)據(jù)分類服務(wù)可以根據(jù)信息的價值、隱私性自動對數(shù)據(jù)添加背景數(shù)據(jù)和相關(guān)信息,從而提高了檢索結(jié)果的查全率。
由上可見,云歸檔具有成本支出低、存儲容量大、存儲風(fēng)險低、服務(wù)功能豐富等優(yōu)勢,這種歸檔模式一經(jīng)推出,就得到了企業(yè)檔案管理者的積極響應(yīng),美國的一些公司紛紛租用云歸檔產(chǎn)品。而我國的檔案管理部門也已經(jīng)發(fā)現(xiàn)了云歸檔這一模式的發(fā)展?jié)摿?,正在積極推進相關(guān)產(chǎn)品的研制工作。
表1 云備份與云歸檔的對照表
云歸檔是近年來隨著云計算的發(fā)展而發(fā)展起來的新的檔案管理模式,在美國和我國都是新生事物,仔細對比美國和我國的云歸檔,發(fā)現(xiàn)其有許多區(qū)別。
在美國,進入網(wǎng)絡(luò)時代后,很多業(yè)務(wù)逐漸在網(wǎng)絡(luò)上進行,許多公司對于數(shù)據(jù)的備份很重視,花重金購買一些IT公司的災(zāi)備系統(tǒng),如EMC公司的Avamar Data Store系統(tǒng)和IBM公司的Business Continuity and Resiliency Services(BCRS)服務(wù),以保證業(yè)務(wù)系統(tǒng)能24小時不間斷地運行。但對于歸檔并不重視,認為所有資料都可以在業(yè)務(wù)系統(tǒng)中進行查詢,并且通過災(zāi)備系統(tǒng),可以防止業(yè)務(wù)數(shù)據(jù)的意外損失,就可以不用歸檔了。但隨著2002年薩班斯·奧克斯利(Sarbanes-Oxley)等法案的出臺,為了滿足法規(guī)遵從和審計的需要,人們開始逐漸認識到歸檔和備份的區(qū)別,備份并不能代替歸檔,因而獨立的適合的法規(guī)遵從的歸檔系統(tǒng)被開發(fā)出來,開始被一些上市企業(yè)歸檔重要的業(yè)務(wù)文件。2006年以后,隨著云計算的發(fā)展,災(zāi)備系統(tǒng)從傳統(tǒng)的網(wǎng)絡(luò)發(fā)展到云備份,同樣,網(wǎng)絡(luò)歸檔也向云歸檔發(fā)展。當(dāng)前,美國多家公司提供了云歸檔服務(wù),如i365(希捷公司)、Nirvanix公司、Sonian公司、M imecast公司等,其中以Iron Mountain、Autonomy兩公司的產(chǎn)品最具有代表性。
Iron Mountain(鐵山)公司于2009年初首推名為“虛擬文件存儲(VFS)”的云存儲空間,虛擬文件存儲上有一個能夠?qū)⑼ㄓ没ヂ?lián)網(wǎng)文件系統(tǒng)(CIFS)或者網(wǎng)絡(luò)文件系統(tǒng)(NFS)共享給客戶端的設(shè)備,當(dāng)數(shù)據(jù)存放到那個共享設(shè)備上時,它們會根據(jù)ACL、審計跟蹤以及校驗碼的不同,將一個內(nèi)部的鏈路傳送到Iron Mountain公司的在線數(shù)據(jù)存儲上。另外一些虛擬文件存儲(VFS)的特性使得它成為云歸檔市場上一個重要的角色,這些特性包括將數(shù)據(jù)標(biāo)記為在設(shè)備上僅讀/一次寫,多次讀(WORM)、根據(jù)設(shè)備上策略加強數(shù)據(jù)生命周期管理、嚴(yán)格的訪問控制以及強有力的審計報告功能等。虛擬文件存儲沒有搜索功能,不能基于內(nèi)容搜索不能做重復(fù)數(shù)據(jù)刪除操作,其還不具備云歸檔平臺的所有的功能,但卻是指出了將云平臺和歸檔結(jié)合起來的發(fā)展路徑。
作為惠普的子公司,Autonomy于2012年上市了一套包含歸檔、電子發(fā)現(xiàn)、高容量擴展等多種功能的特制惠普 Autonomy 系統(tǒng)套件[2]。該產(chǎn)品以惠普智能數(shù)據(jù)操作層(IDOL)為基礎(chǔ),提供了金字塔似的一系列數(shù)據(jù)歸檔產(chǎn)品和服務(wù),包括有郵件歸檔、即時通訊(IM)歸檔、文件歸檔、微軟SharePoint以及結(jié)構(gòu)化數(shù)據(jù)庫歸檔等功能,可對結(jié)構(gòu)化和非結(jié)構(gòu)化的信息進行分析,在數(shù)據(jù)傳輸?shù)綌?shù)據(jù)中心之前實現(xiàn)重復(fù)數(shù)據(jù)刪除。此外,該系統(tǒng)還擁有Autonomy的私有云和Autonomy Digital Safe云存儲的高容量存儲空間支持,可在任何負載下進行容量擴充?;萜誂utonomy系統(tǒng)充分地融合了惠普基礎(chǔ)架構(gòu)與Autonomy IDOL功能,為客戶提供了穩(wěn)定的數(shù)據(jù)保護、高速的數(shù)據(jù)檢索、強大的容量擴展等市場領(lǐng)先的產(chǎn)品功能?,F(xiàn)在,全球已經(jīng)有上百家公司使用Autonomy公司的產(chǎn)品。
隨著云計算技術(shù)的發(fā)展,國內(nèi)已經(jīng)有多家檔案館在開發(fā)基于云平臺的數(shù)字檔案館方案。其中,陜西省數(shù)字檔案館建設(shè)方案依托電子政務(wù)網(wǎng)絡(luò),采用云計算技術(shù),提出建設(shè)以陜西省檔案館為主體的數(shù)字館云平臺,以此平臺為依托,開發(fā)覆蓋全省各市縣檔案館的數(shù)字檔案館系統(tǒng),各區(qū)縣檔案館不用再開發(fā)自己的數(shù)字檔案館系統(tǒng),僅通過政務(wù)專網(wǎng)就可以接入該平臺,擁有自己的虛擬數(shù)字檔案館。同時,還開發(fā)了省直機關(guān)虛擬檔案室,可以讓省直機關(guān)檔案室的工作人員通過電子政務(wù)網(wǎng)絡(luò)接入數(shù)字檔案館云平臺,開設(shè)自己的虛擬檔案室,對自己機關(guān)形成的數(shù)字檔案和電子文件進行歸檔、著錄等工作,即實現(xiàn)云歸檔[3]。
在該數(shù)字檔案館的云平臺上,開發(fā)適合機關(guān)檔案室使用的虛擬數(shù)字檔案室,各機關(guān)檔案室也不用再購買昂貴的服務(wù)器和軟件系統(tǒng),僅使用一條網(wǎng)線就可以接入云平臺,實現(xiàn)云歸檔。該虛擬檔案室可以支持電子文件的歸檔、電子文件著錄、電子文件元數(shù)據(jù)管理、電子文件的在線查詢等一系列功能。由于公文類型不同,需要著錄的元數(shù)據(jù)不同,著錄業(yè)務(wù)流程也不同,針對此特點,該平臺可以由機關(guān)檔案室對著錄流程、元數(shù)據(jù)進行靈活定制。但同時由于機關(guān)檔案室的檔案,最終要向省數(shù)字檔案館移交,又要求虛擬檔案室與省數(shù)字檔案館之間的數(shù)據(jù)和技術(shù)保持一致,符合省檔案館數(shù)字檔案管理規(guī)范。
相比國外的商業(yè)公司開發(fā)的云歸檔系統(tǒng),國內(nèi)檔案館在數(shù)字檔案館云平臺上開發(fā)的虛擬檔案室系統(tǒng),更加符合國內(nèi)政府機關(guān)檔案室的使用。該虛擬檔案室投入使用后,將會極大地節(jié)省政府各機關(guān)在IT方面的投入,也符合我國文件檔案管理的流程,實現(xiàn)政府機關(guān)的OA系統(tǒng)和虛擬檔案室、數(shù)字檔案館等的一體化管理。而國外的云歸檔系統(tǒng)一般都是由云計算服務(wù)商開發(fā),依賴云存儲平臺,提供商業(yè)服務(wù),競爭激烈,滿足了上市企業(yè)對長期保存合規(guī)文檔的需求。
隨著云計算技術(shù)的發(fā)展,以電子文件為管理對象的檔案管理,也會受云計算技術(shù)的發(fā)展而改變,其中云歸檔就是其中的一種。從本質(zhì)上看,云歸檔和傳統(tǒng)的歸檔工作沒有太大的區(qū)別,都是將工作中處理完畢的有保存價值的文件集中保存,以備日后查詢的需要。隨著網(wǎng)絡(luò)時代的到來,電子文件的數(shù)量迅猛增長,對電子文件的歸檔已經(jīng)成為歸檔工作的重點。而對電子文件的歸檔,往往需要依賴管理系統(tǒng),需要投入比紙質(zhì)檔案更多的資金和技術(shù)投入,所以在選取歸檔模式時,必須考慮技術(shù)、使用成本、可靠性等諸多因素,以最低的成本,實現(xiàn)檔案管理的目標(biāo)。云歸檔正是在這種背景下產(chǎn)生的,代表了將來電子文件管理的發(fā)展趨勢。
當(dāng)然,云歸檔無論對于中國還是美國,都是一個新型的模式,其發(fā)展還不夠成熟,有人對其安全性、可靠性還有質(zhì)疑,許多人是處于觀望的狀態(tài)。當(dāng)前人們對云歸檔的質(zhì)疑主要表現(xiàn)在兩個方面:
一是云歸檔的安全性問題。安全問題,一直是電子文件管理關(guān)注的焦點,人們的顧慮主要在兩個方面:第一,歸檔信息會不會意外丟失?由于云存儲往往采用將一個文件分成塊,而每塊存放在多個服務(wù)器上的文件管理機制,從理論上看,云歸檔要比一般的網(wǎng)絡(luò)歸檔安全。加之云歸檔平臺由專業(yè)的IT公司進行維護,即使采用云歸檔系統(tǒng),IT公司也往往使用云備份來防止系統(tǒng)出意外。因此,云歸檔要比企業(yè)自己管理服務(wù)器安全。第二,歸檔信息會不會被非法訪問?由于電子文件屬于企業(yè)或機關(guān)自己工作中形成的重要文檔,往往具有機密性,而采用云歸檔系統(tǒng)后,由于信息不是放在自己的服務(wù)器上,甚至不知道其放置的物理位置,一旦被非法訪問,就會造成信息泄密,造成巨大的損失。針對此問題,提供云服務(wù)的公司也采取了多種措施來加以保證,主要有高級數(shù)據(jù)保護技術(shù)和加密技術(shù)。如我國的云歸檔平臺,用戶必須要擁有相應(yīng)證書和口令,并且必須通過政務(wù)專網(wǎng)才能進入虛擬檔案室。國外的商業(yè)云歸檔平臺,除了使用證書口令管理外,一般都使用VPN加密通道才能訪問云歸檔系統(tǒng)。并且在云歸檔系統(tǒng)中,對文檔采用加密技術(shù)保護所有用戶數(shù)據(jù)并為每位用戶分配一個256位高級的加密標(biāo)準(zhǔn)(AES)密鑰。M imecast為每位用戶分配一個用戶號,并把他的數(shù)據(jù)也標(biāo)記上該用戶號,用戶只能查看有一致用戶號的數(shù)據(jù)[4]。Autonomy公司允許檔案管理者可以追蹤文檔放置的物理位置或者指定存放的服務(wù)器,而不像一般的公共云那樣,不知文檔的存放物理位置。系統(tǒng)對每個文檔的訪問都有嚴(yán)格的文檔訪問記錄。通過這些技術(shù)手段,來保證文檔的安全性。
二是云歸檔服務(wù)的可靠性問題。由于云歸檔是第三方的公司提供的,所以一旦提供云歸檔的公司出現(xiàn)營運問題,也會造成存在于云中的電子文件丟失或無法訪問。要解決這個問題,國外一般是是采用服務(wù)水平協(xié)議(service level agreement,簡稱SLA)的方式來對提供云歸檔服務(wù)的公司進行制約。如Autonomy公司所提供的SLA涵蓋了數(shù)據(jù)訪問、數(shù)據(jù)寫入磁盤和目錄的速度,數(shù)據(jù)查詢的速度等許多方面。
通過嚴(yán)格的服務(wù)水平協(xié)議,以及嚴(yán)格的安全性管理,國外的云歸檔服務(wù)市場正日漸成熟。而我國提供云歸檔服務(wù)的數(shù)字檔案館平臺,則依賴電子政務(wù)云平臺建造,其比商業(yè)公司更具有可靠性。因此,從發(fā)展的角度來看,云歸檔的風(fēng)險會越來越小,而其優(yōu)勢會越來越突出,讓企業(yè)和機關(guān)無法在“云”前止步不前。
注:該文系陜西省教育廳研究項目(編號:12JK0314)和江蘇省2012年度普通高校研究生科研創(chuàng)新計劃項目(編號:CXZZ12_0074)的階段性成果。
[1]云歸檔是否適應(yīng)你的應(yīng)用環(huán)境?[EB/OL]http://www.enet.com.cn/article/2012/0723/A20120723140358.shtm l.[2013-9-3].
[2]Ron Scruggs.云歸檔技術(shù):在最好的云服務(wù)提供商中選擇最好的特性[EB/OL].http://www.searchstorage.com.cn/show content_37828.htm.[2013-9-3].
[3]黃新榮,王曉杰等.云環(huán)境下我國數(shù)字檔案館建設(shè)模式研究[J]檔案與建設(shè).2013(6):(4-15).
[4]Todd Erickson.云歸檔:合規(guī)數(shù)據(jù)的安全很重要.[EB/OL]:http://www.searchstorage.com.cn/show content_52535.htm.[2013-9-3].