徐娟+劉大巧+趙學(xué)敏+李國(guó)紅
【摘要】隨著高校規(guī)模的不斷擴(kuò)大,高校在教學(xué)科研、人才培養(yǎng)及社會(huì)服務(wù)等過(guò)程中產(chǎn)生的數(shù)據(jù)以指數(shù)級(jí)速度增長(zhǎng),傳統(tǒng)的檔案存儲(chǔ)模式已經(jīng)無(wú)法適應(yīng)檔案數(shù)據(jù)增長(zhǎng)的矛盾。與傳統(tǒng)的存儲(chǔ)模式相比,云存儲(chǔ)以其成本低、高效、海量存儲(chǔ)等優(yōu)勢(shì)越來(lái)越受到人們的關(guān)注。但不可忽視的是使用云存儲(chǔ)模式實(shí)現(xiàn)高校檔案存儲(chǔ)也存在著一定的問(wèn)題和風(fēng)險(xiǎn)。本文詳細(xì)分析了高校檔案云存儲(chǔ)實(shí)現(xiàn)的特點(diǎn)和優(yōu)勢(shì),此外針對(duì)可能存在的問(wèn)題和風(fēng)險(xiǎn),提出了相應(yīng)的解決方案。
【關(guān)鍵詞】大數(shù)據(jù);高校檔案;云存儲(chǔ)
高校檔案是高校教育教學(xué)活動(dòng)的真實(shí)記錄,是高校從事教育教學(xué)活動(dòng)、高校管理、教學(xué)科研工作必不可少的參考借鑒資料。高校檔案不僅是高校政策決策的重要保障,也是高校日常管理決策不可或缺的資源。
然而,隨著計(jì)算機(jī)網(wǎng)絡(luò)、云計(jì)算等信息技術(shù)的飛速發(fā)展,整個(gè)社會(huì)已經(jīng)邁入了大數(shù)據(jù)時(shí)代,高校也不例外。在大數(shù)據(jù)背景下,高校學(xué)生的學(xué)籍、發(fā)表的論文、課程成績(jī)以及教師的基本信息、教學(xué)課件、發(fā)表的科研論文、參加的科研項(xiàng)目等會(huì)產(chǎn)生大量數(shù)據(jù),同時(shí)還有實(shí)驗(yàn)室設(shè)備、學(xué)校機(jī)房和行政部門(mén)產(chǎn)生的檔案信息等也會(huì)產(chǎn)生海量數(shù)據(jù)。除了在學(xué)生培養(yǎng)方面會(huì)產(chǎn)生海量數(shù)據(jù)外,高校行政管理活動(dòng)、科研和學(xué)術(shù)交流、社會(huì)服務(wù)等方面也都會(huì)產(chǎn)生海量數(shù)據(jù),這些數(shù)據(jù)數(shù)量大,數(shù)據(jù)結(jié)構(gòu)多樣,數(shù)據(jù)來(lái)源廣泛,明顯具備了大數(shù)據(jù)的特征,對(duì)這些有價(jià)值的數(shù)據(jù)信息進(jìn)行歸檔存儲(chǔ),并確保在需要時(shí)能被有效地查詢(xún)和利用,這將成為高校檔案部門(mén)無(wú)法推脫的責(zé)任,同時(shí)也為高校檔案工作帶來(lái)巨大的挑戰(zhàn)。目前高校檔案管理面臨的最主要的兩個(gè)挑戰(zhàn):一是如何為檔案數(shù)據(jù)提供足夠大的存儲(chǔ)空間。二是如何為用戶(hù)提供一個(gè)更安全、高效、方便的檔案訪問(wèn)平臺(tái)。幸運(yùn)的是,面對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn),云存儲(chǔ)技術(shù)應(yīng)運(yùn)而生。簡(jiǎn)潔地說(shuō),“云存儲(chǔ)”是將數(shù)據(jù)資源存放到網(wǎng)絡(luò)上供人們查詢(xún)的一種新興方案。用戶(hù)可以在任何時(shí)間、任何地方,通過(guò)任意可上網(wǎng)的設(shè)備方便地存取數(shù)據(jù)?,F(xiàn)在許多國(guó)內(nèi)外的大公司如微軟、亞馬遜和谷歌已經(jīng)引入了相關(guān)的云存儲(chǔ)平臺(tái)服務(wù)。在大數(shù)據(jù)背景下,如果能將云存儲(chǔ)技術(shù)應(yīng)用到高校檔案管理領(lǐng)域,不僅可以解決以上兩個(gè)挑戰(zhàn),也將會(huì)為高效檔案事業(yè)帶來(lái)歷史性的變革。
一、云存儲(chǔ)在高校檔案管理中的優(yōu)勢(shì)
(一)云存儲(chǔ)技術(shù)的應(yīng)用,能降低高校檔案管理的成本,提高檔案資源的利用率。傳統(tǒng)的數(shù)據(jù)存儲(chǔ)都是靜態(tài)的,多用于存儲(chǔ)PB級(jí)以下的數(shù)據(jù)。若采用傳統(tǒng)的存儲(chǔ)架構(gòu),當(dāng)存儲(chǔ)容量需求增加時(shí),就需要添加新的存儲(chǔ)陣列。隨著需要管理的陣列數(shù)增加,存儲(chǔ)環(huán)境變得日益復(fù)雜,管理難度更大,需要的運(yùn)營(yíng)成本也隨之增加。而云存儲(chǔ)能夠?qū)崿F(xiàn)動(dòng)態(tài)擴(kuò)展,按需求進(jìn)行配置。各高校檔案館可以根據(jù)自身需求申請(qǐng)適當(dāng)?shù)拇鎯?chǔ)容量,無(wú)須額外的存儲(chǔ)設(shè)備,相比較傳統(tǒng)存儲(chǔ)模式,降低了購(gòu)置設(shè)備的成本。存儲(chǔ)平臺(tái)的運(yùn)行和維護(hù)工作由云存儲(chǔ)提供商完成,降低了高校檔案管理系統(tǒng)運(yùn)行維護(hù)的成本。云存儲(chǔ)提供了一個(gè)較為開(kāi)放的訪問(wèn)平臺(tái),用戶(hù)可以隨時(shí)隨地通過(guò)任何可上網(wǎng)的設(shè)備訪問(wèn)檔案資源,這就解決了某些用戶(hù)由于時(shí)間、地點(diǎn)等因素限制而無(wú)法實(shí)時(shí)訪問(wèn)檔案資源的問(wèn)題,從而大大提高了高校檔案資源的利用率。
(二)云存儲(chǔ)技術(shù)的應(yīng)用,能為檔案數(shù)據(jù)提供海量的存儲(chǔ)空間。隨著高校檔案信息化建設(shè)的不斷加快,高校檔案數(shù)據(jù)也由原來(lái)單一形式向電子文件、圖像、視頻、音頻等多種形式發(fā)展,高校檔案館要安全存儲(chǔ)這些數(shù)據(jù),需要不斷擴(kuò)充服務(wù)器和相應(yīng)的存儲(chǔ)設(shè)備,這會(huì)給高校檔案館帶來(lái)很大的資金壓力。由云計(jì)算發(fā)展起來(lái)的云存儲(chǔ)平臺(tái),用戶(hù)只需要利用幾臺(tái)可以上網(wǎng)的電腦終端就可以方便地上傳和下載存儲(chǔ)在云中的電子文件。云由成千上萬(wàn)的存儲(chǔ)設(shè)備和服務(wù)器集群構(gòu)成,它具有無(wú)限的存儲(chǔ)空間和海量的存儲(chǔ)能力,能夠更好地滿(mǎn)足檔案數(shù)據(jù)海量增長(zhǎng)的存儲(chǔ)需求。
(三)云存儲(chǔ)技術(shù)的應(yīng)用,能增強(qiáng)容災(zāi)、異地備份能力。云存儲(chǔ)可以實(shí)現(xiàn)跨領(lǐng)域部署,并可以通過(guò)虛擬化技術(shù)實(shí)現(xiàn)多物理存儲(chǔ)節(jié)點(diǎn)、多應(yīng)用系統(tǒng)和多業(yè)務(wù)服務(wù)協(xié)調(diào)的共享存儲(chǔ)構(gòu)架。特別是當(dāng)發(fā)生不可預(yù)測(cè)的數(shù)據(jù)災(zāi)難時(shí),通過(guò)云存儲(chǔ)的分布式備份功能可以實(shí)現(xiàn)檔案數(shù)據(jù)的快速恢復(fù)。同時(shí),云存儲(chǔ)可實(shí)現(xiàn)數(shù)字檔案網(wǎng)絡(luò)在線異地備份,以上兩類(lèi)功能可避免各高校檔案館單獨(dú)存儲(chǔ)檔案數(shù)據(jù)時(shí)遭遇停電、火災(zāi)、水災(zāi)、地震等特殊災(zāi)難情況時(shí)可能帶來(lái)的檔案數(shù)據(jù)丟失和損失。
(四)云存儲(chǔ)技術(shù)的應(yīng)用,能實(shí)現(xiàn)檔案數(shù)據(jù)中復(fù)雜數(shù)據(jù)類(lèi)型的虛擬化存儲(chǔ)。采用云存儲(chǔ)所具備的虛擬化技術(shù)和大數(shù)據(jù)管理技術(shù),能實(shí)現(xiàn)很好地復(fù)雜數(shù)據(jù)類(lèi)型的虛擬化存儲(chǔ)。特別是針對(duì)特殊類(lèi)型的檔案,如:電子期刊、古典文籍、照片資源、音頻視頻文件等。
二、云存儲(chǔ)在高校檔案存儲(chǔ)中的存在的問(wèn)題和風(fēng)險(xiǎn)
(一)云存儲(chǔ)平臺(tái)的安全風(fēng)險(xiǎn)。高校檔案的保密性以及檔案工作的機(jī)密性決定了高校檔案存儲(chǔ)需要一個(gè)相對(duì)安全的存儲(chǔ)環(huán)境,現(xiàn)有的高校檔案存儲(chǔ)方式在檔案安全存儲(chǔ)方面有一定的優(yōu)勢(shì)。首先,云存儲(chǔ)自身的虛擬化、無(wú)邊界性、流動(dòng)性等特性,使得其面臨較多的安全威脅。其次,與傳統(tǒng)的存儲(chǔ)方式不同,云存儲(chǔ)是將數(shù)據(jù)信息存儲(chǔ)在云端,這對(duì)數(shù)據(jù)的存儲(chǔ)安全、傳輸安全、服務(wù)安全和訪問(wèn)控制都帶來(lái)極大的挑戰(zhàn)。同時(shí),云存儲(chǔ)應(yīng)用導(dǎo)致網(wǎng)絡(luò)資源、信息資源、用戶(hù)數(shù)據(jù)和應(yīng)用的高度集中,由此帶來(lái)的安全隱患與安全風(fēng)險(xiǎn)也較傳統(tǒng)應(yīng)用高出很多。目前為止,還沒(méi)有任何一家云存儲(chǔ)供應(yīng)商保證可以提供絕對(duì)安全的存儲(chǔ)平臺(tái)。此外,如果將不能公開(kāi)的數(shù)字檔案以遠(yuǎn)程方式存儲(chǔ)到云端,必定會(huì)引發(fā)檔案管理者的擔(dān)憂(yōu)。
(二)云存儲(chǔ)的可靠性問(wèn)題。大多數(shù)云服務(wù)供應(yīng)商都對(duì)云存儲(chǔ)的安全性做出過(guò)承諾,但亞馬遜彈性云服務(wù)出現(xiàn)的服務(wù)中斷事件以及微軟出現(xiàn)的云數(shù)據(jù)托管中斷事件都表明用戶(hù)能否訪問(wèn)到自己的云存儲(chǔ)數(shù)據(jù)取決于云服務(wù)提供商的服務(wù)是否可靠,一旦云服務(wù)供應(yīng)商出現(xiàn)問(wèn)題,用戶(hù)則無(wú)法正常訪問(wèn)自己存儲(chǔ)在云服務(wù)上的數(shù)據(jù),因此可靠性問(wèn)題是目前云存儲(chǔ)急需解決的難題。
(三)缺乏可靠的國(guó)內(nèi)云存儲(chǔ)供應(yīng)商?,F(xiàn)在大部分成功的云存儲(chǔ)供應(yīng)商都是Google、微軟等國(guó)外品牌,盡管?chē)?guó)內(nèi)的一些IT公司正努力追求云存儲(chǔ)技術(shù),但就技術(shù)水平和發(fā)展規(guī)模來(lái)看還存在一定的差距。當(dāng)高校檔案選擇云存儲(chǔ)方式,云平臺(tái)就控制了檔案數(shù)據(jù),這將會(huì)導(dǎo)致潛在的數(shù)據(jù)威脅行為,例如通過(guò)數(shù)據(jù)挖掘技術(shù)挖掘機(jī)密的檔案信息。因此,在某種程度上我們更希望找到一個(gè)具有獨(dú)立R&D 認(rèn)證的國(guó)內(nèi)云存儲(chǔ)供應(yīng)商,最大程度地保證高校檔案的安全性和保密性。
(四)缺乏統(tǒng)一的云存儲(chǔ)技術(shù)標(biāo)準(zhǔn)。在技術(shù)層面,對(duì)于長(zhǎng)期有效存儲(chǔ)數(shù)字檔案尚存在很多需要解決的問(wèn)題,其中最重要的問(wèn)題之一就是技術(shù)標(biāo)準(zhǔn)問(wèn)題。想要實(shí)現(xiàn)數(shù)字文件長(zhǎng)期、高效地存儲(chǔ),必須制定一系列的統(tǒng)一的存儲(chǔ)標(biāo)準(zhǔn)。然而,到目前為止國(guó)際上還未形成一套公認(rèn)的數(shù)字檔案信息長(zhǎng)期保存的標(biāo)準(zhǔn),這有可能導(dǎo)致在將檔案數(shù)據(jù)上傳到云端的過(guò)程中產(chǎn)生數(shù)據(jù)丟失、錯(cuò)序等問(wèn)題,從而直接影響檔案數(shù)據(jù)的完整性和一致性。
三、高校檔案云存儲(chǔ)實(shí)現(xiàn)的觀點(diǎn)
(一) 積極參與檔案云存儲(chǔ)設(shè)計(jì)。高校應(yīng)該以檔案管理部門(mén)為領(lǐng)導(dǎo),由各部門(mén)共同支持建立起一個(gè)較為全面的檔案管理系統(tǒng),從而避免過(guò)多地依賴(lài)于云服務(wù)供應(yīng)商。在檔案管理系統(tǒng)的核心設(shè)計(jì)以及資源建設(shè)過(guò)程中,高校內(nèi)部應(yīng)該制定一套統(tǒng)一的安全標(biāo)準(zhǔn)和機(jī)密性協(xié)議,所有的檔案管理人員都應(yīng)積極參與檔案云存儲(chǔ)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),學(xué)習(xí)云存儲(chǔ)相關(guān)的知識(shí),建立一個(gè)規(guī)模合理的檔案管理系統(tǒng)。考慮到高校檔案的保密性要求,在云存儲(chǔ)供應(yīng)商進(jìn)行系統(tǒng)維護(hù)以及業(yè)務(wù)合作過(guò)程中需要建立一套嚴(yán)格的機(jī)密性協(xié)議,以降低檔案數(shù)據(jù)泄密的風(fēng)險(xiǎn)。
(二)建立高校檔案私有云。云服務(wù)按部署方式和服務(wù)對(duì)象范圍可以分為三類(lèi),即公共云、私有云和混合云。公共云通常適用于大規(guī)模和多用戶(hù)。相對(duì)于公共云和混合云,私有云的用戶(hù)完全擁有整個(gè)云中心設(shè)施,提供了更多地安全和保密等專(zhuān)屬性的保證,因此在安全性、法規(guī)遵從以及服務(wù)質(zhì)量方面更加具有保障。高校檔案管理選擇私有云可以保障在使用云存儲(chǔ)技術(shù)的同時(shí)最大程度地維持對(duì)檔案數(shù)據(jù)的控制權(quán),提高檔案的安全性和保密性。
(三)建立云存儲(chǔ)平臺(tái)下的檔案數(shù)據(jù)的安全備份策略。采用云存儲(chǔ)技術(shù)存儲(chǔ)高校檔案數(shù)據(jù)后,相應(yīng)的備份策略也會(huì)發(fā)生根本性的變化,由脫機(jī)備份轉(zhuǎn)換為網(wǎng)絡(luò)在線備份。為了提高檔案數(shù)據(jù)的存儲(chǔ)安全和災(zāi)難恢復(fù)能力,高??梢赃x擇對(duì)檔案數(shù)據(jù)進(jìn)行多套備份,通過(guò)將檔案數(shù)據(jù)副本在本地、同城和異地進(jìn)行備份的策略,實(shí)現(xiàn)檔案數(shù)據(jù)資源的多套多地備份,這不僅能夠提高檔案數(shù)據(jù)訪問(wèn)的實(shí)時(shí)性和共享性,更加增強(qiáng)了檔案數(shù)據(jù)的容災(zāi)能力。對(duì)于重要的、機(jī)密的高校檔案數(shù)據(jù)應(yīng)該做好提前備份,一旦云存儲(chǔ)數(shù)據(jù)庫(kù)遭受致命損壞時(shí),可以立即啟動(dòng)備份系統(tǒng)以確保高校檔案數(shù)據(jù)的正常使用。
(四)加強(qiáng)云存儲(chǔ)人才的建設(shè)和培養(yǎng)。將檔案數(shù)據(jù)向私有云遷移時(shí),需要采用成熟的技術(shù)方案,解決私有云的系統(tǒng)建設(shè)及運(yùn)營(yíng)管理安全工作。同時(shí),應(yīng)做好系統(tǒng)容災(zāi)、數(shù)據(jù)備份,以及業(yè)務(wù)回退機(jī)制,以提高應(yīng)對(duì)各類(lèi)突發(fā)事件安全事件的處理能力,這些工作都離不開(kāi)掌握相關(guān)技術(shù)的IT技術(shù)人員。管理檔案系統(tǒng)的IT技術(shù)人員不僅要有較為深厚的計(jì)算機(jī)背景知識(shí),還需要熟悉檔案的相關(guān)知識(shí)。因此,高校檔案館建設(shè)要注重人才的建設(shè)和培養(yǎng),做好人才的儲(chǔ)備工作。
四、結(jié)語(yǔ)
云存儲(chǔ)技術(shù)的出現(xiàn)為高校海量檔案數(shù)據(jù)的高效存儲(chǔ)和利用提供了新的平臺(tái),為高校檔案的管理工作指明了新的發(fā)展方向,高校檔案管理工作者應(yīng)積極投入到高校檔案私有云建設(shè)中,充分利用云存儲(chǔ)的技術(shù)優(yōu)勢(shì)。同時(shí),也要重視高校檔案云存儲(chǔ)中存在的問(wèn)題和風(fēng)險(xiǎn),尤其是檔案安全和保密問(wèn)題,積極提出相應(yīng)的策略。
本文系云南省檔案科技項(xiàng)目“基于Hadoop云平臺(tái)的高校檔案資源管理研究”(項(xiàng)目編號(hào):2016-y-125-006)研究成果之一。
【參考文獻(xiàn)】
[1] Zhao Yi. Opportunities and risks: Electronic document management under cloud computingenvironment [J]. Journal of Archives and construction, 2013(10):4-7.
[2]張桂剛,李超,張勇,邢春曉.一種基于海量信息處理的云存儲(chǔ)模型研究[J].計(jì)算機(jī)研究與發(fā)展,2012(S1):32-36.
[3]朱悅?cè)A,何麗萍,丁建萍.“云檔案”信息資源共享系統(tǒng)研究[J].浙江檔案,2012(6):52-53.
[4]薛四新,陶水龍,崔偉.數(shù)字檔案館云計(jì)算建設(shè)模式的思考——以北京市區(qū)域性數(shù)字檔案館為例[J].檔案學(xué)研究,2012(3):62-64.