洪克詩(shī)
摘 要 大數(shù)據(jù)時(shí)代下,數(shù)據(jù)海量且紛繁復(fù)雜,這在豐富圖書(shū)館資源的同時(shí)也給圖書(shū)館數(shù)據(jù)存儲(chǔ)安全管理等方面帶來(lái)了新的挑戰(zhàn)。本文立足于對(duì)大數(shù)據(jù)的特征把握,結(jié)合目前圖書(shū)館面臨的存儲(chǔ)安全管理問(wèn)題,探討了圖書(shū)館存儲(chǔ)安全管理的有效策略,以期構(gòu)建更加科學(xué)、高效的圖書(shū)館存儲(chǔ)與安全管理模式。
關(guān)鍵詞 圖書(shū)館;大數(shù)據(jù);數(shù)據(jù)存儲(chǔ);安全管理
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2016)164-0125-02
1 大數(shù)據(jù)時(shí)代下的數(shù)據(jù)特征
關(guān)于大數(shù)據(jù)至今各界尚未有一個(gè)統(tǒng)一且全面的定義,但筆者比較認(rèn)同的一個(gè)定義方式是:大數(shù)據(jù)是難以在傳統(tǒng)思維及常規(guī)軟件的基礎(chǔ)上,在規(guī)定時(shí)間內(nèi)對(duì)其內(nèi)容實(shí)施采集、管理及分析的數(shù)據(jù)集合[1]。大數(shù)據(jù)時(shí)代下的數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類多、流動(dòng)速度快、價(jià)值密度低等特點(diǎn)。不難看出,在大數(shù)據(jù)的背景下無(wú)論是從管理角度還是技術(shù)角度,對(duì)于圖書(shū)館的數(shù)據(jù)安全管理,尤其是基于海量數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)安全管理,都是新的挑戰(zhàn)。
1.1 數(shù)量巨大
通常認(rèn)為,數(shù)據(jù)量大于10TB即為大數(shù)據(jù)。伴隨著計(jì)算機(jī)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)普及,以及社交網(wǎng)絡(luò)對(duì)人們生活的不斷滲入,人們的個(gè)人信息、網(wǎng)絡(luò)足跡、網(wǎng)絡(luò)交際等數(shù)據(jù)爆炸性增長(zhǎng),這些信息與長(zhǎng)期積累的結(jié)構(gòu)化數(shù)據(jù)共同構(gòu)成了大數(shù)據(jù)。對(duì)于圖書(shū)館來(lái)說(shuō),紙質(zhì)電子資源增多,以及用戶增多帶來(lái)的大量用戶信息,隨著時(shí)間推移,數(shù)據(jù)量會(huì)越來(lái)越大。
1.2 種類繁多
數(shù)據(jù)種類繁多主要是指數(shù)據(jù)結(jié)構(gòu)的多樣化。伴隨著傳感器技術(shù)、移動(dòng)終端、通信設(shè)備的廣泛應(yīng)用,數(shù)據(jù)結(jié)構(gòu)形成結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化共存的局面,如音頻、視頻、網(wǎng)頁(yè)等形式。
1.3 流動(dòng)速度快
流動(dòng)速度快主要指數(shù)據(jù)創(chuàng)建與處理速度。實(shí)時(shí)性是大數(shù)據(jù)的一個(gè)顯著特征,生活在互聯(lián)網(wǎng)環(huán)境中,人們通過(guò)移動(dòng)終端使用的各類應(yīng)用,如天氣、物流、交通等應(yīng)用,這些應(yīng)用使用或產(chǎn)生的數(shù)據(jù)都是具有實(shí)時(shí)性的,即為流式數(shù)據(jù)。對(duì)于這些數(shù)據(jù),傳統(tǒng)的軟件顯然不能處理。
1.4 價(jià)值密度低
大數(shù)據(jù)的價(jià)值獲取和應(yīng)用是大數(shù)據(jù)應(yīng)用的最終目標(biāo)。然而在數(shù)據(jù)大量增長(zhǎng)的同時(shí),蘊(yùn)含于其中的數(shù)據(jù)價(jià)值并未顯著增長(zhǎng),因而數(shù)據(jù)價(jià)值密度降低,這就大大增加了獲取有價(jià)值信息的難度。
2 大數(shù)據(jù)時(shí)代圖書(shū)館面臨的存儲(chǔ)安全問(wèn)題
在大數(shù)據(jù)背景下,圖書(shū)館非結(jié)構(gòu)化數(shù)據(jù)占80%以上,這為圖書(shū)館數(shù)據(jù)存儲(chǔ)方面提出了新的要求,具體體現(xiàn)在存儲(chǔ)模式、安全級(jí)別劃分、身份驗(yàn)證等方面。
2.1 存儲(chǔ)模式局限
隨著數(shù)據(jù)量及數(shù)據(jù)復(fù)雜程度的迅速增長(zhǎng),非關(guān)系型數(shù)據(jù)庫(kù)由于可擴(kuò)展性及可用性較強(qiáng)優(yōu)勢(shì)被廣泛應(yīng)用,成為圖書(shū)館數(shù)據(jù)存儲(chǔ)的主要方式。然而,由于非關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)服務(wù)器軟件內(nèi)置安全管理系統(tǒng)不足且存在較大安全漏洞,造成在數(shù)據(jù)訪問(wèn)控制及用戶隱私管理方面存在較大難度。
2.2 安全級(jí)別劃分問(wèn)題
圖書(shū)館在統(tǒng)一管理平臺(tái)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、管理、分析、應(yīng)用的過(guò)程中,難以對(duì)數(shù)據(jù)按照安全級(jí)別進(jìn)行劃分并分類存儲(chǔ)。同時(shí),數(shù)據(jù)庫(kù)在用戶進(jìn)行訪問(wèn)的過(guò)程中,會(huì)將組織架構(gòu)暴露給發(fā)起訪問(wèn)的程序,安全性受到威脅。另外,由于用戶在操作中與多個(gè)信息節(jié)點(diǎn)進(jìn)行通信,數(shù)據(jù)庫(kù)難以對(duì)訪問(wèn)者身份權(quán)限進(jìn)行即時(shí)驗(yàn)證。
2.3 安全管理產(chǎn)品局限
非結(jié)構(gòu)型數(shù)據(jù)庫(kù)在進(jìn)行大數(shù)據(jù)資源操作中,會(huì)在多個(gè)網(wǎng)絡(luò)通信會(huì)話間建立協(xié)調(diào)任務(wù),因而傳統(tǒng)安全管理產(chǎn)品具有的系統(tǒng)監(jiān)視、日志分析以及安全評(píng)估等功能難以運(yùn)行或難以取得良好效果,同時(shí)還可能對(duì)大數(shù)據(jù)應(yīng)用效率等方面帶來(lái)不利影響。
3 大數(shù)據(jù)背景下的圖書(shū)館存儲(chǔ)安全管理策略
3.1 利用大數(shù)據(jù)決策及時(shí)發(fā)現(xiàn)安全威脅
圖書(shū)館在利用大數(shù)據(jù)技術(shù)來(lái)保護(hù)自身系統(tǒng)與服務(wù)安全時(shí),不應(yīng)僅僅將防范目標(biāo)鎖定在惡意事件的發(fā)現(xiàn)上,也應(yīng)結(jié)合大數(shù)據(jù)安全資源進(jìn)行分析,確定惡意攻擊的來(lái)源、攻擊途徑及危害程度等,并結(jié)合數(shù)據(jù)挖掘與關(guān)聯(lián)技術(shù),實(shí)現(xiàn)對(duì)未來(lái)攻擊的來(lái)源、途徑及目的預(yù)測(cè),提前把握危害程度,做好防范。
同時(shí),在安全管理大數(shù)據(jù)平臺(tái)的構(gòu)建過(guò)程中,在維持平臺(tái)一定的復(fù)雜程度與合理建設(shè)成本的條件下,盡可能選取技術(shù)成熟且兼容性強(qiáng)的數(shù)據(jù)包捕捉與分析工具,以此來(lái)實(shí)現(xiàn)信息的快速采集、定位與科學(xué)分析、決策的過(guò)程。而系統(tǒng)結(jié)構(gòu)過(guò)于復(fù)雜的安全管理產(chǎn)品會(huì)導(dǎo)致平臺(tái)功能性與可控性的大幅度降低。
同時(shí),加強(qiáng)對(duì)安全數(shù)據(jù)倉(cāng)庫(kù)諸如監(jiān)控日志、工作日志、服務(wù)器日志、防火墻日志等的管理控制,有助于圖書(shū)館大數(shù)據(jù)資源安全高效地處理以及安全攻擊行為的及時(shí)發(fā)現(xiàn)。
另外,在了解圖書(shū)館大數(shù)據(jù)服務(wù)與安全管理需求的基礎(chǔ)上,定制大數(shù)據(jù)資源挖掘工具以及相應(yīng)的分析師,來(lái)提高圖書(shū)館利用大數(shù)據(jù)技術(shù)發(fā)現(xiàn)安全威脅的效率與主動(dòng)性。
3.2 構(gòu)建大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評(píng)估體系
建設(shè)以大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評(píng)估體系,是圖書(shū)館構(gòu)建高效安全防御系統(tǒng)的關(guān)鍵內(nèi)容,評(píng)估體系分為宏觀網(wǎng)絡(luò)感知與微觀威脅檢測(cè)2部分。
網(wǎng)絡(luò)是圖書(shū)館各類信息傳輸?shù)妮d體,在網(wǎng)絡(luò)層面上,對(duì)于數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)與外部傳輸網(wǎng)絡(luò)的評(píng)估,需廣泛地在網(wǎng)絡(luò)上設(shè)置大量安全檢測(cè)與數(shù)據(jù)采集設(shè)備,以此來(lái)保證安全評(píng)估平臺(tái)全面且客觀地收集網(wǎng)絡(luò)安全評(píng)估數(shù)據(jù)。
在微觀層面上,應(yīng)注重?cái)?shù)據(jù)采集并構(gòu)建安全評(píng)估指標(biāo)。應(yīng)重點(diǎn)采集APT攻擊方法、路徑、后果等,并建立模型模擬預(yù)測(cè)。而在評(píng)估指標(biāo)的建立上,應(yīng)從大數(shù)據(jù)平臺(tái)二次提取數(shù)據(jù),并分為基礎(chǔ)指標(biāo)與應(yīng)用層指標(biāo)等多種類型,結(jié)合不同指標(biāo)對(duì)圖書(shū)館安全的影響,進(jìn)行科學(xué)的動(dòng)態(tài)評(píng)估。
同時(shí),由于結(jié)構(gòu)化數(shù)據(jù)可降低對(duì)大數(shù)據(jù)平臺(tái)的性能要求并提高分析效率,圖書(shū)館也應(yīng)加強(qiáng)對(duì)采集數(shù)據(jù)的結(jié)構(gòu)化處理,從而提高安全分析效率與分析結(jié)果的可靠性。
3.3 整合大數(shù)據(jù)安全管理軟硬件平臺(tái)
大數(shù)據(jù)安全管理平臺(tái)應(yīng)實(shí)現(xiàn)安全管理工具與流程的整合,以便圖書(shū)館依據(jù)相關(guān)信息來(lái)完成對(duì)安全事件的管理、分析與決策。將監(jiān)控設(shè)備采集的信息進(jìn)行傳輸時(shí),需提前進(jìn)行預(yù)處理,并經(jīng)由SIEM工具傳輸至大數(shù)據(jù)安全倉(cāng)庫(kù),傳輸數(shù)據(jù)需標(biāo)準(zhǔn)、高價(jià)值且具備可用性。同時(shí),通過(guò)實(shí)時(shí)控制,以及安全管理平臺(tái)數(shù)據(jù)的反饋,來(lái)實(shí)現(xiàn)對(duì)圖書(shū)館應(yīng)用平臺(tái)的參數(shù)設(shè)置及管理。
同時(shí),大數(shù)據(jù)安全管理平臺(tái)應(yīng)使用科學(xué)算法、可視化決策與自動(dòng)化管理,應(yīng)通過(guò)大數(shù)據(jù)平臺(tái)對(duì)用戶行為數(shù)據(jù)、閱讀終端參數(shù)分析,實(shí)現(xiàn)對(duì)用戶行為特征模擬,以此來(lái)進(jìn)行大數(shù)據(jù)下的讀者身份認(rèn)證。
3.4 執(zhí)行安全的大數(shù)據(jù)管理與應(yīng)用策略
針對(duì)圖書(shū)館大數(shù)據(jù)的具體特征,為提高數(shù)據(jù)的安全性與可用性,圖書(shū)館必須對(duì)原始數(shù)據(jù)進(jìn)行有效精簡(jiǎn),即通過(guò)過(guò)濾、刪減、標(biāo)準(zhǔn)化、匹配、評(píng)估、清洗等過(guò)程,以及結(jié)合云存儲(chǔ)平臺(tái),將無(wú)用數(shù)據(jù)和重復(fù)數(shù)據(jù)進(jìn)行刪除。同時(shí),圖書(shū)館的大數(shù)據(jù)平臺(tái)在保證開(kāi)放共享的同時(shí),也應(yīng)保證數(shù)據(jù)不被非法訪問(wèn)和過(guò)度分析,因此,應(yīng)允許用戶查看、糾正或刪除自身隱私數(shù)據(jù),增加用戶隱私數(shù)據(jù)使用的透明度。
另外,圖書(shū)館在大數(shù)據(jù)安全管理中,通常將內(nèi)部系統(tǒng)視為可信環(huán)境,執(zhí)行較為寬松的安全管理策略,往往造成內(nèi)部環(huán)境相較于外部環(huán)境安全威脅更大。所以,為防止黑客利用內(nèi)部系統(tǒng)漏洞提高攻擊成功率,加強(qiáng)圖書(shū)館內(nèi)部系統(tǒng)環(huán)境安全控制與監(jiān)控十分必要。
4 結(jié)論
在大數(shù)據(jù)的背景下,圖書(shū)館的資源建設(shè)與管理存在大量的發(fā)展機(jī)遇,同時(shí)也存在更大的挑戰(zhàn)。在圖書(shū)館的數(shù)據(jù)存儲(chǔ)安全管理方面,應(yīng)運(yùn)用大數(shù)據(jù)決策敏銳感知安全威脅,構(gòu)建起以大數(shù)據(jù)安全威脅與防御能力為基礎(chǔ)的評(píng)估體系,對(duì)大數(shù)據(jù)軟硬件平臺(tái)進(jìn)行整合,并執(zhí)行安全的大數(shù)據(jù)管理與應(yīng)用策略,真正提高圖書(shū)館的數(shù)據(jù)存儲(chǔ)安全管理能力,以求更加穩(wěn)定長(zhǎng)遠(yuǎn)的發(fā)展。
參考文獻(xiàn)
[1]張瑜.大數(shù)據(jù)環(huán)境下圖書(shū)館公共媒體數(shù)據(jù)庫(kù)建設(shè)與利用研究[D].大連:遼寧師范大學(xué),2014.
[2]陳臣.大數(shù)據(jù)環(huán)境下數(shù)字圖書(shū)館安全威脅與對(duì)策研究[J].圖書(shū)館工作與研究,2014(11):34-38.
[3]高煜紅.云計(jì)算數(shù)據(jù)存儲(chǔ)安全的研究[D].杭州:浙江工業(yè)大學(xué),2014.
[4]鮑劼,李蘇豐.大數(shù)據(jù)環(huán)境下圖書(shū)館信息安全問(wèn)題與對(duì)策分析[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2014(22):12-14.
[5]陳臣.基于大數(shù)據(jù)的圖書(shū)館個(gè)性化服務(wù)安全體系構(gòu)建研究[J].新世紀(jì)圖書(shū)館,2014(11):47-51.
[6]陳臣.大數(shù)據(jù)環(huán)境下數(shù)字圖書(shū)館安全威脅與對(duì)策研究[J].圖書(shū)館工作與研究,2014(11):34-38.
[7]張毅,趙元媛.大數(shù)據(jù)技術(shù)在數(shù)字圖書(shū)館中的應(yīng)用分析[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2015(3):52-53.
[8]張鶴明.大數(shù)據(jù)對(duì)公共圖書(shū)館服務(wù)的影響探討[J].圖書(shū)館界,2015(3):75-77.