崔洪剛 唐浩 汪永超
【摘 要】隨著社會的不斷發(fā)展,人們采用傳統(tǒng)的設(shè)備和工具來處理龐大的數(shù)據(jù)流已經(jīng)顯示出其在擴(kuò)展性和分析技術(shù)上的劣勢。當(dāng)前主流的大數(shù)據(jù)處理新技術(shù)通常選擇在云計(jì)算環(huán)境下搭建Hadoop完成存儲和分析。本文首先分析了現(xiàn)行的大數(shù)據(jù)運(yùn)用模式,分析了在Hadoop不同階段操作過程中所存在的安全威脅,進(jìn)而根據(jù)安全風(fēng)險給出了對應(yīng)的安全策略。
【關(guān)鍵詞】大數(shù)據(jù);云計(jì)算;安全風(fēng)險
隨著社會的不斷發(fā)展,人們在日常工作和生活中的信息交流量越來越大,需要處理的數(shù)據(jù)變得越來越多。對于如此龐大的數(shù)據(jù)流依舊采用傳統(tǒng)的設(shè)備和工具來處理,已經(jīng)顯示出其在擴(kuò)展性和分析技術(shù)上的劣勢,無法有效地獲得蘊(yùn)藏在大數(shù)據(jù)中的潛在價值。同時,大數(shù)據(jù)還體現(xiàn)出了多樣態(tài)勢的數(shù)據(jù)組成方式,這樣的結(jié)構(gòu)相應(yīng)增長了常規(guī)數(shù)據(jù)計(jì)算和處理的難度。要想滿足大數(shù)據(jù)的運(yùn)用要求,需要廣泛研究新技術(shù)。
1 大數(shù)據(jù)運(yùn)用模式
云計(jì)算的實(shí)現(xiàn),對于設(shè)備的要求是相當(dāng)嚴(yán)格的。首先需要通過小型的計(jì)算機(jī)和單體化的數(shù)據(jù)中心向大型的計(jì)算中心傳輸數(shù)據(jù),這些計(jì)算中心能夠通過專業(yè)的存儲和計(jì)算能力實(shí)現(xiàn)計(jì)算機(jī)在硬件和軟件上的資源共享。企業(yè)在使用云計(jì)算的服務(wù)和相關(guān)功能時,并不需要再花費(fèi)更多的預(yù)算和實(shí)際費(fèi)用在購買大型的基礎(chǔ)設(shè)備方面,也就不需要對更多的設(shè)備進(jìn)行安裝調(diào)試和維護(hù)工作,僅僅需要與云計(jì)算服務(wù)商簽訂一定的使用協(xié)議,就能享受其提供的相應(yīng)云計(jì)算服務(wù),在一定的計(jì)費(fèi)周期內(nèi)按計(jì)時或計(jì)件方式支付相應(yīng)的服務(wù)費(fèi)用。
云計(jì)算服務(wù)商自身的發(fā)展離不開對龐大的數(shù)據(jù)流進(jìn)行存儲和計(jì)算的能力。因此,云計(jì)算服務(wù)商在當(dāng)前的數(shù)據(jù)處理與管理方面被認(rèn)定為選擇信息服務(wù)外包的最佳對象。大數(shù)據(jù)時代的很多運(yùn)用都離不開云計(jì)算的強(qiáng)大機(jī)制和功能。而Hadoop作為支持大數(shù)據(jù)分析和處理的技術(shù)實(shí)施方案,最初的設(shè)定出發(fā)點(diǎn)是基于Google開發(fā)的云計(jì)算中的映射歸約編程模型(Map Reduce),并積極吸收谷歌三大技術(shù)之一谷歌文件系統(tǒng)(Google File System,簡稱GFS)的開源性設(shè)計(jì)。Hadoop的運(yùn)用通過其中的核心技術(shù)HDFS(Hadoop Distributed File System)以及Map Reduce為云計(jì)算的大數(shù)據(jù)運(yùn)用提供了一種計(jì)算框架。HDFS以及 Map Reduce都是針對分布式運(yùn)算的相關(guān)技術(shù),HDFS作為能夠顯示成獨(dú)立磁盤的多機(jī)器系統(tǒng),所提供的是文件系統(tǒng)依然是分布式的,在系統(tǒng)吞吐量方面具有很大優(yōu)勢。而Map Reduce屬于分布式處理模型。Hadoop的建立通過搭建可靠的共享存儲和分析系統(tǒng)來促進(jìn)大數(shù)據(jù)的運(yùn)用處理。當(dāng)前的技術(shù)競爭環(huán)境下,世界上已經(jīng)出現(xiàn)了很多的自發(fā)性群體,通過組織自建集群的方式來運(yùn)行Hadoop,當(dāng)前更多的人群和組織依然選擇通過更加直接和有效的方式來完成Hadoop的組建和服務(wù),選擇租賃性價比更為合理的硬軟件,搭建匹配的運(yùn)行平臺供Hadoop運(yùn)行或提供迅速完成目標(biāo)任務(wù)的可靠服務(wù)。
2 大數(shù)據(jù)安全風(fēng)險分析
云計(jì)算的特點(diǎn)是由云服務(wù)商將已經(jīng)外包的數(shù)據(jù)集中分析后進(jìn)行處理,外包方能夠共享到相應(yīng)的服務(wù)。當(dāng)數(shù)據(jù)的支配權(quán)全部屬于云計(jì)算服務(wù)商后,相當(dāng)于所有用戶對于眼前的物理資源雖能接觸到卻沒有直接的使用和控制權(quán)利。云端服務(wù)器重,存儲的大數(shù)據(jù)一般都有慣用的排位方式,即使用明文方式。在一定的權(quán)限下,云計(jì)算服務(wù)商們基本都會對數(shù)據(jù)的基層控制權(quán)全盤接收,在這樣的情況下,懷有惡意的云計(jì)算服務(wù)商們對于數(shù)據(jù)安全來講,具有相當(dāng)嚴(yán)重的危險,很多用戶的數(shù)據(jù)面臨被盜用丟失,而且往往選擇在用戶不知情的前提下,同時云計(jì)算平臺也可能受到非授權(quán)人進(jìn)行數(shù)據(jù)讀取,往往受到不明的攻擊使自身的安全機(jī)制失效或被非法控制,給大數(shù)據(jù)安全帶來了威脅。Hadoop的版本樣式發(fā)展到Cloudera CDH3后,來自于Kerberos隨設(shè)定的身份識別認(rèn)證機(jī)制和依據(jù)ACL成立的訪問控制機(jī)制被創(chuàng)立和使用,但是這樣的安全機(jī)制卻依然顯得薄弱,由于Kerberos的認(rèn)證機(jī)制僅僅運(yùn)用于客戶機(jī)、密鑰分發(fā)中心、服務(wù)器之間,僅僅是針對機(jī)器級別的安全認(rèn)證,并未對Hadoop運(yùn)用平臺本身進(jìn)行認(rèn)證。而基于ACL的訪問控制策略需要通過在啟用ACL之后,其配置的9條屬限制了用戶與組成員對Hadoop中資源的訪問以及其他關(guān)鍵性節(jié)點(diǎn)間的通信,但是需要注意的是,該機(jī)制的運(yùn)行離不開管理員對整個系統(tǒng)的設(shè)置。因此,往往出現(xiàn)控制列表被訪問后在服務(wù)器中內(nèi)容易被不法分子或者自動運(yùn)行程序進(jìn)行更改,而且更改的程度往往騙過了人們的防備。依據(jù)ACL成立的訪問控制策略在粒度方面的設(shè)計(jì)上細(xì)度不夠,涉及用戶信息的隱私字段就不能夠在映射歸約編程模型中實(shí)現(xiàn)細(xì)粒度保護(hù)。訪問控制列表常常會調(diào)整不同用戶的不同操作習(xí)慣,但是這些更改過程是相對繁瑣的,而且風(fēng)險安保方面也存在較多隱患。通過上述可知,Hadoop的運(yùn)行所建立和應(yīng)用的安全機(jī)制并不真正安全。
3 提高安全保護(hù)的有效策略
真正考慮數(shù)據(jù)的安全風(fēng)險,應(yīng)該對于用戶的隱私保護(hù)也同樣考慮在內(nèi)。對于可能發(fā)生的大數(shù)據(jù)應(yīng)用安全風(fēng)險,可以積極嘗試運(yùn)用如下相關(guān)策略:
第一,需要對云計(jì)算服務(wù)商和使用者的身份信息及平臺進(jìn)行完整性驗(yàn)證。使用云計(jì)算的用戶,對于Kerberos的雙向認(rèn)證要有所了解,要靈活應(yīng)用這一原理在平臺收發(fā)請求時進(jìn)行認(rèn)證,這樣的做法進(jìn)一步提高了用戶和云計(jì)算服務(wù)商兩方身份認(rèn)證方面的完整性信息安全。
第二,在確認(rèn)了用戶和云服務(wù)商之間身份的真實(shí)可靠之后,平臺整體上的安全性能還需要進(jìn)行嚴(yán)格的驗(yàn)證。鑒于此,可以采用有關(guān)的算法和模型等構(gòu)件合理的協(xié)議,配合TPM完成對云計(jì)算可信環(huán)境的構(gòu)建,平臺環(huán)境構(gòu)建完成后還需要對系統(tǒng)的可信鏈展開完善,確保云平臺無較大的安全風(fēng)險。
第三,需要在數(shù)據(jù)使用過程中監(jiān)控行為請求,云服務(wù)商一般情況下會有很大的概率接觸到某些無理化的數(shù)據(jù)請求,只有建立更加嚴(yán)格和規(guī)范的監(jiān)控機(jī)制才能管理非法數(shù)據(jù),進(jìn)而對非法運(yùn)算和錯誤的輸出結(jié)果也能完成實(shí)時監(jiān)控??梢钥紤]借助利用LSM的訪問控制策略,通過hook函數(shù)進(jìn)行內(nèi)核程序的控制,對合法行為予以同行,準(zhǔn)許訪問數(shù)據(jù),對不可信的可疑行為,直接拒絕后設(shè)立記憶點(diǎn),確保數(shù)據(jù)的正確流向。
4 結(jié)語
對于大數(shù)據(jù)應(yīng)用中可能存在的風(fēng)險,應(yīng)充分考慮監(jiān)控云計(jì)算服務(wù)商的可疑行為,杜絕直接更改文件權(quán)限獲取數(shù)據(jù)內(nèi)容,也應(yīng)該避免數(shù)據(jù)計(jì)算者可以對于相關(guān)數(shù)據(jù)的獲取也可以直接通過計(jì)算程序輸出隱私字段等方式來實(shí)現(xiàn),通過一定的安全策略,來提高大數(shù)據(jù)運(yùn)用中云計(jì)算服務(wù)的使用。
【參考文獻(xiàn)】
[1]馬媛.基于Hadoop的云計(jì)算平臺安全機(jī)制研究[J].信息安全與保密通信,2012(6):89-92.
[2]周天陽,朱俊虎,王清賢.基于VMM的Rootkit及其監(jiān)測技術(shù)研究[J].計(jì)算機(jī)科學(xué),2011,12(38):77-80.
[3]李虹,李昊.可信云安全的關(guān)鍵技術(shù)與實(shí)現(xiàn)[M].北京:人民郵電出版社,2010.
[責(zé)任編輯:王楠]