馬卓元 楊向東
摘 要:數(shù)據(jù)日益成為人們的重要資產(chǎn)之一,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨。然而,大數(shù)據(jù)面臨的安全威脅日益嚴(yán)重。文章分析了大數(shù)據(jù)基礎(chǔ)平臺(tái)所面臨的安全風(fēng)險(xiǎn),并為大數(shù)據(jù)基礎(chǔ)平臺(tái)安全防護(hù)提出了相關(guān)要求。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)平臺(tái);安全要求
中圖分類號(hào):TP309;TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A
1 引言
由于風(fēng)險(xiǎn)監(jiān)控與防范機(jī)制不夠健全、開(kāi)源生態(tài)環(huán)境的安全缺陷,大數(shù)據(jù)基礎(chǔ)平臺(tái)面臨各類安全風(fēng)險(xiǎn),其安全問(wèn)題已成為制約大數(shù)據(jù)基礎(chǔ)平臺(tái)建設(shè)部署及業(yè)務(wù)發(fā)展的重要阻礙。然而,目前現(xiàn)有研究主要聚集在安全體系架構(gòu)、隱私保護(hù)、安全管理、服務(wù)能力要求方面,仍缺乏對(duì)大數(shù)據(jù)基礎(chǔ)平臺(tái)的通用安全技術(shù)要求的研究,無(wú)法實(shí)現(xiàn)對(duì)大數(shù)據(jù)基礎(chǔ)平臺(tái)安全性的統(tǒng)一評(píng)價(jià)。因此,本文對(duì)大數(shù)據(jù)基礎(chǔ)平臺(tái)安全要求進(jìn)行了研究分析。
2 大數(shù)據(jù)基礎(chǔ)平臺(tái)安全風(fēng)險(xiǎn)
2.1數(shù)據(jù)采集安全風(fēng)險(xiǎn)
數(shù)據(jù)采集環(huán)節(jié)是大數(shù)據(jù)基礎(chǔ)平臺(tái)的入口,其安全性直接關(guān)系到整個(gè)大數(shù)據(jù)基礎(chǔ)平臺(tái)數(shù)據(jù)入口的安全。數(shù)據(jù)采集環(huán)節(jié)面臨的安全風(fēng)險(xiǎn)包括五個(gè)方面。
(1)采集系統(tǒng)未對(duì)實(shí)施采集的接入終端開(kāi)展身份認(rèn)證,造成終端非法接入進(jìn)行數(shù)據(jù)采集。
(2)采集人員較多且權(quán)限和角色分配不明確,造成非法采集或數(shù)據(jù)泄露。
(3)傳輸加密機(jī)制不完善,造成數(shù)據(jù)被惡意截獲。
(4)采集過(guò)程中臨時(shí)數(shù)據(jù)存儲(chǔ)到不可控區(qū)域,引起數(shù)據(jù)泄露。
(5)缺乏對(duì)采集賬號(hào)、采集人員、采集行為、采集操作等的審計(jì)手段[1]等。
2.2數(shù)據(jù)存儲(chǔ)安全風(fēng)險(xiǎn)
采集到的數(shù)據(jù)需要在大數(shù)據(jù)基礎(chǔ)平臺(tái)進(jìn)行存儲(chǔ)后,才能進(jìn)行計(jì)算處理。數(shù)據(jù)存儲(chǔ)環(huán)節(jié)面臨的安全風(fēng)險(xiǎn)包括四個(gè)方面。
(1)存儲(chǔ)系統(tǒng)自身的安全配置無(wú)法滿足基本安全配置要求,為攻擊者所利用,造成數(shù)據(jù)非授權(quán)訪問(wèn)。
(2)存儲(chǔ)系統(tǒng)未安裝防病毒軟件或病毒庫(kù)未及時(shí)更新,造成病毒軟件入侵,導(dǎo)致敏感數(shù)據(jù)泄露。
(3)傳統(tǒng)數(shù)據(jù)庫(kù)、HDFS以及MPP數(shù)據(jù)倉(cāng)庫(kù)等多種存儲(chǔ)系統(tǒng)共存,一旦賬號(hào)權(quán)限管理不當(dāng),有可能造成同一賬號(hào)在不同存儲(chǔ)系統(tǒng)間的數(shù)據(jù)越權(quán)訪問(wèn)。
(4)不完善的容災(zāi)備份機(jī)制會(huì)使得發(fā)生意外情況時(shí),數(shù)據(jù)無(wú)法及時(shí)恢復(fù),從而影響業(yè)務(wù)的正常開(kāi)展等。
2.3 接口傳輸安全風(fēng)險(xiǎn)
大數(shù)據(jù)基礎(chǔ)平臺(tái)接口包括內(nèi)部接口和外部接口,內(nèi)部接口主要是平臺(tái)內(nèi)部各組件之間的接口,外部接口包括數(shù)據(jù)源到平臺(tái)設(shè)施之間的接口、平臺(tái)設(shè)施到數(shù)據(jù)消費(fèi)之間的接口。接口傳輸環(huán)節(jié)面臨的安全風(fēng)險(xiǎn)包括三個(gè)方面。
(1)數(shù)據(jù)源頭與大數(shù)據(jù)基礎(chǔ)平臺(tái)之間、大數(shù)據(jù)基礎(chǔ)平臺(tái)與上層應(yīng)用之間通過(guò)不安全的通道進(jìn)行數(shù)據(jù)傳輸時(shí),有可能出現(xiàn)中間人攻擊等安全隱患。
(2)大數(shù)據(jù)基礎(chǔ)平臺(tái)內(nèi)部授權(quán)、認(rèn)證、訪問(wèn)控制等功能的不完善,可能會(huì)造成平臺(tái)內(nèi)部數(shù)據(jù)泄露。
(3)大數(shù)據(jù)基礎(chǔ)平臺(tái)存在多種途徑供上層應(yīng)用訪問(wèn),一旦權(quán)限控制不當(dāng),容易出現(xiàn)非授權(quán)用戶越權(quán)訪問(wèn)或者合法用戶對(duì)數(shù)據(jù)的非授權(quán)訪問(wèn)等。
2.4 大數(shù)據(jù)組件安全風(fēng)險(xiǎn)
大數(shù)據(jù)基礎(chǔ)平臺(tái)承載著眾多組件,如Hive、Hbase、Impala、Solr、Spark等,完成大數(shù)據(jù)的存儲(chǔ)、處理工作,是大數(shù)據(jù)功能的實(shí)現(xiàn)基礎(chǔ)。大數(shù)據(jù)基礎(chǔ)平臺(tái)組件存在四項(xiàng)安全威脅。
(1)組件間存在不兼容問(wèn)題,造成數(shù)據(jù)存儲(chǔ)、處理過(guò)程中發(fā)生錯(cuò)誤,丟失、損壞數(shù)據(jù)或影響上層業(yè)務(wù)的正常進(jìn)行。
(2)組件的漏洞未及時(shí)更新版本或打補(bǔ)丁。
(3)外部機(jī)器仿冒集群內(nèi)服務(wù)器或假冒合法客戶端與其他機(jī)器進(jìn)行通信,造成數(shù)據(jù)泄露。
(4)隔離或控制措施不當(dāng),多個(gè)租戶之間的業(yè)務(wù)可能會(huì)相互影響,甚至有惡意用戶利用漏洞偷窺其他租戶數(shù)據(jù)等。
3 大數(shù)據(jù)基礎(chǔ)平臺(tái)安全防護(hù)要求
3.1 基礎(chǔ)設(shè)施安全要求
(1)操作系統(tǒng):定期評(píng)估,對(duì)補(bǔ)丁進(jìn)行及時(shí)更新;采用嚴(yán)格身份鑒別技術(shù)用于主機(jī)系統(tǒng)用戶的身份鑒別,限制匿名用戶的訪問(wèn)權(quán)限;授予不同用戶各自所需的最小權(quán)限等。
(2)數(shù)據(jù)庫(kù):配置連接數(shù)據(jù)庫(kù)的白名單列表;嚴(yán)格控制數(shù)據(jù)庫(kù)操作權(quán)限;完整的數(shù)據(jù)庫(kù)審計(jì)方案及實(shí)施;定期做好數(shù)據(jù)庫(kù)的備份容災(zāi)等。
(3)中間件:及時(shí)更新系統(tǒng)補(bǔ)??;異常界面替換或重新設(shè)定,防止系統(tǒng)信息泄漏等。
(4)虛擬機(jī):禁用多余或危險(xiǎn)的系統(tǒng)后臺(tái)進(jìn)程和服務(wù);根據(jù)虛擬化平臺(tái)的具體實(shí)現(xiàn),采用無(wú)代理或有代理的方式部署;實(shí)施嚴(yán)格的訪問(wèn)控制,防止虛擬機(jī)之間的非法訪問(wèn)等。
3.2 數(shù)據(jù)存儲(chǔ)安全要求
(1)訪問(wèn)控制:用Kerberos認(rèn)證、細(xì)粒度授權(quán)等做好用戶或應(yīng)用程序的訪問(wèn)控制;納入多人操作的金庫(kù)管控模式,使得單人無(wú)法擁有重要數(shù)據(jù)的完整操作權(quán)限等。
(2)加密存儲(chǔ):根據(jù)數(shù)據(jù)機(jī)密不同級(jí)別實(shí)現(xiàn)HDFS、HIVE結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)透明加密;對(duì)部分安全性相關(guān)配置數(shù)據(jù)進(jìn)行加密存儲(chǔ),防止篡改;根據(jù)數(shù)據(jù)密級(jí)采用不同的安全存儲(chǔ)機(jī)制等。
(3)備份和恢復(fù)安全:支持增量或全量備份;支持備份主數(shù)據(jù)或備份元數(shù)據(jù);支持手動(dòng)觸發(fā)備份或按周期或預(yù)約執(zhí)行;可由任意備份點(diǎn)進(jìn)行恢復(fù)等。
(4)殘留與銷毀:通過(guò)剩余信息保護(hù)的手段來(lái)進(jìn)行數(shù)據(jù)刪除;嚴(yán)格規(guī)范各類數(shù)據(jù)和文件的存儲(chǔ)生命周期;定期對(duì)臨時(shí)數(shù)據(jù)及文件進(jìn)行清理等。
3.3 接口傳輸安全要求
(1)外部接口:對(duì)采集終端和采集人員開(kāi)展接入鑒權(quán),并對(duì)采集行為進(jìn)行監(jiān)控;限制采集系統(tǒng)的IP地址、端口號(hào)等;對(duì)采集數(shù)據(jù)的傳輸、存儲(chǔ)及分類分級(jí)實(shí)施嚴(yán)格的安全要求;嚴(yán)格限制采集過(guò)程中臨時(shí)數(shù)據(jù)存儲(chǔ)區(qū)域,不得任意修改存儲(chǔ)區(qū)域地址;對(duì)采集到的數(shù)據(jù)按照數(shù)據(jù)的重要性及敏感度進(jìn)行分類分級(jí)處理;對(duì)采集行為進(jìn)行日志記錄,并對(duì)異常采集行為及時(shí)告警;對(duì)所有接入的用戶或業(yè)務(wù)進(jìn)行身份接入認(rèn)證和權(quán)限控制;定期對(duì)大數(shù)據(jù)基礎(chǔ)平臺(tái)對(duì)外接口進(jìn)行滲透測(cè)試和漏洞評(píng)估;針對(duì)大數(shù)據(jù)執(zhí)行邏輯代碼進(jìn)行嚴(yán)格的代碼安全審查;對(duì)應(yīng)用的非授權(quán)訪問(wèn)行為進(jìn)行監(jiān)測(cè)與告警等。
(2)內(nèi)部接口:接入平臺(tái)的應(yīng)用需要經(jīng)過(guò)身份認(rèn)證;系統(tǒng)對(duì)接口的調(diào)用需要經(jīng)過(guò)鑒權(quán),并記入日志,進(jìn)行定期審計(jì);關(guān)鍵信息的傳輸應(yīng)支持安全信道傳輸或加密傳輸;檢查輸入數(shù)據(jù)的有效性;對(duì)出口數(shù)據(jù)進(jìn)行敏感性檢查和脫敏處理;限制用戶對(duì)接口的訪問(wèn)次數(shù);限制接口的最大連接量;實(shí)時(shí)監(jiān)控大數(shù)據(jù)基礎(chǔ)平臺(tái)與系統(tǒng)之間接口的流量,對(duì)流量異常的情況進(jìn)行告警與控制等。
3.4 平臺(tái)管理安全要求
(1)管理平臺(tái):嚴(yán)格控制所有存儲(chǔ)資源的訪問(wèn)權(quán)限;僅安裝需要的組件和應(yīng)用程序;篩查惡意代碼和相關(guān)漏洞;集群服務(wù)器節(jié)點(diǎn)之間開(kāi)啟認(rèn)證機(jī)制;資源以租戶為單位進(jìn)行計(jì)劃和分配等。
(2)組件及補(bǔ)?。焊鱾€(gè)組件可配置自己的訪問(wèn)控制策略;根據(jù)用戶的選擇為集群中的機(jī)器配置相應(yīng)的補(bǔ)??;提供完善的補(bǔ)丁管理、分發(fā)、升級(jí)功能等。
(3)安全事件:支持告警響應(yīng)行為的定義和設(shè)置告警響應(yīng)的方式,能夠開(kāi)啟和關(guān)閉告警響應(yīng);監(jiān)控所有軟硬件告警;設(shè)置告警觸發(fā)的條件閾值等。
(4)安全態(tài)勢(shì)感知:利用大數(shù)據(jù)分析技術(shù)建設(shè)集中化安全管理平臺(tái),形成整體性安全風(fēng)險(xiǎn)關(guān)聯(lián)分析及態(tài)勢(shì)感知能力等。
(5)容災(zāi)備份:為關(guān)鍵數(shù)據(jù)、關(guān)鍵應(yīng)用建立異地備份;建立系統(tǒng)備份和處理機(jī)制等。
(6)日志審計(jì):對(duì)訪問(wèn)層、應(yīng)用層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)獲取層、元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量監(jiān)控等日志記錄進(jìn)行審計(jì);實(shí)現(xiàn)日志的自動(dòng)分析、異常檢測(cè)和基于風(fēng)控模型的風(fēng)險(xiǎn)報(bào)警等。
4 結(jié)束語(yǔ)
本文研究了大數(shù)據(jù)基礎(chǔ)平臺(tái)面臨的安全風(fēng)險(xiǎn),并在基礎(chǔ)設(shè)施、數(shù)據(jù)存儲(chǔ)、接口傳輸、平臺(tái)管理等方面提出了統(tǒng)一的安全要求,對(duì)加強(qiáng)大數(shù)據(jù)基礎(chǔ)平臺(tái)安全技術(shù)防護(hù),支撐上層大數(shù)據(jù)業(yè)務(wù)的安全健康有序發(fā)展具有重要意義。
參考文獻(xiàn)
[1] 于樂(lè),馮運(yùn)波,江為強(qiáng),任蘭芳.大數(shù)據(jù)平臺(tái)安全防護(hù)研究[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2017,30(11),6-11.