◆佟 瑤
(遼東學(xué)院信息工程學(xué)院信息管理與信息系統(tǒng)系 遼寧 118000)
試論網(wǎng)絡(luò)安全分析中大數(shù)據(jù)技術(shù)的應(yīng)用
◆佟 瑤
(遼東學(xué)院信息工程學(xué)院信息管理與信息系統(tǒng)系 遼寧 118000)
網(wǎng)絡(luò)安全分析工作直接影響數(shù)據(jù)儲存、數(shù)據(jù)傳輸?shù)热蝿?wù)的安全性和有效性?;诖?,本文主要針對當前網(wǎng)絡(luò)安全分析現(xiàn)狀進行分析,對大數(shù)據(jù)技術(shù)在數(shù)據(jù)采集、數(shù)據(jù)查詢、數(shù)據(jù)存儲以及數(shù)據(jù)處理等網(wǎng)絡(luò)安全分析工作中的應(yīng)用進行細化分析,以期在豐富網(wǎng)絡(luò)安全分析方面研究的同時,為大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的實踐應(yīng)用提供可靠的理論參照依據(jù)。
網(wǎng)絡(luò)安全;大數(shù)據(jù)技術(shù);數(shù)據(jù)采集
在互聯(lián)網(wǎng)不斷普及的背景中,網(wǎng)絡(luò)安全分析工作產(chǎn)生了較為明顯的變化。這種變化主要體現(xiàn)在以下幾方面:第一,數(shù)據(jù)分析方法方面?;ヂ?lián)網(wǎng)在人們?nèi)粘9ぷ鳌⑸钪械玫搅藦V泛的應(yīng)用,因此,網(wǎng)絡(luò)安全分析中的數(shù)據(jù)量、數(shù)據(jù)種類也產(chǎn)生了極大的變化。為了滿足分析要求,需運用多維分析方法開展網(wǎng)絡(luò)安全分析工作。第二,分析難度方面。從本質(zhì)角度來講,可以將網(wǎng)絡(luò)安全分析看成是采集數(shù)據(jù)、處理數(shù)據(jù)的過程。當數(shù)據(jù)本身的傳遞速度及數(shù)據(jù)量發(fā)生變化時,網(wǎng)絡(luò)安全分析中的數(shù)據(jù)采集速度、處理速度也需要隨之變動。因此,當前網(wǎng)絡(luò)分析的難度相對較高。
這里主要從以下幾方面入手,對網(wǎng)絡(luò)安全分析中大數(shù)據(jù)技術(shù)的應(yīng)用進行分析和研究:
網(wǎng)絡(luò)安全分析的數(shù)據(jù)對象主要包含流量、日志這兩種。大數(shù)據(jù)技術(shù)的引入可以將網(wǎng)絡(luò)安全分析中的數(shù)據(jù)采集工作變得更加快捷:即運用Chukwa等工具,參照日志、流量數(shù)據(jù)的類型,通過分布采集的方式高速完成數(shù)據(jù)信息的采集。與傳統(tǒng)技術(shù)相比,大數(shù)據(jù)技術(shù)的應(yīng)用可以有效保障數(shù)據(jù)采集的完善性,且全流量數(shù)據(jù)的準確性能夠得到有效保障。
在數(shù)據(jù)查詢方面,大數(shù)據(jù)技術(shù)的應(yīng)用可將MapReduce作為數(shù)據(jù)檢索的基本架構(gòu),參照實際要求向所有分析節(jié)點發(fā)送數(shù)據(jù)查詢請求主語。當分析節(jié)點接受到這一請求后,可通過分布式并行計算方法判斷自身節(jié)點是否存在查詢所需數(shù)據(jù)。若存在,將滿足MapReduce的的查詢請求,為其顯示所需流量、日志等相關(guān)數(shù)據(jù)信息。在這種網(wǎng)絡(luò)安全分析模式下,數(shù)據(jù)的查詢、檢索速度將發(fā)生顯著提升。對于網(wǎng)絡(luò)安全分析人員而言,大數(shù)據(jù)技術(shù)的應(yīng)用可有效提高其工作效率,減輕其工作壓力。
在傳統(tǒng)網(wǎng)絡(luò)安全分析中,數(shù)據(jù)存儲的難度主要在于數(shù)據(jù)的高速傳輸及多樣化的數(shù)據(jù)種類上。大數(shù)據(jù)技術(shù)的應(yīng)用通過提供不同儲存方式的工作模式,滿足網(wǎng)絡(luò)安全分析工作的數(shù)據(jù)存儲需求。以供檢索的原始安全數(shù)據(jù)(如流量歷史數(shù)據(jù)等),大數(shù)據(jù)技術(shù)借助Hbase列式儲存方法,發(fā)揮該方法的快速索引優(yōu)勢,快速響應(yīng)數(shù)據(jù)檢索需求,完成原始安全數(shù)據(jù)的分類化儲存[1]。從大數(shù)據(jù)技術(shù)儲存原始安全數(shù)據(jù)的流程來看:大數(shù)據(jù)技術(shù)按照統(tǒng)一標準對原始安全數(shù)據(jù)進行處理后,利用Hahoop分布式開展構(gòu)架計算,根據(jù)各計算節(jié)點的特征完成原始安全數(shù)據(jù)的分類,進行腳本分析,最后通過對安全數(shù)據(jù)的挖掘處理,制作出數(shù)據(jù)統(tǒng)計報告,并將結(jié)果置于列式中進行儲存。與常規(guī)分析不同的是,若網(wǎng)絡(luò)安全分析工作要求實時開展數(shù)據(jù)分析人物,則利用大數(shù)據(jù)技術(shù)分析原始安全數(shù)據(jù)的流程將轉(zhuǎn)化為:通過Spark等相關(guān)流式計算方法,事先將待分析原始安全數(shù)據(jù)置于對應(yīng)計算節(jié)點上。在實時分析過程中,當安全數(shù)據(jù)流經(jīng)對應(yīng)節(jié)點時,該計算節(jié)點將自動開展數(shù)據(jù)分析工作,將分析結(jié)果轉(zhuǎn)化為安全警告及數(shù)據(jù)統(tǒng)計成果,最終將所得安全數(shù)據(jù)分析結(jié)果存放至流式存儲內(nèi)部。
在網(wǎng)絡(luò)安全分析中,基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)處理工作是通過多種不同的處理技術(shù)及分析技術(shù)完成的。以實時數(shù)據(jù)分析為例,可將Storm流式計算架構(gòu)作為實時分析的基礎(chǔ),借助電聯(lián)分析計算法、復(fù)雜事件處理法共同對來自用戶的實時安全數(shù)據(jù)進行分析。大數(shù)據(jù)技術(shù)的應(yīng)用可以發(fā)揮數(shù)據(jù)實時監(jiān)控功能及數(shù)據(jù)內(nèi)存實時分析功能,精確捕捉網(wǎng)絡(luò)安全分析海量數(shù)據(jù)中的異常行為,并對異常行為進行抑制和處理,有效保障用戶的數(shù)據(jù)安全及數(shù)據(jù)傳輸安全。
為了改善網(wǎng)絡(luò)安全分析質(zhì)量,保障數(shù)據(jù)傳輸安全,可運用大數(shù)據(jù)技術(shù),構(gòu)建具有良好安全分析、檢測功能的網(wǎng)絡(luò)安全平臺。
基于大數(shù)據(jù)技術(shù)的網(wǎng)絡(luò)安全平臺架構(gòu)主要由以下幾個要素構(gòu)成:第一,數(shù)據(jù)呈現(xiàn)層。該層通過安全度量技術(shù)、安全預(yù)警技術(shù)以及可視化引擎等完成原始安全數(shù)據(jù)的相關(guān)處理任務(wù)。第二,數(shù)據(jù)挖掘分析層。該層主要通過對流量、日志等數(shù)據(jù)的聚類分析、機器學(xué)習(xí)、關(guān)聯(lián)分析以及統(tǒng)計分析等,挖掘海量數(shù)據(jù)、多源異構(gòu)數(shù)據(jù)中攻擊行為的特征,為網(wǎng)絡(luò)安全分析工作提供良好的數(shù)據(jù)基礎(chǔ)。第三,大數(shù)據(jù)存儲層。該層主要負責(zé)對不同類型數(shù)據(jù)進行分類存儲,以便后續(xù)數(shù)據(jù)挖掘分析、數(shù)據(jù)檢索等工作的順利展開。第四,數(shù)據(jù)采集層。該層根據(jù)數(shù)據(jù)類型,如用戶行為數(shù)據(jù)、DNS流量數(shù)據(jù)、日志數(shù)據(jù)、鏡像流量數(shù)據(jù)等,分別開展采集工作。與傳統(tǒng)采集流程相比,基于大數(shù)據(jù)技術(shù)的采集效率相對較高,整個采集階段所用時間相對較少。
(1)DDoS攻擊路徑準實時監(jiān)測
基于大數(shù)據(jù)的網(wǎng)絡(luò)安全平臺的DDoS攻擊路徑準實時監(jiān)測流程如下所示:第一,新建空活節(jié)點隊列A、空攻擊路徑鏈表B;第二,將攻擊告警作為參照對象,提取精確的攻擊源 IP地址等相關(guān)信息,利用上述信息開展關(guān)聯(lián)查詢,獲取精確的攻擊流量大小、流經(jīng)路由器等內(nèi)容。第三,上述要素確定完成后,可根據(jù)所確定信息內(nèi)容,進行安全處理。例如,多攻擊源地址位于路由器用戶側(cè)端口輸入流量中,則需將攻擊對象路由器的相關(guān)連接關(guān)系、攻擊源子網(wǎng)等信息納入攻擊路徑鏈表B中[3]。第四,將攻擊對象路由器C作為起點,逐漸開展訪問工作。此時,第一個被訪問的節(jié)點為C。該節(jié)點的訪問完成后,在該節(jié)點的基礎(chǔ)上進行擴展,利用關(guān)聯(lián)技術(shù)分析網(wǎng)絡(luò)拓撲關(guān)系,將于該節(jié)點相鄰的所有節(jié)點識別出來,并逐一對其進行訪問。按照隨機性原則從相鄰節(jié)點中任意抽取一個,重復(fù)上述流程再次進行擴展分析,直至所有節(jié)點均被分析完成。
(2)檢測控制源、被入侵主機
基于大數(shù)據(jù)的網(wǎng)絡(luò)安全平臺檢測控制源、被入侵主機的流程為:挖掘DDoS攻擊歷史信息,將最初發(fā)動攻擊的IP地址信息識別出來,并將其列入疑似被入侵主機。從 DNS日志數(shù)據(jù)中查詢疑似被入侵主機的日志記錄,并將所得查詢結(jié)果于惡意 URL庫進行合理比對。若 URL庫中有匹配記錄,可確定該主機為被控制主機。此外,在被攻擊期間,還可以利用多源數(shù)據(jù)關(guān)聯(lián)分析技術(shù),找出單次攻擊期內(nèi)與參與攻擊 IP地址信息之間存在交互網(wǎng)絡(luò)流量關(guān)聯(lián)的 IP地址,將其看做疑似控制主機,借助該主機的信息利用網(wǎng)絡(luò)安全平臺的數(shù)據(jù)檢索功能,找出與其之間存在通信記錄的主機,判斷為被控制主機,針對這2個主機制定相應(yīng)的安全防范方案。
通過上述分析可知,大數(shù)據(jù)技術(shù)的應(yīng)用可以有效提升網(wǎng)絡(luò)安全分析工作的效率,改善其工作質(zhì)量。為了保障數(shù)據(jù)傳輸?shù)陌踩M行,還可以將大數(shù)據(jù)技術(shù)作為基本要素,構(gòu)建基于大數(shù)據(jù)的網(wǎng)絡(luò)安全平臺,利用平臺的綜合分析功能有效監(jiān)測攻擊路徑,并通過對被入侵主機通信記錄的關(guān)聯(lián)分析,識別控制主機,制定防范方案,進而保障其他主機數(shù)據(jù)傳輸工作的順利進行。
[1]王帥,汪來富,金華敏等.網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用[J].電信科學(xué),2015.
[2]賈孫玉.淺談網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017.
[3]崔玉禮,黃麗君.網(wǎng)絡(luò)安全分析中的大數(shù)據(jù)技術(shù)應(yīng)用[J].網(wǎng)絡(luò)空間安全,2016.