亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據技術的網絡異常行為分析監(jiān)測系統(tǒng)

        2018-01-17 22:22:46王萍
        電子技術與軟件工程 2017年24期
        關鍵詞:機器學習大數(shù)據

        王萍

        摘 要

        本文提出了一種基于大數(shù)據的技術來識別網絡異常行為的方法,并基于該理論方法設計實現(xiàn)了一個網絡異常行為分析監(jiān)測系統(tǒng)。本文詳細描述了系統(tǒng)的總體架構設計、各模塊詳細設計及異常入侵行為發(fā)現(xiàn)方法原理。本系統(tǒng)涉及的核心技術模塊包括數(shù)據采集與預處理模塊、實時流量監(jiān)測模塊、大數(shù)據關聯(lián)分析異常檢測模塊、訪問行為基線機器學習模塊、綜合管理與展示模塊。本文使用的異常識別方法首先通過網絡流量前端數(shù)據采集與預處理模塊采集并還原網絡流量數(shù)據、通過syslog收集安全設備告警數(shù)據、通過漏洞掃描工具采集系統(tǒng)和應用的漏洞數(shù)據,再將多種數(shù)據源采集的數(shù)據進行融合和關聯(lián)分析,利用機器學習技術形成網絡邊界訪問、業(yè)務系統(tǒng)訪問、網站訪問正常行為基線,再結合基線與實時流量和網絡安全事件的實時對比關聯(lián)分析識別網絡入侵行為。系統(tǒng)使用的主要技術有:基于Spark streaming的實時大數(shù)據關聯(lián)分析技術,基于Spark MLlib的離線挖掘分析技術,基于kafka的數(shù)據總線技術,基于Spring MVC的Web應用技術,基于html5、css、js的前端展示技術。

        【關鍵詞】網絡異常行為分析 實時關聯(lián) 機器學習 大數(shù)據

        1 緒論

        近年來網絡攻擊技術發(fā)展變換迅速,隨著各種網絡攻擊檢測技術的發(fā)展,黑客為了繞過檢測系統(tǒng),采用的攻擊手段也越來越隱蔽,行為越來越復雜,為了達到最終目的,黑客潛伏周期也會很長。在此種場景下,現(xiàn)在普遍運用的基于特征檢測的方法只能將已有的入侵行為模式檢查出來,但對新的入侵方法無能為力,需要安全專家對新入侵方式進行分析后重新提取模型特征,生成新的規(guī)則更新到系統(tǒng)中,費時費力,因此在應對復雜多變的攻擊手段面前往往響應效率低下。

        隨著大數(shù)據技術的發(fā)展,提升了對海量數(shù)據的處理能力,因此可以通過實時數(shù)據流的檢測和對歷史數(shù)據的挖掘分析進行非基于特征的異常行為檢測,此方法可以識別更隱蔽及復雜手法的攻擊行為。

        2 系統(tǒng)目標

        本系統(tǒng)基于大數(shù)據技術手段,通過對網域信息、資產信息、應用信息、漏洞信息、實時網絡流量、安全事件等信息的采集和關聯(lián)分析,并對收集的歷史數(shù)據進行挖掘分析,通過智能的手段去學習正常的網絡訪問行為基線,再利用基線與實時網絡訪問行為的對比識別異常攻擊行為,并以可視化的方式直觀的顯示異常告警和異常訪問路徑。

        3 系統(tǒng)設計

        3.1 系統(tǒng)架構設計

        如圖1所示,本系統(tǒng)分為數(shù)據采集層、數(shù)據預處理層、數(shù)據分析層、數(shù)據持久化層、和展示層。

        3.1.1 數(shù)據采集層

        數(shù)據采集層負責從不同的數(shù)據源采集數(shù)據,本系統(tǒng)的數(shù)據來源包括網絡中核心交換機的鏡像網絡流量,網絡中部署的IDS、WAF、防火墻、防病毒等安全設備的告警事件,主機和應用服務器日志。

        3.1.2 數(shù)據預處理層

        數(shù)據預處理層負責將接入的原始數(shù)據進行解析、過濾、數(shù)據提取、歸一化、豐富化處理,為后續(xù)的數(shù)據分析處理提供有效數(shù)據。

        3.1.3 數(shù)據分析層

        數(shù)據分析層分為實時分析和離線分析兩部分。實時分析基于實時數(shù)據流處理技術,對數(shù)據進行關聯(lián)對比和統(tǒng)計,基于一定的分析規(guī)則形成異常行為告警事件。

        3.1.4 數(shù)據持久化層

        數(shù)據持久化層根據存儲數(shù)據的類型及使用情況采用不同的數(shù)據庫進行存儲。

        3.1.5 展示平臺層

        展示平臺層是一個人機交互的Web應用,主要用于系統(tǒng)的可視化管理操作、分析結果的展示、告警事件從查詢和處理、交互式歷史數(shù)據挖掘分析。

        3.2 系統(tǒng)功能模塊設計

        3.2.1 數(shù)據采集與預處理模塊

        數(shù)據采集與預處理模塊實現(xiàn)了數(shù)據采集接收的接口,支持通過syslog接收流量前端、安全設備上報的數(shù)據,同時支持通過日志文件讀取的方式獲得應用日志數(shù)據。數(shù)據預處理通過正則規(guī)則文件對接入的事件內容進行匹配和提取,并將數(shù)據內容按照統(tǒng)一的格式進行組裝形成歸一化的事件,并對數(shù)據中例如各異的時間格式、事件等級、事件名稱等進行統(tǒng)一的標準化處理。事件經過歸一化處理后還需要對后續(xù)分析所依賴的屬性進行豐富化處理,例如根據IP定位回填物理位置信息、資產信息等。

        3.2.2 實時異常檢測模塊

        實時異常檢測模塊采用Spark streaming(Spark Streaming是建立在Spark上的實時計算框架,通過它提供的豐富的API、基于內存的高速執(zhí)行引擎,用戶可以結合流式、批處理和交互試查詢應用)技術進行實時事件流的處理,數(shù)據采集與預處理模塊將處理過的數(shù)據放入kafka(是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng))中,kafka作為系統(tǒng)的消息總線承擔各個模塊之間的數(shù)據交換,實時監(jiān)測模塊通過消息訂閱讀取預處理后的實時數(shù)據流,并依據檢測規(guī)則對數(shù)據內容進行檢測,例如根據登記的允許開放端口檢測非法端口訪問,根據權限規(guī)則檢測非法請求,根據請求頻度、業(yè)務規(guī)則檢測異常行為等。

        3.2.3 機器學習模塊

        機器學習模塊采用Spark MLlib(MLlib是Spark實現(xiàn)一些常見的機器學習算法和實用程序,包括分類、回歸、聚類、協(xié)同過濾、降維以及底層優(yōu)化等)技術對歷史流量數(shù)據、安全事件數(shù)據進行基于統(tǒng)計、聚類等算法的學習,可以學習針對應用的流量訪問規(guī)律,形成正常業(yè)務訪問模型,再將模型轉化成規(guī)則應用到實時異常檢測模塊對后續(xù)數(shù)據進行實時分析。

        3.2.4 綜合管理與展示模塊

        綜合管理與展示模塊采用Spring MVC架構實現(xiàn)了一個人機交互的管理平臺,管理平臺包括異常分析結果的可視化展示,告警事件的查詢、統(tǒng)計、處置管理,資產、漏洞、惡意IP等信息登記,數(shù)據挖掘任務的配置,算法管理,學習結果查看,系統(tǒng)自身的用戶、角色權限管理,系統(tǒng)操作日志管理,系統(tǒng)菜單管理,字典表管理等。endprint

        4 使用的關鍵技術

        4.1 大數(shù)據存儲技術

        Elasticsearch適用于海量事件的檢索處理,因此將經常被用于頁面交互查詢的分析告警結果數(shù)據放入Elasticsearch。

        HDFS是Hadoop分布式文件系統(tǒng),適合存放大規(guī)模數(shù)據集,因此將收集的原始數(shù)據和預處理結果數(shù)據放入其中,結合Spark(Apache Spark 是專為大規(guī)模數(shù)據處理而設計的快速通用的計算引擎)技術進行歷史數(shù)據挖掘。

        redis是一個key-value的基于內存的存儲系統(tǒng),適用于實時分析時快速查找相關聯(lián)的信息,例如根據IP地址檢索物理位置、關聯(lián)資產信息,根據漏洞編號關聯(lián)漏洞信息等。

        Mysql是關系數(shù)據庫,適合存儲系統(tǒng)管理類數(shù)據、統(tǒng)計結果數(shù)據、報告數(shù)據等。

        4.2 實時流事件處理技術

        Spark streaming是一個對實時數(shù)據流進行高通量、容錯處理的流式處理系統(tǒng),可以對接多種數(shù)據源,本系統(tǒng)采用的數(shù)據源是kafka,系統(tǒng)將讀取的數(shù)據流分解成一系列短小的批處理作業(yè),對每個數(shù)據片的內容根據檢測規(guī)則進行異常檢測。

        4.3 大數(shù)據挖掘分析技術

        本系統(tǒng)基于Spark MLlib技術,通過運用聚類、統(tǒng)計、頻度分析、決策樹等算法從netflow流量中學習服務器以及開放的端口,統(tǒng)計端口的流量規(guī)律,通過對比包數(shù)范圍、字節(jié)范圍、流量條數(shù)、連接頻率、連接范圍等指標發(fā)現(xiàn)異常的網絡訪問行為,可根據異常特征確定惡意域名、僵尸網絡等。

        5 系統(tǒng)驗證

        系統(tǒng)開發(fā)完成后應用于某大型國企中心機房,采集業(yè)務應用服務器區(qū)核心交換機流量,經過一段時間的穩(wěn)定運行可以識別出服務器違規(guī)開放的端口,非法的協(xié)議訪問,發(fā)現(xiàn)外部惡意主機連接等異常行為,且發(fā)現(xiàn)的外部IP地址通過網絡惡意地址庫檢索結果證實是垃圾郵件服務器。

        6 結論

        本系統(tǒng)基于大數(shù)據的技術,通過運用Spark、kafka、Spring等技術框架構建了一套網絡異常分析監(jiān)測系統(tǒng),通過接入網絡流量、安全日志、漏掃結果、資產信息等數(shù)據進行關聯(lián)對比和挖掘分析,能夠實現(xiàn)無需預置特征的網絡異常行為識別。

        作者單位

        中電長城網際系統(tǒng)應用有限公司 北京市 102209endprint

        猜你喜歡
        機器學習大數(shù)據
        基于詞典與機器學習的中文微博情感分析
        基于機器學習的圖像特征提取技術在圖像版權保護中的應用
        基于網絡搜索數(shù)據的平遙旅游客流量預測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        前綴字母為特征在維吾爾語文本情感分類中的研究
        科教導刊(2016年26期)2016-11-15 20:19:33
        基于支持向量機的金融數(shù)據分析研究
        大數(shù)據環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據背景下的智慧城市建設研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        機器學習理論在高中自主學習中的應用
        亚洲色爱免费观看视频| 久久久人妻丰满熟妇av蜜臀| 凹凸世界视频a一二三| 日本一区二区在线高清观看 | 精品蜜臀国产av一区二区| 亚洲视频免费在线观看| 999精品无码a片在线1级| 欧美a级情欲片在线观看免费| 亚洲国产午夜精品乱码| 日本一区二区视频免费观看| 精品久久一品二品三品| 国产女人好紧好爽| 午夜性无码专区| 乱子伦av无码中文字幕| 亚洲国产精品夜男人天堂| 青青草视频在线观看入口| 午夜精品久久久久久久| 人妻av乱片av出轨| 337p日本欧洲亚洲大胆色噜噜| 日韩av一区在线播放| 青青草视频是针对华人| 日本va欧美va精品发布| 三级4级全黄60分钟| a午夜国产一级黄片| 亚洲女人天堂成人av在线| 久草青青91在线播放| 首页 综合国产 亚洲 丝袜| 久久av高潮av喷水av无码| 日韩精品中文字幕免费人妻| 青青河边草免费在线看的视频 | 亚洲av套图一区二区| 一区二区三区蜜桃av| 免费观看交性大片| 国产精品美女久久久久久久久| 亚洲AV无码一区二区三区少妇av | 免费观看黄网站| 国产精品无码mv在线观看| 国产在线精品观看一区二区三区 | 日韩有码中文字幕在线视频 | 永久免费观看的毛片手机视频| 亚洲粉嫩av一区二区黑人|