亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)的密度空間聚類算法的網(wǎng)絡(luò)惡意數(shù)據(jù)流檢測策略

        2019-05-08 02:56:58李衛(wèi)華
        關(guān)鍵詞:參考點(diǎn)數(shù)據(jù)流聚類

        李衛(wèi)華

        (龍巖學(xué)院 信息工程學(xué)院,福建龍巖364012)

        惡意網(wǎng)絡(luò)流是由不同類型的惡意軟件產(chǎn)生的,攻擊者利用系統(tǒng)或軟件安全漏洞[1]來部署惡意軟件。近年來,網(wǎng)絡(luò)異常流量的檢測和攻擊類型的識別一直是研究的熱點(diǎn)[2-4]。現(xiàn)有的惡意流量檢測主要集中在惡意軟件的檢測中,包括基于簽名和基于異常的檢測方法[5]。但由于這些檢測方法都需要對數(shù)據(jù)包進(jìn)行操作,從而產(chǎn)生巨大的計(jì)算開銷,因此并不適用于動態(tài)的網(wǎng)絡(luò)環(huán)境。研究者開始使用有監(jiān)督的機(jī)器學(xué)習(xí)來檢測惡意數(shù)據(jù)流(如C4.5決策樹[6]、神經(jīng)網(wǎng)絡(luò)[7]、貝葉斯[2]),也有研究者將無監(jiān)督學(xué)習(xí)算法用于惡意流量檢測和分析[8],并用來識別惡意軟件[9]。但隨著攻擊技術(shù)的發(fā)展,惡意數(shù)據(jù)流逐漸具有與正常數(shù)據(jù)流相似的統(tǒng)計(jì)特征。因此這些技術(shù)面臨著產(chǎn)生高假陽性率的風(fēng)險(xiǎn),即大量的正常網(wǎng)絡(luò)數(shù)據(jù)流會被錯(cuò)誤地歸類為惡意數(shù)據(jù)流。聚類算法是常用的檢測識別方法,然而,由于無法控制聚類過程中數(shù)據(jù)點(diǎn)的相似程度,現(xiàn)有的聚類算法不適用于惡意網(wǎng)絡(luò)流的檢測。鑒于此,本文設(shè)計(jì)一個(gè)有效的聚類算法,將惡意流的攻擊過程分為多個(gè)階段,利用基于參考點(diǎn)的策略來改進(jìn)密度空間聚類算法。最后利用實(shí)驗(yàn)評估本文策略的有效性。

        1 惡意數(shù)據(jù)流檢測策略

        本文將IP數(shù)據(jù)流[10]作為網(wǎng)絡(luò)數(shù)據(jù)流的基本單元,并通過一個(gè)5元組來定義一個(gè)IP數(shù)據(jù)流。其中是源IP地址是源端口號是目的IP地址是目的端口號是協(xié)議類型。IP流由n維特征向量表示,其中n是特征的個(gè)數(shù),xi是指從單個(gè) IP流中提取的統(tǒng)計(jì)特征。研究人員發(fā)現(xiàn)了超過200個(gè)可用于數(shù)據(jù)流分類和聚類的復(fù)雜特征,但如果在進(jìn)行數(shù)據(jù)流分類/聚類時(shí)使用了過多特征,就會產(chǎn)生很高的計(jì)算開銷。因此本文僅使用幾個(gè)簡單的特征[11]來對網(wǎng)絡(luò)惡意數(shù)據(jù)IP流(下文簡稱為“惡意流”)進(jìn)行檢測,具有足夠的識別能力。我們使用網(wǎng)絡(luò)數(shù)據(jù)流的網(wǎng)絡(luò)層和傳輸層參數(shù)作為特征,如表1所示。

        表1 網(wǎng)絡(luò)數(shù)據(jù)流的特征

        我們首先對數(shù)據(jù)集進(jìn)行預(yù)處理。對于連續(xù)型的特征屬性值,通過將其取值范圍劃分為多個(gè)區(qū)間,從而將一個(gè)連續(xù)屬性值離散化。本文使用基于熵的離散化方法,假設(shè)閾值T將樣本S分為子集S1和S2,并假設(shè)共有K個(gè)類是樣本S中類的比例。子集S的類熵定義如下:

        假設(shè)S1S,且 S2=S-S1,則樣本S中關(guān)于特征F在閾值T下的類信息熵定義如下:

        若滿足公式(3)所示的條件,則認(rèn)為對樣本S以T作為閾值進(jìn)行劃分是可接受的。

        其中,InG(F,T;S)是信息增益,N是樣本個(gè)數(shù),參數(shù)是常數(shù)。對于每個(gè)特征,我們根據(jù)可接受劃分(即滿足式(3)的劃分)將特征屬性值的取值范圍劃分為一系列區(qū)間,然后用不同的標(biāo)稱(nominal)表示各個(gè)區(qū)間,該過程就是連續(xù)值的離散化。

        惡意流的聚類過程包括惡意流識別、特征提取、特征預(yù)處理、無監(jiān)督學(xué)習(xí)和聚類,惡意流的最小粒度為IP數(shù)據(jù)包。首先,根據(jù)數(shù)據(jù)流的5元組標(biāo)識將流量聚合成相應(yīng)的數(shù)據(jù)流。然后,從聚合后的數(shù)據(jù)流中提取特征,利用離散化方法對特征進(jìn)行預(yù)處理,將特征值轉(zhuǎn)化為標(biāo)稱。接下來,使用非對稱二進(jìn)制對標(biāo)稱進(jìn)行編碼。最后,使用聚類算法來處理這些編碼后的標(biāo)稱。某些惡意流具有與正常流相似甚至一樣的特征,因此要從數(shù)據(jù)流中分離惡意流就顯得尤為困難。像DDoS等這一類的惡意流具有不同的攻擊階段,因此有必要將惡意流分成不同的階段,這能使分類的過程變得更加容易。

        對于編碼后的非對稱二進(jìn)制特征,其兩種狀態(tài)并不是同等重要的。給定兩個(gè)非對稱的二進(jìn)制特征,那么兩“1”(即正匹配)被認(rèn)為比兩個(gè)“0”(負(fù)匹配)更重要。本文用q表示個(gè)體i和個(gè)體j正匹配的數(shù)量,用r表示個(gè)體i的特征為“1”、個(gè)體j的特征為“0”的數(shù)量,用s表示個(gè)體i的特征為“0”、個(gè)體j的特征為“1”的數(shù)量。本文使用Jaccard系數(shù)來計(jì)算個(gè)體i和個(gè)體j之間的不對稱二進(jìn)制相似度sim(i,j)[12]。

        (a)權(quán)重計(jì)算:對于數(shù)據(jù)流di,計(jì)算數(shù)據(jù)流di與集合D中所有數(shù)據(jù)流dj(除數(shù)據(jù)流di以外)之間的相似度sim(i,j),數(shù)據(jù)流di的權(quán)重wi計(jì)算方法如公式(4)所示。

        (b)參考點(diǎn)選擇。按照數(shù)據(jù)流的權(quán)重對其進(jìn)行降序排序,將結(jié)果存入候選隊(duì)列中。從Q中選取兩個(gè)數(shù)據(jù)流S1和S2作為參考點(diǎn)。我們需要盡可能確保這兩個(gè)參考點(diǎn)分別屬于不同的簇。由權(quán)重計(jì)算過程可知,屬于同一簇的數(shù)據(jù)流具有相似的權(quán)重。因此,本文選擇權(quán)重差異值最大的兩個(gè)數(shù)據(jù)流作為參考點(diǎn)S1和S2。

        (c)參考點(diǎn)聚類。對于數(shù)據(jù)流q,如果它與參考點(diǎn)s之間具有最大的相似度,則將q加入簇中,并將q從隊(duì)列Q刪除。當(dāng)候選隊(duì)列中的數(shù)據(jù)流與參考點(diǎn)之間的相似度小于閾值時(shí),參考點(diǎn)的聚類過程停止。接下來,重復(fù)參考點(diǎn)選擇、參考點(diǎn)聚類兩個(gè)過程,直到隊(duì)列Q為空。

        (d)噪聲消除。數(shù)據(jù)集中可能包含不屬于惡意流的噪聲,因此本文將簇大小小于3的視為噪聲。

        2 性能評估

        我們使用入侵檢測數(shù)據(jù)集中的DDoS數(shù)據(jù)集來評估本文的策略,DDoS攻擊過程分為五個(gè)階段:從遠(yuǎn)程站點(diǎn)進(jìn)行IP-sweep、通過探測IP以查找sadmind進(jìn)程、使用sadmind的漏洞進(jìn)行破壞、安裝DDoS木馬軟件以及進(jìn)行DDoS攻擊。

        本文使用三個(gè)常用的指標(biāo)來評價(jià)聚類結(jié)果,即純度(purity)、蘭德指數(shù)(Rand Index)以及F值(FMeasure)[13]。我們使用范圍從0到1的閾值對測試數(shù)據(jù)集進(jìn)行了一系列的聚類實(shí)驗(yàn),結(jié)果如圖1、圖2和圖3所示。隨著閾值的增加,簇的純度、蘭德指數(shù)和F值也隨之增加。尤其是當(dāng)閾值大于0.5時(shí),三種指標(biāo)都能夠得到更好的結(jié)果。然后,我們將本文策略與K-Means算法進(jìn)行比較,其中我們將閾值設(shè)置為0.95,結(jié)果如圖4所示。其中,圖例中K-Means(C=2)是指K-Means算法的初始中心點(diǎn)數(shù)量為2。由圖4可知,本文策略比K-Means具有更好的聚類性能。

        圖1 聚類的純度

        圖2 聚類的蘭德指數(shù)

        圖3 聚類的F值

        圖4 本文策略與K-Means算法對比結(jié)果

        3 結(jié)論

        利用基于參考點(diǎn)展開的策略來改進(jìn)密度空間聚類算法,并使用該聚類算法進(jìn)行網(wǎng)絡(luò)惡意數(shù)據(jù)流檢測。實(shí)驗(yàn)結(jié)果表明,與K-Means算法相比,本文策略具有更好的聚類性能。在未來的研究工作中,我們將進(jìn)一步研究如何根據(jù)聚類結(jié)果識別隱藏在正常數(shù)據(jù)流中的惡意攻擊流。

        猜你喜歡
        參考點(diǎn)數(shù)據(jù)流聚類
        FANUC數(shù)控系統(tǒng)機(jī)床一鍵回參考點(diǎn)的方法
        汽車維修數(shù)據(jù)流基礎(chǔ)(下)
        參考點(diǎn)對WiFi位置指紋算法的影響
        數(shù)控機(jī)床返回參考點(diǎn)故障維修
        一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機(jī)制
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        FANUC數(shù)控機(jī)床回參考點(diǎn)故障分析與排除
        基于改進(jìn)的遺傳算法的模糊聚類算法
        基于數(shù)據(jù)流聚類的多目標(biāo)跟蹤算法
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        亚洲成人av一区二区麻豆蜜桃| 国产精品免费久久久久影院仙踪林 | 国产在线一区二区三精品乱码| 国产无遮挡又黄又爽免费网站| 性夜影院爽黄a爽在线看香蕉| 挑战亚洲美女视频网站| 大香蕉国产av一区二区三区| 高h纯肉无码视频在线观看| 熟妇人妻AV中文字幕老熟妇 | 日韩精品视频中文字幕播放| 久久精品国产99久久久| 国产精品白丝喷水在线观看| 日韩久久久久中文字幕人妻| 久久精品国产亚洲av豆腐| 无码色av一二区在线播放| 人妻丰满熟妇av无码处处不卡| 人片在线观看无码| 精品一区二区三区久久| 免费成人在线电影| 91制服丝袜| 一区二区免费国产a在亚洲| 国产av自拍视频在线观看| 乱人伦中文无码视频| 日本道免费精品一区二区| 强迫人妻hd中文字幕| 中文无码伦av中文字幕| 97色伦图片97综合影院久久| 久久免费精品视频老逼| 日本一区二区三区视频在线观看| 男人扒开女人下面狂躁小视频| 四虎国产精品免费久久麻豆| av一区二区在线网站| 欧美一性一乱一交一视频| 热久久网站| 日本免费三级一区二区| 女人高潮内射99精品| 亚洲精品国产美女久久久| 手机在线看片在线日韩av| 国产精品无码一区二区三级| 国产成人av一区二区三区在线| 在线视频一区二区在线观看|