亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進AE-CM模型的未知應用層協(xié)議識別

        2024-03-25 02:05:04馬甜甜
        計算機技術與發(fā)展 2024年3期
        關鍵詞:編碼器分支卷積

        馬甜甜,洪 征,陳 乾

        (陸軍工程大學 指揮控制工程學院,江蘇 南京 210014)

        0 引 言

        未知協(xié)議識別是指在網(wǎng)絡通信中識別出無法被預先確定的、類型未知的協(xié)議的過程。未知協(xié)議識別方法依據(jù)協(xié)議特征對網(wǎng)絡流量進行分類,有助于發(fā)現(xiàn)異常的網(wǎng)絡通信活動[1]。提高未知應用層協(xié)議的識別能力,有利于安全高效地提供網(wǎng)絡服務[2]。

        基于深度聚類的未知協(xié)議識別方法[3]通過神經(jīng)網(wǎng)絡模型對網(wǎng)絡流量進行特征提取,并進行聚類分配。該方法適用于不同協(xié)議的特征和流量分布。

        與此同時,基于深度聚類的未知協(xié)議識別方法[4]主要存在以下問題:

        (1)特征提取和聚類分配是相互獨立的過程,聚類結(jié)果不能指導特征提取,導致聚類性能不佳。

        (2)未知協(xié)議的特征不確定,僅從時間或空間的單一維度提取特征會造成特征不充分。

        (3)嵌入式聚類分配模塊對不同特征的影響程度不同[5],但在分配初始權重時采用隨機或相等的權重值,模型需要多次更新,收斂速度較慢。

        AE-CM[6]在現(xiàn)有深度聚類模型的基礎上設計了嵌入式聚類分配模塊,克服了聚類分配模塊對特征提取模塊指導性不強的問題。該文以AE-CM為基礎,提出了未知協(xié)議識別模型(DAEC-NM)。該文的主要研究工作如下:

        (1)提出了一種新的未知協(xié)議識別模型,改進了AE-CM,并將改進模型應用于未知協(xié)議識別。

        (2)在特征提取模塊中插入重新設計的神經(jīng)網(wǎng)絡模塊,增強了模型對協(xié)議時空特征的提取能力。經(jīng)過特征提取模塊獲取的豐富特征能夠被用于指導聚類簇的產(chǎn)生。

        (3)使用Two-branch[7]中提出的鄰居模型提高協(xié)議識別的準確性。使用鄰居分支來捕獲鄰居樣本的格式信息和關聯(lián)特征,并根據(jù)鄰居特征提高主分支中相關協(xié)議特征的權重。

        (4)在聚類模塊中引入了注意力評分機制。記錄模型特征提取過程中的特征權重,并在樣本聚類分配過程中為相關特征設置合理的初始權重,指導樣本進入相應的聚類簇。

        (5)實驗結(jié)果表明,與現(xiàn)有的基于深度聚類的未知協(xié)議識別方法相比,DAEC-NM在ACC、ARI和NMI等指標上都有明顯提升。

        1 協(xié)議識別模型的設計

        未知協(xié)議的識別主要包括協(xié)議數(shù)據(jù)預處理以及協(xié)議識別,如圖1所示。數(shù)據(jù)預處理包括三個步驟。流量清理主要去除與協(xié)議識別無關的數(shù)據(jù)包,提高協(xié)議識別準確性。流重組和分割將網(wǎng)絡流量轉(zhuǎn)換為符合深度自編碼器輸入格式的數(shù)據(jù),并將請求與響應組合在一起,便于分析協(xié)議內(nèi)的關聯(lián)關系。此后從網(wǎng)絡流的開頭截取固定長度的段,并根據(jù)需要執(zhí)行截斷和填充操作。最后,流量數(shù)據(jù)歸一化對獲得的固定長度的序列進行歸一化操作,并將序列轉(zhuǎn)換為固定格式的二維張量。通過數(shù)據(jù)預處理,可以提高輸入數(shù)據(jù)的質(zhì)量,減少數(shù)據(jù)噪聲,保證模型訓練的有效性和準確性。

        圖1 未知協(xié)議識別的流程

        該文提出的DAEC-NM如圖2所示,主要包含一個深度聚類分支(DAEC-branch)和一個鄰居分支(NM-branch)。其中DAEC分支中包含協(xié)議特征的提取模塊(feature extraction module)、聚類分配模塊(clustering module)和協(xié)議重構模塊(protocol reconstruction module)。各模塊的具體工作將在后文詳細論述。

        圖2 DAEC-NM結(jié)構

        1.1 協(xié)議識別模型的特征提取

        深度聚類模型DAEC的設計如圖3所示,特征提取編碼器根據(jù)其功能模塊將輸入的數(shù)據(jù)流張量轉(zhuǎn)換為協(xié)議特征,聚類分配模塊根據(jù)協(xié)議特征輸出聚類簇分配結(jié)果,并根據(jù)協(xié)議簇分配結(jié)果重新調(diào)整協(xié)議特征權重,協(xié)議重構解碼器根據(jù)協(xié)議特征重構協(xié)議樣本。在設計未知協(xié)議識別模型中的特征提取編碼器時,傳統(tǒng)的堆棧自編碼器處理非局部特征信息時不夠靈活。DAEC模型采用了簡單卷積模塊、時序卷積模塊和多層感知機模塊來提取協(xié)議樣本的特征。簡單卷積模塊采用高維卷積對協(xié)議樣本進行空間特征提取,以增強對不同協(xié)議的區(qū)分能力。時序卷積模塊是一種時間序列模型,通過殘差鏈接塊和膨脹因果卷積提取協(xié)議數(shù)據(jù)中的時間相關特征,以提高聚類分配的準確性。多層感知機模塊采用全連接層對前兩個模塊提取的特征進行組合和抽象,增強對協(xié)議特征的區(qū)分能力。為了避免模型計算冗余參數(shù)的壓力,該文向MLP中插入衰減層Dropout1,Dropout2,提高模型的泛化能力和穩(wěn)健性。這些模塊相互結(jié)合,可以挖掘協(xié)議數(shù)據(jù)的空間特征和時間特征,增強挖掘特征對不同協(xié)議的區(qū)分能力。

        圖3 DAEC自編碼器模型結(jié)構

        1.1.1 簡單卷積模塊

        簡單卷積模塊由兩個卷積層組成,用于提取協(xié)議樣本的空間特征。協(xié)議特征在卷積層的輸出值計算方法為:

        y=ReLU(Wyx+by)

        (1)

        其中,y代表卷積操作后的輸出,Wy代表卷積核權重,by表示偏置,ReLU表示激活函數(shù)。

        1.1.2 時序卷積模塊

        TCN由多個殘差模塊(Residual Convolutional Block)構成,其處理函數(shù)為TCN(),它的正向傳播計算過程如下:

        ht=ReLU(max(Whxt+bh))

        (2)

        (3)

        (4)

        ft=Wfxt+bf

        (5)

        (6)

        1.1.3 多層感知機模塊

        從TCN模塊輸出的特征輸入MLP模塊,MLP模塊的正向傳播計算公式如下:

        z1=W1x+b1

        (7)

        (8)

        x1=z1·d1

        (9)

        z2=W2x1+b2

        (10)

        (11)

        x2=z2·d2

        (12)

        z3=W3x2+b3

        (13)

        其中,W1,W2和W3表示權重,b1,b2和b3表示偏置,p1和p2表示衰退層保留節(jié)點的概率。

        1.2 鄰居分支與補充特征

        高維特征空間表示可能無法捕捉到協(xié)議數(shù)據(jù)的語義和局部聯(lián)系。為了解決這些問題,該文采用了Two-branch方法設計鄰居分支,采集鄰居特征獲得更豐富的協(xié)議信息,增強模型對協(xié)議的學習能力。鄰居分支對鄰居樣本的二維張量進行特征提取,使用平均池化來得到一組鄰居中心特征,從而獲得一組通道特征和局部相關特征。這樣,鄰居分支可以幫助深度聚類模型更好地捕獲協(xié)議數(shù)據(jù)的語義和局部聯(lián)系,從而提高協(xié)議識別的準確性。

        1.2.1 鄰居編碼器模塊設計

        模型的編碼器可分為X編碼器和鄰居編碼器,如圖4所示。兩個分支結(jié)構的網(wǎng)絡模型相同且同步輸入,X編碼器分支輸入樣本x,鄰居分支通過最近鄰方法[8]將前次聚類結(jié)果中x的k個最近鄰樣本作為輸入。假設一個輸入鄰居樣本為z,它的前向傳播過程如下:

        圖4 編碼器模型鄰居分支結(jié)構

        簡單卷積模塊的處理:

        yz=ReLU(Wyz+by)

        (14)

        時序卷積模塊的處理:

        rz=TCN(yz)

        (15)

        多層感知機模塊的處理,簡寫為:

        mz=Wmz+bm

        (16)

        其中,Wm表示權重,bm表示偏置,需要通過多層感知機訓練學習得到。

        1.2.2 鄰居編碼器權重加強設計

        樣本鄰居的特征可以為協(xié)議分析提供更全面的信息,同時可以發(fā)現(xiàn)其他樣本的特征模式,進而深入了解數(shù)據(jù)的總體特征。

        X分支和鄰居分支獲得整體樣本特征表示z=[z1,ze,z3,…,ze]和鄰居特征表示m=[mz1,me,…,mzk,0,0,0,…](k

        (17)

        其中,θ表示增強參數(shù),一般小于0.5,防止鄰居特征中的冗余特征過強,影響原樣本特征。

        將加強后的特征輸入聚類層之前的隱藏層,篩選權重較強的特征,其前向傳播計算為:

        (18)

        1.3 基于注意力評分機制的聚類模塊的設計

        在AE-CM中使用RMABs[9]映射方法,設計嵌入式聚類模塊,它將原始特征空間映射到低維的嵌入空間,并在嵌入空間中進行聚類。

        在RMABs映射方法中,將EM算法迭代過程封裝為一個小型自編碼器表示的聚類模塊,映射過程如下:

        F-step:Rd→RK,F(x)=〈p(z=k|x)〉{1≤k≤K}=

        γ~softmax(XWenc+Benc)=Γ

        (19)

        (20)

        AE-CM中聚類模塊的gamma層的初始權重矩陣采用隨機數(shù)進行設置,需要多輪訓練來找到合適的特征權重初始值,降低了模型的識別效率,增加了訓練開銷。為解決這一問題,該文使用加性注意力評分機制[10]生成初始權重矩陣。該評分機制捕獲特征關聯(lián)性和重要性評分,得到特征權重評分矩陣,并使用該評分矩陣作為初始化的gamma層權重矩陣,從而使gamma層在幾次迭代后快速收斂。這種方法可以降低訓練次數(shù),減少訓練開銷,提高模型的識別效率,同時保持聚類模塊的對稱性。

        聚類模塊總體設計如圖5所示,gamma層對于上層網(wǎng)絡提取的每一個協(xié)議特征,通過注意力評分函數(shù)獲得注意力評分,用來表示該特征的重要性。在此基礎上,對注意力評分進行加權平均f,得到最終的初始注意力評分矩陣Wh,通過gamma層將該樣本特征表示輸入相應簇中。相較于公式19,加入注意力評分機制的gamma層前向傳播計算方法為:

        圖5 基于注意力評分機制的聚類模塊

        (21)

        h=Wha+bh

        (22)

        (23)

        其中,Wv,Wq和Wk表示權重,bh表示偏置,a為注意力評分后加權平均層,h為隱藏層,g為gamma聚類層輸出。

        公式20中原mu layer是一個逆線性變化層ΓWdec+Bdec,為了抵消加性注意力機制的影響,聚類模塊中G-step設計為一個多級權重衰減[11]的逆線性變化過程,mu layer前向傳播計算為:

        mu=Γ?Dropout(Wh)+b

        (24)

        其中,Wh是gamma層提供的注意力權重。

        1.4 協(xié)議識別過程

        該文提出的未知協(xié)議識別模型,通過四個步驟(特征提取、聚類分配、協(xié)議重構、模型優(yōu)化)進行協(xié)議識別。特征提取模塊采用兩個分支的設計,嵌入式聚類分配模塊使用gamma層進行聚類分配,使用mu層調(diào)整未知協(xié)議特征的影響權重,最后使用重構誤差和聚類損失來聯(lián)合優(yōu)化模型。模型不需要標記標簽就能夠自動識別未知協(xié)議的分布情況。

        2 實驗分析

        基于Tensoflow2.0構建了未知協(xié)議識別原型系統(tǒng)。為評價模型的性能,主要考慮了以下標準:

        (1)評價鄰居數(shù)量以及鄰居分支對協(xié)議識別性能的影響。

        (2)評價改進聚類模塊對協(xié)議識別性能的影響。

        (3)與其他協(xié)議識別模型進行比較,并對協(xié)議識別模型的整體性能進行了評價。

        2.1 數(shù)據(jù)集與評價標準

        選擇數(shù)據(jù)集IDS2017[12]進行實驗。數(shù)據(jù)集包含的是網(wǎng)絡流量數(shù)據(jù),以pcap的格式提供。提取了四種應用層協(xié)議(HTTP,FTP,DNS和SMB)進行測試。根據(jù)預處理方法對協(xié)議數(shù)據(jù)進行預處理后,得到了45 514條有序的網(wǎng)絡流。在實驗中,協(xié)議的標簽被刪除,從而使所有的協(xié)議都可以被視為未知的協(xié)議。為了評估所提出的協(xié)議識別模型的有效性,選擇了精確度(ACC)、歸一化互信息(NMI)和調(diào)整蘭德指數(shù)(ARI)作為評估指標。

        2.2 實驗結(jié)果分析

        2.2.1 鄰居的影響

        該文通過鄰居分支提取樣本鄰居的特征作為補充特征。在鄰居分支的設計過程中,通過近似算法選取k個樣本鄰居。需要設置實驗分析鄰居數(shù)量對協(xié)議識別效果是否有影響。此外,需要設置實驗探究鄰居分支對協(xié)議識別模型識別精度的提升效果。

        (1)鄰居數(shù)量的影響。

        探究鄰居數(shù)量對協(xié)議識別模型效果影響,設計k鄰居數(shù)量范圍為1~300,實驗通過NMI值隨k值變化,探究鄰居數(shù)量的影響。

        從圖6分析可得,鄰居數(shù)量小于90時,NMI曲線波動小,鄰居數(shù)量超過110時,NMI曲線恢復平穩(wěn)波動;而鄰居數(shù)量在100左右時,NMI曲線急劇下降。NMI值在鄰居數(shù)量小于100時較高(約0.9),在鄰居數(shù)量超過100時較低(約0.66)。

        圖6 NMI值隨k的變化

        從實驗結(jié)果可以看出,較遠處的鄰居與原樣本相差較大,從而導致原樣本的特征被鄰居樣本的補充特征干擾。因此,該文選擇較小數(shù)量的k值,能夠呈現(xiàn)較好的協(xié)議識別效果。

        (2)鄰居分支的影響。

        為探究鄰居分支對協(xié)議識別模型的效果影響,通過實驗比較帶鄰居分支的模型和不帶分支的模型的識別效果。實驗中分別獲得協(xié)議識別模型(DAEC)帶鄰居分支(NM)和不帶鄰居分支(NA)情況下,模型的精確度(ACC)、調(diào)整蘭德指數(shù)(ARI)和歸一化互信息(NMI)。

        從表1中得出以下結(jié)論:帶鄰居分支的深度聚類模型協(xié)議識別表現(xiàn)優(yōu)于不帶鄰居的模型。

        表1 有無鄰居狀態(tài)下協(xié)議識別模型表現(xiàn) %

        表2 有無注意力評分機制的聚類模塊對協(xié)議識別模型表現(xiàn)的影響 %

        2.2.2 注意力評分機制在聚類模塊中的影響

        探究注意力評分機制在聚類模塊中對協(xié)議識別模型的效果影響,通過實驗比較聚類模塊(CM)包含和不包含注意力評分機制對協(xié)議識別模型的效果。實驗結(jié)果顯示,相較于不包含注意力評分機制的聚類模塊,包含注意力評分機制的聚類模塊的協(xié)議識別模型表現(xiàn)更優(yōu)。精確度提升了4.23百分點,ARI指數(shù)提升了11.63百分點,NMI指數(shù)提升了10.78百分點。其原因在于,注意力評分機制側(cè)重于提高協(xié)議識別模型對于重要特征的關注度,有利于提高聚類效果。具體來說,注意力評分機制可以通過動態(tài)給不同的特征分配不同的權重,使得那些更具有代表性和區(qū)分度的特征能夠更好地被聚類模塊所利用。

        2.2.3 與其他模型的橫向比較

        為了驗證所提出的未知協(xié)議識別模型的性能,將該模型與DEC[13],CAE[14],AE+K-Means[15],K-Means和GMM進行橫向比較。

        其中,K-Means和GMM是傳統(tǒng)的聚類算法,常用于協(xié)議識別模型中。根據(jù)本研究實驗結(jié)果設置它們的參數(shù),K-Means聚類簇數(shù)為4,GMM的成份數(shù)為4。深度聚類的方法包含DEC,CAE,AE+K-Means,AECM以及DAEC-NM(ours),其中除該文設計的網(wǎng)絡外,其他方法的自編碼器均為對稱的堆棧多層感知機。

        不同協(xié)議識別模型的協(xié)議識別結(jié)果如表3所示。在表3所示的協(xié)議識別模型中,K-Means和GMM表示基于機器學習的協(xié)議識別模型,其余為基于深度聚類的未知協(xié)議識別模型。實驗結(jié)果表明,提出的深度聚類協(xié)議識別模型優(yōu)于傳統(tǒng)聚類模型,在此基礎上,基于高斯混和聚類的模型優(yōu)于基于K-Means聚類的模型。同時,嵌入式模型優(yōu)于異步訓練的模型,因為嵌入式模型能夠更好地將聚類表現(xiàn)融入到編碼器的訓練中。此外,增加卷積模塊的自編碼器模型也優(yōu)于原堆棧編碼器模型,能夠增強模型的時間、空間特征的提取能力,從而提高識別精度??傮w而言,提出的協(xié)議識別模型比DEC模型在ACC,ARI和NMI評判標準上分別提高了12.03百分點,25.52百分點和17.78百分點。

        表3 各種方法下協(xié)議識別模型表現(xiàn) %

        3 結(jié)束語

        該文提出了一種未知應用層協(xié)議識別模型(DAEC-NM)。該模型的特征提取模塊包含兩個分支,主分支采用時空卷積網(wǎng)絡來提取協(xié)議數(shù)據(jù)的時空特征,鄰居分支捕獲鄰居樣本間的局部關聯(lián)特征作為補充。模型的聚類模塊通過增加注意力評分機制的方法進一步優(yōu)化識別模型,并實現(xiàn)聚類簇分配。實驗結(jié)果表明,該模型在識別性能上優(yōu)于其他協(xié)議識別模型。在未來的工作中,考慮把該模型應用于協(xié)議逆向分析、入侵檢測等領域,為網(wǎng)絡安全提供有效的保障。

        猜你喜歡
        編碼器分支卷積
        基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
        巧分支與枝
        學生天地(2019年28期)2019-08-25 08:50:54
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于FPGA的同步機軸角編碼器
        基于傅里葉域卷積表示的目標跟蹤算法
        一類擬齊次多項式中心的極限環(huán)分支
        基于PRBS檢測的8B/IOB編碼器設計
        JESD204B接口協(xié)議中的8B10B編碼器設計
        電子器件(2015年5期)2015-12-29 08:42:24
        多總線式光電編碼器的設計與應用
        一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法
        電視技術(2014年19期)2014-03-11 15:38:20
        国产毛片一区二区三区| 亚洲一区二区日韩专区| 亚洲国产精品情侣视频| 国产在线无码一区二区三区视频 | 国产亚洲日本人在线观看| 国产一区二区三区在线影院| 婷婷丁香开心五月综合| 最新中文字幕人妻少妇| 人人妻人人澡人人爽欧美一区双| 亚洲色大成网站www久久九九| 海角国精产品一区一区三区糖心| 色av综合av综合无码网站| 亚洲国产成人无码影院| 亚洲无码图| 97激情在线视频五月天视频| 极品粉嫩小仙女高潮喷水网站| 国产成人精品无码一区二区老年人| 国产精品黄网站免费观看| 亚洲中文字幕有综合久久| 中文字幕免费人成在线网站| 精品乱人伦一区二区三区| 国产一区二区内射最近更新| 无码夜色一区二区三区| 自拍亚洲一区欧美另类| 日韩在线手机专区av| 日韩激情视频一区在线观看| 亚洲字幕中文综合久久| 无码ol丝袜高跟秘书在线观看| 国产精品久久无码不卡黑寡妇| 日本一区二区啪啪视频| 亚洲人成网站在线播放2019| 妓院一钑片免看黄大片| 免费的一级毛片| 日韩精品有码中文字幕| 亚洲av少妇高潮喷水在线| 少妇高潮av久久久久久| 无码人妻精品一区二区三区在线 | 无码专区久久综合久中文字幕| 国产精品网站夜色| 一区二区三区在线观看日本视频| 久久久精品人妻一区二区三区妖精 |