亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于自編碼網(wǎng)絡(luò)和聚類(lèi)的入侵檢測(cè)技術(shù)

        2019-05-17 02:51:44康,萬(wàn)
        關(guān)鍵詞:檢測(cè)模型

        周 康,萬(wàn) 良

        (1.貴州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,貴州 貴陽(yáng) 550025;2.貴州大學(xué) 軟件與理論研究所,貴州 貴陽(yáng) 550025)

        0 引 言

        隨著網(wǎng)絡(luò)安全問(wèn)題的層出不窮,傳統(tǒng)入侵檢測(cè)方法已經(jīng)不符合時(shí)代需要,好的入侵檢測(cè)方法應(yīng)滿(mǎn)足準(zhǔn)確性高、較好的適應(yīng)性和檢測(cè)的實(shí)時(shí)性要求。對(duì)于傳統(tǒng)的入侵檢測(cè)方法,前人做了較多研究。例如,Denatious等[1]提出了利用聚類(lèi)、關(guān)聯(lián)規(guī)則等聯(lián)合數(shù)據(jù)挖掘方法進(jìn)行入侵檢測(cè);Chitrakar等[2]組合應(yīng)用鄰近聚類(lèi)算法和SVM算法來(lái)構(gòu)建異常檢測(cè)模型;Srinoy等[3]將隸屬度綜合運(yùn)用粗糙模糊聚類(lèi)方法實(shí)現(xiàn)數(shù)據(jù)容量的約簡(jiǎn),實(shí)現(xiàn)特征降維等。這些方法都在入侵檢測(cè)領(lǐng)域取得了突破性進(jìn)展,而模糊C均值算法(fuzzy C-means,F(xiàn)CM)最早由Bezdek[4]于1984年提出,使用歐氏距離貼近的模糊隸屬度矩陣方法表達(dá)分類(lèi)。Wang[5]和Lee[6]等將FCM方法應(yīng)用于IDS中,證明了FCM具有良好的分類(lèi)性能。

        特征空間維數(shù)過(guò)多是導(dǎo)致IDS檢測(cè)速率低的主要原因。黃思慧[7]提出了一種PCA-ELM的入侵檢測(cè)算法,在時(shí)間上和檢測(cè)正確率上都有所改進(jìn);Kuang等[8]提出混合的KPCA方法與遺傳算法(GA)、單獨(dú)的KPCA方法對(duì)高維數(shù)據(jù)降維后代入分類(lèi)器進(jìn)行入侵識(shí)別;EDL Hoz[9]將主成分分析(PCA)降維和自組織映射(SOM)聚類(lèi)進(jìn)行入侵檢測(cè),是一種常規(guī)高效的做法。

        前人的研究都在輸入特征維度上進(jìn)行降維,提高了檢測(cè)時(shí)間,但在特征維度空間呈現(xiàn)非線(xiàn)性特征時(shí),無(wú)法較大地提高檢測(cè)速度。因此文中旨在保證高分類(lèi)精度的條件下,最大限度地學(xué)習(xí)到低維特征空間的高維數(shù)據(jù)表示,以提高檢測(cè)速度。

        文中將自編碼網(wǎng)絡(luò)(autoencoder network,AN)[10]應(yīng)用于入侵檢測(cè)領(lǐng)域,使用遺傳算法優(yōu)化FCM算法聚類(lèi)中心避免陷入局部最優(yōu),并將自編碼網(wǎng)絡(luò)降維和主成分分析降維進(jìn)行比較,以及對(duì)比FCM和SVM,softmax分類(lèi)算法,證明AN-GA-FCM入侵檢測(cè)模型具有較高的檢測(cè)速率和檢測(cè)正確率。

        1 深度學(xué)習(xí)模型

        1.1 自編碼網(wǎng)絡(luò)

        (1)

        其中,f(X)為sigmoid激活函數(shù)函數(shù)。

        該網(wǎng)絡(luò)激活方式是隱藏層h1的輸入由上一層h0的輸出x和它的權(quán)重W乘積激活。h2的輸入同樣由h2的輸出x'和它的權(quán)重W'乘積激活,直到所有的隱藏層都被激活。

        1.2 RBM神經(jīng)網(wǎng)絡(luò)

        自編碼網(wǎng)絡(luò)的核心組件之一是受限玻爾茲曼機(jī)網(wǎng)絡(luò)(restricted Boltzmann machine,RBM),通過(guò)對(duì)自編碼網(wǎng)絡(luò)每?jī)蓚€(gè)隱藏層進(jìn)行預(yù)訓(xùn)練得到高維空間映射到低維空間的矩陣表示。RBM包含兩層,可見(jiàn)層(visible layer)和隱藏層(hidden layer)。神經(jīng)元之間連接是層內(nèi)無(wú)連接,層間全連接,其所有節(jié)點(diǎn)滿(mǎn)足全概率分布p(v|h),即Boltzmann分布。通過(guò)使用更多的隱藏單元適應(yīng)更復(fù)雜分布,增強(qiáng)其建模能力。RBM的能量函數(shù)定義如下:

        E(v,h)=-b'v-c'h-h'Wv

        (2)

        其中,W表示連接隱藏單元和可見(jiàn)單元的權(quán)重;b,c分別表示可見(jiàn)層和隱藏層的偏移量。

        由于RBM的性質(zhì),即當(dāng)給定可見(jiàn)層神經(jīng)元的狀態(tài)時(shí),各隱藏層神經(jīng)元的激活條件獨(dú)立;反之當(dāng)給定隱藏層神經(jīng)元的狀態(tài)時(shí),可見(jiàn)層神經(jīng)元的激活也條件獨(dú)立,即:

        (3)

        (4)

        其中,Z為歸一化因子。

        訓(xùn)練的目的是使聯(lián)合概率最大,能量函數(shù)值最小。給定可見(jiàn)層(或隱藏層)所有神經(jīng)元狀態(tài),隱藏層(或可見(jiàn)層)上某個(gè)神經(jīng)單元被激活(取值為1)的概率,計(jì)算P(hk=1|v)(或P(vk=1|h))推導(dǎo)得到:

        (5)

        (6)

        通過(guò)參數(shù)調(diào)整,從隱藏層獲得的可見(jiàn)層vk和原來(lái)的可見(jiàn)層v如果一樣,那么所獲得的隱藏層就是可見(jiàn)層的另一種表達(dá)。

        由于可見(jiàn)單元和隱藏單元概率條件獨(dú)立,樣本p(x)可以通過(guò)馬爾可夫鏈?zhǔn)諗俊?/p>

        1.3 Gibbs采樣

        在RBM中,使用Gibbs采樣[12]作為轉(zhuǎn)換算子,樣本包含了可見(jiàn)單元和隱藏單元集合,但它們是條件獨(dú)立的,因此樣本p(x)可通過(guò)馬爾可夫鏈?zhǔn)諗?。在這個(gè)過(guò)程中,給定隱藏單元值同時(shí)對(duì)可見(jiàn)單元進(jìn)行采樣,同樣給定可見(jiàn)單元值同時(shí)對(duì)隱藏單元采樣。馬爾可夫鏈中的一個(gè)步驟如下:

        h(n+1)~sigm(W'v(n)+c)

        (7)

        v(n+1)~sigm(W'h(n)+b)

        (8)

        其中,h(n)為馬爾可夫鏈第n步所有隱藏單元集合。當(dāng)t→∞就可以得到樣本最精確的概率值。

        1.4 CD-k算法

        利用Gibbs采樣和馬爾可夫鏈求概率分布最大值的方法,其迭代收斂次數(shù)無(wú)法保障,難以確定步長(zhǎng)。對(duì)比分歧算法(contrastive divergence,CD)是Hinton提出的快速訓(xùn)練RBM的方法,并在實(shí)踐中取得了很好的效果[13]。CD算法的目的是希望p(v)≈ptrain(v),即數(shù)據(jù)分布差異性最小。兩個(gè)概率分布的差異性表示為Kullback-Leibler(KL),即:

        (9)

        (10)

        (11)

        實(shí)驗(yàn)證明,在n次迭代后,通過(guò)梯度修正參數(shù)θ,CD值必將趨近于0。

        2 自編碼網(wǎng)絡(luò)的入侵檢測(cè)模型構(gòu)建

        2.1 自編碼網(wǎng)絡(luò)特征提取模型構(gòu)建

        文中設(shè)計(jì)的自編碼網(wǎng)絡(luò)結(jié)構(gòu)由數(shù)據(jù)輸入層、中間4層RBM隱藏層和輸出層組成[15],實(shí)現(xiàn)過(guò)程如下:

        (1)預(yù)訓(xùn)練過(guò)程。通過(guò)RBM預(yù)訓(xùn)練獲得生成模型權(quán)值參數(shù),計(jì)算W和b的殘差,利用梯度下降法更新W和b,使得輸出更好地表示輸入。

        (2)展開(kāi)。在經(jīng)過(guò)多層RBM網(wǎng)絡(luò)預(yù)訓(xùn)練后,編碼器和解碼器使用得到的權(quán)值作為自編碼網(wǎng)絡(luò)的初始權(quán)值。將預(yù)訓(xùn)練得到的RBM網(wǎng)絡(luò)連接起來(lái)并按照自編碼網(wǎng)絡(luò)結(jié)構(gòu)展開(kāi)。

        (3)權(quán)值微調(diào)。按照重構(gòu)誤差最小化原則對(duì)自編碼網(wǎng)絡(luò)進(jìn)行調(diào)整,依次經(jīng)過(guò)解碼器和編碼器利用反向傳播算法[16]對(duì)整個(gè)自編碼網(wǎng)絡(luò)進(jìn)行權(quán)值微調(diào)。通過(guò)前向傳播的方法,對(duì)每一層的神經(jīng)元進(jìn)行前向傳導(dǎo)計(jì)算,利用前向傳播公式得到各層的激活值。

        2.2 自編碼網(wǎng)絡(luò)訓(xùn)練過(guò)程

        訓(xùn)練階段主要過(guò)程包括以下幾個(gè)步驟:

        (1)輸入可見(jiàn)層變量H={h1,h2,…,hn}和隱藏層變量V={v1,v2,…,vn},輸出模型參數(shù)θ={W,a,b};

        (2)初始化RBM網(wǎng)絡(luò)權(quán)值Wij=ai=bj=0(i,j∈Z+)和迭代次數(shù)k;

        (3)將每個(gè)輸入特征變量vi賦值給v0;

        (4)對(duì)所有可見(jiàn)單元和隱藏單元,根據(jù)式7、式8求得初始狀態(tài)和更新?tīng)顟B(tài)下的聯(lián)合概率分布梯度,并代入式11來(lái)更新θ={W,a,b},即:

        (二)醫(yī)療服務(wù)價(jià)格定價(jià)權(quán)限各省高度集中。定價(jià)權(quán)高度集中,全國(guó)各省的醫(yī)療服務(wù)定價(jià)權(quán)都在省一級(jí),各省所屬地市的經(jīng)濟(jì)發(fā)展水平不同、財(cái)政級(jí)次及補(bǔ)助比例不同、設(shè)備的檔次不同,使用頻次不同,各地群眾的支付能力不同、醫(yī)保的支付標(biāo)準(zhǔn)不同,用統(tǒng)一標(biāo)準(zhǔn)定價(jià),各地的適應(yīng)差異較大。醫(yī)療服務(wù)價(jià)格扭曲導(dǎo)致了醫(yī)療服務(wù)行為的偏移,醫(yī)療服務(wù)市場(chǎng)的價(jià)值取向出現(xiàn)問(wèn)題,導(dǎo)致醫(yī)療市場(chǎng)混亂。所以,適應(yīng)新的衛(wèi)生體制改革需要,價(jià)格必須及時(shí)調(diào)整,才能保證醫(yī)療服務(wù)成本的補(bǔ)償機(jī)制健全,醫(yī)療服務(wù)行為的偏移得到糾正;

        (12)

        (13)

        (14)

        如果k=t,保存模型參數(shù),算法結(jié)束,如果k>t,則t=t+1,轉(zhuǎn)向步驟2。

        2.3 權(quán)值微調(diào)

        (15)

        最后,更新每個(gè)網(wǎng)絡(luò)模型參數(shù)θij=θij+Δθij。如果k=t,則保存微調(diào)后的參數(shù),算法結(jié)束,如果k>t,t=t+1,回到步驟2。

        3 GA-FCM分類(lèi)器構(gòu)建

        3.1 模糊C-均值聚類(lèi)算法(FCM)

        假設(shè)X={x1,x2,…,xn}為n維數(shù)據(jù)樣本,c(2≤c≤n)為類(lèi)別數(shù),{L1,L2,…,Lc}為分類(lèi)類(lèi)別,U={U1,U2,…,Un}為n個(gè)樣本隸屬度矩陣。各類(lèi)別的聚類(lèi)中心v={v1,v2,…,vc},μk(xi)為第i個(gè)樣本對(duì)于類(lèi)別Lk的隸屬度(簡(jiǎn)寫(xiě)為μik)。則目標(biāo)函數(shù)Jb的表達(dá)式為:

        (16)

        計(jì)算隸屬度μik和c個(gè)聚類(lèi)中心{vi},分別對(duì)Jb求極值有:

        (17)

        (18)

        其中每個(gè)樣本對(duì)于各個(gè)聚類(lèi)的隸屬度和為1。使用式17、式18反復(fù)修改聚類(lèi)中心和隸屬度進(jìn)行迭代,使目標(biāo)函數(shù)Jb趨于穩(wěn)定,完成各類(lèi)聚類(lèi)中心和各樣本對(duì)每個(gè)類(lèi)的隸屬度。

        3.2 遺傳算法實(shí)現(xiàn)

        遺傳算法是一種全局尋優(yōu)方式,具有強(qiáng)大的空間搜索能力[18],兩者結(jié)合使用避免FCM算法陷入局部最優(yōu)。過(guò)程如下:

        (2)適應(yīng)度函數(shù):按優(yōu)勝劣汰的機(jī)制,適應(yīng)度函數(shù)值越小,繁衍幾率越大。排序得到分配函數(shù):FintV=ranking(Jb)

        (3)選擇算子:采用隨機(jī)遍歷抽樣(SUS)。

        (4)交叉算子:采用單點(diǎn)交叉算子。

        (5)變異算子:以初始概率產(chǎn)生變異基因數(shù),用隨機(jī)方法選出變異基因。如果是變異基因,那么它將進(jìn)行0,1互變。

        3.3 GA-FCM算法流程

        基于遺傳算法優(yōu)化的模糊C-均值聚類(lèi)算法模型描述如下:

        (1)初始化GA-FCM算法模型參數(shù),包括模糊C-均值算法最大迭代次數(shù)N,目標(biāo)函數(shù)的終止容限D(zhuǎn),種群個(gè)體大小sizepop,最大進(jìn)化次數(shù)MAXGEN,變異概率Pm。

        (2)隨機(jī)初始化c個(gè)聚類(lèi)中心,并生成初始種群Chrom,對(duì)每個(gè)聚類(lèi)中心用式17計(jì)算各樣本隸屬度,以及每個(gè)個(gè)體適應(yīng)度f(wàn)i,i=1,2,…,sizepop。

        (3)設(shè)初始遺傳代數(shù)循環(huán)計(jì)數(shù)變量gen=0。

        (5)若Gen

        4 實(shí)驗(yàn)結(jié)果及分析

        4.1 數(shù)據(jù)預(yù)處理

        對(duì)KDD’99數(shù)據(jù)集[19]進(jìn)行預(yù)處理作為自編碼網(wǎng)絡(luò)輸入數(shù)據(jù),主要包括數(shù)值化和歸一化過(guò)程。

        (1)數(shù)值化和歸一化。原始KDD’99數(shù)據(jù)集中包含了41個(gè)特征屬性,其中3個(gè)為字符型特征屬性,分別為protocol_type(網(wǎng)絡(luò)協(xié)議類(lèi)型)、service(目標(biāo)主機(jī)網(wǎng)絡(luò)服務(wù)類(lèi)型)、flag(連接正?;蝈e(cuò)誤的狀態(tài))。protocol_type包含3種協(xié)議類(lèi)型,service包含70種服務(wù)類(lèi)型,flag包含11種狀態(tài)。文中分別對(duì)這3種字符型數(shù)值進(jìn)行二進(jìn)制數(shù)值化編碼處理,最后將數(shù)據(jù)集進(jìn)行區(qū)間[0,1]歸一化操作,得到處理后的數(shù)據(jù)集。

        具體過(guò)程見(jiàn)表1。

        表1 數(shù)據(jù)集編碼

        (2)數(shù)據(jù)集選擇。每個(gè)數(shù)據(jù)集隨機(jī)抽取,包含正常連接數(shù)據(jù)樣本和入侵?jǐn)?shù)據(jù)樣本,如表2所示。

        表2 數(shù)據(jù)集組成

        4.2 模型參數(shù)選擇實(shí)驗(yàn)分析

        自編碼網(wǎng)絡(luò)的深度對(duì)特征降維有著重要影響,直接影響數(shù)據(jù)集維度和分類(lèi)效果。Hinton的研究指出3層RBM網(wǎng)絡(luò)已能提取有效的特征用于分類(lèi)任務(wù)[20]。

        實(shí)驗(yàn)設(shè)置5種不同AN-GAFCM網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行性能對(duì)比分析。設(shè)置AN2-GAFCM、AN3-GAFCM、AN4-GAFCM、AN5-GAFCM、AN6-GAFCM的RBM網(wǎng)絡(luò)結(jié)構(gòu)為122-60-5、122-80-40-5、122-110-70-40-5、122-110-80-50-25-5和122-110-80-60-40-20-5。結(jié)果表明使用5層自編碼網(wǎng)絡(luò)結(jié)構(gòu)性能最佳。

        4.3 不同分類(lèi)器檢測(cè)性能對(duì)比

        將AN5-GA-FCM模型與傳統(tǒng)入侵檢測(cè)模型做實(shí)驗(yàn)對(duì)比,通過(guò)常用PCA降維算法、SVM分類(lèi)算法,以及神經(jīng)網(wǎng)絡(luò)中的Softmax分類(lèi)算法進(jìn)行實(shí)驗(yàn),AC(%)表示準(zhǔn)確率,TD(s)表示檢測(cè)時(shí)間,比較如表3、圖1和圖2所示。

        表3 不同分類(lèi)器的檢測(cè)性能對(duì)比

        續(xù)表3

        圖1 不同算法的正確率

        圖2 不同算法的檢測(cè)時(shí)間

        結(jié)果表明,文中提出的自編碼網(wǎng)絡(luò)結(jié)合遺傳算法優(yōu)化的模糊C-均值算法模型具有較高的檢測(cè)率和較低的檢測(cè)時(shí)間。應(yīng)用自編碼網(wǎng)絡(luò)降維效果優(yōu)于傳統(tǒng)PCA降維算法,使用GA-FCM算法分類(lèi)在檢測(cè)時(shí)間和檢測(cè)率上優(yōu)于Softmax、SVM、FCM。

        5 結(jié)束語(yǔ)

        檢測(cè)入侵異常行為,需要檢測(cè)龐大復(fù)雜的數(shù)據(jù)流量,特征選擇的好壞直接影響檢測(cè)效果。針對(duì)網(wǎng)絡(luò)數(shù)據(jù)流量的稀疏多樣性等特點(diǎn),將自編碼網(wǎng)絡(luò)特征降維深度學(xué)習(xí)方法用于處理入侵檢測(cè)數(shù)據(jù)方面,并提出一種改進(jìn)縮短檢測(cè)時(shí)間的優(yōu)化模糊聚類(lèi)算法GA-FCM。通過(guò)分類(lèi)算法和降維算法的對(duì)比,證明AN-GA-FCM算法模型具有較高的檢測(cè)率和較短的運(yùn)行時(shí)間。

        猜你喜歡
        檢測(cè)模型
        一半模型
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        “幾何圖形”檢測(cè)題
        “角”檢測(cè)題
        重要模型『一線(xiàn)三等角』
        重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        小波變換在PCB缺陷檢測(cè)中的應(yīng)用
        2021国产最新无码视频| 亚洲欧美精品91| 精品国产高清a毛片无毒不卡| 成人综合网站| 国产精品国产三级国产密月| 亚洲av色香蕉一区二区三区 | 国产欧美日本亚洲精品一5区| 亚洲成aⅴ人片在线观看天堂无码| 国产av一区二区三区区别| 激情人妻网址| 亚洲综合新区一区二区| 一区二区视频中文字幕| 三个男吃我奶头一边一个视频| 免费无遮挡无码永久视频| 国产精品一区二区在线观看| 色一情一区二| 亚洲AV无码秘 蜜桃1区| 亚洲成av人片在线天堂无| 日韩五码一区二区三区地址| 国产亚洲aⅴ在线电影| 人妻丰满熟妇av无码区| 台湾佬综合网| 亚洲春色AV无码专区在线播放| 亚洲欧洲国产日产国码无码| 精品人妻av一区二区三区不卡| 亚洲一区二区三区品视频| 中文字幕国产亚洲一区| 欧洲熟妇色| 国产欧美日韩精品a在线观看| 成人做爰69片免费看网站| 亚洲一区二区自拍偷拍| 国产自拍一区二区三区| 久久精品国产亚洲超碰av| 亚洲精品夜夜夜妓女网| 播放灌醉水嫩大学生国内精品 | 中国少妇和黑人做爰视频| 国产成人大片在线播放| 少妇av射精精品蜜桃专区| 调教在线播放黄| 久久久亚洲av午夜精品| 强开小婷嫩苞又嫩又紧视频|