亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法研究①

        2023-11-05 11:51:36商鴻發(fā)
        關(guān)鍵詞:誤報(bào)率網(wǎng)絡(luò)流量均值

        商鴻發(fā)

        (浙江旅游職業(yè)學(xué)院,浙江 杭州 312231)

        0 引 言

        經(jīng)過多年的建設(shè)與發(fā)展,我國(guó)互聯(lián)網(wǎng)正逐漸轉(zhuǎn)變?yōu)橐环N大規(guī)模、高容量的創(chuàng)新型技術(shù),并滲透到人們生活的各個(gè)角落[1-2]。除了網(wǎng)絡(luò)對(duì)人民生活產(chǎn)生的影響外,“網(wǎng)絡(luò)+教育”的發(fā)展也是當(dāng)前我國(guó)信息化教育的重點(diǎn)建設(shè)部分。高校作為培養(yǎng)大學(xué)生的主要陣地,其中互聯(lián)網(wǎng)的建設(shè)與發(fā)展受到了社會(huì)大眾的廣泛關(guān)注,其中校園網(wǎng)絡(luò)是我國(guó)大學(xué)校園網(wǎng)絡(luò)建設(shè)的一個(gè)重要環(huán)節(jié)。校園網(wǎng)為我國(guó)高校的信息發(fā)布以及教師自動(dòng)化辦公提供了重要運(yùn)行環(huán)境,但校園網(wǎng)也存在有功能發(fā)揮不充分的現(xiàn)象[3-4]。例如網(wǎng)絡(luò)建設(shè)薄弱,容易受到外來入侵;容量較小,不能同時(shí)容納所有師生登錄使用學(xué)校網(wǎng)站等問題。鑒于此,研究提出基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法,首先利用IRNN對(duì)校園網(wǎng)流量展開預(yù)測(cè),接著融合到傳統(tǒng)K均值聚類算法中,構(gòu)建一種改進(jìn)優(yōu)化K均值聚類算法,期待能夠有效地檢測(cè)校園網(wǎng)異常流量變化,促進(jìn)高校網(wǎng)絡(luò)安全建設(shè)。

        1 基于優(yōu)化K均值聚類的高校網(wǎng)絡(luò)異常流量分析方法研究

        1.1 基于IRNN的流量預(yù)測(cè)方法

        為了解決傳統(tǒng)RNN存在的數(shù)據(jù)梯度消失依賴問題,有學(xué)者提出使用基于時(shí)鐘驅(qū)動(dòng)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型(Clock-driven cyclic neural network, CW-RNN)。改進(jìn)后的RCW-RNN神經(jīng)網(wǎng)絡(luò)模型如圖1。

        圖1 RCW-RNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型

        圖1中可以看出,為了提高檢測(cè)精度、改變激活標(biāo)準(zhǔn)原則以提高預(yù)測(cè)效率,該模型尤其著重于引入隨機(jī)權(quán)值。研究將RCW-RNN分成了不同的儲(chǔ)備池模塊,并保留生成的不同機(jī)制,為每一個(gè)儲(chǔ)備池分配同樣的時(shí)鐘周期[6]。如圖1所示,在t時(shí)刻,改進(jìn)后的神經(jīng)網(wǎng)絡(luò)模型輸出表達(dá)如式(1)。

        (1)

        式(1)中,fout表示輸出層的激活函數(shù);Wout表示輸出層的連接矩陣;yh(t)表示在t時(shí)刻的隱藏層輸出(是g個(gè)隱藏層儲(chǔ)備池輸出構(gòu)成的向量)。隱藏層向量輸出如式(2)。

        (2)

        式(2)中,fh表示隱藏層激活函數(shù);Wh表示隱藏層連接矩陣;Win表示輸入層連接的矩陣;xin(t)則表示處于t時(shí)刻的輸出。yh(t′)是不同的儲(chǔ)備池對(duì)應(yīng)的前一狀態(tài);γ表示前一狀態(tài)的儲(chǔ)備池在當(dāng)前狀態(tài)中占據(jù)的主要比例,取值區(qū)間為[0,1]。由于儲(chǔ)備池的周期不同,對(duì)應(yīng)的不同時(shí)期狀態(tài)也不同,因此計(jì)算方程也不盡相同,具體方程計(jì)算如式(3)。

        (3)

        式(3)中,利用CW-RNN的指數(shù)增長(zhǎng)模型(表達(dá)為Tg=2g-1),可以在很短的時(shí)間內(nèi)利用少量的儲(chǔ)備來實(shí)現(xiàn)更大的時(shí)間范圍跨度。然而在當(dāng)前網(wǎng)絡(luò)識(shí)別的方法中,通常使用機(jī)器學(xué)習(xí)算法對(duì)網(wǎng)絡(luò)流量數(shù)據(jù)集進(jìn)行數(shù)據(jù)的采集與整理。因此研究引入K均值聚類算法對(duì)數(shù)據(jù)進(jìn)行再處理。

        1.2 優(yōu)化的K均值聚類算法設(shè)計(jì)

        原始的K均值(K-means)聚類算法,主要利用數(shù)據(jù)間距離與數(shù)據(jù)指標(biāo)間的相關(guān)系數(shù)表示數(shù)據(jù)的相似性。在實(shí)際計(jì)算過程中,當(dāng)收斂速度與最小誤差平方值最優(yōu)時(shí),算法結(jié)束運(yùn)行,接著獲得最終分類結(jié)果。針對(duì)這一問題,研究提出了一種基于不同數(shù)據(jù)特征分布的初始聚類中心(K均值優(yōu)化)的方法,以避免產(chǎn)生局部最優(yōu)解。優(yōu)化K均值聚類算法實(shí)驗(yàn)開展過程中,首先對(duì)特征值進(jìn)行選取。校園網(wǎng)流量作為一種不確定的變量,一般利用信息熵對(duì)其進(jìn)行表示,具體如式(4)。

        HX=-∑x∈xp(x)logp(x)

        (4)

        利用式(4)求得的熵值,將網(wǎng)絡(luò)流量數(shù)據(jù)中差距較大的特征數(shù)據(jù)值作為實(shí)驗(yàn)參數(shù)。研究選取流量數(shù)據(jù)集進(jìn)行有效測(cè)試,該數(shù)據(jù)集包含有總數(shù)據(jù)500萬條,其中進(jìn)行測(cè)試與訓(xùn)練的子集各為50萬條。在實(shí)際實(shí)驗(yàn)過程中,所有數(shù)據(jù)集都必須經(jīng)過預(yù)處理,保證輸入數(shù)據(jù)之間的差距較小。預(yù)處理表達(dá)式如式(5)。

        (5)

        式(5)中,max表示最大數(shù)據(jù)值;min表示最小數(shù)據(jù)值,X*表示標(biāo)準(zhǔn)化結(jié)果。為了更好地對(duì)算法的設(shè)計(jì)進(jìn)行說明,研究假設(shè)有網(wǎng)絡(luò)數(shù)據(jù)集S(S=f1,f2,…,fn),n表示網(wǎng)絡(luò)數(shù)據(jù)流個(gè)數(shù)。在網(wǎng)絡(luò)數(shù)據(jù)集S當(dāng)中,1表示向量的維度,而利用對(duì)應(yīng)網(wǎng)絡(luò)流量的特征屬性數(shù)值表示向量中的每個(gè)元素。假設(shè)數(shù)據(jù)集合為S={xi|xi∈Rm,i=1,2,3,…,n},n代表一個(gè)集合中的所有數(shù)據(jù)對(duì)象總數(shù)量;m表示空間數(shù)據(jù)最終維度值。在優(yōu)化K均值聚類算法中,數(shù)據(jù)對(duì)象之間的測(cè)量與聚類收斂標(biāo)準(zhǔn)如式(6)。

        (6)

        式(6)中,x,y表示屬性向量;Cj={cj1,cj2,…,cjn}T表示聚類中心;k表示初始聚類數(shù)量;oj表示簇cj中所有數(shù)據(jù)點(diǎn)之間的平均值;cj表示分類簇。研究引入流量密度的概念到優(yōu)化K均值算法中,得到數(shù)據(jù)集合S中數(shù)據(jù)對(duì)象之間的平均距離,以及集合S中某一數(shù)據(jù)對(duì)象xi的密度,具體計(jì)算如式(7)。

        (7)

        (8)

        (9)

        (10)

        式(10)中,din(k)表示簇內(nèi)距離。當(dāng)din(k)越小,對(duì)應(yīng)集合S中簇內(nèi)的數(shù)據(jù)對(duì)象間的相似性越高。為了滿足上述假設(shè),研究引入聚類效果判定函數(shù),表達(dá)如式(11)。

        V(k)=din(k)/bds(k)

        (11)

        式(11)中,V(k)表示集合的簇間聚類。當(dāng)集合的簇內(nèi)距離越小,簇間距離就越大,判別函數(shù)的值就越小。當(dāng)判別函數(shù)有最小值時(shí),數(shù)據(jù)集合S中的數(shù)據(jù)對(duì)象之間的相似性就有最大值,對(duì)應(yīng)不同簇的數(shù)據(jù)對(duì)象之間的差異性也就有最大值。即可以選擇合適的k值,使得判別函數(shù)V(k)有最小值,進(jìn)而將此k值作為最佳聚類效果所對(duì)應(yīng)的簇的個(gè)數(shù)值。將優(yōu)化后的K均值聚類檢測(cè)流程繪制如圖2。

        圖2 優(yōu)化后的K均值聚類檢測(cè)流程

        2 高校異常流量分析檢測(cè)模型的仿真實(shí)驗(yàn)

        為了驗(yàn)證研究所構(gòu)建方法能夠?qū)Ω咝.惓>W(wǎng)絡(luò)流量進(jìn)行快速且準(zhǔn)確的檢測(cè)識(shí)別,研究采用兩個(gè)不同的公開流量數(shù)據(jù)集進(jìn)行流量預(yù)測(cè)的仿真實(shí)驗(yàn)。兩個(gè)數(shù)據(jù)集分別為美國(guó)主干網(wǎng)絡(luò)流量數(shù)據(jù)與11個(gè)北美城市的流量數(shù)據(jù)集,兩個(gè)數(shù)據(jù)集涵蓋約兩個(gè)月內(nèi)每5min采集的匯集流量。所有實(shí)驗(yàn)均在相同的設(shè)備環(huán)境中進(jìn)行。首先對(duì)算法的檢測(cè)率與誤報(bào)率兩個(gè)指標(biāo)進(jìn)行性能對(duì)比,所得對(duì)比結(jié)果如圖3。

        圖3 不同算法的檢測(cè)率與誤報(bào)率對(duì)比

        圖3(a)與(b)中發(fā)現(xiàn),隨著K值的增加,所有算法的檢測(cè)率與誤報(bào)率均表現(xiàn)出明顯的增長(zhǎng)趨勢(shì)。圖3(a)中,研究方法運(yùn)行下檢測(cè)率顯著高于傳統(tǒng)K均值聚類算法。當(dāng)K=60時(shí),研究算法的檢測(cè)率開始趨于穩(wěn)定,此時(shí)的檢測(cè)率為98.21%;當(dāng)K=70時(shí),傳統(tǒng)K均值聚類算法的檢測(cè)率為93.92%。圖3(b)中,研究方法的誤報(bào)率顯著低于傳統(tǒng)K均值聚類算法。當(dāng)K=70時(shí),研究算法的誤報(bào)率為0.661%;傳統(tǒng)聚類算法的誤報(bào)率為0.812%。對(duì)比可知,優(yōu)化后的研究方法能夠同時(shí)擁有高檢測(cè)率與低誤報(bào)率,且有助于得到全局最優(yōu)解。

        為擴(kuò)大對(duì)流量變化曲線的觀察,研究對(duì)北美11個(gè)城市的流量數(shù)據(jù)進(jìn)行收集,選取5.8×103到6.0×103min時(shí)間段內(nèi)的局部預(yù)測(cè)誤差曲線如圖4。

        由圖4可知,在三種方法中,傳統(tǒng)的K均值聚類方法對(duì)整體的預(yù)測(cè)誤差影響較大,最大誤差在5882min附近,此時(shí)誤差約為2.210×108。而整體RCW-RNN與研究算法較為相似,預(yù)測(cè)誤差整體區(qū)間在[0.0~1.500×108]之間波動(dòng)。其中RCW-RNN在所選時(shí)間段內(nèi)的最大誤差出現(xiàn)在5948min附近,對(duì)應(yīng)預(yù)測(cè)誤差值為1.481×108。同時(shí)研究算法的最大誤差出現(xiàn)在5810min附近,對(duì)應(yīng)預(yù)測(cè)誤差約為1.472×108。對(duì)比可知,研究算法的最大誤差均小于傳統(tǒng)K均值聚類誤差與RCW-RNN誤差。使用研究方法對(duì)網(wǎng)絡(luò)流量進(jìn)行較好檢測(cè),并且誤差率較低。為了更加直觀地觀察三種方法的差異,研究對(duì)不同算法進(jìn)行網(wǎng)絡(luò)應(yīng)用識(shí)別準(zhǔn)確率與總體識(shí)別準(zhǔn)確率的對(duì)比,具體如 圖5。

        圖4 不同算法在北美11個(gè)城市的流量

        數(shù)據(jù)集上的部分預(yù)測(cè)誤差結(jié)果從圖5(a)中可以看出,當(dāng)研究方法沒有選取K值對(duì)準(zhǔn)確率進(jìn)行對(duì)比時(shí),任意改變網(wǎng)絡(luò)應(yīng)用,改進(jìn)后研究算法的識(shí)別準(zhǔn)確率仍然顯著高于傳統(tǒng)聚類算法,這表示研究所構(gòu)建方法對(duì)網(wǎng)絡(luò)流量分類的影響是積極的,優(yōu)化的效果能夠得到驗(yàn)證。圖5(b)中可以發(fā)現(xiàn),被標(biāo)記的流量數(shù)據(jù)占比越高(數(shù)量越多),相應(yīng)的K均值算法在準(zhǔn)確率和穩(wěn)定性上都有很大的提高。在15%的標(biāo)記流量數(shù)據(jù)占比下,網(wǎng)絡(luò)流量的識(shí)別準(zhǔn)確精度顯著高于90%,即研究所提出方法可以很好地滿足一般高校校園網(wǎng)流量數(shù)據(jù)變化的識(shí)別要求。

        圖5 不同算法的識(shí)別準(zhǔn)確率對(duì)比

        3 結(jié) 語

        為了讓學(xué)校管理人員能夠更全面地了解校園網(wǎng)絡(luò)流量變化,更準(zhǔn)確地監(jiān)測(cè)網(wǎng)絡(luò)信號(hào)變化,研究對(duì)高校校園網(wǎng)絡(luò)的監(jiān)測(cè)問題展開了討論,亟待提升對(duì)網(wǎng)絡(luò)的檢測(cè)準(zhǔn)確率。研究首先引入循環(huán)神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)K均值聚類算法相互結(jié)合,對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理;接著將處理后數(shù)據(jù)代入K均值聚類算法中,得到有效的結(jié)果。結(jié)果顯示,研究算法在聚類K值為60時(shí),有最大檢測(cè)率98.21%,而傳統(tǒng)K均值聚類算法的檢測(cè)率較小;在聚類K值為70時(shí),傳統(tǒng)算法與研究算法的誤報(bào)率分別為0.812%,0.661%;部分流量數(shù)據(jù)集預(yù)測(cè)結(jié)果中,運(yùn)行時(shí)間在5810min附近時(shí),研究算法有最大誤差1.472×108,傳統(tǒng)K均值聚類算法與RCW-RNN算法的最大誤差為2.210×108與1.481×108;當(dāng)標(biāo)記數(shù)據(jù)占比為15%時(shí),網(wǎng)絡(luò)流量的識(shí)別準(zhǔn)確率可達(dá)到90%以上。以上結(jié)果均表示研究所構(gòu)建優(yōu)化K均值算法的識(shí)別準(zhǔn)確率高,穩(wěn)定性能好,并且具有高檢測(cè)率與低誤報(bào)率的優(yōu)秀性能。但是在將來,網(wǎng)絡(luò)攻擊的技術(shù)手段越來越多,為了更好地檢測(cè)到異常流量的變化,必須進(jìn)行更多的試驗(yàn)研究,以豐富研究結(jié)果。

        猜你喜歡
        誤報(bào)率網(wǎng)絡(luò)流量均值
        基于GRU-LSTM算法的物聯(lián)網(wǎng)數(shù)據(jù)入侵檢測(cè)分析
        基于SSA-SVM的網(wǎng)絡(luò)入侵檢測(cè)研究
        基于多元高斯分布的網(wǎng)絡(luò)流量異常識(shí)別方法
        家用燃?xì)鈭?bào)警器誤報(bào)原因及降低誤報(bào)率的方法
        煤氣與熱力(2021年6期)2021-07-28 07:21:40
        基于神經(jīng)網(wǎng)絡(luò)的P2P流量識(shí)別方法
        AVB網(wǎng)絡(luò)流量整形幀模型端到端延遲計(jì)算
        均值不等式失效時(shí)的解決方法
        均值與方差在生活中的應(yīng)用
        神經(jīng)網(wǎng)絡(luò)技術(shù)在網(wǎng)絡(luò)入侵檢測(cè)模型及系統(tǒng)中的應(yīng)用
        關(guān)于均值有界變差函數(shù)的重要不等式
        亚洲精品中文字幕一二三区| 毛片大全真人在线| 少妇寂寞难耐被黑人中出| 揄拍成人国产精品视频| 精品一区二区三区在线视频观看| 亚洲一区二区av偷偷| 亚洲一区二区三区福利久久蜜桃| 一区二区三区四区草逼福利视频| 午夜dv内射一区二区| 内射人妻视频国内| 久久精品国产第一区二区三区| 日韩AV有码无码一区二区三区| 日日噜噜噜夜夜爽爽狠狠视频| 白白色福利视频在线观看| 国内偷拍国内精品多白86| 18禁免费无码无遮挡不卡网站| 久久成人影院精品777| 大地资源在线播放观看mv| 青青国产成人久久91| 一区二区三区免费观看在线视频| 日韩一区二区中文天堂| 白白白在线视频免费播放| 狠狠躁日日躁夜夜躁2020| 色八a级在线观看| 538任你爽精品视频国产| 亚洲中文字幕黄色小视频| 亚洲av熟女少妇一区二区三区| 人妖av手机在线观看| 久久久久久久极品内射| 久久婷婷成人综合色| 无码国产精品第100页| 免费人成黄页网站在线观看国产| 一本久道久久丁香狠狠躁| 免费国产在线视频自拍白浆| 亚洲av无码片vr一区二区三区| 中文字幕人妻丝袜乱一区三区| 亚洲av成人一区二区三区网址| 青青草绿色华人播放在线视频| 音影先锋中文字幕在线| 亚洲а∨精品天堂在线| 乱中年女人伦av三区 |