亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高性能互連網(wǎng)絡(luò)運(yùn)維過(guò)程中網(wǎng)絡(luò)端口阻塞故障的隨機(jī)森林檢測(cè)技術(shù)

        2022-03-17 08:33:06嚴(yán)萍
        電子測(cè)試 2022年4期
        關(guān)鍵詞:特征實(shí)驗(yàn)檢測(cè)

        嚴(yán)萍

        (河北醫(yī)科大學(xué)第四醫(yī)院,河北石家莊,050000)

        0 引言

        高性能互聯(lián)網(wǎng)絡(luò)是高性能計(jì)算機(jī)的全局性基礎(chǔ)設(shè)施,將網(wǎng)絡(luò)系統(tǒng)中的各部分節(jié)點(diǎn)進(jìn)行連接,其主要組成部分有高性能網(wǎng)卡,高階交換機(jī)和高速鏈路[1],隨著互聯(lián)網(wǎng)絡(luò)系統(tǒng)規(guī)模的不斷擴(kuò)大,其系統(tǒng)的故障率也會(huì)不斷攀升,傳統(tǒng)的運(yùn)維方式無(wú)法滿足現(xiàn)階段的網(wǎng)絡(luò)運(yùn)維工作的需求,優(yōu)化運(yùn)維工作方式迫在眉睫。隨機(jī)森林檢測(cè)技術(shù),是近些年在集成學(xué)習(xí)算法中應(yīng)用范圍較廣的一種檢測(cè)模型,其具有普適性較強(qiáng),靈活性較高等特點(diǎn),能夠?qū)Ω呔S的數(shù)據(jù)進(jìn)行快速處理,對(duì)數(shù)據(jù)集的特征沒(méi)有明確指向,連續(xù)性或離散型數(shù)據(jù),都能夠進(jìn)行高質(zhì)量的處理。

        1 檢測(cè)實(shí)驗(yàn)過(guò)程

        1.1 檢測(cè)模型

        本次實(shí)驗(yàn)是為了對(duì)網(wǎng)絡(luò)端口阻塞故障進(jìn)行解決,對(duì)互聯(lián)網(wǎng)絡(luò)相關(guān)數(shù)據(jù)進(jìn)行采集,生成數(shù)據(jù)集后,將分類(lèi)模型進(jìn)行構(gòu)建,在此基礎(chǔ)上對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行分類(lèi)。本次檢測(cè)模型的設(shè)計(jì)思路是數(shù)據(jù)采集采用高性能互聯(lián)網(wǎng)絡(luò)KPI技術(shù);將采集到的數(shù)據(jù)進(jìn)行標(biāo)記,打亂;以隨機(jī)森林算法進(jìn)行離線學(xué)習(xí);最后對(duì)模型進(jìn)行優(yōu)化,以交叉驗(yàn)證和在線檢測(cè)的方式。

        1.2 數(shù)據(jù)采集處理

        在數(shù)據(jù)采集中,需要將采集時(shí)間間隔進(jìn)行科學(xué)設(shè)定,以保障觀測(cè)數(shù)據(jù)的穩(wěn)定性。以32位寬的寄存器位端口流量信息為例,數(shù)據(jù)報(bào)文大小為192bit,在14G速率下,高速互聯(lián)網(wǎng)卡的寬帶,最大理論值應(yīng)為56Gbps,其觀測(cè)數(shù)據(jù)的最小翻轉(zhuǎn)時(shí)間在14.72s,因此本次研究以10s作為采樣間隔時(shí)間。

        對(duì)采集數(shù)據(jù)進(jìn)行標(biāo)記,主要是通過(guò)運(yùn)維日志信息,將設(shè)備端口和運(yùn)維事件進(jìn)行配對(duì)的方式,對(duì)相關(guān)數(shù)據(jù)進(jìn)行標(biāo)記。網(wǎng)絡(luò)節(jié)點(diǎn)出現(xiàn)輸出變慢的情況時(shí),可以根據(jù)節(jié)點(diǎn)向上尋找到相應(yīng)的網(wǎng)絡(luò)端口[2],由于現(xiàn)階段涉及到的網(wǎng)絡(luò)端口數(shù)量較多,為了保障網(wǎng)絡(luò)的相對(duì)穩(wěn)定,不需做任何處置,直到網(wǎng)絡(luò)出現(xiàn)崩盤(pán)情況時(shí),測(cè)試程序能夠?qū)Σ樵?xún)到出現(xiàn)問(wèn)題的端口,對(duì)其進(jìn)行復(fù)位操作,整個(gè)網(wǎng)絡(luò)系統(tǒng)即可恢復(fù)正常運(yùn)作。

        在有監(jiān)督學(xué)習(xí)中,數(shù)據(jù)標(biāo)記是重要的組成部分,為機(jī)器學(xué)習(xí)提供數(shù)據(jù)集,因此數(shù)據(jù)標(biāo)記的質(zhì)量與檢測(cè)結(jié)果的質(zhì)量息息相關(guān)。在高性能互連網(wǎng)絡(luò)運(yùn)維過(guò)程中網(wǎng)絡(luò)端口阻塞故障是一項(xiàng)逐步加深的過(guò)程,因此本次研究對(duì)將數(shù)據(jù)集分為0,1,2三個(gè)類(lèi)別,0代表正常狀態(tài),1代表潛在異常狀態(tài),2代表網(wǎng)絡(luò)阻塞狀態(tài)。

        1.3 隨機(jī)森林

        在隨機(jī)森林算法中參數(shù)只有2個(gè),在面對(duì)較為嘈雜的特征時(shí),檢測(cè)模型敏感度較低,不容易陷入到過(guò)擬合狀態(tài),其抗噪聲能力也具有一定優(yōu)勢(shì)。RF算法中兩個(gè)隨機(jī)因子,一個(gè)是訓(xùn)練集樣本集合(Di),一個(gè)候選屬性樣本集合(Ti)。訓(xùn)練集樣本的選取是從原始數(shù)據(jù)中進(jìn)行隨禮抽取,每次抽取之前都將上抽取的樣本在放回到原始樣本集當(dāng)中;候選屬性樣本集合,設(shè)原始數(shù)據(jù)共有屬性M個(gè),將S作為制定屬性數(shù),從M中抽取S個(gè)作為候選屬性。將訓(xùn)練樣本和屬性進(jìn)行確定之后,進(jìn)行決策樹(shù)的構(gòu)建,從而得到預(yù)測(cè)結(jié)果(Y),n個(gè)樣本得到預(yù)測(cè)模型n個(gè),對(duì)樣本進(jìn)行模型測(cè)算,則1個(gè)樣本能得到n個(gè)結(jié)果,最終測(cè)算結(jié)果以多數(shù)投票決定。其分類(lèi)模型如下所示:

        其中,單個(gè)決策樹(shù)為hi(Si),I為示性函數(shù)。

        RF訓(xùn)練模型如圖1所示。

        圖1 RF訓(xùn)練模型

        1.4 模型參數(shù)優(yōu)化

        在檢測(cè)的過(guò)程中,為了將模型檢測(cè)的準(zhǔn)確率進(jìn)行進(jìn)一步的提升,RF模型在對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),需要將間隔函數(shù)與泛化誤差進(jìn)行考慮。在RF中,其間隔函數(shù)mg(x,y)如下所示:

        其中,x為樣本向量屬性,y為樣本標(biāo)簽,當(dāng)mg(x,y)大于0時(shí),表明正確分類(lèi)樣本數(shù)量較多,其數(shù)值越大,表示準(zhǔn)確率越高。RF的泛化誤差PE計(jì)算公式如下:

        其中ρ為RF分類(lèi)器之間的相關(guān)度。

        1.5 模型評(píng)估與檢測(cè)

        對(duì)RF模型進(jìn)行評(píng)估時(shí),其評(píng)價(jià)標(biāo)準(zhǔn)以準(zhǔn)確率和召回率為主:準(zhǔn)確率是最終提取的正確信息的數(shù)量;召回率是正確信息數(shù)量與樣本信息數(shù)量的比值,數(shù)值越接近1,表明其模型效果越好。

        模型檢測(cè)主要是將數(shù)據(jù)檢測(cè)結(jié)果與最佳結(jié)果進(jìn)行對(duì)比,對(duì)模型進(jìn)行動(dòng)態(tài)調(diào)整,根據(jù)結(jié)果對(duì)模型中存在的問(wèn)題進(jìn)行分析,并提出一定的解決方案,將模型進(jìn)行優(yōu)化。

        2 檢測(cè)實(shí)驗(yàn)結(jié)果

        2.1 實(shí)驗(yàn)平臺(tái)

        本次實(shí)驗(yàn)主要采用HPC系統(tǒng),結(jié)構(gòu)采用兩級(jí)胖樹(shù)拓?fù)浣Y(jié)構(gòu),在本次系統(tǒng)結(jié)構(gòu)中,葉交換機(jī)18臺(tái),每個(gè)各有24個(gè)上行端口;根交換機(jī)12臺(tái),每個(gè)各有36個(gè)端口。每個(gè)葉交換機(jī)的2個(gè)上行端口與同一個(gè)根交換機(jī)的端口進(jìn)行連接。為了更好地對(duì)實(shí)際情況進(jìn)行模擬,對(duì)RF模型進(jìn)行檢測(cè),在實(shí)驗(yàn)的過(guò)程中,采用衰減光纖對(duì)網(wǎng)絡(luò)系統(tǒng)進(jìn)行注入故障,將其數(shù)據(jù)進(jìn)行收集,形成實(shí)驗(yàn)KPI數(shù)據(jù)集。

        2.2 算法對(duì)比

        本次實(shí)驗(yàn)中同時(shí)采用了SVM算法和樸素貝葉斯,將其效果與RF進(jìn)行對(duì)比。

        其次樸素貝葉斯算法分類(lèi)原則是對(duì)于給出的待分類(lèi)項(xiàng),將該分類(lèi)向會(huì)出現(xiàn)在每個(gè)類(lèi)別中的概率進(jìn)行計(jì)算,其中概率最大的便是該分類(lèi)項(xiàng)的所屬類(lèi)別。使用該種算法進(jìn)行檢測(cè),其特征需要相對(duì)獨(dú)立,且具有較為鮮明的特點(diǎn),但是在實(shí)際的檢測(cè)過(guò)程中,數(shù)據(jù)的特征和屬性具有較強(qiáng)的關(guān)聯(lián)性,因此該種算法的應(yīng)用程度具有一定的局限性。

        2.3 特征與參數(shù)選擇

        本次實(shí)驗(yàn)中,KPI數(shù)據(jù)的特征共有21個(gè),將滑動(dòng)窗口大小進(jìn)行固定,其中窗口期內(nèi)信用分布情況由特征1-10表示,握手情況由特征11表示,重傳均值由特征12表示,虛通道收發(fā)流量均值由特征13-21表示。在實(shí)驗(yàn)的過(guò)程中,采用特征逐步遞增的方式,對(duì)不相關(guān)和冗余特征與模型之間的關(guān)系進(jìn)行探究。

        當(dāng)特征數(shù)量為0時(shí),其模型準(zhǔn)確率為0.12;當(dāng)特征數(shù)量增加到2時(shí),其模型準(zhǔn)確率為0.51;當(dāng)特征數(shù)量增加到5時(shí),其模型準(zhǔn)確率為0.67;當(dāng)特征數(shù)量增加到15時(shí),其模型準(zhǔn)確率為0.95;當(dāng)特征數(shù)量增加到18和21時(shí),其模型準(zhǔn)確率分別為0.96和0.95。模型的準(zhǔn)確率隨著特征數(shù)量的增加,不斷提高,當(dāng)特征數(shù)量增加到10以上,其對(duì)于模型準(zhǔn)確率的影響變得較為微弱。

        將本次實(shí)驗(yàn)的數(shù)據(jù)集分為兩個(gè)部分,一部分作為訓(xùn)練集,一部分作為測(cè)試集,利用上文提及到的公式,對(duì)模型的參數(shù)進(jìn)行優(yōu)化。通過(guò)參數(shù)優(yōu)化調(diào)整,模型的準(zhǔn)確率,召回率都得到了一定的提升。調(diào)參之前,0數(shù)據(jù)狀態(tài)準(zhǔn)確率為0.94,召回率為0.81,調(diào)參之后,準(zhǔn)確率為0.99,召回率為0.96;1數(shù)據(jù)狀態(tài)準(zhǔn)確率為0.92,召回率為0.94,調(diào)參之后,準(zhǔn)確率為0.92,召回率為0.96;2數(shù)據(jù)狀態(tài)準(zhǔn)確率為0.71,召回率為0.91,調(diào)參之后,準(zhǔn)確率為0.89,召回率為0.94。

        2.4 實(shí)驗(yàn)結(jié)果

        在離線模式下,將RF,SVM以及樸素貝葉斯算法檢測(cè)結(jié)果進(jìn)行比較。模型在實(shí)際應(yīng)用的過(guò)程中,主要以準(zhǔn)確率和召回率作為主要的評(píng)價(jià)指標(biāo)。因此在此次算法比較的過(guò)程中,將比較重點(diǎn)放在召回率與準(zhǔn)確率的比較之上。將上述文章中,提到過(guò)KPI數(shù)據(jù)特征,在實(shí)驗(yàn)過(guò)程中,將影響因素較大的數(shù)據(jù)特征內(nèi)容,導(dǎo)入到數(shù)據(jù)模型之中,通過(guò)實(shí)際訓(xùn)練,可以將3種算法的準(zhǔn)確率、召回率以及F1數(shù)值進(jìn)行計(jì)算,其具體數(shù)據(jù)分析結(jié)果如表1所示。

        表1 算法數(shù)據(jù)對(duì)比分析表

        通過(guò)表1數(shù)據(jù)可以得出,在不同數(shù)據(jù)的數(shù)據(jù)集狀態(tài)下,RF算法的準(zhǔn)確率和召回率,都要高于SVM算法以及樸素貝葉斯算法,同時(shí)F1的數(shù)值也是要高于前兩者的算法檢測(cè)結(jié)果。由此可見(jiàn),在對(duì)網(wǎng)絡(luò)端口阻塞故障檢測(cè)過(guò)程中,使用RF算法,能夠?qū)z測(cè)結(jié)果的準(zhǔn)確率進(jìn)行有效地提升,同時(shí)能夠檢測(cè)工作的效率,相較于其他算法具備一定的優(yōu)勢(shì)。

        猜你喜歡
        特征實(shí)驗(yàn)檢測(cè)
        記一次有趣的實(shí)驗(yàn)
        “不等式”檢測(cè)題
        “一元一次不等式”檢測(cè)題
        “一元一次不等式組”檢測(cè)題
        如何表達(dá)“特征”
        做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
        實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
        太空探索(2016年5期)2016-07-12 15:17:55
        www插插插无码视频网站| 日本一区二区不卡二区| 白白白在线视频免费播放| 永久黄网站免费视频性色| 国产欧美日韩专区| 亚洲国产精品亚洲高清| 黄色一区二区三区大全观看| 夜夜爽妓女8888888视频| 久久中文精品无码中文字幕| 国产亚洲日本人在线观看| 一本色道久久88加勒比综合| 一色桃子中文字幕人妻熟女作品| 久久国产精久久精产国| 亚洲欧美变态另类综合| 精品久久人妻av中文字幕| 成在线人av免费无码高潮喷水| 亚洲一区二区观看播放| 日韩av无码午夜福利电影| 国产一区二区三区啊啊| 日本特黄特色特爽大片| jizz国产精品免费麻豆| 日韩精品一二区在线视频| 在线观看免费日韩精品| 久热这里只有精品视频6| 日韩国产成人精品视频| 国产优质av一区二区三区| 少妇被又大又粗又爽毛片 | 日韩精品首页在线观看| 不卡av网站一区二区三区| 日日碰狠狠添天天爽| 免费人成在线观看播放国产| 国产午夜在线观看视频| 欧美性高清另类videosex| 亚洲国产成人va在线观看天堂| 亚洲欧洲日产国码无码av野外| 狠狠爱婷婷网五月天久久| 国产av麻豆mag剧集| 精品无码久久久九九九AV| 国产麻豆极品高清另类| 又紧又大又爽精品一区二区| 久久亚洲av永久无码精品|