張維訪,徐 蕾
(沈陽航空航天大學 計算機學院,沈陽 110136)
?
園區(qū)網(wǎng)的網(wǎng)絡(luò)故障狀態(tài)預測方法
張維訪,徐蕾
(沈陽航空航天大學 計算機學院,沈陽 110136)
為及時處理園區(qū)網(wǎng)可能發(fā)生的網(wǎng)絡(luò)故障,提出了一種網(wǎng)絡(luò)故障狀態(tài)預測方法。首先利用采集的園區(qū)網(wǎng)網(wǎng)絡(luò)運行數(shù)據(jù)樣本做數(shù)據(jù)挖掘,獲得網(wǎng)絡(luò)運行參數(shù)的ARMA預測函數(shù)及網(wǎng)絡(luò)故障預測的BP神經(jīng)網(wǎng)絡(luò)模型;做網(wǎng)絡(luò)故障狀態(tài)實時預測時,在園區(qū)網(wǎng)的關(guān)鍵監(jiān)測點中利用SNMP協(xié)議采集網(wǎng)絡(luò)運行參數(shù),通過這些參數(shù)預測下面幾個時段的網(wǎng)絡(luò)運行參數(shù),進而利用BP網(wǎng)絡(luò)預測網(wǎng)絡(luò)監(jiān)測點的故障狀態(tài)。實驗結(jié)果表明,網(wǎng)絡(luò)運行狀態(tài)預測的準確率能夠達到80%以上,可實現(xiàn)基本的網(wǎng)絡(luò)故障狀態(tài)預測。
園區(qū)網(wǎng)絡(luò)故障;神經(jīng)網(wǎng)絡(luò);數(shù)據(jù)預測;簡單網(wǎng)管協(xié)議
對于大型園區(qū),尤其是國防企事業(yè)單位,網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定、可靠運行是現(xiàn)代化生產(chǎn)和管理的基本保障,網(wǎng)絡(luò)的崩潰或癱瘓意味著傳輸數(shù)據(jù)的丟失等巨大損失。因此,提前預測網(wǎng)絡(luò)延遲、擁塞等網(wǎng)絡(luò)故障狀態(tài),使網(wǎng)絡(luò)運維系統(tǒng)能夠及時響應、處理,進而保證網(wǎng)絡(luò)的穩(wěn)定運行是非常重要的。
現(xiàn)有的網(wǎng)絡(luò)故障預測方法主要是對網(wǎng)絡(luò)歷史故障數(shù)據(jù)進行分析,利用數(shù)據(jù)挖掘的方法得出故障預測模型。文獻[1]引入基于狀態(tài)的維修技術(shù),通過監(jiān)測網(wǎng)絡(luò)狀態(tài),利用構(gòu)建的神經(jīng)網(wǎng)絡(luò)預測網(wǎng)絡(luò)故障;文獻[2]針對網(wǎng)絡(luò)一段時間中的故障率,建立多元線性回歸模型,進而預測網(wǎng)絡(luò)下一個時段的故障率;文獻[3]為了實現(xiàn)計算機網(wǎng)絡(luò)系統(tǒng)中的故障和資源的自我管理,提出了一種具有自主故障預測和管理能力的系統(tǒng)。文獻[4-5]在異常行為頻繁項集挖掘的基礎(chǔ)上提出了單個網(wǎng)絡(luò)參數(shù)的多尺度趨勢分析,利用多維時間尺度趨勢來計算節(jié)點的網(wǎng)絡(luò)故障。文獻[6]提出一種針對多區(qū)域故障的預測模型,采用風險評估知識來描述網(wǎng)路故障模型。以上預測方法存在不足,回歸分析的因子選擇及因子的數(shù)學表達式只是一種推測,如果因子選擇不合理,預測效果會降低;利用趨勢分析的網(wǎng)絡(luò)狀態(tài)預測方法的不足是當一種正常趨勢很像異常趨勢的時候可能會誤判斷成故障。以上文章主要是對網(wǎng)絡(luò)狀態(tài)故障管理的研究,對網(wǎng)絡(luò)狀態(tài)故障預測的研究很少。
本文提出了一種園區(qū)網(wǎng)的網(wǎng)絡(luò)故障預測方法,主要針對網(wǎng)絡(luò)運行狀態(tài)進行預測,進而能夠及時發(fā)現(xiàn)網(wǎng)絡(luò)的擁塞情況。網(wǎng)絡(luò)故障預測方法是在園區(qū)網(wǎng)的關(guān)鍵監(jiān)測點中采集網(wǎng)絡(luò)運行參數(shù),然后利用數(shù)據(jù)挖掘得到的網(wǎng)絡(luò)運行參數(shù)預測模型預測下一階段的網(wǎng)絡(luò)運行參數(shù),將預測得到的網(wǎng)絡(luò)運行參數(shù)輸入神經(jīng)網(wǎng)絡(luò)模型預測網(wǎng)絡(luò)的運行狀態(tài)。實驗結(jié)果表明,這一方法能夠預測網(wǎng)絡(luò)的運行狀態(tài),進而保證網(wǎng)絡(luò)穩(wěn)定運行。
網(wǎng)絡(luò)故障狀態(tài)預測是維護網(wǎng)絡(luò)穩(wěn)定運行和保障網(wǎng)絡(luò)健康狀態(tài)的一種技術(shù)手段。方法是利用已知的網(wǎng)絡(luò)運行數(shù)據(jù)進行數(shù)據(jù)挖掘,得到網(wǎng)絡(luò)故障狀態(tài)的預測模型[7],進而在網(wǎng)絡(luò)監(jiān)測點上利用實時采集的數(shù)據(jù)預測一段時間之后網(wǎng)絡(luò)故障狀態(tài),便于網(wǎng)絡(luò)運維系統(tǒng)做出及時的響應,其系統(tǒng)模型如圖1所示。
圖1 網(wǎng)絡(luò)故障狀態(tài)預測系統(tǒng)模型
預測系統(tǒng)模型主要對網(wǎng)絡(luò)擁塞的故障狀態(tài)進行預測。利用簡單網(wǎng)管協(xié)議(SNMP)實現(xiàn)網(wǎng)絡(luò)運行狀態(tài)數(shù)據(jù)的采集;首先選擇ARMA模型進行網(wǎng)絡(luò)運行狀態(tài)參數(shù)的預測;然后利用學習得到的BP神經(jīng)網(wǎng)絡(luò)模型依據(jù)預測的網(wǎng)絡(luò)運行狀態(tài)參數(shù)預測網(wǎng)絡(luò)故障狀態(tài)。簡單網(wǎng)管協(xié)議可以采集出一組與網(wǎng)絡(luò)運行狀態(tài)相關(guān)的屬性數(shù)據(jù),本文選擇與網(wǎng)絡(luò)擁塞密切相關(guān)的網(wǎng)絡(luò)流量數(shù)據(jù)作為典型參數(shù)進行分析。
1.1網(wǎng)絡(luò)運行參數(shù)預測方法
選用ARMA模型根據(jù)已知的網(wǎng)絡(luò)運行參數(shù)預測下一時段的網(wǎng)絡(luò)運行參數(shù)。ARMA(p,q)模型是自回歸模型(AR模型)和滑動平均模型(MA模型)的一般形式,ARMA(p,q)模型如式(1)所示[8]:
(1)
其中{yt}是平穩(wěn)的時間序列,φ1,…,φp是自回歸系數(shù),θ1,…,θq是滑動平均系數(shù),εt,εt-1,…,ε1是誤差項;根據(jù)時間序列理論,通常選擇模型ARMA(2n,2n-1)( n是正整數(shù))。本文對網(wǎng)絡(luò)流量等參數(shù)進行預測,而流量的變化是呈一種趨勢的,不能用少量的數(shù)據(jù)預測,因此選用了ARMA(6,5)的形式,其表示如式(2)所示:
(2)
圖2 網(wǎng)絡(luò)流量參數(shù)時間序列與預處理后的結(jié)果對比
(3)
(4)
由方程(4)估計計算出自回歸系數(shù),φ1,…,φ6。
樣本的自相關(guān)系數(shù)定義如式(5)所示:
(k=1,2,…,6)
(5)
利用一段時間采集到的網(wǎng)絡(luò)運行狀態(tài)參數(shù)的有限時間序列{xi}(i=1,2,…,n)對ARMA(6,5)模型進行數(shù)據(jù)擬合,計算得出ifInoctets、ifoutOctets和連接復位數(shù)三個參數(shù)的ARMA(6,5)模型分別為線性函數(shù),如式(6)、(7)和(8)所示。
參數(shù)ifInOctets的預測函數(shù)為:
yt=1.177yt-1+0.279 2yt-2+1.622yt-3-1.621yt-4-3.271yt-5+2.819yt-6-1.642εt-1+0.288 7εt-3+1.542εt-4-0.808 2εt-5
(6)
參數(shù)ifOutOctets的預測函數(shù)為:
yt=2.28yt-1-2.864yt-2+0.814 8yt-3+0.698 5yt-4-0.497 8yt-5+0.028 64yt-6+0.971 1εt-1+0.053 1εt-2-0.699 7εt-3-0.005 7εt-4+0.348 6εt-5
(7)
參數(shù)tcpEstabResets的預測函數(shù)為:
yt=0.527yt-1+0.530yt-2+0.504yt-3+0.317 81yt-4-1.033yt-5+0.154yt-6-0.485εt-1+0.064 4εt-2+0.588 2εt-3+0.922 92εt-4-0.114 3εt-5
(8)
其他參數(shù)的數(shù)據(jù)預處理及數(shù)據(jù)預測模型可用類似的方法求解,不在這里一一說明。
1.2網(wǎng)絡(luò)故障預測的BP神經(jīng)網(wǎng)絡(luò)模型
將預測得到的網(wǎng)絡(luò)運行狀態(tài)參數(shù),輸入BP神經(jīng)網(wǎng)絡(luò)模型預測網(wǎng)絡(luò)的故障狀態(tài)。利用網(wǎng)絡(luò)運行狀態(tài)的樣本數(shù)據(jù)對三層結(jié)構(gòu)的BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)進行訓練與學習。設(shè)BP網(wǎng)絡(luò)的輸入層節(jié)點數(shù)是n,輸出層節(jié)點數(shù)是1,隱層是一層結(jié)構(gòu)且節(jié)點數(shù)是m;BP的輸入層節(jié)點對應某時刻采集的網(wǎng)絡(luò)運行狀態(tài)參數(shù),輸出層節(jié)點表示該時刻的網(wǎng)絡(luò)狀態(tài)(網(wǎng)絡(luò)的使用率)。本文對BP網(wǎng)絡(luò)隱層及輸出層的輸出都采用公式(9)的非線性函數(shù)[9-11]做計算。
(9)
其中的wij是上層第i個節(jié)點和本層第j個節(jié)點的聯(lián)接權(quán)值,當oj表示隱層輸出時1≤j≤m、k=n;oj表示輸出層輸出時j=1、k=m。
本文設(shè)置(-1,1)區(qū)間內(nèi)的隨機數(shù)作為wij初始值,權(quán)值的學習是根據(jù)輸出層節(jié)點輸出值與輸出期望值之間的誤差做出調(diào)整。設(shè)t表示輸出層節(jié)點z的輸出期望值,BP網(wǎng)絡(luò)的邊權(quán)值wij利用公式(10)做調(diào)整。
wij(n+1)=wij(n)+ηoiδj
(10)
其中的n和n+1表示迭代次數(shù),η是學習因子,設(shè)置為常數(shù)(文中設(shè)為0.9),oi是上層第i節(jié)點的輸出(若第i層是輸入層,則輸出值即為輸入值),若j是輸出層節(jié)點,δz=oz(1-oz)(t-oz);若j是隱層節(jié),δj=oj(1-oj)δzWjz。
使用5 min間隔采集的網(wǎng)絡(luò)運行狀態(tài)樣本數(shù)據(jù)對BP網(wǎng)絡(luò)進行訓練,選用對網(wǎng)絡(luò)運行狀態(tài)影響較大的網(wǎng)絡(luò)流量數(shù)據(jù)(接口接收數(shù)據(jù)、接口發(fā)送數(shù)據(jù)、缺乏緩沖丟棄數(shù)據(jù)報文數(shù)(IpIndiaCards)、接收的ICMP報文數(shù)(IcmpInMsgs)、接收TCP總段數(shù)(TcpInSegs)和網(wǎng)絡(luò)連接復位數(shù))作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),選定誤差小的(6,15,1)作為BP網(wǎng)絡(luò)結(jié)構(gòu)模型。
本文利用實驗室環(huán)境下一種二層網(wǎng)絡(luò)結(jié)構(gòu)的局域網(wǎng)做實驗[12-13],在該二層網(wǎng)絡(luò)中,有2臺交換機、每臺交換機下有3臺實驗機。監(jiān)測局域網(wǎng)內(nèi)交換機的網(wǎng)絡(luò)運行狀態(tài),網(wǎng)絡(luò)帶寬為10 M。
網(wǎng)絡(luò)運行參數(shù)的實時采集是利用SNMP協(xié)議中異步walk方式,以5 min的時間間隔輪詢,數(shù)據(jù)采集產(chǎn)生的網(wǎng)絡(luò)負載對網(wǎng)絡(luò)的正常運行影響很小;為使網(wǎng)絡(luò)運行狀態(tài)出現(xiàn)一些擁塞現(xiàn)象,實驗時利用ping of death對監(jiān)測點做攻擊(主要使網(wǎng)絡(luò)帶寬占用率增高,使網(wǎng)絡(luò)出現(xiàn)擁堵),進而測試網(wǎng)絡(luò)故障預測模型系統(tǒng)的運行效果。
2.1網(wǎng)絡(luò)運行參數(shù)預測實驗
網(wǎng)絡(luò)運行參數(shù)預測是利用已經(jīng)采集的數(shù)據(jù),利用前面學習得到的ARMA參數(shù)預測函數(shù)預測未來5、10、15、20 min的對應參數(shù)值,圖3給出了三種網(wǎng)絡(luò)運行參數(shù)的部分預測結(jié)果。
圖3 部分預測數(shù)據(jù)與真實數(shù)據(jù)對比結(jié)果
從參數(shù)預測和實際測量值的結(jié)果對比圖可以看出,預測的參數(shù)能夠提前得到參數(shù)的變化趨勢,但是預測值相對參數(shù)變化值的計算結(jié)果有些偏大??梢杂嬎銋?shù)預測的相對誤差,設(shè)某個參數(shù)的預測值為a,實測值為b,則參數(shù)預測的相對誤差為:e=|a-b|/b;表1給出了圖3中三種網(wǎng)絡(luò)運行參數(shù)5分鐘、10分鐘、15分鐘及20分鐘預測值的相對誤差平均值。
表1 網(wǎng)絡(luò)運行參數(shù)不同預測時間的相對誤差均值
由表1的誤差結(jié)果可以看出預測的時間越長,預測的誤差也就越大,這是合理的。
2.3網(wǎng)絡(luò)運行狀態(tài)預測實驗
實驗檢測了BP神經(jīng)網(wǎng)絡(luò)對網(wǎng)絡(luò)運行狀態(tài)的預測結(jié)果。實驗中為保持網(wǎng)絡(luò)的工作狀態(tài),在通過網(wǎng)絡(luò)監(jiān)測點的兩個節(jié)點之間運行數(shù)據(jù)傳輸程序,使網(wǎng)絡(luò)使用率在10%左右,在此過程中,利用突發(fā)的、大量的數(shù)據(jù)傳輸對網(wǎng)絡(luò)傳輸流量進行擾動;在網(wǎng)絡(luò)監(jiān)測點中采集網(wǎng)絡(luò)運行參數(shù),然后進行網(wǎng)絡(luò)運行參數(shù)的5 min后數(shù)值預測,將預測的數(shù)值輸入訓練后的BP神經(jīng)網(wǎng)絡(luò),得出網(wǎng)絡(luò)運行狀態(tài)5 min之后的結(jié)果,實驗結(jié)果如圖4所示。
由于網(wǎng)絡(luò)運行參數(shù)預測模型對網(wǎng)絡(luò)運行參數(shù)的變化預測比較敏感,而網(wǎng)絡(luò)運行狀態(tài)預測是根據(jù)預測的網(wǎng)絡(luò)運行參數(shù)得出的,因而表現(xiàn)出網(wǎng)絡(luò)運行狀態(tài)預測能夠及時預測出網(wǎng)絡(luò)運行的變化,但是預測的變化幅度比真實的變化幅度要大一些。
假定預測的網(wǎng)絡(luò)使用率與實際的網(wǎng)絡(luò)使用率之差的絕對值小于2%就認為預測是基本準確的,圖4實驗中預測準確率大于85%,基本上能夠達到預測的目標。
圖4 網(wǎng)絡(luò)使用率的預測與實際結(jié)果的對比
不斷擴大的網(wǎng)絡(luò)規(guī)模和不斷上升的網(wǎng)絡(luò)速度使網(wǎng)絡(luò)故障預測和管理變得十分困難,若能利用網(wǎng)絡(luò)運行數(shù)據(jù)提前做出漸變性故障的預測,將有助于網(wǎng)絡(luò)故障的及時處理。
本文首先采集各種不同網(wǎng)絡(luò)運行狀態(tài)下的網(wǎng)絡(luò)運行參數(shù),基于這一樣本數(shù)據(jù)采用數(shù)據(jù)挖掘的方法獲得網(wǎng)絡(luò)運行參數(shù)的ARMA預測模型及網(wǎng)絡(luò)運行狀態(tài)的BP神經(jīng)網(wǎng)絡(luò)模型,利用ARMA模型對網(wǎng)絡(luò)運行的主要數(shù)據(jù)屬性進行預測,然后將這些預測數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)預測網(wǎng)絡(luò)的運行狀態(tài)。實驗證明了這一方法的有效性。
文本探討了一種新的網(wǎng)絡(luò)故障預測方法,但是在實驗中,僅僅選擇了網(wǎng)絡(luò)流量等少量網(wǎng)絡(luò)運行相關(guān)參數(shù)進行預測,這些參數(shù)不能充分反應完整的網(wǎng)絡(luò)運行狀態(tài),因此實驗預測結(jié)果誤差在20%左右,進一步的工作應增加網(wǎng)絡(luò)運行狀態(tài)的相關(guān)參數(shù)分析,從而使網(wǎng)絡(luò)故障預測模型更加完善。
[1]侯曉凱,李師謙,王杰瓊,等.一種基于神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)設(shè)備故障預測系統(tǒng)[J].山東理工大學學報:自然科學版,2014(6):29-34.
[2]鄧力,范庚,劉治學.基于回歸分析方法的網(wǎng)絡(luò)故障預測[J].計算機工程,2012(20):251-255.
[3]ZHANG Z,FU S.Failure prediction for autonomic management of networked computer systems with availability assurance[C].2013 IEEE International Symposium on Parallel & Distributed Processing,Workshops and Phd Forum IEEE,Cambridge,2013:1-8.
[4]ABED H J,AL-FUQAHA A,GUIZANI M,et al.Failure prediction based on multi-scale frequent anomalous behavior identification in support of autonomic networks[C].Global Telecommunications Conference(GLOBECOM 2010),2010 IEEEIEEE,2010:1-5.
[5]ABED H J,AL-FUQAHA A,KHAN B,et al.Efficient failure prediction in autonomic networks based on trend and frequency analysis of anomalous patterns[J].International Journal of Network Management,2013,23(3):186-213.
[6]LIU XIAO,WANG YING,XIAO AILING,et al.Disaster-prediction based virtual network mapping against multiple regional failures[C].Integrated Network Management(IM),2015 IFIP/IEEE International Symposium on IEEE,Ottawa,2015.
[7]唐斌,曾啟杰,章云.網(wǎng)絡(luò)化最優(yōu)優(yōu)預預測狀態(tài)估計[J].控制理論與應用,2011(05):727-734.
[8]鄒柏賢,劉強.基于ARMA模型的網(wǎng)絡(luò)流量預測[J].計算機研究與發(fā)展,2002,39(12):1645-1652.
[9]李瑞瑩,康銳.基于神經(jīng)網(wǎng)絡(luò)的故障率預測方法[J].航空學報,2008,29(2):357-363.
[10]薛宇.基于模糊數(shù)據(jù)挖掘的主機故障預測研究[D].沈陽:沈陽航空航天大學,2015.
[11]杜超,徐蕾.結(jié)構(gòu)化P2P網(wǎng)絡(luò)訪問熱點預測與負載均衡機制研究[J].沈陽航空航天大學學報,2013,30(6):38-43.
[12]胡海峰,伍慶潤,張文淵,等.基于局域網(wǎng)的網(wǎng)絡(luò)狀態(tài)預測[J].華中科技大學學報:自然科學版,2003(S1):233-237.
[13]林耀進,胡學鋼.多數(shù)據(jù)源中局部模式挖掘研究[J].合肥工業(yè)大學學報:自然科學版,2013,36(1):53-58.
(責任編輯:劉劃英文審校:趙亮)
Networkfaultspredictionmethodforparknetwork
ZHANGWei-fang,XULei
(CollegeofComputerScience,ShenyangAerospaceUniversity,Shenyang110136,China)
Todealwiththepossiblenetworkfailuresintheparknetworkinstantly,anewmethodofnetworkfaultspredictionwasproposed.Firstly,theARMApredictionfunctiontomakedataminingonthedatasamplewasused.Thenthepredictfunctionofnetworkoperationparameters,andBPneuralnetworkmodelfornetworkfailurepredictionwasobtained.ThecollectionnetworkoperatingparametersofSNMPprotocolonthecriticalmonitoringpointofthecampusnetworkwasappliedwhilethereal-timenetworkfaultswaspredicted.Thereforeseveralhoursinadvancebytheaboveparameterswaspredictedwheneverthenetworkwasrunning.FurthermoretheBackPropagationtopredictthenetfailureswasused.Theexperimentalresultsshowthattheoperationaccuracyratereachesatmorethan80%ofthenetworkstatepredictionbyusingtheproposedthemethod.
parknetworkfault;neuralnetwork;dataforecast;SNMP
2015-12-16
張維訪(1990-),男,遼寧省朝陽人,碩士研究生,主要研究方向:信息安全,E-mail:18040036125@163.com;徐蕾(1959-),女,上海人,教授,主要研究方向:信息安全,E-mail:xulei@sau.com。
2095-1248(2016)04-0073-05
TP274
A
10.3969/j.issn.2095-1248.2016.04.013