【摘 要】對(duì)于網(wǎng)絡(luò)工作安全和可靠性要求,來(lái)進(jìn)行網(wǎng)絡(luò)流量預(yù)測(cè)研究。網(wǎng)絡(luò)流量的性質(zhì)有如下幾點(diǎn):時(shí)變性、非線(xiàn)性以及高度自似性。在對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)中,過(guò)去的傳統(tǒng)方法,已經(jīng)無(wú)法滿(mǎn)足預(yù)測(cè)精度的要求,因?yàn)閭鹘y(tǒng)方法很難抓住網(wǎng)絡(luò)流量的時(shí)變性和自相似性。為了能夠更好的預(yù)測(cè)網(wǎng)絡(luò)流量,結(jié)合網(wǎng)絡(luò)流量的特性,利用ARIMA模型可以高精度的實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè)。ARIMA模型先通過(guò)差分法把網(wǎng)絡(luò)流量的基礎(chǔ)數(shù)據(jù)進(jìn)行平穩(wěn)化處理,捕捉網(wǎng)絡(luò)流量的自相似性,第二步是把處理后的數(shù)據(jù)通過(guò)ARIMA模型進(jìn)行擬合檢測(cè),由于A(yíng)RIMA模型能夠很好的抓住網(wǎng)絡(luò)流量的時(shí)變性和自相似性,因此提高了預(yù)測(cè)精度。模擬預(yù)測(cè)結(jié)果很好的說(shuō)明ARIMA模型比其他類(lèi)型的模型預(yù)測(cè)的精度要高,并且把網(wǎng)絡(luò)流量的規(guī)律呈現(xiàn)的更加直觀(guān),因此這種ARIMA模型在網(wǎng)絡(luò)流量預(yù)測(cè)中越來(lái)越具有優(yōu)勢(shì)。
【關(guān)鍵詞】網(wǎng)絡(luò)流量;預(yù)測(cè);時(shí)間序列;自回歸模型
一、引言
現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展也帶動(dòng)了網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)規(guī)模增長(zhǎng)速度非常快,各種網(wǎng)絡(luò)信息在網(wǎng)絡(luò)動(dòng)態(tài)中交互傳遞,對(duì)此必須保證網(wǎng)絡(luò)信息傳遞的安全,網(wǎng)絡(luò)管理員只要掌握好各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)中的流量數(shù)據(jù),就可以對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行有效的調(diào)控。網(wǎng)絡(luò)工作者在網(wǎng)絡(luò)設(shè)計(jì)時(shí)必須要考慮到網(wǎng)絡(luò)流量特性的問(wèn)題,很多網(wǎng)絡(luò)流量模型近幾年也在不斷的被研究出來(lái),網(wǎng)絡(luò)流量預(yù)測(cè)模型的研究也受到很大程度的重視。例如幾種比較有名的預(yù)測(cè)模型:馬爾科夫模型、泊松過(guò)程模型,近幾年開(kāi)始有學(xué)者提出自回歸模型的概念。由于網(wǎng)絡(luò)的不斷發(fā)展,規(guī)模不斷增大,網(wǎng)絡(luò)流量本身已經(jīng)發(fā)展成為一種具有多種特性的事物,這給傳統(tǒng)網(wǎng)絡(luò)流量預(yù)測(cè)模型的預(yù)測(cè)造成了困難,因?yàn)閭鹘y(tǒng)模型預(yù)測(cè)方法很難捕捉到流量的時(shí)變性、以及高度自私性等特征。本文介紹的ARIMA模型,是一種同其他類(lèi)型預(yù)測(cè)模型相比具有明顯優(yōu)勢(shì)的新型預(yù)測(cè)模型。
二、網(wǎng)絡(luò)流量預(yù)測(cè)原理
網(wǎng)絡(luò)流量的內(nèi)涵是指網(wǎng)絡(luò)上傳輸?shù)臄?shù)據(jù)總量,在采集網(wǎng)絡(luò)流量的原始數(shù)據(jù)時(shí),間隔采集就可以獲得一組組時(shí)間序列。通常情況下,可以采用下面這種方式來(lái)對(duì)網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行描述:
由于網(wǎng)絡(luò)的快速發(fā)展,網(wǎng)絡(luò)的規(guī)模越來(lái)越大,網(wǎng)絡(luò)流量的各種特征也越來(lái)越難以捕捉到,傳統(tǒng)預(yù)測(cè)手段很難呈現(xiàn)數(shù)據(jù)之間的時(shí)間關(guān)系,因此現(xiàn)代的網(wǎng)絡(luò)流量預(yù)測(cè)變成了復(fù)雜時(shí)間序列回歸系統(tǒng)問(wèn)題。ARIMA模型能夠很好的捕捉到網(wǎng)絡(luò)流量的各種特征,對(duì)時(shí)間序列性數(shù)據(jù)的研究具有很好的效果,因此在經(jīng)濟(jì)時(shí)間序列得到了很廣泛的應(yīng)用,解決了許多傳統(tǒng)預(yù)測(cè)模型無(wú)法解決的難題,本文將會(huì)介紹ARIMA模型預(yù)測(cè)的基本方法。
三、基于 ARIMA模型的網(wǎng)絡(luò)流量預(yù)測(cè)
1、ARIMA模型的描述
ARIMA模型之所以能很好的提高預(yù)測(cè)精度,在于其相對(duì)于傳統(tǒng)預(yù)測(cè)模型而言,很好的捕捉到了網(wǎng)絡(luò)流量的幾種特征,把采集到得數(shù)據(jù)通過(guò)處理,然后通過(guò)建立好的最佳預(yù)測(cè)模型,來(lái)對(duì)網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行仿真預(yù)測(cè)。模擬預(yù)測(cè)結(jié)果很好的說(shuō)明ARIMA模型比其他類(lèi)型的模型預(yù)測(cè)的精度要高,并且把網(wǎng)絡(luò)流量的規(guī)律呈現(xiàn)的更加直觀(guān)。
對(duì)某一滿(mǎn)足ARIMA( p, q)模型的樣本數(shù)據(jù)集{w t= 0, 1, , },取自然對(duì)數(shù)并對(duì)其進(jìn)行d次差分(差分算子階數(shù)d通常取0或1,最多取2),可以得到平穩(wěn)的ARIMA( p, q)序列,在確定模型參數(shù)并進(jìn)行擬合和檢驗(yàn)后,就可以進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)流量的預(yù)測(cè),利用希伯特空間上線(xiàn)性算子的基本理論,可以證明對(duì)于離散的、連續(xù)的、標(biāo)量以及向量的情況,用一個(gè)ARIMA(n,n-1)模型可以把任一平穩(wěn)隨機(jī)系統(tǒng)逼近到所要求的精確程度,而在實(shí)際應(yīng)用中,大量的隨機(jī)系統(tǒng)可以恰當(dāng)?shù)赜肁RIMA(2,1)模型來(lái)模擬。
對(duì)其參數(shù)的估計(jì)和定階有很多種方法,幾種常見(jiàn)的例如矩估計(jì)、線(xiàn)性建模、HDW、極大似然估計(jì)等方法,其中“矩估計(jì)方法”精度不高,一般作為其它更好方法的迭代初值,另幾種方法各有所長(zhǎng),本篇論文選擇的方法則是線(xiàn)性建模,一次來(lái)確定ARMA模型的參數(shù)。
根據(jù)最后 AIC和 SBC值最小化原則得到 AR IMA( p, q,d)的參數(shù)達(dá)到最優(yōu), 對(duì)于用不同參數(shù)模型計(jì)算的結(jié)果也可以采用真實(shí)數(shù)據(jù)對(duì)其進(jìn)行相似系數(shù)和擬合度的分析, 如果相似系數(shù)和擬合度最大, 則該模型就最優(yōu)模。
四、仿真分析
1、采集數(shù)據(jù)
為了對(duì)本文提出模型的效果進(jìn)行擬合和檢驗(yàn), 本文采集對(duì) CERNET山西主節(jié)點(diǎn)一臺(tái) CISCO6509設(shè)備某端口流出流量進(jìn)行監(jiān)測(cè), 采樣時(shí)間間隔為 5分鐘, 如圖所示:
2、數(shù)據(jù)處理
從上圖可以看出,該模型在初始階段擬合效果不太好, 但經(jīng)過(guò)大量數(shù)據(jù)的計(jì)算后, 在最后 48小時(shí)模型得到了較好的擬合效果, 與原始流量曲線(xiàn)的走勢(shì)基本相符。
4、網(wǎng)絡(luò)流量的預(yù)測(cè)
使用上述所到的 AR IMA 模型對(duì)未來(lái) 24小時(shí)的網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè), 預(yù)測(cè)結(jié)果如圖所示:
上述部分是基于A(yíng)RIMA模型對(duì)在網(wǎng)絡(luò)流量預(yù)測(cè)中的應(yīng)用介紹,ARIMA模型作為一種新型預(yù)測(cè)模型,同過(guò)去的幾種模型相比較起來(lái),預(yù)測(cè)效果非常的直觀(guān)。與其他預(yù)測(cè)模型相比,優(yōu)越性可見(jiàn)一般,具體預(yù)測(cè)指標(biāo)如下表所示:
五、總結(jié)
傳統(tǒng)的網(wǎng)絡(luò)流量預(yù)測(cè)方法的預(yù)測(cè)基礎(chǔ)是建立在流量滿(mǎn)足線(xiàn)性關(guān)系,但實(shí)際上,這種關(guān)系式并不是始終都是成立的,實(shí)際網(wǎng)絡(luò)流量數(shù)據(jù)中包含了很多的非線(xiàn)性因素,它的表現(xiàn)規(guī)律并不很直觀(guān),因此運(yùn)用傳統(tǒng)的方法對(duì)網(wǎng)絡(luò)流量的預(yù)測(cè),其預(yù)測(cè)精度并不高,為了解決傳統(tǒng)預(yù)測(cè)手段精度不高的問(wèn)題,本文圍繞如何準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)流量模型這一目標(biāo), 提出了基于 ARIMA 的網(wǎng)絡(luò)流量時(shí)間序列模型, 本文詳細(xì)闡述了模型的數(shù)學(xué)算法和實(shí)現(xiàn)方法。仿真結(jié)果表明, 在實(shí)際的網(wǎng)絡(luò)流量環(huán)境中, ARI-MA模型降低了預(yù)測(cè)誤差, 提高了預(yù)測(cè)精確度, 具有較強(qiáng)的適應(yīng)能力。
參考文獻(xiàn):
[1]張冉,趙成龍. ARIMA模型在網(wǎng)絡(luò)流量預(yù)測(cè)中的應(yīng)用研究[J]. 計(jì)算機(jī)仿真,2011,02:171-174.
[2]薛可,李增智,劉瀏,宋承謙. 基于A(yíng)RIMA模型的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 微電子學(xué)與計(jì)算機(jī),2004,07:84-87.
[3]崔文亮. 基于A(yíng)RIMA模型的網(wǎng)絡(luò)流量預(yù)測(cè)[J]. 軟件,2012,11:221-223.
[4]郝占軍. 網(wǎng)絡(luò)流量分析與預(yù)測(cè)模型研究[D].西北師范大學(xué),2011.
[5]李菁菲. 基于小波技術(shù)和ARIMA模型的網(wǎng)絡(luò)流量預(yù)測(cè)研究[D].山東大學(xué),2010.
作者簡(jiǎn)介:
趙俊峰,性別:男,天津工業(yè)大學(xué)在職研究生,研究方向:控制理論與控制工程,工作單位:威世通用半導(dǎo)體(天津)有限公司 工程師。