張志偉 劉立士
摘? 要:計算機網(wǎng)絡(luò)體系逐漸擴(kuò)大,因此網(wǎng)絡(luò)的服務(wù)質(zhì)量和性能也急需提高。網(wǎng)絡(luò)流量預(yù)測是網(wǎng)絡(luò)管理的一個重要手段,研究表明網(wǎng)絡(luò)流量具有自相似特性,在此基礎(chǔ)上該文提出一種ARIMA預(yù)測模型。該模型首先對所生成的網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行預(yù)處理,基于相關(guān)性與偏相關(guān)性選擇ARMA模型,其次通過AIC、BIC確定階數(shù),利用檢驗后的模型進(jìn)行預(yù)測,最后評估預(yù)測模型的性能。ARIMA時間序列模型能夠預(yù)測非平穩(wěn)數(shù)據(jù),與傳統(tǒng)統(tǒng)計模型相比,具有可忽略其他的隨機變量、預(yù)測準(zhǔn)確性更高、突發(fā)性影響較小的優(yōu)點。
關(guān)鍵詞:ARIMA模型? 自相似? 流量預(yù)測? 研究
中圖分類號:TP393 ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2020)08(b)-0025-03
Research on Arima Prediction Model of Self Similarity Traffic
ZHANG Zhiwei? LIU Lishi*
(Shenyang Ligong University, Shenyang, Liaoning Province, 110159 China)
Abstract: With the gradual expansion of computer network system, the service quality and performance of network also need to be improved. Network traffic prediction is an important means of network management. The research shows that network traffic has self similar characteristics. On this basis, this paper proposes an ARIMA prediction model. Firstly, the model preprocesses the generated network traffic data, selects ARMA model based on correlation and partial correlation, then determines the order through AIC and BIC, uses the tested model to predict, and finally evaluates the performance of the prediction model. ARIMA time series model can predict non-stationary data. Compared with the traditional statistical model, ARIMA time series model has the advantages of ignoring other random variables, higher prediction accuracy and less sudden impact.
Key Words: ARIMA model; Self similarity; Traffic prediction; Research
因互聯(lián)網(wǎng)的規(guī)模越來越大,網(wǎng)絡(luò)擁塞、故障等問題也越來越多,提高網(wǎng)絡(luò)服務(wù)質(zhì)量也變的尤為重要。目前的研究表明,網(wǎng)絡(luò)流量可以預(yù)測是因為自相似性[1],因此其也開辟了一個新的研究方向,即可以對網(wǎng)絡(luò)流量進(jìn)行精準(zhǔn)的分析和控制。網(wǎng)絡(luò)流量的預(yù)測是進(jìn)行網(wǎng)絡(luò)規(guī)劃的基礎(chǔ),對于消除網(wǎng)絡(luò)擁塞具有重要的參考價值,選擇一種好的預(yù)測模型對自相似流量進(jìn)行預(yù)測,動態(tài)實時監(jiān)測自相似流量,進(jìn)而篩選、去掉不需要的流量,而且還可以將其引入其他的模塊,進(jìn)行提前預(yù)測,這對解決網(wǎng)絡(luò)擁塞有極大的幫助[2]。
1? 自相似流量的特性及預(yù)測模型
自相似性簡單來說就是局部和整體相似,目前對于網(wǎng)絡(luò)流量的研究過程中少不了自相似性的。對于預(yù)測目前有很多方法,傳統(tǒng)的統(tǒng)計預(yù)測對事物進(jìn)行定量分析進(jìn)而得出預(yù)測結(jié)果,相比于其他模型更簡便、速度更快,但處理突發(fā)流量可能有些吃力,該文選擇ARIMA時間序列方法,建立ARMA[3]模型,通過改進(jìn)使其對自相似流量進(jìn)行預(yù)測。
2? ARIMA原理及預(yù)測模型
ARIMA(p,d,q)(差分自回歸移動平均模型)模型的原理:研究對象隨著時間變化而變化,從而建立一個模型,根據(jù)當(dāng)前序列值預(yù)測,得到預(yù)測值,但是ARIMA模型處理的是平穩(wěn)對象,因此,在數(shù)據(jù)輸入時需要進(jìn)行預(yù)處理,加入一個周期函數(shù),易于操作,最后還原。
ARIMA(p,d,q)模型表達(dá)式如(1)所示,L為滯后算子,d為大于0的整數(shù),p是自回歸項,q為移動平均項數(shù),d為時間序列的差分次數(shù)。
建立網(wǎng)絡(luò)流量預(yù)測模型:
ARIMA模型的基本流程如下:(1)導(dǎo)入數(shù)據(jù)首先判斷序列的平穩(wěn)性,如果序列非平穩(wěn),則進(jìn)行預(yù)處理以獲得平穩(wěn)序列,這里使用ADF檢驗和KPSS檢驗[4]。而該文數(shù)據(jù)由ON/OFF模型產(chǎn)生,具有隨機性,就需要引入一個周期函數(shù)進(jìn)行處理。(2)選擇模型,根據(jù)時間序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)來判斷選擇的模型,經(jīng)過驗證,該文選擇ARMA模型。(3)對ARIMA(p,d,q)模型進(jìn)行定階,這里選擇AIC,BIC最小信息量準(zhǔn)則。(4)基于ARIMA估計模型預(yù)測差分后的數(shù)據(jù),差分還原得到平穩(wěn)的序列,最后去掉前面加入的函數(shù)得到最終流量,與原始流量進(jìn)行對比分析。最后對模型預(yù)測的結(jié)果進(jìn)行評測,用來表示預(yù)測值和真實值的吻合程度,這里則選擇MAE(平均絕對誤差)和MAPE(平均絕對百分比誤差),誤差越大,其值越大。
3? 仿真驗證與分析
該文選擇基于ON/OFF模型產(chǎn)生的流量數(shù)據(jù),并采用ARIMA模型預(yù)測。使用Matlab軟件進(jìn)行仿真,生成的自相似流量由3個部分構(gòu)成:信源到達(dá)過程、信源時間間隔、持續(xù)時間。信源到達(dá)過程服從泊松分布poissrnd(λ,1,N),N為列向量數(shù),信源到達(dá)率λ=0.5,信源時間間隔服從指數(shù)分布exprnd(1/λ,1,N),持續(xù)時間服從帕累托分布其中X、K、σ、θ分別為0.01、1.5、1、1,傳送速率(packet/s)。
仿真結(jié)果如圖1、圖2所示。這里,圖1是基于ON/OFF模型下產(chǎn)生的自相似流量仿真圖,圖2是在ON/OFF模型中基于ARMA網(wǎng)絡(luò)模型預(yù)測了自相似流量得到的對比仿真圖。
由圖1、圖2可得,選取了7個點作為對比,在時間為5s、17s、37s、46s、63s、67s、91s處產(chǎn)生的自相似流量數(shù)據(jù)包個數(shù)為60、120、180、360、450、180、120,而經(jīng)過ARMA預(yù)測過得數(shù)據(jù)包個數(shù)約為60、120、181、362、454、182、123,其相對誤差百分比為0、0、0.55%,0.55%、0.88%、0.55%、2.5%,該文使用MAE和MAPE作為評價誤差的指標(biāo),仿真得到的MAE=1.1102,MAPE=0.0148%,MAE小于預(yù)設(shè)值4,MAPE遠(yuǎn)小于1,接近于0,誤差較小,因此ARMA模型可以實現(xiàn)網(wǎng)絡(luò)流量的預(yù)測。
4? 結(jié)語
該文選取時間序列模型中的ARMA模型進(jìn)行流量預(yù)測,將ON/OFF模型與ARMA模型有效結(jié)合,并通過改進(jìn),經(jīng)過多次驗證,使其能夠處理非平穩(wěn)數(shù)據(jù),減少了部分突發(fā)性的問題,也證明了自相似流量是可預(yù)測的,如果能通過預(yù)測對流量實時監(jiān)控處理,則可以有效避免網(wǎng)絡(luò)擁塞,進(jìn)而提高整體的服務(wù)質(zhì)量。
參考文獻(xiàn)
[1] 王曉婷,王憶文,李平.一種自相似網(wǎng)絡(luò)流量生成器的設(shè)計與實現(xiàn)[J].微電子學(xué)與計算機,2016,33(8):54-58.
[2] 于雅芮.基于自相似流量預(yù)測的AOS幀生成技術(shù)研究[D].沈陽理工大學(xué),2020.
[3] 于雅芮,劉立士.自相似流量的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型研究[J].科技資訊,2019,17(16):9-10.
[4] 翟靜,曹俊.基于時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J].統(tǒng)計與決策,2016(4):29-32.
[5] 耿傳鑫,劉立士.自相似網(wǎng)絡(luò)流量預(yù)測模型的研究[J].科技創(chuàng)新導(dǎo)報,2018,15(13):148-149.
[6] 史明虎.基于FARIMA模型的自相似業(yè)務(wù)流量預(yù)測[D].西安電子科技大學(xué),2013.