陳衛(wèi)軍,金顯華
(安陽師范學(xué)院 軟件學(xué)院,河南 安陽 455000)
隨著網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上承載的業(yè)務(wù)和應(yīng)用日益豐富.因此加強網(wǎng)絡(luò)管理是運營商們急需解決的問題.有效地提高網(wǎng)絡(luò)運行速度和利用率,網(wǎng)絡(luò)峰值起到?jīng)Q定性作用.網(wǎng)絡(luò)峰值預(yù)測是業(yè)務(wù)管理的關(guān)鍵問題,網(wǎng)絡(luò)峰值的精確性、實時性和廣譜性直接關(guān)系到業(yè)務(wù)管理的效率和性能.網(wǎng)絡(luò)峰值預(yù)測就是對尚未發(fā)生和目前還不明確的網(wǎng)絡(luò)信息,根據(jù)過去和現(xiàn)在的網(wǎng)絡(luò)信息進行預(yù)先的估計和推測,即在一定的算法模型下對未來一段時間內(nèi)的網(wǎng)絡(luò)峰值信息的發(fā)展趨勢、方向和可能的狀態(tài)做出合理的、在允許誤差范圍內(nèi)的推斷.網(wǎng)絡(luò)峰值的預(yù)測涉及網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號強度和網(wǎng)路峰值范圍等多種因素,因此研究網(wǎng)絡(luò)峰值預(yù)測算法,具有重大的理論和實踐意義,而相關(guān)模型的構(gòu)建和算法研究受到人們的關(guān)注[1].
對網(wǎng)絡(luò)峰值走勢的預(yù)測模型構(gòu)建,根本上是對一組影響網(wǎng)絡(luò)峰值的樣本數(shù)據(jù)的處理,這個處理過程是對這個樣本序列進行估計預(yù)報的過程.傳統(tǒng)方法中,主要采用線性模型或者等效近似的線性模型對網(wǎng)絡(luò)峰值影響的樣本序列進行處理和分析,并取得了一定的研究成果.文獻[2]提出一種基于改進灰色神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)峰值走勢分析模型,但算法僅僅考慮樣本序列的線性成分,對灰色關(guān)聯(lián)的非線性成分的處理沒有納入分析范疇,導(dǎo)致預(yù)測精度不高.文獻[3]構(gòu)建了一種網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號強度和網(wǎng)絡(luò)峰值的關(guān)聯(lián)模型,對網(wǎng)絡(luò)峰值預(yù)測精度較好,但是算法模型需要從長期均衡角度上看網(wǎng)絡(luò)流量對網(wǎng)絡(luò)峰值的影響,實踐中操作困難.文獻[4]提出一種基于貝葉斯估計的動態(tài)隨機一般均衡模型,實現(xiàn)對網(wǎng)絡(luò)峰值與網(wǎng)絡(luò)管理者的調(diào)控模型,但算法不能夠準確地擬合諸多非線性動力模型影響下的網(wǎng)絡(luò)峰值預(yù)測,導(dǎo)致對網(wǎng)絡(luò)峰值預(yù)測精度不好,且算法開銷較大.
針對上述問題,提出一種采用最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測算法.算法首先建立簡單的SVM模型,在SVM模型的基礎(chǔ)上,采用PCA方法實現(xiàn)對原始網(wǎng)絡(luò)峰值波動序列的加權(quán)平滑處理,采用最大共軛梯度連續(xù)泛函的樣本序列數(shù)學(xué)處理方法實現(xiàn)預(yù)測算法的改進.仿真實驗驗證了網(wǎng)絡(luò)峰值預(yù)測算法的有效性.
首先需要進行統(tǒng)計模型的構(gòu)建,在網(wǎng)絡(luò)峰值預(yù)測算法設(shè)計中,需要建立一個包含網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號強度和網(wǎng)絡(luò)峰值的SVM模型,采用SVM模型的主成分分析方法實現(xiàn)對網(wǎng)絡(luò)峰值的PCA估計系統(tǒng)設(shè)計[5].網(wǎng)絡(luò)峰值估計和預(yù)測的SVM模型是基于數(shù)據(jù)的統(tǒng)計性質(zhì)建立的模型,選取我國2006年3月到2013年10月的網(wǎng)絡(luò)峰值月度數(shù)據(jù)作為原始數(shù)據(jù)樣本序列,樣本序列數(shù)學(xué)表達式為
U={U1,U2,U3,…,UN},
(1)
其中Ui為維數(shù)為d維的隨機變量,各個隨機變量Ui之間是相互獨立的.峰值影響的參量模型中,峰值增長率選取1~3年短期增長率數(shù)據(jù)[6-8],增長率序列的概率密度函數(shù)為:
(2)
(3)
在建模前,對各變量數(shù)據(jù)進行自然對數(shù)變換,峰值波動數(shù)據(jù)X符合穩(wěn)定分布特征,記為X~sα(σ,β,μ),β的最大似然估計可通過求各數(shù)列的單位根檢驗和協(xié)整檢驗得到.當V為連續(xù)變量,則特征函數(shù)滿足:
Φ(ω)=E[ejωX]=
(4)
式(4)表示一個包含網(wǎng)絡(luò)流量、網(wǎng)絡(luò)信號強度和網(wǎng)絡(luò)峰值3個內(nèi)生變量的網(wǎng)絡(luò)峰值波動模型,其模型的數(shù)學(xué)表達式為
(5)
式(5)中,n=1,2,…,N;υi(x)為一個k維內(nèi)生變量.在網(wǎng)絡(luò)峰值關(guān)聯(lián)參數(shù)估計中,增長率為m取得一維數(shù)組Xn,它表示約束算法下最大化消耗指數(shù),與之最相關(guān)的網(wǎng)絡(luò)流失率為Xη(n),從而構(gòu)建得到能影響網(wǎng)絡(luò)峰值關(guān)聯(lián)預(yù)測影響因素的均衡方程:
(6)
式(6)中,通過最大共軛梯度連續(xù)泛函,在奇異半正定性雙周期性復(fù)分析下,得到迭代對數(shù)似然函數(shù)sgn(ω)的期望值,由此實現(xiàn)對網(wǎng)絡(luò)峰值關(guān)聯(lián)預(yù)測.峰值影響的參數(shù)取值面積示意圖如圖1所示.
圖1 網(wǎng)絡(luò)峰值影響的參數(shù)取值面積示意圖
對網(wǎng)絡(luò)峰值的研究,首先是把峰值樣本序列當作一個時間序列,采用信號處理學(xué)科的理論進行.因此,要對網(wǎng)絡(luò)峰值使用信號處理方法進行原始數(shù)據(jù)的預(yù)處理.
dm(0)=‖Xm-Xk‖.
(7)
式(7)中,Xm和Xk通過一步發(fā)展演變?yōu)閄m+1和Xk+1,由此為實現(xiàn)峰值的準確預(yù)測提供數(shù)據(jù)基礎(chǔ).采用最大共軛梯度連續(xù)泛函方法,得到n+m+k(k>0)時刻數(shù)據(jù)的預(yù)測值,它表示為兩向量增長變化分類的指數(shù):
‖Xm+1-Xk+1‖=‖Xm-Xk‖eλ1.
(8)
式(8)中,Xm+1的最末分量x(tn+1)未知,且唯有它是未知的.其計算式表達為:
Xm+1(m)=Xk+1(m)±
(9)
式(9)中:dm(0)表示脈沖響應(yīng)函數(shù)分別分析利率,Xm+1(i)表示網(wǎng)絡(luò)流量對網(wǎng)絡(luò)峰值的影響貢獻程度,Xk+1(i)表示樣本個數(shù).由此建立了簡單的SVM模型,在SVM模型的基礎(chǔ)上,結(jié)合最大共軛梯度連續(xù)泛函,實現(xiàn)對原始峰值波動序列的加權(quán)平滑處理與準確預(yù)測.
首先對初始條件不同的網(wǎng)絡(luò)峰值進行在線評估,峰值波動曲線在運動發(fā)展的過程中,隨著時間的進程呈現(xiàn)指數(shù)分離.考慮網(wǎng)絡(luò)流量和網(wǎng)絡(luò)信號強度對網(wǎng)絡(luò)峰值的貢獻,采用輔助矩陣的方法,進行最大共軛梯度連續(xù)泛函,最大共軛梯度為:
(10)
在考慮峰值因素和網(wǎng)絡(luò)流失的情況下,采取一次性總付的形式增加的峰值預(yù)算約束化成本,引入網(wǎng)絡(luò)峰值指數(shù)的同比增長率,得到新的狀態(tài)項為
(11)
最大共軛梯度連續(xù)泛函下的峰值序列的主成分分析結(jié)構(gòu)狀態(tài)項和積分叉積項分別表示為:
(12)
(13)
由于網(wǎng)絡(luò)信號強度和網(wǎng)絡(luò)峰值互為影響,因此可以對數(shù)據(jù)的統(tǒng)計模型進行連續(xù)泛函求導(dǎo),得到峰值關(guān)聯(lián)預(yù)測的目標函數(shù)為:
FY(χ;α,λ)=1-
(14)
根據(jù)上述分析,得到本文提出的最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測算法實現(xiàn)的關(guān)鍵步驟描述如下.
(1)分別對網(wǎng)絡(luò)峰值對數(shù)hj-1(t)的局部極大值和極小值點進行插值擬合,對數(shù)據(jù)的處理以及模型估計采用方差分解的方法,對網(wǎng)絡(luò)峰值進行SVM擬合,計算包絡(luò)線的均值曲線mj-1(t).
(2)考察增長率波動以及網(wǎng)絡(luò)流量對網(wǎng)絡(luò)峰值的影響貢獻程度,從hj-1(t)中去掉均值曲線得到hj(t),即:
hj(t)=hj-1(t)-mj-1(t).
(15)
(3)考察hj-1(t)和hj(t)是否滿足網(wǎng)絡(luò)峰值對數(shù)和增長率的突發(fā)性變化和尺度特性篩選終止條件,即:
(16)
當滿足上述條件,依據(jù)協(xié)整檢驗結(jié)果,可以得到協(xié)整方程,并利用支持向量機SVM模型對網(wǎng)絡(luò)峰值波動的關(guān)聯(lián)特征進行預(yù)測:
ri(t)=ti-1(t)-ci(t).
(17)
(4)若i=i+1的極值點不少于兩個,則i=i+1,并轉(zhuǎn)到(3),否則分解完成,ri(t)為殘余量.得到預(yù)測后的協(xié)整向量為:
(18)
(5)估計AR特征多項式的特征系數(shù),對峰值關(guān)聯(lián)特征進行狀態(tài)信息融合處理,減少預(yù)測誤差,得到預(yù)測結(jié)果為:
(19)
(20)
(6)令t=t+1,跳轉(zhuǎn)到步驟(1),重復(fù)計算下一時刻樣本數(shù)據(jù),直至結(jié)束.
(7)算法結(jié)束.
為了測試本文算法對網(wǎng)絡(luò)峰值預(yù)測模型的性能,需要進行仿真實驗,分析工具為Matlab,對網(wǎng)絡(luò)峰值對數(shù)、網(wǎng)絡(luò)流量對數(shù)等參數(shù)進行分析比對.上述參數(shù)分別表示為:
表1 網(wǎng)絡(luò)峰值的協(xié)整向量估計表(104T)
在網(wǎng)絡(luò)峰值影響因素中,網(wǎng)絡(luò)流量具有持續(xù)性,網(wǎng)絡(luò)信號強度起到關(guān)鍵作用,影響較大[9].根據(jù)上述參數(shù)設(shè)計和算法處理分析,得到原始峰值數(shù)據(jù)的樣本波形圖如圖2所示.
以此為研究對象,對數(shù)據(jù)序列進行最大共軛梯度連續(xù)泛函預(yù)處理和平滑處理,然后采用本文算法和傳統(tǒng)方法進行峰值關(guān)聯(lián)預(yù)測,得到預(yù)測結(jié)果如圖3所示.圖3中給出了本文算法模型下對網(wǎng)絡(luò)峰值預(yù)測結(jié)果和預(yù)測誤差.
分析圖3中的結(jié)果可見,采用本文算法,預(yù)測精度較高,預(yù)測誤差控制在1.5%以內(nèi).采用傳統(tǒng)方法對網(wǎng)絡(luò)峰值進行預(yù)測,誤差較大,對網(wǎng)絡(luò)峰值的宏觀調(diào)控指導(dǎo)意義受限.本文方法使得預(yù)測誤差得到有效控制,且能實現(xiàn)對各種影響因素的關(guān)聯(lián)性分析,實現(xiàn)關(guān)聯(lián)預(yù)測.
圖2 原始的網(wǎng)絡(luò)峰值數(shù)據(jù)的樣本波形圖
(a) 預(yù)測值 (b) 預(yù)測誤差分析
隨著網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)絡(luò)上承載的業(yè)務(wù)和應(yīng)用日益豐富.傳統(tǒng)的方法對網(wǎng)絡(luò)峰值進行預(yù)測只是單一采用線性或者非線性的方法進行處理,這種片面性造成預(yù)測的準確度和實時性難以保證.本文提出一種采用最大共軛梯度連續(xù)泛函的網(wǎng)絡(luò)峰值預(yù)測算法,實現(xiàn)對原始峰值波動序列的加權(quán)平滑處理,采用最大共軛梯度連續(xù)泛函的樣本序列數(shù)學(xué)處理方法,實現(xiàn)預(yù)測算法的改進.實驗結(jié)果顯示,本文的預(yù)測模型和算法設(shè)計,預(yù)測精度較高,預(yù)測誤差控制在1.5%以內(nèi),且能實現(xiàn)對各種影響因素的關(guān)聯(lián)性分析,性能優(yōu)越,可以有效提高網(wǎng)絡(luò)運行速度和利用率.