陳 晶
(江蘇城鄉(xiāng)建設職業(yè)學院 江蘇常州 213147)
隨著無線通技術的不斷發(fā)展和成熟,無線網(wǎng)絡得到了長足發(fā)展,并在許多領域得到了成功的應用。相對于有線網(wǎng)絡,無線網(wǎng)絡具有一定的優(yōu)點,如可以隨時隨地進行上網(wǎng),但是無線網(wǎng)絡由于在一個開放的環(huán)境中工作,受多種因素的影響,導致無線網(wǎng)絡流量具有比較強的復雜時變、非線性、強耦合等屬性,為提升無線網(wǎng)絡流量預測精度,需設計合理的無線網(wǎng)絡流量計算方法,因此無線網(wǎng)絡流量預測與建模成為當前一個研究熱點[1-3]。
針對無線網(wǎng)絡流量預測與建模問題,許多學者進行了深入的研究,當前存在許多無線網(wǎng)絡流量預測與建模方法[4-5],最常見的為線性無線網(wǎng)絡流量預測與建模方法,該方法缺陷比較明顯,無線網(wǎng)絡流量預測誤差比較大;而基于神經(jīng)網(wǎng)絡的無線網(wǎng)絡流量預測與建模方法,無線網(wǎng)絡流量預測與建模效果要優(yōu)于線性方法,但是同樣存在一定的缺陷,如對噪聲敏感等[6];極限學習算法屬于一種前饋神經(jīng)網(wǎng)絡,可解決經(jīng)典神經(jīng)網(wǎng)絡存在的效率低問題,具備較快的訓練速度以及較優(yōu)的泛化性能,且該方法的預測精度較高。
為了精準預測無線網(wǎng)絡流量,文章設計了基于大數(shù)據(jù)驅(qū)動的無線網(wǎng)絡流量預測方法。采集無線網(wǎng)絡流量,基于混沌理論重構無線網(wǎng)絡流量數(shù)據(jù),利用粒子群算法對ELM內(nèi)的權值與閾值進行優(yōu)化,建立無線網(wǎng)絡流量預測模型,提升極限學習算法的無線網(wǎng)絡流量預測精度。經(jīng)試驗驗證可知,文章方法預測無線網(wǎng)絡流量時的AIC值呈上升趨勢,MCC值呈下降趨勢,但最高AIC值并未超過設定的閾值,表明無線網(wǎng)絡流量預測精度較高。
采集無線網(wǎng)絡流量數(shù)據(jù)時,因為原始無線網(wǎng)絡流量數(shù)據(jù)受到多種因素影響,具有一定的非線性,直接進行建模與預測,無法獲得高精度無線網(wǎng)絡流量預測結果,所以利用混沌理論對無線網(wǎng)絡流量數(shù)據(jù)進行重構,濾除無線網(wǎng)絡流量數(shù)據(jù)的無線性變化因素,為后續(xù)無線網(wǎng)絡流量預測提供更為精準的學習樣本。設采集無線網(wǎng)絡流量數(shù)據(jù)是x,x的第i個混沌時間序列是{x(i),i=1,2,…,N},其中,x的混沌時間序列數(shù)量是N。根據(jù)Takens定理獲取無線網(wǎng)絡流量數(shù)據(jù)的重構公式,即:
[x(t),x(t+θ),…x(t+(m-1)θ)]
(1)
(2)
式(2)中,在I(θ)達到首個極小值點情況下,對應θ的便是最佳延遲時間。
若m過小,則混沌吸引子僅會形成部分投影,不能全面展開,此時無線網(wǎng)絡流量數(shù)據(jù)樣本點x和x的投影點間產(chǎn)生的點,叫作偽最鄰近點。通過偽最鄰近點比例,確定無線網(wǎng)絡流量數(shù)據(jù)重構時的嵌入維數(shù)m。具體步驟如下:
(3)
(2)偽最鄰近點的確定規(guī)則,公式如下:
(4)
式(4)中,嵌入維數(shù)是m與m+1時,無線網(wǎng)絡流量數(shù)據(jù)樣本點的偽最鄰近點比例是Hm(i,j)、Hm+1(i,j);門限值是H′。
(3)不斷提升m,即令m=m+1,當偽最鄰近點比例降至最低情況下,對應m的便是最佳嵌入維數(shù)。
圖1 ELM的結構拓撲圖
(5)
式(5)中,O2內(nèi)第j′個神經(jīng)元閾值是bj′;激活函數(shù)是φ(·)。
(6)
(7)
(8)
其中,R的Moore-Penrose廣義逆矩陣是R+。
為提升極限學習算法的無線網(wǎng)絡流量預測精度,利用粒子群算法對ELM內(nèi)的w權值與閾值b進行改進及優(yōu)化。大數(shù)據(jù)驅(qū)動無線網(wǎng)絡流量預測模型總體結構如圖3所示。
圖2 大數(shù)據(jù)驅(qū)動無線網(wǎng)絡流量預測模型總體結構
粒子群算法內(nèi)的每個粒子均代表一組極限學習算法的w與b,第a個粒子的初始速度與位置是va、za。va與za的更新公式如下:
(9)
za(s+1)=za(s)+va(s+1)
(10)
(11)
利用粒子群算法優(yōu)化ELM內(nèi)的w權值與閾值b的具體步驟如下:
(2)依據(jù)訓練樣本確定ELM網(wǎng)絡拓撲結構。
(3)初始化粒子群算法的參數(shù),種群內(nèi)各粒子均代表一組w與b,以ELM訓練的均方根誤差為適應度值F,公式如下:
(12)
(4)在ELM內(nèi)輸入無線網(wǎng)絡流量數(shù)據(jù)訓練樣本,按照ELM輸出的無線網(wǎng)絡流量預測結果,計算各粒子的F值。
(6)利用式(11)修正粒子權重。
(9)判斷是否達到smax,若達到smax,則繼續(xù)步驟(10),反之,返回步驟(7)。
(10)輸出最佳的w與b,代入式(5),獲取最佳無線網(wǎng)絡流量預測結果。
(1)對無線網(wǎng)絡流量數(shù)據(jù)進行采集。
(2)采用如下形式對無線網(wǎng)絡流量數(shù)據(jù)進行處理
(13)
式中,x表示原始無線網(wǎng)絡流量數(shù)據(jù),xmin和xmax分別為無線網(wǎng)絡流量數(shù)據(jù)的最小和最大值。
(3)采用混沌理論對無線網(wǎng)絡流量數(shù)據(jù)進行重構,得到無線網(wǎng)絡流量預測的訓練和測試樣本集合。
(4)根據(jù)無線網(wǎng)絡流量數(shù)據(jù)設計極限學習機的結構,并確定相關參數(shù)初始值。
(4)根據(jù)無線網(wǎng)絡流量定訓練樣本,極限學習進行自適應學習,并通過粒子算法搜索最優(yōu)閾值和權值。
(5)根據(jù)最優(yōu)閾值和權值構建無線網(wǎng)絡流量預測模型。
(6)通過測試樣本集合驗證構建的無線網(wǎng)絡流量預測模型性能。
由以上可知,大數(shù)據(jù)驅(qū)動的無線網(wǎng)絡非線性流量預測流程如圖3所示。
圖3 大數(shù)據(jù)驅(qū)動的無線網(wǎng)絡流量預測流程
為了測試大數(shù)據(jù)驅(qū)動的無線網(wǎng)絡流量預測模型有性能,從一個無線網(wǎng)絡網(wǎng)絡系統(tǒng)的服務器中采用每小時的無線網(wǎng)絡流量數(shù)據(jù),其采集到5000個無線網(wǎng)絡流量數(shù)據(jù),具體如圖4所示。
圖4 采集的無線網(wǎng)絡流量數(shù)據(jù)
從圖4可知,無線網(wǎng)絡流量數(shù)據(jù)存在較為嚴重的隨機性變化情況,為此需要對其進行相應的預處理操作。
利用文章方法對采集的無線網(wǎng)絡流量數(shù)據(jù)進行重構,無線網(wǎng)絡流量數(shù)據(jù)重構前,需先確定延遲時間與嵌入維數(shù),提升無線網(wǎng)絡流量數(shù)據(jù)重構精度,延遲時間與嵌入維數(shù)確定結果如圖5所示。
(a)延遲時間確定結果
分析圖5(a)可知,當延遲時間為3時,互信息值首次出現(xiàn)最小值,即將3作為最佳的延遲時間;分析圖5(b)可知,隨著嵌入維數(shù)的提升,偽最鄰近點比例隨之下降,當嵌入維數(shù)為6維時,偽最鄰近點比例不再發(fā)生改變,說明6維是最佳的嵌入維數(shù)。延遲時間與嵌入維數(shù)分別選擇3與6維。
采用傳統(tǒng)極限學習的無線網(wǎng)絡流量預測方法,沒有重構數(shù)據(jù)的粒子群優(yōu)化極限學習機的無線網(wǎng)絡流量預測方法進行對比實驗,進行5次實驗,每一次實驗隨機選擇50%作為訓練樣本,其它作為測試樣本,無線網(wǎng)絡流量平均預測精度如圖6所示。
圖6 三種方法的無線網(wǎng)絡流量預測結果
分析圖6可知,三種方法均可有效預測無線網(wǎng)絡流量值,其中文章方法的無線網(wǎng)絡流量預測結果與實際值非常接近,且變化趨勢基本相同;其余兩種方法的無線網(wǎng)絡流量預測結果與實際值存在較大差距,且變化趨勢也不相同。實驗證明:文章方法可精準預測無線網(wǎng)絡流量,更好地描述無線網(wǎng)絡流量變化情況。
利用赤池信息準則(akashi information criterion,AIC)與馬修斯系數(shù)(matthews correlation coefficient,MCC),衡量文章方法無線網(wǎng)絡流量預測的抗干擾效果,AIC代表無線網(wǎng)絡流量預測結果與實際無線網(wǎng)絡流量間的差距,其值越小,無線網(wǎng)絡流量預測誤差越低,AIC的閾值是65,AIC的取值區(qū)間是[50,100];MCC代表無線網(wǎng)絡流量預測結果與實際無線網(wǎng)絡流量間的相關系數(shù),其值越接近1,說明無線網(wǎng)絡流量預測精度越高,MCC的取值區(qū)間是[-1,1]。在不同噪聲比例時,分析文章方法無線網(wǎng)絡流量預測結果的AIC與MCC值,分析結果如表1所示。分析表1可知,隨著噪聲比例提升,文章方法預測無線網(wǎng)絡流量時的AIC值呈上升趨勢,MCC值呈下降趨勢,但最高AIC值并未超過設定的閾值,說明文章方法預測無線網(wǎng)絡流量時的AIC值較低,即無線網(wǎng)絡流量預測誤差較?。辉诓煌肼暠壤龝r,文章方法預測無線網(wǎng)絡流量時的MCC值均與1較為接近,最低MCC值為0.96,說明文章方法預測無線網(wǎng)絡流量時的MCC值較高,即無線網(wǎng)絡流量預測精度較高,表明文章方法的抗干擾能力強。
表1 文章方法的AIC與MCC值分析結果
無線網(wǎng)絡系統(tǒng)在工作過程,受到許多因素的干擾和影響,無線網(wǎng)絡流量具有一定的混沌性和隨機性,影響無線網(wǎng)絡流量預測精度。為此,設計基于大數(shù)據(jù)驅(qū)動無線網(wǎng)絡流量預測方法,通過改進極限學習算法,建立無線網(wǎng)絡流量預測模型,引入粒子群算法優(yōu)化極限學習算法的連接權值和閾值,解決極限學習算法參數(shù)優(yōu)化問題,在該模型內(nèi)輸入無線網(wǎng)絡流量數(shù)據(jù),輸出無線網(wǎng)絡流量預測結果。實驗結果表明:文章方法可精準預測無線網(wǎng)絡流量。經(jīng)實驗驗證,文章方法對無線網(wǎng)絡流量數(shù)據(jù)進行重構后,可有效去除外界因素對無線網(wǎng)絡流量建模影響,無線網(wǎng)絡流量預測結果與實際無線網(wǎng)絡流量非常接近,且變化趨勢基本相同,而且在噪聲干擾環(huán)境下,文章方法仍然可以獲得較高精度的無線網(wǎng)絡流量預測結果。