陳 晶
(江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院 江蘇常州 213147)
隨著無(wú)線通技術(shù)的不斷發(fā)展和成熟,無(wú)線網(wǎng)絡(luò)得到了長(zhǎng)足發(fā)展,并在許多領(lǐng)域得到了成功的應(yīng)用。相對(duì)于有線網(wǎng)絡(luò),無(wú)線網(wǎng)絡(luò)具有一定的優(yōu)點(diǎn),如可以隨時(shí)隨地進(jìn)行上網(wǎng),但是無(wú)線網(wǎng)絡(luò)由于在一個(gè)開(kāi)放的環(huán)境中工作,受多種因素的影響,導(dǎo)致無(wú)線網(wǎng)絡(luò)流量具有比較強(qiáng)的復(fù)雜時(shí)變、非線性、強(qiáng)耦合等屬性,為提升無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度,需設(shè)計(jì)合理的無(wú)線網(wǎng)絡(luò)流量計(jì)算方法,因此無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模成為當(dāng)前一個(gè)研究熱點(diǎn)[1-3]。
針對(duì)無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模問(wèn)題,許多學(xué)者進(jìn)行了深入的研究,當(dāng)前存在許多無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模方法[4-5],最常見(jiàn)的為線性無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模方法,該方法缺陷比較明顯,無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)誤差比較大;而基于神經(jīng)網(wǎng)絡(luò)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模方法,無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)與建模效果要優(yōu)于線性方法,但是同樣存在一定的缺陷,如對(duì)噪聲敏感等[6];極限學(xué)習(xí)算法屬于一種前饋神經(jīng)網(wǎng)絡(luò),可解決經(jīng)典神經(jīng)網(wǎng)絡(luò)存在的效率低問(wèn)題,具備較快的訓(xùn)練速度以及較優(yōu)的泛化性能,且該方法的預(yù)測(cè)精度較高。
為了精準(zhǔn)預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量,文章設(shè)計(jì)了基于大數(shù)據(jù)驅(qū)動(dòng)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法。采集無(wú)線網(wǎng)絡(luò)流量,基于混沌理論重構(gòu)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù),利用粒子群算法對(duì)ELM內(nèi)的權(quán)值與閾值進(jìn)行優(yōu)化,建立無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型,提升極限學(xué)習(xí)算法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度。經(jīng)試驗(yàn)驗(yàn)證可知,文章方法預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量時(shí)的AIC值呈上升趨勢(shì),MCC值呈下降趨勢(shì),但最高AIC值并未超過(guò)設(shè)定的閾值,表明無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度較高。
采集無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)時(shí),因?yàn)樵紵o(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)受到多種因素影響,具有一定的非線性,直接進(jìn)行建模與預(yù)測(cè),無(wú)法獲得高精度無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果,所以利用混沌理論對(duì)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),濾除無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)的無(wú)線性變化因素,為后續(xù)無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)提供更為精準(zhǔn)的學(xué)習(xí)樣本。設(shè)采集無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)是x,x的第i個(gè)混沌時(shí)間序列是{x(i),i=1,2,…,N},其中,x的混沌時(shí)間序列數(shù)量是N。根據(jù)Takens定理獲取無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)的重構(gòu)公式,即:
[x(t),x(t+θ),…x(t+(m-1)θ)]
(1)
(2)
式(2)中,在I(θ)達(dá)到首個(gè)極小值點(diǎn)情況下,對(duì)應(yīng)θ的便是最佳延遲時(shí)間。
若m過(guò)小,則混沌吸引子僅會(huì)形成部分投影,不能全面展開(kāi),此時(shí)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)樣本點(diǎn)x和x的投影點(diǎn)間產(chǎn)生的點(diǎn),叫作偽最鄰近點(diǎn)。通過(guò)偽最鄰近點(diǎn)比例,確定無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)時(shí)的嵌入維數(shù)m。具體步驟如下:
(3)
(2)偽最鄰近點(diǎn)的確定規(guī)則,公式如下:
(4)
式(4)中,嵌入維數(shù)是m與m+1時(shí),無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)樣本點(diǎn)的偽最鄰近點(diǎn)比例是Hm(i,j)、Hm+1(i,j);門(mén)限值是H′。
(3)不斷提升m,即令m=m+1,當(dāng)偽最鄰近點(diǎn)比例降至最低情況下,對(duì)應(yīng)m的便是最佳嵌入維數(shù)。
圖1 ELM的結(jié)構(gòu)拓?fù)鋱D
(5)
式(5)中,O2內(nèi)第j′個(gè)神經(jīng)元閾值是bj′;激活函數(shù)是φ(·)。
(6)
(7)
(8)
其中,R的Moore-Penrose廣義逆矩陣是R+。
為提升極限學(xué)習(xí)算法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度,利用粒子群算法對(duì)ELM內(nèi)的w權(quán)值與閾值b進(jìn)行改進(jìn)及優(yōu)化。大數(shù)據(jù)驅(qū)動(dòng)無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型總體結(jié)構(gòu)如圖3所示。
圖2 大數(shù)據(jù)驅(qū)動(dòng)無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型總體結(jié)構(gòu)
粒子群算法內(nèi)的每個(gè)粒子均代表一組極限學(xué)習(xí)算法的w與b,第a個(gè)粒子的初始速度與位置是va、za。va與za的更新公式如下:
(9)
za(s+1)=za(s)+va(s+1)
(10)
(11)
利用粒子群算法優(yōu)化ELM內(nèi)的w權(quán)值與閾值b的具體步驟如下:
(2)依據(jù)訓(xùn)練樣本確定ELM網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
(3)初始化粒子群算法的參數(shù),種群內(nèi)各粒子均代表一組w與b,以ELM訓(xùn)練的均方根誤差為適應(yīng)度值F,公式如下:
(12)
(4)在ELM內(nèi)輸入無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)訓(xùn)練樣本,按照ELM輸出的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果,計(jì)算各粒子的F值。
(6)利用式(11)修正粒子權(quán)重。
(9)判斷是否達(dá)到smax,若達(dá)到smax,則繼續(xù)步驟(10),反之,返回步驟(7)。
(10)輸出最佳的w與b,代入式(5),獲取最佳無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果。
(1)對(duì)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行采集。
(2)采用如下形式對(duì)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行處理
(13)
式中,x表示原始無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù),xmin和xmax分別為無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)的最小和最大值。
(3)采用混沌理論對(duì)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),得到無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)的訓(xùn)練和測(cè)試樣本集合。
(4)根據(jù)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)設(shè)計(jì)極限學(xué)習(xí)機(jī)的結(jié)構(gòu),并確定相關(guān)參數(shù)初始值。
(4)根據(jù)無(wú)線網(wǎng)絡(luò)流量定訓(xùn)練樣本,極限學(xué)習(xí)進(jìn)行自適應(yīng)學(xué)習(xí),并通過(guò)粒子算法搜索最優(yōu)閾值和權(quán)值。
(5)根據(jù)最優(yōu)閾值和權(quán)值構(gòu)建無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型。
(6)通過(guò)測(cè)試樣本集合驗(yàn)證構(gòu)建的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型性能。
由以上可知,大數(shù)據(jù)驅(qū)動(dòng)的無(wú)線網(wǎng)絡(luò)非線性流量預(yù)測(cè)流程如圖3所示。
圖3 大數(shù)據(jù)驅(qū)動(dòng)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)流程
為了測(cè)試大數(shù)據(jù)驅(qū)動(dòng)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型有性能,從一個(gè)無(wú)線網(wǎng)絡(luò)網(wǎng)絡(luò)系統(tǒng)的服務(wù)器中采用每小時(shí)的無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù),其采集到5000個(gè)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù),具體如圖4所示。
圖4 采集的無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)
從圖4可知,無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)存在較為嚴(yán)重的隨機(jī)性變化情況,為此需要對(duì)其進(jìn)行相應(yīng)的預(yù)處理操作。
利用文章方法對(duì)采集的無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu),無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)前,需先確定延遲時(shí)間與嵌入維數(shù),提升無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)重構(gòu)精度,延遲時(shí)間與嵌入維數(shù)確定結(jié)果如圖5所示。
(a)延遲時(shí)間確定結(jié)果
分析圖5(a)可知,當(dāng)延遲時(shí)間為3時(shí),互信息值首次出現(xiàn)最小值,即將3作為最佳的延遲時(shí)間;分析圖5(b)可知,隨著嵌入維數(shù)的提升,偽最鄰近點(diǎn)比例隨之下降,當(dāng)嵌入維數(shù)為6維時(shí),偽最鄰近點(diǎn)比例不再發(fā)生改變,說(shuō)明6維是最佳的嵌入維數(shù)。延遲時(shí)間與嵌入維數(shù)分別選擇3與6維。
采用傳統(tǒng)極限學(xué)習(xí)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,沒(méi)有重構(gòu)數(shù)據(jù)的粒子群優(yōu)化極限學(xué)習(xí)機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法進(jìn)行對(duì)比實(shí)驗(yàn),進(jìn)行5次實(shí)驗(yàn),每一次實(shí)驗(yàn)隨機(jī)選擇50%作為訓(xùn)練樣本,其它作為測(cè)試樣本,無(wú)線網(wǎng)絡(luò)流量平均預(yù)測(cè)精度如圖6所示。
圖6 三種方法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果
分析圖6可知,三種方法均可有效預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量值,其中文章方法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果與實(shí)際值非常接近,且變化趨勢(shì)基本相同;其余兩種方法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果與實(shí)際值存在較大差距,且變化趨勢(shì)也不相同。實(shí)驗(yàn)證明:文章方法可精準(zhǔn)預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量,更好地描述無(wú)線網(wǎng)絡(luò)流量變化情況。
利用赤池信息準(zhǔn)則(akashi information criterion,AIC)與馬修斯系數(shù)(matthews correlation coefficient,MCC),衡量文章方法無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)的抗干擾效果,AIC代表無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果與實(shí)際無(wú)線網(wǎng)絡(luò)流量間的差距,其值越小,無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)誤差越低,AIC的閾值是65,AIC的取值區(qū)間是[50,100];MCC代表無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果與實(shí)際無(wú)線網(wǎng)絡(luò)流量間的相關(guān)系數(shù),其值越接近1,說(shuō)明無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度越高,MCC的取值區(qū)間是[-1,1]。在不同噪聲比例時(shí),分析文章方法無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果的AIC與MCC值,分析結(jié)果如表1所示。分析表1可知,隨著噪聲比例提升,文章方法預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量時(shí)的AIC值呈上升趨勢(shì),MCC值呈下降趨勢(shì),但最高AIC值并未超過(guò)設(shè)定的閾值,說(shuō)明文章方法預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量時(shí)的AIC值較低,即無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)誤差較??;在不同噪聲比例時(shí),文章方法預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量時(shí)的MCC值均與1較為接近,最低MCC值為0.96,說(shuō)明文章方法預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量時(shí)的MCC值較高,即無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度較高,表明文章方法的抗干擾能力強(qiáng)。
表1 文章方法的AIC與MCC值分析結(jié)果
無(wú)線網(wǎng)絡(luò)系統(tǒng)在工作過(guò)程,受到許多因素的干擾和影響,無(wú)線網(wǎng)絡(luò)流量具有一定的混沌性和隨機(jī)性,影響無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度。為此,設(shè)計(jì)基于大數(shù)據(jù)驅(qū)動(dòng)無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,通過(guò)改進(jìn)極限學(xué)習(xí)算法,建立無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)模型,引入粒子群算法優(yōu)化極限學(xué)習(xí)算法的連接權(quán)值和閾值,解決極限學(xué)習(xí)算法參數(shù)優(yōu)化問(wèn)題,在該模型內(nèi)輸入無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù),輸出無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明:文章方法可精準(zhǔn)預(yù)測(cè)無(wú)線網(wǎng)絡(luò)流量。經(jīng)實(shí)驗(yàn)驗(yàn)證,文章方法對(duì)無(wú)線網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行重構(gòu)后,可有效去除外界因素對(duì)無(wú)線網(wǎng)絡(luò)流量建模影響,無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果與實(shí)際無(wú)線網(wǎng)絡(luò)流量非常接近,且變化趨勢(shì)基本相同,而且在噪聲干擾環(huán)境下,文章方法仍然可以獲得較高精度的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)結(jié)果。
九江學(xué)院學(xué)報(bào)(自然科學(xué)版)2023年1期