龍 霏,余 錚,劉 芬,馮 浩,代蕩蕩
(國網(wǎng)湖北省電力有限公司 信息通信公司,武漢 430077)
隨著互聯(lián)網(wǎng)規(guī)模的不斷擴(kuò)大,各種接入設(shè)備和相關(guān)的數(shù)據(jù)類型也日益繁雜,傳統(tǒng)IP 網(wǎng)絡(luò)的管理方法已經(jīng)無法滿足大量新型應(yīng)用服務(wù)對(duì)設(shè)備快速部署與技術(shù)實(shí)時(shí)更新的需求,同時(shí)網(wǎng)絡(luò)管理者在面對(duì)網(wǎng)絡(luò)資源的合理化配置等任務(wù)時(shí)也遇到了較大的困難,這些問題都極大地增加了新技術(shù)的應(yīng)用成本.軟件定義網(wǎng)絡(luò)SDN(Software Defined Network)技術(shù)改變了傳統(tǒng)IP 網(wǎng)絡(luò)的四層協(xié)議體系,將數(shù)據(jù)傳輸與網(wǎng)絡(luò)控制兩個(gè)主要環(huán)節(jié)相互解耦[1],從而使得用戶可以通過控制層提供的統(tǒng)一且便捷的管理工具,以全局化的視角實(shí)現(xiàn)對(duì)分布式網(wǎng)絡(luò)的集中調(diào)控,并依據(jù)自身需求靈活的配置各類網(wǎng)絡(luò)資源,顯著地提高了大規(guī)模網(wǎng)絡(luò)的運(yùn)維管理水平[2].作為全類型網(wǎng)絡(luò)管理的關(guān)鍵依據(jù),網(wǎng)絡(luò)流量的特征及變化規(guī)律同樣也成為了SDN 技術(shù)研究的熱點(diǎn),因此針對(duì)IP 網(wǎng)絡(luò)流量預(yù)測(cè)技術(shù)進(jìn)行改進(jìn),設(shè)計(jì)一款符合SDN 網(wǎng)絡(luò)流量特征的、精確度高的網(wǎng)絡(luò)流量預(yù)測(cè)模型,以幫助網(wǎng)絡(luò)應(yīng)用開發(fā)人員更準(zhǔn)確地分析SDN 網(wǎng)絡(luò)性能波動(dòng)狀態(tài)和優(yōu)化網(wǎng)絡(luò)資源配置,具有重要的理論意義和應(yīng)用價(jià)值.
目前針對(duì)網(wǎng)絡(luò)流量進(jìn)行預(yù)測(cè)的方法很多,基本可分為兩個(gè)主要類型,第1 類是以時(shí)間序列法為核心,即根據(jù)網(wǎng)絡(luò)流量在歷史時(shí)間序列中的變化規(guī)律預(yù)測(cè)下一個(gè)有限時(shí)間間隔內(nèi)的變化趨勢(shì),如王逸兮等人提出采用同點(diǎn)時(shí)間序列構(gòu)建檢測(cè)模型,提高了網(wǎng)絡(luò)性能異常的檢出率[3],Auld 等人則設(shè)計(jì)了一套網(wǎng)絡(luò)流量信息的規(guī)范化預(yù)處理算法,有效地控制了預(yù)測(cè)模型的計(jì)算規(guī)模[4];葉德忠等人提出構(gòu)建馬爾可夫時(shí)變模型來完成針對(duì)網(wǎng)絡(luò)流量信息挖掘工作,降低了預(yù)測(cè)誤差[5]等.這一類模型對(duì)于傳統(tǒng)IP 網(wǎng)絡(luò)流量的監(jiān)測(cè)效果較好,但對(duì)于具備長相關(guān)性特征的SDN 網(wǎng)絡(luò)數(shù)據(jù)流的預(yù)測(cè)精度則不太理想[6].第2 類方法是以神經(jīng)網(wǎng)絡(luò)等智能算法為核心構(gòu)建網(wǎng)絡(luò)流量預(yù)測(cè)模型,如李曉方等人提出對(duì)源-目的流(OD 流)數(shù)據(jù)進(jìn)行降維,并以Elman 神經(jīng)網(wǎng)絡(luò)對(duì)低維度樣本進(jìn)行訓(xùn)練,從而發(fā)揮了SDN 網(wǎng)絡(luò)可實(shí)現(xiàn)精確測(cè)量數(shù)據(jù)流的優(yōu)勢(shì)[7];NAREJOS 等人提出通過構(gòu)建深層神經(jīng)網(wǎng)絡(luò)的方式提高對(duì)樣本群的訓(xùn)練質(zhì)量,提高了預(yù)測(cè)精度,但算法的空間復(fù)雜度也大幅上升[8].神經(jīng)網(wǎng)絡(luò)存在一些固有的缺陷,如對(duì)訓(xùn)練樣本要求過高,對(duì)待有限的樣本群時(shí),缺乏足夠的泛化能力;網(wǎng)絡(luò)結(jié)構(gòu)無法動(dòng)態(tài)調(diào)整,訓(xùn)練時(shí)間過長;神經(jīng)元規(guī)??煽匦圆?極易陷入“維數(shù)災(zāi)”難題等[9].
支持向量機(jī)(SVM)作為一種基于統(tǒng)計(jì)學(xué)習(xí)理論的人工智能算法,具有良好的泛化能力與非線性處理能力[10],近年來在樣本群分型與模式識(shí)別領(lǐng)域得到廣泛的應(yīng)用.如王鳴提出采用小波技術(shù)結(jié)合SVM 構(gòu)建流量預(yù)測(cè)模型,良好地控制了計(jì)算規(guī)模,提升了預(yù)測(cè)模型的執(zhí)行效率[11].但根據(jù)目前的研究成果來看,與傳統(tǒng)IP 網(wǎng)絡(luò)相比,SDN 網(wǎng)絡(luò)流量的特征呈現(xiàn)出更為突出的混沌性、時(shí)變性和自相似性,這使得SVM 技術(shù)必須在非線性混沌理論的輔助下,方可通過數(shù)學(xué)建模來描述復(fù)雜的網(wǎng)絡(luò)流量變化規(guī)律.因此本文提出采用混沌理論中的多維相空間重構(gòu)技術(shù)對(duì)SDN 網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)建相空間中的樣本矩陣,隨后采用改進(jìn)后的粒子群算法(PSO)對(duì)最小二乘支持向量機(jī)(LSSVM)中的關(guān)鍵參數(shù)進(jìn)行優(yōu)化,有效的提高了LSSVM的運(yùn)算效率,并構(gòu)建針對(duì)網(wǎng)絡(luò)流量變化趨勢(shì)的預(yù)測(cè)模型,對(duì)SDN 網(wǎng)絡(luò)流量樣本群進(jìn)行訓(xùn)練.通過仿真實(shí)驗(yàn)證明,該模型與其他同類模型相比,在合理控制計(jì)算復(fù)雜度的條件下,表現(xiàn)出了更高的預(yù)測(cè)精度和誤差控制能力.
相空間重構(gòu)理論由Takens 等人提出,該理論將多維狀態(tài)空間中任一點(diǎn)的變化規(guī)律視為與之產(chǎn)生關(guān)聯(lián)的其它點(diǎn)變化的綜合影響,因此可構(gòu)建相對(duì)時(shí)間序列.該序列中的任一點(diǎn)在起始時(shí)間點(diǎn)上的值設(shè)為基值,而在空間中其他延遲坐標(biāo)點(diǎn)上的值則作為新維來處理.隨著起始時(shí)間點(diǎn)的推移,不斷構(gòu)建出新的子序列,就可通過監(jiān)測(cè)空間中各個(gè)時(shí)間點(diǎn)變化規(guī)律的方式,完整的構(gòu)建出系統(tǒng)的動(dòng)態(tài)模型[12].
假設(shè)混沌時(shí)間序列為x={x|xi,i=1,2,3,···,N},N為時(shí)間序列長度,采用時(shí)延τ和嵌入維m將其重構(gòu),可得到:
設(shè)系統(tǒng)動(dòng)力學(xué)維數(shù)為d,Takens 同樣證明了若嵌入維m能夠滿足m≥2d+1,則該模型與原系統(tǒng)可視為在拓?fù)湟饬x上等價(jià).雖然Takens 在其證明過程中給出了嵌入維的計(jì)算方法,但其前提是時(shí)間序列無限長,且樣本空間處于無干擾的理想狀態(tài),這顯然與網(wǎng)絡(luò)流量的特征不符[13],因此本文提出采用C-C 方法對(duì)m和τ這兩個(gè)關(guān)鍵參數(shù)進(jìn)行選取,按照以上設(shè)定,可將嵌入序列的關(guān)聯(lián)積分通過式(2)表達(dá):
由此可將檢驗(yàn)統(tǒng)計(jì)量表達(dá)為:
對(duì)上式進(jìn)行分塊平均,可得到:
當(dāng)N→∞時(shí),可將上式簡(jiǎn)化為:
當(dāng)處于時(shí)間序列無限長且各元素之間不相關(guān)的理想條件下時(shí),若m和τ為定值,則對(duì)于?r,均有S2(m,r,τ)=0成立.但對(duì)于網(wǎng)絡(luò)流量的樣本空間而言,其時(shí)間序列長度必然是有限的,且元素之間存在復(fù)雜的關(guān)聯(lián),因此S2(m,r,τ)~τ明顯呈現(xiàn)出了時(shí)延的自相關(guān)性,按照混沌理論求解相空間中最佳時(shí)延 τd的方法,可知:
確定了最佳重構(gòu)時(shí)延τ后,即可逆向推導(dǎo)得到嵌入維m的最佳值,并完成時(shí)間序列在多維相空間中的重構(gòu).
支持向量機(jī)(SVM)具有良好的泛化能力,但對(duì)于一個(gè)新的樣本群進(jìn)行訓(xùn)練時(shí),其計(jì)算復(fù)雜度高成為了一個(gè)很難克服的問題,這就導(dǎo)致了當(dāng)面對(duì)以時(shí)間序列構(gòu)建的大規(guī)模SDN 網(wǎng)絡(luò)流量樣本群時(shí),SVM的執(zhí)行效率會(huì)大幅降低,從而嚴(yán)重地影響了預(yù)測(cè)模型的實(shí)時(shí)性能[14].Este A 等人提出采用最小二乘法對(duì)SVM 進(jìn)行改進(jìn),引入誤差平方和替代SVM中的損失函數(shù),通過非線性映射函數(shù)φ(x)將低維空間中的平面分類問題轉(zhuǎn)化為高維空間的線性方程組求解問題,從而有效地降低了原算法的復(fù)雜度[15].
對(duì)于一個(gè)記錄了輸入量xi和輸出量yi的網(wǎng)絡(luò)流量樣本群D={(xi,yi)|i=1,2,···,n},使用φ(x)構(gòu)建最小二乘支持向量機(jī)(LSSVM)的回歸函數(shù):
式中,w表示高維特征空間采用的權(quán)值向量,b為預(yù)設(shè)的偏置常數(shù).
參照支持向量機(jī)理論,可采用式(9)中列出的回歸模型求解上述回歸函數(shù),有:
該模型使用的正則化方法非常有助于提高模型的泛化能力,γ為正則化參數(shù),ei為輸出量與回歸函數(shù)結(jié)果間的誤差.再引入Lagrange 函數(shù)將式(9)轉(zhuǎn)化更易求解的對(duì)偶空間優(yōu)化模型:
式中,αi∈R為Lagrange 乘子.經(jīng)過多類函數(shù)的對(duì)比分析后,選取RBF 函數(shù)為LSSVM的核函數(shù),設(shè)其函數(shù)寬度為σ,可將其表達(dá)為:
對(duì)式(10)中的L(w,b,η,α)求偏導(dǎo),消除其它待求變量,并引入式(11)核函數(shù),可最終將其簡(jiǎn)化為針對(duì)αi和b的求解函數(shù):
LSSVM 模型的擬合能力主要依賴正則化參數(shù)γ和核函數(shù)寬度值σ的選取質(zhì)量,其中γ影響了模型的擬合精度與泛化能力,σ則直接決定了模型的計(jì)算量與執(zhí)行效率[16,17].目前通常采用的選取方法有網(wǎng)絡(luò)搜索算法和遺傳算法等,前者的計(jì)算規(guī)模龐大,算法實(shí)時(shí)性差,后者則容易陷入局部極值陷阱問題,本文提出采用改進(jìn)粒子群算法實(shí)現(xiàn)對(duì)LSSVM 模型參數(shù)(γ,σ)的組合優(yōu)化,取得了較好的參數(shù)尋優(yōu)質(zhì)量.
粒子群算法(PSO)針對(duì)群體內(nèi)的每個(gè)粒子的位置與速度進(jìn)行跟蹤和調(diào)整,從而實(shí)現(xiàn)對(duì)整個(gè)群體的優(yōu)化效果[18].假設(shè)采用d維向量對(duì)以上兩種狀態(tài)分別進(jìn)行描述,則有zi=(zi1,zi2,···,zid),vi=(vi1,vi2,···,vid),而經(jīng)過調(diào)整后得到該粒子最佳位置記為pi=(pi1,pi2,···,pid),最終整個(gè)群體的最佳位置記為ps=(ps1,ps2,···,psd).在PSO 算法的k輪迭代過程中,對(duì)群體中的每個(gè)粒子均采用式(13)進(jìn)行狀態(tài)參數(shù)的調(diào)整.
式中,ω為慣性權(quán)重,c1和c2為PSO 算法采用的學(xué)習(xí)因子,用以調(diào)節(jié)個(gè)體粒子的變化量對(duì)群體狀態(tài)造成的影響,r1和r2是為了避免算法陷入局部最優(yōu)而設(shè)定的隨機(jī)數(shù).傳統(tǒng)方法設(shè)定ω、c1和c2多是根據(jù)歷史數(shù)據(jù)驗(yàn)算求得,之后定期調(diào)整更新,這導(dǎo)致尋得的參數(shù)往往滯后于網(wǎng)絡(luò)流量的變化現(xiàn)狀,因此本文提出采用自適應(yīng)方法,在算法執(zhí)行過程中,動(dòng)態(tài)的調(diào)整粒子搜索性能,從而提高算法的擬合度,首先ω的計(jì)算方法為:
式中,f為當(dāng)前粒子個(gè)體的適應(yīng)度,fmin和favg分別為整個(gè)群體中適應(yīng)度的最小值和平均值.c1和c2的最佳取值則與迭代次數(shù)k密切相關(guān),并隨著k的增加而分別呈現(xiàn)出遞增和遞減趨勢(shì),因此可采用針對(duì)k的單調(diào)函數(shù)來完成每一輪次c1和c2的動(dòng)態(tài)調(diào)整.
式中,Kmax為設(shè)定的最大迭代次數(shù).在改進(jìn)PSO算法執(zhí)行的每個(gè)輪次,均自適應(yīng)的采用以上方法確定ω、c1和c2,從而可完成對(duì)LSSVM 參數(shù)組合(γ,σ)的尋優(yōu)工作.
對(duì)參數(shù)尋優(yōu)效果進(jìn)行分析,首先,根據(jù)式(13)可以看出,c1和c2兩個(gè)學(xué)習(xí)因子屬于加速參數(shù)類型,決定了個(gè)體粒子分別向個(gè)體最佳位置pi與 群體最佳位置ps的移動(dòng)速度,顯然,過高的c1會(huì)使得粒子個(gè)體快速掠過pi所在區(qū)域,繼而導(dǎo)致粒子適應(yīng)度的大幅波動(dòng),并最終使尋得的參數(shù)偏離最優(yōu)解[19];當(dāng)c1不斷減小時(shí),算法漏掉最佳位置的概率也隨之降低,但與此同時(shí),算法的收斂過程也會(huì)相應(yīng)的延長,導(dǎo)致優(yōu)化效率的下降.c2則相反,由于群體最佳位置ps的相對(duì)固定特征,使得較大的c2會(huì)導(dǎo)致算法在確定粒子移動(dòng)方向時(shí)耗費(fèi)過多資源,而較小的c2又 會(huì)降低粒子抵達(dá)ps區(qū)域的速度,增加算法收斂時(shí)間.改進(jìn)后的算法在引入了動(dòng)態(tài)調(diào)節(jié)機(jī)制之后,c1隨著迭代次數(shù)的增加而減小,確保粒子個(gè)體能夠捕捉到個(gè)體最佳位置,而c2在算法執(zhí)行的初期取較小值,在快速確定了ps的方向后,c2隨迭代次數(shù)不斷增大,有效提高算法的收斂性能.
慣性權(quán)重參數(shù)ω的作用是幫助粒子個(gè)體構(gòu)建全局搜索能力,對(duì)ω進(jìn)行合理的調(diào)節(jié),將有效的影響算法在全局搜索和局部搜索兩方面?zhèn)戎貎A向[20],若式(13)中缺少了第一項(xiàng) ωvid,則算法將只能搜索有限范圍,其結(jié)果往往會(huì)出現(xiàn)局部最優(yōu)問題;若式(13)中去除與c1和c2相關(guān)的后兩項(xiàng),則此時(shí)粒子以初速度v0開始移動(dòng).對(duì)ω的作用進(jìn)行獨(dú)立分析,可分為以下3 種情況:
1)ω=1,此時(shí)粒子將保持初速度,以原方向做勻速移動(dòng);
2)0<ω<1,此時(shí)粒子速度會(huì)從初速度開始,隨著ω的減小而迅速降低至0;
3)ω>1,則粒子的速度不斷增大,直至達(dá)到最大速度vmax.
以上3 種情況均會(huì)對(duì)算法造成極大的干擾,粒子個(gè)體將會(huì)出現(xiàn)加速度恒定和移動(dòng)方向固定等問題,因此當(dāng)失去了加速參數(shù)c1和c2帶來的調(diào)節(jié)效果后,單純依賴慣性權(quán)重ω是無法實(shí)現(xiàn)對(duì)參數(shù)的可靠尋優(yōu)的.若單獨(dú)保留c1項(xiàng),則算法過程等價(jià)于多個(gè)粒子個(gè)體的獨(dú)立搜索,參數(shù)尋優(yōu)性能將大幅度下降;若單獨(dú)保留c2項(xiàng),則算法僅具備群體搜索模式,雖然可開辟新的解空間,但對(duì)復(fù)雜度稍高的問題,算法很容易收斂于局部極值,從而造成較大的偏差.針對(duì)以上分析,本文提出在ω的設(shè)定范圍內(nèi),采用自適應(yīng)算法實(shí)現(xiàn)對(duì)ω的動(dòng)態(tài)調(diào)節(jié)目標(biāo),既在算法執(zhí)行的初期有效地促進(jìn)了全局搜索能力,提高了收斂速度,又在后期保障了局部搜索性能,改善了算法收斂精度,對(duì)于LSSVM 關(guān)鍵參數(shù)γ,σ的尋優(yōu)工作起到了顯著的改進(jìn)效果.
在引入了改進(jìn)PSO 算法之后,采用實(shí)數(shù)編碼將(γ,σ)組成一個(gè)粒子,隨后結(jié)合式(9)至式(12)的推導(dǎo)過程,構(gòu)建出優(yōu)化后的預(yù)測(cè)模型,如式(16)所示:
適應(yīng)度函數(shù)取預(yù)測(cè)值與真實(shí)值之間的誤差總和,即:
其中,yi為當(dāng)前樣本預(yù)測(cè)值,而為對(duì)應(yīng)樣本的真實(shí)值.算法流程如圖1所示.
圖1 預(yù)測(cè)算法執(zhí)行流程
對(duì)算法各主要環(huán)節(jié)描述如下:
Step 1.采集SDN 網(wǎng)絡(luò)流量歷史數(shù)據(jù),構(gòu)建時(shí)間序列的樣本群,并采用C-C 算法獲取最佳的嵌入維和重構(gòu)時(shí)延,在此基礎(chǔ)上完成對(duì)原樣本群的相空間重構(gòu),得到規(guī)范化的數(shù)據(jù)序列;
Step 2.對(duì)PSO 算法執(zhí)行初始化操作,確定樣本群規(guī)模、迭代輪次數(shù)、粒子初始狀態(tài)(位置zi、速度vi)、個(gè)體最佳位置pi、群體最佳位置pg以及ω、c1和c2等關(guān)鍵參數(shù)的初值,完成參數(shù)尋優(yōu)的準(zhǔn)備工作;
Step 3.將(γ,σ)參數(shù)組成粒子個(gè)體,并采用隨機(jī)取值法構(gòu)建初代粒子群體;
Step 4.根據(jù)式(17)計(jì)算群體中粒子個(gè)體的適應(yīng)度,調(diào)整本輪次中ω、c1和c2的取值,根據(jù)式(13)更新個(gè)體粒子的zi與vi,產(chǎn)生本輪次的粒子群體,并計(jì)算出新群體的pi和pg;
Step 5.依據(jù)適應(yīng)度值判斷參數(shù)尋優(yōu)目標(biāo)是否完成,若達(dá)要求則將本輪次尋得的最優(yōu)粒子取出,按照實(shí)數(shù)編碼規(guī)則解析出對(duì)應(yīng)的(γ,σ)作為LSSVM的優(yōu)化參數(shù),否則返回Step 4,進(jìn)入下一輪次的迭代訓(xùn)練;
Step 6.利用求得的參數(shù)和重構(gòu)的訓(xùn)練樣本對(duì)LSSVM進(jìn)行求解,構(gòu)建網(wǎng)絡(luò)流量預(yù)測(cè)模型,并使用驗(yàn)證樣本群進(jìn)行對(duì)照分析,輸出最終的預(yù)測(cè)結(jié)果.
在數(shù)據(jù)樣本的選擇上,采用在美國Abilene 網(wǎng)絡(luò)上采集到的真實(shí)數(shù)據(jù)展開仿真實(shí)驗(yàn)分析.該數(shù)據(jù)集匯聚了一個(gè)包括30 條鏈路在內(nèi)的SDN-IP 混合網(wǎng)絡(luò)中的流量信息,其中SDN-OD 流46 條,IP-OD 流為108 條,數(shù)據(jù)采樣周期為5 min,選擇其中1000 條流量數(shù)據(jù),前800 條數(shù)據(jù)作為訓(xùn)練樣本群,后200 條作為驗(yàn)證樣本群,其中部分樣本信息如圖2所示.
圖2 實(shí)驗(yàn)流量數(shù)據(jù)樣本
本次仿真實(shí)驗(yàn)共分為兩組,分別為1 步預(yù)測(cè)仿真和3 步預(yù)測(cè)仿真.首先對(duì)樣本群進(jìn)行相空間重構(gòu),采用CC 法對(duì)流量樣本進(jìn)行處理,求得最優(yōu)的重構(gòu)時(shí)延τ=2,嵌入維m=10,完成重構(gòu)后將前800 條樣本輸入LSSVM訓(xùn)練,并采用改進(jìn)PSO 算法進(jìn)行參數(shù)尋優(yōu).得到最優(yōu)參數(shù)為:γ=102.83,σ=1.35,最終構(gòu)建針對(duì)SDN 網(wǎng)絡(luò)流量的預(yù)測(cè)模型.在經(jīng)過前800 條樣本的訓(xùn)練后,對(duì)后200 條驗(yàn)證樣本進(jìn)行預(yù)測(cè)對(duì)比,其中1 步預(yù)測(cè)實(shí)驗(yàn)結(jié)果如圖3所示.
觀察圖3(a)中預(yù)測(cè)結(jié)果跟蹤曲線可以發(fā)現(xiàn),在1 步預(yù)測(cè)仿真實(shí)驗(yàn)中,基于改進(jìn)PSO-LSSVM的預(yù)測(cè)模型表現(xiàn)出了良好的預(yù)測(cè)精度,各預(yù)測(cè)值與真實(shí)值擬合程度高,預(yù)測(cè)結(jié)果跟蹤曲線與真實(shí)流量變化曲線基本重合,證明該模型很好地模擬了SDN 網(wǎng)絡(luò)流量所具備的周期性和非線性變化特征,具有可靠的泛化性能;從圖3(b)中可以看出,預(yù)測(cè)結(jié)果的偏差十分穩(wěn)定,且均在狹小范圍內(nèi)波動(dòng).在200 次的預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)的比對(duì)中,167 次預(yù)測(cè)結(jié)果的相對(duì)誤差小于6 MB,其中更有94 次相對(duì)誤差小于2 MB,而誤差超過8 MB 僅有9 次,且所有預(yù)測(cè)誤差均在10 MB 以內(nèi),預(yù)測(cè)結(jié)果表現(xiàn)出了良好的精確性和穩(wěn)定性.
圖3 SDN 網(wǎng)絡(luò)流量1 步預(yù)測(cè)實(shí)驗(yàn)結(jié)果
網(wǎng)絡(luò)流量預(yù)測(cè)模型需要真實(shí)反映網(wǎng)絡(luò)流量變化規(guī)律,其預(yù)測(cè)精度越高、提前量越大,模型應(yīng)用價(jià)值就越高.1 步預(yù)測(cè)僅能對(duì)時(shí)間序列中下一個(gè)臨近點(diǎn)的流量進(jìn)行預(yù)測(cè),并不能客觀的驗(yàn)證模型的預(yù)測(cè)性能[21],為了進(jìn)一步考察本模型在網(wǎng)絡(luò)流量多步預(yù)測(cè)方面的表現(xiàn),設(shè)計(jì)了3 步預(yù)測(cè)仿真實(shí)驗(yàn),其結(jié)果如圖4所示.
觀察圖4(a)可以發(fā)現(xiàn),在增加了預(yù)測(cè)提前量之后,模型對(duì)SDN 網(wǎng)絡(luò)流量變化的擬合性能有了一定程度的下降,且圖4(b)中的預(yù)測(cè)偏差也有所增大,但預(yù)測(cè)質(zhì)量整體上仍處于良好水平,其中154 次預(yù)測(cè)相對(duì)誤差在20 MB以內(nèi),僅有4 次超過40 MB,其中1 次達(dá)到了最高的50.13 MB.從整體來看,誤差波動(dòng)范圍穩(wěn)定,基本控制在10%以內(nèi),預(yù)測(cè)曲線與實(shí)際流量曲線的波動(dòng)方向吻合,能夠在實(shí)際應(yīng)用過程中對(duì)網(wǎng)絡(luò)流量監(jiān)控工作提供可靠的參考.
圖4 SDN 網(wǎng)絡(luò)流量3 步預(yù)測(cè)實(shí)驗(yàn)結(jié)果
為了對(duì)比分析預(yù)測(cè)模型的運(yùn)行質(zhì)量,同時(shí)選取了BP 神經(jīng)網(wǎng)絡(luò)(BPNN)、自回歸滑動(dòng)平均(ARIMA)和基于遺傳算法的最小二乘支持向量機(jī)(GA-LSSVM)三種預(yù)測(cè)模型參與實(shí)驗(yàn),并選取相對(duì)平均誤差(MPAE)和均方根誤差(RMSE)兩種指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),其計(jì)算公式分別為:
使用以上3 種網(wǎng)絡(luò)流量預(yù)測(cè)模型對(duì)同組樣本進(jìn)行預(yù)測(cè),并將統(tǒng)計(jì)結(jié)果與本文提出的改進(jìn)PSO-LSSVM模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,其統(tǒng)計(jì)結(jié)果如表1所示.
表1 多模型預(yù)測(cè)結(jié)果統(tǒng)計(jì)信息
對(duì)比4 種模型對(duì)SDN 網(wǎng)絡(luò)流量的預(yù)測(cè)統(tǒng)計(jì)數(shù)據(jù)可以看出,相較于BPNN 模型和ARIME 模型,改進(jìn)后的PSO-LSSVM 模型在1 步與3 步預(yù)測(cè)仿真實(shí)驗(yàn)中表現(xiàn)出明顯優(yōu)勢(shì),其預(yù)測(cè)結(jié)果的擬合精度和誤差控制水平均大幅領(lǐng)先,這也證明了基于最小二乘向量機(jī)LSSVM技術(shù)構(gòu)建的預(yù)測(cè)模型具有更好的泛化性能,尤其適合針對(duì)大規(guī)模樣本群體的分析與處理場(chǎng)合;而與采用了同類型技術(shù)的GA-LSSVM 模型相比,本模型1 步預(yù)測(cè)的質(zhì)量依舊明顯領(lǐng)先于前者,這說明改進(jìn)后的PSO 算法對(duì)慣性權(quán)重和學(xué)習(xí)因子實(shí)施自適應(yīng)動(dòng)態(tài)調(diào)節(jié)后,顯著地提高了粒子的全局搜索能力,更有效的避免了局部極值問題,從而獲得了比遺傳算法更加突出的參數(shù)尋優(yōu)效果.在3 步預(yù)測(cè)仿真實(shí)驗(yàn)中,本模型表現(xiàn)出的優(yōu)勢(shì)雖有所減少,但仍要優(yōu)于GA-LSSVM 模型,這表明隨著預(yù)測(cè)步數(shù)(即預(yù)測(cè)提前量)的增加,SDN 網(wǎng)絡(luò)流量的非線性和時(shí)變特征對(duì)模型構(gòu)成的干擾效應(yīng)會(huì)持續(xù)放大,從而導(dǎo)致所有模型的預(yù)測(cè)質(zhì)量均會(huì)下降,彼此之間的表現(xiàn)差異也會(huì)相對(duì)縮小,這一規(guī)律在其余兩種模型的預(yù)測(cè)結(jié)果中也得到了充分的體現(xiàn).
本文針對(duì)SDN 網(wǎng)絡(luò)流量預(yù)測(cè)問題展開研究,首先提出對(duì)SDN 網(wǎng)絡(luò)流量時(shí)間序列進(jìn)行混沌處理,實(shí)現(xiàn)在多維相空間中的重構(gòu),減少了網(wǎng)絡(luò)流量的復(fù)雜性特征對(duì)預(yù)測(cè)模型造成的負(fù)面影響;隨后采用自適應(yīng)方法對(duì)PSO 算法中的慣性權(quán)重及學(xué)習(xí)因子進(jìn)行動(dòng)態(tài)調(diào)整,顯著改善了該算法的參數(shù)尋優(yōu)能力,并將其引入到LSSVM中,最終構(gòu)建出SDN 網(wǎng)絡(luò)流量預(yù)測(cè)模型.通過仿真實(shí)驗(yàn)證明,該模型與其他3 種經(jīng)典預(yù)測(cè)模型相比,在預(yù)測(cè)精度和誤差控制等方面具有明顯的優(yōu)勢(shì),應(yīng)用前景十分廣泛.