范 敏
(杭州職業(yè)技術(shù)學(xué)院,浙江杭州310018)
隨著視頻業(yè)務(wù)蓬勃發(fā)展,視頻已經(jīng)成為網(wǎng)絡(luò)中的主要流量,VBR(Variable Bit Rate)作為網(wǎng)絡(luò)視頻通信的主要方式,對(duì)其建立準(zhǔn)確的預(yù)測(cè)模型,有利于設(shè)計(jì)緩沖區(qū)、合理分配帶寬,防止網(wǎng)絡(luò)擁塞產(chǎn)生,從而為用戶提供可靠的QoS(Quality of Service)保障,因此,VBR視頻流量建模和預(yù)測(cè)成為當(dāng)前研究的重要課題[1]。
針對(duì)VBR視頻流量預(yù)測(cè)問題,國(guó)內(nèi)外學(xué)者對(duì)其進(jìn)行了大量的研究,提出一些預(yù)測(cè)模型[2]。傳統(tǒng)預(yù)測(cè)模型主要基于時(shí)間序列分析,并基于線性建模,然而由于VBR視頻流量受到多種因素影響,具有非線性、突變性等變化特點(diǎn),難以建立精確的數(shù)學(xué)模型,因此時(shí)間序列預(yù)測(cè)模型的預(yù)測(cè)誤差較大,在實(shí)際應(yīng)用中存在著很大的局限性[3]。大量研究表明,VBR視頻流量具有混沌特性,因此近年來出現(xiàn)了基于混沌理論的人工智能VBR視頻流量預(yù)測(cè),首先對(duì)VBR視頻流量數(shù)據(jù)進(jìn)行相空間重構(gòu),然后采用神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),建立VBR視頻流量預(yù)測(cè)模型,獲得較高的預(yù)測(cè)精度[4-5]。神經(jīng)網(wǎng)絡(luò)是一種基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則的機(jī)器學(xué)習(xí)算法,要求樣本數(shù)量大,且存在一些自身難以克服的缺陷,如:網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,收斂速度慢,易陷入局部極小,對(duì)VBR視頻流量預(yù)測(cè)結(jié)果產(chǎn)生不利影響[6]。支持向量機(jī)(Support Vector Machine,SVM)是一種針對(duì)小樣本、高維數(shù)的機(jī)器學(xué)習(xí)方法,泛化性能優(yōu)異,解決了神經(jīng)網(wǎng)絡(luò)存在的缺陷,被公認(rèn)為是較好的替代神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)方法[7]。然而VBR視頻流量具有多尺度特性,SVM僅在一個(gè)尺度上對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)測(cè),對(duì)VBR視頻流量數(shù)據(jù)的逼近性能并不能令人滿意[8]。
由于VBR視頻流量具有時(shí)變、非線性和突發(fā)性等特征,單一的模型已經(jīng)不適合預(yù)測(cè)這種復(fù)雜流量,小波核函數(shù)具有多尺度學(xué)習(xí)性能,可以描述多分形的VBR視頻流量特性,為此,采用小波核函數(shù)來構(gòu)造SVM的核函數(shù),利用小波分析和SVM的優(yōu)點(diǎn),建立一種基于小波支持向量機(jī)的VBR視頻流量預(yù)測(cè)模型(WSVM),并通過仿真實(shí)驗(yàn)測(cè)試WSVM模型的預(yù)測(cè)性能。
對(duì)于 VBR 視頻流量時(shí)間序列:x(t),t=1,2,…,N,通過選擇合適的嵌入維(m)和延遲時(shí)間(τ)就可對(duì)其進(jìn)行重構(gòu),產(chǎn)生一個(gè)多維的VBR視頻流量時(shí)間序列
式中,M=N-(m-1)τ。
設(shè)含有n個(gè)樣本的VBR視頻流量訓(xùn)練集:{(xi,di),i=1,2,…,n},xi∈ Rd是第 i個(gè)訓(xùn)練樣本的輸入列向量,xi=[x1i,x2i,…,xdi]T,di∈R為相應(yīng)的輸出值,SVM通過利用非線性映射函數(shù)φ(x)將輸入數(shù)據(jù)映射到線性空間中進(jìn)行線性估計(jì)
式中:ω 為權(quán)值,b為偏置項(xiàng)[9]。
通過對(duì)式(2)進(jìn)行最小化估計(jì),得到ω和b的值
式中:yi為SVM的輸出;ε為不敏感損失函數(shù)。
通過引入松弛變量,找到ω和b的值
式中,ξi為松弛變量。
引入Lagrange乘子,式(3)的決策函數(shù)變?yōu)?/p>
式中:k(xi,x)為核函數(shù);ai和a*i為L(zhǎng)agrange乘子。
小波分析是由一個(gè)母小波函數(shù)φ(x)通過平移和伸縮變換產(chǎn)生一系列小波函數(shù)的疊加。
式中:α是伸縮因子;b是平移因子[10]。
設(shè)母小波函數(shù)為ψ(x),那么滿足平移不變核定理的小波核函數(shù)為
對(duì)于VBR視頻流量預(yù)測(cè)問題,采用Morlet小波,即
因此,可以得到相應(yīng)的小波核函數(shù)
綜合上述可知,VBR視頻流量預(yù)測(cè)的WSVM回歸函數(shù)為
WSVM的VBR視頻流量預(yù)測(cè)模型結(jié)構(gòu)見圖1,WSVM的結(jié)構(gòu)具體為:1)第1層為VBR視頻流量輸入數(shù)據(jù){x1,x2,…,xn},通過為m和τ重構(gòu)而成的訓(xùn)練集;2)第2層為輸入數(shù)據(jù)向量和SVM核函數(shù)計(jì)算;3)第3層為WSVM的輸出結(jié)果。
圖1 VBR視頻流量的WSVM結(jié)構(gòu)
1)收集VBR視頻流量數(shù)據(jù),進(jìn)行預(yù)處理,并劃分為訓(xùn)練集和測(cè)試集兩部分。
2)根據(jù)互信息法和虛假最近臨點(diǎn)算法計(jì)算VBR視頻流量數(shù)據(jù)的m和τ。
3)采用m和τ對(duì)VBR視頻流量的訓(xùn)練集和測(cè)試集進(jìn)行相空間重構(gòu)。
4)初始化WSVM參數(shù),主要包括Lagrange乘子ai和、伸縮和平移因子α,b的初始值。
5)將訓(xùn)練集輸入到SVM建立式(4)的VBR視頻流量預(yù)測(cè)目標(biāo)函數(shù),然后采用SMO(Sequential Minimal Optimization)算法對(duì)其進(jìn)行求解,得到最優(yōu)的ai和a*i,b值。
6)將ai和a*i,b值代入式(10),建立VBR視頻流量預(yù)測(cè)模型,然后采用測(cè)試集對(duì)模型性能進(jìn)行檢驗(yàn)。
7)計(jì)算測(cè)試集的預(yù)測(cè)誤差,如果誤差滿足預(yù)先設(shè)定的閾值,則表示建立了最優(yōu)VBR視頻流量預(yù)測(cè)模型,否則返回步驟5)繼續(xù)學(xué)習(xí),找到更優(yōu)的ai和a*i,b值。
8)采用建立的最優(yōu)VBR視頻流量預(yù)測(cè)模型對(duì)未來某一時(shí)刻的視頻流量進(jìn)行預(yù)測(cè)。WSVM的VBR視頻流量預(yù)測(cè)模型工作流程見圖2。
圖2 VBR視頻流量預(yù)測(cè)模型的工作流程
采用Berlin大學(xué)的MPEG-4視頻跡(trace)數(shù)據(jù)庫(kù)的“Silence of lambs”,幀速率為 30 f/s(幀/秒),連續(xù)采集280幀數(shù)據(jù),前200數(shù)據(jù)作為訓(xùn)練集,最后80個(gè)數(shù)據(jù)作為測(cè)試集,數(shù)據(jù)見圖3。在AMD 3.0 GHz CPU、2Gbyte RAM、Windows XP的平臺(tái)上,采用MATLAB 2010a編寫程序?qū)崿F(xiàn)仿真實(shí)驗(yàn)。
圖3 VBR視頻流量數(shù)據(jù)
為了使WSVM的仿真結(jié)果具有可比性,采用徑向基核函數(shù)支持向量機(jī)(RBF-SVM)、小波神經(jīng)網(wǎng)絡(luò)(WBPNN)作為對(duì)比模型,并采用平均相對(duì)誤差(MAPE)和均方根誤差(RMSE)以及訓(xùn)練時(shí)間作為模型性能的評(píng)價(jià)指標(biāo)。MAPE,RMSE分別定義如下
式中:yi和yi分別為VBR視頻流量的實(shí)際值和預(yù)測(cè)值;n為測(cè)試集的樣本數(shù)。
WSVM對(duì)區(qū)間[0,1]的數(shù)據(jù)最為靈敏,為了提高WSVM的訓(xùn)練效率,對(duì)重構(gòu)后的訓(xùn)練集進(jìn)行歸一化處理,具體為
式中:x和x'分別表示原始數(shù)據(jù)和歸一化后的數(shù)據(jù);xmin和xmax分別表示最小值和最大值。
采用互信息法計(jì)算VBR視頻流量的τ,得到τ=1,用虛假最近鄰點(diǎn)法計(jì)算最優(yōu)m,得到m=5,然后根據(jù)τ=1,m=5對(duì)VBR視頻流量數(shù)據(jù)訓(xùn)練樣本集和測(cè)試樣本集進(jìn)行重構(gòu),得到多維的VBR視頻流量時(shí)間序列。
將重構(gòu)后的VBR視頻流量訓(xùn)練集分別輸入到WSVM,RBF-SVM,WBPNN進(jìn)行學(xué)習(xí),建立相應(yīng)的VBR視頻流量預(yù)測(cè)模型,然后對(duì)訓(xùn)練集進(jìn)行擬合,擬合結(jié)果的絕對(duì)誤差見圖4。從圖4可知,WSVM的擬合精度最高,擬合值與實(shí)際值最吻合,擬合誤差遠(yuǎn)遠(yuǎn)小于對(duì)比模型RBFSVM,WBPNN,對(duì)比結(jié)果表明WSVM是一種有效、擬合精度高的VBR視頻流量預(yù)測(cè)模型。
圖4 各模型的VBR視頻流量擬合誤差對(duì)比
評(píng)價(jià)一個(gè)預(yù)測(cè)模型性能的優(yōu)劣,主要考察其預(yù)測(cè)能力,為此建立VBR視頻流量模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),均采用一步預(yù)測(cè),具體方式:采用前200個(gè)VBR視頻流量數(shù)據(jù)作為最原始的訓(xùn)練集,對(duì)第201個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè),然后采用滾動(dòng)方式將第201個(gè)數(shù)據(jù)合到訓(xùn)練集,對(duì)第202個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè),依次類推,最后得到全部80個(gè)測(cè)試樣本的預(yù)測(cè)結(jié)果,WSVM、RBF-SVM、WBPNN的預(yù)測(cè)結(jié)果見圖5。各模型對(duì)測(cè)試集預(yù)測(cè)結(jié)果的MAPE、RMSE和訓(xùn)練時(shí)間見表1。
圖5 各模型的預(yù)測(cè)結(jié)果對(duì)比
表1 WSVM和RBF-SVM,WBPNN的綜合性能對(duì)比
從圖4、圖5和表1可知,在所有模型中,WSVM的綜合性能最優(yōu),擬合精度最高,預(yù)測(cè)誤差最小,其優(yōu)越性主要體現(xiàn)在3個(gè)方面:
1)在所有模型中,WSVM擬合精度最高,與VBR視頻流量值最吻合,擬合結(jié)果比較穩(wěn)定,WBPNN模型的擬合精度要優(yōu)于RBF-SVM,這表明,采用小波核函數(shù)的多尺度學(xué)習(xí)性能能夠更加準(zhǔn)確地對(duì)VBR視頻流量變化趨勢(shì)進(jìn)行擬合。
2)WSVM的預(yù)測(cè)精度高于WBPNN和RBF-SVM,WBPNN雖然擬合精度高,但是其預(yù)測(cè)精度低,泛化能力差,這主要是由于WBPNN易出現(xiàn)過擬合現(xiàn)象,而WSVM訓(xùn)練實(shí)際上是一個(gè)二次凸規(guī)劃問題,在有限樣本情況下,可以建立全局最優(yōu)的VBR視頻流量模型。
3)訓(xùn)練速度。WSVM的訓(xùn)練時(shí)間為10.5 s,遠(yuǎn)遠(yuǎn)小于WBPNN、RBF-SVM的訓(xùn)練時(shí)間,提高了VBR視頻流量訓(xùn)練速度。
由于受到多種因素的影響,VBR視頻流量具有突變性、非線性等變化特點(diǎn),傳統(tǒng)方法難以建立高精度的VBR視頻流量預(yù)測(cè)模型,本文利用小波核函數(shù)多尺度學(xué)習(xí)性能和SVM的優(yōu)異的非線性預(yù)測(cè)能力,在分析VBR視頻流量多重特性的基礎(chǔ)上,提出一種基于WSVM的VBR視頻流量預(yù)測(cè)模型,結(jié)果表明,WSVM提高了VBR視頻流量的預(yù)測(cè)精度,加快了模型的訓(xùn)練速度,更加準(zhǔn)確地刻畫了VBR視頻流量特性的變化特點(diǎn),預(yù)測(cè)結(jié)果更加穩(wěn)定、可靠。
[1]王升輝,裘正定.MPEG-4視頻流量多重分形建模[J].通信學(xué)報(bào),2006,27(10):44-50.
[2]王生輝,襲正定.基于多重分形的VBR視頻流量多步預(yù)測(cè)方法[J].計(jì)算機(jī)研究與發(fā)展,2007,44(1):92-98.
[3]LEEM.Video traffic prediction based on source information and preventive channel rate decision for RCBR[J].IEEE Trans.Broadcasting,2006,52(2):173-183.
[4]王以寧,李興華,遲學(xué)芬.基于神經(jīng)網(wǎng)絡(luò)VBR視頻流量建模及預(yù)測(cè)[J].吉林大學(xué)學(xué)報(bào):信息科學(xué)版,2008,26(5):509-513.
[5]蘇曉星,常勝江,熊濤,等.用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)VBR視頻通信量的在線預(yù)測(cè)[J].電子學(xué)報(bào),2005,33(7):1163-1167.
[6]胡志剛,楊廣全,喬現(xiàn)玲.基于小波支持向量機(jī)的電梯交通流預(yù)測(cè)模型[J].系統(tǒng)仿真學(xué)報(bào),2009,21(19):6321-6324.
[7]AMIR F,MOHAMED A,ALEXANDER G.Sparse basis selection:new results and application to adaptive prediction of video source traffic[J].IEEE Trans.Neural Network,2005,16(5):1136-1146.
[8]趙露,白光偉,孫勇.基于小波變換的MPEG視頻流預(yù)測(cè)模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(5):1531-1534.
[9]羅會(huì)蘭,杜連平.一種SVM集成的圖像分類方法研究[J].電視技術(shù),2012,36(23):39-42.
[10]HUANG X,ZHOU Y,ZHANG R.A multi-scale model for MPEG-4 varied bit rate video traffic[J].IEEE Trans.Broadcasting,2004,50(3):323-334.