耿立艷, 胡 瑞, 張占福
(1.石家莊鐵道大學(xué) 經(jīng)濟(jì)管理學(xué)院, 石家莊 050043;2.石家莊鐵道大學(xué) 四方學(xué)院, 石家莊 051132)
高鐵客流量的準(zhǔn)確預(yù)測(cè)對(duì)于相關(guān)部門科學(xué)制定運(yùn)輸方案、合理配置運(yùn)輸資源、規(guī)劃高鐵發(fā)展、調(diào)整高鐵企業(yè)內(nèi)部投資機(jī)構(gòu)及經(jīng)營(yíng)管理具有重要作用[1]. 此外,高鐵客流量的準(zhǔn)確預(yù)測(cè)還有助于了解高鐵旅客客流趨勢(shì)、冷熱門線路以及節(jié)假日出行變化等具體情況,對(duì)高鐵票價(jià)的合理制定以及提高高鐵客運(yùn)服務(wù)能力等具有重要的實(shí)際意義.
高鐵客運(yùn)系統(tǒng)是一個(gè)復(fù)雜的不確定系統(tǒng),影響高鐵客流的因素很多[2],包括經(jīng)濟(jì)發(fā)展水平、鐵路基礎(chǔ)設(shè)施狀況、人口數(shù)量、居民消費(fèi)水平、旅行費(fèi)用和其他替代運(yùn)輸方式的發(fā)展等. 因此,高鐵客流量具有復(fù)雜性、隨機(jī)性和周期性的特征,高鐵客流量的預(yù)測(cè)屬于復(fù)雜的非線性系統(tǒng)問(wèn)題,難以用單一預(yù)測(cè)方法獲得精確的預(yù)測(cè)結(jié)果.
目前常用的高鐵客流量預(yù)測(cè)方法主要有:①線性預(yù)測(cè)模型,如時(shí)間序列分析模型[3]和回歸分析模型[4-5];②非線性預(yù)測(cè)模型,如小波預(yù)測(cè)模型[6]和混沌預(yù)測(cè)模型[7-8];③人工智能預(yù)測(cè)模型,如神經(jīng)網(wǎng)絡(luò)[9]和支持向量機(jī)[10]等;④組合預(yù)測(cè)法,包括2種方法的組合及多種方法的綜合[11]等. 線性預(yù)測(cè)模型通常以數(shù)學(xué)理論和假設(shè)為基礎(chǔ),通過(guò)演繹推理建立數(shù)學(xué)模型,建模簡(jiǎn)單,但難以描述高鐵客流量復(fù)雜非線性變化,無(wú)法完全獲取高鐵客流量的內(nèi)在特征. 非線性預(yù)測(cè)模型可刻畫高鐵客流量呈現(xiàn)出的非線性特征,但是高鐵客流量數(shù)據(jù)所具有的海量小粒度的特征,將導(dǎo)致非線性預(yù)測(cè)模型的精度不高. 人工智能預(yù)測(cè)模型在數(shù)據(jù)處理過(guò)程中會(huì)產(chǎn)生“過(guò)學(xué)習(xí)”和“欠學(xué)習(xí)”問(wèn)題[12]. 組合預(yù)測(cè)法將不同預(yù)測(cè)模型進(jìn)行組合,可有效發(fā)揮單一預(yù)測(cè)模型的優(yōu)點(diǎn)、彌補(bǔ)其不足之處,從而達(dá)到改善高鐵客流量預(yù)測(cè)精度的目的. 神經(jīng)網(wǎng)絡(luò)是一種數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)預(yù)測(cè)方法,具有自組織、自學(xué)習(xí)能力、非線性逼近能力[13],其中,徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function neural network,RBFNN)具有較好的逼近能力、較快的學(xué)習(xí)能力和較強(qiáng)的分類能力,被廣泛應(yīng)用到模式識(shí)別、圖像處理、時(shí)間序列分析、語(yǔ)音識(shí)別、智能控制等多個(gè)領(lǐng)域[14]. 但RBFNN存在訓(xùn)練速度慢、易陷入局部最優(yōu)和“維數(shù)災(zāi)難”等缺陷[15]. 基于統(tǒng)計(jì)學(xué)習(xí)理論構(gòu)建的支持向量機(jī)(support vector machines,SVM)通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則提高泛化能力,能較好地解決小樣本、非線性數(shù)據(jù)、局部極小和“維數(shù)災(zāi)難”等問(wèn)題[16]. 而高鐵客流量正是有限樣本數(shù)據(jù),并且具有非線性、非穩(wěn)定性等特征,因此采用SVM預(yù)測(cè)高鐵客流,可對(duì)數(shù)據(jù)樣本的非線性及隨機(jī)性特征進(jìn)行準(zhǔn)確描述,以此來(lái)提高預(yù)測(cè)的精度. 但是標(biāo)準(zhǔn)SVM本質(zhì)上求解的是二次規(guī)劃問(wèn)題,實(shí)際應(yīng)用中將遇到求解速度較慢,求解參數(shù)較多等問(wèn)題. 最小二乘支持向量機(jī)[17](least squares support vector machines,LSSVM)是SVM的改進(jìn)與擴(kuò)充形式,把求解二次規(guī)劃問(wèn)題轉(zhuǎn)化成求解一組線性方程組,降低了計(jì)算復(fù)雜性,提升了運(yùn)算速度和性能,更適合應(yīng)用于高鐵客流量這一復(fù)雜系統(tǒng)的預(yù)測(cè)問(wèn)題.
本文提出的基于小波變換的RBFNN與LSSVM高鐵客流量組合預(yù)測(cè)方法,融合了小波變換技術(shù)、RBFNN和LSSVM三種方法的優(yōu)勢(shì),以提升高鐵客流量的預(yù)測(cè)準(zhǔn)確性. 首先利用小波變換技術(shù)的多尺度分辨特征,將高鐵客流數(shù)據(jù)序列分解成低頻趨勢(shì)分量序列和高頻隨機(jī)分量序列;其次,2種分量序列分別采用RBFNN和LSSVM方法展開(kāi)預(yù)測(cè);再次,將2組單一模型得出的預(yù)測(cè)值合成為最終預(yù)測(cè)值;最后以我國(guó)某高鐵站的日客流量為例,驗(yàn)證該方法的有效性.
1 基于小波變換的RBFNN與LSSVM組合方法
小波變換是數(shù)據(jù)處理過(guò)程中常用的一種時(shí)頻多分辨率分析方法,對(duì)于某一時(shí)間序列f(t)∈L2(R),連續(xù)小波變換可定義成:
(1)
式中,Wf(a,b)為小波變換系數(shù);φ(t)為復(fù)共軛母小波函數(shù);a為頻率參數(shù)或尺寸參數(shù);b為時(shí)域參數(shù)或平移參數(shù).
對(duì)于離散數(shù)據(jù)序列f(nΔt),小波變換系數(shù)變?yōu)椋?/p>
(2)
式中,Δt為采樣間隔;n為樣本容量.
小波變換系數(shù)可同時(shí)反映時(shí)域參數(shù)b和頻率參數(shù)a的特性[18],當(dāng)a較小時(shí),數(shù)據(jù)序列f(t)是高頻小波,取樣步長(zhǎng)??;當(dāng)a較大時(shí),f(t)是低頻小波,取樣步長(zhǎng)大.另外,在時(shí)間序列轉(zhuǎn)分解為小波系數(shù)后,根據(jù)高頻部分呈現(xiàn)出頻率分辨率較低、時(shí)間分辨率較高;而低頻部分則與這一特征相反,可對(duì)小波變換系數(shù)進(jìn)行進(jìn)一步分析,這就完成了對(duì)時(shí)間序列的多尺度局部細(xì)化分析.
由于小波變換主要有連續(xù)和離散2種形式,而高鐵客流量的時(shí)間序列表現(xiàn)為離散形式,所以需要對(duì)其進(jìn)行離散小波變化.對(duì)高鐵客流量進(jìn)行小波分解與重構(gòu)時(shí),可選擇快速算法——二進(jìn)正交小波變換(Mallat算法)[19],利用該算法可快速完成高鐵客流量數(shù)據(jù)序列的分解與重構(gòu).
cj+1=Hcjdj+1=Gcj(j=0,1,…,J)
(3)
式中,H和G表示分解低通和高通濾波器;c0為原始的離散數(shù)據(jù)序列.將c0代入式(3)進(jìn)行分解,可生成c0在分辨率2-j的細(xì)節(jié)信號(hào)和逼近信號(hào),也就是cJ和d1,d2,…,dJ.
在上述分解中,由于需要進(jìn)行多次分解才能完成最終分解,而細(xì)節(jié)信號(hào)和逼近信號(hào)會(huì)隨著分解次數(shù)的增加而減少,并且這種減少將不利于預(yù)測(cè),為避免這一問(wèn)題的影響,可采用重構(gòu)算法實(shí)現(xiàn)信號(hào)重構(gòu):
(4)
RBFNN是以徑向基函數(shù)作為隱含層函數(shù)的3層前饋神經(jīng)網(wǎng)絡(luò),通過(guò)局部逼近與局部響應(yīng)的原理實(shí)現(xiàn)網(wǎng)絡(luò)訓(xùn)練[20],因其全局逼近能力較強(qiáng),所以它可避免陷入局部最優(yōu),除此之外,它還具有收斂速度快,自適應(yīng)性強(qiáng)和泛化能力強(qiáng)等特點(diǎn),所以被廣泛應(yīng)用到非線性優(yōu)化、時(shí)間序列預(yù)測(cè)等領(lǐng)域.
RBFNN共有3層,第1層是輸入層,該層有多個(gè)感知節(jié)點(diǎn)組成,僅用來(lái)輸入樣本時(shí)間序列;第2層是隱含層,該層由多個(gè)徑向基函數(shù)構(gòu)成的隱含層節(jié)點(diǎn)組成,節(jié)點(diǎn)數(shù)與輸入樣本數(shù)相同,通過(guò)這些節(jié)點(diǎn)來(lái)對(duì)輸入序列進(jìn)行變換,通過(guò)局部響應(yīng)的形式將處于低維的向量變換到高維空間中,使各節(jié)點(diǎn)產(chǎn)生較大輸出,將低維的線性不可分問(wèn)題轉(zhuǎn)變成高維線性可分[21];第3層是輸出層,該層由多個(gè)輸出層節(jié)點(diǎn)組成,是對(duì)輸入數(shù)據(jù)序列做出的響應(yīng)結(jié)果,最后輸出是這些節(jié)點(diǎn)輸出的線性加權(quán)和:
(5)
式中,x為輸入的n維樣本向量;Ci為第i個(gè)基函數(shù)的中心,與x維數(shù)相同;δi為高斯函數(shù)的方差,決定了基函數(shù)中心點(diǎn)的寬度.
RBFNN的輸入與輸出之間關(guān)系可表達(dá)為:
(6)
式中,ηi為第i個(gè)徑向基函數(shù)的輸出權(quán)重;Yi為第i個(gè)預(yù)測(cè)值.
LSSVM是由SVM發(fā)展起來(lái)的新型支持向量機(jī),它的基本思想是將SVM的二次規(guī)劃問(wèn)題轉(zhuǎn)變?yōu)榍蠼饩€性方程組,以減少模型計(jì)算的復(fù)雜性[22].具體模型構(gòu)建原理如下:
將時(shí)間序列樣本(xi,yi)i=1,2,…,N,定義為 1組對(duì)應(yīng)的輸入向量和輸出變量,N是數(shù)據(jù)樣本個(gè)數(shù),通過(guò)非線性映射函數(shù)Ψ(x)=(Φ(x1),Φ(x2),…,Φ(xn))可將輸入向量x映射到高維特征空間:
y(x)=wΨ(x)+u
(7)
式中,w為權(quán)重向量;u為偏差量,為常數(shù).
按照結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將LSSVM優(yōu)化問(wèn)題定義為:
(8)
式中,γ為正則化參數(shù),且大于0;ξj為誤差項(xiàng).求解以上優(yōu)化問(wèn)題時(shí),可構(gòu)造成拉格朗日函數(shù),根據(jù)KKT條件,獲得LSSVM回歸函數(shù)形式如下:
(9)
式中,αi為拉格朗日乘子;K(x,xj)為滿足Mercer條件的核函數(shù),通常情況下有線性函數(shù)、徑向基函數(shù)、多項(xiàng)式函數(shù)和Sigmoid函數(shù)[23]等形式.通過(guò)實(shí)證研究發(fā)現(xiàn),RBF函數(shù)的泛化能力強(qiáng),常被選用作為L(zhǎng)SSVM的核函數(shù):
(10)
式中,σ2為核函數(shù)的參數(shù).當(dāng)選用RBF函數(shù)作為核函數(shù)時(shí),LSSVM的性能主要取決于參數(shù)組合(γ,σ2)的取值.
高鐵客流量的影響因素眾多,導(dǎo)致其時(shí)間序列呈現(xiàn)出季節(jié)性、長(zhǎng)短期變化. 除此之外,高鐵客流量時(shí)間序列還具有周期項(xiàng)和趨勢(shì)項(xiàng)的混合疊加特征. 單一模型只包含高鐵客流時(shí)間序列的部分信息,難以全面反映各種規(guī)律的疊加影響,同時(shí),短期規(guī)律對(duì)高鐵客流量的影響也會(huì)被一定程度的削弱. 因此,可利用小波變換對(duì)客流量數(shù)據(jù)序列進(jìn)行分解,使高鐵客流量隨時(shí)間變化的規(guī)律在不同頻率上體現(xiàn)出來(lái),再選取不同的方法進(jìn)行預(yù)測(cè),以實(shí)現(xiàn)高鐵客流量預(yù)測(cè)精度的提高.
基于小波變換的高鐵客流量組合預(yù)測(cè)方法(wavelet-RBFNN-LSSVM)的建模思路為:首先,通過(guò)小波變換技術(shù)將高鐵客流量數(shù)據(jù)序列轉(zhuǎn)換為2種序列:低頻趨勢(shì)分量序列與高頻隨機(jī)分量序列;其次,低頻趨勢(shì)分量序列具有周期性、線性特征,運(yùn)用RBFNN進(jìn)行建模與預(yù)測(cè),高頻隨機(jī)分量序列具有隨機(jī)性、非線性震蕩的特征,通過(guò)LSSVM進(jìn)行建模與預(yù)測(cè);最后,將2組預(yù)測(cè)值疊加為最終組合預(yù)測(cè)值.
基于wavelet-RBFNN-LSSVM的高鐵客流量預(yù)測(cè)步驟設(shè)計(jì)如下:
步驟1:數(shù)據(jù)預(yù)處理. 高鐵客流量數(shù)據(jù)序列的波動(dòng)變化幅度較大,若直接進(jìn)行計(jì)算,將影響模型的運(yùn)算速度和預(yù)測(cè)精度. 為了提高預(yù)測(cè)精度、加速模型收斂,先將高鐵客流量數(shù)據(jù)序列進(jìn)行歸一化預(yù)處理,再采用邊緣數(shù)據(jù)向外對(duì)稱延拓法在高鐵客流量數(shù)據(jù)序列的兩端向外延拓2J個(gè)數(shù)據(jù).
步驟2:小波分解與重構(gòu). 利用小波基對(duì)高鐵客流量數(shù)據(jù)序列進(jìn)行J尺度的小波分解及重構(gòu),去除高鐵客流量數(shù)據(jù)序列數(shù)據(jù)前后延拓的數(shù)據(jù),得到序列組{AJ,D1,D2,…,DJ}.
步驟3:?jiǎn)我活A(yù)測(cè). 設(shè)定RBFNN參數(shù),選取LSSVM核函數(shù)并設(shè)定正則化參數(shù)與核數(shù)值;將全部數(shù)據(jù)樣本分為兩部分:訓(xùn)練樣本集與檢驗(yàn)樣本集,基于訓(xùn)練樣本集,構(gòu)建RBFNN和LSSVM,利用RBFNN預(yù)測(cè)低頻趨勢(shì)分量序列{AJ},通過(guò)LSSVM分別預(yù)測(cè)高頻隨機(jī)分量序列{D1,D2,…,DJ}.
步驟4:組合預(yù)測(cè). 將獲得的低頻趨勢(shì)分量序列預(yù)測(cè)值和高頻隨機(jī)分量序列預(yù)測(cè)值疊加為預(yù)測(cè)值,再將預(yù)測(cè)值逆歸一化為原始高鐵客流量的最終組合預(yù)測(cè)值.
選取某高鐵站的日客流量數(shù)據(jù)進(jìn)行實(shí)證研究,將該高鐵站2017年全年的365個(gè)日客流數(shù)據(jù)作為數(shù)據(jù)樣本. 圖1為某高鐵站日客流量曲線圖. 由圖1可看出,某高鐵站日客流量序列具有明顯的隨機(jī)性和波動(dòng)性變動(dòng)趨勢(shì).
圖1 某高鐵站日客流量曲線圖
將高鐵日客流量數(shù)據(jù)序列看作一個(gè)復(fù)雜信號(hào),利用小波分解進(jìn)行復(fù)雜信號(hào)的頻率分離. 首先確定小波基和分解函數(shù). 由于高鐵客流量數(shù)據(jù)序列具有明顯的隨機(jī)性與波動(dòng)性,選擇正交對(duì)稱小波基以消除冗余. db小波具有正交性、緊支性、高正則性、高消失矩和具有Mallat快速算法等特點(diǎn),db小波系列中,db4小波相對(duì)于其他小波具有更短的時(shí)窗和更高的時(shí)間分辨率,因此,本文采用時(shí)間序列敏感性高的db4小波基分解并重構(gòu)高鐵客流量數(shù)據(jù)序列. 基于小波變換能提取數(shù)據(jù)主要變化趨勢(shì)和過(guò)濾隨機(jī)信息的優(yōu)勢(shì),通過(guò)Kolmogorov-Smimow方法確定高鐵客流量數(shù)據(jù)序列分解與重構(gòu)的尺度為3. 由于直接使用Mallat算法對(duì)高鐵客流量數(shù)據(jù)序列作小波分解,會(huì)使得分解信號(hào)在邊緣的數(shù)據(jù)產(chǎn)生失真,分解出的低頻趨勢(shì)分量序列與高頻隨機(jī)分量序列會(huì)產(chǎn)生交界,并且低頻趨勢(shì)分量序列與高頻隨機(jī)分量序列的預(yù)測(cè)值也會(huì)產(chǎn)生跳躍,最終導(dǎo)致預(yù)測(cè)結(jié)果的誤差較大. 因此,在進(jìn)行小波分解及重構(gòu)之前,先利用邊緣數(shù)據(jù)向外對(duì)稱延拓法在高鐵客流量數(shù)據(jù)序列的兩端向外延拓8個(gè)數(shù)據(jù),再使用Mallat算法的db4小波基對(duì)高鐵客流量數(shù)據(jù)序列進(jìn)行3尺度的分解及重構(gòu),最后去除高鐵客流量數(shù)據(jù)序列前后延拓的8個(gè)數(shù)據(jù),從而得到一個(gè)低頻趨勢(shì)分量序列{A3}和3個(gè)高頻隨機(jī)分量序列{D1,D2,D3},如圖2所示. 小波分解的隨機(jī)部分會(huì)和趨勢(shì)分量會(huì)隨著分解層數(shù)的增多而逐漸變的平滑,同時(shí)尺度部分規(guī)律性也在增強(qiáng). {A3}已經(jīng)比較光滑,保持了原高鐵客流量數(shù)據(jù)序列的曲線形狀. 因此,若先對(duì)原始高鐵客流量數(shù)據(jù)序列進(jìn)行小波分解,然后采用RBFNN預(yù)測(cè){A3}、LSSVM預(yù)測(cè){D1,D2,D3},再將上述預(yù)測(cè)值合成最終預(yù)測(cè)結(jié)果,從理論上可得到更加準(zhǔn)確的預(yù)測(cè)結(jié)果.
圖2 某高鐵站日客流量小波分解結(jié)果
重構(gòu)后的低頻趨勢(shì)分量序列和高頻隨機(jī)分量序列各有365個(gè)數(shù)據(jù),分別將低頻趨勢(shì)分量序列數(shù)據(jù)和高頻隨機(jī)分量序列數(shù)據(jù)歸一化到[0,1]區(qū)間. 并將2個(gè)分量序列劃分成2組,前290個(gè)數(shù)據(jù)作為訓(xùn)練樣本集,后75個(gè)樣本作為檢驗(yàn)樣本集. 預(yù)測(cè)低頻趨勢(shì)分量序列{A3}時(shí),基于訓(xùn)練樣本集,構(gòu)建RBFNN,RBFNN的最大節(jié)點(diǎn)數(shù)設(shè)為2,期望誤差設(shè)為0.000 1. 利用訓(xùn)練好的RBFNN預(yù)測(cè)驗(yàn)證樣本集. 預(yù)測(cè)高頻趨勢(shì)分量序列{D1,D2,D3}時(shí),基于訓(xùn)練樣本集,構(gòu)建LSSVM,以RBF核函數(shù)作為核函數(shù),通過(guò)5折交叉驗(yàn)證法確定參數(shù)組合(γ,σ2)的值. 運(yùn)用訓(xùn)練好的LSSVM預(yù)測(cè)驗(yàn)證樣本集. 最后,將得到的四組預(yù)測(cè)值相加獲得高鐵客流量預(yù)測(cè)值,并將得到的預(yù)測(cè)值逆歸一化為原始高鐵客流量預(yù)測(cè)值.
為驗(yàn)證wavelet-RBFNN-LSSVM的有效性,基本相同的數(shù)據(jù)樣本集,利用RBFNN和LSSVM分別作為單一模型預(yù)測(cè)高鐵客流量數(shù)據(jù)序列,再將兩單一模型的預(yù)測(cè)結(jié)果與wavelet-RBFNN-LSSVM進(jìn)行比較. 其中,RBFNN的最大節(jié)點(diǎn)數(shù)設(shè)為2,期望誤差設(shè)為0.000 1;將LSSVM核函數(shù)選定為RBF核函數(shù),采用5折交叉驗(yàn)證法確定參數(shù)組合(γ,σ2)的值.
首先,利用均方根誤差(root mean squared error RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)、平均相對(duì)誤差(mean percentage error,MPE)、西爾統(tǒng)計(jì)量(Theil)、異方差調(diào)整的均方根誤差(heteroskedasticity adjusted RMSE,HRMSE)對(duì)數(shù)損失函數(shù)(logarithm loss function,LLF)評(píng)價(jià)模型的預(yù)測(cè)性能. 表1列出了3種模型的預(yù)測(cè)性能比較. 由表1可看出,wavelet-RBFNN-LSSVM的RMSE、MAE、MPE、Theil、HRMSE、LLF值均小于RBFNN和LSSVM的對(duì)應(yīng)值,說(shuō)明wavelet-RBFNN-LSSVM的高鐵客流量預(yù)測(cè)性能優(yōu)于RBFNN和LSSVM,即本部分提出的組合預(yù)測(cè)法預(yù)測(cè)性能優(yōu)于單一預(yù)測(cè)法. 另外,LSSVM的高鐵客流量預(yù)測(cè)性能優(yōu)于RBFNN,其6個(gè)預(yù)測(cè)性能評(píng)價(jià)指標(biāo)均小于RBFNN的對(duì)應(yīng)值.
表1 3種模型的預(yù)測(cè)性能比較
其次,采用M-Z回歸檢驗(yàn)評(píng)價(jià)模型的預(yù)測(cè)效果,回歸方程如下:
yt=χ1+χ2t+randt
(11)
式中,yt為高鐵客流量的實(shí)際值;t為高鐵客流量的預(yù)測(cè)值;χ1和χ2表示回歸系數(shù);randt為隨機(jī)項(xiàng).回歸方程的擬合優(yōu)度R2值越大,表明高鐵客流量的實(shí)際值與預(yù)測(cè)值越接近,則模型的預(yù)測(cè)效果越好.
表2列出了3種模型的M-Z回歸檢驗(yàn)結(jié)果比較. 根據(jù)表2,wavelet-RBFNN-LSSVM的擬合優(yōu)度R2值為0.111 8,高于RBFNN的R2值1個(gè)數(shù)量級(jí)、高于LSSVM的R2值2個(gè)數(shù)量級(jí),這充分證明,相比于RBFNN和LSSVM,wavelet-RBFNN-LSSVM對(duì)高鐵客流量具有更好地解釋作用,獲得了更優(yōu)的預(yù)測(cè)效果.
因此. 根據(jù)2種預(yù)測(cè)性能評(píng)價(jià)標(biāo)準(zhǔn),基于小波分解的RBFNN與LSSVM智能組合預(yù)測(cè)模型相對(duì)于單一預(yù)測(cè)模型獲得了更高的預(yù)測(cè)精度.
表2 3種模型的M-Z回歸檢驗(yàn)結(jié)果比較
圖3為3種模型的預(yù)測(cè)值曲線圖. 從圖3可知,wavelet-RBFNN-LSSVM預(yù)測(cè)出了高鐵客流量的長(zhǎng)期變動(dòng)趨勢(shì),RBFNN與LSSVM較好地預(yù)測(cè)出高鐵客流量的波動(dòng)變化規(guī)律. 在波動(dòng)率變動(dòng)幅度較小階段,RBFNN與LSSVM預(yù)測(cè)效果相對(duì)較好,而在波動(dòng)變動(dòng)幅度較大階段,wavelet-RBFNN-LSSVM的預(yù)測(cè)效果相對(duì)更優(yōu).
圖3 3種模型的預(yù)測(cè)值曲線圖
本文將小波變換、RBFNN、LSSVM相結(jié)合,提出基于小波變換的RBFNN與LSSVM組合預(yù)測(cè)法對(duì)高鐵客流量進(jìn)行預(yù)測(cè). 先以小波變換分解出高鐵客流量數(shù)據(jù)序列的2種分量序列,再分別利用RBENN和LSSVM預(yù)測(cè)2種分量序列,最后將這2種分量序列的預(yù)測(cè)值疊加為最終組合預(yù)測(cè)值. 根據(jù)2種預(yù)測(cè)性能評(píng)價(jià)標(biāo)準(zhǔn),wavelet-RBFNN-LSSVM的RMSE、MAE、MPE、Theil、HRMSE、LLF值均小于RBFNN和LSSVM的對(duì)應(yīng)值,且擬合優(yōu)度R2值為0.111 8,高于RBFNN的R2值0.032 5和LSSVM的R2值0.007 0,相對(duì)于RBFNN和LSSVM的預(yù)測(cè)精度更高,適合于高鐵客流量的短期預(yù)測(cè).