耿立艷, 胡 瑞, 張占福
(1.石家莊鐵道大學(xué) 經(jīng)濟管理學(xué)院, 石家莊 050043;2.石家莊鐵道大學(xué) 四方學(xué)院, 石家莊 051132)
高鐵客流量的準確預(yù)測對于相關(guān)部門科學(xué)制定運輸方案、合理配置運輸資源、規(guī)劃高鐵發(fā)展、調(diào)整高鐵企業(yè)內(nèi)部投資機構(gòu)及經(jīng)營管理具有重要作用[1]. 此外,高鐵客流量的準確預(yù)測還有助于了解高鐵旅客客流趨勢、冷熱門線路以及節(jié)假日出行變化等具體情況,對高鐵票價的合理制定以及提高高鐵客運服務(wù)能力等具有重要的實際意義.
高鐵客運系統(tǒng)是一個復(fù)雜的不確定系統(tǒng),影響高鐵客流的因素很多[2],包括經(jīng)濟發(fā)展水平、鐵路基礎(chǔ)設(shè)施狀況、人口數(shù)量、居民消費水平、旅行費用和其他替代運輸方式的發(fā)展等. 因此,高鐵客流量具有復(fù)雜性、隨機性和周期性的特征,高鐵客流量的預(yù)測屬于復(fù)雜的非線性系統(tǒng)問題,難以用單一預(yù)測方法獲得精確的預(yù)測結(jié)果.
目前常用的高鐵客流量預(yù)測方法主要有:①線性預(yù)測模型,如時間序列分析模型[3]和回歸分析模型[4-5];②非線性預(yù)測模型,如小波預(yù)測模型[6]和混沌預(yù)測模型[7-8];③人工智能預(yù)測模型,如神經(jīng)網(wǎng)絡(luò)[9]和支持向量機[10]等;④組合預(yù)測法,包括2種方法的組合及多種方法的綜合[11]等. 線性預(yù)測模型通常以數(shù)學(xué)理論和假設(shè)為基礎(chǔ),通過演繹推理建立數(shù)學(xué)模型,建模簡單,但難以描述高鐵客流量復(fù)雜非線性變化,無法完全獲取高鐵客流量的內(nèi)在特征. 非線性預(yù)測模型可刻畫高鐵客流量呈現(xiàn)出的非線性特征,但是高鐵客流量數(shù)據(jù)所具有的海量小粒度的特征,將導(dǎo)致非線性預(yù)測模型的精度不高. 人工智能預(yù)測模型在數(shù)據(jù)處理過程中會產(chǎn)生“過學(xué)習(xí)”和“欠學(xué)習(xí)”問題[12]. 組合預(yù)測法將不同預(yù)測模型進行組合,可有效發(fā)揮單一預(yù)測模型的優(yōu)點、彌補其不足之處,從而達到改善高鐵客流量預(yù)測精度的目的. 神經(jīng)網(wǎng)絡(luò)是一種數(shù)據(jù)驅(qū)動的非參數(shù)預(yù)測方法,具有自組織、自學(xué)習(xí)能力、非線性逼近能力[13],其中,徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function neural network,RBFNN)具有較好的逼近能力、較快的學(xué)習(xí)能力和較強的分類能力,被廣泛應(yīng)用到模式識別、圖像處理、時間序列分析、語音識別、智能控制等多個領(lǐng)域[14]. 但RBFNN存在訓(xùn)練速度慢、易陷入局部最優(yōu)和“維數(shù)災(zāi)難”等缺陷[15]. 基于統(tǒng)計學(xué)習(xí)理論構(gòu)建的支持向量機(support vector machines,SVM)通過結(jié)構(gòu)風(fēng)險最小化準則提高泛化能力,能較好地解決小樣本、非線性數(shù)據(jù)、局部極小和“維數(shù)災(zāi)難”等問題[16]. 而高鐵客流量正是有限樣本數(shù)據(jù),并且具有非線性、非穩(wěn)定性等特征,因此采用SVM預(yù)測高鐵客流,可對數(shù)據(jù)樣本的非線性及隨機性特征進行準確描述,以此來提高預(yù)測的精度. 但是標準SVM本質(zhì)上求解的是二次規(guī)劃問題,實際應(yīng)用中將遇到求解速度較慢,求解參數(shù)較多等問題. 最小二乘支持向量機[17](least squares support vector machines,LSSVM)是SVM的改進與擴充形式,把求解二次規(guī)劃問題轉(zhuǎn)化成求解一組線性方程組,降低了計算復(fù)雜性,提升了運算速度和性能,更適合應(yīng)用于高鐵客流量這一復(fù)雜系統(tǒng)的預(yù)測問題.
本文提出的基于小波變換的RBFNN與LSSVM高鐵客流量組合預(yù)測方法,融合了小波變換技術(shù)、RBFNN和LSSVM三種方法的優(yōu)勢,以提升高鐵客流量的預(yù)測準確性. 首先利用小波變換技術(shù)的多尺度分辨特征,將高鐵客流數(shù)據(jù)序列分解成低頻趨勢分量序列和高頻隨機分量序列;其次,2種分量序列分別采用RBFNN和LSSVM方法展開預(yù)測;再次,將2組單一模型得出的預(yù)測值合成為最終預(yù)測值;最后以我國某高鐵站的日客流量為例,驗證該方法的有效性.
1 基于小波變換的RBFNN與LSSVM組合方法
小波變換是數(shù)據(jù)處理過程中常用的一種時頻多分辨率分析方法,對于某一時間序列f(t)∈L2(R),連續(xù)小波變換可定義成:
(1)
式中,Wf(a,b)為小波變換系數(shù);φ(t)為復(fù)共軛母小波函數(shù);a為頻率參數(shù)或尺寸參數(shù);b為時域參數(shù)或平移參數(shù).
對于離散數(shù)據(jù)序列f(nΔt),小波變換系數(shù)變?yōu)椋?/p>
(2)
式中,Δt為采樣間隔;n為樣本容量.
小波變換系數(shù)可同時反映時域參數(shù)b和頻率參數(shù)a的特性[18],當a較小時,數(shù)據(jù)序列f(t)是高頻小波,取樣步長??;當a較大時,f(t)是低頻小波,取樣步長大.另外,在時間序列轉(zhuǎn)分解為小波系數(shù)后,根據(jù)高頻部分呈現(xiàn)出頻率分辨率較低、時間分辨率較高;而低頻部分則與這一特征相反,可對小波變換系數(shù)進行進一步分析,這就完成了對時間序列的多尺度局部細化分析.
由于小波變換主要有連續(xù)和離散2種形式,而高鐵客流量的時間序列表現(xiàn)為離散形式,所以需要對其進行離散小波變化.對高鐵客流量進行小波分解與重構(gòu)時,可選擇快速算法——二進正交小波變換(Mallat算法)[19],利用該算法可快速完成高鐵客流量數(shù)據(jù)序列的分解與重構(gòu).
cj+1=Hcjdj+1=Gcj(j=0,1,…,J)
(3)
式中,H和G表示分解低通和高通濾波器;c0為原始的離散數(shù)據(jù)序列.將c0代入式(3)進行分解,可生成c0在分辨率2-j的細節(jié)信號和逼近信號,也就是cJ和d1,d2,…,dJ.
在上述分解中,由于需要進行多次分解才能完成最終分解,而細節(jié)信號和逼近信號會隨著分解次數(shù)的增加而減少,并且這種減少將不利于預(yù)測,為避免這一問題的影響,可采用重構(gòu)算法實現(xiàn)信號重構(gòu):
(4)
RBFNN是以徑向基函數(shù)作為隱含層函數(shù)的3層前饋神經(jīng)網(wǎng)絡(luò),通過局部逼近與局部響應(yīng)的原理實現(xiàn)網(wǎng)絡(luò)訓(xùn)練[20],因其全局逼近能力較強,所以它可避免陷入局部最優(yōu),除此之外,它還具有收斂速度快,自適應(yīng)性強和泛化能力強等特點,所以被廣泛應(yīng)用到非線性優(yōu)化、時間序列預(yù)測等領(lǐng)域.
RBFNN共有3層,第1層是輸入層,該層有多個感知節(jié)點組成,僅用來輸入樣本時間序列;第2層是隱含層,該層由多個徑向基函數(shù)構(gòu)成的隱含層節(jié)點組成,節(jié)點數(shù)與輸入樣本數(shù)相同,通過這些節(jié)點來對輸入序列進行變換,通過局部響應(yīng)的形式將處于低維的向量變換到高維空間中,使各節(jié)點產(chǎn)生較大輸出,將低維的線性不可分問題轉(zhuǎn)變成高維線性可分[21];第3層是輸出層,該層由多個輸出層節(jié)點組成,是對輸入數(shù)據(jù)序列做出的響應(yīng)結(jié)果,最后輸出是這些節(jié)點輸出的線性加權(quán)和:
(5)
式中,x為輸入的n維樣本向量;Ci為第i個基函數(shù)的中心,與x維數(shù)相同;δi為高斯函數(shù)的方差,決定了基函數(shù)中心點的寬度.
RBFNN的輸入與輸出之間關(guān)系可表達為:
(6)
式中,ηi為第i個徑向基函數(shù)的輸出權(quán)重;Yi為第i個預(yù)測值.
LSSVM是由SVM發(fā)展起來的新型支持向量機,它的基本思想是將SVM的二次規(guī)劃問題轉(zhuǎn)變?yōu)榍蠼饩€性方程組,以減少模型計算的復(fù)雜性[22].具體模型構(gòu)建原理如下:
將時間序列樣本(xi,yi)i=1,2,…,N,定義為 1組對應(yīng)的輸入向量和輸出變量,N是數(shù)據(jù)樣本個數(shù),通過非線性映射函數(shù)Ψ(x)=(Φ(x1),Φ(x2),…,Φ(xn))可將輸入向量x映射到高維特征空間:
y(x)=wΨ(x)+u
(7)
式中,w為權(quán)重向量;u為偏差量,為常數(shù).
按照結(jié)構(gòu)風(fēng)險最小化原則,將LSSVM優(yōu)化問題定義為:
(8)
式中,γ為正則化參數(shù),且大于0;ξj為誤差項.求解以上優(yōu)化問題時,可構(gòu)造成拉格朗日函數(shù),根據(jù)KKT條件,獲得LSSVM回歸函數(shù)形式如下:
(9)
式中,αi為拉格朗日乘子;K(x,xj)為滿足Mercer條件的核函數(shù),通常情況下有線性函數(shù)、徑向基函數(shù)、多項式函數(shù)和Sigmoid函數(shù)[23]等形式.通過實證研究發(fā)現(xiàn),RBF函數(shù)的泛化能力強,常被選用作為LSSVM的核函數(shù):
(10)
式中,σ2為核函數(shù)的參數(shù).當選用RBF函數(shù)作為核函數(shù)時,LSSVM的性能主要取決于參數(shù)組合(γ,σ2)的取值.
高鐵客流量的影響因素眾多,導(dǎo)致其時間序列呈現(xiàn)出季節(jié)性、長短期變化. 除此之外,高鐵客流量時間序列還具有周期項和趨勢項的混合疊加特征. 單一模型只包含高鐵客流時間序列的部分信息,難以全面反映各種規(guī)律的疊加影響,同時,短期規(guī)律對高鐵客流量的影響也會被一定程度的削弱. 因此,可利用小波變換對客流量數(shù)據(jù)序列進行分解,使高鐵客流量隨時間變化的規(guī)律在不同頻率上體現(xiàn)出來,再選取不同的方法進行預(yù)測,以實現(xiàn)高鐵客流量預(yù)測精度的提高.
基于小波變換的高鐵客流量組合預(yù)測方法(wavelet-RBFNN-LSSVM)的建模思路為:首先,通過小波變換技術(shù)將高鐵客流量數(shù)據(jù)序列轉(zhuǎn)換為2種序列:低頻趨勢分量序列與高頻隨機分量序列;其次,低頻趨勢分量序列具有周期性、線性特征,運用RBFNN進行建模與預(yù)測,高頻隨機分量序列具有隨機性、非線性震蕩的特征,通過LSSVM進行建模與預(yù)測;最后,將2組預(yù)測值疊加為最終組合預(yù)測值.
基于wavelet-RBFNN-LSSVM的高鐵客流量預(yù)測步驟設(shè)計如下:
步驟1:數(shù)據(jù)預(yù)處理. 高鐵客流量數(shù)據(jù)序列的波動變化幅度較大,若直接進行計算,將影響模型的運算速度和預(yù)測精度. 為了提高預(yù)測精度、加速模型收斂,先將高鐵客流量數(shù)據(jù)序列進行歸一化預(yù)處理,再采用邊緣數(shù)據(jù)向外對稱延拓法在高鐵客流量數(shù)據(jù)序列的兩端向外延拓2J個數(shù)據(jù).
步驟2:小波分解與重構(gòu). 利用小波基對高鐵客流量數(shù)據(jù)序列進行J尺度的小波分解及重構(gòu),去除高鐵客流量數(shù)據(jù)序列數(shù)據(jù)前后延拓的數(shù)據(jù),得到序列組{AJ,D1,D2,…,DJ}.
步驟3:單一預(yù)測. 設(shè)定RBFNN參數(shù),選取LSSVM核函數(shù)并設(shè)定正則化參數(shù)與核數(shù)值;將全部數(shù)據(jù)樣本分為兩部分:訓(xùn)練樣本集與檢驗樣本集,基于訓(xùn)練樣本集,構(gòu)建RBFNN和LSSVM,利用RBFNN預(yù)測低頻趨勢分量序列{AJ},通過LSSVM分別預(yù)測高頻隨機分量序列{D1,D2,…,DJ}.
步驟4:組合預(yù)測. 將獲得的低頻趨勢分量序列預(yù)測值和高頻隨機分量序列預(yù)測值疊加為預(yù)測值,再將預(yù)測值逆歸一化為原始高鐵客流量的最終組合預(yù)測值.
選取某高鐵站的日客流量數(shù)據(jù)進行實證研究,將該高鐵站2017年全年的365個日客流數(shù)據(jù)作為數(shù)據(jù)樣本. 圖1為某高鐵站日客流量曲線圖. 由圖1可看出,某高鐵站日客流量序列具有明顯的隨機性和波動性變動趨勢.
圖1 某高鐵站日客流量曲線圖
將高鐵日客流量數(shù)據(jù)序列看作一個復(fù)雜信號,利用小波分解進行復(fù)雜信號的頻率分離. 首先確定小波基和分解函數(shù). 由于高鐵客流量數(shù)據(jù)序列具有明顯的隨機性與波動性,選擇正交對稱小波基以消除冗余. db小波具有正交性、緊支性、高正則性、高消失矩和具有Mallat快速算法等特點,db小波系列中,db4小波相對于其他小波具有更短的時窗和更高的時間分辨率,因此,本文采用時間序列敏感性高的db4小波基分解并重構(gòu)高鐵客流量數(shù)據(jù)序列. 基于小波變換能提取數(shù)據(jù)主要變化趨勢和過濾隨機信息的優(yōu)勢,通過Kolmogorov-Smimow方法確定高鐵客流量數(shù)據(jù)序列分解與重構(gòu)的尺度為3. 由于直接使用Mallat算法對高鐵客流量數(shù)據(jù)序列作小波分解,會使得分解信號在邊緣的數(shù)據(jù)產(chǎn)生失真,分解出的低頻趨勢分量序列與高頻隨機分量序列會產(chǎn)生交界,并且低頻趨勢分量序列與高頻隨機分量序列的預(yù)測值也會產(chǎn)生跳躍,最終導(dǎo)致預(yù)測結(jié)果的誤差較大. 因此,在進行小波分解及重構(gòu)之前,先利用邊緣數(shù)據(jù)向外對稱延拓法在高鐵客流量數(shù)據(jù)序列的兩端向外延拓8個數(shù)據(jù),再使用Mallat算法的db4小波基對高鐵客流量數(shù)據(jù)序列進行3尺度的分解及重構(gòu),最后去除高鐵客流量數(shù)據(jù)序列前后延拓的8個數(shù)據(jù),從而得到一個低頻趨勢分量序列{A3}和3個高頻隨機分量序列{D1,D2,D3},如圖2所示. 小波分解的隨機部分會和趨勢分量會隨著分解層數(shù)的增多而逐漸變的平滑,同時尺度部分規(guī)律性也在增強. {A3}已經(jīng)比較光滑,保持了原高鐵客流量數(shù)據(jù)序列的曲線形狀. 因此,若先對原始高鐵客流量數(shù)據(jù)序列進行小波分解,然后采用RBFNN預(yù)測{A3}、LSSVM預(yù)測{D1,D2,D3},再將上述預(yù)測值合成最終預(yù)測結(jié)果,從理論上可得到更加準確的預(yù)測結(jié)果.
圖2 某高鐵站日客流量小波分解結(jié)果
重構(gòu)后的低頻趨勢分量序列和高頻隨機分量序列各有365個數(shù)據(jù),分別將低頻趨勢分量序列數(shù)據(jù)和高頻隨機分量序列數(shù)據(jù)歸一化到[0,1]區(qū)間. 并將2個分量序列劃分成2組,前290個數(shù)據(jù)作為訓(xùn)練樣本集,后75個樣本作為檢驗樣本集. 預(yù)測低頻趨勢分量序列{A3}時,基于訓(xùn)練樣本集,構(gòu)建RBFNN,RBFNN的最大節(jié)點數(shù)設(shè)為2,期望誤差設(shè)為0.000 1. 利用訓(xùn)練好的RBFNN預(yù)測驗證樣本集. 預(yù)測高頻趨勢分量序列{D1,D2,D3}時,基于訓(xùn)練樣本集,構(gòu)建LSSVM,以RBF核函數(shù)作為核函數(shù),通過5折交叉驗證法確定參數(shù)組合(γ,σ2)的值. 運用訓(xùn)練好的LSSVM預(yù)測驗證樣本集. 最后,將得到的四組預(yù)測值相加獲得高鐵客流量預(yù)測值,并將得到的預(yù)測值逆歸一化為原始高鐵客流量預(yù)測值.
為驗證wavelet-RBFNN-LSSVM的有效性,基本相同的數(shù)據(jù)樣本集,利用RBFNN和LSSVM分別作為單一模型預(yù)測高鐵客流量數(shù)據(jù)序列,再將兩單一模型的預(yù)測結(jié)果與wavelet-RBFNN-LSSVM進行比較. 其中,RBFNN的最大節(jié)點數(shù)設(shè)為2,期望誤差設(shè)為0.000 1;將LSSVM核函數(shù)選定為RBF核函數(shù),采用5折交叉驗證法確定參數(shù)組合(γ,σ2)的值.
首先,利用均方根誤差(root mean squared error RMSE)、平均絕對誤差(mean absolute error,MAE)、平均相對誤差(mean percentage error,MPE)、西爾統(tǒng)計量(Theil)、異方差調(diào)整的均方根誤差(heteroskedasticity adjusted RMSE,HRMSE)對數(shù)損失函數(shù)(logarithm loss function,LLF)評價模型的預(yù)測性能. 表1列出了3種模型的預(yù)測性能比較. 由表1可看出,wavelet-RBFNN-LSSVM的RMSE、MAE、MPE、Theil、HRMSE、LLF值均小于RBFNN和LSSVM的對應(yīng)值,說明wavelet-RBFNN-LSSVM的高鐵客流量預(yù)測性能優(yōu)于RBFNN和LSSVM,即本部分提出的組合預(yù)測法預(yù)測性能優(yōu)于單一預(yù)測法. 另外,LSSVM的高鐵客流量預(yù)測性能優(yōu)于RBFNN,其6個預(yù)測性能評價指標均小于RBFNN的對應(yīng)值.
表1 3種模型的預(yù)測性能比較
其次,采用M-Z回歸檢驗評價模型的預(yù)測效果,回歸方程如下:
yt=χ1+χ2t+randt
(11)
式中,yt為高鐵客流量的實際值;t為高鐵客流量的預(yù)測值;χ1和χ2表示回歸系數(shù);randt為隨機項.回歸方程的擬合優(yōu)度R2值越大,表明高鐵客流量的實際值與預(yù)測值越接近,則模型的預(yù)測效果越好.
表2列出了3種模型的M-Z回歸檢驗結(jié)果比較. 根據(jù)表2,wavelet-RBFNN-LSSVM的擬合優(yōu)度R2值為0.111 8,高于RBFNN的R2值1個數(shù)量級、高于LSSVM的R2值2個數(shù)量級,這充分證明,相比于RBFNN和LSSVM,wavelet-RBFNN-LSSVM對高鐵客流量具有更好地解釋作用,獲得了更優(yōu)的預(yù)測效果.
因此. 根據(jù)2種預(yù)測性能評價標準,基于小波分解的RBFNN與LSSVM智能組合預(yù)測模型相對于單一預(yù)測模型獲得了更高的預(yù)測精度.
表2 3種模型的M-Z回歸檢驗結(jié)果比較
圖3為3種模型的預(yù)測值曲線圖. 從圖3可知,wavelet-RBFNN-LSSVM預(yù)測出了高鐵客流量的長期變動趨勢,RBFNN與LSSVM較好地預(yù)測出高鐵客流量的波動變化規(guī)律. 在波動率變動幅度較小階段,RBFNN與LSSVM預(yù)測效果相對較好,而在波動變動幅度較大階段,wavelet-RBFNN-LSSVM的預(yù)測效果相對更優(yōu).
圖3 3種模型的預(yù)測值曲線圖
本文將小波變換、RBFNN、LSSVM相結(jié)合,提出基于小波變換的RBFNN與LSSVM組合預(yù)測法對高鐵客流量進行預(yù)測. 先以小波變換分解出高鐵客流量數(shù)據(jù)序列的2種分量序列,再分別利用RBENN和LSSVM預(yù)測2種分量序列,最后將這2種分量序列的預(yù)測值疊加為最終組合預(yù)測值. 根據(jù)2種預(yù)測性能評價標準,wavelet-RBFNN-LSSVM的RMSE、MAE、MPE、Theil、HRMSE、LLF值均小于RBFNN和LSSVM的對應(yīng)值,且擬合優(yōu)度R2值為0.111 8,高于RBFNN的R2值0.032 5和LSSVM的R2值0.007 0,相對于RBFNN和LSSVM的預(yù)測精度更高,適合于高鐵客流量的短期預(yù)測.