耿立艷 胡瑞 張占福
[摘 要]城際高鐵客流量序列呈現(xiàn)出不平穩(wěn)和波動性特征,常規(guī)預測方法很難對其進行精準預測。文章提出將EMD、GRNN和ARIAM模型相結(jié)合的城際高鐵客流量預測模型(EGA)。EGA模型充分利用三者的優(yōu)勢,提升城際高鐵客流量預測精度。通過某城際高鐵站日客流量數(shù)據(jù)檢驗EGA模型的有效性,結(jié)果表明,與GRNN相比,EGA模型獲得了更高的城際高鐵客流量預測精度。
[關鍵詞]EGA;高鐵客流量預測;EMD;GRNN;ARIMA模型
[DOI]10.13939/j.cnki.zgsc.2021.04.026
1 前言
由于城際高鐵客運系統(tǒng)受到多種復雜因素的共同作用,其客流量數(shù)據(jù)序列呈現(xiàn)出不平穩(wěn)與波動性特征。GRNN具有很強的非線性映射能力和柔性網(wǎng)絡結(jié)構(gòu)以及高度的容錯性和魯棒性,適用于解決非線性問題,但在對某些接連的點處,數(shù)據(jù)值有較大波動的數(shù)據(jù)預測擬合曲線仍十分接近直線。而經(jīng)驗模態(tài)分解后的數(shù)據(jù)極大地消除了數(shù)據(jù)的不平穩(wěn)特性,可提高神經(jīng)網(wǎng)絡預測的準確性。模態(tài)分解后的數(shù)據(jù)序列,頻率是逐漸減小的。所以可對低頻的數(shù)據(jù)使用ARIMA模型擬合,對高頻數(shù)據(jù)用廣義回歸神經(jīng)網(wǎng)絡擬合。為提高城際高鐵客流量預測精度,文章將經(jīng)驗模態(tài)分解、廣義回歸神經(jīng)網(wǎng)絡、ARIMA模型相結(jié)合(文中以下簡稱EGA模型),通過以上思路預測高鐵客流量。
2 EGA模型
2.1 廣義回歸神經(jīng)網(wǎng)絡GRNN
廣義回歸神經(jīng)網(wǎng)絡(Generalized Regression Neural Network,GRNN),由美國學者Specht在1991年提出,是徑向基神經(jīng)網(wǎng)絡的一種,GRNN具有很強的非線性映射能力和柔性網(wǎng)絡結(jié)構(gòu)以及高度的容錯性和魯棒性,適用于解決非線性問題。對于小樣本與不平穩(wěn)的數(shù)據(jù)也有較強的處理能力。GRNN由四層組成,分別為輸入層、模式層、求和層和輸出層。理論基礎是非線性回歸分析,Y相對于X的回歸分析實際上是計算具有最大概率值的y。
2.2 EMD
經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD),是由美國國家宇航局華裔科學家Norden e Huang博士于1998年提出的一種新的處理非平穩(wěn)信號的方法。經(jīng)驗模態(tài)分解法能使非平穩(wěn)數(shù)據(jù)進行平穩(wěn)化處理。與短時傅立葉變換、小波分解等方法相比,這種方法是直觀的、直接的、后驗的和自適應的,因為基函數(shù)是由數(shù)據(jù)本身所分解得到。由于分解是基于信號序列時間尺度的局部特性,因此具有自適應性。
2.3 ARIMA模型
ARIMA模型是對數(shù)據(jù)進行差分后建立ARMA模型。由于建立ARMA模型的前提條件是時間序列的均值和方差沒有發(fā)生系統(tǒng)變化,ARMA模型要求數(shù)據(jù)具有平穩(wěn)性的特性。差分是對求導的近似,數(shù)據(jù)在差分后具有很好的平穩(wěn)性。
2.4 模型構(gòu)建
EGA模型首先通過EMD算法對城際高鐵客流量數(shù)據(jù)進行分解處理,再對分解得到的各階數(shù)據(jù)分別建立GRNN預測模型與ARIMA預測模型,通過預測的結(jié)果確定兩模型對數(shù)據(jù)的適用階數(shù),然后對相應的數(shù)據(jù)進行擬合預測,將得到的各預測值進行相加重構(gòu),得到模型的預測結(jié)果。
3 實證研究
3.1 數(shù)據(jù)描述
以某城際高鐵站日客流量數(shù)據(jù)為例進行實證研究,時間區(qū)段為2017年1月1日至2017年12月31日,共365個樣本。
圖1為某城際高鐵站日客流量曲線圖,從中可直觀看出,城際高鐵站日客流量序列具有明顯的波動性和不平穩(wěn)性。
3.2 EMD分解與模型階數(shù)的確定
圖2為某城際高鐵站日客流量EMD分解結(jié)果,圖3為ARIMA模型和GRNN模型對分解數(shù)據(jù)的預測誤差。由誤差曲線對前三階數(shù)據(jù)使用GRNN模型進行擬合,對其他階數(shù)據(jù)使用ARIMA模型進行擬合。
3.3 預測與結(jié)果分析
在365個樣本中,取第355天到第364天的數(shù)據(jù)為需要預測的數(shù)據(jù),之前的數(shù)據(jù)作為已知的數(shù)據(jù)進行擬合預測。
為了比較預測效果,文章選用RMSE、MAE、MPE以及西爾統(tǒng)計量(Theil)共四項評價指標比較模型的預測性能,四項指標的計算公式如下:
其中,yt和t分別為日客流量的實際值和預測值,N為預測樣本個數(shù)。以上指標值越小,表明模型的預測性能越好。
表1列出了GRNN模型和EMD-GRNN模型的預測結(jié)果。由表1可知,在所選取的樣本期內(nèi),W-ARIMA模型的預測性能明顯優(yōu)于ARIMA模型,主要體現(xiàn)W-ARIMA模型的RMSE、MAE、MPE和Theil值均小于ARIMA模型的對應值。
圖4給出了EGA模型和FRNN模型的預測值曲線圖。由圖4可看出,EGA模型較好地預測出城際高鐵客流量每日流量,客運量預測值均比較接近于實際值,而GRNN模型的客流量預測值在某些連續(xù)點與每日實際值偏差較大。
4 結(jié)論
文章提出一種結(jié)合經(jīng)驗模態(tài)分解,GRNN,ARIMA模型的高鐵客流量預測模型。實證研究結(jié)果表明,該模型與GRNN相比,城際高鐵客流量預測能力更強。
參考文獻:
[1]胡愛軍,孫敬敬,向玲.經(jīng)驗模態(tài)分解中的模態(tài)混疊問題[J].振動.測試與診斷,2011,31(4):429-434.
[2]BOX G E P,JENKINS G M.Time series analysis:forecasting and control[M].San Francisco:Holden Day,1976.
[3]耿立艷.基于波動聚集性的城際高鐵客流量預測[J].鐵道科學與工程學報,2019,16(8) :1891-1892.
[4]楊叔子.時間序列分析的工程應用(上冊)[M].2版.武漢:華中科技大學出版社,2007:236-237.
[5]珀西瓦爾.時間序列的小波方法[M].北京:機械工業(yè)出版社,2004.
[基金項目]國家自然科學基金青年項目(項目編號:61503261);2019年度河北省人才培養(yǎng)工程項目(項目編號:A201901048);2019年中國物流學會、中國物流與采購聯(lián)合會面上研究課題(項目編號:2019CSLKT3-020)。
[作者簡介]耿立艷(1979—),女,漢族,天津人,博士,教授,碩士生導師,研究方向:鐵路規(guī)劃與運輸管理。