成 云,成孝剛,談苗苗,周 凱,李海波
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
基于ARIMA和小波神經(jīng)網(wǎng)絡(luò)組合模型的交通流預(yù)測(cè)
成 云,成孝剛,談苗苗,周 凱,李海波
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
針對(duì)現(xiàn)階段城市道路交通流預(yù)測(cè)精度不高的局限性,提出了一種基于差分自回歸滑動(dòng)平均(ARIMA)和小波神經(jīng)網(wǎng)絡(luò)(WNN)組合模型的預(yù)測(cè)方法來(lái)進(jìn)行交通流預(yù)測(cè)。利用差分自回歸滑動(dòng)平均模型良好的線性擬合能力和小波神經(jīng)網(wǎng)絡(luò)模型強(qiáng)大的非線性關(guān)系映射能力,把交通流時(shí)間序列的數(shù)據(jù)結(jié)構(gòu)分解為線性自相關(guān)結(jié)構(gòu)和非線性結(jié)構(gòu)兩部分。采用差分自回歸滑動(dòng)平均模型預(yù)測(cè)交通流序列的線性部分,用小波神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)其非線性殘差部分,最終合成為整個(gè)交通流序列的預(yù)測(cè)結(jié)果。計(jì)算機(jī)仿真結(jié)果表明:組合模型的預(yù)測(cè)精度高于ARIMA模型和WNN模型各自單獨(dú)使用時(shí)的預(yù)測(cè)精度,組合模型可以提高交通流預(yù)測(cè)精度,是交通流預(yù)測(cè)的有效方法。
交通流預(yù)測(cè);差分自回歸滑動(dòng)平均模型;小波神經(jīng)網(wǎng)絡(luò);組合模型
準(zhǔn)確實(shí)時(shí)的交通流信息在智能交通系統(tǒng)中起著十分重要的作用,因此交通流預(yù)測(cè)受到廣泛關(guān)注[1]。其主要預(yù)測(cè)方法包括3種:基于線性理論的預(yù)測(cè)方法、基于知識(shí)發(fā)現(xiàn)的智能模型預(yù)測(cè)方法、基于非線性理論的預(yù)測(cè)方法[2]。其中一些預(yù)測(cè)方法在交通流預(yù)測(cè)應(yīng)用中取得了不錯(cuò)的預(yù)測(cè)效果,但是單個(gè)預(yù)測(cè)方法并不適用于所有交通狀態(tài),同時(shí)實(shí)際的交通流往往既有線性特征,又有非線性特征,僅采用某一種預(yù)測(cè)模型,難以很
好地反映出時(shí)間序列的線性與非線性雙重特征,所以應(yīng)該依據(jù)交通流的實(shí)際情況來(lái)選取合適的預(yù)測(cè)模型。為了更好地發(fā)揮各種模型的預(yù)測(cè)優(yōu)勢(shì),在1969年Bates等提出組合預(yù)測(cè)理論,即把多種預(yù)測(cè)方法組合起來(lái)以獲得更好的預(yù)測(cè)效果。Zhang在預(yù)測(cè)太陽(yáng)黑子的問(wèn)題中也采用了組合模型,其預(yù)測(cè)效果比單個(gè)模型更好[3]。
文中使用差分自回歸滑動(dòng)平均(ARIMA)模型和小波神經(jīng)網(wǎng)絡(luò)(WNN)模型相結(jié)合的方法來(lái)預(yù)測(cè)交通流,利用兩種模型各自的優(yōu)點(diǎn)來(lái)提高交通流的預(yù)測(cè)精度。
1.1 ARIMA模型
1.1.1 ARIMA基本理論
ARIMA是由自回歸滑動(dòng)平均模型(ARMA)擴(kuò)展而來(lái)。該模型首先對(duì)非平穩(wěn)時(shí)間序列作多次差分使其成為平穩(wěn)時(shí)間序列,d即為差分次數(shù),再對(duì)差分后的序列建立參數(shù)為p、q的ARMA模型,然后由反變換得到原來(lái)的非平穩(wěn)時(shí)間序列[4-5]。參數(shù)為p、d、q的ARIMA模型預(yù)測(cè)方程如下:
yt=θ0+φ1yt-1+φ2yt-2+…+φpyt-p+εt-θ1εt-1-θ2εt-2-…-θqεt-q
(1)
p、d、q是模型的階數(shù),由不同的p、d、q組合測(cè)試可以找到最合適的模型參數(shù)[6]。
1.1.2ARIMA算法步驟
ARIMA建模與預(yù)測(cè)包含四個(gè)步驟[7],如下所示:
(1)序列平穩(wěn)化處理。
(2)模型識(shí)別。一般根據(jù)自相關(guān)系數(shù)與偏自相關(guān)系數(shù)來(lái)確定ARIMA模型的階數(shù)p和q。
(3)參數(shù)估計(jì)和模型診斷。
(4)用所選取參數(shù)的模型來(lái)預(yù)測(cè)時(shí)間序列。
1.2 小波神經(jīng)網(wǎng)絡(luò)模型
1.2.1 小波神經(jīng)網(wǎng)絡(luò)基本理論
WNN是以誤差反傳神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ)的網(wǎng)絡(luò),與BP神經(jīng)網(wǎng)絡(luò)類(lèi)似。在小波神經(jīng)網(wǎng)絡(luò)中,信號(hào)向前傳播的同時(shí),誤差反向傳播,不同的是小波神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)的傳遞函數(shù)為小波基函數(shù)[8]。WNN拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 WNN拓?fù)浣Y(jié)構(gòu)
圖1中,X1,X2,…,Xk是WNN的輸入?yún)?shù);Y1,Y2,…,Ym是預(yù)測(cè)的輸出值,即需要求得的最終結(jié)果;wij和wjk為網(wǎng)絡(luò)連接權(quán)重值。
當(dāng)輸入交通流量樣本序列為xi(i=1,2,…,k)時(shí),隱含層輸出為:
(2)
其中,h(j)為隱含層第j個(gè)節(jié)點(diǎn)的輸出;wij為輸入層和隱含層的連接權(quán)重值;aj為小波基函數(shù)hj的伸縮因子;bj為hj的平移因子;hj為小波基函數(shù)[9]。
文中的小波基函數(shù)是Morlet母小波基函數(shù),公式為:
(3)
小波神經(jīng)網(wǎng)絡(luò)輸出層計(jì)算公式為:
(4)
其中,wik為隱含層到輸出層的網(wǎng)絡(luò)連接權(quán)重值;h(i)為第i個(gè)隱含層節(jié)點(diǎn)的輸出;l為隱含層節(jié)點(diǎn)個(gè)數(shù);m為輸出層節(jié)點(diǎn)個(gè)數(shù)[10]。
小波神經(jīng)網(wǎng)絡(luò)權(quán)值修正是通過(guò)梯度修正法來(lái)修正網(wǎng)絡(luò)的權(quán)值和小波函數(shù)參數(shù),使得網(wǎng)絡(luò)預(yù)測(cè)輸出不斷接近期望輸出。步驟如下:
(1)計(jì)算網(wǎng)絡(luò)預(yù)測(cè)誤差。
(5)
其中,y(k)為交通流的預(yù)測(cè)輸出結(jié)果;yn(k)為交通流的期望輸出結(jié)果。
(2)通過(guò)預(yù)測(cè)誤差e修正相關(guān)系數(shù)和網(wǎng)絡(luò)權(quán)重值。
(6)
(7)
(8)
(9)
(10)
(11)
其中,η代表學(xué)習(xí)速率。
1.2.2 小波神經(jīng)網(wǎng)絡(luò)算法步驟
WNN訓(xùn)練算法步驟[11]如下:
(1)網(wǎng)絡(luò)初始化。需要初始化的有伸縮因子、平移因子、網(wǎng)絡(luò)權(quán)重值、學(xué)習(xí)速率。
(2)樣本分類(lèi)。把樣本分為訓(xùn)練樣本和測(cè)試樣本。
(3)預(yù)測(cè)輸出。輸入訓(xùn)練樣本,獲得預(yù)測(cè)輸出,計(jì)算預(yù)測(cè)輸出與期望輸出的誤差。
(4)進(jìn)行權(quán)值修正。通過(guò)誤差修正網(wǎng)絡(luò)權(quán)值和小波函數(shù)參數(shù),使誤差控制在一定范圍之內(nèi)。
(5)判斷算法是否結(jié)束,如果沒(méi)有,返回步驟(3)。
網(wǎng)絡(luò)訓(xùn)練完成后,輸入測(cè)試樣本,根據(jù)預(yù)測(cè)輸出結(jié)果與測(cè)試樣本輸出的對(duì)比來(lái)評(píng)估WNN的性能。綜上所述,基于WNN的交通流預(yù)測(cè)流程如圖2所示。
圖2 基于WNN的交通流預(yù)測(cè)流程
1.3 組合模型
實(shí)際的時(shí)間序列往往既有線性特征,又有非線性特征[12-13],僅用ARIMA或WNN都不能很好地反映出時(shí)間序列的線性與非線性雙重特征。因此,它們的組合模型的預(yù)測(cè)精度可能比其單一模型更高。
把交通流時(shí)間序列的數(shù)據(jù)yt分解為線性Lt和非線性Nt[14-15],即:
yt=Lt+Nt
(12)
組合模型預(yù)測(cè)包含三個(gè)步驟:
(13)
et=f(et-1,et-2,…,et-n)+εt
(14)
其中,εt表示隨機(jī)誤差。
(15)
實(shí)驗(yàn)中的交通流數(shù)據(jù)是運(yùn)用美國(guó)加州高速公路通行能力度量系統(tǒng)(Caltrans Performance Measurement System,PeMS)數(shù)據(jù)庫(kù)中連續(xù)五天的交通數(shù)據(jù),數(shù)據(jù)采樣間隔為5 min,數(shù)據(jù)總數(shù)量達(dá)到1 440,選擇前四天的數(shù)據(jù)作為樣本,對(duì)第五天的交通流進(jìn)行預(yù)測(cè)。
方法1:?jiǎn)为?dú)使用ARIMA模型進(jìn)行預(yù)測(cè)。首先對(duì)原始交通流數(shù)據(jù)作平穩(wěn)化處理,再根據(jù)已平穩(wěn)的時(shí)間序列的自相關(guān)函數(shù)與偏自相關(guān)函數(shù)圖以及AIC最小準(zhǔn)則,獲得模型參數(shù)p,d,q,然后利用該模型進(jìn)行預(yù)測(cè)。用Matlab實(shí)現(xiàn)仿真。
方法2:?jiǎn)为?dú)使用WNN模型進(jìn)行預(yù)測(cè),文中的WNN結(jié)構(gòu)為3-8-1,即輸入層3個(gè)節(jié)點(diǎn),隱含層8個(gè)節(jié)點(diǎn),輸出層1個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)反復(fù)訓(xùn)練500次。將前三天的數(shù)據(jù)用于訓(xùn)練網(wǎng)絡(luò),第四天的數(shù)據(jù)用于測(cè)試網(wǎng)絡(luò)。這一過(guò)程使用Matlab實(shí)現(xiàn)。
使用平均絕對(duì)百分誤差(MAPE)來(lái)評(píng)估算法的預(yù)測(cè)性能。
圖3 3種模型的交通流預(yù)測(cè)仿真結(jié)果
(16)
MAPE越小,預(yù)測(cè)誤差越小,模型的預(yù)測(cè)效果就越好。
用上述3種方法仿真(ARIMA模型、WNN模型、組合模型)獲得的交通流預(yù)測(cè)值和交通流實(shí)際測(cè)量值的對(duì)比見(jiàn)圖3。3種算法的平均絕對(duì)百分誤差對(duì)比見(jiàn)表1。
表1 3種方法的平均絕對(duì)百分誤差對(duì)比
由表1可得:組合模型的MAPE最小,表明組合模型的預(yù)測(cè)效果最好。
在交通流預(yù)測(cè)中,由于實(shí)際的交通流往往既有線性特征,又有非線性特征,僅采用某一種預(yù)測(cè)模型,難以很好地反映出時(shí)間序列的線性與非線性雙重特征。因此提出一種ARIMA與WNN的組合模型來(lái)預(yù)測(cè)交通流。用ARIMA模型預(yù)測(cè)交通流序列的線性部分,用WNN模型預(yù)測(cè)其非線性殘差部分,最后相加得到整個(gè)序列的預(yù)測(cè)結(jié)果。通過(guò)計(jì)算機(jī)仿真實(shí)驗(yàn),證明該組合模型比單個(gè)預(yù)測(cè)模型有更好的預(yù)測(cè)效果。
[1]DaraghmiYA,YiCW,ChiangTC.Negativebinomialadditivemodelsforshort-termtrafficflowforecastinginurbanareas[J].IEEETransactionsonIntelligentTransportationSystems,2014,15(2):784-793.
[2]TeselentisDI,VlahgianniEI,KarlaftisMG.Improvingshort-termtrafficforecasts:tocombinemodelsornottocombine?[J].IETIntelligentTransportSystems,2014,9(2):193-201.
[3]ZhangDC,WangSF.AnovellongtermtrafficforecastalgorithmandcasestudyforChina[C]//Internationalconferenceonadvancedinformationnetworkingandapplicationsworkshops.[s.l.]:[s.n.],2014.
[4]ChanKY,DillonTS,SinghJ,etal.Neural-network-basedmodelsforshort-termtrafficflowforecastingusingahybridexponentialsmoothingandLevenberg-Marquardtalgorithm[J].IEEETransactionsonIntelligentTransportationSystems,2012,13(2):644-654.
[5]WeiW,MaH.ARMAmodelandwavelet-basedARMAmodelapplication[J].AppliedMechanicsandMaterials,2011,121-126:1799-1803.
[6]ErdemE,ShiJ.ARMAbasedapproachesforforecastingthetupleofwindspeedanddirection[J].AppliedEnergy,2011,88(4):1405-1414.
[7]WangL,ZouH,SuJ,etal.AnARIMA-ANNhybridmodelfortimeseriesforecasting[J].SystemsResearchandBehavioralScience,2013,30(3):244-259.
[8]RenCX,WangCB,YinCC,etal.Thepredictionofshort-termtrafficflowbasedonthenichegeneticalgorithmandBPneuralnetwork[M].Berlin:Springer,2012:775-781.
[9]LiuZB,YangZS,GaoP.Researchontheshort-termtrafficflowpredictionmethodbasedonBPneuralnetworks[C]//Worldautomationcongress.[s.l.]:[s.n.],2012.
[10]JiaJ.FinancialtimeseriespredictionbasedonBPneuralnetwork[J].AppliedMechanicsandMaterials,2014,631-632:31-34.
[11] 武志勇,劉東升.小波神經(jīng)網(wǎng)絡(luò)在液壓裝置壓力測(cè)試中的應(yīng)用[J].電子測(cè)量技術(shù),2010,33(12):91-94.
[12]KhasheiM,BijariM.AnovelhybridizationofartificialneuralnetworksandARIMAmodelsfortimeseriesforecasting[J].AppliedSoftComputing,2011,11(2):2664-2675.
[13] 王 堃,陳濤濤,李 雪,等.基于Matlab的小波神經(jīng)網(wǎng)絡(luò)參考作物騰發(fā)量預(yù)測(cè)模型研究[J].沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,44(4):457-460.
[14] 趙成柏,毛春梅.基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型的我國(guó)碳排放強(qiáng)度預(yù)測(cè)[J].長(zhǎng)江流域資源與環(huán)境,2012,21(6):665-671.
[15] 熊志斌.基于ARIMA與神經(jīng)網(wǎng)絡(luò)集成的GDP時(shí)間序列預(yù)測(cè)研究[J].數(shù)理統(tǒng)計(jì)與管理,2011,30(2):306-314.
Traffic Flow Prediction Based on Hybrid Model of ARIMA and WNN
CHENG Yun,CHENG Xiao-gang,TAN Miao-miao,ZHOU Kai,LI Hai-bo
(School of Telecommunications and Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Aimed at the limitation of low prediction accuracy at the present stage of city road traffic,a prediction method is proposed based on Hybrid Autoregressive Integrated Moving Average (ARIMA) and Wavelet Neural Network (WNN) to predict traffic flow.Using the good linear fitting ability of ARIMA and the strong nonlinear mapping ability of WNN,the traffic flow time series are considered to be composed of a linear autocorrelation structure and a nonlinear structure.ARIMA model is used to predict the linear component of traffic flow time series and the wavelet neural network model is applied to the nonlinear residual component prediction.The simulation results show that the hybrid model can produce more accurate prediction than that of single model,which improves prediction accuracy of traffic flow prediction,and it’s an efficient method.
traffic flow prediction;ARIMA model;wavelet neural network;hybrid model
2016-03-27
2016-06-28
時(shí)間:2017-01-04
國(guó)家自然科學(xué)基金資助項(xiàng)目(61401236);南京郵電大學(xué)引進(jìn)人才項(xiàng)目(NY214005)
成 云(1994-),女,研究方向?yàn)榻煌黝A(yù)測(cè)在智能交通系統(tǒng)中的應(yīng)用;成孝剛,講師,研究方向?yàn)榻煌黝A(yù)測(cè)在智能交通系統(tǒng)中的應(yīng)用和霧霾能見(jiàn)度檢測(cè)。
http://www.cnki.net/kcms/detail/61.1450.TP.20170104.1039.072.html
U491112
A
1673-629X(2017)01-0169-04
10.3969/j.issn.1673-629X.2017.01.038