張婷婷,張武雄,裴冬,趙鋮,俞涵
(1.中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海200050;2.上??萍即髮W(xué),上海201210;3.上海無線通信研究中心,上海201210)
研究與開發(fā)
基于自回歸模型與神經(jīng)網(wǎng)絡(luò)模型的車流量預(yù)測對比
張婷婷1,2,張武雄1,3,裴冬1,2,趙鋮1,2,俞涵1,2
(1.中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海200050;2.上??萍即髮W(xué),上海201210;3.上海無線通信研究中心,上海201210)
車流量建模是車聯(lián)網(wǎng)(vehicular Ad Hoc network,VANET)路由、多媒體接入?yún)f(xié)議、無線算法設(shè)計的基礎(chǔ)。準(zhǔn)確的車流量模型將對智能交通系統(tǒng)(intelligent transportation system,ITS)實時調(diào)度和車聯(lián)網(wǎng)的信息安全起到十分重要的作用?;谏虾J械慕煌髁繑?shù)據(jù),利用自回歸(auto regressive,AR)模型與神經(jīng)(back-propagation,BP)網(wǎng)絡(luò)模型對車流量實測數(shù)據(jù)進(jìn)行了仿真對比,給出了相應(yīng)的預(yù)測結(jié)果。研究發(fā)現(xiàn),兩個模型均能有效地對數(shù)據(jù)進(jìn)行跟蹤與預(yù)測,但對不同時段數(shù)據(jù)預(yù)測的準(zhǔn)確性有所不同。研究結(jié)果將為未來智能交通應(yīng)用、車聯(lián)網(wǎng)的理論研究等提供有力依據(jù)。
車聯(lián)網(wǎng);智能交通;自回歸模型;神經(jīng)網(wǎng)絡(luò)模型;交通流量預(yù)測
汽車已成為人們出行的重要交通工具?!?014年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報》統(tǒng)計數(shù)據(jù)顯示,2014年末,全國民用汽車保有量達(dá)15 447萬輛(包括三輪汽車和低速貨車),較2013年末增長了12.4%,其中私人汽車保有量達(dá)12 584萬輛,增長了15.5%;民用轎車保有量達(dá)8 307萬輛,增長了16.6%,其中私人轎車7 590萬輛,增長了18.4%[1]?!?014年交通運輸行業(yè)發(fā)展統(tǒng)計公報》統(tǒng)計數(shù)據(jù)顯示,2014年末,我國公路總里程達(dá)446.39萬公里,較2013年末增加了10.77萬公里;公路密度為46.50公里/百平方公里,提高了1.12公里/百平方公里,其中全國高速公路里程達(dá)11.19萬公里,較2013年末增加了0.75萬公里[2]。中國公路和車輛的迅速增長給智能交通系統(tǒng)(ITS)和車聯(lián)網(wǎng)(VANET)帶來了無比廣闊的市場前景。
ITS是未來交通系統(tǒng)的發(fā)展方向,它將先進(jìn)的信息技術(shù)、數(shù)據(jù)通信傳輸技術(shù)、電子傳感技術(shù)、控制技術(shù)以及計算機(jī)技術(shù)等集成運用于整個地面交通管理系統(tǒng),從而構(gòu)成實時、準(zhǔn)確、高效的綜合交通運輸管理系統(tǒng)。ITS可以有效地利用已有的交通設(shè)施,減少交通帶來的環(huán)境污染,保證交通安全,提高運輸效率等,正越來越多地受到世界各國的重視。
VANET主要應(yīng)用于高速公路或者行駛車道上關(guān)于車輛安全信息和行駛環(huán)境信息發(fā)布的數(shù)據(jù)控制和數(shù)據(jù)通信。作為輔助ITS的一項重要功能,VANET通過實時發(fā)布車輛的行駛環(huán)境信息,針對未來車流量進(jìn)行預(yù)測,以避免道路堵塞。車流量信息的準(zhǔn)確預(yù)測對于減少意外事故、緩解交通壓力、提高道路網(wǎng)絡(luò)的暢通能力、減少環(huán)境污染等,均起著重要作用。
對交通流量的建模,已有人做了部分研究,例如,參考文獻(xiàn)[3]主要講述了高速公路中誘導(dǎo)交通量變化的參數(shù)及模型設(shè)定,提出了使用曲線模型預(yù)測誘增交通量,它主要針對交通量的增加做了預(yù)測,但并未對同一地區(qū)不同時間段的交通量做出實時預(yù)測;參考文獻(xiàn)[4,5]重點對時間序列模型進(jìn)行了分析,雖然參考文獻(xiàn)[5]提到了基于AR模型的車流量分析,但并未提及與BP模型所做預(yù)測準(zhǔn)確性的對比;參考文獻(xiàn)[6]重點闡述了AR模型的原理和參數(shù)估計的MATLAB仿真,但并未對實測的交通量進(jìn)行驗證。與這些研究不同,本文采集了上海市大量的交通流量數(shù)據(jù),并利用AR模型和BP模型分別進(jìn)行了建模,利用MATLAB進(jìn)行了仿真對比,結(jié)果發(fā)現(xiàn),兩種模型對數(shù)據(jù)的預(yù)測各有優(yōu)缺點。本文所述之預(yù)測方法與結(jié)果將對車聯(lián)網(wǎng)的研究與智能交通的應(yīng)用提供支持。
目前道路車流量檢測手段主要有3種:埋入地下的線圈檢測、超聲波檢測和圖像處理技術(shù)檢測車輛的計算機(jī)處理系統(tǒng)。本文所用數(shù)據(jù)來源于2012年上海市交通信息中心所測的真實數(shù)據(jù),主要手段是結(jié)合埋入地下的線圈和視頻監(jiān)控系統(tǒng)。對獲得的數(shù)據(jù)進(jìn)行了整理,得到了每半個小時通過的車流量數(shù)據(jù)。
對車流量的預(yù)測方法有很多,主要分為線性預(yù)測和非線性預(yù)測兩大類。其中線性預(yù)測以ARIMA自回歸積分滑動平均模型(autoregressive integrated moving average model)最為著名,它包括移動平均(MA)過程、自回歸(auto regressive,AR)過程、自回歸移動平均(ARMA)過程以及ARIMA過程。本文重點討論自回歸過程AR模型的預(yù)測方法,非線性部分主要基于BP網(wǎng)絡(luò),文章基于真實數(shù)據(jù)對兩種方法進(jìn)行了討論和比較,以期獲得更精準(zhǔn)的預(yù)測方法。
AR模型是一種線性預(yù)測,通過已知的N個點可以預(yù)測出未來P個點的值;AR模型能準(zhǔn)確分析出各個變量間的相關(guān)性,檢驗回歸方程擬合程度,提高預(yù)測效果,對于統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)其輸出結(jié)果唯一[7]。BP模型是一種非線性預(yù)測模型,通過對已知數(shù)據(jù)不同程度的學(xué)習(xí),對數(shù)據(jù)進(jìn)行預(yù)測;BP模型具有很好的容錯性和頑健性,具有非線性映射特性,同時可以集成定性數(shù)據(jù)和定量數(shù)據(jù)[3]。
ARIMA自回歸積分滑動平均模型是20世紀(jì)70年代初由Box和Jenkins提出的著名的時間序列預(yù)測方法[4],故又稱之為Box-Jenkins模型。ARIMA模型是指將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后因變量僅對它的滯后值以及隨機(jī)誤差項的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型。使用ARIMA(p,d,q)描述差分自回歸移動平均模型,其中AR是自回歸,p為自回歸項,MA為移動平均,q為移動平均項數(shù),d為時間序列成為平穩(wěn)時所做的差分次數(shù)。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括MA過程、AR過程、ARMA過程以及ARIMA過程。
AR模型是描述動態(tài)模型的一種常見模型結(jié)構(gòu)。其數(shù)學(xué)表達(dá)式可以表述為[5]:
其中,e(k)為預(yù)測的誤差,其均值E[e(k)]=0,方差Var[e(k)]=σ2。將式(1)改寫成完整的形式,如式(2)所示:
其中,AR模型參數(shù)估計是對θ(k)這n個參數(shù)的估計。參數(shù)估計的方法主要有最小二乘法、解Yule-Walker方程法、LUD法、BSMF等。其中最小二乘法估計簡單且參數(shù)估計無偏、精度高。本文采用最小二乘法對θ(k)進(jìn)行參數(shù)估計,如式(4)所示,然后選取合適的模型適用性檢驗標(biāo)準(zhǔn),如Akiake信息檢驗標(biāo)準(zhǔn)FPE(final prediction error)、AIC(an information criterion)、BIC(bayesian information criterion)準(zhǔn)則等[6],再將代回到式(1)中,即可完成對后續(xù)車流量的預(yù)測工作。
上述使用AR模型進(jìn)行預(yù)測的方法步驟可以總結(jié)為:先對樣本進(jìn)行預(yù)處理,對非平穩(wěn)時間序列進(jìn)行差分、消除趨勢項等操作,變?yōu)槠椒€(wěn)時間序列;其次進(jìn)行相應(yīng)的參數(shù)估計,對模型進(jìn)行檢驗,得到時間序列的初步模型;最后進(jìn)行預(yù)測。
Rumelhart、McClelland等人[8]在1982年成立了PDP小組,研究并行分布信息處理方法,探索人類認(rèn)知的結(jié)構(gòu),1985年發(fā)展了BP網(wǎng)絡(luò)(back-propagation network)[9]。BP網(wǎng)絡(luò)核心思想主要集中在以下兩方面:正向傳播過程,給出輸入信息,經(jīng)過輸入層到隱含層逐層處理并計算每個單元的實際輸出值;反向傳播過程,若在輸出層未能得到期望輸出值,則逐層遞歸地計算實際輸出與期望輸出之差,即誤差,以便據(jù)此差值調(diào)節(jié)權(quán)重,使誤差減少。這兩個過程的反復(fù)運用使誤差信號逐漸減少,直至誤差達(dá)到要求時,網(wǎng)絡(luò)的學(xué)習(xí)過程才結(jié)束。BP網(wǎng)絡(luò)結(jié)構(gòu)模型如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型
同其他人工神經(jīng)網(wǎng)絡(luò)類似,神經(jīng)元是組成神經(jīng)網(wǎng)絡(luò)的重要組成部分,其網(wǎng)絡(luò)結(jié)構(gòu)中神經(jīng)元模型如圖2所示。根據(jù)BP算法的需求,必須采用處處可導(dǎo)的激活函數(shù),S型函數(shù)是最為常用的,可將神經(jīng)元的網(wǎng)絡(luò)輸入表述如下:
圖2 每一個神經(jīng)元的模型
其中,x1,x2,…,xn是圖1中該神經(jīng)元的輸入,wj1,wj2,…,wjn是對應(yīng)輸入的權(quán)重。因此,神經(jīng)元對應(yīng)的輸出是:
簡單來說,上述兩個核心思想可理解為BP網(wǎng)絡(luò)分為3層:輸入層、隱含層和輸出層。每個層之間、每兩個節(jié)點之間都有一個權(quán)值w,每一個節(jié)點都有一個閾值b,并且還有一個激活函數(shù)f(·),將神經(jīng)元組合起來,便可得到整個BP網(wǎng)絡(luò)的模型,如圖1所示。
綜上所述,可將BP網(wǎng)絡(luò)的構(gòu)建分為樣本選取、網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(即確定網(wǎng)絡(luò)層數(shù)的各項參數(shù))、網(wǎng)絡(luò)拓?fù)湓O(shè)計(主要是網(wǎng)絡(luò)輸出層的激活函數(shù))、網(wǎng)絡(luò)初始化、網(wǎng)絡(luò)訓(xùn)練和網(wǎng)絡(luò)預(yù)測6部分。其中網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計對BP網(wǎng)絡(luò)的預(yù)測精準(zhǔn)性起著至關(guān)重要的作用,而網(wǎng)絡(luò)層數(shù)的選擇主要有如下兩個依據(jù)。
(1)Kolmogorov定理
給定任意連續(xù)函數(shù)f:Un→Rm,f(X)=Y,此處U是閉單位區(qū)間[0,1],f可以精確地用一個三層前向網(wǎng)絡(luò)實現(xiàn),此網(wǎng)絡(luò)的第一層(即輸入層)有n個神經(jīng)元,中間層有2n+1個神經(jīng)元,第三層(即輸出層)有個m神經(jīng)元。
(2)BP定理
給定任意ε>0和任意函數(shù)f:[0,1]n→Rm,存在一個三層BP網(wǎng)絡(luò),它可在任意ε平方誤差精度內(nèi)逼近f。
根據(jù)Kolmogorov定理和BP定理,選取5×11×1的網(wǎng)絡(luò)結(jié)構(gòu),激活函數(shù)為transig函數(shù),學(xué)習(xí)速率為0.7,標(biāo)準(zhǔn)誤差為0.01,開展BP模型的車流量預(yù)測MATLAB仿真。
對AR模型和BP模型進(jìn)行仿真,得到如圖3所示的結(jié)果,BP預(yù)測輸出和AR預(yù)測輸出這兩條線都能很好地與期望輸出相匹配,即AR模型和BP模型都可有效預(yù)測實際車流量的數(shù)值。
表1描述了AR模型的誤差和BP模型與真實車流量數(shù)據(jù)的誤差,根據(jù)平均誤差的計算式(7),可以計算得到AR模型的平均誤差為0.008、BP模型的平均誤差為0.118 6。使用式(8)可以計算得到其均方誤差,AR模型均方誤差為0.014 8、BP模型的均方誤差為0.005 6。
從表1可以看出,10:00-16:00這個時間段,AR模型明顯優(yōu)于BP模型,這是因為這個時間段的車流量數(shù)據(jù)具有一定的線性相關(guān)性,車流量變化的數(shù)量級不是特別明顯;18:00-21:00時間段,BP模型的誤差明顯小于AR模型,這是因為此時公路上的車流量已經(jīng)不如白天的車流量數(shù)據(jù)那樣有很強(qiáng)的相關(guān)性;其他時間段兩者的預(yù)測結(jié)果不相上下,這可能跟夜晚車流量變化較大有關(guān)。
圖3 基于BP-AR模型的車流量預(yù)測
表1 基于BP模型和AR模型的誤差比較
從以上分析可知,預(yù)測數(shù)據(jù)的準(zhǔn)確性與選擇的模型密切相關(guān),但總體而言,AR模型和BP模型都具備對車流量進(jìn)行預(yù)測的能力。
AR模型與BP模型都能很好地預(yù)測未來車流量的變化情況,但從引入的平均誤差而言,AR模型具有更好的預(yù)測能力;從均方誤差而言,BP模型的誤差相對更集中。因此,針對不同的車流量數(shù)據(jù)特點,需權(quán)衡選用合適的模型。本文所述研究與仿真結(jié)果將為今后VANET的車流量預(yù)測提供理論和結(jié)果依據(jù)。
[1]中華人民共和國國家統(tǒng)計局.2014年國民經(jīng)濟(jì)和社會發(fā)展統(tǒng)計公報[R/OL].(2015-02-26)[2015-02-26].http://www.stats.gov.cn/tjsj/zxfb/201502/t20150226_685799.html.National Bureau of Statistics of China.Statistical Communiqué of the People’s Republic of China on the 2014 National Economic and Social Development[R/OL].(2015-02-26)[2015-02-26].http://www.stats.gov.cn/tjsj/zxfb/201502/t20150226_685799.html.
[2]中華人民共和國交通運輸部.2014年交通運輸行業(yè)發(fā)展統(tǒng)計公報[R/OL].(2015-04-30)[2015-04-30].http://www.moc.gov.cn/zfxxgk/bnssj/zhghs/201504/t20150430_1810598.html Ministry of Transport of the People’s Republic of China.Statistical bulletin of transportation industry development in 2014[R/OL].(2015-04-30)[2015-04-30].http://www.moc.gov.cn/zfxxgk/bnssj/zhghs/201504/t20150430_1810598.html
[3]向前忠.生長曲線模型在高速公路誘增交通量預(yù)測中的應(yīng)用[J].公路交通技術(shù),2007(2):161-163.XIANG Q Z.Application of growth curves model in expressway inducedtrafficforecast[J].TechnologyofHighwayand Transport,2007(2):161-163.
[4]BOX G E P,JENKINS G M,REINSEL G C.Time series analysis:forecasting and control[J].Journal of Marketing Research,1994,14(2):556-569.
[5]WANG Y,WU X.An adaptive glucose prediction method using auto-regressive(AR)model and Kalman filter[C]//IEEE-EMBS International Conference on Biomedical and Health Informatics(BHI),Janurary 5-7,2012,Hong Kong,China.New Jersey:IEEE Press,2012:556-569.
[6]陳國強(qiáng),趙俊偉,黃俊杰,等.基于Matlab的AR模型參數(shù)估計[J].工具技術(shù),2005,39(4):39-40.CHEN G Q,ZHAO J W,HUANG J J,et al.Matlab-based parameter estimation of AR model[J].Tool Engineering,2005,39(4):39-40.
[7]JUVAI,SUSITAIVALR,PEUHKURIM,etal.Traffic characterization for traffic engineering purposes:analysis of funet data[J].Next Generation Internet Networks,2005:404-411.
[8]RUMELHART D E,MCCLELLAND J L.The PDP research groupparalleldistributedprocessing[J].IEEE,1998(1):443-453.
[9]FORBES G J,HALL F L.The applicability of catastrophe theory in modelling freeway traffic operations[J].Transportation Research Part A:General,1990,24(5):335-344.
Com parison of traffic flow prediction based on AR model and BP model
ZHANG Tingting1,2,ZHANG Wuxiong1,3,PEI Dong1,2,ZHAO Cheng1,2,YU Han1,2
1.Shanghai Institute of Microsystem and Information Technology,Chinese Academy of Science,Shanghai 200050,China 2.Shanghai Tech University,Shanghai 201210,China 3.Shanghai Research Center for Wireless Communications,Shanghai 201210,China
Traffic flow modeling plays an important role in routing,MAC algorithm and protocol designs in vehicular Ad Hoc networks(VANET).An accurate traffic flow model is crucial to traffic management of an intelligent transportation system(ITS)and information safety in a VANET.Based on Shanghai’s traffic flow data,the performance of the two different models was compared using auto regressive(AR)model and back-propagation(BP)network model,and the corresponding prediction result was given.Research finds that both of the two models can efficiently predict the traffic data,but they have different prediction accuracy for the data of different periods.The research result will provide support for future research on ITS and VANET.
VANET,ITS,AR model,BP network model,traffic flow predicting
TN929.53
A
10.11959/j.issn.1000-0801.2016049
2015-09-02;
2015-12-31
國家自然科學(xué)基金資助項目(No.61471346);上海市自然科學(xué)基金資助項目(No.14ZR1439700)
Foundatiuon Items:The National Natural Science Foundation of China(No.61471346),Shanghai Natural Science Foundation(No.14ZR1439700)
張婷婷(1991-),女,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所碩士生,主要研究方向為車聯(lián)網(wǎng)關(guān)鍵技術(shù)。
張武雄(1985-),男,博士,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所、上海無線通信研究中心助理研究員,一直從事車聯(lián)網(wǎng)/新一代寬帶無線通信網(wǎng)絡(luò)關(guān)鍵技術(shù)的研究,主持國家自然科學(xué)基金面上項目“基于車流量與3D信道建模的車聯(lián)網(wǎng)連接性理論研究”課題、上海市科學(xué)技術(shù)委員會自然基金關(guān)于車聯(lián)網(wǎng)理論研究課題、負(fù)責(zé)“面向南水北調(diào)工程安全的傳感器網(wǎng)絡(luò)技術(shù)研發(fā)”重大專項子任務(wù)的關(guān)鍵技術(shù)研究,參與國家重大專項、國家自然科學(xué)基金重點項目、上海市科學(xué)技術(shù)委員會/上海市經(jīng)濟(jì)和信息化委員會重點項目十余項。目前主要從事蜂窩無線移動通信標(biāo)準(zhǔn)、車聯(lián)網(wǎng)體系架構(gòu)及組網(wǎng)技術(shù)、多網(wǎng)異構(gòu)協(xié)作關(guān)鍵技術(shù)研究工作。發(fā)表學(xué)術(shù)論文24篇,其中SCI/EI索引19篇,申報國內(nèi)發(fā)明專利5項、國際PCT專利1項。
裴冬(1989-),男,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所碩士生,主要研究方向為編碼調(diào)制技術(shù)。
趙鋮(1991-),男,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所碩士生,主要研究方向為Wi-Fi網(wǎng)絡(luò)下的干擾消除。
俞涵(1992-),女,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所碩士生,主要研究方向為下一代移動通信技術(shù)。