王曉丹,白云,,李川
(1.重慶工商大學(xué)電子商務(wù)及供應(yīng)鏈系統(tǒng)重慶市重點(diǎn)實驗室,重慶 400067;2.重慶工商大學(xué)國家智能制造服務(wù)國際科技合作基地,重慶 400067)
基于統(tǒng)計的我國短時交通流預(yù)測模型分析
王曉丹1,白云1,2,李川2
(1.重慶工商大學(xué)電子商務(wù)及供應(yīng)鏈系統(tǒng)重慶市重點(diǎn)實驗室,重慶 400067;2.重慶工商大學(xué)國家智能制造服務(wù)國際科技合作基地,重慶 400067)
短時交通流量預(yù)測作為交通控制管理、交通誘導(dǎo)提供技術(shù)支持之一,已經(jīng)成為交通工程的研究熱點(diǎn)。為了研究近年來預(yù)測模型的現(xiàn)狀,在中國知網(wǎng)數(shù)據(jù)庫高級檢索功能中以“篇名:短時交通并含預(yù)測”和“發(fā)表時間:2000-2016”為條件進(jìn)行檢索,共檢索到133篇核心期刊。通過對期刊的分類統(tǒng)計,就當(dāng)前國內(nèi)常用的預(yù)測模型的原理及作用作簡單介紹,并根據(jù)現(xiàn)有各模型的優(yōu)缺點(diǎn)和使用范圍,對未來的發(fā)展趨勢做初步探討。
交通控制與道路誘導(dǎo)系統(tǒng)是智能交通系統(tǒng)建設(shè)的核心內(nèi)容,而實現(xiàn)該系統(tǒng)的關(guān)鍵是實時準(zhǔn)確的短時交通流量預(yù)測。一般認(rèn)為短時交通流預(yù)測就是根據(jù)已有的交通流數(shù)據(jù),在時刻實時預(yù)測出下一時刻t+△t的交通流量,其中△t一般在5-15min內(nèi)(甚至小于5min)。短時交通流預(yù)測常用于交叉路口信號實時優(yōu)化、交通控制、交通誘導(dǎo)等方面,具有強(qiáng)烈的非線性、時變性、隨機(jī)性以及與上游路口交通流的相關(guān)性等特點(diǎn)。為了研究近年來預(yù)測模型的現(xiàn)狀,在中國知網(wǎng)數(shù)據(jù)庫高級檢索功能中以“篇名:短時交通并含預(yù)測”和“發(fā)表時間:2000-2016”為檢索條件進(jìn)行檢索,共檢索到133篇核心期刊。其中每年核心期刊數(shù)量分布如圖1。
從圖1可以看出,2000-2006年間,專家和學(xué)者對短時交通流的研究較少。從2007年之后,文獻(xiàn)數(shù)量成明顯增長趨勢,說明越來越多的人關(guān)于短時交通流預(yù)測?;谑珍浀奈墨I(xiàn)內(nèi)容來看,可以分為綜述和和學(xué)術(shù)論文;統(tǒng)計結(jié)果顯示,綜述是4篇,占總文獻(xiàn)數(shù)量的3.01%;學(xué)術(shù)論文是129篇,占總文獻(xiàn)數(shù)量的96.99%,由此可以看出,短時交通流預(yù)測模型的建立已經(jīng)逐漸成為交通管理領(lǐng)域研究熱點(diǎn)。
圖1 歷年關(guān)于短時交通流預(yù)測核心期刊數(shù)量
從20世紀(jì)60年代開始,人們就開始把其他領(lǐng)域成熟的預(yù)測模型用于短時交通流預(yù)測,并開發(fā)了多種預(yù)測模型與方法[1],大致分為四類[2]:線性模型、非線性模、組合模型(各模型數(shù)量如表1所示)。從表1可以看出非線性模型占比最高,占49.61%;其次是組合模型,占比為37.98%;組合模型和非線性模型共占88.60%,文獻(xiàn)占比最多。
表1 各預(yù)測模型文獻(xiàn)數(shù)量及占比
如圖2所示,可以看出非線性和組合模型研究呈增長趨勢,說明組合模型和非線性模型預(yù)測短時交通流是研究重點(diǎn)。非線性模型在處理非平穩(wěn)、高波動數(shù)據(jù)方面所表現(xiàn)的能力,已經(jīng)成為了預(yù)測交通流量的熱點(diǎn),同時相比較時間模型也呈現(xiàn)出較好的預(yù)測精度[3]。
圖2 各預(yù)測模型每年核心期刊數(shù)量
根據(jù)對核心期刊的分析,把排名靠前的預(yù)測模型統(tǒng)計出來,其結(jié)果如圖表2所示。在之后章節(jié)對這幾種預(yù)測方法進(jìn)行詳細(xì)介紹。從統(tǒng)計結(jié)果來看,大量的優(yōu)化算法廣泛應(yīng)用到非線性模型優(yōu)化參數(shù)方面,如粒子群算法、蟻群算法、遺傳算法、混合蛙跳算法等。
表2 各類模型預(yù)測方法文獻(xiàn)數(shù)量
線性模型是通過分析事物的運(yùn)動規(guī)律和改變這種規(guī)律的因素和方法,來揭示各因素之間,參數(shù)和性能間確定的和定量的關(guān)系。由于短時交通流具有較強(qiáng)的實時性和隨機(jī)性的特點(diǎn),因此計算復(fù)雜度較低,操作簡單的線性模型滿足不了預(yù)測結(jié)果精度較高和動態(tài)反饋性的要求。
時間序列模型是參數(shù)化模型處理動態(tài)隨機(jī)數(shù)據(jù)的常用方法之一,不僅考慮了觀測數(shù)據(jù)在時間序列上的依賴性,同時也考慮了隨機(jī)波動的干擾性。在短時交通流預(yù)測模型中,廣泛使用的平穩(wěn)模型是自回歸求和滑動平均模型(ARIMA模型)。針對ARIMA模型中存在的缺點(diǎn),如沒有考慮外部其他因素的影響,檢驗過程中模型定階及參數(shù)估計繁瑣,模型參數(shù)無法動態(tài)調(diào)整以及需要大量的樣本支持等缺陷,很多學(xué)者進(jìn)行不同的探索,如唐毅等[13]通過動態(tài)選擇適宜的樣本序列和直接使用ARIMA(p,d,0)模型,來消除模式識別的不確定性和進(jìn)行時間序列模型的優(yōu)化;常剛等[4]構(gòu)建了一個基于時空依賴性的自回歸差分移動平均模型(STARIMA模型)。邴其春等[5]為了降低參數(shù)估計的誤差,提出了一種基于時間序列——向量誤差修正模型的短時交通參數(shù)預(yù)測模型。
早期的線性模型往往不能適應(yīng)短時交通流非線性數(shù)據(jù)的預(yù)測要求,越來越多的非線性預(yù)測模型應(yīng)用到短時交通流預(yù)測模型中去,并取得了較好的預(yù)測效果。人工神經(jīng)網(wǎng)絡(luò)是由大量神經(jīng)元的以某種拓樸結(jié)構(gòu)相互連接而成的非線性系統(tǒng),它是在對以人腦為代表的生物神經(jīng)元系統(tǒng)的組織結(jié)構(gòu)和行為特征進(jìn)行研究的基礎(chǔ)上提出的?,F(xiàn)實任務(wù)中使用神經(jīng)網(wǎng)絡(luò)時,大多是使用誤差逆?zhèn)鞑ニ惴ㄟM(jìn)行訓(xùn)練,其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖3,其中V和W是連接權(quán)值,其中隱含層數(shù)可根據(jù)實際預(yù)測需要進(jìn)行添加。因此,在構(gòu)建神經(jīng)網(wǎng)絡(luò)模型時,應(yīng)先通過一部分?jǐn)?shù)據(jù)測試輸入,輸出和隱含層神經(jīng)元個數(shù),各層連接權(quán)以及各神經(jīng)元的傳遞函數(shù),從而確定網(wǎng)絡(luò)結(jié)構(gòu),再用剩余的數(shù)據(jù)進(jìn)行預(yù)測。
從模型建立來看,基于神經(jīng)網(wǎng)絡(luò)的“黑箱”學(xué)習(xí)模式,不需要大量的經(jīng)驗方式,只需要大量的數(shù)據(jù)支撐,就能獲得這些數(shù)據(jù)的運(yùn)動規(guī)律。其高度的非線性映射及全局表現(xiàn)能力、良好的容錯性與聯(lián)想記憶功能、優(yōu)秀的自適應(yīng)、自學(xué)習(xí)等功能,適合短時交通流預(yù)測領(lǐng)域廣泛應(yīng)用[16-18]。但是神經(jīng)網(wǎng)絡(luò)存在過擬合現(xiàn)象,陷入局部最小、收斂速度過慢等問題,針對這些問題,一些學(xué)者通過各種算法[6]來優(yōu)化連接權(quán)值和閾值,或者優(yōu)化局部搜索能力來優(yōu)化模型。神經(jīng)網(wǎng)絡(luò)能夠能夠較好地運(yùn)用于短時交通流的預(yù)測,但大多數(shù)是驗證性研究,即預(yù)測方法能完成預(yù)測并與其他方法進(jìn)行對比,沒有指出神經(jīng)網(wǎng)絡(luò)的適用范圍和應(yīng)用條件。小波神經(jīng)網(wǎng)絡(luò)是結(jié)合小波變換理論與神經(jīng)網(wǎng)絡(luò)的思想而構(gòu)造的一種新的神經(jīng)網(wǎng)路模型。用小波基函數(shù)代替隱含層中神經(jīng)元的激勵函數(shù),這充分繼承了小波變換良好的時頻局部化性質(zhì)及神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能的特點(diǎn),具有最佳的函數(shù)逼近能力,能有效克服普通人工神經(jīng)網(wǎng)絡(luò)固有的缺陷,用其建立的模型可以取得更好的預(yù)測效果[7]。
圖3 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖
支持向量機(jī)是基于統(tǒng)計學(xué)習(xí)理論的VC理論的新一代機(jī)器學(xué)習(xí)方法,通過尋求結(jié)構(gòu)化風(fēng)險最小來提高學(xué)習(xí)泛化能力,從而在統(tǒng)計樣本數(shù)量較少的情況下,仍能獲得較好的統(tǒng)計規(guī)律。SVM模型屬于參數(shù)預(yù)測方法,在預(yù)測過程會存在核函數(shù)選擇,參數(shù)和特征集優(yōu)化等問題,一些學(xué)者和專家在這方面進(jìn)行了優(yōu)化。大量的實驗證明,預(yù)測精度方面,支持向量機(jī)相比較神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)的預(yù)測方法具有明顯的優(yōu)勢[8]。支持向量機(jī)能夠解決“多維災(zāi)難”,樣本數(shù)量小和解決局部最優(yōu)問題,正成為預(yù)測應(yīng)用熱點(diǎn)。
非參數(shù)回歸模型是以模式識別方法為技術(shù),不需要先驗知識,通過大量歷史樣本庫中找到一組與輸入數(shù)據(jù)相對應(yīng)的目標(biāo)數(shù)據(jù)來進(jìn)行預(yù)測。其具有算法清晰、可移植性強(qiáng)、預(yù)測精度高的、時間強(qiáng)壯性強(qiáng),誤差比較少且分布良好等優(yōu)點(diǎn)。但在實際應(yīng)用中,仍存在搜集歷史數(shù)據(jù)難、處理歷史數(shù)據(jù)復(fù)雜、最近鄰查找效率較低、沒有反饋回路、預(yù)測算法不夠合理等問題。針對非參數(shù)回歸在短時交通流預(yù)測上的局限性,張曉利[9]、于濱[10]和謝海紅[11]等分別在利用反饋機(jī)制、考慮時空參數(shù)、修改搜索方法等方面進(jìn)行了改進(jìn)。
為了有效地利用各種模型的優(yōu)點(diǎn),Bates等于1969年提出混合預(yù)測的思想,將參與組合的各種預(yù)測方法通過適當(dāng)?shù)姆绞浇M合或者對預(yù)測結(jié)果進(jìn)行適當(dāng)?shù)募訖?quán),“取長補(bǔ)短”,獲得最優(yōu)的預(yù)測結(jié)果[12],一般是線性方法與非線性方法,非線性方法之間的組合。組合模型在一定程度能提高預(yù)測模型的精度,但是以犧牲模型的預(yù)測速度為代價,同時也增加了模型的復(fù)雜度。
數(shù)據(jù)融合技術(shù)是對各模型預(yù)測結(jié)果的融合,它的最大優(yōu)勢在于能合理協(xié)調(diào)多元數(shù)據(jù)[13],其流程圖如圖4,對于不在閾值范圍內(nèi)的交通流數(shù)據(jù)進(jìn)行處理,選擇n種成熟度較高和預(yù)測精度較高的方法進(jìn)行預(yù)測,動態(tài)確定最優(yōu)權(quán)重進(jìn)行融合來獲得最終結(jié)果。但也存在最優(yōu)權(quán)重系數(shù)的確定、模型復(fù)雜、融合后的數(shù)據(jù)處理量加大、運(yùn)算能力減弱等問題。
圖4 數(shù)據(jù)融合技術(shù)流程圖
混沌理論是近年來發(fā)展的一門新興學(xué)科,兼具質(zhì)性與量化分析的方法,用于探討非線性動態(tài)學(xué)系統(tǒng)的內(nèi)在隨機(jī)性。Laypunov指數(shù)是混沌系統(tǒng)的吸引子的宏觀特征量之一,同時也是判斷一個動力學(xué)系統(tǒng)可預(yù)測性及預(yù)測時間跨度的重要指標(biāo)。在進(jìn)行交通流混沌特性的判斷之前,先利用相空間重構(gòu)技術(shù)把一維時間序列映射到高維空間,從而在高維空間中計算Laypunov指數(shù),來描述其中所蘊(yùn)藏的內(nèi)在變化規(guī)律?;诨煦缋碚摰纳窠?jīng)網(wǎng)絡(luò)預(yù)測模型,通常先通過相空間重構(gòu)來對交通流數(shù)據(jù)進(jìn)行預(yù)處理,計算出嵌入維數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù),再用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對時間序列進(jìn)行預(yù)測,實驗證明,其預(yù)測結(jié)果明顯好于單一的神經(jīng)網(wǎng)絡(luò)預(yù)測模型[15]。
通過對以上模型的分析,可以看出每一種預(yù)測模型都在一定條件下具有明顯的優(yōu)勢,同時也存在著不足,所以在模型選擇時要根據(jù)不同的環(huán)境、不同的樣本數(shù)據(jù)來選擇預(yù)測模型。從統(tǒng)計結(jié)果來看,短時交通流預(yù)測的發(fā)展方向會傾向于非線性模型的運(yùn)用和對其的優(yōu)化;同時,隨著云計算、大數(shù)據(jù)時代的到來和計算機(jī)能力的大幅度提高可緩解訓(xùn)練低效性,訓(xùn)練數(shù)據(jù)的大幅度增加則降低過擬合風(fēng)險,以組合模型為代表的復(fù)雜模型的創(chuàng)新會得到人們的廣泛關(guān)注。
[1]沈國江,王嘯虎,孔祥杰.短時交通流量智能組合預(yù)測模型及應(yīng)用[J].系統(tǒng)工程理論與實踐,2011,31(3):561-568.
[2]陸海亭,張寧,黃衛(wèi),等.短時交通流預(yù)測方法研究進(jìn)展[J].交通運(yùn)輸工程與信息學(xué)報,2009,7(4):84-91.
[3]謝海紅,戴許昊,齊遠(yuǎn).短時交通流預(yù)測的改進(jìn)K近鄰算法[J].交通運(yùn)輸工程學(xué)報,2014,14(3):87-94
[4]常剛,張毅,姚丹亞.基于時空依賴性的區(qū)域路網(wǎng)短時交通流預(yù)測模型[J].清華大學(xué)學(xué)報(自然科學(xué)版),2013,53(2):215-221.
[5]邴其春,楊兆升,周熙陽,等.基于向量誤差修正模型的短時交通參數(shù)預(yù)測[J].吉林大學(xué)學(xué)報(工學(xué)版),2015,45(4):1076-1081.
[6]李松,劉力軍,翟曼.改進(jìn)粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的短時交通流預(yù)測[J].系統(tǒng)工程理論與實踐,2012,32(9):2045-2049.
[7]萬李,楊杰.小波神經(jīng)網(wǎng)絡(luò)在短時交通流量預(yù)測中的應(yīng)用[J].計算機(jī)仿真,2012,29(9):352-355.
[8]王少華,楊慧慧.基于優(yōu)化參數(shù)的短時交通流預(yù)測仿真研究[J].計算機(jī)仿真,2015,3(6):167-171,270.
[9]張曉利,陸化普.非參數(shù)回歸方法在短時交通流預(yù)測中的應(yīng)用[J].清華大學(xué)學(xué)報(自然科學(xué)版),2009,49(9):1471-1475.
[10]于濱,鄔珊華,王明華,等.K近鄰短時交通流預(yù)測模型[J].交通運(yùn)輸工程學(xué)報,2012,12(2):105-111.
[11]謝海紅,戴許昊,齊遠(yuǎn).短時交通流預(yù)測的改進(jìn)K近鄰算法[J].交通運(yùn)輸工程學(xué)報,2014,14(3):87-94.
[12]顧晨陽,羅熹,程文龍.變權(quán)重組合預(yù)測模型在短時交通流預(yù)測中的應(yīng)用[J].統(tǒng)計與決策,2010(6):168-169.
[13]錢偉,楊礦利,楊慧慧,等.基于組合模型的短時交通流預(yù)測[J].計算機(jī)仿真,2015,32(2):175-178,193.
[14]蔣亞平,郭俊亮,趙軍偉.基于組合模型的短時交通流預(yù)測[J].現(xiàn)代計算機(jī),2013,(7):26-29.
[15]郭雪峰.基于數(shù)據(jù)融合的短時交通流預(yù)測與智能交通信號系統(tǒng)的研究[D].湘潭大學(xué),2007.
Analysis of Short-Term Traffic Flow Forecasting Model Based on Statistics in China
WANG Xiao-dan1,BAI Yun1,2,LI Chuan2
(1.Chongqing Key Laboratory of Electronic Commerce and Supply Chain System,Chongqing Technology and Business University,Chongqing 400067;2.National Research Base of Intelligent Manufacturing Service,Chongqing Technology and Business University,Chongqing 400067)
Short-term traffic forecasting which is one of the key technologies of intelligent traffic control management and traffic guidance,has be?come a hot topic in the field of traffic engineering.In order to study the status quo of the forecasting model in recent years,a total of 133 code journals were retrieved in the advanced search function of the China Knowledge Infrastructure database,which was searched by"title:Short-term traffic and forecast"and"published time:2000-2016".Based on the classification statistics of journals,this article made a briefly introduction on the principle and function of the current forecasting domestic forecasting models.Future,the future development trend also been preliminary discussed based on current advantages,disadvantages and application range of each model.
重慶市科委基礎(chǔ)與前沿研究項目(No.cstc2015jcyjA70007)、重慶市研究生教改項目(No.YJG43015)、國家智能制造服務(wù)國際科技合作基地開放基金(No.ghjd201603)
王曉丹(1988-),女,河南商丘人,碩士研究生,研究方向為交通智能預(yù)測
2017-03-28
2017-06-02
1007-1423(2017)17-0031-04
10.3969/j.issn.1007-1423.2017.17.006
智能交通系統(tǒng);短時交通流;預(yù)測模型
白云(1985-),男,山西陽泉,博士研究生,助理研究員,研究方向為智能交通管理
李川(1975-),男,重慶市人,博士研究生,研究員,研究方向為智能制造服務(wù)
Intelligent Transportation System;Short-Term Traffic Flow;Prediction Model