王明哲,郭 敏
(1.中國勞動關系學院,北京100048;2.北京交通科學研究所,北京100037)
北京市典型道路交通運行狀態(tài)分析及預測研究
王明哲*1,郭 敏2
(1.中國勞動關系學院,北京100048;2.北京交通科學研究所,北京100037)
對城市的道路交通運行狀況進行全面分析評估并實時監(jiān)控、預測,可以有效地消除交通隱患,增強城市交通管理部門對城市交通的管控能力.本文基于北京市典型道路交通流特性分析及已有的道路交通流預測模型,提出道路交通運行狀態(tài)組合預測模型,確定了非參數(shù)回歸模型作為預測模型的核心,組合使用傅立葉歷史估算模型、非參數(shù)自回歸模型和非參數(shù)鄰域回歸模型對北京市典型道路的交通運行狀態(tài)進行預測.針對北京市道路交通流信息采集系統(tǒng)實際情況及未來預測信息圖形化發(fā)布的需要,提出了道路交通流預測系統(tǒng)的異構(gòu)數(shù)據(jù)融合方法及道路編碼模型及方法.
城市交通;交通運行狀態(tài)預測;非參數(shù)回歸;預測模型;交通特性
國外交通流預測研究始于20世紀70年代,主要是將其他領域的預測模型應用于道路交通領域并有針對性地加以開發(fā)應用.隨著該領域研究和應用的發(fā)展,從數(shù)據(jù)來源看,目前道路交通流預測模型分為兩大類型,一是基于動態(tài) OD(Origination Destination)分配矩陣進行離線預測,二是基于歷史觀測數(shù)據(jù)進行離線或在線預測.前者屬于宏觀層次上的預測,預測計算需要大規(guī)模的OD數(shù)據(jù)和道路網(wǎng)絡基礎設施數(shù)據(jù).后者既可以進行宏觀層次的預測又可以進行微觀層次的預測,預測計算數(shù)據(jù)來源于路面固定檢測設備環(huán)形線圈,路側(cè)固定檢測設備微波檢測器、超聲波檢測器、視頻檢測器,也可以來源于移動檢測設備浮動車.具體方法和模型有歷史平均法、時間序列方法、線性回歸模型、非參數(shù)回歸模型、交通仿真和動態(tài)交通分配模型等[1,2].
基于統(tǒng)計方法的模型如歷史平均模型可以解決不同時間、不同時段里的交通流變化問題,但不能解決非常規(guī)和突發(fā)的交通狀況預測.線性回歸模型方法比較成熟,計算復雜性相對低,操作簡單,但適用性差、實時性不強,只適用于特定路段的特定流量范圍,且不能及時修正誤差.基于非線性系統(tǒng)理論的預測方法體現(xiàn)了交通系統(tǒng)非線性的特征,精確性較高,但理論基礎尚不成熟,且計算復雜性較高.基于交通仿真理論的預測方法中理論分析比較充分,能夠考慮交通系統(tǒng)的一些復雜影響因素,但計算復雜性高,難以適應大規(guī)模的交通系統(tǒng).道路交通系統(tǒng)具有歷史規(guī)律性、時變性與空間非線性相關性,單一模型和方法均有各自的優(yōu)點及不足,不能完整準確反映交通流的本質(zhì)特征,難以全面準確反映道路交通運行狀況,因此研究開發(fā)組合交通流預測模型是可行的解決辦法[1-5].
2.1 數(shù)據(jù)采集及原始數(shù)據(jù)說明
全部數(shù)據(jù)來自系統(tǒng)檢測器的實時監(jiān)測,本文實例中數(shù)據(jù)來源于北京市快速路聯(lián)絡線花園北路至學院橋路段,檢測器為安裝在路側(cè)的微波檢測器,檢測參數(shù)為流量、速度,檢測周期為2 min,其上游監(jiān)測器、下游檢測器位于同側(cè),檢測器間距500 m.數(shù)據(jù)總量為2012年12月3日0:00~2012年12月9日24:00共30 240組數(shù)據(jù).
2.2 北京典型道路交通運行特性分析
北京市快速路聯(lián)絡線典型路段交通流具有顯著的分布特征,一日之內(nèi)的交通量呈現(xiàn)周期性的變化規(guī)律.根據(jù)24 h觀測數(shù)據(jù),車流從夜間行駛的自由流階段,逐漸進入正常行駛的穩(wěn)定流階段,繼而進入擁擠流狀態(tài),直至達到飽和排隊階段.在這一過程中,在自由流階段,速度隨流量增加而逐漸降低,進入正常行駛的穩(wěn)定流階段后,速度由于某種因素的影響而上下波動,既而開始隨流量增加而減小,進入擁擠狀態(tài)后,速度下降趨勢加快.當速度降到一定程度后,擁擠開始消散,車速迅速攀升到正常的穩(wěn)定流狀態(tài).但有時也可能發(fā)生極端的情況,即堵車現(xiàn)象,此時,車速降為零,流量也是零.塞車現(xiàn)象解除后,車速和流量又回升到正常穩(wěn)定流.
圖1為北京市快速路聯(lián)絡線花園北路至學院橋路段工作日24 h速度、流量變化情況.具體數(shù)據(jù)為2012年12月3日(周一)~2012年12月7日(周五)的數(shù)據(jù).圖2為北京市快速路聯(lián)絡線花園北路至學院橋路段休息日24 h速度、流量變化情況.具體數(shù)據(jù)為2012年12月8日(周六)、2012年12月9日(周日)的數(shù)據(jù).
在工作日,快速路聯(lián)絡線機動車交通量具有比較明顯的特性,白天16 h(7:00-22:00)交通量占了全天交通量的83.91%左右.一般來說,周一早高峰交通量在一周的早高峰中最大,周五晚高峰交通量在一周晚高峰最大.早高峰出現(xiàn)的比較快,且比較明顯,一般為7:30-10:00;而晚高峰出現(xiàn)的比較緩慢,下降的也比較慢,一般為14:00-18:00.中午出現(xiàn)了一個低谷,但不是很明顯;總的變化趨勢呈M型或稱馬鞍型.
在休息日,交通量在晚間和白天有明顯的變化,白天高峰時間分布廣泛,從8:00-22:00,這一時段快速路聯(lián)絡線交通量占全天的87.85%.
圖1 北京市快速路聯(lián)絡線工作日24 h速度流量變化情況Fig.1 The velocity and flow status of expressway and its connecting line on working day in 24 h in Beijing
圖2 北京市快速路聯(lián)絡線休息日24 h速度流量變化情況Fig.2 The velocity and flow status of expressway and its connecting line on rest day in 24 h in Beijing
3.1 預測模型
交通流過程的復雜性和不確定性,決定了準確的交通流預測不是單一模型或方法所能完成.經(jīng)過歷史數(shù)據(jù)分析發(fā)現(xiàn)道路斷面未來時刻的交通參數(shù)值與3個因素相關:
①該斷面的歷史估算值;
②該斷面當前一段時間內(nèi)的參數(shù)序列;
③與該斷面空間上鄰近的多個斷面在當前時間內(nèi)的參數(shù)序列[4,5].
在本次研究中,基于對北京市道路交通流特性的分析及對已有多種方法的對比分析,確定非參數(shù)回歸模型作為預測模型的核心,針對上述三個因素采用組合模型進行道路交通狀態(tài)預測,組合使用傅立葉歷史估算模型、非參數(shù)自回歸模型和非參數(shù)鄰域回歸模型.
道路交通運行狀態(tài)預測模型的基本形式為
x△——典型的P階自回歸模型;
(k+1)
x*——基于空間拓撲關系根據(jù)鄰近斷面
(k+1)參數(shù)進行計算的預測模型;
α、β、γ——子模型的權重系數(shù).
JP+1立葉變換子模型的輸出結(jié)果,表示預測斷面在k+1時刻的歷史平均值。對歷史數(shù)據(jù)進行的分析表明,交通流的變化形態(tài)是以一個星期為周期的,一個周期內(nèi)每天的交通運行特征均各有特點,一天內(nèi)不同時刻交通運行特征各有特點.因此本項研究中傅立葉變換子模型假設交通流的變化形態(tài)以一個星期為周期,模型為每一個道路斷面的每一個交通參數(shù)(本文為兩個參數(shù):速度、流量)每個特征日保存一個數(shù)據(jù)序列,表示該斷面相應參數(shù)在該類特征日的歷史平均趨勢.特征日是指具有相同屬性的一類日期,即模型共劃分7類特征日,表示從周一至周日的不同特征.模型進行預測時,就是從該歷史平均數(shù)據(jù)序列中選擇對應時段的數(shù)值作為預測值.每獲得新一天的數(shù)據(jù),與原歷史平均序列加權平均后,就對新序列進行傅立葉變換,據(jù)此更新用于預測的傅立葉系數(shù),再通過逆變換得到該斷面該參數(shù)的該特征日的歷史平均序列.
非參數(shù)回歸預測短時交通參數(shù),預測假設是在短時間內(nèi)交通狀態(tài)是時不變.即在這段時間內(nèi),輸入、輸出變量之間存在一定的靜態(tài)函數(shù)關系,即上游路段的車流模式經(jīng)過一段時間的演化,必然會在下游路段產(chǎn)生相對應的車流模式.非參數(shù)回歸方法進行短時流量預測的具體操作:
(1)利用當前流量模式在樣本數(shù)據(jù)庫中匹配,找到n個匹配的模式;
(2)利用短時間區(qū)間內(nèi)時不變特性,在已找到的這n個匹配模式中,尋找最佳匹配點;
(3)利用最佳匹配點及其近鄰點進行預測.
非參數(shù)回歸的四要素是:歷史數(shù)據(jù)的準備、狀態(tài)向量的選取、相似向量的選取、相似機制的選取或近鄰機制的選取和預測函數(shù)的選取.為了提高非參數(shù)模型搜索“近鄰”點的速度,滿足實際系統(tǒng)應用的需要,本項研究采取基于密度集K的變搜索算法,基于動態(tài)聚類和散列函數(shù)的歷史數(shù)據(jù)組織方式,試驗表明可以真正達到實時交通流預測的需求[4-6].
非參數(shù)回歸預測流程如圖3所示.
圖3 非參數(shù)回歸預測流程Fig.3 The process of nonparametric regression prediction
P階自回歸模型
式中 X△t——影響變量矩陣,本項研究中為該斷面當前一段時間內(nèi)的變量參數(shù)序列;
εt——協(xié)方差矩陣;
t——樣本數(shù)。
P階自回歸模型滿足下面三個約束條件:
(1)βp≠0
(2)E(εt)=0,var(εt)=σ2,E(εsεt)=0,s≠t
(3)E(xsεt)=0,?<t
有關被預測路段與空間上鄰近的多個斷面的狀態(tài)參數(shù)的關系如圖4所示.
圖4 被預測路段與空間上鄰近斷面的狀態(tài)參數(shù)的關系Fig.4 The relationship between the section predicted and adjoining
設b為被預測路段,其下一個時刻的交通狀態(tài)可以描述為
式中 Vb(k+1)——b路段當前時刻k的下一個時刻k+1時刻的交通狀態(tài);
Va1,…,Va6——相關路段的狀態(tài)參數(shù),同樣也是離散時間k的函數(shù).
3.2 異構(gòu)數(shù)據(jù)融合技術與方法
數(shù)據(jù)融合系統(tǒng)首先對采集系統(tǒng)傳送到數(shù)據(jù)中心的原始數(shù)據(jù)進行檢查,主要為剔除錯誤數(shù)據(jù),修復缺失數(shù)據(jù),在此基礎上進行數(shù)據(jù)的融合,并且將原始數(shù)據(jù)區(qū)分節(jié)假日和非節(jié)假日,對其分別建庫.
(1)錯誤數(shù)據(jù)的識別.
當數(shù)值不在(0,Xmax)范圍內(nèi)的數(shù)據(jù)系統(tǒng)判斷為錯誤數(shù)據(jù),需要對其進行修復處理.交通流參數(shù)不同,其Xmax的取值不同.交通流參數(shù)為速度時,Xmax的取值為檢測器所在路段的道路的限制速度,不同道路等級的限制速度不同.交通流參數(shù)為流量時,Xmax的取值為檢測器所在路段的道路的通行能力.交通流參數(shù)為占有率時,Xmax的取值為檢測器所在路段的對應于道路通行能力的時間占有率.
(2)重復數(shù)據(jù)、缺失數(shù)據(jù)的處理.
按照檢測器時間確定數(shù)據(jù)是否重復和缺失.對于重復數(shù)據(jù),只保留第一組數(shù)據(jù);對于缺失數(shù)據(jù),如果缺失量較小(一組或者兩組),則采用拷貝前一時刻或者后一時刻的數(shù)據(jù).如果數(shù)據(jù)缺失量較大(三組以上),則采用前一個月同樣特征日的幾個數(shù)據(jù)的平均值進行修復.如果歷史數(shù)據(jù)同樣缺失,則采用相鄰上游檢測器和下游檢測器檢測數(shù)據(jù)取平均值作為缺失數(shù)據(jù)的補充.
(3)數(shù)據(jù)整合.
由于現(xiàn)有采集系統(tǒng)數(shù)據(jù)的采樣間隔為2 min,如果系統(tǒng)預測周期為t min,則需要對原始數(shù)據(jù)進行整合處理.數(shù)據(jù)整合原則為在預測周期內(nèi)對流量累加,速度和占有率分別加權求平均值.
3.3 道路編碼模型及方法
為了使道路交通運行狀態(tài)能夠以圖形方式顯示,需要對道路進行數(shù)字化管理,同時將道路交通運行狀態(tài)參數(shù)(速度、流量、占有率等)目前的狀態(tài)値和未來某一時刻的預測值分別與相對應的路段進行標定.圖5為現(xiàn)實空間的點、線、面與數(shù)字化世界的對應算法.圖6為本文采用的點線面空間實體坐標序列編碼表示算法.
圖5 現(xiàn)實世界與數(shù)字世界的對應算法Fig.5 The homologous algorithm between real word and digit word
圖6 點線面空間實體坐標序列編碼表示算法Fig.6 The code algorithm of dot line and surface
通過歷史數(shù)據(jù)分析組合模型3個權重系數(shù)設置為(0.3,0.4,0.3).
選擇平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)和最大絕對誤差(MaxAE)三個指標對模型的預測精度進行評價,其中,平均絕對百分比誤差反映了預測的精準度,平均絕對誤差反映了預測的精密度,最大絕對誤差反映了絕對誤差的最大偏離程度,其計算公式分別為:
式中
yt——t時刻的實際速度值; ?
n——樣本數(shù).
圖7為2012年12月6日花園北路至學院橋路段速度預測結(jié)果,表1為其速度誤差分析,圖8為同日同地點流量預測結(jié)果,表2為其流量誤差分析.
圖7 花園北路至學院橋路10 min、30 min速度預測誤差Fig.7 The prediction error of velocity in coming 10 minutes and 30 minutes
表1 速度誤差分析Table 1 The speed error analysis
圖8 花園北路至學院橋路10 min、30 min流量預測誤差Fig.8 The prediction error of flow in coming 10 minutes and 30 minutes
表2 流量誤差分析Table 2 The flow error analysis
本文根據(jù)交通流預測的要求,基于對北京市道路交通流特性的分析及對已有多種預測方法的分析,確定非參數(shù)回歸模型作為預測模型的核心,將傅立葉歷史估算模型、非參數(shù)自回歸模型和非參數(shù)鄰域回歸模型組合,建立了一種新的交通流預測組合模型.該模型預測結(jié)果能有效反應交通流的時變性與非線性特點,同時能體現(xiàn)交通流變化的周期穩(wěn)定性.
[1]James Howard Conklin,William T Scherer.Data imputation strategies for transportation management systems[R]. Center for Transportation Studies University of Virginia,2003.
[2]Jiang G Y,Gang L H,Zhang X D,et al.Malfunction identifying and modifying of dynamic traffic data[J].JournalofTraffic and Transportation Engineering, 2004,4(1):7-10.
[3]Javad Abdi,Behzad Moshiri,Baher Abdulhai,et al. Forecasting of short-term traffic-flow based on improved neurofuzzy models via emotional temporal difference learning algorithm[J].Engineering Applications of Artificial Intelligence,2012(25):1022-1042.
[4]Ming-Wei Li a,Wei-Chiang Hong,Hai-Gui Kang. Urban traffic flow forecasting using Gauss-SVR with cat mapping[J]. Cloud Model and PSO Hybrid Algorithm,Neurocomputing 2013(99):230-240
[5]李雁,陸海亭,張寧.短時交通流預測建模因素和建模策略[J].公路,2010(4):130-133.[LI Y,LU H T,ZHANG N. Short-term trafficflow forecasting modeling elements and modeling strategy of[J]. Highway,2010(4):130-133.]
[6]樊娜,趙祥模,戴明,等.短時交通流預測模型[J].交通運輸工程學報,2012,12(4):115-119.[FAN N, ZHAO X M,DAI M,et al.Short-term traffic flow forecasting model[J] Journal of Traffic and Transportation Engineering,2012,12(4):115-119.]
Traffic State Forecasting of Typical Roads in Beijing
WANG Ming-zhe1,GUO Min2
(1.China Institute of Industrial Relations,Beijing 100048,China; 2.Beijing Research Institute for Traffic Engineering,Beijing 100037,China)
The comprehensive analysis of traffic states are effective ways to eliminate some traffic problems and enhance the supervising ability of the traffic management departments,which includes real-time monitoring,evaluation and prediction the states of the entire city.With analyzing the traffic flow characteristic on several typical roads in Beijing and summarizing the existing traffic prediction models,this paper proposes a combination forecasting model.It is mainly based on the nonparametric regression model. The combination ofFourier's history estimated model, nonparametric autoregressive modeland nonparametric neighborhood regression model are used to predict the traffic state of typical Roads. Considering the reality of the traffic flow information collection system of Beijing and the needs of predicting information released by graphical way in the future,the paper also presents the heterogeneous data fusion methods and road traffic code model.
urban traffic; traffic state foresting;non-parametric regression;prediction model; traffic characteristics
U268.6
A
U268.6
A
1009-6744(2013)02-0191-08
2013-01-24
2013-03-15錄用日期:2013-03-22
北京市科技計劃項目(D0702061400704);北京市自然科學基金(4102038).
王明哲(1966-),男,北京人,副教授,博士.
*通訊作者:Wangmingzhe@ciir.edu.cn