胡 華,高云峰,劉志鋼
(1.上海工程技術大學 城市軌道交通學院,上海201620;2.上海海事大學 交通運輸學院,上海201306)
公交車輛到站時間預測是公交到站信息服務、公交動態(tài)調(diào)度的關鍵參數(shù)[1]。目前已建立的公交智能化調(diào)度系統(tǒng)中,公交車輛下班車預測到站時間大都采用車輛當前位置到達車站站牌的距離和平均行車速度之比簡單計算而得,預測結果和實際到站時間往往相差很大。
在理論研究方面,國內(nèi)外學者提出了很多公交車輛到站時間預測模型和方法,如歷史趨勢方法、回歸分析方法、時間序列模型、人工神經(jīng)網(wǎng)絡方法、卡爾曼濾波方法、隨機服務系統(tǒng)方法等[2-4]。然而,在變化的交通狀況和任意時段的條件下,上述模型和方法都未能取得令人滿意的預測結果。究其原因,主要是由于我國城市公共汽車交通運行環(huán)境復雜和公交優(yōu)先運行條件尚不完備,導致公交車輛的到站時間隨機性強。因此不能簡單忽略動態(tài)隨機狀況,而僅僅依靠歷史數(shù)據(jù)規(guī)律進行到站時間預測。自動車輛定位技術(Automatic Vehicle Location,簡稱AVL)逐漸成熟以及AVL車載機在公交車輛中的普及應用,為公交車輛到站時間實時預測提供了良好的基礎數(shù)據(jù)環(huán)境。應用先進的信息和通訊手段,研究高性能的公交車輛到達時間預測技術,對實現(xiàn)公交系統(tǒng)信息化和智能化,推動城市公共交通改善管理水平和服務水平具有重要意義。
公交車輛到站時間預測模型以大量AVL直接或間接運行數(shù)據(jù)為基礎,包括公交車輛的實時位置及速度、站間運行時間、站點停靠時間等。因此,AVL數(shù)據(jù)質量直接影響到模型預測精度,需要采取以下方法來提高預測所需AVL數(shù)據(jù)的準確性和可靠性。
1)異常AVL數(shù)據(jù)的預處理:由于采集過程中的某些因素的干擾,使得實際采集到的AVL數(shù)據(jù)可能存在著異常情況。因此必須對這些數(shù)據(jù)進行預處理,如剔除嚴重阻塞、交通事故等異常條件下的歷史運行時間數(shù)據(jù),修復缺失及錯誤數(shù)據(jù),具體處理方法見參考文獻[5]。
2)AVL數(shù)據(jù)劃分:公交車輛到站時間的預測精度與車輛歷史運行狀態(tài)及實時運行狀態(tài)的相似程度有關??紤]數(shù)據(jù)獲取的難度,筆者以特征日(周末或工作日)、路段、時段、線路及其運行方向(上下行)為影響因素對AVL數(shù)據(jù)進行分類劃分和預測。
公交車輛到站時間是指公交車輛在運營線路某一方向上從當前位置行駛到下游某一站點所需的時間。設公交線路上共有1,2,…,n個站點,根據(jù)可獲得的AVL原始數(shù)據(jù),筆者以公交站點為節(jié)點,將公交線路劃分為1,2,…,n-1個區(qū)段,區(qū)段i定義為公交車輛到達i站至(i+1)站之間的物理區(qū)間,見圖1。
圖1 公交車輛到站時間構成要素劃分示意Fig.1 Elements division of bus arrival time
設公交車輛當前位于區(qū)段m(1,2,…,j-1)內(nèi),預測站點為j(m+1,…,n)。由圖1可見,公交車輛任意當前位置到達預測站點的行程時間被劃分成3個組成部分,分別進行如下定義:
1)公交車輛從當前位置到達預測站點途經(jīng)各站點的??繒r間,即 Di(m+1≤i≤j+1),min。
2)公交車輛從當前位置到達該區(qū)段終點(下游臨近站點)的運行時間,稱之為區(qū)段部分運行時間,即 Ti=Tm,min。
3)公交車輛在當前位置到達預測站點途經(jīng)各區(qū)段的起終點之間的運行時間,稱之為區(qū)段全程運行時間,即 Ti,i+1(m≤i≤j-1),min。
則公交車輛從當前任意位置至預測站點的行程時間計算公式見式(1)。
由式(1)可知,公交車輛從任意當前位置至預測站點的行程時間由站點??繒r間、區(qū)段部分運行時間和區(qū)段全程運行時間構成。下面分別對其進行預測。
根據(jù)上述定義,站點??繒r間是指乘客的上下車時間,可以通過車載終端(如公交車行車記錄儀,公交車停站時間監(jiān)控儀)發(fā)回的車輛到離站開關門信息實時獲取[6]。筆者將預測日預測時段的前兩個時段及預測日前兩個相同特征日i站的停靠時間取平均值作為預測日預測時段i站的??繒r間預測值,見式(2):
目前,在人工神經(jīng)網(wǎng)絡的實際應用中,BP神經(jīng)網(wǎng)絡(Back-Propagation Network,簡稱BP網(wǎng)絡)由于具有較強的非線性映射能力,因而得到了最為廣泛的應用。它可用于函數(shù)逼近、模式識別、數(shù)據(jù)壓縮等,文中的區(qū)段全程運行時間預測就屬于BP神經(jīng)網(wǎng)絡在函數(shù)逼近方面的應用。
BP神經(jīng)網(wǎng)絡的設計要素包含轉移函數(shù)、網(wǎng)絡結構和學習規(guī)則,其中轉移函數(shù)的相關研究已經(jīng)比較成熟[7],僅對本預測模型的網(wǎng)絡結構和學習規(guī)則進行設計。
3.2.1 網(wǎng)絡結構設計
經(jīng)過測試,采用單隱層模型收斂困難。因此,筆者采用4層神經(jīng)網(wǎng)絡(雙隱層)結構,綜合考慮預測日當前時段和歷史相同特征日相同時段的數(shù)據(jù)對下一時段的區(qū)段全程運行時間進行預測,設計的神經(jīng)網(wǎng)絡結構示意如圖2。
圖2 區(qū)段全程運行時間預測的BP神經(jīng)網(wǎng)絡結構示意Fig.2 Back-Propagation network algorithm framework for the section running time prediction
3.2.2 網(wǎng)絡學習規(guī)則
BP神經(jīng)網(wǎng)絡模型通過對歷史數(shù)據(jù)的訓練學習來掌握輸入和輸出影響因素的關系。評價神經(jīng)網(wǎng)絡設計的優(yōu)劣首先取決于學習完成網(wǎng)絡的預測精度,其次在于網(wǎng)絡的學習時間。已有研究對不同的學習規(guī)則(訓練函數(shù))進行了對比試驗[8],發(fā)現(xiàn)帶動量和自動調(diào)整學習速率的學習規(guī)則(traingdx)的預測精度最高,但學習時間相對較長,該學習規(guī)則修正權值Δωij的表達形式見式(3):
式中:e是期望輸出與實際輸出的誤差;η表示網(wǎng)絡的學習速率(η>0),在訓練過程中其取值非常重要(當η取值過小時,網(wǎng)絡收斂慢;當η取值過大時,學習過程變得不穩(wěn)定導致誤差過大);γ是動量因子(0<γ<1),通過引入γ可避免學習的不穩(wěn)定和局部收斂。
學習率η和動量因子γ的恰當選取并非易事,通常憑經(jīng)驗和實驗選取。文中γ的值將結合具體算例經(jīng)多次實驗計算選取得到,而η是自適應調(diào)整的。經(jīng)驗表明,學習率的增加量最好是個常數(shù),但應按幾何律減小,文中采取的自適應函數(shù)見式(4):
式中:Δe為每次迭代誤差函數(shù)的變化;a,b為適當?shù)某?shù)。
本預測模型以N個樣本的方差小于收斂閾值作為訓練的收斂條件,見式(5):
式中:TP和分別表示訓練樣本P的實際值和預測值;e為收斂閾值,其取值的大小決定了訓練過程所需時間(e取得過小需要花費很長的訓練時間,有時甚至無法收斂;e取得過大可能導致網(wǎng)絡無法進行訓練),文中將結合具體算例經(jīng)多次實驗計算選取得到e值。
如圖1,當公交車輛駛離(i-1)站但未到達i站,其相應的區(qū)段部分運行時間計算公式見式(6)。
式中:Ti是公交車輛區(qū)段部分運行時間預測值,min;Li是公交車輛當前位置至臨近下游站點i的距離,m;Vi是公交車輛當前位置至臨近下游站點i的預測運行速度,m/s;Li-1,i是區(qū)段(i-1)的距離,min;Li-1是公交車輛在區(qū)段(i-1)內(nèi)的已行駛距離。
其中,Li-1,i和 Li-1可以通過 AVL靜態(tài)數(shù)據(jù)和實時定位數(shù)據(jù)獲得,則Ti的值取決于Vi的預測結果。筆者將基于歷史AVL數(shù)據(jù)得到的車輛預測運行速度和基于實時AVL數(shù)據(jù)計算得到的車輛當前運行速度進行自適應指數(shù)平滑,預測得到Vi,見式(7):
式中:Vpi是車輛當前運行速度值,指車輛在區(qū)段內(nèi)已行駛路程的平均運行速度,m/s,其計算方法見式(8);Vi-1,i是基于歷史AVL數(shù)據(jù)的車輛運行速度預測值,指該時段區(qū)段(i-1)的全程平均運行速度的預測值,m/s,其計算方法見式(9);δ是自適應平滑系數(shù),其計算方法見式(10):
式中:Ti-1是車輛在區(qū)段(i-1)內(nèi)的已行駛時間,由車輛當前位置時刻與車輛離開站點(i-1)的時刻之差求得,min;Ti-1,i是區(qū)段(i-1)的全程運行時間預測值,由第3.2節(jié)提出的預測模型求得,min;δ則反映了車輛當前運行速度(Vpi)在預測速度Vi中所占權重,其值隨著車輛至下游站點i距離的減小而增大。當車輛到達站點i時,δ=1,Vi=Vpi,與實際情況吻合。
筆者以同濟大學智能公共交通實驗室提供的上海市某實驗公交線路的AVL運行數(shù)據(jù),對上述到站時間預測模型進行驗證和評價分析。選取49路上行方向(共20個站點)、相同特征日(工作日)、威海路陜西北路—延安中路銅仁路—常熟路華山路站點間、早07:00—09:00共計115組(每組數(shù)據(jù)包含預測模型中所涉及的5個原始數(shù)據(jù))區(qū)段全程運行時間(威海路陜西北路—延安中路銅仁路和延安中路銅仁路—常熟路華山路)和站點停靠時間(威海路陜西北路站和延安中路銅仁路站)的AVL原始數(shù)據(jù)進行預測。本算例中,所有預測結果均是利用MATLAB軟件編程實現(xiàn)。
步驟1:區(qū)段全程運行時間預測。將選取的115組區(qū)段全程運行時間AVL原始數(shù)據(jù),隨機選出46組數(shù)據(jù)作為訓練集,采用快速BP算法[7]和traingdx訓練規(guī)則對BP神經(jīng)網(wǎng)絡進行訓練,其余69組數(shù)據(jù)作為測試數(shù)據(jù)。筆者對隱層節(jié)點的個數(shù)進行了試驗,最后選定第1和第2隱層分別為12個和3個神經(jīng)元。預測結果見圖3。
步驟2:站點??繒r間預測。將步驟1中69組測試數(shù)據(jù)相對應的每組站點??繒r間AVL歷史數(shù)據(jù),根據(jù)式(2)取平均值作為該站點??繒r間預測值。
步驟3:到站時間預測。將步驟1與步驟2的每組預測結果分別求和,即得到預測站點(常熟路華山路站)的到站時間預測值。
圖3 基于AVL數(shù)據(jù)的公交車輛到站時間預測值Fig.3 Predictive values of bus arrival time based on AVL data
4.3.1 魯棒性評價
魯棒性評價預測結果波動的大小,主要評價指標是最大絕對偏差值。將69組到站時間預測值與實際值進行曲線擬合,結果見圖4。從圖4中可見,預測值與實際值最大絕對偏差值為55.7 s,在乘客可接受的預測誤差閾值以內(nèi)[9],表明該模型的魯棒性較好。
圖4 到站時間預測值和實際值對比Fig.4 Comparison between predictive values and actual ones
4.3.2 精確性評價
精確性用來評價預測模型的精度高低,主要評價指標是相對誤差率和平均絕對相對誤差率。預測結果的相對誤差見圖5,平均絕對相對誤差率(MAPE)為11.5%,能夠滿足公交動態(tài)調(diào)度的精度要求(MAPE <15%)[10]。
圖5 公交車輛到站時間預測值的相對誤差Fig.5 Relative errors of predictive values of bus arrival time in the example
筆者以上述69組到站時間真實數(shù)據(jù),運用指數(shù)平滑法對其進行了預測。取α=0.05,指數(shù)平滑法的預測結果見圖6,最大絕對偏差值為149.5 s,平均絕對相對誤差率為20.0%,均大于本預測模型的誤差值。因此,本預測模型的精度相對較高。
圖6 指數(shù)平滑法與本預測方法的預測結果對比Fig.6 Comparison between predictive values based on exponential smooth method and the ones in the example
公交車輛到站時間實時預測是實施公交動態(tài)調(diào)度和發(fā)布公交到站時間信息的關鍵支持技術。已有基于歷史數(shù)據(jù)的預測方法因忽略公交運行的動態(tài)隨機狀況導致其預測精度較差。
筆者基于公交車輛的實時和歷史AVL數(shù)據(jù),將公交車輛行程時間劃分為站點??繒r間、區(qū)段全程運行時間和區(qū)段部分運行時間,分別采用點估計法、BP神經(jīng)網(wǎng)絡方法和自適應指數(shù)平滑法對其進行預測,并利用從實驗公交線路采集的AVL運行數(shù)據(jù)驗證了本預測模型的有效性。研究結果表明,基于AVL數(shù)據(jù)的公交車輛到站時間實時預測模型,由于將歷史數(shù)據(jù)規(guī)律和實時交通狀況進行了有效融合,因此提高了公交到站時間的魯棒性和預測精度。
[1]Abkowitz M,Engelstein I.Empirical methods for improving transit scheduling[C].World Conference on Transport Research:Research for Policies in a Changing World.Hambwrg,Germany,1983:884-885.
[2]Chien S,Ding Y Q,Chien H W.Dynamic bus arrival time prediction with artificial neural networks[J].Journal of Transportation Engineering,2002,128(5):429-438.
[3]孫喜梅,楊兆升.城市公共交通站點間實時動態(tài)行程時間預測的模型[J].吉林大學學報,2002,32(1):47-51.Sun Ximei,Yang Zhaosheng.The model of real-time dynamic travel time prediction between urban public transportation stop[J].Journal of Jilin University:Engineering and Technology,2002,32(1):47-51.
[4]杭明升,楊曉光,彭國雄.基于卡爾曼濾波的高速道路行程時間動態(tài)預測[J].同濟大學學報,2002,30(9):1068-1072.Hang Mingsheng,Yang Xiaoguang,Peng Guoxiong.Study of predicted travel time in urban expressway based on Kalman filter[J].Journal of Tongji University,2002,30(9):1068-1072.
[5]Aichong S,Hickman M.Vehicle Travel Time Prediction Using Primitive Automatic Vehicle Location Data[C]//Transportation Research Board 85th Annual Meeting.Washington,D.C.:TRB,2006:1056-1077.
[6]張雄希.無線傳感器網(wǎng)絡在城市智能公交系統(tǒng)中的應用[J].重慶交通大學學報:自然科學版,2009,28(6):1064-1066.Zhang Xiongxi.Application of wireless senor network to intelligent transportation system of city public bus[J].Journal of Chongqing Jiaotong University:Natural Science,2009,28(6):1064-1066.
[7]閻平凡,張長水.人工神經(jīng)網(wǎng)絡與模擬進化計算[M].北京:清華大學出版社,2000:78-96.
[8]Chien S,Ding Yuqing.Applications of Artificial Neural Networks in Predicting of Transit Arrival Times[C]//Annual Conference of ITS America Proceedings.Washington,D.C.:TRB,1999:859-870.
[9]Kalaputapu R,Demetsky M J.Modeling schedule deviations of buses using automatic vehicle-location data and artificial neural networks[J].Transportation Research Record,1995,1497:44-52.
[10]胡華.城市軌道交通與常規(guī)公交協(xié)調(diào)調(diào)度理論及方法[D].上海:同濟大學,2010:63-68.