胡繼華 李國源 程智鋒
(1.中山大學(xué)工學(xué)院 廣州市510006;2.廣東省智能交通系統(tǒng)重點實驗室 廣州510006)
優(yōu)先發(fā)展公交系統(tǒng)是提高城市交通資源利用效率,緩解交通擁堵的重要手段。城市公交行程時間具有明顯的時段分布特征,尤其是早晚高峰與平峰時段的公交行程時間各不相同,導(dǎo)致公交到站時間間隔不均勻、可靠性下降、候車時間過長、載客率差異大等諸多問題,影響了乘客乘坐公交的意愿[1]。研究公交車輛行程時間預(yù)測方法,對于提高公交車輛時間可靠性、公交車輛調(diào)度、提高公交資源利用率及吸引人群采用公交出行等具有重要意義。
公交車輛行程時間預(yù)測方法包括歷史趨勢方法預(yù)測、多元回歸法預(yù)測模型、人工神經(jīng)網(wǎng)絡(luò)模型、卡爾曼濾波模型、非參數(shù)回歸模型預(yù)測方法及支持向量機(jī)模型等。
基于歷史數(shù)據(jù)的預(yù)測模型是通過對同一時段的大量歷史數(shù)據(jù)取平均值進(jìn)行預(yù)測,其預(yù)測精度較低,但算法及校正簡單,實際應(yīng)用廣泛。陳巳康等[2]通過研究公交車路段平均運行速度來確定路段行程時間。
回歸模型研究-系列自變量與因變量之間的關(guān)系。周雪梅等[3]提出了多元回歸公交行程時間分析預(yù)測模型,并利用威海市的公交數(shù)據(jù)對該分析預(yù)測模型進(jìn)行驗證。魏華等[4]通過研究公交行程時間與道路路段實時交通量的關(guān)系,從而確定預(yù)測模型。
人工神經(jīng)網(wǎng)絡(luò)是由大量的節(jié)點(神經(jīng)元)及其之間的相互聯(lián)接構(gòu)成的1種運算模型。相對于回歸模型,神經(jīng)網(wǎng)絡(luò)算法不需要考慮輸入變量之間的關(guān)系,也不需要特定的方程式。楊兆升等[5]提出了1種基于模糊神經(jīng)網(wǎng)絡(luò)的實時路段行程時間估計模型,該模型可利用實測交通數(shù)據(jù)實時預(yù)測未來路段公交車輛行程時間。Ehsan等[6]將道路飽和率和公交時刻表準(zhǔn)點率作為輸入變量,其預(yù)測精度高于歷史數(shù)據(jù)模型。神經(jīng)網(wǎng)絡(luò)普遍存在學(xué)習(xí)過程、算法的時間耗費過多,導(dǎo)致實時預(yù)測的效率低下。
卡爾曼濾波模型是1種基于線性遞歸的算法,由于其高效的預(yù)測誤差修正特性,該算法在動態(tài)預(yù)測中有一定的應(yīng)用。美國的Mei Chen等[7]利用了AVL數(shù)據(jù)建立了公交車到達(dá)時間的卡爾曼濾波預(yù)測模型。國內(nèi)的周文霞[8]等考慮多種影響因素,利用卡爾曼濾波算法給出了行程時間預(yù)測模型。
機(jī)器學(xué)習(xí)中的支持向量機(jī)也逐漸在公交行程時間預(yù)測中得到應(yīng)用。Peng等[9]提出了基于貝葉斯概率的相關(guān)向量機(jī)預(yù)測算法,可獲取到站時間預(yù)測值及誤差的方差。Yu等[10-11]將支持向量機(jī)應(yīng)用到公交行程時間預(yù)測中,該預(yù)測模型具備更強(qiáng)的解釋力及穩(wěn)定性;并且將遺忘因子引入到支持向量機(jī)預(yù)測模型中,得到了更高的預(yù)測精度。
交通流信息反映道路的實際交通情況,故能在此基礎(chǔ)上預(yù)測公交行程時間。2012年李海姣等[12]以交通波理論為基礎(chǔ)建立了站點間行程時間預(yù)測模型,取得較好的預(yù)測效果。
馬爾科夫鏈在交通領(lǐng)域方面的應(yīng)用主要集中在交通事故[13]、交通流密度[14]等方面,在公交行程時間預(yù)測的應(yīng)用還較少。馬爾科夫鏈預(yù)測針對狀態(tài)轉(zhuǎn)移進(jìn)行計算[15],具有可操作性較強(qiáng),且簡單的特點。筆者研究基于馬爾科夫鏈的公交站間行程時間預(yù)測算法,并利用移動誤差補(bǔ)償法對其進(jìn)行改進(jìn)以得到更高的預(yù)測精度。
公交車輛是1類時空過程對象,其在特定的線路運行過程中受到當(dāng)時具體的環(huán)境影響,包括道路交通狀態(tài)、車輛運行狀況及天氣狀況等多種因素。在1次過程中,公交車輛下一階段的運行過程受到前一階段或多個階段的運行狀況影響較大,比如,為了保證班次準(zhǔn)點,當(dāng)車輛在前面的站點發(fā)生延誤時,車輛在后續(xù)站點會相應(yīng)加速以彌補(bǔ)延誤時間。
公交車輛行程時間是由各個站間行程時間及停站時間構(gòu)成,且站間行程時間的預(yù)測是動態(tài)行程時間預(yù)測的關(guān)鍵。某一站間行程時間可視為特定公交線路的系統(tǒng)狀態(tài),一系列的站間行程時間是系統(tǒng)在不同階段的運行狀態(tài),因此可以利用離散系統(tǒng)的預(yù)測方法來估計公交車輛站間行程時間。
公交車輛是典型的時空過程對象,其運行具有狀態(tài)轉(zhuǎn)移性,公交車輛的下一階段發(fā)生狀態(tài)的概率與當(dāng)前狀態(tài)相關(guān),符合馬爾科夫鏈的基本思想,因此提出以下假設(shè)。
假設(shè)1。同一線路同一方向下的公交車輛站間行程時間的延誤符合馬爾科夫過程。
假設(shè)2。同一線路同一方向在同一時段內(nèi),所有的站間狀態(tài)轉(zhuǎn)移概率一致。
在假設(shè)1的前提下,實際上是公交車輛站間行程時間的延誤構(gòu)成了馬爾科夫鏈,因此只需要預(yù)測公交車站行程時間的延誤,即可得到公交車輛站間預(yù)測行程時間;假設(shè)2充分考慮了公交車輛運行的時段差異特征,同時,認(rèn)為同一時段同一方向的公交運行具有同質(zhì)性,簡化了馬爾科夫狀態(tài)轉(zhuǎn)移矩陣的復(fù)雜性。
對于一系列相依的隨機(jī)變量用步長為1的馬爾科夫鏈模型和初始分布推算出未來的絕對分布,即為基于馬爾科夫鏈的基本行程時間預(yù)測算法,具體預(yù)測算法步驟如下。
1)劃分車輛運行時段。對1 d內(nèi)的公交車輛工作時間進(jìn)行時段劃分,假設(shè)1 h為1個時段Ti,那么07:00時到19:00時則可劃分為12個運行時段。
2)構(gòu)造狀態(tài)轉(zhuǎn)移矩陣。狀態(tài)轉(zhuǎn)移矩陣依賴于公交車輛運行的歷史數(shù)據(jù),對于每個運行時段,對要預(yù)測的線路統(tǒng)計3個相鄰公交站點a,b,c之間的站間運行時間tab和tbc,見圖1。
圖1 公交行駛圖示1Fig.1 Schematic Illustration 1 of bus driving
則得到公交車輛的站間延誤為
(Δtab,Δtbc)構(gòu)成了一系列的延誤轉(zhuǎn)移對,如(-20,-10)表明在(a,b)站間的延誤由-20s轉(zhuǎn)變?yōu)椋╞,c)站間的-10s,并且可以得到(-20,-10)此狀態(tài)轉(zhuǎn)移發(fā)生的概率。由一系列的延誤轉(zhuǎn)移對得到1個在時段T線路R的延誤轉(zhuǎn)移概率矩陣。
式中:di或dj(i,j∈ [0,n-1])是具體的延誤時間,正數(shù)表示公交車輛提前到站,負(fù)數(shù)表示延遲到站,且滿足為簡化轉(zhuǎn)移概率矩陣,可以將dij轉(zhuǎn)化為連續(xù)的時間范圍值。
3)馬氏性檢驗。馬氏性的檢驗,是決定序列是否可用馬爾科夫鏈預(yù)測方法來預(yù)測的關(guān)鍵,只有公交車輛站間行程時間延誤序列符合馬氏性檢測條件,才能用馬爾科夫鏈進(jìn)行預(yù)測。驗證馬氏性一般用卡方檢驗方法[16]。
4)站間行程時間動態(tài)推導(dǎo):已知線路R的某輛公交車在時段T內(nèi),在(b,c)站間的運行延誤時間為Δt′bc,見圖2:
圖2 公交行駛圖示2Fig.2 Schematic Illustration 2 of bus driving
即其在(c,d)站間的預(yù)測行程時間tcd為
式中:pij=PTR(i,j)。
根據(jù)上述可見,首先由 Δt′bc確定di,找到Δt′bc在狀態(tài)轉(zhuǎn)移概率矩陣PTR中的行,然后求解該行概率下的轉(zhuǎn)移概率期望,即可得到該站與下一站的公交車輛站間的預(yù)測行程時間延誤,進(jìn)而得到站間的預(yù)測行程時間。
直接由概率矩陣得到的預(yù)測值在平穩(wěn)序列中的魯棒性較大,但當(dāng)公交線路行駛階段不穩(wěn)定狀態(tài)較多時,馬爾科夫預(yù)測值的失真度也較大,造成馬爾科夫鏈算法預(yù)測不準(zhǔn)確的假象。因此,提出了1種移動誤差補(bǔ)償法,提升預(yù)測精度。
改進(jìn)算法的基本思想是假設(shè)在公交車輛運行過程中,上一狀態(tài)的預(yù)測誤差與下一狀態(tài)的預(yù)測誤差具有較高的相似性,即用已知的預(yù)測誤差減少當(dāng)前預(yù)測時間的誤差。具體描述如下。
1)假設(shè)到達(dá)公交車站K時得到的馬爾科夫預(yù)測站間行程時間為tK,而實際的站間行程時間為則稱實際站間行程時間與預(yù)測站間行程時間tK的差值為公交車站K的移動誤差,即
上式為單步的移動誤差;K步的移動誤差為
2)當(dāng)城市道路上有突發(fā)事件發(fā)生時,實際的公交車輛站間行程時間會大幅度增加,帶來極端的移動誤差。為了消除極端移動誤差,在此引入移動誤差閾值θ,因此可將K步移動誤差公式改
寫為式中:移動誤差閾值θ為樣本數(shù)據(jù)中站間實際行程時間與平均行程時間之差的絕對值的平均值。
3)當(dāng)預(yù)測公交車站K與下一站K+1的站間行程時間時,將多步的移動誤差補(bǔ)償?shù)今R爾科夫預(yù)測值中,得到的站間行程時間預(yù)測值為
上式中前2項與基本算法的預(yù)測公式一致,為直接由狀態(tài)轉(zhuǎn)移概率矩陣得到的預(yù)測站間行程時間值。由引入閾值的移動誤差則可以不斷將前K個狀態(tài)的預(yù)測誤差補(bǔ)償?shù)较乱粻顟B(tài)的預(yù)測中。在公交車輛的1次行程中,前面幾個站點的數(shù)量可能滿足不了K個狀態(tài)的預(yù)測誤差補(bǔ)償,則以最大步長作為補(bǔ)償差,比如到達(dá)第3個站臺后要預(yù)測到達(dá)第4個站臺的行程時間,最大只能用2步的移動誤差補(bǔ)償。
為了評估該算法的預(yù)測性能,使用了廣州市BRT線路B1自2011年8月22日~28日共1周的GPS數(shù)據(jù)進(jìn)行實驗。首先由GPS數(shù)據(jù)得到狀態(tài)轉(zhuǎn)移概率矩陣,然后提取20個完整的公交線路行駛過程進(jìn)行預(yù)測仿真。
原始GPS數(shù)據(jù)給出的是時間和經(jīng)緯度信息,需要對公交站臺進(jìn)行匹配和車輛狀態(tài)分析,通過劃分得到公交車輛進(jìn)站出站的過程。其數(shù)據(jù)結(jié)構(gòu)見表1,平均每個時段可以獲得483個轉(zhuǎn)移序列對。
表1公交車輛GPS數(shù)據(jù)集數(shù)據(jù)結(jié)構(gòu)表Tab.1 Structural table of GPS data for the public vehicles
采用卡方檢驗方法來檢驗隨機(jī)過程{Xt,t∈T}是否具有馬氏性,根據(jù)上述統(tǒng)計估算法得到公交車輛站間行程時間延誤轉(zhuǎn)移頻數(shù)矩陣,進(jìn)而由轉(zhuǎn)移頻數(shù)矩陣和公式計算,可得
即有χ2=599.698 8。
令自由度為k=(m-1)2=(15-1)2,即k=196,此處取置信度α=0.01。由于k>45,χ2α(k)不能直接查表得到,當(dāng)k值足夠大時,有
式中:zα為標(biāo)準(zhǔn)正態(tài)分布的上α分位點。查表得到z0.01=2.235,則可得到可即該隨機(jī)過程為馬爾科夫過程。
同理對剩余劃分時段的值進(jìn)行計算,均有χ2,即對于各研究時段,其隨機(jī)過程符合馬氏性,也即所建立的模型為馬爾科夫模型。
為了評估和比較各個公交站間行程時間預(yù)測模型的預(yù)測精度,從而引入平均絕對相對誤差εM(mean relative percentage error,MRPE)和均等系數(shù)εE(equality coefficient,EC)2個指標(biāo),二者的定義分別為
式中:m為單程所要預(yù)測的站間行程數(shù),y′i為第i段行程的實測值,yi為第i段行程的預(yù)測值。εM表征了單程中預(yù)測值和實測值的平均絕對相關(guān)誤差,εM越小,表明預(yù)測精度越高;εE表征了單程中預(yù)測值對于實測值的偏離程度,εE越大,表明預(yù)測精度的穩(wěn)定性越高。
為了檢驗預(yù)測算法的精度,除了將預(yù)測算法的結(jié)果與實際數(shù)據(jù)進(jìn)行比較分析之外,實驗采用了BP神經(jīng)網(wǎng)絡(luò)作為對比預(yù)測算法。算法如下。
1)建立1個3層的BP神經(jīng)網(wǎng)絡(luò),其中輸入層共有5個神經(jīng)元,分別輸入時段T下前3 d各自的站間平均行程時間,該時段總的站間平均時間和上一狀態(tài)的站間行程時間。
2)中間層神經(jīng)元的數(shù)目采用經(jīng)驗公式
式中:n為輸入層神經(jīng)元數(shù)量,所以中間層的數(shù)量為3。神經(jīng)元激勵函數(shù)使用常用的Sigmoid函數(shù),其數(shù)學(xué)形式為
3)神經(jīng)網(wǎng)絡(luò)的輸出層為1個神經(jīng)元,輸出所要預(yù)測的站間行程時間。訓(xùn)練樣本同樣為B1的1周GPS數(shù)據(jù),確保了預(yù)測效果對比的可信性。
分別計算20次實驗中基本馬爾科夫算法、BP神經(jīng)網(wǎng)絡(luò)以及馬爾科夫改進(jìn)算法的平均絕對相對誤差和均等系數(shù),具體結(jié)果值見圖3、4。由圖3可知,馬爾科夫改進(jìn)算法的平均絕對相對誤差總體偏低,基本馬爾科夫算法次之,對比模型BP算法最高。而由圖4可知,馬爾科夫改進(jìn)算法的均等系數(shù)整體偏高,說明其預(yù)測穩(wěn)定性最高;同時,3種算法各自的評價指標(biāo)的平均值見表2。可以看出馬爾科夫改進(jìn)算法的平均MAPE最小,說明預(yù)測誤差小,平均EC最大,說明其預(yù)測穩(wěn)定性高。因此,從總體來看,馬爾科夫改進(jìn)算法在公交行程時間預(yù)測中更優(yōu),預(yù)測準(zhǔn)確性和穩(wěn)定性都較高,基本馬爾可夫算法次之。
圖3 MAPE對比曲線Fig.3 Comparison curve of MAPE
圖4 EC對比曲線Fig.4 Comparison curve of EC
表2 評價指標(biāo)平均值Tab.2 Average value of evaluation indicator
圖5為隨機(jī)抽取的4次實驗中公交站間行程時間的實測值和預(yù)測值對比示意圖。從圖5中可以看到,馬爾科夫改進(jìn)算法的公交站間行程時間預(yù)測結(jié)果較其他2種算法更加接近實測值。
圖5 實際值與預(yù)測值對比圖Fig.5 Comparison curve between actual value and predicted value
針對公交車輛的運行特性,提出了基于馬爾科夫鏈的公交站間行程時間預(yù)測及其改進(jìn)算法。筆者首先將公交車輛在站間的運行過程視作馬爾科夫鏈,由GPS數(shù)據(jù)提取出不同時段下站間行程時間的馬爾科夫狀態(tài)轉(zhuǎn)移矩陣,實現(xiàn)了站間行程時間的動態(tài)推導(dǎo);然后提出了移動誤差補(bǔ)償法對原有的馬爾科夫預(yù)測算法進(jìn)行了改進(jìn),以得到更高的預(yù)測精度。
最后,筆者以廣州市BRT線路B1的實際運行GPS數(shù)據(jù),通過基本馬爾科夫算法及BP神經(jīng)網(wǎng)絡(luò)算法對改進(jìn)算法進(jìn)行了驗證。實驗結(jié)果表明,引入移動誤差補(bǔ)償法對基本馬爾科夫算法進(jìn)行改進(jìn)后,公交站間行程時間預(yù)測精度和穩(wěn)定性均有所提高,效果更佳。
下一步的工作目標(biāo)是探究提出多組合模型算法,進(jìn)一步提高預(yù)測精度和穩(wěn)定性。
[1] 彭昌溆,周雪梅,張道智,等.基于乘客感知的公交服務(wù)質(zhì)量影響因素分析[J].交通信息與安全,2013,31(4):40-44.
[2] 周雪梅,楊曉光,王 磊.公交車輛行程時間預(yù)測方法[J].交通與計算機(jī),2002(6):12-14.
[3] 魏 華,賈守鎮(zhèn).公交車輛實時動態(tài)行程時間與行車間隔確定方法研究[J].渭南師范學(xué)院學(xué)報,2005(13):8-10.
[4] 韓 印,楊兆升,胡堅明.公共交通智能化調(diào)度基礎(chǔ)數(shù)據(jù)預(yù)測方法研究[J].公路交通科技,2003,6(3):140-143.
[5] Ehsan Mazloumi,Sara Moridpour,Grahan Currie,et al.Exploring the value of traffic flow data in bus travel time prediction[J].Journal of Transportation Engineering,2012(138):436-446.
[6] Chen Mei,Liu Xiaobo,Xia Jingxin.A dynamic bus-arrival time prediction model based on APC data[J].Computer-Aided Civil and Infrastructure Engineering.2004(19):364-376.
[7] 周文霞,徐建閩,劉正東.基于卡爾曼濾波算法的公交車輛行程時間預(yù)測[J].交通標(biāo)準(zhǔn)化,2007(2):174-177.
[8] Peng Chen,Yan Xinping,Li Xuhong.Bus travel time prediction based on relevance vector machine[C]∥Information Engineering and Computer Science,2009.ICIECS 2009.International Conference on.Wuhan:Wuhan University,2009:1-4.
[9] Yu B,Yang Z Z,Wang J.Bus travel-time prediction based on bus speed[J].Proceedings of the Institution of Civil Engineers-Transport,2010,163(1):3-7.
[10] Yu B,Ye T,Tian X M,et al.Bus travel-time prediction with forgetting factor[J].Journal of Computing in Civil Engineering,2012.
[11] Chung Y S,Kim J M,Kim D H,et al.A study to prediction modeling of the number of traffic accidents[M].Multimedia and Ubiquitous Engineering.Berlin:Springer Netherlands,2013.
[12] 李海姣,陸 建.基于交通流理論的公交站點間行程時間預(yù)測[J].交通信息與安全,2012,30(3):29-32.
[13] Hillier F S,Lieberman G J,胡運權(quán).運籌學(xué)導(dǎo)論[M].北京:清華大學(xué)出版社,2007:714-746.
[14] 馮耀龍,韓文秀.權(quán)馬爾科夫鏈在河流豐枯狀況預(yù)測中的應(yīng)用[J].系統(tǒng)工程理論與實踐,1999,10(10):89-98.
[15] 張 鑫,任永泰,王福林.基于改進(jìn)灰色馬爾科夫模型的年降水量預(yù)測[J].數(shù)學(xué)的實踐與認(rèn)識,2011,6(11):51-56.
[16] 雷宗光,張 君.基于馬爾科夫鏈模型的滬深300指數(shù)日收益率研究[J].科技創(chuàng)業(yè)月刊,2007,20(9):35-36.