廖孝勇 崔德冠 孫棣華
(重慶大學(xué),中國(guó) 重慶 400044)
公交到達(dá)時(shí)間預(yù)測(cè)是智能交通領(lǐng)域研究的熱點(diǎn)問(wèn)題之一,而公交到達(dá)時(shí)間預(yù)測(cè)是一個(gè)持續(xù)改進(jìn)的過(guò)程。目前以存在了許多公交到達(dá)時(shí)間預(yù)測(cè)的方法,如人工神經(jīng)網(wǎng)絡(luò)算法,支持向量機(jī)、自回歸時(shí)間序列,卡爾曼濾波等等[1-3],這些算法均有自身的優(yōu)點(diǎn),但也存在一定的局限性,預(yù)測(cè)精度還有待進(jìn)一步的提高。文獻(xiàn)[1]已經(jīng)建立了公交到達(dá)時(shí)間預(yù)測(cè)模型,并且經(jīng)實(shí)驗(yàn)驗(yàn)證能取得較好的結(jié)果,而進(jìn)一步分析,其精度還可以進(jìn)一步提高。
因此,為進(jìn)一步提高公交到達(dá)時(shí)間預(yù)測(cè)的精度,本文在已有模型的基礎(chǔ)上,通過(guò)利用海量的公交車GPS 數(shù)據(jù)進(jìn)行長(zhǎng)期的測(cè)試,對(duì)分析測(cè)試結(jié)果做詳細(xì)的分析,同時(shí)結(jié)合公交車GPS 數(shù)據(jù),分析產(chǎn)生誤差產(chǎn)生的原因(特別是大誤差產(chǎn)生的原因),針對(duì)具體的問(wèn)題提出相應(yīng)的解決方案,對(duì)公交到達(dá)時(shí)間預(yù)測(cè)模型做進(jìn)一步的改善和優(yōu)化,以提高模型的精度。
文獻(xiàn)[3]將公交到達(dá)時(shí)間分成了路段行程時(shí)間、車站區(qū)域停留時(shí)間和其他延誤時(shí)間3 部分,提出了公交達(dá)到時(shí)間預(yù)測(cè)模型,如下所示:
公交到達(dá)時(shí)間預(yù)測(cè)精度的評(píng)價(jià)是一個(gè)相對(duì)的指標(biāo),既需要考慮到絕對(duì)誤差,又要考慮到乘客的主觀感受,因此,本文采用短時(shí)精度和長(zhǎng)時(shí)精度兩個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。
(1)短時(shí)精度。實(shí)際到站時(shí)間在5 分鐘內(nèi)的預(yù)測(cè)數(shù)據(jù)的絕對(duì)誤差在1 分鐘及以內(nèi)的數(shù)據(jù)個(gè)數(shù)占實(shí)際到站時(shí)間在5 分鐘內(nèi)的預(yù)測(cè)數(shù)據(jù)總量的比例。
(2)長(zhǎng)時(shí)精度。實(shí)際到站時(shí)間在5 分鐘及以上的預(yù)測(cè)數(shù)據(jù)的相對(duì)誤差在20%及以內(nèi)的數(shù)據(jù)個(gè)數(shù)占實(shí)際到站時(shí)間在5 分鐘及以上的預(yù)測(cè)數(shù)據(jù)總量的比例。
為了對(duì)公交到達(dá)時(shí)間預(yù)測(cè)模型的測(cè)試結(jié)果做進(jìn)一步的分析,根據(jù)測(cè)試結(jié)果所反映的規(guī)律來(lái)查找公交到達(dá)時(shí)間的影響因素,利用0811線路從2012 年7 月到2013 年2 月期間約200 天的測(cè)試結(jié)果的分布情況進(jìn)行分析,如圖1 所示。
通過(guò)長(zhǎng)期的測(cè)試結(jié)果可以看出,利用文獻(xiàn)[3]所建立模型預(yù)測(cè)公交達(dá)到時(shí)間可以達(dá)到較高的精度,短時(shí)精度和長(zhǎng)時(shí)精度整體上保持在85%-90%之間。但不可否認(rèn)的是,公交到達(dá)時(shí)間預(yù)測(cè)仍會(huì)產(chǎn)生較大的波動(dòng),有些天的預(yù)測(cè)精度(主要是長(zhǎng)時(shí)精度)低于80%。因此,如何進(jìn)一步提高公交到達(dá)時(shí)間預(yù)測(cè)的精度(包括降低長(zhǎng)時(shí)精度的波動(dòng)性),是本文研究的主要問(wèn)題。
圖1 公交線路0811 長(zhǎng)期公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果分布
首先,為了檢驗(yàn)短時(shí)精度和長(zhǎng)時(shí)精度之間是否存在顯著的差異,對(duì)兩者進(jìn)行T 檢驗(yàn),結(jié)果如表1 所示。
表1 短時(shí)精度和長(zhǎng)時(shí)精度差異對(duì)比
由表1 可以看出,公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果的短時(shí)精度和長(zhǎng)時(shí)精度具有顯著的差異,短時(shí)精度的均值為87.86%,高于長(zhǎng)時(shí)精度(85.08%),說(shuō)明將公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果分為短時(shí)精度和長(zhǎng)時(shí)精度是有必要的。同時(shí),這兩個(gè)指標(biāo)考慮到乘客候車的感受,對(duì)公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果的評(píng)價(jià)更加合理。
通過(guò)長(zhǎng)期結(jié)合公交到達(dá)時(shí)間預(yù)測(cè)模型的預(yù)測(cè)結(jié)果和海量公交車GPS 數(shù)據(jù)的分析,本文總結(jié)公交到達(dá)時(shí)間預(yù)測(cè)產(chǎn)生誤差(尤其是大誤差)的影響因素有:(1)數(shù)據(jù)問(wèn)題,包括數(shù)據(jù)缺失和數(shù)據(jù)錯(cuò)誤兩方面;(2)道路交通特性的差異影響;(3)司機(jī)駕駛行為差異影響;(4)異常事件影響;以下將對(duì)這些因素的情況及其對(duì)公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果的影響作進(jìn)一步的分析。同時(shí),針對(duì)這些問(wèn)題,提出進(jìn)一步的優(yōu)化方案。
2.1.1 數(shù)據(jù)質(zhì)量問(wèn)題
數(shù)據(jù)質(zhì)量問(wèn)題主要包括兩點(diǎn):其一,數(shù)據(jù)缺失;其二,數(shù)據(jù)錯(cuò)誤。具體如下:
(1)數(shù)據(jù)缺失。數(shù)據(jù)缺失是造成公交到達(dá)時(shí)間預(yù)測(cè)誤差(尤其是大誤差)的主要原因之一。
公交車GPS 數(shù)據(jù)分為運(yùn)營(yíng)數(shù)據(jù)和報(bào)站數(shù)據(jù)。所謂運(yùn)營(yíng)數(shù)據(jù)是記錄公交運(yùn)行過(guò)程的數(shù)據(jù),而報(bào)站數(shù)據(jù)是指公交在進(jìn)站或者出站的瞬間傳回的數(shù)據(jù),記錄了公交進(jìn)站或者出站的時(shí)刻。正常情況下每隔10 秒傳回一條運(yùn)營(yíng)數(shù)據(jù),即同一輛公交車相鄰兩條運(yùn)營(yíng)GPS 數(shù)據(jù)的之間的時(shí)間差為10,而報(bào)站數(shù)據(jù)之間的時(shí)間間隔不確定,因此,運(yùn)營(yíng)數(shù)據(jù)與相鄰的報(bào)站數(shù)據(jù)之間的時(shí)間差可能小于10。
(2)數(shù)據(jù)錯(cuò)誤。數(shù)據(jù)錯(cuò)誤是公交車GPS 數(shù)據(jù)中較為常見的一種現(xiàn)象,數(shù)據(jù)錯(cuò)誤情況如果得不到妥善處理,同樣會(huì)造成較大的誤差。公交車GPS 數(shù)據(jù)的屬性包括站點(diǎn)編號(hào)、車輛IP、瞬時(shí)速度、GPS 時(shí)間、里程信息、車輛狀態(tài)以及行車方向等信息,且不同屬性的錯(cuò)誤所造成的影響不同。
2.1.2 道路交通特性差異
由于道路交通上不同路段的地理?xiàng)l件、車道數(shù)量、車流量、人流量、與始發(fā)站的距離等方面的差異較大,不同路段的交通狀態(tài)變化程度不一致,造成不同站點(diǎn)的公交到達(dá)時(shí)間的預(yù)測(cè)結(jié)果差異較大。在此,以886 線路下行方向的動(dòng)步公園到大廟連續(xù)6 個(gè)典型站點(diǎn)的測(cè)試結(jié)果為例,利用方差分析檢驗(yàn)不同站點(diǎn)預(yù)測(cè)結(jié)果的差異性,結(jié)果如圖2所示。
圖2 公交線路886 從動(dòng)步公園到大廟路段劃分
可以看出,動(dòng)步公園和龍湖西苑兩個(gè)站點(diǎn)的預(yù)測(cè)精度較大,而新牌坊開始預(yù)測(cè)精度逐漸降,直到大廟站其預(yù)測(cè)精度才有所上升。進(jìn)一步分析其原因,造成軌道嘉州站預(yù)測(cè)精度下降的原因是:從新牌坊出站不到50 米為大轉(zhuǎn)盤,大轉(zhuǎn)盤處有等待周期較長(zhǎng)的信號(hào)燈,常造成新牌坊站出站口出發(fā)生堵車。加州花園的預(yù)測(cè)結(jié)果下降是因?yàn)槭艿郊t旗河溝立交上并道(由兩車道減為一車道)的影響,造成從軌道新牌坊大轉(zhuǎn)盤到紅旗河溝立交段經(jīng)常發(fā)生嚴(yán)重的交通擁堵。
進(jìn)一步,分析不同路段交通擁擠程度的波動(dòng)情況,以2013 年6 月1 日到2013 年8 月31 日連續(xù)3 個(gè)月的數(shù)據(jù)為基礎(chǔ),統(tǒng)計(jì)出每個(gè)車次在以上6 個(gè)站點(diǎn)的上一路段的路段行程時(shí)間,其分布圖如3 所示:
圖3 公交線路886 部分路段的路段行程時(shí)間分布情況
結(jié)合以上圖表可以看出,公交到達(dá)時(shí)間的預(yù)測(cè)精度與道路交通狀態(tài)的波動(dòng)程度有密切的關(guān)系,道路交通狀態(tài)平穩(wěn),公交車保定穩(wěn)定運(yùn)行狀態(tài),得到的公交到站時(shí)間的預(yù)測(cè)精度則相對(duì)較高,且較為穩(wěn)定,反之亦然。
2.1.3 駕駛行為差異
經(jīng)分析,由于不同司機(jī)駕駛習(xí)慣不同,有的司機(jī)較為冒進(jìn),而有的則相對(duì)保守,即使在相同的道路交通狀態(tài)下,不同的司機(jī)的行程時(shí)間也可能有較大的差異。利用方差分析檢驗(yàn)不同司機(jī)在相同條件下的路段行程時(shí)間,結(jié)果表明,車輛行程時(shí)間在不同司機(jī)之間具有顯著的差異。因此,考慮不同司機(jī)的駕駛行為習(xí)慣,將會(huì)有助于進(jìn)一步提高公交達(dá)到時(shí)間的預(yù)測(cè)效率。
2.1.4 異常事件影響
道路交通上異常事件的發(fā)生也是產(chǎn)生公交到達(dá)時(shí)間預(yù)測(cè)誤差的主要原因之一。一般對(duì)道路交通產(chǎn)生較大影響的異常事件有:車輛故障、貨物散落、異常天氣、交通事故、臨時(shí)大型活動(dòng)、交通臨時(shí)管制、道路維修等。這些異常事件雖然出現(xiàn)概率較小,但所造成的影響很大,輕則造成交通擁堵,增大出行成本,重則可能造成生命財(cái)產(chǎn)損失。且道路異常事件發(fā)生的時(shí)間、地點(diǎn)具有高度不確定性,一般難以準(zhǔn)確預(yù)測(cè)。較為可行的辦法是根據(jù)公交車GPS 數(shù)據(jù)及時(shí)檢測(cè)出異常事件,并且融合多線路多車的GPS 數(shù)據(jù),以實(shí)現(xiàn)對(duì)異常事件影響程度的估計(jì),通知交通管理部門及早采取有效措施,降低交通異常狀態(tài)所造成的影響。
以上已分析了造成公交到達(dá)時(shí)間預(yù)測(cè)結(jié)果產(chǎn)生較大誤差的主要影響因素,接下來(lái)需要對(duì)這些問(wèn)題提出進(jìn)一步的改進(jìn)方案。由于針對(duì)不同的問(wèn)題,改進(jìn)的程度不同,而且本文篇幅有限,在此僅著重介紹針對(duì)不同交通特性的優(yōu)化方案,而對(duì)于其他問(wèn)題的解決方案,只作簡(jiǎn)單介紹。
2.2.1 針對(duì)數(shù)據(jù)質(zhì)量問(wèn)題的改進(jìn)
(1)數(shù)據(jù)缺失的處理。文獻(xiàn)[3]以浮動(dòng)車覆蓋率作為標(biāo)準(zhǔn),將路段分為有效數(shù)據(jù)路段和無(wú)效數(shù)據(jù)路段兩種,該方法對(duì)公交車GPS 數(shù)據(jù)的缺失起到了一定的作用(尤其是無(wú)效數(shù)據(jù)路段上),但經(jīng)分析發(fā)現(xiàn),在有效數(shù)據(jù)路段也常見數(shù)據(jù)缺失的情況,因此,亟需一種更為有效的方法應(yīng)對(duì)數(shù)據(jù)的缺失。為了為數(shù)據(jù)缺失提供一種更為有效、適用范圍更廣的方法,在此提出利用經(jīng)過(guò)多車信息融合的方法,即考慮經(jīng)過(guò)同一路段多車的數(shù)據(jù),充分發(fā)揮其他數(shù)據(jù)的作用。具體方法如下:
第一,利用同一輛公交車的GPS 數(shù)據(jù)中序列值對(duì)數(shù)據(jù)缺失進(jìn)行判別,確定是否發(fā)生數(shù)據(jù)缺失。
第二,若確定發(fā)生數(shù)據(jù)缺失,則計(jì)算數(shù)據(jù)缺失的周期。若同一公交車數(shù)據(jù)缺失周期小于一定的時(shí)間范圍(如2 分鐘),利用同一路段上其他車輛的信息就行修正;若同一輛車數(shù)據(jù)缺失超過(guò)預(yù)定的時(shí)間范圍,則報(bào)“通訊中斷”。
其中,利用同一路段其他車輛信息進(jìn)行修正的具體方法是:確定在一定范圍內(nèi)在是否有其他公交車輛經(jīng)過(guò)相同的路段,若有,則利用其他車輛離當(dāng)前車輛距離最近的信息(如車輛狀態(tài)、瞬時(shí)速度、里程等)來(lái)填補(bǔ)當(dāng)前車輛的信息;若沒有其他線路的車輛信息作為參考,則選擇最近通過(guò)相同路段的同一線路的其他車輛的信息填補(bǔ)當(dāng)前車輛的信息。
(2)數(shù)據(jù)錯(cuò)誤的處理。當(dāng)確定GPS 數(shù)據(jù)發(fā)生有誤時(shí),則將該數(shù)據(jù)錯(cuò)誤部分當(dāng)缺失處理,再利用上述數(shù)據(jù)缺失的處理方法修正錯(cuò)誤的那部分的數(shù)據(jù)。
2.2.2 針對(duì)道路交通特性的改進(jìn)方案
為了消除不同道路交通特性對(duì)公交運(yùn)行時(shí)間的影響,首先需要根據(jù)道路交通狀態(tài)的大小和波動(dòng)程度對(duì)路段和時(shí)段進(jìn)行準(zhǔn)確、細(xì)致的劃分。對(duì)此,可以使用模糊K-均值聚類算法對(duì)具有不同交通特性的路段進(jìn)行劃分,具體如文獻(xiàn)[6]所述。在此,需要解決兩個(gè)關(guān)鍵問(wèn)題:
(1)輸入?yún)?shù)。由于不同路段的長(zhǎng)度、等級(jí)不同,為了消除不同路段的差異,需要定義“路段擁擠度”來(lái)表征每個(gè)路段的交通特性,具體計(jì)算方法如文獻(xiàn)[7]所述。
(2)劃分?jǐn)?shù)目。為了對(duì)具有不同交通特性的路段進(jìn)行更加精確、細(xì)致地劃分,需要確定合理的分類數(shù)目。由于目前對(duì)于道路交通特性的劃分沒有統(tǒng)一的標(biāo)準(zhǔn),在此利用逐步試驗(yàn)的方法,確定最終將具有不同交通特性的路段和時(shí)段劃分為6 類得到的效果最好。
2.2.3 針對(duì)駕駛行為差異的改進(jìn)方案
司機(jī)駕駛行為的差異主要表現(xiàn)在車輛運(yùn)行過(guò)程中的差異,因此,根據(jù)司機(jī)駕駛行為對(duì)模型的改進(jìn)主要是針對(duì)路段行程時(shí)間計(jì)算方式的改進(jìn)。主要包括行程時(shí)間的計(jì)算和根據(jù)司機(jī)駕駛行為修正兩部分。
(1)計(jì)算平均行程時(shí)間??紤]到GPS 數(shù)據(jù)的特點(diǎn),可利用其中的車輛里程信息可以計(jì)算車輛與最近站點(diǎn)間的距離l,其平均速度可以由該路段的路段區(qū)間平均速度代替。則該車到下游目標(biāo)站點(diǎn)的平均行程時(shí)間為:
(2)根據(jù)駕駛員駕駛行為特性對(duì)結(jié)果進(jìn)行修正。為了提高估計(jì)的精度,還需要對(duì)平均行程時(shí)間加以修正,修正后的平均行程時(shí)間為:
針對(duì)文獻(xiàn)[3]中的模型,本文從數(shù)據(jù)質(zhì)量、道路交通特性和駕駛行為修正等3 個(gè)方面進(jìn)行了改進(jìn)。為了驗(yàn)證模型的有效性,本文實(shí)際的公交車GPS 數(shù)據(jù)為基礎(chǔ),以886 線路從動(dòng)步公園到大廟連續(xù)6 個(gè)站點(diǎn)作為研究對(duì)象,對(duì)改進(jìn)的模型進(jìn)行驗(yàn)證。
進(jìn)一步,為了驗(yàn)證本文改進(jìn)模型的穩(wěn)定性,利用2014 年12 月21日到27 日共一周的公交GPS 數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果如表2 所示:
表2 改進(jìn)模型和舊模型連續(xù)7 天預(yù)測(cè)精度對(duì)比
從表2 可以看出,針對(duì)7 個(gè)典型的站點(diǎn),改進(jìn)模型在每一天的預(yù)測(cè)效果在短時(shí)精度和長(zhǎng)時(shí)精度方面都比舊模型有所提升。整體上7 天的預(yù)測(cè)效果在短時(shí)精度提高了1.51 個(gè)百分點(diǎn),長(zhǎng)時(shí)精度提高了1.88個(gè)百分點(diǎn),說(shuō)明了本文提出的改進(jìn)方案是有效的,而且預(yù)測(cè)結(jié)果更具有穩(wěn)定性。
本文在原有模型的基礎(chǔ)上,從數(shù)據(jù)質(zhì)量、道路交通特性差異、司機(jī)駕駛行為差異等方面進(jìn)行改進(jìn)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的模型的預(yù)測(cè)效果有了進(jìn)一步的提高,尤其是在那些預(yù)測(cè)精度較差的站點(diǎn)精度提高更大,整體預(yù)測(cè)效果也更加穩(wěn)定。
此外,由于交通異常事件是隨機(jī)事件,且發(fā)生的概率相對(duì)較小,難以對(duì)異常事件發(fā)生的位置、時(shí)間及其影響程度進(jìn)行預(yù)測(cè),目前較為可行的方案是在異常事件發(fā)生后及時(shí)、準(zhǔn)確地檢測(cè)出來(lái),然后再對(duì)其影響作進(jìn)一步的分析。目前的對(duì)道路交通異常事件的研究主要集中于高速公路或快速路,而對(duì)城市道路交通異常事件的研究相對(duì)較少。如何及時(shí)、準(zhǔn)確地檢測(cè)城市道路交通異常狀態(tài)并分析其影響程度,最終以提高公交到達(dá)時(shí)間預(yù)測(cè)的精度,是本文下一步工作的重點(diǎn)。
[1]孫棣華,賴云波,廖孝勇,等.公交浮動(dòng)車輛到站時(shí)間實(shí)時(shí)預(yù)測(cè)模型[J].交通運(yùn)輸工程學(xué)報(bào),2011(2):84-89.
[2]于濱,楊忠振,林劍藝.應(yīng)用支持向量機(jī)預(yù)測(cè)公交車運(yùn)行時(shí)間[J].系統(tǒng)工程理論與實(shí)踐,2007,27(4):160-164.
[3]Jeong R,Rilett L R.Bus arrival time prediction using artificial neural network model[J].International IEEE Conference on Intelligent Transportation Systems,2004:988-993.
[4]姜桂艷,郭海鋒,吳超騰.基于感應(yīng)線圈數(shù)據(jù)的城市道路交通狀態(tài)判別方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2008.
[5]李曉丹,劉好德,楊曉光,等.城市道路網(wǎng)絡(luò)交通狀態(tài)時(shí)空演化量化分析[J].系統(tǒng)工程,2008(12):66-70.