周 昀,丁 峰,程添亮
(1.江蘇自動化研究所,江蘇 連云港 222006;2.日照市公安局交通警察支隊,山東 日照 276826)
智能交通系統(tǒng)是解決現(xiàn)代城市交通問題的主要方法。浮動車技術(shù)是基于GPS、GIS的獲取道路交通信息的一種新型技術(shù),相較于其他信息采集方法,浮動車技術(shù)采集路況信息更經(jīng)濟、覆蓋范圍廣、受天氣影響較小。出租車作為城市出行中最為活躍的交通工具,其行駛軌跡密度與城市人口居住密度存在較強的關(guān)聯(lián)關(guān)系。通過對交通信息的定性和定量分析,能夠為各種各樣的交通應(yīng)用提供服務(wù)。根據(jù)出租車途徑路口起訖點的分布特征,我們可以刻畫市民出行畫像;通過預(yù)測城市特征路口過車量,能夠為交通決策提供重要的參考意見。以數(shù)據(jù)為驅(qū)動的智能交通分析需要準(zhǔn)確的行車軌跡數(shù)據(jù)和精準(zhǔn)的地圖匹配數(shù)據(jù)作為支撐,本文中軌跡數(shù)據(jù)依賴于車載GPS,地圖數(shù)據(jù)依賴于高德地圖。由于數(shù)據(jù)的可獲取性,在已取得的成果上,本次研究提出點到點匹配與車輛行駛軌跡相結(jié)合的地圖匹配方法,使用更少的地圖信息,達到更精確的地圖匹配。
根據(jù)數(shù)據(jù)來源、數(shù)據(jù)形式、分析需求的不同,目前基于軌跡的地圖匹配算法主要有幾何匹配算法、拓?fù)潢P(guān)系算法、概率統(tǒng)計算法和先進匹配算法。在本文中則根據(jù)實際情況,我們選擇了幾何算法和拓?fù)潢P(guān)系算法相結(jié)合的算法。城市交通起訖點分析是監(jiān)測與管理城市交通運行情況的重要一環(huán),掌握城市交通需求方便我們采取合理的交通管控、規(guī)劃方案。早先起訖點研究中的檢測數(shù)據(jù)主要來自地磁、線圈等定點檢測數(shù)據(jù),Bell等、Perrakis等提出了一種基于貝葉斯估計的OD矩陣估計,結(jié)果表明模型估計和實際數(shù)據(jù)吻合度較高。曹喻旻等在車輛軌跡和定點檢測器數(shù)據(jù)的基礎(chǔ)上,提出了一種可以保證OD矩陣可靠性、計算路段流量與路段行程估計的OD估計模型。
路網(wǎng)交通流預(yù)測則從短時交通流的角度,對城市路況進行分析。張良力(2015)等使用ARMA模型對交叉口車輛的碰撞風(fēng)險進行了評估,根據(jù)車輛進入交叉口前的速度,預(yù)測車輛進入交叉口后的速度,作為判斷交叉口內(nèi)車輛發(fā)生碰撞的風(fēng)險依據(jù),基于ARMA模型的預(yù)測結(jié)果能夠?qū)崿F(xiàn)車速較高精度的預(yù)測。胡浩(2019)等基于ARMA和BP神經(jīng)網(wǎng)絡(luò)的組合模型,對城市路網(wǎng)中的特征路口交通流進行了預(yù)測,并驗證了預(yù)測效果的可行性和有效性。趙曉靜(2017)等針對短時交通流的突發(fā)性、時變性和非線性等特點,基于序列分解的思想,對信號期望數(shù)據(jù)建立ARMA模型,對噪聲數(shù)據(jù)進行維納濾波處理再建立預(yù)測模型,通過組合模型實現(xiàn)預(yù)測結(jié)果的優(yōu)化。
本文數(shù)據(jù)主體為浮動車軌跡數(shù)據(jù)和地圖數(shù)據(jù)。浮動車軌跡數(shù)據(jù)來自2020年日照市五月980輛出租車GPS軌跡數(shù)據(jù),包括軌跡點的經(jīng)緯度、時間戳、瞬時速度、行車方向等信息;地圖數(shù)據(jù)取自高德地圖,包括路口、道路等地理位置?;谝陨蠑?shù)據(jù)我們運用地圖匹配算法刻畫出租車的行駛軌跡,為分析城市通行分布與關(guān)鍵路口車流量預(yù)測提供數(shù)據(jù)支持。
由于受到設(shè)備硬件和信號傳播途徑的限制,我們需要對收集到的數(shù)據(jù)先進行數(shù)據(jù)清洗和坐標(biāo)系轉(zhuǎn)換,具體步驟如下。
(1)刪除重復(fù)、時間錯亂、缺失、漂移等軌跡數(shù)據(jù),其中20 s內(nèi)的缺失數(shù)據(jù)用均值法進行插補。
(2)坐標(biāo)轉(zhuǎn)換;將浮動車GPS裝置的WGS-84(World Geodetic System-84)坐標(biāo)轉(zhuǎn)換成GCJ-02坐標(biāo)系(火星坐標(biāo)系)。
(3)軌跡劃分;出租車在行駛過程中,會出現(xiàn)換班、休息等情況,導(dǎo)致行車軌跡出現(xiàn)間隔。在起訖點問題的分析中,完整的行車軌跡是關(guān)注重點,故需要將時間間隔大、沒有關(guān)聯(lián)關(guān)系的軌跡進行劃分,如果軌跡數(shù)據(jù)間隔超過8 h,我們認(rèn)為兩段軌跡不相關(guān)。
算法主要功能:統(tǒng)計出租車每天在不同路段的通行情況。
在起訖點算法中,首先要將軌跡點與地圖信息關(guān)聯(lián),對高架、快速路、復(fù)雜路口等情況,除了使用點到點地圖匹配法,還要考慮歷史軌跡,多條件約束下,保證路口地圖匹配地準(zhǔn)確性。其次,統(tǒng)計出租車起訖點通行量信息,根據(jù)統(tǒng)計數(shù)據(jù)分析日照市居民出行在時間和空間上的分布??紤]到出租車在城市交通中的特殊地位,其行車軌跡可用于刻畫城市客流分布信息和波動規(guī)律,為進一步提高城市公共交通服務(wù)水平、增強城市公共交通智能化管理提供了一種發(fā)展方向。
算法設(shè)計過程:
(1)用點到點地圖匹配算法初步獲取出租測經(jīng)過路口的信息;
(2)用點到線地圖匹配算法和軌跡點的行駛方向、與路口相對方向?qū)Φ谝徊降玫降穆房谛畔⑦M行檢查,進一步保證時間上相鄰的軌跡點在空間上也相鄰,得到最終的路口信息;
(3)針對第二步得到的結(jié)果,篩選出與路口最近軌跡點對應(yīng)的地圖信息,按照時間順序確定車輛途徑路口的軌跡;
(4)統(tǒng)計每輛車每條軌跡中途徑路口的路段信息,將所有路口按照時間順序兩兩匹配,得到起訖點路徑對,其中算法只記錄起點和終點不同的路徑對。
起訖點算法流程如圖1所示。
圖1 起訖點算法流程圖
本文使用統(tǒng)計學(xué)中的K-Means聚類和ARIMA模型對日照市出租車行駛軌跡分布以及關(guān)鍵路口車流量預(yù)測進行分析,K-Means是經(jīng)典的快速聚類法,ARIMA模型是傳統(tǒng)的時間序列分析方法。
交通流預(yù)測一直受到廣泛的關(guān)注,基于預(yù)測可以有效地了解未來時段的交通流狀態(tài)。本文通過分析特征路口車流量時間序列的內(nèi)部結(jié)構(gòu)特征,可推演出該路口出租車的行駛規(guī)律,最終實現(xiàn)路口過車輛的預(yù)測。常用的時間序列模型有ARMA(Auto-Regressive Moving Average Model,自回歸移動平均模型), ARIMA(Autoregressive Integrated Moving Average model,求和自回歸移動平均模型)是ARMA的擴展,適用于分析非平穩(wěn)時間序列,其表達式為
Φ(B)xt=Θ(B)εt
E(xsεt)=0,?s (1) 式中:B為延遲算子;Φ(B)=1-φ1B-…-φpBp,是自回歸系數(shù)多項式;Θ(B)=1-θ1B-…-θqBq是移動平均系數(shù)多項式,模型系數(shù)求解一般使用最小二乘估計或極大似然估計。若q=0,那么AEMA(p,q)就退化成AR(p)模型;若p=0,ARMA(p,q)就退化成MA(q)模型。 使用ARMA模型時,需要先檢驗序列的平穩(wěn)性,如果序列平穩(wěn),一般可以根據(jù)序列的自相關(guān)和偏自相關(guān)系數(shù)確定ARMA模型階數(shù);如果序列不平穩(wěn),需要對序列進行差分處理,提取趨勢、周期等信息得到平穩(wěn)序列后再建立ARMA模型,就可得到ARIMA模型。 基于本次樣本數(shù)據(jù)可統(tǒng)計出日照市路口浮動車每天車流總量和每小時的過車量,如圖2所示,日照市路口出租車每日總流量在50萬輛上下浮動(5月18日數(shù)據(jù)缺失,視為異常值,刪除),如圖3所示序列總體呈現(xiàn)出較強的周期性、時變性和非線性,時間上的分布特征明顯。接下來,使用K-Means聚類法和ARIMA模型分別分析日照市每日居民出行分布和關(guān)鍵路口車流量預(yù)測。 圖2 日照市路口日流量時序圖 圖3 路口小時流量時序圖 為了充分考慮到節(jié)假日對城市出行產(chǎn)生的影響,本次研究選擇2020年5月1日和5月8日為樣本。綜合描述性統(tǒng)計分析和K-Means聚類法,可得到居民出行在時間和空間上的分布為。 (1)時間上,每日出租車出行量有3個高峰,分別為上午高峰(7時~11時)、下午高峰(14時~19時)和夜間高峰(21時~22時),說明城市交通流量分布和居民工作和娛樂出行密不可分。 (2)空間上,工作日車流量較大的區(qū)域集中在市政中心、商業(yè)區(qū)、日照市各大醫(yī)院附近,節(jié)假日車流量主要集中在旅游景點、商業(yè)區(qū)和高鐵站附近,存在一定的節(jié)假日效應(yīng)。工作日居民的出行主要以工作、就醫(yī)為主,節(jié)假日則主要以娛樂、休閑為主。 基于日照市居民節(jié)假日和工作日出行在時間和空間分布的特征,我們發(fā)現(xiàn)居民的出行存在一定的周期規(guī)律。由于區(qū)域或路口客流量的大幅增加會給道路通行帶來巨大的壓力,如果能夠合理、準(zhǔn)確地預(yù)測重要路口的過車量,為居民出行提供路況信息,可以為減緩道路通行壓力提供一定的幫助。 在對城市關(guān)鍵路口車流量的分析中以大連路和北京南路交叉口為樣本,北京南路作為日照市的重要交通樞紐,其過車量具有一定的代表性。在后面的研究中以該路口5月前30天中每小時過車量序列,預(yù)測其5月31日的每小時過車量。 圖4 大連路、北京南路交叉口過車量序列分析 圖4(a)表明該路口出租車的過車量呈現(xiàn)出明顯的趨勢性和一定的周期性,ADF平穩(wěn)性檢驗后p值遠(yuǎn)小于顯著水平0.05,故該序列平穩(wěn)。在建模中從時間序列的隨機性分析和確定性分析兩個角度出發(fā),分別使用ARIMA季節(jié)模型和Holt-Winters三參數(shù)指數(shù)平滑模型。圖4(b)可知序列自相關(guān)拖尾并且包含明顯的周期因素,故對序列進行一階2步差分。 圖5 大連路、北京南路交叉口過車量序列殘差分析 對序列進行一階24步差分后,序列平穩(wěn),由于原序列的長期趨勢并不明顯,但是存在一定的短期趨勢。此處我們選擇加法和乘法ARIMA季節(jié)模型、Holt-Winters三參數(shù)指數(shù)平滑模型。如圖5(a)所示自相關(guān)和偏自相關(guān)系數(shù),我們選擇ARIMA(1,(1,24),)加法季節(jié)模型和ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型進行擬合。在確定性分析中,也同樣選擇了加法和乘法模型,四個模型的AIC值如表1所示。 表1 擬合模型AIC值 基于AIC準(zhǔn)則,選擇ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型描述該路口期望出租車過車量的時變性,模型如下 (2) 模型殘差序列白噪聲檢驗顯示模型的殘差短期內(nèi)不存在相關(guān)性,模型擬合效果理想,可以接受。殘差序列的方差齊性檢驗顯示,平方殘差序列不存在短期自相關(guān)性,根據(jù)圖6(b)可知殘差符合正態(tài)性假設(shè)且不相關(guān),故認(rèn)為ARIMA(1,11)×ARIMA(0,11)乘法季節(jié)模型可以用來刻畫該序列并進行預(yù)測。 由于ARMA族模型更適用于短期序列的預(yù)測,如果進行長期預(yù)測,預(yù)測誤差會逐漸變大,作為對比分別進行了6期、12期、18期和24期預(yù)測,預(yù)測效果如圖6(b)所示,預(yù)測精度地評價指標(biāo)如表2所示。從RMSE(均方誤差)來看,6期預(yù)測的精度更高,因為隨著預(yù)測期數(shù)的增加,RMSE也有一定程度地增加。由于RMSE對異常值敏感,說明超過6期的預(yù)測中,有個別點的預(yù)測誤差較大,MAE(平均絕對誤差)也驗證了這一點,這與圖6(b)的預(yù)測結(jié)果是一致的。在對預(yù)測精度要求較高的情況下,我們推薦使用短期預(yù)測。 圖6 大連路、北京南路交叉口過車量序列預(yù)測結(jié)果 表2 ARIMA(1,1,1)×ARIMA(0,1,1)乘法季節(jié)模型預(yù)測精確度指標(biāo) 本文基于出租車浮動車和地圖數(shù)據(jù),提出了一種結(jié)合點到點匹配與車輛行駛軌跡的地圖匹配算法,分析了城市居民的出行分布,預(yù)測了城市關(guān)鍵路口過車量。目前的研究成果還有很多需要進一步深入探索的地方,例如車流量預(yù)測中只考慮了特征路口,沒有對整個城市路網(wǎng)的車流量實現(xiàn)預(yù)測;ARMA族模型在非線性序列預(yù)測和長期預(yù)測上有一定地劣勢,可以考慮多模型組合的方法改進,在保證預(yù)測精度的基礎(chǔ)上,延長預(yù)測時間。希望在未來的研究中,充分融合多學(xué)科知識,為城市交通優(yōu)化提供科學(xué)的方法和支持。3 實證分析
3.1 路口起訖點分布
3.2 路口過車量預(yù)測
4 結(jié) 論