杜豫川, 孫軼凡, 陳贛浙
(同濟大學 道路與交通工程教育部重點實驗室,上海 200092)
?
快速路網(wǎng)實時OD預測的時間顆粒度選擇
杜豫川, 孫軼凡, 陳贛浙
(同濟大學 道路與交通工程教育部重點實驗室,上海 200092)
常見的基于實測數(shù)據(jù)的origin-destination(OD)預測方法分為兩類:一類基于歷史信息,即根據(jù)上一天或上一周同一日相同時段的數(shù)據(jù)進行預測,簡稱同比預測法;另一類則是根據(jù)同一天相鄰時間段的數(shù)據(jù)預測本時段的OD,簡稱環(huán)比預測法.預測所用基礎數(shù)據(jù)的時段長度稱為時間顆粒度.時間顆粒度的大小對OD預測結(jié)果的穩(wěn)定性、準確性具有重要影響.針對上??焖俾肪W(wǎng),采用ADF單位根檢驗和K-Means聚類分析方法,研究時間顆粒度對預測結(jié)果的影響,提出了時間顆粒度選擇的建議,同比預測方法相比環(huán)比預測法更容易得出穩(wěn)定、合理的預測結(jié)果,30~60 min的時間顆粒度預測效果較好.
時間顆粒度; 快速路OD預測; 波動性; 相似性
對城市快速路網(wǎng)而言,每個上下口匝道都可以看成一個起點(O點)或終點(D點).它的OD信息是進行快速路交通運營和建設績效分析的基礎.隨著實測數(shù)據(jù)的累積,利用這些數(shù)據(jù)進行OD預測已經(jīng)成為人們獲取OD的重要途徑.通常根據(jù)OD矩陣的預測周期可以分為靜態(tài)預測方法和動態(tài)預測方法兩大類.由于實時交通管理的需求,動態(tài)OD預測逐漸成為當今研究的熱點.對于這類預測方法,國內(nèi)外學者進行了很多的研究,包括時間序列法、神經(jīng)網(wǎng)絡法[1-2]、支持向量機方法、卡爾曼濾波法[3-5]、非參數(shù)回歸方法[6]、貝葉斯推論法[7-9]等.目前,學者們對預測方法的研究已經(jīng)非常深入,但在預測基礎數(shù)據(jù)的時間顆粒度差異對預測結(jié)果的影響方面討論很少.事實上,快速路流量在不同的時間顆粒度下,對預測結(jié)果有很大影響,預測時選擇的時間顆粒度大小可能直接影響預測的效果.顆粒度過小可能造成預測結(jié)果的波動,過大則可能造成預測結(jié)果的不準確,需要根據(jù)實際數(shù)據(jù)進行科學分析.
動態(tài)預測方法根據(jù)基礎數(shù)據(jù)的不同可分為兩類,第一類方法需要一個先驗的OD矩陣、路徑和交通分配模型,它是基于歷史數(shù)據(jù)的預測方法,以歷史的OD預測當前時段的OD,這里將其定義為同比預測法.另一類則采用時變的路段交通量進行預測,以上一時段的OD預測當前時段的OD,這里將其定義為環(huán)比預測法.無論是同比預測或是環(huán)比預測,都需要采用一個時段長度(時間顆粒度)作為預測的基礎.本文將分別采用環(huán)比預測法和同比預測法,研究時間顆粒度的大小對快速路OD預測結(jié)果的影響,探討實時OD的預測效果.
設定一個交通流量統(tǒng)計時段(時間顆粒度),按此時段將快速路流量數(shù)據(jù)處理成時間序列數(shù)據(jù).相鄰時段OD預測結(jié)果波動性越大,說明該時間顆粒度下的OD預測越不可靠.環(huán)比預測需要建立在波動性小、平穩(wěn)性大的數(shù)據(jù)基礎上,因此在對快速路實時OD預測前,需要對不同時間顆粒度下的快速路OD數(shù)據(jù)進行波動性分析.時間序列的平穩(wěn)性檢驗就是一種進行波動性分析的重要手段和方法.
1.1 時間序列的平穩(wěn)性檢驗
平穩(wěn)性是一個很重要的特性,平穩(wěn)時間序列的基本特性在未來一段時間里將維持不變,而不平穩(wěn)的時間序列會產(chǎn)生結(jié)構(gòu)變動,而這種結(jié)構(gòu)變動將削弱預測結(jié)果的可靠性.分析表明,上??焖俾肪W(wǎng)上的OD交通量存在平穩(wěn)性,但可能由于時間顆粒度選擇不當影響預測結(jié)果的平穩(wěn)性,導致預測的不可靠.
常見的時間序列的平穩(wěn)性檢驗方法有以下幾種:圖形分析法、樣本自相關(guān)函數(shù)檢驗法、特征根檢驗法、游程檢驗法和單位根檢驗法[10].其中單位根檢驗是現(xiàn)代計量經(jīng)濟分析中檢驗一個時間序列是否平穩(wěn)的正式方法,包括DF(Dickey-Fuller Test)檢驗,ADF(Augmented Dickey-Fuller Test)檢驗,PP檢驗,KPSS檢驗以及ERS檢驗等多種.ADF檢驗是對DF檢驗的擴展,是目前實證研究使用最多的工具.所以,選擇ADF單位根檢驗對快速路OD波動性進行分析.
1.2 基于ADF檢驗的快速路OD波動性分析方法
在進行波動性分析時,按照不同時間顆粒度可以得到OD結(jié)果的不同時間序列,再應用ADF單位根時間序列平穩(wěn)性檢驗方法,得出檢驗結(jié)果.
ADF單位根檢驗的回歸模型包含沒有常數(shù)項和時間趨勢、僅含有常數(shù)項、含有常數(shù)項和時間趨勢三種情況,檢驗時,有各自的臨界值.
模型Ⅰ:含有常數(shù)項和時間趨勢項
(1)
模型Ⅱ:僅含有常數(shù)項
(2)
模型Ⅲ:不含常數(shù)項和時間趨勢項
(3)
式中:t是時間變量;α是常數(shù)項;α2t是時間趨勢項;ut是殘差.
采用t分布檢驗ρ=0,所得的統(tǒng)計量即為ADF值.在給定的顯著性水平下,如果ADF統(tǒng)計量小于臨界值,則參數(shù)ρ顯著地不等于0,則序列Yt不存在單位根,說明序列是平穩(wěn)的[11].
為了保證不同ADF檢驗平穩(wěn)性評價結(jié)果的準確性,采用ADF值的對應概值p作為評價指標,在一定的顯著性水平下(α=0.05):如果α=0.05,則拒絕原假設,序列不存在單位根,序列是平穩(wěn)的,而且p值越小,序列平穩(wěn)性越顯著;如果p>α,則接受原假設,序列存在單位根,序列是不平穩(wěn)的,而且p值越大,序列的不平穩(wěn)性越顯著.
通過平穩(wěn)性檢驗結(jié)果評價,定量分析了快速路OD數(shù)據(jù)在不同的時間顆粒度下的時間序列的平穩(wěn)性,而時間序列的平穩(wěn)性即是快速路OD數(shù)據(jù)的波動性;所以同樣的,快速路OD數(shù)據(jù)的波動性也采用ADF值對應概值p作為評價指標進行分析,p值越大,快速路OD的波動性越顯著,p值越小,則OD的平穩(wěn)性越好,該時間顆粒度下的環(huán)比預測效果越好.
基于ADF檢驗的快速路OD波動性分析流程設計如下(圖1):
圖1 基于ADF檢驗的快速路OD波動性分析流程Fig.1 Analysis process of expressway Origin-Destination(OD) volatility by ADF unit root test
不同日期的快速路OD流量作為兩列時間序列,具有一定程度的相似性.相似性越大的OD數(shù)據(jù),同比預測的效果越好.聚類分析就是一種進行相似性分析的重要方法.本文選擇K-means聚類分析進行OD相似性分析.
2.1K-means聚類分析
K-means算法采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度越大.算法認為簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作為最終目標[12].
在K-means方法中,k個初始類聚類中心點的選取對聚類結(jié)果具有較大的影響,因為在該算法第一步中是隨機的選取任意k個對象作為初始聚類的中心,初始地代表一個簇.在每次迭代中,對數(shù)據(jù)集中剩余的每個對象,根據(jù)其與各個簇中心的距離將每個對象重新賦給最近的簇.當考察完所有數(shù)據(jù)對象后,一次迭代完成,新的聚類中心被計算出來.繼續(xù)迭代,直到結(jié)果收斂[13].
2.2 基于K-means算法的快速路OD相似性分析方法
基于K-means算法的快速路OD相似性分析是將某一時間顆粒度下每一天的數(shù)據(jù)序列作為樣本進行聚類,OD數(shù)據(jù)劃分成若干的類別,對于不同的分類數(shù),反復應用K-means算法聚類,會得出不同的聚類結(jié)果.對于不同的聚類結(jié)果,其合理性、代表性可采用F檢驗方法進行分析評價.
設樣本空間由m個樣本組成,每組樣本ri包含n個特征觀測值,對于快速路OD流量而言,觀測樣本的特征值為一天之內(nèi)按每個時間顆粒度計算的OD流量值(x).所得數(shù)據(jù)表示如下:
(4)
式中:i=(1,2,…,m).總體樣本的中心向量為
(5)
式中:
(6)
(7)
式中:
(8)
F統(tǒng)計量為
(9)
在同一F分布下,F(xiàn)值越大,表明類間的差別更顯著.在一定的顯著性水平下(α=0.05),如F值大于臨界閾值F(c-1,m-k),則說明在該顯著性水平下,類間的差別顯著,類內(nèi)差別不顯著即相似性顯著,分類結(jié)果是合理的.
為了對不同的分類結(jié)果進行準確評價,采用F值的對應概值p作為評價指標.在一定的顯著性水平下(α=0.05):①多種分類情況下,p≤α,那么p值最小的那個分類結(jié)果是類間的差別與類內(nèi)相似性最顯著的,即其分類結(jié)果是最合理,最可接受的;②多種分類情況下,p≤α,但p值并不隨分類數(shù)變化而發(fā)生明顯變化.此時可以認為分類數(shù)最少的分類結(jié)果是最合理,最可接受的.
基于K-means聚類算法的快速路OD相似性分析流程設計如圖2所示:
圖2 基于K-means算法的快速路OD相似性分析流程
Fig.2 Analysis process of expressway similarity byK-means algorithm
3.1 研究范圍確定
對上海市快速路進行分區(qū),選擇其中6個交通小區(qū)作為研究對象,它們分別是延安中區(qū)北側(cè)、延安中區(qū)南側(cè)、南北北區(qū)西側(cè)、南北北區(qū)東側(cè)、內(nèi)環(huán)西北區(qū)內(nèi)圈、內(nèi)環(huán)西北區(qū)外圈,包含30個OD對.具體小區(qū)區(qū)域位置及編號信息如圖3所示.
3.2 快速路OD波動性分析
OD數(shù)據(jù)采用2008年12月8日—2008年12月21日的實際OD數(shù)據(jù).通過Eviews6.0中的ADF檢驗模塊對研究范圍內(nèi)確定的6個交通小區(qū)間的OD流量(共計30個OD對)進行不同時間顆粒度下的波動性分析.以1號小區(qū)至2號小區(qū)的OD流量作為分析樣例.
對各個時間顆粒度下O1(延安中區(qū)南側(cè))D2(南北北區(qū)東側(cè))流量,取12月8日數(shù)據(jù)進行ADF檢驗.首先取時間顆粒度為5 min,檢驗結(jié)果顯示,ADF檢驗值=-1.442 574,對應概值p=0.561 3,大于5%顯著性水平的臨界值,所以接受原假設,即時間顆粒度為5 min時,O1D2交通量序列是非平穩(wěn)的.
圖3 研究區(qū)域位置及編號
分析中采用的時間顆粒度為:5 min,10 min,15 min,30 min,1 h和2 h.
將各個時間顆粒度下O1D2流量的ADF檢驗結(jié)果進行匯總,如圖4所示.
圖4 O1D2流量波動性變化趨勢
由圖4可以發(fā)現(xiàn):在5%的顯著性水平下,5 min,10 min,15 min,30 min,1 h,2 h這幾個顆粒度下的O1D2流量的波動性都較顯著;隨著時間顆粒度的增加,序列的不平穩(wěn)程度呈現(xiàn)下降的趨勢,即O1D2流量的波動性呈現(xiàn)逐步減弱的趨勢.
對剩下的29個OD對分別進行分析(取12月8日的數(shù)據(jù)進行分析),將對應概值匯總于圖5.
由圖5可知:在顯著性水平下, 5 min,10 min,15 min,30 min,1 h和2 h這幾個時間顆粒度下的OD流量波動性都比較顯著;大部分OD對流量在這些時間顆粒度下,隨著時間顆粒度的增大,波動性逐漸減弱.
圖5 OD對流量波動性變化趨勢
對于一個時間序列而言,平穩(wěn)性是預測的重要基礎.綜合以上6個交通小區(qū)30個OD對的流量在不同時間顆粒度下的波動性分析,可以認為:研究范圍內(nèi)快速路OD流量在5 min,10 min,15 min,30 min,1 h和2 h這幾個時間顆粒度下,波動性都比較顯著,所以環(huán)比預測法進行快速路OD進行預測的話,所得結(jié)果的可靠性不高.
3.3 快速路OD相似性分析
K-Means算法聚類分析在SPSS 20.0環(huán)境下進行,研究對象仍為所確定的6個小區(qū)(30個OD對),時間跨度為12月8日—12月21日;研究的時間顆粒度為5 min,10 min,15 min,30 min,1 h,2 h,6 h,12 h和1 d;聚類數(shù)為2~7類.圖6是O1D2聚類對應概值變化的示例.
圖6 O1D2聚類結(jié)果
通過圖6以及其他OD對不同聚類數(shù)的分析,可以發(fā)現(xiàn):隨著時間顆粒度的增大,F(xiàn)統(tǒng)計量所對應的概值逐漸變?。辉? min,10 min,15 min,30 min,1 h,2 h這幾個時間顆粒度下,隨著分類數(shù)的增加,對應的概值呈現(xiàn)上升的趨勢;當時間顆粒度下大于2 h時,對應概值隨著分類數(shù)增加并不發(fā)生明顯的變化,且一直維持在較低的水平.
因此可以認為:時間顆粒度越大,不同日期同一時間段的快速路OD流量相似性越顯著;對于不同日期同一時間段的快速路OD而言,分為兩類是可接受的;在一定的顯著性水平下(α=0.05),O1D2流量相似性顯著的最小時間顆粒度及對應分類數(shù)為1 h(2類).
對剩余的29對OD進行分析并將匯總于表1.
表1 各OD對流量相似性顯著最小時間顆粒度及對應分類數(shù)
通過表1可以發(fā)現(xiàn),對于所研究范圍內(nèi)的30個OD對而言,相似性顯著的最小時間顆粒度及對應分類數(shù)有多種情況.由于對于快速路規(guī)劃及區(qū)域誘導而言,很多時候需要從整個路網(wǎng)的角度進行考慮,通過表1可以發(fā)現(xiàn),在研究范圍內(nèi),30 min和1 h的時間顆粒度可以使90%以上OD達到相似性條件,30 min以下的時間顆粒度相似性顯著的比例較低.
因此可以認為:30 min(2類)是同比預測中的快速路OD相似性顯著的最小時間顆粒度及對應分類數(shù);30 min以上的時間顆粒度下的快速路OD相似性都是顯著的.
表2是研究范圍內(nèi)O1D2流量在30 min(2類)情況下的聚類成員具體情況.
表2 O1D2聚類成員
通過表2不難發(fā)現(xiàn)在30 min(2類)情況下,所有工作日的OD數(shù)據(jù)都被分到了同一類中,而周末的數(shù)據(jù)分在另一組.結(jié)合研究范圍內(nèi)的所有OD對的聚類成員具體情況,可以發(fā)現(xiàn):29個OD對的工作日被分入了同一類內(nèi),占總數(shù)的96.7%.因此在30 min的時間顆粒度下,可以用工作日的快速路OD同比預測工作日,用雙休日的快速路OD同比預測雙休日的快速路OD.
3.4 快速路OD同比環(huán)比預測對比
從波動性分析中,可以得到:
(1)環(huán)比預測時,在小于2 h的顆粒度下,快速路OD流量的波動性都較顯著;隨著時間顆粒度的增加,快速路OD的波動性呈現(xiàn)逐步減弱的趨勢.
(2)同比預測時,時間顆粒度越大,快速路OD流量相似性越顯著;30 min以上的時間顆粒度下的快速路OD相似性都是顯著的.
(3)用工作日OD同比預測工作日OD的效果、雙休日OD同比預測雙休日OD的效果較好.
以上分析的實際交通狀況不包含交通事故,分析結(jié)果表明,在一天中快速路的波動性較大,引起這種波動性的原因可能是人們在一天里的通勤時間不一,這種波動性既可能是時間顆粒度的影響,也可能反應了不同時段內(nèi)OD確實不同的事實,這也是環(huán)比預測法的波動性比較大的重要原因.在相似性分析中,不同工作日同一時段的快速路OD具有較好的相似性,說明在不同工作日,不同的出行者趨向于選擇各自穩(wěn)定的出行時間.而周末由于沒有工作影響,人們出行的相似性并沒有工作日明顯.結(jié)合波動性和相似性的對應概值,如圖7所示.
從圖7可以發(fā)現(xiàn):環(huán)比預測需要較大的時間顆粒度才能讓OD波動性下降到合適的波動范圍內(nèi).而同比預測則在一個較小的時間顆粒度下,OD就能達到合適的波動范圍內(nèi).
圖7 O1D2流量波動性變化趨勢
在快速路交通管理中,常常需要一個時段內(nèi)的OD流量預測.因此可以認為:在沒有突發(fā)交通事故的情況下,比起利用一天內(nèi)實時數(shù)據(jù)的環(huán)比預測,利用歷史數(shù)據(jù)中同一時段的快速路OD同比預測更容易得到較合理的結(jié)果.
在研究時間顆粒度對預測結(jié)果影響的基礎上,采用上海快速路OD數(shù)據(jù)對環(huán)比預測方法和同比預測方法進行了比較,提出了預測時采用的時間顆粒度建議.得出如下結(jié)論:
(1)時間顆粒度對于OD預測結(jié)果的穩(wěn)定性、準確性具有顯著的影響.
(2)采用環(huán)比預測所得結(jié)果的波動較大,所需要的時間較長;利用同一時段的歷史數(shù)據(jù)進行同比預測,選擇30~60 min的時間顆粒度的OD預測效果可達到較好精度.
(3)與環(huán)比預測方法相比,同比預測方法更容易得出穩(wěn)定、合理的預測結(jié)果.
由于OD數(shù)據(jù)受限于時間跨度,在分類中無法對較多分類進行分析.同時,因為缺乏突發(fā)事件下的時間顆粒度選擇的分析,該研究還存在不足,有待進一步完善.
[1] Mussone Lorenzo,Grant-Mullersusan,陳海波. 基于線圈數(shù)據(jù)的高速公路OD矩陣預測神經(jīng)網(wǎng)絡法[J]. 交通運輸系統(tǒng)工程與信息, 2010,10(1): 88.
Mussone Lorenzo, Grant-Muller Susan, Chen Haibo.A neural network approach to motorway OD matrix estimation from loo counts[J]. Journal of Transportation Systems Engineering and Information Technology, 2010,10(1): 88.
[2] 羊文琦. 基于遺傳算法和BP神經(jīng)網(wǎng)絡的區(qū)域性公路交通量預測研究[D].成都:西南交通大學,2015.
YANG Wenqi. Prediction of highway traffic volume based on genetic algorithms and BP neural network[J]. Chengdu: Southwest Jiaotong University,2015.
[3] Ashok K, Ben-Akiva M. Dynamic origin-destination matrix estimation and prediction for real-time traffic management systems[C]∥International Symposiumon Transportation and Traffic Theory. Amsterdam: Elsevier,1993:465-484.
[4] Ashok K.Dynamic trip table estimation for real time traffic management systems[D].Cambridge:MIT,1992.
[5] 吳鼎新. 實時OD預測中卡爾曼濾波算法的應用[C]∥Proceedings of International Conference on Engineering and Business Management(EBM2010). 武漢:武漢大學, 2010:3756-3758.
WU Dingxin. Application of Kalman Filtering metheod to real-time OD estimation[C]∥Proceedings of International Conference on Engineering and Business Management(EBM2010). Wuhan: Wuhan University, 2010:3756-3758.
[6] 董春嬌. 多狀態(tài)下城市快速路網(wǎng)交通流短時預測理論與方法研究[D]. 北京:北京交通大學, 2011.
DONG Chunjiao. Theoretical research for short-term traffic flow prediction in multi traffic states on urban expressway network[D].Beijing:Beijing Jiaotong University,2011.
[7] 王金梅. 道路交通動態(tài)OD矩陣預測方法的研究[J]. 寧夏工程技術(shù), 2002,1(4): 362.
WANG Jinmei. The study and analysis of model algorithmic for dynamic origin-destination matrix estimation and prediction[J]. Ningxia Engineering Technology, 2002,1(4): 362.
[8] 邵昀泓,程琳,王煒. 最大熵模型在交通分布預測中的應用[J]. 交通運輸系統(tǒng)工程與信息, 2005, 5(1): 83.
SHAO Yunhong, CHEN Lin, WANG Wei. Application of entropy-maximizing(EM) model to traffic distribution forecast[J]. Journal of Transportation Systems Engineering and Information Technology, 2005, 5(1): 83.
[9] 于秋紅. 基于貝葉斯方法的分層優(yōu)化OD估計模型[J]. 公路,2014(11):123.
YU Qiuhong. A hierarchical optimization model to OD estimation based on Bayesian method[J]. Highway, 2014(11):123.
[10] 王立平,萬倫來,等.計量經(jīng)濟學理論與應用[M].合肥:合肥工業(yè)大學出版社,2008.
WANG Liping, WAN Lunlai. Theory and application of econometrics[M]. Hefei: Hefei University of Technology Publisher,2008.
[11] Dickey D A, Fuller W A. Distribution of the estimators for autoregressive time series with a unit root[J].Journal of the American Statistical Association,1979,74:427.
[12] 張建輝.K-means聚類算法研究及應用[D].武漢:武漢理工大學,2007.
ZHANG Jianhui. Research and application ofK-means clustering algorithm[D].Wuhan:Wuhan University of Technology,2007.
[13] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應用[J].計算機應用研究.2007, 24(5):166.
ZHANG Jianping, LIU Xiyu. Cluster analysis-basedK-means algorithm and its application[J]. Application Research of Computers, 2007, 24(5):166.
Time Granularity Selection for Expressway OD Real-time Prediction
DU Yuchuan, SUN Yifan, CHEN Ganzhe
(Key Laboratory of Road and Traffic Engineering of the Ministry of Education, Tongji University, Shanghai 200092, China)
Two methods, year-on-year prediction method and circularity-ratio prediction method, are often resorted to in the real-time origin-destination(OD) prediction. The former depends on historical information, such as the data about the previous day or week. The latter depends on the data of adjacent period to predict the real-time OD. The size of time granularity, the time period used in the real-time prediction of expressway network has a significant effect on the stability and accuracy of OD prediction results. The Augmented Dickey-fuller Test(ADF) unit root test andK-means algorithm are employed to study the effect of prediction results, and the size of time granularity is recommended. Compared with circularity-ratio prediction method, year-on-year prediction method can lead to the more stable and accurate result and a more satisfied time granularity is between 30 minutes and one hour.
time granularity; expressway origin-destination(OD) prediction; volatility; similarity
2015-07-30
“十二五”國家科技支撐計劃(2014BAG03B05)
杜豫川(1976—),男,教授,博士生導師,工學博士,主要研究方向為智能交通系統(tǒng)、運輸經(jīng)濟分析.E-mail:ycdu@#edu.cn
孫軼凡(1990—),男,碩士生,主要研究方向為智能交通系統(tǒng).E-mail:sunyf1201@126.com
U495
A