王 莉,翁小雄,張騰月
(華南理工大學 土木與交通學院,廣東 廣州 510640)
高速公路的收費業(yè)務數(shù)據(jù)中潛藏著有關車輛的周轉(zhuǎn)狀態(tài)和行駛特性等豐富的數(shù)據(jù)內(nèi)容,從這些數(shù)據(jù)信息中還原車輛的駕駛路線,提取相關參數(shù),這給予后續(xù)的狀態(tài)判別研究以扎實的數(shù)據(jù)基礎。
縱觀國外方面,GREENSHIELDS[1]研究速度與密度聯(lián)系,得到了線性相關的結論,并繪制出其關聯(lián)圖。EDIE[2]在密度稀疏區(qū)和稠密區(qū)分別采用Underwood的速度-密度模型和Greenberg模型[3]。KERNER[4]通過車流變現(xiàn)出來的相表征對交通流狀況進行識別。LV[5]在交通流預測中融入了自編碼算法。KUREMOTO[6]構建了RBM與DBN相結合的預測模型。國內(nèi)方面,對交通流狀態(tài)識別模型和算法的研究也已經(jīng)相對完善,用于研究的算法大致有這幾類:①基于神經(jīng)網(wǎng)絡技術:劉聰聰[7]在對過往的數(shù)據(jù)進行分析時,把小波神經(jīng)網(wǎng)絡與遺傳算法相結合,研究得出交通狀態(tài)參數(shù)與交通狀態(tài)的聯(lián)系。②基于模糊理論技術:黃艷國[8]等將各狀態(tài)數(shù)據(jù)的離散變化為參考基準,增加了歷史先驗數(shù)據(jù)和交通流數(shù)據(jù),采用FCM算法的空間位阻概率,把傳統(tǒng)的歐幾里得距離替換為對多維度數(shù)據(jù)與空間分布更加敏銳的馬哈拉諾比斯距離,實例證明該方法的識別結果更加準確。楊慶芳[9]等在交通狀態(tài)判別中應用模糊C均值,并使用Vissim工具進行模擬。③基于參數(shù)融合技術:丁恒[10]等采用聚類算法修正了路網(wǎng)的狀態(tài)參數(shù),在此基礎上,考慮干線交通流、匝道組合形式及鄰近地面路網(wǎng)條件對高速公路的影響,建立了基于流量與速度關系的狀態(tài)識別模型。韓坤林[11]等將融合了多源數(shù)據(jù)提出了一種融合異常狀態(tài)識別方法。
當下已有的大多數(shù)研究文獻中在對交通流的參數(shù)預測和狀態(tài)識別方面具有一定的局限性,就是其內(nèi)部運行機理無法從表象探知,而本文采用的基于出行車輛時空信息特征推斷交通狀態(tài)參數(shù)的方法是建立在數(shù)學模型的基礎上融入外部交通流的時空特征信息,由外而內(nèi)的揭示交通流從現(xiàn)象到本質(zhì)的原理。
交通流理論是研究流量、速度和密度等重要參數(shù)之間聯(lián)系的理論知識[12]。交通參數(shù)可以照見路面交通的變化狀況。其中,流量是指一定時域范圍途經(jīng)某斷面或車道的機動車數(shù)量[13]。在實際應用中流量總是伴隨著其他交通流參數(shù)一起出現(xiàn),主要是因為道路服務水平不僅受到流量大小的影響,還受到其他因素的控制。速度在交通流狀態(tài)判別方面,較常用的是時間平均速度這一概念,是衡量路段擁堵狀況的物理量,它可以更直觀地映現(xiàn)交通流量周轉(zhuǎn)狀態(tài)的問題。在城市道路管理中,由于密度參數(shù)難以測量,時間占有率常常被用來替代密度這一參數(shù)對交通狀態(tài)進行評估。
除了上述描述的要素,其實還受到諸多或外在、或內(nèi)在等因素的影響,在時間維度和空間維度方面不斷地處于一種動態(tài)的過程。這種動態(tài)變化會打破原有的平衡狀態(tài),不斷產(chǎn)生新的交通流狀態(tài),一旦路面車流量過飽和將會產(chǎn)生擁堵等異常狀況,這就產(chǎn)生了本次論文的研究動機。
從電子收費系統(tǒng)獲取的數(shù)據(jù),聚集了海量的數(shù)據(jù)信息,其數(shù)據(jù)結構主要由IC卡編號、入口站編號、入口日期及時間、入口車牌號碼、入口客貨標識、出口站編號、出口日期及時間、行駛里程、軸數(shù)、總軸重、總軸限、各軸軸重、超限重量等屬性組成。由于采集數(shù)據(jù)的集成、存儲、傳輸?shù)冗^程的不穩(wěn)定性導致數(shù)據(jù)存在缺失、異常等問題,所以需要對數(shù)據(jù)進行預處理。
針對數(shù)據(jù)缺失這一問題需要進行如下還原修復處理:①計算公式中單一字段屬性值缺失。例如總軸重等于總軸限與超限重量之和,或者是軸數(shù)與各軸軸重之積。對于公式中缺少3個字段屬性之一的情況,可以通過上述公式進行信息補全操作。②當車輛的出入口信息出現(xiàn)不一致的問題時,以出口信息為準,主要是因為入口信息由機器設備判斷,存在誤差,出口信息由人工檢驗,可對其進行糾正。③針對數(shù)據(jù)明顯異常這一問題需要進行剔除處理。剔除原則是在計算車輛行駛時間和速度時,通過離群值處理方法對出、入口日期及時間嚴重偏離正常值的數(shù)據(jù)進行剔除操作,但是在計算路段車流量和密度時需要保留該異常數(shù)據(jù)。在通過上述方法處理數(shù)據(jù)后,再從中隨機選取部分數(shù)據(jù)進行檢驗,如果核驗數(shù)據(jù)依舊存在問題,則返回初始步驟重新處理。研究過程如圖1所示。
圖1 研究過程
基于高速公路上運行車輛出行時間和空間位置等特征信息的模型,其主要思想是分時間分空間的對交通流參量進行求解。首先,對有用數(shù)據(jù)實行量化處理,并將公路按收費站劃分小段,然后,根據(jù)具體時間將處于該時間范圍內(nèi)不同空間位置上的車輛分配到具體的各個空間位置上,即當待分配車輛符合一定時間要求的情況下,該空間位置的交通參數(shù)屬性值增加一個單位量,構造出車輛在不同時間不同空間位置散布的二維矩陣圖。最后,根據(jù)皮爾遜系數(shù)和變異系數(shù)的差異,劃分出交通流相圖。
a.流量。首先,以收費站為分界點對各收費站點從0開始進行編號,將該高速公路分為0~1、1~2、……、k~k+1等不同路段,其示意圖2所示。
圖2 收費站示意圖
當車輛從空間位置0站點駛?cè)耄?點駛離,并在時間上滿足條件[t1,t2]的條件時,0~1路段時段的[t1,t2]流量屬性值增加一個單位量。同理,當從0處進入,由k+1處離開時,在路段0~k+1的各個空間位置上分別對應的時間范圍內(nèi)流量屬性值分別加一個單位量。即起始路段區(qū)域0~1上的車流量包含所有從收費站點0進入該高速,出口可以是任何收費站點的車輛;中間路段區(qū)域i~i+1上的車流量可以表示為途經(jīng)路段i-1~i期間的車流量總和Qi-1,i加上從收費站i-1進入的流量,再減去從收費站i-1離開的流量。其表達式見式(1)和式(2):
Q0,1=OD0,1+OD0,2+…+OD0,N=
(1)
(2)
具體情況分析:假設車輛在t時刻進入收費站,在各空間區(qū)域的駕駛時間分別為t01、t12、t23,在編號為0的收費站處在匝道上的駕駛時間為tr0。當車輛從0進入1離開,并滿足t1 表1 流量分布一Table1 Flowdistributionone0-11-22-3[t1,t2]1[t2,t3][t3,t4] 當某車輛從編號為0的收費站點進入高速,從編號為2的收費站點離開,并滿足條件:t1 表2 流量分布二Table2 Flowdistributiontwo0-11-22-3[t1,t2]11[t2,t3][t3,t4] 當上述車輛滿足條件:t1 表3 流量分布三Table3 Flowdistributionthree0-11-22-3[t1,t2]1[t2,t3]1[t3,t4] 同理,當該車輛從0點進入3點離開,則需要對條件t+tr0、t+tr0+t01、t+tr0+t01+t12以及所歸屬得某個時間范圍作出判斷,并進行不同空間位置不同時間范圍的分配,把線路上的車流量全部分配到相對應的空間位置和時間范圍。 綜上可以得到各個空間區(qū)域在不同時間范圍內(nèi)的流量分布矩陣Q,Qi,j表示ti到ti+1這一時間區(qū)間內(nèi),第j個空間位置的單位時域內(nèi)所有車子的數(shù)量總值。即: 0~1 1~2 … k~k+1 (3) b.速度。 速度屬性值可以由特定的行程長度和對應時域范圍的比值來表示[14]`,即: (4) 不同時域范圍相對不同空間位置的平均速度,即: (5) 0~1 1~2 …k~k+1 (6) c.密度。 關于密度的求解與上述獲取流量的方法步驟同理,主要是基于車輛的時空特征信息在不同空間位置對應不同時間范圍屬性值的累加,即在某一系列時間范圍內(nèi)于各不同空間位置上的分布情況,使得車子所屬空間位置在相應時間范圍的密度屬性值增加一個單位量,以便求取在統(tǒng)計時間范圍內(nèi)于某一空間區(qū)域的全部車輛的散布狀況。首先,判斷進入收費站的時刻tn距離參考時刻ti+1所需要的時間域ti+1-tn,所歸屬的高速線路起始和終止時刻對應的時間范圍;然后,確定出所有待分配車輛在ti+1時所屬空間位置詳情;最后,將待求解的空間位置處車輛均值與該空間位置的長度之比定義為統(tǒng)計時段的密度屬性值,即: (7) 其中,ti表示一個周期范圍的起始時間;Δt表示測量密度的時間間隔;n的取值范圍(1,ti+1/Δt)。 綜上,通過對統(tǒng)計周期內(nèi)所有時間范圍的密度進行計算,以統(tǒng)計周期內(nèi)n個密度屬性值求滑動均值作為該統(tǒng)計周期內(nèi)區(qū)間密度的估計值[15]。然后將不同時間范圍各空間位置斷面密度分布的二維矩陣表示為: 0~1 1~2 …k~k+1 (8) 其中,ki,j表示ti到ti+1時間區(qū)間,路段j的平均密度。 d.時間。 入口匝道時間:可以通過測量多個入口匝道獲取其里程長xr和等效加速度ar,然后擬合出其函數(shù)關系ar=f(lr),則入口匝道所用時間tr如下式所示: (9) 同理,出匝道所耗時間需要額外的排隊時間tp,即: (10) 則機車在各個空間區(qū)域(即由收費站i到j)的行駛時間tij,等于總的行駛時間Tij,去除進入i站點的匝道時間tri和離開j的匝道時間tcj,即: tij=Tij-tri-tcj (11) 假設統(tǒng)計周期為[tk,tk+1],進入i站點的時刻是ti,在i處的匝道時間域為tri,則該車輛在統(tǒng)計周期內(nèi)的行駛時間需要滿足tk 0~1 1~2 …k~k+1 (12) 交通流狀態(tài)參數(shù)的閾值主要是對SPSS軟件統(tǒng)計出的相關系數(shù)進行劃分,沒有特殊說明的情況下相關系數(shù)是指卡爾·皮爾遜系數(shù),其表達式如式(13)所示。變異系數(shù)的表達式如式(14),主要用來度量一組變量的離散關系。 (13) (14) 基于上述理論知識,構建如下交通流相圖,具體操作步驟如下: 圖3 交通流相圖構造程序圖 現(xiàn)以廣州市某條高速公路為例,首先將其劃分出9個收費站點,示意圖如圖4所示。 圖4 收費站點示意圖 各站點空間域距離如表4所示。 表4 各空間域距離Table4 Distanceineachspatialdomain空間域0-11-22-33-4距離50034709035704-55-65-75-818461162456745674 然后,統(tǒng)計連續(xù)7 d內(nèi)各空間域的車流量,以第1 d為例,如表5所示。 表5 各空間域車流量Table5 Trafficflowineachspacedomain0123008616413015380982021633919430030000438741189054575000061167133011527544780109781474206624567826220123169411676601069638000005185015821779664000000074238820909340334789604493452022103128771820 統(tǒng)計可知該天內(nèi)的收費數(shù)據(jù)樣本共5 185個,統(tǒng)計信息如表6所示。 表6 統(tǒng)計信息Table6 Datasamplestatistics樣本總量均值標準差偏度峰度51851093.75291.0388.53679.26 四分位法對上述數(shù)據(jù)處理后的統(tǒng)計信息見表7。 表7 數(shù)據(jù)處理后的統(tǒng)計信息Table7 Statisticsafterdataprocessing樣本總量均值標準差偏度峰度4914326.4788.7010.606-0.007 基于該高速公路出行車輛的出行特征信息通過分時間分空間模型對該高速公路的交通狀態(tài)參數(shù)進行求解,二維矩陣中一列為一個空間域,一行為一個時域,以15 min為一個統(tǒng)計時域的參考標準,則流密和速密關聯(lián)圖見圖5、圖6。 圖5 流量-密度時序圖 圖6 速度-密度時序圖 從圖5可以看出,該特定時空區(qū)域下的流量和密度聯(lián)系呈現(xiàn)出正相關的趨勢。在非高峰時域范圍對應交通流相圖的自由流部分。各個時間域的對應速度通過圖6直觀地展示出來。 通過對該條高速公路2018年9月2日-8日為期一周的收費數(shù)據(jù)經(jīng)過數(shù)據(jù)處理分析后,基于收費內(nèi)容中隱藏的車輛時空特征信息利用分時間分空間的方法對其狀態(tài)參數(shù)求解,得出如圖7、圖8所示的流密散點關聯(lián)圖和速密散點關聯(lián)圖。 圖7 流量-密度散點圖 圖8 速度-密度散點圖 通過時空特征信息方式推導出的流量-密度和速度-密度兩個散點關聯(lián)圖,兩幅圖片中展現(xiàn)的點對點關系均非一一對應的關系,從流量-密度的散點圖中的自由流狀態(tài)下,流量和密度呈現(xiàn)強正相關聯(lián)系,速度和密度之間的相關性不夠明顯,不過當密度超過某個閾值,速度會產(chǎn)生突變。通過上述理論基礎和交通流狀態(tài)劃分步驟對為期一周時間范圍內(nèi)的高速公路收費數(shù)據(jù)進行處理,得到了圖9所示的交通流相圖。 圖9 交通流相圖 圖9所示L1和L2區(qū)間的深色區(qū)域表明該區(qū)間的交通流狀態(tài)屬于自由流狀態(tài),L2和L3區(qū)間的淺色區(qū)域表明該區(qū)間屬于擁擠流狀況。從圖9可得知,該高速數(shù)據(jù)的堵塞密度為42 veh/(km·ln)。根據(jù)技術標準JTGB 01-2014相關參考規(guī)范[16],交通流的堵塞密度近似為41.67 veh/(km·ln)。相對誤差0.79%,換言之,該識別方法是有效可行的。 文章主要是對某一高速公路進出口數(shù)據(jù)記錄進行研究,通過對原始數(shù)據(jù)進行處理分析,挖掘出高速公路上運行車輛在時間和空間上的軌跡信息,建立了交通流狀態(tài)參數(shù)的二維矩陣模型,從該模型中可以獲取任一車輛在某一空間位置任一時刻的詳細信息,即任一空間位置在任意時間范圍的交通參數(shù)值,并由此推斷出當下時刻其他所有車輛的斷面分布狀況。通過分析獲取的交通流量和密度的散點關聯(lián)圖以及速度和密度的散點關聯(lián)圖,最終獲得識別交通流狀態(tài)的相圖。鑒于選取的高速公路和樣本數(shù)據(jù)的局限問題,該方法最終只識別出自由流和擁擠流兩部分。最后通過實例與標準對比結果表明相對誤差0.79%,說明該模型效果良好。3.3 交通流狀態(tài)劃分步驟
4 實例分析
5 結論