王海曉, 丁 旭, 郭 敏
(內(nèi)蒙古農(nóng)業(yè)大學(xué)能源與交通工程學(xué)院,呼和浩特 010018)
城市道路交叉口作為城市道路網(wǎng)的樞紐,在交通高峰時(shí)期基本都處于高飽和或過飽和狀態(tài),學(xué)校周邊或中央商務(wù)區(qū)過飽和狀態(tài)更加明顯。目前平面交叉口常用的信號控制方式為單點(diǎn)定時(shí)信號控制,作為常規(guī)的交通節(jié)點(diǎn)管控方式,目標(biāo)是使交叉口的延誤盡可能降低,以整個(gè)交叉口的總延誤最小化為目標(biāo)進(jìn)行信號配時(shí)。
中外關(guān)于單點(diǎn)信號配時(shí)方法進(jìn)行了大量的研究,由于平面交叉口規(guī)模的拓展和交通負(fù)荷的不斷增加,根據(jù)對交叉口飽和情況的適配度,延誤控制評價(jià)理論也不斷地更新修正,目前最常用的方法是TRB(transportation research board)的HCM-2000[1]和HCM-2010[2],HCM(highway capacity manual)延誤模型自提出后,應(yīng)用在大量實(shí)際案例中,本質(zhì)是根據(jù)近似確定性的排隊(duì)累積圖來計(jì)算延誤[3],既適用于非飽和條件也適用于高飽和條件,是目前廣泛應(yīng)用的交叉口延誤計(jì)算方法。由于該公式發(fā)源于美國,飽和情況與中國的交叉口交通狀態(tài)差距較大,中國學(xué)者根據(jù)中國各城市具體案例進(jìn)行了深入的分析對比。張惠玲等[4]提出借助飽和車頭時(shí)距,計(jì)算車輛啟動時(shí)間點(diǎn),根據(jù)車輛的勻變加速過程,確定車輛恢復(fù)正常行駛速度的時(shí)間點(diǎn),從而計(jì)算車輛延誤。趙靖等[5]建立了一種交叉口車輛2次停車啟動的車均延誤計(jì)算模型,通過仿真對比,建立的最佳周期模型的平均誤差小于HCM-2010模型的計(jì)算結(jié)果。姚榮涵等[6]提出針對HCM公式泛化性能較差的缺陷,專業(yè)求解時(shí)應(yīng)根據(jù)不同交叉口的具體情況對系數(shù)賦值。劉巖等[7]提出過飽和狀態(tài)下短連線的信號交叉口路段長度對延誤產(chǎn)生影響的問題,推導(dǎo)出了基于短連線的過飽和信號交叉口最大延誤模型。
目前針對于HCM模型的研究主要集中于采用數(shù)學(xué)建模或統(tǒng)計(jì)軟件進(jìn)行修正,思路主要局限于根據(jù)飽和度的范圍與延誤之間的定量關(guān)系使用數(shù)學(xué)方法進(jìn)行糾錯(cuò)和模擬。針對HCM模型中各參數(shù)的統(tǒng)計(jì)學(xué)意義和交通學(xué)定義,從數(shù)據(jù)挖掘的思路衡量模型各參數(shù)相互依賴性的角度進(jìn)行研究尚屬首次,筆者對模型中的參數(shù)進(jìn)行了兩兩比對及組合比對,發(fā)現(xiàn)參數(shù)之間存在著非獨(dú)立性的互信息關(guān)聯(lián),借助大數(shù)據(jù)處理方法,運(yùn)用Java調(diào)運(yùn)MIC算法編碼對所有的變量進(jìn)行相關(guān)度分析,找出相關(guān)參數(shù)之間互信息關(guān)系的匹配后,擬尋找高飽和度狀態(tài)下延誤與其他變量(組)之間的最佳擬合關(guān)系,從而對模型進(jìn)行修正。
對于孤立交叉口的延誤分析,根據(jù)交叉口的不同飽和狀態(tài),分為穩(wěn)態(tài)延誤模型,定數(shù)延誤模型和過渡函數(shù)延誤模型。穩(wěn)態(tài)延誤模型適用于交叉口飽和度較小,通行能力富余的情況,車輛在每個(gè)信號周期內(nèi)完全清零;定數(shù)延誤模型適用于交叉口高度和過度飽和的情況,但是應(yīng)用過程中假設(shè)前提比較僵化,與實(shí)際車輛到達(dá)狀態(tài)不符;過渡函數(shù)模型介于二者之間,在以上兩種理論曲線之間尋求一種過渡函數(shù)曲線,適用性更廣。HCM模型屬于過渡函數(shù)曲線,是建立在穩(wěn)態(tài)和定數(shù)理論基礎(chǔ)上提出的一種隨機(jī)延誤模型,采用了信號聯(lián)動修正系數(shù)來考慮上游交叉口的影響,并將車輛到達(dá)類型按照密集程度由低到高劃分為6類,以適應(yīng)交叉口各種飽和狀態(tài),從而拓展了模型的適用范圍。
(1)HCM-2000的延誤計(jì)算公式為
(1)
HCM-2000只考慮了前后交叉口的信號聯(lián)動和飽和率太低時(shí)的誘增延誤;針對分析期初始階段的積余情況又提出了HCM-2010,全面考慮了高度飽和狀態(tài)時(shí)上周期剩余排隊(duì)車輛造成的附加延誤。
(2)HCM-2010的車均延誤的計(jì)算公式,分為兩種情況。
①當(dāng)無初始車輛排隊(duì)時(shí)延誤計(jì)算公式為
(2)
②當(dāng)存在初始車輛排隊(duì)時(shí)延誤計(jì)算公式為
(3)
式中:dij為車輛均勻到達(dá)時(shí)產(chǎn)生的延誤值,s/veh;Xij為車道飽和度;C為信號周期;λi為綠信比;Cij為流向的通行能力,pcu/h;di0為初始排隊(duì)附加延誤,由調(diào)查初始的排隊(duì)車輛數(shù)引起;T為調(diào)查交叉口延誤持續(xù)的時(shí)間,T=0.25 h;K為信號控制修正數(shù),(K=0.4);I為上游合流、分流的調(diào)節(jié)系數(shù)(I=1);fi為綠燈時(shí)車隊(duì)到達(dá)補(bǔ)充調(diào)節(jié)系數(shù);P為停駛車輛百分比;PE為均衡延誤協(xié)調(diào)系,PE=1;t為不存在車輛排隊(duì)的時(shí)間;u為延誤參數(shù);Qb為分析期初始積余車輛。
其中,式(3)中的第3項(xiàng)是由車輛到達(dá)的隨機(jī)性所導(dǎo)致的延誤。該模型適合于飽和度Xij≤1.2,交叉口飽和度Xij>1.2情況下結(jié)果偏差較大,當(dāng)飽和度再繼續(xù)加大時(shí),通過該模型得到的延誤誤差值會持續(xù)增大[6],計(jì)算結(jié)果的變動范圍較小,常規(guī)系數(shù)修正意義不大。
互信息可以看成是一個(gè)隨機(jī)變量中包含的關(guān)于另一個(gè)隨機(jī)變量的信息量,是變量間相互依賴性的量度。最大互信息系數(shù)(maximal information coefficient,MIC)是指一個(gè)隨機(jī)變量中包含的關(guān)于另一個(gè)隨機(jī)變量的信息量,或一個(gè)隨機(jī)變量由于已知另一個(gè)隨機(jī)變量而減少的不肯定性[8]。MIC可以用來衡量兩個(gè)參數(shù)之間的關(guān)聯(lián)程度的大小,及兩者之間線性或非線性關(guān)系,具有高標(biāo)準(zhǔn)化、低復(fù)雜度、高魯棒性的優(yōu)勢。
互信息值IG的計(jì)算思路是在二維空間坐標(biāo)平面劃分為(x,y)的網(wǎng)格G,構(gòu)造特征矩陣mxy,矩陣中的元素分別用行和列x、y來表示,網(wǎng)格G總數(shù)不能大于B,B取數(shù)據(jù)總量的0.6或0.55次方[9]。把兩個(gè)隨機(jī)變量化成散點(diǎn)圖,不斷用網(wǎng)格去分割,計(jì)算散點(diǎn)在每個(gè)網(wǎng)格里面落入概率的集中程度,以集中程度確定變量之間的相關(guān)度。在網(wǎng)格G內(nèi)取遍設(shè)定的所有可能的x、y對,互信息值計(jì)算公式為
(4)
式(4)中:聯(lián)合限制條件為|X||Y|
最大互信息值MIC的計(jì)算公式為
MIC(X:Y)=max(mxy)=
(5)
根據(jù)定義,可在二維空間坐標(biāo)平面下繪制出G網(wǎng)格中的MIC值。依次對網(wǎng)格中(x,y)選出的最大互信息進(jìn)行歸一化,并將歸一化后的值組成一個(gè)特征矩陣,矩陣中的每個(gè)元素取值為[0,1]。選取矩陣中的最大值作為檢測兩變量相關(guān)性的系數(shù),將特征矩陣中的值繪制為可視化的表面,這個(gè)表面上的最大值點(diǎn)即為度量兩變量間相關(guān)聯(lián)程度的MIC值,如圖1中星標(biāo)處所示。
圖1 二維空間生成的MIC值Fig.1 MIC value generated by the two-dimensional space
根據(jù)MIC的原理,只要兩變量間的相互關(guān)系不完全獨(dú)立,那么該算法即能夠度量兩變量間各種不同的線性關(guān)系和非線性關(guān)系。數(shù)據(jù)關(guān)聯(lián)性的原理類似于鳶尾花(Iris flower dataset)機(jī)器數(shù)據(jù)集。該數(shù)據(jù)集是三大著名機(jī)器數(shù)據(jù)集,可做多重變量分析,數(shù)據(jù)集內(nèi)包含了150個(gè)樣本,都屬于鳶尾屬下的3類品種,每類都有4項(xiàng)特征,花萼寬、花瓣寬、花萼長、花瓣長用于樣本定量分析,根據(jù)同一種類型的4個(gè)變量之間的散點(diǎn)矩陣圖,可視化體現(xiàn)兩兩成對的相互關(guān)系,以三種不同顏色對應(yīng)各簇散點(diǎn)群,確定花的屬種[11],如圖2所示。
圖2 Iris flower數(shù)據(jù)集中成對變量間的互繪圖(部分)Fig.2 Cross-plotting between pairs of variables in the Iris Flower data set (part)
HCM模型中各參數(shù)之間的關(guān)聯(lián)關(guān)系與Iris flower dataset數(shù)據(jù)集中4個(gè)特征參數(shù)的對應(yīng)規(guī)律非常相似,可以嘗試用MIC測試值檢驗(yàn)?zāi)P椭懈鲄?shù)之間的互信息量。
運(yùn)用無人機(jī)航拍技術(shù)以及檢測器收集了300組高(過)飽和狀態(tài)下的交叉口數(shù)據(jù),所選數(shù)據(jù)樣本均來自常規(guī)信號交叉口,無設(shè)置預(yù)信號、潮汐車道等特殊交通控制方式。提取交通流量、通行能力、有效綠信比,延誤值,如表1所示。由于以上各參數(shù)之間存在著相互影響和關(guān)聯(lián),如延誤與通行能力,綠信比與通行能力,延誤與交通流量等,參數(shù)之間各變量既相互獨(dú)立又同時(shí)包含著另外變量的信息,可以基本確定參數(shù)之間使用MIC測試值的有效性。
根據(jù)采集數(shù)據(jù)的處理要求,需要使用完整的數(shù)組(特別是矩陣)計(jì)算操作,選用R作為數(shù)據(jù)處理軟件進(jìn)行統(tǒng)計(jì)分析。R內(nèi)建多種統(tǒng)計(jì)學(xué)及繪圖分析功能,并且和其他編 程語言與數(shù)據(jù)庫之間有很好的接口[12]。
將表1中的數(shù)據(jù)導(dǎo)入R并畫出散點(diǎn)圖分析走勢,根據(jù)變量間的關(guān)系對各項(xiàng)參數(shù)進(jìn)行互繪,在不同的互繪圖中整理篩選出以延誤值d為自變量、其他參數(shù)及參數(shù)組合為因變量的散點(diǎn)圖。在R中加載rjava程序,設(shè)置環(huán)境變量并調(diào)試好JAVA運(yùn)行環(huán)境,通過調(diào)用MINE.jar(maximal information-based nonparametric exploration)應(yīng)用程序包,執(zhí)行jar命令,對表1中的數(shù)據(jù)集計(jì)算MIC等相關(guān)度測試值,可對延誤d與所有參數(shù)(組合)進(jìn)行互信息相關(guān)度分析,得到運(yùn)算結(jié)果如表2所示。
表1 交叉口車道組的實(shí)時(shí)數(shù)據(jù)統(tǒng)計(jì)
表2 相關(guān)度測試值
表2中,每一行的x均表示車輛延誤,y分別代表不同的參數(shù)和參數(shù)組合。各指標(biāo)分別為:MIC為核心測試值,體現(xiàn)參數(shù)間相關(guān)性分析的結(jié)果,越接近于1,表示相關(guān)性越強(qiáng);MIC-p2表示(x,y)之間能做非線性擬合的概率;MAS表示非單調(diào)性;Linear regression (p)表示所選(x,y)之間能做線性擬合的概率,與MIC-p2值是此消彼長的背反關(guān)系;MEV表示能夠函數(shù)化的概率;MCN 為復(fù)雜度評分。由表2可得,有3項(xiàng)MIC值接近于0.5以上,表明以上參數(shù)為非獨(dú)立變量,其中MIC值最高達(dá)到0.8以上,表示相對應(yīng)的參數(shù)相關(guān)性效果比較理想。由Linear regression (p)值分布特點(diǎn)可以判定延誤與流量qi、變量組q/Cij、q/λiCij之間存在明顯的復(fù)合線性函數(shù)關(guān)系,如圖3~圖5所示;由MIC-p2值分布特點(diǎn)可以明確延誤與綠信比λi、通行能力Cij為非線性關(guān)系,如圖6、圖7所示。由MEV值可得各變量(組)與延誤之間可進(jìn)行函數(shù)擬合,由MAS值可得各參數(shù)(組)與延誤之間同時(shí)存在單調(diào)和復(fù)合增減關(guān)系。
圖3 延誤d與當(dāng)量交通量q的散點(diǎn)圖Fig.3 Scatter plot of delay and traffic volume
圖4 延誤d與的散點(diǎn)圖Fig.4 Scatter plot of delay and Parameter combination
圖5 延誤d與的散點(diǎn)圖Fig.5 Scatter plot of delay and Parameter combination
圖6 延誤d與通行能力Cij的散點(diǎn)圖Fig.6 Scatter plot of delay and capacity
圖7 延誤d與有效綠信比λi的散點(diǎn)圖Fig.7 Scatter plot of delay and green signal ratio
根據(jù)測試指標(biāo)所得的結(jié)論對數(shù)據(jù)集進(jìn)行多元非線性擬合,為了確定從樣本統(tǒng)計(jì)結(jié)果推論至總體時(shí)所犯錯(cuò)的概率,首先利用R對多組數(shù)據(jù)之間分別做F檢驗(yàn)、最大似然比檢驗(yàn)、同方差檢驗(yàn)和正態(tài)分布檢驗(yàn),以確定樣本序列的平穩(wěn)性。同時(shí)還應(yīng)通過加入模型復(fù)雜度的懲罰項(xiàng)來避免出現(xiàn)過擬合問題。過擬合是指由于模型參數(shù)多、復(fù)雜度高,樣本不足,出現(xiàn)指定樣本集內(nèi)不能很好地?cái)M合數(shù)據(jù),樣本集外擬合效果卻較好的現(xiàn)象,通常表現(xiàn)為算法模型的高方差。本例使用的模型選擇評價(jià)指標(biāo)為赤池信息準(zhǔn)則(akaike information criterion,AIC)。AIC是衡量統(tǒng)計(jì)模型擬合優(yōu)良性的一種標(biāo)準(zhǔn),它建立在熵的概念上,提供了權(quán)衡估計(jì)模型復(fù)雜度和擬合數(shù)據(jù)優(yōu)良性的標(biāo)準(zhǔn),通常定義為AIC=2k-2lnl,其中k是模型參數(shù)個(gè)數(shù),L是似然函數(shù)[13]。從一組可供選擇的模型中選擇最佳模型時(shí),一般選擇AIC最小的模型,即最小化信息量準(zhǔn)則。
然后嘗試將延誤與各個(gè)參數(shù)(組)進(jìn)行初步擬合,擬和過程中利用機(jī)器語言多次循環(huán)運(yùn)算以保證樣本中的殘差序列盡可能剔除相關(guān)信息、趨近信息量最小化,從中篩選出一系列可行的備選函數(shù)模型;再分別計(jì)算出各個(gè)備選模型的AIC值,并在各個(gè)備選中選擇出最小AIC值所對應(yīng)的模型作為最終修正后的模型。完成上述運(yùn)算過程后,得到優(yōu)化后的模型為
(6)
式(6)中:a=0.4,b=163,c=14.3??烧頌?/p>
(7)
為了驗(yàn)證修正模型的提升效果,需要檢驗(yàn)其精度和適用性,擬選取呼和浩特市東二環(huán)路與新華東街交叉口、興安南路與鄂爾多斯大街交叉口進(jìn)行驗(yàn)證。所選交叉口均為主干路交匯,高峰期間車流量很大。其中興安南路與鄂爾多斯大街交叉口由于地處學(xué)校匯集區(qū)域,早高峰期間車流量集中聚集狀態(tài)更為明顯,屬于過飽狀態(tài);東二環(huán)路與新華東街交叉口位于呼和浩特市中央政務(wù)區(qū),但無學(xué)生和家長等受時(shí)間強(qiáng)制性約束的車流,早晚上下班高峰期間車流匯集效應(yīng)比較明顯,屬于高飽和狀態(tài)。圖8、圖9分別為這兩個(gè)交叉口的平面示意圖,在調(diào)查數(shù)據(jù)過程中,由于右轉(zhuǎn)車流處于常綠信號的無控放行狀態(tài),在延誤值的計(jì)算過程中不進(jìn)行統(tǒng)計(jì)。
圖8 東二環(huán)路與新華東街交叉口平面示意圖Fig.8 Diagram of the intersection of East Second Beltway and Xinhua East Street
圖9 興安南路與鄂爾多斯大街交叉口Fig.9 Diagram of the intersection of Xing’an South Road and Ordos Street
通過對交叉口的現(xiàn)狀交通狀況進(jìn)行調(diào)查,統(tǒng)計(jì)數(shù)據(jù)如表3、表4所示,將數(shù)據(jù)帶入優(yōu)化后的模型可以計(jì)算得出交叉口的延誤值,為了驗(yàn)證模型的準(zhǔn)確性和適用性,需要得出實(shí)際平均延誤值與修正模型計(jì)算延誤值進(jìn)行對比。
表3 東二環(huán)路與新華東街交叉口調(diào)查數(shù)據(jù)
表4 興安南路與鄂爾多斯大街交叉口調(diào)查數(shù)據(jù)
準(zhǔn)確的實(shí)際延誤值理論上應(yīng)實(shí)測調(diào)查后統(tǒng)計(jì)得到,認(rèn)可度較高的交叉口延誤調(diào)查方法為點(diǎn)樣本法,但是點(diǎn)樣本法的假設(shè)前提是車輛的停駛率不高于80%,在過飽和狀態(tài)下,到達(dá)交叉口的車輛基本都會有停駛等待的行為,停駛率已經(jīng)超過95%,所以點(diǎn)樣本法對高飽和(過飽和)狀態(tài)不適用,計(jì)算結(jié)果也缺乏參考價(jià)值。
使用VISSIM軟件對交叉口進(jìn)行多次交通仿真也可以得到較為精確地延誤結(jié)果,VISSIM仿真軟件界面逼真、精準(zhǔn)度較高,目前廣泛應(yīng)用于道路交通項(xiàng)目的評測和規(guī)劃中[14]。仿真過程中為確保仿真延誤值和真實(shí)值更加接近,采用最小種子數(shù)為30,最大種子數(shù)為42,種子數(shù)遞增為2,每次賦值仿真2次,最后取平均值作為平均延誤的輸出結(jié)果,可以排除仿真中的隨機(jī)因素對延誤結(jié)果的干擾,保證輸出延誤值的穩(wěn)定和可靠性[15]。本文所選案例交叉口的仿真界面(部分)如圖10所示。
圖10 仿真運(yùn)行界面Fig.10 Simulation operation interface
對案例中的交叉口入口引道延誤值分別使用HCM2010模型和本文修正后的模型所計(jì)算的數(shù)據(jù)進(jìn)行對比,以仿真延誤值作為對照組,分析結(jié)果如圖11、圖12所示??傻迷趦蓚€(gè)案例交叉口中修正模型均更加接近仿真值,尤其是在過飽和交叉口,修正模型的計(jì)算結(jié)果比HCM2010模型在精確度上有較大幅度的提高,比高飽和狀態(tài)下在應(yīng)用效果和精度提升方面更加明顯。
圖12 興安南路與鄂爾多斯大街交叉口延誤值對比Fig.12 Delay value of intersection of Xing’an South Road and Ordos Street
提出了將大數(shù)據(jù)處理中的MIC算法應(yīng)用于交通延誤模型的修正,根據(jù)HCM模型在過飽和狀態(tài)下的適配性差和具體交叉口應(yīng)用中出現(xiàn)的誤差和缺陷等,對交叉口延誤模型中的參數(shù)進(jìn)行了重新標(biāo)定和互信息測試,使修正后的模型在高飽和狀態(tài)及過飽和狀態(tài)下的延誤計(jì)算更加精確,從而可提供更加準(zhǔn)確可行的配時(shí)方案,提高交叉口運(yùn)行效率。
由于修正模型需要大量的統(tǒng)計(jì)數(shù)據(jù)作為基礎(chǔ),本文在模型修正過程中采集的樣本量規(guī)模有所欠缺,在今后的研究中有待于借助各類交通大數(shù)據(jù)的采集平臺,補(bǔ)充數(shù)據(jù)容量,以期有效避免因樣本量不足而導(dǎo)致的過擬合問題;同時(shí)應(yīng)搜集整理不同飽和度的交叉口數(shù)據(jù),發(fā)揮機(jī)器運(yùn)算的批量化和準(zhǔn)確度優(yōu)勢,對修正結(jié)果反復(fù)調(diào)試糾錯(cuò),以提升修正系數(shù)a、b、c的精確度,并建立修正系數(shù)數(shù)據(jù)集,量化飽和度指標(biāo)的取值范圍與修正系數(shù)的具體對應(yīng)關(guān)系,使模型具有更高的適用性和靶向性。