謝東繁,賈惠迪,李春艷,趙小梅
(北京交通大學(xué),交通運輸學(xué)院,北京 100044)
近年來,我國很多城市機(jī)動車保有數(shù)量不斷增大,城市道路交通擁堵日益加劇。據(jù)公安部統(tǒng)計,截至2020年6月,全國機(jī)動車保有量達(dá)3.6億輛,城市擁堵已經(jīng)成為常態(tài)。為解決交通擁堵等城市病,很多文獻(xiàn)從交通管理與交通誘導(dǎo)的角度提出緩解城市交通擁堵的措施,而大量措施的基本前提是準(zhǔn)確的行程時間估計。
道路行程時間通常受到多維度復(fù)雜因素的影響,如駕駛行為、道路屬性、交通狀況和信號配時等。因此,沿路段的行程時間是隨機(jī)分布的,故行程時間分布是行程時間估計、出行時間變異性和行程時間可靠性研究中不可回避的問題?,F(xiàn)有行程時間研究大多致力于尋找最佳擬合模型,擬合分布可分為單峰分布和其他分布。單峰分布多為高斯分布(Gaussian Distribution)、對數(shù)正態(tài)分布(lognormal Distribution)、伽馬分布(Gamma Distribution)、韋伯分布(Weibull Distribution)和布爾分布(Burr Distribution)[1-3]。Rahman等[4]利用公交車GPS數(shù)據(jù)對行程時間進(jìn)行估計時發(fā)現(xiàn),對數(shù)正態(tài)分布和正態(tài)分布是擬合較好的分布。Chen 等[5]經(jīng)過分析發(fā)現(xiàn),在不同時段、不同星期、不同路段位置、不同天氣條件下的出行時間分布更契合Burr 分布。對于其他分布,多為截尾分布和混合模型分布[6]。有研究證實混合模型對行程時間的擬合效果要優(yōu)于單模型擬合[7]。Cao 等[8]將行駛時間分解為運動時間(車輛實際行駛的時間)和排隊時間,使用截斷分布對運動時間建模,而將排隊時間用質(zhì)量分布和均勻分布的混合分布表示。Samara 等[9]使用有限高斯混合模型(GMM)估算分段行程時間分布,并應(yīng)用幾種Copula模型進(jìn)行擬合。
盡管當(dāng)前已經(jīng)有許多關(guān)于道路行程時間估計的研究成果,然而由于行程時間估計的多維度復(fù)雜影響因素,仍存在一些典型問題有待深入研究。首先,當(dāng)前的研究成果主要從統(tǒng)計數(shù)據(jù)自身的角度研究行程時間分布規(guī)律,沒有深入挖掘交通狀態(tài)等因素對行程時間的影響機(jī)制,從而導(dǎo)致行程時間估計的精度不高;其次,當(dāng)前研究多針對路段數(shù)據(jù)進(jìn)行挖掘分析,從路網(wǎng)角度對行程時間進(jìn)行深入研究的文獻(xiàn)較少;此外,由于道路交通網(wǎng)絡(luò)與交通狀態(tài)的動態(tài)性與復(fù)雜性,面向大規(guī)模路網(wǎng)的快速行程時間估計也是富有挑戰(zhàn)性的工作。
基于以上分析,本文面向大規(guī)模城市路網(wǎng),提出基于宏觀基本圖理論的行程時間估計方法,得到行程時間分布函數(shù),并進(jìn)行實例驗證。本文的出發(fā)點與創(chuàng)新之處體現(xiàn)在以下方面:首先,采用車輛軌跡數(shù)據(jù)標(biāo)定區(qū)域網(wǎng)絡(luò)宏觀基本圖模型,用于區(qū)域路網(wǎng)交通狀態(tài)的分析與辨識;進(jìn)而,在區(qū)域交通狀態(tài)劃分的基礎(chǔ)上,探析不同交通狀態(tài)下行程時間分布規(guī)律,驗證交通狀態(tài)對行程時間分布的重要作用;最后,提出考慮區(qū)域交通狀態(tài)的行程時間聯(lián)合概率密度模型,可以較好估計行程時間,也可以給出出行者在給定時間內(nèi)到達(dá)的概率,能夠為交通誘導(dǎo)與管控提供技術(shù)支撐。
本節(jié)利用出租車數(shù)據(jù)構(gòu)建宏觀基本圖,并使用高斯混合聚類方法,以速度為特征變量將交通狀態(tài)進(jìn)行劃分。
網(wǎng)絡(luò)層面的交通數(shù)據(jù)是開展宏觀基本圖研究的基礎(chǔ)。本文數(shù)據(jù)為北京市出租車的軌跡數(shù)據(jù),包含大約5萬輛出租車3個月的全天數(shù)據(jù)。數(shù)據(jù)由每輛出租車上的全球定位系統(tǒng)(Global Positioning System,GPS)設(shè)備自動采集得到,每10 s 上傳一條數(shù)據(jù),GPS數(shù)據(jù)是由一系列帶時間戳的空間位置點(以經(jīng)緯度表示)組成的集合。
選取北京市二環(huán)與三環(huán)之間的局部區(qū)域開展分析,具體選取區(qū)域為圖1矩形方框內(nèi)部區(qū)域。此區(qū)域長1.4 km,寬3.6 km。該區(qū)域有中共中央對外聯(lián)絡(luò)部、北京建筑大學(xué)、北京師范大學(xué)等多個文化景點,此區(qū)域毗鄰北京西站、西直門等地,人群、車輛往來密度大。對區(qū)域內(nèi)出租車的軌跡進(jìn)行繪制,可以看出區(qū)域內(nèi)所選行駛路徑的基本情況。
圖1 所選研究區(qū)域Fig.1 Selected study area
在城市交通中出租車與所有道路車輛的比例約為5%[10],為此難以直接基于出租車軌跡數(shù)據(jù)計算路網(wǎng)流量。針對此問題,宏觀基本圖理論中提出網(wǎng)絡(luò)平均密度kˉ和流量qˉ的計算方法,即
式中:l(d,i)為所有車輛在第d天第i個時段的行駛距離;t(d,i)為所有車輛在第d天第i個時段的行駛時間;L為路網(wǎng)中所有道路的長度之和;T為所研究數(shù)據(jù)的總時長。
在網(wǎng)絡(luò)中,出租車交通狀態(tài)變量和全部車輛交通狀態(tài)變量之間的基本關(guān)系為
式中:vp為網(wǎng)絡(luò)中出租車的平均速度;v為網(wǎng)絡(luò)中全部車輛的平均速度;Tp、Ta分別為出租車、全部車輛的總行駛距離;Ttp、Tta分別為出租車、全部車輛的總行駛時間;Na為全部車輛的數(shù)量;Np為出租車的數(shù)量。
由式(3)~式(5)可知,出租車的平均行駛速度與路網(wǎng)中所有車輛的行駛速度近似,故用出租車的總出行時間(VKT)和總出行距離(VHT)代替式(1)和式(2)中的t(d,i)和l(d,i)構(gòu)建網(wǎng)絡(luò)基本圖。為敘述方便,在后文的敘述中,流量用“總出行距離”標(biāo)識,密度用“總出行時間”標(biāo)識。
根據(jù)式(1)和式(2),得到研究區(qū)域的車輛密度與區(qū)域內(nèi)流量的變化曲線,以及區(qū)域內(nèi)車輛運行速度與區(qū)域內(nèi)車輛密度的變化曲線,如圖2所示??梢钥闯?,隨著路網(wǎng)中車輛密度的增加,平均速度逐漸下降。為更清楚地看到流量與密度隨時間的變化,繪制兩日的流量與密度的時間序列,如圖3所示。從圖中可以看出:流量與密度的變化趨勢相似,工作日與周末在0:00-6:00 時段流量較低,但周末0:00附近的流量和密度要大于工作日;工作日與周末早高峰的開始時間都出現(xiàn)在6:00左右,從此時刻開始,流量和密度急劇增加,工作日大約在8:30左右達(dá)到最高峰,而周末的高峰一直持續(xù)到13:00左右;工作日和周末的晚高峰數(shù)值都小于早高峰,這是由于早高峰的通勤出行時段更加集中,而晚高峰對時效的要求則相對寬松。
圖2 工作日與周末基本圖Fig.2 Fundamental diagrams of workdays and weekends
圖3 流量與密度的時間序列圖Fig.3 Time series of weighted flow and weighted density
宏觀基本圖可以描述路網(wǎng)平均流量、平均密度、平均速度之間的關(guān)系。穩(wěn)定的交通三參數(shù)關(guān)系是實現(xiàn)交通管理、交通控制和誘導(dǎo)的基礎(chǔ)。因此對基本圖進(jìn)行擬合,通過三參數(shù)的函數(shù)關(guān)系檢驗研究區(qū)域交通狀態(tài)的平穩(wěn)性和規(guī)律性。從圖2(a)可以看出,區(qū)域的流量-密度呈現(xiàn)拋物線的曲線關(guān)系,故在對流量-密度散點圖進(jìn)行擬合時,首先采用多項式函數(shù)進(jìn)行擬合。
利用一元一次、二次、三次函數(shù)對研究區(qū)域工作日和周末的流量-密度基本圖進(jìn)行擬合,分析區(qū)域的擬合情況,如圖4所示。選取R2和ERMSE作為擬合優(yōu)度評價指標(biāo),R2為確定系數(shù),通過數(shù)據(jù)的變化來表征一個擬合的好壞,正常取值范圍為[0,1],越接近1,說明模型對數(shù)據(jù)擬合的效果越好。ERMSE為均方根誤差,用來衡量觀測值同真值之間的偏差,結(jié)果如表1所示??梢钥闯觯瑹o論是工作日還是周末,一元三次曲線的擬合效果均最好,結(jié)合工作日和周末的流量和密度數(shù)據(jù)來看,工作日的流量和密度跨度大于周末,相比于周末更加離散,故周末的擬合效果要顯著好于工作日。因此,選擇一元三次曲線作為基本圖擬合函數(shù),工作日的基本圖函數(shù)和周末擬合函數(shù)分別為
表1 擬合優(yōu)度Table 1 Goodness of fitting
圖4 基本圖擬合曲線Fig.4 Fitting curves of Fundamental Diagram
式中:l1、l2分別為工作日、周末的總出行距離;t1、t2分別為工作日、周末的總出行時間。
為分析不同交通狀態(tài)對行程時間的影響,首先采用高斯混合模型聚類方法對區(qū)域交通狀態(tài)進(jìn)行聚類分析。這是由于高斯混合模型具有一個點可以屬于多個聚類,聚類形狀靈活的特點;同時,由于不同路段的交通狀態(tài)存在較大差別,通過高斯混合模型可以較好地表示出速度間的差異性。
根據(jù)交通流理論研究中對交通流狀態(tài)的劃分原則,將交通狀態(tài)聚類為3類是普遍認(rèn)為較為合理的交通狀態(tài)劃分結(jié)果[11]。為此,同樣將交通狀態(tài)劃分為3 類,即暢通、輕度擁堵和重度擁堵,如圖5所示。暢通狀態(tài)表示路網(wǎng)中交通流在自由流范圍之內(nèi),車輛能夠自由行駛,車輛行駛不受或者基本不受其他車輛的影響,駕駛自由度大;輕度擁堵是指交通流進(jìn)入不穩(wěn)定流狀態(tài),車輛行駛不順暢,速度受到很大約束,駕駛自由度低;重度擁堵則指交通流處于不穩(wěn)定流或強制流的范圍內(nèi),車輛形成隊列,車輛長時間處于低速行駛狀態(tài),在道路上停停走走。
暢通狀態(tài)對應(yīng)于圖5中倒三角形狀數(shù)據(jù)點,此時道路流量低,屬于自由流,汽車行駛速度高,車輛行駛不受道路上其他車輛影響。輕度擁堵狀態(tài)對應(yīng)于圖5中叉形數(shù)據(jù)點,此狀態(tài)與暢通狀態(tài)相比速度有所下降,道路流量開始增多,車輛行駛開始受到其他車輛影響,逐漸出現(xiàn)排隊現(xiàn)象。重度擁堵狀態(tài)對應(yīng)于圖5 中圓形數(shù)據(jù)點,此時車速已經(jīng)很低,均在25 km·h-1以下,屬于飽和流,車流量也很低,道路上車輛排隊擁堵成為常態(tài)。
圖5 區(qū)域交通狀態(tài)聚類結(jié)果Fig.5 Clustering results of regional traffic states
統(tǒng)計分析聚類結(jié)果,得到工作日3類交通狀態(tài)(即暢通、輕度擁堵和重度擁堵)對應(yīng)的密度區(qū)間分別為[0.0,3.5)veh·h-1,[3.5,13.0)veh·h-1,[13.0,20.0)veh·h-1;周末3類交通狀態(tài)對應(yīng)的密度區(qū)間分別為[0.0,5.0)veh·h-1,[5.0,11.0)veh·h-1,[11.0,20.0)veh·h-1。根據(jù)前文擬合得到的宏觀基本圖曲線,通過換算速度區(qū)間大小,進(jìn)而得到具體交通狀態(tài)等級參數(shù),如表2所示。
表2 區(qū)域交通狀態(tài)等級聚類劃分Table 2 Clustering classification of regional traffic state
當(dāng)前大部分研究將軌跡數(shù)據(jù)與路網(wǎng)地圖進(jìn)行匹配之后,對行程時間的指標(biāo)進(jìn)行計算。然而這種方法依賴于高精度的城市矢量地圖,存在研究適用性較差等問題;同時存在軌跡數(shù)據(jù)匹配計算量龐大,難以對海量數(shù)據(jù)進(jìn)行實時計算等問題。為此通過構(gòu)建地圖網(wǎng)格化模型,利用出租車軌跡數(shù)據(jù)直接獲取路徑行程時間。
在確定網(wǎng)長大小時,如果設(shè)置的邊長過小,如幾十米,可能會出現(xiàn)落入大多數(shù)網(wǎng)格的數(shù)據(jù)較為稀疏的情況;如果設(shè)置的邊長過大,如500 m或以上,則一個網(wǎng)格可能會覆蓋兩條平行的道路,無法對路段進(jìn)行精確分析。合適的網(wǎng)格大小應(yīng)該保證充足的數(shù)據(jù)量且網(wǎng)絡(luò)盡量不會覆蓋兩條或多條平行道路。因此,根據(jù)北京市的路網(wǎng)情況,將研究區(qū)域劃分成均勻的邊長為100 m的正方形網(wǎng)格,此時所選研究區(qū)域包含36×14個格子,路網(wǎng)的劃分情況如圖6所示。
圖6 研究區(qū)域劃分網(wǎng)格示例Fig.6 A case of regional grid division
出租車數(shù)據(jù)給定了出租車的時間戳和經(jīng)緯度。把每輛出租車的經(jīng)緯度根據(jù)時間戳連接起來,即形成出租車的軌跡數(shù)據(jù)。因此,將某一輛出租車的軌跡點按照時間進(jìn)行排列,則可得到該輛出租車的行駛路線,其平均速度為
式中:n為出租車的總數(shù);v(i)為第i輛出租車的平均速度;為第i輛出租車的第j個軌跡點的經(jīng)緯度;為兩個軌跡點經(jīng)緯度的歐式距離;為第i輛出租車在第j個軌跡點對應(yīng)的時間;為兩個軌跡點的時間差。
以5 min 為間隔,求出每個網(wǎng)格內(nèi)的平均速度后,結(jié)合表2,可以判斷出每個格子所屬的交通狀態(tài)。
常用的行程時間分布有正態(tài)分布、對數(shù)正態(tài)分布、Weibull分布、Gamma分布、Burr分布等,選取常用的行程時間分布模型進(jìn)行初步擬合,可以得到最符合分析區(qū)域內(nèi)行程時間的分布。選擇正態(tài)分布、t分布、指數(shù)分布、Burr分布、Gamma分布、對數(shù)正態(tài)分布、Weibull 分布和冪律分布等8 種分布進(jìn)行擬合。高峰小時數(shù)據(jù)量較大,能更好地表現(xiàn)出行程時間分布特點,故選擇7:00-8:00 的數(shù)據(jù)進(jìn)行擬合,得到結(jié)果如圖7所示。
圖7 不同分布模型的行程時間擬合結(jié)果Fig.7 Fitting results of various distribution models
從圖7 和表3 可以看出,擬合度較高的分布有對數(shù)正態(tài)分布、Weibull 分布和Burr 分布;t 分布和正態(tài)分布無法描述出行程時間的偏態(tài)特點,冪律分布頂點處過于尖銳。為確定最佳的重度擁堵狀態(tài)下的行程時間分布,對擬合p 值進(jìn)行計算,p 值越大,擬合效果越好,具體結(jié)果如表3所示。選擇對數(shù)正態(tài)分布、Weibull 分布和Burr 分布對15 h 的行程時間進(jìn)行擬合,使用AIC 準(zhǔn)則對結(jié)果進(jìn)行對比,并引入K-S 檢驗方法檢驗?zāi)P偷目尚行?。綜合考慮兩種方法的檢驗結(jié)果,以確定最優(yōu)的分布模型進(jìn)行后續(xù)分析。6:00-21:00 的擬合結(jié)果如表4所示,其中,AIC 值越小,說明擬合效果越好;K-S 檢驗結(jié)果中,Y 代表通過檢驗,N 代表未通過檢驗。結(jié)合表中數(shù)據(jù)可以發(fā)現(xiàn),在多數(shù)時間段,對數(shù)正態(tài)分布的AIC值都是最小的,即對數(shù)正態(tài)分布的擬合效果最好,Weibull分布的擬合效果居中,Burr 分布的擬合效果較差。但在部分交通平峰時段,如6:00、15:00 和16:00 時,Weibull 分布表現(xiàn)出更好的擬合效果。此外,從AIC數(shù)值來看,Weibull分布與對數(shù)正態(tài)分布的結(jié)果較為接近,但在17:00 這一高峰時段沒有通過K-S 檢驗。綜上,在重度擁堵區(qū)域,對數(shù)正態(tài)分布是最理想的,可以較好地表現(xiàn)出行程時間的離散和左傾特點。
表3 各分布模型擬合p值Table 3 P value of each distribution model
表4 各分布模型擬合檢驗結(jié)果Table 4 Fitting test results of each distribution model
運用同樣的方法,可以對輕度擁堵狀態(tài)和暢通狀態(tài)的網(wǎng)格進(jìn)行同樣的概率分布模型擬合,因篇幅限制,在此不再陳述擬合過程,僅對分析結(jié)果總結(jié)如下:
(1)在暢通狀態(tài)下,區(qū)域行程時間服從Gamma分布;
(2)在輕度擁堵狀態(tài)下,區(qū)域行程時間服從Weibull分布;
(3)在重度擁堵狀態(tài)下,區(qū)域行程時間服從對數(shù)正態(tài)分布。
式中:α,β為Gamma 分布的參數(shù);Γ(α)為Gamma函數(shù);k,λ為Weibull分布的參數(shù);μ,σ為對數(shù)正態(tài)分布的參數(shù)。
一條路徑由若干個網(wǎng)格所包含的路段組成,一條路徑的行程時間可通過各個網(wǎng)格內(nèi)的行程時間相加得到。但各個網(wǎng)格的交通狀態(tài)可能不同,故一條路徑的行程時間分布無法通過簡單的概率密度函數(shù)相加得出。
模型假設(shè)一條路徑的行程時間由車輛在多個網(wǎng)格中行駛的行程時間組成,網(wǎng)格內(nèi)的交通狀態(tài)不同,通過網(wǎng)格的行程時間也具有差異,暢通狀態(tài)下通過網(wǎng)格的行程時間服從于Gamma 分布,輕度擁堵狀態(tài)下通過網(wǎng)格的行程時間服從于Weibull 分布,重度擁堵狀態(tài)下的行程時間服從對數(shù)正態(tài)分布。假定3 種交通狀態(tài)下網(wǎng)格內(nèi)的行程時間各自對應(yīng)隨機(jī)變量X、Y、Z,一條路徑的總行程時間為TL,則TL=aX+bY+cZ,a、b、c分別為3 種交通狀態(tài)的網(wǎng)格數(shù)量,則總行程時間TL的概率密度函數(shù)為
式中:w為aX與bY之和;fW(w)為w的概率密度函數(shù);fZ(z)為z的概率密度函數(shù)。
從前文擬合得到的分布概率密度表達(dá)式來看,存在如exp(xd)的表達(dá)式,其積分不能用初等函數(shù)表示,無法用一個顯式的原函數(shù)來表達(dá),故最終的概率密度表達(dá)式無法給出顯示表達(dá)。為解決這一問題,本文提出采用近似函數(shù)擬合積分函數(shù)的方法。多項式函數(shù)可以接近于任何函數(shù),且易于積分,為此選用多項式函數(shù)近似表示難以積分的復(fù)雜函數(shù)。不失一般性,選址BP 神經(jīng)網(wǎng)絡(luò)模型進(jìn)行近似函數(shù)擬合。
以研究區(qū)域中的路徑1(動物園路)為例,該線路長度約為1.4 km。運用如上逼近方法求出近似表達(dá)式。在8:00-9:00 時間段內(nèi),擬合得到的λ為16.367,k為4.745,即,x取值范圍為0~30,生成新的數(shù)值與原始值比較如圖8所示。
圖8 原始值與逼近值對比Fig.8 Comparison of original and approximate values
為確定多項式的最佳擬合階數(shù),用0~20 次數(shù)進(jìn)行擬合,以均方誤差和R2作為選擇標(biāo)準(zhǔn),均方誤差越小,R2越大,擬合效果越好,結(jié)果如表5所示。
表5 0~20最高項次數(shù)擬合均方根誤差及R2 變化Table 5 0 to 20 maximum terms fitting root mean square error and R2 change
結(jié)合圖9和表5可以看出,在10階時擬合效果最好。故exp[-(x/16.367)4.745]的近似表達(dá)式為
采用同種方法求得沒有原函數(shù)的近似表達(dá)式后,即可求得fT(t)。仍以上述路徑在8:00-9:00 時段內(nèi)的行程時間為例,3 種交通狀態(tài)下行程時間分布擬合得到的參數(shù)如表6所示。將參數(shù)代入fT(t)進(jìn)行積分,即可求得fT(t)在8:00-9:00 時段內(nèi)行程時間的概率密度函數(shù)為
表6 各分布擬合參數(shù)Table 6 Distribution fitting parameters
根據(jù)式(14),繪制其曲線圖,如圖9所示,可得在給定時間范圍內(nèi)完成給定行程的概率為
圖9 選取路徑1在8:00-9:00聯(lián)合行程時間分布圖Fig.9 Joint travel time distribution of path 1(8:00-9:00)
式中:t1、t2為一段行程的最小行程時間、最大行程時間。假設(shè)t1為0,t2為1500,則路徑上的出行者在1500 s內(nèi)抵達(dá)目的地的概率為80.51%;假設(shè)t1為1000,t2為1500,則路徑上出行者花費1000~1500 s行程時間抵達(dá)目的地的概率為11.93%。
路徑平均行程時間是一個時段內(nèi)經(jīng)過該路徑的所有車輛行程時間的平均值。根據(jù)已經(jīng)得到的路徑行程時間概率密度函數(shù),可實現(xiàn)對行程時間變化趨勢的分析。通過概率密度函數(shù)可計算其均值,即
以1 h為區(qū)間,對6:00-22:00的行程時間進(jìn)行估計,結(jié)果如圖10所示。將真實值與估計值作對比,并計算平均絕對誤差。從圖10(a)可以看出,估計值與真實值的變化趨勢相近,時間變化趨勢也較為明顯,6:00-8:00 行程時間急劇增加,8:00 時達(dá)到一天的最高峰,之后逐漸下降,并趨于平穩(wěn),直至18:00 出現(xiàn)晚高峰。從圖10(b)可以看出,平均絕對誤差的百分比都控制在1.5%~16%,表明本文提出的模型能較為準(zhǔn)確地估計行程時間。
圖10 路徑1以1 h為區(qū)間行程時間估計及其平均絕對誤差Fig.10 Estimation of travel time and its mean absolute error with 1 h interval in route 1
為了檢驗時間區(qū)間大小對行程時間估計的影響,以15 min 為區(qū)間,對6:00-22:00 的行程時間進(jìn)行估計,結(jié)果如圖11所示。從圖11(a)可以發(fā)現(xiàn),估計值與真實值變化趨勢相似,與1 h 為區(qū)間的行程時間相比,一天中最大行程時間和最小行程時間都要小于以1 h 為區(qū)間的結(jié)果。對比估計精度,從圖11(b)可以看出,以15 min 為區(qū)間的平均絕對誤差范圍控制在2.5%~12.0%,精度略高于以1 h為區(qū)間的情況,估計的行程時間值更為接近真實值。
圖11 路徑1以15 min為區(qū)間行程時間估計及其平均絕對誤差Fig.11 Estimation of travel time and its mean absolute error with 15 min interval in route 1
為進(jìn)一步檢驗估計的有效性和適用性,選取區(qū)域內(nèi)的路徑2(車公莊西路)進(jìn)行估計,該路徑長約3.6 km。同樣分別以15 min 和1 h 為區(qū)間,對6:00-22:00的行程時間進(jìn)行估計,結(jié)果如圖12和圖13所示??梢钥闯?,以15 min為區(qū)間估計的平均絕對誤差百分比在1%~10%,要優(yōu)于以1 h 為區(qū)間估計的4%~11%。對比路徑1和路徑2的平均絕對誤差,發(fā)現(xiàn)路徑2 的估計誤差值要略小于路徑1,這是因為路徑2的長度要長于路徑1,數(shù)據(jù)量更多。
圖12 路徑2以1 h為區(qū)間行程時間估計及其平均絕對誤差Fig.12 Estimation of travel time and its mean absolute error with 1 h interval in route 2
圖13 路徑2以15 min為區(qū)間行程時間估計及其平均絕對誤差Fig.13 Estimation of travel time and its mean absolute error with 15 min interval in route 2
針對現(xiàn)有城市路網(wǎng)中行程時間估計計算量大、未考慮交通狀態(tài)影響等問題,本文提出基于道路網(wǎng)絡(luò)宏觀基本圖理論的區(qū)域交通狀態(tài)分析方法與行程時間估計方法,該方法既可以計算路徑行程時間的可靠性,又可以提供給出行者在一定時間內(nèi)到達(dá)的概率。主要研究方法與結(jié)論如下:
(1)基于出租車數(shù)據(jù),應(yīng)用高斯混合聚類方法,將網(wǎng)格交通狀態(tài)劃分為3類。針對3類區(qū)域進(jìn)行行程時間分析發(fā)現(xiàn),不同交通狀態(tài)下區(qū)域行程時間服從不同的分布函數(shù),在暢通、輕度擁堵和重度擁堵狀態(tài)下,行程時間分別服從Gamma 分布、Weibull分布和對數(shù)正態(tài)分布。
(2)提出路徑行程時間聯(lián)合概率密度模型,即可以計算路徑的行程時間的可靠性,還可以提供給出行者在一定時間內(nèi)到目標(biāo)區(qū)域的概率。
(3)經(jīng)數(shù)據(jù)驗證,模型的絕對誤差百分比可以控制較小范圍,可以較為準(zhǔn)確地對行程時間進(jìn)行估計,且計算速度快。
本文只考慮了交通狀態(tài)對行程時間的影響,未考慮對行程時間影響的更多復(fù)雜因素,如節(jié)假日、天氣等;在對路網(wǎng)進(jìn)行網(wǎng)格劃分時,選取標(biāo)準(zhǔn)的正方形,實際情況中,城市的規(guī)劃布局有所不同,正方形在一些條件下無法精確表示道路特征;從行程時間估計的精度來看,提出的模型尚有一定提升空間。在后續(xù)研究中,將對這些內(nèi)容進(jìn)行更加深入細(xì)致的研究。