李揚 胡堯 商明菊 楊超 周江娥
摘要:為對新增車輛的通行擁堵進行預測,首先使用K-Medoids聚類算法將交通流運行狀態(tài)劃分為順暢、阻滯、擁堵三類,然后引入交通流特征參數(shù)構(gòu)建累積Logistic回歸模型量化新增車輛對路段運行狀態(tài)的影響,最后基于支持向量回歸機預測新增車輛通行時間。研究結(jié)果表明:當只考慮車流量、限行時段和二者之間的交互作用時,模型預測道路狀態(tài)的正確率達到82.36%,此時車流量在非限行時段每增加一輛車,發(fā)生比從順暢狀態(tài)轉(zhuǎn)為非順暢狀態(tài)的概率是原來的1.087倍:當考慮車流量、黃牌車比例、限行時段、外地車比例及后兩者的交互作用時,模型預測通行時間MSE最小,預測效果最優(yōu)。
關(guān)鍵詞:交通流運行狀態(tài);累積Logistic回歸模型;支持向量回歸機;通行時間
中圖分類號:0212文獻標識碼:A
目前,世界各大中城市幾乎都面臨著交通擁堵問題。交通擁堵給人們的生活帶來很多負面影響,例如降低人們的出行效率,對社會造成經(jīng)濟損失以及擁堵時尾氣排放等問題。交通擁堵在很大程度上阻礙一個城市的發(fā)展,因此構(gòu)建合理且易于實施的擁堵預測模型對人們尤為重要。
關(guān)于構(gòu)建交通擁堵預測模型,有很多學者進行了研究。熊勵等構(gòu)建基于MapReduce的多元對數(shù)線性回歸擁堵預測模型,預測效果良好:崔承穎等運用累積Logistic回歸方法對各路段的擁堵概率進行估計:劉夢涵等將似然比方法和累積Lo-gistic回歸模型結(jié)合運用到交通擁堵評價模型中。近年來,機器學習和深度學習也被廣泛應用在交通擁堵預測上,然而大多數(shù)預測僅限于對當前的車流量狀態(tài)進行預測,而根據(jù)當前的交通流狀態(tài),進行新增車輛通行擁堵預測的問題研究較少。
本文選取深圳市交通數(shù)據(jù)進行分析,運用聚類方法對交通狀態(tài)進行劃分,建立累積Logistic回歸模型,分析新增車輛對交通運行狀態(tài)的影響,并將構(gòu)建的累積Logistic回歸模型與支持向量回歸機模型結(jié)合預測出新增車輛的通行時間。
1 模型理論
2實證分析
2.1數(shù)據(jù)準備
研究數(shù)據(jù)來源于深圳尚龍數(shù)學中心網(wǎng)站(http://m2et,org/)公布的深圳市交通數(shù)據(jù)。選擇的路段位于北環(huán)大道新洲立交西往東方向,長度575m,離其最近的卡口為10100206卡口,選擇該路段2018年3月26日至2叭8年3月28日的數(shù)據(jù),整理數(shù)據(jù)得出在該時段1~3車道的車流量(每兩分鐘過車數(shù))、外地車(非粵B)匯人比和黃牌車(大車包括公交車)比例;此外,將白天設(shè)為1.黑夜設(shè)為0.將限行時段(7:00-9:00.17:30-19:30)設(shè)為1.非限行時段設(shè)為0.總結(jié)出時間屬性:計算路段的路段通行時間(長度除以通行速度),上述數(shù)據(jù)粒度為2min(全天共有720個時刻,3天2160個時刻)。表1為整理后的該路段部分數(shù)據(jù)。
取2018年3月26日和3月27日的數(shù)據(jù)作為訓練集,3月28日的數(shù)據(jù)作為測試集,得到卡口這3天每兩分鐘的過車數(shù)和通行時間時序圖,如圖1所示。
從圖1可看出:3月26日和3月27日的過車數(shù)時序圖趨勢相差不多,而3月28日的過車數(shù)趨勢在早上大約10點后下降,與實際情況相差較大,可能是數(shù)據(jù)的質(zhì)量造成的:3月26日為星期一,其通行時間的早高峰(約8:00)較3月27日和3月28日明顯,與實際情況相符。
2.2模型求解與評價
2.2.1基于Logistic回歸的交通運行狀態(tài)評估
將訓練集(3月26日和3月27日)的車流量和通行時間(長度/通行速度)進行K-Meclioids聚類,得到3類交通運行狀態(tài)聚類結(jié)果,設(shè)為1(順暢),2(阻滯),3(擁堵)。根據(jù)聚類結(jié)果,結(jié)合滑動窗口構(gòu)建解釋變量集,將交通狀態(tài)(順暢,阻滯,擁堵)作為響應變量建立累積Logistic回歸模型,經(jīng)過多種模型的選擇,得到三個模型。
其中:q(t)為t時刻車流量,S為時段(白天黑夜),W(t)為t時刻外地車比例,日(t)為t時刻黃牌車比例,α為時段S與外地車比例W(t)的交互作用;x為限行時段,β為車流量和限行時段的交互作用;γ為限行時段x和外地車比例W(t)的交互作用。AIC為在逐步回歸時以AIC信息統(tǒng)計量為準則,通常選取最小的AIC作為最優(yōu)模型。模型一考慮車流量、時段(白天黑夜)、外地車比例、黃牌車比例以及時段與外地車比例的交互作用,建立累積Logistic回歸模型,如表2所示。
由累積概率表達式(2)(3)得出S=1(白天)時,車流量q(t)、外地車比例W(t)、黃牌車比例H(t)對交通狀態(tài)都有影響。當外地車比例W(t)和黃牌車比例H(t)不變時,車流量q(t)的發(fā)生比為exp(0.015)=1.015.表明當流量每增加一輛車時,交通狀態(tài)從順暢變?yōu)樽铚驌矶聲r的概率是原來的1.015倍;當車流量q(t)和黃牌車比例H(t)不變時,外地車比例W(t)發(fā)生比為exp(3.695-3.259)=1.547.即外地車比例W(t)每增加一個百分比,交通狀態(tài)從1(順暢)變?yōu)?(阻滯)或3(擁堵)時的概率是原來的1.547倍。因此應該對外地車進行限時通行。
模型二只考慮車流量、限行時段(早晚高峰)、車流量和限行時段的交互作用等因素,得到結(jié)果如表3所示。
由累積概率式(4)(5)得到:當不在限行時段內(nèi)(x=0)時,只有車流量q(t)對通行時間有影響。車流量q(t)的發(fā)生比為exp(0.083)=1.087.表明此時車流量每增加一輛車時,交通狀態(tài)從順暢變?yōu)樽铚驌矶聲r的概率是原來的1.087倍。模型三考慮車流量、黃牌車比例、限行時段(早晚高峰)、外地車比例以及限行時段和外地車比例的交互作用,模型結(jié)果如表4所示。
由式(6)、(7)可得:當在限行時段內(nèi)(x=1)時,x和外地車比例W(t)有交互作用。有車流量q(t),黃牌車比例H(t)和外地車比例W(t)對通行時間有影響。外地車比例W(t)和黃牌車比例H(t)不變,車流量q(t)發(fā)生比為exp(0.063)=1.065.車流量每增加一輛車時,交通狀態(tài)從1(順暢)變?yōu)?(阻滯)或3(擁堵)時的概率為原來的1.065倍,這意味著γ=2(阻滯)和γ=3(擁堵)的概率會增加。
為評估各模型的預測效果,將該路段3月26日和3月27日作為訓練數(shù)據(jù)預測3月28日(一天共720個數(shù)據(jù))的交通狀態(tài),并將預測狀態(tài)與真實狀態(tài)作對比(當預測狀態(tài)和真實狀態(tài)一致表示預測正確,不一致則表示預測錯誤),分別計算三個模型預測的正確率。其中3月28日真實狀態(tài)為距三種狀態(tài)的聚類中心最短距離時所對應的交通狀態(tài)。設(shè)T、T、T分別表示真實狀態(tài)為順暢、阻滯、擁堵狀態(tài),P、P、P分別表示預測狀態(tài)為順暢、阻滯、擁堵狀態(tài)。表5描述三個模型在各情形下的數(shù)據(jù)個數(shù),其中每個模型下的9個數(shù)加起來為3月28日數(shù)據(jù)的總數(shù)量即720。
從表5計算正確率可得,模型一為59.58%,模型二為82.36%,模型三為80.280A,,比較各模型AIC信息統(tǒng)計量,模型二最小,因此在三個模型中,模型二能較好地測算出車輛增加時路段交通狀態(tài)的變化。
2.2.2基于支持向量回歸機的通行時間預測
上一節(jié)通過累積Logistic回歸模型得出新增車輛對路段交通狀態(tài)的影響,本節(jié)對新增車輛的通行時間進行預測。將累積Logistic回歸的三個模型代人支持向量回歸機中,運用滑動窗口法對窗口數(shù)^進行選擇,如圖2所示(圖中用“o”表示:MSE達到最小的滑動窗口數(shù))。
表6列出三個支持向量回歸機(SVR-1.SVR-2.SVR-3)對通行時間的預測結(jié)果,可以看出:對于滑動窗口數(shù),三個模型相差不大:但對比MSE,模型三的訓練MSE和預測:MSE在這三個模型中最小。因此針對新增車輛的通行時間預測,模型三在這三個模型中是最好的。
圖3更加直觀的展現(xiàn)了SVR三個模型的通行時間真實值和預測值的對比,可以看出模型三比其他兩個模型擬合效果稍好,但三個模型在下午4點至6點擬合效果不好,這可能是由于圖1中3月28日的車流量數(shù)據(jù)(過車數(shù))與實際不符造成的。整體來說,三個模型能夠較好的預測出通過該路段的通行時間,可為市民提供參考建議。
3結(jié)論
通過對深圳市交通數(shù)據(jù)建立累積Logistic回歸模型,研究結(jié)果表明:當只考慮車流量、限行時段和二者之間的交互作用時,模型正確率達到最高為82.36%,此時車流量在非限行時段每增加一輛車,發(fā)生比從順暢狀態(tài)轉(zhuǎn)為非順暢狀態(tài)的概率是原來的1.087倍:結(jié)合支持向量回歸機較好地預測出新增車輛的通行時間,其中考慮車流量、黃牌車比例、限行時段、外地車比例及限行時段和外地車比例的交互作用時,模型MSE最小,效果最優(yōu)。此外基于Logistic回歸的模型還說明,當外地車比例增加時,擁堵的概率會增大,因此應該對外地車進行限時通行來緩解高峰期時的交通擁堵狀態(tài)。本文研究結(jié)果可為交通相關(guān)部門提供參考。