基金項(xiàng)目:2022年橫向課題“廣西高速公路交通擁堵防治智能決策系統(tǒng)”(編號(hào):GXHS-2022-016);2021年廣西交通職業(yè)技術(shù)學(xué)院重點(diǎn)科研項(xiàng)目“廣西高速公路交通擁堵防治的研究與應(yīng)用”(編號(hào):JZY2021KAZ05);廣西高校中青年教師科研基礎(chǔ)能力提升項(xiàng)目“大數(shù)據(jù)背景下道路運(yùn)輸安全風(fēng)險(xiǎn)預(yù)警平臺(tái)研究與應(yīng)用”(編號(hào):2022KY1122);“基于‘AI視覺(jué)+機(jī)器學(xué)習(xí)’的交通場(chǎng)景應(yīng)用研究”(編號(hào):2023KY1157)
作者簡(jiǎn)介:林立春(1974—),碩士,副教授,研究方向:計(jì)算機(jī)應(yīng)用技術(shù)和大數(shù)據(jù)技術(shù)。
摘要:基于門架和收費(fèi)站大數(shù)據(jù)的特征維數(shù)不高、數(shù)據(jù)量大、擁堵預(yù)測(cè)為模糊預(yù)測(cè)等特點(diǎn),文章選擇支持向量回歸(SVR)方法作為交通擁堵預(yù)測(cè)算法并加以優(yōu)化研究。通過(guò)研究和實(shí)踐表明,利用ETC門架和收費(fèi)站數(shù)據(jù)能夠準(zhǔn)確地獲取高速公路區(qū)間平均車速、交通流量等信息,利用合適的模型能夠較為準(zhǔn)確地預(yù)測(cè)未來(lái)的擁堵?tīng)顟B(tài)。
關(guān)鍵詞:高速公路;交通擁堵;預(yù)測(cè);門架;SVR
中圖分類號(hào):U491.1+4
0 引言
隨著我國(guó)高速公路里程、機(jī)動(dòng)車保有量和交通運(yùn)輸業(yè)務(wù)的增加,高速公路的交通擁堵也越來(lái)越嚴(yán)重。而全國(guó)高速公路ETC門架(以下簡(jiǎn)稱門架)系統(tǒng)早在2019年底已完成23 974個(gè),占比99.99%。門架產(chǎn)生的監(jiān)測(cè)數(shù)據(jù)以及眾多的收費(fèi)站數(shù)據(jù),將其脫敏后,利用大數(shù)據(jù)分析等算法,可以科學(xué)地預(yù)測(cè)道路的擁堵程度。出行者可據(jù)此合理安排時(shí)間和路線,提高出行效率和經(jīng)濟(jì)效益,降低安全事故隱患,減少污染,節(jié)約寶貴的時(shí)間[1]。
基于門架和收費(fèi)站大數(shù)據(jù)的特征維數(shù)不高、數(shù)據(jù)量大、擁堵預(yù)測(cè)為模糊預(yù)測(cè)等特點(diǎn),文章選擇支持向量回歸(Support vector regression,簡(jiǎn)稱SVR)方法作為交通擁堵預(yù)測(cè)算法并加以優(yōu)化。
1 支持向量回歸理論
SVR方法認(rèn)為預(yù)測(cè)值與實(shí)際值偏差不大即認(rèn)為預(yù)測(cè)正確,不用計(jì)算損失,只有當(dāng)超出范圍時(shí)才計(jì)算損失,這極大地減少了數(shù)據(jù)的計(jì)算,尤其是復(fù)雜數(shù)據(jù)的計(jì)算,正符合交通擁堵預(yù)測(cè)的需求。
回歸預(yù)測(cè)模型SVR的預(yù)測(cè)輸出值f(x)的一般公式如式(1)所示。
f(x)=wTx+b""" (1)
式中:w——法向量;
b——位移項(xiàng)。
僅當(dāng)預(yù)測(cè)值與實(shí)測(cè)值yi偏差大于ε時(shí),即|f(xi)-yi|gt;ε時(shí)才計(jì)算損失,ε的計(jì)算如式(2)所示。
s.t.f(xi)-yi≤ε+ξiyi-f(xi)≤ε+ξ*iξigt;0,ξ*igt;0,i=1,2,…,N
式中:ξi和ξ*i——松弛變量,即允許少數(shù)樣本不落在以yi為中心兩側(cè)ε寬的間隔帶內(nèi);
C——懲罰函數(shù)。
定義拉格朗日函數(shù)如式(3)所示。
式中,μi≥0,μ^i≥0,αi≥0,α^i≥0為拉格朗日乘子。根據(jù)拉格朗日對(duì)偶性得到:
假如解為α*=(α*1,α*2,…,α*N),在α^*=(α^*1,α^*2,…,α^*N)T中找出α*j∈α*且滿足Cgt;α*jgt;0,則有:
由此得出模型輸出的預(yù)測(cè)值f(x)為:
式中,K(x,xi)為核函數(shù),通過(guò)試驗(yàn)對(duì)比,選擇了徑向基核函數(shù),如公式(7)所示。
σ為核帶寬參數(shù),取值對(duì)預(yù)測(cè)效果有一定的影響。
2 擁堵預(yù)測(cè)模型
依據(jù)高速公路基本服務(wù)水平分析指標(biāo)與分級(jí)標(biāo)準(zhǔn),文章將區(qū)間平均車速作為擁堵判斷指標(biāo),共劃分6個(gè)交通擁堵?tīng)顩r等級(jí)[2],如表1所示。
2.1 預(yù)測(cè)模型整體架構(gòu)
建立SVR交通擁堵預(yù)測(cè)模型,整體架構(gòu)如圖1所示。先抽取特征,對(duì)特征數(shù)據(jù)降噪,并進(jìn)行歸一化處理,將歸一化后的數(shù)據(jù)集分為訓(xùn)練樣本集和預(yù)測(cè)樣本集,利用式(1)中的SVR算法進(jìn)行預(yù)測(cè),根據(jù)上一預(yù)測(cè)周期的預(yù)測(cè)數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)的誤差,進(jìn)行修正計(jì)算本輪預(yù)測(cè)結(jié)果,評(píng)估模型,優(yōu)化參數(shù),同時(shí)更新樣本集,逆歸一化,輸出結(jié)果。
2.2 抽取特征
目前,ETC門架、交調(diào)站、高清卡口、視頻監(jiān)控和浮動(dòng)車數(shù)據(jù)等已覆蓋全國(guó)90%以上高速公路,廣西已全區(qū)覆蓋。將門架數(shù)據(jù)、收費(fèi)站數(shù)據(jù)等多源數(shù)據(jù)進(jìn)行數(shù)據(jù)融合與清洗,脫敏后即可為高速路擁堵預(yù)防使用。例如對(duì)門架數(shù)據(jù)抽取如表2所示的特征。
2.3 降噪
如果某個(gè)特征中包含了大量的噪聲數(shù)據(jù),結(jié)果會(huì)在一定程度上影響預(yù)測(cè)模型的魯棒性?;诂F(xiàn)實(shí)中高速公路上有個(gè)別車輛在服務(wù)區(qū)停車、路上拋錨、事故、數(shù)據(jù)缺失、識(shí)別異常等情況,表現(xiàn)為趨于分散、能量較小的噪聲,采用陳淑燕等[3]等利用小波變換的方法可達(dá)到較滿意的降噪效果。
2.4 歸一化
交通流時(shí)間序列數(shù)據(jù)是隨機(jī)序列,若未歸一化,一來(lái)學(xué)習(xí)率大,二來(lái)收斂速度慢。對(duì)數(shù)據(jù)采用極差標(biāo)準(zhǔn)化歸一方法,將特征映射到[0,1]區(qū)間內(nèi),如式(8)所示。
式中: x*i——第i個(gè)數(shù)據(jù)xi的歸一化數(shù)據(jù);
xmax和xmin——最大和最小值[4]。
2.5 預(yù)測(cè)模型優(yōu)化
2.5.1 預(yù)測(cè)結(jié)果的修正計(jì)算
設(shè)時(shí)間窗步長(zhǎng)為S,當(dāng)預(yù)測(cè)出t+1時(shí)刻的值之后,要增減一個(gè)修正量。修正量δt+1的計(jì)算如式(9)所示。
即取距離預(yù)測(cè)時(shí)刻t+1最近的t-S+1,t-S+2,…,t等時(shí)刻的實(shí)測(cè)值與預(yù)測(cè)值差值的平均值為修正量。目的是使預(yù)測(cè)值的曲線更加貼近或圍繞實(shí)測(cè)值的曲線發(fā)展,使預(yù)測(cè)值進(jìn)一步逼近實(shí)測(cè)值,提高預(yù)測(cè)準(zhǔn)確度。實(shí)測(cè)值獲取方法見(jiàn)2.5.2。
2.5.2 平均車速實(shí)測(cè)值的計(jì)算
通過(guò)研究表2的數(shù)據(jù)內(nèi)容可發(fā)現(xiàn),利用“vehicleSpeed”、“transTime”等多個(gè)數(shù)據(jù)可獲取統(tǒng)計(jì)周期內(nèi)(15 min、0.5 h、1 h……)每輛車的行駛速度,進(jìn)而得出統(tǒng)計(jì)周期(時(shí)間窗)內(nèi)的門架附近的平均車速vs,如式(10)所示。
式中:vi——第i輛車行駛速度;
n——統(tǒng)計(jì)周期內(nèi)通過(guò)門架的車輛總數(shù),即交通流量。
收費(fèi)站附近的交通流量Q通過(guò)收費(fèi)數(shù)據(jù)很容易統(tǒng)計(jì),但是統(tǒng)計(jì)收費(fèi)站附近的平均車速vs較難。為計(jì)算收費(fèi)站附近的vs,可以根據(jù)公式Q=Kvs計(jì)算得出。Q為交通流量由收費(fèi)數(shù)據(jù)得出,K為平均車流密度。因?yàn)镵的采集難度較大,一般用時(shí)間占有率近似地表示K,計(jì)算公式如式(11)所示。
Occupancy=∑Δti/T""" (11)
式中:occupancy——時(shí)間占有率(%);
Δti——第i輛車占用檢測(cè)器的時(shí)間(s);
T——觀測(cè)時(shí)間段的長(zhǎng)度(s)。
得出K后,通過(guò)Q=Kvs近似地計(jì)算出收費(fèi)站附近的平均車速。
在得出統(tǒng)計(jì)周期內(nèi)門架和收費(fèi)站平均車速之后,結(jié)合門架數(shù)據(jù)“gantryId”的GPS位置可知高速公路各個(gè)區(qū)間段的實(shí)時(shí)平均車速vs和交通流量Q。
2.5.3 SVR參數(shù)的優(yōu)化
SVR預(yù)測(cè)中,影響預(yù)測(cè)結(jié)果的參數(shù)有C、ε和σ三個(gè)。針對(duì)于式(6)、式(7)所示的預(yù)測(cè)函數(shù),主要是調(diào)整核帶寬參數(shù)σ,以期達(dá)到預(yù)測(cè)的最優(yōu)解。
在試驗(yàn)中,閾值范圍為0.01~0.618,初始為0.1。實(shí)際應(yīng)用時(shí)可在每日凌晨3:00-5:00(也可設(shè)置為每周、每月優(yōu)化一次SVR參數(shù))服務(wù)器負(fù)載最低的時(shí)段將前一天或前一周的歷史數(shù)據(jù),通過(guò)差分灰狼優(yōu)化(Differential Evolution-Grey Wolf Optimizer,DE-GWO)算法[5]計(jì)算出每條高速公路的K個(gè)認(rèn)為比較理想的SVR參數(shù),并記錄每個(gè)參數(shù)對(duì)應(yīng)的均方根誤差(RMSE),作為接下來(lái)預(yù)測(cè)時(shí)使用的備選SVR參數(shù)。
在新的預(yù)測(cè)中,例如預(yù)測(cè)t+1時(shí)間的擁堵情況時(shí),t時(shí)間的實(shí)測(cè)值已經(jīng)計(jì)算得出,計(jì)算t時(shí)間的預(yù)測(cè)值和實(shí)測(cè)值之間的RMSE,如果RMSE小于或等于該參數(shù)的最小誤差,更新最小誤差,且繼續(xù)使用該參數(shù),并將該參數(shù)的使用次數(shù)+1;如果RMSE在允許范圍內(nèi),仍繼續(xù)使用該參數(shù),并將該參數(shù)的使用次數(shù)+1;如果RMSE誤差較大超過(guò)允許范圍,繼續(xù)判斷預(yù)測(cè)值偏大還是偏小。如果偏大,從備選參數(shù)中選擇當(dāng)前參數(shù)的近鄰參數(shù),該近鄰參數(shù)應(yīng)該同樣使得產(chǎn)生的預(yù)測(cè)值比實(shí)測(cè)值偏大,且使用次數(shù)是最大的;如果偏小,從另一側(cè)選擇使用次數(shù)最大的近鄰參數(shù)。循環(huán)往復(fù)下去,目的是選擇“最優(yōu)”參數(shù)。
2.5.4 循環(huán)滾動(dòng)更新樣本集
循環(huán)滾動(dòng)預(yù)測(cè)的原理是在數(shù)據(jù)長(zhǎng)度保持不變的情況下,對(duì)訓(xùn)練樣本集、預(yù)測(cè)樣本集循環(huán)滾動(dòng)地加入新的數(shù)據(jù),剔除舊的數(shù)據(jù)。這種不斷向前更新數(shù)據(jù)集建立的數(shù)據(jù)序列能更好地反映出高速公路狀態(tài)的最新特征,體現(xiàn)出訓(xùn)練樣本集、預(yù)測(cè)樣本集的動(dòng)態(tài)變化。因更改了樣本集,故動(dòng)態(tài)數(shù)據(jù)集還在一定程度上解決了過(guò)擬合的問(wèn)題。實(shí)施過(guò)程為:
設(shè)定時(shí)間窗步長(zhǎng)為S,則輸入數(shù)據(jù)為X={X1,X2,…,XS},這里Xi={di,di+1,…,dN-S+p-1},1≤i≤S;i,S∈N。實(shí)測(cè)對(duì)比數(shù)據(jù)為Y={Y1,Y2,…,YS},Yi={di+1,di+2,…,dN-S+p}。下一個(gè)時(shí)間窗Xi從di+1開(kāi)始,Yi則從di+2開(kāi)始,循環(huán)向前滾動(dòng),不停地預(yù)測(cè)下一時(shí)段的交通狀態(tài)。
2.6 輸出預(yù)測(cè)結(jié)果
在預(yù)測(cè)得出區(qū)間平均車速vs后,即可建立每個(gè)門架以及收費(fèi)站所處區(qū)域的速度演變趨勢(shì)圖。當(dāng)vs連續(xù)兩個(gè)周期低于65 km/h時(shí),可通過(guò)相關(guān)管控平臺(tái)軟件進(jìn)行擁堵預(yù)警(管控平臺(tái)面向管理者,還可通過(guò)公眾號(hào)或App面向出行者),并提醒管理者及時(shí)介入,主動(dòng)預(yù)防可能出現(xiàn)的更大擁堵[6]。
3 結(jié)果表征
基于上述預(yù)測(cè)算法,選擇南寧東至六景西樞紐高速公路段進(jìn)行預(yù)測(cè)與實(shí)測(cè),得到預(yù)測(cè)的平均車速與實(shí)測(cè)的平均車速,如圖2所示,表3為對(duì)應(yīng)的預(yù)測(cè)與后來(lái)計(jì)算得出的實(shí)測(cè)數(shù)據(jù)。此實(shí)驗(yàn)數(shù)據(jù)統(tǒng)計(jì)周期為60 min,即預(yù)測(cè)未來(lái)1 h內(nèi)的擁堵情況。圖2中虛線為實(shí)測(cè)值,實(shí)線為預(yù)測(cè)值。當(dāng)出現(xiàn)交通流突變時(shí),誤差略微增大??傮w情況是預(yù)測(cè)值圍繞實(shí)測(cè)值上下波動(dòng),預(yù)測(cè)精度較為理想。
在誤差分析中采用常見(jiàn)的重要指標(biāo)有:平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)。和常見(jiàn)的支持向量機(jī)(SVM)、長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)進(jìn)行對(duì)比,發(fā)現(xiàn)本文經(jīng)過(guò)優(yōu)化后的SVR預(yù)測(cè)精度最高。預(yù)測(cè)誤差對(duì)比如表4所示。
4 結(jié)語(yǔ)
通過(guò)研究和實(shí)踐表明,利用ETC門架和收費(fèi)站數(shù)據(jù)能夠準(zhǔn)確地獲取高速公路區(qū)間平均車速、交通流量等信息,利用合適的模型能夠較為準(zhǔn)確地預(yù)測(cè)未來(lái)的擁堵?tīng)顟B(tài)。
非門架附近的區(qū)域,在具有方便獲取浮動(dòng)車相關(guān)GPS數(shù)據(jù)的情況下,同樣適用于本研究方法。
上述預(yù)測(cè)算法主要針對(duì)常發(fā)性擁堵,當(dāng)遇到交通事故等不可預(yù)測(cè)的偶發(fā)性擁堵時(shí),算法具有較大的滯后性。解決辦法是車主第一時(shí)間報(bào)警,交警及時(shí)把數(shù)據(jù)反饋給平臺(tái)、公眾號(hào)、APP或高速公路管理部門,做出下一步擁堵預(yù)防措施。例如,全國(guó)已有部分高速公路交警支隊(duì)和百度地圖、高德地圖等相關(guān)方合作,及時(shí)反饋交通擁堵情況,以防止更嚴(yán)重、更大范圍的交通擁堵。此法已試行較長(zhǎng)一段時(shí)間,效果較好。而且,隨著北斗衛(wèi)星精確定位的普及,還可以通過(guò)浮動(dòng)車數(shù)據(jù)獲取偶發(fā)性擁堵情況。
其他諸如極端天氣、泥石流、塌方等自然災(zāi)害,或者臨時(shí)養(yǎng)護(hù)、交通稽查等造成的偶發(fā)性擁堵,需要管理者通過(guò)天氣預(yù)報(bào)、作業(yè)申請(qǐng)和管理部門的通知等信息及時(shí)地預(yù)警及管控。重大節(jié)假日亦應(yīng)通過(guò)算法預(yù)測(cè)和人工介入進(jìn)行擁堵預(yù)防,以實(shí)現(xiàn)較好的擁堵防治效果。
擁堵預(yù)防不僅從微觀上能夠帶來(lái)減少用時(shí)、節(jié)約經(jīng)濟(jì)、綠色環(huán)保等好處;從宏觀上來(lái)看,還可深度融入“一帶一路”,加快城鎮(zhèn)化進(jìn)程,構(gòu)建智能、平安、綠色、共享的現(xiàn)代化綜合交通體系,協(xié)助相關(guān)部門實(shí)現(xiàn)道路智能化管理,提高交通科學(xué)治理和服務(wù)水平,助力建設(shè)交通強(qiáng)國(guó)。
參考文獻(xiàn)
[1]林立春,洪 東,劉 華.基于大數(shù)據(jù)分析和多模融合的交通擁堵高效預(yù)測(cè)技術(shù)[J].西部交通科技,2021(7):151-155.
[2]黃承鋒.基于改進(jìn)GA算法的高速公路交通擁堵?tīng)顩r預(yù)測(cè)[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2022(3):198-205.
[3]陳淑燕,王 煒,李文勇.實(shí)時(shí)交通數(shù)據(jù)的噪聲識(shí)別和消噪方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2006(3):322-325.
[4]Lichun Lin,Shi Tong. Automatic Spatial Annotation of Image Based on Object Recognition [J].Journal of Informationamp;Computational Science. 2013,10(18):5 829-5 847.
[5]鄭曉亮,陳華亮,來(lái)文豪.參數(shù)優(yōu)化的SVR移動(dòng)網(wǎng)絡(luò)流量預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2022(9):278-284.
[6]王 健.基于ETC系統(tǒng)數(shù)據(jù)的高速公路主動(dòng)管控建設(shè)探討[J].中國(guó)交通信息化,2020,251(12):99-101.
收稿日期:2023-03-30