(長安大學(xué) 電子與控制工程學(xué)院,陜西 西安 710054)
隨著公路交通和信息技術(shù)的飛速發(fā)展,高速公路管理者和使用者對公路交通提出了更高的要求,包括行駛速度、交通流量和道路安全等。在這些特征中,速度和速度變化是安全分析的重要指標(biāo)。一些研究指出,速度變化和速度本身均為事故統(tǒng)計中的重要因素[1]。但速度通常受許多內(nèi)部和外部因素的影響,前者包括交通流量和交通密度,后者包括天氣(尤其是降雨和能見度)、道路狀況和照明等[2]。在這些不利因素中,降雨是普遍因素,由于道路摩擦力差和能見度低,會對速度產(chǎn)生很大影響[3]。因此,為了提高道路安全性和舒適性,有必要研究降雨對速度的影響,并提供考慮降雨的速度預(yù)測方法。
本文首先系統(tǒng)評估了高峰時段和正常時段降雨強(qiáng)度和交通流量對行駛速度與速度方差的影響,明確了降雨強(qiáng)度和交通流量對行駛速度預(yù)測的必要性。然后,提出了一款基于深度置信網(wǎng)絡(luò)(DBN)的決策級融合模型,該模型融合了3個數(shù)據(jù)源:交通流量數(shù)據(jù)、降雨強(qiáng)度數(shù)據(jù)和行駛速度數(shù)據(jù)。最后,融合3個數(shù)據(jù)的模型可預(yù)測出最準(zhǔn)確的速度值。
從地理區(qū)域看,降雨分布的形狀與城市環(huán)形道路的形狀相似。因此,本文選擇繞城高速作為研究對象。西安繞城高速全長88 km,路基寬35 m,是一條全封閉的雙向兩車道和六車道高速公路,設(shè)計速度[4]為120 km/h。將西安繞城高速上的12個收費站和11個立交點作為路段劃分依據(jù),但由于部分收費站與立交點距離很短,難以劃分,因此選擇12個收費站和5個立交橋?qū)h(huán)城路劃分為34個路段。
在收費數(shù)據(jù)中,每一行數(shù)據(jù)都記錄了一輛車進(jìn)入和離開收費站時的時間和牌照號。在收費站出口數(shù)據(jù)中,還記錄了車輛進(jìn)入時間和進(jìn)入的收費站點。因此,收集了12個收費站的出口數(shù)據(jù)作為交通數(shù)據(jù),由此可獲得車輛的最短路徑平均與平均行駛速度。
氣象數(shù)據(jù)從中國天氣網(wǎng)站收集,包括常見的氣象參數(shù),例如降雨、溫度、風(fēng)速、風(fēng)向和相對濕度。網(wǎng)站天氣數(shù)據(jù)每小時更新一次。本文收集了2018年5月至2018年7月每小時的天氣數(shù)據(jù)。在三個月的時間里,收集了22 132條天氣數(shù)據(jù),其中包含26天中的713條降雨數(shù)據(jù)。
為研究降雨強(qiáng)度對不同時間段行駛速度和速度方差的影響,我們比較了高新收費站和雁塔收費站之間降雨日和正常日的行駛速度和速度方差。行駛速度值為該時段經(jīng)過該路段所有車輛的平均速度。速度方差值為該時段經(jīng)過該路段所有車輛的速度方差。選擇3個典型的降雨日和正常日,并按小時計算行駛速度、速度方差與降雨量的平均值。圖1展示了降雨日與正常日間的每小時行駛速度和速度方差對比。
從統(tǒng)計結(jié)果來看,降雨日的行駛速度與正常日的同一時間相比,中雨、大雨和暴雨條件下分別減少0.5 km/h,1.9 km/h和5.05 km/h。但是從圖1可以看出,這些樣本存在波動,降雨強(qiáng)度相似的不同時段變化幅度不同。分析降雨強(qiáng)度的影響應(yīng)考慮時間段或交通流量。根據(jù)交通狀況的不同,一天可分為3個時段:夜間時段、正常時段和高峰時段[5]。時間范圍分別定義為23:00—07:00,9:00—17:00、19:00—23:00,7:00—8:00、17:00—19:00。在圖1(a)中,降雨會降低車輛行駛速度,尤其在高峰時段。降雨日與正常日的速度差在早高峰時為2.99 km/h,在晚高峰時為5.52 km/h,明顯大于一天的平均速度差2.15 km/h。同樣,在圖1(b)中,降雨時早晚高峰車輛的速度方差也明顯大于正常日,早高峰兩曲線的差值為0.02,晚高峰兩曲線的差值為0.04,明顯大于一天的平均值0.01。
圖1 一天中行駛速度、速度方差與降雨強(qiáng)度之間的關(guān)系
統(tǒng)計結(jié)果一方面展示了降雨強(qiáng)度與行駛速度有較強(qiáng)的相關(guān)性,融合降雨數(shù)據(jù)為提高行駛速度預(yù)測精度提供數(shù)據(jù)依據(jù);另一方面,降雨時高峰時段的速度方差變化說明了降雨對交通狀態(tài)穩(wěn)定性的干擾,進(jìn)一步展示了使用預(yù)測的行駛速度來提前管控的必要性。
上文介紹了降雨和交通流量對速度的復(fù)合影響。本章利用獲取的降雨和交通流量數(shù)據(jù)作為補(bǔ)充,基于DBN和決策級數(shù)據(jù)融合的預(yù)測模型對行駛速度進(jìn)行更準(zhǔn)確的預(yù)測。
深度置信網(wǎng)絡(luò)(DBN)是由多層限制玻爾茲曼機(jī)(RBM)組成的深度學(xué)習(xí)模型。這些網(wǎng)絡(luò)被限制為一個可視層與一個隱層,層間存在連接,層內(nèi)單元間無連接。DBN首先使用非監(jiān)督貪婪逐層方法訓(xùn)練RBM獲得生成模型的權(quán)值,然后通過帶標(biāo)簽數(shù)據(jù)用BP算法對判別性能做調(diào)整[6]。這種獨特的訓(xùn)練方法使DBN可以解決梯度消失問題。圖2展示了包含3個RBM和1個神經(jīng)網(wǎng)絡(luò)(NN)層的DBN結(jié)構(gòu)。
行駛速度預(yù)測模型是一種時間序列預(yù)測模型,這種模型的超參數(shù)除了隱藏層數(shù)、神經(jīng)元數(shù)量、Epoch外,還包括窗口長度。為確定合理的DBN體系結(jié)構(gòu),本文遍歷2~24(時間)來選擇合適的窗口長度,遍歷1~5來設(shè)置合適的隱藏層數(shù),從[100,500]中以50步長為單位測試最優(yōu)神經(jīng)元數(shù)量,從[100,1 000]中以100為步長測試最優(yōu)Epoch。利用網(wǎng)格搜索找到最佳的超參數(shù),結(jié)果見表1所列。
表1 不同輸入數(shù)據(jù)的每個DBN網(wǎng)絡(luò)的最佳結(jié)構(gòu)參數(shù)
多源數(shù)據(jù)融合是一種能夠綜合多個來源信息的技術(shù),與使用單個源數(shù)據(jù)相比,它可以實現(xiàn)更高的準(zhǔn)確性。多源數(shù)據(jù)融合通常位于3個抽象層次:輸入層(傳感器數(shù)據(jù))、特征層和決策層[7-8]。著名的分類結(jié)果如下[9]:
(1)低級融合:也稱為原始數(shù)據(jù)融合,原始數(shù)據(jù)直接作為融合過程的源;
(2)中級融合:也稱為特征級融合,融合特征以獲得可以用于其他更高任務(wù)的其他特征;
(3)高級融合:也稱為符號或決策級融合,它以決策形式為輸入并將其組合以獲得更準(zhǔn)確或全局的決策;
(4)多重融合:處理來自不同級別的數(shù)據(jù),例如輸入與決策融合在一起以提供決策。
本文涵蓋兩種類型的數(shù)據(jù):交通數(shù)據(jù)和降雨量數(shù)據(jù)。行駛速度預(yù)測模型的體系結(jié)構(gòu)采用決策融合,將DBN模型使用交通和降雨時間序列數(shù)據(jù)獲得的行駛速度進(jìn)行融合,以提供更準(zhǔn)確的預(yù)測。
本文構(gòu)建的預(yù)測模型結(jié)構(gòu)如圖2所示。使用不同的輸入數(shù)據(jù)構(gòu)造了3個DBN,其輸出均為未來時段的行駛速度。將DBN的數(shù)據(jù)作為數(shù)據(jù)融合層的輸入,分別輸入過去12 h的交通流量數(shù)據(jù)的時間序列,過去12 h的行駛速度數(shù)據(jù)的時間序列和過去2 h的降雨強(qiáng)度數(shù)據(jù)的時間序列。因此,輸入為26。DBN的輸出是預(yù)測的行駛速度。3種不同的決策作為數(shù)據(jù)融合的輸入。
圖2 使用DBN在決策級融合的行駛速度預(yù)測模型結(jié)構(gòu)
由于徑向基函數(shù)網(wǎng)絡(luò)(RBFN)具有很好的擬合能力,因此它被用來融合數(shù)據(jù)融合模型中的3個決策。RBFN包含2部分,一個是具有RBF激活功能的隱藏層,另一個是使用NN層作為輸出層。在此結(jié)構(gòu)中,數(shù)據(jù)融合層的表達(dá)式如下所示:
式中:h(x)是RBFN的輸出;output(x)表示NN層的函數(shù);wm和b分別表示權(quán)重和偏差。
本文使用局方誤差MSE與決定系數(shù)R2作為模型評價依據(jù),其定義如下:
選擇7個正常日與3個典型降雨日(6月26日,7月3日,7月4日)作為測試用例來驗證預(yù)測模型。其中,6月26日早高峰有陣雨,7月3日和7月4日幾乎全天降雨。我們使用3個月的多源數(shù)據(jù)(測試數(shù)據(jù)除外)來訓(xùn)練融合預(yù)測模型。作為對比,選擇不包含降雨強(qiáng)度的多源數(shù)據(jù)和不包含降雨強(qiáng)度和交通流量的多源數(shù)據(jù)以及只包含行駛速度的數(shù)據(jù)來訓(xùn)練預(yù)測模型。另外,為了避免較大誤差,每個預(yù)測方法測試3次。
圖3展示了典型降雨日6月26日與7月3日不同輸入數(shù)據(jù)下行駛速度預(yù)測曲線。表2詳細(xì)展示了不同輸入數(shù)據(jù)下模型在不同時段的精度。
圖3 不同輸入數(shù)據(jù)下模型的行駛速度預(yù)測曲線
表2 不同輸入數(shù)據(jù)下模型在不同時段的評價指標(biāo)
(1)不同輸入數(shù)據(jù)的預(yù)測結(jié)果可以跟蹤行駛速度的變化,并且它們具有相似的趨勢,說明預(yù)測模型體系結(jié)構(gòu)良好。
(2)通過對比MSE和R2評價指標(biāo),模型在融合行駛速度、流量和降雨強(qiáng)度時MSE為16.20,R2為0.61時表現(xiàn)最佳。模型融合行駛速度和流量次之(MSE為18.21,R2為0.57)。模型只使用行駛速度預(yù)測時最差(MSE為19.02,R2為0.52)。結(jié)果證實降雨強(qiáng)度數(shù)據(jù)和流量數(shù)據(jù)對提高行駛速度預(yù)測精度是有效的,而且本文的數(shù)據(jù)融合架構(gòu)是可行的。
(3)降雨時段的MSE與正常時段的MSE進(jìn)行比較,降雨時段的MSE明顯更大。結(jié)合文中提到的降雨將引起行駛速度波動,可以看出降雨將顯著增加預(yù)測難度。但融合降雨強(qiáng)度數(shù)據(jù)的模型可以減少降雨影響,將MSE值從22.15或21.67降低到19.11。
(4)比較高峰期和非高峰期的MSE,高峰期的MSE明顯更大。主要原因是大交通流量引起的行駛速度波動。融合交通流量的模型性能在高峰期顯著提高,MSE值從37.16降低到30.74或26.87。
本文首先分析了降雨對高速公路的影響,發(fā)現(xiàn)降雨會顯著降低行駛速度。更重要的是,不同時段的降雨對速度帶來不同的影響。在高速公路上,不同的時間通常意味著不同的交通量。所以,本文設(shè)計了一個融合降雨強(qiáng)度、流量與行駛速度的DBN預(yù)測模型,將綜合預(yù)測誤差由19.02降到16.20,以提高行駛速度的預(yù)測精度。根據(jù)該模型預(yù)測的行駛速度,道路管理者可以動態(tài)設(shè)置降雨條件下的道路管控方案,以提高高速公路的安全性與通行效率。