黃 欣,謝文紅,陳耀鵬,李 翔,張素磊,4,*
(1.青島理工大學(xué) 土木工程學(xué)院,青島 266525;2.臺(tái)州市杭紹臺(tái)高速公路有限公司,臺(tái)州 318000;3.青島國信建設(shè)投資有限公司,青島 266000;4.青建集團(tuán)股份公司,青島 266071)
隨著社會(huì)經(jīng)濟(jì)水平的發(fā)展與城市規(guī)模的擴(kuò)大,我國城市機(jī)動(dòng)化水平日益提高,海底隧道里程也在不斷增加,交通擁堵問題愈發(fā)嚴(yán)重,交通事故頻發(fā),因此迫切需要有效的交通控制和誘導(dǎo)策略。構(gòu)建智慧交通系統(tǒng)(ITS)能夠更好地改善交通擁堵,縮短出行時(shí)間,提高通行安全性。交通量預(yù)測通過實(shí)時(shí)交通數(shù)據(jù)的信息滾動(dòng)來預(yù)測未來的交通狀況,是對(duì)車輛進(jìn)行精細(xì)化誘導(dǎo)及管控的重要依據(jù)。
目前,國內(nèi)外針對(duì)交通量預(yù)測的相關(guān)研究提出了大量預(yù)測方法。WILLIAMS等[1]提出了季節(jié)性ARIMA模型并結(jié)合交通量周期性的特征,來提高交通量預(yù)測的精度;李文勇等[2]對(duì)ARIMA模型交通流預(yù)測方法進(jìn)行改進(jìn),構(gòu)建實(shí)際交通流量數(shù)據(jù)均值和方差之間的函數(shù)關(guān)系,并因此推導(dǎo)出交通量時(shí)間序列的方差齊次轉(zhuǎn)換函數(shù)。但由于傳統(tǒng)交通量預(yù)測模型為淺層結(jié)構(gòu),無法對(duì)特定函數(shù)族進(jìn)行有效的表征從而獲取數(shù)據(jù)集的本質(zhì)特征[3],且對(duì)于高維度數(shù)據(jù)集運(yùn)用傳統(tǒng)預(yù)測方法會(huì)造成維度災(zāi)難問題[4]。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,研究人員提出了大量智能預(yù)測方法。羅向龍等[5]對(duì)交通流進(jìn)行特征分析,在網(wǎng)絡(luò)頂層連接支持向量回歸模型進(jìn)行交通量預(yù)測,相比于傳統(tǒng)交通量預(yù)測模型具有更高的預(yù)測精度;WANG等[6]結(jié)合實(shí)驗(yàn)客運(yùn)量數(shù)據(jù),通過與基準(zhǔn)預(yù)測模型進(jìn)行對(duì)比,驗(yàn)證了LSTM網(wǎng)絡(luò)能夠取得較好的預(yù)測性能,同時(shí)分析了各種參數(shù)設(shè)置對(duì)LSTM預(yù)測性能的影響;沈廟生等[7]通過對(duì)實(shí)測交通流量數(shù)據(jù)進(jìn)行實(shí)驗(yàn),得到了考慮缺失值修復(fù)的Dropout-LSTM的高速公路流量預(yù)測模型相較長短期記憶模型預(yù)測精度更高的結(jié)論;溫惠英等[8]提出基于Bi-LSTM的方法,研究表明,該模型在非線性交通流數(shù)據(jù)中具有更好的預(yù)測性和廣泛性;SUN等[9]針對(duì)道路網(wǎng)絡(luò)交通流,提出了一種新的基于最大似然的選擇性堆疊門控循環(huán)單元模型( SSGRU ),得出應(yīng)用于所有道路場景的多道路輸入基礎(chǔ)設(shè)施時(shí),該模型比其他模型具有更高的準(zhǔn)確性的結(jié)論。殷禮勝等[10]基于考慮短時(shí)交通流量時(shí)間序列的復(fù)雜非平穩(wěn)性、空間相關(guān)性和時(shí)間依賴性特性,提出改進(jìn)的VMD-GAT-GRU交通量融合預(yù)測模型,相較于基準(zhǔn)模型,其預(yù)測精度及收斂速度均有所提升。汪鳴等[11]結(jié)合Transformer算法提出多時(shí)間尺度時(shí)空?qǐng)D網(wǎng)絡(luò)模型,并通過消融實(shí)驗(yàn)證明了該模型提升預(yù)測性能的有效性。
上述研究提出的模型僅關(guān)注高速公路短期交通量預(yù)測,訓(xùn)練所用數(shù)據(jù)量較少,忽略了具有城市道路功能的海底隧道中短期交通量在時(shí)間跨度內(nèi)的變化規(guī)律,且用于交通量預(yù)測算法更多集中于LSTM及其融合模型,針對(duì)新提出的GRU模型及Transformer模型研究較少。本文提出基于AGRU-Trans融合模型的海底隧道交通量預(yù)測模型,以小時(shí)為跨度、近一年交通數(shù)據(jù)量為訓(xùn)練,對(duì)海底隧道交通量進(jìn)行預(yù)測,通過結(jié)果分析,驗(yàn)證了該模型相比其他基準(zhǔn)預(yù)測模型具有更高的預(yù)測精度,為膠州灣海底隧道管理部門對(duì)車輛進(jìn)行精細(xì)化誘導(dǎo)及管控提供了理論參考。
交通量預(yù)測模型的不斷優(yōu)化進(jìn)一步推動(dòng)了交通流預(yù)測技術(shù)的發(fā)展,大量學(xué)者從多元時(shí)間序列聯(lián)合預(yù)測[12]、量化時(shí)間序列噪聲的隨機(jī)性[13]、分析不同觀測時(shí)間尺度的時(shí)間序列構(gòu)成[14]等多個(gè)角度提出研究方法。單一模型預(yù)測無法很好地滿足預(yù)測的需要,為了提高預(yù)測精度,組合模型、切換模型、模型優(yōu)化等方法被廣泛使用[15]。
長短期記憶(LSTM)模型[16]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)變體。相比于普通的RNN,LSTM能夠在更長的時(shí)間序列中有更好的表現(xiàn)。該模型通過增加遺忘門、輸入門和輸出門等門控單元來克服傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)模型梯度消失或梯度爆炸的問題[17]。其中遺忘門利用激活函數(shù)sigmoid對(duì)上一時(shí)刻的記憶狀態(tài)進(jìn)行選擇性地遺忘或者保留,輸入門利用tanh函數(shù)生成該時(shí)刻記憶狀態(tài)的候選值,然后再通過與該時(shí)刻輸入門輸出值進(jìn)行元素對(duì)位相乘,以控制該時(shí)刻的記憶狀態(tài)是否發(fā)生更新,而輸出門為控制記憶狀態(tài)輸出到LSTM的當(dāng)前輸出值。LSTM的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,其計(jì)算公式如式(1)-式(6)所示。
圖1 LSTM的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(Wo·[ht-1,xt]+bo)
(5)
ht=ot*tanh(Ct)
(6)
門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(GRU)是由K. CHO等在2014年提出的,它同LSTM一樣也是傳統(tǒng)RNN的變體,能夠有效捕捉長序列之間間隔較大的依賴關(guān)系。GRU是對(duì)LSTM復(fù)雜模型結(jié)構(gòu)的精簡改進(jìn),在獲取將來時(shí)段信息數(shù)據(jù)過程中,保證信息數(shù)據(jù)準(zhǔn)確率的同時(shí)速度也得到提升。它的核心結(jié)構(gòu)分為更新門及重置門兩個(gè)部分[18],GRU單元結(jié)構(gòu)如圖2所示。其計(jì)算公式如式(7)-式(10)所示。
圖2 GRU單元結(jié)構(gòu)
zt=σ(Wz·[ht-1,xt])
(7)
rt=σ(Wr·[ht-1,xt])
(8)
(9)
(10)
LSTM和GRU都通過門控機(jī)制保留了前一序列的有用信息,克服在長期傳播過程中丟失的問題。但由于GRU參數(shù)個(gè)數(shù)較少,所以GRU整體運(yùn)行速度相比LSTM更快。然而GRU有著循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)本身不可并行計(jì)算的弊端,在未來數(shù)據(jù)量和模型體量持續(xù)增大的趨勢下,仍需進(jìn)一步優(yōu)化。
通過來自注意力機(jī)制的嵌入信息修改GRU架構(gòu)后,AGRU可以有效地提取復(fù)雜查詢中的關(guān)鍵信息。AGRU使用權(quán)重來代替GRU的更新門,權(quán)重越大,當(dāng)前時(shí)刻隱藏狀態(tài)更新的信息就越多,之前的信息遺忘的也就越多,該方式需要修改GRU單元內(nèi)部的計(jì)算公式,計(jì)算見式(11)。
(11)
式中:h′t為AGRU時(shí)間步為t時(shí)隱藏層的輸出變量;at為權(quán)重。
除上述算法可以處理時(shí)間序列數(shù)據(jù)以外,近幾年由Google提出的Transformer算法同樣可以解決梯度消失問題以處理時(shí)間序列數(shù)據(jù),其中的注意力機(jī)制運(yùn)行原理實(shí)現(xiàn)了并行計(jì)算,相比于只能串行計(jì)算的RNN極大地提升了運(yùn)行速度?;谝陨咸匦?Transformer一經(jīng)提出就引起了研究者的廣泛關(guān)注,在機(jī)器翻譯、閱讀理解、文本摘要等多個(gè)領(lǐng)域展現(xiàn)出了優(yōu)異的應(yīng)用效果[19]。本文將Transformer模型引入到交通量預(yù)測領(lǐng)域,為其增加了新的應(yīng)用場景。該算法基于編碼和解碼構(gòu)建,解碼部分比編碼部分多了一個(gè)交互層和一個(gè)被掩蓋的多頭注意力機(jī)制。由于編碼部分和解碼部分相差不大,為方便介紹,本文主要介紹Transformer算法的解碼部分。Transformer算法解碼部分的結(jié)構(gòu)如圖3所示。
圖3 Transformer算法解碼部分結(jié)構(gòu)
其中位置編碼計(jì)算見式(12)-式(13)。
(12)
(13)
式中:P為位置編碼;p為時(shí)間序列的位置;dmodel表示模型的維度。
基于以上分析,對(duì)LSTM,GRU,AGRU及Transformer 4種交通量預(yù)測模型間優(yōu)劣進(jìn)行整體對(duì)比分析,見表1。
表1 基準(zhǔn)模型優(yōu)劣比較
基于以上分析,本文提出了基于AGRU-Trans的融合預(yù)測模型,如圖4所示,操作流程如下:
圖4 AGRU-Trans融合模型結(jié)構(gòu)
1) 對(duì)數(shù)據(jù)集進(jìn)行劃分,分為訓(xùn)練集和測試集;
2) 將數(shù)據(jù)集分別輸入至AGRU模型和Transformer模型中進(jìn)行訓(xùn)練;
3) 將Transformer模型輸出值進(jìn)行降維后與AGRU模型的輸出值利用concat函數(shù)進(jìn)行拼接;
4) 最后將拼接后的矩陣通過全連接層輸出相應(yīng)的預(yù)測值矩陣。
本文所依托的隧道工程為青島膠州灣隧道,該隧道是連接青島市市南區(qū)與黃島區(qū)的雙向六車道海底公路隧道,全長7.8 km,隧道縱斷面最大坡度為3.9%,內(nèi)凈空高10.391 m,寬14.426 m。該隧道的建成,不僅有效縮短了兩岸間的通行距離,而且極大緩解了交通運(yùn)營壓力,縮短了人們的出行時(shí)間。
對(duì)具有城市道路功能的海底隧道中短期交通量在時(shí)間跨度內(nèi)的變化規(guī)律進(jìn)行研究。由于該隧道2021年6月底進(jìn)行大區(qū)段增設(shè)可變道路段,為提高訓(xùn)練精度,因此選取膠州灣海底隧道2021年7月1日到2022年5月18日時(shí)間跨度為1 h的交通量數(shù)據(jù)信息,經(jīng)處理后的數(shù)據(jù)共有7464條,對(duì)處理后的交通量數(shù)據(jù)按照時(shí)間進(jìn)行可視化操作,如圖5所示。交通量的數(shù)值雖然在0~4200 veh/h,但是主要的交通量數(shù)值還是集中在0~2500 veh/h。
圖5 膠州灣隧道交通量分布示意
為近一步了解目前膠州灣隧道內(nèi)交通量的特性,且避免初始或結(jié)尾數(shù)據(jù)以及數(shù)據(jù)的偶然性對(duì)交通參數(shù)規(guī)律性造成影響,本文選取中間時(shí)間段2021年8月30日到2021年9月20日3周內(nèi)的交通信息數(shù)據(jù)進(jìn)行細(xì)化處理,并針對(duì)1周內(nèi)的交通數(shù)據(jù)規(guī)律性進(jìn)行分析。圖6為各交通量1周內(nèi)的可視化數(shù)據(jù)。
從圖6中可以看出,交通量變化規(guī)律呈現(xiàn)出周期性和時(shí)間相關(guān)性,并非雜亂無章。1周內(nèi)工作日通過海底隧道的交通量相較于休息日更多,休息日高峰期呈現(xiàn)滯后性,這突出反映了交通參數(shù)和人們的出行習(xí)慣具有很強(qiáng)的相關(guān)性。
本文采用平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)和擬合優(yōu)度可決系數(shù)R2作為模型預(yù)測精度的評(píng)價(jià)指標(biāo)。MAE表示的是真實(shí)值和預(yù)測值之間的絕對(duì)誤差的平均值;RMSE可以測量誤差的平均大小,是真實(shí)值與預(yù)測值偏差的平方與實(shí)測次數(shù)n比值的平方根;R2可以衡量預(yù)測曲線對(duì)于真實(shí)數(shù)據(jù)擬合效果的好壞,R2越大說明擬合效果越好,R2的最優(yōu)值為1[20]。
(14)
(15)
(16)
設(shè)置超參數(shù)回溯時(shí)間窗為24,即每次輸入一個(gè)交通信息數(shù)據(jù),模型都需要考慮前24 h數(shù)據(jù)的值;設(shè)置分批大小為32,即模型一次訓(xùn)練所選取的交通信息數(shù)據(jù)數(shù),可以減少模型訓(xùn)練的時(shí)間,從而能及時(shí)反饋預(yù)測的值;學(xué)習(xí)率為5×10-4,用以反向傳播更新梯度參數(shù)和權(quán)重系數(shù);隱藏層單元數(shù)設(shè)置為100個(gè);層數(shù)設(shè)置為4層;最后設(shè)置迭代次數(shù)為100次。
為檢測模型精度,將所選模型和其余基準(zhǔn)模型進(jìn)行對(duì)比,基準(zhǔn)模型包括:長短期記憶模型(LSTM)、門控循環(huán)模型(GRU)、Transformer模型。
本實(shí)驗(yàn)采用青島膠州灣海底隧道交通量數(shù)據(jù),以青島市市南區(qū)-黃島區(qū)作為研究對(duì)象。將2021年7月1日-2022年5月18日按時(shí)間跨度為1 h交通量數(shù)據(jù)信息進(jìn)行劃分,將前面80%的數(shù)據(jù)作為訓(xùn)練集,最后20%的數(shù)據(jù)作為測試集用以判斷訓(xùn)練后模型的性能狀況。
分別通過4種模型對(duì)海底隧道交通量數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測,如表2所示,在4種模型中,AGRU-Trans融合模型的MAE值和RMSE值相比基準(zhǔn)模型最小,其R2也最接近于1,具有良好的預(yù)測性能與精度。
表2 各模型預(yù)測效果比較
通過表2可以看出4種模型的R2均大于80%,可以認(rèn)為4種模型在交通量預(yù)測上均有較好的預(yù)測性,而Transformer模型預(yù)測誤差相對(duì)更大,究其原因?yàn)門ransformer模型算法完全基于self-attention,對(duì)于位置之間的信息有一定的丟失。GRU模型的擬合程度略高于LSTM模型,這與時(shí)空序列預(yù)測的結(jié)論一致[21]。LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分別大了31.48%,67.55%,20.57%;RMSE值分別增長了35.64%,38.46%,32.03%。
由于交通量數(shù)據(jù)多、重復(fù)率高且交通量變化規(guī)律呈現(xiàn)出周期性和時(shí)間相關(guān)性,為更清晰展示模型預(yù)測結(jié)果,本文選取基準(zhǔn)模型中預(yù)測性能最好的GRU模型與本文所提出的AGRU-Trans融合模型為研究對(duì)象,對(duì)某包含早晚高峰時(shí)刻的120個(gè)預(yù)測數(shù)據(jù)和真實(shí)數(shù)據(jù)進(jìn)行對(duì)比。從圖7中可以直觀看出,AGRU-Trans融合模型的預(yù)測結(jié)果與真實(shí)數(shù)據(jù)貼合性最好,預(yù)測精度高于基準(zhǔn)模型,在交通量波動(dòng)大的時(shí)段預(yù)測結(jié)果更接近真實(shí)值。
1) 通過對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)和Transformer算法的研究,結(jié)合GRU與Transformer模型算法優(yōu)點(diǎn)并加入自注意力機(jī)制,提出一種基于AGRU-Trans融合模型的海底隧道交通量預(yù)測模型用以對(duì)青島膠州灣海底隧道交通信息數(shù)據(jù)進(jìn)行預(yù)測,該模型預(yù)測結(jié)果與真實(shí)數(shù)據(jù)貼合性好,具有良好的預(yù)測性能和精度。
2) 選取膠州灣海底隧道市南區(qū)-黃島區(qū)交通數(shù)據(jù),通過AGRU-Trans融合模型與3種基準(zhǔn)模型對(duì)比發(fā)現(xiàn),LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分別大了31.48%,67.55%,20.57%;RMSE值分別增長了35.64%,38.46%,32.03%。表明:AGRU-Trans融合模型的預(yù)測結(jié)果與真實(shí)數(shù)據(jù)貼合性最好,預(yù)測精度均高于基準(zhǔn)模型。
本文提出的基于AGRU-Trans融合模型的海底隧道交通量預(yù)測模型對(duì)交通規(guī)劃及交通控制有積極意義,基于此方法可為膠州灣海底隧道管理部門對(duì)車輛的誘導(dǎo)及管控提供理論參考。