楊國(guó)亮,溫鈞林,賴振東,張 碩
(江西理工大學(xué) 電氣工程與自動(dòng)化學(xué)院,江西 贛州 341000)
交通流預(yù)測(cè)是智能交通系統(tǒng)中不可或缺的組成部分。準(zhǔn)確的交通流預(yù)測(cè)能幫助交通管理部門(mén)提前預(yù)知交通擁堵等情況,事先做出相應(yīng)的措施,提高路網(wǎng)的工作效率,降低事故發(fā)生的風(fēng)險(xiǎn)。
隨著深度學(xué)習(xí)的發(fā)展,人工智能在交通預(yù)測(cè)領(lǐng)域取得了一系列突破。LSTM[1],GRU[2]等循環(huán)神經(jīng)網(wǎng)絡(luò)模型比HA,ARIMA[3]等傳統(tǒng)模型更有效地提取交通數(shù)據(jù)的時(shí)間相關(guān)性。為了考慮交通路網(wǎng)的非歐氏空間特征,DCRNN[4]利用有向圖對(duì)交通路網(wǎng)進(jìn)行建模,以擴(kuò)散圖卷積的方式捕獲交通數(shù)據(jù)的空間依賴性,并使用Seq2Seq結(jié)構(gòu)來(lái)提取時(shí)間相關(guān)性。STGCN[5]則構(gòu)建了一個(gè)全卷積的時(shí)空?qǐng)D網(wǎng)絡(luò)模型,利用圖卷積和一維卷積分別對(duì)交通數(shù)據(jù)的空間和時(shí)間特征進(jìn)行建模。而ASTGCN[6]進(jìn)一步考慮交通數(shù)據(jù)的周期性,搭建了一個(gè)多組件時(shí)空?qǐng)D卷積網(wǎng)絡(luò),對(duì)近期、日周期和周周期的交通流數(shù)據(jù)進(jìn)行建模,并利用注意力機(jī)制考慮時(shí)間和空間的動(dòng)態(tài)特性。綜上,挖掘交通數(shù)據(jù)的時(shí)空相關(guān)性是交通預(yù)測(cè)的關(guān)鍵,但大多數(shù)現(xiàn)有的交通預(yù)測(cè)模型很少關(guān)注不同交通數(shù)據(jù)之間存在的聯(lián)系。
本文探索了交通流與交通速度數(shù)據(jù)之間的相關(guān)性,并提出一種速度門(mén)控時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(speed gated spatial temporal graph convolution network,SGSTGCN),嘗試以交通速度的角度輔助模型進(jìn)行交通流預(yù)測(cè)。在真實(shí)高速公路交通數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,SGSTGCN的預(yù)測(cè)性能優(yōu)于近期經(jīng)典的時(shí)空?qǐng)D網(wǎng)絡(luò)預(yù)測(cè)模型DCRNN,STGCN。
交通路網(wǎng)是典型的非歐氏結(jié)構(gòu)數(shù)據(jù),因此,本文將其定義成無(wú)向圖G(V,E,A),其中V為圖上|V|=N個(gè)節(jié)點(diǎn)的集合,E為連接節(jié)點(diǎn)的邊。鄰接矩陣A∈RN×N代表圖G中節(jié)點(diǎn)的連接情況,當(dāng)節(jié)點(diǎn)i和j相連時(shí),Aij=1;否則Aij=0。
圖1 小型交通路網(wǎng)示意
交通流預(yù)測(cè)問(wèn)題可被定義為,尋找一個(gè)函數(shù)f,在給定歷史Tp時(shí)段交通數(shù)據(jù)X={X1,X2,…,XTp}∈RN×C×Tp的情況下,預(yù)測(cè)未來(lái)Tq時(shí)段的交通流數(shù)據(jù)Y={Y1,Y2,…,YTq}∈RN×C×Tq。函數(shù)的映射關(guān)系可以表示為
Y=f(X,G)
(1)
本文提出的SGSTGCN的總體框架如圖2所示。
圖2 速度門(mén)控時(shí)空?qǐng)D卷積網(wǎng)絡(luò)的總體框架
TS_block的結(jié)構(gòu)如圖3所示。其采用一維擴(kuò)張卷積(dilated convolution,Dconv)捕獲路網(wǎng)上每個(gè)節(jié)點(diǎn)的時(shí)間相關(guān)性,并利用門(mén)控線性單元GLU控制時(shí)間卷積網(wǎng)絡(luò)層之間的信息流動(dòng),得到門(mén)控?cái)U(kuò)張卷積
圖3 時(shí)空卷積塊
=(θ1(r)*X)?σ(θ2(r)*X)
(2)
式中θ1(r),θ2(r)為兩個(gè)不同的擴(kuò)張卷積核,通過(guò)調(diào)節(jié)擴(kuò)張率r,往卷積核的元素間填充r-1個(gè)零值,進(jìn)而擴(kuò)大時(shí)間維度的感受野。為輸出的時(shí)間特征,σ,*分別為Sigmoid函數(shù)和卷積算子,?為哈達(dá)瑪積。
接著,利用K階切比雪夫近似圖卷積(GCN)[7]對(duì)每個(gè)t時(shí)刻路網(wǎng)的空間特征進(jìn)行建模,且t時(shí)刻的輸出為
(3)
式中θ∈RK為切比雪夫系數(shù)向量,Tk(x)=2xTk-1(x)-Tk-2(x),T0(x)=1,T1(x)=x為切比雪夫多項(xiàng)式。而=2L/λmax-IN,λmax為圖拉普拉斯矩陣L的最大特征值,IN為單位陣。
經(jīng)過(guò)圖卷積的處理后,每個(gè)節(jié)點(diǎn)將聚合K階相鄰節(jié)點(diǎn)的特征。而通過(guò)多個(gè)時(shí)空卷積塊的疊加,模型在時(shí)間和空間2個(gè)維度的感受野將得到逐步擴(kuò)大。
除了對(duì)交通流數(shù)據(jù)的時(shí)空特征進(jìn)行挖掘外,本文發(fā)現(xiàn)速度信息能有效地輔助模型對(duì)路網(wǎng)特征進(jìn)行理解,從而實(shí)現(xiàn)更準(zhǔn)確的交通流預(yù)測(cè)。假設(shè)圖1中路段1的交通流量很大,速度卻很慢,則該路段有可能發(fā)生突發(fā)事件造成了擁堵,短期內(nèi)該路段的交通流變化趨勢(shì)不會(huì)很明顯。同時(shí),路段1的突發(fā)狀況可能會(huì)影響相鄰路段的通行效率,從而導(dǎo)致其他路段的交通流量增大。
因此,本文提出了SG_module對(duì)上述常見(jiàn)且復(fù)雜的交通關(guān)系進(jìn)行建模。如圖2所示,SG_module構(gòu)建了2個(gè)時(shí)空卷積塊分支,分別提取交通流數(shù)據(jù)Xf與速度數(shù)據(jù)Xs的時(shí)空特征,得到Hf和Hs。接著,通過(guò)Sigmoid函數(shù)將速度特征Hs處理成(0,1)取值范圍的特征權(quán)重,最后利用哈達(dá)瑪積融合該權(quán)重與交通流特征,得到輸出
=Hf?σ(Hs)
(4)
本文選取ASTGCN[6]公布的真實(shí)高速公路數(shù)據(jù)集PeMSD4和PeMSD8對(duì)模型的有效性進(jìn)行驗(yàn)證。數(shù)據(jù)集中包含了交通流和交通速度數(shù)據(jù),相關(guān)描述可見(jiàn)表1。該數(shù)據(jù)是由美國(guó)加利福尼亞州的PeMS(Caltrans Performance Measurement System)[8]基于30 s/次的頻率采樣實(shí)時(shí)采集的,并匯總成以5 min為時(shí)間間隔的樣本。本文以6︰2︰2的比例將數(shù)據(jù)劃分成訓(xùn)練集、驗(yàn)證集和測(cè)試集,并對(duì)其進(jìn)行零均值化(zero-mean)處理。
表1 數(shù)據(jù)集描述
在Nvidia Tesla P100 GPU的環(huán)境下,本文采用網(wǎng)格搜索法對(duì)模型的超參數(shù)進(jìn)行尋優(yōu)。實(shí)驗(yàn)表明SG_module個(gè)數(shù)M=8時(shí),SGSTGCN在驗(yàn)證集中表現(xiàn)最優(yōu)。在這8個(gè)SG_module中,TS_block的門(mén)控?cái)U(kuò)張卷積的擴(kuò)張率r分別為1,2,1,2,1,2,1,2,而卷積核大小均為3,個(gè)數(shù)為64。圖卷積的卷積核個(gè)數(shù)也為64。批大小(Batch Size)設(shè)置為64,且采用學(xué)習(xí)率為0.001的Adam優(yōu)化器來(lái)優(yōu)化Smooth L1損失函數(shù)。本文Tq和Tp均為1 h,即利用歷史1 h的交通流與速度數(shù)據(jù)預(yù)測(cè)未來(lái)1 h內(nèi)的交通流數(shù)據(jù)。并利用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)和平均絕對(duì)百分比誤差(mean absolute percen-tage error,MAPE)對(duì)模型未來(lái)1 h內(nèi)的平均預(yù)測(cè)誤差進(jìn)行評(píng)估。指標(biāo)的值越小,則說(shuō)明模型的預(yù)測(cè)效果越好。
表2展示了本文提出的SGSTGCN模型與基準(zhǔn)方法SVR,LSTM,DCRNN,STGCN在PeMSD4和PeMSD8數(shù)據(jù)集上的預(yù)測(cè)效果。由表2可以觀察到,僅考慮交通流數(shù)據(jù)時(shí)間特征的SVR,LSTM預(yù)測(cè)結(jié)果并不理想。而引入圖神經(jīng)網(wǎng)絡(luò)對(duì)交通路網(wǎng)空間特征進(jìn)行建模的DCRNN,STGCN均取得較好的效果。
表2 不同交通流預(yù)測(cè)模型的性能比較
相比于前述模型,SGSTGCN在各個(gè)指標(biāo)中均達(dá)到最佳性能。在PeMSD4上,SGSTGCN的MAE/RMSE/MAPE相比基準(zhǔn)方法中表現(xiàn)最好的STGCN分別提升了4.11 %/5.57 %/1.71 %;在PeMSD8上,則提升了7.62 %/5.30 %/6.47 %。這得益于SG_module以交通速度的角度有效地輔助模型更全面地理解整個(gè)路網(wǎng)的動(dòng)態(tài)變化,進(jìn)而實(shí)現(xiàn)更準(zhǔn)確的交通流預(yù)測(cè)。同時(shí),層層疊加的SG_module利用門(mén)控?cái)U(kuò)張卷積非線性地?cái)U(kuò)大時(shí)間維度的感受野,使得模型有能力感知更長(zhǎng)時(shí)間跨度的時(shí)序特征,從而對(duì)交通流長(zhǎng)期的時(shí)序特征進(jìn)行建模。
為了對(duì)各個(gè)模塊的有效性進(jìn)行評(píng)估,在PeMSD8數(shù)據(jù)集上對(duì)SGSTGCN與如下變體模型進(jìn)行比較。1)Basic模型:一個(gè)以一維卷積與圖卷積為基礎(chǔ)模塊,且只考慮交通流數(shù)據(jù)的時(shí)空?qǐng)D卷積網(wǎng)絡(luò)模型;2)TGLU模型:將Basic模型中的一維卷積替換成門(mén)控?cái)U(kuò)張卷積;3)SGM模型:在Basic模型基礎(chǔ)上,加入速度門(mén)控注意力模塊。
圖4對(duì)比了各個(gè)模型未來(lái)1 h中每個(gè)時(shí)間節(jié)點(diǎn)(以5 min為間隔)的預(yù)測(cè)性能。從圖4(a),(b)可以發(fā)現(xiàn),4種模型短期(5~15 min)的MAE和RMSE差距較小,但隨著預(yù)測(cè)時(shí)間的加長(zhǎng),這種差距逐漸擴(kuò)大。而在圖4(c)中,雖然SGM模型從5 min到20 min的MAPE比TGLU大,但在25 min后的預(yù)測(cè)中,SGM的指標(biāo)低于TGLU,并逐漸逼近預(yù)測(cè)效果最好的SGSTGCN。
圖4 變體模型在PeMSD8上各時(shí)間點(diǎn)的預(yù)測(cè)效果
上述實(shí)驗(yàn)表明:1)門(mén)控?cái)U(kuò)張卷積能有效地通過(guò)控制時(shí)間維度的感受野,捕獲交通流長(zhǎng)期的時(shí)間相關(guān)性;2)速度特征是交通流預(yù)測(cè)的有效輔助信息,并在長(zhǎng)期交通流預(yù)測(cè)時(shí),起到了較大的促進(jìn)作用;3)結(jié)合了上述兩個(gè)模塊的SGSTGCN在長(zhǎng)短期預(yù)測(cè)中均表現(xiàn)出優(yōu)秀的效果。
本文提出了一種基于速度門(mén)控時(shí)空?qǐng)D卷積網(wǎng)絡(luò)的交通流預(yù)測(cè)模型SGSTGCN,該模型結(jié)合門(mén)控?cái)U(kuò)張卷積和圖卷積來(lái)捕獲交通數(shù)據(jù)的時(shí)空特征,并引入速度門(mén)控模塊,利用交通速度特征輔助模型對(duì)交通流進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明:本文提出的速度門(mén)控模塊能有效地輔助模型對(duì)交通流進(jìn)行長(zhǎng)期預(yù)測(cè)。并且,SGSTGCN在不同規(guī)模的數(shù)據(jù)集上均優(yōu)于近期提出的時(shí)空?qǐng)D網(wǎng)絡(luò)預(yù)測(cè)模型DCRNN,STGCN。