高醇,王夢靈
基于特征融合圖注意網(wǎng)絡(luò)的高速公路交通流預(yù)測
高醇,王夢靈*
(華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237)( ? 通信作者電子郵箱wml_ling@ecust.edu.cn)
基于交通網(wǎng)絡(luò)的實(shí)際時(shí)空拓?fù)?,提出一種特征融合圖注意網(wǎng)絡(luò)(FF-GAT)模型融合節(jié)點(diǎn)獲取的多種交通狀態(tài)信息,預(yù)測高速公路交通流。首先,分析節(jié)點(diǎn)的車速、交通流和占有率之間的關(guān)聯(lián)特征,并基于多變量時(shí)間注意力機(jī)制,將車速、交通流和占有率之間的關(guān)系融入注意力機(jī)制,從而捕捉交通流的不同時(shí)間之間的動態(tài)時(shí)間相關(guān)性;其次,將節(jié)點(diǎn)劃分為不同的鄰域集,并通過特征融合圖注意網(wǎng)絡(luò)(GAT)捕獲交通流的不同鄰域之間的空間相關(guān)性;同時(shí),通過特征交叉網(wǎng)絡(luò)充分挖掘多個(gè)異構(gòu)數(shù)據(jù)之間的耦合相關(guān)性,為預(yù)測目標(biāo)序列提供有效的信息補(bǔ)充。在兩個(gè)公開交通流數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:在PeMSD8數(shù)據(jù)集上,與ASTGCN(Attention based Spatial-Temporal Graph Convolutional Network)模型相比,F(xiàn)F-GAT模型的均方根誤差(RMSE)降低了3.4%;與GCN-GAN(Graph Convolutional Network and Generative Adversarial Network)模型相比,F(xiàn)F-GAT模型的RMSE降低了3.1%。可見,F(xiàn)F-GAT模型能夠通過特征融合有效提高預(yù)測精度。
高速公路交通流預(yù)測;圖注意網(wǎng)絡(luò);注意力機(jī)制;特征交叉網(wǎng)絡(luò);時(shí)空拓?fù)?/p>
準(zhǔn)確的交通預(yù)測可以幫助交通管理部門制定合適的控制策略,更合理地引導(dǎo)車輛,有效緩解交通擁堵。與地面道路和城市快速路相比,高速公路具有特定的交通模式。高速公路的車輛行駛速度快且不間斷,一旦發(fā)生擁堵或者交通事故,將嚴(yán)重影響通行能力。因此,預(yù)測高速公路的交通狀態(tài),及時(shí)發(fā)現(xiàn)交通狀態(tài)的變化,輔助交通治理十分重要[1-3]。
交通狀態(tài)隨時(shí)間和空間發(fā)生改變,可以根據(jù)交通網(wǎng)絡(luò)的地理位置劃分為不同的網(wǎng)格圖[4-5]。對于高速公路的交通網(wǎng)絡(luò),可以將公路上不同位置布設(shè)的傳感器作為節(jié)點(diǎn),傳感器間的信息連通作為邊,交通流、平均車速、占有率等交通狀態(tài)參數(shù)作為測量數(shù)據(jù)的屬性。針對交通網(wǎng)絡(luò)的圖結(jié)構(gòu)表征,許多研究采用圖卷積模型聚合交通網(wǎng)絡(luò)節(jié)點(diǎn)的信息,通過捕捉節(jié)點(diǎn)之間的空間依賴關(guān)系,從整個(gè)圖結(jié)構(gòu)預(yù)測所有節(jié)點(diǎn)交通狀態(tài)變化。文獻(xiàn)[6-8]中采用卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)模擬時(shí)序關(guān)聯(lián),同時(shí)采用圖卷積模擬空間關(guān)聯(lián);但圖卷積在卷積過程中無法根據(jù)相鄰節(jié)點(diǎn)的重要性分配不同的權(quán)值,每個(gè)節(jié)點(diǎn)權(quán)重相同,影響預(yù)測精度。近年來,一些通過引入注意力機(jī)制考慮交通數(shù)據(jù)在時(shí)間和空間維度上的動態(tài)關(guān)聯(lián)性,計(jì)算不同場景中時(shí)空節(jié)點(diǎn)的相互影響程度。Zhu等[9]在時(shí)間圖卷積網(wǎng)絡(luò)(Temporal Graph Convolutional Network, T-GCN)[8]中引入時(shí)間注意力機(jī)制,調(diào)整不同時(shí)間點(diǎn)的重要性,基于該改進(jìn)方法交通狀態(tài)變化預(yù)測精度更高。Guo等[10]分析交通流的近期相關(guān)性、日周期相關(guān)性和周周期相關(guān)性,先將交通流進(jìn)行時(shí)間注意力機(jī)制處理,再在空間圖卷積中加入注意力機(jī)制(時(shí)間和空間上的注意力機(jī)制計(jì)算公式相同),設(shè)計(jì)時(shí)空圖卷積模型預(yù)測交通狀態(tài)的變化。事實(shí)上,特定位置的異構(gòu)數(shù)據(jù)直接影響預(yù)測序列。Liang等[11]設(shè)計(jì)氣象等外部因素抽取模塊輸入到局部空間和全局空間注意力機(jī)制,捕獲不同傳感器之間的動態(tài)空間相關(guān)性。Yin等[12]提出的多階段注意力機(jī)制能捕獲同一傳感器采集的多個(gè)時(shí)間序列之間的交互作用。
由于基于圖卷積的交通預(yù)測模型屬于頻域(spectral domain)派別,主要通過引入濾波器定義圖卷積,其中圖卷積操作被解釋為從圖信號中去除噪聲,需要進(jìn)行拉普拉斯矩陣特征分解[13-14],計(jì)算量較大。其次,由于高速公路網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,道路網(wǎng)絡(luò)中不同節(jié)點(diǎn)對目標(biāo)節(jié)點(diǎn)的影響不同,隨著時(shí)間的推移,影響權(quán)重高度復(fù)雜,且是動態(tài)的。圖卷積的模型訓(xùn)練依賴對全圖所有節(jié)點(diǎn)的預(yù)先訪問,泛化能力弱,無法實(shí)現(xiàn)歸納性學(xué)習(xí)。最后,多層圖卷積存在過平滑問題,在使用多層圖卷積后,節(jié)點(diǎn)的表示向量趨于一致,使得相應(yīng)的學(xué)習(xí)任務(wù)變得更加困難。針對以上問題,Veli?kovi?等[15]提出了圖注意網(wǎng)絡(luò)(Graph Attention neTwork, GAT),GAT屬于空域(vertex domain)派別,無須代價(jià)高昂的矩陣計(jì)算,計(jì)算量較小。圖注意模型自主地學(xué)習(xí)一階鄰域中鄰居節(jié)點(diǎn)對目標(biāo)節(jié)點(diǎn)的重要性,自適應(yīng)分配不同鄰居的空間權(quán)重,更好地解決了基于頻域圖卷積的問題。當(dāng)預(yù)測路網(wǎng)交通狀態(tài)時(shí),需要準(zhǔn)確計(jì)算路網(wǎng)節(jié)點(diǎn)影響系數(shù),但圖注意網(wǎng)絡(luò)僅考慮周圍有限節(jié)點(diǎn)對目標(biāo)節(jié)點(diǎn)的交互影響,未考慮路網(wǎng)結(jié)構(gòu)的多階鄰接關(guān)系,信息利用不充分,而且也沒有加入多變量的信息。
針對上述問題,本文提出一種基于特征融合圖注意網(wǎng)絡(luò)(Feature Fusion Graph ATtention network, FF-GAT)模型。將平均車速和占有率作為多變量,在時(shí)間維度上分別把車速、占有率對交通流的相關(guān)度函數(shù)引入時(shí)間注意力機(jī)制,增強(qiáng)模型刻畫時(shí)序上特征相關(guān)性的能力;為了更好地挖掘不同節(jié)點(diǎn)之間隱含空間相關(guān)性,構(gòu)建一階鄰接矩陣和二階鄰接矩陣,將它們輸入圖注意網(wǎng)絡(luò),計(jì)算不同鄰域?qū)δ繕?biāo)節(jié)點(diǎn)的影響系數(shù),線性組合后增大空間維度感受野;基于圖注意網(wǎng)絡(luò)引入特征交叉捕捉不同變量的交叉關(guān)系,抓取每個(gè)節(jié)點(diǎn)變量的特征信息;結(jié)合二維卷積網(wǎng)絡(luò)和特征融合圖注意網(wǎng)絡(luò),模擬時(shí)空關(guān)聯(lián)。本文模型生成的預(yù)測結(jié)果與真實(shí)路網(wǎng)交通流分布基本一致,預(yù)測準(zhǔn)確率較高,同時(shí)消融實(shí)驗(yàn)和參數(shù)敏感性分析驗(yàn)證了模型的有效性。
假設(shè)高速公路的交通狀態(tài)可以由個(gè)傳感器測得,具體可以表示為矩陣如下:
一般地,對于每一個(gè)傳感器(即節(jié)點(diǎn))測量的不同的交通狀態(tài)變量,交通流、平均車速和道路占有率三者之間的關(guān)聯(lián)關(guān)系可以表示為式(2)~(3)[16]。
2)?關(guān)系。
其中:為映射函數(shù);為預(yù)測窗口長度。
雖然交通狀態(tài)變量之間的關(guān)系可以由常用的線性模型表示,但是高速公路網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,而且交通狀態(tài)是時(shí)變的,交通流計(jì)算結(jié)果與實(shí)際測量結(jié)果不一致,因此不能采用單一的模型描述。本文按照時(shí)空的推移尋找三者的關(guān)聯(lián)關(guān)系,在空間上盡可能挖掘圖結(jié)構(gòu)的狀態(tài)信息,采取二階圖注意網(wǎng)絡(luò)的模型預(yù)測交通流。
FF-GAT模型的總體架構(gòu)如圖1(a)所示,它主要由多層時(shí)空層組成。時(shí)空層由多變量時(shí)間注意力機(jī)制、特征交叉圖注意網(wǎng)絡(luò)和時(shí)間二維卷積串聯(lián)組成,串聯(lián)堆疊多個(gè)時(shí)空層,每個(gè)時(shí)空層采用殘差學(xué)習(xí)的方式訓(xùn)練,最后接入一個(gè)多層感知機(jī)模型輸出層。
如圖1(b),在第一個(gè)虛線框中構(gòu)建多變量時(shí)間注意力機(jī)制,利用平均車速、占有率和交通流的相關(guān)度函數(shù),融合計(jì)算各時(shí)刻流程狀態(tài)重要性,增強(qiáng)模型在時(shí)序上特征相關(guān)性的刻畫能力;在第二個(gè)虛線框中同時(shí)創(chuàng)建一階鄰接矩陣和二階鄰接矩陣,輸入圖注意網(wǎng)絡(luò),計(jì)算不同鄰域?qū)δ繕?biāo)節(jié)點(diǎn)的影響系數(shù),增強(qiáng)路網(wǎng)節(jié)點(diǎn)的空間相關(guān)性,在圖注意網(wǎng)絡(luò)基礎(chǔ)上引入特征交叉挖掘每個(gè)節(jié)點(diǎn)的不同交通狀態(tài)關(guān)系;在第三個(gè)虛線框中利用二維卷積網(wǎng)絡(luò)提取時(shí)域上的特征信息,通過一層時(shí)空層操作后,可以捕獲交通流的時(shí)間維和空間維特征。
圖1 本文模型架構(gòu)
在時(shí)間域上,不同時(shí)刻路網(wǎng)節(jié)點(diǎn)的交通流之間也存在相關(guān)性,且這種時(shí)間相關(guān)性隨著路網(wǎng)條件的變化而變化。文獻(xiàn)[10]中利用注意力機(jī)制為不同時(shí)刻路網(wǎng)交通流賦予不同重要性,時(shí)間域上的時(shí)間注意力機(jī)制如下:
對于交通網(wǎng)絡(luò)中的某個(gè)節(jié)點(diǎn),記錄不同的時(shí)間序列,如交通流、速度和占有率。同一節(jié)點(diǎn)的這3個(gè)變量在不同時(shí)刻之間存在著相關(guān)性,由于式(2)~(3)是線性關(guān)系模型,數(shù)學(xué)形式簡單,對實(shí)際數(shù)據(jù)的擬合效果較差,不能用式(2)~(3)表示三者之間的關(guān)聯(lián)關(guān)系。因此,對于實(shí)際數(shù)據(jù),借助余弦相似度(式(6))分別計(jì)算平均車速和占有率對交通流的相似度:
圖2 多變量時(shí)間注意力機(jī)制
與一般忽略路網(wǎng)結(jié)構(gòu)信息的基于注意的方法相比,本文所提圖注意網(wǎng)絡(luò)不需要在圖卷積基礎(chǔ)上進(jìn)行注意力機(jī)制處理[10],可以直接自適應(yīng)地分配不同鄰居的空間權(quán)重,采用鄰接關(guān)系作為先驗(yàn),將節(jié)點(diǎn)劃分為兩個(gè)鄰域集;其次,利用注意力機(jī)制同時(shí)動態(tài)捕捉第一階鄰域和第二階鄰域間的空間相關(guān)性;最后,對觀測節(jié)點(diǎn)的鄰域節(jié)點(diǎn)特征進(jìn)行加權(quán)求和,提取目標(biāo)節(jié)點(diǎn)的特征信息和不同鄰域?qū)λ挠绊憽?/p>
2.3.1構(gòu)建鄰接矩陣
傳統(tǒng)的鄰接矩陣主要關(guān)注直接連接的節(jié)點(diǎn),即相鄰的一階鄰居,而忽略了節(jié)點(diǎn)之間的間接連接。如圖3所示,本文采用新的鄰接矩陣編碼傳感器之間的直接鄰接關(guān)系和間接鄰接關(guān)系。
其中為i到j(luò)的最短路徑長度。
2.3.2二階鄰域圖注意網(wǎng)絡(luò)
圖4 圖注意力層
(=1,2)階鄰域的注意力系數(shù)的計(jì)算公式如下:
每個(gè)節(jié)點(diǎn)的最終輸出特征如下:
為了穩(wěn)定自注意力學(xué)習(xí)過程,進(jìn)一步提升注意力層的表達(dá)能力,對最終的網(wǎng)絡(luò)層執(zhí)行多頭注意力機(jī)制:
其中表示注意力頭數(shù)。
圖5 二階鄰域圖注意網(wǎng)絡(luò)
圖6 特征交叉
第+1層的交叉過程如下:
通過多層網(wǎng)絡(luò)對特征向量各個(gè)維度進(jìn)行充分的交叉組合,模型能夠抓取更多的非線性特征和組合特征的信息,此外,特征交叉網(wǎng)絡(luò)還有低線性復(fù)雜度和參數(shù)共享的優(yōu)點(diǎn)。
本文利用標(biāo)準(zhǔn)二維卷積提取時(shí)域上的特征,具體做法是對每個(gè)節(jié)點(diǎn)自身時(shí)間域上的相鄰點(diǎn)進(jìn)行卷積操作。經(jīng)過空間特征提取和時(shí)間特征提取后的結(jié)果如下:
步驟3 多個(gè)串聯(lián)堆疊的時(shí)空層采用殘差學(xué)習(xí)的方式訓(xùn)練,輸出的交通流接入全連接層。
為了驗(yàn)證本文模型的性能和有效性,在兩個(gè)數(shù)據(jù)集(PeMSD4和PeMSD8)上進(jìn)行對比實(shí)驗(yàn)。兩個(gè)數(shù)據(jù)集是從加州交通性能測量系統(tǒng)(PeMS)[17]收集:PeMSD4包含了美國加州舊金山灣區(qū)(San Francisco Bay Area)的路網(wǎng)節(jié)點(diǎn)交通狀態(tài)數(shù)據(jù),PeMSD8包含了美國加州圣貝納迪諾縣(San Bernardino)的路網(wǎng)節(jié)點(diǎn)交通狀態(tài)數(shù)據(jù)。為了方便研究,本文中所用的數(shù)據(jù)集都移除了路網(wǎng)節(jié)點(diǎn)中的冗余檢測點(diǎn),確保數(shù)據(jù)集中每個(gè)節(jié)點(diǎn)都不過于接近(相鄰節(jié)點(diǎn)間的距離不大于3.5 英里(1 英里=1.61 km))。最終得到的PeMSD4和PeMSD8分別包含了307個(gè)節(jié)點(diǎn)和170個(gè)節(jié)點(diǎn),同時(shí)聚集原有每隔30 s的采樣數(shù)據(jù),使得每條樣本數(shù)據(jù)間的間隔為5 min。本文利用平均值插值法補(bǔ)全缺失數(shù)據(jù),利用零均值對輸入數(shù)據(jù)歸一化。實(shí)驗(yàn)考慮3個(gè)輸入特征:交通流、平均車速和占用率,并將數(shù)據(jù)集按照6∶2∶2隨機(jī)分割為訓(xùn)練集、驗(yàn)證集和測試集。
本文選擇均方根誤差(Root Mean Squared Error, RMSE)和平均絕對誤差(Mean Absolute Error, MAE)作為評價(jià)指標(biāo),它們的計(jì)算公式分別為:
選用長短期記憶(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)[18]、時(shí)空圖卷積網(wǎng)絡(luò)(Spatio-Temporal Graph Convolutional Network, STGCN)[19]、GeoMAN(Multi-level Attention Network for Geo-sensory time series prediction)模型[11]、ASTGCN(Attention based Spatial-Temporal Graph Convolutional Network)模型[10]、GCN-GAN(Graph Convolutional Network and Generative Adversarial Network)模型[20]作為實(shí)驗(yàn)對比的基線。同時(shí),為了和傳統(tǒng)非深度學(xué)習(xí)模型進(jìn)行比較,本文選取了歷史平均(Historical Average, HA)、向量自回歸(Vector Auto-Regressive, VAR)[21]和差分整合移動平均自回歸(AutoRegressive Integrated Moving Average, ARIMA)模型[22]作為傳統(tǒng)基線模型。在HA中,根據(jù)前12個(gè)時(shí)間片的平均值預(yù)測下一個(gè)值。
根據(jù)相關(guān)文獻(xiàn)和歷史經(jīng)驗(yàn)設(shè)定上述基準(zhǔn)模型的關(guān)鍵參數(shù),分別如下:ARIMA模型的自回歸系數(shù)為4,移動平均項(xiàng)數(shù)為2,差分階數(shù)為2;VAR的最佳滯后階數(shù)為3;LSTM的網(wǎng)絡(luò)層數(shù)為2,隱藏層數(shù)為64;STGCN[19]、GeoMAN模型[11]、ASTGCN模型[10]和GCN-GAN模型[20]的參數(shù)設(shè)置均參考相應(yīng)文獻(xiàn),設(shè)置為默認(rèn)值。
經(jīng)過測試和驗(yàn)證,時(shí)間維的卷積核大小不能過大,本文時(shí)間維卷積核的大小設(shè)置為(1,3),圖注意力網(wǎng)絡(luò)中的多頭注意力頭數(shù)設(shè)置為2,圖注意網(wǎng)絡(luò)中隱藏層維度設(shè)置為64,本文的預(yù)測步長大小置為12,即預(yù)測未來1 h的路網(wǎng)節(jié)點(diǎn)流量。利用Adam優(yōu)化器訓(xùn)練,批處理大小設(shè)置為32,初始學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練的最大迭代數(shù)設(shè)置為100。
在本文建立的預(yù)測模型中,主要有3個(gè)影響模型預(yù)測性能的超參數(shù),分別是注意力頭數(shù)、鄰域階數(shù)和隱藏層維度,其中:注意力頭數(shù)影響注意力層的權(quán)重計(jì)算復(fù)雜度;鄰域階數(shù)影響圖結(jié)構(gòu)中鄰居節(jié)點(diǎn)信息的聚合程度;隱藏層維度影響神經(jīng)網(wǎng)絡(luò)的擬合函數(shù)能力。在PeMSD4和PeMSD8數(shù)據(jù)集上,設(shè)置注意力頭數(shù)為{1,2,3,4},鄰域階數(shù)為{1,2,3,4},隱藏層維度{16,32,64,128},使用試湊法分別測試3個(gè)參數(shù)對模型的影響。
注意力頭數(shù)、鄰域階數(shù)對模型性能的影響如圖7所示。隨著頭數(shù)增加,模型的誤差先降低再升高,當(dāng)頭數(shù)為2時(shí)誤差最小,當(dāng)頭數(shù)過大時(shí),模型可能出現(xiàn)過擬合。隨著鄰域階數(shù)增加,在一階鄰域時(shí)模型不能提取更完善的信息;在二階鄰域時(shí)模型可以很好地聚合信息,此時(shí)模型誤差最??;繼續(xù)加深鄰域階數(shù),可能降低信息區(qū)分度,導(dǎo)致誤差較大。
圖7 不同超參數(shù)在不同數(shù)據(jù)集上的預(yù)測誤差對比
表1為不同模型在PeMSD4和PeMSD8數(shù)據(jù)集上在路網(wǎng)節(jié)點(diǎn)未來60 min的流量預(yù)測平均結(jié)果。從表1可以看出,在PeMSD4和PeMSD8數(shù)據(jù)集上,與4個(gè)經(jīng)典時(shí)間序列模型相比,F(xiàn)F-GAT模型的RMSE分別降低了22.4%~47.8%和12.9%~38.2%,可以看出,經(jīng)典時(shí)間序列模型的預(yù)測結(jié)果較差,這可能是因?yàn)榻?jīng)典時(shí)間序列模型對非線性的復(fù)雜交通數(shù)據(jù)建模能力有限,而深度學(xué)習(xí)模型對復(fù)雜的路網(wǎng)預(yù)測能力更強(qiáng)。對比不同的深度學(xué)習(xí)模型,STGCN、GeoMAN和FF-GAT模型都同時(shí)提取了時(shí)間和空間特征,在PeMSD4和PeMSD8數(shù)據(jù)集上,F(xiàn)F-GAT模型的RMSE與STGCN相比分別降低了7.4%和11.7%,與GeoMAN相比分別降低了6.0%和5.9%,與ASTGCN相比分別降低了2.0%和3.4%,與GCN-GAN相比分別降低了1.9%和3.1%。本文模型對路網(wǎng)的預(yù)測結(jié)果更理想,同時(shí)由于本文模型在特征提取時(shí)更全面地挖掘了節(jié)點(diǎn)拓?fù)湫畔?,因此在兩個(gè)數(shù)據(jù)集上的預(yù)測結(jié)果精度都較好。
表1 不同模型在PeMSD4和PeMSD8數(shù)據(jù)集上的結(jié)果對比
圖8為9種模型的預(yù)測精度指標(biāo)(RMSE和MAE)隨著預(yù)測時(shí)間的變化曲線。從圖8可以看出,隨著預(yù)測時(shí)間的增加,HA、ARIMA、LSTM的預(yù)測精度急劇下降,VAR的精度略慢于上述3種模型,深度學(xué)習(xí)模型的誤差隨著預(yù)測時(shí)間的增加而緩慢增加,總體性能良好。從圖8可以看出,當(dāng)時(shí)間為60 min時(shí),在兩個(gè)數(shù)據(jù)集上,F(xiàn)F-GAT模型的RMSE均低于其他對比模型。與上述模型相比,ASTGCN通過引入注意力機(jī)制處理時(shí)空動態(tài)特性,預(yù)測精度有所提升,本文模型在時(shí)間和空間維度都考慮了多變量的參數(shù)影響,充分考慮了交通流數(shù)據(jù)的時(shí)空相關(guān)性,因此能達(dá)到最佳的預(yù)測性能。
圖8 不同模型在不同預(yù)測時(shí)長下的性能比較
FF-GAT模型在PeMSD4數(shù)據(jù)集上對176號傳感器預(yù)測的交通流與實(shí)際值的差異曲線如圖9(a)所示,在PeMSD8數(shù)據(jù)集上對3號傳感器預(yù)測的交通流與實(shí)際值的差異曲線如圖9(b)所示?;谡鎸?shí)值的曲線非常不規(guī)則,但本文模型大致符合趨勢,說明FF-GAT模型對數(shù)據(jù)中可能的模式有更強(qiáng)的學(xué)習(xí)能力,這也說明了本文模型的有效性。
圖9 FF-GAT模型的交通流量預(yù)測值與真實(shí)值的對比
FF-GAT模型參數(shù)擬合過程中的誤差變化曲線如圖10所示,隨著迭代次數(shù)(epoch)的增加,預(yù)測精度逐漸升高,誤差值逐漸減小,模型收斂較快。在PeMSD4數(shù)據(jù)集上,在迭代次數(shù)為40時(shí)模型趨于穩(wěn)定,觀察驗(yàn)證集發(fā)現(xiàn)迭代次數(shù)為78時(shí)模型參數(shù)誤差最??;同樣地,在PeMSD8數(shù)據(jù)集上,模型在迭代次數(shù)為45時(shí)趨于穩(wěn)定,觀察驗(yàn)證集發(fā)現(xiàn)迭代次數(shù)為74時(shí)模型參數(shù)誤差最小,以上結(jié)果說明了本文模型的穩(wěn)定性。
圖10 FF-GAT模型的誤差曲線
為了驗(yàn)證本文模型中各個(gè)模塊的有效性,設(shè)計(jì)兩個(gè)變體模型:1)MA,即移除多變量時(shí)間注意力機(jī)制模塊;2)MF,即移除多變量輸入特征交叉模塊。消融實(shí)驗(yàn)結(jié)果見表2,可以看出,兩個(gè)變體模型的誤差均高于FF-GAT模型,表明模型的各個(gè)組件的有效性,多變量時(shí)間注意力機(jī)制能為模型在時(shí)間維度上提供更多信息輔助模型預(yù)測,多變量輸入特征交叉也能更好地挖掘交通數(shù)據(jù)中的相關(guān)性。
表2 不同模塊在PeMSD4和PeMSD8數(shù)據(jù)集上的性能
高速公路交通流預(yù)測是現(xiàn)代交通管理的一個(gè)基本問題。針對采集的路網(wǎng)狀態(tài)具有時(shí)空復(fù)雜性和非線性特征的問題,本文提出一種基于特征融合圖注意網(wǎng)絡(luò)的路網(wǎng)交通流預(yù)測模型。在時(shí)間上考慮交通預(yù)測中同一節(jié)點(diǎn)不同交通變量之間的關(guān)系,利用多變量時(shí)間注意力機(jī)制捕捉不同時(shí)間之間的動態(tài)時(shí)間相關(guān)性;在空間上以路網(wǎng)不同鄰域信息為先驗(yàn),利用二階圖注意網(wǎng)絡(luò)捕獲網(wǎng)絡(luò)內(nèi)部的綜合空間相關(guān)性,再用多變量特征交叉網(wǎng)絡(luò)充分挖掘多個(gè)異構(gòu)數(shù)據(jù)之間的耦合相關(guān)性,為預(yù)測交通流提供有效的信息補(bǔ)充。在兩個(gè)PeMS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,所提模型與現(xiàn)有對比模型相比,在挖掘特征和預(yù)測精度方面均具有一定優(yōu)勢。下一步將收集道路功能特征、天氣特征、節(jié)假日和社會事件等數(shù)據(jù)集,為用戶提供最全面的信息,形成完整的智能交通系統(tǒng),促進(jìn)智慧城市交通的發(fā)展。
[1] CHEN L, SHAO W, LV M, et al. AARGNN: an attentive attributed recurrent graph neural network for traffic flow prediction considering multiple dynamic factors[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(10): 17201-17211.
[2] SHIN Y, YOON Y. Incorporating dynamicity of transportation network with multi-weight traffic graph convolutional network for traffic forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(3): 2082-2092.
[3] HUANG J, LUO K, CAO L, et al. Learning multiaspect traffic couplings by multirelational graph attention networks for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(11): 20681-20695.
[4] 王海起,王志海,李留珂,等. 基于網(wǎng)格劃分的城市短時(shí)交通流量時(shí)空預(yù)測模型[J]. 計(jì)算機(jī)應(yīng)用, 2022, 42(7):2274-2280.(WANG H Q, WANG Z H, LI L K, et al. Spatial-temporal prediction model of urban short-term traffic flow based on grid division[J]. Journal of Computer Applications, 2022, 42(7):2274-2280.)
[5] LIN Z, FENG J, LU Z, et al. DeepSTN+: context-aware spatial-temporal neural network for crowd flow prediction in metropolis[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 1020-1027.
[6] 陳丹蕾,陳紅,任安虎. 考慮時(shí)空影響下的圖卷積網(wǎng)絡(luò)短時(shí)交通流預(yù)測[J]. 計(jì)算機(jī)工程與應(yīng)用, 2021, 57(13):269-275.(CHEN D L, CHEN H, REN A H. Short-time traffic flow prediction of graph convolutional network considering influence of space and time[J]. Computer Engineering and Applications, 2021, 57(13):269-275.)
[7] SONG C, LIN Y, GUO S, et al. Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[C]// Proceedings of the 34th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2020: 914-921.
[8] ZHAO L, SONG Y, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858.
[9] ZHU J, HAN X, DENG H, et al. KST-GCN: a knowledge-driven spatial-temporal graph convolutional network for traffic forecasting[J]. IEEE Transactions on Intelligent Transaction Systems, 2022, 23(9): 15055-15065.
[10] GUO S, LIN Y, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[C]// Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2019: 922-929.
[11] LIANG Y, KE S, ZHANG J, et al. GeoMAN: multi-level attention networks for geo-sensory time series prediction[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. California: ijcai.org, 2018: 3428-3434.
[12] YIN X, WU G, WEI J, et al. Multi-stage attention spatial-temporal graph networks for traffic prediction[J]. Neurocomputing, 2021, 428: 42-53.
[13] DEFFERRARD M, BRESSON X, VANDERGHEYNST P. Convolutional neural networks on graphs with fast localized spectral filtering[C]// Proceedings of the 30th International Conference on Neural Information Processing Systems. Red Hook, NY: Curran Associates Inc., 2016: 3844-3852.
[14] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[EB/OL]. (2014-05-21) [2022-05-23].https://arxiv.org/pdf/1312.6203.pdf.
[15] VELI?KOVI? P, CUCURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. (2018-02-04) [2022-05-23].https://arxiv.org/pdf/1710.10903.pdf.
[16] GREENSHIELDS B D, BIBBINS J R, CHANNING W S, et al. A study of traffic capacity[J]. Highway Research Board Proceedings, 1935, 14: 448-477.
[17] CHEN C, PETTY K, SKABARDONIS A, et al. Freeway performance measurement system: mining loop detector data[J]. Transportation Research Record, 2001, 1748(1): 96-102.
[18] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780.
[19] YU B, YIN H, ZHU Z. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. California: ijcai.org, 2018:3634-3640.
[20] ZHENG H, LI X, LI Y, et al. GCN-GAN: integrating graph convolutional network and generative adversarial network for traffic flow prediction[J]. IEEE Access, 2022, 10: 94051-94062.
[21] SETHI J K, MITTAL M. Analysis of air quality using univariate and multivariate time series models[C]// Proceedings of the 10th International Conference on Cloud Computing, Data Science and Engineering. Piscataway: IEEE, 2020: 823-827.
[22] RUN L, MIN L X, LU Z X. Research and comparison of ARIMA and grey prediction models for subway traffic forecasting[C]// Proceedings of the 2020 International Conference on Intelligent Computing, Automation and Systems. Piscataway: IEEE, 2020:63-67.
Highway traffic flow prediction based on feature fusion graph attention network
GAO Chun, WANG Mengling*
(,,200237,)
Based on the actual spatio-temporal topology of the traffic network, a Feature Fusion Graph ATtention network (FF-GAT) model was proposed to fuse multiple traffic state information obtained by nodes, so as to predict the highway traffic flow. First, the correlation features among the vehicle speed, traffic flow and occupancy of the nodes were analyzed, and based on the multivariate temporal attention mechanism, the relationships among the vehicle speed, traffic flow and occupancy were incorporated into the attention mechanism to capture the dynamic temporal correlation between different moments of traffic flow. Then, the nodes were divided into different sets of neighborhoods, and the spatial correlation between different neighborhoods of traffic flow was captured by the feature fusion Graph Attention neTwork (GAT). At the same time, the coupling correlation between multiple heterogeneous data was fully explored by the feature crossover network to provide effective information supplement for predicting the target sequence. Experiments were carried out on two publicly available traffic flow datasets. Experimental results show that FF-GAT model reduces the Root Mean Squared Error (RMSE) by 3.4% compared with ASTGCN (Attention based Spatial-Temporal Graph Convolutional Network) model and 3.1% compared with GCN-GAN (Graph Convolutional Network and Generative Adversarial Network) model on PeMSD8 dataset. It can be seen that FF-GAT model can effectively improve the prediction accuracy through feature fusion.
highway traffic flow prediction; Graph Attention neTwork (GAT); attention mechanism; feature crossover network; spatio-temporal topology
This work is partially supported by Project of Science and Technology Commission of Shanghai Municipality (19DZ1209003).
GAO Chun, born in 1998, M. S. candidate. Her research interests include traffic big data mining.
WANG Mengling, born in 1980, Ph. D., associate professor. Her research interests include traffic big data mining, computational intelligence algorithm, artificial intelligence-based modeling method, distributed predictive control, traffic management decision optimization.
1001-9081(2023)10-3114-07
10.11772/j.issn.1001-9081.2022101587
2022?10?24;
2023?03?13;
上海市科學(xué)技術(shù)委員會課題(19DZ1209003)。
高醇(1998—),女,云南曲靖人,碩士研究生,主要研究方向:交通大數(shù)據(jù)挖掘; 王夢靈(1980—),女,湖北黃岡人,副教授,博士,主要研究方向:交通大數(shù)據(jù)挖掘、計(jì)算智能算法、基于人工智能的建模方法、分布式預(yù)測控制、交通管理決策優(yōu)化。
TP391.4
A
2023?03?14。