劉煒燾,馮 輝,王一然,王凌云,余凱峰,孔祥杰
(1.浙江浙能技術(shù)研究院有限公司,浙江 杭州 311121;2.浙江工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023)
隨著城市化進(jìn)程的加快和智慧城市的建設(shè),幾乎無處不在的道路傳感器使車輛處于普適環(huán)境中。在車輛與傳感器的隱式交互下,傳感器能夠不斷地探測車速、車流量等交通情況,因此人們無須關(guān)心道路上潛在的計算設(shè)備,只需關(guān)注自身的出行,從手機應(yīng)用或智能車載終端獲取擁堵提示、路徑引導(dǎo)等出行服務(wù)。由此可見,智能交通系統(tǒng)(Intelligent traffic system,ITS)是普適計算的重要應(yīng)用之一,而ITS的交通控制和交通規(guī)劃需要以實時、準(zhǔn)確的交通流預(yù)測作為基礎(chǔ)。交通流預(yù)測能夠掌握路網(wǎng)、路段、車道在一般時段和日期下的運行規(guī)律,并學(xué)習(xí)特殊地段(商圈、學(xué)校、醫(yī)院)、突發(fā)事件(交通事故、交通擁堵)、特殊期間(擁堵形成期、擁堵期、擁堵消散期)的交通運行特性,完成對未來交通情況的準(zhǔn)確預(yù)測[1],為日常出行和交通管理提供關(guān)鍵信息?,F(xiàn)有的交通流預(yù)測方法可大致分為模型驅(qū)動型和數(shù)據(jù)驅(qū)動型兩大類[2-4]。模型驅(qū)動型方法[5-6]以交通流中基本參數(shù)(速度、流量、占有率)之間的各類公式為先驗知識,無法對天氣、交通事故等特殊因素或偶然事件進(jìn)行處理。因此現(xiàn)有的研究著重于數(shù)據(jù)驅(qū)動型方法中具有多維度數(shù)據(jù)分析能力的深度學(xué)習(xí)方法。Wu等[7]為了使預(yù)測過程能夠適應(yīng)環(huán)境的變化,提出了基于T-RNN的多模態(tài)預(yù)測方法。為了更好地擬合高峰流量,Jing等[8]引入了基于梯度提升決策樹的輕量級梯度提升機算法,并結(jié)合LSTM神經(jīng)網(wǎng)絡(luò)模型對城市軌道交通客流進(jìn)行預(yù)測。Jia等[9]使用DenseNet和ConvLSTM模型分別捕獲空間依賴的動態(tài)變化和時間依賴的非周期性特性。然而,上述研究無法判斷路段及道路交叉口內(nèi)各車道間的相似性與差異性,只是籠統(tǒng)地將其視為一個整體[10]。
由于車輛的高度流動性,不同車道間的交通運行模式存在差異,不同交叉口、不同流向間的車道更傾向于呈現(xiàn)出相異的交通運行狀態(tài)[11-12]。同時,在普適計算的背景下,交通流預(yù)測應(yīng)當(dāng)能夠及時地感知不同車道間的道路動態(tài),完善行車、人、道路一體的普適環(huán)境。因此車道級的交通流預(yù)測是ITS未來重點發(fā)展技術(shù)之一。Gu等[13]使用基于熵值的灰色關(guān)聯(lián)法分析各車道之間的依賴關(guān)系。Ke等[14]提出TM-CNN模型,將同一路口下的不同車道視為各通道內(nèi)的圖片。Xie等[15]以車輛變道行為作為切入點,使用深度置信神經(jīng)網(wǎng)絡(luò)與LSTM建立包括變道決策與變道實施在內(nèi)的車輛變道模型。然而,上述研究沒有考慮車道間交通模式的動態(tài)變化,以及其他異構(gòu)數(shù)據(jù)對預(yù)測結(jié)果的影響。對此筆者提出了車道級交通流預(yù)測異質(zhì)圖卷積模型,同時考慮了靜態(tài)和動態(tài)的路網(wǎng)結(jié)構(gòu),并融合車輛速度、道路占有率和最小能見度等數(shù)據(jù),緩解單源數(shù)據(jù)的信息缺乏問題。模型主要由3部分構(gòu)成,分別為基于動態(tài)圖生成的內(nèi)源圖卷積網(wǎng)絡(luò)、外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)及基于注意力機制的編解碼神經(jīng)網(wǎng)絡(luò)。其中,內(nèi)源卷積網(wǎng)絡(luò)使用車流量和皮爾遜相關(guān)系數(shù)計算道路拓?fù)鋱D中節(jié)點之間的關(guān)聯(lián)度,生成路網(wǎng)的動態(tài)圖,更好地處理了時空相關(guān)性。外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)將車速、道路占有率和最大可見度3個指標(biāo)與車流量一起綜合考慮,提升了交通預(yù)測的準(zhǔn)確度。編解碼神經(jīng)網(wǎng)絡(luò)使用時序注意力機制,進(jìn)一步挖掘時間依賴。在兩個真實數(shù)據(jù)集上的實驗結(jié)果表明:異質(zhì)圖卷積神經(jīng)網(wǎng)絡(luò)模型在多個指標(biāo)上均優(yōu)于對照組方法,能夠有效地預(yù)測未來交通流情況。
圖1為異質(zhì)圖卷積網(wǎng)絡(luò)的模型架構(gòu),網(wǎng)絡(luò)主要由3部分構(gòu)成,分別為基于動態(tài)圖生成的內(nèi)源圖卷積網(wǎng)絡(luò)、外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)和基于注意力機制的編解碼神經(jīng)網(wǎng)絡(luò)。為更方便地在圖1中表示,內(nèi)源卷積網(wǎng)絡(luò)與外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)被整合表示為關(guān)聯(lián)性卷積單元(Association convolution block,ACB)。
圖1 基于動態(tài)圖生成的異質(zhì)圖卷積網(wǎng)絡(luò)模型Fig.1 Architecture of the heterogeneous graph convolution model based on dynamic graph generation
在ACB的內(nèi)源卷積部分,根據(jù)與目標(biāo)車道的關(guān)系,將參與車道分為同路口和不同路口兩大類,分別計算道路之間的關(guān)聯(lián)性。針對不同路口之間的車道,融合動態(tài)圖矩陣與靜態(tài)鄰接矩陣;針對同一路口下的車道,僅采取動態(tài)圖生成過程,代替靜態(tài)鄰接矩陣。上述兩部分矩陣分別參與圖卷積運算,并將運算結(jié)果融合為最終的內(nèi)源圖卷積結(jié)果。在ACB的外源融合部分,采取注意力機制,合理分配各類參數(shù)(交通流特征參數(shù)、天氣參數(shù))的參與權(quán)重,獲取外源融合結(jié)果,并與內(nèi)源圖卷積結(jié)果整合得到各ACB的輸出值。將各ACB中的輸出值作為時序編碼器中的輸入值,使用注意力機制對各時刻GRU單元中隱藏層分配時序權(quán)重,加權(quán)后組成上下文向量。將該上下文向量輸入解碼器,經(jīng)迭代處理后得出最終預(yù)測結(jié)果。
由于各類交通運行狀況信息可被視為圖中的信號,現(xiàn)有許多研究將圖神經(jīng)網(wǎng)絡(luò)應(yīng)用于交通流預(yù)測問題,捕捉交通網(wǎng)絡(luò)中的空間特征。使用基于譜域的圖卷積網(wǎng)絡(luò),挖掘同路口、不同路口車道的靜態(tài)鄰接圖與動態(tài)圖中的深層次空間依賴關(guān)系。
按道路拓?fù)溥B接結(jié)構(gòu)定義無向權(quán)重圖G=(V,E),其中:V為節(jié)點的集合,V={v1,v2,…,vN},N為節(jié)點的數(shù)量;E為各節(jié)點之間邊的集合,表示節(jié)點之間的連通性。圖G的權(quán)重和靜態(tài)鄰接矩陣AI∈
RN×N,其計算式為
(1)
式中:i,j為節(jié)點的編號;di,j為兩個節(jié)點之間的距離。靜態(tài)鄰接矩陣AI只有0值和非0值,0值表示節(jié)點之間無關(guān)聯(lián),非0值表示節(jié)點之間的關(guān)聯(lián)度大小。關(guān)聯(lián)度大小由兩點之間的距離計算,距離越小,兩節(jié)點間的關(guān)聯(lián)度越大,而距離越大,兩點間的關(guān)聯(lián)度越小。為了提高卷積的效率,利用切比雪夫多項式近似擬合卷積核,即
(2)
然而,基于切比雪夫多項式的圖卷積網(wǎng)絡(luò)無法通過式(1)的靜態(tài)鄰接矩陣發(fā)現(xiàn)交通模式的動態(tài)變化。例如:早高峰時郊區(qū)與城區(qū)連接干道的車流大幅度增長,車流方向為郊區(qū)通往城區(qū);晚高峰時城區(qū)通往郊區(qū)的返程車輛呈現(xiàn)增長趨勢。兩者之間的車流關(guān)系與上下游傳導(dǎo)關(guān)系相反,靜態(tài)的連接關(guān)系顯然無法反映車道間交通模式的改變。圖2展示了各節(jié)點間關(guān)聯(lián)程度隨時間變化的過程,邊的顏色越深表示關(guān)聯(lián)程度越高,顏色越淺表示關(guān)聯(lián)程度越低。
圖2 各節(jié)點的關(guān)聯(lián)情況Fig.2 Association between nodes
此外,式(1)依據(jù)與目標(biāo)節(jié)點的距離計算其余節(jié)點關(guān)聯(lián)度的做法,忽略了各節(jié)點間可能存在的相似交通運行模式帶來的影響。各節(jié)點間的靜態(tài)與動態(tài)連接如圖3所示,以S3作為目標(biāo)節(jié)點,根據(jù)距離鄰接關(guān)系可以得到圖3(a)的結(jié)果:S3與S1,S2,S4的距離最近,因而具有更高的權(quán)重;S3與S5,S6,S7距離較遠(yuǎn)且不直接相鄰,因而只有較低的權(quán)重。假設(shè)對各節(jié)點交通運行模式進(jìn)行數(shù)據(jù)分析后發(fā)現(xiàn)S3的交通狀況與S6的狀況最為相近,包括到達(dá)早晚高峰的時間以及高峰期最大流量,并且S6的擁堵會在短時間內(nèi)蔓延至S3,那么應(yīng)有圖3(b)所示的節(jié)點間關(guān)聯(lián)性分析結(jié)果,雖然S3與S6的距離較遠(yuǎn),但是它們之間擁有最高的影響權(quán)重??紤]到上述因素,筆者創(chuàng)新性地提出基于動態(tài)圖生成的內(nèi)源圖卷積網(wǎng)絡(luò),圖4為具體網(wǎng)絡(luò)結(jié)構(gòu)。
圖3 各節(jié)點間的靜態(tài)與動態(tài)連接Fig.3 Static and dynamic links between nodes
圖4 基于動態(tài)圖生成的內(nèi)源圖卷積網(wǎng)絡(luò)Fig.4 Internal graph convolutional network based on dynamic graph generation
將數(shù)據(jù)輸入內(nèi)源圖卷積網(wǎng)絡(luò)前,根據(jù)與目標(biāo)車道的鄰接關(guān)系,將所有參與車道分為同路口鄰接車道Xs以及不同路口鄰接車道Xd這兩類。由于車流量能夠很好地反映路網(wǎng)的擁擠程度及發(fā)生事故的概率,因此選用流量為指標(biāo),由皮爾遜相關(guān)系數(shù)計算各節(jié)點之間的關(guān)聯(lián)度,生成動態(tài)圖,即
(3)
(4)
(5)
(6)
(7)
式中:W為自學(xué)習(xí)的權(quán)重項;⊙為哈達(dá)瑪積運算。
將兩次卷積結(jié)果Fs與Fd進(jìn)行融合,得到第l時刻內(nèi)源卷積的最終結(jié)果,即
(8)
在交通流預(yù)測中,僅考慮單一類型數(shù)據(jù),而忽略異質(zhì)數(shù)據(jù)是造成預(yù)測結(jié)果精度低的另一個主要原因。根據(jù)交通中速度—流量等基礎(chǔ)方程,可以得知速度、流量以及道路占有率三者間復(fù)雜的非線性影響關(guān)系。例如道路在某時段內(nèi)平均流量低,無法根據(jù)該單一的指標(biāo)確定是因為處于平峰段導(dǎo)致車流少,還是因為擁堵造成交通不暢。此外,天氣因素也會對交通運行情況造成較大的影響。當(dāng)天氣晴朗,能見度高時,通常道路中車輛的行駛速度較快,飽和流量可以達(dá)到較高水平;當(dāng)陰雨或是大霧等惡劣天氣時,能見度低,道路中車輛行駛速度較慢,流量低且難以達(dá)到飽和水平。因此,單源交通流特征參數(shù)無法精準(zhǔn)地描述交通運行狀況,模型需要車輛速度、道路占有率和最小能見度等數(shù)據(jù)作補充。
外源融合部分彌補了單源數(shù)據(jù)中信息缺乏的問題。圖5為外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)的具體結(jié)構(gòu),該網(wǎng)絡(luò)采取注意力機制,通過神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí),合理分配各類異構(gòu)特征參數(shù)的參與權(quán)重,自適應(yīng)地達(dá)到各時刻內(nèi)各目標(biāo)節(jié)點的最優(yōu)解,其注意力權(quán)重計算式為
圖5 異質(zhì)數(shù)據(jù)融合神經(jīng)網(wǎng)絡(luò)Fig.5 External heterogeneous data fusion network
(9)
(10)
(11)
如圖6所示,將內(nèi)源卷積神經(jīng)網(wǎng)絡(luò)與外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)的輸出值進(jìn)行線性變化,融合后可得到各ACB中的最終輸出,即
圖6 內(nèi)源卷積網(wǎng)絡(luò)、外源異質(zhì)網(wǎng)絡(luò)的輸出融合Fig.6 Fusion of internal network and external network
(12)
式中:Wl1,Wl2為可自學(xué)習(xí)的權(quán)重項;bl1,bl2為與之對應(yīng)的偏移項。
得到各時刻下ACB中的輸出值后,雖然該輸出值中包含深層次空間依賴,但還需進(jìn)一步挖掘其中的時間依賴關(guān)系,以提升結(jié)果的精度。在交通流預(yù)測研究中,已有較多的結(jié)論證明LSTM,GRU等網(wǎng)絡(luò)可通過歷史信息的有效收集,依據(jù)前文的場景干預(yù)下文的預(yù)測,有效地處理時間序列。因此,筆者以GRU為基礎(chǔ)單元,用頭尾相連的方式搭建編碼器。通常情況下,編碼器會將處理的輸入信息與序列壓縮到上下文向量中,然而由于存儲空間的限制,上下文向量通常具有固定的長度,無法存儲全部的信息,仍然無法妥善地解決序列問題中的遠(yuǎn)程依賴與長期依賴。
為解決上述問題,在編碼器中引入了時序注意力機制。時序注意力以神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)和并行計算的方式,合理且高效地分配各時段參與的權(quán)重,從而獲得全局的最優(yōu)解,解決了遠(yuǎn)程依賴與長期依賴問題。時序注意力權(quán)重計算式為
(13)
(14)
獲取時序注意力權(quán)重后,可以求得上下文向量,即
(15)
(16)
(17)
(18)
筆者使用美國加利福尼亞州運輸機構(gòu)在真實高速公路上采集的兩組大型數(shù)據(jù)集PeMSD4和PeMSD8,對提出的網(wǎng)絡(luò)以及其余對比實驗組進(jìn)行性能測試。根據(jù)傳感器位置所屬的路口及所屬的車道對數(shù)據(jù)進(jìn)行細(xì)分,并以5 min為間隔統(tǒng)計車道的總流量、平均占有率及平均速度。根據(jù)道路限速及實際情況,對不合理的數(shù)據(jù)進(jìn)行清洗,對毛刺點進(jìn)行平滑處理,并使用固定長度的滑動窗口法對缺失數(shù)據(jù)進(jìn)行了補充。此外,筆者還搜集了兩地區(qū)在上述時段內(nèi)的天氣狀況數(shù)據(jù),選擇了其中的能見度指標(biāo)。
PeMSD4中共有307個傳感器,它們分布于舊金山灣區(qū)的29條道路中。數(shù)據(jù)集包含2018年1月1日—2月28日共56 d的數(shù)據(jù),其中41 d數(shù)據(jù)作為訓(xùn)練集,15 d數(shù)據(jù)作為測試集。PeMSD8中共有170個傳感器,分布于圣貝納迪諾地區(qū)的8條道路中。數(shù)據(jù)集包含2016年7月1日—8月31日共62 d的數(shù)據(jù),其中47 d數(shù)據(jù)作為訓(xùn)練集,15 d數(shù)據(jù)作為測試集。
為了考察基于動態(tài)圖生成的異質(zhì)圖卷積網(wǎng)絡(luò)的優(yōu)越性,筆者將其與7種對照算法進(jìn)行對比,對照算法涵蓋了參數(shù)型方法、非參數(shù)型方法以及深度學(xué)習(xí)方法:
1) HA。該方法是一種基于統(tǒng)計學(xué)的方法,它使用訓(xùn)練集中對應(yīng)時刻的交通流特征參數(shù)作為標(biāo)準(zhǔn),計算其平均值,以此作為預(yù)測結(jié)果。
2) SVM。該方法是一種有監(jiān)督學(xué)習(xí)方法,所求得的最優(yōu)超平面可使多個類別之間相距最遠(yuǎn)。
3) ARIMA。該方法是一種時間序列預(yù)測方法,它由一個自回歸塊和一個移動平均塊構(gòu)成。
4) GRU。該方法是LSTM的一種變體,它刪除了其中的遺忘門,僅由更新門和重置門組成。
5) T-GCN[16]。該方法是使用GRU-GCN結(jié)構(gòu)的時間序列神經(jīng)網(wǎng)絡(luò)。其中,GCN處理空間依賴關(guān)系,GRU處理時間依賴關(guān)系。
6) ST-AFN[17]。該方法使用時空注意力構(gòu)建車道級交通流預(yù)測融合網(wǎng)絡(luò),是本課題組先前的工作成果。該網(wǎng)絡(luò)主要由4部分構(gòu)成,分別為速度處理神經(jīng)網(wǎng)絡(luò)、空間性編碼網(wǎng)絡(luò)、異質(zhì)信息融合神經(jīng)網(wǎng)絡(luò)與時間性解碼網(wǎng)絡(luò)。
7) ASTGCN[18]。該方法是時空注意力圖卷積網(wǎng)絡(luò)。它將時間序列分為鄰近、天和星期3個子模塊,并在各個子模塊中使用時間、空間注意力,最后融合3個子模塊得到預(yù)測結(jié)果。
所有的實驗運行于同一臺主機上,主機操作系統(tǒng)為Ubuntu 18.04,內(nèi)存64 GB,CPU為Intel Xeon Silver,顯卡為NVDIA Quadro M4000。Pytorch版本為v1.6.0,初始學(xué)習(xí)率設(shè)置為0.000 1,批次大小(Batch size)設(shè)置為128,編解碼器中GRU單元的隱藏層與細(xì)胞狀態(tài)大小統(tǒng)一設(shè)置為64,預(yù)測所使用的歷史數(shù)據(jù)的步長設(shè)置為12。筆者使用平均絕對誤差(Mean absolute error,MAE)、根均方誤差(Root mean square error,RMSE)和平均絕對百分比誤差(Mean absolute percentage error,MAPE)作為評價指標(biāo),表1列出了各組實驗最終的平均結(jié)果。
表1 整體性能對比Table 1 Overall performance comparison
由表1可知:基于統(tǒng)計學(xué)的HA方法雖然效率高,但由于算法過于簡單,無法應(yīng)用于復(fù)雜多變的真實交通環(huán)境中;時間序列預(yù)測方法ARIMA雖然比傳統(tǒng)機器學(xué)習(xí)方法SVM預(yù)測結(jié)果更好,但是精度仍較低;深度學(xué)習(xí)方法GRU取得了優(yōu)于ARIMA的結(jié)果;空間依賴關(guān)系的欠缺是提升預(yù)測精度的瓶頸,T-GCN使用復(fù)合的網(wǎng)絡(luò)結(jié)果解決了這一問題,它較GRU取得了進(jìn)步明顯;多分支結(jié)構(gòu)的ASTGCN使用了時空注意力,精度比用于地面道路預(yù)測的ST-AFN更高一些;筆者提出的基于動態(tài)圖生成的異質(zhì)圖卷積融合網(wǎng)絡(luò)取得了最優(yōu)預(yù)測結(jié)果,在PeMSD4中的3項評估指標(biāo)分別為16.1654,24.656及12.413%,在PeMSD8中分別取得了15.486,22.513及13.641%的結(jié)果。
與周末相比,工作日的早晚高峰趨勢更加明顯,車流量增長的幅度更大,而平峰時期車流量更少,兩者之間存在較明顯的差異。為了更好地展示神經(jīng)網(wǎng)絡(luò)在工作日與非工作日的預(yù)測結(jié)果,對工作日與非工作日的預(yù)測結(jié)果分別進(jìn)行了統(tǒng)計。表2展示了T-GCN、ASTGCN和筆者所提的異質(zhì)圖卷積神經(jīng)網(wǎng)絡(luò)在工作日和非工作日中的各個指標(biāo),異質(zhì)圖卷積神經(jīng)網(wǎng)絡(luò)在工作日與非工作日都取得了最優(yōu)的預(yù)測結(jié)果,并且在非工作日取得的結(jié)果精度高于在工作日取得的結(jié)果精度。
表2 工作日與非工作日結(jié)果對比Table 2 Performance comparison of working days and nonworking days
為了更好地展示異質(zhì)圖卷積模型的真實有效性,從PeMSD4中選取了一個工作日,從PeMSD8中選取了一個休息日,分別進(jìn)行預(yù)測結(jié)果的圖形展示,結(jié)果圖7所示。由圖7可知:異質(zhì)圖卷積模型取得了較好的交通流預(yù)測結(jié)果,并且非工作日的預(yù)測結(jié)果略好于工作日的預(yù)測結(jié)果。從細(xì)節(jié)上分析,雖然在交通運行狀況較為平穩(wěn)時,神經(jīng)網(wǎng)絡(luò)預(yù)測正確率較高,但是在波動發(fā)生時,神經(jīng)網(wǎng)絡(luò)預(yù)測值與真實值的差距相對較大,仍存在一定的缺陷。例如,在正午時刻交通流量發(fā)生突變的情況下,誤差會較大,并且早晚高峰時期的最大流量值未被準(zhǔn)確預(yù)測。
圖7 預(yù)測結(jié)果Fig.7 Prediction results
為了證明內(nèi)源圖卷積網(wǎng)絡(luò)以及外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)的有效性,分別去除兩個子網(wǎng)絡(luò),消融性實驗結(jié)果如表3所示。其中:author*為刪除內(nèi)源圖卷積網(wǎng)絡(luò)后僅使用靜態(tài)圖卷積網(wǎng)絡(luò)的預(yù)測結(jié)果;author**為刪除外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)后的預(yù)測結(jié)果。當(dāng)僅使用靜態(tài)圖挖掘車道間的空間依賴時,author*在PeMSD4數(shù)據(jù)集的MAPE指標(biāo)為16.105%,在PeMSD8數(shù)據(jù)集的MAPE指標(biāo)為20.896%,和其他對照組相比沒有獲得良好的實驗結(jié)果。而在沒有考慮最小能見度、道路占有率等外源數(shù)據(jù)的情況下,author**在PeMSD4數(shù)據(jù)集的MAE和RMSE指標(biāo)分別為26.221和37.542,在PeMSD8數(shù)據(jù)集的MAE和RMSE指標(biāo)分別為26.462和38.403,實驗數(shù)據(jù)均高于其他對照組模型。在考慮動態(tài)圖卷積和外源數(shù)據(jù)的author實驗中,各指標(biāo)在PeMSD4和PeMSD8數(shù)據(jù)集下都取得了最優(yōu)的實驗結(jié)果。因此,筆者引入的基于動態(tài)圖生成的內(nèi)源圖卷積網(wǎng)絡(luò)和外源異質(zhì)數(shù)據(jù)融合網(wǎng)絡(luò)都對模型性能的提升起到了關(guān)鍵作用。
表3 消融性實驗結(jié)果比較Table 3 Performance comparison of ablation experiment
筆者還對T-GCN、ASTGCN等圖卷積算法以及ST-AFN進(jìn)行了運行效率的分析。表4為網(wǎng)絡(luò)訓(xùn)練消耗時間對比。ST-AFN因其使用高效的注意力機制而具有最快的速度,T-GCN因其相對簡單的網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練完成速度較快,擁有眾多網(wǎng)絡(luò)分支的ASTGCN訓(xùn)練速度較慢。筆者提出的模型雖然在PeMSD4和PeMSD8兩個數(shù)據(jù)集上的MAE,RMSE和MAPE性能指標(biāo)均優(yōu)于其他對照組模型,但在運行效率上仍存在不足。
表4 算法訓(xùn)練耗時對比Table 4 Training cost comparison
在普適環(huán)境下,車道級交通流預(yù)測比已有的預(yù)測方法能夠更精細(xì)化地感知城市中的道路情況,發(fā)現(xiàn)客觀環(huán)境的動態(tài)變化。筆者提出基于動態(tài)圖生成的異質(zhì)圖卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)總體采用編解碼的結(jié)構(gòu),以各時刻ACB中的輸出值作為時序編碼器中的輸入,其中ACB中包括內(nèi)源圖卷積、外源異質(zhì)數(shù)據(jù)融合這兩個子網(wǎng)絡(luò)。ACB單元將動態(tài)內(nèi)源圖信息與外源異質(zhì)數(shù)據(jù)進(jìn)行了融合。時序編碼器使用注意力機制合理分配各時段權(quán)重,組成上下文向量。最后解碼器對上下文向量進(jìn)行解碼,完成交通流預(yù)測。實驗使用PeMS中兩個真實的交通數(shù)據(jù)集,結(jié)果充分證明了該網(wǎng)絡(luò)的可行性與優(yōu)越性。由于PeMSD4和PeMSD8數(shù)據(jù)集采集自美國加利福尼亞州的高速公路,后續(xù)會在國內(nèi)的城市數(shù)據(jù)集和其他交通數(shù)據(jù)集上進(jìn)一步驗證異質(zhì)圖卷積模型的有效性。利用編解碼結(jié)構(gòu)與注意力機制雖然有效地提高了網(wǎng)絡(luò)的運行效率,但要做到根據(jù)當(dāng)前交通情況進(jìn)行實時運算仍存在提升空間。后續(xù)工作也將探索邊緣計算方法,把繁重的運算任務(wù)卸載到路邊單元(Road side unit,RSU)或嘗試遷移學(xué)習(xí)中的模型預(yù)訓(xùn)練思想,進(jìn)一步提升網(wǎng)絡(luò)模型的實時性。