張建旭,金宏意,胡 帥,王雪芹
(1.重慶交通大學(xué) 交通運(yùn)輸學(xué)院, 重慶 400074;2.重慶交通大學(xué) 山地城市交通系統(tǒng)與安全重慶市重點(diǎn)實(shí)驗(yàn)室, 重慶 400074)
路網(wǎng)交通參數(shù)預(yù)測(cè)對(duì)實(shí)際交通應(yīng)用至關(guān)重要。現(xiàn)有大部分交通預(yù)測(cè)模型,如動(dòng)態(tài)模式分解[1]、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[2]及其變體模型[3-4]主要針對(duì)路網(wǎng)中某一觀測(cè)點(diǎn)進(jìn)行時(shí)序預(yù)測(cè)。而卷積神經(jīng)網(wǎng)絡(luò)(CNN)[5]能將空間關(guān)系轉(zhuǎn)換為歐式結(jié)構(gòu),但不適用于處理交通網(wǎng)絡(luò)的非歐式結(jié)構(gòu)。近年興起的圖神經(jīng)網(wǎng)絡(luò)將路網(wǎng)拓?fù)涑蓤D進(jìn)行研究,讓非歐式結(jié)構(gòu)的路網(wǎng)級(jí)參數(shù)預(yù)測(cè)成為了可能。如果能夠提高圖神經(jīng)網(wǎng)絡(luò)對(duì)路網(wǎng)級(jí)參數(shù)的預(yù)測(cè)精度,對(duì)交通管控來(lái)說(shuō)有更加重要的意義。
作為圖神經(jīng)網(wǎng)絡(luò)經(jīng)典模型之一的圖卷積網(wǎng)絡(luò)(GCN)[6]分為空域圖卷積和頻域圖卷積兩大類??沼驁D卷積[6]直接在空間上聚合相鄰節(jié)點(diǎn)信息,思想來(lái)自于CNN對(duì)圖像的計(jì)算,定義直觀、靈活性強(qiáng)。頻域圖卷積[7]則利用傅里葉變換,將空域信號(hào)轉(zhuǎn)換到譜域中,借助圖譜的方式進(jìn)行圖卷積的推導(dǎo),具有較為堅(jiān)實(shí)的理論基礎(chǔ),但不適用于有向的交通網(wǎng)絡(luò)圖。GAT[8]模型的出現(xiàn)很好地解決了交通網(wǎng)絡(luò)是有向圖的問(wèn)題,它通過(guò)注意力機(jī)制來(lái)聚合空間特征,不論交通網(wǎng)絡(luò)圖是否有向都能夠進(jìn)行預(yù)測(cè)。現(xiàn)有的研究中,GCN和GAT通常采用鄰接關(guān)系來(lái)獲取空間特征,Zhao等[9-10]都是通過(guò)交通路網(wǎng)拓?fù)涞玫洁徑雨P(guān)系來(lái)實(shí)現(xiàn)圖卷積。然而,城市交通與高速公路、軌道交通相比,條件復(fù)雜多變,道路之間的相互作用和其他關(guān)聯(lián)信息對(duì)預(yù)測(cè)結(jié)果也至關(guān)重要。因此,還需要從鄰接關(guān)系以外的角度進(jìn)一步挖掘交通路網(wǎng)的空間特征信息。Geng 等[11]將城市網(wǎng)格化劃分,根據(jù)區(qū)域的鄰接關(guān)系、功能相似度和交通連通性確定節(jié)點(diǎn)之間的連邊值,構(gòu)建3種不同圖結(jié)構(gòu)的表示,實(shí)現(xiàn)乘車需求預(yù)測(cè)。AST-GCN[12]整合外部影響信息,如實(shí)驗(yàn)中的天氣條件和周圍的興趣點(diǎn)來(lái)促進(jìn)交通預(yù)測(cè)。以上方法對(duì)空間關(guān)聯(lián)性的挖掘大部分利用了路網(wǎng)周圍的土地性質(zhì)和環(huán)境特征,并沒(méi)有進(jìn)一步體現(xiàn)路網(wǎng)中道路的交通特征。
因此,考慮從道路的交通特征出發(fā),從節(jié)點(diǎn)間地理拓?fù)浣Y(jié)構(gòu)、通行能力和交通數(shù)據(jù)相關(guān)性3個(gè)方面去探討和挖掘節(jié)點(diǎn)間空間關(guān)聯(lián)關(guān)系,再結(jié)合門控循環(huán)單元,提出一種多因子融合時(shí)空?qǐng)D卷積網(wǎng)絡(luò)(multi-factor spatial-temporal graph neural network,MF-STGNN)。首先構(gòu)建節(jié)點(diǎn)間的3個(gè)關(guān)聯(lián)因子矩陣:空間近鄰矩陣A、通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D。然后根據(jù)GCN適用于無(wú)向圖的特點(diǎn),將對(duì)稱的通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D分別輸入到GCN中提取2種不同的空間特征??紤]道路具有方向性,保留了空間鄰近矩陣A的非對(duì)稱性,將其輸入到GAT中進(jìn)行空間特征提取。再通過(guò)通道注意力模型將提取的3種空間特征進(jìn)行加權(quán),得到最終的空間聚合特征。最后通過(guò)門控循環(huán)單元(GRU)提取時(shí)間特征,輸出預(yù)測(cè)結(jié)果。通過(guò)對(duì)比實(shí)驗(yàn)和消融實(shí)驗(yàn)證明考慮了3個(gè)關(guān)聯(lián)因子的MF-STGNN模型能夠很好地提取空間特征,進(jìn)行路網(wǎng)交通參數(shù)預(yù)測(cè)。
針對(duì)城市路網(wǎng)交通預(yù)測(cè)問(wèn)題,利用有向圖G(V,E)來(lái)表征路網(wǎng)的拓?fù)浣Y(jié)構(gòu),V是路段的集合,E是2個(gè)路段之間連通的邊集合。假設(shè)當(dāng)前時(shí)刻為t,則t+1時(shí)刻的交通信息可以表示為:
Xt+1=f(G;(Xt-T,…,Xt-1,Xt))
(1)
式中:Xt∈RN×P為各個(gè)路段在t時(shí)刻的交通信息;N為路段數(shù)量;P為節(jié)點(diǎn)信息的數(shù)量;T為歷史時(shí)間序列的長(zhǎng)度。節(jié)點(diǎn)信息可以是交通速度、交通流量等交通信息。
基于圖神經(jīng)網(wǎng)絡(luò)的路網(wǎng)交通參數(shù)空間特征提取方法比較常用的有圖卷積網(wǎng)絡(luò)GCN和圖注意力網(wǎng)絡(luò)GAT,它們都是通過(guò)利用節(jié)點(diǎn)的連接關(guān)系來(lái)儲(chǔ)存圖的結(jié)構(gòu)。這種連接關(guān)系一般定義為簡(jiǎn)單的鄰接關(guān)系。GCN和GAT通過(guò)鄰接關(guān)系將鄰居節(jié)點(diǎn)的特征聚合到中心節(jié)點(diǎn)上來(lái)獲得新的特征表示。從另一種角度來(lái)看,是將鄰居節(jié)點(diǎn)的信息傳遞給了中心節(jié)點(diǎn)來(lái)形成新的特征。
2.1.1 GCN
基于頻域的GCN通過(guò)傅里葉變換實(shí)現(xiàn)卷積操作,思路和推導(dǎo)過(guò)程有較為堅(jiān)實(shí)的理論基礎(chǔ)。GCN的優(yōu)點(diǎn)在于結(jié)構(gòu)信息能夠在各層之間共享,但不適用于有向的圖結(jié)構(gòu)。雙層GCN模型的前向傳播公式可表示為:
(2)
2.1.2 GAT
GAT通過(guò)注意力機(jī)制,給每條邊加了一個(gè)可學(xué)習(xí)的注意力系數(shù)αij,模型能夠根據(jù)任務(wù)自適應(yīng)調(diào)整邊的權(quán)重,獲得更好的結(jié)果。GAT對(duì)αij的計(jì)算是逐點(diǎn)運(yùn)算,僅與節(jié)點(diǎn)特征相關(guān),與圖的結(jié)構(gòu)毫無(wú)關(guān)系,擺脫了拉普拉斯矩陣的束縛,使得有向圖問(wèn)題迎刃而解。
GAT[8]在更新節(jié)點(diǎn)i的特征向量時(shí),先計(jì)算i節(jié)點(diǎn)所有鄰居的注意力分?jǐn)?shù)αij,再用注意力分?jǐn)?shù)乘以對(duì)應(yīng)鄰居的特征Whj∈RP′×1后相加,得到節(jié)點(diǎn)i的聚合特征yi∈RP′×1,最后得到全部節(jié)點(diǎn)的聚合特征fGAT(X,A)∈RN×P′。
fGAT(X,A)=(y1,y2,…,yi)T
(3)
(4)
式中:W∈RP′×P為權(quán)重矩陣,P′為節(jié)點(diǎn)特征新的輸出維度;Ni表示節(jié)點(diǎn)i的相鄰節(jié)點(diǎn),在計(jì)算過(guò)程中使用鄰接矩陣A作為掩膜矩陣進(jìn)行節(jié)點(diǎn)鄰域信息融合。
2.2.1 空間近鄰矩陣
路網(wǎng)中鄰近路段交通流參數(shù)的運(yùn)行特性在某段時(shí)間內(nèi)存在著相似性,可以看作交通流運(yùn)行狀態(tài)在時(shí)間上具有傳遞性[13]。本文從路網(wǎng)的地理拓?fù)浣Y(jié)構(gòu)出發(fā),通過(guò)道路的連接關(guān)系構(gòu)建有向的空間近鄰矩陣,實(shí)現(xiàn)將相鄰道路的特征聚合到目標(biāo)道路上來(lái)獲得新的特征表示。 空間近鄰矩陣用AR∈N×N={aij}表示,當(dāng)2條道路連通時(shí),aij=1,否則aij=0。由于考慮了道路的方向性,因此空間近鄰矩陣是非對(duì)稱矩陣。
2.2.2 通行能力關(guān)聯(lián)矩陣
城市路網(wǎng)是由不同等級(jí)的道路組成的,道路等級(jí)不同,對(duì)路網(wǎng)交通運(yùn)行狀態(tài)產(chǎn)生的影響不同[14]。高等級(jí)的道路具有更多的車道數(shù)、更寬的車道和更高的行駛自由度,在路網(wǎng)中的地位更高。文獻(xiàn)[14]從路段通行能力、長(zhǎng)度、車道數(shù)3個(gè)方面量化了不同等級(jí)路段對(duì)交通流運(yùn)行的影響程度。如果能構(gòu)建和鄰接矩陣類似的,并且能體現(xiàn)節(jié)點(diǎn)道路等級(jí)差異的連接矩陣,就可以將不同等級(jí)道路對(duì)交通狀態(tài)帶來(lái)的影響融入到GNN節(jié)點(diǎn)的信息傳遞中,使獲取到的特征更加有效。
因此,考慮用道路的通行能力大小來(lái)代表道路的等級(jí)高低,通過(guò)計(jì)算兩兩節(jié)點(diǎn)的通行能力因子cij,得到通行能力關(guān)聯(lián)矩陣C來(lái)代替鄰接矩陣,表征道路的空間聯(lián)系。
(5)
式中:ci和cj為節(jié)點(diǎn)i和節(jié)點(diǎn)j的通行能力;cij為節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的通行能力因子;aij為空間近鄰矩陣元素,值為0或1。
(6)
2.2.3 交通數(shù)據(jù)關(guān)聯(lián)矩陣
現(xiàn)有的研究中常用交通流時(shí)序數(shù)據(jù)的相似性來(lái)對(duì)未來(lái)的交通流狀態(tài)進(jìn)行預(yù)測(cè)[15]。文獻(xiàn)[16]利用歐式距離來(lái)表征交通流數(shù)據(jù)之間存在的某種標(biāo)量距離的大小,發(fā)現(xiàn)了路網(wǎng)節(jié)點(diǎn)交通流序列數(shù)據(jù)中潛在的時(shí)空模式,以此來(lái)劃分不同的交通流模式。
基于以上研究,可以通過(guò)分析節(jié)點(diǎn)的交通參數(shù)數(shù)據(jù)關(guān)聯(lián)性來(lái)挖掘節(jié)點(diǎn)間潛在的關(guān)聯(lián)關(guān)系。將這種關(guān)系體現(xiàn)到GNN的信息傳遞機(jī)制上,則可以獲取到鄰接關(guān)系以外的一些潛在特征。如果一個(gè)節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)的交通參數(shù)數(shù)據(jù)高度相關(guān),則GNN在提取目標(biāo)節(jié)點(diǎn)特征時(shí),高度相關(guān)的節(jié)點(diǎn)的信息占的比重會(huì)更大。
度量相似性主要采用皮爾遜相關(guān)系數(shù)和歐式距離等方法,但2個(gè)變量數(shù)據(jù)之間的關(guān)聯(lián)可能是是非線性的,常見(jiàn)的皮爾遜相關(guān)系數(shù)無(wú)法準(zhǔn)確使用,而距離相關(guān)系數(shù)可以用來(lái)刻畫(huà)這種非線性的關(guān)聯(lián)性。距離相關(guān)系數(shù)的計(jì)算依賴于距離協(xié)方差和距離方差,將節(jié)點(diǎn)的交通速度看作隨機(jī)變量,兩兩節(jié)點(diǎn)間的速度的距離協(xié)方差除以它們的距離標(biāo)準(zhǔn)差的乘積,得到距離相關(guān)系數(shù)dij,即:
(7)
式中:Xi,Xj∈RK×1,是節(jié)點(diǎn)i和節(jié)點(diǎn)j的速度值,i、j=(1,2,…,N),N為節(jié)點(diǎn)數(shù)量,K為樣本量;Var(·)為距離標(biāo)準(zhǔn)差; Cov(·)為距離協(xié)方差。
最終的交通數(shù)據(jù)關(guān)聯(lián)矩陣為:
(8)
空間近鄰矩陣、通行能力關(guān)聯(lián)矩陣的構(gòu)建都與鄰接關(guān)系有關(guān),體現(xiàn)的是節(jié)點(diǎn)局部關(guān)聯(lián)關(guān)系,但后者在鄰接關(guān)系的基礎(chǔ)上還考慮了道路的通行能力,消除了一些偽鄰接關(guān)系的干擾,獲取到的特征更加有效。距離相關(guān)系數(shù)計(jì)算的是所有交通數(shù)據(jù)之間的相關(guān)性,可以提取到鄰接關(guān)系以外的潛在特征。
MF-STGNN主要由多因子空間特征聚合模塊(MF-GNN)和時(shí)間模塊(GRU)組成,MF-GNN先提取交通參數(shù)的空間特征,再由GRU提取時(shí)間特征,最終輸出預(yù)測(cè)結(jié)果,總體結(jié)構(gòu)如圖1所示。
圖1 MF-STGNN模塊
空間聚合模塊包含了3個(gè)部分,一是因子關(guān)聯(lián)矩陣的構(gòu)建,二是圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),三是通道注意力的特征融合,如圖2所示。
圖2 MF-GNN模塊
在因子關(guān)聯(lián)矩陣的構(gòu)建上,通過(guò)考慮節(jié)點(diǎn)間地理拓?fù)浣Y(jié)構(gòu)、通行能力和交通數(shù)據(jù)相關(guān)性分別構(gòu)建了3個(gè)因子關(guān)聯(lián)矩陣,分別是空間近鄰矩陣A、通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D。根據(jù)GCN適用于無(wú)向圖的特點(diǎn),將矩陣D和矩陣C構(gòu)建為對(duì)稱陣;考慮到道路的有向性,保留矩陣A的非對(duì)稱性。
(9)
(10)
(11)
最后將提取到的3種特征通過(guò)通道注意力模型自動(dòng)加權(quán)求和,得到新的特征X′。通道注意力來(lái)源于SENet模型[17],應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域,用來(lái)融合多通道的圖像信息。通道注意力先將每個(gè)二維的特征通道壓縮成一個(gè)實(shí)數(shù),這個(gè)實(shí)數(shù)在某種程度上具有全局的感受野,再經(jīng)過(guò)類似于RNN中的門控機(jī)制,每個(gè)特征通道生成權(quán)重。權(quán)重是經(jīng)過(guò)特征選擇后的每個(gè)特征通道的重要性,然后通過(guò)乘法逐通道加權(quán)到先前的特征上,完成在通道維度上對(duì)原始特征的重標(biāo)定。
將3種不同的特征看成擁有3個(gè)通道的二維圖像,即3個(gè)N×P′(N為節(jié)點(diǎn)個(gè)數(shù),P′為節(jié)點(diǎn)交通參數(shù)的輸出維度)矩陣,首先使用每個(gè)特征矩陣的全局平均池化來(lái)產(chǎn)生每個(gè)矩陣的特征綜合值z(mì)=(za,zd,zc)T∈R3。za,zd,zc分別代表3種不同的特征通道下的所有節(jié)點(diǎn)交通參數(shù)信息的壓縮,其特點(diǎn)是利用全局感受野融合了各自通道的交通信息,是在該通道上響應(yīng)的全局分布,因此對(duì)當(dāng)前通道特征來(lái)說(shuō)是具有表現(xiàn)力的。
(12)
同理,可以求得zd和zc。然后將求得的每個(gè)通道的綜合值經(jīng)過(guò)2個(gè)全連接層和激活函數(shù)得到每個(gè)通道的注意力系數(shù)s=(sa,sd,sc)T∈R3×1。
s=σ(W2δ(W1z))
(13)
式中:W1∈RH×3、W2∈R3×H分別對(duì)應(yīng)第一個(gè)和第二個(gè)全連接層的權(quán)重矩陣;δ(·)和σ(·)分別是 ReLU和Sigmoid函數(shù)。最后,將s作為3個(gè)通道的權(quán)重與每個(gè)通道特征值進(jìn)行加權(quán),得到最終的空間聚合特征Xt′∈RN×P′:
(14)
得到交通網(wǎng)絡(luò)參數(shù)的空間特征后,還需要獲取交通參數(shù)的時(shí)間特征才能進(jìn)行預(yù)測(cè)。LSTM和GRU是RNN的變體,具有門控機(jī)制,能很好地處理長(zhǎng)期記憶問(wèn)題,因此可有效地對(duì)隨時(shí)間推移而獲取的交通參數(shù)時(shí)序數(shù)據(jù)進(jìn)行分析處理。然而,由于LSTM結(jié)構(gòu)比GRU復(fù)雜,訓(xùn)練時(shí)間較長(zhǎng),對(duì)大規(guī)模的路網(wǎng)結(jié)構(gòu)適應(yīng)性較差,因此選擇結(jié)構(gòu)相對(duì)簡(jiǎn)單、訓(xùn)練較快的GRU來(lái)構(gòu)建時(shí)間模塊。
也有研究針對(duì)GRU的局限性提出了一些改進(jìn)模型。文獻(xiàn)[18]針對(duì)輸入時(shí)間序列過(guò)長(zhǎng)導(dǎo)致預(yù)測(cè)有效信息失真的問(wèn)題,提出了基于GRU和注意力機(jī)制的油溫預(yù)測(cè)模型。文獻(xiàn)[19]中為了提高GRU的預(yù)測(cè)性能,使用Salp Swarm算法自動(dòng)優(yōu)化GRU的超參數(shù)來(lái)實(shí)現(xiàn)交通狀況預(yù)測(cè)。這些改進(jìn)模型的精度雖有一定改進(jìn),但增加了模型的復(fù)雜度。文獻(xiàn)[9-10,12]中構(gòu)建的圖神經(jīng)網(wǎng)絡(luò)模型中,直接采用GRU模型進(jìn)行時(shí)間特征提取,取得了較好的效果。因此,在不增加模型復(fù)雜度又不失準(zhǔn)確度的情況下,直接用GRU構(gòu)建時(shí)間模塊進(jìn)行特征提取。
通過(guò)空間聚合模塊,可以得到所有節(jié)點(diǎn)在歷史時(shí)間窗口T的特征值,將其作為時(shí)間模塊的輸入,可以預(yù)測(cè)t+1時(shí)刻的交通信息Xt+1。
圖3 GRU的單個(gè)cell結(jié)構(gòu)
rt=σ([ht-1,xt]Wr+br)
(15)
zt=σ([ht-1,xt]Wz+bz)
(16)
(17)
(18)
式中:tanh(·)為激活函數(shù);Wr、Wz和Wh分別為重置門、更新門和候選集更新的權(quán)重參數(shù);br、bz、bh分別為重置門、更新門和候選集更新的偏置項(xiàng)。
采用的數(shù)據(jù)集為重慶市浮動(dòng)車數(shù)據(jù),選取了重慶市渝北區(qū)新溉大道附近路網(wǎng)進(jìn)行研究。路網(wǎng)中有32條路段,每5 min聚合一次速度數(shù)據(jù),一條路段每天包含288條記錄,共計(jì)7 d。將數(shù)據(jù)的80%劃分為訓(xùn)練集,20%為測(cè)試集,并對(duì)數(shù)據(jù)進(jìn)行[0,1]歸一化。
使用3個(gè)指標(biāo)來(lái)評(píng)估MF-STGNN模型的預(yù)測(cè)性能,分別是平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)。RMSE與MAE用于評(píng)價(jià)預(yù)測(cè)誤差,兩者的數(shù)值越小,說(shuō)明預(yù)測(cè)效果越好。MAPE用于評(píng)價(jià)模型的好壞,MAPE越小,說(shuō)明模型越好。
(19)
(20)
(21)
4.3.1 模型對(duì)比
將提出的MF-STGNN模型與HA、GCN、GAT、TGCN、A3T-GCN模型進(jìn)行對(duì)比,結(jié)果如表1所示。MF-STGNN模型在MAE 、RMSE、MAPE 3個(gè)評(píng)價(jià)指標(biāo)中均獲得了最好的性能,3個(gè)指標(biāo)分別提升了 2%~73%、2%~64%、6%~64%。GCN、GAT、TGCN和A3T-GCN模型單純考慮了節(jié)點(diǎn)的鄰接關(guān)系,預(yù)測(cè)效果不如MF-STGNN模型,這說(shuō)明考慮3種關(guān)聯(lián)因子提取空間特征可以提高模型預(yù)測(cè)性能。
表1 不同模型交通速度預(yù)測(cè)的性能
選取路網(wǎng)中的一條道路,將其某一天速度的預(yù)測(cè)效果進(jìn)行可視化對(duì)比分析,如圖4所示,可以看出,MF-STGCN和GAT模型的擬合程度較好。其中,MF-STGCN的擬合效果最好,預(yù)測(cè)值和真實(shí)值誤差最小。A3T-GCN擬合效果相對(duì)較好;GCN擬合效果最差,可能是因?yàn)镚CN不適用于有向圖,采用的非對(duì)稱鄰接矩陣影響了預(yù)測(cè)結(jié)果。另外,GAT和A3T-GCN都添加了注意力機(jī)制,說(shuō)明注意力機(jī)制有助于提高預(yù)測(cè)效果。
圖4 不同模型預(yù)測(cè)效果可視化曲線
另外,在構(gòu)建通行能力關(guān)聯(lián)矩陣時(shí),由于強(qiáng)調(diào)了路段近鄰空間的相似性,因此矩陣C是在鄰接關(guān)系的基礎(chǔ)上進(jìn)行構(gòu)建的,而交通數(shù)據(jù)關(guān)聯(lián)矩陣D是從所有節(jié)點(diǎn)間相關(guān)性角度進(jìn)行考慮的,不受鄰接矩陣的束縛。因此,為了分析鄰接關(guān)系對(duì)構(gòu)建矩陣D和矩陣C產(chǎn)生的影響,進(jìn)行了4種情況的對(duì)比實(shí)驗(yàn),如表2所示。經(jīng)過(guò)分析,矩陣D與鄰接空間呈弱相關(guān)性,而通行能力C呈強(qiáng)相關(guān)性。這說(shuō)明道路之間通行能力的相關(guān)性作用在相鄰道路之間離得越近,關(guān)聯(lián)性發(fā)揮的作用越大,這也符合交通流狀態(tài)在相鄰路段傳遞的規(guī)律。而對(duì)于道路交通參數(shù)數(shù)據(jù)來(lái)說(shuō),它的時(shí)間傳遞性較弱,因?yàn)樵跇?gòu)建矩陣時(shí)輸入的是整個(gè)交通數(shù)據(jù),因而也不需要過(guò)多考慮相鄰的路段。
表2 矩陣D和矩陣C是否考慮鄰接關(guān)系的預(yù)測(cè)性能
4.3.2 消融實(shí)驗(yàn)
通過(guò)消融實(shí)驗(yàn)進(jìn)一步證明3個(gè)關(guān)聯(lián)因子可以在交通預(yù)測(cè)任務(wù)中發(fā)揮作用。實(shí)驗(yàn)設(shè)置分為只添加空間近鄰矩陣A,只添加通行能力關(guān)聯(lián)矩陣C,只添加交通數(shù)據(jù)關(guān)聯(lián)矩陣D,添加空間近鄰矩陣A和交通數(shù)據(jù)關(guān)聯(lián)矩陣D,添加空間近鄰矩陣A和通行能力關(guān)聯(lián)矩陣C,添加通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D,添加空間近鄰矩陣A、通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D以及不添加任何矩陣8種情況,不添加任何矩陣的情況為直接使用網(wǎng)絡(luò)的鄰接關(guān)系結(jié)合GCN和GRU進(jìn)行預(yù)測(cè)的模型,結(jié)果如表3所示。從表中可以看出,“A+D+C”組合,即MF-STGNN模型的預(yù)測(cè)結(jié)果優(yōu)于其他排列組合。只使用1種因子矩陣的模型比使用2種因子矩陣的模型預(yù)測(cè)效果普遍差一些。
選取路網(wǎng)中一條道路的一段時(shí)間的消融實(shí)驗(yàn)速度預(yù)測(cè)結(jié)果進(jìn)行可視化對(duì)比分析,如圖5—圖7所示。
圖5 單因子關(guān)聯(lián)矩陣可視化曲線
圖5展現(xiàn)了只添加單因子矩陣、不添加任何矩陣的速度預(yù)測(cè)結(jié)果與真實(shí)速度,從圖中可以看出,只添加空間近鄰矩陣A的預(yù)測(cè)效果最好。圖6展現(xiàn)了添加2個(gè)因子矩陣、不添加任何矩陣的速度預(yù)測(cè)結(jié)果與真實(shí)速度的可視化結(jié)果,從圖中可以看出,A+C和A+D組合的預(yù)測(cè)效果不錯(cuò),A+C組合稍優(yōu)于A+D組合。將只添加空間近鄰矩陣A和A+C組合這2種預(yù)測(cè)結(jié)果較好的情況與A+D+C組合進(jìn)行對(duì)比分析,如圖7所示,可以看出,MF-STGNN模型的擬合效果最佳。
圖6 雙因子關(guān)聯(lián)矩陣可視化曲線
圖7 因子關(guān)聯(lián)矩陣可視化曲線
除此之外,為了探索構(gòu)建的通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D是否真的能夠提取到除鄰接關(guān)系以外的空間特征,將3個(gè)矩陣分別代入到GCN模型中進(jìn)行實(shí)驗(yàn),結(jié)果如表4所示。從結(jié)果可以看出,交通數(shù)據(jù)關(guān)聯(lián)矩陣的預(yù)測(cè)結(jié)果最好,表征鄰接關(guān)系的空間近鄰矩陣A效果最差。交通數(shù)據(jù)關(guān)聯(lián)矩陣D的預(yù)測(cè)結(jié)果明顯優(yōu)于其他2個(gè)矩陣,而矩陣D體現(xiàn)的是對(duì)每個(gè)節(jié)點(diǎn)全局特征的把握,這表示在預(yù)測(cè)過(guò)程中考慮網(wǎng)絡(luò)的全局信息至關(guān)重要。
表4 采用不同關(guān)聯(lián)矩陣的GCN模型實(shí)驗(yàn)結(jié)果
綜上所述可以得出:① 僅僅依靠鄰接關(guān)系來(lái)提取空間特征具有局限性,構(gòu)建的通行能力關(guān)聯(lián)矩陣C和交通數(shù)據(jù)關(guān)聯(lián)矩陣D能夠捕捉到更多的空間特征。② 使用多個(gè)關(guān)聯(lián)因子比使用單個(gè)關(guān)聯(lián)因子更能提取到有效的空間特征。③ 在預(yù)測(cè)過(guò)程中可以進(jìn)一步考慮網(wǎng)絡(luò)的全局信息。
提出的MF-STGNN模型,從更多的交通空間特征角度去探索圖神經(jīng)網(wǎng)絡(luò)與時(shí)間序列的交通預(yù)測(cè)問(wèn)題。通過(guò)節(jié)點(diǎn)間地理拓?fù)浣Y(jié)構(gòu)、通行能力和交通參數(shù)相關(guān)系數(shù)3個(gè)因子構(gòu)建因子關(guān)聯(lián)矩陣,再結(jié)合圖神經(jīng)網(wǎng)絡(luò)和GRU進(jìn)行時(shí)空特征提取,取得了一定的的預(yù)測(cè)效果。MF-STGNN模型不只考慮了道路的地理鄰接關(guān)系,還分析了節(jié)點(diǎn)的通行能力和節(jié)點(diǎn)間交通數(shù)據(jù)的相關(guān)性,與其他僅考慮鄰接關(guān)系的模型相比,可以有效地挖掘交通數(shù)據(jù)的空間信息。從實(shí)驗(yàn)結(jié)果來(lái)看,僅僅依靠鄰接關(guān)系來(lái)提取空間特征具有局限性,在以后的研究中,應(yīng)進(jìn)一步考慮網(wǎng)絡(luò)的全局信息來(lái)提升預(yù)測(cè)精度。另外,模型提取空間特征時(shí),由于考慮因子較多,增加了模型的復(fù)雜度,因此,在保證模型準(zhǔn)確度的情況下,提升訓(xùn)練效率、降低模型復(fù)雜度是以后需要研究的問(wèn)題。