楊 頂,鄧明君,徐麗萍
(華東交通大學(xué)交通運(yùn)輸與物流學(xué)院,南昌 330013)
精確實(shí)時(shí)的路段行程車速預(yù)測(cè)有利于出行者的路徑規(guī)劃和時(shí)間安排,減少高峰時(shí)段的擁堵[1],且可為制定交通管理策略提供技術(shù)支撐[2],但是路段行程車速的變化受路網(wǎng)結(jié)構(gòu)影響,具有高度非線性、不確定性等特點(diǎn)[3],使得路段行程車速的精確實(shí)時(shí)預(yù)測(cè)面臨較大困難。學(xué)者們關(guān)于提高路段行程車速的預(yù)測(cè)精度進(jìn)行了大量研究,并主要建立了統(tǒng)計(jì)模型、參數(shù)模型、非參數(shù)模型等3 種模型。統(tǒng)計(jì)模型根據(jù)數(shù)據(jù)的統(tǒng)計(jì)規(guī)律推斷變化趨勢(shì),代表模型為歷史平均(Historical Average,HA)模型[4],該模型計(jì)算簡(jiǎn)單快速,但不能很好地適應(yīng)時(shí)間特征,預(yù)測(cè)精度較低。參數(shù)模型通過(guò)時(shí)間序列數(shù)據(jù)確定參數(shù)然后基于回歸函數(shù)進(jìn)行預(yù)測(cè),常見(jiàn)的模型有自回歸積分移動(dòng)平均(Autoregressive Integral Moving Average,ARIMA)模型[5-6],該模型依賴于平穩(wěn)性假設(shè),不能有效反映路段行程車速的非線性和不確定性。非參數(shù)模型從歷史數(shù)據(jù)中發(fā)現(xiàn)路段行程車速的變化規(guī)律,常見(jiàn)的模型有支持向量回歸(Support Vector Regression,SVR)模型[7]、貝葉斯網(wǎng)絡(luò)模型[8]等,它們能夠更好地適應(yīng)路段行程車速的非線性和不確定性,但僅在時(shí)間維度尋找序列數(shù)據(jù)變化趨勢(shì),很難解決路網(wǎng)結(jié)構(gòu)對(duì)路段行程車速預(yù)測(cè)的影響。
近年來(lái),深度學(xué)習(xí)模型已被證實(shí)能夠有效挖掘路段行程車速數(shù)據(jù)的高維特征[9],從而降低預(yù)測(cè)誤差,如循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)等能夠有效地利用自循環(huán)機(jī)制來(lái)挖掘路段行程車速的長(zhǎng)期變化特征[10-11]。然而,路段行程車速的變化不單受時(shí)間因素的影響,路網(wǎng)空間結(jié)構(gòu)及上下游交通狀態(tài)也是需要考慮的因素。針對(duì)路網(wǎng)的空間特性,文獻(xiàn)[12]使用深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN)提取路網(wǎng)結(jié)構(gòu)特征,使用長(zhǎng)短期記憶網(wǎng)絡(luò)獲得時(shí)間動(dòng)態(tài)變化規(guī)律,并通過(guò)實(shí)驗(yàn)證明了模型的有效性,但DCNN 在數(shù)據(jù)組織上適用于圖像、規(guī)則網(wǎng)格等歐幾里得空間,路網(wǎng)屬于典型非歐幾里得空間,需要對(duì)路網(wǎng)結(jié)構(gòu)進(jìn)行空間轉(zhuǎn)換,增加訓(xùn)練步驟,從而導(dǎo)致預(yù)測(cè)實(shí)時(shí)性較差。文獻(xiàn)[13]利用圖卷積層獲取路網(wǎng)空間特征,并結(jié)合門(mén)控卷積層對(duì)交通預(yù)測(cè)問(wèn)題進(jìn)行建模,在時(shí)間維度采用全卷積的方式減少模型參數(shù),從而提高訓(xùn)練效率,但該模型結(jié)構(gòu)無(wú)法充分獲取交通數(shù)據(jù)長(zhǎng)期變化特征,預(yù)測(cè)精度有待提高。文獻(xiàn)[14]結(jié)合圖卷積網(wǎng)絡(luò)設(shè)計(jì)了時(shí)間序列T-GCN 模型,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證具有優(yōu)于SVR 和門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)的預(yù)測(cè)結(jié)果,然而該模型在預(yù)測(cè)過(guò)程中未能有效表達(dá)預(yù)測(cè)對(duì)象的拓?fù)浣Y(jié)構(gòu),預(yù)測(cè)結(jié)果的可解釋性較差。文獻(xiàn)[15]利用圖卷積網(wǎng)絡(luò)和自由流動(dòng)可達(dá)矩陣(FAST-GCN)來(lái)挖掘路網(wǎng)的時(shí)空依賴性,以可達(dá)矩陣近似表達(dá)路網(wǎng)鄰接矩陣,相較LSTM 模型能夠適應(yīng)大規(guī)模路網(wǎng)的預(yù)測(cè),但引入可達(dá)矩陣的方式增加了參數(shù)量,使模型變得復(fù)雜,從而降低了訓(xùn)練效率。以上研究均對(duì)路網(wǎng)空間結(jié)構(gòu)提出學(xué)習(xí)方法,但在數(shù)據(jù)組織和預(yù)測(cè)精度上仍存在一定的改進(jìn)空間。
本文在上述研究的基礎(chǔ)上,結(jié)合圖卷積網(wǎng)絡(luò)(Graph Convolutional Network,GCN)和門(mén)控循環(huán)單元建立深度學(xué)習(xí)模型,挖掘路段行程車速預(yù)測(cè)問(wèn)題中的時(shí)空特性,通過(guò)圖卷積網(wǎng)絡(luò)適應(yīng)路網(wǎng)任意拓?fù)浣Y(jié)構(gòu),利用門(mén)控循環(huán)單元充分挖掘路段行程車速長(zhǎng)期變化特征,同時(shí)基于Python 程序從在線地圖平臺(tái)上實(shí)時(shí)獲取并滾動(dòng)更新路段行程車速數(shù)據(jù)。
路段行程車速反映路段的運(yùn)行情況,與一般時(shí)間序列預(yù)測(cè)問(wèn)題不同,路段行程車速具有復(fù)雜的時(shí)空特性。在時(shí)間維度上,路段行程車速的變化是一個(gè)漸變過(guò)程,前一時(shí)刻的車速影響著下一時(shí)刻車速的變化。在空間維度上,多個(gè)相連接的路段組成路網(wǎng),形成上下游路段、交叉路段等多種連接關(guān)系,上游路段行程車速通過(guò)傳遞效應(yīng)影響下游路段行程車速,下游路段行程車速通過(guò)反饋效應(yīng)作用于上游路段行程車速,交叉路段通過(guò)空間結(jié)構(gòu)制約交通流向,從而影響路段行程車速的變化[16-17]。因此,路段行程車速預(yù)測(cè)的難點(diǎn)在于如何挖掘路段行程車速數(shù)據(jù)的時(shí)空特性。為直觀解決這一問(wèn)題,給出如下假設(shè)與定義:
假設(shè)1路網(wǎng)是點(diǎn)和線的集合,路網(wǎng)中每一條路段為一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)的連接關(guān)系由集合中的邊線表示。路網(wǎng)時(shí)空演變過(guò)程如圖1 表示,其中節(jié)點(diǎn)的不同顏色代表路段不同的行程車速區(qū)間,隨著時(shí)間的變化每個(gè)路段的行程車速在發(fā)生動(dòng)態(tài)變化,同時(shí)路段行程車速的變化與相連接路段行程車速的變化相互影響。
圖1 路網(wǎng)時(shí)空演變過(guò)程Fig.1 The spatio-temporal evolution of the road network
定義1一個(gè)具有拓?fù)浣Y(jié)構(gòu)的路網(wǎng)表示為G[18],當(dāng)時(shí)間序列長(zhǎng)度為S時(shí),動(dòng)態(tài)變化的路網(wǎng)是一個(gè)形如{G1,G2,???,GS}的連續(xù)集合,且G=(V,E,A),其中:V表示路網(wǎng)中所有路段的集合,當(dāng)路段數(shù)量為N時(shí)V={v1,v2,???,vN};E表示連接各路段的邊線集合;A是一個(gè)N行N列的鄰接矩陣,組成元素為0 或1,表示兩路段之間不連接或者相連接。
定義2路網(wǎng)的特征矩陣表示為X,構(gòu)成元素為路段行程車速,X∈RN×S,Xt表示在時(shí)刻t的路段行程車速集合[14]。
定義3路段行程車速為車輛通過(guò)某一路段的速度值,是路段長(zhǎng)度與行程時(shí)間的比值[18],其中行程時(shí)間包含通過(guò)起始交叉口的時(shí)間。時(shí)刻t的路段行程車速為該路段在t-1 至t時(shí)刻所有車輛的路段行程車速平均值。
依據(jù)定義1,圖1 中部分路段的鄰接矩陣如表1所示。
表1 鄰接矩陣Table 1 Adjacency matrix
因此,路段行程車速預(yù)測(cè)問(wèn)題可表達(dá)為:依據(jù)路網(wǎng)空間結(jié)構(gòu)G和時(shí)間序列數(shù)據(jù)X,通過(guò)預(yù)測(cè)模型得到未來(lái)某一個(gè)時(shí)刻的路段行程車速,其中路網(wǎng)空間結(jié)構(gòu)和時(shí)間序列數(shù)據(jù)根據(jù)路段編碼相互對(duì)應(yīng)。
在空間維度上,路網(wǎng)是一個(gè)典型的非歐幾里得空間,路網(wǎng)中每條路段的相連接路段個(gè)數(shù)以及路段信息都具有不確定性,路網(wǎng)非結(jié)構(gòu)化的特點(diǎn)使得傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)無(wú)法對(duì)其進(jìn)行局部卷積來(lái)提取特征,圖卷積網(wǎng)絡(luò)能夠適應(yīng)任意拓?fù)浣Y(jié)構(gòu)的節(jié)點(diǎn)和圖,很好地解決了非歐幾里得空間的卷積處理問(wèn)題,因此選取圖卷積網(wǎng)絡(luò)來(lái)學(xué)習(xí)路網(wǎng)結(jié)構(gòu)特征。在時(shí)間維度上,路段行程車速數(shù)據(jù)是典型的時(shí)間序列數(shù)據(jù),循環(huán)神經(jīng)網(wǎng)絡(luò)通過(guò)自身循環(huán)機(jī)制能夠很好地對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),但傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失、梯度爆炸等問(wèn)題,長(zhǎng)短期記憶網(wǎng)絡(luò)以及門(mén)控循環(huán)單元通過(guò)門(mén)控機(jī)制選擇性地保留歷史信息,能夠有效學(xué)習(xí)路段行程車速數(shù)據(jù)的長(zhǎng)期變化特征,改善了梯度消失和梯度爆炸的問(wèn)題[19-20]。門(mén)控循環(huán)單元和長(zhǎng)短期記憶網(wǎng)絡(luò)具有相似的控制機(jī)理,但門(mén)控循環(huán)單元具有更簡(jiǎn)單的邏輯和更快的學(xué)習(xí)速度,因此采用門(mén)控循環(huán)單元來(lái)學(xué)習(xí)路段行程車速數(shù)據(jù)在時(shí)間維度上的變化規(guī)律。
為同時(shí)提取路網(wǎng)時(shí)空特征,結(jié)合圖卷積網(wǎng)絡(luò)和門(mén)控循環(huán)單元建立組合深度學(xué)習(xí)模型,通過(guò)學(xué)習(xí)和訓(xùn)練輸入的路網(wǎng)G和特征矩陣X進(jìn)行預(yù)測(cè)。模型由兩部分組成:第一部分為時(shí)空信息融合,使用圖卷積網(wǎng)絡(luò)將路網(wǎng)拓?fù)浣Y(jié)構(gòu)融入路段行程車速序列數(shù)據(jù);第二部分為數(shù)據(jù)特征學(xué)習(xí),通過(guò)門(mén)控循環(huán)單元進(jìn)一步挖掘路段行程車速的動(dòng)態(tài)變化規(guī)律。如圖2 所示,輸入路網(wǎng)拓?fù)浣Y(jié)構(gòu)和路段歷史行程車速數(shù)據(jù),經(jīng)圖卷積網(wǎng)絡(luò)學(xué)習(xí),得到融合路網(wǎng)空間特性的數(shù)據(jù)X′t,然后結(jié)合上一個(gè)時(shí)刻隱藏狀態(tài)ht-1,輸入門(mén)控循環(huán)單元,經(jīng)由激活函數(shù)和控制門(mén)處理后得到預(yù)測(cè)值Yt和隱藏值ht。
圖2 GCN-GRU 模型結(jié)構(gòu)Fig.2 Structure of GCN-GRU model
1.2.1 圖卷積網(wǎng)絡(luò)
圖卷積網(wǎng)絡(luò)通過(guò)構(gòu)造傅里葉域過(guò)濾器捕獲路網(wǎng)中的路段節(jié)點(diǎn)及其一階鄰域的空間特征,如圖3 所示,首先依次對(duì)每一個(gè)路段進(jìn)行空間特征提取,通過(guò)激活函數(shù)Relu(?)和σ(?)分別控制每個(gè)卷積層的輸出,然后堆疊多個(gè)卷積層,最終輸出融合路網(wǎng)空間結(jié)構(gòu)的特征矩陣。
圖3 雙層圖卷積網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.3 Structure of double layer map convolutional neural network model
雙層圖卷積網(wǎng)絡(luò)模型的計(jì)算過(guò)程如式(1)~式(6)所示:
其中:X是特征矩陣;A是鄰接矩陣是自鄰接矩陣;是正則化的拉普拉斯矩陣,通過(guò)式(2)和式(3)對(duì)A進(jìn)行對(duì)稱歸一化處理得到;IN是N階單位矩陣是度矩陣,矩陣中數(shù)值表示與對(duì)應(yīng)路段相連接路段的個(gè)數(shù);W0和W1代表圖卷積網(wǎng)絡(luò)第一層和第二層的權(quán)重矩陣;σ(?)是非線性激活函數(shù);Relu(?)是線性整流函數(shù)。
1.2.2 門(mén)控循環(huán)單元
門(mén)控循環(huán)單元在長(zhǎng)短期記憶網(wǎng)絡(luò)的基礎(chǔ)上[10],將遺忘門(mén)和外部輸入門(mén)整合為更新門(mén),提高了模型計(jì)算速度。門(mén)控循環(huán)單元通過(guò)更新門(mén)和復(fù)位門(mén)控制數(shù)據(jù)的輸入與輸出,其中,更新門(mén)控制當(dāng)前輸入信息的保留情況,復(fù)位門(mén)控制前一個(gè)時(shí)刻的輸出對(duì)當(dāng)前輸入的影響,門(mén)控循環(huán)單元原理如圖2 中右側(cè)矩形框所示,計(jì)算公式如式(7)~式(11)所示:
1.2.3 損失函數(shù)
本文在預(yù)測(cè)模型的訓(xùn)練過(guò)程中,選取自適應(yīng)矩估計(jì)(Adam)優(yōu)化算法對(duì)模型參數(shù)進(jìn)行優(yōu)化。自適應(yīng)矩估計(jì)優(yōu)化算法是一種可以替代傳統(tǒng)隨機(jī)梯度下降過(guò)程的一階優(yōu)化算法,基于訓(xùn)練數(shù)據(jù)迭代更新神經(jīng)網(wǎng)絡(luò)的權(quán)重。訓(xùn)練過(guò)程中通過(guò)設(shè)置的損失函數(shù)來(lái)控制模型的學(xué)習(xí)方向,需要在盡可能最小化路段行程車速預(yù)測(cè)值和真實(shí)值之間誤差的同時(shí)避免過(guò)度擬合。因此,設(shè)置損失函數(shù)如下:其中:n是樣本總量;Xt是路段行程車速的真實(shí)值;Yt是路段行程車速的預(yù)測(cè)值;Lr是正則化項(xiàng),防止過(guò)度擬合;λ是損失函數(shù)超參數(shù),通過(guò)精細(xì)化調(diào)參確定。
1.2.4 訓(xùn)練步驟
通過(guò)輸入路網(wǎng)空間結(jié)構(gòu)數(shù)據(jù)G和路段行程車速歷史數(shù)據(jù)X對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。圖卷積網(wǎng)絡(luò)能夠適應(yīng)任意拓?fù)浣Y(jié)構(gòu)的特點(diǎn)使模型可直接對(duì)輸入的路網(wǎng)數(shù)據(jù)G進(jìn)行特征提取,經(jīng)雙層圖卷積網(wǎng)絡(luò)的學(xué)習(xí),路網(wǎng)空間結(jié)構(gòu)對(duì)路段行程車速的影響能夠有效融合至?xí)r間序列特征矩陣X′。通過(guò)門(mén)控循環(huán)單元的門(mén)控與循環(huán)機(jī)制充分挖掘融合時(shí)空特性的路段行程車速序列數(shù)據(jù)的長(zhǎng)期變化特征。基于圖卷積網(wǎng)絡(luò)和門(mén)控循環(huán)單元的深度學(xué)習(xí)模型訓(xùn)練步驟如下:
步驟1數(shù)據(jù)預(yù)處理,得到路網(wǎng)空間數(shù)據(jù)G和時(shí)間序列數(shù)據(jù)X。
步驟2對(duì)路網(wǎng)鄰接矩陣A進(jìn)行對(duì)稱歸一化處理得到拉普拉斯矩陣
步驟3通過(guò)拉普拉斯矩陣和權(quán)重矩陣W0依次對(duì)路網(wǎng)中路段及相連接路段進(jìn)行第一層卷積計(jì)算,經(jīng)Relu(?)函數(shù)激活并輸出。
步驟4對(duì)步驟3 輸出的特征矩陣進(jìn)行第二層卷積計(jì)算,通過(guò)σ(?)函數(shù)激活并輸出特征矩陣X′。
步驟5將t時(shí)刻特征信息和t-1 時(shí)刻隱藏信息ht-1輸入至門(mén)控循環(huán)單元,通過(guò)復(fù)位門(mén)rt和更新門(mén)zt進(jìn)行處理,確定ht-1中需要丟棄和更新的信息。
步驟6將t時(shí)刻特征信息和復(fù)位門(mén)rt進(jìn)行處理,運(yùn)用tanh(?)激活函數(shù)產(chǎn)生候選的狀態(tài)信息
步驟7通過(guò)丟棄ht-1中部分信息和保留信息,得到t時(shí)刻隱藏信息ht和預(yù)測(cè)信息Yt。
步驟8令t=t+1,重復(fù)步驟5~步驟7 直至預(yù)測(cè)出全部時(shí)刻信息。
步驟9計(jì)算損失函數(shù)值,并通過(guò)自適應(yīng)矩估計(jì)優(yōu)化算法對(duì)模型權(quán)重進(jìn)行調(diào)整。
步驟10在損失函數(shù)值符合精度要求或達(dá)到最大訓(xùn)練次數(shù)時(shí)完成模型訓(xùn)練,否則返回步驟3。
1.3.1 等維遞補(bǔ)
等維遞補(bǔ)方法的基本原理是將最新數(shù)據(jù)值補(bǔ)充到已知序列后,同時(shí)去掉原序列第一個(gè)已知數(shù)據(jù),保持?jǐn)?shù)據(jù)序列與原數(shù)據(jù)序列等維,利用新的序列預(yù)測(cè)下一個(gè)值,依次遞補(bǔ)直至完成預(yù)測(cè)[21-22]。
從在線地圖平臺(tái)獲取實(shí)時(shí)更新的路段行程車速數(shù)據(jù),采用等維遞補(bǔ)方法對(duì)序列數(shù)據(jù)進(jìn)行更新,如圖4 所示,設(shè)t時(shí)刻為預(yù)測(cè)開(kāi)始時(shí)刻,歷史數(shù)據(jù)序列長(zhǎng)度為S,在t+1 時(shí)刻使用獲取的最新數(shù)據(jù)代替t-S時(shí)刻歷史數(shù)據(jù),保證數(shù)據(jù)的實(shí)時(shí)性和數(shù)據(jù)維度一致。深度學(xué)習(xí)模型對(duì)數(shù)據(jù)量大小比較敏感,輸入相同維度的數(shù)據(jù)能夠避免模型超參數(shù)多次重復(fù)標(biāo)定。
圖4 數(shù)據(jù)等維遞補(bǔ)方法Fig.4 Data equal dimension recursive compensation method
1.3.2 路段行程車速預(yù)測(cè)
使用等維遞補(bǔ)方法不斷補(bǔ)充最新的路段行程車速信息,通過(guò)新的時(shí)間序列數(shù)據(jù)進(jìn)行路段行程車速預(yù)測(cè),預(yù)測(cè)流程如圖5 所示,其中虛線在滿足條件時(shí)觸發(fā),在路網(wǎng)結(jié)構(gòu)不變時(shí)可以不間斷對(duì)路段行程車速進(jìn)行預(yù)測(cè)。首先,通過(guò)編寫(xiě)的程序按固定采集時(shí)間間隔從在線地圖平臺(tái)獲取路段行程車速數(shù)據(jù)并存儲(chǔ)于本地?cái)?shù)據(jù)庫(kù)中。然后,在收到預(yù)測(cè)需求后從數(shù)據(jù)庫(kù)調(diào)取一定長(zhǎng)度歷史時(shí)間序列數(shù)據(jù)和路網(wǎng)結(jié)構(gòu)數(shù)據(jù),進(jìn)行精細(xì)化調(diào)參后確定模型超參數(shù)并完成訓(xùn)練。最終,通過(guò)訓(xùn)練好的深度學(xué)習(xí)模型進(jìn)行路段行程車速預(yù)測(cè)。在得到預(yù)測(cè)結(jié)果后,等待再次從在線地圖平臺(tái)處獲取實(shí)時(shí)數(shù)據(jù),以獲取到的最新路段行程車速數(shù)據(jù)等維遞補(bǔ)歷史序列數(shù)據(jù),從而進(jìn)入下一次預(yù)測(cè)。當(dāng)路網(wǎng)結(jié)構(gòu)發(fā)生變化或者收到終止預(yù)測(cè)的指令后結(jié)束預(yù)測(cè)。
圖5 路段行程車速預(yù)測(cè)流程Fig.5 Prediction procedure of road travel speed
以Tensorflow 中Keras 高層神經(jīng)網(wǎng)絡(luò)API 為框架,在Python3.7 環(huán)境中完成模型搭建和訓(xùn)練。選取深圳市福田區(qū)部分區(qū)域路段組成實(shí)驗(yàn)路網(wǎng),研究區(qū)域路網(wǎng)地圖如圖6(a)所示,路網(wǎng)拓?fù)浣Y(jié)構(gòu)如圖6(b)所示,路段編號(hào)采取高德地圖平臺(tái)編碼。該區(qū)域中新洲路、深南大道和益田路為城市主干路,民田路、福中路和福華一路為城市次干路,福中三路等為城市支路,共計(jì)66 個(gè)路段,道路等級(jí)覆蓋較完整,具有較好的代表性。
圖6 研究區(qū)域示意圖Fig.6 Schematic diagram of study area
通過(guò)Python 程序從高德地圖平臺(tái)中以15 min 的時(shí)間間隔采集2020 年7 月1 日至2020 年7 月7 日該區(qū)域路段行程車速數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集、2020 年7 月8 日的數(shù)據(jù)作為測(cè)試集。實(shí)驗(yàn)數(shù)據(jù)由兩部分組成:第一部分為表示路網(wǎng)空間結(jié)構(gòu)的鄰接矩陣,由元素0 和1 構(gòu)成,路段之間存在連接關(guān)系對(duì)應(yīng)1,不存在對(duì)應(yīng)0,對(duì)應(yīng)數(shù)據(jù)集為一個(gè)66×66 的矩陣;第二部分為表示路段行程車速變化的特征矩陣,通過(guò)高德地圖平臺(tái)編碼與區(qū)域內(nèi)的路段建立對(duì)應(yīng)關(guān)系,此部分?jǐn)?shù)據(jù)集為66×672的矩陣。
為評(píng)價(jià)模型的預(yù)測(cè)效果,選取均方根誤差(Root Mean Square Error,RMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)、精度(Acc)和方差解釋分?jǐn)?shù)(var)4 個(gè)評(píng)價(jià)指標(biāo),計(jì)算公式分別如式(13)~式(16)所示。均方根誤差和平均絕對(duì)誤差表示預(yù)測(cè)結(jié)果的誤差情況,誤差越小表示模型的預(yù)測(cè)效果越好;精度用于檢測(cè)預(yù)測(cè)結(jié)果的精確度情況,精度越大表示模型的預(yù)測(cè)效果越好;方差解釋分?jǐn)?shù)表示預(yù)測(cè)結(jié)果和真實(shí)值之間的相似程度,其值越大表示模型的預(yù)測(cè)效果越好。
使用2020年7月1日至2020年7月7日的數(shù)據(jù)對(duì)模型超參數(shù)進(jìn)行調(diào)試和標(biāo)定,需要設(shè)置的超參數(shù)有隱藏單元層數(shù)、學(xué)習(xí)速度、批量大小、訓(xùn)練率、訓(xùn)練量以及損失函數(shù)超參數(shù)λ。深度學(xué)習(xí)模型的超參數(shù)設(shè)置與數(shù)據(jù)量密切相關(guān),參考同類深度學(xué)習(xí)模型的訓(xùn)練過(guò)程總結(jié)出與該實(shí)驗(yàn)數(shù)據(jù)量相近的模型隱藏單元層數(shù)為4~64。
為得到適合的隱藏單元層數(shù),通過(guò)調(diào)整隱藏單元層數(shù)(4、8、16、32 和64)來(lái)分析其對(duì)預(yù)測(cè)結(jié)果的影響,如圖7 所示。RMSE 和MAE 的值隨著隱藏單元層數(shù)的增大迅速減小后開(kāi)始增大,如圖7(a)所示。Acc 和var 的值隨著隱藏單元層數(shù)的增加迅速增大后開(kāi)始減小,如圖7(b)所示。從各檢驗(yàn)指標(biāo)的變化情況可以看出,當(dāng)隱藏單元層數(shù)為32 時(shí),模型達(dá)到最好的預(yù)測(cè)效果。
圖7 不同隱藏單元層數(shù)對(duì)預(yù)測(cè)結(jié)果的影響Fig.7 The influence of different hidden unit layers on the prediction results
學(xué)習(xí)速度決定了訓(xùn)練過(guò)程中的網(wǎng)絡(luò)更新權(quán)重,學(xué)習(xí)速度過(guò)大會(huì)導(dǎo)致模型不收斂,過(guò)小會(huì)增加模型訓(xùn)練時(shí)間;批量大小是模型每次學(xué)習(xí)輸入的樣本數(shù)量;損失函數(shù)超參數(shù)λ控制模型優(yōu)化過(guò)程的靈敏度。實(shí)驗(yàn)使用的數(shù)據(jù)量級(jí)為104,通過(guò)數(shù)據(jù)量級(jí)設(shè)置超參數(shù)取值區(qū)間,然后進(jìn)行多次調(diào)參取優(yōu),最終確定模型超參數(shù)設(shè)置:隱藏單元層數(shù)為32,學(xué)習(xí)速度為0.005,批量大小為32,損失函數(shù)超參數(shù)λ為0.000 6,訓(xùn)練率為0.87,訓(xùn)練量為10 000。
使用2.2 節(jié)中超參數(shù)設(shè)置進(jìn)行路段行程車速預(yù)測(cè)并檢驗(yàn)預(yù)測(cè)效果,選取ARIMA、SVR 和GRU 作為對(duì)比模型。設(shè)置預(yù)測(cè)時(shí)間為15 min、30 min、45 min和60 min,對(duì)應(yīng)預(yù)測(cè)步長(zhǎng)為1 步、2 步、3 步和4 步,分析單個(gè)路段和整體路網(wǎng)的預(yù)測(cè)結(jié)果,同時(shí)為檢驗(yàn)本文模型多步預(yù)測(cè)效果,分析4 種預(yù)測(cè)步長(zhǎng)下模型預(yù)測(cè)效果的變化情況。
單個(gè)路段的預(yù)測(cè)結(jié)果如圖8 所示。對(duì)路段570(福中一路)和路段107(深南大道)的預(yù)測(cè)效果(預(yù)測(cè)時(shí)間為15 min)進(jìn)行分析,如圖8(a)和圖8(b)所示,本文模型可以很好地預(yù)測(cè)路段行程車速變化規(guī)律。在速度發(fā)生突變時(shí),預(yù)測(cè)誤差可能會(huì)出現(xiàn)較大幅度的波動(dòng),如圖8(c)所示,預(yù)測(cè)誤差最大達(dá)到7.5 km/h;在速度變化趨勢(shì)比較平穩(wěn)時(shí),預(yù)測(cè)誤差分布比較平穩(wěn),如圖8(d)所示,預(yù)測(cè)誤差分布在3 km/h 以內(nèi)。
圖8 路段預(yù)測(cè)結(jié)果與誤差分布Fig.8 Road prediction result and error distribution
對(duì)路段570 在不同預(yù)測(cè)步長(zhǎng)下的誤差分布進(jìn)行對(duì)比分析,如圖9 所示,可以看出隨著預(yù)測(cè)步長(zhǎng)的增加,誤差也會(huì)有所增大,但在預(yù)測(cè)步長(zhǎng)最長(zhǎng)時(shí)誤差分布在10 km/h 以內(nèi),相比文獻(xiàn)[19]采用的LSTM-RNN 模型有明顯的性能提升。
圖9 不同預(yù)測(cè)時(shí)間下路段570 的誤差分布Fig.9 Error distribution for road 570 under different prediction times
ARIMA、SVR、GRU 和GCN-GRU 模型在不同預(yù)測(cè)時(shí)間下路段行程車速預(yù)測(cè)指標(biāo)結(jié)果如表2 所示,RMSE 和var 變化情況如圖10 所示。通過(guò)表2 和圖10 的預(yù)測(cè)結(jié)果可以看出,在4 種預(yù)測(cè)步長(zhǎng)下GCN-GRU 模型與不同對(duì)比模型的主要評(píng)價(jià)指標(biāo)有以下變化:1)相比ARIMA 模型,RMSE 分別減少了40.5%、36.7%、34.7%和32.9%,var 分別提高了99%、88.4%、80.5% 和80.6%,Acc 最高提升6.9%;2)相比SVR模型,RMSE分別減少了5.4%、6.6%、9.1% 和10.9%,var 分別提高了1.8%、2.7%、4.2%和5.7%,Acc最高提升1.3%;3)相比GRU 模型,RMSE 分別減少了2.1%、1.6%、3.0% 和2.2%,var 分別提高了0.6%、0.6%、1.2%和1.1%,Acc 最高提升0.4%。通過(guò)主要指標(biāo)的對(duì)比分析可知,使用GCN-GRU 模型得到的預(yù)測(cè)效果優(yōu)于對(duì)比模型。
圖10 不同預(yù)測(cè)時(shí)間下4 種模型的RMSE 和var 變化情況Fig.10 Changes of RMSE and var for four models under different prediction times
表2 不同預(yù)測(cè)時(shí)間下4 種模型的路段行程車速預(yù)測(cè)指標(biāo)結(jié)果Table 2 Results of prediction indexes of road travel speed for four models under different prediction times
由上述實(shí)驗(yàn)結(jié)果可以看出:ARIMA 模型的預(yù)測(cè)效果最差,原因是ARIMA 模型基于平穩(wěn)性假設(shè),不能對(duì)路段行程車速變化的非線性和不確定性進(jìn)行準(zhǔn)確預(yù)測(cè);SVR 模型預(yù)測(cè)效果介于ARIMA 模型和GRU 模型之間,是因?yàn)槠淠芨玫赝诰蚵范涡谐誊囁僭跁r(shí)間序列上的變化趨勢(shì),但忽略了路段行程車速的長(zhǎng)期變化特征;GRU 模型在對(duì)比模型中具有最好的預(yù)測(cè)效果,但未考慮到路網(wǎng)結(jié)構(gòu)對(duì)路段行程車速的影響,因此預(yù)測(cè)效果還是稍劣于GCN-GRU模型。
不同預(yù)測(cè)時(shí)間下GCN-GRU 模型的路段行程車速預(yù)測(cè)指標(biāo)變化情況如圖11 所示,隨著預(yù)測(cè)步長(zhǎng)的增加整體預(yù)測(cè)誤差和精度未出現(xiàn)很大變化,模型預(yù)測(cè)Acc 一直保持在90%以上,并且在預(yù)測(cè)步長(zhǎng)最長(zhǎng)時(shí)誤差分布未出現(xiàn)大幅度增加,說(shuō)明GCN-GRU 模型不但適用于路段行程車速短時(shí)預(yù)測(cè),也適用于中長(zhǎng)時(shí)預(yù)測(cè),預(yù)測(cè)效果穩(wěn)定。
圖11 不同預(yù)測(cè)時(shí)間下GCN-GRU 模型的路段行程車速預(yù)測(cè)指標(biāo)變化情況Fig.11 Changes of prediction indexes of GCN-GRU model of road travel speed under different prediction times
基于以上實(shí)驗(yàn)結(jié)果,總結(jié)并歸納GCN-GRU 模型具有如下優(yōu)勢(shì):1)采用深度學(xué)習(xí)算法能夠有效解決路段行程車速變化的非線性和不確定性問(wèn)題;2)結(jié)合圖卷積網(wǎng)絡(luò)和門(mén)控循環(huán)單元能夠提取影響路段行程車速變化的路網(wǎng)空間特征和時(shí)間序列特征;3)在長(zhǎng)時(shí)預(yù)測(cè)過(guò)程中具有良好的穩(wěn)定性;4)通過(guò)數(shù)據(jù)實(shí)時(shí)獲取與更新程序,保證了預(yù)測(cè)的實(shí)時(shí)性。
本文基于圖卷積網(wǎng)絡(luò)和門(mén)控循環(huán)單元構(gòu)建深度學(xué)習(xí)模型,通過(guò)在線地圖平臺(tái)采集路段實(shí)時(shí)行程車速和路網(wǎng)結(jié)構(gòu)數(shù)據(jù),利用等維遞補(bǔ)方法更新歷史序列數(shù)據(jù),訓(xùn)練并使用GCN-GRU 模型進(jìn)行路段行程車速多步預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,GCN-GRU 模型有效解決了路段行程車速預(yù)測(cè)中的時(shí)空關(guān)系問(wèn)題,提高了預(yù)測(cè)準(zhǔn)確性,并且能夠滿足路段行程車速預(yù)測(cè)的實(shí)時(shí)性要求。后續(xù)將研究不同的路段連接關(guān)系及車速周期性變化對(duì)路段行程車速的影響,提高深度學(xué)習(xí)模型的可解釋性和路段行程車速的預(yù)測(cè)準(zhǔn)確性。