榮 斌,武志昊,劉曉輝,趙苡積,林友芳,景一真
(1.北京交通大學 a.計算機與信息技術學院; b.交通數據分析與挖掘北京市重點實驗室,北京 100044;2.中國民用航空局民航旅客服務智能化應用技術重點實驗室,北京 100105)
隨著智能交通系統(tǒng)的快速發(fā)展,交通流量預測問題受到人們和科研機構的廣泛關注,交通流量的準確預測能為智能交通系統(tǒng)提供信息支撐與決策支持。由于生活中存在多種交通站點,如城市地鐵站、高速公路收費站和民航機場,因此站點擁堵狀況與整個交通網絡正常運轉關系密切,如果能對站點的出入流量進行有效預測,則有利于提高交通網絡的運行效率,減少安全隱患,便于旅客合理安排出行,對智能交通系統(tǒng)的發(fā)展具有重大意義。
近年來,大量學者針對交通流量預測問題進行相關研究,根據研究方法可將其分為三大類,分別為經典時間序列預測方法、傳統(tǒng)機器學習方法以及深度學習方法。早期流量預測模型以經典序列預測方法為主,如歷史均值法、向量自回歸模型、自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[1]及其變體模型。之后,學者使用傳統(tǒng)機器學習方法來預測交通流量,主要通過構建集成模型,如文獻[2]將經驗模式分解與BP神經網絡相結合,文獻[3]提出小波支持向量機(Wavelet-SVM),這2種模型均用于地鐵站人流量預測;文獻[4]將GBDT模型用于收費站的短時交通流量預測。隨著深度學習在計算機視覺、語音文本處理等任務中不斷取得突破[5],開始有學者將深度學習技術應用于交通流量預測任務。文獻[6-7]將RNN類時序預測模型及其變體模型用于交通流量預測。文獻[8]將RNN類模型與傳統(tǒng)機器學習方法相結合進行流量預測。文獻[9]將城市區(qū)域劃分成等大小的網格,設計基于殘差單元的ST-ResNet模型用于預測各區(qū)域的人流量。文獻[10]在此基礎上引入LSTM單元對模型進行改進,但此類模型只適用于網格狀數據。
為解決傳統(tǒng)卷積神經網絡在圖數據上的局限性,圖卷積技術應運而生。文獻[11]使用圖卷積與門控卷積捕捉高速公路上各路段車速的時空依賴性。文獻[12]認為捕獲空間特征的圖結構是隨著實際路況動態(tài)變化的,從而基于動態(tài)圖卷積思想對文獻[11]方法進行改進。文獻[13]通過建模待預測流量與近期流量、日周期流量以及周周期流量之間的關系,并采用時空注意力機制捕獲結點交通流量之間的時空相關性。文獻[14]利用多圖卷積網絡預測共享單車的租賃流量。還有學者將圖卷積應用于其他時空數據挖掘任務,如文獻[15]結合城市設施與信息點(Point of Information,POI)將城市區(qū)域作為結點構建多張圖,提出STMGCN模型預測短期內各區(qū)域的出租車需求量。
交通站點流量受地理位置、時間、交通狀況等多種因素影響,具有復雜的非線性。對于不同站點,低階相鄰站點之間與高階相鄰站點之間的交通狀況均會互相影響;對于相同站點,歷史交通狀況與未來交通狀況密切相關,因此準確地預測站點出入流量需要充分考慮站點之間的時空相關性,而現有模型在解決該問題時均存在一些不足:如經典序列預測方法主要通過從交通流量序列中挖掘出時間維度上的規(guī)律進行預測,一般要求時間序列具有一定的周期性或規(guī)律性,因此預測效果不理想;常用的傳統(tǒng)機器學習方法[2-3]與RNN類時序預測模型[6-7]僅考慮了序列的時間維特征,未考慮流量序列之間的空間相關性;STGCN[11]在捕獲空間特征之前,未考慮其他歷史周期片段與預測時段的相關性,并在模型中對時間維進行逐步降維,導致時空特征表示不充分;ASTGCN[13]只考慮了結點間的低階相鄰關系,難以直接捕獲高階相鄰結點之間的空間關系,且忽略了不同歷史周期片段之間的相關性;STMGCN[15]難以充分捕獲不同時間區(qū)間結點之間的時空關系,對于長期預測,結點的時空特征學習能力不足。
本文從空間維度與時間維度兩個角度出發(fā),提出一種基于上下文門控的時空多圖卷積網絡(Contextual Gated Spatio-Temporal Multi-Graph Convolutional Network,CG-STMGCN)模型,其能夠基于站點間的相鄰關系與流通流量關系捕獲站點流量之間的時空相關性。
定義5(連續(xù)出入網絡記錄組) 二元組Tio(Tk,Tk+1)表示某個體連續(xù)進出一次網絡產生的記錄組,其中,Tk.κ=in,Tk+1.κ=out,Tk.p=Tk+1.p,Tk.τ 定義6(站點出入流量)t=[tstart,tend)表示某個時間區(qū)間,Δt=tstart-tend表示區(qū)間長度,則在時間區(qū)間t內,站點v上產生的進出流量分別為: (1) (2) (3) 目前,實現圖卷積的主要方法為:1)將結點重新組合排列成網格形狀,再使用傳統(tǒng)卷積進行處理[16],屬于空間類方法;2)譜圖卷積,即在譜域對圖信號進行卷積操作[17]。本文使用譜圖卷積實現圖卷積。 (4) (5) 本文提出的CG-STMGCN模型架構如圖1所示。首先,根據站點之間的不同關系構造鄰居圖與流通流量圖。然后,分別在鄰居圖與流通流量圖上構建時空卷積組件,兩個組件架構相同,均由多個基于上下文門控的時空卷積模塊串行組成。之后,通過全連接層將最后一個時空卷積模塊的輸出映射為待預測時段的流量值,最終使用哈達瑪乘積將兩張鄰居圖上的預測結果進行融合作為最終的預測結果。為優(yōu)化學習效率,本文在每個基于上下文門控的時空模塊中使用殘差學習框架。 圖1 CG-STMGCN模型架構 (6) 其中,Th=Tr+Td+Tw。模型輸入拼接示意圖如圖2所示。 圖2 模型輸入拼接示意圖 在現實生活中,當某個交通站點的出入口出現擁堵時,人們可能會選擇該交通站點附近的站點出行,因此相鄰站點的流量之間存在相關性。在整個交通網絡中,各結點流出流量的源頭來自其他若干個站點的流入流量,因此有流通流量的站點之間存在流量依賴性。為分別捕獲相鄰站點之間的鄰近相關性與流量依賴性,本文分別構造鄰居圖與流通流量圖。 2.1.1 鄰居圖 (7) 2.1.2 流通流量圖 (8) (9) (10) (11) (12) (13) (14) 其中,avg(Ftf)表示在時間區(qū)間tf內站點之間的平均流通流量,式(13)為歸一化操作,AF,ij∈[0,1]。 本文在每張圖上構建多個基于上下文門控的時空卷積模塊用于捕獲站點流量的時空特征。由于模型輸入中包含待預測時段不同周期的時間區(qū)間觀測值,因此本文首先使用上下文門控單元建模各個時間區(qū)間對待預測時段的重要程度,然后使用圖卷積單元分別捕獲站點流量之間的相關性與依賴性,此時各結點的特征中已經包含對應圖上相鄰結點的信息,最后使用時間維的卷積單元在時間維度進行卷積,從而有效捕獲站點流量的時空特征。 2.2.1 上下文門控單元 本文使用若干個歷史區(qū)間觀測值預測未來若干個時間區(qū)間的流量值,直觀上不同時間區(qū)間的觀測值對待預測時段的影響程度不同。受通道注意力機制[19-20]與STMGCN模型[15]的啟發(fā),首先,本文使用上下文門控單元來建模歷史觀測值中各時間區(qū)間觀測值對待預測時段的重要程度。 (15) t=1,2,…,Ti (16) s=σ(W2δ(W1z)) (17) 其中,W1與W2是參數矩陣,σ表示激活函數ReLU,δ表示激活函數sigmoid。 2.2.2 圖卷積單元 2.2.3 時間維卷積單元 經過上下文門控單元與圖卷積單元后,每個結點的特征信息中已經包含對應圖上相鄰結點的特征信息,因此使用時間維卷積單元不僅能提取各結點在時間維度上的特征信息,而且能融合其他關聯(lián)結點的特征信息,并且由于模型將待預測時段的近期片段、日周期片段、周周期片段按照時間順序進行拼接,時間維卷積單元能夠獲取到不同周期片段之間的相關性。因此,時間維卷積單元能有效獲取站點流量的時空特征。一個結點的時間維卷積示意圖如圖3所示。 圖3 時間維卷積示意圖 (18) (19) 其中,⊙表示哈達瑪乘積,WN與WF為待學習的參數張量。 本文在兩個交通站點出入流量數據集上對模型進行實驗。第一個數據集是杭州市地鐵網絡80個地鐵站在2019年1月1日至2019年1月26日的出入人流量數據,使用前一周的數據構造流通流量圖,將2019年1月1日至2019年1月20日的數據作為訓練集,2019年1月21日至2019年1月23日的數據作為驗證集,2019年1月24日至2019年1月26日的數據作為測試集。第二個交通站點數據是某地區(qū)高速公路網絡426個收費站在2018年6月30日至2018年8月27日的出入車流量數據。本文使用前一周的數據構造流通流量圖,將2018年6月30日至2018年8月15日的數據作為驗證集,2018年8月16日至2018年8月21日的數據作為驗證集,2018年8月22日至2018年8月27日的數據作為測試集。 本文將CG-STMGCN模型與8種預測方法的實驗結果進行比較,具體為:1)歷史相鄰均值法(HA);2)歷史周期均值法(PreHA),即將待預測時段的前n天相同時間段的均值作為預測值;3)ARIMA模型;4)長短期記憶網絡(LSTM)模型;5)門控循環(huán)單元網絡(GRU)模型;6)STGCN模型[11];7)STMGCN模型[15];8)ASTGCN模型[13]。 本文采用均方根誤差(Root Mean Square Error,RMSE)與平均絕對誤差(Mean Absolute Error,MAE)作為實驗結果的評價指標,計算方法如式(20)、式(21)所示: (20) (21) 其中,xi表示實際值,x′i表示預測值,n表示預測值的個數。 在計算站點出入流量時,對地鐵站數據集的時間區(qū)間長度取5 min,高速公路收費站數據集的時間區(qū)間長度取10 min。本文使用MXNet實現CG-STMGCN模型,在上下文門控單元中圖卷積對應的K′取2,對圖卷積層中對應的K取1、2、3,最佳實驗結果對應K=2,圖卷積層中的卷積核個數取64,時間維的二維卷積核大小取3。在訓練過程中,初始學習率取1e-3,訓練輪次為100,使用驗證集早停策略避免過擬合,批次大小取32,優(yōu)化器選擇Adam。本文分別選取待預測時段的3個近期片段、1個日周期片段以及1個周周期片段在時間維度上按照時間先后順序進行拼接并將其作為模型輸入,預測步長取12,實驗結果如表1所示。 表1 交通站點流量預測實驗結果 Table 1 Experimental results of flow prediction for traffic stations 方法與模型地鐵站數據集高速公路收費站數據集RMSEMAERMSEMAEHA方法44.5221.0019.8810.29PreHA方法38.6617.6415.577.90ARIMA模型45.4219.0918.378.85LSTM模型32.8418.3418.358.72GRU模型30.5716.5316.347.09STGCN模型25.1012.6112.046.27STMGCN模型22.0611.3910.395.56ASTGCN模型20.8010.8110.135.37CG-STMGCN模型19.3010.049.365.15 由表1可知,本文CG-STMGCN模型在RMSE與MAE這兩種評價指標上較其他方法均取得了最優(yōu)效果,深度學習類方法較傳統(tǒng)時間序列預測方法普遍能夠取得更好的預測效果,考慮時空相關性的深度學習模型比僅考慮時間維度相關性的深度學習模型能取得更好的預測效果。 另外,本文針對不同的預測步長,分別使用以上方法進行實驗,實驗結果如圖4、圖5所示??梢钥闯?當預測步長較短時,CG-STMGCN模型能取得良好的預測效果,雖然STMGCN模型在短期預測時也能取得不錯的預測效果,但是隨著預測步長的增加,預測難度越來越大,STMGCN模型與其他方法的預測誤差開始呈現上升趨勢,但是CG-STMGCN模型的預測誤差較其他方法上升更加緩慢,且仍能取得最好的預測準確性,證明了CG-STMGCN模型的有效性與穩(wěn)定性。 圖4 交通站點流量預測方法在地鐵站數據集上的實驗結果 Fig.4 Experimental results of flow prediction methods for traffic stations on subway stations dataset 圖5 交通站點流量預測方法在高速公路收費站數據集上的實驗結果 本文將已有的單圖時空卷積模型進行擴展,分別在鄰居圖與流通流量圖上構建單圖時空卷積模型,使用哈達瑪乘積將兩張圖上的輸出結果進行融合,將ASTGCN擴展為ASTGCN-MG,STGCN擴展為STGCN-MG,并在地鐵站數據集上分別取預測步長為3、6、9、12進行實驗,結果如表2所示。由實驗結果可知,ASTGCN-MG模型的預測效果優(yōu)于ASTGCN模型,STGCN-MG模型模型的預測準確性優(yōu)于STGCN模型,證明了多圖的有效性。由于CG-STMGCN模型結合站點上下文注意力機制對多周期時間區(qū)間的重要程度進行建模,然后進行圖卷積與時間維卷積,能夠充分捕獲站點流量的時空特征,因此取得了最好的預測效果。 表2 基于時空多圖卷積網絡模型的交通站點流量預測實驗結果 Table 2 Experimental results of flow prediction for traffic stations based on spatio-temporal multi-graph convolutional network model 模型預測步長為3預測步長為6預測步長為9預測步長為12RMSEMAERMSEMAERMSEMAERMSEMAESTGCN模型20.1910.4821.8411.2023.4311.8925.1012.61STGCN-MG模型19.8310.2721.1010.8022.0811.2623.0011.71ASTGCN模型19.6310.2820.0510.3820.6710.6720.8010.81ASTGCN-MG模型19.3310.0619.9410.2520.1210.5520.3810.63CG-STMGCN模型18.349.6119.319.9919.5210.2419.3010.04 本文針對交通站點流量預測問題提出一種基于上下文門控的時空多圖卷積網絡(CG-STMGCN)模型。根據站點流量間存在的兩種空間關系,分別構造鄰居圖與流通流量圖用于表示站點流量之間的相關性與依賴性,使用上下文門控單元、圖卷積單元與時間維的標準卷積單元捕獲交通站點流量的時空特征,解決了現有交通站點流量預測方法時空特征捕獲不足的問題,并在兩種真實數據集上進行實驗,結果證明了該模型具有良好的預測效果。后續(xù)將通過增加卷積動態(tài)圖來優(yōu)化CG-STMGCN模型架構,進一步提升預測能力并擴大其應用范圍。1.2 圖卷積
2 模型架構
2.1 多圖構造
2.2 基于上下文門控的時空卷積模塊
2.3 時空多圖卷積融合
3 實驗結果與分析
3.1 數據集
3.2 對比方法與評價指標
3.3 實驗參數與結果分析
4 結束語