胡 杰,龔永勝,蔡世杰,黃騰飛
(1.武漢理工大學(xué),現(xiàn)代汽車零部件技術(shù)湖北省重點實驗室,武漢430070;2.武漢理工大學(xué),汽車零部件技術(shù)湖北省協(xié)同創(chuàng)新中心,武漢430070;3.新能源與智能網(wǎng)聯(lián)車湖北工程技術(shù)研究中心,武漢430070)
在智慧城市[1]建設(shè)過程中,隨著車載傳感器增加,車輛行駛過程中將產(chǎn)生大量的交通數(shù)據(jù),如何充分挖掘隱含在數(shù)據(jù)中的普遍規(guī)律從而進一步推動智慧交通系統(tǒng)的發(fā)展,已經(jīng)引起了大量學(xué)者[2]的關(guān)注。準(zhǔn)確的車流量預(yù)測不僅有利于城市道路的規(guī)劃建設(shè),還有助于提高車輛的通行效率,緩解城市交通擁堵,減少資源浪費和環(huán)境污染。
為了提高交通流量的預(yù)測精度,研究人員做了大量探索。在基于狀態(tài)估計的交通流量預(yù)測中,卡爾曼濾波的預(yù)測模型得到了廣泛的應(yīng)用[3-7]。由于不同路段的交通流量之間存在一定的線性關(guān)系,因此可使用卡爾曼濾波對線性函數(shù)的參數(shù)進行估計,從而實現(xiàn)交通流量的預(yù)測。該方法的缺點是模型容易產(chǎn)生滯后現(xiàn)象,難以適應(yīng)日益復(fù)雜的城市路網(wǎng)結(jié)構(gòu)。
在機器學(xué)習(xí)模型中,車流量被視為單一時間序列問題,使用機器學(xué)習(xí)模型擬合歷史交通流的變化趨勢從而實現(xiàn)對未來的預(yù)測。Marco等[8]提出了一種基于支持向量回歸(support vector regression,SVR)的交通流量預(yù)測模型,考慮到交通流量的季節(jié)變化,該模型采用季節(jié)核來度量兩個時間序列樣本之間的相似性,實驗證明該模型與傳統(tǒng)的自回歸滑動平均模型和卡爾曼濾波組合模型相比,在預(yù)測精度相同的情況下,大幅降低了模型的時間復(fù)雜度。Hu等[9]提出了一種基于混合PSO-SVR的短期交通流量預(yù)測模型,該模型采用快速粒子群優(yōu)化算法(particle swarm optimization,PSO)對SVR的參數(shù)進行優(yōu)化。Ge等[10-11]對復(fù)雜的交通流量序列采用小波變換轉(zhuǎn)變?yōu)椴煌叨认碌膯我惶卣鳎缓笫褂肧VR模型分別對不同尺度下的子序列進行預(yù)測,該方法較大限度地挖掘了時間序列中的隱含信息和特征的變化,實現(xiàn)了較好的預(yù)測效果。在其他機器學(xué)習(xí)算法的研究中,樊漢勤[12]采用隨機森林算法來實現(xiàn)交通流量的預(yù)測,可實現(xiàn)與SVR相似的效果。隨著神經(jīng)網(wǎng)絡(luò)的發(fā)展,其優(yōu)秀的非線性擬合能力使得神經(jīng)網(wǎng)絡(luò)在交通流量預(yù)測領(lǐng)域得到了廣泛的青睞[13-16]。文獻[17]和文獻[18]中利用多層感知機(multilayer perception,MLP)和長短時記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory networks,LSTM)對交通流量進行預(yù)測,并引入早停機制[19-20]來防止模型過擬合?;跁r間序列的預(yù)測方法雖然改進了傳統(tǒng)方法的預(yù)測精度,但該方法忽略了城市交通的空間連通性,不適于復(fù)雜交通系統(tǒng)的交通流量預(yù)測。
為了在時間序列預(yù)測的基礎(chǔ)上進一步探索城市交通中的空間關(guān)系,基于圖神經(jīng)網(wǎng)絡(luò)的圖節(jié)點信息提取得到了廣泛的應(yīng)用[21]。文獻[22]~文獻[25]中提出了不同的圖表示學(xué)習(xí)方法,實現(xiàn)了圖節(jié)點的向量表示。圖表示方法與傳統(tǒng)時間序列模型相結(jié)合可實現(xiàn)交通流量的時空預(yù)測,改善交通流量的預(yù)測效果。劉道廣[26]提出了一種基于圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)和LSTM相結(jié)合的時空預(yù)測模型,取得了較好的預(yù)測效果。Zhao等[27]提出了一種基于圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)和門控循環(huán)單元(gated recurrent unit,GRU)組合的時間圖卷積網(wǎng)絡(luò)(temporal graph convolutional network,T-GCN)模型來實現(xiàn)交通流量預(yù)測,充分考慮了城市交通中的空間特性。Zhang等[28]提出了一種基于殘差網(wǎng)絡(luò)的時空特征提取方法,并考慮了天氣和節(jié)假日的影響,為車流量預(yù)測研究提供了新的思路。
為了充分考慮天氣、時間、興趣點(point of interest,POI)等外部因素對車流量的影響,本文中提出了一種基于多源數(shù)據(jù)與時空預(yù)測模型相結(jié)合的車流量預(yù)測方法。同時,提出了一種基于圖表示學(xué)習(xí)和時間卷積的時空預(yù)測模型,并融合了基于歷史出租車軌跡的空間鄰接權(quán)值提取模型,進而提高模型的空間特征提取能力。
1.1.1 道路交通卡口數(shù)據(jù)集
道路交通卡口數(shù)據(jù)來源于DataCastle競賽平臺,采用的是青島市107個道路交通卡口在2019年8月至9月7:00-19:00的車輛通行數(shù)據(jù),時間跨度為35天,共計94 180 760條。數(shù)據(jù)的特征維數(shù)和空間分布如表1所示。
表1 道路交通卡口數(shù)據(jù)樣本
1.1.2出租車數(shù)據(jù)集
出租車數(shù)據(jù)集采用的是DataCastle網(wǎng)站提供的青島市2019年8月1日至19日中7:00-19:00之間的出租車行駛軌跡數(shù)據(jù)。數(shù)據(jù)采集的時間間隔為20 s,共計100 740 505條。數(shù)據(jù)維度如表2所示。
表2 出租車數(shù)據(jù)樣本
1.1.3 天氣數(shù)據(jù)
天氣數(shù)據(jù)來自WunderGround網(wǎng)站,數(shù)據(jù)包括時間(小時)、溫度、濕度、風(fēng)速、氣壓和天氣狀況6個維度,如表3所示。
表3 天氣數(shù)據(jù)樣本
1.1.4 POI數(shù)據(jù)
POI數(shù)據(jù)來自O(shè)penstreetmap平臺,數(shù)據(jù)包含POI名稱、POI類別、行政區(qū)、經(jīng)度和緯度,如表4所示。
表4 POI數(shù)據(jù)樣本
1.2.1 道路交通卡口數(shù)據(jù)集的流量轉(zhuǎn)換
道路交通卡口數(shù)據(jù)集包含道路車輛通行記錄,以5 min為時間間隔,對各卡口的車輛通行記錄進行流量統(tǒng)計轉(zhuǎn)換。轉(zhuǎn)換后的數(shù)據(jù)點代表5 min內(nèi)的車流量。轉(zhuǎn)換后的部分卡口(100051、100117、100335)車流量數(shù)據(jù)如圖1所示。
圖1 交通卡口車流量變化趨勢
1.2.2 出租車數(shù)據(jù)集的流量轉(zhuǎn)換
對于出租車數(shù)據(jù)集的處理,首先對出租車的軌跡進行坐標(biāo)轉(zhuǎn)換,將車載傳感器采集的WGS84坐標(biāo)系轉(zhuǎn)換為GCJ02坐標(biāo)系。其次,計算相鄰兩軌跡點之間的平均速度,剔除平均速度大于120 km/h的異常軌跡點,并使用線性插值法補全缺失。最后,基于Geohash6[29]對城市進行網(wǎng)格劃分,以5 min為間隔統(tǒng)計每個網(wǎng)格的出租車流量,從而實現(xiàn)出租車數(shù)據(jù)集的流量轉(zhuǎn)換。轉(zhuǎn)換后的部分流量如圖2所示。
圖2 出租車流量變化趨勢
受限于數(shù)據(jù)采集設(shè)備的精度,原始數(shù)據(jù)中不可避免地存在少量噪聲。為了減少噪聲,采用了基于Kalman濾波的數(shù)據(jù)平滑方法[30]。
1.4.1 時間相關(guān)性分析
充分挖掘車流量時間序列的時間特征有助于提高模型的預(yù)測精度。
(1)以天為單位的周期性分析
兩個數(shù)據(jù)集前3天的變化趨勢圖如圖3和圖4所示。由圖可見,車流量的變化趨勢基本相同,說明車流量具有明顯的周期性特征。
圖3 車流量的周期性分析(天)-交通卡口流量的周期性對比
圖4 車流量的周期性分析(天)-出租車流量的周期性對比
(2)以星期為單位的周期性分析
以星期為單位的周期性分析如圖5所示。由圖可見,工作日平均車流量較高,呈現(xiàn)明顯的早晚高峰特性,且與周末的車流趨勢有較大差異。
圖5 車流量的周期性分析(星期)
1.4.2 天氣相關(guān)性分析
天氣狀況會影響城市交通流。兩個數(shù)據(jù)集在不同天氣下的平均流量圖如圖6所示。由圖可見,晴天的車流量都明顯高于雨天,說明市民更傾向晴天出行。
圖6 天氣相關(guān)性分析
1.4.3 POI相關(guān)性分析
不同POI下的平均流量的統(tǒng)計分析如圖7所示,可知不同POI對應(yīng)的流量存在較大差異,說明POI能間接反映市民的出行意圖對城市交通存在影響。
圖7 POI相關(guān)性分析
為了加強模型的時間特征學(xué)習(xí)能力,提出了一種基于Time2vec[31]的時間周期特征提取模型。Time2vec模型通過嵌入神經(jīng)網(wǎng)絡(luò)層可以實現(xiàn)從輸入時間序列中自動提取隱含的時間周期特征。Time2vec的周期特征表達式為
式中:ω和φ分別為正弦三角函數(shù)中的頻率和初始相位;t為輸入的時間特征(時間標(biāo)量);i為第i個特征表示輸出。
為了更精確地描述天氣舒適度對車流量的影響,提出了一種基于K-means聚類的出行舒適性分類方法。
K-means的輸入包括天氣特征中的溫度、濕度、風(fēng)速和氣壓4個維度,k值根據(jù)輪廓系數(shù)確定。聚類結(jié)果和輪廓圖分別如圖8(a)和圖8(b)所示,當(dāng)k取3時對應(yīng)輪廓系數(shù)最大,說明聚類標(biāo)簽為3時最為合適。類別標(biāo)簽將經(jīng)過One-Hot編碼后輸入模型。
圖8 POI相關(guān)性分析
2.3.1 道路交通卡口數(shù)據(jù)集的POI匹配
POI點和交通卡口點的匹配,采用了基于最近鄰算法(K-nearest neighbor,KNN)的匹配方法。通過進行對照實驗得知,當(dāng)近鄰參數(shù)k=50時,匹配效果最佳。匹配結(jié)果如圖9所示,匹配后卡口的POI標(biāo)簽將通過One-Hot編碼實現(xiàn)特征表征。
圖9 道路卡口的POI匹配
2.3.2 出租車數(shù)據(jù)集的POI匹配
出租車數(shù)據(jù)集的流量為GeoHash6網(wǎng)格區(qū)域流量,首先計算每個網(wǎng)格內(nèi)各類型的POI數(shù)量,其次將數(shù)量最大的類別作為網(wǎng)格的POI類別從而完成網(wǎng)格的POI匹配。所有的POI類別都將通過One-Hot編碼實現(xiàn)特征表征。
為了充分考慮多源特征對車流量的影響,本文中從外部特征、空間特征和時間特征3個角度進行了綜合建模,即采用外部特征、空間特征和時間特征提取模型經(jīng)過張量拼接輸入至MLP單元中進行多模型的融合,從而實現(xiàn)基于多特征融合的車流量時空預(yù)測方法。預(yù)測模型的總體結(jié)構(gòu)如圖10所示。
圖10 預(yù)測模型整體結(jié)構(gòu)
外部特征包括多源特征表征中的時間、天氣和POI屬性。對此類特征進行相應(yīng)的張量拼接后將連接到全連接網(wǎng)絡(luò)實現(xiàn)外部特征的建模。外部特征提取模型的輸出將與其他模型的輸出融合后輸入多層感知機網(wǎng)絡(luò)中。
3.2.1 基于圖表示學(xué)習(xí)的空間鄰接特征提取模型
在城市路網(wǎng)中,相鄰道路交叉口之間的上下游關(guān)系會對整體的車流量產(chǎn)生重要影響??紤]到道路的空間分布對城市交通的交叉影響,采用了一種基于結(jié)構(gòu)深層網(wǎng)絡(luò)嵌入(structural deep network embedding,SDNE)的空間分布特征提取方法[25],其中1階相似性用來捕獲路網(wǎng)空間局部結(jié)構(gòu)相關(guān)性,2階相似性用來捕獲路網(wǎng)空間全局結(jié)構(gòu)相關(guān)性。圖表示學(xué)習(xí)SDNE算法的總體結(jié)構(gòu)如圖11所示。
圖11 SDNE模型總體結(jié)構(gòu)
在SDNE模型中,每個輸入數(shù)據(jù)(節(jié)點鄰接信息)需要經(jīng)歷相應(yīng)的編碼和解碼過程,該過程對應(yīng)為SDNE的2階相似性學(xué)習(xí)。在節(jié)點編碼時,通過多層非線性單元將節(jié)點信息從低維映射到高維從而得到節(jié)點信息的表示空間。在解碼時,通過多層非線性元素進一步映射表示空間得到重構(gòu)的節(jié)點鄰接矩陣。
SDNE模型的輸入為交通鄰接圖數(shù)據(jù)。該模型包含兩個網(wǎng)絡(luò)層,每層包含64個和128個隱藏神經(jīng)元,用于學(xué)習(xí)交通卡口之間的隱含空間關(guān)聯(lián)。
3.2.2基于歷史軌跡的空間權(quán)重特征提取模型
針對空間權(quán)重問題,提出了一種基于出租車歷史軌跡的鄰接權(quán)重特征提取方法。首先,將出租車軌跡數(shù)據(jù)通過Geohash6網(wǎng)格編碼;然后將軌跡編碼去重后視為文本語言輸入詞嵌入Word2vec模型學(xué)習(xí)網(wǎng)格間的權(quán)重關(guān)系,從而實現(xiàn)網(wǎng)格間的實際車輛流動關(guān)系的探索;最后在網(wǎng)格的基礎(chǔ)上實現(xiàn)交通卡口數(shù)據(jù)集和出租車數(shù)據(jù)集中各流量統(tǒng)計點的空間權(quán)重匹配。
詞嵌入Word2vec模型為圖12中所示的CBOW(continuous bag-of-words model)模型,模型包括輸入層、隱含層和輸出層。該模型的詞窗口大小為5,圖中ωi-1、ωi-2、ωi+1和ωi+2分別為CBOW模型中經(jīng)過One-Hot編碼后的輸入,ωi為輸出,也即CBOW模型根據(jù)當(dāng)前單詞的前后4個單詞來預(yù)測當(dāng)前詞。
圖12 CBOW模型結(jié)構(gòu)
Word2vec模型訓(xùn)練后,其隱含層中的嵌入向量將被保存至模型的詞典中,詞向量可通過查詢字典的方式獲取。每個單詞的嵌入維度由隱含層的神經(jīng)元個數(shù)決定,嵌入后的詞向量將包含單詞間的相似度信息,也即空間權(quán)重信息。在詞嵌入模型中,詞窗口大小設(shè)置為4,嵌入維數(shù)為60,空間權(quán)重特征提取模型的結(jié)構(gòu)如圖13所示。
圖13 鄰接特征提取過程
在空間相關(guān)提取模型由SDNE模型和詞嵌入的CBOW模型融合而成,其中SDNE負責(zé)空間鄰接特征提取,CBOW負責(zé)鄰接權(quán)重特征提取,空間相關(guān)提取模型的最終輸出xspace是SDNE的輸出xSDNE和Word2vec的輸出xWord2vec的張量拼接。
車流量作為時間序列數(shù)據(jù),具有強烈的時間相關(guān)性。時間卷積網(wǎng)絡(luò)(temporal convolutional net?works,TCN)中加入的因果卷積,加強了模型對序列數(shù)據(jù)的學(xué)習(xí)能力,同時通過膨脹卷積極大的擴展了模型的感受野。TCN還引入殘差單元用于緩解梯度爆炸和梯度消失,從而使深TCN網(wǎng)絡(luò)的實現(xiàn)成為可能。為了提高模型的效率,采用了基于TCN的時間相關(guān)性建模方法[32]。
為了提高模型的時間特征提取能力,建立了基于近鄰預(yù)測和日周期預(yù)測的雙基線時間特征提取模型。如圖14所示,近鄰基線上的TCN模型根據(jù)前12條(1 h)流量預(yù)測后續(xù)流量;在日周期基線上,模型根據(jù)前一天同一時間的流量預(yù)測當(dāng)前值。
圖14 雙基線數(shù)據(jù)采樣方法
多頭自注意力機制[33]能增強模型對長序列的“記憶能力”,增強模型對長期依賴的學(xué)習(xí)。在深度學(xué)習(xí)中,注意力機制被廣泛用于增強模型對重要信息的關(guān)注度。自注意力模型的輸出向量可根據(jù)式(3)計算得出,其中dk為調(diào)節(jié)參數(shù),Q、K、V分別為查詢向量序列、鍵向量序列和值向量序列,3種序列可由輸入信息經(jīng)過線性變換獲得。
多頭自注意力模型的輸出計算方法如式(4)和式(5)所示,其中WQ、WK、WV和WO為隱藏參數(shù)矩陣,headi為第i個放縮點積注意層的輸出。為了避免模型訓(xùn)練過程中出現(xiàn)過擬合現(xiàn)象,同時加入早停算法。
4.1.1 評價指標(biāo)
本文中以均方根誤差(root mean squared error,RMSE)和平均絕對誤差(mean absolute error,MAE)為評價指標(biāo)實現(xiàn)預(yù)測模型的對比評估。兩個評價指標(biāo)越小,則表示預(yù)測效果越佳。
4.1.2 相關(guān)參數(shù)設(shè)置
通過多個對照實驗分析預(yù)測效果,模型最佳效果的相關(guān)參數(shù)設(shè)置如下:訓(xùn)練集、驗證集和測試集的比例分別為60%、20%、20%。在外部特征模塊中,Time2vec的神經(jīng)元數(shù)為32,K-means聚類標(biāo)簽為3,KNN近鄰參數(shù)為50,Geohash編碼長度為6。在空間特征提取模塊中,SDNE模型的批量大小和迭代次數(shù)分別為128和50;鄰接權(quán)值模型的單詞窗口大小和嵌入尺寸分別為4和60。在時間特征提取模型中,批量大小為256,早停容忍度為5,早停閾值為0.001,模型的優(yōu)化算法為Adam。
4.2.1 多源特征對比及結(jié)果分析
該部分設(shè)置了以TCN為基模型的多源特征驗證方案。車流量的輸入步長為12(1 h),預(yù)測長度為6(30 min),對照實驗如下所示:
TCN,交通流序列作為輸入;
Time-TCN,在TCN的基礎(chǔ)上添加時間特征;
Wea-TCN,在TCN的基礎(chǔ)上添加天氣特征;
POI-TCN,在TCN的基礎(chǔ)上添加POI類別特征;
GTCN,在TCN的基礎(chǔ)上組合空間特征提取模型SDNE與鄰接權(quán)重提取模型Word2vec。
兩個真實數(shù)據(jù)集的對照模型預(yù)測結(jié)果(3次重復(fù)實驗后的平均值)如圖15所示。
圖15 多源特征預(yù)測結(jié)果對比
由對比結(jié)果可知,多源特征的引入改善了模型的預(yù)測效果??臻g相關(guān)性特征的引入最大程度提升了模型的預(yù)測效果,驗證了空間相關(guān)性建模的有效性;時間、天氣和POI特征的引入均不同程度地提升了模型的預(yù)測精度,驗證了基于多源數(shù)據(jù)方法的合理性。
4.2.2 預(yù)測模型對比及結(jié)果分析
為了驗證MF-AGTCN模型的預(yù)測效果,該部分以RNN、LSTM、GRU、CNN、TCN和Zhao等提出的基于圖卷積網(wǎng)絡(luò)(GCN)與GRU的組合模型TGCN[27]為對照模型設(shè)計了對照實驗。所有的對照模型均調(diào)至最佳狀態(tài),并設(shè)置隨機失活率為0.5以防止過擬合。同樣,模型的輸入步長為12(1 h),預(yù)測長度為6(30 min)。實驗結(jié)果如圖16所示。
圖16 不同模型的預(yù)測結(jié)果對比
實驗結(jié)果表明,MF-AGTCN模型在兩個數(shù)據(jù)集的多個預(yù)測步長上都呈現(xiàn)出更好的預(yù)測效果。相比于5個模型的平均提升對比,MF-AGTCN相比RNN的提升最大,相比TCN模型提升相對較小,說明TCN模型在兩個交通數(shù)據(jù)集上優(yōu)于傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò),也驗證了MF-AGTCN模型中的基于TCN模型的時間相關(guān)性建模的合理性。在MF-AGTCN與T-GCN模型的對比中,由于時間特征提取模型Time2vec和多頭注意力機制的引入使MF-AGTCN模型改善了未來25~30 min的車流量預(yù)測精度,說明MF-AGTCN模型具備更優(yōu)異的中長時預(yù)測性能。
MF-AGTCN模型在兩個真實交通數(shù)據(jù)中的部分預(yù)測效果如圖17和圖18所示。由圖可見,MFAGTCN模型較好地擬合了真實的交通流波動趨勢,且在預(yù)測步長為30 min時依然表現(xiàn)穩(wěn)定,進而驗證了其良好泛化能力。
圖17 道路交通卡口流量數(shù)據(jù)集MF-AGTCN預(yù)測結(jié)果
圖18 出租車流量數(shù)據(jù)集MF-AGTCN預(yù)測結(jié)果
本文中提出了基于多源數(shù)據(jù)的特征工程和時空預(yù)測模型相結(jié)合的車流量預(yù)測方法,該方法從外部特征、空間特征和時間特征的角度建立車流量預(yù)測模型,其中基于圖表示學(xué)習(xí)SDNE模型的空間特征提取模型與基于出租車歷史軌跡的空間權(quán)重模型的引入,改善了空間依賴性特征的提取能力,有利于提高模型對復(fù)雜交通系統(tǒng)的適用性。多組對照實驗結(jié)果表明,MF-AGTCN預(yù)測模型實現(xiàn)了預(yù)測精度的提升,并具有良好的泛化能力,同時還改善了對長序列數(shù)據(jù)的學(xué)習(xí)能力,使模型具備更優(yōu)異的中長時預(yù)測性能。