劉永樂,谷遠(yuǎn)利
(北京交通大學(xué) 綜合交通運輸大數(shù)據(jù)應(yīng)用技術(shù)交通運輸行業(yè)重點實驗室,北京 100044)
近年來,世界范圍內(nèi)的交通擁堵問題愈發(fā)嚴(yán)重,城市道路和高速公路的交通事故頻發(fā),解決以上問題迫切需要有效的交通控制與誘導(dǎo)策略。交通流量預(yù)測是利用實時交通數(shù)據(jù)的信息滾動來預(yù)測未來的交通狀況,作為交通流控制和誘導(dǎo)的前提正發(fā)揮著越來越重要的作用。
目前已有大量關(guān)于交通流量預(yù)測的研究成果,早期的方法有傳統(tǒng)線性預(yù)測法,線性預(yù)測方法簡單易操作,但不能很好地反映不規(guī)律的交通流狀態(tài),為適應(yīng)不斷波動的交通流,又出現(xiàn)了傳統(tǒng)非線性預(yù)測方法。后隨著計算機(jī)技術(shù)的發(fā)展以及人們對準(zhǔn)確實時交通的掌握,出現(xiàn)了現(xiàn)代智能預(yù)測方法,如基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的預(yù)測方法。由于單個方法會出現(xiàn)或多或少的缺陷,近些年出現(xiàn)了組合預(yù)測方法,該方法是將不同預(yù)測方法組合,彌補單個預(yù)測方法的缺點,以達(dá)到更好的預(yù)測效果。
Abadi等[1]估算了無法獲得交通數(shù)據(jù)的交通網(wǎng)絡(luò)中所有路段的交通流量,但只能預(yù)測后30 min的短時交通流。Deng等[2]將時間序列分析問題轉(zhuǎn)化為圖像分析任務(wù),提出的模型具有預(yù)測路網(wǎng)不完整流量數(shù)據(jù)的能力,但這些深層網(wǎng)絡(luò)具有復(fù)雜的架構(gòu),且可解釋性較弱。HTM分層時間記憶[3]具有作為短期交通流量預(yù)測的有效工具潛力,其效果與LSTM相當(dāng),且在交通流量分布發(fā)生變化時得到改善,但不能很好地從模型輸出中檢測異常流量,并將其用于推斷異常事件的存在。Ma等[4]將機(jī)器學(xué)習(xí)算法與統(tǒng)計模型相繼連接,通過ARIMA分析對其進(jìn)行后處理,從而顯著提高預(yù)測的準(zhǔn)確性,局限性在于機(jī)器學(xué)習(xí)算法只考慮了最簡單的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。Minal等[5]將神經(jīng)網(wǎng)絡(luò)和模糊邏輯的互補功能相結(jié)合,在短期交通流量預(yù)測上取得了令人滿意的成績。Lv等[6]提出了一種基于SAE模型提取交通流抽象和潛在特征的方法,但當(dāng)交通流量較小時,觀察流量與預(yù)測流量之間的微小差異會導(dǎo)致較大的相對誤差。溫惠英等[7]針對高速公路交通量的預(yù)測問題,引入一種新的基于雙向長短期記憶網(wǎng)絡(luò)的預(yù)測方法,在預(yù)測非線性問題時具有較好的泛化能力。王碩等[8]創(chuàng)新性地將混沌理論和改進(jìn)BP神經(jīng)網(wǎng)絡(luò)相融合,用思維進(jìn)化算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),提高預(yù)測精度。戢曉峰等[9]用BP神經(jīng)網(wǎng)絡(luò)對樣本數(shù)據(jù)進(jìn)行處理,再將LSTM捕獲的數(shù)據(jù)特征輸入到SVR回歸層中,實現(xiàn)站點級別的交通流量預(yù)測,但沒有推廣到路網(wǎng)范圍。陸文琦等[10]采用了基于ARIMA模型和PSO-BP模型組的合加權(quán)城市快速路短時交通流速度預(yù)測方法,預(yù)測的擬合度較高。Wan等[11]提出了CTS-LSTM相關(guān)時間序列預(yù)測方法,能夠同時顯示序列內(nèi)時間和空間的依賴性。Xiao等[12]提出了一種混合式LSTM神經(jīng)網(wǎng)絡(luò),能夠預(yù)測更精確的結(jié)果,且適用于實際交通網(wǎng)絡(luò)中的不同交通狀況。Tian等[13]運用多尺度時間平滑法推斷丟失數(shù)據(jù),并學(xué)習(xí)殘差預(yù)測。
上述研究僅關(guān)注短期交通流量預(yù)測,忽略了中期交通流量在一定時間跨度內(nèi)隨空間的變化規(guī)律。文中采用CNN-BiLSTM從時空兩個維度預(yù)測美國加州一條高速公路連續(xù)10個工作日內(nèi)的25個斷面交通流量,并通過結(jié)果分析,驗證了文中模型相比于其他基準(zhǔn)預(yù)測方法具有更高的預(yù)測精度。
交通量[14]是指某一時段內(nèi),連續(xù)通過道路某一斷面的車輛或行人數(shù)。交通流的預(yù)測實質(zhì)是對交通量、速度和占有率等交通流基本參數(shù)進(jìn)行預(yù)測,文中主要預(yù)測高速公路斷面的交通量。
根據(jù)交通量預(yù)測時間長短可以把交通量預(yù)測分成長期預(yù)測、中期預(yù)測和短期預(yù)測[15]:長期預(yù)測主要是交通規(guī)劃四階段法中對規(guī)劃區(qū)域目標(biāo)年交通量的預(yù)估,中期預(yù)測主要是交通管控中小時、日、周的時間跨度預(yù)測,短期預(yù)測主要為交通誘導(dǎo)中時間跨度小于15 min的實時預(yù)測。文中研究的是中期交通量預(yù)測。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)分為一維CNN、二維CNN和三維CNN。一般CNN包括輸入層、卷積層、池化層和全連接層等[16]。
數(shù)據(jù)輸入層預(yù)處理輸入的數(shù)據(jù),卷積層在反向傳播訓(xùn)練中將學(xué)習(xí)到合理的權(quán)值,池化層減少空間信息參數(shù)、提高運算效率,防止過擬合。全連接層把經(jīng)過池化之后的神經(jīng)元展開為一維向量形式,方便對數(shù)據(jù)進(jìn)行處理。
圖1和圖2分別為典型的一維和二維卷積神經(jīng)網(wǎng)絡(luò)示意圖。
圖1 典型的一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 典型的二維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
長短期記憶LSTM[17]比普通循環(huán)神經(jīng)網(wǎng)絡(luò)RNN[18]多出3個控制器,即輸入門、輸出門和遺忘門。輸入門是LSTM單元獲取外界新信息的通道,輸出門在每一步中生成輸出,遺忘門決定是否選擇性遺忘相應(yīng)的輸入結(jié)果。LSTM的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,其算式如式(1)—式(6)所示。
圖3 經(jīng)典的長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(Wo·[ht-1,xt]+bo)
(5)
ht=ot°tanh(ct)
(6)
雙向長短期記憶BiLSTM[19]可以同時獲得正向和反向信息,輸出結(jié)果由這兩個方向的信息綜合處理得到。每個單向LSTM的傳播與前面介紹的前向LSTM傳播算法完全相同。BiLSTM的結(jié)構(gòu)如圖4所示。
圖4 雙向長短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
一維CNN只沿一個方向做卷積和池化處理,更適合一維數(shù)據(jù),如時間序列、自然語言等;二維CNN沿兩個方向做卷積和池化處理,普遍應(yīng)用于二維領(lǐng)域,如計算機(jī)視覺和圖像處理等。鑒于文中從時空兩個維度預(yù)測交通流量,用一維CNN在空間維度上做一維卷積池化來提取線性25個連續(xù)斷面的交通流量空間局部特征,因此,文中選擇一維CNN。
LSTM模型解決了循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的長期依賴問題,獨特的“門”結(jié)構(gòu)能夠避免梯度爆炸和梯度消失,且具有長時記憶能力強(qiáng)的優(yōu)點。BiLSTM在具備LSTM優(yōu)勢的同時,還能在時間維度上考慮前向和后向的雙向時間序列信息,預(yù)測更加全面準(zhǔn)確。
一維CNN適合提取局部空間特征,BiLSTM兼顧雙向時間序列信息,將一維CNN與BiLSTM相結(jié)合,可以從時空特性上更周全地分析交通流量數(shù)據(jù),使預(yù)測結(jié)果的擬合度更高。
基于以上分析,文中提出了基于CNN-BiLSTM的融合預(yù)測模型,結(jié)構(gòu)如圖5所示。其中CNN主要提取時間序列不同空間位置的特征,BiLSTM主要提取時間序列內(nèi)部的時間信息特征。
圖5 卷積-雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
該模型由輸入層、CNN層、BiLSTM 層、全連接層和輸出層組成,CNN層由一維卷積(Conv_1D)層和最大池化(MaxPooling_1D)層堆疊組成,BiLSTM層由一層BiLSTM堆疊成,分別在CNN層和BiLSTM層的末尾加上Dropout層隨機(jī)丟棄節(jié)點,以防止過擬合。將研究斷面歷史交通量經(jīng)過歸一化和缺失值修復(fù)等數(shù)據(jù)預(yù)處理后輸入CNN和Dropout層,進(jìn)行局部空間特征提取,提取后得到多組特征向量,將特征向量依次輸入BiLSTM層、Dropout層、一層flatten層和三層Dense層中,得到輸出結(jié)果。
2.1.1 數(shù)據(jù)來源
本實驗采用美國加州PeMS交通量數(shù)據(jù),以第八區(qū)I10-E高速公路連續(xù)25個公路斷面為研究對象。數(shù)據(jù)采集時間為2016年2月1日至2016年4月11日的工作日(周一至周五),共50 d。取前40 d數(shù)據(jù)為訓(xùn)練集,最后10 d數(shù)據(jù)為測試集,數(shù)據(jù)采集間隔為5 min。
2.1.2 數(shù)據(jù)預(yù)處理
采用最大最小歸一化方法對數(shù)據(jù)進(jìn)行預(yù)處理,最大最小歸一化算式為
(7)
式中:x′為最大最小歸一化后的結(jié)果,xi為序列的第i個真實值,xmin為序列數(shù)據(jù)的最小值,xmax為序列數(shù)據(jù)的最大值。
對于缺失數(shù)據(jù),采用簡單加和平均進(jìn)行插值修復(fù)。
2.2.1 評價指標(biāo)
在交通流量預(yù)測的測試集中,設(shè)置了5種評價指標(biāo):均方誤差MSE,均方根誤差RMSE,平均絕對誤差MAE,平均絕對百分比誤差MAPE以及擬合度R2。這5類評價指標(biāo)的算式為
(8)
(9)
(10)
(11)
(12)
2.2.2 超參數(shù)設(shè)置
優(yōu)化方法采用mini-batch梯度下降法,模型選擇Adam算法,迭代100次,批量大小設(shè)置為256,學(xué)習(xí)率為10-3,在訓(xùn)練數(shù)據(jù)集上采用十折交叉驗證。設(shè)置回溯時間窗步長T為待定參數(shù)(T=1,2,3,4,5,6,7)。設(shè)置L層CNN中L為待定參數(shù)(L=1,2,3),包括卷積層與最大池化層,設(shè)置1層BiLSTM。CNN層卷積核濾波器深度設(shè)置為64,kernel size為2,步長為1,設(shè)置padding為same,以保證CNN輸入和輸出的空間維度一致,采用ReLU函數(shù)作為激活函數(shù)。Max Pooling的pool size為2,步長為1,padding設(shè)為same。BiLSTM的雙向隱藏單元數(shù)總共為512個,分別在CNN和BiLSTM的末尾增加1層隨機(jī)丟失Dropout,防止過擬合,Dropout rate的參數(shù)均設(shè)置為0.1。
為獲得合理的模型結(jié)構(gòu),對不同回溯時間窗長度T(T=1,2,3,4,5,6,7)和CNN層數(shù)L(L=1,2,3)取值組合下的CNN-BiLSTM模型進(jìn)行測試和預(yù)測。選擇CNN-BiLSTM模型的回溯時間窗長度T為4(回溯時間窗長度=4×5 min=20 min),設(shè)定各變量結(jié)構(gòu)中CNN層數(shù)為1層,在上述參數(shù)設(shè)定條件下,CNN-BiLSTM模型的預(yù)測結(jié)果偏差較小,具有較高精度。
為檢測模型精度,將所選模型與其余基準(zhǔn)模型進(jìn)行對比,基準(zhǔn)模型包括:整合自回歸移動平均ARIMA、卷積神經(jīng)網(wǎng)絡(luò)CNN、長短期記憶LSTM、門控循環(huán)單元GRU、雙向長短期記憶BiLSTM、卷積-長短期記憶CNN-LSTM、反向傳播神經(jīng)網(wǎng)絡(luò)BPNN和支持向量回歸SVR。
表1比較了文中模型和其他幾種對比模型在所研究斷面上的平均預(yù)測效果。通過表1可以看到,預(yù)測效果最好的CNN-BiLSTM比次好的CNN-LSTM的MSE、RMSE、MAE和MAPE分別提升了29.789%、13.666%、18.198%和25.220%,表明:BiLSTM相較于LSTM能夠同時考慮2個方向的交通流量信息,能夠顧及到時間序列的前后依賴性特點;相比于單獨的LSTM、GRU和BiLSTM模型,CNN-LSTM和CNN-BiLSTM結(jié)合時空特性預(yù)測交通流量,考慮更周全、且預(yù)測結(jié)果擬合度更高;SVR是傳統(tǒng)的機(jī)器學(xué)習(xí)預(yù)測模型之一,能夠?qū)W到非線性變換數(shù)據(jù),預(yù)測準(zhǔn)確性明顯高于傳統(tǒng)線性模型。此外,由于文中預(yù)測的是未來時段25個公路橫斷面的交通流量,更多關(guān)注的是時間特征,而CNN注重的是局部空間特征的提取,預(yù)測效果并不理想;BPNN是傳統(tǒng)智能非線性預(yù)測模型的代表,雖然模型效果不如現(xiàn)代智能預(yù)測方法,但精度高于傳統(tǒng)線性預(yù)測方法ARIMA;ARIMA模型十分簡單,只需要內(nèi)生變量而不需要借助于其他外生變量,但其要求時序數(shù)據(jù)是穩(wěn)定的,或者通過差分化之后是穩(wěn)定的,本質(zhì)上只能捕捉線性關(guān)系。
表1 各模型斷面平均預(yù)測效果比較
下面分別進(jìn)行同一斷面不同日期不同方法、不同斷面不同日期同一方法以及不同斷面平均10 d不同方法的比較。
2.4.1 同一斷面不同日期不同方法比較2.4.1.1 每日交通流量比較
研究了美國加州第八區(qū)110-E高速公路在2016年3月29日至4月11日10 d 25個公路斷面的交通流量變化情況,并進(jìn)行了預(yù)測分析。選取19號斷面比較同一斷面不同日期的不同方法預(yù)測結(jié)果。
圖6為第19號斷面在不同方法下的預(yù)測結(jié)果。其中子圖(a)~(j)分別代表預(yù)測的10 d每日交通流量的變化情況。
圖6 第19號斷面2016年3月29日至4月11日交通量預(yù)測
從圖6可以看出:在早晚高峰時段,最大車流量可達(dá)450 veh·(5min)-1,文中模型的預(yù)測誤差依舊穩(wěn)定在恒定范圍內(nèi),有較強(qiáng)的適用性。
為量化CNN-BiLSTM的優(yōu)越性,將該方法與其他方法進(jìn)行對比,表2所示為2016年3月29日至4月11日在19號檢測器斷面的指標(biāo)。
表2 不同方法3月29日~4月11日在19號檢測器斷面5項評價指標(biāo)對比
由表2可知,CNN-BiLSTM法在預(yù)測期10 d中的5項評價指標(biāo)平均值優(yōu)于其他幾種方法,模型準(zhǔn)確度較高、預(yù)測能力較強(qiáng),體現(xiàn)了該模型中BiLSTM在時間上的適用性。
2.4.1.2 不同周同一天交通流量相似性比較
為方便說明,同樣選取第19號檢測器斷面為研究對象,利用SPSS(一種數(shù)據(jù)統(tǒng)計分析軟件)進(jìn)行相關(guān)系數(shù)計算。
表3展示了預(yù)測期內(nèi)不同周同一工作日的實際交通量與采用不同種預(yù)測方法預(yù)測得到的交通量相似性比較結(jié)果。
由表3可知,相關(guān)系數(shù)均大于0.9,可認(rèn)為不同周同一工作日的交通流量具有較強(qiáng)相關(guān)關(guān)系。表3中每種預(yù)測方法均反映出了周二的交通量相似性最強(qiáng),周五的相似性相較于其他4天最弱,文中預(yù)測方法預(yù)測出的交通量與真實值最吻合、相似度相差最小,因此,驗證文中使用方法的適用性較強(qiáng)。
表3 預(yù)測期內(nèi)不同周同一工作日實際與預(yù)測交通量相關(guān)系數(shù)
2.4.2 不同斷面不同日期同一方法的比較
將預(yù)測期的第1天3月29日、第2天3月30日、第4天4月1日、第8天4月7日和第10天4月11日中25個斷面的實際值,與CNN-BiLSTM預(yù)測得到的值分別用熱力圖形式展現(xiàn)出來,如圖7所示。
圖7 卷積-雙向長短期記憶神經(jīng)網(wǎng)絡(luò)模型工作日預(yù)測效果
由圖7可知,CNN-BiLSTM模型在工作日的早高峰07:00—09:00和14:00—19:00點均能動態(tài)地反映交通狀態(tài)變化情況,在不同斷面處真實值與預(yù)測值相差較小,預(yù)測結(jié)果與真實交通量比較吻合,體現(xiàn)了該模型中CNN在空間上的適用性。
2.4.3 不同斷面平均10 d不同方法比較
圖8顯示了CNN-BiLSTM方法和其他幾種方法的比較,平均10 d中在16、18、20、22和24號檢測器斷面上的5項評價指標(biāo)的簇狀柱形匯總。
圖8 16、18、20、22和24號檢測器斷面五項評價指標(biāo)簇狀柱形
由圖8可知,CNN-BiLSTM在16、18、20、22和24號檢測器斷面的預(yù)測較穩(wěn)定,相比于其他模型在不同斷面處的誤差波動較小,尤其在交通量波動最大的第22號檢測器斷面處,其他對比模型的預(yù)測誤差都較大,而文中模型在第22號檢測器斷面處的擬合優(yōu)度R2接近于96%,明顯高于其他模型。無論在時間還是空間上,CNN-BiLSTM的預(yù)測精度均優(yōu)于基準(zhǔn)模型,體現(xiàn)了該模型中CNN和BiLSTM組件分別具有出色的空間局部信息提取和時間序列預(yù)測能力,在交通流量波動較大時段或公路斷面,預(yù)測精度均較高,模型結(jié)果更接近真實值。
針對交通流量序列存在的時空相關(guān)性等特征,文中提出了一種結(jié)合CNN與BiLSTM各自優(yōu)點的CNN-BiLSTM模型。CNN-BiLSTM模型通過CNN和BiLSTM分別提取空間和時間特征,通過實例驗證分析表明:相比于其他基準(zhǔn)模型,文中的模型能夠較好地適應(yīng)不斷波動的交通流量數(shù)據(jù),早高峰和晚高峰預(yù)測的穩(wěn)定性和精度均較高。
同時,研究也存在一些不足:可以增加注意力關(guān)注時間序列中更重要的因素,充分利用交通流中3個參數(shù)分析交通流量;對外部因素,如雨、雪、交通事故、公路改線等的考慮上也要有所關(guān)注。以上這些都是未來的研究方向。