張 瑞,席一丹,白惠君,周曉淵,韓峰宇
(太原工業(yè)學院,山西太原 030008)
交通事故是一種嚴重的公共安全問題,對人民生命財產(chǎn)安全和社會穩(wěn)定造成了巨大的影響。在當前交通管理的實踐中,交通流預測是實現(xiàn)交通管控和優(yōu)化交通系統(tǒng)運行的關鍵技術之一。交通流是指一定時間內(nèi)通過道路或交通網(wǎng)絡的車輛數(shù)量、速度和密度等交通參數(shù)的總體表現(xiàn)。通過對交通流進行預測,可以為路線規(guī)劃、交通管理等方面提供決策支持。
自20世紀開始,部分國家開始投入大量精力對交通管控技術進行研究,于是,交通流預測的各種模型也就應運而生。目前,常用的預測模型主要包括傳統(tǒng)統(tǒng)計學模型、機器學習模型、深度學習模型。傳統(tǒng)統(tǒng)計學模型應用于交通流時間較早,包括時間序列模型(Time-Series Model)、卡爾曼濾波模型(Kalman Filtering Model)等。徐翠翠等人[1]使用ARIMA 模型進行城市交叉路口交通流預測建模,該模型能夠準確地預測早高峰和晚高峰時段的交通流。為了提高交通流預測的準確性,楊紫煜等人[2]提出了一種新的方法,根據(jù)卡爾曼濾波理論,利用重構后的相位作為卡爾曼濾波的初始值進行預測。然而,由于統(tǒng)計學模型依賴于先驗知識設定模型的參數(shù),其算法結構相對簡單,不能夠深入挖掘交通流的深層次特征信息。與此相比,機器學習模型在處理非線性、非平穩(wěn)序列方面具有優(yōu)勢。何祖杰等人[3]提出了一種基于IGWO-SVM 的短期交通流預測模型,通過與實際數(shù)據(jù)進行對比分析,結果表明該模型具有良好的預測能力。
深度學習是現(xiàn)在研究的焦點,自2010年以來熱度增長迅速。深度學習模型應用于許多領域,包括空氣污染預測[4]、股票市場預測[5]、物理[6]等。循環(huán)神經(jīng)網(wǎng)絡模型(Recurrent Neural Network,簡稱RNN)[7]在序列預測任務中取得了顯著的成績。Hochreater 和Schmidhuber[8]提出了長短期記憶(Long Short term Memory,簡稱LSTM)神經(jīng)網(wǎng)絡來解決RNN 的梯度爆炸和梯度消失問題。李雪梅等人[9]使用基于雙向長短期記憶網(wǎng)絡(Bi-direction Long Short Term Memory,簡稱Bi-LSTM)的預測模型利用雨天和非雨天、工作日和非工作日影響因子分別對交通流進行預測,并與LSTM 進行比較,結果表明Bi-LSTM 的預測效果較好。滕騰等人[10]采用堆疊式長短期記憶網(wǎng)絡(Stack Long Short Term Memory Network,簡稱SLSTM)模型對長期狀態(tài)進行處理。在SLSTM 模型中,存在多個隱藏LSTM 層,每層包含多個LSTM 單元,上層的LSTM 結構輸出一個隱藏狀態(tài)序列,輸入到下一層結構中,可以更好地捕捉信息。李楷等人[11]提出了一種SLSTM 神經(jīng)網(wǎng)絡來對交通流進行短期預測,結果表明所提出方法優(yōu)于常用的機器學習和經(jīng)典的LSTM 方法。
然而,交通流的預測受到許多因素的影響。Niam Archana 等人[12]通過利用過去和當前的交通和天氣信息捕捉交通和降雨數(shù)據(jù)之間的時空相關性,得出降雨對道路交通流預測具有影響。Attallah Mustafa 等人[13]提出了一種實時高分辨率天氣雷達數(shù)據(jù)與交通流數(shù)據(jù)融合的預測模型,通過與無天氣雷達數(shù)據(jù)模型對比,得出天氣因素對交通流預測有較大影響。由于交通流的復雜性和不確定性,預測模型存在著預測精度不高和預測滯后等問題,因此需要尋求更加高效和精確的交通流預測方法,學者們對此問題展開了廣泛的研究。劉兵等人[14]采用物聯(lián)網(wǎng)與大數(shù)據(jù)相結合的模型,提高了預測精度,減小了預測滯后。陸百川等人[15]分析了交通流的時空特征和數(shù)據(jù)特征,建立了空間鄰接矩陣;其次,通過時空相關性函數(shù)量化不同時間延遲對交通的影響,并結合神經(jīng)網(wǎng)絡構建了交通流預測模型,使預測結果更加精準。
盡管交通流預測已經(jīng)取得了一定的成果,但其預測精度和預測滯后等問題仍然需要提高和改進。為了解決這些問題,本文提出了WT-SLSTM(Wavelet Transform and Stacked Long Short Term Memory)模型。具體而言,首先,采用小波變換將最初的短時交通流分解成在各個尺度空間和小波空間上的時間序列信號;接著,將各個時間序列信號傳遞到SLSTM 神經(jīng)網(wǎng)絡模型中,在調(diào)整學習率、滯后時間和批量大小等參數(shù)的基礎上進行預測;最后,將各信號的預測值進行小波重組,得到最終預測值。為了證明WT-SLSTM 模型的優(yōu)越性,本文對北京市出租車車流量數(shù)據(jù)進行了預處理,并使用預處理后的數(shù)據(jù)進行訓練和預測;從常用評價指標和折線圖兩個方面對預測性能進行了比較。試驗結果表明,WT-SLSTM 模型優(yōu)于基準模型,極大地提高了交通流預測的精度。
LSTM 神經(jīng)網(wǎng)絡模型是RNN 的一種重要變體,由Hochreater 和Schmidhuber 于1997年首次提出。相比于傳統(tǒng)的RNN 模型,LSTM 神經(jīng)網(wǎng)絡模型引入了輸入門f(t),遺忘門i(t)和輸出門o(t),以實現(xiàn)更好的信息處理和傳遞能力。在神經(jīng)網(wǎng)絡的訓練過程中,通過門結構增添和遺忘信息,不同的神經(jīng)網(wǎng)絡可以通過其單元狀態(tài)上的門結構來選擇性地記住或遺忘哪些信息。f(t)、i(t)、o(t)分別對t時刻時上一單元的隱藏狀態(tài)ht-1和當前輸入xt進行初步特征提取。LSTM 模型單元運算包括以下幾個步驟:首先,在遺忘門中輸入信息并激活函數(shù)來選擇要丟棄的信息,公式如式(1):
然后,輸入門i(t)決定哪個狀態(tài)要更新,將該狀態(tài)與tanh激活函數(shù)所生成的向量c'(t)相加,計算公式如式(2)~式(4):
最后,輸出門產(chǎn)生最終輸出,計算公式如式(5)、式(6):
式中:Wf、Wt、Wo、Wc表示遺忘門、輸入門、輸出門和記憶單元的權重系數(shù)矩陣;bf、bt、bo、bc表示遺忘門、輸入門、輸出門和記憶單元的偏置條件。
在2015年,Dyer 等學者[16]提出了SLSTM 模型,該模型是LSTM 模型的改進形式,由多個LSTM 層和一個Softmax 函數(shù)組成。由于單一的LSTM 神經(jīng)網(wǎng)絡在提取時間序列數(shù)據(jù)方面的能力有限,所以通常將多個LSTM單元組合起來進行訓練以提高模型的精度。隨著層數(shù)的增加,輸入觀察時間的抽象級別也增加。此外,多個LSTM 單元的輸入值和輸出值之間僅有一些微小的區(qū)別,在本質(zhì)上仍然是一致的。相比于傳統(tǒng)的LSTM,SLSTM 不僅考慮當前時刻的輸入值,還考慮了上一時刻的輸入值。因此,SLSTM 模型的隱藏層更加深入,比LSTM 內(nèi)部的記憶單元更有助于預測。其3 層時序結構如圖1所示。
圖1 3層LSTM 時序結構
小波變換是一種基于多尺度分析的信號處理方法,其基本思想是通過取樣頻率和多分辨率分析確定原信號的近似空間Vj,以便更好地反映原信號的各種信息。通過對原信號進行分解,得到近似部分Ca1和細節(jié)部分Cd1。然后可選取近似部分或細節(jié)部分繼續(xù)分解。小波變換的原理圖如圖2所示。如果需要對原信號進行數(shù)據(jù)壓縮,則可以舍棄值比較小的Cdj-1分量,這不會明顯改變原信號的特征,但可以大大提高數(shù)據(jù)壓縮的效果。當Cdj-1分量被修改完成后,需要重構算法重新組裝被過濾或壓縮的信號。
圖2 小波變換原理圖
本文提出了一種新穎的混合WT-SLSTM 模型,用于預測短時交通流。該模型結合了數(shù)據(jù)分解手段和SLSTM 神經(jīng)網(wǎng)絡,可以分為3 個主要部分:數(shù)據(jù)分解、子信號預測和小波重組。圖3 展示了整體預測框架。
圖3 WT-SLSTM 模型流程圖
首先,為了降低原始交通流數(shù)據(jù)的復雜度,同時提高預測精度,采用小波分解方法將原始交通流數(shù)據(jù)分解成k個子信號。接下來,每個子信號對應于一個通道,并利用SLSTM 神經(jīng)網(wǎng)絡分別預測各個子信號。在此過程中,調(diào)整SLSTM 神經(jīng)網(wǎng)絡的參數(shù),并選擇最佳擬合模型。最后,每個子信號的預測值被重構以實現(xiàn)最終的短時交通流預測。具體而言,每個子信號輸出一個m維向量,采用小波重組獲得最終交通流預測值。
為了更準確地評估模型的預測能力和驗證方法的有效性,本文采用平均絕對誤差(Mean Absolute Error,記作MAE)、均方根誤差(Root Mean Square Error,記作RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,記作MAPE)和相關系數(shù)(Coefficient of determination R squared,記作R2)作為預測性能指標。每個評估指標的計算公式如式(7)~式(10):
本文采用北京市出租車軌跡數(shù)據(jù),時間跨度為一周。數(shù)據(jù)采樣時間間隔為100 s,選取東經(jīng)116.4°至116.408°,北緯39.9°至39.906°的區(qū)域。為了確保數(shù)據(jù)的可預測性,夜間車流量幾乎為零的時間段已被剔除。最終整理出該區(qū)域周一至周四每天從第10 000 s 至76 400 s 所對應的車流量數(shù)據(jù),如圖4所示。
圖4 時間-車流量折線圖
鑒于車流量數(shù)據(jù)在不同時段有不同數(shù)量級,為消除對預測結果的影響,將其進行標準化,公式如式(11)所示:
式中:mean(x)是樣本均值;std(x)是樣本標準差。
經(jīng)過預處理后,將車流量數(shù)據(jù)按照10∶1 的比例劃分為訓練集和測試集。首先,將訓練集輸入到SLSTM模型中,隱藏層狀態(tài)變量的維度為128,學習率為0.001,迭代次數(shù)為200 次,使用PMSprop 優(yōu)化器進行訓練。預測結果與測試集數(shù)據(jù)進行比較,采用MAE、RMSE、MAPE、R2作為指標對模型進行綜合評估。預測結果表明,MAE、RMSE和MAPE的值分別為2.44、3.02 和19.87,R2的值為0.12,擬合效果較差。
為了解決單個SLSTM 模型預測效果差的問題,引入小波變換,以此優(yōu)化SLSTM 模型。于是,基于深度學習TensorFlow 框架,建立WT-SLSTM 神經(jīng)網(wǎng)絡模型。首先,對數(shù)據(jù)進行小波分解。將訓練集分解為近似部分Ca1和細節(jié)部分Cd1,再將Ca1分解為近似部分Ca2和細節(jié)部分Cd2,繼而將Ca2分解為近似部分Ca3和細節(jié)部分Cd3。分解結果如圖5所示。接著,分別將Ca3,Cd1,Cd2和Cd3分別輸入SLSTM 神經(jīng)網(wǎng)絡模型進行訓練和預測。模型輸入為各個小波分量,輸出層為各分量預測值,滯后時間為4,時間步長為1,學習率為0.001,迭代次數(shù)為200 次,使用PMSprop 優(yōu)化器進行訓練。最后,將各小波分量預測值進行小波重組,并進行反標準化,從而得到出租車車流量的最終預測值。
圖5 小波變換預測結果
預測過程結束后,將預測結果和測試集數(shù)據(jù)進行比較,選取MAE、RMSE、MAPE、R2為度量指標來綜合評估預測結果。為了驗證WT-SLSTM 模型的有效性,將其與基準模型進行對比,包括決策樹(DT)、隨機森林(RF)、LSTM、SLSTM 模型。評估結果如表1所示。總體上,深度學習模型(LSTM、SLSTM、WT-SLSTM)優(yōu)于機器學習模型(DT,RF)。在深度學習模型中,加入了小波變換后預測效果得到了顯著提升。WT-SLSTM 模型與SLSTM 模型相比,MAE、RMSE、MAPE分別減小了49.18%,49.66%,9.47%,R2提升了6.41 倍;與LSTM 模型相比,MAE、RMSE、MAPE分別減小了50.59%,50.48%,10.18%,R2提升了8.55 倍。因此,WT-SLSTM 模型擬合效果優(yōu)于基準模型。
表1 預測性能評價表
為了進一步驗證WT-SLSTM 模型的預測性能,繪制實際值和預測值的對比曲線圖,如圖6所示。DT、RF、LSTM 和SLSTM 模型的預測曲線存在滯后現(xiàn)象和偽峰現(xiàn)象。相比之下,WT-SLSTM 模型修正了這種現(xiàn)象,預測效果更佳。然而,同時也觀察到WT-SLSTM 模型的預測峰值低于觀測值。隨著預測時間的增加,模型逐漸難以預測出與觀測值高度一致的值,這可能是由于出租車扎堆現(xiàn)象較為少見所致。一方面,為了準確預測,模型需要大量的觀測數(shù)據(jù);另一方面,出租車扎堆現(xiàn)象并不常見,因此WT-SLSTM 模型難以學習到某些極端峰值,導致低估預測結果。
圖6 對比折線圖
綜上所述,WT-SLSTM 模型的預測效果明顯優(yōu)于其他基準模型,具體表現(xiàn)在預測誤差小、與真實值數(shù)據(jù)匹配度高、擬合程度更好。對于傳統(tǒng)的LSTM 模型,SLSTM 模型提取和儲存數(shù)據(jù)的效果更好、預測精度更高。然而SLSTM 模型對時間序列數(shù)據(jù)的提取能力有限,本文通過加入小波變換來彌補該問題。小波變換可以覆蓋整個頻域,對時間頻率的局部化進行分析,還能通過伸縮平移運算對信號逐步進行多尺度細化。本文利用其高頻處時間細分、低頻處頻率細分的特點,再結合SLSTM 模型,從本質(zhì)上分析了交通流序列的頻率構成,提高了預測精度,獲得了較好的預測效果。
本文結合小波變換與SLSTM 神經(jīng)網(wǎng)絡模型,對北京市出租車車流量進行預測研究。實證結果顯示,與基準模型相比,WT-SLSTM 模型的預測效果明顯提升,預測值更加接近真實值。因此,本文提出的WT-SLSTM 神經(jīng)網(wǎng)絡模型在交通流預測方面效果較好,性能更加穩(wěn)定,可以更好地掌握交通動態(tài),為交通部門制定和實施政策提供參考。