崔洪濤 陳曉旭 楊 超,3 項(xiàng) 煜 段紅勇
(1.河南省高速公路聯(lián)網(wǎng)監(jiān)控收費(fèi)通信服務(wù)有限公司,450018,鄭州;2.同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,201804,上海;3.同濟(jì)大學(xué)城市交通研究院,200092,上海;4.河南省交通一卡通有限責(zé)任公司,450018,鄭州//第一作者,高級工程師)
客流預(yù)測對于地鐵線路設(shè)計規(guī)劃、運(yùn)營管理以及預(yù)警都有著重要意義。當(dāng)前地鐵客流預(yù)測方法主要包括基于線性理論預(yù)測、基于非線性理論預(yù)測和基于組合模型預(yù)測的3種方法。線性預(yù)測模型主要包括時間序列法[1-3]和卡爾曼濾波模型[4]等。線性預(yù)測模型理論簡單,但是當(dāng)預(yù)測時間變短(小于15 min,甚至更短)時,隨著客流量的非線性與不確定性增強(qiáng),基于線性理論的預(yù)測模型預(yù)測性能就會變差。
地鐵客流具有非線性、隨機(jī)性、周期性的特點(diǎn),短時客流波動性與隨機(jī)性尤其較大,因此短時客流預(yù)測應(yīng)采用非線性模型進(jìn)行分析。常用的基于非線性理論的預(yù)測模型主要有非參數(shù)回歸模型[5]、馬爾可夫鏈[6]、神經(jīng)網(wǎng)絡(luò)[7]、支持向量機(jī)[8]等?;诜蔷€性理論的預(yù)測方法更加符合地鐵客流的非線性特點(diǎn),該方法只需根據(jù)歷史數(shù)據(jù)訓(xùn)練,從數(shù)據(jù)本身尋找演變規(guī)律,因此該方法需要大量的數(shù)據(jù)做支持,相應(yīng)的運(yùn)算量也會增大。
單一的線性或非線性預(yù)測模型往往存在一定的不足與缺陷。多種模型結(jié)合預(yù)測方法利用兩種或者兩種以上的預(yù)測方法進(jìn)行預(yù)測,既避免了每種方法的缺陷,同時又很好地繼承了各種方法的優(yōu)點(diǎn),預(yù)測精度也較單一預(yù)測模型有所提高。文獻(xiàn)[9]利用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行城市軌道交通線路流量的預(yù)測,構(gòu)建了基于混合核函數(shù)的支持向量機(jī)模型進(jìn)行進(jìn)站客流量預(yù)測,最后融合兩種預(yù)測方法構(gòu)建了基于灰色關(guān)聯(lián)度最大化的組合預(yù)測模型來預(yù)測重大節(jié)假日線路客流量。文獻(xiàn)[10]提出的城市軌道交通短時客流預(yù)測模型(EMD-BPN),包含經(jīng)驗(yàn)?zāi)B(tài)分解和反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)測模型的組合。文獻(xiàn)[11]提出了基于聚類搜索的改進(jìn)遺傳算法和小波神經(jīng)網(wǎng)絡(luò)(IGA-WNN)客流預(yù)測模型。
近年來深度學(xué)習(xí)有了充分的發(fā)展,當(dāng)前使用比較多的是深度神經(jīng)網(wǎng)絡(luò)。文獻(xiàn)[12]設(shè)計了深度長短期記憶網(wǎng)絡(luò)(DLSTM)模型,并利用DLSTM模型對石油產(chǎn)量進(jìn)行預(yù)測。本文首先對多源數(shù)據(jù)(地鐵IC卡數(shù)據(jù)、氣候數(shù)據(jù)和節(jié)假日數(shù)據(jù))進(jìn)行特征構(gòu)造,然后利用DLSTM模型進(jìn)行地鐵客流預(yù)測。本次研究選取深圳市2014年1—3月的地鐵刷卡數(shù)據(jù)進(jìn)行研究。選取前兩個月的數(shù)據(jù)為訓(xùn)練集,后一個月的數(shù)據(jù)為測試集。采用不同的DLSTM來預(yù)測地鐵客流,并與差分自回歸移動平均(ARIMA)模型、BP神經(jīng)網(wǎng)絡(luò)(BPNN)模型、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型和支持向量機(jī)(SVR)模型進(jìn)行比較。試驗(yàn)結(jié)果表明,DLSTM模型在準(zhǔn)確性方面優(yōu)于其他模型。
本次研究使用的數(shù)據(jù)來自深圳地鐵,包括2014年1—3月的地鐵IC卡數(shù)據(jù)、節(jié)假日數(shù)據(jù)和氣象數(shù)據(jù)。截至2014年底,深圳地鐵網(wǎng)由5條線路和118個站點(diǎn)組成,運(yùn)營里程為178 km,年度客流量為8.6億人次。地鐵IC卡數(shù)據(jù)格式如表1所示。
表1 2014年深圳市地鐵IC卡數(shù)據(jù)格式
首先對地鐵數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行處理。異常數(shù)據(jù)包括完全相同的記錄、刷卡時間字段有缺失的記錄。完成數(shù)據(jù)清理后,選取深圳北站地鐵站刷卡時間在6:00—23:00的地鐵IC卡數(shù)據(jù)記錄。此次研究對象為深圳北站地鐵站,因?yàn)樯钲诒闭臼侵匾慕煌屑~,客流量較大。前兩個月的數(shù)據(jù)用于訓(xùn)練模型,后一個月的數(shù)據(jù)用于測試驗(yàn)證。深圳北站地鐵站一周的進(jìn)出站客流量如圖1所示。
圖1 深圳北站地鐵站一周進(jìn)出站客流量
從圖1中可以看出:進(jìn)出站客流量都呈現(xiàn)出了一定的周期性,并且進(jìn)站客流量和出站客流量存在明顯的潮汐現(xiàn)象;早高峰的進(jìn)站客流量遠(yuǎn)遠(yuǎn)高于出站客流量,晚高峰的進(jìn)站客流量則遠(yuǎn)遠(yuǎn)低于出站客流量;工作日的客流量存在明顯的早晚高峰,周末的客流量變化相對平緩,不同的工作日之間又有一定的差異。
乘客選擇地鐵出行與天氣狀況以及是否是節(jié)假日有密切關(guān)系。文獻(xiàn)[13]對站點(diǎn)進(jìn)站客流量與天氣情況進(jìn)行了相關(guān)性分析,結(jié)果顯示相關(guān)性顯著。而客流量還與當(dāng)天是否是節(jié)假日也有很強(qiáng)的相關(guān)性。因此氣候數(shù)據(jù)集與節(jié)假日數(shù)據(jù)集也被用于構(gòu)造輸入特征。氣候數(shù)據(jù)集如表2所示,節(jié)假日數(shù)據(jù)集如表3所示。
表2 深圳市氣候數(shù)據(jù)格式
表3 節(jié)假日數(shù)據(jù)格式
在本次研究中,對地鐵IC卡數(shù)據(jù)、節(jié)假日數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行融合。選取客流量所在星期、小時、5 min間隔編號、是否節(jié)假日、平均氣溫、最高氣溫、最低氣溫、降雨量、大氣壓、風(fēng)速、云量、預(yù)測時刻的前6個時間間隔的客流量(例如預(yù)測9:00—9:05的客流量,用8:30—8:35、8:35—8:40、8:40—8:45、8:45—8:50、8:50—8:55、8:55—9:00的客流量來構(gòu)造特征)。因此,特征變量可以構(gòu)造訓(xùn)練數(shù)據(jù)集。
LSTM模型最初由文獻(xiàn)[14]作者提出,LSTM模型的主要目標(biāo)是解決RNN梯度消失且很難處理長序列數(shù)據(jù)的問題。LSTM模型由輸入層、循環(huán)隱藏層和輸出層組成。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同,LSTM模型隱藏層的基本單元是記憶模塊。記憶模塊包含細(xì)胞狀態(tài)單元(CEC)和3個稱為門的特殊運(yùn)算單元。CEC在整個鏈中直接向下運(yùn)行而沒有任何激活功能,因此當(dāng)運(yùn)用反向傳播算法訓(xùn)練LSTM模型時梯度不會消失。記憶模塊包含輸入門、遺忘門和輸出門3個門結(jié)構(gòu),它們可以控制記憶模塊內(nèi)的信息流。LSTM模型記憶模塊的原理如圖2所示。遺忘門確定單元狀態(tài)拋出哪些信息,輸入門決定哪些新信息存儲在單元狀態(tài)中,輸出門決定單元狀態(tài)的哪些信息作為輸出。
圖2 LSTM記憶模塊原理圖
模型輸入為:X=(X1,X2,…,XT),隱藏層狀態(tài)可以通過以下循環(huán)訓(xùn)練得到:
ft=σ(XtUf+St-1Wf+bf)
(1)
it=σ(XtUi+St-1Wi+bi)
(2)
Ct=Ct-1?ft⊕it?tanh(XtUc+St-1Wc+bc)
(3)
ot=σ(XtUo+St-1Wo+bo)
(4)
St=ot?tanh(Ct)
(5)
式中:
Wf、Wi、Wo、Wc——分別為遺忘門、輸入門、輸出門和CEC的輸入權(quán)重矩陣;
Uf、Ui、Uo、Uc——分別為遺忘門、輸入門、輸出門和CEC的循環(huán)權(quán)重矩陣;
bf、bi、bo、bc——分別為忘記門、輸入門、輸出門和CEC的偏差向量;
Xt——第一層LSTM模型記憶模塊的輸入;
ft、it、ot、Ct、St———分別為t時刻忘記門、輸入門、輸出門、CEC和單元的輸出;
St-1——t-1時刻單元的輸出;
Ct-1——t-1時刻CEC的輸出;
⊕和?——分別代表向量求和與向量點(diǎn)積運(yùn)算;
σ(·)——標(biāo)準(zhǔn)sigmoid函數(shù);
tanh(·)——雙曲正切激活函數(shù)。
在DLSTM模型中,將多個LSTM模型塊進(jìn)行連接,如圖3所示。DLSTM模型可以結(jié)合每個LSTM模型層的優(yōu)點(diǎn)。在分層體系結(jié)構(gòu)中,堆疊多個LSTM模型可以在較低層構(gòu)建特征。這些特征可以將輸入數(shù)據(jù)中的變化因素,利用非線性轉(zhuǎn)化在較高層映射輸出。文獻(xiàn)[15]認(rèn)為在大型或復(fù)雜數(shù)據(jù)情況下,深層次的架構(gòu)將比淺層架構(gòu)更能反映出數(shù)據(jù)的內(nèi)在聯(lián)系。
圖3 DLSTM 模型結(jié)構(gòu)
St-1,1為上一個狀態(tài)的第一層的輸出,St為現(xiàn)在狀態(tài)的第一層輸出且是下一個LSTM模型記憶模塊的輸入。對于第二個LSTM模型記憶模塊,由上一個狀態(tài)的St-1,2和現(xiàn)在狀態(tài)上一層的輸出St,1就可以計算得到該記憶模塊的輸出St,2。后面各層的計算原理都是相同。
為了全面地評價模型的預(yù)測效果,本文選取平均絕對誤差(EMA)、均方根誤差(ERMS)、平均絕對百分比誤差(EMAP)作為模型評價指標(biāo)。這3個指標(biāo)可以反映預(yù)測值與實(shí)際值之間的誤差大小,其定義分別為:
(6)
(7)
(8)
式中:
h(i)——預(yù)測值;
f(i)——真實(shí)值。
利用DLSTM模型分別對深圳北站地鐵站的進(jìn)站客流量和出站客流量進(jìn)行預(yù)測。并且與其它模型預(yù)測結(jié)果進(jìn)行比較,比較模型分別為差分自回歸移動平均模型(ARIMA)、BP神經(jīng)網(wǎng)絡(luò)(BPNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、支持向量機(jī)(SVR)。
設(shè)計了3種不同層數(shù)的DLSTM模型,分別對進(jìn)站客流量進(jìn)行預(yù)測。不同結(jié)構(gòu)的DLSTM模型參數(shù)以及預(yù)測評價指標(biāo)結(jié)果如表4所示,不同DLSTM模型結(jié)構(gòu)的客流量預(yù)測結(jié)果如圖4所示。
表4 不同DLSTM模型的進(jìn)站客流量預(yù)測評價指標(biāo)
由表4可知,隨著DLSTM模型的深度增加,預(yù)測精度變高。DLSTM3模型的精度為:EMA=32.33,ERMS=45.74,EMAP=13.90%。
圖4 不同DLSTM模型的進(jìn)站客流量預(yù)測結(jié)果
從圖4中可以看出,DLSTM模型具有較好的預(yù)測效果,并且DLSTM3模型的預(yù)測值曲線和真實(shí)值曲線差異最小。
不同預(yù)測模型的進(jìn)站客流量預(yù)測評價指標(biāo)如表5所示,不同預(yù)測模型的進(jìn)站客流預(yù)測結(jié)果如圖5所示。
表5 不同預(yù)測模型的進(jìn)站客流量預(yù)測評價指標(biāo)
由表5可知,DLSTM3模型的預(yù)測精度最高。在所有的比較模型中,RNN模型預(yù)測效果最好,而SVR模型的預(yù)測效果最差。DLSTM3模型與SVR模型相比較,EMA降低了30.14,ERMS降低了25.62,ERMS降低了20.88%。DLSTM3模型與RNN模型相比較,EMA降低了10.05,ERMS降低了12.84,ERMS降低了2.29%。
圖5 不同預(yù)測模型的進(jìn)站客流量預(yù)測結(jié)果
由圖5可見,DLSTM3模型的預(yù)測值曲線和真實(shí)值曲線差異性最小,而SVR模型的預(yù)測值曲線和真實(shí)值曲線差異最大。
本文提出利用深度長短期記憶網(wǎng)絡(luò)(DLSTM)方法預(yù)測地鐵進(jìn)站客流量。首先,對地鐵刷卡數(shù)據(jù)、氣候數(shù)據(jù)和節(jié)假日數(shù)據(jù)進(jìn)行預(yù)處理并完成特征構(gòu)造。對深圳北站地鐵站進(jìn)站客流量進(jìn)行試驗(yàn)驗(yàn)證,設(shè)計了不同的DLSTM模型,對各模型的預(yù)測結(jié)果進(jìn)行對比分析。結(jié)果表明,DLSTM模型預(yù)測準(zhǔn)確度隨著DLSTM模型深度的增加而提高。然后,將DLSTM模型預(yù)測結(jié)果與其它4種模型(ARIMA、BPNN、RNN、SVR)的預(yù)測結(jié)果進(jìn)行比較,結(jié)果表明,DLSTM 的預(yù)測精度更高。充分驗(yàn)證了深度長短期記憶網(wǎng)絡(luò)方法在地鐵客流預(yù)測中的適用性和準(zhǔn)確性。在下一步的研究中,將考慮DLSTM模型與其他模型結(jié)合起來建立組合模型。