魏姝瑤,張 瑾
(昆明理工大學(xué) 交通工程學(xué)院, 昆明 650504)
2019年12月武漢市發(fā)現(xiàn)新型冠狀病毒后,為了抑制病毒的快速蔓延,國家采取了一系列全國范圍內(nèi)的交通管制措施,這些政策性措施對鐵路客運組織造成了巨大沖擊[1]。目前鐵路運營管理仍舊是依靠調(diào)度員的經(jīng)驗來判斷客流變化,這就造成部分鐵路部門應(yīng)對像新冠肺炎這樣的重大公共衛(wèi)生突發(fā)事件的能力和準(zhǔn)備不足,難以適應(yīng)客流的波動特征[2]。因此,有必要研究鐵路突發(fā)性事件的短時客流預(yù)測問題,為運營管理提供理論依據(jù)。
鐵路客流短時預(yù)測的方法大致可分為線性模型、非線性模型和組合模型3種[3]。時間序列模型作為最傳統(tǒng)的線性客流預(yù)測方法,如Zhu[4]通過n日移動平均客流量指標(biāo),建立ARlMA模型預(yù)測上海地鐵客流的變化情況;Rusyana等[5]運用SARIMA季節(jié)模型將數(shù)據(jù)建模為依賴于前一個季節(jié)的值而不是之前的原始序列值,應(yīng)用這種方法更加精確地預(yù)測了吉隆坡國際機場入境游客數(shù)量。這類模型的缺陷在于只關(guān)注數(shù)據(jù)在時間維度上的變化特征,通過測量其相關(guān)性和變化趨勢來建立模型并用于預(yù)測,但顯然還有許多其他因素和信息尚未參考,如難以捕捉的空間維度信息等。因此,經(jīng)典時間序列模型對于復(fù)雜的多變量非線性關(guān)系的建模并不理想。隨著數(shù)據(jù)采集手段的進步和歷史數(shù)據(jù)量的增加,以神經(jīng)網(wǎng)絡(luò)為代表的非線性模型發(fā)展迅速,在模式識別、樣本分類、預(yù)測等領(lǐng)域得到廣泛應(yīng)用,如Sha等[6]提出了一種基于RNN的地鐵客流預(yù)測方法,但是隨著相關(guān)理論知識的不斷完善,發(fā)現(xiàn)RNN不能很好地處理遠距離依賴的問題;Liu等[7]將LSTM模型應(yīng)用于短時客流預(yù)測,解決了RNN在訓(xùn)練期間梯度消失的問題。Chen等[8]則針對長短期記憶(LSTM)模型在城市交通流預(yù)測中準(zhǔn)確率低的問題,提出了一種基于注意機制的LSTM模型。該模型計算每個過去值和當(dāng)前值之間的相關(guān)性,為這些過去值分配不同的權(quán)重,并衡量它們對當(dāng)前值的重要性。為了更加充分地發(fā)揮二者在線性方面和非線性方面的互補優(yōu)勢,近年來,出現(xiàn)了將以上2種方法混合建模的發(fā)展趨勢,如ARIMA和BP神經(jīng)網(wǎng)絡(luò)[9]、ARIMA模型和小波神經(jīng)網(wǎng)絡(luò)[10]等組合模型。因為隨著經(jīng)濟的快速發(fā)展,軌道交通給人們帶來快速便捷出行方式的同時,不可否認線路的日益復(fù)雜和客流的迅速增加也給鐵路運營的調(diào)試和管理帶來了巨大的壓力,而運用組合模型預(yù)測短時客流對緩解軌道交通壓力具有重要意義。
上述組合模型的研究雖有助于短期客流預(yù)測,但是都缺少對短期異??土黝A(yù)測的關(guān)注。本文將因新冠疫情對春運期間日客流量造成的異常波動稱之為異常客流。在面對新冠肺炎疫情這樣的突發(fā)事件時,客流的變化具有很大不確定性,所以降低了歷史數(shù)據(jù)的參考價值。因此,對于罕見的相似樣本(例如在春運期間本該持續(xù)上升的客流量卻因疫情防控的管制而持續(xù)大幅下降的現(xiàn)象所產(chǎn)生的數(shù)據(jù)樣本)和不確定的發(fā)展趨勢,短期異??土黝A(yù)測是困難的。在研究疫情期間客流的估計問題時,根據(jù)相關(guān)研究和實例分析,SARIMA模型在基于相似歷史樣本的線性回歸中具有優(yōu)勢,能夠很好地進行客流預(yù)測。然而,對于罕見的相似樣本,就需要結(jié)合非線性分析來減弱SARIMA季節(jié)模型局限性帶來的誤差。因此,提出SARIMA-LSTM滾動優(yōu)化模型,在SARIMA線性回歸基礎(chǔ)上,增加LSTM神經(jīng)網(wǎng)絡(luò)模型,運用滾動優(yōu)化的方法進行訓(xùn)練。同時,受自然語言處理中注意力機制的巨大成功的啟發(fā),基于交通流數(shù)據(jù)也是時間序列數(shù)據(jù)的事實,嘗試將注意力機制加入LSTM模型中,并將該模型應(yīng)用于短時交通流預(yù)測領(lǐng)域,以反映罕見的大隨機波動。
春運期間鐵路日客流量有明顯的季節(jié)性和周期性波動現(xiàn)象,為了處理這類時間序列問題,采用季節(jié)性時間序列模型(SARIMA),即SARIMA(p,d,q)(P,D,Q)S。其中p和P分別表示自回歸和季節(jié)自回歸的順序;d和D分別代表著根據(jù)不同差異和不同季節(jié)差異進行的排列組合;q和Q分別表示移動平均線和季節(jié)移動平均線的順序[11]。公式如下:
(1)
其中,
φ(BS)=1-φ1BS-…-φpBS
?(BS)=1+?1BS+…+?qBS
由于疫情期間很少有相似的歷史數(shù)據(jù),SARIMA模型也無法反映異常的客流波動。因此,設(shè)計了滾動優(yōu)化方法來訓(xùn)練長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò),充分利用實時數(shù)據(jù),及時反映異常波動。LSTM神經(jīng)網(wǎng)絡(luò)的核心是增加存儲器神經(jīng)元和柵極控制單元,存儲神經(jīng)元通過存儲當(dāng)前信息和提取數(shù)據(jù)將信件填充到時間序列鏈中[12]。因此,以較早的時間為單位的信息可以以較晚的時間為單位傳輸,從而減緩信息丟失的速度,提高信息存儲容量。LSTM網(wǎng)絡(luò)的神經(jīng)元結(jié)構(gòu)如圖1所示。Xt、ht和Ct分別表示時間t的輸入向量、隱藏狀態(tài)和單元狀態(tài)。相應(yīng)的LSTM正向傳播方程[13]如下:
it=σ(Wiixt+Whiht-1+bi)
(2)
ft=σ(Wifxt+Whfht-1+bf)
(3)
gt=tanh(Wigxt+Whght-1+bg)
(4)
Ot=σ(Wioxt+Whoht-1+bo)
(5)
Ct=ft*Ct-1+it*gt
(6)
ht=Ot*tanh(Ci)
(7)
其中:it、ft、gt分別是輸入門、遺忘門和輸出門;Wii、Whi、bi分別是輸入權(quán)重矩陣、回歸權(quán)重矩陣和輸入門的偏差項;Wif、Whf、bf分別是輸入權(quán)重矩陣、回歸權(quán)重矩陣和遺忘門的偏差項;Wig、Whg、bg分別是輸入權(quán)重矩陣、回歸權(quán)重矩陣和輸入層到隱藏層的偏差項;Wio、Who、bo分別是輸入權(quán)重矩陣、回歸權(quán)重矩陣和輸出門的偏差項;σ代表sigmoid函數(shù)。
圖1 LSTM網(wǎng)絡(luò)的神經(jīng)元結(jié)構(gòu)示意圖
由于時間相關(guān)性有一定的社會原因,任何一天的乘客需求都會受到其他時間的影響,特別是受到相鄰時間段的影響。為了表示這種相關(guān)性,運用滾動優(yōu)化預(yù)測算法,這種算法在模型預(yù)估時,每個采樣時刻都要根據(jù)當(dāng)前的預(yù)估誤差重新計算控制作用的變化量,不斷滾動計算。就算是遇到類似新冠疫情的重大公共衛(wèi)生突發(fā)事件,也能通過這種累計方法使預(yù)測值始終處于一種動態(tài)平衡狀態(tài)。
本文中建立的組合預(yù)測模型結(jié)合了2種性能互補算法,有效克服了單一算法在預(yù)測方面的局限性,提高了預(yù)測精度。因為SARIMA模型可以很好地擬合序列中的線性關(guān)系,LSTM神經(jīng)網(wǎng)絡(luò)可以挖掘序列中的非線性關(guān)系。通過2種模型的結(jié)合,可以發(fā)揮兩者的優(yōu)勢,對復(fù)雜時間序列進行有效預(yù)測。而鐵路短時客流因受新冠疫情影響,形成了2條不同特征的客流曲線,這就是一種復(fù)雜的時間序列。
因此,采用Attention Mechanism的方法,可以幫助模型對輸入的X每個部分賦予不同的權(quán)重,抽取出更加關(guān)鍵及重要的信息,使模型做出更加準(zhǔn)確的判斷,同時不會對模型的計算和存儲帶來更大的消耗[15]。把SARIMA模型的異常值代入LSTM神經(jīng)網(wǎng)絡(luò)后,訓(xùn)練集數(shù)據(jù)波動較大,隨著網(wǎng)絡(luò)深度的不斷加深,會造成網(wǎng)絡(luò)退化問題。而AttentionMechanism機制的引入有效緩解了網(wǎng)絡(luò)模型訓(xùn)練過程中反向傳播梯度消失的問題,還解決了深度網(wǎng)絡(luò)的訓(xùn)練難度和性能下降的問題[16]。注意力層的實現(xiàn)是由LSTM編碼器保留輸入序列的中間輸出結(jié)果,計算前一層的中間輸出結(jié)果與當(dāng)前輸出的相似度,得到權(quán)重因子,最后得到注意力系數(shù),如圖2所示。
圖2 在LSTM模型中增加注意力機制的過程示意圖
H=[h1,h2…h(huán)n]
(8)
(9)
(10)
(11)
(12)
式中,首先使用向量H和H′進行計算獲得權(quán)重的相似度,其次使用softmax功能對權(quán)值進行歸一化,然后使用歸一化權(quán)值ai和hj加權(quán)求和,最后得出的結(jié)果就是注意力權(quán)重值Ci。
本文以南昌火車站春運期間的原始客流數(shù)據(jù)為依據(jù)作出客流時序圖。從圖3(a)中可以發(fā)現(xiàn),2015—2019年春運期間鐵路局的日客流量呈周期性上升狀態(tài),而2020年本應(yīng)上升的趨勢卻因新冠疫情的影響,導(dǎo)致了春運期間總客流量同比2019年下降53.6%。2021年在疫情常態(tài)化背景下,“就地過年”成為越來越多人的選擇,客運量較往年降幅依然明顯,雖然比2020年同比增長11.2%,但也僅為疫情前正常年份的51.6%。
圖3 2015—2021年春運期間日客流量曲線
通過分析圖3(b)可以發(fā)現(xiàn),2020年春運前14 d符合春運周期性變化趨勢,然而從1月24日(除夕)開始鐵路日客流量呈現(xiàn)斷崖式下降。所以,首先利用2015—2019年南昌站春運期間前14 d的客流數(shù)據(jù)建立SARIMA季節(jié)模型,預(yù)測2020年前14 d的日客流量,從第15 d開始因受疫情影響,將其導(dǎo)入LSTM滾動優(yōu)化模型進行計算,得到后26 d非線性預(yù)測模型的計算結(jié)果。最后為精度評定,除了將預(yù)測值與2020春運實測值進行比較外,還使用了SARIMA季節(jié)模型和門控循環(huán)單元網(wǎng)絡(luò)(GUR)來預(yù)測樣本,比對預(yù)測數(shù)據(jù),驗證預(yù)測模型。
結(jié)合SARIMA季節(jié)模型與LSTM滾動優(yōu)化神經(jīng)網(wǎng)絡(luò),構(gòu)建組合預(yù)測模型,算法流程如圖4所示,對疫情期間鐵路春運日客流進行預(yù)測,該模型輸入數(shù)據(jù)為南昌站2015—2019年春運40 d的原始客運量,輸出數(shù)據(jù)為用組合模型預(yù)測出的2020年春運日客流量。
圖4 算法流程框圖
對在疫情期間鐵路春運客流量的原始數(shù)據(jù)進行去均值化處理。通過一階差分后,對數(shù)據(jù)的平穩(wěn)性進行檢驗,使用的是單位根檢驗(即ADF),表1顯示的t統(tǒng)計值為-4.306,明顯比各顯著水平的臨界值小,故差分后的序列可以通過平穩(wěn)性檢驗。
表1 ADF檢驗
通過繪制自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)對模型進行定階。如果有一個進入藍色置信區(qū)域(一般取95%)的點,并且在其之后的點大部分都在此區(qū)域內(nèi)浮動,該點就可以暫定為q和p的值,如圖5和圖6所示。
圖5 自相關(guān)圖(ACF)
圖6 偏自相關(guān)圖(PACF)
通過赤池信息準(zhǔn)則(AIC)對上述函數(shù)所產(chǎn)生的所有參數(shù)項進行評估,篩選后得出在SARIMA(1,1,1)*(0,1,1,12)時,AIC最小。由此,可以利用SARIMA模型通過2015—2019年春運前14 d預(yù)測2020年春運前14 d的客流量。
通過時間序列對數(shù)據(jù)的處理,發(fā)現(xiàn)春運第15 d開始因受疫情影響,日客流量大幅度下降,這與上階段數(shù)據(jù)分析中的結(jié)果相吻合。因此,從第15 d開始的客流量定義為異常值,將其權(quán)重置零,即讓SARIMA特征檢測器暫時停止工作,導(dǎo)入LSTM神經(jīng)網(wǎng)絡(luò)進行計算。首先通過輸入層將預(yù)處理后的輸入數(shù)據(jù)傳輸?shù)较乱粚?并在神經(jīng)網(wǎng)絡(luò)中嵌入了注意機制模塊,在Attention LSTM模型的構(gòu)建中確定網(wǎng)絡(luò)的結(jié)構(gòu)。將輸入層的大小設(shè)置為輸入系列長度,隱藏層編號設(shè)置為2,把歷史數(shù)據(jù)和最新數(shù)據(jù)共同作為訓(xùn)練集數(shù)據(jù),對新的訓(xùn)練集數(shù)據(jù)持續(xù)學(xué)習(xí),不斷調(diào)整模型參數(shù),滾動更新數(shù)據(jù)變化,找出最新規(guī)律,以提高預(yù)測的準(zhǔn)確率。運算過程中產(chǎn)生了殘差學(xué)習(xí)單元,把它們組成殘差模塊,該單元主要由2個分支組成,第一個是殘差學(xué)習(xí)分支,另一個是輸入的身份映射分支。用X表示輸入,F(x)表示殘差映射,那么殘差學(xué)習(xí)單元的輸出就是H(x)=F(x)+x,如果殘差結(jié)果趨近于白噪聲序列,那么累加層只用于恒等式映射。因此,接下來的訓(xùn)練目標(biāo)是將殘差結(jié)果趨近于白噪聲序列,這樣隨著網(wǎng)絡(luò)的深入,精度就不會再下降。其次進入輸出層,對神經(jīng)網(wǎng)絡(luò)計算的分量進行歸一化處理,得到LSTM滾動優(yōu)化模型的預(yù)測結(jié)果;最后將前14 d的SARIMA線性模型預(yù)測數(shù)據(jù)與后26 d的LSTM神經(jīng)網(wǎng)絡(luò)模型預(yù)測數(shù)據(jù)代入權(quán)重組合法,計算前一層的中間輸出結(jié)果與當(dāng)前輸出的相似度,得到權(quán)重因子,同時得到注意力系數(shù),再利用梯度下降法對2種互補算法的訓(xùn)練結(jié)果進行權(quán)重優(yōu)化,計算出組合模型的預(yù)測誤差,得到2020年春運40 d客流預(yù)測數(shù)據(jù)。
首先,將被歸一化的樣本數(shù)據(jù)輸入到SARIMA-LSTM組合模型中。使用梯度下降的公式進行反向傳播計算,不斷更新模型的權(quán)重。每迭代1次,都要計算模型的當(dāng)前誤差精度,結(jié)果如圖7所示。可以看出,經(jīng)過200次迭代訓(xùn)練,訓(xùn)練誤差的精度線損失從0.727 8下降到0.042 5并保持穩(wěn)定,效果良好。
圖7 迭代誤差變化曲線
其次,使用SARIMA季節(jié)模型和SARIMA-GUR組合模型來預(yù)測樣本數(shù)據(jù),將結(jié)果與本文選取的SARIMA-LSTM組合模型進行比較。由圖8可知,僅使用SARIMA季節(jié)模型預(yù)測的春運日客流量真實值與預(yù)測值差距很大,嚴(yán)重失真。而在加入了神經(jīng)網(wǎng)絡(luò)模型對非線性部分進行擬合后,實驗精度得到了極大提高,這是因為線性模型對隨機性、突發(fā)性強的交通流數(shù)據(jù)的預(yù)測效果不佳,組合模型具有更好地預(yù)測控制性。
圖8 2020年春運實際日客流量與 3種模型預(yù)測值曲線
最后,為了驗證長短期記憶網(wǎng)絡(luò)(LSTM)和門控循環(huán)單元網(wǎng)絡(luò)(GRU)在短時客流中的預(yù)測精度,比較這2種神經(jīng)網(wǎng)絡(luò)在組合模型中的性能差異。使用平均百分比誤差(MAPE)和均方根誤差(RMSE)作為檢驗?zāi)P偷脑u價指標(biāo),公式如下:
(13)
(14)
表2顯示了不同模型的預(yù)測結(jié)果誤差。結(jié)果表明,在整個預(yù)測期內(nèi),SARIMA-LSTM組合模型的預(yù)測精度總體上優(yōu)于SARIMA-GRU組合模型。從模型原理分析原因,門控循環(huán)單元網(wǎng)絡(luò)(GUR)只有一個門控來遺忘和選擇內(nèi)存,且參數(shù)較少,而長短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)可以使用更多的門控和更多的參數(shù)來完成相同的任務(wù),所以在客流異常且波動很大的情況下,與LSTM相比,GRU的性能損失更為嚴(yán)重。
表2 預(yù)測結(jié)果誤差
1) 提出了一種基于SARIMA-LSTM的組合模型對疫情期間南昌火車站的春運日客流數(shù)據(jù)進行了預(yù)測。該方法中,穩(wěn)態(tài)序列由SARIMA季節(jié)模型計算,將穩(wěn)態(tài)序列和時間序列作為周期特征輸入。同時設(shè)計了一種LSTM滾動優(yōu)化模型,該模型利用實時樣本和歷史樣本進行滾動預(yù)測,可以更及時、更近似地反映異常流量的波動情況。最后,將2種模型的預(yù)測結(jié)果加權(quán)求和得到最終的預(yù)測數(shù)據(jù)。
2) 利用SARIMA模型和LSTM滾動優(yōu)化模型的互補優(yōu)勢,在模型的預(yù)測中,大大降低了組合模型的平均百分比誤差(MAPE)和均方根誤差(RMSE),提高了在突發(fā)事件中異常客流的預(yù)測精度,其精確度達到了72.7%。當(dāng)面臨突發(fā)性重大衛(wèi)生公共事件時,可以解決鐵路短時客流預(yù)測問題,緩解因客流大幅減少而造成的鐵路客運部門直接性經(jīng)濟損失。
3) 實驗中還存在一些不足,比如實驗數(shù)據(jù)只使用實時樣本和歷史樣本,沒有考慮其他外部因素。因此,在后期的研究工作中,還需考慮影響客流的其他環(huán)境因素,如天氣、臨時組織措施與地鐵等其他交通方式的連接狀態(tài)等,從而得到更準(zhǔn)確的預(yù)測模型。