燕學(xué)博,曹 雨(福建理工大學(xué),福建 福州 350118)
鐵路貨運(yùn)量是我國物流的重要組成部分,也是衡量鐵路貨運(yùn)發(fā)展水平和能力的重要指標(biāo)。近年來,由于國內(nèi)經(jīng)濟(jì)社會(huì)的發(fā)展以及我國城市化步伐的加速,城市居民對各種商品的需求量不斷增加,這導(dǎo)致了鐵路貨運(yùn)量呈逐年遞增的趨勢。為了滿足社會(huì)對貨運(yùn)服務(wù)的需求,進(jìn)一步提高鐵路貨運(yùn)服務(wù)質(zhì)量,加強(qiáng)對鐵路貨運(yùn)組織建設(shè)和發(fā)展戰(zhàn)略的研究,對鐵路貨運(yùn)量的精準(zhǔn)預(yù)測十分必要。傳統(tǒng)的貨運(yùn)量預(yù)測模型主要包含統(tǒng)計(jì)模型預(yù)測法、神經(jīng)網(wǎng)絡(luò)預(yù)測法以及組合模型預(yù)測法。
黃雪婷[1]分別對比了SARIMA 模型、LSTM 模型與組合模型的預(yù)估數(shù)據(jù),結(jié)果表明,組合模型無論在較短周期還是在較長周期的預(yù)估上,表現(xiàn)結(jié)果均強(qiáng)于單一模型;張冠東等[2]改進(jìn)了傳統(tǒng)LSTM 模型,提出一種多維度LSTM 模型,并分別對鐵路、公路、航空貨運(yùn)量進(jìn)行預(yù)估,結(jié)果表明多維LSTM 模型預(yù)測效果優(yōu)于傳統(tǒng)LSTM 模型;賈春苗等[3]采用ARIMA 與多元回歸模型相結(jié)合的綜合模型對陜甘鐵路貨運(yùn)量進(jìn)行了預(yù)估,結(jié)果顯示,復(fù)合模型的預(yù)測效果優(yōu)于傳統(tǒng)單一模型;冉葉子[4]利用ANN 與LSTM 深度學(xué)習(xí)模型對貴州省貨運(yùn)量進(jìn)行預(yù)測,并與傳統(tǒng)時(shí)間序列預(yù)測法ARIMA 進(jìn)行比較,結(jié)果表明深度學(xué)習(xí)模型預(yù)測效果優(yōu)于傳統(tǒng)模型;楊飛[5]采用了Logit 加權(quán)方法,將BP 神經(jīng)網(wǎng)絡(luò)、霍爾線特性趨勢指數(shù)平滑算法與ARIMA 相結(jié)合構(gòu)建了全新的組合模型,將該模型與基于等權(quán)分配法的組合模型加以比較,結(jié)果表明采用Logit 加權(quán)方式的組合模型表現(xiàn)效果明顯高于采用等權(quán)分配的組合模型;周昌野等[6]基于網(wǎng)格搜索算法對LSTM 模型進(jìn)行改良,得出全新的GS-LSTM 模型,實(shí)驗(yàn)結(jié)果表明,經(jīng)過改良的GS-LSTM 模型泛化能力要強(qiáng)于傳統(tǒng)LSTM 模型。
以上研究表明,組合模型的泛化能力要強(qiáng)于單一模型,而對組合模型的權(quán)重分配法中,等權(quán)分配法表現(xiàn)較差。組合模型中能夠更好實(shí)現(xiàn)對單一模型的優(yōu)點(diǎn)整合,特別是強(qiáng)化數(shù)據(jù)預(yù)測中線性部分與非線性部分的有機(jī)結(jié)合。本文以國家統(tǒng)計(jì)局公布的2005 至2022 年全國鐵路貨運(yùn)量為例,分別利用傳統(tǒng)ARIMA 模型,深度學(xué)習(xí)中LSTM 模型與二者相結(jié)合的ARIMA-LSTM 組合模型對數(shù)據(jù)進(jìn)行擬合,選取最優(yōu)預(yù)測方案。
ARIMA (p,d,q)模型是經(jīng)過差分處理的AR(p)模型與MA(q)模型的組合,它包含三個(gè)方面,分別為自回歸函數(shù)AR,函數(shù)階數(shù)I 與移動(dòng)平均函數(shù)MA,其中參數(shù)p,q 分別表示自回歸函數(shù)與移動(dòng)平均函數(shù)階數(shù),d 代表差分次數(shù),ARIMA (p,d,q)模型基本公式為:
式中:yt與yt-i分別代表預(yù)測值與歷史值;μ 為白噪聲項(xiàng);γi與θi分別代表自相關(guān)系數(shù)與誤差項(xiàng)系數(shù);p 與q 分別代表自回歸階數(shù)和移動(dòng)平均階數(shù);εt與εt-i代表模型的誤差和時(shí)間點(diǎn)i 之間的偏差。
ARIMA (p,d,q)模型步驟包括數(shù)據(jù)平穩(wěn)性檢測、模型定階、模型選取、白噪聲檢驗(yàn)等,具體流程如圖1 所示。
圖1 ARIMA 模型預(yù)測流程圖
長短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory Network,LSTM)模型是由Schmidhuber 和Hochreiter 于1997 年提出,它的基本原理為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型,它針對傳統(tǒng)RNN 模型中經(jīng)常出現(xiàn)的梯度消失,長時(shí)訓(xùn)練信息無法保留等問題進(jìn)行優(yōu)化,在此基礎(chǔ)上首次引入“門”的概念,使每一個(gè)神經(jīng)元同時(shí)具有輸入門、遺忘門和輸出門。LSTM 模型基本工作原理如圖2 所示,
模型中ft、it、Ot分別代表遺忘門、輸入門和輸出門,Ct代表細(xì)胞更新狀態(tài),ht代表當(dāng)前時(shí)刻輸出值,σ、tanh 均為激活函數(shù),其中:σ 采取Sigmoid 激活函數(shù),tanh 則采用正切激活函數(shù)。遺忘門、輸入門、輸出門、細(xì)胞更新狀態(tài)、當(dāng)前節(jié)點(diǎn)輸出計(jì)算方式分別如下:
其中:Wf、Wt、Wo、Wc、bf、bi、bo、bc依次代表遺忘門、輸入門、輸出門和細(xì)胞更新狀態(tài)的時(shí)間權(quán)重及其偏置項(xiàng),ht-1表示上一時(shí)刻隱藏層的向量,Xt則代表當(dāng)前時(shí)刻輸入。
組合模型可以解決單一預(yù)測模型的不足,進(jìn)一步提升預(yù)測的精度,組合模型通常采取串聯(lián)、并聯(lián)兩種模式,其具體流程如圖3、圖4 所示:
圖3 串聯(lián)模型流程圖
本文數(shù)據(jù)來源均為國家統(tǒng)計(jì)局公布數(shù)據(jù),實(shí)驗(yàn)軟件分別為SPSS Statistics 20.0 與Matlab 2018b。為保證實(shí)驗(yàn)準(zhǔn)確性,ARIMA模型采用SPSS 中專家建模的結(jié)論,最終模型為ARIMA (0,1,0)(0,1,1);LSTM 模型選用單隱層模型,隱層節(jié)點(diǎn)數(shù)為70,優(yōu)化器為Adam,最大循環(huán)次數(shù)為300,初始學(xué)習(xí)率為0.01。
為量化評估模型精度,本文選取平均絕對誤差(Mean Absolute Error,MAE)指標(biāo),平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)指標(biāo),均方誤差(Mean Square Error,MSE)指標(biāo)和均方根誤差(Root Mean Square Error,RMSE)指標(biāo)作為評估依據(jù),指標(biāo)計(jì)算公式如下:
其中:Yi為i 時(shí)刻實(shí)際值,為i 時(shí)刻模型預(yù)測值,n 代表樣本個(gè)數(shù)。
串聯(lián)模型中,首先通過ARIMA 模型對原始數(shù)據(jù)進(jìn)行估計(jì)判斷,得出預(yù)測結(jié)果A(t);而后通過LSTM 模型對ARIMA 模型預(yù)測中出現(xiàn)的殘差項(xiàng)進(jìn)行預(yù)測,并得出預(yù)測結(jié)果L(t),串聯(lián)模型最終預(yù)測結(jié)果Y(t)為:
對比單一模型與串聯(lián)耦合模型下的MAE、MAPE、MSE、RMSE 指標(biāo),對比結(jié)果如表1 所示。通過對比可以得出結(jié)論,組合模型各項(xiàng)指標(biāo)值均低于單一模型,表明組合模型的泛化能力明顯強(qiáng)于單一模型。
表1 單一模型與組合模型對比結(jié)果
并聯(lián)組合模型基本方法是分別利用各模型對原始序列進(jìn)行預(yù)測,而后確定單一模型所占權(quán)重Wi、Wj,基本運(yùn)算如下:
當(dāng)前多模型權(quán)重確定方法包括算術(shù)平均法、方差倒數(shù)法、均方倒數(shù)法、簡單加權(quán)法和熵權(quán)法。本文對各權(quán)重方法產(chǎn)生的組合模型進(jìn)行比較,選取最優(yōu)組合作為并聯(lián)組合模型解。
3.2.1 算術(shù)平均法
算術(shù)平均法通常也叫做等權(quán)平均法,即對各模型均賦予相同權(quán)重,權(quán)重確定公式為:
其中:Wi為第i 個(gè)模型權(quán)重,I 為模型總數(shù)。
3.2.2 方差倒數(shù)法
方差倒數(shù)法是對算術(shù)平均法的改進(jìn),以預(yù)測誤差的平方和作為權(quán)重確定依據(jù),基本公式為:
式中:Di為誤差平方和,其基本公式為:
式中:xt為真實(shí)值,為模型的預(yù)測值。
3.2.3 均方倒數(shù)法
均方倒數(shù)法是對方差倒數(shù)法的改進(jìn),體現(xiàn)在單一模型的誤差平方和越大,所屬模型在組合模型中權(quán)重越小,其基本公式為:
式中:Di定義與方差倒數(shù)法Di定義相同。
3.2.4 簡單加權(quán)法
簡單加權(quán)法確定權(quán)重方法是先將各模型預(yù)測誤差的方差之和進(jìn)行排序,排名越靠前的預(yù)測模型,其組合模型中加權(quán)系數(shù)越小,計(jì)算公式為:
3.2.5 熵權(quán)法
熵權(quán)法是通過衡量指標(biāo)變異性的能力來判斷客觀權(quán)重。熵權(quán)法認(rèn)為,某指標(biāo)信息熵越小,則表明指標(biāo)變異程度大,所能反映的信息量越多,因此其相對權(quán)值越大,熵權(quán)法基本運(yùn)算公式為:
式中:1-ej代表信息效用,ej代表第j 個(gè)指標(biāo)的信息熵,其計(jì)算公式為:
對比結(jié)果顯示,采用方差倒數(shù)法確定權(quán)重的并聯(lián)模型為最優(yōu)組合模型,且所有指標(biāo)均小于其他模型,表明了該模型泛化能力及預(yù)測精準(zhǔn)度較其余模型更佳。不同方法所確定組合模型權(quán)重及精度對比如表2、表3 所示:
表2 組合模型權(quán)重表
表3 多模型預(yù)測精度對比表
分別對比ARIMA 模型、LSTM 模型以及ARIMA-LSTM 組合模型的參數(shù),最終選定基于方差倒數(shù)的組合模型為最優(yōu)模型。對各模型的預(yù)測值與原始數(shù)據(jù)進(jìn)行擬合,可以明顯看出組合模型的擬合效果要好于單個(gè)模型,如圖5 所示。
圖5 多模型數(shù)據(jù)擬合圖
圖6 為各模型與真實(shí)數(shù)據(jù)的絕對誤差值。由圖6 可以清晰看到組合模型誤差波動(dòng)整體較單一模型要小,其絕對誤差值也低于單一模型,表明ARIMA-LSTM 組合模型的穩(wěn)定性及誤差較單一模型表現(xiàn)較好。
圖6 多模型絕對誤差對比
為進(jìn)一步量化參數(shù),對各模型預(yù)測效果進(jìn)行評價(jià),分別對比各模型MAE、MAPE、MSE、RMSE 指標(biāo),結(jié)果如表4 所示。通過對比可得,組合模型較ARIMA 模型的MAE、MAPE、MSE、RMSE 指標(biāo)分別降低15.26%、15.62%、24.64%、17.12%,較LSTM 模型分別降低25.32%、32.67%、43.66%、28.33%。
表4 多模型指標(biāo)對比
本文以全國2005 年1 月至2022 年10 月鐵路貨運(yùn)量為研究目標(biāo),并分別采用ARIMA 模型、LSTM 模型與ARIMA-LSTM 組合模型對原數(shù)據(jù)進(jìn)行預(yù)測,在組合模型中,采用ARIMA 模型與LSTM 預(yù)測殘差所共同構(gòu)建的串聯(lián)模型,以及采用算數(shù)平均法、方差倒數(shù)法、均方倒數(shù)法、簡單加權(quán)法、熵權(quán)法構(gòu)建的并聯(lián)模型,并以MAE、MAPE、MSE、RMSE 指標(biāo)作為評價(jià)模型依據(jù),研究結(jié)論表明:(1)任意組合模型擬合效果均強(qiáng)于單一模型。(2)組合模型中采取不同的權(quán)重賦予方式會(huì)導(dǎo)致組合模型預(yù)測精度不同,通過對比五種權(quán)重確定方式,以方差倒數(shù)法確定的權(quán)重組合模型表現(xiàn)最佳。(3)鐵路貨運(yùn)量數(shù)據(jù)兼具線性與非線性特征,在時(shí)間維度原始數(shù)據(jù)包含趨勢性與季節(jié)性特征,單一線性模型預(yù)測效果較差,在對以上數(shù)據(jù)進(jìn)行預(yù)測時(shí)應(yīng)兼顧線性與非線性特征,采取線性與非線性相組合模型對該數(shù)據(jù)進(jìn)行預(yù)測。