收稿日期:2024-01-12
作者簡介:康家明(1997—),男,碩士,助理工程師,研究方向:綜合運輸與智能交通。
摘要 公路貨運量是貨運物流領(lǐng)域的關(guān)鍵指標之一,對貨運統(tǒng)計工作具有重要意義。為了提高公路貨運量預測的準確性,文章依據(jù)東莞市歷年公路貨運量數(shù)據(jù)建立了GM(1,1)-LSTM組合預測模型,組合模型利用LSTM神經(jīng)網(wǎng)絡(luò)模型強大的數(shù)據(jù)學習能力,修正了灰色GM(1,1)預測模型中預測序列與原序列的殘差,充分發(fā)揮了GM(1,1)預測模型趨勢捕獲和LSTM模型非線性預測的優(yōu)勢。選取東莞市2006—2022年公路貨運量數(shù)據(jù),基于GM(1,1)、LSTM、GM(1,1)-LSTM三個模型分別預測2023—2030年東莞市公路貨運量。結(jié)果表明:文章所提出的GM(1,1)-LSTM模型的預測性能更優(yōu),同時可以更加合理地預測貨運量發(fā)展趨勢,為公路貨運管理決策提供有力支撐。
關(guān)鍵詞 公路運輸;貨運量預測;GM(1,1);LSTM;組合模型
中圖分類號 U492.313文獻標識碼 A文章編號 2096-8949(2024)09-0025-03
0 引言
公路貨運量預測是綜合運輸系統(tǒng)規(guī)劃、資源配置的關(guān)鍵環(huán)節(jié),也是政府部門制定綜合運輸服務發(fā)展規(guī)劃與政策的基礎(chǔ)工作,準確預測公路貨運量具有重要意義。公路貨運量時間序列預測是指根據(jù)歷史公路貨運數(shù)據(jù)的變化規(guī)律,建立預測模型,預測未來的公路貨運量。
目前,國內(nèi)外學者已開展諸多關(guān)于公路貨運量時間序列預測的研究。公路貨運量時序預測模型主要分為定性預測和定量預測兩大類。其中定性預測方法常有公路貨運市場調(diào)查法、德爾菲法等,定量預測包括線性模型和非線性模型等。線性模型包括時間序列法、回歸分析法、灰色預測模型等,非線性模型包括神經(jīng)網(wǎng)絡(luò)、支持向量機、隨機森林、馬爾科夫、深度學習模型等。定性預測研究中,文獻[1]評估了德爾菲法對長期貨運物流趨勢預測的有效性,預測了英國公路貨運物流的長期變化趨勢。定量預測研究中,文獻[2]應用ARMA模型預測了陜西省的公路貨運量,文獻[3]建立的灰色預測GM(1,1)模型分別對廣東省貨運總量及其構(gòu)成進行了預測。文獻[4]基于趨勢外推法、三次指數(shù)平滑法、灰色預測法、指數(shù)回歸法以及BP神經(jīng)網(wǎng)絡(luò)對南寧市公路貨運量進行了對比預測,凸出了BP神經(jīng)網(wǎng)絡(luò)的貨運量預測模型較傳統(tǒng)預測方法的優(yōu)越性。文獻[5]考慮不同時期貨運數(shù)據(jù)的特點建立了基于LSTM的貨運量預測模型,并與ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)方法的預測結(jié)果相比較,結(jié)果表明,LSTM網(wǎng)絡(luò)預測效果更佳。此外,為了克服單一預測方法的局限性,不少學者研究了組合預測方法。文獻[6]根據(jù)西安市貨運量數(shù)據(jù),建立了灰色GM(1,1)模型,結(jié)合馬爾可夫鏈過程,獲得序列在各個狀態(tài)下的概率值及預測中值,計算出了貨運量的修正預測值,證明了模型具有較高的準確性。文獻[7]綜合考慮貨運量的線性與非線性特征,提出了ARIMA-LSTM的組合預測模型。
該文根據(jù)東莞市公路貨運量歷史數(shù)據(jù)的特點,充分發(fā)揮灰色GM(1,1)預測模型的趨勢捕獲和LSTM模型非線性時間序列預測的優(yōu)勢,創(chuàng)新提出了GM(1,1)-LSTM組合預測模型,對東莞市未來八年的公路貨運量進行了預測,并與傳統(tǒng)灰色GM(1,1)模型、LSTM神經(jīng)網(wǎng)絡(luò)預模型的預測結(jié)果進行了對比,證明了所提出模型的優(yōu)越性。
1 研究方法
1.1 GM(1,1)模型
灰色系統(tǒng)動態(tài)模型是把一組離散的、隨機的原始數(shù)據(jù)序列經(jīng)m次累加,生成規(guī)律性強的累加序列,削弱原始序列的隨機性,之后對生成的序列建模,經(jīng)過累減,生成預測序列。
第一步,設(shè)該文獲取的公路貨運量時間序列為A(0)={A(0)(1),A(0)(2),…,A(0)(n)},對其進行一次累加生成,得到累加序列:
A(1)={A(1)(1),A(1)(2),…,A(1)(n)} (1)
式(1)中:
第二步,以A(1)為原始序列建立GM(1,1)灰色預測方程模型:
(2)
利用最小二乘法可求解出參數(shù):
(3)
式(3)中:
BY=(A(0))T
通過求解參數(shù)a,u,求出微分方程的相應函數(shù):
(4)
經(jīng)過累減還原得到預測的公路貨運量:
(5)
以上為GM(1,1)公路貨運量的預測模型。
1.2 LSTM模型
長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory, LSTM)模型是遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)的一個變種。它構(gòu)建了專門的記憶存儲單元,通過時間反向傳播算法對數(shù)據(jù)進行訓練。LSTM中的重復模塊包含四個相互作用的激活函數(shù)(三個σ,一個tanh)和三種門限(遺忘門、輸入門、輸出門)。LSTM公式,見式(6)~式(11)。
(6)
(7)
(8)
(9)
(10)
(11)
式中,xt——t時刻輸入序列向量;it、ot、ft——輸入門、輸出門和遺忘門;b′——偏移常量;Ct——記憶單元;ht——t時刻的輸出值;σ,tanh為激活函數(shù),,,“”為標量積,表示按照元素的相乘。
LSTM構(gòu)造的主要步驟。步驟1:由遺忘門限層決定從單元狀態(tài)中拋棄的信息。步驟2:決定單元狀態(tài)保存的新信息,生成臨時新狀態(tài)、更新舊狀態(tài)。步驟3:通過σ函數(shù)決定輸出范圍,再將單元狀態(tài)輸入到tanh函數(shù)(?1~1間),最后乘以σ值得到輸出。
1.3 GM(1,1)-LSTM模型
GM(1,1)模型在趨勢變化較為穩(wěn)定的時間序列數(shù)據(jù)預測中具有優(yōu)勢,廣泛應用于貨運量預測。但GM(1,1)模型對非線性數(shù)據(jù)預測能力較差,而LSTM模型具有長期記憶、數(shù)據(jù)學習能力強等優(yōu)勢,非常適用于時間序列預測問題。故該文提出一種GM(1,1)-LSTM模型,即灰色GM(1,1)結(jié)合長短期記憶神經(jīng)網(wǎng)絡(luò)的組合預測模型,通過LSTM模型對GM(1,1)模型預測的殘差進行修正。GM(1,1)-LSTM的建模流程如圖1所示:
圖1 GM(1,1)-LSTM建模流程
第一步,利用灰色GM(1,1)模型對公路貨運量數(shù)據(jù)進行擬合,計算得到擬合殘差。
計算GM(1,1)模型預測序列與原序列的殘差。
(12)
第二步,將公路貨運量殘差序列進行歸一化處理,輸入到LSTM模型進行訓練學習,模型輸出后反歸一化得到預測殘差序列。
第三步,基于LSTM模型輸出的殘差序列,修正GM(1,1)模型公路貨運量預測的結(jié)果。
(13)
2 案例分析
2.1 數(shù)據(jù)集
從歷年東莞市統(tǒng)計公報整理得到2006—2022年共計17年的公路貨運量數(shù)據(jù)。
2.2 實驗分析
2.2.1 模型參數(shù)
該文基于2006—2022年公路貨運量數(shù)據(jù)預測到2023—2030年共計未來8年的公路貨運量?;疑獹M(1,1)預測模型的背景系數(shù)a=?0.032 6,u=6 748.2。將LSTM預測模型的時間滯后步長設(shè)定為1,訓練集長度為12年,測試集長度為5年,滾動預測未來年數(shù)據(jù),隱藏層單元數(shù)設(shè)定為64,訓練次數(shù)100次,批處理設(shè)定為6,優(yōu)化算法為Adam算法。為了方便對照實驗,GM(1,1)-LSTM模型的參數(shù)和GM(1,1)、LSTM模型保持一致。
2.2.2 評價指標
為綜合比較不同模型的預測性能,該文選擇平均絕對誤差百分比(MAPE)、均方根誤差(RMSE)和決定系數(shù)(R2)作為評價標準,計算如式(14)~式(16)所示:
(14)
(15)
(16)
2.2.3 結(jié)果分析
從模型評價指標來看(如表1所示),GM(1,1)-LSTM模型的各項指標均表現(xiàn)出最優(yōu)性能。該模型決定系數(shù)(R2)為0.96,相對GM(1,1)、LSTM模型分別提升了0.30和0.10;均方根誤差(RMSE)為464.38,相對GM(1,1)、LSTM模型分別提升了763.90和733.60;平均絕對誤差百分比(MAPE)為2.55%,相對GM(1,1)、LSTM模型分別提升了9.27%和3.96%。
從模型預測趨勢看(如圖2所示),GM(1,1)-LSTM模型整體對公路貨運量的數(shù)據(jù)趨勢預測較好,平衡了GM(1,1)模型和LSTM模型的預測效果,整體更加符合公路貨運量發(fā)展的趨勢,模型解釋性更強。預計到2030年,GM(1,1)-LSTM模型公路貨運量預測值為13 778萬噸,相對2022年的9 271萬噸增長了48.61%。
表1 不同模型的預測性能比較
評價指標 GM(1,1) LSTM GM(1,1)-LSTM
R2 0.66 0.86 0.96
RMSE 1 228.28 1 197.98 464.38
MAPE 12.27% 6.51% 2.55%
3 結(jié)論
該文提出了一種GM(1,1)-LSTM公路貨運量預測模型,利用GM(1,1)模型在趨勢預測上的優(yōu)勢,基于LSTM模型預測GM(1,1)模型的殘差序列,有效彌補了GM(1,1)非線性時序預測能力弱的特性。以東莞市公路貨運量預測為例,研究結(jié)果表明,GM(1,1)-LSTM組合預測模型的各項評價指標相對GM(1,1)和LSTM預測模型均有大幅提升,在公路貨運量預測方面有較強的適用性。同時,預測數(shù)據(jù)表明,未來東莞市公路貨運量將穩(wěn)步提升,貨運需求市場仍然旺盛,2030年東莞市公路貨運量預計突破1.38億噸。
參考文獻
[1]McKinnon A C, Piecyk M I. Application of the Delphi Method to the Forecasting of Long-term Trends in Road Freight, Logistics and Related CO2 Emissions[J]. International Journal of Transport Economics, 2013(2): 241-266.
[2]惠倩倩. 基于ARMA模型的公路貨運量預測及分析[J]. 經(jīng)濟研究導刊, 2020(12): 35-37.
[3]嚴雪晴. 基于灰色預測模型的廣東省貨運總量預測研究[J]. 數(shù)學的實踐與認識, 2020(14): 294-302.
[4]安然, 華光, 董娜. 基于BP神經(jīng)網(wǎng)絡(luò)的南寧市公路貨運量預測[J]. 交通運輸研究, 2015(2): 58-64.
[5]程肇蘭, 張小強, 梁越. 基于LSTM網(wǎng)絡(luò)的鐵路貨運量預測[J]. 鐵道學報, 2020(11): 15-21.
[6]Yang F, Tang X, Gan Y, et al. Forecast of Freight Volume in Xian Based on Gray GM (1,1) Model and Markov Forecasting Model[J]. Journal of Mathematics, 2021, 2021(1): 1-6.
[7]楊艷, 黃晴, 龍思, 等. 基于ARIMA-LSTM的貨運量組合預測方法研究[J]. 交通科學與工程, 2022(2): 102-108.