曹 瑩,陳 旭,張躍博,龔 正
(湖北省交通規(guī)劃設(shè)計院股份有限公司,湖北 武漢 430051)
天門港位于湖北省中南部、漢江下游、江漢平原腹地的天門市境內(nèi),沿江上溯至襄陽,順江而下至漢口,是湖北省的重要港口。其地理位置優(yōu)越,東與孝感市的漢川、應(yīng)城接壤,北與荊門市的京山、鐘祥毗鄰,南面和西面隔漢江與仙桃、潛江、荊門相望,水陸交通發(fā)達(dá)。改革開放以來,天門港吞吐量持續(xù)增長,對當(dāng)?shù)厣鐣?jīng)濟、產(chǎn)業(yè)布局等發(fā)揮著重要的支撐作用。對天門港吞吐量進(jìn)行精準(zhǔn)預(yù)測,可為后續(xù)的社會經(jīng)濟發(fā)展提供科學(xué)的寶貴意見。
劉枚蓮,等[1]將BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型應(yīng)用在北部灣港口吞吐量預(yù)測上,證明了與多元回歸模型相比,BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型精準(zhǔn)度更高。李怡瑩[2]在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,引入了寬度學(xué)習(xí)系統(tǒng),對連云港吞吐量進(jìn)行建模預(yù)測,發(fā)現(xiàn)引入寬度學(xué)習(xí)系統(tǒng)后,與原網(wǎng)絡(luò)相比,不僅神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)時間大大減少,且訓(xùn)練效果更加出色。單玉隆[3]通過遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)以及ARIMA模型兩種方式對GDP進(jìn)行預(yù)測,通過比較分析得到遺傳算法改進(jìn)神經(jīng)網(wǎng)絡(luò)比起傳統(tǒng)的ARIMA模型的精度更高。石美娟[4]通過對上海市社會固定資產(chǎn)投資進(jìn)行分析,利用ARIMA 模型對其進(jìn)行預(yù)測,分析了預(yù)測方法的優(yōu)勢和缺點。夏麗[5]將粗糙集理論引入回歸分析中,利用屬性約簡理論解決多重共線性問題,同時利用ARIMA 模型對區(qū)域用電量進(jìn)行組合預(yù)測,具有良好的預(yù)測效果。
本文選取與港口吞吐量密切相關(guān)的因素,以天門港為例,采用BP神經(jīng)網(wǎng)絡(luò)模型和ARIMA模型組合預(yù)測,結(jié)合2010-2019年實際數(shù)據(jù)(2020-2021年受新冠疫情、特大洪水影響,港口機構(gòu)整合等外部條件限制,天門市無營運的貨物港口,2022-2023年港口又處于建設(shè)期,因此剔除2020-2022年非正常數(shù)據(jù)),預(yù)測天門港2023-2026年的港口吞吐量,并驗證其效果。
BP神經(jīng)網(wǎng)絡(luò)算法將多種單一信息分布式存儲后協(xié)同處理,一般包含按照其梯度下降的原則,利用梯度搜索方法,從誤差反向傳播訓(xùn)練至前段多層網(wǎng)絡(luò),使實際與期望輸出值的誤差均方差最?。黄渌惴ê诵陌跋騻鞑ズ头聪騻鞑?,當(dāng)計算誤差輸出時按從輸入到輸出的方向進(jìn)行,而調(diào)整權(quán)值和閾值則從輸出到輸入的方向進(jìn)行[6]。BP神經(jīng)網(wǎng)絡(luò)模型示意圖如圖1所示。具體可分為兩個過程:
圖1 BP神經(jīng)網(wǎng)絡(luò)模型示意圖
(1)網(wǎng)絡(luò)狀態(tài)初始化,確定輸入因素、輸出量、網(wǎng)絡(luò)層數(shù)和網(wǎng)絡(luò)節(jié)點個數(shù)。
(2)學(xué)習(xí)過程,包括向前計算和向后學(xué)習(xí)。
從輸入層到中間層的數(shù)學(xué)關(guān)系為:
從中間層到輸出層的數(shù)學(xué)關(guān)系為:
其中:ym和yj分別表示輸入層和中間層的輸入,yt表示預(yù)測結(jié)果值,μjm和λoj表示輸出層和中間層的網(wǎng)絡(luò)權(quán)重,μj和λo是中間層和輸出層的最大限制;n和l為節(jié)點數(shù),fI和fo為激活的函數(shù)。
ARIMA(p,d,q)模型基礎(chǔ)原理是時間序列預(yù)測,包含自回歸過程(AR)和移動平均過程(MA)兩部分。其計算公式為:
式中:φ1,φ2,φ3…,φp為自回歸系數(shù);p是自回歸階次;θ1,θ2,θ3…,θq是移動平均系數(shù);q是移動平均階次;{ }ε是白噪聲序列,通常用于模型有效性檢驗。
當(dāng)q=0 時,該模型成為AR(p)模型:
當(dāng)p=0 時,該模型成為MA(q)模型:
ARIMA模型的具體建模步驟如下:
選取近10年吞吐量數(shù)據(jù),運用單位根檢驗時間序列的平穩(wěn)程度。如果為平穩(wěn)的時間序列,則判斷是否為白噪聲序列,識別是自回歸、移動或移動平均回歸模型;通過自相關(guān)與偏相關(guān)估計值序列的圖形判斷在5%的顯著水平下,模型的自相關(guān)系數(shù)和偏相關(guān)系數(shù)不為零的個數(shù),從而大致判斷該序列應(yīng)選擇的具體模型[7]。通過估計與識別的殘差檢驗,確定模型的有效性;最后通過檢驗和比較,完成現(xiàn)狀與未來走勢的預(yù)測。ARIMA預(yù)測模型流程如圖2所示。
圖2 ARIMA預(yù)測模型流程圖
選用擬合優(yōu)度方法對兩種預(yù)測進(jìn)行簡單組合,以擬合誤差最小附以最大權(quán)重,其計算公式如下:
式中,sei為第i個模型的標(biāo)準(zhǔn)誤差。
再對組合預(yù)測結(jié)果進(jìn)行平穩(wěn)性檢驗,計算預(yù)測的誤差,利用BP神經(jīng)網(wǎng)絡(luò)最大的訓(xùn)練次數(shù)和最大誤差不斷調(diào)整相關(guān)參數(shù),得到殘差優(yōu)化后的港口吞吐量模型,最終得到ARIMA-BP神經(jīng)網(wǎng)絡(luò)組合預(yù)測的港口吞吐量預(yù)測模型。組合預(yù)測流程圖如圖3所示。
圖3 組合預(yù)測流程圖
港口吞吐量的影響因素較多,根據(jù)近年來的觀測,選取天門市的第一產(chǎn)業(yè)總產(chǎn)值、第三產(chǎn)業(yè)總產(chǎn)值、社會固定投資額、地方財政收入和外貿(mào)進(jìn)出口總額指標(biāo)作為港口吞吐量預(yù)測模型的主要影響因素,見表1。
表1 港口吞吐量預(yù)測的主要影響指標(biāo)表
2.2.1 數(shù)據(jù)預(yù)處理。采集天門港主要影響因素2010-2019年的各項數(shù)據(jù),具體見表2。為適應(yīng)模型仿真要求,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,采用歸一化方法將數(shù)據(jù)限制在區(qū)間[0 ,1] 以內(nèi)。歸一化處理后的數(shù)據(jù)見表3。
表2 天門港2010-2019年各影響因素及港口吞吐量統(tǒng)計表
表3 天門港2010-2019年各影響因素及港口吞吐量統(tǒng)計表歸一化處理后數(shù)據(jù)
2.2.2 網(wǎng)絡(luò)學(xué)習(xí)。將BP神經(jīng)網(wǎng)絡(luò)算法中訓(xùn)練次數(shù)設(shè)定為T=60 000 次,學(xué)習(xí)效率設(shè)定為L=0.035,誤差閾值定位E=0.65*10(-3),輸入變量個數(shù)為INPUT=6,輸出為OUTPUT=1,隱藏層神經(jīng)元個數(shù)為H=8。將2010-2018年的數(shù)據(jù)作為訓(xùn)練樣本,2019年的數(shù)據(jù)作為測試樣本。圖4為訓(xùn)練樣本的訓(xùn)練過程誤差圖。可得,結(jié)果整體誤差率在0.076%。
圖4 預(yù)測誤差
通過樣本訓(xùn)練后,確定了本次研究的BP 網(wǎng)絡(luò)預(yù)測模型,將測試樣本帶入訓(xùn)練得到的模型中,得到的結(jié)果如圖5所示。
圖5 擬合效果圖
從擬合效果來看,2010-2018年的實際值與模擬值均接近,總誤差在0.076%以內(nèi),而2019年的吞吐量實際數(shù)據(jù)為99.70 萬t,經(jīng)過BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測值為99.78萬t,表明可作后續(xù)預(yù)測所使用的模型。
2.2.3 預(yù)測結(jié)果。對天門市2023-2026 年的港口吞吐量進(jìn)行預(yù)測,首先要對輸入層的5個變量進(jìn)行大致預(yù)測,通過分析第一產(chǎn)業(yè)總值、第三產(chǎn)業(yè)總值、全社會固定資產(chǎn)投資、外貿(mào)進(jìn)出口總額、地方財政收入5個經(jīng)濟指標(biāo)的歷年數(shù)據(jù)變化,采用二次指數(shù)平滑方法對這5 個指標(biāo)進(jìn)行預(yù)測,求得這5 個指標(biāo)對應(yīng)的2023年的預(yù)測值為:89.18 億元,280.01 億元,444.83 億元,16 984 萬美元,36.87 億元;2024 年的預(yù)測值為:90.12億元,282.21億元,451.23億元,17 231萬美元,37.76億元;2025年的預(yù)測值為:96.73億元,332.05億元,498.65 億元,18 923 萬美元,43.23 億元;2026 年的預(yù)測值為:103.51 億元,392.80 億元,531.33 億元,20 113萬美元,50.22億元。同樣,將上述預(yù)測數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后得到2023 年的輸入量為(1.121 394 26,1.167 985 132,0.932 596 574,1.081 268 478,1.146 573 212);2024 年的輸入量為(1.139 169 322,1.188 885 245,0.944 497 334,1.097 268 889,1.172 602 74);2025 年的輸入量為(1.357 681 719,1.458 640 895,1.094 979 69,1.243 042 991,1.386 692 759);2026 年的輸入量為(1.803 194 116,1.825 896 545,1.396 462 046,1.412 317 093,1.768 782 778)。將處理后的數(shù)據(jù)輸入到已經(jīng)生成好的BP神經(jīng)網(wǎng)絡(luò)中,輸出的值再進(jìn)行反標(biāo)準(zhǔn)化處理后得到2023-2026 年天門市港口吞吐量的預(yù)測值為:126.74萬t、137.66萬t、157.23萬t和170.48萬t。
2.3.1 時間序列特征分析。借助計量經(jīng)濟學(xué)軟件EVIEWS進(jìn)行統(tǒng)計分析,天門港港口吞吐量隨時間的變化呈現(xiàn)出明顯的正相關(guān)趨勢,是典型的非平穩(wěn)時間序列,需要先對吞吐量數(shù)據(jù)進(jìn)行平穩(wěn)化處理,繪制折線圖如圖6所示,對其單位根進(jìn)行ADF檢驗(如圖7所示),可得為平穩(wěn)序列,取d值為1。
圖6 天門港港口吞吐量一階差分折線圖
圖7 單位根檢驗
2.3.2 模型的建立和檢驗。如圖8所示,差分后序列的自相關(guān)系數(shù)在滯后一階波動歸于零,在偏相關(guān)函數(shù)中,滯后一階后也同樣歸于零,較為平穩(wěn)。由分析結(jié)果可見,可建立ARIMA((1,2,3,4),1,(1,2))的模型,經(jīng)比較其調(diào)整后的R2,ARIMA(4,1,2)為最大,因此選取此模型為最優(yōu)模型進(jìn)行測算。
圖8 ARIMA檢驗參數(shù)估計結(jié)果
在Eviews中操作得到的殘差序列如圖9所示。通過對殘差序列進(jìn)行白噪聲檢驗,殘差序列為白噪聲序列,殘差序列參數(shù)檢驗如圖10所示。
圖9 殘差序列
圖10 殘差序列參數(shù)檢驗結(jié)果
2.3.3 結(jié)果預(yù)測。利用ARIMA(4,1,2)模型對天門港港口吞吐量進(jìn)行預(yù)測,原數(shù)據(jù)經(jīng)過差分后得出預(yù)測值與原數(shù)值比較以及誤差分析。具體如圖11 所示。
圖11 擬合效果圖
從預(yù)測結(jié)果可知,2010-2018年的實際值與模擬值基本接近,整體誤差為0.266%;2019年吞吐量實際數(shù)據(jù)為99.7萬t,經(jīng)過ARIMA模型的2019年吞吐量預(yù)測值為99.97萬t,可作為后續(xù)預(yù)測模型使用。
經(jīng)計算,將BP神經(jīng)網(wǎng)絡(luò)模型和ARIMA模型的標(biāo)準(zhǔn)誤差0.076%和0.266%代入式(6)可得其權(quán)重分別為0.71和0.29,從而得到最終預(yù)測值見表4。
表4 組合預(yù)測結(jié)果 (單位:萬t)
通過計算,BP 神經(jīng)網(wǎng)絡(luò)模型的誤差為0.076%,ARIMA 模型誤差為0.266%,組合預(yù)測模型的誤差為0.072%,組合預(yù)測的誤差較小,預(yù)測的精度最高。不同預(yù)測模型誤差對比見表5。
表5 不同預(yù)測模型誤差對比分析
本文組合運用了BP 神經(jīng)網(wǎng)絡(luò)預(yù)測與ARIMA 預(yù)測對天門港2023-2026 年的港口吞吐量進(jìn)行預(yù)測。其中,BP神經(jīng)網(wǎng)絡(luò)預(yù)測綜合考慮了天門港從屬天門市的各項社會經(jīng)濟指標(biāo),從多個維度對港口吞吐量進(jìn)行預(yù)測,更多考慮了其他因素對于港口吞吐量的影響,因此預(yù)測出的數(shù)據(jù)與考慮因素關(guān)系較大,聯(lián)動性較強。ARIMA預(yù)測則更多考慮數(shù)據(jù)自身的規(guī)律性,通過對數(shù)據(jù)進(jìn)行處理,進(jìn)而開展后續(xù)的預(yù)測。通過組合預(yù)測,結(jié)合兩種預(yù)測方法短期預(yù)測的優(yōu)勢,將誤差控制在0.072%,未來可應(yīng)用于短期水路貨運量預(yù)測。