王振振, 萇道方, 朱宗良, 羅 天
(上海海事大學 物流科學與工程研究院, 上海 201306)
隨著“一帶一路”新型經(jīng)濟帶的提出,我國海運業(yè)發(fā)展日益蓬勃,集裝箱運輸方式已成為海洋運輸?shù)臉酥尽Ec此同時港口作為“一帶一路”的重要節(jié)點,在“一帶一路”建設中有著舉足輕重的作用,港口集裝箱吞吐量不僅是港口地區(qū)經(jīng)濟發(fā)展的晴雨表,更標志著一個港口在國際經(jīng)濟貿易中的地位。[1]因此,利用有效的數(shù)學方法對港口集裝箱吞吐量進行精準預測,是對港口未來的規(guī)劃發(fā)展做出科學決策的重要前提。
自20世紀80年代起,關于港口集裝箱吞吐量預測方面的研究很多,國內外學者提出多種預測方法,如時間序列預測法[2-3]、TEI@I方法論[4]、灰色模型法[5-6]、支持向量回歸機法[7]、神經(jīng)網(wǎng)絡法[8]和組合模型法[9-11]等。一方面大部分單一模型的預測精度較低,而組合模型建模求解過程較復雜,在實際應用中難以發(fā)揮理想效果;另一方面,大部分文獻集中于研究年度集裝箱吞吐量預測,沒有對季度數(shù)據(jù)進行統(tǒng)計分析,無法準確地掌握港口集裝箱吞吐量的季度發(fā)展規(guī)律,僅有少量文獻考慮月度數(shù)據(jù),但沒有深入分析各月份吞吐量對總體吞吐量的影響程度。與以往的研究相比,本文的做法:首先用加權灰色關聯(lián)分析對各季度影響總體吞吐量的程度進行排序;然后利用三次指數(shù)平滑法對該港口集裝箱季度吞吐量進行初值預測,并結合馬爾科夫模型修正初值,改善其對轉折點的不適應所造成的誤差,提高預測精度;最后與傳統(tǒng)三次指數(shù)平滑法和灰色模型法的預測結果進行對比,充分證明所提組合模型的預測效果更好,可為港口經(jīng)營發(fā)展提供決策支持。
設X={xσ|σ=0,1,2,…,m}為序列關聯(lián)因子集,X0為參考函數(shù),Xi為比較函數(shù),xσ(k)為xσ在第k點的值,其中k=1,2,3,…,n。
設x=(x(1),x(2),x(3),…,x(n))的累減生成序列為
x′=(x′(1),x′(2),x′(3),…,x′(n))
(1)
其計算方法為
x′(1)=x(1),x′(k)=x(k)-x(k-1),k=2,3,…,n
(2)
對于x0、xi
令
(3)
式(3)中:ζi(k)為關聯(lián)系數(shù),即第k時刻比較曲線xi對于參考曲線x0的相對差值;兩個層級的最大差為maxi∈mmaxk∈n|x0(k)-xi(k)|;ε為分辨系數(shù);λ1為位移加權系數(shù);λ2為變化率加權系數(shù),均取0.5。ε取值過大或過小都可能導致相關參數(shù)產生誤差,最終影響模型的準確度。許多文獻表明:ε較為合理的取值為0.5或0.6,此時不僅計算簡單,而且可信度較高,本文取ε= 0.5。[12]
xi對于x0的加權灰色關聯(lián)度γi為
(4)
式(4)中:βk為因子k常態(tài)化的權重系數(shù),通過白化權函數(shù)來確定[12],過程如下:
設白化權函數(shù)為
f(x)=xe1-x+(1-x)ex-1
(5)
已知序列為
xi(k)=(xi(1),…,xi(2),…,xi(k),xi(n)),
i=1,2,…,n
(6)
1) 求各序列中屬性因子總和為
(7)
2) 求因子熵為
(8)
3) 求熵總和為
(9)
4) 求相對權重為
(10)
5) 利用正規(guī)化法求各因子權重為
(11)
選取深圳港2012—2017年各季度集裝箱吞吐量數(shù)據(jù)見表1,對其進行季度灰色加權關聯(lián)分析,旨在找出該港口集裝箱季度吞吐量發(fā)展變化規(guī)律。
設該港口每年的集裝箱吞吐量為參考序列如下:
x0=(2 101.69,2 096.70,2 401.77,2 369.78,
2 283.23,2 460.49)
(12)
不同季度對應的集裝箱吞吐量為比較序列xi(i=1,2,3,4),由式(3)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的關聯(lián)系數(shù)矩陣為
(13)
式(13)中:ξ1、ξ2、ξ3、ξ4分別為第一、第二、第三、第四季度的關聯(lián)系數(shù)。
通過上述白化權函數(shù)求得各因子權重為β1=0.172、β2=0.172、β3=0.162、β4=0.163、β5=0.166、β6=0.165,由式(2)可得每年度集裝箱吞吐量總數(shù)與各季度吞吐量的加權關聯(lián)度為
表1 深圳港2012—2017各季度集裝箱吞吐量 萬TEU
(14)
式(14)中:γ1、γ2、γ3、γ4分別為第一、第二、第三、第四季度的關聯(lián)度。
由式(14)可知:γ3>γ4>γ2>γ1,即第三季度與年度總數(shù)的關聯(lián)度最大,其次是第四季度、第二季度,這兩個季度的影響度接近,關聯(lián)度最低的是第一季度。這與直觀對數(shù)據(jù)分析的結果一致,表明每年從第一季度開始深圳港集裝箱吞吐量逐漸遞增,在第三季度達到峰值,第四季度稍稍回落到與第二季度接近的水平,而來年第一季度吞吐量又迅速降低。根據(jù)量化結果,深圳港在未來的規(guī)劃發(fā)展中應依據(jù)此規(guī)律,制定有效計劃,合理規(guī)劃交通、資源配置等問題。
指數(shù)平滑法是特殊的移動平均法,其特點在于對過去的觀測值分配不一樣的權重,新數(shù)據(jù)給予較大的權重,舊數(shù)據(jù)給予較小的權重,預測值是以前觀測值的加權和。指數(shù)平滑預測法包括3種,其中:一次指數(shù)平滑法適合無趨勢的平穩(wěn)時間序列;二次指數(shù)平滑法適合呈線性趨勢的時間序列;三次指數(shù)平滑預測法適用于不規(guī)則、呈非線性趨勢的時間序列。港口集裝箱吞吐量受國家政策、周邊經(jīng)濟發(fā)展狀況和自然環(huán)境等因素影響,導致其具有明顯的非線性特征。因此,使用三次指數(shù)平滑法來對其進行初值預測。三次指數(shù)平滑公式[13]為
(15)
第t+m期的預測值為
(16)
式(16)中:m為預測步長,取正整數(shù)1,2,3,…。其中預測參數(shù)為
(17)
一般情況下確定平滑初值有兩種方式:
1) 當數(shù)據(jù)量較多時,應取
(18)
2) 當數(shù)據(jù)量較少時,一般選取最初三期的平均數(shù)作為初值,即
(19)
另外,選取合適的平滑系數(shù)對于建立平滑模型非常關鍵。若數(shù)據(jù)波動較大,為提高預測精度,應將α值取大一些,以增加近期數(shù)據(jù)的權重;若數(shù)據(jù)波動平穩(wěn),則α值應取小一些。
當數(shù)據(jù)量較多時,可編制通用化程序,計算動態(tài)平滑系數(shù);當數(shù)據(jù)量較少時,一般采用試算法確定α值,即先根據(jù)自身數(shù)據(jù)變化趨勢來大致確定取值范圍,再根據(jù)取值范圍選取不同的α值進行試算,將預測誤差平方和最小的α選為最終參數(shù)。誤差平方和最小公式為
(20)
ES-Markov模型結合三次指數(shù)平滑法與馬爾科夫模型,首先利用三次指數(shù)平滑法得出初始預測值,再用馬爾科夫原理得到狀態(tài)轉移矩陣,修正初始預測值,以此提高預測精度。以下為具體步驟。
2.2.1計算精確度[14]
精確度為實際值與三次指數(shù)平滑預測初值之比,即
(21)
2.2.2狀態(tài)區(qū)間劃分
通過簡單層次聚類將精確度劃分為n個狀態(tài),其狀態(tài)區(qū)間表示為Ei=[Ei1,Ei2],其中:Ei1、Ei2分別為狀態(tài)Ei的上下限,總的精確度集合為E= (E1,E2,…,En)。
2.2.3構建狀態(tài)轉移概率矩陣
狀態(tài)轉移概率Pij(k)計算為
(22)
式(22)中:Pij(k)為客觀事物經(jīng)一種狀態(tài)轉移至另一種狀態(tài)發(fā)生的概率,其中Mi為Ei狀態(tài)的原始數(shù)據(jù)數(shù)量;Mij(k)為Ei經(jīng)過k步轉移至狀態(tài)Ej的原始數(shù)據(jù)數(shù)量,處于樣本序列末尾的Mi不計入算式。
狀態(tài)轉移矩陣由狀態(tài)轉移概率組成,其代表著客觀事物在t時刻所處狀態(tài)轉變?yōu)?t+1)時刻所處狀態(tài)時的條件概率矩陣,其表達式為
(23)
2.2.4確定預測時刻轉移狀態(tài)
馬爾科夫鏈具有無后效性,即轉移的發(fā)生只與當前狀態(tài)有關,假設預測對象處于Ei狀態(tài),則僅考察當前狀態(tài)轉移概率矩陣第i行狀態(tài)向量P(t),若第j列概率值最大,則預測對象下一時刻最有可能轉向Ej狀態(tài)。
2.2.5修正預測初值
超聲波模塊固定在小車的正前方,用來檢測正前方的障礙物。在這里筆者選用的型號是US-100,其測距范圍為2cm-450cm,自帶溫度傳感器可以自動對測試結果進行校正,具有電平輸出和UART輸出兩種輸出方式,小車使用的是電平輸出。該模塊具有五個端子,1號端子接VCC電源;4號和5號端子接外部電路的地;2號端子為 Trig端;3號端子為 Echo端。需要測距時,單片機會從Trig管腳輸入一個10微秒以上的高電平,系統(tǒng)會發(fā)出8個40KHz的超聲波脈沖,然后檢測回波信號,經(jīng)過溫度校正后,將結果通過Echo管腳輸出[3]。
首先確定預測對象下一步轉移到狀態(tài)Ei,然后結合三次指數(shù)平滑法所得初值和所處狀態(tài)確定組合預測優(yōu)化值yt。
(24)
設置以下3個檢驗精度的指標:
1) 將t時刻實際值與預測值的相對誤差記為δ(t),其表達式為
(25)
2) 將所有時刻的平均絕對百分誤差記為(Mean Absolute Percentage Error, MAPE),其表達式為
(26)
3) 將所有時刻的均方根誤差記(Root Mean Square Error, RMSE),其表達式為
(27)
以2012—2016年深圳港集裝箱季度吞吐量作為原始數(shù)據(jù),如表1所示。首先使用三次指數(shù)平滑法、組合預測優(yōu)化模型分別對數(shù)據(jù)進行擬合,再預測2017年4個季度的集裝箱吞吐量,并將預測值與實際值進行對比。
首先確定平滑初值,由于本文數(shù)據(jù)量只有20個,而初始值對預測值影響較大,因此,采用前3個數(shù)據(jù)的平均數(shù)作為初始值,即
(28)
本文利用MATLAB,首先選取幾個大致區(qū)間臨界值代入進行試算,找出誤差平方和最小的區(qū)間,再從該區(qū)間內找到使誤差平方和最小的α值,經(jīng)過計算,確定α=0.1時預測誤差最小。
通過三次指數(shù)平滑模型得出預測結果,由于篇幅所限,各季度對應的平滑值與參數(shù)無法全部展示。主要預測2016年之后的集裝箱吞吐量,因此,取t=20,根據(jù)式(16)可得a20=598.140 1,b20=3.81,c20=0.042 7,根據(jù)式(16)得到三次平滑預測式為
(29)
由式(29)得出2017年4個季度的3次平滑預測初值分別為601.99萬TEU、605.93萬TEU、609.95萬TEU、614.06萬TEU。
3.2.1劃分狀態(tài)區(qū)間
根據(jù)三次指數(shù)平滑法的初步預測結果,可得到預測初值的精確度序列,通過簡單層次聚類,將精確度序列劃分為(0.854 2,0.939)、(0.939,1.032 8)、(1.032 8,1.126 6)、(1.126 6,1.220 4)等4個狀態(tài),各季度集裝箱吞吐量所處狀態(tài)見表2。
表2 各預測模型擬合精度對比與狀態(tài)劃分
3.2.2預測狀態(tài)向量及預測值計算
通過式(24)得到由Markov優(yōu)化后的2012—2016年吞吐量組合預測值如表2所示。根據(jù)馬爾科夫預測原理,得到1步轉移矩陣P1為
(30)
由于2016年第四季度處于狀態(tài)E3,由P1可知2017年第一季度預測狀態(tài)向量P(1)=(1/5,2/5,1/5,1/5),則2017年第一季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預測值為593.50萬TEU;此時再求出二步轉移矩陣P2=(P1)2,得到2017年第二季度預測狀態(tài)向量P(2)=(21/160,169/320,9/40,37/320),則2017年第二季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預測值為597.39萬TEU;同理,2017年第三季度預測狀態(tài)向P(3)=(390/2 203,950/2 753,587/1 600,646/5 819),則2017年第三季度集裝箱吞吐量最有可能處于狀態(tài)E3,求出組合預測值為658.57萬TEU;同理,2017年第四季度預測狀態(tài)向量P(4)=(860/4 879,167/464,583/1 678,287/2 466),則該港口2017年第四季度集裝箱吞吐量最有可能處于狀態(tài)E2,求出組合預測值為605.40萬TEU。
由表2可知:相比傳統(tǒng)的三次指數(shù)平滑模型、灰色預測模型,組合優(yōu)化模型使相對誤差都降至5%以下,再計算出各模型的平均相對百分誤差及均方根誤差,見表3。
表3 各模型精度檢驗結果
由表3可知:組合模型所得平均相對百分誤差(MAPE)相比灰色模型降低4.21%,比三次指數(shù)平滑模型降低4.97%;組合模型所得均方根誤差(RMSE)相比灰色模型降低29.56,比三次指數(shù)平滑模型降低36.55,預測精度大幅提高。2012—2017年的實際值與3種模型的預測值對比見圖1,可看出相對于傳統(tǒng)的三次指數(shù)平滑模型和灰色預測模型,組合模型的預測曲線與實際值曲線更加吻合,模型效果更優(yōu)。
圖1 3種模型預測結果對比圖
本文使用加權灰色關聯(lián)分析和ES-Markov組合模型,對深圳港2012—2017年集裝箱季度吞吐量數(shù)據(jù)進行定量研究,結果表明:港口集裝箱吞吐量存在季節(jié)性波動,組合預測模型能很好地適應其發(fā)展變化規(guī)律,且預測精度和擬合度較高,同時建模相對簡單、易于實現(xiàn),可為港口未來的決策規(guī)劃提供新思路。