葉雪強,桂預風
(武漢理工大學理學院,武漢430070)
長江是我國內河水運最重要、運輸規(guī)模最大的通航河流。自2003年三峽船閘投入運行以來,過閘貨運量快速增長,2014年三峽船閘過閘貨運量達到近1.2億噸。長江三峽船閘過閘貨運量常應用于各種經(jīng)濟規(guī)劃分析中,并作為衡量內河航運發(fā)展程度的一項重要指標[1]。
目前,貨運量的預測方法主要有時間序列分析法,回歸分析法,彈性系數(shù)法,平均增長率法,灰色系統(tǒng)預測法等。杜嘉[1]采用彈性系數(shù)法、平均增長率法、回歸分析法、曲線擬合法分別預測三峽過閘貨運量,并根據(jù)各種預測方法的特點及適用場合,最終確定四種過閘貨運量預測方法的權重系數(shù)。趙奇志[2]采用回歸分析模型、二次指數(shù)平滑法、抽象方式選擇模型、增長系數(shù)法分別預測廣西內河貨運總量,最后通過綜合比較分析,最終預測出西津水利樞紐過閘貨運量。馬海峰[3]采用平均增長率法預測三峽船閘過閘貨運量。
本文根據(jù)三峽船閘過閘貨運量的歷史數(shù)據(jù),建立了GM(1,1)預測模型和線性回歸預測模型,并提出了熵值法組合預測模型。由于熵值法確定組合預測權系數(shù)不可避免地會碰到一些極端值,如相對誤差為零,或者數(shù)據(jù)出現(xiàn)異常點等,而熵值法確定組合預測權系數(shù)要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,從而提出了改進熵值法組合預測模型,并對三峽船閘過閘貨運量進行預測。
1.2.1 基于熵值法的組合預測模型權系數(shù)的確定方法[4]
組合預測綜合利用各種單項預測方法所提供的信息,以適當?shù)募訖嗥骄问降贸鼋M合預測模型。組合預測核心的問題就是如何求出組合預測加權平均系數(shù),使得組合預測模型更加有效地提高預測精度。本文從信息論的觀點出發(fā),根據(jù)各單項預測方法預測誤差序列的變異程度,利用信息熵的概念。計算出組合預測加權平均系數(shù)。
設第i種單項預測方法第t時刻相對誤差為:
用熵值法確定組合預測加權系數(shù)的步驟如下:
(1)將各種單項預測方法預測相對誤差序列歸一化。即計算第i種單項預測方法第t時刻的預測相對誤差的比重:
(2)計算第i種單項預測方法的預測相對誤差的熵值hi:
其中k>0為常數(shù)。對第i種單項預測方法而言,如果pit全部相等,即,那么hi取得極大值klnN,這里取k=1 lnN,則有0≤hi≤1。
(3)計算第i種單項預測方法的預測相對誤差序列的變異程度系數(shù):
(4)計算各種預測方法的加權系數(shù):
(5)計算組合預測值:
1.2.2 基于改進熵值法的組合預測模型權系數(shù)的確定方法
傳統(tǒng)的熵值法確定權系數(shù)不可避免地會碰到一些極端值,如相對誤差為零,或者數(shù)據(jù)出現(xiàn)異常點等。而傳統(tǒng)的熵值法確定權系數(shù)要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,或者人為主觀的定義0ln0=0,是為了保證數(shù)據(jù)的完整性和確定權系數(shù)的客觀性,等于零的數(shù)值又不能直接刪去,因此需要對該相對誤差進行變換,從而對熵值法進行改進。為了縮小極端值對權系數(shù)的影響,并保證賦權的客觀性,可以對相對誤差序列進行變換,然后再按照傳統(tǒng)熵值法的步驟(1)至步驟(5)進行計算。相對誤差變換公式為:
其中:
Markov鏈是一種特殊的隨機過程[5],其可以根據(jù)系統(tǒng)當前時刻的狀態(tài)推求下一時刻的狀態(tài)概率分布,進而得到下一時刻的狀態(tài)。其基本原理是:每個系統(tǒng)的狀態(tài)可用隨機變量表示,并對應一定的狀態(tài)概率,當某一時刻狀態(tài)轉移到下一時刻狀態(tài)時,同時在這個過程中存在概率的轉移,即轉移概率[6]。
假設有個n狀態(tài),并且狀態(tài)的個數(shù)是可數(shù)的,那么狀態(tài)Ei經(jīng)一步轉移到狀態(tài)Ej都有可能發(fā)生,則這個過程可能發(fā)生的概率稱為一步轉移概率pij。所有的狀態(tài)一步轉移概率構成一步轉移矩陣P(1)。Markov鏈預測模型[7]可表示為:
其中,P0為初始時刻的概率分布,Pt+1是t+1時刻的概率分布,P(1)為一步轉移概率矩陣,其表達式為:
式中:pij為一步轉移概率,
根據(jù)改進熵值法組合預測模型預測結果,選擇適合的指標(這里采用預測結果的相對誤差)劃分狀態(tài)空間;計算其一步轉移頻數(shù)矩陣,求出其一步轉移概率矩陣;利用Markov鏈預測模型對改進熵值法的預測結果進行修正。
本文根據(jù)三峽船閘過閘貨運量2003—2014年數(shù)據(jù)的變化趨勢,先利用GM(1,1)模型和線性回歸預測模型分別進行預測;之后再利用組合預測模型對年過閘貨運量進行預測,并對各種方法的預測結果進行對比分析;最后通過Markov鏈模型對預測結果進行修正。三峽船閘過閘貨運量2003—2014年數(shù)據(jù)(記為y,單位:萬噸)見表1所示。
表1 預測方法的預測擬合值
3.1.1 GM(1,1)模型
灰色系統(tǒng)建模是通過數(shù)據(jù)序列建立微分方程來擬合給定的時間序列,從而對數(shù)據(jù)的發(fā)展趨勢進行預測[8]。
設為原始數(shù)據(jù)序列:
將原始序列進行一次累加,得到:
GM(1,1)模型的時間響應序列為:
還原值為:
利用GM(1,1)模型建??梢缘贸鋈龒{船閘過閘貨運量的GM(1,1)模型的時間響應序列為:
利用GM(1,1)模型的時間響應序列進行預測并對預測結果進行一次累減后的數(shù)列即為運用GM(1,1)模型對過閘貨運量的預測估計值(記為x1),見表1所示。
通過對模型的檢驗,得出以下結果:
(1)殘差檢驗:相對殘差φˉ=6.94%>10%,認為其預測精度較高。
(2)關聯(lián)度檢驗:關聯(lián)度r=0.7243>0.6,認為其模型可以接受。
(3)后驗差檢驗:小殘差概率p=1>0.95,認為其模型為小殘差概率合格模型。
3.1.2 線性回歸模型
一元線性回歸模型[9]的數(shù)學形式:
其中,ε是隨機誤差,通常假定ε~N(0,σ2)。
由于過閘貨運量數(shù)據(jù)隨年份呈線性趨勢,故建立一元線性回歸模型:
通過對模型的檢驗,得出以下結果:
(1)回歸系數(shù)的顯著性檢驗:β1顯著性檢驗的t值為t=13.6953,其對應的p值p=0<0.05,認為β1顯著性不為零。
(2)線性回歸方程的顯著性檢驗:線性回歸方程的顯著性檢驗的F值為F=187.5624,其對應的p值p=0<0.05,認為線性回歸方程顯著。
3.2.1 基于熵值法確定權系數(shù)的組合預測模型
在利用以上兩種單項預測模型計算出預測擬合值后,根據(jù)熵值法來確定兩種單項預測模型的組合權系數(shù),得到的權系數(shù)向量為:
ω=(0.4562,0.5438)
從而得到相應的熵值法組合模型為:
利用熵值法組合預測模型(記為組合模型1)得到的預測擬合值(記為x3)見表1所示。
3.2.2 基于改進熵值法確定權系數(shù)的組合預測模型
根據(jù)改進熵值法來確定兩種單項預測模型的組合權系數(shù),得到的權系數(shù)向量為:
ω=(0.6054,0.3946)
從而得到相應的改進熵值法組合預測模型為:利用改進熵值法組合模型得到的預測擬合值(記為x4)見表1所示。
比較兩種單項預測模型和兩種組合模型的擬合精度,以預測誤差平方和作為反映預測精度的一個指標。通過計算兩種單項預測模型和兩種組合模型的預測誤差平方和(結果見表2所示)可以得出,熵值法組合預測模型精度低于改進熵值法組合預測模型精度,但高于兩種單項預測模型的精度,由此可見,改進熵值法能有效的減少預測誤差,提高預測精度。預測誤差平方和公式為:
表2 各種預測模型的預測誤差平方和
計算改進熵值法組合預測模型對過閘貨運量的預測相對誤差,計算結果見表3所示。根據(jù)預測相對誤差的具體數(shù)值,劃分的Markov狀態(tài)空間間為:(1)狀態(tài)空間E1為預測相對誤差ε∈[-18%,-6%),屬于預測偏低狀態(tài);(2)狀態(tài)空間E2為預測相對誤差ε∈[-6%,6%),屬于預測正常狀態(tài);(3)狀態(tài)空間E3為預測相對誤差ε∈[6%,18%),屬于預測偏高狀態(tài)。并以此對改進熵值法組合預測模型的預測相對誤差進行狀態(tài)劃分,結果見表3所示。
表3 2003—2014年過閘貨運量的預測相對誤差及狀態(tài)分類
由表3可計算出其一步轉移頻數(shù)矩陣Q,從而計算出一步狀態(tài)轉移概率矩陣P(1),其中:
同理,
轉移矩陣的不變分布為:
根據(jù)Markov鏈預測模型,由轉移概率矩陣可以得出預測值的狀態(tài)空間及其相對應的概率,從而可以計算出基于Markov鏈修正的改進熵值法組合預測模型的預測結果。由不變分布可以得出,若干年之后Markov鏈處于狀態(tài)E1,E2和E3的概率分別0.5455,0.2727和0.1818。表4(見下頁)列出了2015—2020年基于Markov鏈修正的改進熵值法組合預測模型的預測結果。
本文采用了熵值法組合預測模型對三峽船閘過閘貨運量進行預測,針對熵值法確定組合預測權系數(shù)的不足,提出了改進熵值法組合預測模型,并且預測精度比熵值法組合預測模型的預測精度更高。最后利用Markov鏈預測模型對改進熵值法的預測結果進行修正,進一步增加了預測的精度和可信度。
表4 改進熵值法組合預測結果的Markov鏈修正值
[1]杜嘉.長江三峽樞紐水路客貨運輸量預測[D].重慶:重慶交通大學碩士學位論文,2008.
[2]趙奇志.西津樞紐貨運量預測及二線船閘通航條件研究[D].重慶:重慶交通大學碩士學位論文,2013.
[3]馬海峰.三峽樞紐過閘貨運量預測分析及對策研究[J].中國水運,2015,38(3).
[4]陳華友.組合預測方法有效性理論及其應用[M].北京:科學出版社,2008.
[5]朱新國,張展羽,祝卓.基于改進型BP神經(jīng)網(wǎng)絡馬爾科夫模型的區(qū)域需水量預測[J].水資源保護,2010,26(2).
[6]景亞平,張鑫,羅艷.基于灰色神經(jīng)網(wǎng)絡與馬爾科夫鏈的城市需水量組合預測[J].西北農林科技大學學報,2011,39(7).
[7]付長賀,鄧甦.馬爾科夫鏈在傳染病預測中的應用[J].沈陽師范大學學報:自然科學版,2009,27(1).
[8]許國根,賈瑛.模式識別與智能計算的MATLAB實現(xiàn)[M].北京:北京航空航天大學出版社,2012.
[9]何曉群,劉文卿.應用回歸分析[M].北京:中國人民大學出版社,2011.