詹 斌,呂臘梅,黃 馨
(武漢理工大學(xué) 交通學(xué)院,湖北 武漢 430061)
基于熵權(quán)法的公路貨運(yùn)量組合預(yù)測(cè)
詹斌,呂臘梅,黃馨
(武漢理工大學(xué)交通學(xué)院,湖北武漢430061)
由于僅采用單一模型進(jìn)行預(yù)測(cè)很難得到有效的預(yù)測(cè)結(jié)果,為了充分利用各種預(yù)測(cè)方法所提供的信息,規(guī)避單一模型的局限性,盡可能科學(xué)有效地預(yù)測(cè)公路貨運(yùn)量,在多元線性回歸模型、二次指數(shù)平滑法以及GM(1,1)模型這三種單一模型的基礎(chǔ)上,建立基于熵權(quán)法確定權(quán)重的組合預(yù)測(cè)模型。實(shí)證結(jié)果表明,與單一的預(yù)測(cè)方法相比,組合預(yù)測(cè)模型能夠降低單一模型的預(yù)測(cè)風(fēng)險(xiǎn),減少預(yù)測(cè)的系統(tǒng)誤差,提高預(yù)測(cè)精度,具有較好的實(shí)用價(jià)值。
公路貨運(yùn)量;熵權(quán)法;組合預(yù)測(cè)
公路貨運(yùn)量預(yù)測(cè)方法大致可以分為兩類,一類是定性預(yù)測(cè),它是根據(jù)已掌握的歷史資料和直觀材料,運(yùn)用個(gè)人經(jīng)驗(yàn)和分析判斷能力,對(duì)事物的未來(lái)發(fā)展做出性質(zhì)和程度上的判斷,強(qiáng)調(diào)對(duì)事物發(fā)展的趨勢(shì)、方向和重大轉(zhuǎn)折點(diǎn)進(jìn)行預(yù)測(cè)。如專家會(huì)議法、德?tīng)柗品ǖ?,定性預(yù)測(cè)主觀性較強(qiáng),預(yù)測(cè)結(jié)果完全依賴于參與預(yù)測(cè)人員的經(jīng)驗(yàn)和能力[1]。另一類是定量預(yù)測(cè),定量預(yù)測(cè)分兩種,基于時(shí)間序列的預(yù)測(cè)法和基于影響因素的預(yù)測(cè)法。基于時(shí)間序列的預(yù)測(cè)法包括指數(shù)平滑法、灰色系統(tǒng)法、神經(jīng)網(wǎng)絡(luò)法、小波分析法等;基于影響因素的預(yù)測(cè)法包括回歸分析法、彈性系數(shù)法、投入產(chǎn)出法等。在進(jìn)行預(yù)測(cè)時(shí),單獨(dú)采用某一種模型往往有其局限性,例如:基于時(shí)間序列的預(yù)測(cè)法以時(shí)間作為單一的預(yù)測(cè)因素,無(wú)法反映預(yù)測(cè)對(duì)象的實(shí)際影響因素,尤其是無(wú)法反映經(jīng)濟(jì)政策和發(fā)展速度調(diào)整等外部因素調(diào)整所引起的運(yùn)輸需求的變化;如果預(yù)測(cè)對(duì)象在所研究的時(shí)間序列上波動(dòng)較大,預(yù)測(cè)效果就會(huì)很差?;谟绊懸蛩氐念A(yù)測(cè)法中,自變量或因變量未來(lái)值的選擇影響預(yù)測(cè)的準(zhǔn)確性,對(duì)數(shù)據(jù)信息的完備性要求高,而在實(shí)際預(yù)測(cè)時(shí),很難獲取充足的數(shù)據(jù)信息。因此,為了充分利用各種預(yù)測(cè)方法所提供的信息,規(guī)避單一模型的局限性,盡可能地提高預(yù)測(cè)精度,本文在多元線性回歸模型、二次指數(shù)平滑法以及GM(1,1)模型這三種單一模型的基礎(chǔ)上建立組合預(yù)測(cè)模型,根據(jù)熵權(quán)法確定各單項(xiàng)預(yù)測(cè)方法的權(quán)重,從而達(dá)到提高預(yù)測(cè)精度的目的。
2.1單項(xiàng)預(yù)測(cè)模型
2.1.1線性回歸預(yù)測(cè)模型。線性回歸預(yù)測(cè)模型在貨運(yùn)量預(yù)測(cè)中應(yīng)用較為普遍,它是從事物變化的相關(guān)關(guān)系出發(fā)進(jìn)行預(yù)測(cè)的一種方法,其可靠性高,實(shí)用價(jià)值高。線性回歸預(yù)測(cè)有一元線性回歸分析、二元線性回歸和多元線性回歸分析。本文采用的是多元線性回歸模型。
多元線性回歸模型為 Y=β0+β1X1+β2X2+...+ βkXk+φ,其中φ為隨機(jī)項(xiàng)。
在進(jìn)行線性回歸預(yù)測(cè)時(shí),通常要對(duì)模型進(jìn)行檢驗(yàn)。多元線性模型的檢驗(yàn)包括擬合優(yōu)度檢驗(yàn)、F檢驗(yàn)、t檢驗(yàn)、序列相關(guān)性檢驗(yàn)。擬合優(yōu)度檢驗(yàn)一般用判定系數(shù)R2實(shí)現(xiàn),0<R2<1,且R2越接近1,表明模型對(duì)觀測(cè)數(shù)據(jù)擬合程度越高,通常,R2>0.8時(shí),則可以認(rèn)為模型擬合程度較高。判定系數(shù)R2的計(jì)算公式為:
F檢驗(yàn)按給定的顯著性水平,若F>Fα(m,n-m-1),拒絕原假設(shè),反之,則接受原假設(shè),說(shuō)明自變量與因變量線性關(guān)系不顯著。F檢驗(yàn)的計(jì)算公式:
t檢驗(yàn),t統(tǒng)計(jì)量的計(jì)算公式為:
式中Cjj為矩陣主對(duì)角線上的第j個(gè)元素。
序列相關(guān)性檢驗(yàn),最常見(jiàn)的序列相關(guān)性檢驗(yàn)是一階自相關(guān)檢驗(yàn),即εi與εi+1相關(guān),而一階自相關(guān)檢驗(yàn)最常用的檢驗(yàn)方法是DW檢驗(yàn)法,DW統(tǒng)計(jì)量計(jì)算公式為:
2.1.2指數(shù)平滑法。指數(shù)平滑法是用平滑系數(shù)對(duì)時(shí)間序列的歷史數(shù)據(jù)進(jìn)行加權(quán)修勻,建立指數(shù)平滑數(shù)學(xué)模型進(jìn)行預(yù)測(cè)的方法,即對(duì)實(shí)際值和預(yù)測(cè)值分別給以不同的權(quán)重,計(jì)算加權(quán)平均數(shù)作為下期的預(yù)測(cè)值。該方法只需要最近一期的貨運(yùn)量預(yù)測(cè)數(shù)和實(shí)際貨運(yùn)量即可預(yù)測(cè)下一期的數(shù)值貨運(yùn)量,預(yù)測(cè)方法簡(jiǎn)單,因此在實(shí)際工作中得到了廣泛應(yīng)用[2]。
指數(shù)平滑法包括一次指數(shù)平滑法、二次指數(shù)平滑法和三次指數(shù)平滑法。本文采用的是二次指數(shù)平滑法,二次指數(shù)平滑法是以相同的平滑系數(shù),對(duì)時(shí)間序列進(jìn)行兩次平滑修勻,使長(zhǎng)期趨勢(shì)更清楚地顯示出來(lái),然后根據(jù)兩次平滑數(shù)列建立線性趨勢(shì)預(yù)測(cè)模型。其計(jì)算公式如下:
采用GM(l,1)模型進(jìn)行預(yù)測(cè)時(shí),為了保證預(yù)測(cè)精度,需對(duì)模型的精度進(jìn)行檢驗(yàn),如果模型不能達(dá)到精度要求,那么需要對(duì)模型進(jìn)行校正,常用的模型檢驗(yàn)方法有殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)、后驗(yàn)差檢驗(yàn)。本文采用的是后驗(yàn)差檢驗(yàn)。計(jì)算均方差比值C以及小誤差概率P。P,C等級(jí)參照表1。
用下式計(jì)算后驗(yàn)差比值C及小概率誤差P:
表1 P,C等級(jí)參照表
2.2組合預(yù)測(cè)模型
2.2.1組合預(yù)測(cè)原理。組合預(yù)測(cè)法是指對(duì)兩種或兩種以上預(yù)測(cè)方法的預(yù)測(cè)結(jié)果進(jìn)行加權(quán)組合,與單一的預(yù)測(cè)方法相比,組合預(yù)測(cè)法更加科學(xué)合理,它能達(dá)到取長(zhǎng)補(bǔ)短的效果,從而提高預(yù)測(cè)結(jié)果的精度和可靠性。
2.2.2權(quán)重確定。本文采用基于信息熵的組合預(yù)測(cè)模型。該方法引入了信息論中的信息熵概念,根據(jù)每個(gè)單項(xiàng)預(yù)測(cè)模型在系統(tǒng)中的信息熵,為各個(gè)單項(xiàng)預(yù)測(cè)方法在組合預(yù)測(cè)系統(tǒng)中賦權(quán)值,由此建立一個(gè)能夠全面考慮到各種單項(xiàng)預(yù)測(cè)方法所提供的信息的組合預(yù)測(cè)模型,達(dá)到客觀、準(zhǔn)確的對(duì)貨運(yùn)量進(jìn)行預(yù)測(cè)的效果?;陟貦?quán)的權(quán)重計(jì)算具體步驟如下:
設(shè)對(duì)m種預(yù)測(cè)方法用n個(gè)效果評(píng)價(jià)(誤差)指標(biāo)去評(píng)價(jià),得到評(píng)價(jià)矩陣:
yij表示第i種預(yù)測(cè)方法用第j個(gè)指標(biāo)進(jìn)行評(píng)價(jià)得到的評(píng)估值。
最后,計(jì)算各預(yù)測(cè)方法的權(quán)重:
2.3模型評(píng)價(jià)
評(píng)價(jià)效果這里選擇平方和誤差SSE、平均絕對(duì)誤差MAE、均方誤差MSEA、平均絕對(duì)百分比誤差MAPE、均方百分比誤差MSPE這5種誤差指標(biāo)。
本文以湖南省公路貨運(yùn)量為例進(jìn)行組合預(yù)測(cè),表2是2002-2013年湖南省公路貨運(yùn)量數(shù)據(jù)。
表2 湖南省2002-2013年公路貨運(yùn)量統(tǒng)計(jì)表[4](單位:萬(wàn)t)
(1)多元線性回歸預(yù)測(cè)。通過(guò)計(jì)算各經(jīng)濟(jì)指標(biāo)與湖南省公路貨運(yùn)量的灰色關(guān)聯(lián)度,選擇了社會(huì)零售總值(x1)、地區(qū)生產(chǎn)總值(x2)、全社會(huì)固定資產(chǎn)投資(x3)作為解釋變量,利用SPSS軟件對(duì)公路貨運(yùn)量進(jìn)行回歸分析,建立多元線性回歸模型,其預(yù)測(cè)模型為:
回歸模型檢驗(yàn):對(duì)模型進(jìn)行擬合優(yōu)度檢驗(yàn),該模型的擬合優(yōu)度R2=0.984,說(shuō)明該模型的擬合度很高;對(duì)模型進(jìn)行顯著性檢驗(yàn),F(xiàn)=221.767,F(xiàn)0.05(1,10)=4.96,F(xiàn)>F0.05,所以該模型通過(guò)了顯著性檢驗(yàn)。根據(jù)t統(tǒng)計(jì)量的計(jì)算公式計(jì)算得tb1=0.707,tb2
=1.259,tb3
=-2.719,當(dāng)顯著性水平為α=0.01時(shí),t0.01/2(12-3-1)=3.5,tb1,tb2,tb3均通過(guò)檢驗(yàn)。
對(duì)預(yù)測(cè)誤差進(jìn)行檢驗(yàn),通過(guò)計(jì)算,平均絕對(duì)百分比誤差MAPE=4.05%,小于10%,屬于高精度預(yù)測(cè)。因此可用求得的多元線性回歸模型對(duì)公路貨運(yùn)量進(jìn)行預(yù)測(cè)。
(2)二次指數(shù)平滑法。通過(guò)對(duì)α的多次試算,此處選取的平滑系數(shù)α為0.4,此時(shí)平均絕對(duì)百分比誤差MAPE最小。經(jīng)計(jì)算得:
因此趨勢(shì)模型方程為:
對(duì)模型進(jìn)行預(yù)測(cè)誤差檢驗(yàn),通過(guò)計(jì)算,平均絕對(duì)百分比誤差MAPE=6.82%,小于10%,屬于高精度預(yù)測(cè)。
(3)GM(1,1)模型
第三步,檢驗(yàn)X(1)是否具有準(zhǔn)指數(shù)規(guī)律
因此可以確定模型為:
為了確認(rèn)該模型是否合格,需對(duì)模型進(jìn)行檢驗(yàn),通過(guò)計(jì)算,均方差比值C=0.168,根據(jù)表1可知均方差比值精度為一級(jí)(優(yōu))。小誤差概率P=1,精度為一級(jí)(優(yōu))。平均絕對(duì)百分比誤差MAPE=4.22%,小于10%,屬于高精度預(yù)測(cè)。故該模型為合格的,可用來(lái)預(yù)測(cè)公路貨運(yùn)量。
(4)組合預(yù)測(cè)結(jié)果。根據(jù)2.2.2中的權(quán)重計(jì)算方法,計(jì)算得出多元線性回歸、二次指數(shù)平滑法、GM(1,1)模型所占權(quán)重分別為0.49,0.22,0.29。多元線性回歸模型考慮了其他因素的影響,能較好地反映貨運(yùn)量與經(jīng)濟(jì)的關(guān)系,其權(quán)重系數(shù)在三種預(yù)測(cè)方法中最高,說(shuō)明其預(yù)測(cè)值更接近實(shí)際情況。組合預(yù)測(cè)模型公式為:
根據(jù)上述組合預(yù)測(cè)模型計(jì)算預(yù)測(cè)結(jié)果,預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 預(yù)測(cè)結(jié)果 (單位:萬(wàn)t)
(5)誤差指標(biāo)結(jié)果。根據(jù)2.3中的公式計(jì)算出各預(yù)測(cè)方法及組合預(yù)測(cè)法的5種誤差指標(biāo),計(jì)算結(jié)果見(jiàn)表4,從表4可以看出,組合預(yù)測(cè)結(jié)果中,MAE、MAPE、MSPE這三個(gè)誤差指標(biāo)值是最低的,SSE誤差指標(biāo)值僅次于GM(1,1)模型、MSE誤差指標(biāo)值僅次于多元線性回歸模型,說(shuō)明基于信息熵的組合預(yù)測(cè)模型對(duì)提高預(yù)測(cè)精度有一定的意義。
表4 誤差指標(biāo)計(jì)算結(jié)果
本文采用基于熵權(quán)法的組合預(yù)測(cè)方法,綜合利用了多元線性回歸、二次指數(shù)平滑及灰色預(yù)測(cè)這三種單一模型所提供的信息,克服了單一預(yù)測(cè)模型在貨運(yùn)量預(yù)測(cè)中的局限性,達(dá)到了提高預(yù)測(cè)精度的目的。從實(shí)例分析中可以看出,采用基于信息熵的組合預(yù)測(cè)模型,各個(gè)誤差指標(biāo)都有了一定程度的改善,擬合結(jié)果優(yōu)于單一模型的預(yù)測(cè)結(jié)果,說(shuō)明采用此組合預(yù)測(cè)模型具有一定的合理性和優(yōu)越性。
[1]陳實(shí).貨運(yùn)量預(yù)測(cè)方法與應(yīng)用研究[D].武漢:武漢理工大學(xué),2008.
[2]宋光平.鐵路貨運(yùn)量預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2007.
[3]鄧聚龍.灰色系統(tǒng)基本方法(第二版)[M].武漢:華中科技大學(xué)出版社,2005.
[4]湖南統(tǒng)計(jì)局.湖南統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,2013.
Combination Forecasting of Highway Freight Volume Based on Entropy Weighting
Zhan Bin,Lv Lamei,Huang Xin
(School of Transportation,Wuhan University of Technology,Wuhan 430061,China)
In this paper,we established an entropy weighted combination forecasting model based on the multiple linear regression model,secondary exponential smoothing method and GM(1,1)model.Then through an empirical study,we proved that as compared with the individual models,the combination model had lower forecasting risks and system errors and higher forecasting accuracy.
highway freight volume;entropy weighting;combination forecasting
U492.313;F224
A
1005-152X(2016)06-0054-04
10.3969/j.issn.1005-152X.2016.06.013
2016-04-12
詹斌(1966-),男,湖北武漢人,武漢理工大學(xué)交通學(xué)院教授,主要研究方向:交通運(yùn)輸規(guī)劃與管理;呂臘梅(1992-),女,湖北隨州人,武漢理工大學(xué)交通學(xué)院碩士,主要研究方向:交通運(yùn)輸規(guī)劃與管理;黃馨(1993-),女,湖南懷化人,現(xiàn)供職于海豐國(guó)際。