許 錕,鮑學(xué)英,王起才
(蘭州交通大學(xué)土木工程學(xué)院,蘭州 730070)
基于GA-GM(1, N,α)冪模型的鐵路客運(yùn)量預(yù)測(cè)
許 錕,鮑學(xué)英,王起才
(蘭州交通大學(xué)土木工程學(xué)院,蘭州 730070)
針對(duì)在鐵路客運(yùn)量預(yù)測(cè)領(lǐng)域傳統(tǒng)的灰色預(yù)測(cè)模型不能反映真實(shí)系統(tǒng)的非線性結(jié)構(gòu)特點(diǎn)及其背景值的賦值不合理的問(wèn)題,提出使用對(duì)系統(tǒng)相關(guān)因素引入冪指數(shù)且經(jīng)過(guò)背景值優(yōu)化的GM(1, N, )冪模型進(jìn)行客運(yùn)量預(yù)測(cè)。背景值優(yōu)化時(shí)設(shè)置待定參數(shù),利用線性組合結(jié)構(gòu)重新計(jì)算背景值。對(duì)此模型產(chǎn)生的較多的待定參數(shù),采用能夠并行運(yùn)算、全局尋優(yōu)的遺傳算法進(jìn)行一次性求解。最后使用此模型對(duì)甘肅省鐵路客運(yùn)量進(jìn)行建模預(yù)測(cè),并與傳統(tǒng)GM(1, N)模型、GM(1, N)冪模型進(jìn)行對(duì)比分析。結(jié)果證明, GM(1, N, )冪模型具有更高的預(yù)測(cè)精度,對(duì)鐵路客運(yùn)量預(yù)測(cè)有一定的應(yīng)用和研究?jī)r(jià)值。
灰色模型;遺傳算法;鐵路客運(yùn)量;預(yù)測(cè);背景值優(yōu)化
鐵路部門(mén)的運(yùn)輸能力影響著整個(gè)國(guó)民經(jīng)濟(jì)的發(fā)展[1]。對(duì)鐵路客運(yùn)量進(jìn)行有效的預(yù)測(cè)是為鐵路運(yùn)輸部門(mén)作出合理規(guī)劃提供依據(jù)[2]。因此針對(duì)鐵路客運(yùn)量預(yù)測(cè)的研究具有充分的必要性和合理性。
駱泳吉[3]建立了非線性回歸模型并對(duì)京滬高鐵日客運(yùn)量做了預(yù)測(cè),結(jié)果顯示其精度和穩(wěn)定性均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型;Cheng[4]采用RBF神經(jīng)網(wǎng)絡(luò)建模方法對(duì)哈爾濱太平國(guó)際機(jī)場(chǎng)客流量進(jìn)行了預(yù)測(cè),結(jié)果證明其模型預(yù)測(cè)精度較高;汪健雄等[5-7]也建立了不同的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,均對(duì)客運(yùn)量預(yù)測(cè)效果較好;侯麗敏和Yuan均構(gòu)建了GM(1,1)與線性回歸的組合模型[8-9],分別對(duì)河南省鐵路客運(yùn)量和拉薩市出租車客流量進(jìn)行了預(yù)測(cè),且取得較高預(yù)測(cè)精度;Chen[10]建立了一種殘差GM(1,1)模型,并在陜西貨運(yùn)量預(yù)測(cè)問(wèn)題中表現(xiàn)良好。馮冰玉[11]提出一種BP神經(jīng)網(wǎng)絡(luò)與灰色GM(1,1)相結(jié)合的新型組合模型,在蘭州至中川機(jī)場(chǎng)鐵路客運(yùn)量預(yù)測(cè)應(yīng)用中表現(xiàn)出較高的預(yù)測(cè)精度。
以上針對(duì)客運(yùn)量預(yù)測(cè)的研究包括了非線性的神經(jīng)網(wǎng)絡(luò)類方法和基于貧信息、少數(shù)據(jù)的灰色預(yù)測(cè)方法,且都取得了優(yōu)良的預(yù)測(cè)精度。但是在灰色預(yù)測(cè)領(lǐng)域鮮有能夠?qū)ο到y(tǒng)進(jìn)行非線性預(yù)測(cè)的模型。鐵路客運(yùn)量的預(yù)測(cè)是一個(gè)對(duì)非線性結(jié)構(gòu)系統(tǒng)的規(guī)律進(jìn)行預(yù)測(cè)的過(guò)程,傳統(tǒng)的灰色預(yù)測(cè)模型描述這樣的系統(tǒng)難以避免較大的誤差。
此外,黃元生[12]對(duì)灰色預(yù)測(cè)模型背景值賦值的不合理性進(jìn)行了證明;周清[13]經(jīng)過(guò)實(shí)例分析證明對(duì)于低增長(zhǎng)序列,背景值最佳生成系數(shù)法能有效提升精度;徐寧[14]基于誤差最小化優(yōu)化了GM(1,1)模型的背景值,使其同時(shí)具有無(wú)偏性和最小誤差性。
針對(duì)以上問(wèn)題,本文提出使用經(jīng)過(guò)背景值優(yōu)化的GM(1,N,α)冪模型來(lái)對(duì)鐵路客運(yùn)量進(jìn)行預(yù)測(cè)。通過(guò)引入冪指數(shù)使相關(guān)變量能夠?qū)ο到y(tǒng)特征序列產(chǎn)生非線性的影響,同時(shí)使用線性結(jié)構(gòu)的背景值優(yōu)化方法進(jìn)一步提升模型的精度。受李祚泳[15]和邵良彬[16]使用遺傳算法優(yōu)化GM(1,1)模型的啟發(fā),本文采用具有并行計(jì)算,全局尋優(yōu)特點(diǎn)的遺傳算法對(duì)模型的多個(gè)待定參數(shù)進(jìn)行求解。
而
?
為GM(1,N)冪模型。
相對(duì)于傳統(tǒng)的GM(1,N)模型,GM(1,N)冪模型具有更好的非線性結(jié)構(gòu)。而現(xiàn)實(shí)生活中絕大多數(shù)系統(tǒng)都是非線性的,這就意味著具有非線性結(jié)構(gòu)的冪模型能更好地描述真實(shí)系統(tǒng)。GM(1,N)冪模型中γi即為對(duì)應(yīng)相關(guān)變量的冪指數(shù),用以反映對(duì)應(yīng)相關(guān)變量對(duì)系統(tǒng)產(chǎn)生的非線性作用。當(dāng)所有冪指數(shù)均為1時(shí),模型即退化為傳統(tǒng)GM(1,N)模型。
為GM(1,N)冪模型的影子方程。
(1)上述影子方程的解為
(3)經(jīng)過(guò)累減還原后的預(yù)測(cè)值為
在實(shí)際建模時(shí),為了防止模型在參數(shù)識(shí)別時(shí)出現(xiàn)數(shù)據(jù)矩陣漂移現(xiàn)象,應(yīng)對(duì)數(shù)量級(jí)較大的原始數(shù)據(jù)進(jìn)行初值化等數(shù)據(jù)變換。
對(duì)模型預(yù)測(cè)精度影響最大的因素之一就是背景值,因此,背景值的構(gòu)造是提高模型精度的一個(gè)有效突破口。文獻(xiàn)[11]已經(jīng)論證過(guò),緊鄰均值生成對(duì)背景值的賦值并不合理。本文采取線性結(jié)構(gòu)來(lái)優(yōu)化背景值。
傳統(tǒng)的背景值為緊鄰均值生成,即
采用線性組合結(jié)構(gòu)優(yōu)化的背景值為
其中,α為待定參數(shù)。
將新構(gòu)建的背景值代入方程(1)中,即變?yōu)?/p>
相關(guān)項(xiàng)合并后即可得
解之得
設(shè)輔助參數(shù)
則由式(14)可得
遺傳算法(Genetic Algorithm)是20世紀(jì)70年代發(fā)展出來(lái)的一種基于自然選擇、遺傳學(xué)理論和適者生存原理的最優(yōu)化全局搜索算法[17]。它能夠?qū)δ繕?biāo)空間進(jìn)行隨機(jī)搜索。通過(guò)對(duì)問(wèn)題的可能解進(jìn)行編碼、選擇、交叉、變異、解碼等一系列遺傳操作,逐步地得到問(wèn)題的最優(yōu)解。由于它不受搜索空間限制性條件的約束,遺傳算法不要求目標(biāo)函數(shù)可微可導(dǎo)。因此,它具有簡(jiǎn)潔易懂、適用范圍廣和便于操作的優(yōu)良特性。
使用遺傳算法進(jìn)行參數(shù)優(yōu)化的步驟如下。
(1)編碼。初始化種群后,本文采用實(shí)數(shù)編碼的方式來(lái)構(gòu)建染色體[18]。不僅可以縮短個(gè)體的長(zhǎng)度,也能省去解碼的過(guò)程。
(2)計(jì)算適應(yīng)度。以冪模型的平均相對(duì)誤差最小化為目標(biāo),建立適應(yīng)度函數(shù)如下
(3)選擇。本文采用“輪盤(pán)賭”法進(jìn)行選擇操作。使適應(yīng)度大的個(gè)體被選中的概率大,而適應(yīng)度小的個(gè)體被選中的概率小。個(gè)體被選中的概率為
式中,fk為第k個(gè)個(gè)體的適應(yīng)度,n為種群規(guī)模。
(4)交叉。交叉操作是以某個(gè)概率交換2個(gè)個(gè)體的部分基因,從而產(chǎn)生新個(gè)體,實(shí)現(xiàn)對(duì)目標(biāo)空間的全局搜索。此處使用實(shí)數(shù)交叉法。個(gè)體ws和個(gè)體wg在位置點(diǎn)的交叉操作產(chǎn)生的新個(gè)體如式(17)、(18)所示,其中為之間的隨機(jī)數(shù)。
(5)變異。此處采用非均勻變異:設(shè)個(gè)體,對(duì)變異點(diǎn)進(jìn)行變異操作后得到的新基因值為
式中,Rd(0,1)為以相同概率從0、1中任取一個(gè);r為[0,1]上的隨機(jī)數(shù);G為當(dāng)前代數(shù);T為終止代數(shù);b為參數(shù),進(jìn)化代數(shù)G對(duì)隨機(jī)數(shù)影響的大小由它決定。
(6)重復(fù)步驟2至步驟5,直到滿足終止條件。
本文使用遺傳算法對(duì)GM(1,N,α)冪模型進(jìn)行參數(shù)優(yōu)化時(shí)直接對(duì)所有未知參數(shù)求解,結(jié)果代入冪模型即可進(jìn)行模擬運(yùn)算。
通過(guò)遺傳算法尋找模型參數(shù)最優(yōu)解的優(yōu)勢(shì)在于它能夠并行運(yùn)算,同時(shí)優(yōu)化所有要求的參數(shù)。避免了通過(guò)公式推導(dǎo)來(lái)求背景值優(yōu)化參數(shù)的繁瑣過(guò)程。遺傳算法的計(jì)算過(guò)程清晰,更加簡(jiǎn)單易用。
為了對(duì)比分析,本文將分別建立傳統(tǒng)GM(1,N)模型、GM(1,N)冪模型和GM(1,N,α)冪模型對(duì)甘肅省2005~2014年的鐵路客運(yùn)量進(jìn)行預(yù)測(cè)。其中選擇2005~2011年這7年的數(shù)據(jù)來(lái)進(jìn)行建模,并對(duì)2012~2014年的甘肅省鐵路客運(yùn)量作建模樣本外預(yù)測(cè),基于平均相對(duì)誤差分析對(duì)比建模精度。
在研究中,基于相關(guān)文獻(xiàn)查閱和關(guān)聯(lián)度比較選取了對(duì)鐵路客運(yùn)量影響較明顯的甘肅省地區(qū)的生產(chǎn)總值和居民消費(fèi)水平作為相關(guān)因素序列。
(1)甘肅省地區(qū)生產(chǎn)總值:代表著甘肅省地區(qū)一年內(nèi)的生產(chǎn)總值,能夠反映整個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展情況。對(duì)當(dāng)?shù)氐目瓦\(yùn)量有著直接的影響。
(2)居民消費(fèi)水平:反映當(dāng)年甘肅省地區(qū)居民消費(fèi)支出情況。居名消費(fèi)水平越高意味著居民選擇出行的可能性越大,對(duì)客運(yùn)量增長(zhǎng)有較明顯的影響。相關(guān)具體數(shù)據(jù)見(jiàn)表1。
表1 原始數(shù)據(jù)統(tǒng)計(jì)
注:數(shù)據(jù)來(lái)源于甘肅省統(tǒng)計(jì)局.
分別用3種建模方法對(duì)系統(tǒng)進(jìn)行建模預(yù)測(cè)后,得到結(jié)果見(jiàn)表2。根據(jù)2005~2011年的相關(guān)數(shù)據(jù)建立的傳統(tǒng)GM(1,N)模型平均相對(duì)誤差為16.02%,而GM(1,N)冪模型的平均相對(duì)誤差減小到4.58%,當(dāng)使用經(jīng)過(guò)背景值優(yōu)化的GM(1,N,α)冪模型時(shí)平均相對(duì)誤差減至3.31%,模型預(yù)測(cè)精度達(dá)到96.69%。
表2 3種模型的模擬和預(yù)測(cè)結(jié)果
(1)針對(duì)鐵路客運(yùn)量預(yù)測(cè)過(guò)程中的非線性系統(tǒng)特征提出使用經(jīng)過(guò)線性結(jié)構(gòu)背景值優(yōu)化的GM(1,N,α)冪模型來(lái)進(jìn)行模擬和預(yù)測(cè)。引入冪指數(shù)的模型能夠更準(zhǔn)確地反映真實(shí)系統(tǒng)的非線性結(jié)構(gòu)特點(diǎn)。
(2)利用遺傳算法并行全局優(yōu)化搜索的特點(diǎn)對(duì)模型的參數(shù)進(jìn)行尋優(yōu)求解。遺傳算法能針對(duì)多參數(shù)求解問(wèn)題提供過(guò)程清晰、操作簡(jiǎn)便的計(jì)算過(guò)程,較為快速地尋找到參數(shù)的最優(yōu)解。
(3)在對(duì)甘肅省2005~2014年鐵路客運(yùn)量的預(yù)測(cè)實(shí)例分析中的結(jié)果表明:GM(1,N)冪模型相對(duì)于傳統(tǒng)的GM(1,N)模型預(yù)測(cè)精度有明顯的提升,同時(shí)經(jīng)過(guò)背景值優(yōu)化的GM(1,N,α)冪模型能夠更好地描述系統(tǒng)行為規(guī)律,平均相對(duì)誤差明顯減小。證明此模型在鐵路客運(yùn)量預(yù)測(cè)領(lǐng)域有一定的實(shí)用性。
[1] 曹慶山.鐵路運(yùn)輸與社會(huì)經(jīng)濟(jì)適應(yīng)性分析[D].成都:西南交通大學(xué),2010.
[2] 宋光平.鐵路貨運(yùn)量預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2007.
[3] Lou Yong ji,Liu Jun,Sun Xun,et al. Regression model for daily passenger volume of high-speed railway line under capacity constraint[J]. Journal of Central South University,2015(9):3666-3676.
[4] Cheng S, Xu J, Mu Q, et al. A Terminal Departure Passenger Traffic Prediction Method Based on the RBF Neural Network[C]∥ Cota International Conference of Transportation Professionals. 2014:31-38.
[5] 汪健雄,劉春煌,單杏花,朱建生.基于雙層次正交神經(jīng)網(wǎng)絡(luò)模型的鐵路客運(yùn)量預(yù)測(cè)[J].中國(guó)鐵道科學(xué),2010(3):126-132.
[6] 王浩,郭瑞軍.改進(jìn)PCA-BP神經(jīng)網(wǎng)絡(luò)模型在公路客運(yùn)量預(yù)測(cè)的應(yīng)用[J].大連交通大學(xué)學(xué)報(bào),2016(2):1-5.
[7] Yan Q, Wang H, Wang H. Prediction of Taxi Passenger Volume Based on a Gray Linear Regression Combined Model[C]∥ International Conference on Transportation Engineering. 2015:335-341.
[8] Yuan C, Lin W, Jiao P. Prediction Method for Freight Volume Based on Residuals Improved GM (1,1) Model[C]∥ ICTE 2013@sSafety, Speediness, Intelligence, Low-Carbon, Innovation. ASCE, 2013:140-146.
[9] 侯麗敏,馬國(guó)峰.基于灰色線性回歸組合模型鐵路客運(yùn)量預(yù)測(cè)[J].計(jì)算機(jī)仿真,2011(07):1-3,30.
[10] Chen Y, Zha W. Prediction of the Traffic Volume of Henan Province with a BP Neural Network[J]. Joint Bone Spine Revue Du Rhumatisme, 2015,81(28):542-542.
[11] 馮冰玉,鮑學(xué)英,王起才,董朝陽(yáng).新型組合模型在鐵路客運(yùn)量預(yù)測(cè)中的應(yīng)用[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2015,60(12):6-9.
[12] 黃元生,陳子儒.灰色預(yù)測(cè)模型背景值賦值不合理性的證明及改進(jìn)[J].電子測(cè)試,2013(13):70-71.
[13] 周清,王奉偉.灰色預(yù)測(cè)模型背景值改進(jìn)方法比較分析[J].東華理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(2):231-234.
[14] 徐寧,黨耀國(guó),丁松.基于誤差最小化的GM(1,1)模型背景值優(yōu)化方法[J].控制與決策,2015(2):283-288.
[15] 李祚泳,張明,鄧新民.基于遺傳算法優(yōu)化的GM(1,1)模型及效果檢驗(yàn)[J].系統(tǒng)工程理論與實(shí)踐,2002(8):136-139.
[16] 邵良杉,馬寒,溫廷新,張銀玲.遺傳算法優(yōu)化的GM(1,1)模型研究[J].統(tǒng)計(jì)與決策,2015(4):22-24.
[17] 席裕庚,柴天佑,惲為民.遺傳算法綜述[J].控制理論與應(yīng)用,1996(6):697-708.
[18] 何祥衛(wèi).基于遺傳算法的鐵路縱斷面優(yōu)化研究[J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2014(6):14-17.
Railway Passenger Volume Forecasting based on GA-GM (1, N,α ) Power Model
XU Kun, BAO Xue-ying, WANG Qi-cai
(School of Civil Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China)
In order to reflect the nonlinear structural characteristics of the real system in railway passenger volume forecasting and set the background value of gray prediction models in a reasonable way, a GM(1,N,α) power model with background value optimization is proposed for forecasting passenger volume. The linear combined structure with a probable parameter is used to recalculate the background value and more probable parameters are solved by a genetic algorithm that can perform parallel operation and global optimization for one-time solution. Finally, forecasting railway passenger volume in Gansu Province is conducted with this model. By comparing it with the traditional GM (1,N,α) model and GM (1,N,α) power model, we find that GM(1,N,α)power model has higher prediction accuracy and proves applicable in railway passenger traffic forecasting.
Grey model; Genetic algorithm; Railway passenger volume; Forecast; Background value optimization
1004-2954(2018)01-0006-04
2017-03-21;
2017-04-05
長(zhǎng)江學(xué)者和創(chuàng)新團(tuán)隊(duì)發(fā)展計(jì)劃滾動(dòng)支持(IRT15R29),蘭州交通大學(xué)優(yōu)秀科研團(tuán)隊(duì)資金資助(201606),國(guó)家自然科學(xué)基金(51768034)
許 錕(1994—),男,陜西西安人,碩士研究生。
鮑學(xué)英(1974—),女,教授,從事鐵路運(yùn)輸管理及決策研究,E-mail:813257032@qq.com。
U293
A
10.13238/j.issn.1004-2954.201703210007