程麗娟,張仲榮
(蘭州交通大學(xué) 數(shù)理學(xué)院,甘肅 蘭州 730070)
基于LSSVM和馬爾科夫鏈模型的公路客運(yùn)量預(yù)測
程麗娟,張仲榮
(蘭州交通大學(xué) 數(shù)理學(xué)院,甘肅 蘭州 730070)
通過分析常用的客運(yùn)量預(yù)測方法,提出了基于LSSVM和馬爾科夫模型的組合預(yù)測模型。以2004年~2013年蘭州市公路客運(yùn)量的實(shí)際值為基礎(chǔ),通過LSSVM對客運(yùn)量的預(yù)測,得到了2014和2015年的公路客運(yùn)量的預(yù)測值,結(jié)合實(shí)際客運(yùn)量計算出其預(yù)測結(jié)果的相對誤差。對相對誤差進(jìn)行劃分狀態(tài)區(qū)間,運(yùn)用馬爾科夫模型對預(yù)測結(jié)果進(jìn)行修正,進(jìn)而得到高精度的客運(yùn)量預(yù)測值。最后將所得結(jié)果與應(yīng)用單一的LSSVM預(yù)測方法及時間序列方法預(yù)測所得結(jié)果進(jìn)行對比。分析結(jié)果表明,基于LSSVM和馬爾科夫鏈模型的組合預(yù)測模型預(yù)測精度較高,滿足實(shí)際需求。
LSSVM;馬爾科夫模型;組合預(yù)測;公路客運(yùn)量
公路客運(yùn)量是指公路運(yùn)輸企業(yè)報告期內(nèi)實(shí)際輸送的乘客人數(shù)?,F(xiàn)階段中國客運(yùn)主要集中于公路和鐵路,而公路因具有方便靈活的特點(diǎn),使得不同交通運(yùn)輸方式之間換乘極為便利,從而在中國客運(yùn)中占據(jù)重要地位。公路運(yùn)輸方式與鐵路運(yùn)輸方式相比,公路運(yùn)輸方式具有機(jī)動靈活、直達(dá)性好、可實(shí)現(xiàn)“門到門”直達(dá)運(yùn)輸?shù)忍攸c(diǎn)。在越來越殘酷的公鐵客運(yùn)競爭中,公路客運(yùn)為了能繼續(xù)鞏固市場,就必須充分發(fā)揮比較優(yōu)勢,主要在靈活、方便等方面做文章,采取較好的經(jīng)營策略和服務(wù)策略,從而將比較優(yōu)勢轉(zhuǎn)換為競爭優(yōu)勢,才能使公路客運(yùn)立于不敗之地[1]。由于客運(yùn)量是一個復(fù)雜變量,所以在實(shí)際工作中因缺少信息從而不能準(zhǔn)確的確定模型參數(shù),進(jìn)而給建模帶來困難;使用回歸分析等預(yù)測方法要收集大量信息,這樣會導(dǎo)致計算工作量增大、建模困難,進(jìn)而導(dǎo)致無法實(shí)現(xiàn)預(yù)測[2]。因此利用準(zhǔn)確的預(yù)測方法,才能準(zhǔn)確把握公路客運(yùn)量的未來趨勢,進(jìn)而進(jìn)行合理編制并檢查營運(yùn)計劃、配備運(yùn)力,為公路客運(yùn)管理和決策提供依據(jù),從而更能適應(yīng)社會經(jīng)濟(jì)發(fā)展的需求[3]。為了準(zhǔn)確預(yù)測公路客運(yùn)量,提出了多種預(yù)測模型。其中有利用改進(jìn)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行公路旅游客流量預(yù)測[4],也有應(yīng)用灰色系統(tǒng)GM(1,1)模型進(jìn)行客運(yùn)量預(yù)測[5],還有運(yùn)用回歸分析法、指數(shù)平滑法、彈性系數(shù)法進(jìn)行預(yù)測[6]。以上研究都是經(jīng)過多年的資料積累,通過不斷摸索客貨運(yùn)量的特征和規(guī)律、積累經(jīng)驗,使客貨運(yùn)量預(yù)測的準(zhǔn)確度提高,但現(xiàn)實(shí)運(yùn)用中要達(dá)到較高的精度,卻存在較大的難度[7]。本文針對以往研究的不足之處提出先應(yīng)用最小二乘支持向量機(jī)(Least Squares Support Vector Machine, LSSVM)對公路客運(yùn)量進(jìn)行初步預(yù)測,再應(yīng)用馬爾科夫模型對初步預(yù)測結(jié)果進(jìn)行修正,最后與幾種傳統(tǒng)預(yù)測方法對比分析預(yù)測精度。
近年來,智能方法在復(fù)雜的系統(tǒng)建模中廣泛使用。支持向量回歸(Support Vector Machine, SVM)是由Vapnik和他的同事[8]提出的,它功能強(qiáng)大,已被廣泛用于研究分類、回歸和模式識別等。SVM的基本思想是將輸入數(shù)據(jù)點(diǎn)映射到一個高維的特征空間,進(jìn)而找到一個超平面。后來,Suykens和同事[9]提出了SVM的一種改進(jìn)方法,稱作最小二乘支持向量回歸(Least Squares Support Vector Machine, LSSVM),這就使問題變成一組線性方程組,而不是一個二次規(guī)劃問題。
y=ωTφ(x)+b。
(1)
其中:ω是權(quán)重向量,b是偏置量。則LSSVM算法目標(biāo)函數(shù)如下:
(2)
其中:ξi為回歸誤差,γ為懲罰系數(shù),用于調(diào)節(jié)誤差,γ值越大,回歸誤差ξi越小。約束條件:yi=ωTφ(xi)+b+ξi。目標(biāo)函數(shù)第一部分是一個權(quán)值衰減,被用來調(diào)節(jié)權(quán)重大小。第二部分是所有數(shù)據(jù)的回歸誤差,參數(shù)γ需要進(jìn)行優(yōu)化。引入拉格朗日函數(shù),則有
(3)
其中:αi為拉格朗日乘子,根據(jù)二次規(guī)劃的Karush-Kuhn-Tucker(KKT)條件[10],則有
(4)
(5)
其中:K=K(xi,xj),In為n×n單位矩陣,In=[11...1]T。則可求得方程組的解為
(6)
常見的核函數(shù)有:線性核K(x,xi)=xTxi;
多項式核K(x,xi)=(〈x,xi〉+d)pp∈N,d≥0;
由LSSVM推導(dǎo)原理可知,采用等式約束就將求解的優(yōu)化問題轉(zhuǎn)化成線性方程,大大減少了算法的復(fù)雜性。研究表明:線形核函數(shù)不能處理非線性輸入值;RBF核函數(shù)的高維核參數(shù)數(shù)量少于多項式核函數(shù),在SVM訓(xùn)練過程中采用多項式核函數(shù)所需訓(xùn)練時間遠(yuǎn)大于RBF核函數(shù),因此本文采用RBF作為輸入的核函數(shù)[11]。這樣LSSVM就只需確定γ和σ兩個參數(shù),降低了參數(shù)的搜索空間維數(shù),加快了建模速度。
對照組實(shí)施常規(guī)護(hù)理,研究組在此基礎(chǔ)上實(shí)施臨床護(hù)理路徑。第一,術(shù)前臨床護(hù)理路徑。為患者介紹醫(yī)院的環(huán)境,保持病房環(huán)境的干凈整潔,針對患者的個人情況檢查術(shù)前的身體指標(biāo)。想患者詳細(xì)介紹手術(shù)的過程?;颊邥κ中g(shù)產(chǎn)生焦慮、抑郁、緊張、恐懼等負(fù)面情緒,應(yīng)該和患者多進(jìn)行溝通交流,緩解患者的負(fù)面情緒,多給患者講解一些治療成功案例,提升患者的勇氣和信心;第二,術(shù)后臨床護(hù)理路徑。將患者送入病房,密切觀察患者的血壓、脈搏等生命體征,協(xié)助患者進(jìn)入舒適的體位,指導(dǎo)患者進(jìn)行術(shù)后的康復(fù)訓(xùn)練;第三,出院臨床護(hù)理路徑。向患者及其家屬講解疾病以及護(hù)理相關(guān)的健康知識、用藥、飲食相關(guān)注意事項,如果需要復(fù)查,告知患者復(fù)查時間[2] 。
在確定LSSVM參數(shù)(γ,σ)時采用交叉驗證法和網(wǎng)格搜索。交叉驗證是用來驗證分類器性能的一種統(tǒng)計方法,它的基本思想是把某種意義下的原始數(shù)據(jù)進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為驗證集。首先用訓(xùn)練集對分類器進(jìn)行訓(xùn)練,再利用驗證集來測試訓(xùn)練得到的模型,以此作為評價分類器的性能指標(biāo)。網(wǎng)格搜索法是一種基于遍歷尋優(yōu)的方法,通過對γ和σ構(gòu)成的二維平面上進(jìn)行網(wǎng)格搜索,這種方法在尋優(yōu)區(qū)間足夠大且步距足夠小的情況下可以找到全局最優(yōu)解[12]。
1.2.1 數(shù)據(jù)處理
表1 蘭州市歷年公路客運(yùn)量數(shù)據(jù)
1.2.2 應(yīng)用LSSVM進(jìn)行模型預(yù)測
本文采用2004-2015年蘭州市公路客運(yùn)量共12個數(shù)據(jù),2004-2013年公路客運(yùn)量數(shù)據(jù)共10個數(shù)據(jù)作為訓(xùn)練集,2014-2015年共2個數(shù)據(jù)作為測試集,如表2所示。
表2 輸入數(shù)據(jù)與輸出數(shù)據(jù)表
在利用LSSVM 對輸入數(shù)據(jù)進(jìn)行預(yù)測時,其參數(shù)的選擇是重要部分。本文采取交叉驗證法對參數(shù)進(jìn)行確定。通過對樣本集數(shù)據(jù)進(jìn)行完全遍歷后,經(jīng)運(yùn)算獲得公路客運(yùn)量預(yù)測模型的最佳參數(shù)對為γ=300,σ2=10。LSSVM模型的擬合效果圖如圖1所示。
圖1 LSSVM模型的擬合效果圖
1.2.3 預(yù)測結(jié)果
表3 LSSVM預(yù)測結(jié)果
上述預(yù)測相對誤差已超出±5%,因此預(yù)測精度一般,實(shí)際應(yīng)用時應(yīng)進(jìn)一步提高預(yù)測精度。
根據(jù)LSSVM的初步預(yù)測結(jié)果,以及相對誤差所處范圍劃分閾值,將相對誤差序列劃分為4個狀態(tài)區(qū)間如表4所示,2004年-2013年的相對誤差所在狀態(tài)區(qū)間如表5所示。根據(jù)誤差范圍集中程度進(jìn)行劃分,使得各區(qū)間滿足狀態(tài)變化的客觀規(guī)律。
表4 狀態(tài)區(qū)間劃分
表5 相對誤差及狀態(tài)區(qū)間
轉(zhuǎn)移矩陣確定后,就可以根據(jù)某一年份所處狀態(tài)來預(yù)測下一年份可能出現(xiàn)的狀態(tài),再對各個狀態(tài)所處區(qū)間范圍進(jìn)行加權(quán)平均。設(shè)初始時刻的狀態(tài)概率向量為PT(0)=(p1,p2,…pn),則下一時刻的系統(tǒng)分布為PT(1)=PT(0)P,第2期的為PT(2)=PT(1)P=PT(0)P2,依此類推。利用概率向量的值進(jìn)行加權(quán)運(yùn)算,最終得到馬爾科夫模型修正值。2013年的狀態(tài)區(qū)間為S1, 經(jīng)過1步轉(zhuǎn)移得到2014年轉(zhuǎn)為狀態(tài)S4,則認(rèn)為2014年的狀態(tài)為S4,利用馬爾科夫模型修正,2014年公路客運(yùn)量預(yù)測修正值為4 003.24萬人。同理,可由P2經(jīng)過2步轉(zhuǎn)移得到2015年的預(yù)測值為4 078.61萬人。
對于模型的預(yù)測效果是否精確需要用評價指標(biāo)對其進(jìn)行評價,本文用MAPE(平均絕對百分比誤差)來評價模型的預(yù)測精度,其計算公式如下:
其中:Xi表示真實(shí)值,Yi表示預(yù)測值,n為預(yù)測的樣本數(shù)。為了驗證組合預(yù)測方法的優(yōu)越性,采用時間序列方法進(jìn)行預(yù)測建模比較性能,得到不同方法的預(yù)測值與真實(shí)值的比較,如表6所示??梢钥闯鍪褂民R爾科夫模型修正后,MAPE僅為0.014 1,說明組合方法精度較高,可滿足實(shí)際需求。
表6 預(yù)測結(jié)果對比
本文綜合考慮了公路客運(yùn)量的數(shù)據(jù)特點(diǎn),應(yīng)用LSSVM和馬爾科夫方法對交通量進(jìn)行了預(yù)測研究,通過網(wǎng)格搜索算法選取了LSSVM中的最優(yōu)參數(shù)。研究結(jié)果表明,通過相對誤差的比較以及平均絕對百分比誤差可以看出,該方法對客運(yùn)量的預(yù)測精度較高,顯示了該方法的良好的預(yù)測性能。
[1] 李林峰.新形勢下公路客運(yùn)經(jīng)營新策略[J].交通企業(yè)管理,2008,23(1):24-25.
[2] 鐘霞,吳中,王麗.灰色理論及其組合模型在交通運(yùn)量預(yù)測中的運(yùn)用[J].交通標(biāo)準(zhǔn)化,2004(12):35-38.
[3] 李曉剛,賈元華,敖谷昌.基于主成分回歸公路客運(yùn)量預(yù)測模型研究[J].交通標(biāo)準(zhǔn)化,2009(196):77-80.
[4] 孫崎峰,周栩,孫曉峰.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的公路旅游客流量預(yù)測[J].山東理工大學(xué)學(xué)報(自然科學(xué)版),2008,22(6):75-79.
[5] 紀(jì)躍芝,馮延輝.應(yīng)用灰色系統(tǒng)GM(1,1)模型預(yù)測長春市公路客運(yùn)量[J].吉林工學(xué)院學(xué)報,1997,18(2):52-56.
[6] 王生昌,白韶波,張 慧.公路客運(yùn)量預(yù)測方法的比較[J].長安大學(xué)學(xué)報(自然科學(xué)版),2005,25(5):83-86.
[7] 芮海田,吳群琪,袁華智,等.基于指數(shù)平滑法和馬爾科夫模型的公路客運(yùn)量預(yù)測方法[J].交通運(yùn)輸工程學(xué)報,2013,13(4):87-93.
[8] Vapnik V.The nature of statistical learning theory[M].New York:Springer-Verlag,1995:48-54.
[9] Suykens J, Gestel T V,Brabanter I D. Least-squares support vector machine[M].Singapore: Word Scientific,2002:101-105.
[10] Mbamalu G A, El-Hawary M E.Load forecasting via suboptimal seasonal autoregressive models and iteratively reweighted least squares estimation[J].IEEE Transactions on Power Systems,1993,8(1):1903-1915.
[11] Kim K J.Financial Time Series Forecasting Using Support Vector Machines[J].Neurocomputing,2003,55(3): 307-319.
[12] 王健峰,張磊,陳國興,等.基于改進(jìn)的網(wǎng)格搜索法的SVM參數(shù)優(yōu)化[J].應(yīng)用科技,2012,39(3):28-31.
[13] 岳毅宏,韓文秀,程國平.多變量時間序列相空間重構(gòu)中參數(shù)的確定[J].控制與決策,2005,20(3):290-293.
Highway Passenger Volume Forecast Based on Least Squares Support Vector Machine and Markov Chain Model
CHENG Lijuan, ZHANG Zhongrong
(Lanzhou jiaotong University, Lanzhou 730070, China)
In this paper, a combined forecasting model based on least squares support vector machine and Markov model is proposed by the analysis of the commonly used passenger volume forecasting methods. First of all, through the actual volume of highway passenger traffic in Lanzhou from 2004 to 2013, the values of highway passenger volume in 2014 and 2015 were predicted by least squares support vector machine and the relative error of the predicted results is calculated. Then, the relative error is divided into the state interval and revised by using the Markov model, so the high precision passenger volume forecast value is obtained. Finally, the results are compared with the results predicted by the method of a single LSSVM prediction and time series. The results show that the prediction accuracy of the combined forecasting model based on LSSVM and Markov chain model is high, which can meet the actual demand.
least squares support vector machine; Markov model; combination forecasting; highway passenger volume
10.3969/j.issn.1674-5403.2017.04.016
F570.82
A
1674-5403(2017)04-0070-06
2017-04-01
程麗娟(1990-),女,甘肅天水人,在讀碩士研究生,主要從事大數(shù)據(jù)、交通流量預(yù)測方面的研究.
甘肅省自然科學(xué)基金項目(1610RJZA057).