朱偉,李楠,石超峰
(重慶交通大學(xué) 交通運(yùn)輸學(xué)院,重慶 400074)
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,鐵路運(yùn)輸事業(yè)取得了長足的進(jìn)步.作為衡量鐵路運(yùn)輸發(fā)展的一個(gè)重要指標(biāo),鐵路客運(yùn)量預(yù)測(cè)一直占有重要的作用.而科學(xué)準(zhǔn)確地預(yù)測(cè)鐵路客運(yùn)量及其仿真趨勢(shì)、特點(diǎn)和規(guī)律是制定公路客運(yùn)發(fā)展規(guī)劃及規(guī)劃鐵路客運(yùn)場(chǎng)站的重要理論依據(jù)[1].傳統(tǒng)的預(yù)測(cè)方法有時(shí)間序列預(yù)測(cè)法、彈性系數(shù)法、灰色系統(tǒng)預(yù)測(cè)等等[2].近幾年來,隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)開始被應(yīng)用到公路客運(yùn)量預(yù)測(cè)中,它對(duì)解決非線性問題具有很好的效果,但是也存在著收斂速度慢、過學(xué)習(xí)和局部極值等問題[3],在一定程度上影響了其準(zhǔn)確性.
支持向量機(jī)是(Support Vector Machine,SVM)是基于Vapnik 提出的小樣本學(xué)習(xí)理論建立的,著重研究小樣本條件下的統(tǒng)計(jì)學(xué)習(xí)規(guī)律[4-5].它克服了神經(jīng)網(wǎng)絡(luò)的一些固有缺陷,在小樣本預(yù)測(cè)領(lǐng)域有著很好的應(yīng)用效果[6].但是支持向量機(jī)的預(yù)測(cè)精度與其參數(shù)的選擇有很大的關(guān)系,參數(shù)選擇的好壞對(duì)預(yù)測(cè)結(jié)果的影響很大.本文將粒子群算法和支持向量機(jī)結(jié)合,構(gòu)建了基于粒子群算法優(yōu)化支持向量機(jī)的鐵路客運(yùn)量預(yù)測(cè)模型.仿真實(shí)驗(yàn)結(jié)果表明,該模型預(yù)測(cè)精度更高,為鐵路客運(yùn)量預(yù)測(cè)提供了一種新的途徑.
支持向量機(jī)理論可用于分類問題和回歸問題.其基本原理是通過一個(gè)非線性映射?(x),把輸入數(shù)據(jù)x 映射到一個(gè)高維的空間,從而將非線性回歸問題轉(zhuǎn)化為高維特征空間的線性問題,即
其中,?(x)是將樣本點(diǎn)映射到高維空間的非線性變換;ωT為權(quán)值矢量;b 為閾值.
定義ε 不敏感損失函數(shù)為:
其中f(x)為回歸函數(shù)求得的預(yù)測(cè)值,y 為相應(yīng)的真實(shí)值,ε 為不敏感損失系數(shù),即表示預(yù)測(cè)值與真實(shí)值之差小于等于ε 時(shí),代表損失為0.
通過最小泛函分析得:
其中第一項(xiàng)稱為模型復(fù)雜性項(xiàng),第二項(xiàng)是由ε 不敏感損失函數(shù)確定的經(jīng)驗(yàn)誤差項(xiàng),C 為懲罰系數(shù).
引入K(xi,xj)核函數(shù),把(4)轉(zhuǎn)化為對(duì)偶形式來求:
懲罰參數(shù)C、RBF核參數(shù)σ、不敏感損失參數(shù)是決定支持向量機(jī)預(yù)測(cè)性能的三個(gè)重要參數(shù).利用智能優(yōu)化算法對(duì)支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化選擇,對(duì)提高其預(yù)測(cè)性能具有重要的意義.
粒子群算法是繼蜂群算法,蟻群算法之外的一種群體智能算法,它是由Kennedy 和Bernhard 在1995年提出的,其基本思想源于對(duì)鳥類捕食行為的研究.利用PSO 算法求解最優(yōu)化問題時(shí),每一個(gè)粒子代表問題的一個(gè)解,并且每一個(gè)粒子都對(duì)應(yīng)著一個(gè)適應(yīng)度值,此適應(yīng)度值主要通過適應(yīng)度函數(shù)得到.粒子移動(dòng)的方向和距離由粒子的速度決定,而速度通過自身及其身邊的粒子的移動(dòng)經(jīng)驗(yàn)進(jìn)行動(dòng)態(tài)更新,從而實(shí)現(xiàn)對(duì)解的搜索.在每一次尋優(yōu)過程中,粒子通過兩個(gè)“極值”來更新自己,一個(gè)是個(gè)體極值Pbest(粒子本身搜索得到的最優(yōu)解),另一個(gè)是群體極值Gbest(全局最優(yōu)解).粒子群優(yōu)化支持向量機(jī)參數(shù)的相關(guān)步驟如下:
(1)設(shè)置PSO 初始參數(shù),如種群數(shù)、迭代數(shù),變異率、交叉率等.隨機(jī)產(chǎn)生一組粒子的初始位置和速度.
(2)選擇適應(yīng)度函數(shù),本文選擇均方誤差作為適應(yīng)度函數(shù)來判斷參數(shù)選擇的優(yōu)劣.
(3)根據(jù)兩個(gè)對(duì)比更新粒子的位置.當(dāng)前適應(yīng)度值和所經(jīng)歷過最好位置pbest 對(duì)比,若當(dāng)前適應(yīng)度好,則更換當(dāng)前適應(yīng)度值為最好位置;當(dāng)前適應(yīng)度值與全局最優(yōu)位置Gbest 對(duì)比,若當(dāng)前適應(yīng)度值優(yōu),則更換當(dāng)前適應(yīng)度值為全局最優(yōu)位置.
(4)按照公式(7)和(8)對(duì)粒子的速度和位置進(jìn)行動(dòng)態(tài)調(diào)整
公式中:ω 表示為慣性權(quán)重;d=1,2,…,D;i=1,2,…,n;k 為迭代次數(shù);Vid為粒子的速度;c1,c2為加速因子;r1,r2是介于0 到1 之間的隨機(jī)數(shù).
(5)判斷是否達(dá)到最優(yōu),若滿足,輸出最優(yōu)參數(shù)值;若不滿足,依照步驟(2)-(4)繼續(xù)迭代.
以國家統(tǒng)計(jì)局和鐵路部門提供的的1985-2002年鐵路客運(yùn)量作為原始數(shù)據(jù)集[7].首先,對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,然后將歸一化后的數(shù)據(jù)分成訓(xùn)練集、測(cè)試集和檢驗(yàn)集.根據(jù)訓(xùn)練集數(shù)據(jù),建立PSO-SVM 時(shí)間序列預(yù)測(cè)模型,并根據(jù)PSO 算法確定SVM 模型參數(shù);最后,將預(yù)測(cè)值與實(shí)際數(shù)據(jù)對(duì)比,驗(yàn)證模型的預(yù)測(cè)性能.
原始數(shù)據(jù)集及其歸一化結(jié)果見表1所列.利用表1 中1985 ~1999年的鐵路客運(yùn)量數(shù)據(jù)產(chǎn)生訓(xùn)練樣本,相鄰5年的數(shù)據(jù)經(jīng)過歸一化處理作為訓(xùn)練樣本的輸入,第6年經(jīng)過歸一化處理的數(shù)據(jù)作為訓(xùn)練樣本的輸出.以1990-1999年的樣本為訓(xùn)練樣本數(shù)據(jù),2000-2002 作為測(cè)試樣本,具體數(shù)據(jù)見表2.為了驗(yàn)證模型的有效性,同時(shí)選取了傳統(tǒng)的SVM 模型進(jìn)行預(yù)測(cè),分別建立粒子群支持向量機(jī)預(yù)測(cè)模型以及傳統(tǒng)SVM 預(yù)測(cè)模型.粒子群算法相關(guān)參數(shù)設(shè)置如下:種群數(shù)為20,迭代數(shù)為200,加速因子c1,c2初始值分別為1.5、1.7.
表1 原始數(shù)據(jù)及其歸一化表
表2 PSO-SVM 和傳統(tǒng)SVM 預(yù)測(cè)誤差比較
表2 為種模型的誤差對(duì)比結(jié)果,從表2 可知,基于PSO-SVM的預(yù)測(cè)精度優(yōu)于傳統(tǒng)的SVM 模型,這很大程度上取決于PSO 算法對(duì)支持向量機(jī)參數(shù)進(jìn)行了尋優(yōu)處理,提高了預(yù)測(cè)精度
本文提出了基于粒子群算法優(yōu)化支持向量機(jī)的鐵路客運(yùn)量預(yù)測(cè)方法.通過粒子群算法進(jìn)行了支持向量機(jī)的參數(shù)優(yōu)化,克服了人工選擇參數(shù)的不確定性,得到了預(yù)測(cè)性能更好的SVM 預(yù)測(cè)模型.用鐵路客運(yùn)量數(shù)據(jù)作為應(yīng)用算例,同時(shí)構(gòu)建了傳統(tǒng)的SVM預(yù)測(cè)模型,并形成了對(duì)比.實(shí)驗(yàn)結(jié)果表明PSO-SVM的預(yù)測(cè)效果更好,為鐵路客運(yùn)量預(yù)測(cè)提供了一種新途徑.
圖1 PSO-SVM、BP、SVM 擬合值及預(yù)測(cè)曲線
[1]劉芹.基于最小二乘支持向量機(jī)的城市客運(yùn)量預(yù)測(cè)模型[J].混交通與計(jì)算機(jī),2007,25(5):50-53.
[2]陳荔,馬榮國.基于支持向量機(jī)的都市圈客運(yùn)量預(yù)測(cè)模型[J].交通運(yùn)輸工程學(xué)報(bào),2010,10(6):75-80.
[3]文培娜,張志勇,羅琳.基于BP 神經(jīng)網(wǎng)絡(luò)的北京物流需求預(yù)測(cè)分析[J].物流技術(shù),2009(6):91-93.
[4]Vapnik W N.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯.北京:清華大學(xué)出版社,
[5]Venkoba R B,Gopalakrishna S J.Hard grove grind ability index prediction using support vector regression[J],International Journal of Mineral Processings,2009,91(12):55-59.
[6]Liu Sheng,Li Yanyan,Anovel predictive control and its application on water level system ship Hoiler[C].International Conference on Innovative Computing,Information and Control,2006:8.
[7]中國國家統(tǒng)計(jì)局.中國統(tǒng)計(jì)年鑒[M].北京:中國統(tǒng)計(jì)出版社,1985-2003.