劉 杰 衡玉明 趙 輝 高學(xué)金 王 普
(1.北京公聯(lián)交通樞紐建設(shè)管理有限公司 北京100161;2.北京工業(yè)大學(xué)電子信息與控制工程學(xué)院 北京100124)
目前我國正在大力發(fā)展以軌道交通為骨干,以公共汽車、電車交通為主體的,實(shí)現(xiàn)各類交通方式之間有機(jī)銜接的城市綜合客運(yùn)交通體系,以緩解城市客運(yùn)交通的困境[1-2]。交通樞紐在城市綜合客運(yùn)交通體系中的主要功能是有效銜接各種交通方式,匯集和分配各種客流,滿足乘客中轉(zhuǎn)換乘時高效、安全、便捷、舒適的需要。城市交通樞紐的建設(shè)滿足了居民的出行需要,然而樞紐內(nèi)的客流量卻呈現(xiàn)出了動態(tài)性的變化,客流量不僅影響交通樞紐的空間布局,同時也影響著樞紐內(nèi)部的客流輸送組織方案[3]。因此,對客流量進(jìn)行短期的預(yù)測能夠在一定程度上影響交通的組織方案和應(yīng)急預(yù)案的調(diào)整,因而對客流量進(jìn)行短期的預(yù)測是十分必要的。
交通樞紐短期客流的時序性特點(diǎn)具有明顯隨機(jī)波動性,因此在眾多的短期預(yù)測的模型方法中(主要包含指數(shù)平滑法[4],灰色預(yù)測法[5],神經(jīng)網(wǎng)絡(luò)[6]以及支持向量機(jī)[7-8]等),BP神經(jīng)網(wǎng)絡(luò)是具有適應(yīng)性的簡單單元組成的廣泛并行互聯(lián)的網(wǎng)絡(luò),具有良好的非線性,高度并行的處理機(jī)制[9]。使得網(wǎng)絡(luò)具有較好的模式識別能力和在任意精度逼近非線性預(yù)測的能力。最小二乘支持向量機(jī)(LSSVM)是標(biāo)準(zhǔn)支持向量機(jī)(support vector machine,SVM)的1種擴(kuò)展[10],是建立在統(tǒng)計學(xué)習(xí)理論的VC維和結(jié)構(gòu)最小化原理基礎(chǔ)之上的方法,能夠很好地解決有限數(shù)量樣本的高維模型構(gòu)造問題,且構(gòu)造的模型具有很好的預(yù)測性能;可以解決小樣本情況下的機(jī)器學(xué)習(xí)問題,具有良好的泛化能力;可以解決高維問題及非線性問題;人為設(shè)定的參數(shù)較少,便于使用。2種方法適合對交通樞紐的客流量進(jìn)行預(yù)測。但由于交通樞紐客流量的影響因素較多,且相互之間的關(guān)系錯綜復(fù)雜,呈現(xiàn)的是1種極為復(fù)雜的高維非線性關(guān)系[11],應(yīng)用單一的預(yù)測方法往往具有片面性,不可避免地會降低預(yù)測精度。為提高客流量預(yù)測的精度,筆者采用了綜合BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)的組合預(yù)測模型,即首先利用BP神經(jīng)網(wǎng)絡(luò)歷史數(shù)據(jù)進(jìn)行初步預(yù)測,再將初步預(yù)測的結(jié)果作為最小二乘支持向量機(jī)的輸入,在此基礎(chǔ)上進(jìn)行訓(xùn)練和預(yù)測。
BP神經(jīng)網(wǎng)絡(luò)又稱誤差逆?zhèn)鞑ニ惴ǎ?種具有3層或3層以上的多層網(wǎng)絡(luò)結(jié)構(gòu),每1層都由若干個神經(jīng)元組成,且各層神經(jīng)元之間通過不同的權(quán)重連接[12-13],其結(jié)構(gòu)圖見圖1。
BP神經(jīng)網(wǎng)絡(luò)的基本數(shù)學(xué)模型可表示為
圖1 3層BP神經(jīng)網(wǎng)絡(luò)Fig.1 BP neural network
式中:wji為神經(jīng)元之間的連接權(quán);θj為神經(jīng)元的閾值為神經(jīng)元的激活值,再經(jīng)過傳輸函數(shù)f就可得到輸出值y,預(yù)測神經(jīng)網(wǎng)絡(luò)執(zhí)行過程包括:訓(xùn)練過程和預(yù)測過程。所謂訓(xùn)練程,即BP神經(jīng)網(wǎng)絡(luò)按有導(dǎo)師學(xué)習(xí)方式進(jìn)行訓(xùn)練,當(dāng)學(xué)習(xí)模式提供給網(wǎng)絡(luò)后,其神經(jīng)元的激活值將從輸入層經(jīng)隱含層向輸出層傳播,在輸出層的各神經(jīng)元輸出對應(yīng)于輸入模式的網(wǎng)絡(luò)響應(yīng)。然后按減少誤差的原則,從輸出層經(jīng)隱含層回到輸出層逐層修正各連接權(quán)。隨著上述訓(xùn)練過程的不斷進(jìn)行,網(wǎng)絡(luò)對輸入模式響應(yīng)的正確率也不斷提高,而最終輸出層的輸出值即為所需的預(yù)測結(jié)果。
設(shè)給定的樣本集為S={(xi,yi),xi∈Rn}(i=1,2,…,l)。式中:xi為第i個輸入數(shù)據(jù);yi為相應(yīng)于xi的目標(biāo)輸出;l為樣本容量。那么最小二乘支持向量機(jī)預(yù)測問題就可轉(zhuǎn)化為求解下面的最優(yōu)化問題
式中:φ(·)為核空間映射函數(shù);w為權(quán)矢量;e為誤差變量;b為偏差量;r為正規(guī)化參數(shù)(懲罰參數(shù)),r>0。構(gòu)造拉格朗日函數(shù)如下
式中:αi(i=1,2,…,l)為Lagrange乘子。將函數(shù)L分別對w,b,e,a求偏導(dǎo),并令其為0,計算解得參數(shù)α(α=α1,α2,…,αl)和b分別為
式中:y=[y1,y2,…,yl]T,E=[1,1,…,1]T,矩陣Ω的元素為
構(gòu)造回歸函數(shù)如下:
將參數(shù)代到式(6)即可得到LSSVM的預(yù)測結(jié)果,其中采用的核函數(shù)為徑向基核函數(shù)。
在上述2種模型中,神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射功能,并具有并行分布式處理,自學(xué)習(xí)、自組織,以及良好的容錯性等優(yōu)點(diǎn)。然而神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)法采用經(jīng)驗(yàn)風(fēng)險最小化原理,不能使期望風(fēng)險最小化,會出現(xiàn)局部極小點(diǎn)等問題,使得其在小樣本,短期客流量的預(yù)測中效果不佳;而支持向量機(jī)方法運(yùn)用結(jié)構(gòu)風(fēng)險最小化原則可解決神經(jīng)網(wǎng)絡(luò)所具有的一些缺陷,能夠保證得到全局最優(yōu)解,而且在訓(xùn)練樣本很少的情況下具有很好的推廣能力,在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢[14],具有很強(qiáng)的泛化能力。
由于短期客流量的非平穩(wěn)性特點(diǎn),所以流隨機(jī)性、不確定性更明顯,導(dǎo)致短期客流量的預(yù)測要比長期預(yù)測受隨機(jī)干擾因素影響更大,不確定性更強(qiáng),規(guī)律性更不明顯;單一的方法對于不同結(jié)構(gòu)的數(shù)據(jù)樣本,預(yù)測的差異性較大,導(dǎo)致預(yù)測效果的穩(wěn)定性較差,從而影響預(yù)測的精度,為提高預(yù)測精度,消除單一方法帶來的不確定性,采取了綜合BP神經(jīng)網(wǎng)絡(luò)和最小二乘支持向量機(jī)的組合預(yù)測模型,將BP神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性擬合能力與最小二乘支持向量機(jī)在小樣本預(yù)測中的優(yōu)勢結(jié)合起來。首先利用BP神經(jīng)網(wǎng)絡(luò)對歷史數(shù)據(jù)進(jìn)行初步預(yù)測,再將預(yù)測的結(jié)果作為支持向量機(jī)的輸入從而構(gòu)建組合預(yù)測模型,具體結(jié)構(gòu)見圖2。
圖2 組合預(yù)測模型Fig.2 Combination prediction model
為了驗(yàn)證文中算法在客流量預(yù)測中的有效性,采用2012年北京市東直門交通樞紐全年的實(shí)際客流量數(shù)據(jù)作為樣本進(jìn)行仿真實(shí)驗(yàn),具體數(shù)據(jù)見圖3。實(shí)驗(yàn)的評價指標(biāo)采用平均絕對百分比誤差MAPE和最大預(yù)測誤差ME,即
式中:xi和x′i分別為客流量的真實(shí)值和預(yù)測值;n為待預(yù)測樣本個數(shù)。MAPE越小,表示模型的預(yù)測精度越高。
圖3 東直門樞紐的客流量數(shù)據(jù)Fig.3 Passenger flow volume of Dongzhimen Transit Hub
具體實(shí)驗(yàn)步驟如下。
1)數(shù)據(jù)預(yù)處理。以1月1日到3月3日9周的數(shù)據(jù)為例(見圖4),可看出第3周,第4周,第5周分別出現(xiàn)了異常的數(shù)據(jù),究其原因這些異常點(diǎn)對應(yīng)的日期為1月19日~2月1日,正處于春節(jié)期間,由于本文著重平日的短期客流量預(yù)測,因此將這些節(jié)假日異常點(diǎn)用其對應(yīng)星期的其他周的平均數(shù)據(jù)代替,以完成數(shù)據(jù)預(yù)處理。同樣對余下的客流量做相同的處理,并對新的時間序列做數(shù)據(jù)的歸一化。
圖4 九周的客流量數(shù)據(jù)(1月1日~3月3日)Fig.4 9-week passenger flow volume data
2)確定訓(xùn)練集與測試集。以數(shù)據(jù)時間(d)序列連續(xù)m的數(shù)據(jù)作為輸入,第m+1的數(shù)據(jù)作為輸出組成1個新的樣本集,包含了1個輸入矩陣X和輸出矩陣Y,確定測試集與訓(xùn)練集的比例r(測試集與訓(xùn)練集樣本個數(shù)的比值),從而得到相應(yīng)的訓(xùn)練集與測試集。
3)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型對訓(xùn)練集的樣本進(jìn)行初步訓(xùn)練和預(yù)測,得到歷史的客流量預(yù)測值。
4)將BP神經(jīng)網(wǎng)絡(luò)得到的初步預(yù)測值作為最小二乘支持向量機(jī)的訓(xùn)練輸入,構(gòu)建模型對測試集進(jìn)行預(yù)測,得到最終的客流量預(yù)測結(jié)果。
實(shí)驗(yàn)首先選取m=3 d,r=0.1的情況對數(shù)據(jù)進(jìn)行預(yù)測,此時共有363個樣本(前330個樣本作為訓(xùn)練樣本,后33個樣本作為測試樣本),得到預(yù)測結(jié)果見表1、圖5。
表1 組合模型的預(yù)測結(jié)果對比Tab.1 Comparison prediction result of two models 人次
由表1,圖5可看出筆者所提組合預(yù)測方法能夠較好地與真實(shí)值相貼近,而為增加對比,采用BP神經(jīng)網(wǎng)絡(luò)與LSSVM 2種方法對表1測試集的數(shù)據(jù)進(jìn)行預(yù)測并具體計算出其預(yù)測的平均絕對誤差為:在m=3,測試比例r為0.1的情況下,BP神經(jīng)網(wǎng)絡(luò)的平均絕對誤差為:6.62%,LSSVM的平均絕對誤差是:6.09%,而組合預(yù)測模型的平均絕對誤差為5.95%,結(jié)果如表2所示。由表2可看出筆者所提組合預(yù)測方法的預(yù)測精度比LSSVM和BP神經(jīng)網(wǎng)絡(luò)的都要高,這直接驗(yàn)證了筆者所提方法的有效性,客流量的預(yù)測精度也得到了提高。
表2 筆者所提出方法預(yù)測精度與其他方法的比較Tab.2 Comparison result between the combination model and other methods
為了驗(yàn)證不同輸入與訓(xùn)練比例對組合預(yù)測模型的精度的影響,筆者分別選取了m=4,6,8;r=0.1,0.3,0.5,求解了組合模型的預(yù)測精度并與BP神經(jīng)網(wǎng)絡(luò)與LSSVM模型進(jìn)行了精度的對比,結(jié)果如表3所示。
圖5 2種模型的預(yù)測結(jié)果對比圖Fig.5 Prediction result of two models
表3 不同輸入與訓(xùn)練比例下模型的精度對比Tab.3 Prediction accuracy of the combination model in different situations %
由表3可見,不同的m與r值,模型的精度不同,總體來看測試集數(shù)量越小,精度越高,這是由于最小二乘支持向量機(jī)對短期小樣本的預(yù)測問題具有優(yōu)勢,因此組合精度的輸出會更高些。
針對交通樞紐客流量的復(fù)雜性,非線性等特點(diǎn),筆者提出了綜合BP神經(jīng)網(wǎng)絡(luò)和LSSVM的組合預(yù)測模型對客流量進(jìn)行了預(yù)測,并采用了北京市東直門交通樞紐的實(shí)際數(shù)據(jù)作為驗(yàn)證,通過對比得知所提組合預(yù)測模型能夠克服2種單一方法帶來的不確定性,能夠準(zhǔn)確地預(yù)測交通樞紐的短期客流,且與其他2種模型相比,客流量的預(yù)測精度要更高些。后續(xù)的研究中將集中于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)以進(jìn)一步提高客流量的預(yù)測精度。
[1] 譚復(fù)興.城市軌道交通概論[M].北京:中國鐵道出版社,2013.
[2] 葛 亮,王 煒,鄧 衛(wèi),等.城市公共交通樞紐客流量預(yù)測使用方法研究[J].公共交通科技,2005,22(8):110-113.
[3] 鄧軍生,孔繁鈺,陳小峰.基于SVR的軌道交通客流量預(yù)測[J].重慶科技學(xué)院學(xué)報,2008,10(3):147-149.
[4] 劉羅曼.時間序列分析中指數(shù)平滑法的應(yīng)用[J].沈陽師范大學(xué)學(xué)報,2009,27(4):416-418.
[5] 吳 強(qiáng),馮維琇,胡小嘉,等.灰色預(yù)測法在城軌客流預(yù)測中的應(yīng)用[J].城市軌道交通研究,2004,7(3):52-55.
[6] Kaan Yetilmezsoy,Ilter Turkdogan F M,Ilknur Temizel,et al.Development of ANN-based models to predict biogas and methane production in anaerobic treatment of molasses wastewater[J].International Journal of Green Energy,2013,9(10):885-907.
[7] 石永輝,鮑 俊,嚴(yán)忠貞,等.混合智能算法在城市道路短時交通流量預(yù)測中的研究[J].交通信息與安全,2011,29(4):58-61.
[8] Nicoletti M C,Bertini J R,Tanizaki M M,et al.Applications of evolutionary SVM to prediction of membrane alpha-h(huán)elices[J].Expert Systems with Applications,2013,40(9):3412-3420.
[9] 楊淑瑩.模式識別與智能計算[M].北京:電子工業(yè)出版社,2008.
[10] 申富饒.神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2011.
[11] 王艷輝,王 卓,賈利民,等.鐵路客運(yùn)量數(shù)據(jù)挖掘預(yù)測方法及應(yīng)用研究[J].鐵道學(xué)報,2004,26(5):1-7.
[12] Cheng Hua Li,Xiang Ji Huang.Spam filtering using semantic similarity approach and adaptive BPNN[J].Neurocomputing,2012(92):88-97.
[13] 林 連,林 樺.改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)在港口物流量預(yù)測中的應(yīng)用[J].交通信息與安全,2009,27(5):161-165.
[14] 楊兆升,王 媛,管 青.基于支持向量機(jī)方法的短時交通流量預(yù)測方法[J].吉林大學(xué)學(xué)報,2006,36(6):881-884.