楊祺煊
(軍事交通學(xué)院 研究生管理大隊,天津 300161)
● 基礎(chǔ)科學(xué)與技術(shù) Basic Science & Technology
基于主成分分析與GA-BP網(wǎng)絡(luò)的鐵路客運(yùn)量預(yù)測研究
楊祺煊
(軍事交通學(xué)院 研究生管理大隊,天津 300161)
針對鐵路客運(yùn)量影響因素眾多、變量之間映射關(guān)系復(fù)雜的特點,使用主成分分析方法對客運(yùn)量影響因素進(jìn)行處理,降低相關(guān)變量維數(shù),消除變量間的多重共線性關(guān)系,并將轉(zhuǎn)換后的變量輸入到基于GA-BP的神經(jīng)網(wǎng)絡(luò)模型中,完成對于鐵路客運(yùn)量的預(yù)測。仿真結(jié)果表明,該模型相較于BP神經(jīng)網(wǎng)絡(luò)模型,具有更好的預(yù)測精度和更簡單的結(jié)構(gòu)。
鐵路客運(yùn)量預(yù)測;主成分分析;神經(jīng)網(wǎng)絡(luò)
鐵路客運(yùn)量預(yù)測是指對客運(yùn)量的發(fā)展進(jìn)行動態(tài)分析,并在定性基礎(chǔ)上進(jìn)行定量計算。正確預(yù)測鐵路客運(yùn)量,對國家的經(jīng)濟(jì)發(fā)展格局和資源配置,以及對鐵路企業(yè)內(nèi)部的投資結(jié)構(gòu)、經(jīng)營管理等都有重要作用[1]。但現(xiàn)實中的鐵路客運(yùn)量呈現(xiàn)出較大的不確定性,在春運(yùn)階段的表現(xiàn)尤其突出,相關(guān)預(yù)測誤差會使運(yùn)力安排與各地區(qū)客流聚集程度不協(xié)調(diào)。由于客運(yùn)量增長影響因素不僅包括人口結(jié)構(gòu)、經(jīng)濟(jì)社會發(fā)展水平、消費水平,還易受到突發(fā)事件的影響,如何通過相關(guān)影響因素的變化分析出可能出現(xiàn)的客運(yùn)量異常變化,顯得十分重要。
預(yù)測精度和考慮的影響因素與使用的算法密切相關(guān)。常用的預(yù)測算法有時間序列法[2]、回歸分析法[3]、馬爾科夫預(yù)測法[4]、神經(jīng)網(wǎng)絡(luò)方法[5-7]、組合預(yù)測方法[8]等。各種方法在樣本數(shù)據(jù)需求、預(yù)測精度、運(yùn)算效率、預(yù)測偏差方面都有其各自的特點,而在數(shù)據(jù)處理方法上主要有標(biāo)準(zhǔn)化、小波分析、因子分析[9]、主成分分析等。本文將對鐵路客運(yùn)量的影響因素進(jìn)行PCA處理,分析提取主成分,在此基礎(chǔ)之上建立利用遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò),對鐵路客運(yùn)量進(jìn)行預(yù)測。
1.1 PCA原理介紹
主成分分析(principal component analysis, PCA)是多元統(tǒng)計分析中一種簡化數(shù)據(jù)、特征提取的方法。它通過分析樣本數(shù)據(jù)中方差最大的特征,將原變量的一系列線性組合成新的變量,使組合后的變量互不相關(guān)且最大限度保留原有變量信息。這里利用該方法對原始數(shù)據(jù)樣本進(jìn)行處理,提取主成分,組合成新的輸入指標(biāo),再利用簡化后的數(shù)據(jù)集作為模型的輸入。
設(shè)有m個樣本,每個樣本有n維度,則整個樣本數(shù)據(jù)可表示為
式中單個樣本數(shù)據(jù)可表示為Xi=[xi1,xi2,…,xin],i=1,2,…,m。
PCA完整計算步驟如下:
(1)樣本數(shù)據(jù)均值化處理,以消除量綱的影響。
(2)矩陣分解。令X*=YTY,對X*求其特征值λj,特征向量vj。
式中:vj為Y的右奇異向量;σj為奇異值;uj為左奇異向量。
(3)選擇主成分個數(shù)。將奇異值σj從大到小排列,求其方差貢獻(xiàn)率ηj與累計方差貢獻(xiàn)率ηk。
一般來說,當(dāng)ηk>0.95時,即視為包涵樣本的絕大部分信息,此時選取的主成分為前k個。
(4)數(shù)據(jù)變換。
1.2 GA-BP原理介紹
作為預(yù)測研究中重要的新興技術(shù),神經(jīng)網(wǎng)絡(luò)具有良好的自學(xué)習(xí)、自適應(yīng)、分布式存儲等特性,在處理模式識別、非線性回歸及優(yōu)化等問題時展現(xiàn)了較大的優(yōu)勢。盡管如此,其自身也存在一些缺陷:由于BP算法的權(quán)值調(diào)整原則是基于誤差的梯度下降,這要求調(diào)整過程的每一步都取局部最優(yōu),因此,對于某些復(fù)雜的誤差曲面,BP網(wǎng)絡(luò)容易陷于局部極小點。此外,當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、學(xué)習(xí)樣本數(shù)目較多時,網(wǎng)絡(luò)初始權(quán)值的取值對網(wǎng)絡(luò)收斂與否影響很大,而標(biāo)準(zhǔn)算法中隨機(jī)確定的初始權(quán)值,增加了預(yù)測結(jié)果的不確定性。因此這里使用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值進(jìn)行篩選優(yōu)化,目的在于利用其啟發(fā)式搜索能力排除掉不利于網(wǎng)絡(luò)收斂的初始權(quán)值,提高網(wǎng)絡(luò)尋優(yōu)效率。
圖1所示的BP神經(jīng)網(wǎng)絡(luò)中,X=(x1,x2,…,xn)T為網(wǎng)絡(luò)的輸入向量,x0=-1將隱含層閾值轉(zhuǎn)化為權(quán)值;H=(h1,h2,…,hm)T為隱含層輸出向量,h0=-1將輸出層閾值轉(zhuǎn)化為權(quán)值;Y=(y1,y2,…,yl)T為網(wǎng)絡(luò)的輸出向量,V=(V1,V2,…,Vm)為隱含層神經(jīng)元權(quán)值,W=(W1,W2,…,Wl)輸出層神經(jīng)元權(quán)值,期望輸出向量為T=(t1,t2,…,tl)T。
圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
各層之間信號傳遞方式如下:從輸入層到隱含層:
hq=f(netq)q=1,2,…,m
從隱含層到輸出層:
yr=f(netr)r=1,2,…,l
基于遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)運(yùn)算過程如圖2所示。
圖2 GA-BP模型原理
2.1 預(yù)測影響因子選取
鐵路客運(yùn)量影響因素涉及面廣,根據(jù)相關(guān)文獻(xiàn)[10-12],綜合考慮區(qū)域經(jīng)濟(jì)發(fā)展水平、產(chǎn)業(yè)結(jié)構(gòu)、人口結(jié)構(gòu)與消費、稅收情況等,選取以下13個指標(biāo)作為客運(yùn)量影響因素(見表1)。本文算例數(shù)據(jù)出自天津統(tǒng)計年鑒。
選取較多的影響因素是為了盡可能地保留并發(fā)現(xiàn)影響因素與客運(yùn)量之間的隱含映射關(guān)系,但輸入矩陣規(guī)模的擴(kuò)大,會導(dǎo)致網(wǎng)絡(luò)冗余。輸入變量間的多重共線性會導(dǎo)致網(wǎng)絡(luò)參數(shù)變化怪異,進(jìn)而降低網(wǎng)絡(luò)泛化性能[3]。對輸入矩陣的主成分提
取,能在保留絕大部分?jǐn)?shù)據(jù)信息量的同時盡可能降低輸入矩陣維數(shù),以少數(shù)不相關(guān)的主成分作為維度對原始數(shù)據(jù)進(jìn)行重新映射,將其投影到低維空間,作為神經(jīng)網(wǎng)絡(luò)的輸入(如圖3所示)。
表 1 鐵路客運(yùn)量的主要影響因素
圖3 客運(yùn)量預(yù)測模型
2.2 主成分分析與輸入變量提取
為去除輸入數(shù)據(jù)單位及量綱的差別,首先對數(shù)據(jù)進(jìn)行均值化處理[13],然后求其協(xié)方差矩陣的特征根以及相應(yīng)的特征向量,根據(jù)特征值的累計貢獻(xiàn)率篩選主成分(主要結(jié)果見表2)。
表2計算數(shù)據(jù)表明,特征值最大的主成分占有全部信息的98.8%,而前兩項主成分累計達(dá)到99%以上,符合選取標(biāo)準(zhǔn)[14],完全可以用前兩項主成分作為新的維度對原有數(shù)據(jù)進(jìn)行映射。
由表3可知,區(qū)域GDP、第二和三產(chǎn)業(yè)產(chǎn)值、新增固定資產(chǎn)投資、營業(yè)稅、企業(yè)所得稅在第一主成分中占有較大載荷,即該主成分以較大程度反映了這方面特征。對于第二主成分,企業(yè)所得稅與個人所得稅則占據(jù)絕大部分比重。
表2 各主成分特征值與方差貢獻(xiàn)
表3 各影響因素的因子載荷矩陣
2.3 PCA-GABP預(yù)測方法的結(jié)果分析
(1)有PCA處理和無PCA處理的模型遺傳收斂代數(shù)與誤差曲線。圖4、圖5所示為兩種GABP模型的預(yù)測誤差與遺傳代數(shù)曲線,其中神經(jīng)網(wǎng)絡(luò)部分隱節(jié)點數(shù)同為4,相關(guān)參數(shù)相同,遺傳算法部分除個體長度外其余參數(shù)相同??梢钥闯?,PCA處理過的模型無論是收斂代數(shù)、收斂速度、預(yù)測精度都優(yōu)于非PCA模型。非PCA模型在遺傳收斂初始階段誤差加大,這與其較大的網(wǎng)絡(luò)參數(shù)數(shù)據(jù)相關(guān)。隨著遺傳代數(shù)的增加,誤差下降較為緩慢,網(wǎng)絡(luò)開銷較大。而PCA模型得益于較小的網(wǎng)絡(luò)規(guī)模,遺傳初始階段誤差就已經(jīng)優(yōu)于前者的最終誤差,且在第10代時完成收斂,收斂速度有很大提高。
圖 4 PCA處理過的模型遺傳進(jìn)化過程
圖5 未經(jīng)PCA處理的模型進(jìn)化過程
(2)最優(yōu)隱節(jié)點取值時訓(xùn)練預(yù)測誤差圖。為考察PCA對于前饋網(wǎng)絡(luò)訓(xùn)練情況與預(yù)測精度的影響,這里將兩種模型平均絕對誤差最小的結(jié)果加以比較。采用試湊法尋找網(wǎng)絡(luò)預(yù)測誤差最小時隱節(jié)點取值,仿真結(jié)果表明:基于PCA的網(wǎng)絡(luò)最優(yōu)隱節(jié)點數(shù)為4;非PCA處理的網(wǎng)絡(luò)最優(yōu)隱節(jié)點數(shù)為7。網(wǎng)絡(luò)訓(xùn)練與預(yù)測情況如圖6所示。
在網(wǎng)絡(luò)訓(xùn)練階段,PCA網(wǎng)絡(luò)與非PCA網(wǎng)絡(luò)差異不大,前者相對于實際值的偏差較為平均,而后者擬合值明顯偏大。在預(yù)測階段,PCA網(wǎng)絡(luò)更準(zhǔn)確且誤差分布均勻;非PCA網(wǎng)絡(luò)預(yù)測誤差更大且顯著偏小。這說明在同等精度水平下,PCA能夠減少前饋網(wǎng)絡(luò)的誤差偏性,將誤差控制在實際值兩側(cè)。主要原因在于輸入數(shù)據(jù)維數(shù)的縮減,有利于神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化迭代,使參數(shù)變化更加簡明有效;此外,主成分之間的相對獨立性會提高網(wǎng)絡(luò)效率,提高網(wǎng)絡(luò)識別能力。
圖6 兩種模型訓(xùn)練、預(yù)測誤差比較
將PCA處理過的樣本輸入到網(wǎng)絡(luò)中,三層前饋網(wǎng)絡(luò)隱節(jié)點數(shù)為4,網(wǎng)絡(luò)結(jié)構(gòu)為2-4-3;訓(xùn)練次數(shù)epochs=1 000,學(xué)習(xí)速率lr=0.1;遺傳優(yōu)化階段個體數(shù)目NIND=50,最大遺傳代數(shù)MAXGEN=50,交叉概率Px=0.8,初始變異概率Pm0=0.01,代溝GAP=0.95,選擇操作為隨機(jī)遍歷采樣,交叉操作采用單點交叉,變異操作使用離散變異算子;同時使用未經(jīng)PCA處理的樣本作為GABP網(wǎng)絡(luò)輸入建立對比模型,遍歷實驗表明其最優(yōu)隱節(jié)點數(shù)為7,網(wǎng)絡(luò)結(jié)構(gòu)為13-7-3,其余參數(shù)不變。兩個模型使用1999—2010年數(shù)據(jù)作為訓(xùn)練樣本,2011—2013年樣本作為預(yù)測樣本,預(yù)測結(jié)果及誤差分析見表4、表5、圖7。其中:MAE為平均絕對誤差,RMSE為均方根誤差。
表4 兩種模型預(yù)測結(jié)果對比
表 5 兩種模型訓(xùn)練及預(yù)測誤差分析
圖7 兩種模型訓(xùn)練均方誤差比較
由表5可知,就訓(xùn)練誤差而言,GA-BP比PCA-GABP擬合度更高,但其預(yù)測誤差則遠(yuǎn)遠(yuǎn)大于PCA模型。盡管非PCA方法平均擬合度較好,由圖7可以看出,個別點擬合偏差不穩(wěn)定。訓(xùn)練次數(shù)過多或訓(xùn)練精度過高時,BP網(wǎng)絡(luò)存在過擬合的趨勢,可能導(dǎo)致網(wǎng)絡(luò)泛化能力減弱。這里輸入數(shù)據(jù)維度之間的冗余與線性關(guān)系,加上BP網(wǎng)絡(luò)基于經(jīng)驗最小化的特點,會進(jìn)一步降低其泛化能力[15]。若要減少過擬合的影響,就要控制訓(xùn)練數(shù)據(jù)輸入次序與訓(xùn)練迭代步數(shù),這會使模型預(yù)測能力帶有較大的不確定性。相比之下,PCA-GABP模型由于其相對較少的輸入變量、簡單的網(wǎng)絡(luò)結(jié)構(gòu),因而在尋優(yōu)速度與預(yù)測精度方面具有明顯優(yōu)勢。
為探討該網(wǎng)絡(luò)模型與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在客運(yùn)量預(yù)測方面的性能,這里將廣義回歸神經(jīng)網(wǎng)絡(luò)(generalized regression neural network, GRNN)、BP網(wǎng)絡(luò)和本文模型同時對算例進(jìn)行預(yù)測,對比分析其性能優(yōu)劣。以均方根誤差最小化為原則確定GRNN其最優(yōu)光滑因子(Spread)為0.4,BP網(wǎng)絡(luò)最優(yōu)隱節(jié)點數(shù)為31,GRNN網(wǎng)絡(luò)隱層中心由K-MEANS聚類確定,隱層至輸出層權(quán)值由最小二乘法確定,其余網(wǎng)絡(luò)參數(shù)同PCA-GABP模型一致。具體仿真結(jié)果見表6。
表6 不同網(wǎng)絡(luò)模型訓(xùn)練及預(yù)測結(jié)果分析
由表6可知:沒有經(jīng)過優(yōu)化的BP網(wǎng)絡(luò)在訓(xùn)練誤差上有一定的優(yōu)勢,但在泛化性能上表現(xiàn)出較大劣勢,這是由于網(wǎng)絡(luò)誤差面的結(jié)構(gòu)和學(xué)習(xí)算法特性使其容易陷于局部極小,且訓(xùn)練結(jié)果還受到初始權(quán)值的影響,進(jìn)而影響網(wǎng)絡(luò)性能。GRNN以結(jié)構(gòu)簡單、訓(xùn)練速度快等特點著稱,這里突出表現(xiàn)為較小的訓(xùn)練誤差,但面對較多的輸入變量時,其經(jīng)驗風(fēng)險最小化的特點與過于簡單的學(xué)習(xí)算法會使其泛化性能較差。相比之下,結(jié)合了PCA方法的GABP網(wǎng)絡(luò),在客運(yùn)量預(yù)測方面表現(xiàn)出更強(qiáng)的泛化性能與較簡單的結(jié)構(gòu)。
本文利用主成分分析技術(shù)對影響鐵路客運(yùn)量的因素進(jìn)行處理,將取出主成分并輸入到利用遺傳算法優(yōu)化的BP網(wǎng)絡(luò)中,從而對客運(yùn)量進(jìn)行預(yù)測。實驗結(jié)果表明,該模型能有效降低輸入數(shù)據(jù)規(guī)模并且具有較好的訓(xùn)練速度。不同模型的對比結(jié)果也說明該模型較一般網(wǎng)絡(luò)模型具有更好的預(yù)測精度,印證了其在客運(yùn)量預(yù)測方面的優(yōu)勢。由于這里使用的是各年份的數(shù)據(jù),對于更細(xì)的客運(yùn)量數(shù)據(jù)劃分如季度、月,該模型的預(yù)測能力尚不可知,有待繼續(xù)研究。
[1] 侯福均, 吳祈宗. BP神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)市場時間序列預(yù)測中的應(yīng)用[J]. 運(yùn)籌與管理, 2003, 12 (4): 73-75.
[2] 潘迪夫,劉輝,李燕飛.風(fēng)電場風(fēng)速短期多步預(yù)測改進(jìn)算法[J].中國電機(jī)工程學(xué)報, 2008, 28(26): 87-91.
[3] 李曉剛,賈元華,敖谷昌.基于主成分分析的公路客運(yùn)量預(yù)測模型研究[J]. 公路標(biāo)準(zhǔn)化, 2009(5): 77-81.
[4] 芮海田,吳群琪,袁華智,等. 基于指數(shù)平滑法和馬爾科夫模型的公路客運(yùn)量預(yù)測方法[J]. 交通運(yùn)輸工程學(xué)報, 2013, 13(4): 87-92.
[5] 王卓,王艷輝,賈利民,等. 改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)在鐵路客運(yùn)量時間序列預(yù)測中的應(yīng)用[J]. 中國鐵道科學(xué),2005,26(2): 127-131.
[6] 吳偉,符卓,王曉.運(yùn)輸通道客運(yùn)量預(yù)測方法[J].鐵道科學(xué)與工程學(xué)報,2012,9(5): 96-102.
[7] SPECHT D F. A general regression neural network[J]. IEEE Transactions on Neural Works, 1991, 2(6): 568-576.
[8] 劉純,范高鋒,王偉勝,等.風(fēng)電場輸出功率的組合預(yù)測模型[J].電網(wǎng)技術(shù), 2009, 33(13): 74-79.
[9] 王學(xué)仁,王松桂.實用多元統(tǒng)計分析[M].上海:上??茖W(xué)技術(shù)出版社,1990:270-344.
[10] 姚新勝,蘇延川,孫金玲. 公路客運(yùn)短期運(yùn)量預(yù)測研究[J]. 公路交通科技, 2005, 22(11): 155-158.
[11] 陸化普.交通規(guī)劃理論與方法[M]. 北京: 清華大學(xué)出版社, 1998:47-59.
[12] 楊洋.基于運(yùn)輸一體化的區(qū)域交通運(yùn)輸需求預(yù)測研究[D]. 長春: 吉林大學(xué), 2006.
[13] 徐雅靜, 汪遠(yuǎn)征.主成分分析應(yīng)用方法的改進(jìn)[J].數(shù)學(xué)實踐與認(rèn)識,2006, 36(6):68-75.
[14] SANDHYA S.神經(jīng)網(wǎng)絡(luò)在應(yīng)用科學(xué)和工程中的應(yīng)用—從基本原理到復(fù)雜的模式識別[M].史曉霞,譯.北京:機(jī)械工業(yè)出版社,2009: 7.
[15] 周松林,茆美琴,蘇建徽.基于主成分分析與人工神經(jīng)網(wǎng)絡(luò)的風(fēng)電功率預(yù)測[J]. 電網(wǎng)技術(shù),2011,35(9):128-132.
(編輯:史海英)
Prediction of Railway Passenger Volume Based on PCA and GA-BP Network
YANG Qixuan
(Postgraduate Training Brigade, Military Transportation University, Tianjin 300161, China)
Considering numerous factors influencing railway passenger volume and complex mapping relation among variables, the paper firstly deals with the influencing factors with PCA (principal component analysis) method and reduces the dimension of related variables to eliminate multiple co-linear relations between variables. Then, it enters the converted variables into neural network model based on GA-BP and predicts the railway passenger volume. The simulation result shows that this model is more accurate and simpler than BP neural network model.
railway passenger volume prediction; PCA (principal component analysis); neural network
2016-04-19;
2016-09-02.
楊祺煊(1991—),男,碩士研究生.
10.16807/j.cnki.12-1372/e.2017.02.021
U491
A
1674-2192(2017)02- 0084- 06