馬子驥,郭帥鋒,李元良
(湖南大學(xué) 電氣與信息工程學(xué)院,湖南 長沙 410082)
軌道不平順的形成受到多種因素的影響,包括軌道因素、載荷因素和自然因素等,這決定了軌道不平順是隨里程變化的隨機干擾函數(shù)[1]。國內(nèi)外學(xué)者對軌道質(zhì)量預(yù)測方法進行的研究工作基本分為兩類,一是將外界變量參數(shù)化構(gòu)建出合適的模型。文獻[2]提出一種基于信號處理、統(tǒng)計和軌檢數(shù)據(jù)的綜合因子法,對軌道不平順發(fā)展趨勢進行了預(yù)測。文獻[3]從軌道構(gòu)造條件、列車載荷對軌道及路基下沉量作用出發(fā),通過軌道力學(xué)理論得到未來的軌道下沉量。二是構(gòu)造合適的組合預(yù)測模型。文獻[4]利用線性預(yù)測模型預(yù)測軌道質(zhì)量指數(shù)(TQI)的發(fā)展情況。文獻[5]利用實測軌道不平順歷史數(shù)據(jù),通過回歸分析,得到軌道不平順的非線性預(yù)測公式。文獻[6]利用軌檢車動態(tài)檢測數(shù)據(jù),提出一種基于不平順分布函數(shù)的不平順發(fā)展統(tǒng)計預(yù)測方法。文獻[7]利用軌道不平順TITCGM(1,1)-PC灰色非線性預(yù)測模型對TQI序列進行預(yù)測。為了充分反映軌道不平順的動態(tài)隨機性,文獻[8]提出基于非等時距灰色加權(quán)和BP神經(jīng)網(wǎng)絡(luò)的軌道不平順預(yù)測方法,具有較高的預(yù)測精度。但是TQI序列屬于典型的小樣本貧信息不確定性系統(tǒng),BP神經(jīng)網(wǎng)絡(luò)受樣本容量影響較大,當樣本較少時對歷史數(shù)據(jù)的擬合較好,但是預(yù)測缺乏穩(wěn)定性。
基于以上分析,本文充分利用支持向量機(SVM)[9]處理小樣本非線性高維數(shù)據(jù)的能力,提出一種基于非等間距GM(1,1)和粒子群優(yōu)化[10]支持向量機(PSVM)的軌道不平順組合預(yù)測方法。將非等距序列變換為等間距累加均值序列,通過改進的灰色模型得到TQI的初步預(yù)測值,利用PSVM對灰色預(yù)測值進行修正,得到較精確的TQI序列。
設(shè)非等間距TQI序列為
X(0)={x(0)(t1),x(0)(t2),…,x(0)(tn)}
將n個歷史數(shù)據(jù)X(0)轉(zhuǎn)換為等間距序列的步驟如下[11]:其對應(yīng)的各觀測周期距首個周期的時間間隔為ti=Ti-T1,其中Ti為各期的原始觀測時間,且滿足
Δti=ti-ti-1≠consti=2,3,…,n
( 1 )
平均時間間隔為
( 2 )
各實際觀測時段與平均時間間隔的單位時段差系數(shù)為
( 3 )
各實際觀測時段的差值為
Δx(0)(ti)=u(ti)[x(0)(ti)-x(0)(ti-1)]
( 4 )
式中:x(0)(ti)為ti時刻的原始觀測值,i=2,3,…,n。Δx(0)(ti)=0。
( 5 )
( 6 )
得到等間隔累加均值序列
( 7 )
由式( 7 )可知
X(1)={x(1)(t1),x(1)(t2),…,x(1)(tn)}
( 8 )
由一階生成序列x(1)(ti)構(gòu)建GM(1,1)模型的白化形式,其微分方程為
( 9 )
式中:a為發(fā)展系數(shù),用來控制系統(tǒng)發(fā)展態(tài)勢;u為灰色作用量,用來反映數(shù)據(jù)變化的不確切關(guān)系。
將式( 9 )在區(qū)間[ti-1,ti]上積分
(10)
可得離散化差分方程為
x(0)(ti)Δti+az(1)(ti)=uΔti
(11)
式中:z(1)(ti)為x(1)(ti)在區(qū)間[ti-1,ti]上的背景值。
利用最小二乘法求得待辨識參數(shù)a、u,即
[au]T=(BTB)-1BTG
(12)
其中
(13)
將a、u代入式(10)中可得時間響應(yīng)函數(shù)
(14)
式中:i=2,3,…,n。
GM(1,1)模型預(yù)測值為
(15)
如果在級數(shù)比檢驗時進行平移,需將式(15)等號右邊減去常數(shù)c,c為使原始數(shù)據(jù)序列的級數(shù)比都落在可容覆蓋范圍內(nèi)的常數(shù)。
GM(1,1)模型的模擬預(yù)測精度取決于參數(shù)a、u,a、u的值又取決于z(1)(ti)的求解,因此背景值是影響灰色理論建模精度的重要因素之一。傳統(tǒng)GM(1,1)模型把序列x(1)(ti)在區(qū)間上的連續(xù)函數(shù)視為直線,用梯形公式近似代替區(qū)間[ti-1,ti]上累加曲線x(1)(ti)與t軸圍成的面積。文獻[8,12]指出使用齊次指數(shù)擬合灰指數(shù)序列對其積分,并將積分值作為背景值,但是一階累加生成序列并不一定都是齊次序列。因此本文利用一種復(fù)化梯形公式[13]解決更為一般的1-AGO序列,從積分幾何意義出發(fā),利用函數(shù)逼近思想,得到更精確的GM(1,1)背景值。由文獻[13]可知,一階累加序列可表示為一般的非齊次序列
x(1)(ti)=Aeαti-1+B
(16)
式中:
B=x(0)(t1)-A
式(11)中的z(1)(ti)可以表示為
(17)
式中:k表示將區(qū)間[ti-1,ti]均分為k段。
支持向量機(SVM)是由Vapnik等根據(jù)統(tǒng)計學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險最小化(SRM)原則提出的,具有良好的泛化能力。SVM既有嚴格的理論基礎(chǔ),又能較好地處理小樣本非線性高維數(shù)問題,能夠避免陷入局部極小值。利用支持向量機可以將輸入樣本向量通過事先選擇的非線性映射變換到高維特征空間,并在這個高維空間中得到自變量和因變量之間的非線性映射關(guān)系。
支持向量機函數(shù)擬合問題就是用函數(shù)f(x)=wx+b擬合數(shù)據(jù)(xi,yi),i=1,2,…,n,xi∈Rn,yi∈Rn。數(shù)據(jù)樣本為n組數(shù)據(jù),即n維向量。支持向量機擬合函數(shù)為
(18)
使得
(19)
對于非線性問題,若在原樣本空間中不能得到滿意結(jié)果,可以通過非線性變換轉(zhuǎn)化為某個高維空間中的線性問題,在變換空間求得最優(yōu)分類面。這種變換可能比較復(fù)雜,SVM通過引入核函數(shù)成功解決了這一問題。高維計算的核函數(shù)主要有多項式核函數(shù)、徑向基核函數(shù)(RBF)和Sigmoid核函數(shù)。
由于單一灰色模型可能存在較大的偏差,所以本文利用SVM對GM(1,1)模型預(yù)測的軌道不平順TQI值進行修正預(yù)測。研究表明,懲罰參數(shù)C與核函數(shù)參數(shù)g是影響SVM性能的關(guān)鍵參數(shù),目前還沒有合適的理論能夠指導(dǎo)參數(shù)選擇[14]。因此,使用粒子群優(yōu)化算法對SVM的懲罰參數(shù)C、核函數(shù)參數(shù)g進行選擇,可以有效避免參數(shù)選擇不當對SVM的影響。PSO算法是一種經(jīng)典的群智能算法,其粒子尋優(yōu)基本過程為
vij(t+1)=wvij(t)+c1×r1×
[pij-xij(t)]+c2×r2[pgi-xij(t)]
(20)
xij(t+1)=xij(t)+vij(t+1)
(21)
式中:w為慣性因子;r1、r2為(0,1)區(qū)間服從均勻分布的隨機數(shù);c1、c2為學(xué)習(xí)因子,其個體極值為pbest,pi=(pi1,pi2,…,pid),i=1,2,…,n;n為粒子數(shù),d為粒子維度;全局最優(yōu)解為gbest,表示所有粒子的全局極值所在位置,pg=(pg1,pg2,…,pgn)。
基于以上理論分析,本文設(shè)計的TQI預(yù)測方法為:對原始TQI數(shù)據(jù)進行級數(shù)比檢驗,判斷是否需要平移變換;利用改進的非等間距灰色模型對TQI值進行初步預(yù)測,利用復(fù)化梯形公式對該模型進行背景值優(yōu)化;將得到的初步預(yù)測值輸入PSVM模型中進行修正預(yù)測,得到本文組合模型的最終預(yù)測值。灰色和PSVM模型結(jié)構(gòu)如圖1所示。
圖1 灰色和PSVM模型結(jié)構(gòu)
具體計算步驟如下:
步驟1對原始數(shù)據(jù)序列進行級數(shù)比檢驗,如果不符合要求,則將數(shù)據(jù)進行平移處理。
計算其級數(shù)比為
(22)
X(0)=X(0)+c
(23)
步驟2將處理過的非等間距TQI序列X(0)進行變換處理,得到等間隔的一階累加均值序列X(1),如式( 7 )所示。
步驟3在每個時間間隔[ti-1,ti]內(nèi)插入3個點將其均分為4份,利用復(fù)化梯形公式對GM(1,1)模型的背景值z(1)(ti)進行優(yōu)化。
步驟4利用最小二乘法估計灰色模型的參數(shù)a、u,得到最終灰色模型預(yù)測的時間響應(yīng)函數(shù)。
步驟5利用步驟4得到基于灰色模型預(yù)測的原始TQI數(shù)據(jù)為
(24)
步驟6將灰色模型預(yù)測得到的原始TQI數(shù)據(jù)Pg作為PSVM修正模型的輸入,TQI真實值X(0)作為其輸出,對模型進行訓(xùn)練,得到最優(yōu)化C、g的PSVM模型。具體方法為:通過對學(xué)習(xí)因子c1、c2和權(quán)重系數(shù)進行初始化,初始化粒子的位置和速度,每個粒子設(shè)置為初始最好位置;計算每個粒子的適應(yīng)度,粒子的適應(yīng)度采用K折交叉檢驗進行評估,根據(jù)式(19)更新粒子的速度和位置;最后判斷是否滿足終止條件,若滿足,則將群體中最優(yōu)粒子映射為SVM懲罰參數(shù)C和核函數(shù)參數(shù)g最優(yōu)解,否則,返回步驟2開始下一次搜索。
以文獻[7]中提速干線滬昆線上行K226.4~K226.6和K226.8~K227的TQI檢測數(shù)據(jù)為例。將2007年9月—2008年8月一年內(nèi)的19個數(shù)據(jù)作為穩(wěn)定維修周期內(nèi)積累的原始數(shù)據(jù),對2008年9月—2008年12月的7個TQI數(shù)據(jù)進行預(yù)測。支持向量機采用林智任編寫的libsvm包,用PSO算法優(yōu)化SVM的徑向基核函數(shù),其表達式為
K(x,xi)=exp[-‖x-xi‖2/(2σ2)]
(25)
相對誤差
(26)
平均誤差
(27)
讀取滬昆線上行K226.4~K226.6的19個訓(xùn)練樣本數(shù)據(jù),PSO優(yōu)化SVM模型參數(shù)過程中的均方誤差適應(yīng)度隨迭代次數(shù)的變化曲線如圖2所示。迭代結(jié)束時,搜索得到的SVM懲罰參數(shù)C=100,核函數(shù)參數(shù)g=1.187 6,CVmse=0.245 12。
圖2 PSO優(yōu)化SVM參數(shù)的適應(yīng)度曲線
利用改進的非等間距灰色模型預(yù)測結(jié)果如圖3所示,利用PSVM模型進行修正的結(jié)果如圖4所示。由圖3可看出,灰色模型的預(yù)測大致反映了TQI序列的變化方向,誤差較大。由圖4可看出,雖然經(jīng)過PSVM模型進一步糾正之后訓(xùn)練結(jié)果對歷史數(shù)據(jù)擬合效果一般,但SVM小樣本學(xué)習(xí)和良好的外推能力使預(yù)測誤差明顯減小。本文預(yù)測模型與文獻[7]的TITCGM(1,1)-PC模型和文獻[8]的灰色與神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型對比結(jié)果見表1。顯然,文獻[7]模型個別誤差過大,最大為12.64%;文獻[8]灰色與神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型由于神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值是運行時隨機賦值的,具有不確定性且訓(xùn)練性能依賴大樣本數(shù)據(jù),訓(xùn)練結(jié)果雖然對歷史數(shù)據(jù)擬合較好,但是預(yù)測性能欠佳。
圖3 K226.4~K226.6區(qū)間TQI實測值與初步預(yù)測值圖4 K226.4~K226.6區(qū)間TQI實測值與最終預(yù)測值
表1 K226.4~K226.6區(qū)間內(nèi)3種算法的TQI預(yù)測結(jié)果比較
為了避免連續(xù)區(qū)段TQI變化較接近,另取滬昆線上行K226.8~K227的19個訓(xùn)練樣本數(shù)據(jù),PSO優(yōu)化SVM模型參數(shù)過程中的均方誤差適應(yīng)度隨迭代次數(shù)的變化曲線如圖5所示。當?shù)Y(jié)束時,搜索得到的SVM懲罰參數(shù)C=261.700 9,核函數(shù)參數(shù)g=1.406 9,CVmse=0.098 162。
圖5 PSO訓(xùn)練SVM參數(shù)的適應(yīng)度曲線
利用改進的非等間距灰色模型預(yù)測結(jié)果如圖6所示,利用PSVM模型進行修正的結(jié)果如圖7所示。由圖6可以看出,灰色模型的預(yù)測誤差較大。經(jīng)過PSVM模型進一步糾正之后訓(xùn)練結(jié)果對歷史數(shù)據(jù)的擬合效果一般,但預(yù)測誤差較小,結(jié)果如圖7所示。本文預(yù)測模型與文獻[7]中的TITCGM(1,1)-PC模型和文獻[8]的灰色與神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型對比結(jié)果見表2。
圖6 K226.8~K227區(qū)間TQI實測值與初步預(yù)測值
序號檢測時間實測TQI值文獻[7]方法TQI預(yù)測值相對誤差/%文獻[8]方法TQI預(yù)測值相對誤差/%本文方法TQI預(yù)測值相對誤差/%12008-09-056.7936.5493.596.4574.956.3596.3922008-09-156.5026.6412.146.4590.666.4251.1832008-10-066.6666.3944.086.4563.156.5701.4442008-10-156.6236.2805.186.4562.526.6330.1552008-11-116.9707.1342.356.4617.306.8232.1162008-12-116.6577.53713.226.5251.987.0285.5772008-12-247.2847.6444.947.0073.807.1122.36相對誤差平均值/%5.073.482.74
圖7 K226.8~K227區(qū)間TQI實測值與最終預(yù)測值
(1)計算TQI累計序列微分方程的背景值時,從積分的幾何意義出發(fā),利用函數(shù)逼近思想,通過復(fù)化梯形公式構(gòu)造背景值,提高預(yù)測精度。
(2)隨著預(yù)測時間的延長,灰色模型在實際應(yīng)用中預(yù)測精度會降低,在實踐中應(yīng)當對模型不斷試驗,總結(jié)出對多長時間內(nèi)進行預(yù)測既可以減少運算量又滿足精度要求。
(3)利用PSO算法的全局搜索能力,將SVM的懲罰參數(shù)C和核函數(shù)參數(shù)g作為粒子向量進行全局尋優(yōu),該方法克服了SVM對參數(shù)敏感的缺點,避免了根據(jù)經(jīng)驗確定模型參數(shù)導(dǎo)致的不確定性。
(4)PSVM模型中的不敏感損失函數(shù)應(yīng)隨著預(yù)測區(qū)段的不同進行微調(diào),訓(xùn)練樣本也應(yīng)及時補充完善,提高預(yù)測精度。
(5)TQI序列屬于典型的小樣本貧信息不確定性序列。利用支持向量機對TQI灰色預(yù)測值進一步修正,可充分發(fā)揮其良好的預(yù)測性能和泛化能力,克服了單一灰色預(yù)測模型的不足,具有較高的使用價值。
正確預(yù)測軌道質(zhì)量指數(shù)的變化對提高軌道平順性意義重大,本文以滬昆線上行兩段線路的預(yù)測分析為例,采用灰色模型和粒子群優(yōu)化的支持向量機組合模型探討解決這一問題的方法,并與實測值進行比較,取得了較理想的效果,預(yù)測相對誤差低于現(xiàn)有的TITIGM-PC模型和灰色神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型。
參考文獻:
[1]羅林.軌道隨機干擾函數(shù)[J].中國鐵道科學(xué),1982,3(1):74-112.
LUO Lin.Track Random Excitation Function[J].China Railway Science,1982,3(1):74-112.
[2]陳憲麥.軌道不平順時頻域分析及預(yù)測方法的研究[D].北京:鐵道部科學(xué)研究院,2006.
[3]三和雅史,內(nèi)田雅夫.軌道狀態(tài)推移モデルの設(shè)定と軌道保守施策決定法[J].鉄道総研報告,1996(4):7-12.
[4]許玉德,吳紀才.利用線性預(yù)測模型分析軌道不平順發(fā)展[J].石家莊鐵道學(xué)院學(xué)報,2005,18(1):6-9.
XU Yude,WU Jicai.Analysis on Development of Track Irregularities with Linear Forecast Model[J].Journal of Shijiazhuang Railway Institute,2005,18(1):6-9.
[5]杉山徳平,家田仁,上野昌喜.軌道狂い狀態(tài)を考慮した軌道破壊の要因分析[J].鉄道線路,1986,34(9):442-446.
[6]高建敏,翟婉明,徐涌,等.基于概率分布的軌道不平順發(fā)展統(tǒng)計預(yù)測[J].鐵道科學(xué)與工程學(xué)報,2006,3(6):55-60.
GAO Jianmin,ZHAI Wanming,XU Yong,et al.Development Forecast Model of Track Irregularity Based on Probability Distribution[J].Journal of Railway Science and Engineering,2006,3(6):55-60.
[7]曲建軍.基于提速線路TQI 的軌道不平順預(yù)測與輔助決策技術(shù)的研究[D].北京:北京交通大學(xué),2011.
[8]韓晉,楊岳,陳峰,等.基于非等時距加權(quán)灰色模型與神經(jīng)網(wǎng)絡(luò)的軌道不平順預(yù)測[J].鐵道學(xué)報,2014,36(1):81-87.
HAN Jin,YANG Yue,CHEN Feng,et al.Prediction of Track Irregularity Based on Non-equal Interval Weighted Grey Model and Neural Network[J].Journal of the China Railway Society,2014,36(1):81-87.
[9]VAPNIK V N.Statistical Learning Theory[M].New York:Wiley,1998.
[10]XUE Z H,DU P J,SU H J.Harmonic Analysis for Hyperspectral Image Classification Integrated with PSO Optimized SVM[J].IEEE Journal of Selected Topics inApplied Earth Observations and Remote Sensing,2014,7(6):2131-2146.
[11]李斌,朱健.非等間隔灰色GM (1,1) 模型在沉降數(shù)據(jù)分析中的應(yīng)用[J].測繪科學(xué),2007,32(4):52-55.
LI Bin,ZHU Jian.Application of Unequal Interval Grey Model in Analysis of Settlement Data[J].Science of Surveying and Mapping,2007,32(4):52-55.
[12]曲建軍,高亮,辛濤,等.基于改進灰色-馬爾可夫鏈的軌道不平順發(fā)展預(yù)測方法[J].北京交通大學(xué)學(xué)報,2010,34(4):107-111.
QU Jianjun,GAO Liang,XIN Tao,et al.Track Irregularity Development Prediction Method Based on Grey-Markov Chain Model[J].Journal of Beijing Jiaotong University,2010,34(4):107-111.
[13]蔣詩泉,劉思峰,周興才.基于復(fù)化梯形公式的GM(1,1)模型背景值的優(yōu)化[J].控制與決策,2014,29(12):2221-2225.
JIANG Shiquan,LIU Sifeng,ZHOU Xingcai.Optimization of Background Value in GM(1,1) Based on Compound Trapezoid Formula[J].Control and Decision,2014,29(12):2221-2225.
[14]王生生,楊娟娟,柴勝.基于混沌鯰魚效應(yīng)的人工蜂群算法及應(yīng)用[J].電子學(xué)報,2014,42(9):1731-1737.
WANG Shengsheng,YANG Juanjuan,CHAI Sheng.Artificial Bee Colony Algorithm with Chaotic Catfish Effect and Its Application[J].Acta Electronica Sinica,2014,42(9):1731-1737.