張煜 楊飛 尤明熙 李國(guó)龍 龍亦語(yǔ)
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司基礎(chǔ)設(shè)施檢測(cè)研究所,北京 100081)
軌道不平順是引起車(chē)輛動(dòng)態(tài)響應(yīng)主要原因之一,直接影響車(chē)輛運(yùn)行的安全性和舒適性。由于我國(guó)軌道不平順評(píng)價(jià)體系未考慮波長(zhǎng)和形狀特性及多種不平順相互疊加的影響,因此評(píng)價(jià)結(jié)果與車(chē)輛動(dòng)態(tài)響應(yīng)之間關(guān)聯(lián)性較低。近年來(lái),大量研究開(kāi)始關(guān)注通過(guò)結(jié)合車(chē)輛響應(yīng)來(lái)評(píng)估軌道幾何質(zhì)量的方法,例如荷蘭ProRail 基于車(chē)輛濾波器的Pupil 系統(tǒng)、奧地利?BB 點(diǎn)質(zhì)量加速法[1]、德國(guó) DB 車(chē)輛響應(yīng)分析方法[2]和美國(guó)TTCI基于性能的軌道幾何檢測(cè)技術(shù)[3-4]等。根據(jù)TTCI研究報(bào)告,在當(dāng)前運(yùn)營(yíng)環(huán)境中,超過(guò)50%導(dǎo)致車(chē)輛不良響應(yīng)的軌道位置沒(méi)有被確認(rèn)。這些方法雖然增強(qiáng)了軌道幾何不平順與車(chē)輛動(dòng)態(tài)響應(yīng)的相關(guān)性,但未能表明影響車(chē)輛動(dòng)態(tài)響應(yīng)的主要因素。
本文基于軌道幾何動(dòng)態(tài)檢測(cè)數(shù)據(jù)和車(chē)載式線路檢查儀數(shù)據(jù),利用隨機(jī)森林模型,分析各項(xiàng)軌道幾何特征對(duì)垂向和水平晃車(chē)影響程度,并通過(guò)迭代決策樹(shù)(GBDT)算法預(yù)測(cè)疑似晃車(chē)點(diǎn),達(dá)到較高的準(zhǔn)確率;能夠識(shí)別超出現(xiàn)有幅值評(píng)判標(biāo)準(zhǔn)對(duì)車(chē)輛運(yùn)行有顯著影響的軌道病害區(qū)段,對(duì)于完善軌道幾何不平順評(píng)價(jià)體系及工務(wù)設(shè)備養(yǎng)護(hù)維修具有重要意義。
GBDT 是一種基于集成思想的決策樹(shù)模型,算法采用加法模型(即基函數(shù)的線性組合)與前向分布算法[5-6],以決策樹(shù)為基函數(shù),通過(guò)構(gòu)建M個(gè)決策樹(shù)(弱分類(lèi)器),經(jīng)過(guò)多次迭代最終組合為一個(gè)強(qiáng)分類(lèi)器。每一次迭代是為了改進(jìn)上一次結(jié)果,減少上一次模型殘差,并在殘差減少的梯度方向上建立新的組合模型。具體步驟如下。
輸入:訓(xùn)練數(shù)據(jù)集T={(x1,y1),(x2,y2),…,(xN,yN)},xi∈X,yi∈Y,i=1,2,…,N。輸出:決策樹(shù)fM(x)。
1)初始化f0(x)=0;
2)對(duì)m=1,2,…,M:
①按式(1)計(jì)算殘差,
②擬合殘差學(xué)習(xí)一個(gè)決策樹(shù),得到T(x,Θm),
③更新fm(x)=fm-1(x)+T(x,Θm);
3)得到最終決策樹(shù)為
為確定殘差減少的梯度,引入損失函數(shù)(Loss Function)概念。由于本文所涉問(wèn)題屬于二分類(lèi)問(wèn)題,因此選用對(duì)數(shù)損失函數(shù)(Log Like Hood Loss)。其定義如下:對(duì)于二項(xiàng)分布,y*∈{0,1},定義預(yù)測(cè)概率為p(x)=P(y*=1),即二項(xiàng)分布的概率,可得
式(3)可合并為
數(shù)據(jù)源于一客運(yùn)專(zhuān)線上行2016 年1—3 月數(shù)據(jù):①動(dòng)態(tài)檢測(cè)數(shù)據(jù),包括里程、左高低、右高低、左軌向、右軌向、軌距、超高、水平、三角坑、曲率、車(chē)速等軌道幾何信息;②晃車(chē)儀檢測(cè)數(shù)據(jù),包括水平和垂向晃車(chē)點(diǎn)的里程、時(shí)間、晃車(chē)次數(shù)等。
為提高模型準(zhǔn)確率,結(jié)合現(xiàn)場(chǎng)工作一般情況,以1—2 月動(dòng)態(tài)檢測(cè)數(shù)據(jù)和晃車(chē)儀檢測(cè)數(shù)據(jù)為訓(xùn)練集,3 月動(dòng)態(tài)檢測(cè)數(shù)據(jù)和晃車(chē)儀數(shù)據(jù)為測(cè)試集。數(shù)據(jù)源統(tǒng)計(jì)見(jiàn)表1。
表1 數(shù)據(jù)源統(tǒng)計(jì)
2.2.1 動(dòng)態(tài)檢測(cè)數(shù)據(jù)處理
由于動(dòng)態(tài)檢測(cè)數(shù)據(jù)體量龐大(樣本數(shù)量共246 萬(wàn)條),且單點(diǎn)檢測(cè)數(shù)據(jù)無(wú)法準(zhǔn)確表述線路幾何狀態(tài),加之晃車(chē)儀檢測(cè)里程誤差,利用原始數(shù)據(jù)建立模型無(wú)法保證預(yù)測(cè)的準(zhǔn)確性。因此,結(jié)合動(dòng)態(tài)檢測(cè)數(shù)據(jù)物理意義及晃車(chē)儀精度范圍,將原始數(shù)據(jù)按照一定長(zhǎng)度劃分區(qū)段,并以每區(qū)段為單位分別計(jì)算其特征屬性[7-8],具體字段包含左高低、右高低、左軌向、右軌向、軌距、水平、超高、三角坑、曲率屬性的標(biāo)準(zhǔn)差、幅值和最大變化率,以及區(qū)段內(nèi)車(chē)速的平均值。
以左高低PL為例,其標(biāo)準(zhǔn)差σPL為一定區(qū)段內(nèi)左高低值與其平均數(shù)離差平方算術(shù)平均數(shù)的平方根:
式中,xi∈PL,μ是其平均值。
左高低幅值δPL為一定區(qū)段內(nèi),左高低峰峰值的最大值:
式中,x∈PL。
左高低最大變化率αPL為區(qū)段內(nèi)相鄰波峰及波谷間的最大變化速率,即變化量與距離比值的最大值:
式中,(xi,yi),(xj,yj)是區(qū)段內(nèi)左高低波形的2 個(gè)連續(xù)的極值點(diǎn)。
由于檢測(cè)誤差和某些異常值的存在,原始波形存在一定異常波動(dòng),對(duì)最大變化率的計(jì)算造成了干擾。因此,在計(jì)算最大變化率前,先采用滑動(dòng)平均法對(duì)原始波形進(jìn)行了濾波處理,滑塊寬度設(shè)置為3 m,部分原始波形和濾波后波形如圖1所示。
圖1 波形處理示意
2.2.2 晃車(chē)儀檢測(cè)數(shù)據(jù)處理
根據(jù)晃車(chē)儀測(cè)量精度,將相距小于20 m 的晃車(chē)數(shù)據(jù)合并為1條數(shù)據(jù),并根據(jù)預(yù)處理后的軌道幾何數(shù)據(jù),為每個(gè)區(qū)段添加1 個(gè)標(biāo)識(shí)位,用來(lái)標(biāo)注該區(qū)段內(nèi)是否存在晃車(chē)點(diǎn)(1表示存在晃車(chē)點(diǎn),0表示不存在)。
2.2.3 數(shù)據(jù)標(biāo)準(zhǔn)化
由于動(dòng)態(tài)檢測(cè)數(shù)據(jù)中,不同屬性具有不同單位和變異程度,會(huì)影響模型預(yù)測(cè)的準(zhǔn)確性,因此需對(duì)計(jì)算后軌道幾何數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。本文使用scikitlearn 自帶的標(biāo)準(zhǔn)化函數(shù),將預(yù)處理動(dòng)態(tài)檢測(cè)數(shù)據(jù)按其屬性(按列進(jìn)行)減去其均值,并除以其方差,將每列屬性的數(shù)值都聚集在0 附近,方差為1,以保障數(shù)據(jù)的分布范圍和變化幅度。
2.3.1 垂向晃車(chē)
根據(jù)對(duì)垂向加速度影響顯著的成因分析與研究成果[9-10],從預(yù)處理后的軌道幾何數(shù)據(jù)中選取了左高低、右高低和三角坑的標(biāo)準(zhǔn)差、幅值和最大變化率,以及平均速度和垂直晃車(chē)因子等11 個(gè)字段作為垂向晃車(chē)特征屬性。其中垂向晃車(chē)因子βV為區(qū)段內(nèi)左高低PL與右高低PR之和的算術(shù)平均值,表示為
式中,xi∈PL,yi∈PR。
利用隨機(jī)森林模型,通過(guò)gini 指數(shù)判斷各特征值的相關(guān)性[11-12],如圖2 所示??芍瓜蚧诬?chē)因子相關(guān)性最高,其次是左高低、右高低和三角坑的標(biāo)準(zhǔn)差及最大變化率的影響較高,均大于0.08;平均速度和各類(lèi)幅值的影響最小。
2.3.2 水平晃車(chē)
圖2 垂向晃車(chē)特征相關(guān)性分析
選取左軌向、右軌向、軌向的標(biāo)準(zhǔn)差、幅值和最大變化率,以及平均行駛速度和水平晃車(chē)因子等11個(gè)字段作為水平晃車(chē)的特征屬性。其中,水平晃車(chē)因子βL為區(qū)段內(nèi)左軌向aL與右軌向aR之和的算術(shù)平均值,表示為
式中,xi∈aL,yi∈aR。
通過(guò)模型計(jì)算后,相關(guān)性分析結(jié)果如圖3 所示。可知,水平晃車(chē)因子相關(guān)性最高,左軌向與右軌向的標(biāo)準(zhǔn)差和最大變化率相關(guān)性較高,均大于0.1;軌距的最大變化率也有較高的相關(guān)性。
圖3 水平晃車(chē)特征相關(guān)性分析
2.4.1 垂向晃車(chē)
以預(yù)處理后該線路上行1—2 月軌道幾何數(shù)據(jù)和垂向晃車(chē)數(shù)據(jù)為訓(xùn)練集,以左高低、右高低、三角坑的標(biāo)準(zhǔn)差、幅值和最大變化率,以及平均行駛速度和垂直晃車(chē)因子等11 個(gè)字段作為特征屬性,通過(guò)GBDT 算法建立預(yù)測(cè)模型,通過(guò)調(diào)整參數(shù)“權(quán)重縮小系數(shù)”優(yōu)化模型準(zhǔn)確率,見(jiàn)表2。
當(dāng)權(quán)重縮小系數(shù)為0.02 時(shí),模型得到最優(yōu)解,共預(yù)測(cè)8 個(gè)晃車(chē)點(diǎn),其中有6 個(gè)點(diǎn)預(yù)測(cè)正確,預(yù)測(cè)準(zhǔn)確率為75%。
表2 垂向晃車(chē)預(yù)測(cè)模型調(diào)整參數(shù)結(jié)果
2.4.2 水平晃車(chē)
水平晃車(chē)預(yù)測(cè)模型調(diào)整參數(shù)結(jié)果見(jiàn)圖4。當(dāng)權(quán)重縮小系數(shù)為0.02 時(shí),模型得到最優(yōu)解,共預(yù)測(cè)8 個(gè)晃車(chē)點(diǎn),其中有4 個(gè)點(diǎn)預(yù)測(cè)正確,預(yù)測(cè)準(zhǔn)確率為50%,所有預(yù)測(cè)點(diǎn)(含錯(cuò)誤點(diǎn))距離最近的真實(shí)晃車(chē)點(diǎn)平均距離為150 m。
圖4 水平晃車(chē)預(yù)測(cè)模型調(diào)整參數(shù)結(jié)果
權(quán)重縮小系數(shù)為0.02 時(shí),利用1—2 月數(shù)據(jù)訓(xùn)練垂向晃車(chē)模型,對(duì)3月動(dòng)態(tài)檢測(cè)數(shù)據(jù)進(jìn)行預(yù)測(cè),共發(fā)現(xiàn)8 處疑似軌道不平順區(qū)段,通過(guò)與實(shí)測(cè)晃車(chē)儀檢查結(jié)果比對(duì),有6 處區(qū)段確認(rèn)發(fā)生過(guò)晃車(chē)情況。其中預(yù)測(cè)晃車(chē)點(diǎn) K133+212 處在 3 月共發(fā)生 2 次晃車(chē),如圖 5 所示。K133+212 處各項(xiàng)軌道幾何參數(shù)均未達(dá)到日常保養(yǎng)I 級(jí)標(biāo)準(zhǔn)管理值,但左高低和右高低通道出現(xiàn)較大波動(dòng),K133+212處左高低波谷為-2.67 mm,K133+219處左高低波峰為4.08mm,峰峰值為6.75 mm,三角坑增大較為明顯,引起晃車(chē)反應(yīng)。
圖5 垂向晃車(chē)預(yù)測(cè)點(diǎn)K133+212處3月動(dòng)態(tài)檢測(cè)波形
預(yù)測(cè)的垂向晃車(chē)點(diǎn)K142+613 處,根據(jù)實(shí)測(cè)晃車(chē)儀驗(yàn)證,該區(qū)段在3月共發(fā)生3次晃車(chē),如圖6所示,在K142+613晃車(chē)區(qū)段內(nèi),雖未出現(xiàn)高低和三角坑大值偏差超限,但包含2處波長(zhǎng)為4~5 m、峰峰值為4~5 mm的突變,產(chǎn)生了變化率較大的軌道幾何不平順,并通過(guò)車(chē)輛動(dòng)態(tài)響應(yīng)反映了出來(lái),造成車(chē)輛垂向晃車(chē)。
圖6 垂向晃車(chē)預(yù)測(cè)點(diǎn)K142+613處3月動(dòng)態(tài)檢測(cè)波形
本文以軌道幾何動(dòng)態(tài)檢測(cè)數(shù)據(jù)和車(chē)載式線路檢查儀(晃車(chē)儀)數(shù)據(jù)為基礎(chǔ),利用隨機(jī)森林模型,分析了各項(xiàng)軌道幾何特征對(duì)垂向和水平晃車(chē)影響程度。主要結(jié)論如下:
1)通過(guò)GBDT算法,建立疑似晃車(chē)預(yù)測(cè)模型,能夠識(shí)別對(duì)車(chē)輛運(yùn)行有顯著影響的軌道不良區(qū)段,識(shí)別準(zhǔn)確率最高達(dá)到75%,完善了僅靠幅值評(píng)價(jià)軌道狀態(tài)的不足。通過(guò)對(duì)一客運(yùn)專(zhuān)線現(xiàn)場(chǎng)實(shí)際驗(yàn)證,模型能夠較好地預(yù)測(cè)出未超幅值管理標(biāo)準(zhǔn)的晃車(chē)處,指導(dǎo)線路養(yǎng)護(hù)維修。
2)在垂向晃車(chē)特征中,構(gòu)建的垂向晃車(chē)因子與晃車(chē)儀垂向晃車(chē)數(shù)據(jù)相關(guān)性最高,其次是高低和三角坑的標(biāo)準(zhǔn)差及最大變化率。
3)在水平晃車(chē)特征中,構(gòu)建的水平晃車(chē)因子與晃車(chē)儀水平晃車(chē)數(shù)據(jù)相關(guān)性最高;其次是軌向的標(biāo)準(zhǔn)差和最大變化率及軌距最大變化率。
下一步將研究更為有效的特征屬性,優(yōu)化預(yù)測(cè)模型,在保證準(zhǔn)確率前提下,提高召回率,更加全面準(zhǔn)確識(shí)別軌道幾何病害區(qū)段。