杜文然,陸 航,楊濤存,徐貴紅
(1 中國(guó)鐵道科學(xué)研究院 研究生部,北京100081;2 中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 機(jī)車(chē)車(chē)輛研究所,北京100081;3 中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京100081)
隨著我國(guó)高速鐵路的迅速發(fā)展,動(dòng)車(chē)組保有量逐年增多。動(dòng)車(chē)組安全運(yùn)營(yíng)是保障鐵路安全運(yùn)營(yíng)的必要條件之一。對(duì)動(dòng)車(chē)組一定周期內(nèi)的百萬(wàn)公里故障率進(jìn)行預(yù)測(cè),對(duì)于宏觀掌握動(dòng)車(chē)組運(yùn)行狀態(tài),分析動(dòng)車(chē)組運(yùn)行安全規(guī)律,了解動(dòng)車(chē)組安全裕度具有重要意義。
我國(guó)動(dòng)車(chē)組具有大范圍跨線開(kāi)行、運(yùn)行環(huán)境復(fù)雜多變等特點(diǎn)。動(dòng)車(chē)組故障的形成是多種復(fù)雜因素共同作用的結(jié)果,除了設(shè)備自身的狀態(tài)惡化外,還受人為因素、自然因素等多種復(fù)雜因素的影響,這些因素有多種多樣的表征形式,并且很可能耦合交叉共同作用。在影響動(dòng)車(chē)組百萬(wàn)公里故障率的各種因素中,諸多因素的不確定性較強(qiáng),難以量化分析?;疑到y(tǒng)理論是處理不確定性半復(fù)雜問(wèn)題的有效方法,在一些影響因素難以定量分析的領(lǐng)域得到了廣泛應(yīng)用[1]?;疑到y(tǒng)理論已成功地應(yīng)用于醫(yī)學(xué)、圖像處理、機(jī)器人、工業(yè)技術(shù)等方面并取得實(shí)效[2]。在水上交通運(yùn)輸領(lǐng)域,灰色系統(tǒng)理論被用來(lái)預(yù)測(cè)船舶交通事故,揭示船舶交通事故與其相關(guān)影響因素之間的規(guī)律性,對(duì)船舶交通事故短期預(yù)測(cè)有較好的效果[3]。在軌道交通領(lǐng)域,采用灰色系統(tǒng)理論預(yù)測(cè)鐵路客、貨運(yùn)量未來(lái)發(fā)展趨勢(shì)[4-6],應(yīng)用灰色GM(1,1)非等時(shí)距修正模型模擬軌道質(zhì)量指數(shù)的趨勢(shì)成分與波動(dòng)成分[7]。對(duì)于動(dòng)車(chē)組運(yùn)行故障趨勢(shì)的預(yù)測(cè)目前未見(jiàn)相關(guān)文獻(xiàn)。文中利用灰色理論,以某分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障數(shù)據(jù)為原始時(shí)間序列,深入挖掘動(dòng)車(chē)組故障數(shù)據(jù)的特點(diǎn),研究建立了用于動(dòng)車(chē)組百萬(wàn)公里故障率預(yù)測(cè)的灰色GM(1,1)殘差修正模型。
隨著中國(guó)鐵路運(yùn)營(yíng)里程的增加,投入運(yùn)行的動(dòng)車(chē)組也不斷增多。為了更加清晰地分析相同的速度級(jí)或者相同修程條件下動(dòng)車(chē)組的安全規(guī)律,考慮我國(guó)動(dòng)車(chē)組既有的修程設(shè)置(主要是相同檢修周期的不同走行公里的規(guī)定)和速度等級(jí)(主要考慮200~250 km/h、300~350 km/h 這2 個(gè)速度級(jí)),將不同車(chē)型動(dòng)車(chē)組劃分為4 個(gè)分析類(lèi)別,具體劃分方法見(jiàn)表1。
文中以某分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率數(shù)據(jù)為例,研究建立灰色GM(1,1)殘差修正模型。該分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率數(shù)據(jù)變化趨勢(shì)如圖1 所示。
圖1 呈現(xiàn)出該分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率數(shù)據(jù)具有如下特點(diǎn):
(1)非線性;
(2)數(shù)據(jù)波動(dòng)變化具有動(dòng)態(tài)隨機(jī)性。
灰色預(yù)測(cè)模型是預(yù)測(cè)理論中的一種重要方法,是一種研究少數(shù)據(jù)、貧信息不確定性問(wèn)題的方法[8]。它的突出優(yōu)點(diǎn)是可以有效地處理系統(tǒng)內(nèi)部信息的不確定性因果關(guān)系,通過(guò)對(duì)時(shí)間序列的累加,弱化其隨機(jī)性[9]。文中采用灰色系統(tǒng)理論,建立灰色GM(1,1)殘差修正模型,對(duì)動(dòng)車(chē)組百萬(wàn)公里故障率進(jìn)行研究。
表1 動(dòng)車(chē)組自定義分析類(lèi)別劃分說(shuō)明
圖1 某分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率變化趨勢(shì)圖
由文獻(xiàn)[7]可知,灰色GM(1,1)模型可分為等時(shí)距模型和非等時(shí)距模型。文中建立的模型為等時(shí)距模型,時(shí)間間隔為1 個(gè)月。
(1)設(shè)某分析類(lèi)別動(dòng)車(chē)組的百萬(wàn)公里故障率數(shù)據(jù)序列為X(0)={ x(0)(1),x(0)(2),…,x(0)(n)},對(duì)原始序列構(gòu)造一次累加生成(1-AGO)序列,得:X(1)={ x(1)(1),x(1)(2),…,x(1)(n)},令 x(1)(1)=x(0)(1);式中:
(2)由生成序列X(1)建立白化形式的微分方程為式(2)。
式中:a 為發(fā)展系數(shù),用以控制灰色系統(tǒng)發(fā)展態(tài)勢(shì)的大?。籾 用以反映數(shù)據(jù)變化的不確切關(guān)系,又稱(chēng)為灰色作用量[7]。
對(duì)式(2)在區(qū)間[k-1,k]上積分,得到式(3):
GM(1,1)模型的擬合精度與參數(shù)a^ =[a,u]T有關(guān),而a^ =[a,u]T的取值又依賴(lài)于原始序列和背景 值 Z(1)=(z(1)(2),z(1)(3),…,z(1)(n)) 的 構(gòu) 造 形式[7],為了提高模型精度,減小誤差,文獻(xiàn)[7,10]提出了一種基于積分重構(gòu)GM(1,1)模型背景值的方法,按照該方法,對(duì)Z(1)進(jìn)行優(yōu)化的計(jì)算方法為式(9):
式中:k=2,…,n。文獻(xiàn)[7,10]證明按照式(9)構(gòu)造的背景值更接近實(shí)際。
為進(jìn)一步提高模型的擬合度,對(duì)殘差序列進(jìn)行修正,修正方法如下:
設(shè)殘差數(shù)列為式(10):
設(shè) 樣 本 集D={(x1,q1),(x2,q2),…,(xn,qn)},回歸問(wèn)題就是找到一個(gè)函數(shù)f(x),使得f(xi)與真實(shí)值qi的誤差能夠盡可能小。以支持向量機(jī)SVM(Support Vector Machine)為理論基礎(chǔ)建立的回歸模型,在準(zhǔn)確度、收斂速度和風(fēng)險(xiǎn)控制等方面都有很好的性能[11]。因此用支持向量回歸機(jī)SVR(Support Vector Regression)對(duì)殘差數(shù)列Q進(jìn)行回歸擬合。
對(duì) 于 訓(xùn) 練 集D={(x1,q1),(x2,q2),…,(xn,qn)}為非線性的情況,支持向量回歸機(jī)的基本思想是通過(guò)一個(gè)非線性函數(shù)Φ,將數(shù)據(jù)x映射到高維特征空間F,并在這個(gè)特征空間進(jìn)行回歸[12]。
為了提高預(yù)測(cè)精度,在用支持向量回歸機(jī)對(duì)殘差進(jìn)行回歸擬合時(shí),把t-k,t-(k-1),…,t-1 時(shí)刻的殘差作為輸入,t時(shí)刻的殘差作為相應(yīng)的輸出。經(jīng)參數(shù)調(diào)整,把t-3,t-2,t-1 時(shí)刻的殘差作為輸入,t時(shí)刻的殘差作為輸出時(shí),擬合的精度較高。核函數(shù)選擇高斯核函數(shù)時(shí),對(duì)殘差的擬合精度較高。
對(duì) 殘 差 數(shù) 列Q={q(1),q(2),…,q(n)} 用 支 持向量回歸機(jī)進(jìn)行回歸擬合,得到殘差的擬合數(shù)據(jù)序列,見(jiàn)式(11):
根據(jù)式(8)、式(10)和式(11),得到最終優(yōu)化的灰色GM(1,1)修正模型為式(12):
采用某分析類(lèi)別動(dòng)車(chē)組在相對(duì)時(shí)間0~44 個(gè)月的百萬(wàn)公里故障率數(shù)據(jù)。用文中給出的優(yōu)化背景值后的灰色GM(1,1)模型對(duì)該分析類(lèi)別動(dòng)車(chē)組在該時(shí)間段內(nèi)的百萬(wàn)公里故障率數(shù)據(jù)進(jìn)行擬合,原始百萬(wàn)公里故障率數(shù)據(jù)及其擬合結(jié)果對(duì)比如圖2所示。
圖2 表明該分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率總體上呈現(xiàn)出下降的趨勢(shì)。由真實(shí)值減去優(yōu)化背景值后的灰色GM(1,1)模型擬合值得到的殘差如圖3 所示。
圖3 顯示出該分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率數(shù)據(jù)的殘差呈現(xiàn)非線性的正負(fù)交替的情況,這說(shuō)明原始百萬(wàn)公里故障率數(shù)據(jù)中含有一定的隨機(jī)成分。動(dòng)車(chē)組故障形成是多種因素共同作用的結(jié)果,且動(dòng)車(chē)組行車(chē)環(huán)境復(fù)雜,得到的殘差具有隨機(jī)波動(dòng)性,符合實(shí)際意義。圖3 呈現(xiàn)的殘差變化波動(dòng)趨勢(shì)與圖1 原始百萬(wàn)公里故障率數(shù)據(jù)的變化波動(dòng)趨勢(shì)相似,進(jìn)一步說(shuō)明優(yōu)化背景值后的灰色GM(1,1)模型能夠較好的呈現(xiàn)該分析類(lèi)別的動(dòng)車(chē)組在該時(shí)間段內(nèi)的百萬(wàn)公里故障率的趨勢(shì)成分。為了提高模型的擬合精度,用支持向量回歸機(jī)對(duì)殘差 進(jìn) 行 修 正,將t-3,t-2,t-1 時(shí) 刻 的 殘 差 作 為輸入,t時(shí)刻的殘差作為輸出,核函數(shù)選用高斯核函數(shù)。經(jīng)過(guò)超參數(shù)調(diào)整后,原始百萬(wàn)公里故障率數(shù)據(jù)與經(jīng)過(guò)殘差修正后的百萬(wàn)公里故障率擬合數(shù)據(jù)的對(duì)比如圖4 所示。
圖2 百萬(wàn)公里故障率及其擬合結(jié)果對(duì)比
圖3 殘差變化趨勢(shì)圖
用平均相對(duì)誤差作為檢驗(yàn)指標(biāo)時(shí),圖4 中的灰色GM(1,1)殘差修正模型得到的百萬(wàn)公里故障率擬合值與真實(shí)值的平均相對(duì)誤差為0.076;用統(tǒng)計(jì)學(xué)中的后驗(yàn)差C和小概率P檢驗(yàn)法[7,9]進(jìn)行模型精度檢驗(yàn),得到后驗(yàn)差比值C=0.150,小誤差頻率P=1.00;由文獻(xiàn)[9,15]可知,一般根據(jù)C、P的值將預(yù)測(cè)精度分為4 級(jí),見(jiàn)表2。
對(duì)照上表可以看出文中給出的灰色GM(1,1)殘差修正預(yù)測(cè)模型的精度屬于好的范疇,可以用于外推預(yù)測(cè)。
用圖4 得到的灰色GM(1,1)殘差修正模型對(duì)相對(duì)時(shí)間45 個(gè)月的百萬(wàn)公里故障率數(shù)據(jù)進(jìn)行預(yù)測(cè),得到預(yù)測(cè)值為0.85,相對(duì)時(shí)間45 個(gè)月的百萬(wàn)公里故障率數(shù)據(jù)的真實(shí)值為0.81,相對(duì)誤差為4.94%。
將相對(duì)時(shí)間45 個(gè)月的百萬(wàn)公里故障率數(shù)據(jù)加入模型,刪除原始百萬(wàn)公里故障率數(shù)據(jù)中的第一個(gè)數(shù)據(jù),進(jìn)行模型更新,得到新的等維灰色GM(1,1)殘差修正模型,用此模型對(duì)相對(duì)時(shí)間46 個(gè)月的百萬(wàn)公里故障率進(jìn)行預(yù)測(cè)。依次類(lèi)推,得到相對(duì)時(shí)間47~49 個(gè)月的故障率預(yù)測(cè)模型。相對(duì)時(shí)間46~49 個(gè)月的原始百萬(wàn)公里故障率數(shù)據(jù)與模型擬合值的對(duì)比如圖5 所示。
圖4 原始百萬(wàn)公里故障率與殘差修正后的擬合結(jié)果對(duì)比
表2 精度檢驗(yàn)等級(jí)參照表
圖5 相對(duì)時(shí)間46~49 個(gè)月的原始百萬(wàn)公里故障率與殘差修正后的擬合結(jié)果對(duì)比
相對(duì)時(shí)間46~49 個(gè)月的故障率預(yù)測(cè)模型的各項(xiàng)評(píng)價(jià)指標(biāo)見(jiàn)表3。
由表3 可知,殘差修正后的等維灰色GM(1,1)模型能較好地?cái)M合百萬(wàn)公里故障率數(shù)據(jù)的變化趨勢(shì)以及波動(dòng)大小。
用等維灰色GM(1,1)殘差修正模型對(duì)相對(duì)時(shí)間45~49 個(gè)月的百萬(wàn)公里故障率的預(yù)測(cè)值與真實(shí)值的對(duì)比見(jiàn)表4。
表3 各預(yù)測(cè)模型指標(biāo)值
表4 模型預(yù)測(cè)值與真實(shí)值的比較
(1)根據(jù)灰色系統(tǒng)理論的時(shí)間序列處理原則,在等時(shí)距灰色GM(1,1)模型的基礎(chǔ)上,通過(guò)優(yōu)化背景值的方法,建立了預(yù)測(cè)動(dòng)車(chē)組百萬(wàn)公里故障率變化趨勢(shì)的模型,利用支持向量回歸機(jī)對(duì)優(yōu)化背景值后的灰色GM(1,1)模型的殘差進(jìn)行修正,擬合了某分析類(lèi)別動(dòng)車(chē)組百萬(wàn)公里故障率數(shù)據(jù)的波動(dòng)大小,并通過(guò)等維信息灰色GM(1,1)模型來(lái)對(duì)建模數(shù)據(jù)進(jìn)行更新。計(jì)算實(shí)例表明,等維灰色GM(1,1)殘差修正模型能夠較好的擬合動(dòng)車(chē)組百萬(wàn)公里故障率的變化趨勢(shì)與波動(dòng)程度,且有較好的預(yù)測(cè)精度。
(2)由于用來(lái)建模的原始百萬(wàn)公里故障數(shù)據(jù)波動(dòng)較大,給長(zhǎng)期預(yù)測(cè)帶來(lái)了挑戰(zhàn)。計(jì)算實(shí)例表明,該模型能夠較好地?cái)M合歷史數(shù)據(jù),卻無(wú)法預(yù)測(cè)出現(xiàn)較大波動(dòng)的數(shù)據(jù),如何進(jìn)一步處理原始數(shù)據(jù),減小原始數(shù)據(jù)波動(dòng)性對(duì)模型性能的影響以及挖掘更多影響百萬(wàn)公里故障率的因素是下一步研究的內(nèi)容。