蔡俊鵬,吳炳福,陳德旺
(1.福州大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建 福州 350116;2.福州大學(xué) 軌道交通研究院,福建 福州 350116)
中國(guó)高速鐵路具有高速度、高密度和大載客量等特點(diǎn),這些指標(biāo)都體現(xiàn)了中國(guó)高速鐵路的綜合水平已經(jīng)達(dá)到了世界前列。中國(guó)高速鐵路運(yùn)營(yíng)最高速度已經(jīng)達(dá)到了350公里每小時(shí),保持著高速鐵路歷史最高運(yùn)營(yíng)速度的記錄。在列車(chē)運(yùn)行中,列車(chē)轉(zhuǎn)向架是高速列車(chē)的重要部件,在長(zhǎng)期的運(yùn)營(yíng)中保存了大量的轉(zhuǎn)向架振動(dòng)信號(hào)數(shù)據(jù),其振動(dòng)信號(hào)很大程度上決定車(chē)輛運(yùn)行的穩(wěn)定性和安全性。經(jīng)實(shí)驗(yàn)表明,對(duì)轉(zhuǎn)向架振動(dòng)信號(hào)提取的特征進(jìn)行監(jiān)測(cè)與分析能夠準(zhǔn)確識(shí)別出列車(chē)故障的狀態(tài),識(shí)別率高達(dá)92%[1]。隨著高速列車(chē)運(yùn)營(yíng)里程的增長(zhǎng),轉(zhuǎn)向架的服役性能與安全狀態(tài)始終處于時(shí)變狀態(tài),這對(duì)轉(zhuǎn)向架的安全與維護(hù)帶來(lái)極大的挑戰(zhàn)。因此準(zhǔn)確地分析轉(zhuǎn)向架的振動(dòng)數(shù)據(jù)信號(hào),能有效指導(dǎo)高速列車(chē)的安全提速,優(yōu)化轉(zhuǎn)向架的鏇修周期,有利于緩解中國(guó)高速鐵路運(yùn)營(yíng)和交通運(yùn)輸?shù)膲毫?,提高中?guó)高速鐵路的運(yùn)營(yíng)競(jìng)爭(zhēng)力,是一個(gè)重大而有意義的課題[2-3],對(duì)高速列車(chē)運(yùn)行的經(jīng)濟(jì)性和安全性都具有重要意義。
在轉(zhuǎn)向架部件研究方面,國(guó)內(nèi)外科研工作人員在監(jiān)控技術(shù)的基礎(chǔ)上,使用增強(qiáng)實(shí)驗(yàn)仿真的方式,以不同的方法對(duì)轉(zhuǎn)向架的故障檢測(cè)診斷問(wèn)題進(jìn)行了深入研究,并取得了許多成果。例如,金煒東等[4]對(duì)轉(zhuǎn)向架故障數(shù)據(jù)進(jìn)行分類(lèi)訓(xùn)練,訓(xùn)練模型的準(zhǔn)確率達(dá)到了90%以上。秦娜等[5-6]采用集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD對(duì)列車(chē)振動(dòng)信號(hào)進(jìn)行分析,進(jìn)一步提高了支持向量機(jī)的轉(zhuǎn)向架故障特征的識(shí)別率。侯亞?wèn)|等[7-8]采用小波變換處理轉(zhuǎn)向架齒輪故障監(jiān)測(cè)信號(hào)。Hinton等[9-10]基于人腦學(xué)習(xí)思想提出深度學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,Dahl等[11]驗(yàn)證了基于深度學(xué)習(xí)方法訓(xùn)練轉(zhuǎn)向架故障功率譜數(shù)據(jù)的可行性。龐榮等[12]利用深度學(xué)習(xí)的方法對(duì)轉(zhuǎn)向架的故障特征提取,對(duì)其中關(guān)鍵部件的識(shí)別正確率有了很大的提升??偟膩?lái)說(shuō),目前國(guó)內(nèi)外對(duì)轉(zhuǎn)向架的研究方案都有其理論和實(shí)際意義,但是也存在一定的缺陷?;诠收显\斷的方法,基于研究現(xiàn)代信號(hào)處理方法(EEMD、Hilbert變換等)和數(shù)據(jù)挖掘分類(lèi)算法(支持向量機(jī)、K最近鄰、隱馬爾可夫模型等)[13-15]的研究方法,能有效對(duì)轉(zhuǎn)向架故障進(jìn)行診斷,提高維修效率。但是這些方法都采用增強(qiáng)實(shí)驗(yàn)的方法來(lái)研究,存在實(shí)驗(yàn)成本高、難驗(yàn)證的問(wèn)題。而且增強(qiáng)實(shí)驗(yàn)與實(shí)際相比存在性能偏離,實(shí)際中的轉(zhuǎn)向架結(jié)構(gòu)參數(shù)是緩慢變化的。因此,文中以動(dòng)車(chē)長(zhǎng)期運(yùn)行過(guò)程當(dāng)中保存下來(lái)的轉(zhuǎn)向架振動(dòng)信號(hào)為基礎(chǔ),對(duì)其分析研究,該方法不存在發(fā)生性能偏離和數(shù)據(jù)量不足等缺點(diǎn),實(shí)驗(yàn)結(jié)果更加契合實(shí)際運(yùn)行情況,且實(shí)驗(yàn)成本低,能真實(shí)反映轉(zhuǎn)向架的服役性能變化規(guī)律,具有較好的指導(dǎo)意義。
文中分析對(duì)比了國(guó)內(nèi)外關(guān)于轉(zhuǎn)向架的研究現(xiàn)況,以實(shí)際動(dòng)車(chē)運(yùn)營(yíng)數(shù)據(jù)作為主要研究對(duì)象,對(duì)復(fù)雜的轉(zhuǎn)向架振動(dòng)信號(hào)數(shù)據(jù)進(jìn)行小波變換去噪處理。在此基礎(chǔ)上,研究轉(zhuǎn)向架部件的振動(dòng)速度、振動(dòng)加速度和歷史運(yùn)營(yíng)里程與振動(dòng)值的服役性能規(guī)律,通過(guò)對(duì)多元線性回歸、反向傳播神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)、回歸決策樹(shù)和隨機(jī)森林算法實(shí)驗(yàn)進(jìn)行對(duì)比分析,最終得出隨機(jī)森林算法在動(dòng)車(chē)轉(zhuǎn)向架振動(dòng)數(shù)據(jù)的信號(hào)監(jiān)測(cè)中精度最優(yōu)。驗(yàn)證了基于隨機(jī)森林算法的高速列車(chē)轉(zhuǎn)向架振動(dòng)信號(hào)的研究在轉(zhuǎn)向架服役性能和安全運(yùn)行方面起到有效實(shí)時(shí)監(jiān)測(cè)的效果,具有一定的研究?jī)r(jià)值。
文中的轉(zhuǎn)向架數(shù)據(jù)集是通過(guò)專(zhuān)業(yè)的軌道交通車(chē)輛安全監(jiān)測(cè)系統(tǒng)對(duì)運(yùn)營(yíng)動(dòng)車(chē)的長(zhǎng)期跟蹤,實(shí)驗(yàn)采集得到的。數(shù)據(jù)集包括5個(gè)轉(zhuǎn)向架關(guān)鍵部件:枕梁、軸箱、構(gòu)架、彈簧筒和冷卻風(fēng)機(jī)。這些數(shù)據(jù)集包含了部件的橫向振動(dòng)有效值、橫向振動(dòng)最大值、垂向振動(dòng)有效值、垂向橫向振動(dòng)最大值和高速列車(chē)運(yùn)營(yíng)速度、運(yùn)營(yíng)加速度、歷史運(yùn)營(yíng)里程等信息。經(jīng)過(guò)實(shí)驗(yàn)得知,轉(zhuǎn)向架其余部件的實(shí)驗(yàn)結(jié)果對(duì)比分析過(guò)程與枕梁相類(lèi)似,并且實(shí)驗(yàn)結(jié)果所采用的模型與枕梁是一致的,為了避免篇幅冗余,文中以枕梁數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn)分析。
動(dòng)車(chē)轉(zhuǎn)向架枕梁垂向振動(dòng)中的訓(xùn)練集共有18 370個(gè)訓(xùn)練樣本,囊括了6種不同的歷史運(yùn)營(yíng)里程的樣本,其中11.7萬(wàn)公里的樣本3 433個(gè),15萬(wàn)公里的的樣本2 889個(gè),20萬(wàn)公里的樣本2 947個(gè),25萬(wàn)公里的樣本2 908個(gè),30萬(wàn)公里的樣本3 092個(gè),35萬(wàn)公里的樣本3 101個(gè),每種運(yùn)營(yíng)里程下的數(shù)據(jù)記錄著轉(zhuǎn)向架枕梁運(yùn)營(yíng)過(guò)程中的振動(dòng)有效值和振動(dòng)最大值隨運(yùn)營(yíng)速度、運(yùn)營(yíng)加速度的變化關(guān)系。
圖1是11.7萬(wàn)公里運(yùn)營(yíng)里程下動(dòng)車(chē)轉(zhuǎn)向架枕梁垂向振動(dòng)有效值和振動(dòng)最大值的數(shù)據(jù)。
圖2是在不同歷史運(yùn)營(yíng)里程下列車(chē)從啟動(dòng)到加速到最大速度的轉(zhuǎn)向架枕梁垂向振動(dòng)最大值和振動(dòng)有效值的平均值數(shù)據(jù)。
無(wú)論從單個(gè)歷史運(yùn)營(yíng)里程還是從多個(gè)歷史運(yùn)營(yíng)里程分析,該動(dòng)車(chē)轉(zhuǎn)向架振動(dòng)信號(hào)隨著運(yùn)營(yíng)里程和時(shí)間的增長(zhǎng),其振動(dòng)值上升均具有一定的規(guī)律。由于轉(zhuǎn)向架的振動(dòng)的信號(hào)十分復(fù)雜,其信號(hào)頻譜寬大,存在近似于白噪聲的干擾噪聲頻譜幾乎覆蓋了整個(gè)振動(dòng)信號(hào)閾值,很難確定信號(hào)的濾波頻率,且轉(zhuǎn)向架振動(dòng)信號(hào)中夾雜著大量的隨機(jī)噪聲,無(wú)法嚴(yán)格按周期對(duì)數(shù)據(jù)進(jìn)行采樣。轉(zhuǎn)向架振動(dòng)激勵(lì)源多,轉(zhuǎn)向架的某個(gè)部件的振動(dòng)信號(hào)數(shù)據(jù)往往會(huì)與大量的隨機(jī)噪聲數(shù)據(jù)相互影響,導(dǎo)致各種振動(dòng)數(shù)據(jù)的信噪比特別低[16]。為了提升原始信號(hào)信噪比及樣本數(shù)據(jù)曲線光滑度,需要對(duì)數(shù)據(jù)進(jìn)行去噪處理。
圖1 11.7萬(wàn)公里運(yùn)營(yíng)里程振動(dòng)散點(diǎn)圖
圖2 不同運(yùn)營(yíng)里程的振動(dòng)平均值
數(shù)據(jù)的去噪濾波是信號(hào)數(shù)據(jù)處理領(lǐng)域中一個(gè)重要的組成部分[17]。數(shù)據(jù)去噪的方法有很多種,但是有些去噪方法會(huì)過(guò)度的平滑,造成譜線中的峰值失真,從而丟失信號(hào)的重要信息成分。為了得到更高的信噪比,通過(guò)仿真實(shí)驗(yàn),對(duì)幾種常用的濾波去噪方法(包括巴特沃斯低通濾波器去噪、FIR低通濾波器去噪、移動(dòng)平均濾波去噪、小波去噪等)進(jìn)行濾波前后的波形圖片分析對(duì)比。從小波去噪的結(jié)果來(lái)看,由于小波去噪能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,得到波形不是很平滑,但是去噪效果明顯,且上升沿和下降沿保持的非常高,對(duì)于轉(zhuǎn)向架數(shù)據(jù)信號(hào)的演變規(guī)律的信息得到了較好的保存,相比之下,它很好地解決了巴特沃斯低通濾波器和FIR低通濾波器無(wú)法刻畫(huà)信號(hào)的非平穩(wěn)特性,信噪比低的缺點(diǎn)。因此,最終選定小波變換對(duì)數(shù)據(jù)信號(hào)進(jìn)行去噪。
小波變換(wavelet transform,WT)是近年來(lái)十分熱門(mén)的去噪分析方法,它是短時(shí)傅里葉變換局部化思想的繼承和發(fā)展,對(duì)含有等效噪聲或人為噪聲有很好的分割效果[18],并且克服了窗口大小不隨頻率變化和缺乏離散正交性等缺點(diǎn),是進(jìn)行信號(hào)時(shí)頻分析和數(shù)據(jù)處理的理想方法[19]。它的主要優(yōu)點(diǎn)是通過(guò)對(duì)時(shí)間頻率的局部化分析,伸縮平移運(yùn)算對(duì)信號(hào)逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分,低頻處頻率細(xì)分,從而充分突出問(wèn)題某些方面的特征,自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求。
文中對(duì)11.7萬(wàn)公里運(yùn)營(yíng)里程下列車(chē)從啟動(dòng)到加速到最大速度的轉(zhuǎn)向架枕梁垂向振動(dòng)有效值和振動(dòng)最大值的數(shù)據(jù)進(jìn)行小波去噪處理,所選數(shù)據(jù)的小波去噪濾波器分解層數(shù)為兩層,選擇閾值方法為rigorsure方式,選擇軟閾值去噪,噪聲結(jié)構(gòu)為unscaled white noise,可以給出小波去噪濾波器的運(yùn)行結(jié)果,如圖3所示。
結(jié)果表明,去噪效果明顯,能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,且上升沿和下降沿保持的非常高,沒(méi)有過(guò)度平滑而造成振動(dòng)信號(hào)線譜峰值失真,對(duì)于轉(zhuǎn)向架數(shù)據(jù)信號(hào)振動(dòng)規(guī)律的信息得到了較好的保存,可以得到較高的振動(dòng)信號(hào)的信噪比。
圖3 小波變換去噪結(jié)果
在轉(zhuǎn)向架系統(tǒng)中,其參數(shù)包括速度、加速度和歷史運(yùn)營(yíng)里程,其中速度的取值范圍是[0,350],加速度的取值范圍是[10,10],而歷史運(yùn)營(yíng)里程的取值范圍為[117 000,350 000],為避免因其輸入?yún)?shù)數(shù)值量綱差異過(guò)大,導(dǎo)致每個(gè)輸入?yún)?shù)對(duì)輸出影響的權(quán)重不同,在數(shù)據(jù)去噪的基礎(chǔ)上,還需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將輸入?yún)?shù)的值域歸一化為[0,1],使各個(gè)參數(shù)具有同等的權(quán)重。
在評(píng)價(jià)指標(biāo)上,使用均方差、標(biāo)準(zhǔn)差和算法穩(wěn)定性來(lái)評(píng)價(jià)轉(zhuǎn)向架部件的服役性能模型。穩(wěn)定性則是將同一個(gè)機(jī)器學(xué)習(xí)算法模型訓(xùn)練M次,得到M個(gè)模型,則假設(shè)每一次得到的測(cè)試集均方差為R1,R2,…,RM,那么穩(wěn)定性S為:
對(duì)所有訓(xùn)練樣本進(jìn)行提取特征、數(shù)據(jù)去噪、數(shù)據(jù)歸一化和數(shù)據(jù)劃分后,針對(duì)動(dòng)車(chē)轉(zhuǎn)向架枕梁垂向振動(dòng)數(shù)據(jù)集,文中使用多元線性回歸、反向傳播神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)、回歸決策樹(shù)和隨機(jī)森林算法建立轉(zhuǎn)向架振動(dòng)信號(hào)監(jiān)測(cè)模型。一共選用了12 859組枕梁振動(dòng)數(shù)據(jù)作為訓(xùn)練集,另一組作為驗(yàn)證集,共5 511組數(shù)據(jù),訓(xùn)練集和測(cè)試集的比例根據(jù)經(jīng)驗(yàn)取為7∶3。分別比較各個(gè)模型的訓(xùn)練集、測(cè)試集的擬合誤差來(lái)驗(yàn)證模型的正確性和穩(wěn)定性,避免求得的模型存在過(guò)擬合的問(wèn)題。
另外通過(guò)比較各個(gè)模型測(cè)試集誤差模型的穩(wěn)定性,驗(yàn)證模型是否存在不穩(wěn)定的問(wèn)題。
利用5 511組枕梁垂向振動(dòng)數(shù)據(jù)來(lái)驗(yàn)證五個(gè)模型的有效性。驗(yàn)證集在五個(gè)模型上的擬合均方差、標(biāo)準(zhǔn)差和穩(wěn)定性指標(biāo)對(duì)比如表1所示。
表1 測(cè)試集驗(yàn)證結(jié)果
從表1中的測(cè)試集誤差可以直觀看出,相對(duì)于其他所建立模型的精度,隨機(jī)森林回歸模型比兩個(gè)神經(jīng)網(wǎng)絡(luò)提高了1.4%,比梯度提升樹(shù)模型提高了16.9%,比多元線性回歸模型18.8%。而在模型的穩(wěn)定性上,隨機(jī)森林也是優(yōu)于除多元線性回歸之外的其他三個(gè)模型,多元線性回歸由于每次訓(xùn)練的結(jié)果都是一樣的,所以其穩(wěn)定性是最好的,但是其精度確是最差的。
通過(guò)對(duì)訓(xùn)練集和測(cè)試集的實(shí)驗(yàn)對(duì)比,選取了隨機(jī)森林模型來(lái)預(yù)測(cè)動(dòng)車(chē)轉(zhuǎn)向架枕梁的垂向振動(dòng)數(shù)據(jù)。在11.7萬(wàn)公里的固定里程下,列車(chē)的運(yùn)行速度和運(yùn)行加速度變化以及所得模型的振動(dòng)最大值的結(jié)果如圖4所示。
圖4 11.7萬(wàn)公里下的運(yùn)行速度及枕梁振動(dòng)最大值預(yù)測(cè)結(jié)果
從列車(chē)枕梁的振動(dòng)數(shù)據(jù)監(jiān)測(cè)結(jié)果看出:當(dāng)列車(chē)處于牽引階段時(shí),列車(chē)的振動(dòng)最大值是隨著運(yùn)營(yíng)速度的增加而增加的。當(dāng)列車(chē)處于惰行階段時(shí),列車(chē)會(huì)有減速和加速狀態(tài),因此振動(dòng)值是處于震蕩變化的;當(dāng)列車(chē)處于減速階段,隨著運(yùn)營(yíng)速度的降低,振動(dòng)值也隨之減小??偟膩?lái)說(shuō),模型的預(yù)測(cè)監(jiān)測(cè)結(jié)果與高速列車(chē)實(shí)際運(yùn)行情況是十分吻合的。
圖5是根據(jù)所得模型,預(yù)測(cè)高速列車(chē)在11.7萬(wàn)公里、15萬(wàn)公里、20萬(wàn)公里、25萬(wàn)公里、30萬(wàn)公里、35萬(wàn)公里、40萬(wàn)公里的運(yùn)營(yíng)里程下,列車(chē)枕梁的振動(dòng)最大值隨列車(chē)運(yùn)行狀態(tài)的變換關(guān)系。
圖5 各里程枕梁振動(dòng)最大值預(yù)測(cè)結(jié)果
從最終選取的模型來(lái)看,隨機(jī)森林模型具備一定的魯棒性能力,對(duì)數(shù)據(jù)的監(jiān)測(cè)符合其實(shí)際的服役性能,能實(shí)時(shí)預(yù)測(cè)出在特定里程下,動(dòng)車(chē)轉(zhuǎn)向架枕梁垂向振動(dòng)值隨運(yùn)行速度和加速度的變化規(guī)律。在特定里程下,當(dāng)列車(chē)速度或者加速度超出限速范圍,應(yīng)用該模型可以監(jiān)測(cè)到振動(dòng)值超出安全閾值。其次,該模型還能監(jiān)測(cè)轉(zhuǎn)向架的振動(dòng)趨勢(shì)是否異常。當(dāng)列車(chē)轉(zhuǎn)向架服役里程達(dá)到使用年限時(shí),列車(chē)轉(zhuǎn)向架的振動(dòng)值也會(huì)超出安全閾值,該模型能制定更加合理的鏇修周期,減少列車(chē)運(yùn)營(yíng)成本。基于機(jī)器學(xué)習(xí)高速列車(chē)轉(zhuǎn)向架振動(dòng)信號(hào)的研究對(duì)轉(zhuǎn)向架的服役性能分析和安全運(yùn)行具有重要的指導(dǎo)意義。
實(shí)驗(yàn)結(jié)果表明,針對(duì)動(dòng)車(chē)轉(zhuǎn)向架枕梁垂向振動(dòng)數(shù)據(jù)集的監(jiān)測(cè)模型,隨機(jī)森林回歸模型在回歸性能上是最佳的。隨機(jī)森林算法相比于BP神經(jīng)網(wǎng)絡(luò)算法、RBF神經(jīng)網(wǎng)絡(luò)算法、多元線性回歸算法,能更好地保證在轉(zhuǎn)向架部件上復(fù)雜的振動(dòng)信號(hào)的數(shù)據(jù)表現(xiàn)出良好的線性擬合性、數(shù)據(jù)集適應(yīng)性以及抗噪性[20-21]。在實(shí)現(xiàn)方面,隨機(jī)森林比其他算法具有更良好的實(shí)現(xiàn)性。在處理復(fù)雜且多維的實(shí)際問(wèn)題中,隨機(jī)森林采用特征空間劃分學(xué)習(xí)方式,適應(yīng)高維數(shù)據(jù)的處理[22-23],面對(duì)振動(dòng)信號(hào)與動(dòng)車(chē)運(yùn)營(yíng)速度、加速度的分析方面具有更好的優(yōu)化能力。隨機(jī)森林中各個(gè)決策樹(shù)相互獨(dú)立,進(jìn)行學(xué)習(xí)和預(yù)測(cè)的效率更高。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,在小波變換數(shù)據(jù)去噪的基礎(chǔ)上,基于隨機(jī)森林算法的實(shí)驗(yàn)?zāi)P湍苡行У胤从掣哞F轉(zhuǎn)向架部件服役性能演變規(guī)律和安全運(yùn)行,具有較高的工程應(yīng)用價(jià)值。
列車(chē)轉(zhuǎn)向架振動(dòng)信號(hào)是一個(gè)振動(dòng)源復(fù)雜,噪音強(qiáng),數(shù)量龐大的數(shù)據(jù)集,僅靠去噪處理,雖然噪聲減少,數(shù)據(jù)顯示效果較好,但是依然具有誤差。因此,文中應(yīng)用具有抗噪性的隨機(jī)森林算法對(duì)數(shù)據(jù)進(jìn)行擬合。經(jīng)過(guò)實(shí)驗(yàn)表明,基于隨機(jī)森林的高速列車(chē)轉(zhuǎn)向架振動(dòng)信號(hào)監(jiān)測(cè)模型在高速列車(chē)安全提速和有效指導(dǎo)合理的維修保養(yǎng)應(yīng)用中,具有一定的工程價(jià)值。為提高監(jiān)測(cè)模型的精準(zhǔn)性和有效性,在高速列車(chē)轉(zhuǎn)向架振動(dòng)的安全閾值設(shè)置方面需要做進(jìn)一步的研究。