張鵬飛,岳建海,裴 迪,焦 靜
(北京交通大學(xué)機(jī)械與電子控制工程學(xué)院,北京 100044)
隨著我國鐵路貨車運(yùn)載量和速度的不斷提高,制動(dòng)系統(tǒng)作為保證貨車安全運(yùn)行的核心部件,保障其正常運(yùn)行至關(guān)重要。但現(xiàn)有的鐵路車輛運(yùn)行安全監(jiān)控系統(tǒng)(5T)中的貨車運(yùn)行故障動(dòng)態(tài)圖像監(jiān)測系統(tǒng)(TFDS)只能對基礎(chǔ)制動(dòng)裝置進(jìn)行狀態(tài)監(jiān)測,無法實(shí)現(xiàn)對空氣制動(dòng)機(jī)氣路故障的識(shí)別。目前,對于制動(dòng)機(jī)故障大多采用人工檢查,效率低,勞動(dòng)強(qiáng)度大,且容易發(fā)生漏檢。因此對貨車制動(dòng)系統(tǒng)狀態(tài)監(jiān)測具有現(xiàn)實(shí)且重要的意義。
針對列車制動(dòng)系統(tǒng)故障診斷,主要有基于信號處理、基于解析模型和基于知識(shí)的方法[1]。隨著制動(dòng)機(jī)被設(shè)計(jì)的越來越復(fù)雜,單純依靠信號處理的方法已不能準(zhǔn)確診斷出故障?;诮馕瞿P偷姆椒ㄓ墟I合圖模型[2]、物理模型[3]等,該方法的診斷效果依賴于模型的精度?;谥R(shí)的方法有專家系統(tǒng)[4]、神經(jīng)網(wǎng)絡(luò)[5]等,專家系統(tǒng)嚴(yán)重依賴獲取知識(shí)的層次,神經(jīng)網(wǎng)絡(luò)依賴于樣本數(shù)量和質(zhì)量,而本文故障數(shù)據(jù)來源于貨車線路運(yùn)行過程,受制于數(shù)量原因,導(dǎo)致其診斷效果不佳。由于空氣制動(dòng)機(jī)結(jié)構(gòu)復(fù)雜,各零部件間存在復(fù)雜的耦合關(guān)系,難以進(jìn)行精確的建模,并且在狀態(tài)監(jiān)測中需要測量的變量較多,且變量之間存在相關(guān)性,導(dǎo)致故障診斷存在長時(shí)間序列和診斷性能低的特點(diǎn)。隱馬爾可夫模型(HMM)基于時(shí)間序列建模,對小樣本數(shù)據(jù)具有較好的診斷性,可用于任意時(shí)長的時(shí)序建模問題,廣泛應(yīng)用于行為識(shí)別、齒輪箱狀態(tài)識(shí)別[6]、軸承故障診斷[7]等領(lǐng)域,這為HMM應(yīng)用于制動(dòng)機(jī)故障診斷提供了理論基礎(chǔ)。初始參數(shù)影響HMM的訓(xùn)練和測試效果,K-means算法作為一種簡單、高效的聚類算法,可以對模型參數(shù)進(jìn)行快速初始化。特征集對分類器的性能有較大影響,由于制動(dòng)機(jī)風(fēng)壓信號具有非線性[8]特征,故采用核主成分分析(KPCA)對提取的多維特征行約減,去除冗余信息,獲得信息主要成分。
鑒于此,本文提出KPCA和優(yōu)化HMM相結(jié)合的方法,采用大秦鐵路貨車線路實(shí)測數(shù)據(jù)進(jìn)行驗(yàn)證,并與全特征集HMM和KPCA+HMM以及其它診斷模型進(jìn)行比較,驗(yàn)證所提方法的有效性。
核主成分分析法利用非線性映射將數(shù)據(jù)從原始空間映射到高維空間中,然后對其進(jìn)行主成分分析。其中,核函數(shù)及參數(shù)決定了原始數(shù)據(jù)在高維空間的分布,間接決定了KPCA的輸出主元成分,故核函數(shù)及參數(shù)選擇對KPCA效果影響較大。
為簡化計(jì)算,本文選用高斯徑向基核函數(shù)(RBF)
(1)
式中,σ是寬度參數(shù)。在使用核函數(shù)進(jìn)行KPCA分析時(shí),較小的σ會(huì)引起過渡擬合,降低分類的泛化性能;而較大的σ會(huì)把核函數(shù)簡化為一個(gè)常函數(shù),導(dǎo)致其變成平凡分類器[9]。因此,本文對σ的選擇引入類內(nèi)類間距離,并定義
J=argmax(SB/SW)
(2)
式中,SB是特征集的類間距離,SW是各個(gè)特征的類內(nèi)距離。使得選取的核參數(shù)對應(yīng)的特征類間距最大且類內(nèi)距最小。
HMM為雙隨機(jī)模型,即狀態(tài)轉(zhuǎn)換和各狀態(tài)下的觀測值都服從隨機(jī)過程。根據(jù)觀測值離散或連續(xù),分為離散HMM和連續(xù)HMM。本文采用連續(xù)HMM,其描述為[10]:
1) 模型的狀態(tài)數(shù)目N。記N個(gè)狀態(tài)為S1,S2,…,S3,t時(shí)刻模型對應(yīng)的狀態(tài)為qt,qt∈{S1,S2,…,SN}。
2) 模型每個(gè)狀態(tài)對應(yīng)的觀測值數(shù)目M。將觀測值記為V1,V2,…,VM,t時(shí)刻觀測值為Ot,則ot∈{V1,V2,…,VM}。
3) 初始狀態(tài)矢量π
π={πi},πi=P(q1=Si) (1≤i≤N)
(3)
4) 狀態(tài)轉(zhuǎn)移矩陣A
A=(αi,j),αi,j=P(qt+1=Sj|qt=Si)
(4)
5) 觀測值概率密度函數(shù)
(5)
一般采用高斯混合模型來表示觀測值概率密度函數(shù)。其中Mj為Sj狀態(tài)下單高斯數(shù);ωj,m、μj,m和δj,m分別為Sj狀態(tài)下第m個(gè)單高斯的權(quán)重、均值和協(xié)方差。
HMM訓(xùn)練采用Baum_welch算法,該算法基于遞歸思想進(jìn)行參數(shù)估計(jì),尋找最優(yōu)的模型參數(shù)是一個(gè)泛函極值問題,因此模型訓(xùn)練和初始參數(shù)有一定關(guān)系。模型初始參數(shù)可以隨機(jī)化初始,但對其進(jìn)行估計(jì)是有益的,其中觀測值概率分布對模型性能影響更大[11]。
本文采用K-means聚類算法對觀測值概率分布進(jìn)行初始估計(jì)。K-means算法利用相似性的歐氏距離計(jì)算來對樣本進(jìn)行分類,其目標(biāo)是使各類樣本到對應(yīng)聚類中心距離的總和最小,即類內(nèi)離散度之和最小。將其設(shè)為聚類測度函數(shù),計(jì)算公式如下
(6)
式中,Zk為第k個(gè)聚類的中心,Ci為第i個(gè)分類的集合,k為需要分類的類別數(shù)。E反映了樣本圍繞各聚類中心的緊密度,E越小分類樣本分類效果越好。
利用K-means聚類算法優(yōu)化模型的流程如下:
步驟2:隨機(jī)挑選個(gè)K樣本作為初始的聚類中心centeri,1≤i≤K。
步驟3:計(jì)算每個(gè)樣本與各聚類中心的歐氏距離,并按照最小歐氏距離將其劃入所對應(yīng)的類,類中樣本量記為numi,1≤i≤K。
步驟4:重新計(jì)算各個(gè)類中所有樣本的平均值,并將其作為更新后的聚類中心centeri。并根據(jù)式(6)計(jì)算聚類測度函數(shù)值Ei,1≤i≤t。
步驟5:循環(huán)步驟3和步驟4,得到更新后Ei+1,并計(jì)算Ei-Ei+1,判斷其與收斂精度Δ的關(guān)系,如果小于等于Δ,則退出循環(huán)。
則觀測值概率密度函數(shù)bj(Ot)的初始參數(shù)估計(jì)如下
μj,m=centeri(1≤i≤K)
(7)
(8)
(9)
基于KPCA和優(yōu)化HMM的制動(dòng)系統(tǒng)故障診斷的過程如圖1,具體步驟如下:
步驟1:對訓(xùn)練集和測試集數(shù)據(jù)分別進(jìn)行多維特征提取。
步驟2:計(jì)算高斯核函數(shù)的最優(yōu)參數(shù),并利用KPCA對訓(xùn)練集和測試集數(shù)據(jù)進(jìn)行降維,得到新的訓(xùn)練集和測試集數(shù)據(jù)。
步驟3:在訓(xùn)練集數(shù)據(jù)上,利用K-means聚類算法完成HMM的初始參數(shù)優(yōu)化選擇。
步驟4:對訓(xùn)練集不同狀態(tài)下的樣本數(shù)據(jù)分別訓(xùn)練HMM,并保存到模型庫中。本文在制動(dòng)系統(tǒng)5種狀態(tài)下,分別訓(xùn)練HMM模型,即λi,1≤i≤L,L=5。
步驟5:將測試集樣本送入HMM模型庫中,分別計(jì)算每個(gè)測試樣本在不同模型下的似然概率P(O|λi),其中概率最大的模型就是測試樣本對應(yīng)的狀態(tài),即
(10)
圖1 制動(dòng)系統(tǒng)故障診斷流程圖
本文研究的對象為貨車空氣制動(dòng)機(jī)風(fēng)壓數(shù)據(jù),通過對大秦線210輛編組的C80B(H)試驗(yàn)車加裝車載監(jiān)測裝置,利用EPCOS(愛普科斯)C82系列空氣壓力傳感器采集貨車在線運(yùn)行過程中多通道風(fēng)壓數(shù)據(jù),從而實(shí)現(xiàn)制動(dòng)系統(tǒng)狀態(tài)監(jiān)測。如圖2所示,空氣制動(dòng)機(jī)風(fēng)壓采集點(diǎn)包括列車管、副風(fēng)缸、制動(dòng)缸上游、制動(dòng)缸下游。
圖2 壓力采集實(shí)物圖
結(jié)合列車行車故障統(tǒng)計(jì)表,對試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,共得到制動(dòng)機(jī)5種狀態(tài)數(shù)據(jù),每種狀態(tài)各50組,包括空車正常制動(dòng)、重車正常制動(dòng)、緩解不良故障、自然緩解故障、制動(dòng)缸漏泄故障。圖3為制動(dòng)機(jī)5種狀態(tài)的一組數(shù)據(jù)展示。其中緩解不良是指列車管充氣緩解時(shí),制動(dòng)缸不緩解或緩解很慢,可能導(dǎo)致貨車抱閘運(yùn)行;自然緩解是指沒有緩解操作時(shí),制動(dòng)缸自行發(fā)生緩解作用,可能會(huì)導(dǎo)致列車失去制動(dòng)力而引發(fā)事故;制動(dòng)缸漏泄是指車輛制動(dòng)保壓時(shí),制動(dòng)缸下游壓力持續(xù)下降時(shí)間>1min,當(dāng)壓力下降到30±10kPa后停止下降。
圖3 各種制動(dòng)狀態(tài)風(fēng)壓信號圖
空氣制動(dòng)機(jī)風(fēng)壓信號為多通道時(shí)序數(shù)據(jù),存在周期性、隨機(jī)性等動(dòng)態(tài)特性,對其時(shí)域和頻域基本特征進(jìn)行提取。時(shí)域特征包括均值、方根幅值、標(biāo)準(zhǔn)差、均方根值、峰峰值、偏度、峭度、波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo);頻域特征包括平均頻率、中心頻率、均方根頻率、標(biāo)準(zhǔn)差頻率、頻率峭度。
制動(dòng)機(jī)在制動(dòng)過程中內(nèi)部氣路管道壓力存在階躍變化的過程,而小波分析對這類邊緣信號有很好的處理效果,不僅有濾波作用,并且可以從階躍型信號中提取信號的突變點(diǎn)[12]。故對多通道數(shù)據(jù)進(jìn)行小波分析,選取db3對信號進(jìn)行3層小波包分解,計(jì)算各頻帶的能量譜尺度,選取前三作為特征。
空氣制動(dòng)機(jī)是一個(gè)復(fù)雜的耦合系統(tǒng),各零部件間存在相關(guān)性關(guān)系,故對多通道風(fēng)壓數(shù)據(jù)提取相關(guān)性特征。本文計(jì)算皮爾森相關(guān)系數(shù)作為特征,其計(jì)算公式
(11)
將采集到的250組數(shù)據(jù),各狀態(tài)下隨機(jī)選取60%數(shù)據(jù)作為訓(xùn)練集,其余作為測試集。對各組數(shù)據(jù)特征提取后,采用KPCA進(jìn)行特征降維,核函數(shù)參數(shù)σ的選擇如式(2)所述,以1為步長,對σ∈[1,200]內(nèi)的 200個(gè)點(diǎn)進(jìn)行計(jì)算,選取J最大時(shí)所對應(yīng)的核參數(shù)。對訓(xùn)練集和測試集數(shù)據(jù)進(jìn)行KPCA,分別選取最優(yōu)的σ1=12,σ2=11。并設(shè)置主元貢獻(xiàn)率≥85%,保留前三階主元進(jìn)行分析。圖4(a)和(b)分別是訓(xùn)練集和測試集降維后的前三主元的分布。從圖中可以看出經(jīng)過KPCA處理后的特征可以有效分辨空氣制動(dòng)機(jī)5種不同狀態(tài)的數(shù)據(jù),可用于空氣制動(dòng)機(jī)的故障診斷。
圖4 KPCA后特征結(jié)果
HMM參數(shù)選擇:高斯元數(shù)目M=2,訓(xùn)練迭代次數(shù)為10。對馬爾可夫鏈和協(xié)方差矩陣的類型采用網(wǎng)格搜索法的方式,在訓(xùn)練集數(shù)據(jù)上采取5折交叉驗(yàn)證,以模型平均診斷準(zhǔn)確率作為參數(shù)選擇的標(biāo)準(zhǔn)。確定馬爾可夫鏈為左右型且狀態(tài)數(shù)為5,協(xié)方差矩陣為對角型。
利用K-means算法對HMM的初始參數(shù)進(jìn)行優(yōu)化選擇,然后進(jìn)行模型訓(xùn)練。設(shè)置聚類中心數(shù)K=M,聚類迭代次數(shù)t=10,聚類測度函數(shù)的收斂精度Δ=1e-4。圖5給出了在迭代過程中,對KPCA后的訓(xùn)練集特征進(jìn)行聚類時(shí)聚類測度函數(shù)值的變化曲線,體現(xiàn)了各類樣本中最佳個(gè)體類內(nèi)離散度之和的變化趨勢。從圖中可以看出,各類樣本中最佳個(gè)體類內(nèi)離散度下降明顯,且在迭代步數(shù)內(nèi)滿足收斂精度要求。
圖5 聚類測度函數(shù)值收斂曲線圖
在模型訓(xùn)練和測試階段,為驗(yàn)證本文所提方法的有效性,將該方法與全特征HMM和KPCA+未優(yōu)化HMM進(jìn)行對比。圖6為3種方法訓(xùn)練收斂曲線圖,縱坐標(biāo)為訓(xùn)練迭代過程中的各模型平均似然概率。從圖中可以看出,KPCA+優(yōu)化HMM的方法大大提高了模型的訓(xùn)練效率,在訓(xùn)練的第3步可以達(dá)到收斂精度,KPCA+HMM收斂速度次之,全特征HMM收斂速度最慢。
圖6 模型訓(xùn)練過程收斂曲線
圖7為全特征集訓(xùn)練HMM的診斷結(jié)果,圖8為KPCA+未優(yōu)化HMM診斷結(jié)果,圖9為KPCA+優(yōu)化HMM診斷結(jié)果,其中橫坐標(biāo)1-20、21-40、41-60、61-80、81-100分別表示狀態(tài)為空車正常制動(dòng)、重車正常制動(dòng)、緩解不良、自然緩解、制動(dòng)缸漏泄的測試樣本,縱坐標(biāo)對應(yīng)的是測試樣本在不同模型中的似然概率。由圖7可知,空車正常制動(dòng)的樣本全都能被正確診斷,無誤判樣本,重車正常制動(dòng)樣本(編號21-40)除編號40外,其余樣本都在模型下取得最大對數(shù)似然概率,因此判斷這些樣本為重車正常制動(dòng)狀態(tài),而編號40的樣本則出現(xiàn)了誤分。同理,緩解不良樣本出現(xiàn)2次誤分(編號50和55),自然緩解樣本出現(xiàn)4次誤分(編號62、67、72和73),制動(dòng)缸漏泄樣本出現(xiàn)3次誤分(編號88、95和98)。由圖8可知,空車正常制動(dòng)、重車正常制動(dòng)的樣本全都被正確診斷,緩解不良樣本出現(xiàn)1次誤分(編號47),自然緩解樣本出現(xiàn)1次誤分(編號72),制動(dòng)缸漏泄樣本出現(xiàn)2次誤分(編號88、95)。由圖9可知,除了緩解不良樣本出現(xiàn)1次誤分(編號47)和制動(dòng)缸漏泄樣本出現(xiàn)1例誤分(編號88)外,其它樣本都被正確診斷。診斷結(jié)果見表1。
由表1可知,診斷空車正常制動(dòng)時(shí),三種方法診斷率相同,對其它制動(dòng)狀態(tài)診斷時(shí),KPCA+優(yōu)化HMM較KPCA+HMM及全特征HMM,獲得了更好的診斷效果。這是由于KPCA對特征集進(jìn)行約減,獲得特征主要成分,提高了模型的收斂速度,并且利用K-means算法優(yōu)化初始模型參數(shù),降低了訓(xùn)練難度,提高了模型的訓(xùn)練效率,使得診斷準(zhǔn)確率有了一定的提高。
為了對比其它診斷模型的分類效果,分別設(shè)計(jì)基于支持向量機(jī)(SVM)和隨機(jī)森林(RF)的故障分類器。SVM選擇RBF核函數(shù),c=0.435,gamma=0.25。隨機(jī)森林參數(shù):分類器個(gè)數(shù)為10,決策樹的最大深度為5,葉子節(jié)點(diǎn)的最小樣本數(shù)為2。其診斷結(jié)果如表2所示。RF由于采用了集成弱分類器的學(xué)習(xí)策略,相比沒有經(jīng)過集成策略的單分類器模型SVM,泛化能力更強(qiáng),診斷準(zhǔn)確率更高。但是相較于HMM這種可以對時(shí)間序列建模的模型,HMM更能反映出時(shí)間序列過程中的狀態(tài)指標(biāo)變化,對長時(shí)間序列比如制動(dòng)數(shù)據(jù)有更好的故障識(shí)別效果。
圖7 全特征HMM診斷結(jié)果
圖8 KPCA+HMM診斷結(jié)果
圖9 KPCA+優(yōu)化HMM診斷結(jié)果
表1 診斷結(jié)果比較
表2 其它模型診斷結(jié)果
根據(jù)鐵路貨車制動(dòng)系統(tǒng)故障診斷特點(diǎn),提出了采用KPCA和優(yōu)化HMM相結(jié)合的方法。該方法利用KPCA對特征參數(shù)進(jìn)行約減,去除其中大量的冗余信息,降低了模型的復(fù)雜程度,并利用K-means聚類算法優(yōu)化模型初始參數(shù),提高了HMM訓(xùn)練和測試的效率。結(jié)果表明,基于KPCA和優(yōu)化HMM的故障診斷方法能很好地表征空氣制動(dòng)機(jī)的故障狀態(tài),具有很高的診斷精度,為鐵路貨車制動(dòng)系統(tǒng)故障診斷提供了一種切實(shí)可行的方法,具有一定的參考價(jià)值。