付雅婷,溫世明,楊 輝,伍迎節(jié)
(1.華東交通大學(xué) 電氣與自動化工程學(xué)院,江西 南昌 330013;2.華東交通大學(xué) 江西省先進控制與優(yōu)化重點實驗室,江西 南昌 330013;3.華東交通大學(xué) 軌道交通基礎(chǔ)設(shè)施性能監(jiān)測與保障國家重點實驗室,江西 南昌 330013;4.中國鐵路上海局集團有限公司 南京電務(wù)段,江蘇 南京 210011)
道岔轉(zhuǎn)轍機作為鐵路基礎(chǔ)設(shè)施被應(yīng)用于引導(dǎo)列車到達預(yù)定的路線,從而確保每列列車的平穩(wěn)運行[1]。然而,運輸繁忙、客貨運輸密度大等工作環(huán)境常使道岔轉(zhuǎn)轍機的動作桿、表示桿、齒輪等關(guān)鍵部件發(fā)生故障,影響列車的安全可靠運行?,F(xiàn)有故障識別方式主要是利用集中監(jiān)測系統(tǒng)實時監(jiān)測轉(zhuǎn)轍機動作時的工作電流和工作功率,通過與正常動作時的參考數(shù)據(jù)進行對比來處理道岔隱患[2]。這種方式具有一定的人為主觀因素,在復(fù)雜多變的工作環(huán)境下很難實現(xiàn)對轉(zhuǎn)轍機故障的快速定位和及時維修。因此,研究道岔轉(zhuǎn)轍機智能故障診斷對保障高速列車的安全可靠運行和降低維修成本具有重要意義,是適應(yīng)新形勢下鐵路運維智能化發(fā)展的方向。
近年來,國內(nèi)外專家學(xué)者在道岔轉(zhuǎn)轍機智能故障診斷方面已經(jīng)開展了一些研究,并取得了一定的成果。文獻[3]提出模糊神經(jīng)網(wǎng)絡(luò)的道岔故障診斷,通過某種特征提取方法提取特征,采用前饋神經(jīng)網(wǎng)絡(luò)完成故障類型的診斷,但是該方法的特征提取方式過于復(fù)雜且需要人工整理得到特征向量集,在實際應(yīng)用中很難對轉(zhuǎn)轍機故障快速定位。文獻[4]提出一種自生成故障樣本的智能故障診斷方法,通過LeNet卷積神經(jīng)網(wǎng)絡(luò)有效檢測道岔故障,但是該方法以圖像的形式輸入,消耗大量計算機資源,對設(shè)備硬件要求較高。文獻[5]提出一種半監(jiān)督學(xué)習(xí)算法的道岔故障診斷方法,采用支持向量機對道岔進行故障分類,但該方法需要提取分段特征的預(yù)處理,相對來說比較繁瑣。文獻[6]提出一種基于深度學(xué)習(xí)的道岔故障診斷方法,采用卷積神經(jīng)網(wǎng)絡(luò)-門控循環(huán)單元組合模型對道岔進行故障診斷,具有較好的診斷率,但該方法的數(shù)據(jù)為單通道輸入,相比多通道輸入不能全面挖掘信號的信息。
上述文獻主要是對信號在時域特征上和單通道輸入上進行分析。雖然時域特征[7]能從不同角度反映道岔轉(zhuǎn)轍機的故障狀態(tài),但是轉(zhuǎn)轍機的動作功率存在突變性,具有非線性非平穩(wěn)的特點。單通道輸入[8]是直接分析原始的功率信號,相對來說不能充分挖掘功率信號中的隱藏信息。考慮到經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)算法適用于非線性、非平穩(wěn)的動作功率信號分析處理[9],能表達出不同頻率的信息特征;一維卷積神經(jīng)網(wǎng)絡(luò)(One-dimensional Convolutional Neural Network, 1DCNN)在功率信號的卷積和池化操作過程中具有強大的特征學(xué)習(xí)能力,表現(xiàn)出更高的診斷精度[10];長短期記憶神經(jīng)網(wǎng)絡(luò)(Long-Short Term Memory, LSTM)可以對功率數(shù)據(jù)信息進行選擇性保留,深層挖掘內(nèi)部信息[11]。因此,本文提出一種基于多通道輸入(Multi-channel Input, MC)和1DCNN-LSTM的道岔轉(zhuǎn)轍機故障診斷方法(以下簡稱“MC-1DCNN-LSTM”),主要對道岔轉(zhuǎn)轍機動作時的工作功率進行診斷并完成故障分類,實現(xiàn)對轉(zhuǎn)轍機故障的快速定位。首先利用EMD算法對功率信號進行不同頻率分解,通過方差貢獻率篩選出最有效的3個固有模態(tài)函數(shù)(Intrinsic Mode Function, IMF)信號作為多通道輸入;然后將多通道信號輸入到1DCNN 中進行局部特征提取,利用LSTM從已提取的局部特征中選擇性提取長距離特征;最后利用所建模型診斷出故障的類型,通過對比損失值、準(zhǔn)確率、混淆矩陣診斷效果和t-分布隨機近鄰嵌入(t-distributed Stochastic Neighbor Embedding, t-SNE)診斷效果,來評估模型的有效性。
本文選取S700K道岔轉(zhuǎn)轍機為研究對象。S700K道岔轉(zhuǎn)轍機采用三相交流電動機,在道岔轉(zhuǎn)換過程中輸出功率P與工作拉力F之間的關(guān)系[12]為
( 1 )
式中:n、η、Re分別為轉(zhuǎn)轍機電機的轉(zhuǎn)速、轉(zhuǎn)換效率、等效力臂,其值均為常數(shù),故工作拉力F與輸出功率P呈線性關(guān)系。在道岔轉(zhuǎn)換過程中,F的變化能反應(yīng)出轉(zhuǎn)轍機的運行狀態(tài),從而可以根據(jù)P的曲線變化來判斷轉(zhuǎn)轍機的工作狀態(tài),因此本文通過動作時的工作功率數(shù)據(jù)來對S700K轉(zhuǎn)轍機的工作狀態(tài)進行故障診斷。
S700K轉(zhuǎn)轍機正常動作功率曲線見圖1。
圖1 S700K轉(zhuǎn)轍機正常動作功率曲線
由圖1可知,S700K轉(zhuǎn)轍機正常動作功率曲線共分為5個階段:啟動階段、解鎖階段、轉(zhuǎn)換階段、鎖閉階段、緩放階段。其中,啟動階段,機械解鎖需要把鎖閉塊頂出,故功率曲線快速上升并達到峰值,機械解鎖后功率值下降至穩(wěn)定值;解鎖階段,動作桿移動60 mm時,外鎖閉裝置解鎖完成;轉(zhuǎn)換階段,電機開始推動尖軌動作,尖軌與基本軌實現(xiàn)密貼后結(jié)束;鎖閉階段,尖軌與基本軌實現(xiàn)密貼,此時表示桿的缺口中已經(jīng)插入了鎖閉桿;緩放階段,啟動電流只剩下A、C兩相電流,此時會出現(xiàn)“小臺階”。當(dāng)曲線的功率值保持為0 kW時,道岔的整個轉(zhuǎn)換過程就已全部完成。
通過相關(guān)調(diào)查研究,本文選取S700K道岔轉(zhuǎn)轍機5種常見的故障類型進行診斷,其相應(yīng)的動作功率曲線見圖2。
圖2 S700K轉(zhuǎn)轍機常見故障動作功率曲線
為更好地挖掘功率數(shù)據(jù)中隱藏的故障信息和提高道岔故障診斷精度,本文提出的MC-1DCNN-LSTM模型具有以下特點:①通過EMD算法分解動作功率信號,得到若干個IMF,其中僅有少數(shù)IMF與故障信息相關(guān)程度較高,將相關(guān)程度較高的IMF信號作為多通道輸入,可以更有效地關(guān)注重點故障信息;②1DCNN具有局部連接和權(quán)值共享等特點,能自動提取輸入的IMF信號數(shù)據(jù)特征,實現(xiàn)更高效的局部特征提取;③將1DCNN提取到的局部特征輸入到LSTM網(wǎng)絡(luò)中,利用LSTM捕捉局部特征中的長距離特征,可以更進一步挖掘功率數(shù)據(jù)中的關(guān)聯(lián)特征和提高故障診斷精度。
EMD作為一種自適應(yīng)時頻分析方法,有效地解決了基函數(shù)缺乏自適應(yīng)的問題,根據(jù)輸入信號的局部特征信息可以自適應(yīng)分解為若干個尺度特征不同的IMF信號,因此EMD算法非常適用于非線性、非平穩(wěn)信號的分解,具有很明顯的優(yōu)勢[13-14]。
本文通過EMD算法對動作功率數(shù)據(jù)進行自適應(yīng)分解。假設(shè)待分解功率信號為P(t),先確定P(t)所有的局部極值點,再用三次樣條插值法對所有極值點進行擬合得到上包絡(luò)線g(t)和下包絡(luò)線k(t),進而得到上下包絡(luò)線的平均值m1(t)為
( 2 )
用P(t)減去m1(t)得到第一個分量h1(t)。h1(t)成為IMF需要滿足2個條件:①極值點數(shù)和零點數(shù)必須相等或相差最多不能超過1個;②上、下包絡(luò)線相對時間軸局部對稱。若不符合,則把h1(t)作為待分解信號重復(fù)以上步驟直至滿足IMF條件。此時第一個IMF信號記為c1(t),殘余分量r1(t)為
r1(t)=P(t)-c1(t)
( 3 )
將r1(t)作為待分解信號重復(fù)以上步驟,直至rn(t)成為單調(diào)函數(shù),即EMD分解結(jié)束。則功率信號P(t)可表達為
( 4 )
1DCNN適用于分析具有固定長度周期的一維信號,能從其中自動學(xué)習(xí)特征,并具有局部連接和權(quán)值共享等特點,極大程度上降低了故障診斷模型的復(fù)雜程度,從而可以節(jié)省計算機資源,實現(xiàn)更高效的故障診斷。1DCNN[15]網(wǎng)絡(luò)通常由輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成,其結(jié)構(gòu)見圖3。
圖3 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
考慮到信號微機監(jiān)測系統(tǒng)監(jiān)測的動作功率信號為一維信號,故本文將功率信號分解得到的IMF信號作為1DCNN[16]網(wǎng)絡(luò)的輸入,對其進行特征提取。
卷積層是對功率數(shù)據(jù)特征提取的關(guān)鍵,具體運算為
( 5 )
池化層是在對數(shù)據(jù)降維的同時保留最大信息量,本文選擇最大池化的方式,具體運算為
( 6 )
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個變種,有效解決了循環(huán)神經(jīng)網(wǎng)絡(luò)遇到的梯度消失和梯度爆炸的問題,非常適用于處理與時間序列相關(guān)的問題,使故障診斷模型更具優(yōu)勢。
LSTM[17]將1DCNN所提取的局部特征向量作為輸入,學(xué)習(xí)其內(nèi)部的特征變化規(guī)律并提取出長距離特征向量,從而挖掘功率信號內(nèi)部的關(guān)聯(lián)特征,進一步提高模型的診斷精度。LSTM的傳輸狀態(tài)通過3個門結(jié)構(gòu)來控制,分別是遺忘門、輸入門和輸出門。LSTM網(wǎng)絡(luò)結(jié)構(gòu)見圖4,各變量具體表達為[18-19]
( 7 )
圖4 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
( 8 )
Gt=tanh(ωt[ht-1,xt]+bt)
( 9 )
(10)
(11)
(12)
實驗平臺為某電務(wù)器材公司提供的S700K轉(zhuǎn)轍機故障模擬平臺,共設(shè)置5種常見轉(zhuǎn)轍機故障,分別采集轉(zhuǎn)轍機正常運行,以及表示電路二極管損壞、動作桿被外來物卡死、轉(zhuǎn)轍機內(nèi)部和道岔連接部分發(fā)生故障、轉(zhuǎn)轍機齒輪與齒輪塊之間卡死、斷相保護器發(fā)生故障,共6種狀態(tài)下的動作功率數(shù)據(jù),轉(zhuǎn)轍機轉(zhuǎn)換時間為7 s,采樣間隔為0.02 s,每個樣本長度為350,每個狀態(tài)下的樣本量為1 500組,6種狀態(tài)下的樣本總量為9 000組,各種狀態(tài)樣本狀況見表1。
表1 S700K轉(zhuǎn)轍機6種狀態(tài)樣本狀況
多通道輸入將具有代表性的挑選樣本輸入到特征圖的多個通道內(nèi),多個通道融合后的特征圖能夠充分挖掘數(shù)據(jù)的有效信息[20]。通過2.1節(jié)中的EMD算法對動作功率數(shù)據(jù)進行自適應(yīng)分解,可以得到對應(yīng)的IMF信號,本文僅給出動作桿被外來物卡死的功率信號分解,見圖5。
圖5 EMD分解的時域信號
由圖5可知,共有5層IMF信號,考慮到不同層對所分解的功率信號影響不同,本文通過方差貢獻率篩選出最有效的IMF[21]。方差貢獻率由各IMF信號方差與功率信號方差的比值構(gòu)成,比值越高表示該IMF與功率信號相關(guān)程度越高。各層IMF信號的方差貢獻率見表2。
表2 各層IMF信號的方差貢獻率 %
由表2可知,IMF2、IMF4、IMF5與功率信號相關(guān)程度較高,所包含的故障信息最重要,故將其作為多通道輸入,即本文所構(gòu)建的為三通道輸入,可以充分讓1DCNN網(wǎng)絡(luò)提取重要故障特征,提高診斷精度。
多通道輸入之間的卷積操作見圖6。圖6中,展示了所構(gòu)建的三通道輸入特征融合過程,篩選的3個IMF信號先在各自的通道內(nèi)完成一維卷積操作,再通過卷積后的輸出進行求和操作,此刻卷積層開始對融合后的特征進行特征提取。
圖6 多通道輸入之間的卷積操作
本文提出的基于MC-1DCNN-LSTM的道岔轉(zhuǎn)轍機故障診斷模型見圖7。圖7中,診斷模型由3個卷積層、3個池化層、2個LSTM層、1個展平層和3個全連接層組成,主要結(jié)構(gòu)參數(shù)見表3。表3中,CS、C、N、S、P分別為卷積層卷積核的形狀、通道數(shù)、數(shù)量、步幅、零填充的數(shù)量;Size、Stride分別為池化層卷積核的形狀、步幅;Input_size、hidden_size、num_layer分別為LSTM輸入層的特征維度、隱藏層的輸出特征維度、隱藏層的數(shù)量;n為全連接層神經(jīng)元數(shù)量。
表3 模型主要結(jié)構(gòu)參數(shù)
圖7 基于MC-1DCNN-LSTM的道岔故障診斷模型
本文采用Pytorch的深度學(xué)習(xí)框架搭建MC-1DCNN-LSTM故障診斷模型:輸入層為篩選出的IMF信號;卷積層的數(shù)量逐層疊加,通過觀察卷積層輸出特征圖的效果和模型最終診斷效果來確定層數(shù);為更好提取故障特征,逐層翻倍增加卷積層卷積核的數(shù)量來增加網(wǎng)絡(luò)寬度;LSTM層采用2層的網(wǎng)絡(luò)結(jié)構(gòu),均含100個隱藏層,能夠充分學(xué)習(xí)故障數(shù)據(jù)中的長距離特征;Flatten5展平層用于將多維輸出展平成一維;輸出層采用全連接方式將模型的輸出向量轉(zhuǎn)換為診斷類別標(biāo)簽的維度。
模型訓(xùn)練采用Adam優(yōu)化器更新參數(shù),學(xué)習(xí)率設(shè)為0.001,該值通過觀察模型學(xué)習(xí)速度和收斂速度得到最優(yōu)解;為防止過擬合和梯度爆炸,權(quán)值衰減weight_decay由經(jīng)驗值設(shè)為0.000 5;采用交叉熵損失函數(shù)來衡量模型的診斷性能,批訓(xùn)練樣本數(shù)量batch_size根據(jù)模型訓(xùn)練速度和精度設(shè)為32個樣本,模型訓(xùn)練輪次Epoch設(shè)為100輪。
3.4.1 不同診斷模型對比實驗
將本文建立的模型與5種經(jīng)典的診斷方法進行對比分析,具體為:①LeNet[4],包含2個卷積層,2個池化層和2個全連接層;②DenseNet[22],前面所有層都作為下一層的額外輸入,即實現(xiàn)特征重用;③VGG19[23],下一層通過上一層的輸出特征來提取更加復(fù)雜的特征;④ResNet50[24],包含49個卷積層和1個全連接層,其解決了深度過大訓(xùn)練困難的問題;⑤LSTM-Attention[25],長短期記憶神經(jīng)網(wǎng)絡(luò)和自注意力機制組合,更加關(guān)注重要信息。6種模型分別在5 400組訓(xùn)練集上進行訓(xùn)練,故障診斷準(zhǔn)確率、損失值見圖8。準(zhǔn)確率為不同模型診斷正確的樣本數(shù)量占訓(xùn)練集樣本數(shù)量的比例;損失值為通過交叉熵損失函數(shù)計算的各模型中真實類別概率分布與診斷類別概率分布之間的差距。
由圖8(a)可見,6種模型隨著迭代次數(shù)的增加均有著較高的故障診斷準(zhǔn)確率,而本文模型相較于另外5種模型收斂效果和收斂速度都是最佳的,具有更強的特征學(xué)習(xí)能力和適應(yīng)性。由圖8(b)可見,本文所建的診斷模型相較于其他診斷模型有著更平穩(wěn)的損失值變化,具有較好的魯棒性。
為調(diào)整各模型的相關(guān)參數(shù),本文在訓(xùn)練集訓(xùn)練的同時加入驗證集進行驗證,并以最小損失值為標(biāo)準(zhǔn)挑選最優(yōu)的模型和參數(shù)。為衡量各自最優(yōu)診斷模型的性能和診斷能力,分別在1 800組測試集上進行測試。通過混淆矩陣對各類診斷結(jié)果進行可視化展示,可以更直觀地展示各模型測試診斷效果,混淆矩陣可視化診斷結(jié)果見圖9。圖9中,每一列為測試診斷類別,每一行為實際類別,對角線方塊為各類診斷正確樣本數(shù)量,其余為錯誤樣本診斷數(shù)量。各種方法測試準(zhǔn)確率比較結(jié)果見表4。表4中,平均準(zhǔn)確率值為各類混淆矩陣內(nèi)總的正確樣本數(shù)量占測試集樣本數(shù)量的比例。
表4 各方法測試準(zhǔn)確率比較
圖9 混淆矩陣可視化診斷結(jié)果
由圖9可見,相較于其他5種模型,本文所提出的MC-1DCNN-LSTM方法在診斷精度上更高,錯誤分類的數(shù)目最少。由表4的對比數(shù)據(jù)可知:本文方法準(zhǔn)確率為99.28%,測試時間為0.28 s,相較于DenseNet、LeNet、VGG19、ResNet50,準(zhǔn)確率分別增加了0.61%、2.45%、1.17%、0.06%,主要原因是本文方法加入了多通道輸入和LSTM網(wǎng)絡(luò),多通道輸入把主要故障信息作為輸入,LSTM使各類的時間序列特征聯(lián)系更加緊密;ResNet50診斷準(zhǔn)確率與本文模型接近,但測試時間相對較長,主要原因是ResNet50網(wǎng)絡(luò)卷積層層數(shù)較多,提取特征過程耗時大;LeNet的測試時間最短,但準(zhǔn)確率相對不高,主要原因是模型結(jié)構(gòu)較簡單,提取特征能力稍弱;本文方法相較于LSTM-Attention準(zhǔn)確率提升0.11%,LSTM-Attention也具有較高的準(zhǔn)確率,但測試時間消耗較大,主要原因是LSTM后連接注意力機制網(wǎng)絡(luò),捕捉長序列中的依賴關(guān)系消耗時間較多。綜合比較,本文建立的模型具有較高的診斷準(zhǔn)確率和較好的魯棒性,且對計算機硬件要求不高,驗證了本文方法的有效性和泛化性。
3.4.2 消融實驗
為進一步從內(nèi)部結(jié)構(gòu)的變化來驗證本文所提算法的有效性和可行性,在保持其他實驗設(shè)置不變的情況下,將單通道輸入、多通道輸入、1DCNN、LSTM進行組合搭配,通過不同網(wǎng)絡(luò)的組合搭配來進行消融實驗,消融實驗產(chǎn)生的準(zhǔn)確率比較結(jié)果見表5。表5中,SC為單通道輸入。
表5 消融實驗產(chǎn)生的準(zhǔn)確率比較 %
由表5的對比數(shù)據(jù)可以發(fā)現(xiàn):①當(dāng)1DCNN中的輸入方式由單通道輸入變?yōu)槎嗤ǖ垒斎霑r,準(zhǔn)確率提高0.65%,說明多通道輸入把主要故障信息作為輸入能進一步挖掘功率數(shù)據(jù)中的信息;②在以上網(wǎng)絡(luò)中分別加入LSTM網(wǎng)絡(luò),模型的準(zhǔn)確率分別增加了0.89%和0.42%,即LTSM網(wǎng)絡(luò)把動作功率數(shù)據(jù)中的長距離特征信息聯(lián)系得更加密切,進一步提高了模型的準(zhǔn)確率。
3.4.3 t-SNE可視化分析
t-分布隨機近鄰嵌入(t-SNE)[26]是一種將高維數(shù)據(jù)轉(zhuǎn)換為低維數(shù)據(jù)的方法,其基本思路是在二維或三維空間形成一個t分布,使其在高維空間構(gòu)造概率分布一致。為觀察MC-1DCNN-LSTM模型對S700K轉(zhuǎn)轍機故障診斷效果,直觀地展現(xiàn)模型各層中的特征學(xué)習(xí)能力,將1 800組測試樣本作為模型的輸入,利用t-SNE將模型中各層所學(xué)習(xí)的高維特征降到二維空間進行可視化,t-SNE特征可視化結(jié)果見圖10。由圖10(a)~圖10(c)可見,經(jīng)過3個卷積-池化操作后,6種狀態(tài)具有一定的可分性;由圖10(d)可見,經(jīng)過LSTM層后各狀態(tài)之間聚在一起,有更加明顯的可分性;由圖10(e)可見,經(jīng)過全連接層FC8后,類與類之間距離較大,6種狀態(tài)之間是完全可分的。
圖10 t-SNE特征可視化結(jié)果
從圖10可以得出,本文所建立的模型具有較強的特征學(xué)習(xí)能力,隨著網(wǎng)絡(luò)層數(shù)的增加能夠逐漸區(qū)分6種狀態(tài),具有較強的故障診斷能力,驗證了本文方法的有效性和優(yōu)越性。
本文根據(jù)S700K交流道岔轉(zhuǎn)轍機的動作功率曲線為一維信號的特點,提出基于MC-1DCNN-LSTM的特征學(xué)習(xí)方法,很好地解決了S700K轉(zhuǎn)轍機故障診斷問題。通過實驗驗證得出以下結(jié)論:
1)EMD算法將動作功率曲線自適應(yīng)地分解為若干個頻率不同的IMF信號,通過MC-1DCNN網(wǎng)絡(luò)可以有效地將IMF信號融合在一起,并可以有效地挖掘動作功率信號的關(guān)鍵故障信息。
2)引入1DCNN-LSTM組合診斷模型,先用1DCNN網(wǎng)絡(luò)提取轉(zhuǎn)轍機功率數(shù)據(jù)中的局部特征,再用LSTM網(wǎng)絡(luò)選擇性保留信息來提取局部特征中的長距離特征,從而更深層挖掘功率信號內(nèi)部的關(guān)聯(lián)特征。
3)與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)模型相比較,本文所構(gòu)建的模型對計算機的性能要求較低,且診斷時間短,顯示出更好的故障特征學(xué)習(xí)能力和診斷能力,也驗證了本文方法的有效性和優(yōu)越性。