武曉春,溫昕
(蘭州交通大學(xué) 自動(dòng)化與電氣工程學(xué)院,蘭州 730070)
鐵路道岔是鐵路系統(tǒng)最重要的線路連接設(shè)備之一,包括道岔和道岔轉(zhuǎn)轍設(shè)備[1].對于道岔轉(zhuǎn)轍設(shè)備來說,首先是依據(jù)行車要求和聯(lián)鎖條件將道岔轉(zhuǎn)換到正確位置;其次需要檢查道岔尖軌與基本軌間是否密貼,以保證行車安全。目前,道岔轉(zhuǎn)轍設(shè)備狀態(tài)信息的獲取主要依靠現(xiàn)場工作人員對信號集中監(jiān)測系統(tǒng)中道岔電流、功率等參數(shù)的調(diào)閱分析,這種方法可能導(dǎo)致設(shè)備出現(xiàn)過維修和維修不足的問題。所以,有必要采用科學(xué)方法準(zhǔn)確掌握道岔轉(zhuǎn)轍設(shè)備的實(shí)際健康狀態(tài),保證其安全可靠工作。
目前,國內(nèi)外學(xué)者在道岔轉(zhuǎn)轍設(shè)備健康管理與故障診斷方面取得許多成果。文獻(xiàn)[2]提出一種相似度函數(shù)定義法,計(jì)算樣本曲線與其余曲線的相似度,從而對應(yīng)出故障模式。文獻(xiàn)[3]提出將支持向量聚類(Support vector data description,SVDD)運(yùn)用在道岔健康管理方面,通過對道岔動(dòng)作時(shí)異常數(shù)據(jù)的捕捉,用來評估其健康狀態(tài)。文獻(xiàn)[4]利用卷積神經(jīng)網(wǎng)絡(luò)對道岔曲線特征提取,輸入到門控循環(huán)單元(Gated recurrent units,GRU)中對道岔故障進(jìn)行分類。文獻(xiàn)[5]對道岔功率曲線進(jìn)行特征提取和分解,結(jié)果作為故障特征參數(shù),利用模糊聚類進(jìn)行故障診斷。文獻(xiàn)[6-11]運(yùn)用神經(jīng)網(wǎng)絡(luò):灰色神經(jīng)網(wǎng)絡(luò),SOM 網(wǎng)絡(luò),BP 網(wǎng)絡(luò)等對道岔設(shè)備的退化狀態(tài)進(jìn)行分類和評估。以上研究推動(dòng)了道岔轉(zhuǎn)轍設(shè)備故障分類和檢測的技術(shù)發(fā)展,但存在以下不足:1)由于道岔轉(zhuǎn)轍設(shè)備數(shù)據(jù)量大,傳統(tǒng)算法計(jì)算力稍顯欠缺,構(gòu)建的設(shè)備健康因子精度欠佳,不能準(zhǔn)確判斷道岔轉(zhuǎn)轍設(shè)備的健康狀態(tài);2)道岔轉(zhuǎn)轍設(shè)備預(yù)測研究多為設(shè)備壽命預(yù)測,而實(shí)際現(xiàn)場中道岔轉(zhuǎn)轍設(shè)備有規(guī)定使用年限,到期更換,故障前健康狀態(tài)預(yù)測方面研究較少,無法滿足設(shè)備預(yù)防修要求。
綜上,本文提出一種結(jié)合SOM 和LSTM 混合神經(jīng)網(wǎng)絡(luò)的道岔轉(zhuǎn)轍設(shè)備健康狀態(tài)評估及預(yù)測的方法。利用SOM 算法計(jì)算健康因子,將道岔故障前的健康狀態(tài)數(shù)據(jù)化;利用LSTM 算法對道岔轉(zhuǎn)轍設(shè)備退化趨勢進(jìn)行預(yù)測,以上過程可實(shí)現(xiàn)對道岔轉(zhuǎn)轍設(shè)備的預(yù)防修,可直觀觀測設(shè)備健康狀況,對設(shè)備退化趨勢進(jìn)行預(yù)警,為現(xiàn)場工作人員提供決策依據(jù)。
結(jié)合SOM-LSTM 混合神經(jīng)網(wǎng)絡(luò)的健康狀態(tài)分析評估與預(yù)測方法主要包含3 部分內(nèi)容(數(shù)據(jù)預(yù)處理、健康狀態(tài)評估和健康狀態(tài)預(yù)測),總體流程圖如圖1 所示。
圖1 結(jié)合SOM-LSTM 混合神經(jīng)網(wǎng)絡(luò)道岔健康狀態(tài)評估與預(yù)測流程Fig.1 Assessment and prediction of switch equipment health status combined with SOM-LSTM hybrid neural network algorithm
1)數(shù)據(jù)預(yù)處理:根據(jù)道岔轉(zhuǎn)轍設(shè)備功率曲線數(shù)據(jù)特點(diǎn),分3 段提取時(shí)域參數(shù),得到特征參數(shù)集。
2)健康狀態(tài)評估:利用SOM 神經(jīng)網(wǎng)絡(luò)中的最小量化誤差算法計(jì)算道岔轉(zhuǎn)轍設(shè)備的健康因子,得到表征其健康狀態(tài)變化的HI 曲線。
3)健康狀態(tài)預(yù)測:采用LSTM 神經(jīng)網(wǎng)絡(luò)對道岔轉(zhuǎn)轍設(shè)備后續(xù)健康因子進(jìn)行預(yù)測,判斷其健康狀態(tài)。
由于道岔正常動(dòng)作一次大約可采集165 個(gè)功率數(shù)據(jù),數(shù)據(jù)冗余且繁雜,需要對原始數(shù)據(jù)進(jìn)行處理,以得到適合神經(jīng)網(wǎng)絡(luò)輸入維數(shù)的數(shù)據(jù)。
針對上述問題,本文提出一種結(jié)合SOM 神經(jīng)網(wǎng)絡(luò)與LSTM 神經(jīng)網(wǎng)絡(luò)的道岔轉(zhuǎn)轍設(shè)備健康評估及預(yù)測方法:利用SOM 神經(jīng)網(wǎng)絡(luò)構(gòu)建設(shè)備健康因子,實(shí)現(xiàn)對道岔轉(zhuǎn)轍設(shè)備健康狀態(tài)的準(zhǔn)確判斷;預(yù)測重點(diǎn)移至道岔轉(zhuǎn)轍設(shè)備健康狀態(tài)預(yù)測方面,利用LSTM 算法對設(shè)備后期健康狀態(tài)進(jìn)行預(yù)測。最后使用現(xiàn)場某車站一個(gè)季度內(nèi)實(shí)際監(jiān)測的600 組功率特征數(shù)據(jù)對該方法進(jìn)行驗(yàn)證。
道岔轉(zhuǎn)轍設(shè)備的功率曲線可直觀反映出道岔轉(zhuǎn)換時(shí)長和曲線波動(dòng)狀況,常被用作評估其健康狀態(tài)和退化狀態(tài)的分析依據(jù)。其中道岔轉(zhuǎn)換時(shí)長能夠大致反映出道岔在動(dòng)作過程中是否有異常狀況;而分析功率曲線的波動(dòng)形態(tài)可較為全面的反映出道岔在動(dòng)作時(shí)受到的阻力大小。因此,選取道岔轉(zhuǎn)轍設(shè)備的功率曲線作為分析依據(jù)是較為理想的選擇。將功率曲線分為3 個(gè)階段:①解鎖階段、②轉(zhuǎn)換階段、③鎖閉階段,如圖2 為道岔設(shè)備標(biāo)準(zhǔn)功率曲線圖。針對道岔轉(zhuǎn)轍設(shè)備功率曲線的3 個(gè)區(qū)段,分別提取每個(gè)區(qū)段的8 個(gè)時(shí)域特征,這些特征可從不同角度描述原始監(jiān)測數(shù)據(jù)的變化性和不對稱性,進(jìn)而來表征整個(gè)道岔功率曲線狀態(tài)和形態(tài)。8 種時(shí)域特征包括標(biāo)準(zhǔn)差(STD)、峰度(KT)、峰峰值(P2P)、偏斜度(SK)、均方根(RMS)、波峰因子(CF)、均值(Mean)和方差(Var),具體內(nèi)容如表1 所示。
表1 8 種時(shí)域特征計(jì)算公式表Tab.1 Calculation formulas for 8 types of domain features
圖2 道岔轉(zhuǎn)轍設(shè)備功率曲線圖Fig.2 Power curve of switch equipment
對選擇完的特征參數(shù)進(jìn)行最大最小歸一化處理,以減少數(shù)據(jù)差異性對結(jié)果的影響,表達(dá)式為
式中:x?為 歸一化后數(shù)據(jù);xmax與xmin為數(shù)據(jù)中的最大值和最小值;x為原始樣本數(shù)據(jù)。
自組織映射神經(jīng)網(wǎng)絡(luò)(Self-organizing map,SOM)是一種無監(jiān)督的學(xué)習(xí)方法[12],通過對數(shù)據(jù)內(nèi)部規(guī)律的把握,對網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)進(jìn)行自適應(yīng)的改變[13]。SOM 學(xué)習(xí)過程是一個(gè)競爭過程,在競爭過程中逐步優(yōu)化網(wǎng)絡(luò)。為研究道岔設(shè)備的實(shí)際健康狀態(tài),本文運(yùn)用SOM 網(wǎng)絡(luò)中的最小量化誤差算法(Minimum quantification error,MQE)[13-15]來計(jì)算健康因子,表征系統(tǒng)的健康狀況。利用SOM 神經(jīng)網(wǎng)絡(luò)評估道岔轉(zhuǎn)轍設(shè)備健康狀態(tài)過程如下:
1)構(gòu)建并訓(xùn)練SOM 神經(jīng)網(wǎng)絡(luò)
根據(jù)數(shù)據(jù)處理結(jié)果,確定SOM 網(wǎng)絡(luò)結(jié)構(gòu)。SOM網(wǎng)絡(luò)結(jié)構(gòu)分為兩層:輸入層和競爭層,通常輸入層節(jié)點(diǎn)數(shù)由輸入樣本維數(shù)確定,本文使用的SOM 輸入層節(jié)點(diǎn)數(shù)24 個(gè),競爭層結(jié)構(gòu)為6*6。
在構(gòu)建完成的SOM 網(wǎng)絡(luò)上以訓(xùn)練集數(shù)據(jù)為輸入,計(jì)算輸入值與各神經(jīng)元的相似度(通常使用歐式距離),距離計(jì)算公式為
當(dāng)某個(gè)神經(jīng)元的權(quán)重向量與輸入向量的歐氏距離最小時(shí),稱該神經(jīng)元為最佳匹配神經(jīng)元(Best matc-hing unit,BMU)[16],根據(jù)鄰域半徑σ確定BMU鄰域內(nèi)包含的點(diǎn),然后通過鄰域函數(shù)計(jì)算各神經(jīng)元需要更新的幅度,原理是:越靠近BMU,更新幅度越大;反之,越遠(yuǎn)離BMU,各神經(jīng)元需更新的幅度越小。在優(yōu)勝鄰域內(nèi)更新節(jié)點(diǎn)的權(quán)重公式為
式中: θ(u,v,s)為對更新的約束,基于離BMU 的距離,即鄰域函數(shù)的返回值; α (s)為 學(xué)習(xí)率;D(t)為輸入層神經(jīng)元;W_v(s+1)為s+1時(shí) 刻節(jié)點(diǎn)v的權(quán)重;W_v(s)是節(jié)點(diǎn)v當(dāng)前的權(quán)重。
在完成一輪迭代(迭代次數(shù) + 1)后,然后繼續(xù)輸入下一個(gè)樣本,直到滿足設(shè)定的迭代次數(shù),完成SOM神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
2) HI 曲線評估健康狀態(tài)
將測試集數(shù)據(jù)作為道岔轉(zhuǎn)轍設(shè)備特征參數(shù)輸入到訓(xùn)練好的SOM 網(wǎng)絡(luò)中,確定網(wǎng)絡(luò)權(quán)值,計(jì)算對應(yīng)的MQE 值,也稱為設(shè)備的HI 值。最小量化誤差(MQE)是源于SOM 神經(jīng)網(wǎng)絡(luò)算法的一個(gè)概念,是指輸入向量與BMU 權(quán)重向量的距離,其值的大小可以衡量道岔轉(zhuǎn)轍設(shè)備的健康狀況。輸入向量與BMU 距離越遠(yuǎn),HI 值越大,說明此時(shí)道岔轉(zhuǎn)轍設(shè)備的健康狀況離基準(zhǔn)健康狀況差距越大;反之,距離越近,說明此時(shí)道岔轉(zhuǎn)轍設(shè)備的健康狀況離基準(zhǔn)健康狀況越貼近,狀態(tài)越好。設(shè)備的HI 值計(jì)算公式為
式中:XK為 某一時(shí)刻下的數(shù)據(jù);WK為該數(shù)據(jù)在自組織映射神經(jīng)網(wǎng)絡(luò)中的最佳匹配神經(jīng)元的權(quán)值。
道岔轉(zhuǎn)轍設(shè)備的健康閾值確定為設(shè)備正常狀態(tài)下HI 曲線中最大MQE,即 H IMAX值,超出閾值視為健康狀況不佳,以此評估設(shè)備的健康狀態(tài)。
長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(Long short term memory,LSTM)是一種遞歸神經(jīng)網(wǎng)絡(luò)[17-19]。其作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN 網(wǎng)絡(luò)),彌補(bǔ)了傳統(tǒng)RNN 網(wǎng)絡(luò)只能記憶短序列的缺點(diǎn)。
LSTM 具有使得“門”的信息增加或刪除一直達(dá)到理想細(xì)胞狀態(tài)的能力,這種能力是通過被稱為門限的結(jié)構(gòu)來實(shí)現(xiàn)的。門限是一種可以讓信息選擇性通過的方式,由Sigmoid 神經(jīng)網(wǎng)絡(luò)層和逐點(diǎn)相乘器組成,LSTM 包括3 個(gè)門限:輸入門、忘記門及輸出門[17]。圖3 為LSTM 神經(jīng)網(wǎng)絡(luò)原理圖,每個(gè)時(shí)間點(diǎn)對應(yīng)一個(gè)狀態(tài)Ct,此狀態(tài)記錄了之前的狀態(tài)信息,每個(gè)時(shí)間點(diǎn)的Ct都可通過控制權(quán)重,遺忘等方式修整,神經(jīng)元狀態(tài)如同一個(gè)傳送帶,使信息在傳送帶上傳播,狀態(tài)卻不會(huì)改變。
圖3 LSTM 原理框圖Fig.3 Block diagram for LSTM principles
利用LSTM 具有選擇性記憶的優(yōu)勢,本文用作對道岔轉(zhuǎn)轍設(shè)備健康因子曲線的預(yù)測。以SOM 神經(jīng)網(wǎng)絡(luò)得到的健康因子作為預(yù)測算法輸入,去預(yù)測設(shè)備后續(xù)的健康因子。具體步驟如下:
步驟1 創(chuàng)建LSTM 網(wǎng)絡(luò)結(jié)構(gòu),確定損失函數(shù)。本文采用均方誤差(MSE)作為損失函數(shù)。計(jì)算公式為
式中:x1(i) 為 實(shí)際值;x(i)為 預(yù)測值;n為樣本數(shù)目。
步驟2 初始化各個(gè)參數(shù),為使模型準(zhǔn)確率達(dá)到想要的精度,需對參數(shù)進(jìn)行不斷更新,直至損失函數(shù)收斂完成模型訓(xùn)練。本文采用Adagrad 優(yōu)化算法對參數(shù)進(jìn)行優(yōu)化。
步驟3 利用測試數(shù)據(jù)在訓(xùn)練好的LSTM 上進(jìn)行預(yù)測。
為驗(yàn)證本文方法的有效性,采用2021 年蘭州站某道岔轉(zhuǎn)轍設(shè)備2 月26 日-6 月10 日現(xiàn)場監(jiān)測數(shù)據(jù)中600 組數(shù)據(jù)。依據(jù)常規(guī)神經(jīng)網(wǎng)絡(luò)訓(xùn)練集與測試集7∶3 原則,訓(xùn)練集數(shù)據(jù)確定420 組,測試集數(shù)據(jù)確定180 組。
根據(jù)數(shù)據(jù)處理結(jié)果,確定輸入層神經(jīng)元個(gè)數(shù)為24 個(gè),競爭層神經(jīng)元結(jié)構(gòu)為6*6。設(shè)置其訓(xùn)練次數(shù)為1 000 次。構(gòu)建的SOM 神經(jīng)網(wǎng)絡(luò)如圖4 所示。道岔轉(zhuǎn)轍設(shè)備的特征參數(shù)輸入到SOM 神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)經(jīng)過不斷迭代之后會(huì)自動(dòng)聚類。圖5 給出了鄰近神經(jīng)元之間的距離分布,連接帶的深淺可以看出距離的遠(yuǎn)近,距離越近顏色越淺。
圖4 SOM 神經(jīng)網(wǎng)絡(luò)6*6 拓?fù)浣Y(jié)構(gòu)Fig.4 SOM neural network's 6 * 6 topological structure
圖5 鄰近神經(jīng)元之間的距離分布Fig.5 Distance distribution between adjacent neurons
道岔第1 次到第180 次的道岔轉(zhuǎn)轍設(shè)備健康因子曲線如圖6 所示,可看出道岔動(dòng)作在前期雖有小幅度波動(dòng)但整體較為穩(wěn)定。但在道岔動(dòng)作第92 次和第97 次之間HI 曲線出現(xiàn)了尤為明顯的波動(dòng),此時(shí)HI 值尖峰較高,凸起明顯,說明此階段設(shè)備健康狀態(tài)發(fā)生突變。除去道岔第92 到第97 動(dòng)異常狀況下HI 曲線,得到道岔轉(zhuǎn)轍設(shè)備正常狀態(tài)下的HI 最大值為0.311 35,由此確定設(shè)備健康閾值為0.311 35,超出閾值視為健康狀態(tài)不佳。
圖6 道岔轉(zhuǎn)轍設(shè)備HI 曲線圖Fig.6 HI curve of switch equipment
圖7 為道岔轉(zhuǎn)轍設(shè)備第90 次到第100 次的功率曲線。圖中表明道岔功率曲線在第92 動(dòng)至第97 動(dòng)的臨近鎖閉階段出現(xiàn)小尖峰,說明此時(shí)道岔轉(zhuǎn)轍設(shè)備健康狀況不佳,與現(xiàn)場工作人員交流得知是由于道岔鎖閉時(shí)遇到阻力。其余時(shí)間道岔功率曲線狀態(tài)正常,無明顯波動(dòng)。此分析結(jié)果與圖6 分析結(jié)果相符,佐證了SOM 算法對評估道岔轉(zhuǎn)轍設(shè)備健康狀態(tài)的有效性。
圖7 道岔轉(zhuǎn)轍設(shè)備功率圖Fig.7 Diagram of switch equipment's power
2.2.1 算法評價(jià)標(biāo)準(zhǔn)
實(shí)驗(yàn)數(shù)據(jù)采用經(jīng)SOM 算法得到的180 組HI數(shù)據(jù),依據(jù)7:3 劃分確定訓(xùn)練集數(shù)據(jù)126 組,測試集數(shù)據(jù)54 組。
為驗(yàn)證LSTM 算法對預(yù)測設(shè)備健康因子的準(zhǔn)確性,利用平均相對誤差(MRE),均方根誤差(RMSE),決定系數(shù)(R2)這3 個(gè)評價(jià)指標(biāo)對預(yù)測結(jié)果進(jìn)行分析評價(jià),其中平均相對誤差及均方根誤差越小,決定系數(shù)越趨近于1,說明算法預(yù)測效果越好。具體計(jì)算公式如下:
1) 平均相對誤差(MRE)
2.2.2 算法預(yù)測結(jié)果及分析
選取RNN 神經(jīng)網(wǎng)絡(luò)與BP 神經(jīng)網(wǎng)絡(luò)做預(yù)測對比算法,確定RNN 與BP 學(xué)習(xí)率為0.001,迭代次數(shù)100次,RNN 神經(jīng)網(wǎng)絡(luò)激活函數(shù)使用Relu,隱藏層神經(jīng)元個(gè)數(shù)依據(jù)經(jīng)驗(yàn)公式求得,即
式中:m為 隱藏層神經(jīng)元個(gè)數(shù);p和q為輸入輸出層神經(jīng)元個(gè)數(shù),p=q= 1;a為常數(shù),a= 10。
將道岔轉(zhuǎn)轍設(shè)備用SOM 算法得到的健康因子數(shù)據(jù)作為LSTM、BP、RNN 神經(jīng)網(wǎng)絡(luò)輸入,對應(yīng)的預(yù)測數(shù)據(jù)作為輸出,得到的實(shí)際健康因子曲線與預(yù)測值對比結(jié)果如圖8 所示。從圖8 中可看出LSTM、BP 及RNN 算法在道岔轉(zhuǎn)轍設(shè)備健康因子預(yù)測方面都具有較好的預(yù)測效果,其中LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果對真實(shí)HI 曲線有著更好的擬合效果。
圖8 LSTM、BP、RNN 預(yù)測設(shè)備HI 結(jié)果Fig.8 LSTM, BP, RNN prediction equipment's HI results
為進(jìn)一步驗(yàn)證預(yù)測效果,通過MRE,RMSE 和決定系數(shù)這3 個(gè)指標(biāo)對預(yù)測結(jié)果進(jìn)行評價(jià),指標(biāo)計(jì)算結(jié)果如表2 所示。
表2 不同預(yù)測算法實(shí)驗(yàn)結(jié)果對比Tab.2 Comparison of experimental results of different prediction algorithms
分析可知:MRE 指標(biāo)下LSTM 神經(jīng)網(wǎng)絡(luò)較BP 神經(jīng)網(wǎng)絡(luò)降低0.598%,較RNN 神經(jīng)網(wǎng)絡(luò)降低0.110%;RMSE 指標(biāo)下LSTM 較BP 神經(jīng)網(wǎng)絡(luò)降低0.774%,較RNN 神經(jīng)網(wǎng)絡(luò)降低0.583%;決定系數(shù)指標(biāo)下LSTM較BP 提高0.089,較RNN 神經(jīng)網(wǎng)絡(luò)提高0.116。數(shù)據(jù)結(jié)果表明LSTM 在預(yù)測道岔轉(zhuǎn)轍設(shè)備健康因子的問題上有著更高的準(zhǔn)確率,具有良好的預(yù)測性能。
本文結(jié)合目前鐵路行業(yè)技術(shù)的快速發(fā)展,提出一種結(jié)合SOM 和LSTM 的方法對道岔轉(zhuǎn)轍設(shè)備的健康狀態(tài)進(jìn)行評估及預(yù)測,得到如下結(jié)論:
1)對道岔轉(zhuǎn)轍設(shè)備功率曲線分3 段提取時(shí)域特征參數(shù),可有效表征整個(gè)功率曲線特征,并達(dá)到數(shù)據(jù)降維的效果。
2)利用SOM 神經(jīng)網(wǎng)絡(luò)計(jì)算得到的健康因子曲線可較好的反映道岔轉(zhuǎn)轍設(shè)備的健康狀況,健康閾值確定為0.311 35,對超出閾值的不良狀態(tài)判斷較為準(zhǔn)確。
3)LSTM 神經(jīng)網(wǎng)絡(luò)預(yù)測效果相較于BP 神經(jīng)網(wǎng)絡(luò)和RNN 神經(jīng)網(wǎng)絡(luò),預(yù)測平均相對誤差分別降低0.598%和0.110%;預(yù)測均方根誤差分別降低0.774%和0.583%,;預(yù)測決定系數(shù)分別提升0.089 和0.116,有效實(shí)現(xiàn)對道岔轉(zhuǎn)轍設(shè)備健康因子的較精確預(yù)測。