呂明珠
(1.遼寧裝備制造職業(yè)技術(shù)學院 自控學院,沈陽 110161;2.遼寧廣播電視大學,沈陽 110034)
滾動軸承是旋轉(zhuǎn)機械中的重要部件,其性能是否穩(wěn)定對機械系統(tǒng)的安全運行至關(guān)重要[1-2]。軸承的運行工況復雜多變,容易產(chǎn)生各種故障,不僅影響工作效率,還會造成經(jīng)濟損失甚至嚴重威脅人身安全。如果能準確評估和預測性能退化的趨勢,則可以及時識別和更換故障軸承,從而大大減小資源浪費和經(jīng)濟損失,滾動軸承性能退化趨勢預測研究對機械系統(tǒng)的可靠性和安全性具有重要意義。
近年的數(shù)據(jù)預測分析算法大致可以劃分為基于模型驅(qū)動的預測算法和基于數(shù)據(jù)驅(qū)動的預測算法[3-4]?;谀P万?qū)動的方法是通過建立一個數(shù)學模型來描述和預測系統(tǒng)的退化機制,很難用精確的模型來表達復雜的退化過程及其機理,無法解決實際軸承的退化趨勢預測問題。基于數(shù)據(jù)驅(qū)動的方法可以直接使用以監(jiān)控信息為主的數(shù)據(jù)源而無需探索退化機理,從而克服了基于模型驅(qū)動的方法存在的局限性。
隨著工業(yè)信息化、大數(shù)據(jù)技術(shù)和人工智能計算技術(shù)的不斷進步,許多基于深度學習的計算方法被廣泛應用于數(shù)據(jù)預測處理領(lǐng)域,如BP神經(jīng)網(wǎng)絡(Back Propagation Neural Network,BPNN)[5]、支持向量回歸(Support Vector Regression,SVR)[6]等,但是這些模型很少考慮歷史信息對未來信息的累積影響。長短時記憶(Long Term Short Term Memory,LSTM)將以往的信息重新計算出一個單元的狀態(tài),提供自相關(guān)特征且能夠解決梯度消失和爆炸問題[7];然而,傳統(tǒng)的LSTM方法不能合理利用在線數(shù)據(jù)進行參數(shù)實時更新,不適合解決小樣本數(shù)據(jù)的長期預測問題。
針對上述不足,本文提出一種基于改進LSTM的滾動軸承性能退化趨勢預測方法,基本思想是利用傳統(tǒng)LSTM方法的前向計算建立一個初始預測模型,利用新的在線觀測數(shù)據(jù)實時更新模型參數(shù)以達到預測誤差最小化,最終實現(xiàn)在樣本數(shù)據(jù)較少的情況下對軸承退化趨勢進行可靠的預測。
循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)由輸入層、隱含層和輸出層組成,有一定的記憶功能,神經(jīng)元的輸出可直接應用于自身,能很好地解決與時間軸相關(guān)的問題(如軸承退化問題)。RNN在時間軸上的展開如圖1所示:RNN的鏈式結(jié)構(gòu)使層間的神經(jīng)元之間建立了權(quán)連接,使得歷史輸出也會對當前輸出帶來影響。利用反向傳播算法可以實現(xiàn)RNN的參數(shù)訓練,然而處理長時序列數(shù)據(jù)時,隨著時間的增加,反向傳播算法返回的誤差梯度會在時間軸上逐漸消失,以前信息的權(quán)重不能很好地更新,會導致后續(xù)時刻的信息漸變消失[8]。
圖1 RNN單元展開圖Fig.1 Expansion diagram of RNN unit
為更好地解決RNN的梯度消失和梯度爆炸等問題,LSTM神經(jīng)網(wǎng)絡通過引入一組存儲單元,使得網(wǎng)絡能夠?qū)W習何時記住歷史信息和何時更新存儲單元[9],其結(jié)構(gòu)如圖2所示。LSTM最關(guān)鍵的組成部分是單元狀態(tài),單元狀態(tài)類似于傳動帶,信息可以在整個鏈中循環(huán)。這種選擇性的決定信息是添加還是刪除的結(jié)構(gòu)叫做門(gates),LSTM中共有3個這樣的門控制單元狀態(tài),分別是輸入門、遺忘門和輸出門。
圖2 LSTM單元結(jié)構(gòu)圖Fig.2 Structure diagram of LSTM unit
LSTM網(wǎng)絡的訓練過程如下:
1)對訓練數(shù)據(jù)進行預處理(規(guī)范化等操作)。
2)初始化網(wǎng)絡的權(quán)重、偏移量以及超參數(shù)。
3)計算LSTM前向傳播處理過程,得到LSTM預測值。
4)獲取預測值與真實值之間的偏差。
5)確定訓練過程是否達到誤差閾值或最大迭代次數(shù)。如果達到終止條件,則退出訓練,否則使用誤差反向傳播算法更新網(wǎng)絡參數(shù),然后再返回到步驟3。
針對實際問題,在只有部分生命周期觀測數(shù)據(jù)可用的情況下(小樣本數(shù)據(jù)),利用在線數(shù)據(jù)更新網(wǎng)絡參數(shù)并建立更有效的退化趨勢預測模型。首先,依據(jù)獲得的歷史數(shù)據(jù)生成LSTM離線預測模型;然后,采集在線新數(shù)據(jù)時利用離線預測模型前向計算得到預測值,將新的觀測數(shù)據(jù)作為前一個采樣時刻的真實值并將預測值與真實值之間的偏差累加到整體誤差中;最后,通過誤差最小化的方法不斷修正、更新模型參數(shù)。隨著采集數(shù)據(jù)的增加,模型預測的準確度也不斷提高。這種建模思想更有利于真實場景中小樣本系統(tǒng)的在線監(jiān)測和故障預警。
將本文提出的方法稱為改進LSTM,并結(jié)合圖2描述其基本思路:
1)處理單元狀態(tài)中的保留信息。由遺忘門完成,在讀取ht-1和xt后通過sigmoid激活函數(shù)輸出一個0~1之間的值(0代表全部遺忘,1代表全部保留,也叫做占比),單元狀態(tài)中的每個數(shù)字都要乘以此占比,從而達到判斷這些信息是否有用以及有選擇性地保留單元信息的目的。
2)確定在單元狀態(tài)中可以存儲哪些信息。第1部分是sigmoid輸入門,決定哪個值需要更新;第2部分是使用雙曲正切傳遞函數(shù)(tanh)創(chuàng)建一個新的候選值Ct,這個過程是確認更新的信息。
3)更新舊的單元狀態(tài),即將Ct-1更新到Ct。將舊狀態(tài)Ct-1乘以遺忘門的輸出ft,將不需要的信息丟棄后加上新的候選值itCt。
4)確定要輸出的值。通過一個sigmoid層(輸出門)確定單元狀態(tài)的哪些部分將被輸出,用雙曲正切傳遞函數(shù)(tanh)處理單元狀態(tài)并乘以輸出門的輸出ot來確定輸出部分。改進LSTM在每個時間點t都進行參數(shù)更新,如(1)式所示。
(1)
對于實際時間序列X=(x1,x2,…,xn),改進LSTM的具體步驟如下:
1)將X按(2)式展開,訓練數(shù)據(jù)標記為y=(xk,xk+1,…,xn),通過(3)式對X進行歸一化。
(2)
(3)
式中:n為時間序列長度;k為樣本維度;樣本數(shù)量為n-k+1。
2)初始化網(wǎng)絡參數(shù)并設置超參數(shù),即
(4)
式中:rand(·)表示產(chǎn)生隨機數(shù)的一個隨機函數(shù);L為LSTM單元個數(shù);N為LSTM神經(jīng)元個數(shù);M1,M2分別為最大迭代次數(shù)和誤差閾值。
3)計算單元狀態(tài)需要遺忘的信息,計算遺忘門的輸出并乘以前一時刻的單元狀態(tài)可得
(5)
4)計算當前時刻t時哪些輸入信息可以保持在單元狀態(tài)中。先確定輸入門的輸出it,決定將更新哪些值;再利用雙曲正切傳遞函數(shù)構(gòu)造一個新的候選向量Ct并將其乘以輸入門的輸出,即
(6)
5)計算當前單元狀態(tài)Ct,其由遺忘門和輸入門組合而成,即
(7)
6)計算t時刻的網(wǎng)絡輸出。先計算輸出門的輸出ot,通過當前單元狀態(tài)乘以輸出門的輸出就可以獲得當前時刻的輸出,即當前時刻的預測值ht。重復步驟3—6,就可以計算所有訓練樣本的預測值,則
ht=σ(Wo·[ht-1,xt]+bo)*tanh(Ct)。
(8)
7)計算所有樣本的預測值與真實值之間的誤差可得
(9)
式中:y為真實值;h為預測值。
如果誤差小于誤差閾值或當前迭代次數(shù)大于最大迭代次數(shù),則退出訓練過程;否則用反向傳播算法更新網(wǎng)絡參數(shù),迭代次數(shù)加1后返回步驟3,直到達到誤差閾值或最大迭代次數(shù)達到要求。訓練后的網(wǎng)絡參數(shù)為
θ0=(Wf,Wi,WC,Wo,C,h,bf,bi,bC,bo)。
(10)
8)帶有新參數(shù)集θ0的新樣本Xn+1(xn-k+2,…,xn+1)執(zhí)行步驟3—6所示的LSTM前向運算,得到新樣本的輸出預測值hn+1并計算總誤差,然后利用反向傳播算法對模型參數(shù)進行更新,即
θ1=(Wf-λ*ΔWf,…,bf-λ*Δbf),
(11)
式中:λ為學習速率;ΔWf,Δbf分別為神經(jīng)元的權(quán)值矩陣和偏移向量。由于參數(shù)迭代更新時選擇了歷史樣本的全局最優(yōu)解,因此循環(huán)過程很快收斂。
9)當下次采樣時的預測值達到故障點時,系統(tǒng)將啟動故障警告并制定運維策略,以防止造成進一步損失甚至安全事故。
均方根(Root Mean Square,RMS)描述了振動信號的有效幅值,也被稱為有效值,能夠反映振動信號的能量和變化趨勢,很多標準都采用RMS作為狀態(tài)監(jiān)測的特征參數(shù)[10]。RMS通過計算信號樣本平方和均值的平方根獲得,即
(12)
式中:x(i)為第i個信號樣本;n為樣本個數(shù)。
由于振動信號RMS的穩(wěn)定性和趨勢性較好,且可以隨故障演變而變化,在軸承性能退化的早期保持相對平穩(wěn)狀態(tài),在性能退化后期由于軸承損傷嚴重影響設備的正常運行而迅速增加[11],因此RMS已成為廣泛應用于軸承故障診斷領(lǐng)域的反映軸承狀態(tài)的退化指標。
然而,即使在相同的測試條件下,不同軸承的RMS也會有很大差異,如圖3所示。這種情況會干擾軸承退化階段的判斷,且難以在故障預測過程
圖3 不同軸承的RMS值Fig.3 RMS values for different bearings
中設置閾值。因此,本文提出了相對均方根(Relative Root Mean Square,RRMS)作為振動特征指標,其定義為
(13)
式中:xbase為基準值,是軸承相對平坦的偶發(fā)性故障階段內(nèi)RMS的平均值。軸承的單個差異不會影響RRMS,因為它是一個比值指標。
此外,RMS中的雜散波動對退化趨勢預測性能的影響很大,在軸承從運行到故障的發(fā)展過程(圖3)中,振動信號的RMS顯示了虛假的波動。這種RMS的波動由損傷傳播引起,當軸承上的小裂紋形成和擴展時,RMS開始增大;當小裂紋邊緣通過連續(xù)滾動接觸變得平滑時,RMS減?。浑S著軸承受損區(qū)域的擴大,RMS再次增大;有時來自機器其他部件的傳感器噪聲和振動也會引起波動。因此,需要對這種虛假波動進行平滑處理,采用7點3次的平滑方法減少隨機波動的影響,即
(14)
式中:x為平滑處理前的信號;xMA為平滑處理后的信號;k為信號的采樣點,k=1,2,…,N。
平滑處理后的RRMS不僅對形成的缺陷很敏感,能夠隨著缺陷的增長而增大,而且消除了虛假波動的影響。如圖4所示,RRMS的前期增長緩慢,后期增長迅速,符合軸承性能退化演變規(guī)律。
圖4 平滑處理后不同軸承的RRMS值
對于漸進退化的滾動軸承,基于改進LSTM的性能趨勢預測流程分為離線模型生成和在線參數(shù)更新2個階段,如圖5所示。
離線階段:
1)收集軸承歷史振動信號,進行信號預處理和參數(shù)初始化;
2)對樣本進行LSTM前向計算,利用BP算法動態(tài)更新網(wǎng)絡參數(shù)和學習策略;
3)求出整體誤差并判斷是否達到迭代終止條件;
4)若滿足終止條件,則保留訓練好的模型參數(shù)。
在線階段:
1)采集當前振動信號,加入模型參數(shù)的訓練過程;
2)生成預測模型并根據(jù)退化趨勢判斷預測值是否到達故障點;
3)若沒有達到故障點,則利用當前樣本繼續(xù)訓練模型直至達到故障點,啟動故障預警。
圖5 滾動軸承性能退化趨勢預測流程圖
3.1.1 數(shù)據(jù)描述
使用美國辛辛那提大學智能維護系統(tǒng)(IMS)公布的滾動軸承外圈故障全壽命數(shù)據(jù)[12]驗證本文所提方法的有效性。試驗臺結(jié)構(gòu)簡圖如圖6所示,試驗軸承為ZA-2115型雙列圓柱滾子軸承,主軸轉(zhuǎn)速2 000 r/min,每套軸承的垂直和水平方向各安裝1個PCB353B33高靈敏度石英ICP加速計用于采集其振動信號。
本節(jié)采用軸承1外圈的全壽命周期數(shù)據(jù),采樣頻率為20 kHz,每隔10 min采集1次,共采集了984組數(shù)據(jù)。
圖6 軸承全壽命試驗臺Fig.6 Full life bearing test rig
3.1.2 結(jié)果分析與對比
為說明改進LSTM預測方法的有效性,選擇前期正常狀態(tài)下的510組數(shù)據(jù)作為訓練樣本,采用傳統(tǒng)LSTM、支持向量回歸(SVR)和BP神經(jīng)網(wǎng)絡(BPNN)同時進行預測分析及對比,各方法對軸承性能退化的預測結(jié)果及其均方根誤差如圖7所示。由圖7可知:所有的預測方法在短期預測范圍內(nèi)(5 100~7 000 min)都能很好地處理歷史數(shù)據(jù);但在長期預測過程中,明顯看出幾種傳統(tǒng)方法的預測效果并不理想,這是因為傳統(tǒng)方法在歷史數(shù)據(jù)不夠豐富的情況下無法訓練更好的預測模型,而改進LSTM可以利用更多的在線數(shù)據(jù)更新預測模型的參數(shù),得到了較理想的預測結(jié)果,預測誤差最小。
圖7 不同方法的軸承性能退化趨勢預測對比
幾種方法的各項性能見表1:由于改進LSTM算法實現(xiàn)了模型參數(shù)的實時更新,從而大大縮短了離線學習的時間,訓練時間最短;BPNN和SVR的有效預測時間很短且不能預測故障點,LSTM的有效預測時長為4 070 min,預測的失效時刻為9 800 min,改進LSTM的有效預測時長為4 740 min,預測的失效時刻為9 790 min,實際的失效時刻為9 840 min。有效預測時長越長說明模型預測準確度越高,預測的失效時刻比實際失效時刻超前則可以更早提醒維護人員做出預防性維護決策,避免重大安全事故的發(fā)生。由此可見,改進LSTM算法具有更準確的預測性能,不僅預測的失效時刻早于實際失效時刻,還能在性能退化動態(tài)發(fā)展過程中進行有效預測,有利于識別軸承退化的不同階段,對軸承的運行安全性進行更有效的評估,在訓練時間、預測能力和準確度方面優(yōu)于其他3種方法。
表1 不同預測方法的性能對比
以美國綠色能源監(jiān)測系統(tǒng)提供的2.2 MW風電機組的實際高速軸軸承數(shù)據(jù)為例進行算法有效性驗證[13],高速軸轉(zhuǎn)速為1 800 r/min,被測軸承為32222-J2-SKF型圓錐滾子軸承,外徑為200 mm,內(nèi)徑為110 mm,寬度為56 mm,滾子數(shù)為 20,圓錐角為16°。采用MEMS加速度傳感器采集被測軸承(齒輪箱后軸承)的徑向振動數(shù)據(jù),采樣頻率為97 656 Hz,每隔6 s采集1次,每天記錄585 936個樣本,監(jiān)測50天后軸承失效,原因為內(nèi)圈裂紋故障。風電機組高速軸軸承的測試環(huán)境和故障位置如圖8所示。
圖8 風力發(fā)電機組高速軸軸承測試環(huán)境及其內(nèi)圈故障
采用改進LSTM方法對風電機組高速軸軸承的性能趨勢進行預測,以前期第1—10天的振動數(shù)據(jù)作為模型的訓練數(shù)據(jù),并通過在線不斷更新模型參數(shù)得到后40天的預測值,結(jié)果如圖9所示。由圖9可知:由于前期的歷史訓練數(shù)據(jù)不充足,而且實際RRMS波動顯著,預測值與真實值存在一定偏差;然而,預測值很好地體現(xiàn)了軸承性能漸進演變的退化趨勢,如預測的早期退化階段為第11—29天,僅比真實值(第28天)延遲了1天;另外,預測的軸承發(fā)展期退化過程也能很好的體現(xiàn)動態(tài)變化過程中急劇上升→輕微下降→再上升的趨勢,說明改進LSTM方法可以很好地預測風電機組高速軸軸承的退化趨勢,為預防性維護策略的制定提供參考。
圖9 改進LSTM方法對風電機組高速軸軸承的預測結(jié)果
提出的改進LSTM方法是一種基于誤差最小化的實時更新方法,能夠在樣本數(shù)據(jù)較少的情況下在線更新模型,使代價函數(shù)最小化,解決了傳統(tǒng)LSTM不能合理利用在線數(shù)據(jù)的問題。以辛辛那提大學IMS提供的全壽命軸承數(shù)據(jù)集為例,驗證了改進LSTM方法在訓練時間、預測能力和準確度方面相對傳統(tǒng)LSTM,SVR和BPNN方法的優(yōu)越性,為小樣本數(shù)據(jù)的長期預測提供了理論依據(jù);此外,通過實際風電機組高速軸軸承的退化趨勢預測進一步說明了改進LSTM方法在工業(yè)應用中的價值。