衛(wèi)炳坤 王慶鋒* 劉家赫 張?zhí)镉?/p>
(1.北京化工大學 機電工程學院,北京 100029;2.北京化工大學 高端機械裝備健康監(jiān)控及自愈化北京市重點實驗室,北京 100029;3.中國航天標準化與產品保證研究院,北京 100166)
國內煉油與化工生產裝置規(guī)模大型化發(fā)展趨勢明顯,與其配套的旋轉機械設備也向大型化、高速化、自動化和智能化方向發(fā)展,而設備故障導致的非計劃停機不僅會造成巨大的經濟損失,而且可能會帶來災難性的火災、爆炸等安全事故,因此實現(xiàn)預測性維修對于確保設備安全、可靠運行具有重要作用。故障類型按故障發(fā)生、發(fā)展的過程分為突發(fā)性故障和漸變性故障,一般漸變性故障具有可檢測性與可預測性。研究設備性能退化預測技術并開展預測性維修,可使運行維護人員來預防故障或為故障的發(fā)生做好充足準備,并最大限度地減少計劃外維修帶來的損失[1],具有重要的工程應用價值和實踐意義。
設備性能退化預測技術是剩余使用壽命預測技術的間接表達,通過預設報警閾值也可以達到壽命預測目的。Pecht等[2]和Lei等[3]將剩余壽命預測方法總體上分為3類:基于機理模型的方法、數(shù)據驅動的方法和兩者相融合的方法?;跈C理模型的方法是在深入分析設備失效機理的基礎上建立退化模型,但由于實際運行設備機理模型幾乎難以實現(xiàn)導致其應用并不廣泛[4]。隨著傳感技術的發(fā)展以及預測和健康管理理念的深入人心,基于數(shù)據驅動的退化預測方法引起國內外學者的重視。
系統(tǒng)設備狀態(tài)數(shù)據含有豐富的健康信息,是數(shù)據驅動故障診斷和預測技術的基石,其難點在于由歷史數(shù)據得到的故障預測模型如何延拓,才能保證中長期故障預測的準確性[5]。基于數(shù)據驅動的退化預測主要分為統(tǒng)計學習方法與機器學習方法,其中機器學習方法在退化趨勢預測中表現(xiàn)出良好的性能。陳強強等[6]采用基于分解-粒化和優(yōu)化極限學習機的燃油泵性能退化趨勢預測,構建退化的置信區(qū)間來綜合表達設備退化信息;胡友濤等[7]提出了基于小波支持向量回歸機和模糊C均值聚類的實時壽命預測方法,利用同類產品的性能退化數(shù)據對特定個體的壽命進行實時預測;Wang等[8]采用時間序列分析和反向傳播(BP)神經網絡相結合的方法對冷卻風機進行剩余壽命預測;李志剛等[9]采用徑向基神經網絡用于繼電器壽命預測。然而上述方法都是利用機器學習中的淺層學習機[10](包括支持向量回歸、BP神經網絡、極限學習機、多層感知機等)預測退化趨勢,并未充分發(fā)掘數(shù)據中的隱含信息。
隨著人工智能的發(fā)展,深度學習理論在性能退化趨勢預測或壽命預測領域逐漸得到應用。吳金棟[11]提出基于動態(tài)長短期記憶網絡(LSTM)和自回歸積分滑動平均模型的發(fā)動機剩余壽命預測模型,然而LSTM只是用來提取設備的退化特征并未應用到預測。李京峰等[12]提出基于LSTM與深度置信網絡(DBN)的航空發(fā)動機剩余壽命預測;張繼冬等[13]提出基于全卷積層神經網絡的軸承剩余壽命預測;宋亞等[14]提出基于自編碼和雙向LSTM(Bi-LSTM)的渦扇發(fā)動機剩余壽命預測。但以上文獻以及目前研究的熱點均基于相似模型理論,通過對某一實驗室數(shù)據或相似工況下的“運轉到壞(run to failure)”數(shù)據訓練后作退化趨勢擬合,即知道失效時刻(標簽數(shù)據)而后反推剩余壽命。然而在實際工廠活動中多變的工況會使實驗室訓練的模型無法直接應用到實際案例上,相似工況也并不能保證發(fā)生的故障相似。同時,目前基于深度學習理念的預測工作往往在模型訓練完后再不斷地進行預測,并未將預測的數(shù)據反饋給數(shù)據池重新訓練模型以進行下一步預測,固定的模型將會導致累計誤差不斷增大。
因此,本文提出一種融合趨勢濾波、模糊信息?;?、動態(tài)長短期記憶網絡的旋轉機械退化趨勢與退化區(qū)間預測方法,以振動信號為例,首先提取表達設備性能退化信息的特征指標,然后通過趨勢濾波與模糊信息?;崛≈饕耐嘶厔菖c模糊退化邊界,其次利用動態(tài)LSTM模型進行綜合的性能退化預測,給出未來時刻設備的主要退化趨勢和模糊退化區(qū)間。
對于連續(xù)采集的旋轉機械的振動信號序列而言,有效的特征指標可完整地表達設備的運行可靠性與性能退化狀況。何正嘉等[15]對機械設備在運行過程中的可靠性進行評估,提出譜距離指標法、相關系數(shù)法、凝聚函數(shù)法、狀態(tài)參量法、信息熵法等一系列歸一化的度量指標。對于同一臺旋轉機械,以運行優(yōu)良的狀態(tài)為參考,評估未知狀態(tài)機械的健康度可采用譜距離指標法。待評估信號與運行優(yōu)良狀態(tài)信號的譜距離系數(shù)值越大,說明該時刻旋轉機械的運行狀態(tài)越好,譜距離系數(shù)越小,說明該時刻旋轉機械的運行狀態(tài)越差[15]。
假設兩個信號的功率譜密度函數(shù)分別為S1與S2,該兩組信號的對稱化距離如式(1)所示[16]。
(1)
當q=1,d(S1,S2)=dIS(S1,S2)時,式(2)即成為J散度,計算公式如式(2)。
(2)
則該兩信號的譜距離函數(shù)H(Jx,y)如式(3)所示。
(3)
式中,α為靈敏度系數(shù),由設備性能退化趨勢決定,α∈(0,1];Jx,y是良好狀態(tài)信號x(t)和待評估狀態(tài)信號y(t)之間的J散度;下標IS表示對稱化距離,N表示第N組信號。
假設一個標準的時間序列yt是由一個基本趨勢xt和一個隨機變量zt(t=1,…,n)組成。趨勢濾波就是從標準的時間序列中估計出基本趨勢xt,或者估計出隨機變量zt=yt-xt[17]。l1趨勢濾波是在Hodrick-Prescot濾波基礎上發(fā)展來的,使用l1趨勢濾波對監(jiān)測參數(shù)趨勢數(shù)據進行濾波處理,能夠很好地得到旋轉機械的退化趨勢。
l1趨勢濾波算法通過最小化加權目標函數(shù)實現(xiàn)趨勢估計,加權目標函數(shù)為
(4)
其矩陣形式如式(5)所示。
(5)
式中,y=(y1,y2,…,yn)∈Rn,x=(x1,x2,…,xn)∈Rn,‖u‖1=Σi|ui|表示向量u的l1范數(shù),D∈R(n-2)×n是一個二階差分矩陣。
(6)
λ是一個非負參數(shù)用來控制x的平滑性和平衡余項的大小。加權目標函數(shù)對x來說是一個嚴格的凸函數(shù),所以只有一個最小值,用xlt表示,因此xlt就是濾波后的趨勢[17]。
文獻[18]指出,l1趨勢濾波求解問題可以等同于對正則化l1最小二乘求解問題
(7)
式中,θ=(θ1,…,θn)∈Rn,A是下三角矩陣
(8)
通過最小二乘法求得此問題結果θlt,則l1趨勢濾波結果xlt=Aθlt。
模糊信息?;@一概念由Zadeh[19]提出。一個信息整體分解成若干個信息塊,每個信息塊中的信息元素由于相似、接近或具有某種功能而結合在一起,這樣的信息塊稱為信息粒[20-21]。對于旋轉機械退化預測主要分為窗口劃分與信息模糊化兩個步驟。窗口劃分就是將整個時間序列按時間尺度劃分為若干個子序列,每個子序列作為一個操作窗口;信息模糊化就是通過一定的模糊規(guī)則提取出每個操作窗口的有效退化信息,生成一個個模糊信息粒的過程。信息模糊化的重點是所生成的模糊信息粒能夠取代原窗口中的信息,即根據模糊概念G建立的模糊粒子P可以表達模糊窗口X。因此模糊化過程本質上就是確定模糊概念G的隸屬函數(shù)M的過程。采用三角形模糊粒子求得窗口數(shù)據的最大值、最小值和平均值,其隸屬函數(shù)M可表示為[22]
(9)
式中,x是窗口中的變量;a、m、b為參數(shù),分別對應原始數(shù)據變化的最小值、平均值和最大值。模糊化后的最小值與最大值即為退化信息的模糊邊界。
循環(huán)神經網絡(RNN)是以時間序列為輸入,在序列演進方向遞歸且所有節(jié)點(循環(huán)單元)按鏈式遞接的遞歸神經網絡。然而一般的RNN存在長期依賴問題,LSTM神經網絡的提出解決了該問題,適合處理和預測時間序列中間隔和延遲相對較長的重要事件。如圖1所示,LSTM神經網絡每個時間狀態(tài)的網絡拓撲結構相同,在任意t時間下,包含輸入層、隱含層和輸出層。LSTM的隱含層的輸出一分為二,一份傳給輸出層,一份與下一時刻輸入層的輸出一起作為隱含層的輸入。
如圖2所示,單個LSTM區(qū)塊是由遺忘門、輸入門、輸出門3個門結構和細胞狀態(tài)構成,貫穿在區(qū)塊上的水平線為細胞狀態(tài),區(qū)塊內的矩陣是學習的神經網絡層,圓圈代表運算操作,箭頭表征向量的傳輸,橢圓為激活函數(shù)。
在遺忘門(圖2(a))中,來自上一層的輸出ht-1和本時刻的數(shù)據Xt通過sigmoid激活函數(shù)進行淘汰與選擇,將輸入數(shù)據進行部分拋棄,具體公式為
ft=σ{Wf[ht-1,Xt]+bf}
(10)
式中,Wf、bf為遺忘門的權重矩陣和偏置項;σ為sigmoid函數(shù)。
在輸入門(圖2(b))中更新單元狀態(tài),將部分記憶進行拋棄,部分記憶予以保存,并更新信息。根據式(11)決定更新的信息,根據式(12)計算備選的用來更新的內容。
it=σ{Wi[ht-1,Xt]+bi}
(11)
(12)
式中,Wi、bi為輸入門的權重矩陣和偏置項;WC、bC為更新信息時的權重矩陣和偏置項。
(13)
在輸出門(圖2(d))中,通過式(14)來確定哪些狀態(tài)作為細胞輸出,然后將新的單元狀態(tài)通過tanh函數(shù)計算出輸出ht,如式(15)所示。
Ot=σ{Wo[ht-1,Xt]+bo}
(14)
ht=Ot×tanh (Ct)
(15)
式中,Wo、bo為輸出門的權重矩陣和偏置項。
如圖3所示,首先提取振動信號的特征指標來表達設備的歷史退化信息,然后通過趨勢濾波與模糊信息粒化提取主要退化趨勢與模糊退化邊界,之后利用動態(tài)LSTM進行模型訓練,最終給出綜合的性能退化預測。
在LSTM訓練模型中,本文采取的數(shù)據處理方式為多步動態(tài)預測,多步是指采用前n個時刻數(shù)據預測未來l個時刻數(shù)據,動態(tài)是指將預測l個時刻的數(shù)據返回數(shù)據池,重新學習模型進行下一次預測,直到達到預測需求。
如式(16)~(18)所示,選擇n=5,l=2時,t時刻構造的訓練數(shù)據為Xt=[xt-4,xt-3,xt-2,xt-1,xt],訓練標簽為Yt=[xt+1,xt+2]。
Xm=[xm-n,xm-n+1,…,xm]
(16)
Xtrain=[X0,X1,…,Xm]
(17)
Ytrain=[[x1,…,xl],[x2,…,xl+1],…,[xm+1,…,xl+m+1]]
(18)
式中,Xm為m時刻的輸入數(shù)據,Xtrain為模型的訓練數(shù)據集,Ytrain為訓練數(shù)據集的標簽。
在趨勢濾波的過程中,λ是一個非負參數(shù)用來控制x的平滑性和平衡余項的大小。由于本文只需要提取主要趨勢,且波動狀況由模糊邊界描述,所以λ可選擇盡量大,推薦選擇100。
在模糊信息?;^程中,選擇模糊窗口的大小應根據傳感器采樣間隔與需求決定,一般模糊窗口的大小為10。模糊窗口越大,模糊區(qū)間代表的信息也就越多,區(qū)間預測波動也會減小,區(qū)間更具代表性;模糊窗口越小,模糊區(qū)間代表的信息也就越少,區(qū)間預測波動會增大,區(qū)間更具準確性。
在LSTM模型中,模型的搭建有多種方式,本文選取了簡單的單層LSTM模型,由于運行可靠性數(shù)據本身已經在[0,1]區(qū)間,所以LSTM不添加歸一化層,但為保證批數(shù)據的快速運算,添加批歸一化層(batch normalization)。優(yōu)化器采用Adam優(yōu)化器,參數(shù)均為默認。LSTM模型中的超參數(shù)用交叉驗證方法且結合實際需求(如單次預測與總預測長度)擇優(yōu)。
為了公平地比較本文所提方法與其他方法在測試集上的泛化性能,選取均方根誤差ERMS(RMSE)來對退化效果進行評價,RMSE值越小,預測效果越好。同時在優(yōu)化超參數(shù)時也采用RMSE作為損失函數(shù)。
(19)
選取西安交通大學滾動軸承加速壽命實驗數(shù)據集(XJTU-SY軸承數(shù)據集)進行驗證,該數(shù)據集開展了歷時兩年的滾動軸承加速壽命實驗,共包含3種工況下15個滾動軸承的全壽命周期振動信號,關于軸承信息與傳感器采樣信息詳見文獻[23]。
3.2.1特征指標計算
本文以編號Bearing 3_2的數(shù)據集為例展示具體實驗過程。該數(shù)據集樣本總數(shù)為2 496,采樣頻率為25.6 kHz,采樣間隔為1 min,每次采樣時長為1.28 s。以第一組信號為參考,計算其譜距離指標如圖4所示。從圖中可以看出,在樣本編號1 000點后軸承開始逐步退化,對于大多數(shù)復雜機械系統(tǒng)而言,其失效過程大體可分為兩個階段:第一個階段是從系統(tǒng)安裝運行到出現(xiàn)異常的正常工作階段,在這一階段監(jiān)測得到的數(shù)據一般比較平穩(wěn),沒有明顯的趨勢出現(xiàn);第二階段是從出現(xiàn)異常點到系統(tǒng)退化至失效的過程,在這一階段監(jiān)測數(shù)據將呈現(xiàn)一定的退化趨勢[24]。以前1 000~2 000組為已知的歷史退化數(shù)據對未來一段時間內的數(shù)據進行預測。
3.2.2趨勢提取與模糊邊界提取
從圖4可以看出,盡管設備的退化信息已較為清楚,但由于采集誤差或其他原因,數(shù)據間的波動十分明顯,因此采用趨勢濾波的方法提取設備退化主要趨勢,λ依據推薦選擇100。設備退化的非趨勢項表明了設備的波動狀況,通過模糊信息?;姆绞教崛≡O備退化的模糊邊界,模糊窗口大小依據推薦選擇10,即每個模糊粒子代表長度為10的信息變化。所提取譜距離指標的主要趨勢與模糊邊界如圖5所示,可以看出設備的退化趨勢明顯,模糊邊界可覆蓋主要趨勢,因此將歷史數(shù)據的譜距離趨勢與模糊邊界作為訓練數(shù)據構建模型。
3.2.3LSTM模型訓練
首先在訓練數(shù)據中分離出驗證組作超參數(shù)優(yōu)化。以預測主要趨勢為例,其超參數(shù)優(yōu)化過程如表1所示,其中預測參數(shù)32-16的含義為需要前32組數(shù)據來預測未來16組數(shù)據,MRMSE為在驗證組上的平均均方根誤差。
表1 超參數(shù)優(yōu)化過程Table 1 Super-parameter optimization process
預測模糊邊界時超參數(shù)優(yōu)化過程同上,最終采用表2中的超參數(shù)訓練LSTM模型。
表2 退化預測與邊界預測超參數(shù)Table 2 Super-parameters of degradation prediction and boundary prediction
3.2.4訓練結果
初次趨勢預測模型訓練后,以歷史數(shù)據的最后128組數(shù)據作為輸入預測未來64組數(shù)據,而后預測數(shù)據返回模型繼續(xù)訓練,共預測未來192組的訓練結果。如圖6所示,模糊邊界預測模型預測方法同趨勢預測,預測未來20個模糊粒子,每個粒子代表10組數(shù)據,即代表未來200組數(shù)據的邊界變化情況。
如圖6所示,在預測退化趨勢時,設備譜距離指標從0.45下降到0.35左右,雖然第二次模型訓練完畢后預測的64組數(shù)據距離原始趨勢較遠,但由于模型的更新,第三次預測就較好地貼合了設備的趨勢變化,體現(xiàn)了動態(tài)模型的優(yōu)勢。第二次模型的趨勢與第一次模型的趨勢有一定差別,這是由于每次訓練的初始網絡都是隨機的,所以會導致每次訓練的趨勢略有不同,但造成的隨機誤差遠小于由于固定模型造成的累計誤差。本文模型通過對邊界的預測來反映設備退化的置信區(qū)間,退化趨勢處于設備退化區(qū)間內的為可信趨勢,處于區(qū)間外的為不可信趨勢。同時,模糊邊界以?;翱诘男问酱砹舜翱趦人悬c的邊界變化情況,而趨勢預測則反映了每一點的變化情況,從不同的角度反映了退化過程。表3展示了模糊邊界(包括上邊界與下邊界)與退化趨勢的預測精度誤差。
表3 退化趨勢與模糊區(qū)間預測精度Table 3 Aauracy of degradation trends and fuzzy interval predictions
為了進一步體現(xiàn)本文所提動態(tài)模型方法的優(yōu)越性,選取其他策略的LSTM模型在編號Bearing 3_2數(shù)據集上進行退化趨勢的比較分析,其他幾種方法分別為傳統(tǒng)的LSTM模型和雙向長短期記憶網絡模型。這兩種模型的最優(yōu)參數(shù)均由交叉驗證法得出,且列于表4中。采用全部預測數(shù)據的均方根誤差作為模型性能指標,采用最后20組預測數(shù)據的均方根誤差作為模型累計誤差的性能比較指標。
表4 其他模型超參數(shù)Table 4 Super-parameters for other models
對比結果如表5所示,相比于傳統(tǒng)的LSTM模型,Bi-LSTM雖然大幅度提高了預測精度,但仍不能解決累計誤差逐漸增大的問題。使用本文提出的動態(tài)LSTM預測模型后,后20組數(shù)據均方根誤差小于整體數(shù)據的均方根誤差,表明數(shù)據累計誤差越來越大的問題得到解決。
表5 不同預測方法性能對比Table 5 Comparison of the performance of different prediction methods
考慮到實際工廠數(shù)據類型與預測需求,本文提出一種融合趨勢濾波、模糊信息?;c動態(tài)長短期記憶網絡的旋轉機械退化趨勢與退化區(qū)間預測的方法。該方法以運行可靠性理論、趨勢濾波理論、模糊信息理論和動態(tài)LSTM的模型理論為基礎,利用動態(tài)LSTM模型預測了設備退化的主要趨勢并給出設備退化的模糊區(qū)間。實驗結果與對比分析表明:本文提出的退化預測方法只需要對設備的退化數(shù)據進行分析,即可最終輸出未來一定時間段內每一時刻的退化狀況以及未來模糊區(qū)間時刻內的代表邊界,從不同的角度反映了設備的退化信息,且減小了預測累計誤差。