王 猛,王光君,張 雷,張法業(yè),姜明順
(1.中車青島四方機車車輛股份有限公司,山東 青島 266100;2.山東大學,山東 濟南 250061)
隨著煤炭和石油等不可再生能源的過度開采和大量使用,人類生存的環(huán)境日益惡化,大力發(fā)展風能、太陽能、水能、地熱能和潮汐能等可再生能源已逐步成為能源可持續(xù)發(fā)展的關鍵舉措。其中,風能作為一種安全可靠、儲量豐富和對環(huán)境影響較小的可再生能源,已經(jīng)被廣泛應用于發(fā)電行業(yè)[1]。我國風力發(fā)電潛力巨大,風電裝機容量大且呈上升趨勢[2]。據(jù)國家能源局統(tǒng)計,我國的風電裝機容量從2015 年突破1 億kW 到2019 年突破2 億kW 用時4年;截至2021年12月份,用時兩年裝機容量便突破3 億kW 大關,僅2020 年裝機容量新增7176 萬kW。目前,風電裝機容量約占全國電源總裝機的13%。
風力發(fā)電分為陸上風力發(fā)電和海上風力發(fā)電,風力發(fā)電機通常安裝在風沙較大、日曬嚴重或者濕度較大的地區(qū),工作環(huán)境非常惡劣,承受的溫度、濕度和載荷變化范圍較大。軸承作為風力發(fā)電機的重要傳動機構,受環(huán)境影響較大且存在較高的故障率,一臺風力發(fā)電機所需要的軸承多達幾十套,一旦發(fā)生故障會影響整個風力發(fā)電機的運行,造成巨大的經(jīng)濟損失。因此,實現(xiàn)風力發(fā)電機軸承的視情維修[3](Condition Based Maintenance,CBM)至關重要,可有效改善原計劃維修和定時維修所造成的資源浪費,實時監(jiān)測軸承的健康狀態(tài)。預測軸承的剩余使用壽命(Remaining Useful Life,RUL)是實現(xiàn)軸承視情維修的重要手段,剩余壽命是指軸承按照當前的運行狀態(tài)直至運行到發(fā)生故障并失效的時間[4]。
目前,基于數(shù)據(jù)驅動的軸承剩余壽命預測是主流的研究方向[5]。許多學者根據(jù)采集到的軸承傳感器信號,借助機器學習或者深度學習方法,建立軸承的RUL 預測模型。Hu Y 等人[6]通過Wiener 過程建立了基于溫度特征參數(shù)的軸承性能退化模型,然后通過最大似然估計方法得到性能退化模型的參數(shù),建立了基于逆高斯分布的風電機組軸承RUL預測模型,實現(xiàn)軸承的剩余壽命預測。文獻[7]使用互信息對軸承振動信號的多個時頻域特征進行約簡,通過支持向量回歸預測軸承的剩余壽命。文獻[8]針對軸承的振動信號,提出了基于徑向基神經(jīng)網(wǎng)絡和帶有漂移參數(shù)的維納模型的剩余壽命預測方法。隨著深度學習理論研究的深入和其處理大數(shù)據(jù)問題的能力,越來越多的學者將深度學習應用于軸承的剩余壽命預測中。Yang B 等人[9]提出了一種基于雙卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)模型結構的剩余壽命預測框架,第1 個CNN 模型用于識別故障點,第2 個CNN 模型用于實現(xiàn)RUL 預測。Chen Y等人[10]提出了一種基于編碼器框架的純數(shù)據(jù)驅動的軸承RUL 預測方法,通過注意力機制的循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)預測軸承的RUL。Saufi 等人[11]通過整合拉普拉斯評分、隨機搜索優(yōu)化和長短期記憶網(wǎng)絡(Long Short Term Memory,LSTM)來解決軸承的剩余壽命預測問題。文獻[12]通過核主成分分析方法融合提取出來的軸承振動信號的14 個時頻特征指標,然后通過LSTM模型預測軸承的剩余壽命。盡管基于深度學習的RUL 預測方法取得了不錯的效果,但是大部分方法沒有同時考慮監(jiān)測數(shù)據(jù)中的序列特征和單采樣時刻的時頻域特征。
為進一步提高軸承的剩余壽命預測精度,基于軸承的高頻振動信號,充分挖掘退化監(jiān)測數(shù)據(jù)中的時頻域特征,通過卷積自編碼器(Convolutional Autoencoder,CAE)將時頻特征轉化為一維的健康指標(Health Indicator,HI)曲線,然后通過多層的門控循環(huán)單元(Gated Recurrent Unit,GRU)網(wǎng)絡模型實現(xiàn)軸承的剩余壽命預測,提高模型的RUL預測精度。
軸承的振動信號中包含了大量的退化趨勢特征,且易于采集,因此,基于振動信號的軸承剩余壽命預測是當前應用最廣泛的研究方法。但是采集到的振動信號往往受采集設備或環(huán)境噪聲的影響,因此,預測時需要對原始的振動信號進行降噪處理。
基于小波變換(Wavelet Transform,WT)的閾值降噪方法具有適應性強、實現(xiàn)簡單的優(yōu)點,且具有良好的時頻局部特性,能夠在去除噪聲的同時保留信號的細節(jié)信息[13]。小波閾值降噪的過程如圖1所示。
圖1 小波閾值降噪過程
首先,通過對原始振動信號進行小波分解,得到不同的小波系數(shù);然后,根據(jù)信號選擇合適的閾值對干擾噪聲進行分離,保留有用的信息;最后,對小波系數(shù)進行重構,得到降噪之后的振動信號,小波閾值降噪的表達式為:
式中:sn為含有噪聲的原始信號;fn為真實信號;en為高斯白噪聲;ωjk為小波系數(shù);ψ為窗函數(shù);j為分解尺度;k為時移因子;λ為閾值;σ為噪聲標準差;N為信號長度;為閾值降噪后的小波系數(shù);a為設定參數(shù),取值范圍為[0,1];sng()為符號函數(shù)。
常見的閾值設定方法分為硬閾值和軟閾值兩種,硬閾值方法是將大于閾值的小波系數(shù)保留,小于閾值的設為0,會導致信號出現(xiàn)不連續(xù)的現(xiàn)象;軟閾值方法是將大于閾值的小波系數(shù)進行收縮處理,會使信號光滑但是會導致恒定的誤差,影響信號重構。因此,本文采用軟硬閾值折中的小波閾值降噪方法對振動信號進行降噪處理,在保留特征信息的同時,又在一定程度上保證了信號的光滑性。
通過傳感器系統(tǒng)采集到的軸承高頻振動信號是非平穩(wěn)性的,不僅包含了大量的時域特征,還蘊含著豐富的頻域特征,反映了軸承退化過程中的頻率變化。與基于統(tǒng)計特征的RUL 預測方法相比,對監(jiān)測數(shù)據(jù)進行時頻分析可以充分挖掘軸承退化過程中的時域和頻域信息,提高RUL的預測精度。
常見的特征提取方法是通過分別提取均值、標準差、均方根值、峰值等有量綱時域特征和偏度、峭度、裕度因子、峰值因子等無量綱時域特征,并通過快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)將時域信號轉換為頻域信號提取頻域特征參數(shù),然后將提取出來的多維時頻域特征映射到健康指標曲線或者直接映射到軸承的剩余壽命。
因FFT 頻域轉換針對整個時域進行,并未考慮到信號時間域的局部特征,且無法對每個采樣時刻內的突變和非平穩(wěn)信號進行刻畫,這將造成特征信息的缺失。而短時傅里葉變換(Short Time Fourier Transform,STFT)可以提供不同時頻分辨率的圖譜,將整個時域過程分解成無數(shù)個等長的近似平穩(wěn)的小過程,然后再進行傅里葉變換,從而保留局部的特征信息。軸承振動信號v(t)通過STFT在實對稱窗函數(shù)g(t)上進行傅里葉變換的具體表達式為[14]
式中:η為調制頻率;τ為轉換時間;S為調制頻率η和轉換時間τ的二維函數(shù)。當滑動窗口經(jīng)過時域信號時,窗口內的頻譜分量被計算為頻率的函數(shù)。STFT 將一維的高頻振動信號轉換為數(shù)量級較低的二維特征矩陣,同時包含時域特征和頻域特征,并能很好地表征局部特征和時變特征。
經(jīng)過STFT 變換之后獲得的是軸承振動信號的二維時頻圖,為了獲得軸承退化過程中的健康指標曲線,本文通過CAE 網(wǎng)絡將二維時頻圖壓縮成一維的健康指標曲線,再由健康指標曲線映射到軸承的剩余壽命。
自動編碼器是一種無監(jiān)督的特征自提取網(wǎng)絡,其編碼器結構是將高維的輸入數(shù)據(jù)壓縮成低維的特征表示形式,然后解碼器再通過特征表示形式映射回原始的輸入數(shù)據(jù),中間隱藏層的輸出就是提取出來的特征信息。堆疊自編碼器通過多個自編碼器疊加組成,可以提取更深層次的抽象特征。CAE 是堆疊自動編碼器的變形,使用CNN 網(wǎng)絡代替原本網(wǎng)絡中的全連接層[15],CNN 網(wǎng)絡是由卷積層和池化層組成的,其局部連接和權值共享的方法,使其在進行特征提取,尤其是針對二維的圖像數(shù)據(jù)時更有優(yōu)勢,CAE的網(wǎng)絡結構如圖2所示。
圖2 CAE網(wǎng)絡結構
與使用全連接層的堆疊自編碼器只提取全局特征相比,CAE 網(wǎng)絡可以提取二維圖像數(shù)據(jù)中的局部信息,保留空間特征。編碼器對輸入的二維圖像進行壓縮并提取深層特征,對于輸入x,第k個隱藏層獲得的深層特征hk可以表示為
式中:f為激活函數(shù);Wk和bk分別為第k個隱藏層的權重矩陣和偏差矩陣;*表示二維卷積運算。然后解碼器結構與編碼器是對稱的,由提取出來的深層特征重建原始的輸入圖像,其表達式為
池化層用于壓縮圖像大小,上采樣層用于恢復圖像大小,編碼器與解碼器所對應的層輸出的圖像大小是相等的。將CAE網(wǎng)絡編碼器最后一層的輸出大小設置為1×1,將每個時刻的二維時頻圖壓縮成一個點,此時就可以獲得軸承退化過程的一維健康指標曲線。
軸承退化是一個逐漸的過程,假設獲得的整個軸承退化過程中的健康指標曲線的長度為T,t(0 <t≤T)時刻的軸承健康狀態(tài)不僅與當前時刻的監(jiān)測數(shù)據(jù)有關,還與前面時刻的監(jiān)測數(shù)據(jù)相關聯(lián),共同決定了軸承的退化狀態(tài)。RNN網(wǎng)絡以其獨特的循環(huán)結構,非常適用于處理長時間序列數(shù)據(jù)的問題,但是會造成梯度消失或梯度爆炸的問題。LSTM 網(wǎng)絡通過加入門結構有效地克服了RNN 網(wǎng)絡所存在的問題。GRU 網(wǎng)絡是LSTM 網(wǎng)絡的一個變體[16],可將遺忘門和輸入門合成一個單一的更新門,同樣混合了細胞狀態(tài)和隱藏狀態(tài)并進行了改進,使網(wǎng)絡模型結構更加簡單,GRU的網(wǎng)絡結構如圖3所示。
圖3 GRU網(wǎng)絡結構
GRU 網(wǎng)絡引入了一個復位門,當復位門接近1時,計算當前時刻的狀態(tài)時完成讀取之前時刻的狀態(tài)信息,當復位門接近0 時,則計算當前時刻的狀態(tài)時忽略之前時刻的狀態(tài)信息,其表達式為:
式中:zt為更新門的值;ht為當前時刻隱藏狀態(tài);Wzx和Wzh分別為更新門對輸入數(shù)據(jù)和更新門對上一時刻隱藏狀態(tài)的權重矩陣;bz為更新門的偏差矩陣。輸出門決定了多少單元格狀態(tài)傳入最終隱藏狀態(tài)。GRU 網(wǎng)絡簡化了LSTM 網(wǎng)絡結構的復雜度,同時又不影響LSTM網(wǎng)絡的性能。
基于健康指標曲線的軸承剩余壽命預測方法的基本流程如圖4所示,具體步驟為:
圖4 剩余壽命預測基本流程
1)將歷史監(jiān)測數(shù)據(jù)按一定比例分為訓練集和測試集,并將訓練集中的一部分數(shù)據(jù)作為驗證集用于模型訓練;
2)通過軟硬閾值折中的小波閾值降噪方法對振動信號進行降噪;
3)對降噪處理后的數(shù)據(jù)進行STFT 變換,獲得每個采樣時刻的時頻圖;
4)構建多層CAE 網(wǎng)絡模型,通過時頻圖獲得軸承整個退化過程的健康指標曲線;
5)為了提取序列數(shù)據(jù)中的時間特征,通過平移時間窗的方法生成訓練樣本,以一個固定大小的時間窗,每次往后平移一個時間步,對應時間窗最后時刻的剩余壽命標簽;
6)構建多層GRU 網(wǎng)絡模型,通過訓練集的健康指標曲線生成的訓練樣本進行網(wǎng)絡模型訓練;
7)將測試數(shù)據(jù)或者是在線采集的監(jiān)測數(shù)據(jù)通過步驟2)—步驟5)獲得測試樣本之后,輸入訓練好的模型中實現(xiàn)軸承的剩余壽命預測。
由于通過實驗方法獲得軸承全生命周期的監(jiān)測數(shù)據(jù)所需時間較長,且生成可用數(shù)據(jù)集較為困難。因此,使用法國FEMTO-ST 研究所公開的通過PRONOSTIA 實驗平臺收集到的FEMTO 軸承數(shù)據(jù)集[17]作為實驗數(shù)據(jù)來驗證所提方法的有效性,該數(shù)據(jù)集同時作為PHM2012 挑戰(zhàn)賽的實驗數(shù)據(jù),數(shù)據(jù)集的概況如表1所示,該數(shù)據(jù)集中包含了3種工況下軸承從健康狀態(tài)運行到完全失效的全生命周期的監(jiān)測數(shù)據(jù),工況1 為轉速1 800 r/min、載荷為4 000 N;工況2 為轉速為1 650 r/min、載荷為4 200 N;工況3 為轉速1 500 r/min、載荷為5 000 N。
表1 FEMTO軸承數(shù)據(jù)集
分別采集了軸承水平方向和垂直方向的振動加速度信號,采樣頻率為25.6 kHz,采樣間隔為10 s,每次采集0.1 s 的數(shù)據(jù),每個樣本中的數(shù)據(jù)長度為2 560,當加速度信號的振幅超過20g,認為軸承完全失效。本文主要采用工況1 軸承水平方向的振動信號對所提方法進行驗證,圖5 中展示了部分軸承的全生命周期數(shù)據(jù)。
從圖5中可以看出,軸承1_1在運行過程中是逐漸退化直至失效的,同樣的還有軸承1_3,而軸承1_2 則是突發(fā)性故障失效。由于漸進性退化過程可以預測,突發(fā)性失效只能進行識別而無法預測,因此將軸承1_1 數(shù)據(jù)作為訓練集進行模型訓練,將軸承1_3數(shù)據(jù)集作為測試集用于驗證模型預測性能。首先通過閾值折中的小波降噪方法對數(shù)據(jù)進行降噪處理,將分解層數(shù)設置為5,圖6 展示了某采樣時刻降噪處理前后的頻域波形對比。從圖中可以看出,經(jīng)過降噪處理后,有效地去除了高頻的干擾噪聲,保留了原始信號中的真實特征信息。
圖5 工況1部分軸承數(shù)據(jù)
圖6 降噪處理前后頻域波形對比
然后通過STFT 變換對降噪后的振動信號進行時頻域特征提取,將形狀為(2 560,1)的一維數(shù)據(jù)轉化成形狀為(99,28)的二維時頻圖,圖7 中分別展示了軸承退化的初始階段和退化末期的時頻圖。從圖中可以看出STFT 變換可以很好地表征退化過程不同階段的特征的變化情況與時域上的局部特征信息。
圖7 不同階段的時頻圖
針對獲得的二維時頻圖,搭建多層CAE網(wǎng)絡,對圖像進行壓縮獲得一維健康指標曲線,將前一層編碼器輸出作為后面的輸入進一步壓縮,CAE 網(wǎng)絡的圖像形狀變化如圖8所示。
圖8 CAE網(wǎng)絡的圖像形狀變化
使用ReLU 作為每層二維卷積網(wǎng)絡的激活函數(shù),使用Adam[18]作為模型訓練的優(yōu)化方法,模型的輸入輸出都是原始的二維時頻圖,不需要額外設置標簽。將最后一層編碼器的輸出,即圖8 中的(1,1)作為軸承的一維健康指標曲線用于后續(xù)的剩余壽命預測。同時為了使健康指標曲線更加光滑,消除波動對RUL 預測的干擾,使用最小二乘擬合對曲線進行平滑處理,獲得的訓練集和測試集的健康指標曲線分別如圖9和圖10所示。
圖9 訓練集健康指標曲線
圖10 測試集健康指標曲線
從軸承的時域信號和健康指標曲線中可以看出,軸承在運行初期較長一段時間內都保持健康的狀態(tài)。因此,本文研究后半段退化階段的剩余壽命預測,將故障發(fā)生時刻的剩余壽命設為1,最后失效時刻的剩余壽命設為0,使用從1 到0 線性變化的剩余壽命值作為訓練和驗證的標簽,訓練集軸承1_1故障開始的時間選擇為13 010 s,測試集軸承1_3 故障開始的時間選擇為11 670 s,使用大小為5 的時間窗生成樣本,將訓練樣本中10%(150個)的樣本作為驗證集用于交叉訓練。構建兩層的GRU 網(wǎng)絡模型,后面接一個全連接層用于輸出RUL 的預測值,同樣使用ReLU 和Adam 作為激活函數(shù)和優(yōu)化方法,將測試樣本輸入到訓練好的模型中進行剩余壽命預測,圖11 展示了測試集在整個退化過程中的剩余壽命預測情況。從圖11 中可以看出,軸承RUL 的預測值很好地擬合了實際的RUL 值,在整個退化過程中都能較好地實現(xiàn)軸承的剩余壽命預測。
圖11 測試集軸承RUL預測
使用均方根誤差[19]RMSE和平均絕對誤差[20]MAE作為剩余壽命預測結果的評價指標,對多次預測結果取平均值,獲得的結果如表2所示。
表2 測試集軸承RUL預測結果評價指標
從表2 的預測結果可以看出,對振動數(shù)據(jù)進行降噪處理和對健康指標曲線進行平滑處理都能在一定程度上改善模型的預測性能,提高軸承剩余壽命的預測精度。
準確預測軸承剩余壽命對于風力發(fā)電機的檢修和維護具有重要意義。本文針對軸承高頻振動信號,首先通過軟硬閾值折中的小波閾值降噪方法對信號進行降噪處理,削弱了干擾信號對特征信息的影響;然后通過STFT 對降噪后的信號進行了時頻分析,獲得每個采樣時刻的時頻圖;再通過CAE網(wǎng)絡的無監(jiān)督訓練得到了軸承的健康指標曲線,同時對健康指標曲線進行平滑處理;最后,構建了多層GRU網(wǎng)絡提取健康指標曲線中的序列特征,實現(xiàn)了軸承剩余壽命的高效預測。通過FEMTO 軸承數(shù)據(jù)集驗證了所提方法的有效性,并為風力發(fā)電機的視情維修提供有益的數(shù)據(jù)支撐。