廖晨,王艷豐,李舜酩,3,張名武
(1.南京航空航天大學 能源與動力學院,南京 210016;2.中國航發(fā)四川燃氣渦輪研究院,四川 綿陽 621010;3.南通理工學院 汽車工程學院,江蘇 南通 226002)
滾動軸承作為旋轉(zhuǎn)機械的關(guān)鍵部件,在機械傳動過程中具有承載和減少摩擦的作用,易產(chǎn)生故障,從而對機械設備的安全運行造成影響,有必要開發(fā)準確有效的滾動軸承故障診斷方法[1]。
近年來,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)由于可以自動從樣本中提取和整合特征,避免復雜的特征提取與選擇過程,而被應用于故障診斷領(lǐng)域[2]:文獻[3]提出了一種基于振動頻譜成像(Vibration Spectrum Imaging,VSI)和CNN的智能診斷方法,成功對軸承故障進行分類;文獻[4]將滾動軸承振動信號轉(zhuǎn)換為灰度圖,結(jié)合CNN進行端到端的故障識別;文獻[5]將連續(xù)小波變換(Continuous Wavelet Transform,CWT)作為時頻圖生成方法,利用 CNN模型進行自動診斷。
CNN對圖像的強大分類能力在滾動軸承故障診斷中取得了一定成效,但仍存在一些不足:1)將振動信號轉(zhuǎn)化為圖像時,未對信號中夾雜的非敏感故障信息進行處理,導致CNN無法充分利用圖像中的故障信息;2)大多數(shù)CNN提取特征時存在注意力分散、特征提取不合理的問題[6]。
變分模態(tài)分解(Variational Mode Decomposition,VMD)是一種自適應信號處理方法,通過非遞歸、變分模態(tài)分解對信號進行分解,克服了模態(tài)混疊和端點效應,已在故障特征提取領(lǐng)域成功應用[7]:文獻[8]基于VMD算法分解軸承振動信號,并將每個模態(tài)的能量熵作為特征值輸入支持向量機以解決故障分類問題;文獻[9] 結(jié)合VMD算法和廣義Warblet變換,對VMD分解得到的模態(tài)進行廣義Warblet變換時頻分析以確定齒輪故障類型。
為使CNN充分提取圖像中的故障信息,本文結(jié)合VMD方法和廣義S變換(Generalized S-transform,GST)生成特征圖像;針對CNN不能自主選擇重要通道的問題,引入卷積注意力機制模塊(Convolutional Block Attention Module,CBAM),構(gòu)建AMCNN模型高效提取時頻圖的特征,實現(xiàn)智能故障診斷。
VMD算法是一種自適應的信號分解方法,能使復雜信號分解為K個有限帶寬的本征模態(tài)分量(Intrinsic Modal Function,IMF),可以被表示為以下變分模型[10-11]
(1)
式中:uk為各模態(tài)函數(shù);ωk為各中心頻率;δ(t)為脈沖函數(shù);f(t)為原始信號。
為得到變分模型的最優(yōu)解,引入二次懲罰因子α和拉格朗日乘子λ(t)構(gòu)造增廣拉格朗日函數(shù),即
L({uk},{ωk},λ)=
(2)
采用交替方向乘子法反復迭代求取上述增廣拉格朗日函數(shù)的鞍點,得到模態(tài)分量uk及中心頻率ωk的表達式為
(3)
(4)
理論上,經(jīng)過VMD得到的每個IMF都代表原信號中的一個特征成分,但由于信號成分復雜、參數(shù)選取等因素,在分解結(jié)果中存在虛假分量。為了保證生成的圖像能有效保留振動信號的故障特征,同時減少非敏感故障信息的干擾,使用互信息準則篩選分解后的IMF分量,選擇前K-1個互信息值較大的真實分量重構(gòu)得到富含故障信息的一維信號。
互信息(Mutual Information)可表示兩隨機變量的相關(guān)程度,相對于相關(guān)系數(shù)能更好地辨別關(guān)聯(lián)性,其定義如下[12]
I(X,Y)=H(X)-H(X∣Y) ,
(5)
式中:H(X)為X的信息熵;H(X∣Y)為Y對應X的條件信息熵。
為充分滿足AMCNN模型的訓練要求,需要生成特征明顯的圖像作為訓練數(shù)據(jù)。為將一維重構(gòu)信號轉(zhuǎn)換為二維特征圖像,利用GST對重構(gòu)信號進行時頻分析。
GST是一種適合于對非平穩(wěn)信號處理的時頻分析方法,通過給定調(diào)節(jié)參數(shù),能控制高斯窗窗口函數(shù)的寬度,相較于S變換具有更優(yōu)的時頻能量聚焦性[13]。一個時間序列x(t)的GST可描述為
GGST(t,f)=
(6)
為保征圖像的有用信息不被淹沒,同時提高后續(xù)網(wǎng)絡的訓練速度,需將時頻分析得到的圖像以灰度圖形式顯示,整個VMD-GST二維特征圖像生成流程如圖1所示。
圖1 VMD-GST特征圖像生成流程
CNN是一種主要應用在圖像識別中的深度前饋網(wǎng)絡,其基本結(jié)構(gòu)主要包括輸入層、卷積層、池化層和全連接層。
CNN卷積層中,輸入的特征圖通過一系列學習后的核函數(shù)進行卷積,再加入偏置項與激活函數(shù)將特征圖卷積后的結(jié)果生成特征映射。卷積運算描述為
Ca=σ(Ca-1?Wa+ba),
(7)
式中:Ca,Ca-1為卷積神經(jīng)網(wǎng)絡的第a,a-1層特征圖;σ為激活函數(shù);?為卷積運算;Wa為第a層卷積核的權(quán)重矩陣;ba為第a層的偏置向量。
在一個卷積層之后總會添加一個池化層,這一層的作用是對特征圖進行降維,減少模型參數(shù)數(shù)量和避免過擬合。平均池化和最大池化是常用的2種池化層方法。
全連接層將多個卷積層和多個池化層提取的特征映射擴展成一維向量,并輸出分類結(jié)果。
卷積神經(jīng)網(wǎng)絡中的卷積層默認給特征圖每個通道分配相同的權(quán)重,但不同通道中的信息對故障診斷結(jié)果影響不同。注意力機制是模仿人腦注意力而產(chǎn)生的一種優(yōu)化策略,通過對不同特征區(qū)域分配不同的權(quán)重系數(shù)來突出關(guān)鍵信息,從而提高網(wǎng)絡的分類準確率。卷積注意力模塊分別在通道和空間維度上使用注意力機制,對“空間”和“通道”中的重要特征進行關(guān)注,抑制不必要的特征。卷積注意力模塊包含空間注意力和通道注意力2個相互獨立的子模塊,如圖2所示:通道注意力模塊將輸入特征中的每個通道作為特征檢測器,以此關(guān)注輸入特征中需要注意的內(nèi)容;空間注意力模塊是通道注意模塊的補充,用于查找注意信息的位置。
圖2 卷積注意力模塊結(jié)構(gòu)
對于卷積得到特征,卷積注意力模塊分別在通道和空間2個維度上計算特征映射的注意力權(quán)重,然后將注意力權(quán)重與輸入的特征映射相乘,自適應學習特征過程可以描述為
F′=Mc(F)?F,
(8)
F″=Ms(F″)?F′,
(9)
式中:F為輸入特征映射,F(xiàn)∈RC×H×B;Mc為通道維度中的注意力權(quán)重,Mc∈RC×1×1;Ms為空間維度中的注意力權(quán)重,Ms∈R1×H×B;C,H,B為每個通道的維度。
基于VMD-GST和AMCNN相結(jié)合的滾動軸承智能診斷方法流程如圖3所示,包含信號預處理、模型構(gòu)建、智能診斷3個模塊,滾動軸承振動信號數(shù)據(jù)處理步驟如下:
1)基于VMD算法將試驗采集的振動信號進行處理,一維時域信號被分解為多個IMF;
2)計算每個IMF與原始信號的互信息值,將互信息值最小的模態(tài)判定為虛假分量,借此選出能有效反映滾動軸承故障狀態(tài)的真實分量,并進行重構(gòu);
3)對重構(gòu)信號進行GST時頻分析,生成時頻圖像,再將時頻圖進行灰度化處理并壓縮為28×28像素的大小,構(gòu)造VMD-GST二維特征圖像數(shù)據(jù)集,然后劃分為訓練集、測試集和驗證集;
4)引入注意力機制,構(gòu)建AMCNN的基本結(jié)構(gòu),并對模型進行初始化;
5)通過訓練集數(shù)據(jù)訓練網(wǎng)絡模型,同時在訓練過程中調(diào)整網(wǎng)絡模型以達到最優(yōu);
6)將測試集數(shù)據(jù)送入訓練后的AMCNN模型,得到各故障類型的分類精度,完成滾動軸承的智能診斷。
圖3 滾動軸承智能診斷方法流程圖
滾動軸承故障測試試驗臺如圖4所示,其主要包括柴油發(fā)動機、制動盤、軸承及軸承座和轉(zhuǎn)軸等。選用NJ208EM圓柱滾子軸承,通過加速度傳感器分別獲取軸承的正常信號及故障信號,采樣頻率為12.8 kHz,轉(zhuǎn)速為2 200 r/min。通過線切割在軸承零件表面加工不同寬度的裂紋,其中內(nèi)圈故障位置如圖5所示。軸承各狀態(tài)見表1,每套軸承狀態(tài)取1 000個樣本,取樣長度為2 048,按3∶1∶1的比值劃分訓練集、驗證集與測試集,得到4 200個訓練集樣本,1 400個驗證集樣本,1 400個測試集樣本。
圖5 內(nèi)圈故障位置示意圖
表1 NJ208EM圓柱滾子軸承各工作狀態(tài)
4.2.1 VMD算法參數(shù)的確定
VMD算法需預先設置初始參數(shù):模態(tài)數(shù)K、懲罰因子α、中心頻率初始化設置參數(shù)init、噪聲容忍度參數(shù)tau、初始中心頻率更新參數(shù)DC和終止條件tol,其中K,α對分解效果影響較大,下文將主要介紹這2個參數(shù)如何確定。
通過分析不同模態(tài)數(shù)時IMF分量的中心頻率判斷K值:若2個模態(tài)中心頻率差值過大,說明K值過小,會產(chǎn)生欠分解現(xiàn)象;若2個模態(tài)中心頻率過于接近,說明K值過大,信號被過度分解。限于篇幅,僅以內(nèi)圈故障直徑0.2 mm的滾動軸承振動信號為例,將信號進行VMD處理,得到各IMF中心頻率見表2:K為2~4時模態(tài)之間中心頻率相差較大,K=6時出現(xiàn)了2個中心頻率相近的模態(tài),故將K=5作為VMD分解時的預設數(shù)。
表2 不同K值時模態(tài)分量的中心頻率
懲罰因子α會影響收斂速度和各模態(tài)分量的帶寬,α越小,經(jīng)VMD分解得到模態(tài)分量的帶寬越大,反之模態(tài)分量的帶寬越小。模態(tài)分量的帶寬會影響模態(tài)混疊情況,為保證VMD的分解效果,懲罰因子α應大于采樣頻率的一半[15],同時考慮懲罰因子α過大會降低收斂速度,α取8 000。
VMD其他參數(shù)取經(jīng)驗值,init=0,tau=0,DC=0,tol=1×10-6。
4.2.2 特征圖生成
利用VMD-GST二維特征圖生成方法處理滾動軸承數(shù)據(jù)集中的信號,制作各狀態(tài)的時頻圖數(shù)據(jù)集用于滾動軸承的故障診斷,軸承各狀態(tài)的VMD-GST二維特征圖如圖6所示:7種軸承狀態(tài)振動信號的VMD-GST在時域和頻域上均有一定的差異,反映了信號在時頻平面上的變化過程。故VMD-GST方法構(gòu)造的灰度圖具有突出特征,能夠分辨滾動軸承狀態(tài)。
(a) 0# (b) 1# (c) 2# (d) 3#
(e) 4# (f) 5# (g) 6#
此外,為了在后續(xù)的網(wǎng)絡訓練過程中減少計算量,將灰度圖壓縮成28×28像素的圖片,作為AMCNN的輸入。
AMCNN模型是一種基于ALexNet結(jié)構(gòu)的改進CNN模型,引入注意力機制來選擇重要通道,進而提高故障診斷模型的特征提取能力。AMCNN模型結(jié)構(gòu)參數(shù)見表3,在第1個和最后1個卷積池化單元之后添加CBAM。該模型以二維灰度圖作為輸入,在第1個卷積池化單元對源數(shù)據(jù)進行初始特征提取后,通過第1個CBAM和第2,3個卷積池化單元對特征進一步提取。輸出數(shù)據(jù)再經(jīng)過第2個CBAM和全連接層展開為一維向量,最后輸入到Softmax層進行故障分類。為提高訓練速度和避免網(wǎng)格結(jié)構(gòu)在訓練過程中出現(xiàn)過擬合現(xiàn)象,在卷積層與池化層之間加入批歸一層。
表3 AMCNN模型結(jié)構(gòu)參數(shù)
選用AMD Ryzen7 5800H-處理器,RTX 3060顯卡,深度學習框架為Pytorch。采用訓練樣本對所建立的網(wǎng)絡進行訓練,batch size為35,訓練的迭代次數(shù)總計200,網(wǎng)絡的訓練收斂曲線如圖7所示:模型準確率迅速增加,損失值迅速減小,經(jīng)50次迭代后模型趨于穩(wěn)定,達到完全收斂,此時準確率為99.93%,損失值為0.003。
圖7 網(wǎng)絡的訓練收斂曲線
為排除個別類型故障存在極端識別的情況,用混淆矩陣分析測試集結(jié)果,如圖8所示:準確率達到99.79%,僅2個4#外圈故障被誤診為3#外圈故障和1個1#內(nèi)圈故障被誤診為6#滾動體故障,說明該方法能有效識別不同故障類型、不同故障程度的滾動軸承,具有高精度性和穩(wěn)定性。
圖8 混淆矩陣結(jié)果分析
將滾動軸承振動信號通過GST,CWT,VSI方法生成的特征圖像作為AMCNN網(wǎng)絡的輸入,與本文VMD-GST特征圖像生成方法進行對比,不同方法的診斷結(jié)果見表4:信號經(jīng)VMD-GST處理轉(zhuǎn)換為特征圖像后輸入本文所構(gòu)建的網(wǎng)絡,訓練準確率和測試準確率均高于其他方法,說明采用VMD-GST方法將振動信號轉(zhuǎn)化為二維圖像時降低了信號中非敏感故障信息的比例,使故障特征在時頻域里突出,為網(wǎng)絡識別提供了優(yōu)秀的樣本。
表4 不同特征圖生成方法的診斷結(jié)果
為進一步驗證本文模型的正確性,將本文模型與支持向量機(Support Vector Machine,SVM)、堆疊自編碼(Stacked Auto Encoder,SAE)和CNN模型進行對比。試驗中:SVM的核函數(shù)選用高斯核;SAE設置有2個隱含層,神經(jīng)元個數(shù)分別為168,64;CNN使用3個卷積池化單元、1個全連接層、1個Softmax分類層,與AMCNN相比沒有加入注意力機制層,參數(shù)設置與AMCNN相同。使用VMD-GST方法生成的圖像數(shù)據(jù)集對每個模型進行10次試驗,4種模型的診斷結(jié)果見表5:1)后3種深度學習算法對不同滾動軸承故障的平均識別率達到97%以上,SVM算法的平均識別率低于85%,說明深度學習方法擁有強大的特征提取和故障分類能力;2)AMCNN對不同滾動軸承故障的平均識別率為99.76%,優(yōu)于SAE,CNN模型,證明了AMCNN模型的優(yōu)越性;3)AMCNN的方差最小,說明AMCNN模型診斷效果更穩(wěn)定。
表5 不同模型的診斷結(jié)果
為了證明本文模型的特征提取能力,利用t-SNE降維技術(shù),將SAE,CNN,AMCNN的全連接層輸出特征分別轉(zhuǎn)化至二維平面進行可視化,如圖9所示(橫、縱坐標分別代表數(shù)據(jù)特征在特征空間的橫向距離和縱向距離): 1)SAE,CNN中的t-SNE可視化散點圖能有效區(qū)分6種故障類型的特征和正常樣本特征,但相同軸承狀態(tài)樣本的聚集度并不好,2#,3#樣本有混疊;2) AMCNN的t-SNE可視化散點圖能有效區(qū)分6種故障類型的特征和正常樣本特征,且相同軸承狀態(tài)樣本的聚集度較好。上述分析說明AMCNN能有效提取圖像數(shù)據(jù)集的特征,不同軸承狀態(tài)樣本的特征比SAE,CNN模型在t-SNE可視化圖上更容易區(qū)分,有利于進一步提高故障診斷準確率。
圖9 3種模型的t-SNE可視化散點圖
本文提出一種VMD-GST和AMCNN相結(jié)合的滾動軸承故障診斷方法,通過試驗得到以下結(jié)論:
1)原始振動信號采用VMD-GST方法生成二維圖像能夠有效提取故障特征,很好地區(qū)分滾動軸承的狀態(tài),為下一步故障診斷提供優(yōu)秀的圖像樣本;
2)在CNN網(wǎng)絡中加入注意力機制,能夠自適應地增強有效信息,抑制干擾信息,從而更有效地提取滾動軸承振動信號時頻圖像中的關(guān)鍵特征,進一步提高故障診斷準確率。