劉之航,鐘玉華
(1.廣州城市理工學院汽車與交通工程學院,廣州 510800;2.華南理工大學機械與汽車工程學院,廣州 510641)
滾動軸承是各類旋轉機械的基本零部件之一,當機器停機時,約45%~55%的情況是由軸承發(fā)生故障而引起的。滾動軸承廣泛應用于各個行業(yè)中,如車輛與航空航天等,是整個設備保持平穩(wěn)運行的基礎保障,因此對滾動軸承進行運行狀態(tài)監(jiān)測和綜合評價具有極其重要的意義[1]。
現(xiàn)代狀態(tài)監(jiān)測技術已經(jīng)能夠實現(xiàn)對復雜裝備進行多測點、全壽命的數(shù)據(jù)采集,故使得機械健康監(jiān)測進入了“大數(shù)據(jù)”時代,同時隨著深度學習等概念的提出,故障診斷已經(jīng)逐漸進入智能化時代。深度學習中的卷積神經(jīng)網(wǎng)絡等方法相比于傳統(tǒng)方法而言,其不需要太多先驗知識,適用條件較為寬松,并可適用于建立復雜、困難的模型[2],并且其先前被人詬病的“運算量巨大、規(guī)則建立困難、學習時間冗長”等缺點已經(jīng)隨著計算機硬件的發(fā)展而逐漸改正。
首先對于故障診斷問題,朱文輝等[3]構造了基于離散隱馬爾科夫模型(DHMM)和BP神經(jīng)網(wǎng)絡算法的智能診斷方法;為了提高診斷的精度,曲建嶺等[4]提出了基于一維卷積神經(jīng)網(wǎng)絡的故障診斷算法,實現(xiàn)了自適應特征提取和故障診斷;LIPTON等[5]提出了一種基于卷積神經(jīng)網(wǎng)絡和支持向量機的自適應特征提取故障診斷方法。以上研究以神經(jīng)網(wǎng)絡為基礎進行故障診斷的研究,可以較好地進行分類任務,但沒有利用到時間序列的上下文信息,也沒有充分考慮網(wǎng)絡模型對噪聲的抵抗能力,有必要研究具有優(yōu)秀抗噪性和魯棒性的新結構。
對于卷積神經(jīng)網(wǎng)絡的可解釋性,由于CNN復雜的非線性模型結構和高維度的數(shù)據(jù)分布,被人詬病為一個無法解釋的“黑箱”。GUYON等[6]去除不相關和冗余的數(shù)據(jù)部分以降低模型的復雜性從而使得模型能夠被理解和解釋,如果已知的模型是根據(jù)先驗規(guī)則建立的,理論上就是可以被解釋的模型;WANG[7]提出了一種規(guī)則嵌入神經(jīng)網(wǎng)絡(ReNN)來彌補神經(jīng)網(wǎng)絡的不足,ReNN將“黑盒”分解成兩個部分:基于本地的推理和人類長期積累的先驗知識,令其分析推理模式和規(guī)則,從而更好地解釋網(wǎng)絡;ZHOU等[8]提出了類激活圖(CAM)去定位卷積層對圖片進行特征提取的位置所在;SELVARAJU等[9]基于CAM并對其改進提出了梯度權重類激活映射圖(Grad-CAM),使其的使用范圍更廣;CHATTOPADHAY等[10]對Grad-CAM進行改進,使其權重計算更加準確,提出了定位更加精確的Grad-CAM++。上述研究基本都是對二維圖片進行特征提取并定位激活區(qū)域,而沒有對一維時間信號進行研究,但在故障診斷領域,對時間序列進行可解釋性研究是極其重要的。
因此,提出了一種具有良好抗噪性的可解釋性軸承故障診斷方法。該方法基于CNN-BiLSTM網(wǎng)絡模型,充分利用了CNN局部特征提取上的優(yōu)勢和BiLSTM能很好處理非線性時間序列及利用上下文信息的天然特點,并采用Grad-CAM++方法對一維故障信號進行解釋性研究,同時使得類激活映射圖系列算法更具有通用性。
作為梯度權重類激活映射圖系列算法的基石,CAM通過全局平均池化層(GAP)來解決全連接層中的過擬合問題。再通過熱力圖顯示CNN中卷積層對于輸入的激活區(qū)域。
在卷積神經(jīng)網(wǎng)絡中可以通過CAM將卷積層提取的特征以熱力圖的形式進行可視化展示,從而顯示卷積核對于不同類別的輸入是如何提取特征的。假設在某一分類問題中,類別數(shù)為n,則某一類別x所獲得的分數(shù)是:
(1)
CAM的局限性在于需要添加GAP層以改變網(wǎng)絡結構,因此,文獻[9]提出了梯度權重類激活映射圖(Grad-CAM)。
對于類別x,第k個特征圖的權重為:
(2)
式中,Z是激活圖中的像素數(shù),即圖像尺寸。
將所有特征圖的權重和對應的特征圖加權求和,再通過線性整流函數(shù)Relu進行激活獲得類激活映射圖:
(3)
根據(jù)Grad-CAM的推導可知,其通過除以特征圖的大小Z來估計權重,所以權重大小與特征圖的大小關系很大,會影響到結果。此外,該方法對輸入圖像中多次出現(xiàn)的同一類,則無法很好地進行激活。
基于類激活映射圖(CAM)和梯度權重類激活映射圖(Grad-CAM),文獻[10]修改了權重的計算方式,使權重不再是式(2)中固定的尺寸值Z,并提出了Grad-CAM++:
(4)
則類激活圖為:
(5)
類激活圖需要將尺寸變換到原輸入圖像的尺寸大小,再通過熱力圖覆蓋到原圖上,熱力圖的值對應著卷積神經(jīng)網(wǎng)絡對此位置的激活程度。綜上所述,3種方法的示意圖如圖1所示。
圖1 3種方法示意圖
卷積神經(jīng)網(wǎng)絡(CNN)憑借卷積核,具有優(yōu)異的學習和識別能力,其并不需要過多的先驗知識和專家經(jīng)驗,就能輕松地實現(xiàn)端到端的故障診斷等能力。
循環(huán)神經(jīng)網(wǎng)絡(RNN)根據(jù)輸入的序列,能夠很好地學習其非線性特征,但RNN在多次傳播后,容易發(fā)生梯度消失和梯度爆炸的問題。長短時記憶(LSTM)神經(jīng)網(wǎng)絡為了解決上述問題,在RNN的基礎上添加了記憶單元從而防止梯度消失[11]。
LSTM由各種門控單元組成,包括輸入門、輸出門和遺忘門。其中輸入門用于保留當前的信息,并且可以與歷史信息進行融合,輸出門決定輸出的信息,遺忘門負責選擇性地刪除較弱的歷史相關信息:
ft=σ(Wf[ht-1,xt]+bf)
(6)
it=σ(Wi[ht-1,xt]+bi)
(7)
ot=σ(Wo[ht-1,xt]+bo)
(8)
ct=ftct-1+ittanh(Wc[ht-1,xt]+bc)
(9)
ht=ottanhct
(10)
式中,ft為遺忘門;it為輸入門;ot為輸出門;ct為細胞狀態(tài);σ為sigmoid激活函數(shù);Wf、Wi、Wo、Wc為訓練參數(shù)中的權重;bf、bi、bo、bc為訓練參數(shù)中的偏置項;ht為當前時刻隱藏層的狀態(tài);ht-1為上一時刻隱藏層的狀態(tài)。
但LSTM也有不足,即其只能正向訓練輸入數(shù)據(jù),會忽略掉之后的狀態(tài)。而雙向長短時記憶(BiLSTM)神經(jīng)網(wǎng)絡[12]可以對輸入數(shù)據(jù)進行雙向分析,能夠很好地學習上下文信息,對序列型任務十分有效。其由具有前向和反向的雙向LSTM進行連接,對具有前后時間相關性的序列具有明顯的優(yōu)勢。
綜上所述,結合CNN局部特征提取上的優(yōu)勢和BiLSTM能很好處理非線性時間序列的天然特點,本文針對滾動軸承故障數(shù)據(jù)提出一種1D-CNN-BiLSTM神經(jīng)網(wǎng)絡用于特征提取可視化和故障診斷,該網(wǎng)絡架構如圖2所示,其中CNN層的輸出結果作為BiLSTM層的輸入,BiLSTM后設置Dropout目的是防止模型過擬合,Grad-CAM++放置在最后一個卷積層之后,作為本文所提出模型的解釋層。
圖2 整體網(wǎng)絡架構圖
本文提出的可解釋性神經(jīng)網(wǎng)絡模型的整體流程如圖3所示。
圖3 方法流程框圖
為驗證所提方法對于一維振動信號的有效性及合理性,利用MATLAB生成仿真信號并通過提出的CNN-BiLSTM網(wǎng)絡模型進行分析。
當滾動軸承發(fā)生故障時,產(chǎn)生的是沖擊型信號,其外圈特征頻率fout和內圈特征頻率fin為:
(11)
(12)
式中,z是滾動體的個數(shù);fn是軸轉頻;d是滾動體的直徑;D是軸承節(jié)徑。
考慮滾動軸承系統(tǒng)的多階固有頻率時,傳感器收集到的振動響應為[13]:
(13)
式中,fdj為多階固有頻率;ζj為多階阻尼比;Aij為第i個沖擊的響應在第j階固有頻率下的幅值大??;T為響應的重復周期;τi為響應的延時大??;η(t)為高斯白噪聲。
針對探討Grad-CAM++對一維時間信號的適用性,先利用仿真信號進行驗證及分析。
首先為驗證所提方法對一維時間信號的通用性,構造無噪聲仿真信號進行驗證。
當沒有高斯白噪聲時,式(13)的η(t)項為0。設置采樣頻率fs為214=16 384 Hz,轉速為600 r/min。軸承外圈和內圈故障的時域波形分別如圖4、圖5所示。
圖4 軸承外圈故障仿真時域波形 圖5 軸承內圈故障仿真時域波形
對于軸承外圈故障來說,外圈的損傷點相對傳感器的位置是不變的,所以傳感器收集到的響應信號的大小和形狀都不變,時域波形相對簡單。而對于軸承內圈故障來說,內圈的損傷點相對傳感器的位置是呈現(xiàn)周期性的變化的,所以時域信號的幅值大小和形狀也呈現(xiàn)出周期性的變化,故出現(xiàn)明顯的幅值調制現(xiàn)象。
基于提出的神經(jīng)網(wǎng)絡架構和Grad-CAM++算法,對一維時域信號進行激活。1D-CNN-BiLSTM網(wǎng)絡結構參數(shù)如表1所示,BiLTSM層之后使用Dropout操作,并將丟棄率設置為0.25。表1中,F(xiàn)ilters表示卷積核的個數(shù),K(Kernel)表示卷積核的尺寸,S(Stride)表示移動步長,Units表示BiLSTM層或全連接層的參數(shù)量。
表1 網(wǎng)絡結構與參數(shù)
根據(jù)網(wǎng)絡的特征提取情況所得到的外圈和內圈故障的熱力圖如圖6、圖7所示,其信號大小和形狀分別與圖4、圖5保持一致,但增添了熱力值這一維度,淺灰色到黑色表示網(wǎng)絡對該區(qū)域的激活程度由強到弱。
圖6 滾動軸承仿真外圈故障的類激活圖 圖7 滾動軸承仿真內圈故障的類激活圖
在沒有噪聲的情況下,提出的模型對于輸入的外圈或內圈故障信號樣本的激活位置都在沖擊信息附近,即在進行分類任務時,對這些位置的權重較高。該可視化結果與實際的情況相符,軸承在這些位置包含較多的故障特征,說明Grad-CAM++在無噪聲的情況下對一維時間信號是適用的,并且對卷積提取的過程具有充分的解釋性意義。
考慮到在實際工程中不可避免地有噪聲干擾,故在仿真分析中,令式(13)中的η(t)項不為0,并從5 dB到-5 dB逐漸添加更大的高斯白噪聲,觀察其Grad-CAM++圖并分析結果。圖8a、圖8b分別是5 dB、0 dB和-5 dB下的軸承外圈和內圈仿真信號的激活圖。
(a) 軸承外圈故障 (b) 軸承內圈故障
當有噪聲的情況下,輸入信號經(jīng)過1D-CNN-BiLSTM神經(jīng)網(wǎng)絡后,特征的激活區(qū)域仍集中在信號的沖擊區(qū)域附近,即網(wǎng)絡對該部分有較高的激活權重,故Grad-CAM++對有噪聲的一維時間信號仍然適用,并且可以充分解釋卷積提取過程。
本次實驗的硬件背景是一臺Intel i5-10200H CPU和NVIDIA GTX 1650顯卡的Windows 10計算機,軟件采用Python和MATLAB,深度學習框架為基于TensorFlow的Keras。
為了驗證在實際工程中本文所提方法的有效性和可行性,采用凱斯西儲大學的滾動軸承故障數(shù)據(jù)集作為本節(jié)的實驗對象,實驗使用的軸承型號為SKF6205。電動機驅動端和風扇端的兩個加速度傳感器采集振動信號。
選取驅動端加速度傳感器所收集到的正常、外圈故障、內圈故障和滾動體故障四種類別的數(shù)據(jù),并對其進行one-hot標簽編碼。實驗時的采樣頻率為12 kHz,轉速為1797 r/min,具體如表2所示。
表2 滾動軸承故障類型
該數(shù)據(jù)集的每種故障狀態(tài)約有12k個點數(shù),所提出的網(wǎng)絡的輸入為2048個采樣點,為了提高神經(jīng)網(wǎng)絡精度,采用重疊采樣的方式對樣本量進行擴充,并將數(shù)據(jù)樣本劃分為訓練集和測試集。
如圖9所示,取采樣重疊率為0.5,獲得用以訓練、驗證和測試的所有樣本。此外,采用K折交叉驗證的方式多次劃分出不同的訓練集和測試集,以提高模型的魯棒性。在本次實驗中,將樣本劃分成10組,即K=10,每次將一個子集作為測試集,其余的K-1個子集作為訓練集,共得到K個模型。經(jīng)過K次評估之后,其平均結果可以降低誤差,該方法有效地利用小樣本數(shù)據(jù)去反映更真實的實驗結果。
圖9 重疊采樣
經(jīng)過數(shù)據(jù)處理后,得到正常狀態(tài)和3種故障狀態(tài)各120個樣本。網(wǎng)絡結構與參數(shù)和第3節(jié)仿真分析保持一致。
將樣本經(jīng)過本文所提出的可解釋性神經(jīng)網(wǎng)絡模型,可以得到網(wǎng)絡提取特征的Grad-CAM++圖和診斷準確率。
首先驗證所提網(wǎng)絡的解釋性。圖10是外圈故障、內圈故障、滾動體故障和正常狀態(tài)這4種類別的Grad-CAM++圖,該激活圖在一定程度上可以對卷積神經(jīng)網(wǎng)絡進行解釋。
(a) 滾動軸承實驗外圈故障的Grad-CAM++圖 (b) 滾動軸承實驗內圈故障的Grad-CAM++圖
滾動軸承外圈故障的軸承如圖10a所示,該1D-CNN-BiLSTM神經(jīng)網(wǎng)絡對于該輸入信號的沖擊部分有較大的激活程度,而神經(jīng)網(wǎng)絡的卷積層在此實驗中負責故障特征的提取,故說明該網(wǎng)絡對此沖擊部分的權重較大,更為關注。
內圈故障的軸承如圖10b所示,與外圈故障的情況類似,該神經(jīng)網(wǎng)絡對于該輸入信號的沖擊部分同樣有較大的激活程度,說明網(wǎng)絡對此部分的權重更大。
滾動體故障的軸承如圖10c所示,與內外圈故障不同,滾動體故障樣本的時域信號沖擊部分分布不均勻,沒有特別明顯的沖擊區(qū)域,但與正常軸承的信號圖10d相比,仍表現(xiàn)出神經(jīng)網(wǎng)絡對此類信號進行了有選擇的激活,該激活區(qū)域權重更大。
正常軸承的時域信號是均勻分布的,如圖10d所示,同樣地,其Grad-CAM++圖的激活部分也是分散在各個區(qū)域,即各部分的權重相近,故能夠表明正常軸承的狀態(tài)。
綜上所述,所提出的網(wǎng)絡模型針對分類任務時,對不同類別的樣本進行特征提取,通過Grad-CAM++以可視化熱力圖的形式很好地進行了解釋性說明。
其次驗證所提網(wǎng)絡的診斷準確性。經(jīng)過K折交叉驗證之后,本次實驗的平均分類精度為98.75%。對結果以混淆矩陣和t-SNE技術進行展示,如圖11、圖12所示。
圖11 混淆矩陣 圖12 降維可視化分析
從圖11混淆矩陣可以得出,在類別3中,有個別樣本被分類在類別2和類別4,在類別4中,有少量樣本被分類在類別2中,故診斷結果沒有達到100%。但根據(jù)圖12降維可視化的結果可以看出,該網(wǎng)絡對相同類別的樣本可以很好地進行聚類,對不同的樣本也可以很好地進行分類。
除此之外,本文提出的模型具有很好的抗噪性。引入相同結構的各參數(shù)相同的1D-CNN、1D-CNN-SVM和1D-CNN-LSTM作為本文所提模型的對比,各方法隨著信噪比的增大SNR所展現(xiàn)的診斷結果如圖13所示。
圖13 不同信噪比下各種網(wǎng)絡模型的診斷精度
所有實驗的迭代輪數(shù)epochs=15,在相同噪聲條件下,1D-CNN-BiLSTM的診斷準確率更高,當噪聲逐漸降低即SNR逐漸增大時,該模型收斂得更快。故所提模型的抗噪性和魯棒性比起其他模型更為優(yōu)秀。
提出了一種基于CNN-BiLSTM的可解釋性軸承故障診斷網(wǎng)絡模型。利用Grad-CAM++使得神經(jīng)網(wǎng)絡提取的特征以熱力圖的形式可視化展示,并將1D-CNN與雙向長短時記憶BiLSTM網(wǎng)絡結合,構造出具有可解釋性和優(yōu)秀抗噪性的模型。通過本模型和對比模型的實驗表明,本文所提出的網(wǎng)絡模型具有更強的抗噪性和魯棒性。該方法的具體優(yōu)點如下:
(1)具有可解釋性和通用性。在仿真分析和實驗驗證中,利用Grad-CAM++證明了卷積神經(jīng)網(wǎng)絡特征提取的合理性和可解釋性。該方法不僅能應用于二維圖片,也可以應用在旋轉機械故障等一維時間信號,拓展了類激活映射圖的適用范圍,具有通用性。
(2)診斷精度和分類結果好。采用凱斯西儲大學的滾動軸承故障數(shù)據(jù)集進行實驗,診斷結果和t-SNE分析表明該方法對于相同類別的聚類效果和對于不同類別的分類效果均表現(xiàn)優(yōu)異,平均診斷精度達98.5%。
(3)抗噪性和魯棒性好。對比同樣條件和參數(shù)下的其他方法:1D-CNN、1D-CNN-SVM和1D-CNN-LSTM。結果表明在相同噪聲條件下本文所提模型的診斷精度更高,并且當噪聲逐漸降低時,其診斷精度收斂得更快。