駱家杭,張旭,汪靖翔
(1.上海工程技術大學 機械與汽車工程學院,上海 201600;2.河南科技大學 機電工程學院,河南 洛陽 471003)
作為旋轉機械的關鍵部件,軸承的故障可能會導致嚴重的安全事故[1-2],因此,具有自動檢測能力的智能故障診斷技術越來越多地應用于軸承和其他工業(yè)設備的健康監(jiān)測[3]。隨著深度學習的發(fā)展,長短期記憶網(wǎng)絡(LSTM)、深度卷積神經(jīng)網(wǎng)絡(DCNN)、自編碼器(SAE)等[4]具有自學習特征能力的網(wǎng)絡的應用也越來越廣泛。文獻[5]通過增強振動和聲信號,采用深度置信網(wǎng)絡(DBN)對齒輪和軸承進行故障分類。文獻[6]利用SAE提取軸承振動信號的特征進行故障診斷。文獻[7]改進SAE并實現(xiàn)了對齒輪箱振動信號的故障診斷。文獻[8]改進標準CNN并基于嘈雜的振動數(shù)據(jù)識別了電機軸承的故障。文獻[9]提出了一種改進CNN用于分析振動信號并進行故障診斷。文獻[10]提出了一種將DBN和CNN結合的方法對機車軸承進行故障診斷。上述方法大都集中于軸承的振動分析,而振動分析則存在影響設備結構和傳感器安裝困難的問題。此外,振動信號的傳輸路徑長,工況條件多變,背景噪聲大等問題致使其處理過程非常復雜,當某類可用故障樣本中的噪聲信號影響較大時,不可避免地會造成分類準確率的降低。
針對上述問題,本文提出了一種基于格拉姆角場(Gram Angle Field,GAF)和多尺度卷積神經(jīng)網(wǎng)絡(Multi-Scale Convolutional Neural Network,MSCNN)的故障診斷方法,嘗試通過端到端的診斷獲得更高的分類準確率。
軸承振動信號的時間序列是包含各種相關特征的時序信號,軸承退化的相關特征需要將時間序列某一時刻的前后信息關聯(lián)起來,會造成對時間序列的依賴性。對于時間序列的處理與分析,通常采用快速傅里葉變換(FFT)等時頻變換方法將含有復雜噪聲和背景噪聲的時域信號轉化為更為直觀的頻域信號;但是,小波分析、傅里葉變換等方法只能給出總體效果,而不能完整地描述信號的瞬時特征。格拉姆角場能夠將時間序列中的信息完整保留并轉存為具有豐富特征信息的圖像格式[11],使信息的完整度得以保證,解決了時間序列依賴性的問題,非常適合軸承振動信號等非平穩(wěn)信號的處理。
格拉姆角場獲得的圖像從左上角到右下角將時間序列表達出來,其首先通過對時間序列中的步長和幅值進行極坐標轉化得到半徑和角度;然后計算每個點的三角函數(shù)值及其相關性, 利用三角函數(shù)變換組成n×n的格拉姆矩陣。對軸承振動信號X={x1,x2,…,xi,…,xn}進行范圍[-1,1]的歸一化處理可得
(1)
(2)
式中:ti為時間步;N為極坐標下的正則化常數(shù)系數(shù)。
格拉姆角場的變換如圖1所示,紅線為軸承振動信號的波峰和波谷,其完整表示了軸承振動信號的所有信息。通過對軸承振動信號進行格拉姆角場的變換,可以將軸承原始信號中的噪聲干擾以圖像的形式表達出來,減少了軸承信號去噪的步驟,利用圖像信息的豐富性對軸承故障進行診斷,更加高效、便捷。
圖1 軸承振動信號的GAF變換
傳統(tǒng)的分類識別模型存在過擬合問題,而且實際應用中的可靠性較差。隨著現(xiàn)代圖像識別技術的發(fā)展,海量的圖像數(shù)據(jù)結合深度學習模型的處理,不僅能夠縮短模型訓練時間,而且提高了實際應用中的可靠性。卷積神經(jīng)網(wǎng)絡是一種自動提取特征的神經(jīng)網(wǎng)絡,通過多個隱含層的非線性變換將“低層”特征轉換為抽象的“高層”特征,用簡單的模型即可解決復雜的分類識別學習問題。傳統(tǒng)卷積神經(jīng)網(wǎng)絡的結構如圖2所示。
圖2 卷積神經(jīng)網(wǎng)絡結構
卷積神經(jīng)網(wǎng)絡的卷積運算依靠卷積核生成局部特征,通過一系列卷積得到相似的統(tǒng)計特征并將其重新排列和挖掘。層與層之間通過激活函數(shù)相連,常用的激活函數(shù)有sigmoid函數(shù)、tanh函數(shù)、ReLU函數(shù)[12]等,其用于處理卷積運算的非線性問題。卷積層的輸出特征為
(3)
對池化層進行二次采樣,其表達式為
(4)
經(jīng)過卷積和池化后,增加全連接層進行分類。卷積神經(jīng)網(wǎng)絡的高層特征具有豐富的語義信息,低層特征具有較高空間分辨率。傳統(tǒng)卷積神經(jīng)網(wǎng)絡提取的全局特征僅包含序列信息等高層次特征,難以刻畫信號單峰值等低層次特征以及有效挖掘和利用過程數(shù)據(jù)中包含的多尺度信息,其原因是僅采用了單一尺寸的卷積核提取特征,即單尺度特征。為了將高層特征和底層特征融合起來得到更加豐富的特征信息,嘗試構建多尺度的神經(jīng)網(wǎng)絡對特征進行充分挖掘。
對卷積層中的卷積核進行不同尺寸的變換以得到不同尺度的特征,但輸入只需要單尺度[13]。選用卷積核的尺寸分別為5×5,3×3和1×1,每個分支上感受野的尺度不一,從而可以覆蓋大尺度范圍內(nèi)變化的目標,提取完整、豐富的特征。MSCNN的結構如圖3所示,通過改變卷積核的尺寸能夠獲得不同尺度的特征,多尺度特征具有的信息更加豐富,從而使得特征提取更加迅速、高效。
圖3 MSCNN的結構Fig.3 Structure of MSCNN
全連接層接受前面卷積的特征,輸出計算公式為
(5)
激活函數(shù)能夠處理卷積運算的非線性問題。ReLU激活函數(shù)收斂速度較快,但在傳遞過程中存在信息丟失問題,而且當梯度較大時,會造成梯度下降,使該神經(jīng)元的輸入小于0且輸出為零,之后的神經(jīng)元則停止運算。
ReLU函數(shù)的表達式為
(6)
為避免ReLU激活函數(shù)在負半軸數(shù)據(jù)的整流泄漏問題,在ReLU函數(shù)小于0的區(qū)間加入一個泄漏值,稱為Leaky-ReLU函數(shù),其表達式為
(7)
式中:x為激活函數(shù)f的輸入數(shù)據(jù);a為可以通過反向傳播算法學習的變量,稱為可變超參數(shù)。
在深度學習算法中有一種負半軸軟飽和的激活函數(shù),即SoftSign激活函數(shù),其類似于雙曲正切函數(shù),具有更平坦的曲線與更慢的下降導數(shù),且輸出-1~1之間的值,其表達式為
(8)
針對ReLU激活函數(shù)正負半軸所存在的缺點,基于Leaky-ReLU激活函數(shù)的改進思路,提出一種Soft-ReLU激活函數(shù),其消除了線性運算,收斂速度變快,表達式為
(9)
當可變超參數(shù)a的值為0時與ReLU函數(shù)相似。
通過對MSCNN激活函數(shù)進行改進,本文構建的軸承故障分類模型參數(shù)見表1。
表1 改進激活函數(shù)的MSCNN模型參數(shù)
數(shù)據(jù)集來自凱斯西儲大學的軸承數(shù)據(jù)中心[14],試驗平臺由2hp電動機、功率計、電子控制器、扭矩傳感器和負載電動機組成。選用驅動側6205-2RS軸承在2hp工況(電動機轉速1 750 r/min)下的數(shù)據(jù),提取的10種軸承故障及其具體描述見表2。其中,在驅動端以12 kHz的頻率采樣振動信號,每種故障類型各有訓練樣本60個,測試樣本30個。每個樣本包含1 024個采樣點,歸一化所有數(shù)據(jù)樣本點并將其映射到[0,1]區(qū)間。
表2 10種狀態(tài)下軸承振動信號的數(shù)據(jù)集描述
基于格拉姆角場和多尺度卷積神經(jīng)網(wǎng)絡的軸承故障診斷流程為:1)將軸承數(shù)據(jù)集通過格拉姆角場轉換為圖像;2)對MSCNN網(wǎng)絡中的激活函數(shù)進行改進,即提出一種Soft-ReLU激活函數(shù);3)將GAF圖像輸入到搭建好的改進MSCNN網(wǎng)絡中進行訓練和測試。
將整理好的訓練集和測試集信號通過GAF轉換為圖像,圖像分辨率為128×128,部分GAF圖像如圖4所示。分別將輪數(shù)設為30,40,50,100,150訓練網(wǎng)絡并觀察測試結果。由表3可知:隨著迭代次數(shù)的增加,分類準確率不斷提高,但在50輪后準確率提高不明顯且耗時長,說明50輪迭代時模型已經(jīng)訓練完成,能夠達到最佳效果。
圖4 不同狀態(tài)下軸承振動信號的GAF圖
表3 不同輪數(shù)時模型的分類準確率和用時
學習率設置為0.001,輪數(shù)設置為50,可變超參數(shù)取值為0.01,最后一層用softmax函數(shù)作為分類器,分類數(shù)為10,采用Adam算法優(yōu)化梯度下降問題。將整理好的圖像放入MSCNN模型中進行訓練和測試,其中訓練集、測試集分別有2 100,900張GAF圖片。試驗條件為2.4 GHz 四核Intel Core i5處理器,在Python的pytorch框架上進行網(wǎng)絡訓練,數(shù)據(jù)可視化由Matlab2021a實現(xiàn)。
基于格拉姆角場和多尺度卷積神經(jīng)網(wǎng)絡的軸承故障診斷方法的準確率和損失率如圖5所示:將準確率定義為對每個類別軸承圖像分類的正確率之和的平均值,經(jīng)過50輪迭代后,本文方法的準確率達到了99.67%,分類效果優(yōu)異;損失率只有1.022%且下降梯度快,說明模型收斂速度好,魯棒性高。
圖5 基于格拉姆角場和多尺度卷積神經(jīng)網(wǎng)絡的軸承 故障診斷模型的準確率和損失率
本文方法對每個故障類別的分類情況如圖6所示,由混淆矩陣[15]可知:BF1中0.5%的樣品被錯誤分類為BF2且0.3%的樣品被錯誤分類為BF3,BF3中則有0.4%的樣品被錯誤分類為BF1,對于鋼球故障的識別大體上是準確的;ORF2中0.3%的樣本被錯誤分類為BF1且 0.1% 的樣品被錯誤分類為IRF1,ORF3則有0.5%的樣本被錯誤分類為IRF2,這些故障點的位置存在一定的誤分類,但整體識別效果尚可且分類效果比較穩(wěn)定。
圖6 10種狀態(tài)下軸承振動信號的分類準確率
為進一步說明本文所提方法的優(yōu)越性,對同一數(shù)據(jù)集進行GAF變換后輸入深度信念網(wǎng)絡(DBN)和傳統(tǒng)CNN進行測試,其分類準確率分別為93.21%和91.16%,均不如本文方法的分類準確率高,充分驗證了格拉姆角場與多尺度卷積神經(jīng)網(wǎng)絡相結合的有效性。
提出了一種基于格拉姆角場和多尺度卷積神經(jīng)網(wǎng)絡的軸承故障診斷方法,實現(xiàn)了數(shù)據(jù)端到端的分類診斷,將信號通過格拉姆變換為圖像后輸入到多尺度卷積神經(jīng)網(wǎng)絡中進行訓練,解決了軸承原始信號中噪聲干擾相關退化信號導致分類準確率低的問題,利用圖像信息的豐富性保留了信息的完整性并避免了時序依賴性。試驗結果表明該方法的分類準確率高達99.67%,損失率僅為1.022%,且模型訓練速度快,魯棒性高,能夠對軸承的分類問題進行高效的診斷;但所構建的模型仍存在一些錯誤分類情況,后續(xù)將對軸承混合故障的分類做出進一步研究和試驗。