杜小磊,陳志剛,張楠,許旭
(1.北京建筑大學 機電與車輛工程學院,北京 100044;2.北京市建筑安全監(jiān)測工程技術研究中心,北京 100044)
當今大數(shù)據(jù)時代,由于反映軸承運行工況的海量數(shù)據(jù)的積累,傳統(tǒng)的基于“人工特征提取+模式識別”的軸承故障診斷方法[1-4]越來越不能滿足現(xiàn)代自動化診斷的要求[5]。深度學習[6]能自動從原始數(shù)據(jù)中學習具有代表性的特征,很大程度上擺脫了對診斷人員信號處理與特征提取經(jīng)驗的依賴,并已應用于軸承故障診斷領域。文獻[7]將3層深層降噪自編碼器用于軸承故障診斷,并探究了輸入維數(shù)、深層結構等因素對網(wǎng)絡性能的影響;文獻[8]采用深層稀疏自編碼器直接學習軸承振動時域信號,省去了復雜的信號處理過程;文獻[9]將軸承振動信號的包絡線作為深層自編碼器的輸入,取得98%以上的識別準確率;然而,上述基于深層自編碼器的研究所使用的Sigmoid激活函數(shù)難以建立軸承故障與振動信號之間的精確映射關系[10],且所使用的Softmax分類器存在收斂速度慢、泛化能力低的問題[11]。
小波函數(shù)包含尺度因子和位移因子,位移因子使小波沿著信號的時間軸進行遍歷性分析,尺度因子用于分析信號不同的頻率,因此,將小波與深度學習模型相結合,將使深度模型具有更優(yōu)的自動特征提取能力。目前,大多數(shù)基于深度學習的軸承故障診斷研究所使用的模型為單一深層模型,而由于軸承振動信號的復雜性,使用單一深層模型進行軸承故障診斷時存在網(wǎng)絡結構單一、泛化能力低的問題[12]。
綜上,建立一種基于集成深度小波神經(jīng)網(wǎng)絡(Ensemble Deep Wavelet Neural Network,EDWNN)和深度小波支持向量機(Deep Wavelet Support Vector Machine,DW-SVM)的滾動軸承故障診斷方法,將小波和深度模型相結合,采用不同的小波函數(shù)作為激活函數(shù),設計出一系列具有不同特性的改進小波自編碼器(Wavelet Auto-Encoder,WAE)構造相應的DWNN,實現(xiàn)對軸承振動數(shù)據(jù)的無監(jiān)督特征學習,并將各DWNN頂層特征融合后輸入DW-SVM分類器,從而實現(xiàn)精確的滾動軸承故障診斷。
深層自編碼器(Deep Auto-Encoder,DAE)[13]是一種無監(jiān)督深度學習模型,由多個自編碼器(Auto-Encoder,AE)構成,每個AE由輸入層、隱含層和輸出層組成,輸入層維數(shù)等于輸出層維數(shù)。AE的目的是最小化輸入與輸出之間的重構誤差,使其逼近一個恒等函數(shù),從而自動完成特征提取。WAE結合了小波函數(shù)的時頻局部特性和AE自動特征提取的優(yōu)點,使用小波函數(shù)代替AE的Sigmoid激活函數(shù),具有比AE更好的特征提取和表示的性能。DWNN則由多個WAE堆疊構成,標準WAE和2隱層DWNN的結構如圖1所示。
設WAE輸入層有m個節(jié)點,隱含層有L個節(jié)點,輸出層有m個節(jié)點,Wjk為隱含層小波節(jié)點j和輸入層節(jié)點k的連接權值,aj和cj分別為隱含層小波節(jié)點j的尺度因子和平移因子。給定m維輸入向量x=[x1,…,xm]T,隱層小波節(jié)點j的輸出為
圖1 WAE和DWNN結構
(1)
式中:φ為小波激活函數(shù)。以Morlet小波函數(shù)的實部為例,φ的表達式為
(2)
于是,小波節(jié)點j的輸出改寫為
(3)
輸出層激活函數(shù)為Sigmoid函數(shù),則輸出層節(jié)點i的輸出為
(5)
式中:Wij為隱層小波節(jié)點j與輸出層節(jié)點i的連接權值。訓練WAE就是不斷地調整參數(shù),最后找到一組最優(yōu)的參數(shù)θWAE={Wij,Wjk,aj,cj},使得輸入和輸出之間的重構誤差最小化。DWNN堆疊多個WAE,采取逐層化訓練方法,將上一層網(wǎng)絡中隱含層的輸出作為下一層網(wǎng)絡的輸入,并保證損失函數(shù)最小化,從而構成多層次的網(wǎng)絡結構,直到整個DWNN完成訓練,為了進一步優(yōu)化所提取的特征,將帶有標簽的樣本數(shù)據(jù)結合BP算法對DWNN網(wǎng)絡進行微調。
原始的WAE抗噪能力弱,泛化能力弱,容易過擬合,因此,通過改進誤差函數(shù)、加入降噪自編碼機制、Dropout機制和收縮自編碼機制對WAE進行改進。
1)改進誤差函數(shù)。標準AE重構誤差函數(shù)一般使用均方誤差代價函數(shù),對于軸承復雜振動信號的特征學習魯棒性低,最大相關熵損失函數(shù)[14]能夠較好地改進均方誤差函數(shù)的缺陷,且對復雜非平穩(wěn)背景噪聲不敏感,具有與復雜信號特征相匹配的潛力,因此將其作為WAE的損失函數(shù)。設2個隨機變量A=[a1,a2,…,aN]T,B=[b1,b2,…,bN]T之間的相關熵為
(6)
(7)
式中:σ為高斯核函數(shù)尺寸。
WAE重構誤差函數(shù)可以通過最大化以下函數(shù)實現(xiàn)
(8)
式中:N為樣本個數(shù);xi為輸入樣本向量;yi為重構樣本向量。
2)降噪自編碼機制。將訓練數(shù)據(jù)的某些維度數(shù)值隨機設置為0,在訓練時要求WAE仍然能夠還原原始輸入,從而使得網(wǎng)絡能無監(jiān)督地學習到更具魯棒性的特征,顯著降低網(wǎng)絡的過擬合。
3)Dropout機制。在WAE訓練過程中,將隱層神經(jīng)元按一定概率P丟棄,以較低成本實現(xiàn)模型融合,且能明顯降低過擬合的風險。
4)收縮自編碼機制。收縮自編碼器(Contractive Auto-Encoder,CAE)以AE的激活函數(shù)對于輸入的雅克比矩陣的Frobenius Norm為懲罰項,使CAE學到的特征對輸入的狹小變動具有魯棒性。懲罰項為
(9)
則改進后的WAE的損失函數(shù)為
(10)
各參數(shù)的更新公式[15]為
(11)
式中:η為學習率;LWAE(k)為第k次迭代時WAE的重構誤差。
為克服單一DWNN的局限性,提高泛化性能,采用多個DWNN的集成。不同的小波函數(shù)構成不同的DWNN網(wǎng)絡,會表現(xiàn)出不同的特征和互補的學習行為。利用3種不同小波激活函數(shù)(表1)來構造不同的DWNN網(wǎng)絡。
表1 3種激活函數(shù)的方程
Softmax分類器的收斂速度慢,泛化能力低;傳統(tǒng)SVM分類器不能充分挖掘數(shù)據(jù)的內在特征信息[16]。深度支持向量機將深度學習模型應用于SVM,將訓練后的上一層SVM核激活函數(shù)值輸入到下一層SVM,兩層間的特征提取框架結構如圖2所示。
圖2 兩層間的特征提取結構圖
從原始輸入特征集中獲得第1層的訓練權重。設N個輸入樣本xi∈R,從訓練樣本可以得到p個支持向量s1,…,sp及其對應的Lagrange乘子系數(shù)α1,…,αp,以及對應的支持向量的標簽y1,…,yp,則下一層的激活值為
h1(i)=αiyiK(si,x),
(12)
式中:h1(i)為第1個隱層的第i個元素。h1的維數(shù)為p。輸入層到第1隱層之間的權值訓練完成,下一層的權值按照同樣的方式逐層訓練。最后一層的分類結果為
(13)
式中:si為第i個支持向量;l為最后一層支持向量的數(shù)量;o(x)為數(shù)據(jù)經(jīng)隱層變化后的特征;b為分類偏差,只在最后一層使用;K為核函數(shù)。實際中,RBF核函數(shù)應用廣泛,但RBF核函數(shù)不是正交基,不能任意逼近L2(R)空間中的曲線,導致RBF-SVM不能逼近L2(R)空間中的任意函數(shù);由于Morlet小波函數(shù)可以通過伸縮和平移建立正交基,并在L2(R)空間中有任意逼近的能力,且滿足SVM核函數(shù)的容許條件,因此,使用Morlet小波核函數(shù),其表達式為
(14)
為將DW-SVM應用于多分類問題,采用基于決策樹的多分類算法[17]。綜上,滾動軸承故障診斷的流程如圖3所示,主要步驟如下:
1)獲取不同故障狀態(tài)的軸承振動數(shù)據(jù)樣本集并進行歸一化操作,從樣本集中隨機選取70%作為訓練樣本,其余作為測試樣本,再從訓練樣本中隨機選取80%作為無標簽樣本,其余作為有標簽樣本。
2)采用不同的小波激活函數(shù)設計一系列性能不同的改進WAE,并進一步構造相應的DWNN。
3)第1階段,使用無標簽樣本對DWNN網(wǎng)絡進行無監(jiān)督預訓練;第2階段,將各DWNN網(wǎng)絡學習到的深層特征進行融合,即將DWNN頂層特征組成一維特征向量,輸入到DW-SVM分類器中進行訓練,無需任何人工特征提取,這一階段使用帶標簽樣本數(shù)據(jù)。
4)測試樣本驗證訓練后模型的性能。
圖3 滾動軸承故障診斷流程
為驗證上述方法的有效性,以軸承故障模擬試驗臺為對象,采集不同故障類型、不同故障程度的7種軸承工況。試驗臺如圖4所示,加速度傳感器置于驅動端附近,在SKF 6205深溝球軸承的內、外圈和鋼球上用電火花加工技術加工直徑分別為0.18和0.36 mm的單點故障。采樣頻率為12 kHz,在1 800 r/min工況下采集軸承振動信號。訓練DWNN需要大量訓練樣本,由于軸承的故障信息主要蘊含在不同故障狀態(tài)產(chǎn)生的沖擊中,因此,對訓練數(shù)據(jù)進行有重疊樣本分割[18],從而實現(xiàn)數(shù)據(jù)擴充,這種分割方式即增加了訓練樣本數(shù)量,又可以使DWNN模型學習到更具魯棒性的特征。最后得到每種工況下1 000個樣本,每個樣本由600個采樣數(shù)據(jù)點組成。7種軸承工況描述見表2,滾動軸承的故障診斷實際上就是對故障編碼進行識別的過程[19],訓練DW-SVM的過程為有監(jiān)督訓練,必須對每個樣本設置編碼,以判斷樣本是否識別正確。由于共設置7 種工況狀態(tài),故設置樣本故障編碼樣式為7位數(shù)字組成。當輸入某一種類型的振動數(shù)據(jù)時,輸出結果中7位數(shù)字只有 1位數(shù)字賦值為1,其余數(shù)字賦值為0。
圖4 軸承試驗臺
表2 7種軸承工況
為減少噪聲干擾,將軸承原始信號歸一化到[0,1],7種工況軸承振動信號的時、頻域波形如圖5所示。由時域圖可知,早期故障信號受噪聲干擾嚴重,部分沖擊淹沒在噪聲中,振動情況較為復雜,難以區(qū)分軸承故障類型及故障程度。由頻域圖可知,同種故障類型的頻譜有一定的差異,但同種故障類型中不同程度的故障從頻譜上很難區(qū)分。而且,由于傳統(tǒng)特征提取方法的不確定性和復雜性,使得軸承早期輕微故障特征和復合故障特征難以提取,故障診斷難度很大。因此,有必要引入深度學習,進行逐層特征提取以建立各種故障狀態(tài)與輸入信號之間的精確映射關系。
圖5 7種工況下軸承振動信號的時、頻域圖
為驗證本文方法的優(yōu)越性,采用人工神經(jīng)網(wǎng)絡(ANN)、支持向量機(SVM)、深度置信網(wǎng)絡(DBN)、深度稀疏自動編碼器(DSAE)和單一DWNN進行分析比較,其中ANN和SVM的輸入為24個特征[20],包括11個時域特征和13個頻域特征。不同方法的參數(shù)設置及診斷結果見表3,5次試驗的詳細診斷結果如圖6所示。
圖6 不同方法的5次測試結果
從表3中可以看出,方法1(即EDWNN+DW-SVM)的平均測試正確率達到99.18%,標準差為0.099,與其他方法相比具有最高的測試準確率和最小的標準差。從圖6可以看出,方法1每次測試的平均準確率分別為99.18%,99.16%,99.18%,99.18%和99.19%,均高于其他方法。在這幾種方法中,方法1訓練用時最多,耗時比其他單一深度模型多4倍,但幾種方法的測試用時都不高,方法1僅0.089 s,具有較好的實用性。綜合分析表明,方法1具有更高的分類正確率和穩(wěn)定性,主要原因是:1)方法1將小波與深度學習相結合,通過多個非線性變換更有效地從軸承原始振動數(shù)據(jù)中提取特征,而ANN和SVM等傳統(tǒng)方法的性能很大程度上依賴于人工特征提取,非常耗費時間;2)方法1充分利用了不同DWNN相互提供的互補信息,結合DW-SVM優(yōu)異的分類性能,使得測試精度和穩(wěn)定性均優(yōu)于單一的深度模型。
表3 不同方法的診斷結果
方法1第1次測試結果的多分類混淆矩陣如圖7所示,其全面記錄了不同軸承故障狀態(tài)下的識別結果,包括正確分類信息和錯誤分類信息。其中,縱坐標表示軸承狀態(tài)的實際標簽,橫坐標表示預測標簽,主對角線上的元素代表了各狀態(tài)的識別精度。從圖7可以看出,復合故障狀態(tài)b的分類正確率相對較低,但也達到了98%以上。
圖7 多分類混淆矩陣
為驗證DW-SVM分類器對軸承故障識別的優(yōu)越性,與Softmax,SVM,ANN和D-SVM幾種分類器進行對比,結果見表4。表中分類正確率為5次試驗的平均結果,由于DW-SVM分類器通過Morlet小波的伸縮和平移建立小波和D-SVM的正交基,能夠刻畫數(shù)據(jù)的細節(jié),數(shù)據(jù)擬合率高,分類準確率高于其他分類器。
表4 不同分類器的診斷結果
為直觀顯示DWNN所提取的特征,以軸承外圈故障振動狀態(tài)f為例,由于網(wǎng)絡所提取的深層特征較抽象,因此只給出激活函數(shù)為Morlet小波的DWNN提取的第1隱層的特征(以序列方式),如圖8所示。從圖中可以看出,DWNN所提取的第1隱層的特征從不同角度反映了原始信號,這些特征比較好地滿足了Fisher判別準則[23],更有利于最后的分類。
為深入了解DWNN的特征提取效果,通過t-SNE(t-Distributed Stochastic Neighbor Embedding)降維技術將測試集融合特征降為2維并進行可視化,如圖9所示。從圖中可以看出,各故障類別已基本分開,表明該模型具有更強的從非平穩(wěn)振動信號逐層學習以獲取具有代表性信息的能力。
圖9 深層特征的2維可視化
在實際情況下,不同工況狀態(tài)下的樣本數(shù)據(jù)是不平衡的,正常狀態(tài)的樣本比例要大于故障狀態(tài)的樣本比例。因此,設置4組不同比例的不平衡數(shù)據(jù)以研究方法1在不平衡訓練樣本情況下的軸承故障分類性能。4組數(shù)據(jù)中,正常狀態(tài)和各種故障狀態(tài)下的測試樣本數(shù)量均設置為200,正常狀態(tài)和各故障狀態(tài)下的訓練樣本數(shù)量比例分別設置為1 000∶1 000,1 000∶800,1 000∶600和1 000∶500,組1中的樣本數(shù)據(jù)情況與3.1節(jié)相同,即正常狀態(tài)和各故障狀態(tài)下的訓練樣本數(shù)量均為1 000。
共進行5次試驗并取平均結果,幾種方法的分類正確率如圖10所示。從圖中可以看出:幾種模型的平均故障分類正確率隨著不平衡比例的增大整體上呈現(xiàn)下降趨勢;但4組數(shù)據(jù)中,方法1的分類效果均優(yōu)于其他幾種方法;甚至當不平衡比例為1 000∶500時,方法1的平均分類正確率仍可達98.14%,在面對不同比例的不平衡樣本時表現(xiàn)更加優(yōu)異。
圖10 不平衡數(shù)據(jù)下各方法的分類正確率
實際應用中,目標樣本數(shù)量不充分會造成深度網(wǎng)絡的泛化性能降低甚至失效。針對此問題,在原有DWNN基礎上引入迀移學習策略,構建基于輔助訓練集的DWNN模型,基本思想是將大量輔助樣本集用于網(wǎng)絡預訓練過裎,將少量目標樣本集用于網(wǎng)絡微調過程,以此實現(xiàn)遷移目的。為驗證在目標訓練樣本集不足情況下模型的性能,將美國凱斯西儲大學(CWRU)實驗室[24]采集的滾動軸承故障數(shù)據(jù)作為輔助訓練數(shù)據(jù),數(shù)據(jù)是采樣頻率為12 kHz、轉速為1 772 r/min時驅動端軸承故障下的振動數(shù)據(jù),包括表2中的7種狀態(tài),將3.1節(jié)試驗中所測得的數(shù)據(jù)作為目標數(shù)據(jù)。每個信號仍然取600個時域采樣點,其中輔助樣本集的數(shù)量為對應的目標訓練樣本集的5倍,目標測試樣本每種狀態(tài)為100個,同時,使用標準DWNN模型(即僅用少量目標訓練樣本訓練所得的模型)作為對比。2種模型診斷正確率隨目標樣本數(shù)目的變化如圖11所示,從圖中可以看出:隨目標樣本個數(shù)的增加,2種模型的診斷性能總體呈上升趨勢,在目標訓練樣本較少的情況下,基于遷移學習的DWNN模型對目標測試樣本的診斷效果要好于標準DWNN模型;當目標樣數(shù)超過200時,2種模型性能相當。
圖11 2種模型的對比結果
提出一種基于EDWNN和DW-SVM的滾動軸承智能故障診斷方法,實現(xiàn)了高精度的軸承故障診斷,較其他方法具有較大優(yōu)勢:
1) 將深度學習與小波理論相結合,使深度網(wǎng)絡具有更強大的自動提取特征的能力,避免了復雜的人工提取特征過程,又改進了WAE的誤差函數(shù),引入Dropout機制、降噪自編碼機制和收縮自編碼機制,對信號特征學習的魯棒性大大增強,增強了網(wǎng)絡泛化性能。
2) 將單一DWNN模型進行集成,充分利用了不同DWNN相互提供的互補信息,可以獲得比單一深度模型更好的學習效果。
3) DW-SVM分類器結合了小波和D-SVM模型的優(yōu)點,能夠刻畫數(shù)據(jù)的細節(jié),對數(shù)據(jù)的擬合率高,分類精度也相對較高。
然而,關于深度學習滾動軸承故障診斷的研究文獻所使用的數(shù)據(jù)對于深度學習來說仍然十分不足,且數(shù)據(jù)中軸承故障的類型較少,對新型故障類型難以判別,今后需不斷收集相關數(shù)據(jù),以進行更深入的研究。