杜小磊,陳志剛,張楠,許旭
(1.北京建筑大學 機電與車輛工程學院,北京 100044;2.北京市建筑安全監(jiān)測工程技術研究中心,北京 100044)
滾動軸承是旋轉機械的重要部件,一旦出現(xiàn)故障,輕則使設備工作異常,降低生產(chǎn)質量;重則造成生產(chǎn)事故,給企業(yè)造成重大損失。因此,及時診斷軸承故障具有重要意義。特征提取和狀態(tài)識別是軸承故障診斷的兩個重要步驟。傳統(tǒng)的基于時域和頻域的信號特征提取,通常將信號的平均統(tǒng)計量作為特征,但軸承振動信號受外界干擾嚴重,多個振源的激勵和響應相互耦合,導致難以進行有效特征提取[1]。在時頻聯(lián)合分析方法中,短時傅里葉變換不能滿足時頻局部化;經(jīng)驗模態(tài)分解[2]、固有時間尺度分解[3]和局部均值分解[4]存在模態(tài)混疊和端點效應;Wigner-Ville分布存在交叉項干擾;連續(xù)小波變換(continuous wavelet transform,CWT)可以較好表達信號的局部時頻性質,但分辨率較低,為提高CWT的時頻可讀性,I.Daubechies等[5]提出同步壓縮小波變換(synchrosqueezed wavelet transform,SST),改善了CWT的能量發(fā)散狀況,從而提高了時頻分辨率。
在軸承故障識別方面,廣泛使用的人工神經(jīng)網(wǎng)絡(artificial neural networks,ANN)和支持向量機(support vector machine,SVM)均屬于淺層模型,在當今大數(shù)據(jù)時代,這些淺層模型面臨維數(shù)災難問題,難以表征被測信號與故障之間復雜的映射關系。深度學習[6]克服了淺層模型的缺陷,通過貪婪逐層訓練算法解決了深層網(wǎng)絡的訓練問題,在很大程度上擺脫了依賴于診斷專家經(jīng)驗的信號處理與特征提取,并已應用于故障診斷領域[7]。溫江濤等[8]將深度稀疏自編碼器用于軸承故障診斷;張紹輝等[9]將軸承振動信號的包絡線作為深度自編碼器的輸入,取得98%的識別率。但目前大多數(shù)有關深度學習的故障診斷研究只考慮到信號的時域或頻域等單一信息,且網(wǎng)絡所使用的大都為S型激活函數(shù),難以建立各種故障狀態(tài)與輸入信號之間的精確映射[10]。脊波[11](ridgelet)可在小波特有的參數(shù)外,增添對信號方向性的表示,包含尺度因子、位移因子和方向因子,位移因子使脊波沿著信號的時間軸進行遍歷性分析,尺度因子用于分析信號不同的頻率,方向因子用于分析信號不同方向的特性。因此,將脊波函數(shù)和深度學習相結合,具有更明顯的優(yōu)勢。
在SST、脊波和深度學習的基礎上,本文提出一種新的滾動軸承故障診斷方法:首先,對軸承振動信號進行SST變換;其次,將得到的時頻圖像進行雙向二維主成分分析(two-directional two dimensional principal components analysis,TD-2DPCA)壓縮,TD-2DPCA能有效去除二維矩陣行與列之間的相關性,顯著降低二維矩陣的維數(shù),并保留原始矩陣的主要信息,很大程度上減小計算量,從而提高計算效率,其詳細算法見文獻[12];最后,構建深度脊波網(wǎng)絡(deep ridgelet network,DRN),對壓縮的時頻圖像進行深層特征提取,以實現(xiàn)故障識別。
軸承故障診斷領域已越來越多地用到時頻分析技術。一種好的時頻分析技術應具有較高的時頻分辨率,以便能清楚地觀察到信號的結構,這對于識別軸承運行工況和提取軸承故障特征都有積極的意義。為改善CWT的能量發(fā)散狀況,從而提高時頻可讀性,SST應運而生。SST通過小波系數(shù)重排技術提高CWT的時頻分辨率,且能重建原始信號。
定義函數(shù)f(t)的CWT為
W(a,τ)=
(1)
式中:a和τ分別為尺度因子和平移因子;ψa,τ(t)為小波函數(shù)。
SST基本原理為:由式(1)求得信號f(t)的CWT系數(shù)為W(a,τ),對于時間-尺度平面上任一點(a,τ),若W(a,τ)不為0,則f(t)的瞬時頻率w(a,τ)計算式為
(2)
定義f(t)的SST變換為
(3)
式中:T(w,τ)為SST系數(shù);w為瞬時頻率,Δw為頻率離散間隔;ak為離散小波尺度;Δa為尺度離散間隔,頻率范圍為(w-Δw/2,w+Δw/2)。
為驗證SST的效果,需要進行仿真信號分析,模擬信號設為
(4)
f(t)由3個分量疊加而成,f1(t)為余弦信號,f2(t)和f3(t)為調頻信號,設置采樣時間2 s,采樣間隔2 ms。圖1和圖2分別是仿真信號的SST時頻譜和CWT時間-尺度譜。由圖1~2可知,CWT時間-尺度譜模糊嚴重,分辨率低,在真實瞬時頻率附近存在一定寬度的偽頻率成分;SST通過“擠壓”使能量回到真實瞬時頻率上,很大程度上提高了信號時頻分辨率。
圖1 SST時頻譜Fig.1 SST time-frequency diagram
圖2 CWT時間-尺度譜Fig.2 CWT time-scale diagram
深度自編碼器(deep auto-encoder,DAE)為無監(jiān)督深度模型,由多個自編碼器(auto-encoder,AE)組成,每個AE包括輸入層、隱含層和輸出層,輸入層維數(shù)和輸出層維數(shù)相同。AE的目的是最小化輸入和輸出之間的重構誤差,以逼近一個恒等函數(shù),從而完成自動特征提取。而脊波自編碼器(ridgelet auto-encoder,RAE)結合了脊波函數(shù)的時-頻及方向局部特性和AE自動特征提取的優(yōu)點,使用脊波函數(shù)代替AE的S激活函數(shù),具有比AE更好的特征提取和表示的性能。DRN由多個RAE構成,標準RAE和DRN的結構如圖3所示。
設RAE輸入層和輸出層為m個神經(jīng)元,隱層為L個神經(jīng)元,Wjk是連接輸入層神經(jīng)元k和隱層脊波神經(jīng)元j的權值,aj、cj和uj分別為隱層脊波神經(jīng)元j的尺度因子、平移因子和方向因子。給定m維輸入向量
x=[x1,…,xm]T,
圖3 RAE和DRN結構Fig.3 Structures of standard RAE and DRN
脊波神經(jīng)元j的輸出為
(5)
其中,Ψ為Morlet小波激活函數(shù)的實部,表達式為
(6)
則隱層脊波神經(jīng)元j的輸出重寫為
(7)
輸出層神經(jīng)元i的輸出為
(8)
S(t)=1/(1+e-t),
(9)
其中,Wij為輸出層神經(jīng)元i和隱層神經(jīng)元j的連接權值。訓練RAE就是不斷地調整參數(shù),最后找到一組最優(yōu)的參數(shù)θRAE={Wij,Wjk,aj,cj,uj},使輸入和輸出之間的重構誤差最小化,重構誤差函數(shù)通常為均方誤差代價函數(shù)。DRN堆疊多個RAE,采取逐層化訓練方法,將上一層RAE隱層輸出作為下一層RAE的輸入,并保證重構誤差最小化,從而構成多層次網(wǎng)絡結構,直到整個DRN完成訓練。RAE各參數(shù)更新公式一般為
(10)
式中:η為學習率;LRAE(k)為RAE第k次迭代的重構誤差。
原始RAE抗噪能力弱,泛化能力弱,為此,改進誤差函數(shù),加入收縮自編碼機制并改進權重更新策略,詳細如下。
(1)標準RAE重構誤差函數(shù)一般使用均方誤差代價函數(shù),使得對復雜信號的特征學習魯棒性低,而文獻[13]提出的最大相關熵損失函數(shù)對復雜非平穩(wěn)背景噪聲不敏感,可以有效彌補均方誤差函數(shù)的缺陷。本文采用最大相關熵設計RAE誤差函數(shù)。設兩個隨機變量A=[a1,a2,…,aN]T,B=[b1,b2,…,bN],相關熵近似計算如式(11)所示,σ為高斯核函數(shù)尺寸,
(11)
則RAE損失函數(shù)可以通過最大化以下函數(shù)實現(xiàn),
(13)
式中:m為樣本個數(shù);xi為輸入樣本向量;yi為輸出樣本向量。
(2)收縮自編碼機制。收縮自編碼器(contractive auto-encoder,CAE)以AE的激活函數(shù)對于輸入的雅克比矩陣的Frobenius Norm為懲罰項,使CAE學到的特征對輸入的狹小變動具有魯棒性。懲罰項為
(14)
式中:m和L分別為輸入數(shù)據(jù)和隱含層輸出數(shù)據(jù)的維度;Wjk為輸入層與隱含脊波神經(jīng)元間的權值;hj為隱層脊波神經(jīng)元j的輸出。則改進后的RAE的損失函數(shù)為
(15)
式中:λ1為懲罰參數(shù),用于調節(jié)收縮懲罰項在目標函數(shù)中的所占比例;Dm為m個輸入樣本集合;λ2為權重衰減項系數(shù),用于防止網(wǎng)絡過擬合;sl是第l層的神經(jīng)元個數(shù),s1=s3=m,s2=L;WIJ(l)為第l層權重,WIJ(1)=Wij,WIJ(2)=Wjk。
(3)權重更新策略改進。對于式(10)所示的參數(shù)更新算法,學習率η是一個全局性的常數(shù),η過大不利于網(wǎng)絡收斂,η過小耗時過多,因此,引入自適應調整策略,以Wij更新為例,更新公式為
(16)
該方法在網(wǎng)絡迭代開始階段,使網(wǎng)絡有較大的學習率,從而使誤差函數(shù)快速衰減,隨迭代增加,學習率逐漸減小,有助于模型收斂。
為進一步優(yōu)化所提取的特征,在DRN最后一層加上有監(jiān)督的Softmax分類器,使用帶標簽的樣本數(shù)據(jù)結合BP算法對網(wǎng)絡進行微調。Softmax分類器針對多類分類問題,類別標簽y為向量形式,表示當前樣本類別在所有可能類別中的分布概率。Softmax分類器的詳細訓練算法見文獻[14]。
綜上,所提出方法的總流程如圖4所示,主要步驟如下。
圖4 本文方法整體流程Fig.4 Overall flowchart of the proposed method
(1)首先采集軸承不同類型的故障信號并進行SST變換,得到時頻圖像。
(2)將時頻圖像經(jīng)雙向主成分分析壓縮至28×28維度,從壓縮后的時頻圖像樣本集隨機選取70%作為訓練樣本,其余作為測試樣本,訓練樣本中隨機選取90%作為無標簽樣本,10%作為有標簽樣本進行微調。
(3)將時頻矩陣按行重組成一列,根據(jù)實際數(shù)據(jù)大小確定網(wǎng)絡深度、各層神經(jīng)元數(shù)量和學習率等參數(shù)。
(4)進行網(wǎng)絡訓練,逐層訓練RAE,將上一層RAE隱層輸出作為下一層RAE的輸入,逐層提取特征信息,將最后一層RAE隱層輸出作為Softmax分類器的輸入,通過帶標簽樣本結合BP算法微調整個網(wǎng)絡。
(5)使用測試樣本測試訓練后模型的性能。
為驗證本文方法的有效性,以軸承故障模擬實驗臺為對象,采集不同故障類型、不同故障程度的7種軸承工況。實驗臺如圖5所示,美國SpectraQuest公司生產(chǎn),由驅動器、電磁制動器等組成,加速度傳感器置于驅動端附近,使用電火花技術在軸承的內圈、外圈和滾動體上加工故障直徑分別為0.18,0.36 mm的切槽,采樣頻率12 kHz,轉速1 800 r/min,負載735 W,轉軸轉1圈,傳感器采集400(12 000×60/1 800=400)個數(shù)據(jù)點。最后得到每種工況下1 000個樣本,每個樣本由800個采樣點組成。表1為7種軸承工況,表2為軸承參數(shù)。為減少噪聲干擾,將軸承原始信號歸一化到[0,1]。圖6為軸承7種工況時域波形,可以看出,軸承內圈和外圈故障信號出現(xiàn)周期性沖擊成分,但早期故障信號噪聲干擾嚴重,部分沖擊淹沒在噪聲中,振動情況復雜,難以區(qū)分故障類型及故障程度。由于傳統(tǒng)特征提取方法的不確定性,軸承早期輕微故障和復合故障特征難以提取,有必要引入深度學習,以建立故障與信號之間的精確映射關系。
圖5 軸承故障診斷實驗臺Fig.5 Experimental platform of roller bearing fault diagnosis
表1 7種軸承工況Tab.1 Seven bearing working conditions
表2 軸承參數(shù)Tab.2 Parameters of bearing
圖6 7種軸承工況的振動信號波形
Fig.6 Vibration signals of seven bearing conditions
以軸承外圈故障為例,分析SST的效果。軸承外圈故障特征頻率計算式為
(17)
由式(17)計算求得軸承外圈故障特征頻率,為101.23 Hz,轉頻fr為30 Hz。圖7~8分別為軸承外圈振動信號SST和CWT變換得到的時-頻圖和時間-尺度圖。從SST時頻譜中可以比較清晰地看出故障外圈故障頻率,而CWT時間-尺度譜受干擾項影響嚴重,故障頻率不夠清晰。
圖7 SST時頻圖Fig.7 SST time-frequency diagram
為驗證本文方法的優(yōu)越性,使用ANN、SVM、深度信念網(wǎng)絡(DBN)和深度稀疏自編碼器(DSAE)進行分析對比。本文方法輸入的是SST壓縮數(shù)據(jù)(784維),ANN和SVM的輸入是24個特征(11個時域特征和13個頻域特征),這24個特征的詳細計算見文獻[15]。DRN雖然省去了大量的人工特征提取時間,但是其隱含層層數(shù)和隱含層節(jié)點數(shù)的確定依然依賴人力。AutoKeras開源軟件利用貝葉斯優(yōu)化,通過每次選擇最佳運算來引導結構搜索空間,能根據(jù)所給定的數(shù)據(jù)集,自動搜索在上面執(zhí)行某個任務時可以達到最佳表現(xiàn)的神經(jīng)網(wǎng)絡結構。本文基于AutoKeras軟件,搜索得到最優(yōu)DRN的隱含層數(shù)目和隱含層節(jié)點數(shù)目。根據(jù)本文方法,將訓練樣本輸入AutoKeras,AutoKeras將自動搜索在執(zhí)行滾動軸承故障識別任務時可以達到最佳表現(xiàn)的DRN。輸出如下:輸出6層DRN模型,包括輸入、輸出層及4個隱層,結構為784-392-196-98-49-7。RAE的迭代次數(shù)為120,整體微調次數(shù)為1 000。超參數(shù)設置方法見文獻[16],設置如下:高斯核函數(shù)尺寸σ為3.26,懲罰參數(shù)λ1為0.03,權重衰減項系數(shù)λ2為0.003,RAE的初始學習率為0.5。其他方法的主要參數(shù)如下。
方法2(24個特征參數(shù)輸入SVM):SVM采用高斯核函數(shù),核函數(shù)的懲罰因子和半徑分別為27和0.17,由10折交叉驗證法確定。
方法3(24個特征參數(shù)輸入ANN):ANN結構為24-48-7,學習率0.04,迭代次數(shù)800,由10折交叉驗證法確定。
方法4(SST壓縮數(shù)據(jù)輸入DSAE):DAE的結構為784-392-196-98-49-7,學習率、動量參數(shù)和迭代次數(shù)分別為0.05,0.1和1 900。
方法5(SST壓縮數(shù)據(jù)輸入DBN):DBN的結構為784-392-196-98-49-7,學習率、動量參數(shù)和迭代次數(shù)分別為0.08,0.2和1 900。
為減小隨機因素影響,進行5次測試,取平均結果。表3列出了測試階段的平均診斷準確率和標準差,圖9為在每次試驗中使用不同方法的詳細診斷結果。
表3 不同方法的平均診斷結果Tab.3 Diagnosis results of different methods
圖9 不同方法的5次測試結果Fig.9 Detailed testing results of different methods for five trials
從表3可以看出,與其他方法相比,本文方法具有更高的測試準確率和更小的標準差,平均測試正確率達到98.89%,標準差僅0.16。由圖9可知,5次試驗的準確率分別為98.82%,99.49%,99.01%,98.87%,98.80%,均高于其他方法,主要原因是ANN和SVM等傳統(tǒng)淺層模型的性能在很大程度上依賴于繁瑣的人工特征提取與選擇,導致診斷精度和泛化能力低;與其他深度模型相比,本文方法改進了編碼器損失函數(shù)并充分利用了脊波函數(shù)的優(yōu)良特性,進一步提高了對復雜非平穩(wěn)振動信號的特征學習能力,因此,具有更高的穩(wěn)定性。圖10給出了使用本文方法第1次測試得到的多分類混淆矩陣,由圖10可知,復合故障狀態(tài)b和c的分類正確率較低。
圖10 多分類混淆矩陣Fig.10 Multi-class confusion matrix
圖11和圖12是平均分類精度與懲罰參數(shù)λ1、權重衰減項系數(shù)λ2之間的關系。分析可知,識別精度對懲罰參數(shù)和權重衰減系數(shù)敏感,較小的懲罰參數(shù)值和權重衰減系數(shù)值有助于網(wǎng)絡取得較好的性能。
圖11 懲罰參數(shù)λ1對平均測試準確率的影響Fig.11 Effects of penalty parameter λ1 on the testing accuracy
圖12 權重衰減系數(shù)λ2對平均測試準確率的影響Fig.12 Effects of weight decay parameter λ2 on the average testing accuracy
分別對本文方法、SDAE和DBN學習得到的深層特征進行評價和比較。以第1次試驗為例,采用主成分分析(PCA)對各網(wǎng)絡最后一層特征進行二維可視化,如圖13~15所示,PC1和PC2分別表示前兩個主成分??梢钥闯?,SDAE和DWNN所提取的特征在不同的故障工況之間存在一定的重疊,而本文提出的模型具有更強的從非平穩(wěn)振動信號逐層學習從而獲取具有代表性的信息的能力。
圖13 本文模型深層特征2維可視化Fig.13 Two-dimensional visualizations of the deep features learned by the proposed model
圖14 SDAE深層特征2維可視化Fig.14 Two-dimensional visualizations of the deep features learned by the SDAE
圖15 DBN深層特征2維可視化Fig.15 Two-dimensional visualizations of the deep features learned by the DBN
提出一種基于SST和DRN的軸承故障診斷方法,實現(xiàn)了較高精度的軸承故障識別,較其他軸承故障識別方法更具優(yōu)勢,主要結論如下:
(1)對軸承故障振動信號進行SST變換,提高了信號的時頻分辨率,更有利于故障特征提取。
(2)將深度學習和脊波理論相結合,使深層網(wǎng)絡具有更強大的自動提取特征的能力,避免了復雜的人工提取特征過程,且改進了RAE的誤差函數(shù)和優(yōu)化算法,又引入收縮自編碼機制,使網(wǎng)絡對信號的特征學習的魯棒性增強,較其他方法具有更大的優(yōu)勢,具有較好的理論意義和一定的工程應用價值。但是,目前還沒有系統(tǒng)的理論體系指導網(wǎng)絡參數(shù)的選擇,往往還需要根據(jù)經(jīng)驗選取,而且網(wǎng)絡訓練耗時,這是今后需要進一步研究的方向。