段敏霞,劉 鑫,董增壽,龐 俊
(太原科技大學(xué)電子信息工程學(xué)院,太原 030024)
軸承是機(jī)械設(shè)備的重要零部件之一[1],軸承的損壞會造成巨大的經(jīng)濟(jì)損失甚至危及人類生命。因此軸承的故障診斷是十分必要的。由于滾動軸承的工作環(huán)境復(fù)雜,所采集的信號中通常含有大量噪聲[2],因此需要對信號進(jìn)行去噪處理來提高后期故障診斷的準(zhǔn)確率。
在滾動軸承的故障診斷中,特征提取是重要一步,對診斷結(jié)果具有較大的影響,已有不少學(xué)者對這一過程進(jìn)行了研究。文獻(xiàn)[3]采用基于波形匹配延拓的改進(jìn)經(jīng)驗?zāi)B(tài)分解(EMD)對軸承數(shù)據(jù)進(jìn)行分解,得到各本征模函數(shù)(Intrinsic Mode Function, IMFs)分量,選取各IMF分量的能量信息作為特征,將其輸入到粒子群算法(PSO)優(yōu)化的支持向量機(jī)(SVM)中進(jìn)行故障診斷,得到了95.2%的分類準(zhǔn)確率。文獻(xiàn)[2]對軸承數(shù)據(jù)采用EMD進(jìn)行分解,對前幾階的IMF分量構(gòu)造Hankel矩陣, 獲取的奇異值能夠表達(dá)滾動軸承的運行狀態(tài),通過堆疊稀疏自動編碼器進(jìn)行分類,得到了較好的分類結(jié)果。文獻(xiàn)[4]采用卷積神經(jīng)網(wǎng)絡(luò)算法結(jié)合SVM分類器用于滾動軸承的故障診斷。并達(dá)到了99%的分類識別率。以上方法雖然達(dá)到了較高了故障診斷精度,但都是基于純凈數(shù)據(jù)下的故障診斷,如果軸承數(shù)據(jù)中有用信號被噪聲淹沒,以上方法就很難達(dá)到較高的分類精度。因此急需一種能夠在強噪聲背景下的故障診斷模型。
文獻(xiàn)[1]提出了一種基于小波包特征提取、自編碼器(AE)特征選擇和PSO優(yōu)化SVM特征分類的軸承故障自動診斷方法,在信噪為-10db時達(dá)到了94.34的分類精度。文獻(xiàn)[5]提出了一種基于混沌同步系統(tǒng)的降噪方法, 將其應(yīng)用于滾動軸承振動信號的前期處理, 并結(jié)合功率譜密度進(jìn)行故障診斷。文獻(xiàn)[6]鑒于在復(fù)雜工況和強背景噪聲環(huán)境下,提出了一種改進(jìn)經(jīng)驗小波變換的方法,能有效地分離出機(jī)車軸承損傷故障的特征。以上這些方法雖然是基于噪聲環(huán)境下的軸承故障診斷,但并未達(dá)到很高的分類精度,尤其是噪聲較大時,分類精度更低。為了提高在強噪聲背景下的診斷精度,提出了改進(jìn)小波閾值函數(shù)與棧式自編碼器(SAE)相結(jié)合的診斷模型。該模型在強噪聲背景下可以提取出軸承損傷故障的特征,并達(dá)到較高的分類精度。
傳統(tǒng)的小波閾值函數(shù)有硬閾值函數(shù)和軟閾值函數(shù)[7],硬閾值函數(shù)簡單而不連續(xù),很容易引起重構(gòu)信號的振蕩。雖然軟閾值函數(shù)是連續(xù)的,但是會喪失信號的某些特征[8]。為了提高噪音抑制的性能。本文提出了一種改進(jìn)的新閾值函數(shù),它連續(xù)且不存在偏差。
(1)硬閾值函數(shù)
當(dāng)小波系數(shù)處于閾值范圍之內(nèi),小波系數(shù)置0,當(dāng)處于閾值范圍之外,小波系數(shù)不變[9],即
(1)
其中,wλ表示去噪后的小波系數(shù),w表示信號分解后的小波系數(shù),λ表示閾值。
(2)軟閾值函數(shù)
當(dāng)小波系數(shù)處于閾值范圍之內(nèi),小波系數(shù)置0,當(dāng)處于閾值范圍之外則減去閾值[10],即
(2)
sign(·)表示符號函數(shù)。
傳統(tǒng)的軟硬閾值函數(shù)存在一定的缺陷,為了解決硬閾值函數(shù)不連續(xù),軟閾值函數(shù)存在一定偏差的問題,提出了一種介于軟硬閾值之間的新閾值函數(shù),該閾值函數(shù)結(jié)合了軟硬閾值函數(shù)的優(yōu)點。
(3)
(4)
閾值的選取對信號的去噪結(jié)果具有較大的影響,閾值過大會導(dǎo)致有用的信號被濾除掉,閾值過小會導(dǎo)致信號中的噪聲濾除不干凈。
Donoho D L等提出的一種固定閾值用于傳統(tǒng)閾值函數(shù)的去噪[11]:
(5)
傳統(tǒng)的固定閾值在不同分解層上的閾值均一致,這不符合噪聲的分布規(guī)律,噪聲系數(shù)大多分布在高頻小波系數(shù)中,隨著分解層數(shù)的增加,噪聲的小波系數(shù)會逐漸變小,針對傳統(tǒng)固定閾值的不足,本文提出了一種改進(jìn)的閾值:
(6)
其中,j為小波的分解層數(shù)。β為控制因子。隨著分解層數(shù)的增加,閾值會逐漸減小。
AE包含編碼過程和解碼過程。編碼過程是將高維數(shù)據(jù)變成更低維度的數(shù)據(jù),解碼過程可以看作是編碼網(wǎng)絡(luò)的逆過程,是將編碼器的低維數(shù)據(jù)經(jīng)過升維重構(gòu)得到原始的輸入數(shù)據(jù),其目的就是使輸出數(shù)據(jù)和輸入數(shù)據(jù)的差距最小。表示編碼所得的低維數(shù)據(jù)是可以得到原始輸入數(shù)據(jù)的[12]。AE的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
(1)編碼過程:高維空間的訓(xùn)練樣本集{xm},通過編碼器得到隱藏層的輸出向量集{hm},通過公式可以表示成如下形式[13]:
hm=f(Wxm+b)
(7)
其中,f表示的是輸入層到隱藏層的激活函數(shù),W為權(quán)值矩陣,b為偏置向量。
(8)
其中,g表示的是隱藏層到輸出層的激活函數(shù),W′為權(quán)值矩陣,d為偏置向量。
圖1 AE網(wǎng)絡(luò)結(jié)構(gòu)
(3)損失函數(shù):AE的原理是通過最小化重構(gòu)誤差來優(yōu)化參數(shù)集{W,b},{W′,d},采用均方誤差作為AE的損失函數(shù),其表達(dá)式如下:
(9)
通過設(shè)置迭代次數(shù),使得損失函數(shù)達(dá)到最小,以得到編碼器的輸出hm。損失函數(shù)越小,表示hm中包含的信息越多,越能夠完好的重構(gòu)出原始數(shù)據(jù)。以上過程并不需要標(biāo)簽信息,因此AE的訓(xùn)練過程屬于無監(jiān)督訓(xùn)練。
SAE是由多個AE堆疊而成,是深度神經(jīng)網(wǎng)絡(luò)中的一種。主要是用來實現(xiàn)深度學(xué)習(xí)的無監(jiān)督預(yù)訓(xùn)練的,其無監(jiān)督預(yù)訓(xùn)練過程如圖2所示。經(jīng)過深度編碼器后,加入SoftMax對故障類型進(jìn)行分類。在加入分類器之前,網(wǎng)絡(luò)使用貪心算法來訓(xùn)練網(wǎng)絡(luò)參數(shù),無需標(biāo)簽,屬于無監(jiān)督訓(xùn)練。加入分類器后,需添加少量標(biāo)簽數(shù)據(jù)對權(quán)重和偏置進(jìn)行整體微調(diào),以達(dá)到更好的分類精度。該網(wǎng)絡(luò)的每一層都屬于淺層網(wǎng)絡(luò),可以防止網(wǎng)絡(luò)陷入局部最優(yōu)。
圖2 SAE結(jié)構(gòu)
采用本文所提方法對軸承數(shù)據(jù)進(jìn)行故障診斷的具體流程如下:
(1)采用本文的改進(jìn)閾值函數(shù)和閾值對噪聲數(shù)據(jù)做去噪處理;
(2)提取去噪后的軸承數(shù)據(jù)的小波包能量;
(3)初始化SAE的網(wǎng)絡(luò)結(jié)構(gòu);
(4)訓(xùn)練第一層AE,將其隱含層作為第2個AE的輸入,并進(jìn)行同樣的訓(xùn)練,直到第n層AE訓(xùn)練完成;
(5)將訓(xùn)練好的n層AE進(jìn)行堆疊形成SAE,向SAE網(wǎng)絡(luò)頂層添加輸出層SoftMax分類器;
(6)利用樣本數(shù)據(jù)和標(biāo)簽對整個網(wǎng)絡(luò)進(jìn)行有監(jiān)督的微調(diào)。
不同于小波分析,小波包在全頻率上對信號進(jìn)行多層分解,提高了信號的頻率分辨率[14]。由于系統(tǒng)出現(xiàn)故障時會對各頻帶信號的能量有較大影響,且不同的故障對各頻帶內(nèi)信號的能量影響也不同,根據(jù)不同頻帶內(nèi)能量的分布情況我們可以診斷出發(fā)生故障的類型[15-16]。因此可以對故障信號進(jìn)行小波包分解得到各頻帶的小波包能量,以此來進(jìn)行故障診斷。用小波包分解對故障信號進(jìn)行能量特征提取的步驟如下:
(1)對故障信號進(jìn)行小波包分解,選取的小波基為db3,分解層數(shù)為4。
(2)分解后每個節(jié)點的小波包能量可由式(10)求得:
(10)
3.2.1 數(shù)據(jù)描述
這項研究的數(shù)據(jù)來自CWRU[18]。電機(jī)軸由試驗軸承支承。這些軸承采用電火花加工,軸承的不同直徑分別為0.177 8 mm,0.355 6 mm和0.533 4 mm。振動數(shù)據(jù)是通過安裝在帶有磁性底座的外殼上的加速度計收集的。加速度計被放置在兩個驅(qū)動外殼的6點鐘位置。利用16通道DAT記錄儀采集振動信號,包括滾動體故障、內(nèi)圈故障和外圈故障三種工況。這些操作條件是用6205-2RS JEM SKM軸承操作的,這是深溝球軸承類型。所有實驗均為單負(fù)荷(2 HP負(fù)荷),轉(zhuǎn)速為1750 r/min。分別從驅(qū)動器端(DE)48 kHz采樣頻率的數(shù)據(jù)。表1詳細(xì)列出了這10種軸承的健康狀態(tài)。
表1 數(shù)據(jù)集的詳細(xì)描述
3.2.2 測試結(jié)果
設(shè)含有噪聲的數(shù)據(jù)為:
f(t)=s(t)+n(t)
(11)
其中,s(t)表示原始數(shù)據(jù),n(t)為噪聲標(biāo)準(zhǔn)差為σ的高斯白噪聲,服從N(0,σ2)。不同類型的10種故障的原始數(shù)據(jù)和添加噪聲標(biāo)準(zhǔn)差為2的高斯白噪聲后的數(shù)據(jù)的時域波形圖如圖3所示。圖中的第一列表示原始數(shù)據(jù)的波形,可以看出內(nèi)圈故障,外圈故障和滾動體故障的波形圖存在明顯差異。圖中第二列表示加噪后的波形圖,噪聲完全淹沒了原始的波形。無法分辨出不同類型的故障。噪聲的存在使得特征提取變得困難,從而影響了分類結(jié)果的準(zhǔn)確度。因此有必要在特征提取前去除數(shù)據(jù)中的噪聲。
圖3 10種故障狀態(tài)振動信號和噪聲信號的時域波形
為了確定閾值中控制因子β的大小,我們采用信噪比(signal-to-noise ratio, SNR)作為衡量去噪效果的指標(biāo),通過取不同的β值,來觀察SNR的變化。在純凈信號中加入噪聲標(biāo)準(zhǔn)差為0.5的高斯白噪聲。取SNR最大時所對應(yīng)的β值作為本次實驗的最終值。如表2所示。因此設(shè)置β的值為3.3。
表2 不同β值的SNR
3.2.3 測試結(jié)果
為了對比不同方法在強噪聲背景下的故障診斷結(jié)果。在軸承數(shù)據(jù)中加入不同噪聲標(biāo)準(zhǔn)差的高斯白噪聲,各方法的診斷結(jié)果如表3所示。可以看出本文所提方法在不同噪聲下的診斷精度最高。文獻(xiàn)[1]在噪聲強度較大時,診斷精度明顯降低。含噪的軸承數(shù)據(jù)不經(jīng)過小波閾值去噪的診斷結(jié)果相對于去噪后的診斷結(jié)果較差,可見采用本文改進(jìn)閾值函數(shù)去噪可以提高軸承數(shù)據(jù)的診斷精度,相對于SVM的診斷結(jié)果,采用SAE可以提高診斷精度。這是因為SAE進(jìn)一步提取了軸承數(shù)據(jù)的深層特征,提高了診斷精度。與傳統(tǒng)的閾值去噪方法相比較,本文的改進(jìn)閾值函數(shù)的去噪效果更佳,診斷結(jié)果也更準(zhǔn)確。
表3 不同噪聲強度下不同方法的診斷準(zhǔn)確率
為了觀察不同方法的特征提取能力,采用t-SNE將高維數(shù)據(jù)降為3維,各方法提取特征的散點圖如圖4所示,可以看出其他6種方法的不同健康狀態(tài)并未完全分離,部分健康狀態(tài)的散點仍有交集,說明這6種方法對軸承數(shù)據(jù)的特征提取能力還有不足,圖4g為本文所提方法的散點圖,圖中同一健康狀態(tài)的散點都聚集在一起,而不同健康狀態(tài)的散點都分離開,可見本文方法的特征提取能力較強。
(a) 小波包能量+SVM (b) 小波包能量+SAE
(c) 硬閾值去噪+小波包能量+SAE(d) 軟閾值去噪+小波包能量+SAE
(e) 改進(jìn)閾值去噪+小波包能量+SVM (f) 文獻(xiàn)[5]
(g) 改進(jìn)閾值去噪+小波包能量+SAE(本章所提方法)
編碼器很難從含有強噪聲的振動數(shù)據(jù)中識別出不同類型的故障,本文提出了一種改進(jìn)閾值函數(shù)和SAE相結(jié)合的軸承故障診斷方法,并用CWRU的軸承數(shù)據(jù)表明該方法在強噪聲背景下仍可準(zhǔn)確識別多種故障類型。采用改進(jìn)的閾值函數(shù)對故障樣本進(jìn)行去噪,提取去噪后的小波包能量,最大限度保留故障信息,經(jīng)過SAE后可以實現(xiàn)對噪聲軸承數(shù)據(jù)的準(zhǔn)確診斷。
但本文方法仍存在一些不足,SAE搭建過程中,隱藏層數(shù)、節(jié)點數(shù)、初始學(xué)習(xí)率以及迭代次數(shù)等參數(shù)的選取至今還沒有完整的理論支撐,需要依靠先驗知識以及反復(fù)實驗才能得出,具有較強的主觀性,未來需要確定各參數(shù)之間的關(guān)系以及尋找一個優(yōu)化模型可以確定各參數(shù)的最佳值。