鄒劍暉,敖銀輝
(廣東工業(yè)大學 機電工程學院,廣州 510006)
在軸承的故障診斷領域中,基于振動信號分析的方法是目前最有效的方法。其中,利用適用的信號處理方法從振動信號中有效提取故障特征是實現(xiàn)軸承故障診斷的關鍵[1]。Huang等[2]提出了自適應信號處理方法,即經(jīng)驗模態(tài)分解(EMD)和集合經(jīng)驗模態(tài)分解(EEMD),但這兩種方法都會受到模態(tài)混疊效應的影響。Yeh等[3]提出了補充集合經(jīng)驗模態(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD),該方法完全解決了模態(tài)混疊的問題。熵可以反映信號的復雜程度,通常被用作故障信息的特征參數(shù)。Pincus提出了近似熵,Richman等人提出了樣本熵[4],但是這樣的單尺度熵算法在數(shù)據(jù)處理時經(jīng)常會得到相互矛盾的結(jié)果,后來Costa等[5]提出了多尺度熵(Multiscale Entropy,MSE)的概念。極限學習機(Extreme Learning Machine,ELM)是一類針對單層前饋神經(jīng)網(wǎng)絡(Single Layer Feedforward neuron Network,SLFN)設計的機器學習算法[6],具有學習能力快,泛化能力強等優(yōu)點[7]。
大量機械零件故障診斷研究領域的文獻使用EEMD和支持向量機或者神經(jīng)網(wǎng)絡的結(jié)合模型。文獻[8]結(jié)合EEMD和ELM進行齒輪診斷;文獻[9]提出一種基于EEMD和SVM的識別滾動軸承退化狀態(tài)的方法;文獻[10]利用多尺度熵提取特征。由于SVM在大規(guī)模訓練樣本中的局限性和傳統(tǒng)BP神經(jīng)網(wǎng)絡易陷入局部極小化等問題,本文提出一種CEEMD多尺度熵和小波核極限學習機(Wavelet Kernel ELM,WKELM)結(jié)合的故障診斷方法。
本文將以滾動軸承作為研究對象,針對幾種典型的工作模式如滾動軸承正常工況、外圈故障、內(nèi)圈故障和滾動體故障,分析相關振動信號數(shù)據(jù),利用CEEMD多尺度熵提取特征,采用WKELM模型來對滾動軸承進行故障診斷,相對于傳統(tǒng)的神經(jīng)網(wǎng)絡等方法提高了診斷準確率。
EMD算法從原信號中提取出若干個固有模態(tài)分量IMF,但會產(chǎn)生模態(tài)混疊。EEMD將白噪聲加入到原始信號當中,有效抑制了模態(tài)混疊,但添加的白噪聲會使得IMF分量重構(gòu)時產(chǎn)生誤差。
為了解決上述白噪聲干擾且無法完全被中和的問題,CEEMD算法通過給原始信號添加符號相反的白噪聲,分別對兩組信號進行EMD分解,重構(gòu)誤差得到了明顯減少,添加的白噪聲得到了最大限度地中和。
(3)通過多組分量組合的方式得到分解結(jié)果,即CEEMD分解最終得到的IMF分量:
(1)
多尺度熵的實質(zhì)就是在不同尺度因子下計算給定數(shù)據(jù)的樣本熵,設原始數(shù)據(jù)長度為X={x1,x2,…,xN},預先給定相似容量r和嵌入維數(shù)m,計算過程如下:
(1)對原始數(shù)據(jù)X進行粗?;幚?,建立新的粗粒化向量yj(τ)。
(2)求N個粗粒向量的樣本熵,由在尺度τ下的粗粒化序列組成m維數(shù)矢量Y(i)。
(4)當重構(gòu)m維數(shù)據(jù)時,求樣本的平均值相似度Bm。
(5)重復步驟(2)~步驟(4)得到Bm+1(r),則原始信號序列的樣本熵為:
(2)
(6)計算每一個尺度因子序列的樣本熵,則可得到MSE,即MSE(x,τ,m,r)=SampEn(yτ,m,r) 。
結(jié)合CEEMD和多尺度熵進行滾動軸承故障特征提取,首先用CEEMD將滾動軸承振動信號分解為多個IMF分量,然后根據(jù)相關系數(shù)法篩選出5個包含有效信息最多的分量,再計算5個IMF分量的多尺度熵值,構(gòu)造出五維故障特征向量。多尺度熵值的計算與尺度因子τ、相似容量r和嵌入維數(shù)m有關,依據(jù)本文數(shù)據(jù)和以往經(jīng)驗,尺度因子τ取10,相似容量r取原始信號數(shù)據(jù)標準差的0.2倍,嵌入維數(shù)m取2。
極限學習機是一種單隱層前饋神經(jīng)網(wǎng)絡SLFN學習算法,相對于傳統(tǒng)神經(jīng)網(wǎng)絡具有學習速度快,泛化性能好的優(yōu)點。該算法只用設置網(wǎng)絡的隱含層節(jié)點個數(shù)和核函數(shù),不需要設置輸入層與隱含層間的連接權(quán)值和隱含層神經(jīng)元的閾值,便可以得到唯一的最優(yōu)解。
極限學習機的數(shù)學模型可以表述為:給定任意Q個不同樣本(xi,ti),其中xi∈Rn為輸入樣本,ti∈Rm為輸出樣本,設隱含層神經(jīng)元個數(shù)為L,核函數(shù)為g(x),則輸出可表示為:
(3)
上式可簡化成:
Hβ=T′
(4)
其中,wi為輸入層與隱含層的連接權(quán)值,bi為隱含層神經(jīng)元的偏置,βi為輸出權(quán)值。
綜上,ELM的學習算法如下:
(1)確定隱含層神經(jīng)元的數(shù)量,隨機設置輸入層神經(jīng)元和隱含層神經(jīng)元間的連接權(quán)值w和隱含層神經(jīng)元的偏置b;
(2)選取適當?shù)暮瘮?shù)作為隱含層神經(jīng)元的核函數(shù),并計算出隱含層的輸出矩陣H;
為進一步提高ELM的分類能力,將小波核函數(shù)引入ELM。一般的ELM使用的核函數(shù)為′sig′(默認)、′sin′和′hardlim′,而基于Morlet小波在數(shù)據(jù)處理方面的優(yōu)越性,小波核函數(shù)可以實現(xiàn)逼近任意函數(shù),泛化能力更強且在非線性分類平面上的效果更佳。
核極限學習機的核函數(shù)需要滿足平移不變性定理和Mercer條件,因此本文選用Morlet小波函數(shù)h(x)=cos 1.75x·exp (-x2/2),其相應的小波核函數(shù)表達式為:
(5)
式中:a為尺度因子。
軸承是重要的旋轉(zhuǎn)運動部件,其狀態(tài)直接關系著設備的穩(wěn)定運行。軸承失效模式多種多樣,簡單分類有內(nèi)圈故障、外圈故障和滾動體故障,任何一種故障都會影響軸承正常運轉(zhuǎn),進而導致機械設備產(chǎn)生故障,因此制定一種高效的故障診斷方法具有實際意義,基于振動信號的測試分析是軸承故障診斷的主要方法。
本文使用的軸承振動實驗數(shù)據(jù)來自美國凱斯西儲大學電氣工程實驗室的滾動軸承故障模擬實驗臺所測得的數(shù)據(jù),實驗時電機轉(zhuǎn)速1797 r/min,采樣頻率為12kHz,數(shù)據(jù)采自驅(qū)動端電機上型號為6205 2RS JEM SKF的深溝球軸承,其結(jié)構(gòu)參數(shù)如表1 所示。
表1 軸承結(jié)構(gòu)參數(shù)
本文首先利用CEEMD分解原始信號,根據(jù)包絡譜分析得到故障特征頻率,驗證CEEMD的優(yōu)越性能。然后,利用多尺度熵進行特征向量提取,輸入到小波核極限學習機中訓練和測試。該數(shù)據(jù)處理過程如圖1所示。
圖1 數(shù)據(jù)處理過程
以驅(qū)動端軸承外圈故障數(shù)據(jù)為例,截取一段信號進行CEEMD分解,信號分解產(chǎn)生的IMF分量如圖2所示,再對這一段截取信號進行EEMD分解,對比兩次分解過程的箱型圖,如圖3所示。
(a) 原始信號、IMF1和IMF2
(b) IMF3、IMF4和IMF5
(c) IMF6、IMF7和IMF8
(d) IMF9和殘余分量 圖2 軸承外圈故障振動信號及其CEEMD分解結(jié)果
(a) EEMD篩選迭代次數(shù)
(b) CEEMD篩選迭代次數(shù) 圖3 EEMD和CEEMD的篩選迭代次數(shù)對比
由圖2可知,CEEMD分解后的IMF按頻率高低排列,振幅依次減弱,各IMF平穩(wěn)且沒有模態(tài)混疊現(xiàn)象。由圖3可知,CEEMD算法迭代的次數(shù)僅為EEMD的58.6%,降低了計算成本。
CEEMD分解后利用相關系數(shù)法篩選出與原始信號相關性大、包含最多有效信息的IMF分量,重構(gòu)后做傅里葉變換得到的包絡譜如圖4所示。
圖4 重構(gòu)信號的包絡譜
由圖4可知,該發(fā)生外圈故障的滾動軸承的特征故障振動頻率為105.5Hz,與理論特征故障振動頻率一致。同時,在圖4中還可以找到它的二倍頻210.9Hz和三倍頻316.4Hz,并且頻率突出,沒有受到噪聲干擾埋沒,因此該CEEMD算法在本次處理的軸承信號數(shù)據(jù)中是有效的。
根據(jù)第1節(jié)理論,輸入到小波核極限學習機的特征向量可以由多尺度熵來構(gòu)造。因此,首先要選取出可用的特征向量,通過計算各分量與原始信號的相關系數(shù)即可篩選出有效IMF分量。
對于該次實驗,本文為4種工況分別構(gòu)造了115組樣本,每組樣本數(shù)據(jù)的長度是1024,組合成460×1024的矩陣樣本進行處理。
本文擬在每組數(shù)據(jù)中篩選出5個最能反映原始信號特點的特征向量,選取第一組樣本數(shù)據(jù)進行處理,計算4種工況數(shù)據(jù)的IMF相關系數(shù),如表2所示,列出了前7個IMF的計算結(jié)果。
表2 各工況數(shù)據(jù)的前7個IMF分量的相關系數(shù)
由表2可知,正常工況和故障工況數(shù)據(jù)經(jīng)過CEEMD分解后,得到的IMF分量與原始信號的相關性由高到低排列,其中前5個IMF與原始信號相關系數(shù)較大,可以用來構(gòu)造特征向量。計算前5個IMF分量的多尺度熵值,如表3所示。
表3 各工況數(shù)據(jù)的前5個IMF分量的多尺度熵值
根據(jù)表3中4種工況數(shù)據(jù)分解后的IMF分量多尺度熵值,結(jié)合經(jīng)驗可知,各工況下的多尺度熵值基本反映了對應工況的振動特點。
為驗證表3的結(jié)果不存在偶然性,每種工況選取32組樣本,各取前3個IMF分量的多尺度熵值,構(gòu)造CEEMD-多尺度熵特征向量,可視化特征提取結(jié)果如圖5所示,圖中不同工況構(gòu)造的特征向量之間界限清晰,類內(nèi)聚集性良好,其中正常工況的特征向量與3種故障工況的特征向量分離明顯,因此本方法構(gòu)造的4種特征向量能夠真實反映其對應工況的信號特點。
圖5 CEEMD-多尺度熵故障特征向量
將得到的特征向量作為輸入特征輸入小波核極限學習機進行分類,從而達到識別輸入特征所屬信號歸于哪類工況的目標。
本文采用交叉實驗的方法,對構(gòu)造的樣本進行了6次分類識別。其中,樣本總數(shù)為340,包括250個訓練集樣本,90個測試集樣本,根據(jù)多次實驗總結(jié),設置隱含層神經(jīng)元個數(shù)為100。首先,將正常工況樣本與3種故障工況樣本進行分類識別,每次實驗中,訓練集樣本由170個正常工況樣本和80個故障工況樣本組成,測試集由60個正常工況樣本和30個故障工況樣本組成,其結(jié)果如表4所示。
然后,對3種故障工況樣本之間進行相互識別,共3組實驗,結(jié)果如表5所示。此次識別中的前兩組實驗用外圈故障樣本取代了表4實驗中正常工況樣本,樣本數(shù)目保持不變,命名為主樣本,訓練集和測試集中的少數(shù)部分樣本則由內(nèi)圈故障樣本和滾動體樣本取代,命名為副樣本。表中第3組實驗的主樣本和副樣本則分別是內(nèi)圈故障樣本和滾動體樣本。
表4 正常工況和故障工況的分類結(jié)果
表5 3種故障工況的相互分類結(jié)果
根據(jù)表4和表5可知,小波核極限學習機在分類準確率上表現(xiàn)優(yōu)異,本文還利用支持向量機和BP神經(jīng)網(wǎng)絡進行識別,最終效果與本文所用方法對比如表6所示。
表6 小波核極限學習機與其他分類方法的結(jié)果比較
本文利用CEEMD多尺度熵和小波核極限學習機結(jié)合的診斷方法,對滾動軸承進行故障診斷,具有良好效果。其中,CEEMD算法解決了模態(tài)混疊問題,多尺度熵提取出的特征很好地反映出原始信號的特點,結(jié)合小波核極限學習機實現(xiàn)了精確診斷。與SVM和BP神經(jīng)網(wǎng)絡相比,本文所提出的方法的診斷精度最高,達到97.96%,可以運用在實際滾動軸承故障信號診斷上。