趙志宏,楊紹普
(1.北京交通大學 機械與電子控制工程學院,北京 100044;2.石家莊鐵道大學 信息科學與技術學院,石家莊 050043)
滾動軸承是機械設備中最常用且最容易損壞的零件之一,當發(fā)生故障時損失巨大,因此軸承故障診斷技術得到人們的重視[1-3]。特征提取是軸承故障診斷中非常關鍵的一個環(huán)節(jié),提取的特征如能正確地反映故障類別,則為模式識別打下基礎。
當軸承存在故障時,表現(xiàn)出非線性、非平穩(wěn)特征。傳統(tǒng)的基于線性系統(tǒng)的特征提取方法不能有效提取故障的非線性特征?;诜蔷€性動力學參數(shù)的特征提取方法提供了一種研究機械故障非線性特征的工具,近年來這種方法引起了人們廣泛的關注。至今,已有許多非線性參數(shù)識別方法用在機械故障診斷領域,其中,使用較多的有關聯(lián)維數(shù)方法[4-5]。Yan[6]引入近似熵(Appropriate Entropy,ApEn)概念并將其用于軸承狀態(tài)監(jiān) 測。Pincus[7]提 出 的 樣 本 熵 (Sample Entropy,SampEn)是近似熵的改進算法,它的優(yōu)越性在于可以較少地依賴于時間序列長度,已經(jīng)廣泛地用于生理信號處理[8-9]。
Huang等人[10]提出的經(jīng)驗模式分解方法(Empirical Mode Decomposition,EMD)可以根據(jù)振動信號自身的時間特征尺度進行自適應分解,將軸承振動信號的狀態(tài)信息分解到不同的內蘊模式分量(Intrinsic Mode Function,IMF)中,從而為軸承狀態(tài)深層次的挖掘奠定了基礎。EMD方法的一個主要問題是模式混淆問題,使得各IMF分量不能反映信號的真實內涵。集成經(jīng)驗模式分解方法(Ensemble Empirical Mode Decomposition,EEMD)[11]是對 EMD 的改進,可以有效解決模式混淆問題。因此,針對利用原始軸承振動信號的樣本熵無法準確反映軸承故障信號的特征問題,采用先對原始信號進行EEMD分解,再對獲得的內蘊模式分量進行SampEn分析,這樣可以獲得軸承狀態(tài)信號更深層次的信息。
本文在對軸承振動信號的樣本熵深入分析的基礎上,提出一種基于EEMD分解,利用樣本熵作為特征的軸承故障診斷方法,并通過軸承正常狀況、內圈故障、滾動體故障、外圈故障實測振動信號進行驗證,實驗結果表明了該方法的有效性。
一般地,對于由N個數(shù)據(jù)組成的時間序列{x(n)}=x(1),x(2),…,x(N),樣本熵的計算方法如下[12]:
(1)按序號組成一組維數(shù)為m的向量序列,Xm(1),…,Xm(N-m+1),其中Xm(i)={x(i),x(i+1),…,x(i+m-1)},1≤i≤N-m+1。這些向量代表從第i點開始的m個連續(xù)的x的值。
(2)定義向量Xm(i)與Xm(j)之間的距離d[Xm(i),Xm(j)]為兩者對應元素中最大差值的絕對值。即:
(3)對于給定的Xm(i),統(tǒng)計Xm(i)與Xm(j)之間距離小于等于r的j(1≤j≤N-m,j≠i)的數(shù)目,并記作Bi。對于1≤i≤N-m,定義:
(4)定義B(m)(r)為:
(5)增加維數(shù)到m+1,計算Xm+1(i)與Xm+1(j)(1≤j≤N-m,j≠i)距離小于等于r的個數(shù),記為Ai。(r)定義為:
(6)定義Am(r)為:
這樣,Bm(r)是兩個序列在相似容限r下匹配m個點的概率,而Am(r)是兩個序列匹配m+1個點的概率。樣本熵定義為:
當N為有限值時,可以用下式估計:
可以看到,樣本熵的值與m,r的取值有關。因此,確定m,r兩個參數(shù)的值對于樣本熵的計算非常重要。這里,根據(jù) Pincus[9]的研究結果,m=1 或 2,r=0.1 Std~0.25 Std(Std 是原始數(shù)據(jù)x(i),i=1,2,…,N的標準差)計算得到的樣本熵具有較為合理的統(tǒng)計特性。在本文的研究中,取m=2,r=0.2 Std。
圖1 實驗裝置Fig.1 The test rig
實驗所用的實測軸承振動加速度數(shù)據(jù)來自于Case Western Reserve University(CWRU)[13]。實 驗裝置如圖1所示,滾動軸承的型號為SKF6205,軸承狀態(tài)包括正常、內圈故障、滾動體故障和外圈故障四種類型,軸承的損傷狀況為單一損傷,是由電火花機分別在軸承內圈、滾動體和外圈人工加工制作,損傷的直徑分別為0.177 8 mm,0.355 6 mm,0.533 4 mm和0.711 2 mm。電機的負載由風機來調節(jié),產(chǎn)生的載荷為0~2 206.496 W。將振動加速度傳感器垂直固定在感應電機輸出軸支撐軸承上方的殼上進行數(shù)據(jù)采集,采樣速率為12 k。
圖2顯示了當損傷程度為0.177 8 mm,載荷為0,轉速為1 797 r/min,取樣速率為12 k時,樣本熵的值與數(shù)據(jù)長度取值的關系。從圖中可以看到,當數(shù)據(jù)長度小于500時,不同數(shù)據(jù)長度,樣本熵的值有很大變化;而當數(shù)據(jù)長度大于500時,樣本熵的值比較穩(wěn)定。另外,軸承在不同故障下,樣本熵的值也不同;軸承在正常情況下,樣本熵的值比較小,當故障出現(xiàn)時,樣本熵的值變大。從圖2中可以看出,樣本熵可以很好地表明軸承的運行狀況。
圖2 數(shù)據(jù)長度對樣本熵的影響Fig.2 The influence of data length on the SampEn
一些典型數(shù)據(jù)長度取值的樣本熵均值與標準差如表1所示。從表1可以看出,軸承在四種情況下,取不同數(shù)據(jù)長度時標準差的值都比較小,說明了對于不同的數(shù)據(jù)樣本,樣本熵計算結果的變化不大;而不同故障情況下樣本熵的取值有很大不同,表明樣本熵可以很好地作為軸承故障診斷的特征。另外還可以看到,隨著數(shù)據(jù)長度變大,標準差的值變小(雖然變化不是大),說明數(shù)據(jù)長度越大,樣本熵的值越穩(wěn)定。因此,數(shù)據(jù)長度取值越大越好,但是,由樣本熵計算方法可以知道,數(shù)據(jù)長度越大,計算時間也越長,綜合考慮之后,選取數(shù)據(jù)長度為2 048。本文后面部分樣本熵計算的數(shù)據(jù)長度都取此值。
取載荷為0,轉速為1 797 r/min,損傷程度依次為0.177 8 mm,0.355 6 mm,0.533 4 mm,0.711 2 mm 的數(shù)據(jù)進行實驗。軸承在不同故障、不同損傷程度下樣本熵的值如表2所示。從表2可以看到,在三種故障情況下,隨著損傷程度改變,樣本熵的取值也不同,但并不是損傷程度越大,樣本熵值越大。而是在輕微損傷(0.177 8 mm)的情況下,樣本熵的取值比較大,然后,隨著損傷程度的加大,樣本熵的值先變小,當?shù)揭欢ǔ潭群?,樣本熵的值又變大。說明樣本熵對輕微損傷比較敏感。不同故障情況下,樣本熵值的變化規(guī)律不同。但是在同樣損傷程度情況下,內圈故障、滾動體故障、外圈故障的樣本熵值不同。
表1 不同數(shù)據(jù)長度軸承樣本熵的均值與標準差Tab.1 The average and standard deviation SampEn of different data length
表2 損傷程度對樣本熵的影響Tab.2 The influence of fault diameter on the SampEn
取損傷程度為 0.177 8 mm,載荷分別為 0、735.49875W、1470.998W、2206.496W 馬力,對應轉速分別為 1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min的測試數(shù)據(jù)。軸承在不同載荷下樣本熵的取值如表3所示。從表中可以看到,載荷對樣本熵的取值有影響。在正常情況下,載荷越大,樣本熵取值越大。載荷對滾動體故障的影響較小。當軸承出現(xiàn)內圈故障與外圈故障時,并不是載荷越大,樣本熵值越大。在同樣載荷作用下,軸承在正常情況、內圈故障、滾動體故障、外圈故障情況下樣本熵的取值明顯不同??梢詮谋?得知,當出現(xiàn)損傷情況下,軸承振動信號的樣本熵值會變大。
表3 載荷對樣本熵的影響Tab.3 The influence of motor load on the SampEn
Huang等人[10]提出的經(jīng)驗模式分解方法(EMD)目的是將待分析信號分解為一系列表征時間尺度的IMF分量,使得各IMF分量是窄帶信號,滿足Hilbert變換的要求,即IMF分量必須滿足兩個條件:采樣數(shù)據(jù)的極大點和極小點數(shù)之和與過零點的個數(shù)之差不超過1;在任意點,由局部極大值和局部極小值定義的包絡均值必須為零。
EMD的分解過程其實是一個“篩分”過程,在“篩分”的過程中,不僅消除了模式波形的疊加,而且使波形輪廓更加對稱。EMD算法的實現(xiàn)過程可參考文獻[10,14]。
經(jīng)驗模式分解基本方法的缺點是存在模式混淆問題,模式混淆掩蓋了各IMF分量蘊含的信號真實內涵,導致對象的物理本質不清晰。集成經(jīng)驗模式分解[11](EEMD)通過疊加高斯白噪聲,使分解得到的IMF分量更真實,更能反映信號的本質過程。EEMD算法描述如下[11]:
(1)向待分解的原始數(shù)據(jù)中加入一個隨機高斯白噪聲序列;
(2)對含有白噪聲的數(shù)據(jù)進行EMD分解,得到其內蘊模式分量IMFs。
(3)重復執(zhí)行步驟(1)~(2),但是每次增加不同的白噪聲序列。
(4)將多次EMD分解得到的對應的內蘊模式分量進行平均,作為最終的IMF分量。
EEMD通過在原始數(shù)據(jù)上疊加隨機白噪聲序列,從而改變一次EMD分解中的特征尺度,通過多次EMD分解,相當于從多個特征尺度提取原始數(shù)據(jù)的本質,最后利用各內蘊模式分量IMF的均值作為最終的IMF,因此,與單次EMD分解相比,可以更準確地揭示數(shù)據(jù)的真實物理意義。研究證實,EEMD可以有效抑制EMD中的模式混淆問題?;谝陨峡紤],本文選擇EEMD進行軸承振動信號的分解。
軸承正常信號與外圈故障信號的EEMD分解結果如圖3所示,圖中只列出了前8個IMF分量,從圖3中可以看到,各個IMF分量包含了不同的時間特征尺度,使得軸承故障特征在不同的時間尺度下顯露出來,第1個IMF分量的頻率成分最高,第2~7個IMF分量的頻率成分依次降低。軸承故障信息在高頻段,因此,使用前4個IMF分量的樣本熵作為軸承故障診斷的特征。另外,從圖3中可以看到,正常軸承振動信號和外圈故障軸承振動信號得到的IMF分量明顯不同,外圈故障信號的imf1,imf2分量可以明顯看出存在周期性沖擊信號特征,imf3,imf4分量可以看到存在沖擊信號特征,但周期性并不明顯。而正常軸承振動信號得到的imf1分量可以看到一些與轉速等有關的周期特征,并且該周期大于外圈故障信號imf1分量的周期,這與軸承外圈故障振動信號的特征頻率較高一致。從圖3中可以看到,軸承故障振動信號的EEMD分解得到的IMF分量中包含了軸承的故障特征信息。
圖3 不同軸承故障振動信號的EEMD分解Fig.3 EEMD result of the bearing vibration signal
當損傷程度為0.533 4 mm,載荷為0,轉速為1 797 r/min時,軸承正常情況、內圈故障、滾動體故障、外圈故障的樣本熵值如圖4所示,從圖中可以看到,如果直接用原始信號的樣本熵作為特征,無法正確區(qū)分內圈故障與外圈故障。EEMD可以將信號分解為一系列內蘊模式分量,軸承在不同運行情況下,內蘊模式分量也不同,采用EEMD分解后IMF的SampEn作為特征比只利用原始信號SampEn的優(yōu)越之外在于:如果只利用原始信號的SampEn,相當于在1個尺度分析;而進行EEMD分解后,相當于在多個尺度對振動信號進行分析,通過多個尺度,可以得到軸承不同故障的深層次信息,更好地對軸承故障進行分類。
圖4 軸承不同狀況的SampEn值Fig.4 The SampEn vaule of bearing vibration signal
軸承振動信號經(jīng)過EEMD分解后,得到一系列表征時間尺度的IMF分量和殘余函數(shù)res,每個IMF與該層提取前的IMF相比,包含了更低的頻率成分。計算與各個 IMF分量相對應的 SampEn值,把得到的SampEn1,SampEn2,…,SampEnn作為軸承故障分類的特征值。其中,最初的幾個IMF分量包含了振動信號的最主要的信息。經(jīng)過對各種故障軸承振動信號EEMD分解結果的觀察,選取前 4個 IMF分量的SampEn的值作為特征向量。
支持向量機(Support Vector Machine,SVM)是在統(tǒng)計學習理論基礎上發(fā)展起來的一種新型機器學習方法,具有泛化能力強、維數(shù)不敏感等優(yōu)點,適于求解高維、小樣本、非線性情況下的模式分類和回歸分析等問題[15]。
SVM算法最初是為兩類分類問題設計的,但軸承故障診斷屬于多類模式問題,所以必須擴展(兩類)支持向量機來處理多類問題。已經(jīng)提出多種方法用于多類識別,例如“一對一”,“一對多”等,Hsu and Lin[16]對此做了比較研究,指出“一對一”分類方法在實際應用中優(yōu)于其它方法。因此,在本文中選用“一對一”的SVM識別方法。
基于EEMD SampEn的軸承故障診斷方法如下:
(1)將原始的軸承振動信號進行EEMD分解,得到內蘊模式分量IMF,取前4個IMF分量進行進一步處理。
(2)利用式(7)計算選取IMF分量的樣本熵,參數(shù)選取為m=2,r=0.2 Std。
(3)對于訓練數(shù)據(jù)集,用計算得到的4個樣本熵作為特征向量,輸入SVM進行訓練,得到SVM分類器。
(4)把測試樣本的IMF分量的SampEn值輸入SVM分類器,由SVM分類器的輸出得到測試樣本的運行狀態(tài)。
為了驗證所提方法的有效性,針對CWRU數(shù)據(jù)進行軸承故障分類實驗。數(shù)據(jù)集的選擇參考文獻[17-18]的方法,利用載荷為0的10組數(shù)據(jù)進行9種不同的故障診斷測試,其中包含了不同故障狀態(tài)的組合,數(shù)據(jù)集的詳細描述如表4所示。數(shù)據(jù)集中每個樣本的采樣點數(shù)為2 048,共包含了650個樣本,其中軸承正常情況的樣本數(shù)為119個,隨機選擇其中59個樣本作為訓練樣本集,其余60個樣本作為測試樣本集;其余每種故障情況的樣本數(shù)為59個,隨機選擇其中29個樣本作為訓練樣本集,其余30個樣本集作為測試樣本集。故障數(shù)據(jù)集名稱中的3組數(shù)字分別代表軸承的3種故障狀態(tài)所對應的故障直徑的大小(如對于D070707數(shù)據(jù)集,代表內圈、滾動體和外圈的故障直徑都為0.177 8 mm),對于 DBALL、DINN 和 DOUT數(shù)據(jù)集,分別包含了滾動體故障、內圈故障和外圈故障三種故障程度的數(shù)據(jù),用于評價對損傷程度的評估能力。
實驗中SVM核函數(shù)選擇最常使用的高斯核函數(shù)形式,核函數(shù)形式為:
其中,σ為控制核函數(shù)高寬的參數(shù)。對于線性不可分情況,引入懲罰因子C來控制錯誤分類。參數(shù)取值為σ=1,懲罰因子C=10。
表4 數(shù)據(jù)集Tab.4 The data set
應用EEMD分解后各IMF的樣本熵值作為特征對表4的數(shù)據(jù)集進行訓練與識別,故障分類結果如表5所示。從表中可以看出,在9個故障診斷測試集上只用樣本熵值作為特征參數(shù),都取得了比較高的識別率,說明了基于EEMD的樣本熵方法用于軸承故障診斷的有效性。
表5 軸承故障分類正確率Tab.5 The recognition rate of bearing fault diagnosis
本文提出一種基于EEMD與樣本熵的軸承故障診斷方法,利用實測軸承故障振動信號實驗表明:
(1)樣本熵分析方法只需要較短數(shù)據(jù)就可得出穩(wěn)健的估計值,是一種具有較好的抗噪和抗干擾能力的非線性分析方法。通過對軸承正常運行、內圈故障、滾動體故障、外圈故障振動信號分析實驗表明,當軸承出現(xiàn)故障時,樣本熵的值會有所改變,不同的故障,樣本熵的值也不同,說明樣本熵作為軸承故障診斷的特征的有效性。
(2)當軸承出現(xiàn)輕微故障(內圈故障、滾動體故障、外圈故障)時,樣本熵值會突然變大,隨著損傷的進一步擴展,樣本熵值會變小,然后又變大。這種特性表明樣本熵在軸承早期故障診斷方面有潛在的應用前景。
(3)對軸承振動信號進行EEMD分解后,再進行樣本熵特征提取,比直接對軸承振動信號進行樣本熵特征提取,可以發(fā)現(xiàn)軸承信號中更深層次的信息,得到更好的軸承故障診斷效果。
[1]陶新民,徐 晶,楊立標,等.基于GARCH模型MSVM的軸承故障診斷方法[J].振動與沖擊,2010,29(5):11-15.
[2]郝如江,盧文秀,褚福磊.滾動軸承故障信號的多尺度形態(tài)學分析[J].機械工程學報,2008,44(11):160-165.
[3]王曉冬,何正嘉,訾艷陽.滾動軸承故障診斷的多小波譜峭度方法[J].西安交通大學學報,2010,44(3):77-81.
[4]李 琳,張永祥,明廷濤.EMD降噪的關聯(lián)維數(shù)在齒輪故障診斷中的應用研究[J].振動與沖擊,2009,28(4):145-148.
[5]王 浩,張來斌,王朝暉,等.迭代奇異值分解降噪與關聯(lián)維數(shù)在煙氣輪機故障診斷中的應用[J].中國石油大學學報:自然科學版,2009,33(1):93-98,108.
[6]Yan,Gao R X.Approximate entropy as a diagnostic tool for machine health monitoring[J].Mechanical Systems and Signal Processing,2007,21(2):824-839.
[7] Pincus S M.Approximate entropy as a measure of system complexity[C].Proc.Natl.Acad.Sci USA,1991,88:2297-2301.
[8] Lake D E,Richman J S,Griffin M P,et al.Sample entropy analysis of neonatal heart rate variability[J].Am.J.Physiol Regul.Integr.Comp.Physiol,2002,283(3):789-797.
[9]Pincus S M.Assessing serial irregularity and its implications for health[J].Ann.N.Y.Acad.Sci,2002,954:245-267.
[10] Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hibert Spectrum for nonlinear and nonstationary time series analysis[C].Proc.R.Soc.Lond.A,1998,454:903-995.
[11] Wu Z,Huang N E,Ensemble empirical mode decomposition:a noise-assisted data analysis method[R].Center for Ocean-Land-Atmosphere Studies,2005,Technical Report 193.
[12] Alcaraz R, Rieta JJ. A review on sample entropy applications for the non-invasive analysis of atrial fibrillation electrocardiograms[J].Biomedical Signal Processing and Control,2010,5(1):1-14.
[13] http://www.eecs.cwru.edu/laboratory/bearing,Bearing Data Center Website,Case Western Reserve University.
[14] Huang N E,Shen Z,Long S R.A new view of nonlinear water waves:the Hibert spectrum[J].Annu.Rev.Fluid Mech.,1999,31:417-457.
[15]Vapnik V N.統(tǒng)計學習理論的本質[M].北京:清華大學出版社,2000.
[16]Hsu C W,Lin C J.A comparison of methods for multi-class support vector machines[J].IEEE Transactions on Neural Networks,2002,13:415 – 425.
[17]楊永生,張優(yōu)云.基于集成支持向量機的滾動軸承故障智能診斷研究[J].煤礦機械,2010,31(4):243-245.
[18]Yang J Y,Zhang YY,Zhu Y S.Intelligent fault diagnosis of rolling element bearing based on SVMs and fractal dimension[J].Mechanical Systems and Signal Processing,2007,21(5):2012-2024.