金 梅, 李 盼, 張立國, 金 菊, 張淑清
(1.燕山大學河北省測試計量技術與儀器重點實驗室,河北 秦皇島 066004;2.河北工業(yè)大學土木工程學院,天津 300401)
基于EEMD模糊熵和GK聚類的信號特征提取方法及應用
金 梅1, 李 盼1, 張立國1, 金 菊2, 張淑清1
(1.燕山大學河北省測試計量技術與儀器重點實驗室,河北 秦皇島 066004;2.河北工業(yè)大學土木工程學院,天津 300401)
提出了一種基于集合經驗模態(tài)分解模糊熵和GK聚類相結合的方法,應用于滾動軸承的故障診斷中。首先,利用EEMD方法將故障信號分解成多個本征模態(tài)分量來消除模態(tài)混疊影響;其次,通過相關性對IMF分量進行篩選,并求取其模糊熵作為特征向量進行GK聚類分析進行模式識別。在實驗分析中,通過模糊熵、樣本熵、近似熵3種特征參數(shù)的對比,和GK聚類與FCM聚類的對比,證明了該方法的有效性和優(yōu)越性。
計量學;故障診斷;集合經驗模態(tài)分解;模糊熵;GK聚類
信號特征提?。?]是模式識別、智能系統(tǒng)和機械故障診斷等諸多領域的基礎和關鍵,也是理論研究的熱點之一。滾動軸承是機械設備的重要組成部分,其運行狀態(tài)正常與否直接影響到整個機組的性能[2]。因此,對滾動軸承的振動信號進行故障特征提取和模式識別具有十分重要的意義。
經驗模態(tài)分解(EMD)[3]和聚類分析方法[4,5]在信號故障診斷中已經得到廣泛應用。但應用EMD算法[6]進行信號處理時容易出現(xiàn)頻譜混疊的現(xiàn)象。為了解決模式混合問題,在對白噪聲特性進行EMD分析的基礎上提出了整體平均經驗模式分解(Ensemble Empirical Mode Decomposition,EEMD)[7]方法。聚類分析法是理想的多變量統(tǒng)計技術,已經有效地應用到大規(guī)模的數(shù)據(jù)分析、數(shù)據(jù)挖掘、模式識別等領域中,其中最著名的是FCM(fuzzy center means)算法[8]。但其并未考慮數(shù)據(jù)集的結構,通過對其進行改進,提出了GK(Gustafaon-Kessel)聚類算法[9]。
模糊熵[10]是不確定性推理領域中一個重要概念,它是衡量信號復雜度的有效方法。由于引入指數(shù)函數(shù)作為模糊熵函數(shù),模糊熵不但克服了樣本熵(SampEn)[12]對模板的依賴性,而且相對于近似熵(ApEn)[13]大大提高了相對一致性。因此,本文利用模糊熵作為故障信號的特征量。
本文提出了一種基于集合經驗模態(tài)分解(EEMD)模糊熵和GK聚類相結合的信號特征提取方法,并將其應用于滾動軸承的故障診斷中。通過實驗分析,結果證明了所提方法的優(yōu)越性。
EEMD能自適應處理任意非線性、非平穩(wěn)信號,通過引入白噪聲進行多次分解求平均,將待測信號從高頻到低頻分解成有限個具有物理意義的固有模態(tài)函數(shù)(Intrinsic Mode Function,IMF)和余項之和。
EEMD方法的具體步驟為:
(1)在原始信號x(n)中多次加入均值為0、標準差為常數(shù)的高斯白噪聲序列ni(n),即:
(4)引入下一個高斯白噪聲,重復步驟(2)~(3),獲得各自的固有模態(tài)函數(shù)cij(n),其中cij(n)為第i次加入高斯白噪聲后,分解得到的第j個IMF分量,重復N次,利用總體平均消除噪聲影響。
模糊熵一般定義如下:
(1)設N點時間序列u(i),構造m維向量
GK聚類算法是求能夠使目標函數(shù)Jn最小的隸屬度矩陣U和聚類中心V的迭代過程。當不同種類故障信號的聚類中心確定后,通常通過比較待測值與聚類中心的最大貼近度來確定屬于哪種故障。
為了對提出的方法進行驗證,本文采用Case Western Reserve University的滾動軸承實驗數(shù)據(jù),通過人工電火花技術將軸承加工成單點故障。實驗中,主要選取4種故障類型:軸承正常、滾動體故障、內圈故障、外圈故障。
為保證數(shù)據(jù)充分,對4種類型的故障信號連續(xù)選取同一時期的30組數(shù)據(jù)樣本,每組數(shù)據(jù)間隔為500點,樣本容量為2048個點。為避免模態(tài)混疊分別對4種類型的故障信號進行EEMD分解,通過相關性分析,發(fā)現(xiàn)4種類型故障信號的前3個IMF分量的重構信號與原始信號的相關性均大于95%。因此,前3個IMF分量就能充分表征原始信號的關鍵信息。
經上述分析,分別對4種數(shù)據(jù)類型信號的前3個IMF分量求取模糊熵,通過分析模糊熵的性質,本文模糊熵的參數(shù)設置為:m=2,r=0.2SD(SD表示樣本數(shù)據(jù)的標準差),n=2。最終得到4種類型的3×30組模糊熵數(shù)據(jù),由于篇幅所限不能一一列出,同時為方便對比求取4種模糊熵的平均值,結果如表1所示。
表1 4種類型模糊熵的平均值
根據(jù)表1可知,4種數(shù)據(jù)類型中IMF1分量的模糊熵最大,表明分量IMF1比其他兩個分量更復雜,含有的特征信息也最豐富。同時,4種類型信號的模糊熵差異比較明顯,表明了模糊熵可以很好地表征不同的故障信號的特征信息,可以選取模糊熵作為特征向量。
對4種類型數(shù)據(jù)的模糊熵進行GK聚類分析,本文選取了4種故障類型的數(shù)據(jù)。因此,初始設置聚類中心個數(shù)為c=4,n=2,終止容差error=0.000 1。聚類結果如圖1所示。從圖中可以明顯看到4個聚類簇,聚類中心分別是V1~V4,具體數(shù)值如表2所示。4種故障類型的模糊熵分布在各自的聚類中心附近,各聚類中心之間的空間距離較大,同時同一類模糊熵數(shù)據(jù)聚集相對緊密,充分避免了類之間的相互混疊現(xiàn)象。4種數(shù)據(jù)類型相對于各聚類中心的隸屬度如表3所示,表中數(shù)值為各組樣本隸屬于各聚類中心的平均值。其中第1組數(shù)據(jù)樣本對于V3的均值隸屬度為0.996 6,并且遠遠大于其他3組,因此可以將第1組數(shù)據(jù)歸于V3類;同理,將第2組歸于V1類,將第3組歸于V2類,將第4組歸于V4類。由于數(shù)據(jù)樣本1至4依次為:正常信號、滾動體故障信號、內圈故障信號、外圈故障信號,因此可以求得各類故障數(shù)據(jù)的聚類中心如表2所示。
圖1 EEMD模糊熵的GK聚類三維空間圖
表2 4種類型信號的聚類中心
表3 4種類型信號的隸屬度
為了說明模糊熵在特征提取方面優(yōu)于樣本熵和近似熵,分別求取上述4種類型數(shù)據(jù)的IMF分量的樣本熵和近似熵,并進行GK聚類分析,三維空間聚類效果如圖2、圖3所示,聚類評價指標如表4所示。
圖2 EEMD樣本熵的GK聚類三維空間圖
圖3 EEMD近似熵的GK聚類三維空間圖
表4 模糊熵、樣本熵、近似熵的聚類評價指標
從圖1~圖3對比可知,從類內緊致性判斷模糊熵的聚類效果比樣本熵和近似熵效果要好。同時,根據(jù)表4的評價指標可知,模糊熵的GK聚類劃分系數(shù)PC相對于樣本熵和近似熵更加接近1,而劃分熵CE相對于樣本熵和近似熵更接近于0,同時,指標XB均小于樣本熵和近似熵。根據(jù)聚類評價指標可知,劃分系數(shù)PC越接近1,劃分熵CE越接近于0,XB值越小,說明聚類效果越好,識別準確度越高。因此,在對滾動軸承故障信號進行特征提取時,模糊熵作為特征向量要優(yōu)于樣本熵和近似熵。
為了對比GK聚類分析與FCM聚類分析的聚類效果,對上述4種數(shù)據(jù)類型的模糊熵進行FCM聚類分析,結果如表5所示。
表5 FCM和GK的聚類指標
從表5中的聚類指標可知,GK聚類的劃分系數(shù)PC為0.981 4大于FCM聚類的0.925 9,同時劃分熵CE和XB的值均小于FCM聚類得到的值。因此,GK的聚類效果相對于FCM的聚類效果更好。
考慮到對不同故障程度的信號進行診斷同樣重要,繼續(xù)選取了滾動體正常、輕微故障、嚴重故障3種故障程度的信號進行分析,其中輕微故障的滾動體損傷直徑為0.177 8 mm,嚴重故障的滾動體損傷直徑為0.533 4 mm,其損傷深度均為0.279 4 mm。同樣,分別對上述3種數(shù)據(jù)同一時間段,連續(xù)截取30組數(shù)據(jù)樣本,每組樣本之間的間隔為500點,數(shù)據(jù)長度為2 048點。利用EEMD對3種數(shù)據(jù)進行分解,分別求取IMF分量的模糊熵,然后進行GK聚類分析,聚類結果如圖4所示。
根據(jù)圖4可知,通過GK聚類算法對上述3種不同損傷程度信號進行分析,聚類效果明顯。這說明,本文提出的方法能對不同種類和不同程度的故障信號進行有效分析。
圖4 不同損傷程度的GK聚類效果圖
本文提出了EEMD模糊熵和GK聚類分析相結合的方法對不同種類故障和不同損傷程度的故障進行分析,通過對模糊熵、樣本熵、近似熵3種特征提取方法對比分析,說明利用模糊熵表征滾動軸承的特征信息效果更優(yōu);同時將GK聚類和FCM聚類兩種聚類方式對比,聚類三維圖和聚類評價指標均表明GK聚類方法比FCM聚類方法效果更好。
[1] 張淑清,董璇,翟欣沛,等.基于EEMD和混沌的信號特征提取方法及應用[J].計量學報,2013,34(2):173-179.
[2] 崔春英,段禮祥,張來斌.基于LMD和FCM滾動軸承故障診斷方法[J].科學技術與工程,2013,13(6):1764-1772.
[3] 孔丁科,汪國昭.基于EMD的快速活動輪廓圖像分割算法[J].電子與信息學報,2010,32(5):1094-1099.
[4] 王書濤,張金梅,李圓圓.基于數(shù)學形態(tài)學和模糊聚類的旋轉機械故障診斷[J].儀器儀表學報,2012,33(5):1056-1060.
[5] Ge G X,Jing Q,Luo Y H.A computational investigation of boron-doped chromium and chromium clusters by density functional theory[J].Science China(Physics,Mechanics&Astronomy),2010,53(5):812-817.
[6] Huang N E,Shen Z,Long S R.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A,1998,454(1971):903-995.
[7] 王宏,Narayanan R M,周正歐,等.基于改進EEMD的穿墻雷達動目標微多普勒特性分析[J].電子與信息學報,2010,32(6):1355-1360.
[8] 陳龍,郭寶龍,孫偉.基于FCM聚類的粒子濾波多目標跟蹤算法[J],儀器儀表學報,2011,32(11):2536 -2542.
[9] 蔡威,程俊杰.基于減法聚類的GK模糊聚類研究[J].蘭州交通大學學報,2011,30(6):50-54.
[10] 劉慧,謝洪波,和衛(wèi)星.基于模糊熵的腦電睡眠分期特征提取與分類[J].數(shù)據(jù)采集與處理,2010,25(4):485-489.
[11] Chen W T,Wang Z H,Xie H B.Characterization of surface EMG signal based on fuzzy entropy[J].IEEE TransactionsonNeuralSystemsandRehabilitation Engineering,2007,15(2):267-272.
[12] 張文斌,郭德偉,普亞松.諧波窗分解樣本熵與灰色關聯(lián)度在轉子故障識別中的應用[J].中國電機工程學報,2013,33(21):132-137.
[13] 袁琦,周衛(wèi)東,李淑芳.基于ELM和近似熵的腦電信號檢測方法[J].儀器儀表學報,2012,33(3):514-519.
A Signal Feature Extraction Method and Its Application Based on EEMD Fuzzy Entropy and GK Clustering
JIN Mei1, LI Pan1, ZHANG Li-guo1, JIN Ju2, ZHANG Shu-qing1
(1.Measurement Technology and Instrumentation Key lab of Hebei Province,Yanshan University,Qinhuangdao,Hebei 066004,China;2.School of Civil Engineering,Hebei University of Technology,Tianjin 300401,China)
A method of feature extraction combining ensemble empirical mode decomposition with fuzzy entropy,and Gustafaon-Kessel clustering to the rolling bearing fault diagnosis.is introduced.Firstly,rolling bearing vibration signal is decomposed into a series of IMFs.Secondly,IMFs are chosen by the criteria of correlation,and the fuzzy entropies of the chosen IMF component compose eigenvectors.Finally,the constructed eigenvectors are put into GK classifier to recognize different fault types.Experiments show that fuzzy entropy can characterize the feature information of the fault signal better than sample entropy and approximate entropy do,and the result of GK clustering is superior to FCM’s.So,experimental results show that the rolling bearing fault diagnosis method based on EEMD fuzzy entropy and GK clustering is effective and superiority.
metrology;fault diagnosis;ensemble empirical mode decomposition;fuzzy entropy;GK clustering
TB936
A
1000-1158(2015)05-0501-05
10.3969/j.issn.1000-1158.2015.05.12
2014-03-09;
2014-06-26
國家自然科學基金(61077071)
金梅(1977-),女,黑龍江明水人,燕山大學講師,博士,主要研究方向為視覺伺服、智能控制及信號處理。meijin297@126.com張立國為本文通訊作者。zlgtime@163.com