王亞東,殷戰(zhàn)穩(wěn)
(1.中國平煤神馬集團陽光物業(yè)有限公司,河南平頂山467099;2.河南城建學院電氣與電子工程系,河南平頂山467036)
在實際工程中,旋轉機械在發(fā)生故障時不可能是全部部件出現(xiàn)問題,大多只是某一零部件出現(xiàn)了故障,即旋轉機械故障可以用某一小部分振動信息進行表述。對故障狀態(tài)下的振動信息進行有效地提煉,可以縮短故障診斷的時間,提高準確度,實現(xiàn)故障檢測的實時性。
1999年《Science》發(fā)表了Golub等針對正常和非正常樣本進行特征選取的研究結果[1]。Golub等以“信噪比”指標作為衡量局部特征對樣本分類貢獻大小的度量。該“信噪比”指標為:
式中:i為數(shù)據(jù)編號;μnomal(i)、δnomal(i)、μunomal(i)和δunomal(i)分別表示正常樣本和非正常樣本數(shù)據(jù)i的均值和標準差。由式(1)可知,如果數(shù)據(jù)信息i在正常樣本和非正常樣本的表達水平均值相同,那么信噪比SN(i)=0,則該數(shù)據(jù)信息被視為冗余信息。如果兩個該數(shù)據(jù)信息在兩個類別中表述水平的方差出現(xiàn)較大差異,那么可以認為該數(shù)據(jù)信息很可能是與故障緊密相關的特征信息。
李穎等[2]對“信噪比”改進如下:
式中α、β為參數(shù),根據(jù)具體情況設置,其它參量同式(1)表述意義相同。對式(2)分析可知:SN2(分類信息指數(shù))越大,含有的樣本分類信息越多,對樣本的分類能力也越強,而只有少數(shù)樣本數(shù)據(jù)才有相對較大的信息指數(shù)。即使兩類樣本中的信息表達水平的均值相同,只要分布方差差別較大,依然可以得到較大的SN2(分類信息指數(shù))。SN2越大說明正常樣本和故障樣本的差別越大。
由上述可知,當某一振動信息在正常和故障兩個類別中的分布均值相同,則其信噪比SN(i)=0,該振動信息會被作為無關信息而剔除。當振動信息在正常狀態(tài)下的分布方差很小,而在故障狀態(tài)下的分布方差較大時,從故障診斷研究的角度分析,該振動信息很可能與某種故障狀態(tài)密切相關。依據(jù)這種分布方差的差異可以較好地判斷樣本的類別。在文獻[3]中,提出了使用Bhattacharyya距離衡量樣本數(shù)據(jù)中蘊含的分類信息量,其公式為:
式(3)由兩部分構成:第一部分體現(xiàn)了振動信息在正常和故障類別中分布均值的差異對樣本分類的貢獻;第二部分體現(xiàn)了分布方差的不同對分類的貢獻。從式(3)可知,即使不同類別樣本中的數(shù)據(jù)分布的均值相同,只要分布的方差存在差異,依然可以獲得較大的Bhattacharyya距離值,即實現(xiàn)不同類別的分離。
式(2)和式(3)主要描述了非正常狀態(tài)下數(shù)據(jù)信息間的相互因素。這里還需引入歐氏距離的概念,其公式為:
式中:xi為正常樣本振動數(shù)據(jù);yi為故障狀態(tài)下樣本振動數(shù)據(jù);歐式距離ED表示正常樣本與非正常樣本之間的差異性,距離大表示二者之間的差異性大,反之就表示差異性小。
綜合上述的研究,在分類時,既要考慮到信息間的相互作用,又要兼顧信息間的獨立性,因此,提出了“差異度”的模型,即
式中:μnomal(i)、δnomal(i)、μunomal(i)和δunomal(i)分別為正常樣本和非正常樣本數(shù)據(jù)i的均值和標準差;xi為正常樣本震動數(shù)據(jù);yi為非正常樣本震動數(shù)據(jù)。
差異度包含:(1)振動數(shù)據(jù)在兩個類別中分布均值的差異對樣本分類的貢獻;(2)振動數(shù)據(jù)在兩個類別中分布方差的不同對分類的貢獻;(3)包括SN2、SN3以及歐式距離共同作用下對故障信息分類的影響。
差異度信息分離方法在旋轉機械故障診斷中的原理如圖1所示。
圖1 差異度信息分離方法在旋轉機械故障診斷中的原理圖
本文從實際采集到的數(shù)據(jù)中隨機抽選出10組內圈故障數(shù)據(jù)和5組正常狀態(tài)下的振動數(shù)據(jù)。通過對這10組數(shù)據(jù)進行EMD分解,會得到與之相對應的IMF分量。由于故障信息只在某一個或幾個IMF分量內集中表現(xiàn),并且故障振動信息與正常狀態(tài)下的振動信息存在一定的相關性,因此故障數(shù)據(jù)經分解之后的IMF也會和正常數(shù)據(jù)及其IMF分量存在關聯(lián)性,只有故障信息集中的IMF分量才會與其差異度較大。本文選取包含主要故障信息的前10個IMF分量進行研究。
某組故障狀態(tài)下的前10個IMF分量與正常狀況下的振動數(shù)據(jù)的差異度如圖2所示,從圖2可知,差異度基本上是隨著IMF分量級數(shù)的升高而遞減,差異度較大的是故障數(shù)據(jù)的前5個IMF分量,后面的5個分量的差異度基本一致。故障數(shù)據(jù)IMF分量與正常數(shù)據(jù)相對應的IMF分量的差異度如圖3所示,圖3顯示第二到第六個IMF分量的差異度較大,第九個和第十個IMF分量的差異度最小。綜合圖2和圖3的顯示結果,從故障數(shù)據(jù)的IMF分量中抽選出前6個IMF分量作為特征向量作為LS-SVM的輸入,以正常和故障兩種類型作為輸出。
圖2 故障數(shù)據(jù)IMF與正常數(shù)據(jù)的差異度
圖3 故障數(shù)據(jù)IMF與正常數(shù)據(jù)IMF的差異度
基于差異度方法的故障識別結果如圖4所示,其中圖4a是正常樣本經LS-SVM分類后所在的空間,圖4b是具有故障的樣本經LS-SVM分類后所在的空間,圖4c是兩類樣本的分類結果。從圖4中可以看出兩類樣本數(shù)據(jù)經過LS-SVM分類后能達到很好的效果,可使兩類樣本完全分離開。
本文提出了差異度的信息分離方法,對該方法的有關理論依據(jù)和模型設計作了詳細的介紹,并運用該方法對實測信號的IMF分量和正常狀況下振動信號的IMF分量進行差異度計算,篩選出能代表故障類型的IMF分量。通過差異度模型篩選出來的IMF分量作為特征向量送入分類器進行分類,這樣就能依據(jù)旋轉機械振動信息快速地對其進行判斷是否正常。因此差異度模型的引入使后期故障診斷更加實時、高效。
圖4 基于差異度的滾動軸承故障識別結果
[1] Golub T R,Slonim D K,Tamayo P,etal.Molecular classification of cancer:class discovery and class prediction by gene expression monitoring[J].Science,1999,286(5439):531-537.
[2] 李穎新,阮曉鋼.基于支持向量機的腫瘤分類特征基因選取[J].計算機研究與發(fā)展,2005,42(10):1796-1801.
[3] Li Yi-xin,Ruan Xiao-gang.Feature selection for cancer classification based on support vector machine[J].Journal of Computer Research and Development,2005,42(10):1796-1801.