李力,王紅梅
(三峽大學(xué) 水電機(jī)械設(shè)備設(shè)計(jì)與維護(hù)湖北省重點(diǎn)實(shí)驗(yàn)室, 湖北 宜昌 443002)
軸承故障是一個(gè)動(dòng)態(tài)演變發(fā)展的過程,只有當(dāng)故障發(fā)展到一定程度才會(huì)影響設(shè)備的正常運(yùn)行[1],所以軸承故障程度的狀態(tài)監(jiān)測與診斷技術(shù)在了解軸承的性能狀態(tài)和及早發(fā)現(xiàn)潛在故障等方面起著至關(guān)重要的作用,而且還可以有效提高機(jī)械設(shè)備的運(yùn)行管理水平及維修效能,具有顯著的經(jīng)濟(jì)效益。
故障診斷的關(guān)鍵問題就是模式識別,也就是分類器的建立。神經(jīng)網(wǎng)絡(luò)識別需要大量的訓(xùn)練樣本,而訓(xùn)練樣本的獲取比較困難,優(yōu)化過程有可能陷入局部極值;大部分神經(jīng)網(wǎng)絡(luò)用于處理靜態(tài)模式分類問題,而正常的故障行為是一個(gè)動(dòng)態(tài)演變過程[2]。支持向量機(jī)(SVM)則是基于統(tǒng)計(jì)學(xué)理論基礎(chǔ)和小樣本學(xué)習(xí)方法,可以克服神經(jīng)網(wǎng)絡(luò)難以避免的問題。SVM算法基于核函數(shù),存在泛化能力與核函數(shù)選擇密切相關(guān),但對大規(guī)模訓(xùn)練樣本難以實(shí)施[3]。隱Markov模型(Hidden Markov Models,HMM)由于具有豐富的數(shù)學(xué)模型結(jié)構(gòu)及堅(jiān)實(shí)的理論基礎(chǔ),實(shí)踐中有很多成功的應(yīng)用模式,被廣泛應(yīng)用于語音識別中[4-5]。
機(jī)械故障識別與語音識別中的孤立詞識別類似,故障信號就如某個(gè)單詞一樣,HMM在語音識別的成功應(yīng)用表明,通過對故障信號進(jìn)行適當(dāng)?shù)奶卣魈崛?,必定可以?yīng)用于故障模式識別[6-7]。由于具有較強(qiáng)的時(shí)間序列建模和信號模式處理能力,因此針對軸承滾動(dòng)體不同程度的故障,提取其時(shí)頻域特征參數(shù),建立對應(yīng)的HMM模型,對滾動(dòng)軸承不同程度的故障進(jìn)行診斷分類。
隨機(jī)過程是一連串隨機(jī)事件動(dòng)態(tài)關(guān)系的定量描述。Markov過程是一個(gè)隨機(jī)過程,其特性為:由一個(gè)狀態(tài)向另一個(gè)狀態(tài)的轉(zhuǎn)換過程中,存在著轉(zhuǎn)移概率,并且轉(zhuǎn)移概率可以依據(jù)前一種狀態(tài)推算出來,與該系統(tǒng)的原始狀態(tài)和此次轉(zhuǎn)移前的Markov過程無關(guān)。Markov模型是一種基于Markov過程的統(tǒng)計(jì)模型。HMM是Markov模型的進(jìn)一步發(fā)展,其狀態(tài)不能直接觀測,這種隱狀態(tài)的存在及特性可通過觀測值及隨機(jī)過程間接感知。每個(gè)觀測值是通過某種概率密度分布表現(xiàn)為相應(yīng)狀態(tài),而每個(gè)觀測向量由一個(gè)具有相應(yīng)概率密度分布的狀態(tài)序列產(chǎn)生。與傳統(tǒng)模式識別方法相比,HMM是基于參數(shù)模型的統(tǒng)計(jì)識別方法,適用于動(dòng)態(tài)過程時(shí)序建模,有強(qiáng)大的時(shí)序模式分類能力,適合于對非平穩(wěn)、重復(fù)再現(xiàn)性差的信號分析[8]。
一個(gè)HMM由下列基本參數(shù)組成[9]。
N:模型中Markov鏈狀態(tài)數(shù)目。設(shè)N個(gè)狀態(tài)為θ1,…,θN,t時(shí)刻Markov鏈所處的狀態(tài)為qt,qt∈(θ1,…,θN)。
M:每個(gè)狀態(tài)對應(yīng)的可能觀測值數(shù)目。設(shè)M個(gè)狀態(tài)為V1,…,VM,t時(shí)刻觀測到的觀測值為Ot,Ot∈(V1,…,VM)。
π:初始狀態(tài)概率矢量,π=(π1,…,πN),其中
πi=P(q1=θi),1≤i≤N。
(1)
A:狀態(tài)轉(zhuǎn)移矩陣,A=(aij)N×N,其中aij=P(qt+1=θj/qt=θi),
(2)
B:觀測值概率矩陣,B=(bjk)N×M,bjk=P(Ot=Vk/qt=θj),1≤k≤M且
(3)
此時(shí)模型為離散HMM;當(dāng)B不是一個(gè)矩陣,而是一組觀測值概率密度,即B={bj(X),j=1,…,N},這種模型稱為連續(xù)HMM。
因此,一個(gè)HMM可以記為:
λ=(N,M,π,A,B),或簡記為λ=(π,A,B)。
下文在模型訓(xùn)練及驗(yàn)證中涉及2個(gè)基本算法[9]:
(1)Forward-Backward算法。該算法對于給定的HMM,λ=(π,A,B)中各參數(shù)已知,將給定的觀測值序列Ot∈(V1,…,VM)輸入模型中,計(jì)算產(chǎn)生該觀測值序列的概率P(O|λ)。由于概率值較小,為了防止下溢,對該概率取對數(shù),稱為對數(shù)似然概率,用此算法對故障程度進(jìn)行分類識別。
(2)Baum-Welch算法。是建立HMM的算法,即HMM參數(shù)估計(jì)問題,給定模型的狀態(tài)數(shù)N及觀測值數(shù)M,提供一個(gè)觀測值序列Ot∈(V1,…,VM),該算法能確定一個(gè)λ=(π,A,B),并估計(jì)模型的最優(yōu)參數(shù),使得P(O|λ)最大。
HMM識別故障程度的基本思路為特征提取、特征矢量量化、HMM的訓(xùn)練和未知狀態(tài)觀測序列的識別問題。
(1)分別從正常及各種不同程度損傷的滾針軸承故障信號提取能表征軸承故障程度的特征指標(biāo);
(2)將特征指標(biāo)歸一化后量化編碼。建立HMM時(shí),觀測值序列應(yīng)為有限的離散數(shù)值,經(jīng)量化處理后的離散數(shù)值才能作為模型訓(xùn)練特征值;
(3)HMM訓(xùn)練。設(shè)置初始模型的參數(shù),量化編碼的離散特征值作為觀測值序列輸入,采用Baum-Welch算法對觀測值序列訓(xùn)練,調(diào)整并優(yōu)化模型參數(shù),使觀測值序列在該模型下觀測值序列的似然概率最大;
(4)HMM狀態(tài)識別。不同故障程度狀態(tài)建立與之對應(yīng)的HMM,將未知故障狀態(tài)的數(shù)據(jù)依次輸入各個(gè)模型中,計(jì)算并比較似然概率,輸出似然概率最大的模型即為未知信號的故障類型。診斷流程如圖1所示。
圖1 基于HMM的診斷示意圖
為了驗(yàn)證HMM方法在滾動(dòng)軸承故障程度診斷中的可行性,進(jìn)行了試驗(yàn)分析。監(jiān)測與診斷對象是6308軸承,模擬故障試驗(yàn)臺主要由電動(dòng)機(jī)、傳動(dòng)軸、滾動(dòng)軸承及加載電動(dòng)機(jī)等部分組成,軸承振動(dòng)信號由加速度傳感器拾取。設(shè)置電動(dòng)機(jī)轉(zhuǎn)速為1 200 r/min,采樣頻率20 480 Hz,數(shù)據(jù)長度2 048點(diǎn)。
使用滾動(dòng)體損傷面積分別約為1,3,7 mm2不同故障程度的滾動(dòng)軸承進(jìn)行試驗(yàn),分別采集正常軸承、滾動(dòng)體不同故障程度的振動(dòng)信號,4種狀態(tài)的時(shí)域波形如圖2所示。從圖可見,正常狀態(tài)軸承的振動(dòng)時(shí)域波形比較平穩(wěn);當(dāng)出現(xiàn)剝落故障后,振動(dòng)幅度增加,波形出現(xiàn)沖擊及毛刺。但是不同程度的故障振動(dòng)幅度增加規(guī)律性不強(qiáng),通過常規(guī)時(shí)域、頻域方法不易識別。
圖2 軸承不同狀態(tài)的時(shí)域波形
HMM進(jìn)行模式識別的前提是提取足量有效的特征信息。在此選擇常用時(shí)域指標(biāo)(均方值、有效值、方差、修正樣本方差及標(biāo)準(zhǔn)差)以及時(shí)頻域指標(biāo)(頻域中心、帶寬)作為監(jiān)測特征,由這7個(gè)指標(biāo)組成7維特征矢量,即模型的觀測序列是7維特征矢量。從不同的故障程度及正常狀態(tài)的軸承中提取振動(dòng)信號用于試驗(yàn)。正常、剝落1 mm2、剝落3 mm2、剝落7 mm2故障狀態(tài)分別對應(yīng)模型λ1,λ2,λ3和λ4。
為了使各特征值均在某一限定的區(qū)間內(nèi),將所有信號時(shí)頻域特征值分別除以各個(gè)指標(biāo)的最大值進(jìn)行歸一化。用Matlab中的lloyds和quantiz函數(shù)一起對原始特征矢量x進(jìn)行矢量量化,量化是根據(jù)歸一化幅值,將信號分為N-1個(gè)區(qū)間,N個(gè)區(qū)域?qū)?yīng)N個(gè)離散的訓(xùn)練碼本。信號經(jīng)量化后得到分布函數(shù)partition,得到各個(gè)信號對應(yīng)的索引值Index(x),作為模型的輸入[10]。
(4)
式中:x為原始特征矢量;i為自然數(shù);Index(x)可作為原始信號的量化碼本。文中量化的最大碼本設(shè)為100,經(jīng)矢量量化后得到4種狀態(tài)對應(yīng)的量化編碼序列。
HMM中的Markov鏈由π,A描述,不同的π,A決定其形狀。左右型Markov鏈的特點(diǎn)為:必定從初始狀態(tài)出發(fā),沿狀態(tài)序列增加的方向轉(zhuǎn)移,停在最終狀態(tài)。該模型更能描述以連續(xù)的方式隨時(shí)間改變的信號。機(jī)械設(shè)備狀態(tài)運(yùn)行是隨時(shí)間遞增的,因此對軸承故障程度建立HMM時(shí)選用左右型。
由于有4種故障狀態(tài),選用4狀態(tài)的HMM,即模型參數(shù)N選用4。初始概率π=[1 0 0 0],狀態(tài)轉(zhuǎn)移矩陣A=[0.5 0.5 0 0;0 0.5 0.5 0;0 0 0.5 0.5;0 0 0 1];每種狀態(tài)取60組作為訓(xùn)練樣本,用于生成4個(gè)狀態(tài)下的HMM;剩余各組特征向量作為測試樣本(其中,正常,剝落1 mm2,3mm2和7 mm2樣本數(shù)量分別為95,91,84和60組)。訓(xùn)練所使用的算法為Baum-Welcm算法,設(shè)置迭代次數(shù)為50,收斂誤差為0.000 01。在模型的訓(xùn)練中,最大似然估計(jì)值隨著迭代次數(shù)的增加而不斷增加,直至滿足收斂誤差條件時(shí)訓(xùn)練結(jié)束。訓(xùn)練一般循環(huán)10次即可收斂。訓(xùn)練曲線如圖3所示。
圖3 軸承故障程度訓(xùn)練曲線
4種狀態(tài)的HMM訓(xùn)練完成后,就建立了一個(gè)狀態(tài)分類器,即狀態(tài)識別的模型庫。對于剩余的4種狀態(tài)待測樣本的特征值序列,由Forward-Backward算法計(jì)算在λ1,λ2,λ3和λ4模型下,產(chǎn)生此觀測序列的對數(shù)似然概率P(O|λ)。對數(shù)似然概率值P(O|λ)反映特征向量與HMM的相似程度,其值越大,觀測值特征序列就越接近該狀態(tài)的HMM,而特征序列對應(yīng)于使輸出對數(shù)似然概率值最大的模型所對應(yīng)的故障狀態(tài)。據(jù)分類識別原則,將待測部分樣本分別輸入到4個(gè)已訓(xùn)練模型庫中,識別結(jié)果見表1。
表1 待測樣本部分識別結(jié)果
從表1能夠看出,對于正常狀態(tài)軸承,模型λ1對應(yīng)的似然概率值最大,識別出軸承處于正常狀態(tài)。同理,HMM也能準(zhǔn)確識別其他程度的軸承故障。由此可見,HMM能對不同的故障程度建模并進(jìn)行模式識別。
將所有待測樣本的觀測值序列,分別導(dǎo)入4個(gè)模型中計(jì)算產(chǎn)生此觀測值序列樣本的似然概率值,統(tǒng)計(jì)各組樣本的狀態(tài)識別率,其結(jié)果見表2。由表可知,在有限次的測試試驗(yàn)中,雖然識別過程中存在誤判,但整體識別率已經(jīng)超過了90%,平均識別率達(dá)到95%。說明該模型分類效果良好,達(dá)到了診斷的目的。
表2 不同損傷程度軸承識別結(jié)果
通過軸承振動(dòng)信號對軸承進(jìn)行故障程度診斷時(shí),利用各種時(shí)頻域指標(biāo),結(jié)合HMM理論,提出一種軸承故障程度狀態(tài)識別的新方法。該方法通過軸承模擬故障試驗(yàn)臺獲取滾動(dòng)體不同剝落程度時(shí)的振動(dòng)信號,提取不同時(shí)頻域指標(biāo)作為有效特征向量序列,并作為HMM的輸入,建立了4種不同的故障程度HMM,基于HMM的狀態(tài)分類器能成功地應(yīng)用到滾動(dòng)軸承的故障程度識別中。