袁洪芳,張 任,王華慶
(1.北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100029;2.北京化工大學(xué) 機(jī)電工程學(xué)院,北京 100029)
齒輪箱作為大型旋轉(zhuǎn)設(shè)備中重要零部件,一旦發(fā)生故障,設(shè)備甚至生產(chǎn)過程均會受其影響。為保證設(shè)備安全、高效運(yùn)行,故障診斷技術(shù)應(yīng)運(yùn)而生,現(xiàn)已用于各種機(jī)械設(shè)備,避免眾多生產(chǎn)事故的發(fā)生[1]。目前齒輪故障診斷研究主要集中在齒輪箱狀態(tài)檢測儀器及分析系統(tǒng)的開發(fā)、信號處理與分析、故障機(jī)理研究與典型故障特征提取、診斷方法及人工智能應(yīng)用,包括振動診斷、噪聲分析、扭振分析、油液分析、聲發(fā)射、溫度及能耗監(jiān)測等。信號處理及分析方法亦取得較大發(fā)展,如時域波形分析法、功率譜分析、包絡(luò)譜分析、時間序列分析、小波變換、HHT變換等。以上方法在故障診斷中雖已成熟應(yīng)用,但仍依賴專家經(jīng)驗。而智能診斷方法因依賴專家經(jīng)驗少、操作簡單方便、具有自動性、實時性強(qiáng)等特點得到較大發(fā)展[2]。常用智能診斷算法包括人工神經(jīng)元網(wǎng)絡(luò)、遺傳算法、支持向量機(jī)、蟻群算法等,雖在模式識別領(lǐng)域成熟應(yīng)用,但均存在缺點。神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu);遺傳算法對染色體編碼及適應(yīng)度函數(shù)設(shè)計要求較高;蟻群算法搜索時間過長,易出現(xiàn)搜索停滯。隱馬爾科夫模型(Hidden Markov Model,HMM)為不完全觀測數(shù)據(jù)的統(tǒng)計模型,在語音識別領(lǐng)域應(yīng)用廣泛,包容性、適用性強(qiáng)[3],且HMM訓(xùn)練時間短,無需提前建立目標(biāo)函數(shù),識別準(zhǔn)確率較高。HMM的應(yīng)用包括手語識別、口型識別、車牌識別、人臉檢測及信號處理與模式識別領(lǐng)域[4]。齒輪箱智能故障診斷即為模式識別。
利用HMM對齒輪箱故障進(jìn)行智能模式識別前,先從由齒輪箱振動信號中提取有關(guān)故障信息,即特征提取。本文由時域波形、頻譜、解調(diào)譜及小波域能量中共提取41個特征參數(shù)。若用全部特征參數(shù)建立HMM模型會使程序運(yùn)行緩慢降低模式識別效率,診斷實時性低,導(dǎo)致識別準(zhǔn)確率較低。為提高HMM識別效率及準(zhǔn)確率,需對特征參數(shù)集合進(jìn)行降維去掉參數(shù)間相關(guān)性、冗余性,提取最優(yōu)特征參數(shù)子集。常用降維方法有主成分分析、線性判別分析、獨立成分分析、距離測度法等[5]。距離測度法因算法簡單、易于實現(xiàn)、可靠性強(qiáng)等特點在故障診斷參數(shù)降維領(lǐng)域應(yīng)用較廣。本文據(jù)傳統(tǒng)距離測度法理論提出改進(jìn)算法,對原評價函數(shù)進(jìn)行修正以提取對故障最敏感的特征參數(shù)子集。提取最優(yōu)特征參數(shù)后用其對HMM模型進(jìn)行訓(xùn)練,建立各齒輪的HMM模型,并對齒輪箱進(jìn)行智能故障診斷。通過齒輪箱模擬試驗臺采集齒輪正常、斷齒、磨損、軸不對中等狀態(tài)振動數(shù)據(jù),利用預(yù)處理數(shù)據(jù)進(jìn)行仿真實驗。實驗結(jié)果表明本文所提方法有效、可行。
齒輪箱發(fā)生故障時振動信號能量會變化,并產(chǎn)生沖擊信號,各時域統(tǒng)計參數(shù)隨之改變。因此,時域統(tǒng)計參數(shù)能有效反應(yīng)齒輪箱發(fā)生的變化。常用時域統(tǒng)計參數(shù)及公式見表1,其中N為信號長度;xi為信號時域幅值。
表1 時域統(tǒng)計參數(shù)
表2 頻域特征參數(shù)
信號頻譜中含大量特征頻率信息,能反映齒輪箱狀態(tài)的改變,故需提取頻域中特征參數(shù)。常用特征參數(shù)公式見表2,其中p(m)為頻譜幅值;M(m=1,2,…,M)為頻譜線個數(shù);fm為第m條頻譜線頻率大小。由于齒輪發(fā)生故障時會伴有沖擊信號,出現(xiàn)不同程度調(diào)制現(xiàn)象,尤其以齒輪嚙合頻率及諧波為載波的調(diào)制為主。調(diào)制產(chǎn)生的邊頻帶包含較多有用齒輪故障信息,對振動信號進(jìn)行解調(diào)可獲得齒輪故障特征頻率。在解調(diào)譜中按12個頻域特征參數(shù)計算公式提取12個解調(diào)譜特征參數(shù)D1~D12。
齒輪箱發(fā)生故障時,振動信號幅值發(fā)生變化,不同故障振動信號各頻率段能量變化不同,因此可求出信號各頻段能量作為另一組特征參數(shù)。小波分解具有多分辨率分析能力,可將原始信號分解到不同頻段,每個頻段振動信號均含原始信號在該頻段內(nèi)的特征信息。原始信號小波分解后對各頻段信號進(jìn)行重構(gòu)后分別求其能量為
(1)
式中:xk為重構(gòu)后信號;N為重構(gòu)信號長度;J為原始信號分解頻段個數(shù)。
總能量為
(2)
小波能量特征參數(shù)可表示為向量形式
(3)
提取的包括時域、頻域、解調(diào)譜及小波能量在內(nèi)共41個特征參數(shù)組成齒輪箱故障模式識別特征參數(shù)集合,基本覆蓋振動信號時、頻域內(nèi)所有故障信息。
由于提取的特征參數(shù)集合數(shù)量眾多,參數(shù)間冗余不相干,為降低故障診斷周期、提高識別準(zhǔn)確率,需選出最優(yōu)特征參數(shù)子集,即特征參數(shù)降維[6]。本文在傳統(tǒng)距離測度法基礎(chǔ)上提出改進(jìn)的最優(yōu)特征參數(shù)選擇方法。傳統(tǒng)方法原理描述為不同故障模式可視為不同類別,而特征參數(shù)則可視為類別中的點。即當(dāng)某類內(nèi)點較分散時可能有的點會被劃分到其它類別中,故某一類內(nèi)點較集中時較易識別,此為類內(nèi)距離需小的原則;同樣兩類別中心點距離太近時,兩類內(nèi)點可能會相互摻雜,當(dāng)兩中心點相距較遠(yuǎn)時兩類別較易區(qū)分,此為類間距離需大的原則。因此當(dāng)同時達(dá)到類間距離大、類內(nèi)距離小要求時,分類器較易區(qū)分各種故障類別。
Ⅰ,Ⅱ,Ⅲ樣本在某一特征參數(shù)分類的二維平面投影簡化模型見圖1。設(shè)樣本有三類,即A類、B類、C類,其中圓心點為樣本中心點,圓半徑為類內(nèi)距離,圓心與圓心之間為類間距離。傳統(tǒng)的距離測度法基于類間距離大、類內(nèi)距離小原則,即類間距離平均值與類內(nèi)距離平均值比值越大越好。其中模型Ⅰ為標(biāo)準(zhǔn)樣本分布模式,符合距離測度法原則,樣本間較易區(qū)分。
圖1 三種樣本分布
類間距離平均值與類內(nèi)距離平均值比值較大時,會出現(xiàn)分類效果不理想現(xiàn)象:①Ⅱ分類模型與模型Ⅰ相比圓半徑相等,即類內(nèi)平均距離相等,三個圓之間類間平均距離亦相等,因此類間類內(nèi)平均距離比值相等,但A類、B類間樣本不易區(qū)分。原因為A類、B類之間距離過小,而A、B類與C類之間距離過大,導(dǎo)致類間平均距離與類內(nèi)平均距離比值較大時仍出現(xiàn)分類不理想現(xiàn)象;② Ⅲ分類模型中雖類間類內(nèi)平均距離比值較大,但由于A類樣本類內(nèi)距離過大、B類樣本類內(nèi)距離過小,同樣導(dǎo)致分類效果不理想。為避免在類間類內(nèi)平均距離比值較大時出現(xiàn)Ⅱ、Ⅲ分類效果不理想現(xiàn)象,需控制類間(類內(nèi))距離大小,防止某一類間(類內(nèi))距離過大或過小。據(jù)此,本文提出改進(jìn)方法,引入修正函數(shù)及衰減因子,計算過程如下[8]:
(1) 樣本集合描述
{Sn,f,p,n=1,2,…,Nf;f=1,2,…,F;p=1,2,…,P}
(4)
式中:Sn,f,p為f模式下第n個樣本第p個特征參數(shù)值;Nf為f模式下樣本數(shù);F為模式個數(shù);P為特征參數(shù)個數(shù)。
(2) 對任意特征參數(shù)p,計算其在各模式下類內(nèi)距離
(5)
式中:f=1,2,…,F;ni,nj=1,2,…,Nf,ni≠nj。
計算F個模式的平均類內(nèi)距離為
(6)
(3)計算同一模式f下特征參數(shù)p的平均值,即類內(nèi)中心
(7)
計算類與類兩兩之間距離的平均值,即類間平均距離為
(8)
式中:fi,fj=1,2,…,F,fi≠fj。
(9)
(10)
(5) 兩約束因子值越小分類效果越好,因此可定義修正函數(shù)對傳統(tǒng)方法計算的靈敏度函數(shù)進(jìn)行修正,修正函數(shù)定義為
(11)
式中:α為衰減因子,可將修正因子對傳統(tǒng)評價函數(shù)影響進(jìn)行衰減,防止修正因子對傳統(tǒng)靈敏度評價函數(shù)過分修正,常用α值為0.5,1,2。
(6) 特征參數(shù)靈敏度評價函數(shù)為
(12)
分別計算各特征參數(shù)的評價函數(shù),函數(shù)值越大該參數(shù)分類靈敏度越高,由此可有效提取最優(yōu)特征參數(shù)子集。
隱Markov模型(HMM)包括兩個隨機(jī)過程,即① 最基本的隨機(jī)過程Markov鏈,可描述狀態(tài)之間的轉(zhuǎn)移;② 描述狀態(tài)與觀測變量之間的統(tǒng)計對應(yīng)關(guān)系[9]。1個HMM可由5個參數(shù)描述[10]:即N為模型中Markov鏈狀態(tài)數(shù)目;M為每個狀態(tài)對應(yīng)的可能觀測值數(shù)目,每個狀態(tài)觀測值由字符或編碼表示;π=(π1,π2,…,πN)為初始概率分布矢量,表示N個狀態(tài)中隨機(jī)選擇某一狀態(tài)概率;A=(aij)N×N(1≤i,j≤N)為狀態(tài)轉(zhuǎn)移概率矩陣,表示從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài)的概率;B=(bjk)N×M(1≤j≤N,1≤k≤M)為觀測值概率矩陣,表示第j個狀態(tài)下選擇第k個觀測值概率。
因此1個HMM模型可記為λ=(N,M,π,A,B)。HMM齒輪箱智能模式識別可表述為求概率p(O|λ)最大值問題,其中O={o1,o2,…,oT}為觀測值序列,即特征參數(shù)樣本。
HMM訓(xùn)練采用Baum-Welch算法[11],即定義ξt(i,j)為給定訓(xùn)練序列O及模型λ時,t時刻Markov模型鏈處于θi狀態(tài)、t+1時刻處于θi狀態(tài)概率為
ξt(i,j)=P(O,qt=θi,qt+1=θj|λ)
(13)
據(jù)前向變量、后向變量定義可導(dǎo)出:
ξt(i,j)=[αt(i)αijbj(ot+1)βt+1(j)]/P(O|λ)
(14)
則t時刻Markov鏈處于θi狀態(tài)概率為
ξt(i)=P(O,qt=θi|λ)=
(15)
模型中三個參數(shù)重估公式[12]為
(16)
(17)
(18)
以齒輪箱某狀態(tài)的HMM模型為例,簡要闡述HMM在齒輪箱模式識別中的作用。齒輪箱發(fā)生某一故障時先提取特征參數(shù),并將其量化到1~M之間正整數(shù),初始化HMM模型各參數(shù),其中狀態(tài)數(shù)為N,觀測值為1~M間正整數(shù),見圖2。
圖2 齒輪箱某狀態(tài)HMM模型
訓(xùn)練階段據(jù)訓(xùn)練算法訓(xùn)練模型達(dá)收斂后求得π,A,B值,最終獲得該故障模式的HMM模型λ=(N,M,π,A,B);模式識別階段輸入觀測值序列(特征參數(shù)集合)O={o1,o2,…,oT}到訓(xùn)練好的各模型中,分別計算輸出概率p(O|λ),輸出概率越大與該模型越匹配,屬于該模型故障的概率值越大,通過比較輸出概率值大小對故障類型進(jìn)行決策。
實驗平臺為齒輪箱故障診斷模擬試驗臺,主動輪齒數(shù)75,從動輪齒數(shù)55,軸承轉(zhuǎn)速300 r/min,采樣頻率100 kHz。通過加速度傳感器分別采集齒輪正常、磨損、斷齒及軸不對中四種狀態(tài)振動信號,每20000個數(shù)據(jù)為一組共采集100組,其中50組作為訓(xùn)練數(shù)據(jù),50組作為測試數(shù)據(jù)。實驗數(shù)據(jù)規(guī)格見表3。
表3 實驗數(shù)據(jù)規(guī)格
齒輪斷齒故障的時域信號見圖3。由圖3看出,波形中周期性沖擊信號明顯,能量較大,通過提取信號中特征參數(shù)并利用HMM進(jìn)行模式識別即可判斷故障類型。
圖3 齒輪斷齒故障時域波形
據(jù)改進(jìn)的距離測度法分別計算時、頻域及小波能量域中41個特征參數(shù)評價函數(shù)值并歸一化,結(jié)果見圖4。由圖4看出,41個特征參數(shù)靈敏度的相對大小,據(jù)特征參數(shù)盡量少原則,選取6個靈敏度值最大特征參數(shù)作為最優(yōu)特征參數(shù)子集進(jìn)行模式識別,包括兩時域參數(shù)T4,T6,兩頻域參數(shù)F1,F(xiàn)10,兩解調(diào)譜參數(shù)D1,D9。而四個小波能量參數(shù)未被選中,說明小波分解并重構(gòu)后各頻率段間能量無明顯區(qū)別,不能顯著反映齒輪故障特征。
圖4 特征參數(shù)靈敏度值
圖5 HMM模型訓(xùn)練曲線
據(jù)所選靈敏度較高的6個特征參數(shù),利用HMM對齒輪箱4種狀態(tài)進(jìn)行訓(xùn)練,訓(xùn)練曲線見圖5,其中橫坐標(biāo)為迭代次數(shù),由于HMM所求概率值較小,為便于比較,本文對輸出似然概率值取對數(shù),故縱坐標(biāo)為對數(shù)似然概率值。
HMM模型訓(xùn)練速度較快,經(jīng)20次迭代后4種狀態(tài)模型均已達(dá)到收斂誤差。模型訓(xùn)練后所得參數(shù)包括初始概率分布矩陣、狀態(tài)轉(zhuǎn)移概率矩陣及觀測值概率矩陣。利用另200組數(shù)據(jù)分別對4種模型識別能力進(jìn)行測試,即求每組數(shù)據(jù)的對數(shù)似然概率p(O|λ)值,每組測試數(shù)據(jù)4種HMM模型的測試結(jié)果見表4~表7。表4~表7中-Inf代表負(fù)無窮大,由于為對數(shù)似然概率,故-Inf表示概率接近0。
表4 正常測試數(shù)據(jù)4種HMM模型的輸出對數(shù)似然概率
表5 磨損測試數(shù)據(jù)4種HMM模型的輸出對數(shù)似然概率
表6 斷齒測試數(shù)據(jù)4種HMM模型的輸出對數(shù)似然概率
表7 軸不對中測試數(shù)據(jù)4種HMM模型的輸出對數(shù)似然概率
測試結(jié)果表明,在每種狀態(tài)50組測試數(shù)據(jù)中除少數(shù)樣本未能正確分類外,大部分樣本均能準(zhǔn)確分類。4種模型的識別統(tǒng)計結(jié)果如見表8。由表8看出,每種狀態(tài)50組共200組測試樣本實驗中,基于HMM的齒輪箱故障模式識別平均準(zhǔn)確率達(dá)95.5%?;诟倪M(jìn)的距離測度法及HMM智能齒輪箱故障診斷方法具有算法簡單、訓(xùn)練速度快、識別準(zhǔn)確率高等優(yōu)點,證明本文所提方法在齒輪箱智能故障診斷中有效、可行。
表8 測試樣本識別統(tǒng)計結(jié)果
(1) 用本文所提新的齒輪箱智能故障診斷方法提取的齒輪振動信號在時域、頻譜、解調(diào)譜及小波能量中特征參數(shù)能充分覆蓋齒輪箱故障信息。
(2) 用改進(jìn)的距離測度法提取最優(yōu)特征參數(shù)子集,該方法據(jù)最大類間距離、最小類內(nèi)距離原則提出的新特征參數(shù)靈敏度評價函數(shù)能有效對參數(shù)集合降維,選靈敏度較高的參數(shù)組成最優(yōu)特征參數(shù)集合。
(3) 本文通過將HMM引入齒輪箱故障識別中,訓(xùn)練速度快,平均識別準(zhǔn)確率達(dá)95.5%。
[1] 屈梁生,張西寧,沈玉娣.機(jī)械故障診斷理論與方法[M].西安:西安交通大學(xué)出版社,2009.
[2] 李紅衛(wèi),楊東升,孫一蘭,等.智能故障診斷技術(shù)研究綜述與展望[J].計算機(jī)工程與設(shè)計,2013, 34(2):632-637.
LI Hong-wei, YANG Dong-sheng, SUN Yi-lan,et al.Study review and prospect of intelligent fault diagnosis technique[J].Computer Engineering and Design,2013,34(2): 632-637.
[3] 李寧.旋轉(zhuǎn)機(jī)械的測試信號分析及隱馬爾科夫模型應(yīng)用研究[D].重慶:重慶大學(xué),2010.
[4] Chien J T,Liao C P.Maximum confidence hidden markov modeling for face recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(4): 606-616.
[5] 肖健華,吳今培,樊可清,等.粗糙主成分分析在齒輪故障特征提取中的應(yīng)用[J].振動工程學(xué)報,2003,16(2):166-170.
XIAO Jian-hua, WU Jin-pei, FAN Ke-qing, et al.Rough principal component analysis and its application on feature extraction for gears[J].Journal of Vibration Engneering, 2003,16(2):166-170.
[6] 楊先勇.基于信號局部特征提取的機(jī)械故障診斷方法研究[D].浙江:浙江大學(xué),2009.
[7] 鄭軍,王巍,楊武,等.基于類間距離參數(shù)估計的文本聚類評價方法[J].計算機(jī)工程, 2009, 35(9): 37-42.
ZHEN Jun, WANG Wei, YANG Wu,et al.Textclustering evaluation method based on parameter estimation of distances between clusters[J].Computer Engneering, 2009, 35(9):37-42.
[8] Lei Ya-guo,He Zheng-jia,Zi Yan-yang.A new approach to intelligent fault diagnosis of rotating machinery[J].Expert Systems with Applications,2008,35(4):1593-1600.
[9] 吳昭同,楊世錫.旋轉(zhuǎn)機(jī)械故障特征提取與模式識別新方法[M].北京:科學(xué)出版社,2012.
[10] 岳夏.基于HMM的復(fù)雜條件故障診斷研究[D].廣州:華南理工大學(xué),2012.
[11] 郭明威,倪世宏,朱家海.基于EMD-HMM的BIT間歇故障識別[J].振動,測試與診斷,2012,32(3):468-470.
GUO Ming-wei, NI Shi-hong, ZHU Jia-hai.Intermittent fault diagnosis for built-in test system based on EMD and HMM[J].Journal of Vibration, Measurement & Diagnosis, 2012,32(3):468-470.
[12] Li Qing-min,Zhao Tong,Zhang Li,et al.Mechanical fault diagnostics of onload tap changer within power transformers based on hidden markov model[J].IEEE Transactions on Power Delivery,2012,27(2):596-601.