張星輝,康建設,高存明,曹端超,滕紅智
(1.軍械工程學院,石家莊 050003;2.68262部隊,青銅峽 751601;3.68129部隊,蘭州 730060)
基于MoG-HMM的齒輪箱狀態(tài)識別與剩余使用壽命預測研究
張星輝1,康建設1,高存明2,曹端超1,滕紅智3
(1.軍械工程學院,石家莊 050003;2.68262部隊,青銅峽 751601;3.68129部隊,蘭州 730060)
提出了基于混合高斯隱馬爾可夫模型的齒輪箱狀態(tài)識別與剩余使用壽命預測新方法。建立了基于聚類評價指標的狀態(tài)數(shù)優(yōu)化方法,通過計算待識別特征向量的概率值來識別齒輪箱當前狀態(tài)。在狀態(tài)識別的基礎上,提出了剩余使用壽命計算方法。最后,利用齒輪箱全壽命實驗數(shù)據(jù)進行驗證,結果表明,該方法可以有效的識別齒輪箱狀態(tài)并實現(xiàn)了剩余使用壽命預測,平均預測正確率為90.94%,為齒輪箱的健康管理提供了科學依據(jù)。
混合高斯隱馬爾可夫模型;剩余使用壽命預測;狀態(tài)識別
有效的狀態(tài)識別和剩余使用壽命(Remaining Useful Life,RUL)預測是設備健康管理的關鍵步驟。設備的大多數(shù)故障都是從正常到失效緩慢退化的過程,這些狀態(tài)變化(磨損、裂紋等)由于受到機械構造的限制,一般不便直接測量,但可通過外部測量設備來確定其內部狀態(tài)的變化。由于測量設備本身誤差及噪聲的影響,使得測量結果具有一定的隨機性,與設備內部狀態(tài)的關聯(lián)關系變得復雜。這種由設備外部測量結果反映內部狀態(tài)變化的過程是一種雙重隨機過程。其與隱馬爾可夫模型(Hidden Markov Model,HMM)的建模過程一致。目前,HMM在故障診斷領域已有很多成功的案例[1-3]。但多數(shù)文獻只對不同故障模式進行故障診斷,對全壽命退化過程不同退化狀態(tài)識別研究較少。騰紅智等[4]應用連續(xù)隱馬爾可夫模型(Continuous Hidden Markov Model,CHMM)對齒輪箱全壽命過程不同狀態(tài)的識別進行了研究。其應用K均值聚類算法和交叉驗證思想相結合對狀態(tài)數(shù)進行了優(yōu)化。該方法針對不同的狀態(tài)數(shù)目都要進行分類錯誤率的計算,計算過程繁瑣。而一些聚類方法驗證指標(如分割系數(shù)等)則能夠簡便快速確定最優(yōu)狀態(tài)數(shù),可以進一步提升運算效率?;旌细咚闺[馬爾可夫模型(Mixture of Gaussians Hidden Markov Model,MoG-HMM),允許隱狀態(tài)以多高斯分布產生觀測值,相比單個高斯分布而言更能合理的表達外部觀測與內部狀態(tài)之間復雜的關聯(lián)關系。為此,本文研究了基于MoG-HMM的狀態(tài)識別與RUL預測方法,并將其應用于齒輪箱全壽命過程的退化狀態(tài)識別和RUL預測,實驗結果證明了該方法的有效性。
MoG-HMM是HMM的其中一種形式,該模型是一個雙重隨機過程。其中一個隨機過程描述隱狀態(tài)之間的概率轉移關系;另一個隨機過程描述隱狀態(tài)產生觀測值的概率關系。一個MoG-HMM可以由下列參數(shù)描述:
(1)K:模型中的隱狀態(tài)數(shù)。其狀態(tài)分別為1,2,…,K,t時刻的狀態(tài)表示為st;
(2)A:狀態(tài)轉移概率矩陣,A=aij,aij=P[st+1=j
因此,可以記 MoG-HMM 為:λ =(K,A,B,π)。
設備從正常到失效要經歷一系列不同的退化狀態(tài),狀態(tài)之間具有一定的轉移關系。其和MoG-HMM的建模過程一致。利用MoG-HMM對設備退化過程實施狀態(tài)識別和RUL預測包括三個關鍵步驟:確定退化狀態(tài)數(shù)目、狀態(tài)識別和RUL預測。
設備退化狀態(tài)數(shù)目的確定是利用MoG-HMM進行狀態(tài)識別和剩余使用壽命預測的前提。多數(shù)文獻都是靠經驗來確定退化狀態(tài)數(shù)目。Dong等[5]根據(jù)油液的污染度將泵軸承分為四個退化狀態(tài)。文獻[6]在應用HMM預測時,假設設備的退化狀態(tài)數(shù)目為2(好和壞)。退化狀態(tài)數(shù)目的確定大致可以分為三種方法:一是由專家根據(jù)經驗確定;二是利用交叉驗證思想以分類器的分類錯誤率最低來確定;三是應用聚類方法評價指標確定。由于設備的構造越來越復雜,由專家根據(jù)經驗來確定退化狀態(tài)數(shù)目缺乏通用性,且需要大量的實驗,對于高可靠、價格昂貴的部件并不適用。利用交叉驗證的思想確定最優(yōu)退化狀態(tài)數(shù)目需要對不同的退化狀態(tài)數(shù)目都訓練分類器并檢驗分類錯誤率,其計算時間長,效率低。而應用聚類方法評價指標確定最優(yōu)退化狀態(tài)數(shù)目則簡便易行,計算效率高。
首先,假設聚類數(shù)目(退化狀態(tài)數(shù)目)為c,c∈{2,3,…,cmax}。選擇一種聚類方法將提取的特征矩陣分為c類,計算各個聚類評價指標的值,每個c值都有一組評價指標值相對應,由此可以確定最優(yōu)的c值。其過程如圖1所示。
圖1 基于LMoG-HMM的退化狀態(tài)識別框架Fig.1 Framework of degradation state recognition based on LMoG-HMM
聚類方法評價指標分別為:
分割系數(shù)[7](Partition Coefficient,PC),其定義為:
以上表達式中μij表示第j個樣本屬于第i類的概率,xj表示第j個樣本,vi表示第i類的聚類中心,vk表示第k類的聚類中心,1≤i,k≤c,c表示聚類數(shù)目,N 表示樣本數(shù)目。其中,PC取值越大越好,SC、SI和XB取值越小越好。
該方法包括兩個階段:訓練和識別,其過程如圖1所示。假設從歷史狀態(tài)數(shù)據(jù)中提取的特征矩陣為F,F(xiàn)=(ft1,ft2,…,ftn),1≤t≤T,1≤d≤D。T 為設備失效時間,D為提取的特征數(shù)。用某聚類方法將特征矩陣F分為c類,用該c類特征分別訓練c個MoG-HMM,因其隱狀態(tài)并不代表設備的退化過程,因此稱為局部混合高斯隱馬爾可夫模型(Local Mixture of Gaussians Hidden Markov Model,LMoG-HMM)。當獲取新的特征向量O時,就可以分別計算c個LMoG-HMM分別產生O的概率概率值最大的 LMoG-HMM所對應的退化狀態(tài)即為當前所處的退化狀態(tài)。如圖2所示,當新的設備從正常狀態(tài)開始退化時,將從監(jiān)測信號中提取的特征向量不斷的輸入用歷史數(shù)據(jù)訓練好的LMoG-HMM分類器中,由概率最大原則來判斷該時刻設備所處的退化狀態(tài),直到設備再次失效。由此確定出該設備的退化狀態(tài)序列 H=((si)1,(si)2,…,(sj)t),1≤i,j≤K,1≤t≤T。i為初始退化狀態(tài),j為 t(當前)時刻退化狀態(tài)。該退化過程和觀測矩陣又可以用一個MoG-HMM表示,稱為全局混合高斯輸出隱馬爾可夫模型(Global Mixture of Gaussians Hidden Markov Model,GMoG-HMM)。
當獲得退化狀態(tài)序列H后,通過求取退化狀態(tài)信息即可進行RUL預測。往往同型號的多個設備其退化過程也不盡相同,當其退化量超過某一預先確定的閾值時,設備失效。對其進行RUL預測,也就是預測從當前退化量到達退化量閾值所需的時間。通常,設備真實的退化量是無法測量的。因此,在實際計算過程中,可以從提取的特征向量中,選取全壽命過程中某一特征作為設備退化量的度量。
定義如下退化狀態(tài)信息:
其中:De(Si)表示設備處于退化狀態(tài)Si時每個時間點的退化量,de(t)表示t時刻時的退化量。Sd表示退化狀態(tài)Si開始時間,dl表示退化狀態(tài)Si結束時間。Tt=dl-sd+1。用來預測的GMoG-HMM模型可以進一步表示為:
μ(De(Si))和μ(ΔDe(Si))表示退化狀態(tài)i每個時間點的平均退化量和平均退化量變化。σ(De(Si))和σ(ΔDe(Si))表示退化狀態(tài)Si每個時間點退化量的標準差和退化量變化的標準差。退化狀態(tài)序列H和退化信息 μ(De(Si))、μ(ΔDe(Si))、σ(De(Si))與σ(ΔDe(Si))可以估計用于RUL預測的退化向量。其主要思想是結合置信度估計t時刻的平均退化量和變化范圍。其可以表示為式(9)~(11)。
t時刻的退化量可以表示為:
RUL的值即可表示為退化量閾值Dlimit與現(xiàn)有退化量的差值。
圖2 全壽命過程退化狀態(tài)識別Fig.2 Degradation state recognition of full life cycle
實驗設備如圖3所示,實驗所用齒輪箱型號為JZQ175;動力源為電磁調速電機,型號為YCT180-4A;風冷磁粉制動器為齒輪箱提供載荷,型號為FZ200.K/F。齒輪箱結構及傳感器位置如圖4所示。該實驗為全壽命實驗,為縮短實驗時間,齒輪箱傳遞功率為額定功率的2~2.5 倍,轉速為1 200 r/min,輸入端負載為15 N·m,采樣頻率為20 kHz,采樣時間為6 s,每10 min采集1組數(shù)據(jù)。實驗發(fā)現(xiàn),齒輪箱工作548 h后失效,主要故障形式是齒面嚴重磨損和斷齒,如圖5和6所示。
圖3 實驗臺示意圖Fig.3 Test-rig of gearbox
圖4 齒輪箱主要參數(shù)及傳感器位置Fig.4 Main parameters of the gearbox and the transducers location
實驗采集的是加速度信號,共3 288組數(shù)據(jù)。用‘db8’小波分別對四個通道的振動信號進行小波包3層分解,提取各頻帶能量作為特征向量。因此,四個通道共32個特征,特征矩陣F的維數(shù)為3 288×32。
圖5 齒輪箱實驗中期1號齒輪嚴重磨損Fig.5 Serious wear of gear 1 at the middle test time
圖6 齒輪箱實驗后期1號齒輪失效Fig.6 Failure of gear 1 at the later test time
3.2.1 狀態(tài)數(shù)優(yōu)化
首先應用K均值聚類算法對特征矩陣F進行聚類,聚類數(shù)目取2~7。然后分別計算PC、SC、SI、XB的值。結果如圖7所示。從圖中可以看出,最佳的聚類數(shù)目為3。因此將齒輪箱全壽命過程分為3個退化狀態(tài)。最后,應用K均值聚類算法將特征矩陣聚為3類,獲得類別序號及聚類中心向量。
3.2.2 LMoG-HMM 分類器訓練
從第1類中選取類別序號401~450所對應的特征矩陣;從第2類中選取類別序號3091~3130所對應的特征矩陣;從第3類中選取類別序號3279~3288所對應的特征矩陣。3個類別共100組數(shù)據(jù)用來訓練各自的分類器(LMoG-HMM1、LMoG-HMM2、LMoG-HMM3)。分類器的初始參數(shù)設置和訓練后的參數(shù)如表1所示。
3.2.3 齒輪箱全壽命過程狀態(tài)識別
分類器訓練完畢后,即可對新采集的數(shù)據(jù)進行狀態(tài)識別,即計算產生觀測值概率最大的分類器所對應的退化狀態(tài)即為齒輪箱所處的退化狀態(tài)。齒輪箱全壽命過程特征矩陣所對應的三個分類器產生概率如圖8所示。圖8(a)為全壽命過程狀態(tài)識別全貌圖,圖8(b)為全貌圖的局部放大。從局部放大圖中可以看出,由于受噪聲等的影響,局部時間點的退化狀態(tài)識別結果是錯誤的。在求取全壽命過程退化狀態(tài)序列時需要去除異常數(shù)據(jù)點,可以將錯誤識別狀態(tài)更正為實際退化狀態(tài)。
圖7 四種聚類評價指標不同狀態(tài)數(shù)目劃分取值Fig.7 Values of the four validity meaxures at thd different cluster number
圖8 齒輪箱全壽命狀態(tài)識別結果Fig.8 State reeognition results of geatbox's full life cycle
由于齒輪箱實際的退化量通常是難以測量的,所以以第1通道頻帶0~1.25 kHz的能量值作為反映退化量的指標。如圖9所示。由于數(shù)據(jù)受采集設備誤差、噪聲和環(huán)境溫度變化的影響存在一定的波動,其波動與圖8相同。因此需對退化指標進行多項式擬合,多項式階數(shù)為8,以使其穩(wěn)定增長。然后對其進行歸一化處理,使其退化值的范圍為[0,1]之間。
表1LMoG-HMM初始及訓練后參數(shù)Tab.1 Initialzation and learned parmeters of LMoG-HMM
表2 估計的退化參數(shù)值Tab.2 Estimated degradation parameters
根據(jù)式(5)~(8)可求得退化參數(shù)如表2所示。剩余使用壽命計算公式(9)~(11)中的 n·σ表示3Sigma準側(68%,95%,99.7%)。在該實驗中選取n=3。RUL預測正確率計算公式為:
其中:RULR(t)表示 t時刻實際的剩余使用壽命,RULE(t)表示t時刻估計的剩余使用壽命。通過RUL計算公式可以得到其結果如圖10所示。由正確率計算公式可以得出其預測平均正確率為90.94%。
圖9 齒輪箱退化量度量指標Fig.9 Degradation measure index of gearbox
圖10 齒輪箱RUL預測結果Fig.10 RUL prediction result of Gearbox
本文建立了基于MoG-HMM的齒輪箱狀態(tài)識別和RUL預測方法,建立了基于聚類評價指標的狀態(tài)數(shù)優(yōu)化方法,相比基于交叉驗證的狀態(tài)數(shù)優(yōu)化方法,其運算速度快,計算簡潔。齒輪箱全壽命實驗驗證了論文所用方法的有效性,平均預測準確率達到了90.94%,為齒輪箱的健康管理提供了科學依據(jù),也為其它類型設備的狀態(tài)識別和RUL預測提供了借鑒。
[1]Boutros T,Liang M.Detection and diagnosis of bearing and cutting toolfaults using hidden Markov models[J].Mechanical Systems and Signal Processing,2011,25:2102-2124.
[2] Lee J M,Kim S J,Hwang Y,et al.Diagnosis of mechanical fault signals using continuous hidden Markov model[J].Journal of Sound and Vibration,2004,276:1065-1080.
[3] Purushotham V,Narayanan S,Prasad S A N.Multi-fault diagnosis of rolling bearing elements using wavelet analysis and hidden Markov model based fault recognition[J].NDT&E International,2005,38:654 -664.
[4]滕紅智,趙建民,賈希勝,等.基于CHMM的齒輪箱狀態(tài)識別研究[J].振動與沖擊,2012,31(5):92-96.
TENG Hong-zhi, ZHAO Jian-min, JIA Xi-sheng, et al.Gearbox state recognition based on continuous hidden Markov model[J].Journal of Vibration and Shock,2012,31(5):92-96.
[5] Dong M,He D.A segmental hidden semi-Markov model(HSMM)-based diagnostics and prognostics framework and methodology[J].Mechanical Systems and Signal Processing,2007,21:2248-2266.
[6] Zhou Z J,Hu C H,Xu D L,et al.A model for real-time failure prognosis based on hidden Markov model and belief rule base[J].European Journal of Operational Research,2010,207:269-283.
[7] Bezdek J C.Pattern recognition with fuzzy objective function algorithms[M].Plenum Press,1981.
[8] Bensaid A M,Hall L O,Bezdek J C,et al.Validity-guided(Re)clustering with applications to image segmentation[J].IEEE Transactions on Fuzzy Systems,1996,4:112 -123.
[9] Xie X L,Beni G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(8):841-847.
Gearbox state identification and remaining useful life prediction based on MoG-HMM
ZHANG Xing-hui1,KANG Jian-she1,GAO Cun-ming2,CAO Duan-chao1,TENG Hong-zhi3
(1.Ordnance Engineering College,Shijiazhuang 050003,China;2.68262 Unit,Qingtongxia 751601,China;3.68129 Unit,Lanzhou 730060,China)
A new approach for state recognition and remaining useful life(RUL)prediction based on Mixture of Gaussians Hidden Markov Model(MoG-HMM)was presented.The state number optimization method was established based on cluster validity measures.One can recognize the state through identifying the MoG-HMM that best fits the observations.Then,the RUL prediction method was presented on the recognition base.Finally,the data of a gearbox's full life cycle test was used to demonstrate the proposed methods.The results show that the mean accuracy of prediction is 90.94%.
MoG-HMM;remaining useful life prediction;state recognition
TH165.3
A
2012-07-13 修改稿收到日期:2012-08-21
張星輝 男,博士生,講師,1984年6月生