劉小雍,周淑芳,熊中剛,張慧
(1.遵義師范學院工學院,貴州遵義563002;2,遵義醫(yī)學院附屬醫(yī)院醫(yī)學檢驗科,貴州遵義563003;3.上海新時達機器人有限公司,上海201801)
隱馬爾可夫模型的TE過程故障診斷
劉小雍1,周淑芳2,熊中剛1,張慧3
(1.遵義師范學院工學院,貴州遵義563002;2,遵義醫(yī)學院附屬醫(yī)院醫(yī)學檢驗科,貴州遵義563003;3.上海新時達機器人有限公司,上海201801)
對基于隱馬爾可夫模型(HMM,Hidden Markov Model)的故障診斷方法在田納西-伊斯曼(TE)過程中的應用進行了研究,實現(xiàn)了故障模式的識別以及退化狀態(tài)的評估。利用主元分析法對觀測變量的維數(shù)進行降維,并結(jié)合滑動窗口技術,提高了診斷的實時性,同時在保存原數(shù)據(jù)主要信息的同時大大減少了計算量。
故障診斷;隱馬爾可夫模型;TE過程
故障診斷與預報技術對提高工程系統(tǒng)的安全性和可靠性極其重要,是PHM(Prognostics and Health Management)的核心技術,也是視情維修的前提條件。目前,故障診斷方面的文獻比較多,但是預報方面的研究還處于初步發(fā)展階段,主要研究的是系統(tǒng)的一步預測和多步預測,而對剩余使用壽命估計(RemainingUsefulEstimation,RUL)的研究則很少?,F(xiàn)有故障診斷與預報技術主要分為三類:基于模型的故障診斷與預報、基于知識的故障診斷與預報和基于數(shù)據(jù)的故障診斷與預報[1]。
HMM是一種基于數(shù)據(jù)方法的典型代表,它是一個雙重隨機過程,具有較強的動態(tài)模式識別能力,并且對時間數(shù)據(jù)和空間數(shù)據(jù)都能很好地建模,具有嚴謹?shù)臄?shù)據(jù)結(jié)構(gòu)和有效的計算方法。HMM于20世紀70年代由Baum[2]提出,首先應用于語音識別,經(jīng)過Rabiner等[3]的總結(jié)以及其在語音識別上的成功應用,HMM受到廣大研究者的關注,廣泛應用于生物醫(yī)學、通信、經(jīng)濟、控制等領域。如今,HMM在機械、工業(yè)、航空等領域內(nèi)的故障診斷與預報研究也成為了熱點。
在進行故障診斷時,除了要識別出故障的類型,還需診斷出故障的性能退化程度。Baruam等[4]在2005年首次指出,HMM可以應用于機械系統(tǒng)的退化狀態(tài)識別,并在此基礎上進行剩余使用壽命估計,他們還對HMM在應用中出現(xiàn)的訓練問題以及模型選擇問題進行了討論,并指出在今后的研究中,當出現(xiàn)新的數(shù)據(jù)時,可以用貝葉斯方法對HMM的參數(shù)進行更新。文獻[5-7]也利用HMM的分類能力對齒輪箱和滾動軸承的故障程度進行了識別。
針對DHMM(discreteHMM)在TE過程退化狀態(tài)評估中出現(xiàn)的不足,本文給出了基于CHMM(continuousHMM)的退化狀態(tài)評估方法。利用主元分析法對觀測變量的維數(shù)進行降維,并結(jié)合滑動窗口技術,提高了診斷的實時性,同時在保存原數(shù)據(jù)主要信息的同時大大減少了計算量。
HMM根據(jù)觀測變量的性質(zhì),分為DHMM和CHMM。其中DHMM的觀測變量是離散的,如果獲得的信號是連續(xù)的,就需要經(jīng)過離散化處理,將觀測值用符號或者是編碼來表示。
工業(yè)過程基于數(shù)據(jù)驅(qū)動的故障診斷方法是根據(jù)監(jiān)測過程的各種狀態(tài)信息評估出系統(tǒng)的當前健康狀態(tài)。DHMM是一種典型的基于數(shù)據(jù)的方法,它能根據(jù)相應的數(shù)據(jù)對工業(yè)過程的各種健康狀態(tài)建模,再利用它的動態(tài)模式識別性能診斷出系統(tǒng)的當前健康狀態(tài)。一般,對各類故障類型的識別以及對故障當前退化狀態(tài)的識別都稱為故障診斷,但大部分文獻的故障診斷方法是針對各類型的故障識別[8]。本文的故障診斷是指對單一故障的退化過程進行建模,識別出其退化的程度,也就是識別出系統(tǒng)的當前退化狀態(tài)。當然,本文闡述的基于DHMM的故障診斷識別方法只適用于逐漸退化的狀態(tài)過程,在很多實際情況下,系統(tǒng)的退化也是漸進的,直到系統(tǒng)完全崩潰。
基于DHMM的故障診斷原理如圖1所示。首先對監(jiān)測過程中各傳感器獲得的信號進行處理,得到訓練數(shù)據(jù);然后用某單一故障各退化狀態(tài)的訓練數(shù)據(jù)訓練出相應的DHMM,從而得到一個狀態(tài)分類器;最后,根據(jù)監(jiān)測到的系統(tǒng)的當前信號,經(jīng)處理后得到待測試的觀測向量,將其輸入狀態(tài)分類器,計算出每個模型產(chǎn)生該測試觀測向量的概率,概率最大的模型所對應的狀態(tài)就是系統(tǒng)的當前退化狀態(tài)。
在參數(shù)估計上采用Baum-Welch算法。HMM的訓練問題是三個基本問題中最重要的,也是最難解決的一個問題,到目前為止,該問題還沒有獲得解析解,但是可以用迭代的方法,如Baum-Welch算法來獲得局部最優(yōu)解。
圖1 基于DHMM的故障診斷原理圖
首先定義兩個變量:
又由于
故也可以用前向后向變量表示。
根據(jù)極大似然原理,可以推導出HMM的參數(shù)重估公式:
當田納西過程(TE過程[10],如圖2所示)的故障6發(fā)生時,對應TE結(jié)構(gòu)圖中的物料A會出現(xiàn)不平衡的損失,導致衍化過程出現(xiàn)突變,即階躍性的變化;從TE結(jié)構(gòu)圖中還可以進一步看出,由于A組分是反應器中的兩個主要反應物之一,它的非正常變化會導致最終產(chǎn)物質(zhì)量和產(chǎn)量的下降,從而引起汽提塔中的液位降低,當液位降低到預定的最低下限時,系統(tǒng)嚴重失效。TE過程加入故障6后,系統(tǒng)隨著時間的推移逐漸呈現(xiàn)出衰退的特征,直到最終崩潰。本文以TE過程的故障6為研究對象,對提出的方法進行實驗論證,論證按以下三個步驟進行。
圖2 TE過程工藝流程圖
第一步:設定TE過程的采樣時間T為0.01小時,在指定時刻加入故障6,分別做兩次運行,獲取兩組數(shù)據(jù),其中一組數(shù)據(jù)作為訓練,用于求解馬爾科夫模型的參數(shù),另一組作為測試數(shù)據(jù),實現(xiàn)對提出方法的論證。在提出的方法中,為了求解模型參數(shù),將出現(xiàn)的故障6分解為3個不同的退化狀態(tài)?;谒惴ǖ男枰?,將反應器中的物料A作為可測變量,便于求解模型時對A組分進行標一化處理。
第二步:將故障6標一化后的訓練數(shù)據(jù)應用于隱馬爾科夫模型進行求解。根據(jù)Baum-Welch算法,估計出每個模型的參數(shù)。每個退化狀態(tài)模型的訓練曲線如圖3所示,隨著迭代次數(shù)的遞增,不同衰退狀態(tài)下的最大目標函數(shù),即最大似然函數(shù)在逐步趨于穩(wěn)定,同時也反映出各個狀態(tài)模型的快速收斂程度。
圖3 三個退化狀態(tài)的訓練曲線
第三步:測試結(jié)果。測試時,利用滑動窗口技術,選取當前時刻采樣點之前的10個采樣數(shù)據(jù)作為觀測序列,也就是只要知道當前時刻之前0.1小時的系統(tǒng)狀態(tài)信息就能進行診斷,然后將觀察序列輸入到各退化狀態(tài)的狀態(tài)分類器,計算出每個退化狀態(tài)所對應馬爾科夫模型在測試數(shù)據(jù)下的對數(shù)似然函數(shù),從不同觀測序列中確定一個最大的概率模型,根據(jù)極大似然函數(shù)原理,該最大概率所對應的退化狀態(tài)即為當前最可能發(fā)生的狀態(tài),其仿真結(jié)果如圖4所示。
圖4 估計狀態(tài)與實際狀態(tài)曲線圖
由圖4可知,該故障診斷方法在狀態(tài)的跳變點容易出現(xiàn)診斷錯誤,并且診斷結(jié)果具有一定的滯后性。在跳變點出現(xiàn)錯誤是由于系統(tǒng)在退化到下一個狀態(tài)時不穩(wěn)定造成的,這就需要對算法進行改進,或者采用更多的包含退化狀態(tài)改變的數(shù)據(jù)信息訓練模型。滯后性是因為TE過程反應器中A組分的分析本身具有一定的時延。為了提高診斷的準確率,本文根據(jù)診斷精度的計算公式可以求出基于DHMM故障診斷方法的診斷精度,即:
本文針對DHMM在TE過程退化狀態(tài)評估中出現(xiàn)的不足,給出了基于CHMM的退化狀態(tài)評估方法,并且還給出了基于CHMM的故障類型識別原理。在實現(xiàn)故障模式識別和退化狀態(tài)評估時,為了減少計算的復雜度,訓練模型前用PCA技術對觀測變量進行降維。此外,在測試時,為了快速地診斷出系統(tǒng)的狀態(tài),采用滑動窗口技術對測試數(shù)據(jù)進行處理,并在TE過程中驗證了其有效性。
[1]馬賀賀.基于數(shù)據(jù)驅(qū)動的復雜工業(yè)過程故障檢測方法研究[D].上海:華東理工大學,2013.
[2]Baum L E.An equality and associated maximization technique in statistical estimation for probabilistic functions of Markov processes[J].Inequalities,1972,(3):1-8.
[3]Rabiner L R.A tutorial on hidden Markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
[4]Baruah P,Chinnam R B.HMMs for diagnostics and prognostics in machining processes[J].InternationalJournalof Production Research,2005,43(6):1275-1293.
[5]鄭晴晴.基于隱Markov模型的滾動軸承故障診斷方法研究[D].成都:西南交通大學,2013.
[6]張建峰,王志華.基于EEMD降噪和HMM的采煤機搖臂滾動軸承故障診斷[J].煤礦機械,2016,(1):205-207.
[7]于天劍,陳特放,陳雅婷,等.HMM在電機軸承上的故障診斷[J].哈爾濱工業(yè)大學學報,2016,(2):184-188.
[8]周韶園,王樹青,張建明.PCA-CHMM在化工過程故障診斷中的應用[J].浙江大學學報(工學版),2005,39(10):1475-1480.
[9]Baum L E,Sell G R.Growth transformations for functions on manifolds[J].Pacific J Math,1968,27(2):211-227.
[10]Downs J J,Vogel E F.A plant-wide industrial process control problem[J].Computers&Chemical Engineering,1993,17(3): 245-255.
(責任編輯:朱彬)
Hidden Markov Model Based on Fault Diagnosis for
TE Process
LIU Xiao-yong,ZHOU Shu-fang,XIONG Zhong-gang,ZHANG Hui
(College of engineering and technology,Zunyi Normal College,Zunyi 563002,China)
The fault diagnosis method based on Hidden Markov Model(HMM)and its application in Tennessee Eastman(TE)process are studied,which is to identify the fault pattern and assess the current degradation state.Principle component analysis(PCA)is adopted to reduce the dimension of observed variables in the fault diagnosis based on HMM,which maintains the main feature of the original data and relieves the computational burden greatly.Moving window is employed to track the dynamic data and simplify the calculation in the test of the fault diagnosis.
Fault diagnosis;Hidden Markov model;TE process
TP391.9
A
1009-3583(2016)-0092-03
2016-04-10
遵義師范學院博士基金資助項目(遵師BS(2015)04號);貴州省教育廳基金資助項目(黔教合KY字[2015]457號);貴州省科技廳基金資助項目(黔科合LH字[2015]7054號)
劉小雍,男,貴州遵義人,遵義師范學院工學院講師,博士。研究方向:機器學習與故障檢測。