胡清忠, 褚福磊
(1. 清華大學(xué)機(jī)械工程系 北京,100084) (2. 航天發(fā)射場可靠性技術(shù)重點(diǎn)實(shí)驗(yàn)室 西昌,615000)
由于壓縮氣體具有制取容易、響應(yīng)較快及遠(yuǎn)距離輸送等優(yōu)點(diǎn),在中國新一代航天發(fā)射場中一改傳統(tǒng)的氣瓶供氣模式,首次采用高壓在線供氣模式。在全新的供氣模式下需要準(zhǔn)確掌握其健康狀態(tài)、預(yù)測其發(fā)展趨勢,才能將發(fā)射風(fēng)險(xiǎn)降低到最小程度。由于發(fā)射場設(shè)備往往僅生產(chǎn)和使用一套或幾套,且受近海鹽霧和高溫、高濕的影響,使用傳統(tǒng)參數(shù)表征系統(tǒng)的可靠性和健康狀態(tài)有較大的偏差,可信度不高。在這種情況下,以預(yù)測方法和技術(shù)為核心的故障預(yù)測和健康管理技術(shù)(prognosis and health management,簡稱PHM)滿足此要求[1-5],對(duì)航天發(fā)射場的故障預(yù)測和健康管理技術(shù)具有重要的意義與用途。
目前,預(yù)測與健康狀態(tài)管理的方法有4種:基于物理模型的預(yù)測方法、基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測方法、基于模型驅(qū)動(dòng)的預(yù)測方法[6]和基于信息融合的預(yù)測方法[7]?;谖锢砟P偷念A(yù)測方法利用對(duì)系統(tǒng)內(nèi)部的深層認(rèn)識(shí)建立模型進(jìn)行預(yù)測,其效果依賴于模型的精確度,而在實(shí)際工程中,預(yù)測對(duì)象的精確模型很難建立,對(duì)發(fā)射場這種特有的大型設(shè)備就更難。基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測方法利用來自傳感器的數(shù)據(jù)信息進(jìn)行預(yù)測,在預(yù)測過程中容易出現(xiàn)陷入局部最優(yōu)解和計(jì)算過程收斂慢的缺陷?;谀P万?qū)動(dòng)的健康狀態(tài)預(yù)測方法需要耗費(fèi)較長的時(shí)間,不適合設(shè)備在線預(yù)測?;谛畔⑷诤系念A(yù)測方法易受權(quán)重值大的因素影響。因此,需要探索一種適用天航天發(fā)射場的健康預(yù)測方法。
由于發(fā)射場供氣系統(tǒng)的健康狀態(tài)不能直接觀測,只能通過溫度、壓力和變形等參數(shù)表征其健康狀態(tài),這種通過觀察參數(shù)來判斷系統(tǒng)隱藏的健康狀態(tài)與隱馬爾可夫模型(hidden Markov models ,簡稱HMM)相通,兩者都不可直接觀測到結(jié)果,都有一個(gè)潛在的結(jié)構(gòu),在一定的時(shí)間跨度上系統(tǒng)的參數(shù)空間和時(shí)間一起發(fā)生變化,生成一個(gè)多變量的動(dòng)態(tài)模式,可利用隱馬爾可夫模型對(duì)供氣系統(tǒng)的健康狀態(tài)進(jìn)行描述。
隱馬爾可夫是由馬爾可夫鏈的演變發(fā)展而成的一種概率模型,能夠?qū)㈦S機(jī)過程的統(tǒng)計(jì)特性表征出來[8]。近年來,一些學(xué)者開展了隱馬爾可夫模型的故障分類與預(yù)測研究。Chinanam等[9]和Kwan等[10]在設(shè)備剩余壽命預(yù)測方面應(yīng)用了隱馬爾可夫模型。文獻(xiàn)[11]采用有限元法和隱馬爾可夫模型進(jìn)行了設(shè)備故障模式識(shí)別。這些研究都取得了不錯(cuò)的效果。
隱馬爾可夫模型和馬爾可夫鏈不同,是一個(gè)雙重的隨機(jī)過程,其中一個(gè)用來反映狀態(tài)的轉(zhuǎn)移情況,另一個(gè)用來反映對(duì)象狀態(tài)和對(duì)象觀察值之間的統(tǒng)計(jì)對(duì)應(yīng)關(guān)系[11]。在隱馬爾可夫模型中,狀態(tài)和狀態(tài)之間的轉(zhuǎn)移是一個(gè)隨機(jī)過程,狀態(tài)觀察值也是隨機(jī)的。如果通過觀察者的方式查看對(duì)象的觀察值,對(duì)象的明確狀態(tài)不能直接看到,只有通過剩下的那個(gè)隨機(jī)過程的描述才能感知對(duì)象狀態(tài)的特性和存在。
隱馬爾可夫模型的研究對(duì)象為一數(shù)據(jù)序列,包含一個(gè)具有狀態(tài)轉(zhuǎn)移概率陣A的馬爾可夫鏈和一個(gè)具有輸出觀測值的隨機(jī)過程。由于被觀察的對(duì)象狀態(tài)是隱藏的,只能通過對(duì)觀測序列隨機(jī)過程的描述才能表現(xiàn)出來,狀態(tài)之間要通過觀測概率矩陣B才能聯(lián)系。單個(gè)隱馬爾可夫模型可記為
λ=N,M,π,A,B
(1)
簡寫為
λ=π,A,B
(2)
其中:N為模型的狀態(tài)數(shù)目; M為隱馬爾可夫模型的觀察符號(hào)數(shù);π為初始狀態(tài)的概率集合,π=π1,π2,…,πN。;πi=Pq1=Si,1≤i≤N;S為狀態(tài)的集合;q1為初始時(shí)刻為1的狀態(tài);A為隱馬爾可夫模型中的狀態(tài)轉(zhuǎn)移概率矩陣,A=aijN×N;aij=Pqi+1=Sjqi=Si,1≤i,j≤N ;B為隱馬爾可夫模型中的觀測值概率矩陣,B=bjkN×M;bjk=Poi=Vkqi=Sj,1≤j≤N,1≤k≤M。
隱馬爾可夫模型主要解決評(píng)估、解碼和學(xué)習(xí)3類問題[12]。
采用隱馬爾可夫模型對(duì)系統(tǒng)進(jìn)行健康狀態(tài)管理,需要進(jìn)行健康狀態(tài)特征的提取、建立HMM模型并進(jìn)行訓(xùn)練以及作出健康狀態(tài)評(píng)估3個(gè)步驟。其基本過程如圖1所示。
圖1 基于HMM的健康管理流程圖Fig.1 Health management flow chart based on hmm
特征提取是進(jìn)行健康狀態(tài)預(yù)測的基礎(chǔ)。在多個(gè)監(jiān)測信號(hào)的情況下提取的特征就有多個(gè),這些健康狀態(tài)特征具有冗余性和高維性的特點(diǎn)。如將這些特征直接應(yīng)用于健康狀態(tài)評(píng)估,將會(huì)極大降低評(píng)估與預(yù)測效率,從而出現(xiàn)偏差,所以必須根據(jù)工程的實(shí)際需求和算法實(shí)現(xiàn)的需要,對(duì)獲得的特征進(jìn)行必要的空間狀態(tài)變換,從而在低維空間內(nèi)獲取最優(yōu)的健康狀態(tài)特征,有效實(shí)現(xiàn)對(duì)系統(tǒng)的健康精確評(píng)估與故障預(yù)測。健康狀態(tài)的特征提取過程如圖2所示。
圖2 特征提取示意框圖Fig.2 Feature extraction diagram
為滿足隱馬爾可夫模型進(jìn)行健康狀態(tài)管理與預(yù)測所需要的多組觀測數(shù)據(jù)序列,采用從設(shè)備正常狀態(tài)的特征數(shù)據(jù)中隨機(jī)選擇N次觀測值的方法,把這些觀測值重新組合,構(gòu)成一組觀測數(shù)據(jù)序列來滿足HMM的需要。
對(duì)于觀測數(shù)據(jù)系列,HMM訓(xùn)練可使用鮑姆-韋爾奇算法進(jìn)行極大似然估計(jì),得到模型參數(shù)λ=π,A,B。對(duì)于連續(xù)隱馬爾可夫模型,使用維特比匹配算法把樣本分成N個(gè)段,分成的每一段對(duì)應(yīng)了隱馬爾可夫模型的一個(gè)狀態(tài),利用K均值聚類算法給每個(gè)觀測矩陣分配對(duì)應(yīng)的狀態(tài)序號(hào),估算出初始模型參數(shù)。對(duì)于離散隱馬爾可夫模型,通過改進(jìn)訓(xùn)練算法確定初始參數(shù)值。為了提高隱馬爾可夫模型在使用中的穩(wěn)定性,需要應(yīng)用重估算法對(duì)多組觀測數(shù)據(jù)序列進(jìn)行HMM訓(xùn)練。
為了對(duì)系統(tǒng)進(jìn)行精確的健康狀態(tài)估計(jì)與預(yù)測,引入Kullback-Leibler距離對(duì)健康狀態(tài)特征進(jìn)行定量評(píng)估,根據(jù)Kullback-Leibler距離的大小計(jì)算系統(tǒng)偏離正常狀態(tài)的程度,從而準(zhǔn)確評(píng)估出系統(tǒng)的健康狀況。
在供氣系統(tǒng)的健康狀態(tài)評(píng)估中,一般將其健康狀態(tài)劃分為兩類:正常狀態(tài)與故障狀態(tài)。由于健康的正常狀態(tài)劣化至故障狀態(tài)是一個(gè)緩變的歷程,其健康狀況是逐漸劣化,如果能對(duì)劣化過程詳細(xì)描述并賦予其相應(yīng)的中間狀態(tài)來表示,就可以解釋其故障發(fā)生過程,從而采取有效措施避免故障發(fā)生,真實(shí)反映出供氣系統(tǒng)的健康狀態(tài),所以增加一個(gè)中間故障態(tài)來反映設(shè)備的健康變化過程。
由于設(shè)備故障的嚴(yán)重程度是隨時(shí)間而逐漸變大的,從正常健康狀態(tài)到故障狀態(tài)的過程具有不可逆變性,所以采用左右型的隱馬爾可夫模型對(duì)供氣系統(tǒng)進(jìn)行健康狀態(tài)評(píng)估與預(yù)測,能夠真實(shí)反映出設(shè)備健康劣化過程,如圖3所示。
圖3 供氣系統(tǒng)的HMM結(jié)構(gòu)Fig.3 HMM structure of gas supply system
如圖3所示,將供氣系統(tǒng)的健康狀態(tài)分成正常工作狀態(tài)(0),早期故障狀態(tài)(1),中間故障狀態(tài)(2)和完全故障狀態(tài)(3)。中間的狀態(tài)由狀態(tài)1和狀態(tài)2構(gòu)成。HMM模型狀態(tài)間的轉(zhuǎn)移概率值用aiji,j=0,1,2,3表示,觀測數(shù)據(jù)序列用Okk=0,1,2,3表示。
供氣系統(tǒng)工作初期,系統(tǒng)工作正常。HMM中的初始狀態(tài)概率參數(shù)設(shè)為
π=1 0 0 0
(6)
狀態(tài)轉(zhuǎn)移概率矩陣A為
(7)
由于觀測值是連續(xù)的,因此采用連續(xù)隱馬爾可夫模型來確定觀測矩陣B。針對(duì)實(shí)際應(yīng)用過程中高斯概率密度函數(shù)不能滿足使用要求這種情況,采用
多個(gè)高斯概率密度函數(shù)的線性組合來模擬產(chǎn)生對(duì)象的觀測序列。通過大量的觀測樣本特征統(tǒng)計(jì)能夠得到高斯概率密度函數(shù)自身的均值和協(xié)方差矩陣。觀測矩陣B為
(8)
其中:O為觀測序列矩陣;Cjm為狀態(tài)j的第m個(gè)混合系數(shù);H為高斯概率密度;μm為狀態(tài)j的第m個(gè)混合成分均值;Ujm為協(xié)方差矩陣。
由于HMM模型的參數(shù)已確定,因此供氣系統(tǒng)的隱馬爾可夫模型記為λ=π,A,B。
新一代航天發(fā)射場氮?dú)夤庀到y(tǒng)氣源由液氮汽化而成,為滿足大流量的用氣要求,采用大型低溫液氮貯罐進(jìn)行液氮貯存。液氮貯罐監(jiān)測的參數(shù)有貯罐壓力(P119)、上部溫度(T109)、下部溫度(T110)和夾層溫度(T111)。
選取供氣系統(tǒng)在實(shí)際工作中液氮貯罐預(yù)冷過程時(shí)的所有數(shù)據(jù)作為供氣系統(tǒng)HMM的訓(xùn)練數(shù)據(jù)。其中:正常數(shù)據(jù)為液氮預(yù)冷和汽化過程中的正常數(shù)據(jù);異常數(shù)據(jù)為貯罐預(yù)冷過程中發(fā)生爆破膜破裂和壓力傳感器異常的數(shù)據(jù)。正規(guī)化后數(shù)據(jù)(無量綱)如表1所示。根據(jù)式(6)~(8),采用系統(tǒng)的觀測序列訓(xùn)練HMM,為了增加系統(tǒng)HMM的穩(wěn)定性,訓(xùn)練時(shí)采用系統(tǒng)多組觀測序列的重估算法。
表1選取的訓(xùn)練數(shù)據(jù)
Tab.1Selectionoftrainingdata
狀態(tài) 參數(shù)各時(shí)段值t1t2t3t4t5t6t7正常數(shù)據(jù)異常數(shù)據(jù)P119-1.862 5-1.862 5-1.862 5-1.862 5-1.853 0-1.853 0-1.853 0T109-1.524 0-1.524 0-1.524 0-1.524 0-1.524 0-1.524 0-1.524 0T1101.340 11.340 11.340 11.351 01.361 91.361 91.361 9T1111.870 41.858 91.858 91.858 91.858 91.858 91.847 3P1192.232 22.232 22.232 22.196 32.196 32.196 32.160 5T109-1.774 8-1.774 8-1.774 8-1.753 6-1.753 6-1.753 6-1.753 6T110-1.339 9-1.339 9-1.339 9-1.339 9-1.339 9-1.299 9-1.299 9T111-2.155 4-2.155 4-2.155 4-2.155 4-2.155 4-2.155 4-2.114 8
根據(jù)訓(xùn)練結(jié)果,液氮罐的狀態(tài)轉(zhuǎn)移矩陣A為
系統(tǒng)的觀測值概率矩陣B為
通過基于Viterbi算法的訓(xùn)練得到轉(zhuǎn)移矩陣A和混淆矩陣B。為了考察其序列長度與預(yù)測準(zhǔn)確率之間的關(guān)系,采用逐步遞增的方法觀察狀態(tài)系列從10增加到1 000,記錄各次預(yù)報(bào)準(zhǔn)確率的情況,預(yù)測結(jié)果準(zhǔn)確率如圖4所示??梢钥吹?,隨著測試系列的增加,預(yù)測準(zhǔn)確率會(huì)越來越高,在300個(gè)測試序列以上的情況下準(zhǔn)確率已經(jīng)達(dá)到了99%,因此選擇300個(gè)測試序列作為其分析標(biāo)準(zhǔn)。
圖4 不同測試序列下的預(yù)測準(zhǔn)確率Fig.4 Under different test sequence prediction accuracy
為了檢驗(yàn)在300個(gè)觀察測試序列情況下的預(yù)測的準(zhǔn)確率,采用多次觀察檢驗(yàn)的方法,在隨機(jī)200次的情況下記錄各次預(yù)報(bào)準(zhǔn)確率。隨著測試次數(shù)的增加,預(yù)測準(zhǔn)確率有一定的波動(dòng),但是準(zhǔn)確率都在90%以上,準(zhǔn)確率的平均值為0.973 9,方差為0.018 9,說明選擇300個(gè)測試序列作為其分析標(biāo)準(zhǔn)是可行的。
以上試驗(yàn)表明,供氣系統(tǒng)的隱馬爾可夫模型是可行和可信的,因此選取供氣系統(tǒng)實(shí)際數(shù)據(jù)進(jìn)行應(yīng)用測試。在實(shí)際工作過程中發(fā)生了4個(gè)典型情況,開始時(shí),液氮罐處于正常的靜態(tài)貯存,然后系統(tǒng)補(bǔ)充液氮進(jìn)入液氮罐,這些液氮在線汽化生產(chǎn)供給產(chǎn)品使用,工作完成后又轉(zhuǎn)入常規(guī)貯存狀態(tài)。選取不同的狀態(tài)對(duì)模型進(jìn)行測試和狀態(tài)識(shí)別,依次將時(shí)間序列數(shù)據(jù)正規(guī)化送入HMM計(jì)算正常態(tài)、弱故障態(tài)、中間故障態(tài)和完全故障態(tài)(均為無量綱),從中取最小值作為最終判定結(jié)果,測試結(jié)果如表2所示。
表2 實(shí)際數(shù)據(jù)測試結(jié)果
由表2可知,在4種情況下系統(tǒng)測試結(jié)果表明只有在液氮轉(zhuǎn)注過程中有弱故障情況,其他3種工況均正常,這與實(shí)際相符。這是因?yàn)橐旱D(zhuǎn)注過程中,為防止貯罐超壓,采取了手動(dòng)控制進(jìn)液量并打開貯罐放氣閥的臨時(shí)措施,這種情況判別為弱故障態(tài)是可以的。
對(duì)液氮貯罐預(yù)冷狀態(tài)和任務(wù)狀態(tài)的測試表明,HMM模型能在液氮貯罐的健康狀態(tài)判別中能有效識(shí)別各種狀態(tài)。
為有效評(píng)估系統(tǒng)的健康情況,引入健康指數(shù)對(duì)供氣系統(tǒng)進(jìn)行定量評(píng)估,規(guī)定Xn為正常狀態(tài)的值,T為供氣系統(tǒng)健康狀態(tài)的特征參數(shù),則
1) 當(dāng)T∈[0.90Xn~1.00Xn],健康指數(shù)為1;
2) 當(dāng)T∈[0.80Xn~0.90Xn],健康指數(shù)為0.9;
……
3) 當(dāng)T∈[0.05Xn~0.10Xn],健康指數(shù)為0。
采用以上方法對(duì)整個(gè)供氣系統(tǒng)的健康狀態(tài)進(jìn)行評(píng)估,收集的數(shù)據(jù)為投入使用這一年的數(shù)據(jù),健康狀態(tài)的評(píng)估結(jié)果如圖5所示。在當(dāng)前工作條件下隨著時(shí)間的推移,供氣系統(tǒng)的健康狀態(tài)逐步下降,其中出現(xiàn)了一次跳躍數(shù)據(jù),這是由于根據(jù)任務(wù)使用需要,轉(zhuǎn)入了大量的液氮,轉(zhuǎn)注過程中溫度升高所致。經(jīng)處理后溫度下降到正常值,繼續(xù)使用直到工作結(jié)束。
圖5 供氣系統(tǒng)健康指數(shù)Fig.5 Health index gas supply system
采用供氣系統(tǒng)液氮貯罐近一年的監(jiān)測數(shù)據(jù),分別采用3,4,5階對(duì)反映系統(tǒng)絕熱狀態(tài)的T110溫度變化情況進(jìn)行液氮貯罐健康狀態(tài)預(yù)測,如圖6所示。
藍(lán)色曲線為實(shí)測溫度數(shù)據(jù);紅色為預(yù)測數(shù)據(jù)圖6 不同階次的健康指數(shù)預(yù)測Fig.6 Different levels of health index forecast
圖7 供氣系統(tǒng)壽命預(yù)測Fig.7 Gas supply system life prediction
1) 對(duì)于具有與隱馬爾可夫模型內(nèi)部結(jié)構(gòu)相同的單樣本設(shè)備的健康狀態(tài)評(píng)估與預(yù)測是可行的。
2) 對(duì)HMM進(jìn)行訓(xùn)練時(shí),隨著樣本系列的增加,預(yù)測準(zhǔn)確率會(huì)越來越高。在300個(gè)測試序列以上的情況下,準(zhǔn)確率已經(jīng)達(dá)到了99%。
3) 采用歷史數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行健康狀態(tài)預(yù)測,歷史數(shù)據(jù)量變大,預(yù)測結(jié)果的準(zhǔn)確率就越高。
4) 基于隱馬可夫模型與趨勢預(yù)測方法在航天發(fā)射場供氣系統(tǒng)實(shí)際應(yīng)用表明其是有效可行的,對(duì)其他單樣本健康狀態(tài)管理提供了借鑒,具有良好的應(yīng)用前景。