李 鵬, 丁 瀛, 黃培煒, 杜藝博
(華東交通大學(xué)機電與車輛工程學(xué)院,江西 南昌 330013)
航空發(fā)動機剩余壽命(remaining useful life,RUL)預(yù)測是航空發(fā)動機PΗM(prediction and health management)的核心技術(shù),是連接飛機系統(tǒng)機載狀態(tài)監(jiān)測、飛機設(shè)備故障診斷、地面運行規(guī)劃和維修保障的重要紐帶。
對于航空發(fā)動機PΗM系統(tǒng)中的設(shè)備退化建模和RUL預(yù)測,現(xiàn)有文獻大多集中在單個特征信號在單個運行條件下的分析。但隨著系統(tǒng)和設(shè)備結(jié)構(gòu)的日趨復(fù)雜,再加上服役工況的惡劣多變,依賴單一類特征信號通常不足以準確描述設(shè)備的潛在退化機制,從而導(dǎo)致RUL預(yù)測結(jié)果的不準確。而另一方面,多個特征數(shù)據(jù)包含更為豐富的信息,采用多個特征監(jiān)測數(shù)據(jù)用于發(fā)動機剩余壽命預(yù)測可以顯著提高發(fā)動機健康監(jiān)測的效果[1]。但用于航空發(fā)動機PΗM系統(tǒng)的特征也并非越多越好,過量特征監(jiān)測數(shù)據(jù)的處理將會導(dǎo)致算法的計算復(fù)雜性增加,并且冗余特征數(shù)據(jù)的引入將導(dǎo)致分析模型過擬合,反而降低模型的預(yù)測能力[2]。
因此,若對特征數(shù)據(jù)特征進行挑選,只挑選出于設(shè)備退化機制較相關(guān)的特征監(jiān)測數(shù)據(jù),利用這些合適特征監(jiān)測數(shù)據(jù)進行融合并進行建模分析,將會提高RUL預(yù)測的精確度和魯棒性。
對于RUL預(yù)測中的特征數(shù)據(jù)的選擇問題,國內(nèi)外學(xué)者也進行了大量的研究,Wang[3]等采用分析傳感器信噪比的方法對用于RUL預(yù)測的傳感器特征數(shù)據(jù)進行選擇,但只是考慮了單個特征信號噪聲的特點,未考慮到特征數(shù)據(jù)變化趨勢和不同類型特征數(shù)據(jù)間的相關(guān)性。Liu[4]等研究了集成數(shù)據(jù)融合方法以改進壽命預(yù)測的方法,并以模型擬合誤差、失效閾值方差為最小目標函數(shù)來確定融合系數(shù)。
王金杰[5]等將互信息作為特征貢獻度評價指標結(jié)合粒子群算法進行冗余特征剔除;Rao[6]等人采用梯度增強決策樹作為特征貢獻度評價方法,并利用人工蜂群算法進行特征優(yōu)選。巫紅霞[7]等以Pearson相關(guān)系數(shù)對特征進行評估,再利用人工蟻群算法對評價后的特征子集進行特征優(yōu)選。但以上方法都未直接建立不同特征選擇結(jié)果與發(fā)動機RUL預(yù)測效果的聯(lián)系,只評價了單一次特征選擇的預(yù)測結(jié)果,采用這樣的特征數(shù)據(jù)進行RUL預(yù)測時可能導(dǎo)致不合理的結(jié)果。并且隨著現(xiàn)代傳感器技術(shù)的發(fā)展,實際應(yīng)用中采用越來越多的傳感器同時對一個設(shè)備進行狀態(tài)監(jiān)測,從而出現(xiàn)了大量與設(shè)備的退化機理不相關(guān)或冗余的傳感器監(jiān)測數(shù)據(jù)。
針對以上問題,研究提出了一種基于特征優(yōu)選的航空發(fā)動機剩余壽命預(yù)測方法,首先,基于長短時記憶網(wǎng)絡(luò)建立監(jiān)測數(shù)據(jù)預(yù)測模型,預(yù)測不同工況下發(fā)動機測試樣本的數(shù)據(jù)集。其次,基于特征融合與相似性匹配法,計算預(yù)測數(shù)據(jù)集剩余壽命值的均方根誤差,定義剩余壽命預(yù)測評價指標,并分別基于非劣分層遺傳算法(non-dominated sorting genetic algorithm II, NSGA-II)進行特征優(yōu)選。最后,對基于特征優(yōu)選的發(fā)動機剩余壽命預(yù)測效果進行驗證,以證明所提出方法的有效性。
研究以航空發(fā)動機為對象,基于NASA公布的航空渦輪發(fā)動機性能退化數(shù)據(jù)展開研究,研究中所采用的數(shù)據(jù)為C-PASS數(shù)據(jù)庫中的FD001數(shù)據(jù)集,包括訓(xùn)練樣本集:100個不同工況下航空發(fā)動機的全壽命周期數(shù)據(jù);測試樣本集:100個與訓(xùn)練樣本集對應(yīng)工況下的航空發(fā)動機部分退化數(shù)據(jù);RUL真實值:包含測試樣本集100個不同工況下發(fā)動機的剩余壽命值,分別為測試樣本集中每個發(fā)動機最后時間周期的剩余壽命。上述訓(xùn)練樣本集和測試樣本集中每組監(jiān)測數(shù)據(jù)都包含了24個特征。
研究中以FD001數(shù)據(jù)集的前50個工況中的訓(xùn)練樣本 T1-50和測試樣本 C1-50進行監(jiān)測數(shù)據(jù)的預(yù)測和剩余壽命預(yù)測的特征優(yōu)選,剩余50個工況中的訓(xùn)練樣本 T51-100和測試樣本 C51-100用于特征優(yōu)選結(jié)果的發(fā)動機剩余壽命預(yù)測效果驗證。
1)數(shù)據(jù)濾波。發(fā)動機的原始特征監(jiān)測數(shù)據(jù)中伴隨著大量隨機噪聲,而且所有發(fā)動機存在一定的初始磨損。研究采用FIR數(shù)字濾波器對發(fā)動機的原始特征監(jiān)測數(shù)據(jù)進行異常值和工作噪聲的去除。
2)數(shù)據(jù)去量綱。由于不同類型特征獲取的監(jiān)測數(shù)據(jù)數(shù)量級和量綱都不同,因此采用歸一化的方法將數(shù)據(jù)濾波后的特征監(jiān)測數(shù)據(jù)進行去量綱化,具體計算公式為:
式中: xi,j(t)——第i個工況中第j類特征在t時間周期時的原始特征監(jiān)測數(shù)據(jù);
min(xi,j)和——第j類特征在所有工
況下所有時間周期數(shù)據(jù)的最小值和最大值;
xi′,j(t)—— xi,j(t)經(jīng)歸一化處理后的歸一化值。
對所有特征監(jiān)測數(shù)據(jù)進行濾波和歸一化預(yù)處理,獲得處理后的訓(xùn)練樣本集 xT1-50和測試樣本集 xC1-50。
為通過監(jiān)測數(shù)據(jù)提取出航空發(fā)動機的性能退化內(nèi)在趨勢,并以此預(yù)測未來一段時間內(nèi)的性能退化趨勢,在設(shè)備故障失效前及時預(yù)警,需要通過預(yù)測模型獲取監(jiān)測數(shù)據(jù)的時間序列預(yù)測結(jié)果,并充分利用時間序列信息進行RUL預(yù)測。常見的序列學(xué)習(xí)模型有遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、隱馬爾可夫模型(hidden Markov model,ΗMM)和前饋神經(jīng)網(wǎng)絡(luò)等。其中,RNN網(wǎng)絡(luò)其內(nèi)部循環(huán)結(jié)構(gòu)允許信息從上一個網(wǎng)絡(luò)直接傳遞到下一個網(wǎng)絡(luò),與序列型數(shù)據(jù)建模非常契合,在智能語音識別、圖像字幕、機器翻譯等領(lǐng)域得到廣泛應(yīng)用。但由于梯度爆炸或梯度彌散現(xiàn)象的存在,導(dǎo)致RNN應(yīng)用中“記憶能力”受限[8],通常只能學(xué)習(xí)到短時間步長的依賴關(guān)系。而LSTM網(wǎng)絡(luò)作為特殊的RNN網(wǎng)絡(luò),通過引入了門限機制來控制信息的累積速度,使得其能夠?qū)W習(xí)長期的依賴信息[9],其結(jié)構(gòu)如圖1所示。
圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
一個LSTM網(wǎng)絡(luò)單位模塊主要包括長期狀態(tài)Ct和短期狀態(tài)ht,輸入門、遺忘門、輸出門門控機制來對進行信息調(diào)節(jié)[10]。通過遺忘舊信息,添加新信息和控制信息傳遞來實現(xiàn)LSTM網(wǎng)絡(luò)狀態(tài)更新,LSTM網(wǎng)絡(luò)計算t時刻輸入xt到輸出ht的實現(xiàn)公式為:
式中:σ——sigmoid函數(shù);
i、f、O和C——輸入門、遺忘門、輸出門和單元狀態(tài);
W——權(quán)值矩陣;
b——閾值矩陣;
tanh函數(shù)——激活函數(shù);
LSTM監(jiān)測數(shù)據(jù)預(yù)測模型結(jié)構(gòu)圖如圖2所示。
圖2 LSTM單序列預(yù)測模型結(jié)構(gòu)圖
LSTM監(jiān)測數(shù)據(jù)預(yù)測模型利用特征全周期壽命監(jiān)測數(shù)據(jù)中前mi個時間周期的監(jiān)測數(shù)據(jù)值來預(yù)測第mi+1次時間周期時的特征監(jiān)測數(shù)據(jù)y,故在訓(xùn)練網(wǎng)絡(luò)模型時將第mi+1次時間周期點的xi的真實值y'作為模型的理想輸出。在完成所有LSTM監(jiān)測數(shù)據(jù)預(yù)測模型訓(xùn)練后,將對應(yīng)的測試樣本集輸入網(wǎng)絡(luò)模型,進行測試樣本集后續(xù)l個時間周期的特征監(jiān)測數(shù)據(jù)的預(yù)測。
特征優(yōu)選的目標是獲取在特征數(shù)量盡可能少的情況保證對不同工況下的航空發(fā)動機的剩余壽命預(yù)測效果,研究據(jù)此設(shè)計雙目標優(yōu)化函數(shù)f1和f2。
特征數(shù)量在本研究中指的是基于數(shù)據(jù)驅(qū)動進行航空發(fā)動機剩余壽命預(yù)測所采用的數(shù)據(jù)的特征總數(shù)量,有效地減少特征數(shù)量,不僅能選擇出包含信息量豐富、能有效反映航空發(fā)動機性能變化且冗余小的特征數(shù)據(jù)集,并且有利于提高RUL的數(shù)據(jù)處理速度,提升RUL預(yù)測的精準度和魯棒性。因此將特征數(shù)量設(shè)為優(yōu)化目標函數(shù)I。
研究中特征的組合方式為二進制編碼,特征共24種,則特征的組合的向量可表示為S=[s1,s2,···,s24]T。向量中數(shù)字1的個數(shù)代表了選擇的特征數(shù)量。1代表選擇中該類特征數(shù)據(jù),0代表不選擇該類特征數(shù)據(jù)。因此,優(yōu)化目標函數(shù)I:特征數(shù)量fT1即為向量S中的非零元素個數(shù):
在航空發(fā)動機剩余壽命預(yù)測過程中,對于相同的數(shù)據(jù)特征數(shù)量,基于不同的特征類型數(shù)據(jù)組成的特征數(shù)據(jù)進行的剩余壽命預(yù)測結(jié)果也大為不同。在某一組特征類型的組合中,如果其剩余壽命預(yù)測的預(yù)測結(jié)果與真實值越接近,即發(fā)動機所有工況下的預(yù)測剩余壽命與真實剩余壽命的誤差值越小,則剩余壽命預(yù)測的效果越好,將該誤差值定義為目標函數(shù)II。
2.2.1 基于特征融合的相似性匹配
研究采用一種基于特征融合的相似性匹配方法來確定預(yù)測數(shù)據(jù)集在對應(yīng)工況下的發(fā)動機RUL預(yù)測結(jié)果,具體流程如圖3所示。
圖3 基于特征融合的相似性匹配流程
1)特征融合。為盡可能在特征融合過程中保留全周期壽命數(shù)據(jù)和預(yù)測數(shù)據(jù)集的退化特性,減少給后續(xù)的相似性匹配結(jié)果帶來的誤差,研究中采用最為簡單和有效的特征融合方法,即基于串聯(lián)的特征融合方法。對全周期壽命數(shù)據(jù)第t個時間周期起始、長度與預(yù)測數(shù)據(jù)集長度l相同的全周期壽命數(shù)據(jù)片段以及預(yù)測數(shù)據(jù)集進行串聯(lián)特征融合。
2)相似性匹配。采用Pearson相關(guān)系數(shù)來計算經(jīng)過特征融合后的全周期壽命數(shù)據(jù)片段和預(yù)測數(shù)據(jù)集這兩個時間序列之間的相關(guān)程度,以此進行相似性匹配。Pearson相關(guān)系數(shù)的計算公式為:
其中,x和y在本研究中為待定的全周期壽命數(shù)據(jù)片段和預(yù)測數(shù)據(jù)集這兩個時間序列。
2.2.2 剩余壽命標定
在進行發(fā)動機RUL預(yù)測時,由于待測的測試樣本集,即待預(yù)測的系統(tǒng)性能狀態(tài)未知,在預(yù)測評估其RUL并生成其壽命標簽的過程中,通常采用分段標定的策略來實現(xiàn)[11]。定義RUL標定策略函數(shù)為 f (RUL),設(shè)定上邊界為U,則函數(shù) f (RUL)可以表示為:
上邊界U值選取大小與航空發(fā)動機的退化性能密切相關(guān),通常上邊界U的范圍在120~130之間。通過分段RUL的標定策略,將全周期壽命數(shù)據(jù)和預(yù)測數(shù)據(jù)集的剩余壽命標簽設(shè)置為分段的線性函數(shù),當其RUL值超過125時統(tǒng)一修正為125。
2.2.3 獲取剩余壽命預(yù)測評價指標
在某一組特征類型的組合中,如果其剩余壽命預(yù)測的預(yù)測結(jié)果與真實值越接近,即發(fā)動機所有工況下的預(yù)測剩余壽命與真實剩余壽命的誤差值越小,則剩余壽命預(yù)測的效果越好。均方根誤差(root mean square error, RMSE)能夠反映出預(yù)測結(jié)果與真實值之間的偏差,所以將其作為評價目標函數(shù)I(f1)選擇的特征數(shù)據(jù)進行發(fā)動機剩余壽命預(yù)測效果的評價指標,即目標函數(shù) II(f2)。
RULp——預(yù)測的剩余壽命值;
RULt——真實的剩余壽命值。
RMSE指的是所有工況下預(yù)測的剩余壽命與真實剩余壽命的均方根誤差值,得分越高,代表平均預(yù)測誤差越大。最終,確定剩余壽命預(yù)測中進行特征優(yōu)選的兩個目標函數(shù)為:
NSGA-II是一種基于最優(yōu)保存策略的隨機尋優(yōu)算法[13],其本質(zhì)是模擬自然中生物進化的過程,遵循物競天擇的原則,個體優(yōu)勢基因?qū)⒂懈髾C會傳遞下去,同時加入一定的變異概率,從而可以避免陷入局部最優(yōu)解,找到全局最優(yōu)解[14]。流程圖如圖4所示,具體步驟如下。
圖4 改進的非劣分層遺傳算法程序流程圖
步驟1:設(shè)定個體編碼方式。特征選擇方案采用A維列向量表示,中元素取值1(或0)表示是否選擇第i類特征。
步驟3:創(chuàng)建初始種群。隨機生成規(guī)模為n的初始種群:
式中:i——0時表示初始種群;
T——迭代終止次數(shù);
j——種群中個體的編號。
步驟4:建立優(yōu)選池。由公式(7)計算種群中所有個體的目標函數(shù)和目標函數(shù)的值,據(jù)此對所有個體進行非劣層級劃分,并采用輪盤賭從父代中挑選n個個體放入優(yōu)選池。
步驟7:生成子代。將優(yōu)選池、交叉種群和變異種群合并,并根據(jù)目標函數(shù)和目標函數(shù)的值對合并后的種群進行非劣層級劃分,將非劣層級最前和擁擠距離最大的n個個體放入子代。
步驟8:迭代終止條件
2)迭代次數(shù)達到10 000次,迭代結(jié)束。
將數(shù)據(jù)代入NAGA-II算法,特征數(shù)量閾值設(shè)定為14,經(jīng)過優(yōu)化后,獲得的特征優(yōu)選結(jié)果如表1所示。由表1可知,特征優(yōu)選結(jié)果中:
表1 采用NAGA-II優(yōu)化獲得的特征優(yōu)選結(jié)果
1)特征數(shù)量少的特征優(yōu)選結(jié)果大都包含在特征數(shù)量多的特征優(yōu)選結(jié)果里,說明優(yōu)化后的特征優(yōu)選結(jié)果具有一定可靠性。
2)在第一非劣層中,隨著特征數(shù)量從1增加到9,剩余壽命預(yù)測評價指標從41.85降低至33.38,以特征數(shù)量多的數(shù)據(jù)進行發(fā)動機RUL預(yù)測效果好于特征數(shù)量少的。
3)特征數(shù)量小于特征數(shù)量設(shè)計閾值14,而優(yōu)選結(jié)果中的最大特征數(shù)量小于14,說明過多的特征數(shù)量并沒有使預(yù)測結(jié)果更接近真值,即部分冗余特征的數(shù)據(jù)加入導(dǎo)致了發(fā)動機RUL預(yù)測效果變得更差,證明了采用特征優(yōu)選對發(fā)動機RUL預(yù)測的必要性。
將后50個工況中的訓(xùn)練樣本 T51-100和測試樣本C51-100用于特征優(yōu)選結(jié)果的發(fā)動機剩余壽命預(yù)測效果驗證。對于訓(xùn)練樣本 T51-100和測試樣本C51-100,采用與前50個工況的訓(xùn)練樣本 T1-50和測試樣本C1-50相同的數(shù)據(jù)處理方法和監(jiān)測數(shù)據(jù)預(yù)測方法,利用2.4中獲得的特征優(yōu)選結(jié)果,可以計算得到測試樣本剩余壽命預(yù)測效果如表2和圖5所示。
圖5 測試樣本C 51-100剩余壽命預(yù)測效果
表2 測試樣本C 51-100剩余壽命預(yù)測效果
由表2和圖5可以得知,測試樣本 C51-100的剩余壽命預(yù)測效果與特征優(yōu)選結(jié)果相似:
1)以特征優(yōu)選結(jié)果第一非劣層的特征組合進行剩余壽命預(yù)測和以第二非劣層的特征組合進行剩余壽命預(yù)測時,第一非劣層的f2值整體趨勢上小于第二非劣層的f2值,說明通過MOPSO算法獲得的最優(yōu)特征組合(第一非劣層),相較于次優(yōu)的特征組合(第二非劣層),能夠獲得更好的剩余壽命預(yù)測效果,證明論文所提的基于特征優(yōu)選的航空發(fā)動機剩余壽命預(yù)測方法的正確性。
2)當特征數(shù)量為3時,測試樣本 C51-100以最優(yōu)特征組合(第一非劣層)獲得的剩余壽命預(yù)測評價指標值反而小于以次優(yōu)的特征組合(第二非劣層)獲得的值,以及當特征數(shù)量為3、4和6時,剩余壽命預(yù)測評價指標值不降反升,這是由于訓(xùn)練樣本T51-100的50個工況和訓(xùn)練樣本 T1-50的50個工況存在差異,導(dǎo)致進行特征優(yōu)選時,優(yōu)化會盡可能朝著對于訓(xùn)練樣本 T1-50的50個工況剩余壽命預(yù)測效果更好的方向進行,使得對于訓(xùn)練樣本的50個工況而言并非是最優(yōu)的。
3)隨著特征數(shù)量的增加,測試樣本 C51-100的剩余壽命預(yù)測評價指標值整體呈現(xiàn)逐漸下降的趨勢。說明以訓(xùn)練樣本 T1-50的50個工況數(shù)據(jù)進行特征優(yōu)選的結(jié)果適用于另外完全不同的訓(xùn)練樣本 T51-100的50個工況。
以第一非劣層中2、9個特征數(shù)量的特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果以及第二非劣層中2個特征數(shù)量的特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果如圖6所示。
圖6 不同特征優(yōu)選結(jié)果下的剩余壽命預(yù)測效果
由圖6可知:對于進行特征優(yōu)選的測試樣本C1-50的50個工況和進行剩余壽命預(yù)測的測試樣本C51-100的50個工況,都出現(xiàn)了相同的趨勢,以2個特征數(shù)量第一非劣層特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果優(yōu)于以2個特征數(shù)量第二非劣層特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果,預(yù)測誤差均值從49.9降低至34.98;以9個特征數(shù)量第一非劣層特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果優(yōu)于同為第一非劣層中以2個特征數(shù)量第一非劣層特征優(yōu)選結(jié)果進行RUL預(yù)測的結(jié)果,預(yù)測誤差均值從34.98降低至30.66,證明通過特征優(yōu)選,可以有效提高航空發(fā)動機剩余壽命預(yù)測效果;第一非劣層中2個特征的的預(yù)測誤差均值相差8.47%,9個特征的的預(yù)測誤差均值相差15.07%,它們都小于16%,則可得到在第一非劣層不同特征數(shù)量下,的預(yù)測誤差均值相差都小于16%,證明了論文所提方法的魯棒性。
研究針對航空發(fā)動機剩余壽命預(yù)測中單一特征數(shù)據(jù)的剩余壽命預(yù)測方法數(shù)據(jù)利用率低及預(yù)測精度不高,而多特征數(shù)據(jù)的剩余壽命預(yù)測方法存在信息冗余及時間序列信息考慮不充分的問題,提出了一種基于特征優(yōu)選的航空發(fā)動機剩余壽命預(yù)測方法,結(jié)果表明:
1)特征優(yōu)選結(jié)果中:①特征數(shù)量少的特征優(yōu)選結(jié)果大都包含在特征數(shù)量多的特征優(yōu)選結(jié)果里,說明優(yōu)化后的特征優(yōu)選結(jié)果具有一定可靠性;②隨著特征數(shù)量從1增加到9,剩余壽命預(yù)測評價指標從41.85降低至33.38,以特征數(shù)量多的數(shù)據(jù)進行發(fā)動機RUL預(yù)測效果好于特征數(shù)量少的;③特征數(shù)量小于特征數(shù)量設(shè)計閾值14,說明部分冗余特征的數(shù)據(jù)加入導(dǎo)致了發(fā)動機RUL預(yù)測效果變得更差,證明了采用特征優(yōu)選對發(fā)動機RUL預(yù)測的必要性。
2)以訓(xùn)練工況樣本進行特征優(yōu)選的結(jié)果適用于另外完全不同的測試工況樣本,預(yù)測誤差均值相差小于16%,證明了論文所提方法的正確性和魯棒性。