吳俊偉 陳保家 陳正坤 萬 剛 田助新 劉 強(qiáng)
(1.三峽大學(xué) 水電機(jī)械設(shè)備設(shè)計(jì)與維護(hù)湖北省重點(diǎn)實(shí)驗(yàn)室, 湖北 宜昌 443002;2.長江三峽通航管理局,湖北 宜昌 443001;3.中國長江電力股份有限公司, 湖北 宜昌 443000)
故障預(yù)測與健康管理(prognostic and health management,PHM)技術(shù)集數(shù)據(jù)監(jiān)測、分析挖掘、智能建模于一體,能夠?yàn)闄C(jī)械設(shè)備提供健康狀態(tài)評估、剩余使用壽命預(yù)測(remaining useful life,RUL)和指導(dǎo)性維護(hù)維修決策,其中對設(shè)備系統(tǒng)進(jìn)行RUL 預(yù)測是PHM 的核心.渦扇發(fā)動(dòng)機(jī)作為航空航天領(lǐng)域的核心部件,其結(jié)構(gòu)復(fù)雜、運(yùn)行工況惡劣,對其進(jìn)行精確的RUL預(yù)測有利于保證航天器安全可靠地運(yùn)行、節(jié)省維護(hù)成本、提升經(jīng)濟(jì)效益.
Lei等[1]將RUL 預(yù)測方法分為以下4類:基于物理模型的方法、基于統(tǒng)計(jì)模型的方法、基于人工智能的方法和混合模型方法.基于物理模型的方法,通過建立基于失效機(jī)理或性能退化準(zhǔn)則的數(shù)學(xué)模型來描述設(shè)備的退化過程,最典型的應(yīng)用是蠕變模型[2].此類方法依賴于專家知識經(jīng)驗(yàn),只有在充分掌握設(shè)備故障機(jī)理后才能建立較為精準(zhǔn)的數(shù)學(xué)模型來反映機(jī)械系統(tǒng)或零部件的退化行為,因而此類方法的適用范圍受限[3].基于統(tǒng)計(jì)模型的方法,通過概率方法將觀測數(shù)據(jù)擬合成隨機(jī)系數(shù)模型或隨機(jī)過程模型,在一定程度上可以有效地描述退化過程的不確定性及其對RUL預(yù)測的影響.常用的統(tǒng)計(jì)學(xué)方法模型有自回歸模型[4]、Gamma 過程模型[5]、Wiener 過程模型[6]、Markov模型[7]等.但是基于統(tǒng)計(jì)模型的方法往往需要較為理想的假設(shè)條件,且在非線性轉(zhuǎn)換到線性過程中存在信息丟失的風(fēng)險(xiǎn).相較于上述兩種方法,基于人工智能的方法不依賴專家知識經(jīng)驗(yàn),不需要建立復(fù)雜的退化模型,利用數(shù)據(jù)驅(qū)動(dòng)就能很好地學(xué)習(xí)到機(jī)械設(shè)備的退化規(guī)律,得到可靠的RUL 預(yù)測結(jié)果.李京峰等[8]利用長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)分別對渦扇發(fā)動(dòng)機(jī)的單一傳感器數(shù)據(jù)進(jìn)行時(shí)間序列預(yù)測,然后將所有的結(jié)果按比例整合輸入到深度信念網(wǎng)絡(luò)(deep belief networks,DBN)中進(jìn)行健康指標(biāo)的預(yù)測,最終結(jié)合健康指標(biāo)的預(yù)測曲線與設(shè)定的失效閾值得到渦扇發(fā)動(dòng)機(jī)的RUL.Song等[9]通過相關(guān)向量機(jī)(relevant vector machine,RVM),對衛(wèi)星的鋰電池壽命進(jìn)行了預(yù)測.混合模型方法,即通過對前3 種方法進(jìn)行混合而形成的預(yù)測方法.Zhu等[10]提出了一種隱馬爾科夫模型自適應(yīng)故障發(fā)生時(shí)間檢測與多層感知器特征分布差異修正相結(jié)合的遷移學(xué)習(xí)軸承壽命預(yù)測方法.Tian等[11]對設(shè)備當(dāng)前和歷史的數(shù)據(jù)進(jìn)行威布爾失效函數(shù)擬合匹配,并將其作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行設(shè)備的剩余壽命預(yù)測.雖然通過混合模型能在不同類型方法中取長補(bǔ)短,但其實(shí)現(xiàn)過程復(fù)雜,因而在實(shí)際場景中應(yīng)用較少.而傳統(tǒng)的淺層模型的特征提取能力及模型的泛化能力均比較差,預(yù)測的精度有待提高.
深度學(xué)習(xí)作為近年來人工智能領(lǐng)域一種新的技術(shù),具有優(yōu)秀的深度特征提取能力,能很好地建立實(shí)測數(shù)據(jù)與退化趨勢之間的映射關(guān)系[1].Wang等[12]將原始振動(dòng)信號直接輸入到具有殘差結(jié)構(gòu)的深度可分卷積網(wǎng)絡(luò)(deep separable convolutional networks,DSCN)中獲取敏感特征,并將其映射到機(jī)械設(shè)備的剩余壽命中.Wu等[13]通過深度長短時(shí)記憶網(wǎng)絡(luò)(deep LSTM,DLSTM)融合多維傳感器數(shù)據(jù),進(jìn)行渦扇發(fā)動(dòng)機(jī)的RUL 預(yù)測,并給出預(yù)測誤差范圍.朱霖等[14]通過增加改進(jìn)的殘差塊結(jié)構(gòu),并結(jié)合采用遺傳算法的集成學(xué)習(xí)技術(shù)實(shí)現(xiàn)渦扇發(fā)動(dòng)機(jī)的RUL預(yù)測.
由于LSTM 具有出色的記憶功能,在時(shí)間序列預(yù)測和RUL預(yù)測領(lǐng)域得到了廣泛的研究與應(yīng)用.然而,LSTM 的同一層參數(shù)不能共享,無法實(shí)現(xiàn)并行計(jì)算.隨著網(wǎng)絡(luò)單元數(shù)目和網(wǎng)絡(luò)堆棧深度的增加,其網(wǎng)絡(luò)的參數(shù)量會(huì)變得十分龐大,訓(xùn)練時(shí)占用的內(nèi)存也更大,訓(xùn)練時(shí)間往往比普通RNN 更為漫長.時(shí)間卷積網(wǎng)絡(luò)(temporal convolutional networks,TCN)[15]是專門為時(shí)間序列處理而設(shè)計(jì)出來的一種卷積神經(jīng)網(wǎng)絡(luò).相較于LSTM,它同樣具有時(shí)間記憶能力,并且已經(jīng)在機(jī)器翻譯、語音合成、時(shí)間序列預(yù)測等領(lǐng)域中驗(yàn)證了其優(yōu)越的性能[15].考慮到C-MAPSS 數(shù)據(jù)集的序列特點(diǎn),基于TCN 的RUL 預(yù)測是具有可行性的.而渦扇發(fā)動(dòng)機(jī)的RUL 預(yù)測方法的可靠性已經(jīng)得到了一定驗(yàn)證[16].因此,本文提出了一種基于麻雀搜索算法(SSA)[17]進(jìn)行參數(shù)搜索的TCN 模型,用于渦扇發(fā)動(dòng)機(jī)的RUL 預(yù)測.該方法一方面充分利用TCN結(jié)構(gòu)中的卷積層參數(shù)共享、并行計(jì)算以及良好記憶能力的優(yōu)勢;另一方面利用SSA 更快的收斂速度、更好的魯棒性與精度等特點(diǎn),對TCN 進(jìn)行參數(shù)尋優(yōu),能減少人工調(diào)節(jié)參數(shù)的工作量,得到性能穩(wěn)定的TCN 結(jié)構(gòu),提高模型的預(yù)測精度,為渦扇發(fā)動(dòng)機(jī)的維護(hù)策略提供可靠的依據(jù).
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[17]在圖像分類中已取得了巨大成功.經(jīng)典CNN由多個(gè)卷積層和池化層組成.TCN 是CNN 的一種特殊體系結(jié)構(gòu),只有卷積層沒有池化層,通過卷積層構(gòu)成深度神經(jīng)網(wǎng)絡(luò)以達(dá)到對輸入序列歷史信息的記憶功能.其主要結(jié)構(gòu)特點(diǎn)包括膨脹卷積、殘差連接.
膨脹卷積分為因果膨脹卷積(causal dilated convolution)與非因果膨脹卷積(non-causal dilated convolution)[18]兩種卷積方式,其中因果膨脹卷積可以防止未來時(shí)間序列信息的泄漏[15],可實(shí)現(xiàn)實(shí)時(shí)預(yù)測;而采用非因果膨脹卷積則可使TCN 能利用過去到未來全部的輸入進(jìn)行預(yù)測,但不再適合實(shí)時(shí)應(yīng)用.
膨脹卷積通過對TCN 每一層卷積核進(jìn)行零填充,使得卷積核的感受也隨著卷積層數(shù)的遞增而呈指數(shù)級增大,因此能獲得更多的局部信息,從而能保存更長的歷史信息.此外,TCN 還可以將任意長度的序列作為輸入并產(chǎn)生相同長度的輸出序列,因此比RNN 更具有靈活性.但是值得注意的是,TCN 不是特定的網(wǎng)絡(luò)結(jié)構(gòu),而是一系列體系結(jié)構(gòu),其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示.
對于一維時(shí)間序列輸入x∈Rn和一個(gè)卷積核f:{0,1,…,k-1}→R,序列元素上的膨脹卷積運(yùn)算F被定義為
式中:d為膨脹因子;k為核大小;s-d·i為時(shí)間序列過去的方向.
TCN 中含有殘差網(wǎng)絡(luò)(residual networks,res-Net)[19]結(jié)構(gòu),其殘差塊允許TCN 學(xué)習(xí)各層特征映射的殘余誤差,避免深度網(wǎng)絡(luò)的梯度消失問題,使網(wǎng)絡(luò)在深層結(jié)構(gòu)中仍然保持穩(wěn)定的性能[15].由于批規(guī)范化(batch normalization,BN)對于同處于一個(gè)批次中的數(shù)據(jù)長度要求是相同的,而TCN 輸入的序列長度可能是動(dòng)態(tài)變化的,因此BN 可能并不適用于TCN;而層規(guī)范化(layer normalization,LN)通過對指定層的所有神經(jīng)元的輸出進(jìn)行規(guī)范化,解決了上述問題[20],同時(shí)滿足了C-MAPSS 數(shù)據(jù)集的不同輸入序列要求.圖2表示本文TCN 結(jié)構(gòu)體系中改進(jìn)的殘差塊結(jié)構(gòu).
圖2 改進(jìn)的殘差塊結(jié)構(gòu)
本文采用改進(jìn)的殘差塊構(gòu)建深度TCN 結(jié)構(gòu)體系,并結(jié)合麻雀搜索算法(SSA)對關(guān)鍵的網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化.首先將預(yù)處理的時(shí)序數(shù)據(jù)作為TCN 的輸入,然后將最后一層TCN 的輸出直接與一個(gè)神經(jīng)元數(shù)目為1的全連接層連接,以全連接層的輸出直接作為RUL的預(yù)測結(jié)果.剩余使用壽命預(yù)測流程如圖3所示,分為3個(gè)模塊:數(shù)據(jù)處理,參數(shù)優(yōu)化,RUL預(yù)測.
圖3 基于SSA-TCN 剩余壽命預(yù)測的基本流程
2.1.1 時(shí)序數(shù)據(jù)歸一化與維度轉(zhuǎn)換
渦扇發(fā)動(dòng)機(jī)的原始傳感器數(shù)據(jù)存在量綱和數(shù)量級的差別,為了消除因這些差異而造成的數(shù)據(jù)不一致性,同時(shí)又不改變數(shù)據(jù)的原始分布,方便神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,提高RUL 預(yù)測的精度,本文采用最大最小歸一化方式將原始數(shù)據(jù)范圍限制在[0,1]之間.
目前,對不同長度的時(shí)間序列添加時(shí)間步的處理方式主要有兩種:長度損失型[8-12],長度保持型.長度損失型即直接滑動(dòng)采樣,其窗口大小受限,對于發(fā)動(dòng)機(jī)傳感器數(shù)據(jù)來講,窗口不能大于所有發(fā)動(dòng)機(jī)的傳感器數(shù)據(jù)中的最小長度.因而預(yù)測模型對歷史信息的記憶能力也會(huì)相應(yīng)地受限.長度保持型采用零填充的方式來消除滑動(dòng)采樣窗口對原始時(shí)間序列樣本長度的消耗.其中填充的方式又可以分為前向填充與后向填充[14].由于前向填充的方式與TCN 中膨脹卷積對時(shí)序數(shù)據(jù)處理方式相似,因此,本文采用前向填充滑動(dòng)采樣進(jìn)行數(shù)據(jù)維度轉(zhuǎn)換.
2.1.2 分段退化RUL標(biāo)簽處理
為了提高最終的RUL 預(yù)測精度,降低發(fā)動(dòng)機(jī)正常運(yùn)行狀態(tài)特征對退化狀態(tài)特征的干擾,常常需要對RUL標(biāo)簽進(jìn)行一定的處理.其中文獻(xiàn)[12-14,21-22]均采用分段線退化的方法來處理RUL 標(biāo)簽,即當(dāng)實(shí)際的剩余壽命Y大于某一個(gè)最大循環(huán)周期T時(shí),認(rèn)為發(fā)動(dòng)機(jī)處于正常運(yùn)行狀態(tài),其壽命始終為常數(shù)值T;當(dāng)Y小于T時(shí),此時(shí)開始發(fā)生退化,發(fā)動(dòng)機(jī)壽命為原始實(shí)際值.
式中:Ylabel為分段處理后的RUL 標(biāo)簽.此外,T值的選取與發(fā)動(dòng)機(jī)的退化狀態(tài)密切相關(guān).根據(jù)文獻(xiàn)[23]的研究,T值通常在120~130個(gè)周期之間較為合適.
用于渦扇發(fā)動(dòng)機(jī)RUL 預(yù)測的TCN 模型的搜索參數(shù)及范圍見表1,表中參數(shù)分別對應(yīng)激活函數(shù)A、優(yōu)化器O、殘差塊數(shù)目L(為了保證TCN 能學(xué)習(xí)到輸入數(shù)據(jù)的時(shí)間依賴關(guān)系,同時(shí)便于訓(xùn)練,規(guī)定網(wǎng)絡(luò)最小有3層,最大有7層,其范圍對應(yīng)著該層神經(jīng)元數(shù)目的取值范圍)、隨機(jī)丟失率D、激活函數(shù)Leaky Re-LU 大于0時(shí)的的線性系數(shù)α值、卷積核大小K、卷積方式P(因果卷積為φ1,非因果卷積為φ2)、批處理大小B、初始學(xué)習(xí)率λ.
表1 TCN 待尋優(yōu)參數(shù)及其范圍
TCN 每一層殘差塊的膨脹率為2N-1,N為每一個(gè)TCN 網(wǎng)絡(luò)個(gè)體中殘差塊所處的層數(shù)值.在訓(xùn)練過程中,從訓(xùn)練集中隨機(jī)劃分出20%的數(shù)據(jù)作為驗(yàn)證集,以增加模型的泛化性能.當(dāng)驗(yàn)證集的預(yù)測效果連續(xù)30次沒有提升時(shí),則使個(gè)體網(wǎng)絡(luò)的學(xué)習(xí)率衰減為原來的10%.設(shè)置訓(xùn)練時(shí)早期停止的可承受度為100,訓(xùn)練的最大次數(shù)為300,損失函數(shù)為均方誤差(mean square error,MSE).TCN 參數(shù)尋優(yōu)的具體步驟如下:
1)種群初始化:所有群智能優(yōu)化算法的初始群數(shù)量為10;
2)適應(yīng)度:所有群智能優(yōu)化算法運(yùn)行過程中的適應(yīng)度為RUL預(yù)測值與標(biāo)簽值之間的MSE,其值越小表示適應(yīng)度越好;
3)生產(chǎn)者位置更新:生產(chǎn)者發(fā)現(xiàn)開始進(jìn)行搜索,發(fā)現(xiàn)食物(最優(yōu)解)后帶領(lǐng)種群朝著食物的區(qū)域移動(dòng);
4)競爭者位置更新:部分競爭者時(shí)刻監(jiān)視生產(chǎn)者,并與之爭奪食物;
5)種群位置整體更新:預(yù)警者發(fā)現(xiàn)危險(xiǎn),種群迅速朝著其他安全區(qū)域(潛在最優(yōu)解)的方向移動(dòng).
6)終止條件:當(dāng)算法完成50次迭代后,終止運(yùn)算.
增設(shè)的對照方法為遺傳算法(GA)[24]和粒子群優(yōu)化算法(PSO)[25].其中GA 的選擇算子采用確定式選擇,即對每一代的個(gè)體按照適應(yīng)度從大到小排序后,保留前50%,再從剩下的較差個(gè)體中選擇10%,以防止算法早熟;交叉算子采用均勻交叉的方式,即被選擇的父母親個(gè)體的每個(gè)基因位置上的基因值都以相同的交叉概率進(jìn)行交換,從而形成兩個(gè)新個(gè)體;變異算子采用基本位變異,隨機(jī)指定表1中的一個(gè)參數(shù),在給定的參數(shù)值范圍內(nèi)進(jìn)行變異,并設(shè)置變異率為0.1;PSO 按文獻(xiàn)[25]中的經(jīng)驗(yàn)選取的學(xué)習(xí)因子均為1.2,最小慣性權(quán)重為0.4,最大慣性權(quán)重為0.9.GA 和PSO 的其它實(shí)驗(yàn)條件設(shè)置與SSA 保持一致.
在基于CUDA10.0和Tensorflow 2.0 GPU 版框架下,使用Python 3.7完成算法的構(gòu)造;并在配置信息為Intel(R)Core(TM)i5-9300 H CPU@2.4 GHz,NVIDIA GeForce GTX 1660Ti GPU,16G RAM 的計(jì)算機(jī)上完成實(shí)驗(yàn)的計(jì)算.
驗(yàn)證數(shù)據(jù)集采用RUL 預(yù)測中廣泛使用的商業(yè)模塊化航空推進(jìn)系統(tǒng)仿真(commercial modular aero-propulsion system simulation,C-MAPSS)數(shù)據(jù)集[26].該數(shù)據(jù)集由4個(gè)子數(shù)據(jù)集組成.這些子數(shù)據(jù)集分別在不同的運(yùn)行工況和故障模式組合下進(jìn)行仿真,采集了21個(gè)傳感器和3 個(gè)操作條件設(shè)置的監(jiān)測數(shù)據(jù),以反映渦扇發(fā)動(dòng)機(jī)從開始運(yùn)行到發(fā)生故障直至失效的退化過程.數(shù)據(jù)集描述見表2,可知FD001 到FD004數(shù)據(jù)集兼顧不同的操作條件和故障模式,因此它們是很難預(yù)測的.故而,采用此數(shù)據(jù)集能對本文TCN 算法的性能進(jìn)行很好的驗(yàn)證.
表2 C-MAPSS數(shù)據(jù)集介紹
在上述的24維數(shù)據(jù)中,FD001和FD003是單一的操作條件,故3 個(gè)固定操作條件設(shè)置的數(shù)據(jù)會(huì)對TCN 退化特征的提取造成較大的干擾.由于傳感器1、5、6、10、16、18、19 的數(shù)據(jù)存在異常,因此,在FD001和FD003的RUL 預(yù)測中,僅用剩下的14個(gè)傳感器的數(shù)據(jù);在FD002和FD004的RUL 預(yù)測中,除了上述14個(gè)傳感器數(shù)據(jù),還使用3個(gè)操作條件設(shè)置的數(shù)據(jù).
采用評分函數(shù)(scoring functions,SF)[26]、均方根誤差(root mean square error,RMSE)以及準(zhǔn)確率(accuracy)[22]對TCN 的預(yù)測性能進(jìn)行定量評價(jià).
式中:是第i臺發(fā)動(dòng)機(jī)的RUL 預(yù)測值與RUL實(shí)際值之間的誤差;Q為測試樣本數(shù);Acc是RUL 預(yù)測結(jié)果的Accuracy,表示在誤差區(qū)間[-13,10]內(nèi)的測試集發(fā)動(dòng)機(jī)的得分情況;M為測試集發(fā)動(dòng)機(jī)的總數(shù)目.
TCN 參數(shù)搜索中使用的數(shù)據(jù)集為FD001 子數(shù)據(jù)集,時(shí)間步取36.SSA、GA 和PSO 的種群平均適應(yīng)度和個(gè)體最佳適應(yīng)度(MSE)的變化如圖4所示.
圖4 不同優(yōu)化算法的適應(yīng)度隨進(jìn)化代數(shù)的變化
從圖4可以看出:PSO 的種群平均適應(yīng)度波動(dòng)大,穩(wěn)定性差;GA 出現(xiàn)了微小波動(dòng);唯有SSA 在50次進(jìn)化的過程中最為穩(wěn)定.改進(jìn)的SSA 最佳個(gè)體收斂值為128,PSO 的收斂值為133,GA 的收斂值為140,因此,改進(jìn)的SSA 效果最佳,最終搜索得到最佳個(gè)體的參數(shù)具體見表3,再利用這些參數(shù)構(gòu)建本文的TCN 模型結(jié)構(gòu).
表3 SSA搜索到的TCN 最佳參數(shù)
本文采用層規(guī)范化(layer normalization,LN)改進(jìn)的TCN 分別與批規(guī)范化(batch normalization,BN)和文獻(xiàn)[13]中采用權(quán)重規(guī)范化(weight normalization,WN)的TCN 進(jìn)行比較.一般RUL 分段函數(shù)的最大循環(huán)周期是根據(jù)觀測結(jié)果選擇的,每個(gè)數(shù)據(jù)集的數(shù)值是不同的.參照文獻(xiàn)[13],其它實(shí)驗(yàn)參數(shù)不變的條件下,FD001數(shù)據(jù)集取最大循環(huán)周期125.3種規(guī)范化方法在FD001數(shù)據(jù)集上分別運(yùn)行10次,最終在測試集上的ERMS、SF和Acc的3個(gè)指標(biāo)的均值和標(biāo)準(zhǔn)差見表4.
表4 不同規(guī)范化方式的TCN 模型在FD001測試集上預(yù)測性能的對比
從表4可以得出,本文采用LN 的TCN 模型在3個(gè)評價(jià)指標(biāo)上均具有最優(yōu)的性能.相較于采用BN 方式的TCN 模型,TCN 模型的ERMS和SF這兩個(gè)誤差型指標(biāo)分別降低了29.06%和67.39%;準(zhǔn)確率指標(biāo)Acc提高了22.85%.相較于采用WN 方式的TCN模型,TCN 模型的ERMS和SF分別降低了30.06%和72.86%;準(zhǔn)確率指標(biāo)Acc提高了13.30%.因此,本文采用的層規(guī)范化方法能有效提高模型準(zhǔn)確率.
為了更直觀地表示3種規(guī)范化方式對TCN 模型訓(xùn)練過程的影響,BN、LN 和WN 這3種規(guī)范化方式的TCN 的訓(xùn)練過程如圖5所示.
圖5 不同規(guī)范化方式的TCN 模型的訓(xùn)練過程
3種TCN 模型在訓(xùn)練集上的損失函數(shù)值下降均比較穩(wěn)定,其中BN 方式的TCN 收斂最早,在第135個(gè)epoch 就停止了訓(xùn)練;WN 方式下的TCN 在第208個(gè)epoch停止訓(xùn)練;LN 方式的TCN 是最晚停止訓(xùn)練的,但是模型在第100個(gè)epoch的時(shí)候最早到達(dá)了收斂值.在圖5(b)中,相較于BN 和WN 方式的驗(yàn)證集損失函數(shù)的巨大波動(dòng),采用LN 的TCN 在驗(yàn)證集上的表現(xiàn)十分穩(wěn)定,訓(xùn)練過程中驗(yàn)證集的損失函數(shù)穩(wěn)定下降,并在epoch 為100 左右時(shí)就已經(jīng)趨于收斂,而后在第150個(gè)epoch時(shí)進(jìn)一步下降;同時(shí),LN方式的驗(yàn)證集損失函數(shù)的收斂值也是3種方式中最小的.因此,上述訓(xùn)練過程進(jìn)一步證明了本文采用的LN 方式能夠提高TCN 模型在訓(xùn)練過程中的穩(wěn)定性,并能夠抑制過擬合情況的出現(xiàn),從而提升TCN 模型的預(yù)測性能.
為了證明前向填充滑動(dòng)采樣方法和時(shí)間步的合適取值能有效降低RUL 預(yù)測的誤差,在其他實(shí)驗(yàn)條件不變的前提下,探究了直接滑動(dòng)采樣和前向填充滑動(dòng)采樣針對不同時(shí)間步的預(yù)測效果,分別將兩種采樣方式在4個(gè)子數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)對比.通過探究前向填充滑動(dòng)取樣的時(shí)間步問題,在10~38之間尋找最佳取值,發(fā)現(xiàn)時(shí)間步等于32時(shí)能達(dá)到局部最佳效果,故前向填充滑動(dòng)采樣4 個(gè)數(shù)據(jù)集的時(shí)間步均采用32.FD001數(shù)據(jù)集ERMS、SF和Acc帶誤差棒的折線圖如圖6所示.
圖6 不同時(shí)間步取值的FD001測試集RUL預(yù)測結(jié)果評價(jià)
由于在直接滑動(dòng)采樣方式下除了FD003的最大時(shí)間步能夠取到37,其他的FD001、FD002和FD004分別只能取到30、20和18.因此直接滑動(dòng)采樣選擇FD003時(shí)間步為32,其余的FD001、FD002、FD004分別取其最大的時(shí)間步.所有實(shí)驗(yàn)均運(yùn)行10次,并計(jì)算其評價(jià)指標(biāo)的均值和標(biāo)準(zhǔn)差,最終對比的實(shí)驗(yàn)結(jié)果見表5.由表5可知,相比于直接滑動(dòng)采樣,前向填充滑動(dòng)采樣的時(shí)間步添加方式能夠提升TCN 模型的RUL預(yù)測性能;并且在FD001~FD004這4個(gè)子數(shù)據(jù)集中的ERMS和SF兩個(gè)誤差型指標(biāo)上分別降低了8.34%和20.96%;在Acc指標(biāo)上平均提升幅度為7.07%.
表5 不同方法在FD001測試集上的RUL預(yù)測結(jié)果性能對比
本文方法與其它文獻(xiàn)方法的對比結(jié)果見表6.
表6 本文提出的SSA-TCN 與其他文獻(xiàn)的對比
本文的SSA-TCN 方法在4 個(gè)子數(shù)據(jù)集上表現(xiàn)突出,在4個(gè)子數(shù)據(jù)集共計(jì)12個(gè)評價(jià)指標(biāo)中,其中8個(gè)指標(biāo)效果最佳.而對比文獻(xiàn)中,表現(xiàn)最好的GASEN-TCN,共2個(gè)指標(biāo)效果最佳.因此,這足以證明本文SSA-TCN 方法的優(yōu)秀性能.
本文方法在4個(gè)子數(shù)據(jù)集的12個(gè)指標(biāo)中,均優(yōu)于LSTM-DBN、DLSTM 和TCN 這3種方法.
在具有Acc指標(biāo)結(jié)果的GASEN-TCN、TCN-HI這兩種方法中,本文方法在FD001、FD003和FD004上擁有最高的準(zhǔn)確率指標(biāo)值,另外FD002的準(zhǔn)確率指標(biāo)10次的平均值為60.58%,位列第2.本文方法的準(zhǔn)確率指標(biāo)在FD001到FD004這4個(gè)子數(shù)據(jù)集上分別提升了9.36%、1.81%、18.03%和2.36%,4個(gè)數(shù)據(jù)集的Acc指標(biāo)綜合平均提升了7.89%.
綜合對比6篇文獻(xiàn)的方法,本文的SSA-TCN 在FD001到FD004的ERMS分別平均降低了20.13%、25.26%、16.32%和21.82%,4個(gè)數(shù)據(jù)集的ERMS指標(biāo)綜合平均降低20.89%;在FD001到FD004的SF分別平均降低了59.33%、79.95%、51.66% 和71.53%,4 個(gè)數(shù)據(jù)集的SF指標(biāo)綜合平均降低了65.62%.
為了更加直觀地表達(dá)預(yù)測結(jié)果,以FD001 子數(shù)據(jù)集在T=125時(shí)的測試集預(yù)測結(jié)果為例,本文的方法比較準(zhǔn)確地預(yù)測出了不同發(fā)動(dòng)機(jī)的RUL 值,如圖7所示.
為了進(jìn)一步探究在預(yù)測過程中,每一臺發(fā)動(dòng)機(jī)的具體預(yù)測情況,本文分別對FD001~FD004等4個(gè)子數(shù)據(jù)集的發(fā)動(dòng)機(jī)單獨(dú)進(jìn)行了研究.受限于文章篇幅,本文從每一個(gè)子數(shù)據(jù)集的測試集中分別獲取一臺發(fā)動(dòng)機(jī)的RUL預(yù)測結(jié)果,如圖8所示.
圖8 單臺發(fā)動(dòng)機(jī)RUL預(yù)測結(jié)果
從圖8可知,本文方法學(xué)習(xí)到了訓(xùn)練集的退化特征,不僅在相對應(yīng)的測試集上精確預(yù)測出了最后一個(gè)點(diǎn)的RUL值,而且很好地預(yù)測出了單臺發(fā)動(dòng)機(jī)在不同周期點(diǎn)上對應(yīng)的健康狀態(tài)以及整個(gè)運(yùn)行過程中對應(yīng)的RUL值.因此證明了本文方法的有效性與適用性,能夠?yàn)榘l(fā)動(dòng)機(jī)的維護(hù)提供可靠的指導(dǎo)性策略.
本文提出了一種結(jié)合SSA 優(yōu)化的改進(jìn)TCN 剩余使用壽命預(yù)測模型.利用SSA 更快的收斂速度、更好的魯棒性與精度等特點(diǎn),對TCN 的參數(shù)進(jìn)行優(yōu)化,可以使得TCN 模型能針對特定的預(yù)測問題自適應(yīng)選擇模型參數(shù),降低了人工調(diào)試參數(shù)的工作量,提高了模型的預(yù)測精度,實(shí)現(xiàn)了端到端的剩余使用壽命預(yù)測模式.通過在公開的C-MAPSS數(shù)據(jù)集上進(jìn)行測試,并與最近的預(yù)測方法進(jìn)行比較,得出如下結(jié)論:
1)提出的基于LN 改進(jìn)的殘差塊結(jié)構(gòu),增強(qiáng)了TCN 模型在訓(xùn)練過程中的穩(wěn)定性,有效提高了模型的RUL預(yù)測精度;
2)相比于直接滑動(dòng)采樣,本文采用的前向填充滑動(dòng)采樣的時(shí)間步添加方式能有效降低模型的RUL預(yù)測誤差;
3)提出的SSA-TCN 模型在4個(gè)子測試集上的RUL預(yù)測評價(jià)指標(biāo)ERMS和SF比其他方法分別平均降低了20.89%和65.62%,證明了本文方法的優(yōu)越性能,能夠?yàn)樵O(shè)備的安全維護(hù)提供可靠的指導(dǎo);
4)雖然本文的TCN 模型已取得了一定的預(yù)測效果,但是對TCN 內(nèi)部結(jié)構(gòu)的探索還不夠,未來將對TCN 內(nèi)部結(jié)構(gòu)的設(shè)計(jì)做出進(jìn)一步的研究.