苗青林,張曉豐,高楊軍,劉顯光,秦丕勝
(空軍工程大學(xué)裝備管理與無人機工程學(xué)院,西安,710051)
隨著傳感技術(shù)和監(jiān)測技術(shù)的發(fā)展,航空發(fā)動機剩余使用壽命(remaining useful life, RUL)預(yù)測[1-2]也采用了大量傳感器。但各傳感器數(shù)據(jù)間具有強耦合、非線性關(guān)聯(lián)的關(guān)系,致使傳統(tǒng)預(yù)測方法難以準(zhǔn)確預(yù)測航空發(fā)動機RUL。
近年來,隨著機器學(xué)習(xí)的發(fā)展,基于數(shù)據(jù)驅(qū)動的航空發(fā)動機RUL預(yù)測方法受到廣泛關(guān)注,依靠機器學(xué)習(xí)算法的航空發(fā)動機RUL預(yù)測方法成為主流發(fā)展趨勢。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)[3]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)[4-5]、長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)[6-9]、多目標(biāo)深層信念網(wǎng)絡(luò)集成方法(multi objective deep belief network integration ensemble, MODBNE)[10]、相關(guān)向量機(relevance vector machine,RVM)融合的時間序列預(yù)測方法[11]、支持向量機(support vector machines, SVM)算法[12]等在航空發(fā)動機RUL預(yù)測中得到了一定的應(yīng)用,這些方法克服了傳統(tǒng)預(yù)測的局限性,預(yù)測精度有所提高。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)是具有卷積計算且有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),被廣泛應(yīng)用于圖像處理領(lǐng)域。近年來,許多學(xué)者將航空發(fā)動機傳感器數(shù)據(jù)看成RGB通道為1的圖像,使用CNN預(yù)測RUL[13-14],在C-MAPSS數(shù)據(jù)集上實驗,結(jié)果表明CNN較現(xiàn)有算法在預(yù)測準(zhǔn)確度上有所提升,但其仍將航空發(fā)動機壽命衰減過程看作一個線性過程,沒有將航空發(fā)動機壽命狀態(tài)進行分類,即健康狀態(tài)(未發(fā)生壽命衰減)和壽命衰減狀態(tài),導(dǎo)致預(yù)測仍存在較大的誤差。
為進一步提高算法精度,降低預(yù)測誤差,本文提出了一種基于雙通道的深度卷積神經(jīng)網(wǎng)絡(luò)(two-channel deep convolutional neural network, TCDCNN)方法,用來預(yù)測航空發(fā)動機剩余使用壽命。方法整體框架如圖1所示。
圖1 整體框架
本文采用由NASA提供的C-MAPSS數(shù)據(jù)集[1],包括FD001~FD004四個子集,每個子集分為訓(xùn)練集和測試集。每個子集的訓(xùn)練集軌跡數(shù)量、測試集軌跡數(shù)量、工作條件數(shù)量和故障模式數(shù)量如表1所示。
表1 數(shù)據(jù)集詳情
表1中FD001和FD002中故障模式為高壓壓氣機(high pressure compressor,HPC)衰退,F(xiàn)D003和FD004中故障模式為HPC衰退和風(fēng)扇衰退。
每個訓(xùn)練集和測試集中的數(shù)據(jù)包括航空發(fā)動機id、時間步c、3個航空發(fā)動機設(shè)置和21個航空發(fā)動機傳感器數(shù)據(jù)。
訓(xùn)練集中每個航空發(fā)動機的總壽命s1id為該發(fā)動機c的最大值,如式(1)所示:
(1)
測試集中每個航空發(fā)動機的總壽命s2id是該航空發(fā)動機c的最大值加上測試停止時的true_RULid(式中簡寫為RT),如式(2)所示:
(2)
以FD001為例,得到了每個航空發(fā)動機總壽命后,用總壽命減c得到剩余使用壽命RUL(式中簡寫為R),如式(3)所示:
(3)
由于傳感器種類眾多、數(shù)據(jù)集中、數(shù)據(jù)維度大,為提高算法效率,需要對數(shù)據(jù)進行降維,各傳感器(sensor)描述如表2所示[14]。
最大信息系數(shù)(maximal information coefficient,MIC)是用于檢測變量之間的關(guān)聯(lián)程度的度量標(biāo)準(zhǔn),范圍為0~1,計算各個傳感器數(shù)據(jù)與RUL的MIC值[15],得到傳感器s1、s5、s6、s10、s14、s16、s18和s19的MIC值為0,說明上述傳感器數(shù)據(jù)并不影響RUL預(yù)測,可以刪除該傳感器數(shù)據(jù)。
表2 傳感器描述
使用存在噪聲的數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,得到網(wǎng)絡(luò)模型的預(yù)測結(jié)果誤差較大。進行數(shù)據(jù)降噪時應(yīng)保證降噪前后的數(shù)據(jù)量不變,本文采用卡爾曼濾波方法對數(shù)據(jù)進行降噪。
卡爾曼濾波是采用卡爾曼增益修正狀態(tài)觀測值,以逼近真實值,通常用來去除噪聲來還原真實數(shù)據(jù),在軌跡預(yù)測、制導(dǎo)和導(dǎo)航等領(lǐng)域有較好的應(yīng)用。
對降噪后的數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)映射到0~1范圍內(nèi)。
卷積神經(jīng)網(wǎng)絡(luò)輸入的數(shù)據(jù)通常為矩形數(shù)據(jù),本文采用的數(shù)據(jù)集由多個多元時間序列組成,所以需要數(shù)據(jù)重構(gòu),使其形成矩陣數(shù)據(jù)。
假設(shè)原數(shù)據(jù)大小為x×y,采用數(shù)據(jù)切片大小為l×y,滑動步長為1,掃描操作之后得到(x-l+1)個l×y的數(shù)據(jù)片,數(shù)據(jù)片可以看成1張大小為l×y的灰色圖像,RGB通道為1。
以FD001中id為1的數(shù)據(jù)為例,數(shù)據(jù)的大小為192×18,采用30×18的切片進行數(shù)據(jù)提取,滑動步長為1,過程如圖2所示。
圖2中灰色矩形為掃描窗口,從數(shù)據(jù)的最上方開始掃描,然后矩陣向下移一行,依次類推。數(shù)據(jù)重構(gòu)之后共獲得163個30×18大小的數(shù)據(jù)片。
圖2 數(shù)據(jù)切片過程
對每個數(shù)據(jù)片設(shè)置標(biāo)簽,標(biāo)簽為該數(shù)據(jù)片的最后一次循環(huán)的RUL,一共有163個數(shù)據(jù)片,對應(yīng)數(shù)據(jù)標(biāo)簽為0~162。FD001~FD004的數(shù)據(jù)切片大小分別30×18,20×18,30×18,20×18。
現(xiàn)有CNN算法[13-14]中的壽命衰減過程考慮不夠全面,沒有判斷壽命衰減起始點位置方法,導(dǎo)致預(yù)測誤差較高。Shi首次將壽命衰減起始點判斷方法加入Dual-LSTM算法,利用LSTM進行退化分析和RUL預(yù)測[15],優(yōu)點是去除對固定變化點的假設(shè),逐單元檢測變化點,并在C-MAPSS數(shù)據(jù)集上驗證了該方法的有效性。本文嘗試在CNN中加入分段和線性RUL衰減模型和RUL衰減起始點判斷方法以取得更準(zhǔn)確的預(yù)測結(jié)果。
本文使用的壽命衰減模型如圖3所示。
圖3 改進后的壽命衰減模型
圖3中改進的壽命衰減模型中有2種不同的衰減模型,包括線性衰減模型和分段衰減模型。通過RUL衰減起始點來判斷該航空發(fā)動機RUL衰減模型。
在測試集中,若RUL大于或等于訓(xùn)練集中的最大壽命時,則說明測試開始的一段時間內(nèi)航空發(fā)動機壽命未衰減,此時,壽命衰減起始點為RUL等于s1id的點,對應(yīng)分段RUL衰減模型。當(dāng)RUL大于s1id時,RUL置為最高壽命,如式(4)所示:
(4)
若RUL一直小于訓(xùn)練集中的最大壽命,此時,壽命衰減起始點即為測試起始點,對應(yīng)線性RUL衰減模型。
本文將每次訓(xùn)練的壽命衰減模型保留并作為下一次訓(xùn)練的初始模型進行訓(xùn)練,繼承訓(xùn)練結(jié)果。圖4為訓(xùn)練過程流程圖。
圖4 訓(xùn)練過程流程圖
本文采用卷積神經(jīng)網(wǎng)絡(luò)對時間序列數(shù)據(jù)進行預(yù)測,以FD001為例,重構(gòu)后的數(shù)據(jù)片為:
(5)
卷積運算是利用卷積核對數(shù)據(jù)進行特征提取,采用共享網(wǎng)絡(luò)權(quán)值的方法降低了網(wǎng)絡(luò)復(fù)雜度,提升訓(xùn)練速度。若采用卷積核u,大小為k×1。
u=(u1,u2,…,uK)
(6)
若該卷積核提取的數(shù)據(jù)為p,大小為1×k。
p=(ai,j,ai+1,j,…,ai+k-1,j)T
(7)
卷積結(jié)果為:
Ci=φ(up-b)
(8)
式中:φ為激活函數(shù),一般采用非線性函數(shù);b為偏置;p為感受野,長度為k,經(jīng)過多層卷積,將結(jié)果輸入到全連接層,得到結(jié)果與真實值差值,采用梯度下降算法更新網(wǎng)絡(luò)權(quán)值。
本文使用卷積神經(jīng)網(wǎng)絡(luò)分為7層(包括5個卷積層,2個全連接層),深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。本文選擇2種卷積核,大小分別為(10,1)和(3,1),池化層選擇最大池化,大小為(2,2),每層添加dropout()操作,防止產(chǎn)生過擬合。激活函數(shù)統(tǒng)一采用Relu()函數(shù)。
圖5 深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文采用雙通道網(wǎng)絡(luò)結(jié)構(gòu)對不同的特征進行訓(xùn)練,采用壽命衰減起始點判斷方法對2種壽命衰減過程進行區(qū)分,將壽命衰減前、壽命衰減中2種特征作為雙通道網(wǎng)絡(luò)模型的輸入。相較于單通道網(wǎng)絡(luò)模型,能保留更多數(shù)據(jù),提高預(yù)測精度。雙通道網(wǎng)絡(luò)模型結(jié)構(gòu)如圖6所示。
圖6 多通道網(wǎng)絡(luò)模型
按照前面的模型結(jié)構(gòu)在Intel I7-10750H,2.6 GHz CPU,16 GiB RAM,NVIDA GEFORCE RTX 2070 GPU,Pytorch 1.81的環(huán)境下搭建CNN結(jié)構(gòu)。
使用卡爾曼濾波對傳感器數(shù)據(jù)進行降噪,以train_FD004為例,降噪前的傳感器參數(shù)值如圖7(a)所示,降噪后的傳感器參數(shù)值如圖7(b)所示。
圖7 降噪前后train_FD004中傳感器參數(shù)值
對降噪后的數(shù)據(jù)進行重構(gòu),將重構(gòu)后的train_FD001~FD004作為訓(xùn)練集訓(xùn)練網(wǎng)絡(luò)權(quán)值,將重構(gòu)后的test_FD001~FD004作為測試集得到預(yù)測結(jié)果。
進行誤差分析時通常采用回歸評價標(biāo)準(zhǔn)均方根誤差(root mean square error, RMSE,公式中簡寫為ERMS),如式(9)所示:
(9)
相對預(yù)測誤差Err,如式(10)所示:
(10)
該評價標(biāo)準(zhǔn)很好地反映了觀測值同真實值之間的偏差,值越小就說明偏差越小。
此外,得分可以反映該模型超前或者滯后預(yù)測的程度,因此,在進行評價時,要將得分函數(shù)sf也作為評價標(biāo)準(zhǔn)之一。在RMSE相同時,得分函數(shù)越小,說明RUL預(yù)測結(jié)果偏向于預(yù)測值小于真實值,符合航空發(fā)動機RUL預(yù)測問題特性[14],單個預(yù)測結(jié)果的得分s的計算如式(11)所示,得分函數(shù)sf計算如式(12)所示:
(11)
(12)
式中:m為數(shù)據(jù)量;yi true為真實值;yi predict為預(yù)測值;t為該航空發(fā)動機總壽命。
將數(shù)據(jù)輸入到卷積神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,迭代20次,并使用訓(xùn)練后的數(shù)據(jù)進行預(yù)測,以數(shù)據(jù)集FD004為例,預(yù)測誤差分布直方圖(預(yù)測值-真實值)如圖8所示。
圖8 預(yù)測誤差直方圖
從預(yù)測誤差分布直方圖可以看出在數(shù)據(jù)集FD004中41 214條數(shù)據(jù)的預(yù)測誤差范圍在-20~10之間,其中大部分誤差小于0,表示本方法預(yù)測結(jié)果偏向于預(yù)測值小于真實值。在航空發(fā)動機壽命預(yù)測角度上,預(yù)測值小于真實值帶來的安全隱患較小,符合航空發(fā)動機壽命預(yù)測問題特性。
從test_FD004中隨機選取4個航空發(fā)動機作為測試樣本,降噪前預(yù)測值和真實值對比如圖9所示。降噪后預(yù)測值和真實值對比如圖10所示。
圖9 降噪前FD004中樣本航空發(fā)動機的預(yù)測結(jié)果
圖10 降噪后FD004中樣本航空發(fā)動機的預(yù)測結(jié)果
圖9和圖10中對比了降噪前后預(yù)測結(jié)果的差異,說明了降噪之后可以有效減少數(shù)據(jù)噪聲帶來的影響。預(yù)測開始時,誤差相對較大,是由于模型帶來的誤差,經(jīng)過迭代,預(yù)測的誤差相對較小。
同理,對FD001和FD003數(shù)據(jù)進行預(yù)測,取5次實驗結(jié)果的平均值,數(shù)據(jù)集FD003的sf和ERMS指標(biāo)和其他方法[15]的對比如表3所示。
數(shù)據(jù)集FD001和FD003的相關(guān)指標(biāo)和其他算法[15]的對比如表4所示。
從表3中可以看出,數(shù)據(jù)量的大小不會引起兩項指標(biāo)的大幅變化,分布比較均勻。
表4中pn表示預(yù)測相對誤差小于或等于n的樣本百分比,在樣本大小相同時,p5越大,預(yù)測表現(xiàn)越好。p5相等時,p10越大,預(yù)測表現(xiàn)越好,以此類推。
本方法在數(shù)據(jù)量較多時,預(yù)測結(jié)果明顯優(yōu)于其他方法,當(dāng)剩余周期次數(shù)大于20時,sf和ERMS兩項指標(biāo)均優(yōu)于其他方法,原因在于本方法預(yù)測結(jié)果偏向于預(yù)測值小于真實值,計算sf時較有優(yōu)勢。符合航空發(fā)動機壽命預(yù)測問題特性,驗證了該方法在航空發(fā)動機RUL預(yù)測上具有顯著優(yōu)勢。
表3 數(shù)據(jù)集FD003的評價結(jié)果對比
表4 數(shù)據(jù)集FD001和FD003的評價結(jié)果對比
本文針對航空發(fā)動機RUL難以準(zhǔn)確預(yù)測的問題,提出了TCDCNN方法,通過對2種壽命衰減模型進行分類,實現(xiàn)C-MAPSS渦輪風(fēng)扇發(fā)動機壽命退化數(shù)據(jù)的預(yù)測,并與其他算法的預(yù)測結(jié)果進行比較分析,驗證了該方法在測試數(shù)據(jù)范圍較大時,可以更加準(zhǔn)確地判斷航空發(fā)動機壽命衰減起始點和RUL,進一步提高預(yù)測準(zhǔn)確度。決策者可以根據(jù)預(yù)測結(jié)果,及時地做出有效的維修決策,防止剩余使用壽命浪費和因航空發(fā)動機故障而導(dǎo)致其他部件的損壞,以提高壽命利用率、降低維修成本和事故頻率。