徐建新,侯振華
(中國(guó)民航大學(xué)航空工程學(xué)院,天津 300300)
基于集成ELM模型的航空發(fā)動(dòng)機(jī)性能參數(shù)預(yù)測(cè)
徐建新,侯振華
(中國(guó)民航大學(xué)航空工程學(xué)院,天津 300300)
為預(yù)測(cè)航空發(fā)動(dòng)機(jī)性能參數(shù),提出了一種動(dòng)態(tài)集成極端學(xué)習(xí)機(jī)模型。采用AdaBoost.RT集成算法對(duì)極端學(xué)習(xí)機(jī)(ELM)進(jìn)行集成,并針對(duì)AdaBoost.RT集成算法中固定閾值的局限性,采用自適應(yīng)動(dòng)態(tài)調(diào)整閾值的方法來(lái)提高預(yù)測(cè)精度。通過(guò)比較前后兩次迭代的均方根誤差(RMSE)的大小,對(duì)閾值進(jìn)行調(diào)整。最后,以排氣溫度裕度為預(yù)測(cè)參數(shù),使用動(dòng)態(tài)集成ELM模型對(duì)其進(jìn)行預(yù)測(cè),并與單一ELM模型和原始集成ELM模型進(jìn)行比較。結(jié)果表明:改進(jìn)模型的預(yù)測(cè)結(jié)果好于其他模型,更適合航空發(fā)動(dòng)機(jī)性能參數(shù)預(yù)測(cè)。
航空發(fā)動(dòng)機(jī);性能參數(shù);預(yù)測(cè);AdaBoost.RT;極端學(xué)習(xí)機(jī)
航空發(fā)動(dòng)機(jī)長(zhǎng)年工作在高溫、高壓及高載荷的環(huán)境下,其性能會(huì)隨著飛行循環(huán)的累積而逐漸衰退。如果能準(zhǔn)確掌握發(fā)動(dòng)機(jī)的性能衰退規(guī)律,將會(huì)為航空公司制定科學(xué)、有效的維修方案提供極大的科學(xué)依據(jù),這對(duì)于航空公司降低維修成本、提高市場(chǎng)競(jìng)爭(zhēng)力具有重大意義。
在目前的發(fā)動(dòng)機(jī)性能分析中,氣路參數(shù)分析仍是一種重要方法。盡管航空發(fā)動(dòng)機(jī)具有多個(gè)性能監(jiān)測(cè)參數(shù),但排氣溫度裕度(EGTM,exhaust gas temperature margin)是最能反映發(fā)動(dòng)機(jī)運(yùn)行狀態(tài)的性能參數(shù)之一。對(duì)連續(xù)航班的EGTM參數(shù)進(jìn)行預(yù)測(cè)分析,有助于判斷航空發(fā)動(dòng)機(jī)的后續(xù)工作性能。目前,人工神經(jīng)網(wǎng)絡(luò)(ANN,artificial neural network)由于其良好的非線性預(yù)測(cè)能力而被廣泛應(yīng)用到航空發(fā)動(dòng)機(jī)性能參數(shù)的預(yù)測(cè)中[1-2]。然而,基于ANN的預(yù)測(cè)模型存在網(wǎng)絡(luò)參數(shù)難以確定、極易陷入局部最優(yōu)等問(wèn)題。
為解決單一ANN建模存在的問(wèn)題,文獻(xiàn)[3]證明可將多個(gè)次優(yōu)的弱學(xué)習(xí)機(jī)通過(guò)集成算法得到效果優(yōu)越的強(qiáng)學(xué)習(xí)機(jī)。其中研究最多且前景良好的集成算法有Boosting和Bagging及其衍生算法。因此,本文采用一種針對(duì)回歸問(wèn)題設(shè)計(jì)的AdaBoost.RT集成算法,相對(duì)于ANN模型參數(shù)設(shè)置較松弛,該模型的預(yù)測(cè)精度明顯高于單一ANN模型[4]??紤]到極端學(xué)習(xí)機(jī)學(xué)習(xí)速度快、泛化性能好等優(yōu)點(diǎn),采用其作為弱學(xué)習(xí)機(jī)組建集成預(yù)測(cè)模型并且采用自適應(yīng)動(dòng)態(tài)閾值代替Ada-Boost.RT集成算法中的固定閾值。將該方法運(yùn)用到航空發(fā)動(dòng)機(jī)的性能參數(shù)預(yù)測(cè),取得了比較滿(mǎn)意的結(jié)果。
近年來(lái),Huang等[5]針對(duì)單隱層前饋神經(jīng)網(wǎng)絡(luò)(SLFNs,single-hidden layer feedforward neural networks)常見(jiàn)算法中存在的問(wèn)題提出了ELM算法。在ELM算法中,可以任意給定輸入權(quán)值和隱層神經(jīng)元的激勵(lì)閾值,并計(jì)算得到輸出權(quán)值,因此,ELM并不需要復(fù)雜冗長(zhǎng)的迭代過(guò)程便可直接得到最優(yōu)解。
設(shè)有N個(gè)樣本(xi,ti),其中
其中:wi=[wi1,wi2,…,win]T表示連接隱層第i個(gè)神經(jīng)元與輸入層神經(jīng)元的權(quán)向量;βi=[βi1,βi2,…,βim]T表示連接隱層的i個(gè)神經(jīng)元與輸出層神經(jīng)元的權(quán)向量;oj= [oj1,oj2,…,ojm]T為SLFNs的輸出向量;bi表示隱層第i個(gè)神經(jīng)元的閾值。若此SLFNs能以0誤差逼近上述N個(gè)樣本,則可表示為,利用矩陣的形式表示為
其中
其最小范數(shù)解為
其中:H+為矩陣H的Moore-Penrose廣義逆。綜上可以看出,ELM算法只需一次矩陣計(jì)算便可使輸出權(quán)值絕對(duì)值最小,不僅節(jié)省了運(yùn)算時(shí)間而且獲得了最小訓(xùn)練誤差。
為使ELM的預(yù)測(cè)精度提高,使用AdaBoost.RT集成算法對(duì)ELM進(jìn)行集成。并提出一種自適應(yīng)動(dòng)態(tài)閾值的方法來(lái)克服原有算法的缺點(diǎn),進(jìn)一步提高了集成模型的精度。
2.1 AdaBoost.RT集成算法
AdaBoost算法是Boosting改進(jìn)算法中最具代表性的一種,為了解決回歸問(wèn)題,Shrestha和Solomatine[4,6]提出了基于AdaBoost算法的AdaBoost.RT集成學(xué)習(xí)算法。其中,R代表回歸(Regression),T代表閾值(Threshold)。此算法通過(guò)引入一個(gè)固定閾值φ而將回歸問(wèn)題轉(zhuǎn)化為二分類(lèi)問(wèn)題,使之可以用AdaBoost集成算法框架進(jìn)行模型建立。AdaBoost.RT算法的具體流程如下。
步驟1 對(duì)于一組N個(gè)時(shí)間序列樣本{z1,z2,…,zN},選擇合適的嵌入維數(shù)m對(duì)其進(jìn)行相空間重構(gòu),生成n=N-m個(gè)用于模型訓(xùn)練的輸入輸出樣本,即
選取合適的最大迭代次數(shù)T和閾值φ;確定一組弱學(xué)習(xí){f1(x),f2(x),…,fp(x)},若每次迭代只訓(xùn)練一個(gè)弱學(xué)習(xí)機(jī),則p=T。
步驟2 設(shè)置初次迭代次數(shù)t=1;樣本的初始權(quán)值均為Dt(i)=1/n;誤差率εt=0。
步驟3 當(dāng)前迭代t≤T:
1)根據(jù)權(quán)值分布Dt對(duì)樣本進(jìn)行取樣,用此樣本集訓(xùn)練弱學(xué)習(xí)機(jī),建立回歸模:ft(x)→y,并計(jì)算每個(gè)樣本的相對(duì)誤差(ARE,absolute relative error),即
計(jì)算弱學(xué)習(xí)機(jī)ft(x)的誤差率
3)更新樣本權(quán)值Dt
其中:Zt為標(biāo)準(zhǔn)化因子。
4)設(shè)置t=t+1。
步驟4 輸出結(jié)果
AdaBoost.RT的突出特點(diǎn)是引入一個(gè)固定的閾值φ用來(lái)判斷預(yù)測(cè)值的正確與否。如果某個(gè)樣本的ARE大于φ,則預(yù)測(cè)結(jié)果被認(rèn)為是錯(cuò)誤的,反之就是正確的。而誤差率εt的計(jì)算是由正確和錯(cuò)誤預(yù)測(cè)值的數(shù)量決定的,根據(jù)計(jì)算流程可知,閾值φ也將間接影響權(quán)值更新參數(shù)和下一次迭代的采樣方式。所以,Ada-Boost.RT集成算法的預(yù)測(cè)性能將在很大程度上取決于閾值φ的選取。文獻(xiàn)[7-8]的實(shí)驗(yàn)也表明預(yù)測(cè)結(jié)果對(duì)于φ的選取非常敏感。若φ取值太小,將會(huì)很難獲得足夠的正確預(yù)測(cè)樣本;若φ取值太大,則很可能只產(chǎn)生很少一部分困難樣本,而這些困難樣本極有可能是混在樣本中的奇異值,從而對(duì)訓(xùn)練樣本產(chǎn)生過(guò)擬合。這樣不僅影響集成學(xué)習(xí)機(jī)的預(yù)測(cè)結(jié)果,而且會(huì)使算法不穩(wěn)定。
2.2 改進(jìn)的AdaBoost.Rt算法
由于在AdaBoost.RT集成算法中,閾值φ的選取會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生極大的波動(dòng),因此提出一種自適應(yīng)動(dòng)態(tài)閾值的方法,用來(lái)改善原有算法中受參數(shù)選擇影響的局限。改進(jìn)算法的設(shè)計(jì)思想是:計(jì)算每次迭代輸出的均方根誤差(這里用et表示),若當(dāng)前迭代的et大于前一次迭代的et-1,當(dāng)前閾值φ將會(huì)增大;反之則會(huì)減小。根據(jù)Solomatine[6]的研究可知,當(dāng)閾值φ在0~0.4之間時(shí),集成學(xué)習(xí)機(jī)是穩(wěn)定的,當(dāng)閾值φ到達(dá)0.4附近時(shí),集成學(xué)習(xí)機(jī)由于過(guò)擬合和噪音等問(wèn)題開(kāi)始變得不穩(wěn)定[9]。因此,在AdaBoost.RT集成算法開(kāi)始時(shí),選擇0.2為初始閾值。自適應(yīng)動(dòng)態(tài)閾值的改進(jìn)方法具體如下。
1)計(jì)算每一次迭代輸出的均方根誤差,即
2)當(dāng)et<et-1時(shí),閾值減小,相反,當(dāng)et>et-1時(shí),閾值增加。具體變化如下
其中:λ為RMSE的變化率,即
航空發(fā)動(dòng)機(jī)有許多性能指標(biāo),其中表征發(fā)動(dòng)機(jī)健康狀態(tài)最重要的性能指標(biāo)是排氣溫度裕度(EGTM)[10-11]。隨著飛行時(shí)間的增加,EGTM會(huì)逐漸衰減,達(dá)到或接近手冊(cè)規(guī)定的紅線值就必須對(duì)發(fā)動(dòng)機(jī)進(jìn)行維修。發(fā)動(dòng)機(jī)的紅線值取決于熱部件的材料和熱部件冷卻性能,而實(shí)際EGTM則與發(fā)動(dòng)機(jī)核心機(jī)尺寸和氣動(dòng)效率相關(guān),隨著在翼時(shí)間的增加,發(fā)動(dòng)機(jī)核心部件的氣動(dòng)效率降低,從而導(dǎo)致整機(jī)性能的衰退。利用本文提出的模型對(duì)EGTM時(shí)間序列進(jìn)行預(yù)測(cè),可以監(jiān)測(cè)發(fā)動(dòng)機(jī)的健康狀況。
本文采用國(guó)內(nèi)某航空公司B737-800飛機(jī)裝配的CFM56-7B發(fā)動(dòng)機(jī)2年多的QAR監(jiān)控?cái)?shù)據(jù),對(duì)其進(jìn)行解碼修正后的數(shù)據(jù)如圖1所示。
圖1 EGTM檢測(cè)值序列Fig.1 EGTM detection value sequence
從圖1可以看出發(fā)動(dòng)機(jī)的衰退特征:①在發(fā)動(dòng)機(jī)剛投入使用的 3 000個(gè)飛行小時(shí)里,發(fā)動(dòng)機(jī)衰退較為明顯,這是因?yàn)榘l(fā)動(dòng)機(jī)各部件處于初始磨合期;②在之后的3 000~15 000個(gè)飛行小時(shí)里,各部件磨合結(jié)束,部分部件出現(xiàn)輕微磨損,發(fā)動(dòng)機(jī)進(jìn)入正常衰退期;③15 000飛行小時(shí)后,發(fā)動(dòng)機(jī)有些部件已有較大磨損和老化,性能衰退較快,甚至超過(guò)初始磨合期。
由于數(shù)據(jù)量過(guò)于龐大,抽取一部分作為建模樣本。考慮到EGTM的特點(diǎn),以10個(gè)飛行循環(huán)為間隔對(duì)數(shù)據(jù)源取樣,剔除粗大誤差后得到一組排氣溫度裕度數(shù)據(jù),記作采用EGTM序列前8個(gè)數(shù)據(jù)預(yù)測(cè)第9個(gè)數(shù)據(jù),由此構(gòu)建235個(gè)樣本,取前200個(gè)樣本作為訓(xùn)練樣本,后35個(gè)樣本作為測(cè)試樣本。
為了比較,采用單個(gè)ELM模型、基于原始Ada-Boost.RT算法的集成ELM模型和基于自適應(yīng)閾值A(chǔ)daBoost.RT算法的集成ELM模型分別預(yù)測(cè)。為了方便起見(jiàn),將上述模型分別記為SELM、OBoost和DBoost。其中對(duì)于SELM模型,經(jīng)過(guò)試探確定節(jié)點(diǎn)結(jié)構(gòu)為8-23-1。OBoost模型和DBoost模型迭代次數(shù)T經(jīng)試驗(yàn)確定為10,閾值設(shè)為0.2,弱學(xué)習(xí)機(jī)ELM的參數(shù)設(shè)置與SLEM相同。
3種模型對(duì)EGTM的預(yù)測(cè)結(jié)果分別如圖2~圖4所示,預(yù)測(cè)誤差如表1所示。
圖2 SELM模型預(yù)測(cè)結(jié)果Fig.2 SLEM model prediction results
圖3 OBoost模型預(yù)測(cè)結(jié)果Fig.3 OBoost model prediction results
圖4 DBoost模型預(yù)測(cè)結(jié)果Fig.4 DBoost model prediction results
表1 不同模型的預(yù)測(cè)誤差Tab.1 Prediction error of different models
從上述圖表可以看出,在對(duì)EGTM時(shí)間序列的預(yù)測(cè)上,兩種ELM集成模型的預(yù)測(cè)結(jié)果要優(yōu)于單一ELM模型,說(shuō)明集成算法具有良好的預(yù)測(cè)性能。對(duì)于兩種集成模型OBoost和DBoost,除了最大相對(duì)誤差稍微大點(diǎn),DBoost模型的其余誤差都要明顯低于OBoost模型。綜上所述,本文采用的動(dòng)態(tài)閾值A(chǔ)da-Boost.RT算法對(duì)于集成模型的預(yù)測(cè)結(jié)果有顯著提高。進(jìn)而也可以認(rèn)為,本文提出的模型更適合發(fā)動(dòng)機(jī)機(jī)性能參數(shù)的預(yù)測(cè)。
提出一種以AdaBoost.Rt算法為集成框架的ELM模型,并以此模型對(duì)航空發(fā)動(dòng)機(jī)性能參數(shù)進(jìn)行預(yù)測(cè)??紤]到閾值選取對(duì)預(yù)測(cè)結(jié)果的影響,本文采用自適應(yīng)動(dòng)態(tài)閾值的方法來(lái)克服原始集成算法的局限性。另一方面,ELM比其他傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更加簡(jiǎn)單且學(xué)習(xí)速度更快,因此,以ELM作為弱學(xué)習(xí)機(jī)來(lái)構(gòu)建集成模型。
在對(duì)航空發(fā)動(dòng)機(jī)性能參數(shù)進(jìn)行預(yù)測(cè)時(shí),集成ELM模型的預(yù)測(cè)精度要比單一ELM模型的預(yù)測(cè)精度高,且本文采用的改進(jìn)集成ELM模型相對(duì)于原始集成ELM模型具有更好的預(yù)測(cè)結(jié)果。同時(shí),本文所提模型也可用于燃油流量、振動(dòng)信號(hào)等發(fā)動(dòng)機(jī)性能參數(shù)的預(yù)測(cè)。
[1]丁 剛,徐敏強(qiáng),侯立國(guó).基于過(guò)程神經(jīng)網(wǎng)絡(luò)的航空發(fā)動(dòng)機(jī)排氣溫度預(yù)測(cè)[J].航空動(dòng)力學(xué)報(bào),2009,24(5):1035-1039.
[2]劉永建,朱劍英,曾 捷.改進(jìn)BP神經(jīng)網(wǎng)絡(luò)在發(fā)動(dòng)機(jī)性能趨勢(shì)分析和故障診斷中的應(yīng)用[J].南京理工大學(xué)學(xué)報(bào),2010,34(1):24-29.
[3]SCHAPIRE R E.The strength of weak learnability[J].Machine Learning,1990,5(2):197-227.
[4]SOLOMATINE D P,SHRESTHA D L.AdaBoost.RT:A Boosting Algorithm for Regression Problems[C]//IEEE International Joint Conference on Neural Networks.IEEE,2004,2:1163-1168.
[5]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.
[6]SHRESTHA D L,SOLOMATINE D P.Experiments with AdaBoost.RT, an improved boosting scheme for regression[J].Neural Computation, 2006,18(7):1678-1710.
[7]LIU S,XU J,ZHAO J,et al.Efficiency enhancement of a process-based rainfall-runoff model using a new modified AdaBoost.RT technique[J].Applied Soft Computing,2014,23(5):521-529.
[8]查 翔,倪世宏,張 鵬.關(guān)于AdaBoost.RT集成算法時(shí)間序列預(yù)測(cè)研究[J].計(jì)算機(jī)仿真,2015,32(9):391-394.
[9]TIAN H X,MAO Z Z.An ensemble ELM based on modified AdaBoost.RT algorithm for predicting the temperature of molten steel in ladle rurnace[J].IEEE Transactions on Automation Science&Engineering, 2010,7(1):73-80.
[10]周茂軍.考慮性能衰退的航空發(fā)動(dòng)機(jī)總體性能裕度設(shè)計(jì)研究[J].航空動(dòng)力學(xué)報(bào),2008,23(10):1868-1874.
[11]呂永樂(lè),郎榮玲,路 輝,等.航空發(fā)動(dòng)機(jī)性能參數(shù)聯(lián)合RBFPN和FAR預(yù)測(cè)[J].北京航空航天大學(xué)學(xué)報(bào),2010,36(2):131-134.
(責(zé)任編輯:劉佩佩)
Aircraft engine performance parameter prediction based on ensemble ELM model
XU Jianxin,HOU Zhenhua
(College of Aeronautical Engineering,CAUC,Tianjin 300300,China)
In order to predict performance parameters of aircraft engine accurately,a dynamic ensemble extreme learning machine(ELM)model is proposed.Ada Boost.RT algorithm is used to integrate ELM to construct the ensemble model.Aiming at the limitation of static threshold in original AdaBoost.RT algorithm,a self-adaptive and dynamic adjusting method is used to improve the forecasting precision.A given method makes adjustments to the threshold by comparing RMSE of two neighboring iterations.Finally,compared with single ELM model and original ensemble ELM model,dynamic ensemble ELM model is used to predict EGTM.Results show that the improved model is better than other models for the performance parameters prediction of aircraft engine.
aircraft engine;performance parameters;prediction;AdaBoost.RT;extreme learning machine
V235.13
A
1674-5590(2017)02-0020-04
2016-10-21;
2016-12-22
徐建新(1967—),男,江蘇蘇州人,教授,博士,研究方向?yàn)閺?fù)合材料結(jié)構(gòu)力學(xué).