徐竟耕,曾 力
(重慶交通大學(xué)機(jī)電與車(chē)輛工程學(xué)院,重慶 400074)
作為航空燃?xì)廨啓C(jī)的基本部件,壓氣機(jī)對(duì)空氣的流通運(yùn)送起著至關(guān)重要的作用,其功能為:先對(duì)空氣進(jìn)行減速增壓,再向燃燒室里不斷輸入高壓空氣,以提高氣流的膨脹功,使整個(gè)發(fā)動(dòng)機(jī)系統(tǒng)的熱效率得到增強(qiáng)[1-2]。流量系數(shù)不僅是衡量壓氣機(jī)空氣流通能力的重要指標(biāo),也是直接影響燃?xì)廨啓C(jī)數(shù)字化建模精度的重要參數(shù)。當(dāng)計(jì)算流量系數(shù)時(shí),需要根據(jù)已知的燃?xì)廨啓C(jī)實(shí)驗(yàn)數(shù)據(jù)來(lái)建立插值模型,但實(shí)驗(yàn)數(shù)據(jù)的獲取成本卻較高。因此,如何利用有限的實(shí)驗(yàn)數(shù)據(jù),借助合適的建模方法構(gòu)造出高精度的插值模型便成為最值得研究的問(wèn)題之一[3-4]。
目前的壓氣機(jī)特性建模方法都存在對(duì)流量系數(shù)的預(yù)測(cè)精度不高的問(wèn)題[5-6]。為了優(yōu)化插值模型,提高預(yù)測(cè)精度:陳輝等在Kriging 插值法的基礎(chǔ)上,建立了符合壓氣機(jī)流量特性的插值模型,探索了相關(guān)模型和參數(shù)初值的選取對(duì)最終結(jié)果的影響[7];尹大偉、李本威等根據(jù)壓氣機(jī)的流量特性和效率特性,在原有模型基礎(chǔ)上進(jìn)行了重新構(gòu)造[8];Ghorbanian K and Gholamrezaei M等通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),雖然BP神經(jīng)網(wǎng)絡(luò)對(duì)壓氣機(jī)特性的預(yù)測(cè)效果較好,但卻難以確定合適的網(wǎng)絡(luò)結(jié)構(gòu),最終導(dǎo)致出現(xiàn)“欠擬合”或“過(guò)擬合”的現(xiàn)象[9];涂環(huán)、趙勇和李本威等選擇了QPSO 算法,在Kriging 相關(guān)模型的基礎(chǔ)上,在全局尋找最優(yōu)參數(shù)[10],通過(guò)該方法,優(yōu)化了基于梯度的模式搜索法,使其不再須要考慮參數(shù)初始值。
上述方法雖都可提高計(jì)算壓氣機(jī)流量系數(shù)的模型精度,但卻未考慮到Kriging 插值模型的不足,即樣本庫(kù)里的換算轉(zhuǎn)速與待預(yù)測(cè)數(shù)據(jù)的換算轉(zhuǎn)速的數(shù)值相差較大時(shí),是無(wú)法得到高精度計(jì)算結(jié)果的。另外,這些方法也未考慮在到利用設(shè)計(jì)空間中樣本點(diǎn)的分布與模型精度的關(guān)系來(lái)提高預(yù)測(cè)精度的同時(shí)節(jié)省樣本點(diǎn)。
因此,本文采用了1 種基于垂距的多點(diǎn)取樣算法。將垂距、預(yù)測(cè)標(biāo)準(zhǔn)差等參數(shù)作為篩選標(biāo)準(zhǔn),再結(jié)合高斯函數(shù),篩選出更具有代表性的樣本點(diǎn),以此建立Kriging插值模型,該算法可以在全局和局部范圍內(nèi)提高模型精度。實(shí)際結(jié)果表明,使用該方法構(gòu)建模型時(shí),需要的樣本點(diǎn)數(shù)減少近30%。待預(yù)測(cè)數(shù)據(jù)與樣本庫(kù)的換算轉(zhuǎn)速不同時(shí),對(duì)比傳統(tǒng)Kriging 插值模型,精度提升近10%。
Kriging插值法是通過(guò)對(duì)樣本賦予權(quán)重,通過(guò)加權(quán)線(xiàn)性組合的辦法對(duì)目標(biāo)估值,同時(shí)滿(mǎn)足無(wú)偏估計(jì)要求,且滿(mǎn)足估計(jì)方差最小[11]。結(jié)合壓氣機(jī)特性,建立Kriging插值模型,首先定義輸入與輸出向量。
輸入的樣本向量如下:換算轉(zhuǎn)速為
增壓比為
輸出的樣本向量如下:
流量系數(shù)為
換算轉(zhuǎn)速和增壓比作為模型輸入,記為
對(duì)應(yīng)的模型輸出為流量系數(shù),記為
模型的輸出與輸入變量可表示為[12]
式(6)中:fT(x)β是回歸模型,被稱(chēng)為定性漂移;fT(x)是p階線(xiàn)性多項(xiàng)式的回歸模型集合,f(x)=[f1(x)f2(x)…fp(x)]T;β是 回 歸 模 型 系 數(shù),β= [β1β2…βq]|p×q。回歸模型的理論概念為在設(shè)計(jì)空間上的全局近似。多項(xiàng)式的階次大多數(shù)情況下選擇為0階(常數(shù))模型[13]。
z(x)為一隨機(jī)函數(shù),且滿(mǎn)足:
式(8)中:R代表相關(guān)系數(shù)矩陣;矩陣中的元素r是衡量2 個(gè)不同的樣本點(diǎn)之間距離的函數(shù),它用來(lái)表征輸入變量之間的空間相關(guān)性,即:
式(9)中:N為輸入變量中元素的個(gè)數(shù);xki、xkj分別是輸入向量xi、xj的第k個(gè)分量[14],k=1,2,…,N;Rk(θk,dk)為相關(guān)函數(shù),常用的相關(guān)模型有球狀模型、指數(shù)模型、線(xiàn)性模型和高斯模型。本文選擇高斯函數(shù)來(lái)確定輸入變量之間的相關(guān)性,其形式如下[15]:
將式(6)代入式(5),所以模型輸出向量根據(jù)計(jì)算可以表示為:
式(11)記為:
設(shè)待估計(jì)點(diǎn)為xnew,則待估計(jì)的輸出點(diǎn)為:
c為樣本點(diǎn)的權(quán)重向量,由于無(wú)偏估計(jì)要求,所以E[y?(xnew)-y(xnew)]=0,通過(guò)構(gòu)造拉格朗日算子,代入式(14),可得估計(jì)值及回歸系數(shù)β*的表達(dá)式,即:
式(15)中,γ*=R-1(Y-Fβ*)。
估計(jì)值的方差為:
在選點(diǎn)的過(guò)程中,首先需要全局尋找不確定性較大的數(shù)據(jù)點(diǎn)[16],還須要結(jié)合曲線(xiàn)特征,精確地反映曲線(xiàn)的曲率大小?;诖咕嗟亩帱c(diǎn)取樣算法便考慮到了以上2點(diǎn)[17]。選擇樣本曲線(xiàn)上的某1個(gè)單點(diǎn),計(jì)算該點(diǎn)與相鄰2 點(diǎn)連線(xiàn)的垂距,通過(guò)判斷垂距大小的方式來(lái)完成初步選點(diǎn),再結(jié)合預(yù)測(cè)不確定性的思想,進(jìn)行第2次篩選。在換算轉(zhuǎn)速相同的情況下,每1 個(gè)增壓比都會(huì)存在1 個(gè)與之對(duì)應(yīng)的流量系數(shù),即它們之間存在一一對(duì)應(yīng)的關(guān)系,所以,在保持換算轉(zhuǎn)速不變的情況下,可以只根據(jù)增壓比和流量系數(shù)來(lái)計(jì)算垂距,進(jìn)而將原本的三維樣本空間簡(jiǎn)化為二維樣本空間。在計(jì)算之前,要根據(jù)現(xiàn)有的樣本數(shù)據(jù)建立初始樣本點(diǎn)集{ }O和基礎(chǔ)點(diǎn)集{M},建立Kriging 插值模型來(lái)判斷點(diǎn)集{O}是否滿(mǎn)足目標(biāo)精度,然后再使用取樣算法對(duì){M}進(jìn)行選點(diǎn),篩選出的樣本點(diǎn)組成1個(gè)新的樣本點(diǎn)集{ }A,將點(diǎn)集{ }A加入到初始樣本點(diǎn)集{ }O中。重復(fù)以上步驟,一直往初始樣本點(diǎn)集{ }O中加點(diǎn),直到Kriging 插值模型能達(dá)到預(yù)期的精度要求。基本流程圖,如圖1所示。
Synthesis, properties and industrial applications of amino acid surfactants 12 5
圖1 基于垂距的多點(diǎn)采樣算法流程Fig.1 Flow chart of multipoint sampling algorithm based on vertical distance
步驟1:在某一相同的換算轉(zhuǎn)速nm下,壓氣機(jī)增壓比和流量系數(shù)之間的關(guān)系是一一對(duì)應(yīng)的,即有
其中,t表示在這一換算轉(zhuǎn)速下,流量系數(shù)與增壓比的樣本數(shù)量。m為換算轉(zhuǎn)速的樣本數(shù)量。建立初始樣本點(diǎn)集{ }O,則剩余的樣本點(diǎn)組成點(diǎn)集i=0,1,2,…}。使用當(dāng)前的點(diǎn)集來(lái)建立Kriging 插值模型,提取出誤差最小的點(diǎn)Mk。集合M的式子為:
步驟2:依次檢測(cè)當(dāng)前換算轉(zhuǎn)速下的樣本點(diǎn)的數(shù)量是否大于等于3。如果是,則當(dāng)前換算轉(zhuǎn)速下的所有樣本點(diǎn)進(jìn)行步驟3;如果否,則對(duì)下一個(gè)換算轉(zhuǎn)速下的樣本點(diǎn)數(shù)量進(jìn)行檢測(cè)。
步驟3:連接Mi-1,Mi+1,計(jì)算點(diǎn)Mi到Mi-1Mi+1連線(xiàn)的距離D。式(19)為D的計(jì)算公式:
D值的高低能夠準(zhǔn)確地體現(xiàn)曲線(xiàn)在這一點(diǎn)的彎曲程度,找到合適的垂距閾值d,檢測(cè)D與d的大小關(guān)系。如果D>d,進(jìn)行步驟4;如果D<d,進(jìn)行步驟5。
步驟4:將Mi以及該換算轉(zhuǎn)速下的首尾2 點(diǎn)提取到另一新建空點(diǎn)集{N},進(jìn)行第5步。
步驟5:將Mi在點(diǎn)列中后移1個(gè)點(diǎn),進(jìn)行步驟3。
圖2中:a)為基礎(chǔ)點(diǎn)集{M}組成的圖形;b)代表以垂距作為判斷標(biāo)準(zhǔn)的選點(diǎn);最后被選取的點(diǎn)組成的點(diǎn)集{N},如c)所示。將c)與a)進(jìn)行比較,可以看出留下的樣本點(diǎn)大部分都是能夠反映原始曲線(xiàn)特征的樣本點(diǎn)。
圖2 基于垂距的曲線(xiàn)采樣方法示意圖Fig.2 Schematic diagram of curve sampling method based on vertical distance
閾值d的選擇沒(méi)有明確的計(jì)算公式,也與樣本點(diǎn)集無(wú)關(guān)[18]。所以,本文在考慮閾值的取值時(shí),采用迭代法來(lái)尋找最佳閾值。
首先,根據(jù)樣本點(diǎn)的垂距判斷閾值的取值范圍。
然后,再取多個(gè)合適的初始閾值,并設(shè)置一定的間隔,間隔的取值范圍取決于不同樣本點(diǎn)的垂距之差。判斷每一次迭代的選點(diǎn)數(shù)以及最后計(jì)算結(jié)果的精度:如果在選點(diǎn)數(shù)為“0”的情況下依然沒(méi)有達(dá)到目標(biāo)精度,則須更換初始閾值或者閾值間隔,以進(jìn)行下一次迭代;如果達(dá)到目標(biāo)精度,則記錄計(jì)算結(jié)果并進(jìn)行下一次迭代。
最后,將得到的計(jì)算結(jié)果進(jìn)行比較,以篩選出最佳閾值。
根據(jù)上述流程,篩選出了能夠體現(xiàn)原始曲線(xiàn)圖形特征的樣本點(diǎn)。為了預(yù)測(cè)不確定性,須使用Kriging插值模型計(jì)算點(diǎn)集{N}中各點(diǎn)處預(yù)測(cè)值的標(biāo)準(zhǔn)差,將標(biāo)準(zhǔn)差按式(20)進(jìn)行再次篩選,篩選后得出的點(diǎn)便構(gòu)成了候選點(diǎn)集{P}。
把先前所計(jì)算出的誤差最小點(diǎn)Mk加入到{ }P里,接下來(lái)尋找{M}中與{P}相關(guān)的點(diǎn)并將它們?nèi)コ瞬襟E需要使用高斯相關(guān)函數(shù)。選取合適的判斷標(biāo)準(zhǔn)值,根據(jù)計(jì)算出的相關(guān)函數(shù)R與標(biāo)準(zhǔn)值進(jìn)行比較,以此判斷是否相關(guān)。刪去{M}中與{P}相關(guān)的點(diǎn)以后,將剩余的點(diǎn)提取到1個(gè)新的樣本集{A}中,加上初始樣本{O},最終樣本點(diǎn)集為{A+O}。
將換算轉(zhuǎn)速相同的樣本點(diǎn)記為1 組樣本,現(xiàn)有某型燃?xì)廨啓C(jī)壓氣機(jī)流量系數(shù)樣本共15組[19],每組有10個(gè)樣本點(diǎn),一共150個(gè)樣本點(diǎn)。
隨機(jī)選取1組樣本為待驗(yàn)證樣本,剩下的14組作為訓(xùn)練樣本,進(jìn)行隨機(jī)抽取3 次。分別將原始樣本點(diǎn)和基于垂距的多點(diǎn)取樣算法篩選后的樣本點(diǎn)作為Kriging插值模型的輸入。待驗(yàn)證的3組樣本點(diǎn),如表1所示。
表1 待驗(yàn)證樣本點(diǎn)Tab.1 Sample points to be validated
首先,從14組訓(xùn)練樣本中的每組隨機(jī)抽取1個(gè)樣本點(diǎn)(除首尾2 點(diǎn)),建立初始樣本點(diǎn)集{O}。剩余的126 個(gè)樣本點(diǎn)則組成基礎(chǔ)樣本點(diǎn)集{M},在此初始基礎(chǔ)樣本點(diǎn)集{M}中搜索誤差最小解,得到點(diǎn)Mk。
只有在同一換算轉(zhuǎn)速下且樣本點(diǎn)滿(mǎn)足數(shù)量大于等于3 的條件時(shí),才計(jì)算垂距。這樣便降低了原本樣本空間的維度,可以簡(jiǎn)化計(jì)算公式,提升計(jì)算效率。依次檢測(cè)給定換算轉(zhuǎn)速下的樣本點(diǎn)的數(shù)量,并設(shè)置好垂距閾值d、相關(guān)函數(shù)R等初始參數(shù)。
開(kāi)始對(duì)待驗(yàn)證樣本點(diǎn)進(jìn)行預(yù)測(cè),表2 是對(duì)3 組待驗(yàn)證樣本點(diǎn)的預(yù)測(cè)過(guò)程與結(jié)果。
預(yù)測(cè)第1 組待驗(yàn)證樣本點(diǎn),選取換算轉(zhuǎn)速等于0.331 5 的樣本點(diǎn)組,根據(jù)垂距的大小,選取的垂距閾值d依次為0.001 和0.001 5,b取值為0.1 和0.2,相關(guān)函數(shù)R判斷標(biāo)準(zhǔn)分別為0.000 1 和0.000 1,加點(diǎn)次數(shù)為2次,加點(diǎn)個(gè)數(shù)分別為76和11。
預(yù)測(cè)第2 組待驗(yàn)證樣本點(diǎn),選取換算轉(zhuǎn)速等于0.529 2 的樣本點(diǎn)組,根據(jù)垂距的大小,選取的垂距閾值d依次為0.001和0.002,b取值為0.35和0.45,相關(guān)函數(shù)R判斷標(biāo)準(zhǔn)分別為0.1和0.2,加點(diǎn)次數(shù)為2次,加點(diǎn)個(gè)數(shù)分別為75和35。
預(yù)測(cè)第3 組待驗(yàn)證樣本點(diǎn),選取換算轉(zhuǎn)速等于0.847 8 的樣本點(diǎn)組,根據(jù)垂距的大小,選取的垂距閾值d依次為0.001、0.001 5、0.002 和0.002 5,b取值分別為0.1、0.2、0.3 和0.4,相關(guān)函數(shù)R判斷標(biāo)準(zhǔn)分別為0.000 1、0.000 12、0.000 14 和0.000 16,加點(diǎn)次數(shù)為4次,加點(diǎn)個(gè)數(shù)分別為74、10、4和3。
最后,驗(yàn)證選點(diǎn)后的模型精度,并與選點(diǎn)前的Kriging 插值模型進(jìn)行比較。用均方根誤差(Root mean square error,RMSE)和最大絕對(duì)誤差(Max absolute error,MAE)這2 項(xiàng)指標(biāo)來(lái)驗(yàn)證,判斷全局精度和局部精度,均方根誤差公式為[20]:
式(21)中:m為1 組驗(yàn)證樣本(1 條等換算轉(zhuǎn)速曲線(xiàn))中樣本點(diǎn)的個(gè)數(shù);y?為預(yù)測(cè)值;yi為實(shí)際值。
圖3 為流量系數(shù)插值示意圖,黑色曲線(xiàn)為流量系數(shù)的實(shí)際值??梢钥闯?,相比選點(diǎn)前的Kriging模型的插值精度,選點(diǎn)后的Kriging模型預(yù)測(cè)值的紅色點(diǎn)更靠近代表實(shí)際值的黑色曲線(xiàn)。表3是2種方法結(jié)果的精度檢驗(yàn)。可以看出,對(duì)3組樣本進(jìn)行預(yù)測(cè)后,使用本方法的RMSE和MAE,都有明顯降低。
圖3 流量系數(shù)插值示意圖Fig.3 Schematic diagram of flow coefficient interpolation
表3 誤差比較Tab.3 Comparison of errors
當(dāng)換算轉(zhuǎn)速為0.847 8時(shí),選點(diǎn)后的模型相較于選點(diǎn)前的模型精度有較大提高。造成這種結(jié)果的原因是該換算轉(zhuǎn)速下的樣本點(diǎn)過(guò)于冗雜,在對(duì)曲率較小的曲線(xiàn)部分進(jìn)行預(yù)測(cè)時(shí)容易受到其他多余樣本點(diǎn)干擾。而選點(diǎn)后的模型使用的樣本點(diǎn)都具有代表性,這便淡化了多余樣本點(diǎn)帶來(lái)的負(fù)面影響,有效解決了此類(lèi)問(wèn)題。
為了提高航空燃?xì)廨啓C(jī)流量系數(shù)的插值建模精度,同時(shí)也為了減少使用樣本的數(shù)量,在傳統(tǒng)Kriging代理模型的基礎(chǔ)上,采用了基于垂距的多點(diǎn)取樣算法。首先,根據(jù)垂距來(lái)刪除多余冗雜的樣本點(diǎn);然后,使用預(yù)測(cè)標(biāo)準(zhǔn)差與高斯相關(guān)函數(shù)來(lái)判斷樣本點(diǎn)的相關(guān)性;最后,只篩選出具有代表性的樣本點(diǎn),以此來(lái)提高Kriging插值模型精度。仿真表明,該選點(diǎn)方式有效可行,且具有以下特點(diǎn):
1)采用該取樣算法選點(diǎn)后,Kriging 模型針對(duì)單目標(biāo)點(diǎn)的插值精度得到了明顯的提高;
2)該算法能夠選出最優(yōu)點(diǎn),并刪除與之相關(guān)的點(diǎn),節(jié)省了構(gòu)建模型時(shí)所需要使用的訓(xùn)練樣本數(shù)量;
3)選出的點(diǎn)能夠與原始曲線(xiàn)形狀相適應(yīng),提高了全局精度和局部精度,進(jìn)而提高了計(jì)算效率。