譚景寶,許 歡
(合肥幼兒師范高等專科學(xué)?;A(chǔ)部,安徽合肥 230013)
現(xiàn)代航空運(yùn)輸是現(xiàn)代社會(huì)綜合交通體系中的重要組成部分,是遠(yuǎn)程旅客選擇出游的主要方式。隨著經(jīng)濟(jì)的發(fā)展,國內(nèi)外航空運(yùn)輸正迅猛發(fā)展,大部分人在國際國內(nèi)遠(yuǎn)程旅行時(shí)選擇乘坐飛機(jī),并且乘客人數(shù)每年都在增長。燃油流量被視為飛機(jī)發(fā)動(dòng)機(jī)重要的技術(shù)參數(shù)之一,它直接影響飛機(jī)性能的優(yōu)劣,反映發(fā)動(dòng)機(jī)性能衰減的狀況。為此,各大航空公司采取各種措施來提高燃油效率,以減少不必要的燃油成本。飛機(jī)在飛行過程中的燃油消耗受到多種因素的影響,建立燃油消耗模型,利用模型對飛機(jī)燃油流量進(jìn)行監(jiān)控,對提高燃油效率有著重要意義。
目前已有大量學(xué)者對飛機(jī)燃油消耗模型進(jìn)行了研究。王偉[1]、Bela P C[2]、傅職忠[3]分別基于能量守恒原理的燃油消耗和基于實(shí)際非參數(shù)據(jù)的傳統(tǒng)統(tǒng)計(jì)以及基于智能算法建立模型,并對模型進(jìn)行分析;Trani A A[4]、劉婧[5]、劉芳[6]分別基于非參數(shù)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)方法,建立了燃油消耗回歸預(yù)測模型,提高了飛機(jī)燃油消耗的預(yù)測精度。王長坤[7]基于真實(shí)飛行QAR數(shù)據(jù),采用兩階段分析,第一步找到影響飛機(jī)飛行的燃油消耗的因素,第二步利用多元線性回歸分析方法,建立飛機(jī)飛行燃油流量模型;耿宏[8]在深入分析飛機(jī)飛行QAR數(shù)據(jù)的基礎(chǔ)上,確定了影響飛機(jī)燃油流量的因素,基于多元線性回歸分析建立飛機(jī)燃油消耗回歸預(yù)測模型,并利用該模型對飛機(jī)燃油消耗進(jìn)行了預(yù)測分析;楊姝[9]利用灰色關(guān)聯(lián)分析法找出了影響飛機(jī)油耗的因素,并基于多元線性回歸方法在挑選出的一組相關(guān)性強(qiáng)、結(jié)構(gòu)合理的要素和耗油量間構(gòu)建了燃油消耗量模型。
在飛機(jī)油耗的研究中,通常采用線性回歸方法,建立線性回歸模型,利用最小二乘法估計(jì)模型的參數(shù)。但在現(xiàn)實(shí)中,對某些情況如變量間存在嚴(yán)重的多重共線性時(shí),該種方法的估計(jì)值并不準(zhǔn)確,從而導(dǎo)致預(yù)測精度較低。此外,當(dāng)影響因素即自變量數(shù)量較多時(shí),對模型的解釋能力就會(huì)降低。1996年,Tibshirani R[10]提出了Lasso方法,目的是為了壓縮模型參數(shù),使得某些回歸系數(shù)變小。之后,很多學(xué)者提出了Lasso方法的改進(jìn)技術(shù),并利用Lasso方法進(jìn)行多元統(tǒng)計(jì)分析。譚常春[11]基于Adaptive-Lasso方法,建立了城市火災(zāi)次數(shù)與氣象因素的回歸模型,很好地預(yù)測了城市火災(zāi)次數(shù);譚常春[12]在主成分分析的基礎(chǔ)上運(yùn)用Adaptive-Lasso方法分析了本科課程對本科成績的影響,建立了回歸模型并預(yù)測了后期成績。
本文針對2014-04-08至2015-04-09飛機(jī)飛行階段耗油量,分析飛行速度、高度、氣溫、風(fēng)速、重量、經(jīng)度等相關(guān)的因素對其的影響,分別用主成分分析方法與Adaptive-Lasso方法進(jìn)行建模。并對以上兩種模型進(jìn)行分析比較,最終顯示,通過Adaptive-Lasso方法建立的回歸模型能更好地?cái)M合飛機(jī)耗油量。
主成分分析方法(Principal Component Analysis,PCA)采用降維的思想,通過正交變換將一組存在相關(guān)性的多個(gè)指標(biāo)轉(zhuǎn)換為一組線性不相關(guān)的少數(shù)幾個(gè)綜合指標(biāo),少數(shù)的幾個(gè)綜合指標(biāo)代表了總體的大多數(shù)信息,我們稱之為主成分。它是將眾多指標(biāo)進(jìn)行綜合,消除樣本間的信息重合,消除共線性,綜合后的少數(shù)指標(biāo)彼此間互不相干,且保留了盡量多的原始變量信息,即利用少數(shù)的幾個(gè)指標(biāo)來揭示原始變量間的內(nèi)部關(guān)系。通常的處理方式就是將原始變量進(jìn)行線性組合,組合后的變量作為新的綜合指標(biāo)。其模型為:
Lasso利用壓縮估計(jì)的思想,是一種將變量的選擇和參數(shù)的估計(jì)同時(shí)進(jìn)行的方法,其參數(shù)估計(jì)為:
其中,λ為非負(fù)正則化參數(shù),β=(β1,β2,…,βk)T是回歸系數(shù),Xj=(x1j,x2j,…,xmj)T,j=1,2,…,k是預(yù)測變量,X=(X1,X2,…,Xk)是預(yù)測變量矩陣,Y=(y1,y2,…,ym)T是響應(yīng)變量。
構(gòu)造懲罰函數(shù),壓縮變量的系數(shù),是Lasso方法的關(guān)鍵。隨著λ的增加,Lasso方法使得系數(shù)連續(xù)地趨向于0。當(dāng)λ足夠大時(shí),系數(shù)被壓縮到0。系數(shù)連續(xù)的縮小使得偏差被權(quán)衡掉,從而提高了模型預(yù)測的精確度。
Lasso方法雖然可以解決普通最小二乘和逐步回歸中變量共線性的問題,但需在滿足一定條件的情況下。我們選用一個(gè)改進(jìn)的Lasso方法,稱為Adaptive-Lasso方法,其改變的地方在于給不同的系數(shù)分配不同的權(quán)重。定義如下:
本文中所使用的數(shù)據(jù)為某家航空公司2014-04-08至2015-04-09飛機(jī)飛行階段的耗油量數(shù)據(jù),如表1所示。
表1 飛機(jī)耗油量及其因素
因因素太多表中不能全部列舉,故省略一些因素,省略的有:地速、計(jì)算空速、馬赫、重量、經(jīng)度、緯度、總溫、靜溫、耗時(shí)(ACCUM)、地速距離(ACCUM)、空速距離(ACCUM)。
將上述1252組數(shù)據(jù)中的前1052組數(shù)據(jù)進(jìn)行分析,對后200組數(shù)據(jù)進(jìn)行預(yù)測比較。對前1052組數(shù)據(jù)中的飛行速度、高度、氣溫、風(fēng)速、重量、經(jīng)度等相關(guān)因素進(jìn)行主成分分析,建立回歸模型。
主成分分析結(jié)果如表2所示,共有9個(gè)主成分。
表2 主成分分析成分貢獻(xiàn)率
采用前4個(gè)主成分進(jìn)行回歸分析,累計(jì)貢獻(xiàn)率大于70%。第一主成分與第三主成分主要為客觀環(huán)境變量,包括高度、真空速、經(jīng)度、維度、總溫及靜溫,其貢獻(xiàn)率分別為26.9%、15.5%;第二主成分主要為飛機(jī)飛行變量,包括地速、耗時(shí)、地速距離和空速距離,其貢獻(xiàn)率為18.8%;第四主成分主要為飛機(jī)自身變量,包括重量、馬赫等,其貢獻(xiàn)率為14.1%。
利用主成分分析所得的成分矩陣,采用逐步回歸法建立飛機(jī)油耗與主成分之間的回歸模型,結(jié)果如表3所示。
表3 逐步回歸法回歸系數(shù)
注:***表示結(jié)果顯著。
由此得出回歸模型:
y=30.089+0.137Comp1-6.069Comp2+1.282Comp3-0.895Comp4.
此回歸模型的擬合優(yōu)度為0.9569。
對后200組數(shù)據(jù)根據(jù)以上模型進(jìn)行預(yù)測,并將預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行比較,如圖1所示,其中橫軸代表數(shù)據(jù)序號,縱軸代表油耗,實(shí)線代表實(shí)際值,虛線代表預(yù)測值。
其均方誤差為123.252,從圖1看出,預(yù)測值與實(shí)際值走勢大致吻合,但在30~50和150~180這兩段誤差較大。
將上述1252組數(shù)據(jù)中的前1052組數(shù)據(jù)進(jìn)行分析,對后200組數(shù)據(jù)進(jìn)行預(yù)測比較。利用Adaptive-Lasso建立飛機(jī)油耗與相關(guān)因素之間的回歸模型,表4為各相關(guān)因素的回歸系數(shù)。
表4 Adaptive-Lasso方法回歸系數(shù)
由表4可以看出,Adaptive-Lasso方法剔除了一些共線性的變量,如經(jīng)度、維度等,保留了溫度、靜溫、耗時(shí)、空速距離4個(gè)變量,其相關(guān)檢驗(yàn)如表5所示。
表5 相關(guān)檢驗(yàn)
注:***表示結(jié)果顯著。
由此得出飛機(jī)油耗與相關(guān)因素之間的回歸模型:
y=-5.009+0.072X7-0.008X9+0.086X10+5.067X11.
模型擬合優(yōu)度為0.9736,大于基于主成分分析的回歸模型的擬合優(yōu)度。因此得出結(jié)論,基于Adaptive-Lasso方法的回歸模型要優(yōu)于基于主成分分析的回歸模型。
對后200組數(shù)據(jù)根據(jù)以上模型進(jìn)行預(yù)測,并將預(yù)測數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行比較,如圖2所示,其中橫軸代表數(shù)據(jù)序號,縱軸代表油耗,實(shí)線代表實(shí)際值,虛線代表預(yù)測值。
其均方誤差為44.262,從圖2可以看出,預(yù)測值與實(shí)際值基本吻合,說明擬合效果較好。與基于主成分分析方法建立的模型相比,通過Adaptive-Lasso方法建立的回歸模型能更好地?cái)M合飛機(jī)耗油量。
本文根據(jù)2014-04-08至2015-04-09飛機(jī)飛行階段耗油量及飛行速度、高度、氣溫、風(fēng)速、重量、經(jīng)度等相關(guān)的因素,分別建立了主成分逐步回歸模型和Adaptive-Lasso回歸模型。經(jīng)過對比分析后可得,主成分逐步回歸雖然保證了較好的模型解釋和預(yù)測精度,但模型的擬合度不如Adaptive-Lasso方法建立的回歸模型。但從實(shí)際考慮,Adaptive-Lasso方法剔除了較多的變量,僅利用較少的變量進(jìn)行擬合,其模型解釋性不高,沒有很好的實(shí)際意義。由回歸模型可以得出,飛機(jī)飛行的耗油量是由客觀環(huán)境、飛機(jī)自身及飛機(jī)飛行三者共同決定,并且環(huán)境對其影響較大,航空公司可適當(dāng)根據(jù)環(huán)境調(diào)整飛行狀態(tài),以減少油耗。