錢 宇,龍 濤
(中國(guó)民用航空飛行學(xué)院,四川 廣漢 618307)
民航運(yùn)輸飛機(jī)起飛離地速度是飛機(jī)主輪離地時(shí)的瞬時(shí)速度,該速度超過輪胎型號(hào)限制速度,即發(fā)生超輪速[1]。由于超輪速極易造成輪胎超負(fù)荷損傷,甚至爆胎,嚴(yán)重威脅航空安全運(yùn)行[2],因此對(duì)超輪速的研究尤為重要。飛機(jī)起飛離地速度受多種因素的影響,目前對(duì)超輪速誘因的研究多為定性分析[3][4]。快速存取記錄器(Quick Access Recorder,QAR)用于日常運(yùn)行時(shí)獲取飛行數(shù)據(jù),飛行數(shù)據(jù)能夠反映飛機(jī)運(yùn)行情況。因此,為客觀分析超輪速誘因,進(jìn)行識(shí)別風(fēng)險(xiǎn),可以使用QAR數(shù)據(jù)對(duì)超輪速誘因進(jìn)行定量研究。
超輪速誘因研究涉及多個(gè)變量,且變量間相關(guān)性明顯。為使研究問題得到簡(jiǎn)化,降低建立模型的難度和復(fù)雜性,并保證模型的合理性,需要對(duì)多個(gè)變量進(jìn)行降維,而主成分分析是一種常用的降維方法。Chuanqi Lu等[5]利用主成分分析法對(duì)航空液壓泵的故障特征進(jìn)行降維,建立支持向量回歸模型對(duì)故障規(guī)模進(jìn)行識(shí)別;劉科生和王思洋[6]對(duì)函數(shù)型自變量進(jìn)行主成分提取,降低參數(shù)估計(jì)的復(fù)雜性;李鼎哲等[7]利用主成分分析法將航空發(fā)動(dòng)機(jī)工作狀態(tài)數(shù)據(jù)進(jìn)行屬性約簡(jiǎn),輸出作為隨機(jī)森林原始訓(xùn)練集;Shane Kosir等[8]利用主成分分析法處理航空燃油容積膨脹數(shù)據(jù),所得主成分用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
研究以民航客機(jī)起飛離地速度為對(duì)象,依據(jù)QAR所記錄的發(fā)生超輪速事件的飛行數(shù)據(jù),利用主成分分析方法對(duì)影響起飛離地速度的多個(gè)參數(shù)進(jìn)行降維,建立主成分回歸模型,得出各參數(shù)與離地速度的定量關(guān)系。
QAR數(shù)據(jù)涵蓋了飛行過程中上千個(gè)不同的參數(shù),如經(jīng)緯度、高度、風(fēng)向風(fēng)速、溫度、速度、側(cè)桿輸入等。因此,飛行數(shù)據(jù)分析和應(yīng)用一直是航空安全研究的熱點(diǎn)之一。目前對(duì)QAR數(shù)據(jù)的應(yīng)用研究在飛機(jī)性能分析[9]和故障診斷[10]、飛行員操作特征研究[11]、風(fēng)險(xiǎn)評(píng)估和預(yù)警[12]等方面發(fā)揮著巨大的作用。
研究選取影響起飛離地速度的26個(gè)參數(shù),基于QAR數(shù)據(jù)建立超輪速誘因分析模型。所選參數(shù)分為機(jī)組操縱類、飛機(jī)性能類、飛機(jī)姿態(tài)類、飛機(jī)位置類和環(huán)境類等5類,具體分類情況見表1。
表1 起飛離地速度影響參數(shù)分類情況
采用主成分分析(Principal Component Analysis,PCA)方法,將多個(gè)變量化為少數(shù)幾個(gè)主成分(綜合變量),實(shí)現(xiàn)降維。這些主成分可以表示為原始變量的線性組合,能夠反映原始變量的大部分信息,且各主成分之間互不相關(guān)[13]。主成分分析模型的建立過程如下:
1)原始數(shù)據(jù)標(biāo)準(zhǔn)化處理
(1)
(2)
(3)
R=(rij)p×p
(4)
(5)
3)求解R的特征值λ和正交單位特征向量e
由特征方程|R-λD|=0,計(jì)算得出R的特征值λ和特征向量D,將特征值由大到小進(jìn)行排序,得到λ1≥λ2≥…≥λp;利用施密特正交化方法將特征向量D正交規(guī)范化,再對(duì)向量進(jìn)行單位化處理,得到正交單位特征向量e,即主成分表達(dá)式的系數(shù)。
4)計(jì)算貢獻(xiàn)率ci和累積貢獻(xiàn)率C
(6)
(7)
式中,λi、λj分別為R的第i和第j個(gè)特征值。
5)計(jì)算主成分得分score。
(8)
式中,i,j=1,2,…,p,ej為相應(yīng)主成分表達(dá)式的系數(shù),scorej表示第j個(gè)主成分得分,主成分得分可用于進(jìn)一步的統(tǒng)計(jì)分析。
通過主成分分析方法得到主成分得分和主成分表達(dá)式。將各主成分得分作為回歸模型的輸入,得到主成分回歸方程,使原始回歸模型得到簡(jiǎn)化,并使得回歸方程和參數(shù)估計(jì)更加可靠;將主成分表達(dá)式代回回歸模型,即可得到因變量關(guān)于標(biāo)準(zhǔn)化自變量的回歸模型。模型建立過程如下:
1)變量共線性診斷與相關(guān)性分析
VIF=1/(1-R2)
(9)
式中,VIF為方差膨脹因子;R2為判定系數(shù),R2=1-SSE/SST,SSE為誤差平方和,SST為變量的總離差平方和。VIF越大說明變量間共線性越嚴(yán)重,一般,VIF<5,認(rèn)為不存在共線性;VIF>10,認(rèn)為共線性嚴(yán)重。
2)建立多元線性回歸模型
采用普通最小二乘法,建立因變量y關(guān)于主成分Z1,Z2,…,Zk的回歸模型
y=β0+β1Z1+β2Z2+…+βkZk+ε
(10)
3)顯著性檢驗(yàn)
給定顯著性水平α=0.05,對(duì)回歸方程進(jìn)行顯著性檢驗(yàn)(F檢驗(yàn)),若F檢驗(yàn)的p值小于0.05,則應(yīng)拒絕原假設(shè)H0:β1=β2=…=βk=0,可認(rèn)為回歸方程是顯著的。然后,對(duì)方程的常數(shù)項(xiàng)和線性項(xiàng)進(jìn)行顯著性檢驗(yàn)(t檢驗(yàn)),若t檢驗(yàn)的p值小于0.05,則說明方程各項(xiàng)系數(shù)是顯著的。
4)殘差分析和異常值診斷
通過殘差直方圖和殘差正態(tài)概率圖檢驗(yàn)殘差是否服從正態(tài)分布,然后通過學(xué)生化殘差統(tǒng)計(jì)量Se查找異常值。去除異常值并剔除不顯著的線性項(xiàng),重新建立回歸模型。
(11)
式中,ei為第i個(gè)觀測(cè)對(duì)應(yīng)的殘差,MSE為均方殘差,hii為帽子矩陣H=X(XTX)-1XT對(duì)角線上的第i個(gè)元素。
5)回代主成分表達(dá)式
(12)
建立主成分回歸模型的流程圖如圖1。
圖1 主成分回歸模型建立流程圖
研究選取144組航班QAR數(shù)據(jù)作為樣本。為判斷樣本是否適合進(jìn)行主成分分析,通過Kaiser-Meyer-Olkin (KMO)檢驗(yàn)和Bartlett’s test of sphericity(Bartlett’s)檢驗(yàn)對(duì)數(shù)據(jù)進(jìn)行總體分析[14]。一般,KMO檢驗(yàn)值分布在0~1之間,若系數(shù)值大于0.6,則認(rèn)為樣本的數(shù)據(jù)結(jié)構(gòu)合理且滿足要求;Bartlett’s檢驗(yàn)基于各參數(shù)互不相關(guān)的假設(shè),即各參數(shù)無法進(jìn)行降維。因此,若Bartlett’s檢驗(yàn)的p值小于0.001,則拒絕原假設(shè),說明樣本可以進(jìn)行主成分提取。檢驗(yàn)結(jié)果見表2。
表2 樣本總體分析檢驗(yàn)結(jié)果
從表2的檢驗(yàn)結(jié)果可以看出,樣本數(shù)據(jù)可用于主成分分析。
考慮各參數(shù)的量綱不同,故將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行主成分分析的結(jié)果如圖2和表3。
表3 主成分分析結(jié)果
由于前9個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到85.69%,超過85%,且綜合考慮累積貢獻(xiàn)率和各主成分的特征值(方差),前9個(gè)主成分已經(jīng)具有足夠的解釋能力,故確定選取前9個(gè)主成分作為回歸模型的自變量。
圖2 主成分貢獻(xiàn)率和累計(jì)貢獻(xiàn)率圖
所選主成分關(guān)于原始變量的表達(dá)式系數(shù)見表4。其中,Zi表示各主成分,Xi表示標(biāo)準(zhǔn)化的原始自變量,i=1,2,…,26。
表4 所選主成分關(guān)于原始變量的表達(dá)式系數(shù)
經(jīng)多重共線性診斷,各主成分的方差膨脹因子VIF計(jì)算結(jié)果均為1,說明各主成分間不存在共線性。然后以主成分Z1,Z2,…,Z9為自變量,以離地速度y為因變量,通過相關(guān)性分析,得到各變量相關(guān)系數(shù)如圖3。
圖3 離地速度與各主成分的相關(guān)系數(shù)矩陣圖
從圖3可以看出,各自變量與因變量之間均存在相關(guān)性。
建立初始線性回歸模型,得到回歸分析結(jié)果見表5。
表5 初始線性回歸模型參數(shù)估計(jì)結(jié)果
由表5得到初始線性回歸方程:
y=0.008Z1+0.378Z2-0.157Z3+0.125Z4+0.210Z5-0.074Z6+0.061Z7-0.013Z8+0.019Z9
回歸方程的F檢驗(yàn)p值小于0.05,說明該方程通過顯著性檢驗(yàn),整體顯著;從表中常數(shù)項(xiàng)和各線性項(xiàng)t檢驗(yàn)的p值可以看出,回歸系數(shù)中的常數(shù)項(xiàng)和線性項(xiàng)Z1、Z7、Z8、Z9所對(duì)應(yīng)的p值均大于0.05,說明其均不顯著。
對(duì)回歸模型進(jìn)行殘差分析和異常值診斷,所得結(jié)果如圖4和圖5。
圖4 初始線性回歸模型殘差分析結(jié)果
圖5 初始線性回歸模型異常值診斷結(jié)果
從殘差直方圖中可以看出,殘差基本呈正態(tài)分布;殘差正態(tài)概率圖的下尾部分偏離直線,說明存在異常值。根據(jù)學(xué)生化殘差查找異常值,得到8組存在異常的樣本。去除異常值并剔除不顯著的線性項(xiàng),重新建立線性回歸模型,參數(shù)估計(jì)結(jié)果見表6。
表6 去異線性回歸模型參數(shù)估計(jì)結(jié)果
由表6得到去異線性回歸方程為:
y=0.398Z2-0.130Z3+0.130Z4+0.235Z5-0.084Z6
對(duì)回歸方程的顯著性檢驗(yàn)p值小于0.05,說明方程整體是顯著的。除了常數(shù)項(xiàng)外,各線性項(xiàng)的t檢驗(yàn)p值均小于0.05,說明各線性項(xiàng)均顯著。
表7 回歸模型擬合效果評(píng)價(jià)結(jié)果對(duì)比
參數(shù)的置信區(qū)間能夠反映參數(shù)真實(shí)值在某個(gè)可信程度下處于某區(qū)間。計(jì)算去異線性回歸模型中回歸系數(shù)在95%可信程度下的置信區(qū)間,結(jié)果見表8。
表8 去異線性回歸模型回歸系數(shù)置信區(qū)間
表8反映了在95%置信水平下,去異線性回歸模型的各回歸系數(shù)分別處于表中所示相應(yīng)區(qū)間內(nèi)。
將主成分與標(biāo)準(zhǔn)化原始變量的表達(dá)式系數(shù)代入去異線性回歸方程,得到用標(biāo)準(zhǔn)化自變量表示的回歸方程:
y=-0.191X6-0.177X5+0.141X2+0.052X1+0.039X3+0.038X4+0.203X13+0.148X8+0.132X9+0.116X16+0.099X14+0.083X10+0.072X11+0.065X7+0.031X12-0.003X15+0.038X17+0.031X18-0.155X19-0.034X20+0.012X21+0.020X22+0.100X25-0.032X24-0.013X23-0.001X26
觀察以標(biāo)準(zhǔn)化自變量表示的回歸方程和表1中的參數(shù)分類情況,可以發(fā)現(xiàn):
1)變量X6(襟翼角度)、X5(縫翼角度)、X15(發(fā)動(dòng)機(jī)排氣溫度)、X19(經(jīng)度)、X20(緯度)、X23(總溫)、X24(靜溫)和X26(風(fēng)向)的系數(shù)為負(fù),其余均為正。方程系數(shù)為負(fù),說明起飛離地速度隨相關(guān)變量減小而增大;反之,方程系數(shù)為正,起飛離地速度隨相關(guān)變量增大而增大。
2)對(duì)起飛離地速度影響較大的因素分別是低壓轉(zhuǎn)子轉(zhuǎn)速、襟翼角度、縫翼角度、經(jīng)度。表現(xiàn)為低壓轉(zhuǎn)子轉(zhuǎn)速越高,越易超輪速;起飛襟翼和縫翼伸出角度越小,越易超輪速;起飛位置越靠近我國(guó)西部,即經(jīng)度越小,越易超輪速。此外,影響其次的是油門、抬前輪速度、指示空速、發(fā)動(dòng)機(jī)壓力比、風(fēng)速等;影響最小的兩個(gè)因素分別是發(fā)動(dòng)機(jī)排氣溫度和風(fēng)向。
3)盡管風(fēng)向的回歸系數(shù)值僅為0.001,但這并非說明風(fēng)向?qū)ζ痫w離地速度幾乎沒有影響。經(jīng)分析,由于風(fēng)向和風(fēng)速構(gòu)成一個(gè)矢量,當(dāng)順風(fēng)風(fēng)速越大,起飛離地速度越大,越容易超輪速,符合實(shí)際情況。
利用發(fā)生超輪速事件的航班QAR數(shù)據(jù),通過主成分回歸分析方法,所建立的包含機(jī)組操縱、飛機(jī)性能、飛機(jī)姿態(tài)、飛機(jī)位置和運(yùn)行環(huán)境等參數(shù)的運(yùn)輸飛機(jī)超輪速誘因分析模型,實(shí)現(xiàn)了各參數(shù)與起飛離地速度的定量關(guān)系估計(jì),解釋了起飛離地速度的影響因素及其影響程度,為飛行訓(xùn)練及起飛風(fēng)險(xiǎn)預(yù)測(cè)奠定了基礎(chǔ)。