朱興動(dòng),章思宇,范加利
(1. 海軍航空大學(xué),山東 煙臺(tái) 264000;2. 海軍航空大學(xué)青島校區(qū),山東 青島 266000)
飛機(jī)發(fā)動(dòng)機(jī)是飛機(jī)核心部分,發(fā)動(dòng)機(jī)的可靠性直接影響飛機(jī)能否正常完成飛行任務(wù),因此對(duì)飛機(jī)發(fā)動(dòng)機(jī)的故障和維修記錄的統(tǒng)計(jì)分析就顯得尤為重要,對(duì)于提高飛行的安全性和整機(jī)的可靠性有著極大的作用。本文在充分查閱某型飛機(jī)的資料和相關(guān)單位搜集機(jī)務(wù)維修記錄與數(shù)據(jù)的基礎(chǔ)上,運(yùn)用多元統(tǒng)計(jì)分析理論,提出了一個(gè)基于Fisher判別分析法的分類預(yù)測模型,找出各影響因子與故障所在系統(tǒng)之間的內(nèi)在聯(lián)系[1]。
發(fā)動(dòng)機(jī)作為飛機(jī)的核心組成部分,其本身結(jié)構(gòu)十分復(fù)雜。通過比對(duì)GJB4855—2003和技術(shù)資料可知,該型飛機(jī)中所有系統(tǒng)與飛機(jī)發(fā)動(dòng)機(jī)相關(guān)的有發(fā)動(dòng)機(jī)系統(tǒng)、發(fā)動(dòng)機(jī)起動(dòng)系統(tǒng)、發(fā)動(dòng)機(jī)操縱系統(tǒng)、發(fā)動(dòng)機(jī)指示及告警系統(tǒng)和動(dòng)力裝置系統(tǒng)五類[2]。據(jù)此,可以根據(jù)故障件型號(hào)將所有故障分到這五個(gè)系統(tǒng)中。
飛機(jī)發(fā)動(dòng)機(jī)的維修記錄多為自然語言記錄,且項(xiàng)目較多,較為繁雜,不便于使用數(shù)據(jù)統(tǒng)計(jì)分析工具進(jìn)行分析判別。為了更有效地使用維修質(zhì)控記錄,需要進(jìn)行篩選和標(biāo)準(zhǔn)化等一系列數(shù)據(jù)預(yù)處理工作。
1)選擇影響故障分布的指標(biāo)
影響故障分布的指標(biāo)有很多,如發(fā)生故障時(shí)飛行的總時(shí)間、總架次、故障部位等。根據(jù)經(jīng)驗(yàn),選取故障發(fā)生月份、故障發(fā)生部位、故障件返修次數(shù)、故障件修后時(shí)次、飛機(jī)修后工作時(shí)間、專業(yè)、發(fā)動(dòng)機(jī)修后工作時(shí)間、發(fā)現(xiàn)時(shí)機(jī)、故障件無故障工作時(shí)次等9個(gè)指標(biāo)作為故障分系統(tǒng)的因變量。在這九個(gè)指標(biāo)中,月份、故障發(fā)生部位、專業(yè)、發(fā)現(xiàn)時(shí)機(jī)為自然語言敘述,其余指標(biāo)為數(shù)值。
2)數(shù)據(jù)的標(biāo)準(zhǔn)化方法[3]
如使用SPSS工具對(duì)數(shù)據(jù)進(jìn)行分析,需按照一定的規(guī)則將部分非結(jié)構(gòu)化數(shù)據(jù)標(biāo)準(zhǔn)化。為此,本文使用自行編寫的程序,先掃描所有故障記錄,對(duì)各選定指標(biāo)的具體名稱,按照出現(xiàn)次數(shù)進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果按頻數(shù)從小到大排序,再賦予相應(yīng)的數(shù)值,完成自然語言記錄的標(biāo)準(zhǔn)化。最終,標(biāo)準(zhǔn)化的結(jié)果如表1所示。
具體指標(biāo)對(duì)應(yīng)的各名稱和值如下:
①月份:一至十二月分別賦值1~12。
②故障發(fā)生部位:1-彈艙,2-設(shè)備艙,3-后機(jī)身,4-電源艙,5 -其他,6-起落架艙,7-前機(jī)身,8-座艙,9-發(fā)動(dòng)機(jī)艙。
③-專業(yè):1-綜合航電,2-電氣,3-儀表,4-飛機(jī),5-機(jī)械,6-發(fā)動(dòng)機(jī),7-特設(shè)。
表1 數(shù)據(jù)標(biāo)準(zhǔn)化結(jié)果
④發(fā)現(xiàn)時(shí)機(jī):1-滑行,2-周期性工作,3-換季檢查,4-其他,5-飛行中,6-更換發(fā)動(dòng)機(jī),7-定期檢查,8-空中,9-直接機(jī)務(wù)準(zhǔn)備,10-飛行后檢查,11-飛行啟動(dòng),12-特定檢查,13-再次出動(dòng)準(zhǔn)備,14-機(jī)械日,15-預(yù)先機(jī)務(wù)準(zhǔn)備。
⑤系統(tǒng):1-發(fā)動(dòng)機(jī)操作系統(tǒng),2-動(dòng)力裝置,3-發(fā)動(dòng)機(jī)系統(tǒng),4-發(fā)動(dòng)機(jī)操縱系統(tǒng),5-發(fā)動(dòng)機(jī)指示及告警系統(tǒng)。
除上述4個(gè)自然語言描述的指標(biāo)和發(fā)動(dòng)機(jī)系統(tǒng)之外,故障件修后時(shí)次、飛機(jī)修后時(shí)間、發(fā)動(dòng)機(jī)修后工作時(shí)間、故障件無故障工作時(shí)次的數(shù)據(jù)均為數(shù)值,為更便于進(jìn)行數(shù)據(jù)分析,將發(fā)動(dòng)機(jī)修后工作時(shí)間、故障修后時(shí)次、飛機(jī)修后工作時(shí)間、故障件無故障工作時(shí)次等幾個(gè)數(shù)值較大的指標(biāo)進(jìn)行概化,分為0,0-500,500-1 000,1 000-1 500,1 500-2 000,2 000小時(shí)以上6個(gè)檔次,并根據(jù)不同檔次從大到小依次按0-6賦值。
通過以上規(guī)則,使用自行編寫的數(shù)據(jù)標(biāo)準(zhǔn)化程序完成數(shù)據(jù)標(biāo)準(zhǔn)化,為統(tǒng)計(jì)及計(jì)算過程做好數(shù)據(jù)準(zhǔn)備。
影響發(fā)動(dòng)機(jī)故障分布的指標(biāo)多種多樣,且每個(gè)指標(biāo)對(duì)于分類結(jié)果的影響并不相同,為了簡化模型與計(jì)算過程,需要通過一定的分析手段去除一些非關(guān)鍵的指標(biāo)。
使用SPSS統(tǒng)計(jì)分析軟件,得到組均值均等性檢驗(yàn)表如表2所示。
表2中,各統(tǒng)計(jì)量含義和取值范圍如下所示。
Wilks Lambda∶Wilks Lambda是組內(nèi)平方和與總平方和之比,取值范圍為0~1,值越小說明該因素對(duì)模型影響越大[4]。
F:即F檢驗(yàn),用于檢驗(yàn)?zāi)P椭械母鱾€(gè)因素是否可以用于模型的估計(jì),F(xiàn)沒有取值范圍,值越大說明該因素越適合模型。
df1:表示自由度。
表2 組均值均等性檢驗(yàn)表
df2:無特殊意義,需滿足df1+df2=N,N為模型的樣本數(shù)量。
Sig.:Sig.表示顯著性,取值范圍為0~1,值越小說明組間的差異越顯著。
在篩選過程中,最需要關(guān)注的是顯著性指標(biāo)。由表中數(shù)據(jù)最后一列Sig.值可以看出,月份、故障件返修次數(shù)和發(fā)現(xiàn)時(shí)機(jī)3個(gè)指標(biāo)的值超過了0.05,這就意味著,在0.05的顯著水平上,不能拒絕月份、故障件返修次數(shù)和發(fā)現(xiàn)時(shí)機(jī)這三個(gè)指標(biāo)在分組的均值相等的假設(shè),即認(rèn)為其余六個(gè)指標(biāo)在分組的均值是有顯著差異的。因此,可以認(rèn)為月份、故障件返修次數(shù)和發(fā)現(xiàn)時(shí)機(jī)這三個(gè)指標(biāo)對(duì)于分類影響不大,為簡化模型和計(jì)算,之后的計(jì)算過程中將不再考慮這三個(gè)指標(biāo)。
2.2.1 Fisher判別法簡介
Fisher判別法是一種經(jīng)典的分組判別法,其基本思想是將高維的數(shù)據(jù)點(diǎn)投影到低維空間,使得數(shù)據(jù)點(diǎn)更加聚集。當(dāng)分組數(shù)為k時(shí),指標(biāo)為p個(gè),借助方差分析構(gòu)造出k個(gè)判別函數(shù),函數(shù)的通式如下所示:
(1)
其中,確定參數(shù)ci的原則是使組間差距最大,組內(nèi)差距最小。對(duì)于一個(gè)未分類的樣本數(shù)據(jù),將p個(gè)指標(biāo)分別代入求出Fi值后,值最大的對(duì)應(yīng)的分組即為該樣本所在組[5]。
2.2.2 數(shù)據(jù)集檢驗(yàn)
在使用Fisher判別分析前,需要對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn),以便確定Fisher法是否適用于目前的數(shù)據(jù)集。檢驗(yàn)的方法主要是通過計(jì)算數(shù)據(jù)集的Fisher典型判別函數(shù)得分情況,即計(jì)算典型判別式的特征值和在組差異的顯著性值。特征值占總體特征值的比例越大,也即正則相關(guān)性值越大,說明典型函數(shù)的判別能力越強(qiáng),顯著性值越小,說明該典型函數(shù)在分組時(shí)的差異更顯著。
將數(shù)據(jù)輸入程序,經(jīng)過計(jì)算獲得如表3、4所示的結(jié)果。
表3 特征值
表4 Wilks Lambda
由表3和表4的檢驗(yàn)結(jié)果可以看出,分組需要四個(gè)Fisher典型判別函數(shù)。其中判別函數(shù)1至判別函數(shù)3在顯著水平0.05上判別效果是顯著的,且前三個(gè)判別函數(shù)可以解釋整體方差的99.8%,說明前三個(gè)函數(shù)可以較好的對(duì)數(shù)據(jù)集進(jìn)行分組,即該數(shù)據(jù)集可以通過Fisher判別犯法進(jìn)行分組的。因此可以認(rèn)為,F(xiàn)isher判別分析是適用于當(dāng)前數(shù)據(jù)集的[6]。
2.2.3 系統(tǒng)分組模型的建立
Fisher判別法致力于尋找一個(gè)最能夠反映組與組之間差異的投影方向,即尋找使組之間差異最大,每個(gè)組內(nèi)部離差平方和最小的線性判別函數(shù)[7]。
多個(gè)分組的Fisher判別函數(shù)系數(shù)的求法如下所述,設(shè)有k個(gè)分組G1,G2,…,Gk,其均值和協(xié)方差矩陣分別為μ1,μ2,…,μk和Σ1,Σ2,…,Σk,從k個(gè)分組中抽取一個(gè)含p個(gè)指標(biāo)的觀測樣本,假定建立的判別函數(shù)為
C(Y)=c1Y1+…+cpYpC′Y
(2)
其中,系數(shù)c1,c2,…,cp確定的原則是使得組間差達(dá)到最大,而組內(nèi)差到達(dá)最小。
當(dāng)X∈Gi時(shí),有
i=1,2,…,k
(3)
令
(4)
B相當(dāng)于組間差,E相當(dāng)于組內(nèi)差,使用判別分析的思想,構(gòu)造的最大特征根,而系數(shù)向量C為最大特征根對(duì)應(yīng)的特征向量[8]。
(5)
求得Δ(C)極大值,即可得到判別函數(shù),顯然B0,E0均為負(fù)定矩陣,Δ(C)的極大值方程為
|B0-λE0|=0
(6)
根據(jù)以上計(jì)算思想,將數(shù)據(jù)集輸入SPSS統(tǒng)計(jì)分析軟件,使用SPSS聚類分析功能進(jìn)行模型的訓(xùn)練[9],獲得系統(tǒng)判別函數(shù)的系數(shù)如下表所示。
表5 分類函數(shù)系數(shù)
由表5可得六個(gè)系統(tǒng)判別函數(shù)分別為:
F1=5756x1-0801x2+3337x3+2495x4-
5395x5+0936x6-35932
(7)
F2=5998x1-1261x2+3416x3+3443x4-
4290x5+0676x6-41841
(8)
F3=5866x1-0821x2+3079x3+2946x4-
3939x5+1044x6-36858
(9)
F4=6231x1-0657x2+3300x3+2268x4-
7391x5+1744x6-35855
(10)
F5=5415x1-1046x2+3555x3+3220x4-
5345x5+0485x6-33337
(11)
其中,x1為故障發(fā)生部位,x2為故障件修后時(shí)次,x3為飛機(jī)修后時(shí)間,x4為專業(yè),x5為故發(fā)動(dòng)機(jī)修后工作時(shí)間,x6為故障件無故障工作時(shí)次。
假設(shè)故障發(fā)生在起落架艙,故障專業(yè)類別為特設(shè)專業(yè),且該故障件的修后時(shí)次為141.3小時(shí),該機(jī)發(fā)動(dòng)機(jī)修后工作時(shí)間為100小時(shí),距飛機(jī)上次大修時(shí)間為1000小時(shí),該故障件的無故障工作時(shí)間為200小時(shí),在這種情況下,根據(jù)前文所述的數(shù)據(jù)標(biāo)準(zhǔn)化方法,向判別函數(shù)組中代入以下參數(shù):
通過計(jì)算可得到各方程的值為
根據(jù)Fisher判別法的判別標(biāo)準(zhǔn),由于在5個(gè)F值中F5最大,故認(rèn)為若符合上述情況時(shí),故障最有可能發(fā)生在系統(tǒng)5,即發(fā)動(dòng)機(jī)指示及告警系統(tǒng)中。
模型的分類效果如圖1所示。
由圖可以看出,第1、4、5三組與其他分組之間相距較遠(yuǎn),分類效果較好,而2、3組之間距離較近,導(dǎo)致系統(tǒng)分類可能會(huì)出現(xiàn)差錯(cuò),影響分類結(jié)果的準(zhǔn)確性。
為了檢驗(yàn)?zāi)P偷呐袛嘟Y(jié)果的正確性,下面將使用歐氏距離法進(jìn)行驗(yàn)證[10]。
歐氏距離法是一種通過計(jì)算觀測點(diǎn)到組質(zhì)心距離,通過比較距離大小來進(jìn)型分類的方法[11],觀測點(diǎn)到組質(zhì)心距離最近,則說明觀測點(diǎn)屬于該組。
歐氏距離法分兩步,第一步計(jì)算觀測點(diǎn)坐標(biāo)值,計(jì)算公式如下所示:
(12)
其中,方程的個(gè)數(shù)由典型函數(shù)判別式個(gè)數(shù)來確定,Xi為計(jì)算出的坐標(biāo)值,xi為輸入?yún)?shù),n為輸入?yún)?shù)的個(gè)數(shù)。
第二步則通過歐氏距離計(jì)算公式得到觀測點(diǎn)坐標(biāo)值到質(zhì)心的距離,公式如下所示:
(13)
其中,X為組質(zhì)心坐標(biāo)值,n為坐標(biāo)的維數(shù)。
通過SPSS計(jì)算可得源數(shù)據(jù)集的標(biāo)準(zhǔn)化典型函數(shù)判別式和組質(zhì)心處函數(shù)分別如表6和表7所示,由前文所述,由于第四個(gè)方程的置信度未到達(dá)要求,故僅用前三個(gè)方程進(jìn)行計(jì)算。
表6 標(biāo)準(zhǔn)化典型函數(shù)判別式系數(shù)
表7 組質(zhì)心處函數(shù)
由表中系數(shù)可得觀測點(diǎn)的坐標(biāo)公式如下所示:
X1=-0265x1-0830x2+0008x3+0439x4+
1585x5-0495x6-0369
(14)
X2=0479x1+0434x2-0363x3-0333x4-
974x5+0601x6-2354
(15)
X3=0605x1-0072x2+0287x3+0497x4-
1101x5±0003x6-7684
(16)
其中,x1為故障發(fā)生部位,x2為故障件修后時(shí)次,x3為飛機(jī)修后時(shí)間,x4為專業(yè),x5為故發(fā)動(dòng)機(jī)修后工作時(shí)間,x6為故障件無故障工作時(shí)次。
代入前文所述的參數(shù),由公式(14)、(15)、(16)通過計(jì)算可得該觀測點(diǎn)的坐標(biāo)如下所示:
再將觀測點(diǎn)的坐標(biāo)代入公式(13)中,使用表7 中的組質(zhì)心函數(shù)得到該觀測點(diǎn)到各質(zhì)心的距離為
可以看出,D5的距離最短,因此認(rèn)為在該情況下發(fā)生的故障是屬于系統(tǒng)5,即發(fā)動(dòng)機(jī)指示及告警系統(tǒng),這與通過模型判斷所得結(jié)果相一致,說明模型計(jì)算所得結(jié)果是準(zhǔn)確的。
常用的預(yù)測模型有許多種,如趨勢外推模型,線性回歸模型,神經(jīng)網(wǎng)絡(luò)等等。下面使用多元線性回歸預(yù)測模型[12]來對(duì)數(shù)據(jù)進(jìn)行分析預(yù)測。
通過SPSS軟件計(jì)算得到多元回歸預(yù)測模型如式(17)所示,擬合效果如圖2所示:
Y=-0172x1-0064x2+0109x3+0065x4-
0409x5-0161x6+5188
(17)
其中,x1為故障發(fā)生部位,x2為故障件修后時(shí)次,x3為飛機(jī)修后時(shí)間,x4為專業(yè),x5為故發(fā)動(dòng)機(jī)修后工作時(shí)間,x6為故障件無故障工作時(shí)次。
圖2 多元線性回歸預(yù)測模型擬合效果
通過實(shí)際的數(shù)據(jù)檢驗(yàn),多元線性回歸模型的綜合預(yù)測正確率為40.9%,而Fisher故障分系統(tǒng)預(yù)測模型的最終預(yù)測正確率為74.4%,可見在預(yù)測正確率上,分系統(tǒng)預(yù)測模型的預(yù)測效果優(yōu)于多元線性回歸模型。
本文使用Fisher判別法,設(shè)計(jì)了一種系統(tǒng)故障預(yù)測模型,并使用歐氏距離法驗(yàn)證了模型預(yù)測的準(zhǔn)確性。相比于其他常用預(yù)測分析模型,本模型采用Fisher判別分析思想,易于理解和實(shí)際應(yīng)用,且分類效果較為良好。通過大量實(shí)際維修記錄數(shù)據(jù)的檢驗(yàn),該模型可以對(duì)70%以上的數(shù)據(jù)樣本進(jìn)行正確分類。但是,由于機(jī)務(wù)維修記錄往往存在錯(cuò)漏和不準(zhǔn)確的現(xiàn)象,導(dǎo)致預(yù)測結(jié)果的準(zhǔn)確率會(huì)受到一定的影響。隨著維修記錄的數(shù)據(jù)不斷增加,新的影響指標(biāo)的加入,該模型的預(yù)測準(zhǔn)確性將會(huì)隨之增加,同時(shí)挖掘出數(shù)據(jù)與數(shù)據(jù)之間更有價(jià)值的信息。