郝姜偉 魯斌
摘要:根據(jù)飛機發(fā)動機狀態(tài)參數(shù)建立決策樹進行分類是發(fā)動機故障檢測的重要方法,本文針對單棵決策樹模型分類方法精度不高、容易出現(xiàn)過擬合等問題,提出使用組合單決策樹來提高計算精度的隨機森林算法,并將該方法進行仿真實驗。結果表明,隨機森林算法能夠解決單個決策樹過擬合問題,在解決飛機發(fā)動機故障診斷領域中具有廣闊的發(fā)展及應用前景。
關鍵詞:飛機發(fā)動機;故障診斷;隨機森林
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)23-0158-03
Abstract:Establish decision tree for aircraft engines state parameters to classify is an important method of engine fault detection, the paper according to the accuracy of a single decision tree classification model is not high, prone to problems of over-fitting,propose the Random Forest algorithm which use a combination of a single decision tree classification model to improve the accuracy, and use it for simulation experiments.The results show that the Random Forest algorithm can solve the problem of over-fitting with a single tree,and it has a broad development prospect in solving aircraft engine fault diagnosis.
Key words:aircraft engine; fault diagnosis; random forest
隨著互聯(lián)網(wǎng)技術的持續(xù)快速發(fā)展,各種創(chuàng)新技術、前沿概念不斷影響著人們的生活,人類社會進入了一個前所未有的信息化時代。國內(nèi)航空市場發(fā)展迅速,飛機的數(shù)量不斷增加,航空維修行業(yè)在不斷發(fā)展。在航空業(yè)繁榮的背后,航空維修承擔著非常重要的作用,航空公司近百分之二十的飛行成本是維修費用。飛機安全飛行是航空公司的生命線,飛機發(fā)動機是航空器的“心臟”是安全飛行的基礎[1],飛機發(fā)動機的重要性不言而喻。目前的航空領域正處于快速發(fā)展時期,新技術、新需求不斷出現(xiàn),對維修方面也提出了更高的要求,按照原來的維修方法、要求,以及安全性、可靠性已無法滿足新時代的新的需求。在短時間內(nèi),利用有效、可靠的技術手段完成維修任務變得越來越重要。
分類預測是數(shù)據(jù)挖掘技術領域的主要方法。利用數(shù)據(jù)挖掘技術,根據(jù)現(xiàn)有的數(shù)據(jù),對未來發(fā)展趨勢進行準確、有效的分類和預測,受到了廣泛的關注和研究,而且其成果也不斷投入到我們的現(xiàn)實生活。其中應用很多優(yōu)秀的算法,比如決策樹、貝葉斯、k-近鄰分類、神經(jīng)網(wǎng)絡、支持向量機等。近幾年分類器在飛機發(fā)動機故障診斷領域也逐漸被推廣,但是單模型分類器會出現(xiàn)診斷精度不高、過擬合、訓練速度慢、陷入局部最優(yōu)解等缺點。
本文提出采用隨機森林算法對飛機發(fā)動機進行故障診斷,根據(jù)波音747-400(發(fā)動機型號為 PW-4000)發(fā)動機四個狀態(tài)參數(shù)進行初步診斷:低壓壓縮機轉速 NL;高壓壓縮機轉速 NH;排氣溫度 EGT;燃油流量 FF[3]。建立隨機森林的組合分類器模型,每個分類器起到互補的作用,將單決策樹錯誤判斷影響降低,最終根據(jù)每個決策樹的投票得出最終診斷結果,該方法具有速度快、準確率高等優(yōu)點。
1 決策樹和隨機森林
1.1 決策樹
決策樹,根據(jù)給定的無規(guī)律的樣本,推理得出樹狀的分類規(guī)則的方法,它的一個分支就是一個決策過程,每個決策過程中涉及一個數(shù)據(jù)的屬性[6],然后遞歸直到滿足決策條件。其中樣本數(shù)據(jù)集中含有多個特征屬性和目標屬性,采用從上向下的原則,從根節(jié)點開始遍歷,直到每一個數(shù)據(jù)子集都有唯一的對應的目標。建立好決策樹后,輸入測試樣本,測試數(shù)據(jù)根據(jù)生成的決策樹,確定一條由根節(jié)點到葉節(jié)點的唯一路徑,葉節(jié)點即為測試樣本所屬類別[2]。決策樹算法有著很多良好的特性,比如說訓練時間復雜度較低、預測的過程比較快速、模型容易展示等。但是同時,單決策樹又有一些不好的地方,比如說容易過擬合。
1.2 隨機森林
隨機森林算法是Leo Breiman于2001年提出的一種新型分類和預測模型,是基于決策樹(decision tree)的分類器集成算法,用隨機的方式建立一個森林,由多個決策樹
隨機森林通過在每個節(jié)點處隨機選擇特征進行分支,最小化了各棵分類樹之間的相關性,提高了分類精確度。由于每棵樹的生長速度很快,所以隨機森林的分類速度很快,并且很容易實現(xiàn)并行化。按這種算法得到的隨機森林中的每一棵都很弱,但是多顆決策樹組合起來就可以達到更精確的結果。即:將每一棵決策樹看成一個精通于某一個窄領域的專家,隨機森林中就有了很多個精通不同領域的專家決策樹,對待新的問題,用不同的角度去看待它,最后由各個專家,投票得到最終結果[4]。該算法具有需要調(diào)整的參數(shù)少、分類速度快、不用擔心過度擬合、能高效處理大樣本數(shù)據(jù)、能估計哪個特征在分類中更重要以及較強的抗噪音能力、數(shù)據(jù)集上表現(xiàn)良好等特點。
2 基于隨機森林算法的飛機發(fā)動機故障診斷步驟
隨機森林應用自助法重采樣技術生成整個決策樹分類器,其步驟如下:
1)從樣本集中用自助法(Boot-strap)重采樣選出n個樣本,預建立決策樹(CART),每個自助樣本集包括每棵分類樹的全部訓練數(shù)據(jù)。
2)在樹的每個節(jié)點上,從所有屬性中隨機選擇k個屬性,選擇出一個最佳分割屬性作為節(jié)點。
3)每棵樹最大限度地生長, 不進行剪枝操作;
4)將生成的多棵分類樹組成隨機森林,對新的數(shù)據(jù)進行判別與分類,分類結果按樹分類器的投票多少而定,最終決策結果根據(jù)如下公式給出:
用投票策略來得到最終結果。
基于隨機森林的飛機發(fā)動機故障診斷流程如圖1所示:
3 基于隨機森林算法的飛機發(fā)動機故障診斷的應用
本文使用Google開發(fā)的一種編譯型、可并行化、并具有垃圾回收功能的編程語言GoLang對隨機森林算法進行仿真實驗。
3.1 輸入特征
根據(jù)飛機發(fā)動機故障維修人員的經(jīng)驗,波音 747-400(發(fā)動機型號為 PW-4000)的故障可以通過如下四個參數(shù)進行初步診斷:低壓壓縮機轉速 NL;高壓壓縮機轉速 NH;排氣溫度 EGT;燃油流量 FF。故障診斷就是利用這些有限的參數(shù)所提供的特征信息來確定發(fā)動機的故障狀態(tài)的[3]。 選用文獻[3]的12個特征,即典型故障模式作為學習樣本輸入,如表1所示。
3.2 學習樣本和測試樣本
本文為每種故障分別選定20個樣本,總共240個學習樣本,將輸入和目標樣本作為算法入口進行分類學習,試驗中取100棵獨立決策樹組成隨機森林。根據(jù)文獻[3]典型故障模式輸入輸出樣本如表2所示。
本文進行多組實驗將隨機森林算法應用到飛機發(fā)動機故障診斷中,當選取的樣本集數(shù)量為100組,即數(shù)量較少、生成決策樹數(shù)量較少或樣本差異不明顯時,測試數(shù)據(jù)故障診斷錯誤率高達30%及以上,隨著樣本集數(shù)量以及樣本數(shù)據(jù)的不斷調(diào)整,錯誤率不斷降低。因此,正確選取學習樣本、確定適合的樣本數(shù)量、減少樣本數(shù)據(jù)的相關性是隨機森林算法能否準確決策的關鍵因素。
3.3 系統(tǒng)實現(xiàn)
前端借鑒MVC模式,使用Angularjs框架,結合HTML,CSS開發(fā),數(shù)據(jù)通信基于http協(xié)議,采用RESTful風格,使用JSON數(shù)據(jù)格式進行數(shù)據(jù)傳送。服務端使用Google開發(fā)的一種編譯型、可并行化、并具有垃圾回收功能的編程語言GoLang。Web API層基于RESTful Web API開源框架Martini實現(xiàn),分為路由管理、控制器、RPC代理三層,其中路由管理模塊負責資源的路由分配;控制器模塊定義了應用系統(tǒng)的行為,通過提供的HTTP方法向前端暴露資源;RPC代理模塊負責與模型層的通訊,使用MongoDB進行數(shù)據(jù)的存儲。實現(xiàn)結果如圖3和圖4所示:
4結論
本文研究了基于隨機森林算法的飛機發(fā)動機故障診斷方法,并通過實驗驗證該方法的有效性,實現(xiàn)了相應的web應用。實驗結果表明,利用該方法進行飛機發(fā)動機故障診斷能取得理想的效果,證明該方法的可行性,在解決飛機發(fā)動機故障診斷領域中具有廣闊的發(fā)展及應用前景。
參考文獻:
[1] 李愛. 航空發(fā)動機磨損故障智能診斷若干關鍵技術研究[D].南京航空航天大學,2013.
[2] 陶棟琦,薄翠梅,易輝. 基于隨機森林的變壓器故障檢測方法的研究[J]. 電子器件,2015(4):840-844.
[3] 吳月偉. 基于徑向基神經(jīng)網(wǎng)絡的飛機發(fā)動機故障診斷研究[D].中國民用航空學院,2006.
[4] 尹玲. 基于心率變異和腦波分析的塑身腹帶著裝壓力舒適性研究[D].東華大學,2012.
[5] 鄢仁武,葉輕舟,周理. 基于隨機森林的電力電子電路故障診斷技術[J]. 武漢大學學報:工學版,2013(6):742-746.
[6] 葉圣永,王曉茹,劉志剛,等. 基于隨機森林算法的電力系統(tǒng)暫態(tài)穩(wěn)定性評估[J]. 西南交通大學學報,2008(5):573-577.