鞏小強(qiáng), 劉尚輝, 李 沖
(西安飛機(jī)工業(yè)(集團(tuán))有限責(zé)任公司,陜西 西安 710089)
隨著科學(xué)技術(shù)的快速發(fā)展,航空發(fā)動機(jī)的推力、轉(zhuǎn)速、動強(qiáng)度等顯著提高,導(dǎo)致發(fā)動機(jī)零部件的振動載荷不斷增加,振動引起的故障顯著增多;此外,發(fā)動機(jī)結(jié)構(gòu)日趨復(fù)雜且質(zhì)量不斷減輕,其對安全性和可靠性的要求亦隨之增高[1]。因此,發(fā)動機(jī)振動狀態(tài)及振動特征的精準(zhǔn)識別是判斷發(fā)動機(jī)有無故障的主要手段,且發(fā)動機(jī)安全性、有效性及使用壽命可獲得有效提高;同時,對于飛機(jī)適航性的增強(qiáng)、維修費(fèi)的減少以及飛行事故的降低具有重要的工程意義。
近年來,大量研究者使用了BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對航空發(fā)動機(jī)進(jìn)行故障診斷,并達(dá)到了較好的診斷效果,但專注于整機(jī)振動故障診斷的相關(guān)研究極少。費(fèi)成巍等[1]應(yīng)用支持向量機(jī)進(jìn)行整機(jī)振動故障診斷,實(shí)驗(yàn)效果良好,診斷準(zhǔn)確率較高;王志等[2]應(yīng)用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建了整機(jī)振動故障診斷模型,結(jié)果發(fā)現(xiàn),該方法診斷較精準(zhǔn),且有效減少了虛警率。然而,由于BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)在局部極值、泛化能力、訓(xùn)練樣本等方面存在著難以解決的問題[3],如BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量的樣本,且容易出現(xiàn)過學(xué)習(xí)和低泛化能力的現(xiàn)象,支持向量機(jī)雖是針對小樣本統(tǒng)計(jì)估計(jì)和預(yù)測的學(xué)習(xí),但其僅能獲得局部最優(yōu)解,導(dǎo)致其可擴(kuò)展性較低且穩(wěn)定性較差,故它們的使用范圍均存在一定的局限性[4]。因此,迫切需要引入一種當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的新方法。協(xié)同訓(xùn)練算法的應(yīng)用極具前景,它有效地解決了上述問題,同時使用該算法學(xué)習(xí)獲得的故障診斷模型具有強(qiáng)泛化能力,且對非線性數(shù)據(jù)的數(shù)學(xué)建模高效準(zhǔn)確,因此在各個領(lǐng)域中得到了廣泛應(yīng)用。
實(shí)際應(yīng)用中,數(shù)據(jù)是由多種屬性特征所描述,并將其稱之為多視圖數(shù)據(jù),故如何充分利用多視圖數(shù)據(jù)的信息進(jìn)行有效學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)[5-7]。多視圖學(xué)習(xí)充分利用數(shù)據(jù)的多屬性特征,互傳信息,補(bǔ)充完善,更全面地反映目標(biāo)數(shù)據(jù)的潛在特性,以獲得更好的分類性能,解決了單視圖學(xué)習(xí)精度低的問題。本文所使用的協(xié)同訓(xùn)練算法是最為經(jīng)典的一種多視圖學(xué)習(xí)算法。該算法可綜合利用目標(biāo)數(shù)據(jù)的多視圖信息,在2個視圖上學(xué)習(xí)獲得2個不同的分類器,互換信息重新學(xué)習(xí)分類器,分類性能得到了顯著提高;其中,多視圖信息是指目標(biāo)數(shù)據(jù)所具有的不同屬性,例如,在網(wǎng)頁分類問題中,網(wǎng)頁可由當(dāng)前的網(wǎng)頁信息表示,亦可由指向網(wǎng)頁的超鏈接信息表示,從而形成了2種不同的視圖信息[5]。
Blum和Mitchell于1998年提出了協(xié)同訓(xùn)練算法[8]。該算法的基本原理為:假設(shè)數(shù)據(jù)集χ包含2個不同視圖χ=χ1×χ2,且其相應(yīng)的屬性劃分結(jié)果分別為子集X1、X2;其中,視圖χ1、χ2必須滿足2個條件:① 每個屬性子集都足夠訓(xùn)練一個高性能分類器;② 在給定類標(biāo)簽的情況下,屬性子集之間相互獨(dú)立分布,即:給定樣本x=(x1,x2)∈χ1×χ2,其標(biāo)簽y∈Y,Y為標(biāo)簽集,則存在:p(x1|y)p(x2||y)=p(x1,x2|y)。
每個屬性子集構(gòu)成一個“視圖”,滿足以上條件的視圖稱之為“充分冗余視圖”[9]。該算法首先基于2個視圖上的標(biāo)記數(shù)據(jù)集學(xué)習(xí)獲得2個初始分類器,然后,分類器對無標(biāo)記樣本進(jìn)行標(biāo)簽預(yù)測,選擇出置信度較高的樣本及其預(yù)測標(biāo)簽,并將其添加到另一個分類器對應(yīng)的標(biāo)記數(shù)據(jù)集中,形成其新的標(biāo)記數(shù)據(jù)集,進(jìn)而基于此更新2個分類器,重復(fù)執(zhí)行以上過程,直至算法達(dá)到收斂效果[10];其中,置信度是指正確標(biāo)記樣本數(shù)據(jù)的可靠性。具體算法流程如下。
輸出:分類器h=(h1,h2)。
具體步驟:
① 利用L中的標(biāo)記樣本訓(xùn)練分類器h1,h2;
② 分類器h1,h2分別對無標(biāo)記數(shù)據(jù)U進(jìn)行預(yù)測標(biāo)記;
③ 選擇置信度較高的預(yù)測樣本,并添加到另一個分類器對應(yīng)的標(biāo)記數(shù)據(jù)集;
④ 利用更新的訓(xùn)練樣本集X=L′∪U′,重新訓(xùn)練分類器;
⑤ 重復(fù)上述過程,直至收斂。
本文提出了一種基于多類協(xié)同訓(xùn)練的整機(jī)振動故障診斷方法,實(shí)現(xiàn)了對發(fā)動機(jī)故障的精準(zhǔn)診斷,降低了因故障而造成的各種損失,如飛行事故的降低、飛機(jī)維修費(fèi)的減少等,故其在航空飛行試驗(yàn)中具有重要的工程意義。
BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)僅適用于二分類問題,而航空發(fā)動機(jī)整機(jī)振動故障診斷研究屬于多分類問題,同時針對某型發(fā)動機(jī),振動故障數(shù)據(jù)有限,故利用協(xié)同訓(xùn)練算法可對少量數(shù)據(jù)進(jìn)行有效建模的特點(diǎn),構(gòu)建發(fā)動機(jī)整機(jī)振動故障診斷模型。
本文將整機(jī)振動故障類別表示為標(biāo)記空間y={0,1,2,3},其中,“0”表示“無故障”,“1”表示“轉(zhuǎn)子不對中”,“2”表示“動不平衡”,“3”表示“支承剛度過大”。整機(jī)振動故障分類器使用矩陣形式表示,即:ε=[ε0,ε1,ε2,ε3],θ=[θ0,θ1,θ2,θ3],且ε,θ∈Rd×4,其中,ε,θ表示2種不同性質(zhì)的分類器,d為不同的“振動速度”數(shù),即在不同位置不同方向上的振動速度。
1.1.1 損失函數(shù)構(gòu)造
使用邏輯回歸算法構(gòu)造2個分類器的損失函數(shù),如式(1)、式(2)所示。
(1)
(2)
式中,(x,y)表示故障數(shù)據(jù)x對應(yīng)故障類別y;L表示帶標(biāo)記的整機(jī)振動故障數(shù)據(jù)集。
最小化2個分類器上的損失函數(shù),如式(3)所示。
(3)
由于式(3)不可微,故使用歸一化操作將其最大項(xiàng)消除,如式(4)所示。
(4)
1.1.2 屬性劃分
為了提高2個分類器之間的差異性,保證該算法的高分類性能,對帶標(biāo)記的整機(jī)振動故障數(shù)據(jù)集L所包含的“振動速度”屬性進(jìn)行劃分,具體如式(5)所示。
(5)
式中,εi,θi分別表示2個分類器在屬性i上的取值,即:“1”或“0”,“1”表示分類器包含該屬性,“0”則相反。
1.1.3 最優(yōu)化問題轉(zhuǎn)化
為了學(xué)習(xí)2個具有較低損失值的故障分類器,結(jié)合式(4)、式(5),將其轉(zhuǎn)化為帶約束的最優(yōu)化問題,具體如式(6)、式(7)所示。
目標(biāo)函數(shù):
(6)
約束條件:
(7)
本文應(yīng)用增廣拉格朗日方法[10]進(jìn)行該最優(yōu)化問題的求解。
使用已生成的2個故障分類器ε、θ分別預(yù)測整機(jī)振動故障數(shù)據(jù)x′∈U的故障模式,其中,U表示未帶標(biāo)記的整機(jī)振動故障數(shù)據(jù)集,具體如式(8)、式(9)所示。
(8)
(9)
式中,k=0,1,2,3分別代表4種故障模式,即:“無故障”、“轉(zhuǎn)子不對中”、“動不平衡”和“支承剛度過大”;yε(x′),yθ(x′)分別為x′在分類器ε,θ上的類別預(yù)測結(jié)果;x′Tεk表示x′在分類器ε上的故障類別為“k”的概率;x′Tθk表示x′在分類器θ上的故障類別為“k”的概率。
為了提高分類器的診斷準(zhǔn)確率,迭代優(yōu)化已生成的2個故障分類器ε,θ。本文對整機(jī)振動故障數(shù)據(jù)x′的診斷可靠性進(jìn)行量化評估,如式(10)、式(11)所示。
(10)
(11)
(12)
(13)
診斷可靠性評估完成之后,在2個分類器之間互傳帶標(biāo)記的整機(jī)振動故障數(shù)據(jù),即:基于預(yù)測可靠性大小降序排列未帶標(biāo)記的整機(jī)振動故障數(shù)據(jù),選取每個分類器預(yù)測獲得的前5組整機(jī)振動故障數(shù)據(jù)添加至另一個分類器對應(yīng)的標(biāo)記數(shù)據(jù)集,以此更新帶標(biāo)記的整機(jī)振動故障數(shù)據(jù)集,并基于更新后的標(biāo)記數(shù)據(jù)重新訓(xùn)練故障分類器ε、θ,重復(fù)上述過程,直至未帶標(biāo)記的整機(jī)振動故障數(shù)據(jù)集為空或無可靠數(shù)據(jù)選擇,以此迭代優(yōu)化分類器。
本文基于多數(shù)投票機(jī)制識別其故障診斷結(jié)果,其計(jì)算如式(14)所示。
y(x′)=argmax{yε(x′),yθ(x′)}
(14)
本文選取某型航空發(fā)動機(jī)5種常見截面的水平與垂直方向作為試驗(yàn)測點(diǎn),即為故障診斷模型學(xué)習(xí)所需的分類屬性,以及4種常見的發(fā)動機(jī)故障模式(無故障、轉(zhuǎn)子不對中、動不平衡、支承剛度過大)作為分類標(biāo)簽。在每種故障模式中選取5個特征向量,總計(jì)20個特征向量。本文隨機(jī)選取每種模式中的2個特征向量作為訓(xùn)練數(shù)據(jù),用于構(gòu)建多類協(xié)同訓(xùn)練故障診斷模型,如表1所示(注:此數(shù)據(jù)均來源于沈陽航空工業(yè)學(xué)院遼寧省數(shù)字化工藝仿真與試驗(yàn)技術(shù)重點(diǎn)實(shí)驗(yàn)室);同時選取每種模式中剩余的3個特征向量作為測試數(shù)據(jù),以此驗(yàn)證診斷模型的分類性能。
表1 某型航空發(fā)動機(jī)整機(jī)振動故障診斷訓(xùn)練數(shù)據(jù)[1]
基于表1所包含的8個特征向量進(jìn)行故障診斷模型的訓(xùn)練,同時利用該數(shù)據(jù)對該模型進(jìn)行仿真測試,分類準(zhǔn)確率達(dá)到100%,實(shí)現(xiàn)了故障數(shù)據(jù)的精準(zhǔn)分類。
此外,為了驗(yàn)證該模型在噪聲條件下的模式識別能力,在輸入數(shù)據(jù)上疊加一定的噪聲信號,該模型診斷結(jié)果如表2所示,診斷準(zhǔn)確率達(dá)100%。由此表明,存在噪聲信號的干擾下,該模型仍具有高分類性能。
表2 噪聲干擾下的診斷結(jié)果
為了評估多類協(xié)同訓(xùn)練算法在不同發(fā)動機(jī)故障類型上的泛化能力,本文選取分類準(zhǔn)確率(Accuracy)作為其評估指標(biāo),并采用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine, SVM)與該算法診斷結(jié)果進(jìn)行對比;其中,分類準(zhǔn)確率越高,算法的泛化能力則越強(qiáng)。本文使用表1所包含的8組訓(xùn)練數(shù)據(jù)進(jìn)行整機(jī)振動故障診斷,實(shí)驗(yàn)結(jié)果如表3所示。結(jié)果發(fā)現(xiàn),多類協(xié)同訓(xùn)練算法在4種故障類型上的分類準(zhǔn)確率均為100%,均高于BP神經(jīng)網(wǎng)絡(luò)和SVM,且BP神經(jīng)網(wǎng)絡(luò)的分類準(zhǔn)確率達(dá)到最低(82%)。由此可得,多類協(xié)同訓(xùn)練算法在整機(jī)振動故障診斷上具有最強(qiáng)泛化能力。在表3中,多類協(xié)同訓(xùn)練算法用MCT表示。
表3 多類協(xié)同訓(xùn)練算法、SVM、BP在不同故障類型上的分類準(zhǔn)確率
為了進(jìn)一步驗(yàn)證多類協(xié)同訓(xùn)練算法的有效性,本文將其余12組測試數(shù)據(jù)輸入至整機(jī)振動故障診斷模型,“轉(zhuǎn)子不對中”、“動不平衡”、“支承剛度過大”及“無故障”等4類數(shù)據(jù)的診斷結(jié)果如表4所示。結(jié)果發(fā)現(xiàn),4種故障類型的模型預(yù)測結(jié)果均與實(shí)際結(jié)果一致,這表明該模型的學(xué)習(xí)能力和泛化能力均為良好。
表4 4類數(shù)據(jù)的故障診斷結(jié)果
相比于BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī),協(xié)同訓(xùn)練算法的最大優(yōu)點(diǎn)為它能在少量帶標(biāo)記數(shù)據(jù)的條件下,實(shí)現(xiàn)對未標(biāo)記數(shù)據(jù)或?qū)嵗龜?shù)據(jù)的精準(zhǔn)分類。本文對于航空發(fā)動機(jī)整機(jī)振動故障的仿真識別,利用少量的4組訓(xùn)練數(shù)據(jù)實(shí)現(xiàn)了4種故障模式的精準(zhǔn)識別,且故障診斷模型具有較強(qiáng)的泛化能力以及噪聲條件下的容錯能力。由此證明,針對某型號飛機(jī),因其發(fā)動機(jī)很少發(fā)生重大故障,故難以獲得大量的訓(xùn)練數(shù)據(jù),同時在真實(shí)場景下的整機(jī)振動數(shù)據(jù)中均存在相應(yīng)強(qiáng)度的噪聲干擾,使用多類協(xié)同訓(xùn)練算法對整機(jī)振動故障進(jìn)行模式識別,具有非常重要的工程實(shí)用價值。