侯學(xué)理, 李 凱, 車 力, 馬曉聰, 侯旭鵬
(1.中國(guó)人民解放軍95579部隊(duì),四川 成都 611531; 2.空裝駐西安地區(qū)第九軍代室,陜西 西安 710002;3.中國(guó)人民解放軍61213部隊(duì),山西 臨汾 041000)
直升機(jī)因其具有優(yōu)越的垂直起降、靈活的機(jī)動(dòng)性等特點(diǎn)在軍事和民用都有廣泛的應(yīng)用,而且伴隨我國(guó)低空領(lǐng)域?qū)γ裼玫拈_(kāi)放,將迎來(lái)直升機(jī)發(fā)展的黃金時(shí)代。同時(shí),其安全性能也越來(lái)受到人們的關(guān)注。
直升機(jī)的三大關(guān)鍵部件為:動(dòng)力系統(tǒng)、傳動(dòng)系統(tǒng)和操縱系統(tǒng)。直升機(jī)動(dòng)力系統(tǒng)一般采取雙發(fā)或者輔助設(shè)備,操縱系統(tǒng)采用液壓、機(jī)械等兩套以上的系統(tǒng)補(bǔ)充。而傳動(dòng)系統(tǒng)需要保證傳遞效率和傳遞方向,一般采取單向傳遞,無(wú)可用替代系統(tǒng)。所以在直升機(jī)三大系統(tǒng)中傳動(dòng)系統(tǒng)安全余度最小。直升機(jī)傳動(dòng)系統(tǒng)示意圖如圖1所示。
圖1 直升機(jī)傳動(dòng)系統(tǒng)示意圖
直升機(jī)傳動(dòng)系統(tǒng)的作用是將發(fā)動(dòng)機(jī)輸出的功率按照一定的比例傳遞給旋翼和尾槳,并按各自的需求降低轉(zhuǎn)速帶動(dòng)其旋轉(zhuǎn),使直升機(jī)起飛和平衡。一旦傳動(dòng)系統(tǒng)被破壞(特別是尾傳動(dòng)軸)或出現(xiàn)故障,動(dòng)力將無(wú)法傳遞到尾槳,直升機(jī)將無(wú)法航行。傳動(dòng)系統(tǒng)的性能直接影響直升機(jī)的總體性能,關(guān)系到直升機(jī)的飛行安全和穩(wěn)定[1]。美國(guó)空軍后勤保障部門就直升機(jī)的維護(hù)數(shù)據(jù)表明,在直升機(jī)機(jī)械故障引發(fā)的飛行事故中,由傳動(dòng)系統(tǒng)和動(dòng)力系統(tǒng)造成的事故占比高達(dá)68%,維修費(fèi)用也占到了總維修費(fèi)用的58%[2]。貢慧等[3]、張娟等[4]對(duì)2016年以前的世界直升機(jī)發(fā)生的事故原因、事故機(jī)型、主要事故系統(tǒng)進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)傳動(dòng)(動(dòng)力)系統(tǒng)是引發(fā)直升機(jī)事故的一大誘因,占所有直升機(jī)飛行事故的15.9%。這也從另一方面說(shuō)明傳動(dòng)系統(tǒng)是直升機(jī)的核心關(guān)鍵部件之一,其可靠性水平在很大程度上決定了直升機(jī)的安全性。
然而目前我國(guó)的直升機(jī)傳動(dòng)系統(tǒng)的研究,特別是傳動(dòng)軸的研究,還都停留在對(duì)信號(hào)分析的研究方面,如湖南大學(xué)研發(fā)了直升機(jī)傳動(dòng)系統(tǒng)故障診斷軟件;南昌航空大學(xué)對(duì)傳動(dòng)系統(tǒng)振動(dòng)信號(hào)分析進(jìn)行故障研究,空軍工程大學(xué)、國(guó)防科技大學(xué)等院校也都在研究直升機(jī)傳動(dòng)系統(tǒng)故障,但這些故障診斷方法基本上都是基于傳統(tǒng)的信號(hào)分析,不僅需要大量的信號(hào)分析專業(yè)領(lǐng)域的專家還需要有經(jīng)驗(yàn)豐富的故障診斷專家,在實(shí)際工程中很難實(shí)現(xiàn),而且實(shí)現(xiàn)后需要依靠人來(lái)進(jìn)行判斷。
目前人工智能和數(shù)據(jù)挖掘技術(shù)均已成熟,這就使用新技術(shù)解決傳統(tǒng)問(wèn)題成為可能。而且最主要的原因是數(shù)據(jù)挖掘技術(shù)更多的是依賴于數(shù)據(jù)最原始的信息,減少了過(guò)程中對(duì)人的依賴和人為因素。同時(shí),未來(lái)的航空業(yè)將向數(shù)字航空、智能航空發(fā)展,原來(lái)的方法將很難適應(yīng)未來(lái)的數(shù)字航空、智能航空。
目前國(guó)外的大多數(shù)戰(zhàn)斗機(jī)均已安裝了健康管理系統(tǒng)(PHM),在直升機(jī)上也使用了健康與使用監(jiān)控系統(tǒng)HUMS(Health and Usage Monitoring System),我國(guó)也在進(jìn)行該項(xiàng)研究,這些研究絕大部分都依賴于數(shù)據(jù)分析或者數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘前期必須要對(duì)數(shù)據(jù)進(jìn)行處理,例如數(shù)據(jù)降維、數(shù)據(jù)清洗等。只有前期數(shù)據(jù)處理得好,后期數(shù)據(jù)分析才能準(zhǔn)確。目前國(guó)內(nèi)幾所高校均在研究用數(shù)據(jù)處理的方法進(jìn)行故障診斷,但是將數(shù)據(jù)挖掘技術(shù)用在直升機(jī)傳動(dòng)軸上的健康管理研究還處于起步階段。
本文提出了一種改進(jìn)后的相似性聚類(Affinity Propagation,AP)方法并應(yīng)用于傳動(dòng)軸上的故障特征提取。通過(guò)實(shí)驗(yàn)驗(yàn)證該方法可以進(jìn)行故障特征提取和分類。并與成分分析法(Principal Component Analysis,PCA)對(duì)比,改進(jìn)后的相似性聚類方法優(yōu)于成分分析法。
相似性傳播聚類算法[5]是通過(guò)在原始數(shù)據(jù)集中識(shí)別最具有代表性的子集來(lái)進(jìn)行數(shù)據(jù)分類的無(wú)監(jiān)督學(xué)習(xí)算法[6]。相似性聚類的核心思想利用數(shù)據(jù)信息之間相互不斷的傳遞,最終得到一個(gè)能夠描述這個(gè)數(shù)據(jù)集合的中心子集,從而使得每個(gè)數(shù)據(jù)點(diǎn)歸于一類,最終將數(shù)據(jù)集分為幾個(gè)部分[7]。
設(shè)輸入X1,X2,…,Xn為n個(gè)d維實(shí)數(shù)向量樣本Xi={xi1,xi2,…,xid},i=1,2,…,n,則d為數(shù)據(jù)樣本Xi的特征維度數(shù),則樣本數(shù)據(jù)集可以表示為X=[X1,X2,…,Xn]T,即
(1)
輸出為通過(guò)最后的聚類得到的表示點(diǎn)與點(diǎn)之間的關(guān)系矩陣ci,j(i,j=1,2,…,n)。
① 若ci,j=1,判定點(diǎn)xj為點(diǎn)xi的中心;
② 若ci,j=0,判定點(diǎn)xj不是點(diǎn)xi的中心。
相似性傳播算法目標(biāo)要使數(shù)據(jù)和它的中心點(diǎn)之間的相似性最大,即中心點(diǎn)能表示該數(shù)據(jù)集合的某一特征。通過(guò)最大和算法理論算法[8]求解ci,j,使xj成為xi中心的可能性最大,具體算法如下。
為了求解ci,j,必須將所有局部函數(shù)聯(lián)合起來(lái),建立一個(gè)全局目標(biāo)函數(shù),這樣解出來(lái)的結(jié)果才是全局最優(yōu)解。
設(shè)目標(biāo)函數(shù)S(c1,1,c1,2,…,cn,n),為了滿足算法實(shí)際需求,求解S(cij)還需幾個(gè)修真目標(biāo)函數(shù)。
(2)
式中,Ii(cij)和Ej(cij)為約束函數(shù),用于修正目標(biāo)函數(shù)S(cij)。
(3)
Ej(c1j,c2j,…,cNj)=
(4)
式(2)表示當(dāng)ci,j=1時(shí),點(diǎn)xi是屬于點(diǎn)以xj為中心的集合。式子(3)、式(4)表示每一個(gè)數(shù)據(jù)點(diǎn)只能屬于一個(gè)中心點(diǎn)集合。利用最大和信息更新原則,推出圖2所示的相似性傳播聚類算法示意圖來(lái)計(jì)算ci,j。
圖2 相似性傳播聚類算法示意圖
利用最大和原則:
(5)
此外,在計(jì)算ci,j時(shí)包括s(i,j)在內(nèi)的5個(gè)信息需要通過(guò)不斷的迭代更新。
βi,j=s(i,j)+αi,j
(6)
(7)
(8)
(9)
式中,ρi,j為責(zé)任信息,傳遞是從點(diǎn)xi到點(diǎn)xj的信息,表示點(diǎn)xj作為點(diǎn)xi的集合的中心點(diǎn)的合適程度;αi,j為可用信息,表示xj在已經(jīng)從其他數(shù)據(jù)點(diǎn)上獲得可用信息的前提下,作為xi中心的可能性的大?。沪耰,j和ηi,j為計(jì)算過(guò)程中間變量。計(jì)算數(shù)次迭代之后,求解使得ρi,j+αi,j最大和所對(duì)應(yīng)的ci,j矩陣。在實(shí)際應(yīng)用這個(gè)算法的時(shí)候,很多時(shí)候只需要輸入表示數(shù)據(jù)之間距離的相似矩陣s(i,j)。
傳統(tǒng)研究表征距離的函數(shù)有歐氏距離、曼哈頓距離、明可夫斯基距離、切比雪夫距離等。現(xiàn)在又有學(xué)者提出了改進(jìn)的表征距離的Hsim(X,Y)、Close(X,Y)[9],以及改進(jìn)的高維數(shù)據(jù)相似性度量函數(shù)Esim(X,Y)[10]。這些改進(jìn)的函數(shù)使相似性傳播聚類的降維能力有了很大的提高。而本文研究的直升機(jī)傳動(dòng)系統(tǒng)的數(shù)據(jù)維度并不是很高,而且需要較快的時(shí)間計(jì)算能力,所以選擇負(fù)歐式距離。
s(i,j)=-‖xj-xi‖2
(10)
式(10)選取某時(shí)刻某兩個(gè)特征向量之間的歐氏距離平方和。其優(yōu)點(diǎn)是放大了數(shù)據(jù)之間大的差異,但缺點(diǎn)是對(duì)數(shù)據(jù)之間細(xì)小的差異不明顯,這就使得兩個(gè)數(shù)據(jù)之間差別大的時(shí)候分類很清楚,數(shù)據(jù)差異小的時(shí)候分類不理想,甚至可能導(dǎo)致分不清楚。特別是中心點(diǎn)的選取可能效果更差。
為了解決這個(gè)弊端,提出一種加權(quán)的歐式距離:
(11)
式中,αjt為每個(gè)特征的權(quán)重用于衡量Xi在t時(shí)刻這個(gè)數(shù)據(jù)在整個(gè)測(cè)量數(shù)據(jù)序列中的影響程度,目的是使得AP聚類的聚類效果更好。αit的具體求解如下:
(12)
(13)
(14)
式(11)中αit為給每一個(gè)測(cè)量數(shù)據(jù)的每一個(gè)維度都進(jìn)行了標(biāo)記,表示在第t個(gè)的i維的重要程度的大小,從而使數(shù)據(jù)緯度之間的差異變大,將會(huì)使重要的維度在整個(gè)維度序列中表現(xiàn)出來(lái),在算法上將比較清楚地表征出其所代表的特征與其他的值的差異,使聚類原始數(shù)據(jù)的差異性變大,但又不會(huì)失去數(shù)據(jù)的本來(lái)特性。
式(11)能表示出每個(gè)數(shù)據(jù)的每個(gè)特征的重要程度,重要的特征αit大,能在整個(gè)數(shù)據(jù)維度里面更加凸顯,所以理論上可以使分類效果更好。
目前,先進(jìn)直升機(jī)對(duì)重要的關(guān)鍵系統(tǒng)都做了監(jiān)控。通過(guò)采集來(lái)的信號(hào)記錄和顯示設(shè)備運(yùn)行情況,應(yīng)用最多的是時(shí)域信號(hào),時(shí)域信號(hào)是監(jiān)測(cè)設(shè)備直接測(cè)量到的信號(hào),包含的信息量大且易于觀察和理解[11]。但應(yīng)用數(shù)據(jù)挖掘的方法來(lái)處理、識(shí)別直升機(jī)傳動(dòng)系統(tǒng)的故障時(shí),需要對(duì)采集到的信號(hào)進(jìn)行重新定義[12]。對(duì)于時(shí)域信號(hào)分析而言,常用的特征有最大值、最小值、有效值、均值、均方值、方差、標(biāo)準(zhǔn)差、峰值、峰-峰值[13]等一批有量綱的指標(biāo)。具體如表1所示。
表1 故障特征定義表
上述這些有量綱的指標(biāo)一般受工況、負(fù)載、環(huán)境、轉(zhuǎn)速等外界條件的變化影響較大,給工程應(yīng)用和研究增加了難度。但可以通過(guò)它們演變出一些無(wú)量綱指標(biāo),如峭度(Kurtosis,K)、偏斜度(Skewness,S)、波形指標(biāo)(Shape Factor,SF)、脈沖指標(biāo)(Impulse Factor,IF)、峰值指標(biāo)(Crest Factor,CF)和裕度指標(biāo)(Clearance Factor,CLF)[14]等,以及在時(shí)頻域分析中頻率峰值均值比和頻域均方根等一些參數(shù)指標(biāo)。這些都是從某一方面來(lái)描述傳動(dòng)軸的特性[15]。這些指標(biāo)的具體公式和含義在其他文獻(xiàn)中有詳細(xì)的描述這里不再贅述。
這些時(shí)域的有量綱的特征和無(wú)量綱的特征以及頻域、時(shí)頻域都可以作為故障數(shù)據(jù)的特征,均可以參與故障特征的提取,而且時(shí)域、頻域、時(shí)頻域是可以相互轉(zhuǎn)化和進(jìn)行分析的。本文為了簡(jiǎn)化計(jì)算量并說(shuō)明該方法有效性選取了時(shí)域的特征進(jìn)行分析。
通過(guò)前面的介紹可知,改進(jìn)后的AP算法可以更好地描述數(shù)據(jù)之間的差異,能使數(shù)據(jù)之間的不同特點(diǎn)表現(xiàn)得更加明顯。故這種改進(jìn)后的方法可以判別更加細(xì)微的差異,故該方法對(duì)直升機(jī)傳動(dòng)軸故障早期的相似故障有很好的判別能力。應(yīng)用改進(jìn)后的AP算法進(jìn)行傳動(dòng)軸故障特征選擇,具體如下。
改進(jìn)AP算法故障特征選擇流程圖如圖3所示。
圖3 改進(jìn)AP算法故障特征選擇流程圖
① 首先對(duì)采集到的原始信號(hào)進(jìn)行整理,使其成為一個(gè)信號(hào)序列Xt={X1,X2,…,XT},T為信號(hào)序列的長(zhǎng)度。
② 根據(jù)前面第2節(jié)定義的有量綱和無(wú)量綱的多個(gè)特征,將每一個(gè)特征作為一個(gè)維度對(duì)原始信號(hào)序列Xd進(jìn)行維度計(jì)算。設(shè)信號(hào)序列Xd計(jì)算的維度為d=1,2,…,D,D為維度長(zhǎng)度,則可將信號(hào)序列表示為Xd={X1d,X2d,…,XTd}。
③ 為了便于相似性聚類算法計(jì)算,將X進(jìn)行轉(zhuǎn)置得到信號(hào)的轉(zhuǎn)置特征序列Xt={X1t,X2t,…,XDt},d=1,2,…,D,t=1,2,…,T,則輸入序列變?yōu)?/p>
(15)
⑤ 計(jì)算歐式距離:計(jì)算特征序列XDT中每個(gè)數(shù)據(jù)點(diǎn)Xdi與特征序列XDT中對(duì)應(yīng)的數(shù)據(jù)點(diǎn)Xjt之間加權(quán)后的歐式距離s(i,j)′dt。
(16)
⑥ 將式(16)代入式(2)、式(3)、式(4)中,計(jì)算出每個(gè)特征的歸屬類,從而找出哪些特征是所有數(shù)據(jù)點(diǎn)的特征中心,并刪除冗余的特征數(shù)據(jù)。
故障的特征提取是故障診斷的關(guān)鍵步驟,該步驟直接影響后面的故障診斷。在實(shí)際的故障診斷問(wèn)題中,首先利用表1中的有量綱指標(biāo)以及其他的無(wú)量綱指標(biāo)和頻域上的特征指標(biāo),分別計(jì)算出來(lái)數(shù)據(jù)點(diǎn)的特征,這些均值、均方值、有效值、方差、標(biāo)準(zhǔn)差、峰值、峰-峰值、峭度、偏斜度、波形指標(biāo)、脈沖指標(biāo)、峰值指標(biāo)、裕度指標(biāo)、頻率峰值均值比、頻域均方根等都是描述這個(gè)故障的不同方面,對(duì)于算法來(lái)講都可以看成數(shù)據(jù)的維度。
研究的目標(biāo)是將原始數(shù)據(jù)中最能表現(xiàn)故障特性的特征提取出來(lái),為后面數(shù)據(jù)分類問(wèn)題做好準(zhǔn)備。
為了驗(yàn)證該方法在特征提取中的有效性,利用模擬傳動(dòng)軸實(shí)驗(yàn)臺(tái)進(jìn)行實(shí)驗(yàn)數(shù)據(jù)的采集。模擬傳動(dòng)軸實(shí)驗(yàn)臺(tái)如圖4所示。
圖4 模擬傳動(dòng)軸實(shí)驗(yàn)臺(tái)
在實(shí)驗(yàn)臺(tái)上設(shè)置電機(jī)轉(zhuǎn)速為480 r/s,頻率為520 Hz,采集轉(zhuǎn)動(dòng)穩(wěn)定后20 s的數(shù)據(jù)點(diǎn),并在第10 s左右的時(shí)候,輕敲傳動(dòng)軸,傳動(dòng)軸受到突然沖擊。模擬直升機(jī)受到突變載荷時(shí)傳動(dòng)系統(tǒng)受到的沖擊,如武器襲擊、風(fēng)切變等。模擬傳動(dòng)系統(tǒng)突變沖擊數(shù)據(jù)圖如圖5所示。
圖5 模擬傳動(dòng)系統(tǒng)突變沖擊數(shù)據(jù)圖
可以明顯看出數(shù)據(jù)在受到?jīng)_擊載荷時(shí)被分成了3個(gè)部分。
將采集到的數(shù)據(jù)通過(guò)第3節(jié)介紹的步驟計(jì)算出故障特征,然后將數(shù)據(jù)分別導(dǎo)入近主成分分析法(PCA)、傳統(tǒng)AP算法、改進(jìn)后AP算法,得到的特征選擇圖如圖6~圖8所示。
圖6 實(shí)驗(yàn)數(shù)據(jù)PCA特征選擇圖
圖7 傳統(tǒng)AP聚類算法特征選擇圖
圖8 改進(jìn)AP聚類算法特征選擇圖
通過(guò)上面特征選擇結(jié)果圖來(lái)看,PCA選擇的結(jié)果將數(shù)據(jù)分成了兩類,將瞬間沖擊數(shù)據(jù)(第2類數(shù)據(jù))和沖擊前數(shù)據(jù)(第1類數(shù)據(jù))、沖擊后數(shù)據(jù)(第3類數(shù)據(jù))分開(kāi)了,但是并未將數(shù)據(jù)1和數(shù)據(jù)3分開(kāi),不能把數(shù)據(jù)里的細(xì)小差異區(qū)分出來(lái)。傳統(tǒng)的AP算法將數(shù)據(jù)分成了3個(gè)部分,這數(shù)據(jù)均被分離,效果也比較好,但是在對(duì)第1類數(shù)據(jù)和第3類數(shù)據(jù)進(jìn)行細(xì)微差異的分辨時(shí)有部分?jǐn)?shù)據(jù)分辨不清,第1類數(shù)據(jù)和第3類數(shù)據(jù)出現(xiàn)了重合,這對(duì)于故障診斷可能埋下診斷不清或者診斷不準(zhǔn)確的隱患。而改進(jìn)后的AP算法,將3類數(shù)據(jù)分離得很清楚,特別是對(duì)第1類數(shù)據(jù)和第3類數(shù)據(jù)有很好的分辨率,同時(shí)將第1類數(shù)據(jù)和第3類數(shù)據(jù)投影到同一面上,并將第2類數(shù)據(jù)也統(tǒng)一投影在一個(gè)面上,這說(shuō)明對(duì)于一些相差比較大的數(shù)據(jù)改進(jìn)后的AP算法也有較好的聚類效果。
本文提出了針對(duì)直升機(jī)傳動(dòng)系統(tǒng)故障特征提取的相似性傳播聚類方法,對(duì)直升機(jī)傳動(dòng)軸進(jìn)行了故障特征定義,理論推導(dǎo)和實(shí)驗(yàn)驗(yàn)證表明該方法對(duì)故障點(diǎn)特征具有良好的選擇性。針對(duì)傳統(tǒng)AP算法在分辨數(shù)據(jù)差異方面的不足,提出了一種度量特征重要度的加權(quán)AP算法,并將其應(yīng)用于傳動(dòng)軸的故障特征選擇上,實(shí)驗(yàn)結(jié)果表明,該算法分辨效果有了很大的提高,解決了傳統(tǒng)AP算法對(duì)傳動(dòng)軸故障早期和細(xì)微故障的分辨率不高的問(wèn)題。