彭宅銘, 程龍生, 姚啟峰
(1.江蘇科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,江蘇 鎮(zhèn)江 212100;2.南京理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,南京 210094)
隨著復(fù)雜性、綜合性和智能化水平的日益提升,現(xiàn)代裝備系統(tǒng)逐漸發(fā)展成為具有更長(zhǎng)壽命和更高可靠性的大規(guī)模復(fù)雜系統(tǒng)。由于系統(tǒng)結(jié)構(gòu)復(fù)雜,各功能模塊相互作用、相互依賴,關(guān)鍵部件的故障可能導(dǎo)致整個(gè)系統(tǒng)停止運(yùn)行,給用戶帶來(lái)巨大的經(jīng)濟(jì)損失。復(fù)雜系統(tǒng)故障預(yù)測(cè)與健康管理(prognostics and health management, PHM)技術(shù)就是針對(duì)大型高價(jià)值復(fù)雜系統(tǒng)的自主保障、自主診斷的要求提出來(lái)的,該技術(shù)可利用先進(jìn)的傳感器獲取系統(tǒng)運(yùn)行狀態(tài)信息,借助智能推理算法,實(shí)現(xiàn)系統(tǒng)狀態(tài)的分析與監(jiān)控、診斷與預(yù)測(cè)評(píng)估,對(duì)降低系統(tǒng)的維修成本、提高安全性與可靠性具有重要的意義[1]。退化模式挖掘是PHM技術(shù)的主要內(nèi)容之一,該技術(shù)基于裝備或系統(tǒng)的歷史數(shù)據(jù)來(lái)構(gòu)建狀態(tài)評(píng)估模型,以此掌握不同環(huán)境下系統(tǒng)退化或降級(jí)的規(guī)律,挖掘可能存在的退化或降級(jí)模式,搭建全面的系統(tǒng)退化模式庫(kù)。由于歷史數(shù)據(jù)往往呈現(xiàn)時(shí)序性、高維性、復(fù)雜性、高噪聲等特性,如果將其直接用于退化模式挖掘,不但在儲(chǔ)存和計(jì)算上要花費(fèi)高昂代價(jià),而且可能會(huì)影響算法的準(zhǔn)確性和可靠性。因此,有效的建立退化模式的方法就是對(duì)歷史數(shù)據(jù)進(jìn)行時(shí)間序列數(shù)據(jù)挖掘[2]。一方面,在降維或融合算法的基礎(chǔ)上構(gòu)建健康狀態(tài)評(píng)估模型,以健康指數(shù)(health indicator,HI)曲線刻畫系統(tǒng)的變化趨勢(shì);另一方面,利用時(shí)間序列聚類算法開(kāi)展退化模式挖掘研究,探索不同的衰退模式。
復(fù)雜系統(tǒng)健康狀態(tài)評(píng)估方法層出不窮,從HI構(gòu)建的策略可以分為基于物理特征的健康指數(shù)(physics HI,PHI)方法和基于融合特征的健康指數(shù)(fusion HI,F(xiàn)HI)方法兩類[3]。PHI方法主要使用統(tǒng)計(jì)方法或信號(hào)處理技術(shù)從監(jiān)測(cè)信號(hào)中提取物理特征作為監(jiān)測(cè)指標(biāo),如均方根、峰值、頻譜特征和能量等。但這些PHI僅對(duì)特定性能退化階段中特定故障敏感,無(wú)法滿足系統(tǒng)全面健康狀態(tài)監(jiān)測(cè)的敏感性和穩(wěn)定性。于是,在此基礎(chǔ)上開(kāi)發(fā)出了FHI方法,通過(guò)融合多個(gè)PHI或多傳感器信號(hào)來(lái)構(gòu)造表征系統(tǒng)健康狀態(tài)和退化程度的參數(shù)。主成分分析法(PCA)能夠在減少特征維數(shù)的同時(shí)保留盡可能多的信息,在FHI方法中也得到了大量的應(yīng)用[4-6]。但是,PCA選擇的主成分的物理特性往往難以解釋。此外,特征融合方法,如神經(jīng)網(wǎng)絡(luò)[7]、遺傳算法[8]、隱馬爾可夫模型[9]、支持向量機(jī)[10]等方法也被廣泛使用到FHI的構(gòu)建中。這些算法的實(shí)用性在實(shí)踐中都得到了驗(yàn)證,但無(wú)法描述特征對(duì)系統(tǒng)故障的敏感性和重要程度。馬氏距離(Mahalanobis distance,MD)作為一種無(wú)量綱、尺度化的協(xié)方差距離,能夠量化不同類別數(shù)據(jù)之間的差異,在構(gòu)建FHI時(shí)表現(xiàn)出了較為理想的效果[11-12]。馬田系統(tǒng)(Mahalanobis-Taguchi system,MTS)方法[13]是Taguchi提出的一種結(jié)合MD和質(zhì)量工程學(xué)的多維模式識(shí)別方法,該算法可以在使用較小的樣本量且沒(méi)有任何先驗(yàn)信息的情況下,輕松地測(cè)量數(shù)據(jù)的異常程度并提供準(zhǔn)確的結(jié)果。相比其它的特征融合算法,MTS不僅使用MD將所有相關(guān)信息融合為一個(gè)度量標(biāo)準(zhǔn),而且能夠識(shí)別出對(duì)故障信息敏感的特征。因此,MTS成為了當(dāng)前部件或系統(tǒng)PHM的有效工具之一[14-15]。
時(shí)間序列聚類算法的主要過(guò)程是距離度量和聚類。在距離度量過(guò)程中,可選擇多種不同的距離度量方法,如MD、歐式距離(Euclidean distance,ED)和動(dòng)態(tài)時(shí)間彎曲(dynamic time warping,DTW)距離等[16]。相比MD和ED,DTW克服了點(diǎn)對(duì)點(diǎn)的缺陷,通過(guò)彎曲時(shí)間來(lái)測(cè)量長(zhǎng)度不等的時(shí)間序列數(shù)據(jù),能夠?qū)崿F(xiàn)數(shù)據(jù)點(diǎn)一對(duì)多匹配。因此,這種距離度量對(duì)時(shí)間偏差和幅度改變具有更強(qiáng)的穩(wěn)健性[17]。在聚類算法選擇上,層次聚類算法不僅不需要預(yù)先制定聚類數(shù),而且能通過(guò)聚類結(jié)果準(zhǔn)確描述整個(gè)聚類過(guò)程。因此,可利用DTW距離和層次聚類算法有效地挖掘滾動(dòng)軸承的衰退模式[18]。
基于此,本文提出一種基于多傳感器數(shù)據(jù)融合方法的復(fù)雜系統(tǒng)退化模式挖掘方法,通過(guò)改進(jìn)MTS算法構(gòu)建融合健康指數(shù),利用分段點(diǎn)分析方法和基于DTW的層次聚類算法挖掘系統(tǒng)的不同退化模式,并利用航空發(fā)動(dòng)機(jī)實(shí)例來(lái)驗(yàn)證所提方法的有效性。該方法充分利用現(xiàn)有系統(tǒng)全壽命周期數(shù)據(jù),對(duì)系統(tǒng)衰退模式進(jìn)行挖掘,為系統(tǒng)在線監(jiān)測(cè)和剩余壽命預(yù)測(cè)提供依據(jù),具有一定的理論價(jià)值和應(yīng)用價(jià)值。
復(fù)雜系統(tǒng)不同部件(或子系統(tǒng))的傳感器數(shù)據(jù)能夠真實(shí)反映其性能狀態(tài),是其健康評(píng)估的基礎(chǔ)。隨著系統(tǒng)復(fù)雜程度的不斷提升,數(shù)據(jù)維度也成倍增長(zhǎng),為在線評(píng)估和預(yù)測(cè)帶來(lái)了挑戰(zhàn)。根據(jù)PHM的內(nèi)容,在對(duì)復(fù)雜系統(tǒng)進(jìn)行健康狀態(tài)評(píng)估前,需要通過(guò)數(shù)據(jù)采集、特征提取和特征選擇等過(guò)程來(lái)提取有利故障特征,構(gòu)建評(píng)估矩陣,基于評(píng)估矩陣構(gòu)建健康狀態(tài)評(píng)估模型,以此來(lái)量化評(píng)估系統(tǒng)的健康水平。
MTS將MD與質(zhì)量工程學(xué)中的正交表(OA)和信噪比(SNR)相結(jié)合,實(shí)現(xiàn)多維特征的篩選和融合。同時(shí),得到的MD是一種協(xié)方差距離,可以通過(guò)計(jì)算樣本與樣本集“重心”的最近距離來(lái)量化兩個(gè)樣本的差異。但是,在實(shí)際操作中MTS方法也存在明顯不足:在基準(zhǔn)空間優(yōu)化時(shí)利用OA和SNR篩選的特征子集未必是最好的[19]。為此,本文提出改進(jìn)MTS(improved MTS,IMTS)算法,并將其運(yùn)用到多傳感器數(shù)據(jù)的降維和融合中,以此來(lái)構(gòu)建FHI。
基于IMTS的退化參數(shù)篩選與融合過(guò)程主要有四個(gè)階段,具體如下:
階段1基準(zhǔn)空間(MS)構(gòu)建
該階段是IMTS的基礎(chǔ),需要從連續(xù)的時(shí)間序列數(shù)據(jù)中區(qū)分出“正常樣本”和“異常樣本”,確定“正常樣本”和計(jì)算MD值。
(1) 按照性能參數(shù)的退化程度進(jìn)行樣本選擇,早期的T0個(gè)監(jiān)測(cè)數(shù)據(jù)作為“正常樣本”,末期T1監(jiān)測(cè)數(shù)據(jù)作為“異常樣本”;
(2) 計(jì)算“正常樣本”的MD值。設(shè)xi(i=1,2,…,n)為n個(gè)包含p個(gè)變量的樣品,xi=(xi1,xi2,…,xip),xij為第i個(gè)樣本的第j個(gè)變量的觀測(cè)值,則第i個(gè)樣品的馬氏距離平方(簡(jiǎn)稱馬氏距離)為
(1)
階段2基準(zhǔn)空間有效性驗(yàn)證
在基準(zhǔn)空間優(yōu)化之前要對(duì)上一階段構(gòu)建的基準(zhǔn)空間的有效性進(jìn)行驗(yàn)證。
階段3基準(zhǔn)空間優(yōu)化
Taguchi認(rèn)為并非所有的特征對(duì)分類都有貢獻(xiàn),有些變量可能會(huì)產(chǎn)生冗余信息、增加計(jì)算的成本和復(fù)雜度,因此,需要對(duì)原始變量進(jìn)行篩選,挑選出其中的重要特征作為分類依據(jù)。
ReliefF算法是Kononenko[20]于1994年提出的基于特征權(quán)重的特征選擇算法。通過(guò)搜索當(dāng)前樣本的各種近鄰,綜合計(jì)算特征權(quán)重,將權(quán)重小于閾值的特征移除,以選擇最優(yōu)特征子集。該算法計(jì)算簡(jiǎn)單,易于理解,在分類問(wèn)題的特征選擇中具有獨(dú)特優(yōu)勢(shì)。為此,本文使用ReliefF算法代替OAs和SNR方法優(yōu)化基準(zhǔn)空間。但是,在實(shí)際運(yùn)用中發(fā)現(xiàn),利用ReliefF算法選擇的特征之間可能存在高相關(guān)性,出現(xiàn)特征冗余,導(dǎo)致式(1)中的S不可逆,使得MD值無(wú)法計(jì)算。因此,如果能在進(jìn)行ReliefF選擇之前消除特征之間的相關(guān)性,將會(huì)有效地解決此類問(wèn)題?;谝陨系睦碚摵蛯?shí)踐,提出基于相關(guān)性聚類和ReliefF算法的兩階段特征選擇算法來(lái)優(yōu)化基準(zhǔn)空間,具體步驟如下:
(4) 分別計(jì)算特征之間相關(guān)性系數(shù)的絕對(duì)值rij,得到相關(guān)系數(shù)矩陣r;
(5) 根據(jù)r進(jìn)行特征聚類,將特征相關(guān)性大于閾值δ1的特征聚為一類,得到k類特征子集;
(6) 利用ReliefF算法計(jì)算所有特征的權(quán)重Wj并選擇每一類中權(quán)重最大的特征構(gòu)成特征子集FS1;
在上述過(guò)程中,步驟(5)和(6)利用相關(guān)系數(shù)聚類,可以消除特征集的高冗余性。本文選取Person相關(guān)系數(shù),當(dāng)其絕對(duì)值在0.8以上,認(rèn)為特征間有強(qiáng)的相關(guān)性。因此,本文δ1選擇在0.8~1.0之間。步驟(8)中的Sp類似于PCA中的累計(jì)貢獻(xiàn)率,當(dāng)Sp>δ2時(shí)可認(rèn)為選擇的特征子集可以解釋原有的特征集,類似地,本文取δ2在0.85~1.0之間。
階段4樣本馬氏距離計(jì)算
優(yōu)化后的基準(zhǔn)空間中包含初始特征集中的重要特征,可以利用其計(jì)算各樣本的MD值。
(9) 利用優(yōu)化后的基準(zhǔn)空間計(jì)算樣本的MD值:
(2)
以上的IMTS方法操作簡(jiǎn)單,在降維時(shí)保持了特征集的分類能力,大大降低算法的復(fù)雜度。另外,利用該算法計(jì)算出的MD也是一種有效的刻畫樣本差異性的工具,可以作為表征系統(tǒng)性能狀態(tài)的參數(shù)。
單一時(shí)刻的MD只能刻畫系統(tǒng)偏離正常狀態(tài)的程度,不能很好的反映該系統(tǒng)的健康狀態(tài)變化過(guò)程,因此需要結(jié)合時(shí)間信息來(lái)獲取相應(yīng)的MD時(shí)間序列,以此來(lái)描述系統(tǒng)的退化過(guò)程及隨時(shí)間偏移的程度。事實(shí)上,系統(tǒng)的健康狀態(tài)遵循單調(diào)性原則,即如果沒(méi)有進(jìn)行人工干預(yù)(例如維修),系統(tǒng)的健康狀態(tài)不會(huì)隨時(shí)間推移而改善,也不會(huì)突然出現(xiàn)大幅度下降(例如,從90%突然降到20%)。因此,需要根據(jù)單調(diào)性原則來(lái)計(jì)算HI,從而可以準(zhǔn)確反映系統(tǒng)健康狀況。
(3)
式中,OMDmin和OMDmax分別為系統(tǒng)全壽命周期樣本計(jì)算的OMDi的最小值和最大值。
由式(3)可知,HIi∈[0,1],且單調(diào)遞減,值越大,系統(tǒng)越健康。系統(tǒng)整個(gè)壽命周期的HI曲線會(huì)呈現(xiàn)明顯的變化趨勢(shì)(如圖1)。在整個(gè)過(guò)程中,曲線斜率均為負(fù)值,當(dāng)系統(tǒng)處于穩(wěn)定階段時(shí),曲線趨近于直線,而當(dāng)系統(tǒng)逐漸退化,到達(dá)一定的閾值之后,曲線的斜率不斷減小,直到HIi趨近于0。因此,通過(guò)以上方法定義的健康指數(shù)將有利于退化分段點(diǎn)確定。
圖1 分段性能退化過(guò)程Fig.1 Piecewise performance degradation process
假設(shè)某一系統(tǒng)全壽命周期共存在n個(gè)循環(huán),其HI值記為H={h1,h2,…,hn},對(duì)應(yīng)的HI曲線圖如圖1所示。根據(jù)第1.2節(jié)的定義可知,HI存在圖1中的退化分段點(diǎn),該分段點(diǎn)的確定對(duì)于退化模式挖掘具有重要價(jià)值。
CUSUM(cumulative sum)算法是一種序貫分析技術(shù),可以通過(guò)累積作用,將退化過(guò)程中的微小波動(dòng)通過(guò)累計(jì)偏差反映出來(lái),從而可以準(zhǔn)確檢測(cè)出退化分段點(diǎn)。CUSUM算法步驟如下:
(2) 令S0=0,計(jì)算累計(jì)和Sj:
(4)
(3) 尋找累積和Sj的極值點(diǎn),即為退化分段點(diǎn)。
通過(guò)計(jì)算訓(xùn)練集樣本的健康指數(shù),建立健康指數(shù)曲線集合C={C1,C2,…,CN}。這些曲線記錄了同一類型設(shè)備在不同環(huán)境中的運(yùn)行狀態(tài),雖然各不相同,但存在具有類似退化趨勢(shì)的樣本。因此,有必要對(duì)健康指數(shù)曲線進(jìn)行聚類分析,構(gòu)建退化模式庫(kù)。
DTW距離在計(jì)算時(shí)不要求兩條時(shí)間序列具有相等的長(zhǎng)度,可實(shí)現(xiàn)異步相似性比較,同時(shí),對(duì)異常點(diǎn)不敏感。因此,DTW距離可以很好的作為健康指數(shù)曲線相似性度量的標(biāo)準(zhǔn)。層次聚類算法不需要預(yù)先設(shè)定聚類數(shù),通過(guò)計(jì)算數(shù)據(jù)集樣本間的相似性,不斷的將相似性最高的樣本合并構(gòu)成新的集群,直到所有樣本聚為一類。該算法的優(yōu)勢(shì)就在于可以表征聚類的全過(guò)程,同時(shí)可以清楚地知道各類之間的距離關(guān)系。為此,本文將利用DTW距離度量的層次聚類算法來(lái)挖掘系統(tǒng)的退化模式。具體步驟如下:
(1) 利用CUSUM算法確定N個(gè)健康指數(shù)曲線的分段點(diǎn),并將退化階段的健康指數(shù)曲線構(gòu)成退化曲線集合D={D1,D2,…,DN};
(2) 將單個(gè)退化曲線Di視為一類,計(jì)算Di和Dj之間的DTW距離dij,得到初始距離矩陣;
(3) 將初始距離矩陣中距離值及對(duì)應(yīng)的退化曲線存放在數(shù)組DS={(Di,Dj,dij)|1≤i (4) 將DS中dij最小的值對(duì)應(yīng)的兩條退化曲線合并為一類,形成新的聚類; (5) 從DS中刪除對(duì)應(yīng)的類和距離值,計(jì)算新聚類與其它類之間的距離,更新距離矩陣; (6) 重復(fù)步驟(3)~(5),直到全部聚為一類; (7) 根據(jù)設(shè)定的終止條件確定聚類數(shù)目k和聚類結(jié)果。 為更好地刻畫新的聚類與其它類之間的特征,將新的聚類中所有樣本到其它類之間距離的平均值作為類間距離。由于層次聚類的最終結(jié)果不是單一聚類,而是一個(gè)聚類層次,選擇不同的終止條件將產(chǎn)生不同聚類數(shù)目。因此,選擇一個(gè)合適的終止條件對(duì)聚類的結(jié)果有很大的影響。本文將根據(jù)類內(nèi)相似度和退化時(shí)間區(qū)間確定不同類之間的閾值。 基于相似度的退化模式識(shí)別的基本思想是找到與測(cè)試樣本具有最高相似性的退化模式。對(duì)待測(cè)樣本Y=[y1,y2,…,ym]T,yi=(yi1,yi2,…,yip)為第i個(gè)周期的特征數(shù)據(jù),其退化模式識(shí)別步驟和流程如下: (1) 利用IMTS優(yōu)化的基準(zhǔn)空間計(jì)算待測(cè)樣本從開(kāi)始運(yùn)行到當(dāng)前周期的MD值和MD累計(jì)和OMDi; (2) 利用式(3)計(jì)算各時(shí)刻的健康指數(shù)HIi,得到HY=[HI1,HI2,…,HIm]T,其中OMDmin和OMDmax使用退化模式庫(kù)中各模式樣本的OMDmin最小值和OMDmax最大值; (3) 根據(jù)退化模式庫(kù)中的退化閾值確定Y的退化曲線DY; (4) 計(jì)算DY與各退化模式Ci的相似度: (5) 式中:Sim(Ci,j)為DY與Ci中每一條退化曲線D(j)的DTW距離;ni為模式Ci中退化曲線個(gè)數(shù)。 (5) 根據(jù)SIM(Ci)值和退化模式Ci的退化時(shí)間區(qū)間來(lái)確定Y所屬的退化模式。模式Ci的退化時(shí)間區(qū)間定義為DTCi=[min(TCi),max(TCi)],其中TCi為模式Ci中樣本的退化時(shí)間,min(TCi)和max(TCi)分別為模式Ci中樣本退化時(shí)間的最小值和最大值。假設(shè)測(cè)試樣本Y所經(jīng)歷的退化時(shí)間為T,DY與模式Ci的相似度為SIM(Ci),i=1,2,…,l,將其按照從小到大排序?yàn)椋篠IM(Ck1) ①若T∈DTCk1,則Y屬于模式Ck1; ②若T?DTCk1,則Y不屬于模式Ck1,進(jìn)而判斷T是否在DTCk2,若T∈DTCk2,則Y屬于模式Ck2;以此類推,直到T在某一模式的退化時(shí)間區(qū)間內(nèi),則將其歸為該類模式。 ③若T不是任何一種模式的退化時(shí)間區(qū)間內(nèi),則將Y單獨(dú)作為一類新的退化模式。 退化模式庫(kù)的構(gòu)建是一個(gè)不斷學(xué)習(xí)的過(guò)程,在確定某樣本的退化模式后,可將其加入相應(yīng)的退化模式,更新模式庫(kù),以便更準(zhǔn)確識(shí)別其他測(cè)試樣本。退化模式識(shí)別的具體流程如圖2所示。 圖2 退化模式識(shí)別流程Fig.2 Flowchart of degradation pattern recognition 航空發(fā)動(dòng)機(jī)是一個(gè)復(fù)雜的機(jī)電液磁耦合系統(tǒng),其性能退化并不決定于某一個(gè)變量的退化,而是多個(gè)狀態(tài)變量動(dòng)態(tài)變化且相互耦合的結(jié)果,如溫度、電壓、振動(dòng)等,所以必須充分利用多個(gè)傳感器的特征參數(shù),從中提取能體現(xiàn)系統(tǒng)退化特性的特征參數(shù),才能準(zhǔn)確了解航空發(fā)電機(jī)的退化狀態(tài)。本文對(duì)美國(guó)國(guó)家航空航天局(NASA)提供的航空發(fā)動(dòng)機(jī)全壽命周期退化仿真數(shù)據(jù)進(jìn)行分析,該仿真數(shù)據(jù)是借助商用模塊化航空推進(jìn)器軟件(C-MPASS)獲得的。通過(guò)改變輸入?yún)?shù)模擬風(fēng)扇、高壓渦輪、低壓渦輪、高壓壓氣機(jī)和低壓壓氣機(jī)的故障和性能退化過(guò)程,利用傳感器記錄反映航空發(fā)動(dòng)機(jī)運(yùn)行狀況的21個(gè)監(jiān)測(cè)參數(shù),其中包括低壓壓縮機(jī)出口溫度(T24)、高壓壓縮機(jī)入口溫度(T30)、高壓壓縮機(jī)出口壓力(P30)、風(fēng)扇物理轉(zhuǎn)速(Nf)、核心機(jī)轉(zhuǎn)速(NRc)、涵道比(BPR)、高壓渦輪冷卻引氣流量(W31)、低壓渦輪冷卻引氣流量(W32)和引氣焓值(htBleed)等[21]。不同性能監(jiān)測(cè)參數(shù)與航空發(fā)動(dòng)機(jī)的退化狀態(tài)有不同的相關(guān)性,根據(jù)訓(xùn)練集所有參數(shù)的散點(diǎn)圖和局部加權(quán)回歸(LOESS)散點(diǎn)平滑法選擇有明顯變化趨勢(shì)的14 個(gè)參數(shù)構(gòu)建航空發(fā)動(dòng)機(jī)的狀態(tài)矩陣。 本文選取FD001數(shù)據(jù)集,該數(shù)據(jù)集包含100個(gè)訓(xùn)練集樣本,可作為歷史數(shù)據(jù)進(jìn)行退化模式挖掘。為驗(yàn)證方法的有效性和穩(wěn)定性,利用5折交叉驗(yàn)證,隨機(jī)選擇其中的80個(gè)樣本作為測(cè)試集,剩余20個(gè)樣本作為測(cè)試集。以其中的一次交叉驗(yàn)證為例,介紹退化模式挖掘的流程,具體如下: 首先利用IMTS對(duì)歷史樣本數(shù)據(jù)進(jìn)行分析,篩選對(duì)退化有利的特征。為消除發(fā)動(dòng)機(jī)初期不穩(wěn)定帶來(lái)的影響,選取訓(xùn)練集中發(fā)動(dòng)機(jī)的第6-10個(gè)周期飛行的數(shù)據(jù)作為正常樣本,最終運(yùn)行的5個(gè)周期飛行的數(shù)據(jù)作為異常樣本,各包含500個(gè)樣本。選擇有變化趨勢(shì)的參數(shù)構(gòu)建航空發(fā)動(dòng)機(jī)的評(píng)估矩陣?;鶞?zhǔn)空間有效性驗(yàn)證結(jié)果顯示,超過(guò)98.8%的正常樣本的MD值小于異常樣本的MD值的最小值,說(shuō)明所建立的基準(zhǔn)空間是有效的。利用特征之間的相關(guān)性,按照第1.1節(jié)進(jìn)行特征聚類,取δ1=0.9。利用ReliefF算法計(jì)算特征的權(quán)重,并選擇每一類中權(quán)重最大的特征構(gòu)建特征子集,得到9個(gè)特征,將其按照標(biāo)準(zhǔn)化權(quán)重從大到小的順序排列,如圖3所示。 圖3 特征的權(quán)重占比Fig.3 The weight ratio of each feature 由圖可知,前6個(gè)特征的累積權(quán)重已經(jīng)達(dá)到了93%,因此,選擇NRc、T24、W31、P30、BPR、Nf構(gòu)建優(yōu)化基準(zhǔn)空間。 分別計(jì)算訓(xùn)練集樣本的全壽命周期的MD值和HI。利用CUSUM方法獲取每個(gè)編號(hào)發(fā)動(dòng)機(jī)的退化分段點(diǎn)和退化曲線。結(jié)果顯示,航空發(fā)動(dòng)機(jī)的退化閾值HIi0集中在0.6~0.9之間。結(jié)合航空發(fā)動(dòng)機(jī)退化特性,取平均值HI0=0.745 0作為該類型發(fā)動(dòng)機(jī)的退化閾值,即當(dāng)健康指數(shù)大于0.745 0時(shí),發(fā)動(dòng)機(jī)緩慢退化,處于穩(wěn)定階段;當(dāng)健康指數(shù)小于0.745 0時(shí),發(fā)動(dòng)機(jī)加速退化,處于退化階段,直至完全失效。 根據(jù)退化閾值和健康指數(shù)曲線,確定發(fā)動(dòng)機(jī)的退化曲線,如圖4所示。 圖4 發(fā)動(dòng)機(jī)退化曲線圖Fig.4 Degradation curve of engines 按照DTW層次聚類的步驟,得到如圖5所示的聚類譜系圖。聚類數(shù)目的選取對(duì)模式識(shí)別的準(zhǔn)確率具有重要意義,本文基于以下三個(gè)原則來(lái)確定最佳聚類數(shù)目:①保證各類樣本具有較高的類內(nèi)相似性;②要求各退化模式得到的退化時(shí)間區(qū)間盡量不重疊;③各模式樣本退化時(shí)間在剩余壽命預(yù)測(cè)允許的正向和負(fù)向預(yù)測(cè)誤差(10和-13)內(nèi)。經(jīng)過(guò)多次試驗(yàn),選擇類內(nèi)相似度閾值為85%,最終選擇聚類數(shù)目為7,得到如表1所示的模式分類結(jié)果。分別選取各模式的樣本和退化循環(huán)次數(shù)進(jìn)行對(duì)比,如圖6所示。 圖5 DTW分層聚類譜系圖Fig.5 Dendrogram of DTW hierarchical clustering (a) 不同模式退化曲線對(duì)比 (b) 不同模式退化循環(huán)次數(shù)對(duì)比圖6 不同退化模式對(duì)比Fig.6 Comparison of different degradation modes 表1 基于DTW聚類的模式聚類結(jié)果Tab.1 Model clustering results based on DTW clustering 由圖6(a)可知,各模式的退化趨勢(shì)有明顯的差異。從表1中可以看出,不同退化模式經(jīng)歷的退化時(shí)間區(qū)間存在少量的重疊區(qū)域(模式四和模式五、模式五和模式六),但從圖6(b)中線箱圖可以看出,不同模式的退化時(shí)間存在明顯的差異。因此,可以利用得到的聚類結(jié)果和退化時(shí)間區(qū)間建立全面的系統(tǒng)退化模式庫(kù)。 最后,利用建立的退化模式庫(kù)和退化模式識(shí)別方法,對(duì)待測(cè)樣本進(jìn)行識(shí)別,識(shí)別結(jié)果如表2所示。 表2 模式識(shí)別結(jié)果Tab.2 Model recognition results 為度量模式識(shí)別的準(zhǔn)確性,評(píng)估所有測(cè)試樣本中正確識(shí)別的百分比,借鑒文獻(xiàn)[21]中的準(zhǔn)確率計(jì)算公式,構(gòu)造如下的準(zhǔn)確率計(jì)算公式 (6) 式中:N為待測(cè)樣本個(gè)數(shù);Cor(ei)表示識(shí)別結(jié)果,當(dāng)識(shí)別的樣本的退化時(shí)間在對(duì)應(yīng)的模式區(qū)間內(nèi)時(shí),說(shuō)明預(yù)測(cè)正確,此時(shí)Cor(ei)=1,反之Cor(ei)=0。 通過(guò)計(jì)算可知,除了一個(gè)樣本被錯(cuò)誤識(shí)別到模式七以外,剩余樣本的識(shí)別準(zhǔn)確率為100%。通過(guò)對(duì)比該樣本退化曲線,該樣本的退化時(shí)間不在任何一類中,因此,可將其歸為單獨(dú)一類。 為驗(yàn)證本文方法的穩(wěn)定性,利用5折交叉驗(yàn)證,得到如表3所示的結(jié)果。結(jié)果顯示,得到的模式數(shù)較為穩(wěn)定,準(zhǔn)確率較高,除了第1和第3次交叉驗(yàn)證出現(xiàn)的新模式被誤識(shí)別外,其他測(cè)試樣本均識(shí)別準(zhǔn)確。因此,本文的退化模式聚類和識(shí)別方法是有效的,可以將其作為剩余壽命預(yù)測(cè)的依據(jù)。 表3 交叉驗(yàn)證結(jié)果Tab.3 Cross-validation results 為驗(yàn)證本文方法的在退化模式挖掘中的優(yōu)勢(shì),選擇文獻(xiàn)[18]中的方法從健康指數(shù)構(gòu)建和退化模式聚類兩個(gè)層面進(jìn)行對(duì)比。在健康指數(shù)構(gòu)建方面,本文利用MD累計(jì)和構(gòu)建的健康指數(shù)具有單調(diào)性,而且可以準(zhǔn)確區(qū)分出穩(wěn)定階段和退化階段,而文獻(xiàn)中選擇信號(hào)的時(shí)域特征作為退化趨勢(shì),不單調(diào),且較難識(shí)別故障點(diǎn)。在退化模式聚類方面,航空發(fā)動(dòng)機(jī)退化模式只與退化過(guò)程相關(guān),本文利用退化曲線進(jìn)行DTW聚類,而文獻(xiàn)則使用整個(gè)壽命周期退化趨勢(shì)進(jìn)行DTW分段聚合,相比起來(lái),本文方法更簡(jiǎn)便、合理。 本文針對(duì)復(fù)雜系統(tǒng)的退化模式挖掘方法進(jìn)行了研究,提出了基于IMTS的復(fù)雜系統(tǒng)健康狀態(tài)評(píng)估方法和基于DTW層次聚類算法的退化模式挖掘過(guò)程,通過(guò)NASA 提供的航空發(fā)電機(jī)的全壽命周期內(nèi)的性能監(jiān)測(cè)數(shù)據(jù),驗(yàn)證所提方法的有效性,得到以下結(jié)論: (1) 本文所提的改進(jìn)MTS方法有效地解決了MTS中基準(zhǔn)空間優(yōu)化過(guò)程的不足,在復(fù)雜系統(tǒng)的健康評(píng)估時(shí)不僅能夠降低復(fù)雜系統(tǒng)監(jiān)測(cè)數(shù)據(jù)的維度與冗余性,還能融合多傳感器數(shù)據(jù)構(gòu)建MD度量,為構(gòu)建合理的健康指數(shù)提供可能。 (2) 本文提出的基于DTW層次聚類的退化模式挖掘算法可以構(gòu)建系統(tǒng)全面的退化模式庫(kù),并準(zhǔn)確識(shí)別出待測(cè)樣本的退化模式,能夠?yàn)閺?fù)雜系統(tǒng)剩余壽命預(yù)測(cè)提供依據(jù)。3.3 基于相似度的退化模式識(shí)別
3 實(shí)驗(yàn)與分析
4 結(jié) 論