王 宇,李玉鵬,趙志華
(中國礦業(yè)大學 礦業(yè)工程學院工業(yè)工程系,江蘇 徐州 221116)
機械產品被廣泛應用于各種復雜、嚴苛的環(huán)境中,功能和結構趨于復雜化[1]。機械產品在其生命周期內,在外界環(huán)境(如:溫度、濕度)的壓力下,功能模塊可能出現(xiàn)性能退化,當退化達到一定程度時,將導致相關功能故障、失效,最終影響產品的正常使用[2],甚至帶來重大經濟損失[3]。復雜機械產品的可靠性和維護效果是滿足企業(yè)實際生產需求的重要保障,為了防止其在運行過程中出現(xiàn)急劇退化、降低維修成本、保障正常運行,產品性能退化評估顯得尤為重要[4-5]。
作為產品健康運作和剩余壽命評估的關鍵步驟,產品性能退化評估成為近年來的一個研究熱點。當前,性能退化的評估方法主要分為基于內部機理分析的評估方法和數(shù)據驅動的評估方法兩類。
基于內部機理分析的評估方法采用多學科理論技術對產品內部功能模塊相互耦合關系進行建模,從而反應其行為變動和性能變化。Hanachi等[6]提出一種基于物理模型的性能退化監(jiān)測建模方法,通過熱損失指數(shù)和功率損耗指數(shù)兩個性能指標表征燃氣輪機發(fā)動機的性能退化程度;Zhao等[7]對直齒圓柱齒輪構建分子動力學模型,探索了齒根裂紋萌生與擴展的機制,分析了導致齒輪斷齒的裂紋特性和行為,為研究風力機齒輪工況更為復雜的斷齒機理提供參考;Wang等[8]基于有限元法對光伏組件的物理場進行模擬,將獲得的模組溫度和濕度作為失效物理模型,從而構建性能退化率,并結合輸出功率建立了考慮環(huán)境因素和耦合影響的輸出功率退化模型,來評估光伏組件的退化程度;李慧樂[9]將車橋耦合振動理論引入橋梁疲勞分析,建立了考慮列車與橋梁之間動力相互作用的橋梁疲勞損傷及剩余壽命評估框架,提出一種基于車橋系統(tǒng)隨機振動分析的橋梁疲勞可靠度的評估方法?;趦炔繖C理分析的產品性能退化評估方法可以對產品各系統(tǒng)和功能模塊作出詳細的物理解釋,但是其通常需要充分的先驗知識和多學科知識,需要耗費大量的人力、時間成本,建模過程較為復雜且難以根據特定的機械產品精確地建立物理模型。因此,基于實時監(jiān)測數(shù)據的智能學習技術成為復雜機械產品性能退化評估與預測的有效方法[10]。
數(shù)據驅動的產品性能退化評估方法通過分析產品的運行狀態(tài)信息來評估退化程度[11]。復雜機械產品在運行過程中,大量的溫度、壓力、振動傳感器等信息采集設備可持續(xù)采集和記錄產品功能模塊狀態(tài)數(shù)據[12],例如風電機組、航空發(fā)動機等,機械產品各子系統(tǒng)、功能模塊或部件的狀態(tài)信息均可通過傳感器采集。Wang等[13]提出一種滾動軸承性能退化的健康監(jiān)測與評估體系,分別利用卷積神經網絡和長短時記憶網絡提取局部魯棒特征、序列信息和學習特征,定義H統(tǒng)計量來評估滾動軸承的健康狀況;鄧超等[14]基于維納過程對機電設備進行多性能的退化預測,利用逼近理想解法和馬氏距離對裝備的運行狀態(tài)進行評估;Zhang等[15]提出一種基于多特征融合的滾動軸承性能退化評估方法,利用譜回歸對表征軸承正常狀態(tài)的靜電監(jiān)測系統(tǒng)特征參數(shù)集進行降維處理,消除冗余,根據處理后的特征,建立高斯混合模型評估軸承的健康狀況,并將貝葉斯推斷得到的距離值作為評估性能下降的定量指標來提高靜電監(jiān)測系統(tǒng)的早期退化檢測能力;杜海濤等[16]基于退化數(shù)據建立Gamma模型來表示產品的累積退化量,并結合退化對產品功能的影響程度來衡量產品的退化風險。Wei等[17]利用變分模態(tài)分解將電流信號分解為多個模態(tài)分量,利用隨機森林算法對各模態(tài)分量的時域和頻域特征進行分類,將變分模態(tài)分解和隨機森林結合有效地評估主軸的性能退化。數(shù)據驅動的產品退化評估方法通常對產品多元性能監(jiān)測參數(shù)進行特征提取和降維,構建模型。采用關鍵性能退化參數(shù)的失效閾值表征產品的退化程度,沒有考慮產品功能模塊監(jiān)測參數(shù)之間的相關關系,且評估過程中一般假設退化規(guī)律已知,過程較為復雜。
在許多實際工程問題中,產品功能模塊性能狀態(tài)可由一個或多個性能監(jiān)測參數(shù)表征,且功能模塊之間存在不同程度的相關關系。產品功能模塊之間信息流、能量流和物料流等不同形式的交互,使得性能監(jiān)測參數(shù)之間存在非線性的相關關系,會對退化評估、可靠性分析等結果產生顯著影響。因此,對產品性能進行退化評估時需考慮性能參數(shù)間的相關關系。產品性能存在退化趨勢時,其運行過程中相關參數(shù)的實時監(jiān)測數(shù)據相對于正常狀態(tài)往往會產生偏離[10],數(shù)據驅動的退化評估方法重點識別并分析原始監(jiān)測數(shù)據中少數(shù)發(fā)生偏離的數(shù)據,以達到退化評估的目的。離群點檢測是數(shù)據挖掘領域的關鍵問題之一,其目的是發(fā)現(xiàn)較剩余對象存在異常的小規(guī)模目標群[18],來揭示系統(tǒng)的異常狀態(tài)和行為[19]。離群點憑借其獨特的機制和有價值的信息在專家系統(tǒng)和智能系統(tǒng)中發(fā)揮著重要作用[20],已經廣泛應用于入侵檢測[21]、圖像處理[22]、醫(yī)療[23]、設備健康監(jiān)測[24]等領域;同時,離群點檢測方法的研究相對較為成熟,可以處理數(shù)值型[25]、字符型[26]、混合型[27]等不同類型的數(shù)據。基于鄰域粗糙集的離群點檢測[20,28]方法可以有效地揭示樣本數(shù)據點之間的相關關系,離群點的離群得分可用于表征產品性能的退化程度。因此,產品性能退化評估從本質上可以看作是一類離群點檢測問題。
綜上所述,本文將離群點檢測引入產品性能退化評估,首先基于鄰域粗糙集理論和功能結構關聯(lián)性確定性能監(jiān)測參數(shù)之間的相關關系;然后基于信息熵表征某一特定性能監(jiān)測參數(shù)的不確定性程度,結合性能監(jiān)測參數(shù)之間的相關關系所包含的知識構建退化評估指標,最終得到每個監(jiān)測參數(shù)的退化得分;最后,采用主成分分析法對性能監(jiān)測參數(shù)賦予權重,從而得到功能模塊的綜合退化得分。
粗糙集能夠對知識進行分析與推理,有效處理各種模糊、不一致、不完備的信息,不需要先驗知識,基于問題本身的數(shù)據集潛藏的規(guī)則,提煉出有價值的信息,并簡化處理信息[29],將粗糙集理論引入產品性能退化評估問題可提高推理效率。鄰域粗糙集不同于傳統(tǒng)粗糙集,可以同時處理連續(xù)和離散數(shù)據集。
在信息系統(tǒng)IS=(U,Q,V,f)中:U={u1,u2,…,un},表示對象的非空有限集合;Q表示屬性的非空有限集合;V表示屬性的值域;f作為一種映射關系反映對象集合之間的值,表示為:f(ui,q)∈Vq,?q∈Q。距離是兩個數(shù)據系統(tǒng)中構造鄰域粗糙集的基本工具。
對于任意集合U的對象,基于距離函數(shù)的鄰域定義為:
N(ui)={y∈U|d(ui,uk)≤r}。
(1)
其中:當r≥0時被稱為鄰域半徑;N(ui)表示基于距離公式與對象ui距離不超過r的元素,任意對象的鄰域均由距離函數(shù)和鄰域半徑共同決定和表示,用于描述對象在距離上的不可區(qū)分性。集合U中對象的鄰域關系表示為:
NR={(ui,uk)∈U×U|d(ui,uk)≤r}。
(2)
基于離群點檢測的產品性能退化評估方法主要分為兩個步驟:①挖掘性能參數(shù)間的相關關系;②構建評估產品功能模塊的退化指標,具體內容如圖1所示。
(3)
為了降低性能監(jiān)測參數(shù)間相關關系對退化評估結果的影響,本文同時基于鄰域粗糙集理論及產品功能結構關聯(lián)性確定性能監(jiān)測參數(shù)之間的相關關系。
(1)基于鄰域粗糙集理論
從數(shù)據挖掘的角度,基于鄰域粗糙集理論可以有效地揭示數(shù)據點之間的客觀關系。性能監(jiān)測參數(shù)pi在第j個監(jiān)測時間段內的鄰域為:
i,k=1,2,…,n,j=1,2,…,m。
(4)
性能監(jiān)測參數(shù)之間的鄰域關系記作:
(5)
(2)基于功能結構關聯(lián)性
產品功能模塊之間通常在功能、結構等方面存在一定的相關關系。產品的內部結構很大程度上取決于產品的設計原理和所要實現(xiàn)的功能,根據其工作原理的不同改變產品內部結構,從而使產品的外部造型產生差異。產品在運行過程中,各功能模塊之間不是孤立存在的,功能模塊之間的信息流、能量流和物料流等會使性能監(jiān)測參數(shù)之間存在不同程度的相互影響關系,這一部分參照產品的設計原理或由相關設計人員給出,即
N(pi,pk)=
(6)
則性能監(jiān)測參數(shù)之間的關聯(lián)性記作:
LRj={(pi,pk)∈P×P|N(pi,pk)=1}。
(7)
綜上所述,同時考慮基于鄰域粗糙集理論和功能結構關聯(lián)性確定性能監(jiān)測參數(shù)之間的鄰域關系和關聯(lián)性,性能監(jiān)測參數(shù)之間的相關關系表示為:
CRj={NRj∪LRj}。
(8)
假設性能參數(shù)之間的相關關系所包含的知識為:
(9)
信息熵用來度量信息量的不確定程度,基于性能參數(shù)相關關系的信息熵能夠很好地描述相關關系中知識的不確定性,即
(10)
為了探索某一特定性能參數(shù)pi對整個產品性能參數(shù)集P中信息量不確定性的影響程度,首先從P中移除某一產品性能參數(shù)pi,然后按照式(3)~式(8)重復以上步驟,獲得(P-{pi})之間的相關關系CRj′(pi)。參照式(9),假設剩余性能參數(shù)相關關系所包含的知識為:
l′=1,2,…,n-1。
(11)
則基于剩余產品性能參數(shù)相關關系的信息熵可表示為:
(12)
基于剩余產品性能參數(shù)(P-{pi})相關關系的信息熵INEj(pi)完全參照基于性能參數(shù)P相關關系的信息熵INEj的表達式,能夠很好地反映pi的不確定性程度。系統(tǒng)總是朝著熵增或不變的方向發(fā)展,當移除某一性能參數(shù)pi后,若INEj(pi)相比INEj減小,則說明pi有較高的不確定性偏離大多數(shù)值;若INEj(pi)相比INEj增大或不變,則pi有較低的不確定性偏離大多數(shù)值。為此,構建相對信息熵來反映INEj和INEj(pi)之間熵的變化,即:
RINEj(pi)=
(13)
基于參數(shù)相關關系的相對信息熵RINEj(pi)可以同時測量某一產品性能參數(shù)pi的不確定性和偏離大多數(shù)值的程度,RINEj(pi)值越大,pi的不確定性和偏離程度越大。但對于產品性能的退化評估,基于性能監(jiān)測參數(shù)相關關系的相對信息熵是充分非必要條件。為此,引入基于性能參數(shù)相關關系的相對基數(shù)來改進這一參數(shù):
(14)
(15)
DNDj(pi)能夠更好地反應某一產品性能參數(shù)pi在監(jiān)測時間段內偏離正常范圍的程度,即退化程度。綜合考慮多個監(jiān)測時間段,產品性能參數(shù)的退化得分被定義為:
(16)
產品運行過程中,功能模塊的性能通常可以由一組可持續(xù)動態(tài)監(jiān)測的性能參數(shù)集合來描述,且不同功能模塊的性能處于不同的退化狀態(tài)中。每個功能模塊的性能狀態(tài)可以由一個或多個性能參數(shù)直接或間接反應,由于各性能參數(shù)對相應功能模塊功能實現(xiàn)的貢獻大小不同,當產品的退化程度由多個性能監(jiān)測參數(shù)反映時,采用單個關鍵性能參數(shù)對產品進行退化評估可能會忽略其他性能參數(shù)蘊含的信息,導致評估結果不夠準確。因此,基于主成分分析法對性能監(jiān)測參數(shù)賦予權重,全面考慮產品各功能模塊對應的多個性能監(jiān)測參數(shù)從而得到各功能模塊的退化得分。
假設產品C包含A個功能模塊,每個功能模塊Fa(a=1,2,…,A)可由一個或多個性能參數(shù)表征其功能的實現(xiàn),則產品功能模塊退化得分
a=1,2,…,A。
(17)
式中Na、DDpi(Fa)和Gpi(Fa)分別表示與第a個功能模塊對應的性能監(jiān)測參數(shù)的總個數(shù)、退化得分和權重。基于離群點檢測的產品性能退化評估方法偽代碼如下:
算法1基于離群點檢測的產品性能退化評估方法。
輸入:產品性能監(jiān)測參數(shù)原始數(shù)據集n×m;
輸出:產品各功能模塊的退化得分。
//數(shù)據標準化處理
1:For i=1 to n
2:For j=1 to m
4:End for
5:End for
//產品性能監(jiān)測參數(shù)的相關關系CRj
6:For i=1 to n
8:LRj←{(pi,pk)∈P×P|N(pi,pk)=1}
9:CRj←{NRj∪LRj}
10:End for
//計算功能模塊退化程度
11:For i=1 to n
13:DNDj(pi)←
14:End for
15:For j=1 to m
17:End for
18:For i=1 to A
20:End for
風電機組通過風輪把風作用在槳葉上的力轉化為自身的轉速和扭矩,通過主軸、增速箱、聯(lián)軸器和高速軸將扭矩和轉速傳遞到發(fā)電機,實現(xiàn)風能到機械能再到電能的轉換。風電機組由傳動系統(tǒng)、偏航系統(tǒng)、剎車系統(tǒng)、支撐系統(tǒng)、冷卻潤滑系統(tǒng)和電控系統(tǒng)6大系統(tǒng)組成,通常運行在變風載、大溫差、高海拔、強沙塵、臺風等惡劣的工況下,隨著運行時間的增加,機組會出現(xiàn)不同程度退化,極大地影響使用壽命[30]。當各子系統(tǒng)功能退化到一定程度將造成機組停機,機組停機時間過長則會嚴重影響發(fā)電量,且其安裝、維護困難,運營成本、維護費用高[31]。因此,對風電機組各系統(tǒng)功能模塊的退化評估極為重要,企業(yè)可根據評估結果對相應的功能模塊按退化程度顯著程度采取維護、保養(yǎng)、維修或更換等措施,從而保證機組的正常運行。本節(jié)將以風電機組性能退化評估為例驗證所提方法的有效性。
表1 R80711風電機組性能監(jiān)測參數(shù)
續(xù)表1
續(xù)表1
R80711風力發(fā)電機組性能退化評估具體步驟如下:
步驟1首先取1 000條數(shù)據(1月份)計算R80711風電機組性能監(jiān)測參數(shù)之間的相關關系。
(1)基于鄰域粗糙集理論的性能監(jiān)測參數(shù)鄰域關系隨運行時間與所取參數(shù)值確定,如某時段內的參數(shù)鄰域關系如表2所示。
表2 基于鄰域粗糙集理論的R80711風電機組性能參數(shù)鄰域關系
(2)基于功能結構關聯(lián)性的性能監(jiān)測參數(shù)相關性不隨運行時間而變化,如表3所示。
表3 基于功能結構關聯(lián)性的R80711風電機組性能參數(shù)關聯(lián)性
續(xù)表3
由式(8)得出的性能參數(shù)相關關系隨運行時間與所取參數(shù)值確定,如某時段內的參數(shù)相關關系如表4所示。
表4 某時段R80711風電機組性能參數(shù)相關關系
步驟2各性能參數(shù)退化得分如表5所示。
表5 R80711風電機組各性能參數(shù)退化得分
步驟3主成分分析法確定各功能模塊相應性能參數(shù)的權重如表6所示。
表6 R80711風電機組各性能參數(shù)權重
續(xù)表6
步驟4根據式(17)得到各功能模塊的退化程度,如表7所示。
表7 基于離群點檢測的R80711風電機組各功能模塊的退化得分
為直觀地看到各功能模塊的退化得分,將表7的結果繪制成點線圖,如圖2所示。
如圖2所示,槳葉的退化得分最高,為0.706 572 5;其次為變矩器,退化得分為0.670 305。風力發(fā)電是將風的動能轉變成機械動能,再將機械能轉化為電力動能,當風吹向漿葉時,槳葉上產生氣動力驅動風輪轉動,從而將風的動能轉變?yōu)闄C械能;變矩器的作用是保證在風輪轉速變化時,發(fā)電機的輸出軸轉速恒定。因此,在該月檢修中應重點關注槳葉和變矩器。
(1)首先選取不同時段內的R80711風電機組運行狀態(tài)對其各功能模塊進行退化評估。表8所示為R80711風電機組各功能模塊(變矩器、齒輪箱、發(fā)電機、輪轂、機艙、變速箱、轉子軸承和槳葉)在不同月份的退化得分。為了便于比較各功能模塊在不同時段的退化得分,將表9的結果繪制成點線圖,如圖3所示。
表8 不同時段R80711風電機組各功能模塊的退化得分
風電機組屬于壽命長、高可靠性的復雜機械產品,在其生命周期內,各功能模塊的退化程度應趨于穩(wěn)定(如圖3),1~2月份各功能模塊的退化得分波動略大,2月之后各功能模塊的退化得分趨于穩(wěn)定,波動較小,該結果與現(xiàn)狀相吻合,一定程度上說明了所提方法的可行性。
(2)基于鄰域粗糙集理論從數(shù)據挖掘的角度揭示了性能參數(shù)之間的鄰域關系,基于性能參數(shù)鄰域關系的R80711風電機組各功能模塊的退化得分如表9所示。
表9 基于性能參數(shù)鄰域關系的R80711風電機組各功能模塊的退化得分
將表7和表9的結果乘以104繪制成點線圖(如圖4),以比較基于性能參數(shù)相關關系和鄰域關系的R80711風電機組各功能模塊的退化得分。
如圖4所示,基于性能參數(shù)相關關系和鄰域關系求得的R80711風電機組各功能模塊的退化得分排序相同,即槳葉、變矩器、變速箱、齒輪箱、發(fā)電機、輪轂、轉子軸承、機艙,但是基于性能參數(shù)鄰域關系求得的各功能模塊的退化得分小于基于性能參數(shù)相關關系的評估結果,會導致評估信息不準確,高估產品的可靠性?;陔x群點檢測的產品性能退化評估同時考慮性能參數(shù)之間的鄰域關系和功能結構關聯(lián)性導致的參數(shù)相關關系,評估信息更加全面,結果也更接近實際情況。
(3)數(shù)據驅動的產品退化評估方法通常對產品多元性能監(jiān)測參數(shù)進行特征提取和降維,構建模型,通過單個關鍵性能退化參數(shù)(即任何一個性能參數(shù)退化至閾值時產品即發(fā)生失效)表征產品的退化程度。文獻[5]定義性能指數(shù)來量化風電機組性能狀態(tài)的異常程度,通過分析性能異常點,基于高斯Copula熵估計互信息值來衡量性能監(jiān)測參數(shù)與性能指數(shù)之間相關性的強弱,互信息值越大,說明該性能監(jiān)測參數(shù)與性能指數(shù)的相關性程度越高,以確定關鍵性能參數(shù),并將其映射到風電機組對應的功能模塊,從而表征功能模塊的評估結果。當產品功能模塊的退化表征在一個參數(shù)上時,采用單個關鍵參數(shù)反應該功能模塊的退化較為合理,但實際中存在多個性能參數(shù)的產品功能模塊(如表1),齒輪箱、發(fā)電機和槳葉均對應多個性能監(jiān)測參數(shù),現(xiàn)將采用單個關鍵參數(shù)和考慮多性能參數(shù)得到的齒輪箱、發(fā)電機和槳葉的退化得分進行對比,如圖5所示。
槳葉的性能狀態(tài)表征在2個性能參數(shù)上,除1月份外,其他各月份采用單個關鍵性能參數(shù)和考慮多個性能參數(shù)得到的退化結果相差不大;發(fā)電機的性能狀態(tài)表征在5個性能參數(shù)上,采用單個關鍵性能參數(shù)得到的退化結果明顯大于考慮多個性能參數(shù)得到的退化結果。由于各功能模塊的退化趨勢不一定一致,當表征功能模塊退化程度的性能參數(shù)較少時,采用單個關鍵性能參數(shù)和考慮多個性能參數(shù)得到的退化結果可能相差不大,但當表征功能模塊退化程度的性能參數(shù)較多時,采用單個關鍵性能參數(shù)得到的結果往往會大于考慮多個性能參數(shù)得到的退化結果。因此,對于具有多個性能退化參數(shù)的產品功能模塊而言,是否考慮多個性能參數(shù)對于評估結果影響很大,基于單個關鍵性能參數(shù)評估得到的功能模塊退化得分高于綜合考慮多個性能參數(shù)得到的結果,采用單一性能參數(shù)會人為放大產品功能模塊的退化程度,低估產品的可靠性,不符合實際情況。
(4)基于近鄰度的方法在模式識別和數(shù)據挖掘中得到了廣泛的討論和應用,Chen等[32]將粗糙集粒度技術與離群點檢測相結合,提出一種基于鄰域的離群點檢測方法。分別基于該方法與本文所提方法對R80711風電機組各功能模塊進行評估,評估結果如圖6所示。
本文所提方法考慮了性能參數(shù)之間的相關關系,且得到的評估結果位于[0,1]之間,可直接根據各功能模塊的得分來判斷其退化程度;基于鄰域的異常點檢測方法直接對未經處理原始數(shù)據進行計算,存在誤差,得到的評估結果根據對象所取數(shù)值大小而定,無法直接根據對象的得分反應退化特性,且該方法計算較為簡單,忽略了實時監(jiān)測數(shù)據中存在的其他信息,導致評估結果不夠全面。
本文將產品性能退化評估描述為基于異常定義區(qū)分的離群點檢測問題,提出基于離群點檢測的產品性能進行退化評估?;卩徲虼植诩碚摗a品功能結構關聯(lián)性,對產品運行狀態(tài)實時監(jiān)測數(shù)據進行分析,挖掘產品性能參數(shù)之間的相關關系,由此構建相應的退化指標用于鑒別相關功能是否存在退化乃至故障風險??紤]到實際應用中,產品功能模塊的性能狀態(tài)可能表征在多個性能監(jiān)測參數(shù)上,且各參數(shù)對相應功能模塊功能實現(xiàn)的貢獻大小不同,利用主成分分析法對性能監(jiān)測參數(shù)賦予權重,從而得到產品各功能模塊的退化程度。以R80711風電機組為例,通過對比分析驗證了所提方法的有效性。該方法不需要先驗知識,用時少,有助于實現(xiàn)實時診斷、評估。但是,產品性能狀態(tài)受運行工況的影響,如何在識別、劃分運行工況的基礎上,將離群點檢測引入產品性能退化評估是下一步的研究方向之一。