何大偉, 彭靖波, 胡金海, 李騰輝, 賈偉州
(空軍工程大學 航空航天工程學院,西安 710038)
診斷是以機械學和信息論為依托、多學科融合的技術,本質是模式識別[1]。現(xiàn)代機械設備結構復雜、故障率高,且故障征候難以判斷,無法完全依靠傳統(tǒng)方法建立精確的物理模型進行管理監(jiān)控[2],同時,機械設備在實際的運行過程中會隨時間產生大量的性能參數(shù)數(shù)據(jù)。通常情況下,對象的性能參數(shù)與其運行狀態(tài)具有一定聯(lián)系,例如在航空發(fā)動機的運行過程中,其性能參數(shù)在不同的工作狀態(tài)下表現(xiàn)出不同的函數(shù)形式和映射關系[3],因此基于數(shù)據(jù)驅動的故障檢測方法不僅有效、合理,同時,能避免基于模型方法要求的模型必須定量、準確等缺點,已成為研究的熱點[4-5]。
SVM(Suppot Vector Mechine)算法使用結構風險最小化準則構造決策超平面,在處理高維樣本時具有較高的精度和泛化能力[6],由于其應用性強和拓展空間較大的特點,目前已廣泛應用在機械故障診斷研究領域。文獻[7]提出了一對一SVM多分類方法,并對軸承故障進行了有效診斷;文獻[8]基于SVM研究了軸承故障檢測方法,提高了軸承故障的診斷精度。但上述方法的基本假定前提是每個樣本的誤分類代價相等,在實際故障診斷中,該假設一般情況下難以滿足,同時,由于故障類樣本數(shù)量遠少于正常類樣本,且當故障發(fā)生時,設備已無法進行工作,會造成樣本類數(shù)據(jù)不平衡的問題[9],這在航空發(fā)動機軸承的故障診斷中尤為顯著。
在樣本類不平衡的問題中,SVM分類算法會在多數(shù)據(jù)類樣本中產生過擬合[10],忽略樣本數(shù)少的類別。針對這一問題,文獻[11]基于代價敏感的半監(jiān)督Laplacian支持向量機在7個UCI 數(shù)據(jù)集和8個NASA 軟件數(shù)據(jù)集上有效解決數(shù)據(jù)集的不平衡性問題,文獻[12]研究基于委員會投票選擇(Modified Query By Committee,MQBC)和代價敏感支持向量機(Cost-Sensitive Support Vector Machine,CS-SVM) 的故障檢測方法,提高了CS-SVM對類不平衡樣本的故障檢測率。
上述文獻對基本CS-SVM進行了改進,提高了對類不平衡樣本的識別準確率,但在CS-SVM的參數(shù)選取中具有隨機性,且未證明其合理性。在CS-SVM算法中,核函數(shù)參數(shù)的選擇是至關重要的,傳統(tǒng)的SVM參數(shù)大都由人工設定,憑借的只是個人經驗,通常需要做多次試驗,才能選擇一個較為合適的參數(shù),不僅耗時費力,得到的參數(shù)可能仍然不是最優(yōu)參數(shù)[13],針對此問題,本文提出利用改進FOA算法優(yōu)化CS-SVM參數(shù),并結合隨機共振、KPCA(Kemel Principal Component Analysis)特征提取方法,對IMS(Intelligent Maintenance Systems)航空軸承數(shù)據(jù)進行測試,為有效提高軸承故障診斷和預測正確率提供思路和手段。
Vapnik[14]在20世紀60年代對有限樣本情況下的機器學習進行了研究,限于理論研究瓶頸,并未將其付諸實踐,直到20世紀90年代,隨著統(tǒng)計學習理論的逐漸成熟,SVM成為了一個較完善的機器學習方法。SVM最優(yōu)超平面分類原理,如圖1所示。
按照確定的非線性映射將樣本集向量{xi},i=1,2,…,n映射至高維特征空間Z, 即φ:Rm→Z,x→φ(x), 則訓練集能被一個最優(yōu)超平面H:w·{φ(x)}+b=0準確無誤地分為兩類
(1)
式中:H1與H2為兩個平行于H且平面之間無樣本點、距離最大的超平面,此距離稱為分類間隔,其值為2/‖w‖;ξi≥0;為松弛量。
圖1 支持向量機最優(yōu)超平面分類原理圖Fig.1 The diagram of SVM optimal hyper-plane classification principle
為使兩超平面之間的分類間隔最大且無樣本點,則約束方程描述為
yi({ω}{φ(xi)}+b)-1+ζi≥0,i=1,2,…,n
(2)
求解最優(yōu)分類超平面H就是求解
(3)
式中:C為規(guī)則化常數(shù),即經驗風險與VC維復雜性之間的權衡。
建立此凸二次規(guī)劃優(yōu)化問題的Lagrange函數(shù), 對式中{ω},b,ξi求偏導并令其為0, 可推導其Lagrange函數(shù)的對偶形式及其對應的決策函數(shù)。
對于ξi=0的標準支持向量,有
{ω}{φ(xi)}+b=1
(4)
即滿足
(5)
(6)
則滿足穩(wěn)定性的閾值為
(7)
在故障診斷中: 一方面是正常類樣本數(shù)量遠多于故障類;另一方面是考慮到將故障類錯分為正常類的危害性遠大于將正常類錯分為故障類,因此要對正、負類樣本分別采用不同的規(guī)則化常數(shù)C+,C-[15],此時對應的最優(yōu)分類超平面H優(yōu)化問題為
(8)
式(4)~式(8)聯(lián)立即可得到代價敏感支持向量機(CS-SVM)。為了使CS-SVM模型更加聚焦于數(shù)量少的故障樣本,降低將故障樣本錯分為“正常”的錯分率,則需要將數(shù)量較少的故障類別樣本集對應的規(guī)則化常數(shù)C+或C-取值增大,即增大故障類樣本錯分代價。
果蠅優(yōu)化算法FOA(Fly Optimization Algorithm)[16]是根據(jù)果蠅覓食行為提出的優(yōu)化算法。作為一種新型進化算法,相比蟻群算法、遺傳算法、魚群算法等其他傳統(tǒng)優(yōu)化算法具有參數(shù)設置少、程序實現(xiàn)簡單和運算速度快等優(yōu)點,在科學和工程領域都得到了應用。
果蠅優(yōu)化算法的本質為果蠅依靠嗅覺搜索食物源并逐漸向食物方向靠近[17],果蠅群體搜索食物源的過程,如圖2所示。
步驟如下:
圖2 果蠅群體搜索食物的過程Fig.2 The diagram of FOA algorithm
步驟1初始化FOA算法參數(shù);
(9)
(10)
(11)
步驟5找出濃度值最大個體的位置
(12)
步驟6保留最大濃度位置并更新群體位置(X′,Y′);
步驟7進入迭代尋優(yōu),重復執(zhí)行步驟2~步驟6,并判斷味道濃度是否優(yōu)于前一迭代味道濃度,直至迭代次數(shù)達到最大迭代數(shù)。
盡管果蠅算法有諸多優(yōu)點,但通過分析可知,其搜索步長為固定值,根據(jù)介值相關理論[18],在實際優(yōu)化問題中,較優(yōu)解周圍可能存在更優(yōu)解,從而易陷入局部最優(yōu),因此為了改進由于固定步長取值帶來的全局搜索與局部搜索能力的不足,提出利用混沌搜索方法[19],在步長選取前進行混沌優(yōu)化,從而避免陷入局部最優(yōu)。
Logistic映射系統(tǒng)模型如下
zk+1=f(m,zk)=mzkg(1-zk),zk∈[0,1]
(13)
當μ=4時,系統(tǒng)處于混沌狀態(tài)。具體IFOA(Improved Fly Optimization Algorithm)的實現(xiàn)策略如下:在初始化FOA參數(shù),進行完第一次濃度計算后,對果蠅種群個體隨機生成兩個n維變量。
根據(jù)混沌模型式(13),將得到的(a2,b2)各個分量載波至擾動范圍[-d,d],則擾動量式(14)、搜索步長增益式(15)如下
(14)
(15)
(16)
將改進策略加入果蠅優(yōu)化算法,則式(9)改進為
(17)
根據(jù)算法的改進, 改進FOA算法在每次迭代時,步長將執(zhí)行一次混沌搜索,全局尋優(yōu)能力增強,隨著進化代數(shù)的增加,將避免陷入局部最優(yōu),更好實現(xiàn)全局搜索。
本文提出采用改進IFOA算法對CS-SVM規(guī)則化常數(shù)C+,C-與核函數(shù)參數(shù)g進行優(yōu)化選取。參數(shù)選擇步驟如下:
步驟1初始化FOA參數(shù);
步驟2根據(jù)群體的當前位置,獲取C+,C-及g值;并利用訓練數(shù)據(jù)建立CS-SVM分類模型,再利用測試數(shù)據(jù)計算適應度函數(shù),并考慮適應度函數(shù)的獎勵與懲罰機制輸出得到適應度函數(shù)值;
步驟3根據(jù)最佳濃度函數(shù)更新果蠅種群中最佳個體的濃度;并更新果蠅種群的位置;
步驟4基于混沌搜索理論對FOA算法的優(yōu)化策略,對果蠅種群的位置進行更新,實現(xiàn)全局尋優(yōu);
步驟5判斷算法收斂準則是否滿足。如不滿足收斂準則,則轉步驟2;如滿足收斂準則,則輸出最優(yōu)參數(shù)C+,C-及g,算法結束。
為了測試所提出算法的尋優(yōu)性能,選取遺傳算法(Genetic Algorithm,GA)、粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)、FOA和IFOA,通過測試函數(shù)進行對比仿真,本文在此僅列舉Sphere函數(shù)的測試結果。
Sphere函數(shù)
(18)
該函數(shù)在(0,…,0)處取得最小值0。
測試函數(shù)的復雜度會隨著維數(shù)和迭代次數(shù)的增加而增加,適合測試算法的尋優(yōu)性能。四種算法參數(shù)設置基本保持一致,同時考慮到果蠅算法與其他智能算法之間可能存在的最優(yōu)種群參數(shù)帶來影響,迭代次數(shù)iter依次選取為50,100,150,200, 種群規(guī)模N依次選取為10,20,30,40,50。iter=200,N=50的測試結果如圖3所示。
圖3 Sphere函數(shù)的收斂曲線Fig.3 The convergence curve of Sphere
由測試結果可知,IFOA算法相較于其它智能算法表現(xiàn)出較好的收斂速度和精度,GA算法雖然前期收斂較快,但后期不穩(wěn)定。其他組合種群參數(shù)的收斂結果與此趨勢相同,限于篇幅不在列出,由此確定了IFOA算法在尋優(yōu)過程中的優(yōu)越性。
通過美國辛辛那提大學智能維護中心(IMS)的航空軸承疲勞壽命試驗數(shù)據(jù)[20]對“2.3”節(jié)方法所提方法進行驗證。IMS航空軸承疲勞壽命試驗機由主體部分、傳動部分、加載系統(tǒng)、潤滑系統(tǒng)及控制電路等組成,其結構示意圖如圖4所示。試驗軸上安裝著4個試驗軸承。交流電機驅動試驗軸,試驗轉速為2 000 r/min。徑向載荷為26.67 kN。
圖4 IMS航空軸承試驗臺結構示意圖Fig.4 The structure diagram of IMS aviation bearing test
試驗軸承為ZA-2115雙列腰鼓形滾子軸承。每列含16個滾子,節(jié)圓直徑為71.501 mm,滾動體直徑為8.407 mm,壓力角為15.17°。振動信號通過安裝在軸承座上的PCB(Printed Circuit Board)的高靈敏度ICP(Integrated Circuits Piezoelectric)加速度傳感器353B33進行監(jiān)測,同時選用4個熱電偶溫度傳感器監(jiān)測軸承溫度和潤滑情況。振動信號利用NI公司的DAQCard-6063E數(shù)字采集器記錄,采樣頻率為12 kHz。
在機械故障診斷系統(tǒng)中,有效值通常用于描述振動信號的能量,是信號的二階矩統(tǒng)計平均,有效值Xrms又稱為均方根值
(19)
考慮到軸承方根幅值與有效值Xr在反映軸承運轉狀態(tài)上的相似性及目前體現(xiàn)方根幅值的研究內容較少,本文選用方根幅值來對軸承振動的異常情況進行表示,方根幅值計算公式
(20)
由于軸承在發(fā)生故障前已存在故障征候,真實故障點在試驗中無法準確識別,為了實現(xiàn)模型對軸承故障的預測,需要人工提前設定故障預判點,以試驗1的 3#軸承內圈故障數(shù)據(jù)為例進行分析。圖5為該軸承的方根幅值在全壽命期內的變化趨勢,本文設定故障預判點如圖5所示。故障預判點到軸承停止工作點的時長為軸承內圈故障的總時間,即故障類樣本時間為44 100~47 700 min,正常樣本時間為0~44 100 min,有效試驗采樣間隔為20 min采樣1次,選取正常類樣本900組,故障類樣本153組,選取的故障類樣本主要為故障征候區(qū)域樣本。
圖5 IMS航空軸承試驗1的3#軸承的方根幅值Fig.5 The root amplitude of IMS 1st No.3 aviation bearing
為提高預測準確率,需剔除軸承信號中的噪聲影響,首先采用經改進免疫粒子群優(yōu)化參數(shù)的隨機共振預處理方法[21]對軸承振動信號進行降噪處理,提取時域、頻域、時頻域特征[22],通過振動信號描述轉子工作狀態(tài)的指標眾多,本文選擇了8個常用的基于統(tǒng)計特性的指標
{Pt1,Pt2,TV,UV,Cf,If,Clf,Sf}
(21)
式中:Pt1為絕對平均值;Pt2為均方值;TV為歪度指標;UV為峭度指標;Cf為峰值指標;If為脈沖指標;Clf為裕度指標;Sf為波形指標。以上8個原始特征無量綱指標形式簡單、數(shù)量有限,且可分性指標較差,圖6列出了Pt1,Pt2的可分性關系。
為能更好構造和選擇軸承故障本質的特征參數(shù),利用KPCA法[23]進行特征提取,計算選取貢獻率最高的兩類特征,得到新的特征集:KPC1,KPC2,并進行歸一化處理,投影至二維平面如圖7所示。
圖6 試驗1的3#軸承原始特征Pt1,Pt2的2維平面投影Fig.6 The 2D plane projection of IMS 1st No.3 aviation bearing original Pt1 and Pt2 feature
圖7 經隨機共振預處理的試驗1的3#軸承KPCA特征2維平面投影Fig.7 The 2D plane projection of IMS 1st No.3 aviation bearing original feature
表1為圖6、圖7兩種特征集的可分性參數(shù)比較,可分性數(shù)值越大代表可分性越好,經所選預處理方法處理后的特征具有更好的可分性,有利用后期軸承故障征候識別。
表1 不同特征集的可分性指標
在CS-SVM訓練及測試中,將上述經預處理的900組正常樣本歸為正類(yi=1),將153組內圈故障樣本歸為負類(yi=-1),選擇各正類、負類樣本的2/3樣本作為訓練集,剩余1/3樣本作為測試集。
采用所提出的IFOA算法對CS-SVM模型進行參數(shù)優(yōu)化。取果蠅種群規(guī)模為50,初始步長為30,最大迭代次數(shù)為200,選擇測試正確率作為適應度函數(shù),C+,C-及g的尋優(yōu)范圍設為[0.01,1 000]。
3.2.1 IFOA優(yōu)化的CS-SVM方法驗證
在診斷模型建立階段分別采用CS-SVM、基本SVM方法進行測試驗證。由于故障類樣本錯分代價高于為正常類錯分代價,因此需提前確定好C-與C+的關系。通常采用的方法是將兩類樣本數(shù)目的反比作為懲罰參數(shù)之比,即IR(Imbalance Ratio)方法[24],但是在IR中使用樣例的數(shù)目之比來彌補分類器的偏斜程度具有一定的局限性,因為數(shù)據(jù)的不平衡程度可能并不僅僅取決于兩類樣例的數(shù)據(jù)差異,也可能和樣例在空間中的分布相關。
為此本文采用基于樣本總體的平均密度選取參數(shù)的 AD(Average Density)法[25],對試驗1的 3#軸承內圈故障全壽命期數(shù)據(jù)進行計算,按照圖5劃分的正常類和故障類樣本確定C-與C+的比例關系:C-=1.4C+,在此比例關系基礎上進行尋優(yōu)計算。
對預處理后數(shù)據(jù)采用所提IFOA算法優(yōu)化得到的CS-SVM參數(shù)為C+=141.575,C-=198.205,g=160.941 6, 總診斷正確率為86.03%(302/351); 正類正確率為89.67%(269/300); 負類正確率為64.71%(33/51), 即在故障類樣本中有35.29%的錯分率。
預處理方法不變,采用IFOA優(yōu)化基本SVM參數(shù)為C=67.202 9,g=0.747 68, 總診斷正確率為83.19%(292/351); 正類89%(267/300); 負類49.02%(25/51), 即在故障類樣本中有50.98%的錯分率。
未經預處理,采用IFOA算法優(yōu)化基本SVM算分,得到參數(shù)為C=104.698 4,g=6.785 1, 總診斷正確率為69.52%(244/351); 正類74%(222/300); 負類43.14%(22/51),即在故障類樣本中有56.86%的錯分率,分類結果如表2所示。
表2 不同方法的診斷結果比較(900∶153)
綜上所述,對于相同模型(如基本SVM)而言,采用本文所提出的預處理方法提高了正類、負類及總體的診斷正確率;對于相同的預處理特征,所提的CS-SVM方法與基本SVM相比,在保證正類和總體樣本診斷正確率基本不變的情況下,提高了數(shù)量較少、錯分代價更高的故障類樣本的診斷正確率。測試集真實類別與模型診斷類別的比較,如圖8~圖10所示。
3.2.2 不平衡樣本比例及不同方法的驗證性分析
本節(jié)驗證所提的CS-SVM方法對不同比例的正、負類樣本診斷效果。為便于比較,以下仍分別采用CS-SVM和基本SVM方法進行測試驗證。
圖8 原始特征+改進FOA+基本SVM診斷結果Fig.8 The result of original characteristics+ IFOA+basic SVM classification
圖9 自適應SR+KPCA+改進FOA+基本SVM診斷結果Fig.9 The result of adaptive SR+ IFOA+ basic SVM classification
圖10 自適應SR+KPCA+改進FOA+CS-SVM診斷結果Fig.10 The result of adaptive SR+ IFOA+CS-SVM classification
由于仍采用試驗1的 3#軸承內圈故障數(shù)據(jù)作為研究對象,C-與C+的比例關系:C-=1.4C+保持不變。分別采用正、負類樣本數(shù)比為5∶1,4∶1,3∶1,2∶1,1∶1五種不同比例對CS-SVM與基本SVM進行驗證,所采用的預處理方法不變:首先采用自適應隨機共振方法進行去噪、提取特征值,隨后利用KPCA方法對特征值進行變換得到KPCA特征集。
由圖11的趨勢分析可知,隨著樣本不平衡比例的逐漸增加,兩種方法對于正類、負類和總體樣本的診斷正確率都會隨之降低;但所提CS-SVM的方法相較于基本SVM算法具有更高的診斷正確率,且受樣本不平衡性的影響較小,具有較強的泛化能力?;維VM與所提CS-SVM對不同樣本類比例的診斷正確率,如表3所示。
圖11 不同方法在不同比例樣本集上的診斷結果Fig.11 Different diagnosis methods in different proportions of imbalance sample set
綜上所述,所提的CS-SVM方法與基本SVM相比有效提高了對故障類樣本的診斷正確率,同時還能保證正常類樣本和總體診斷正確率略有增加或基本不變。所提的基于IFOA優(yōu)化的CS-SVM方法能有效處理類不平衡樣本問題,更適合處理與軸承故障類似的故障類樣本少、樣本類數(shù)據(jù)不平衡以及錯分代價不相同的樣本集。
表3 不同方法在不同比例樣本條件下的診斷結果
通過對IMS航空軸承試驗數(shù)據(jù)的分析比較可知:采用自適應SR信號預處理以及KPCA特征提取,可提高信號質量和特征效果,從而提高發(fā)動機軸承故障診斷正確率;所提的IFOA優(yōu)化的CS-SVM方法能有效處理誤分類代價不同、不平衡、小樣本條件下的軸承診斷問題,提高誤故障類樣本的診斷正確率。
同時,本文提出的方法主要針對二類分類問題,對于實際的多類分類問題,需要以二分類問題為基礎,將多類別的分類問題轉換為若干二分類問題的組合,采用一對余、一對一等以二分類為基礎的多分類方法進行處理,在今后的研究中,將該方法嘗試應用在多分類問題中,以期取得更好的多分類效果。