劉海瑞,武憲威,李 鵬,錢征華*,李 錕
(1.南京航空航天大學 航空航天結構力學及控制全國重點實驗室,江蘇 南京 210016;2.中國航發(fā)四川燃氣渦輪研究院,四川 綿陽 621703)
滾動軸承作為航空發(fā)動機的重要零部件之一[1],在發(fā)動機工作過程中發(fā)揮著至關重要的作用,它的工作性能會對發(fā)動機的可靠性產生直接影響。如果航空發(fā)動機軸承出現故障不能及時被發(fā)現和處理,將引起嚴重的后果,造成巨大的損失。因此,對滾動軸承的運行狀態(tài)和健康程度進行實時精準監(jiān)控[2],并對其可能出現的故障進行精準的預測,對航空發(fā)動機的安全至關重要[3]。
支持向量機(Support Vector Machine,SVM)最早由Vapnik提出,其核心思想是通過使用核函數對坐標進行變換,使低維線性不可分問題轉化為高維線性可分問題,然后在高維空間中構造出超平面實現非線性分類和回歸。由于其具有最小化結構風險與經驗風險等優(yōu)點,在處理軸承狀態(tài)監(jiān)測等小樣本數據問題時,泛化能力比人工神經網絡更強[4],因此在機械狀態(tài)監(jiān)測與故障機器識別中得到了廣泛應用[5-6]。為解決SVM在求解對偶問題時計算過程繁冗、效率較低等問題[7],Suykens等[8]提出了最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)方法,將復雜的二次規(guī)劃問題轉變?yōu)榫€性方程組的求解問題,使計算效率極大地提高。
然而,SVM的性能受核函數參數和懲罰因子的影響較大,如何在使用過程中對這兩個參數進行恰當的選擇顯得尤為重要。Agasthian等[9]用布谷鳥搜索算法對SVM的懲罰因子及核函數參數進行了優(yōu)化,構建了用于風力機齒輪箱故障診斷的高精度模型。譚晶晶[10]提出了彌補固定步長缺點的動態(tài)變步長果蠅算法,并對支持向量機的參數進行了優(yōu)化,使軸承故障的診斷精確度有了明顯的提高。文獻[11]將蟻群算法用于SVM參數優(yōu)化,使錯誤率最小化,以提高故障診斷準確率。皮駿等[12]在采用遺傳算法的同時對支持向量機、BP神經網絡和RBF神經網絡進行了優(yōu)化,用優(yōu)化后的模型對航空發(fā)動機的油液磨粒進行診斷,結果表明遺傳算法優(yōu)化的SVM精度明顯高于RBF和BP神經網絡。此外,還可以將粒子群優(yōu)化(Partide Swarm Optimization,PSO)算法[13]、免疫算法[14]、量子自適應粒子群算法[15]分別與SVM進行結合,并應用于航空發(fā)動機磨損故障診斷中。
上述研究使用了各種種群算法對SVM的超參數進行尋優(yōu),但并沒有考慮到種群迭代過程中移動步長的調整,會導致前期收斂緩慢,有的后期無法收斂[16],使最終結果陷入局部最優(yōu)值。針對這一問題,本文采用一種自適應粒子群優(yōu)化(Adaptive Particle Swarm Optimization,APSO)算法對LSSVM進行參數尋優(yōu),創(chuàng)新性地采用自適應移動步長,降低算法陷入局部最優(yōu)的可能性,提高算法的收斂性及搜索效率。在此基礎上,結合主成分分析法(Principal Components Analysis,PCA)對軸承磨屑數據進行降維并提取特征值,最終通過本文的方法對軸承故障數據進行分類,實現了航空發(fā)動機軸承的故障診斷,并通過對軸承故障數據進行回歸成功實現了軸承的剩余壽命預測。
LSSVM作為一種基于統(tǒng)計理論的改進型SVM,其理論體系先進完備,可以將二次優(yōu)化問題的解決轉化為求解線性方程組[17],從而極大地簡化問題,目前已在數據回歸、模式識別、時間序列預測等方面得到成功應用。下面簡要敘述其求解過程。
對于給定訓練集T={(x1,y1),(x2,y2),…,(xl,yl)}∈(χ×γ)l(式中:xi∈χ=Rk;yi∈γ=R;i=1,2,…,l;xi為模型的樣本輸入,yi為模型的樣本輸出),LSSVM可以通過樣本訓練后得到函數f,通過f即可將輸入轉化為輸出,對數據進行分類或者回歸。首先通過非線性映射x→φ將輸入轉換到高維特征空間H,然后在特征空間實現分類,其函數表達式可以表示為
f(x)=ωTφ(x)+b
(1)
式中:ω為超平面系數;b為偏差;φ為非線性映射函數。
目標性問題根據結構風險最小化的原則,可用約束優(yōu)化問題表述為
(2)
式中:γ為正則化參數;i=1,2,…,l;ei為允許的分類誤差。
構建如下的Lagrange函數求解式(2)的約束優(yōu)化問題:
(3)
式中:αi為拉格朗日乘數。由Karush-Kuhn-Tucker(KKT)條件,可得:
(4)
綜上所述,LSSVM模型可表示為
(5)
式中:K(x,xi)為核函數,用于將數據從低維空間變換到高維空間。本文采用的徑向基核函數為
(6)
式中:σ為核函數寬度。LSSVM模型在使用過程中極易受到正則化參數γ和核函數參數σ的影響,因此,建立LSSVM模型時有必要對這2個參數進行優(yōu)化。
在對正則化參數γ和核函數參數σ進行調整時,一般使用劃分網格點進行尋找,但這種方式的技術精度與劃分網格點的密度相關,需要花費大量的時間才能找到更好的點。為找到這2個參數的最佳取值,本文采用自適應PSO進行參數尋優(yōu)。
PSO最早由Eberhart和Kennedy共同提出[17],是一種種群智能算法,通過模擬鳥類捕食行為而設計出來??梢越忉尀樵On維空間中的一個優(yōu)化問題,首先生成一個初始化種群X,該種群由m個粒子{X1,X2,…,Xm}組成,每個粒子在空間中的位置為{Xi,1,Xi,2,…,Xi,n}。粒子每次通過將位置坐標代入適應度函數來計算此時位置的好壞。在移動過程中,每個粒子都會記住個體自己搜索到的最佳位置,并記住整個種群搜索到的當前最優(yōu)解,然后下一步朝著這2個最佳位置移動,移動速度及位置的更新公式為
(7)
(8)
式中:Xi和vi分別為粒子的位置和速度;a為慣性因子;c1和c2分別為個體認知加速度和全局認知加速度;Pi和Pg分別為個體歷史最佳位置和全局歷史最佳位置;r1和r2為0~1之間的隨機數。
在使用PSO確定正則化參數γ和核函數參數σ的過程中,會面臨前期移動步幅過小、收斂過慢、后期移動步幅過大、找不到最優(yōu)值的問題,所以需要對a、c1、c2這3個參數進行調整,本文采用一種自適應粒子群算法[18]實現參數自動調節(jié)。參數自適應調節(jié)步驟如下所述。
① 計算每個粒子i相對于其他粒子的平均距離,即
(9)
式中:N為粒子總數;D為粒子維度數。
② 選出di中最好的值db、最大距離dmax、最小距離dmin,計算出進化因子h,
(10)
③ 根據h的值,使用圖1所示的隸屬函數判斷此刻進化的狀態(tài)。
圖1 隸屬函數圖
④ 對慣性因子a進行自適應調整,即
(11)
⑤ 應用表1對加速因子c1、c2進行更新。
表1 加速度因子更新策略
同時,為保證每一步參數變化不會太突兀,應滿足|ci(g+1)-ci(g)|≤δ。式中:i=1,2;g為迭代次數;δ定義為加速度率,根據經驗一般取0.05~0.1;c1與c2值應滿足[1.5,2.5],且和小于4,若超出則歸一化,則ci=4ci/(c1+c2)?;贏PSO的LSSVM模型的整體優(yōu)化步驟如圖2所示。
圖2 基于APSO的LSSVM模型的優(yōu)化步驟
本文針對中國航發(fā)四川燃氣渦輪研究院的航空發(fā)動機主軸三號軸承的全過程壽命試驗滑油磨屑數據,應用本算法對軸承進行故障診斷和剩余壽命預測。數據利用的是中國航發(fā)四川燃氣渦輪研究院5套C1276720NW1(H)軸承全壽命過程中的磨屑信息。實驗過程中,通過間歇斷油來預制初始損傷,軸向和徑向分別施加19.30 kN和2.16 kN的載荷,1號和2號軸承的轉速為800 r/min,其余3個軸承的轉速為1 200 r/min。研究過程中選取20個磨屑信息特征值,包括直徑為155 μm、175 μm、201 μm、225 μm、250 μm、275 μm、301 μm、401 μm、501 μm的顆粒累計數量和累計體積等18個特征值,以及磨屑顆??倲岛涂傮w積每分鐘的變化率??紤]到這20個特征值中存在線性相關項,且過多的冗余數據會影響算法的計算效率,因此本文采用PCA對數據進行降維。
PCA可以將高維數據降維為低維數據,解決多維數據分析中的計算量過大、維度災難、維度冗余等問題。它的基本思想是,將數據集中的多個變量轉換為一組新的變量,稱這些新的變量為主成分。具體過程如下:
① 輸入m條樣本,特征數為20的軸承磨屑信息數據集,記為
④ 對協(xié)方差矩陣C進行特征分解,求出協(xié)方差矩陣的特征值λk及對應的特征向量vk,即Cvk=λkvk。
⑤ 將特征向量對應特征值從左到右按列降序排列成矩陣,取前5列組成n×k階矩陣W。
⑥ 通過Y=X*W計算降維到5維后的樣本特征,即m×5階矩陣。應用PCA將原始特征值降維到5個特征向量,主成分的累計貢獻占比如圖3所示。由此可見,降維后的前5個主成分分量可表達出原來20個特征值的99.9%的信息。
圖3 主成分累計貢獻占比
將軸承的全壽命劃分為4個階段,即正常運行、輕微磨損、初期失效、嚴重失效,分別將其定義為標簽“0”“1”“2”“3”,使用APSO-LSSVM對其進行故障分類。采用1、3、4號軸承磨屑數據作為訓練集,2號和5號軸承磨屑數據作為測試集進行訓練和驗證。為進一步說明算法的優(yōu)勢,將本模型的預測結果與LSSVM、基于遺傳算法優(yōu)化的最小二乘支持向量機(GA-LSSVM)、基于灰狼算法優(yōu)化的最小二乘支持向量機(GWO-LSSVM)和基于粒子群算法優(yōu)化的最小二乘支持向量機(PSO-LSSVM)進行比較,5種種群算法初始種群數量都為25,迭代次數為10次,參數γ和σ的搜索范圍都設為[0,200],模型輸入為油液磨屑信息進行PCA降維后的5維特征向量,輸出為1維的4種分類標簽。每種算法取50次計算結果平均值,結果如表2所示。
表2 5種算法結果比較
由表2可知,應用了智能種群算法對LSSVM超參數進行尋優(yōu)后,雖然訓練時間大幅增加,但準確率有明顯提高,同時也可證明本文算法的正確性。在使用智能種群算法對SVM的2個參數進行尋優(yōu)的問題上,PSO算法相對于GWO和GA算法,準確率和計算速度都有所提升,測試集準確率可達到95%,訓練時間也減小到17.27 s,這是由于PSO的尋優(yōu)策略簡單而高效,更適合于處理二維目標的尋優(yōu)問題。而APSO相比于PSO穩(wěn)定性進一步提高,因為其自適應調節(jié)粒子移動步長,可以減小在粒子搜索過程中掉入局部最優(yōu)的概率,增加算法的穩(wěn)定性,進而提高算法準確率。5種算法測試集的混淆矩陣如圖4所示。
圖4 5種算法測試集的混淆矩陣
由圖4可知:LSSVM整體識別率較低;GWO-LSSVM算法無法識別標簽為“0”的樣本,并且將許多標簽為“2”的樣本識別成標簽為“1”的樣本,整體識別度比較低,其原因在于灰狼算法在迭代過程中同時選擇“三匹頭狼”為移動方向,導致向最優(yōu)位置的移動速度較慢;GA-LSSVM出現部分標簽“2”識別為標簽“3”的樣本,相比于GWO-LSSVM精度有顯著提高,但因為遺傳算法在迭代過程中變異導致的較大隨機性,使算法不夠穩(wěn)定;PSO-LSSVM將少數標簽為“2”的樣本錯誤識別為標簽“1”和“3”,相比于前兩種算法,其精度進一步提高,但算法中粒子在移動過程中步幅可能無法調整,導致后期無法收斂到全局最優(yōu)值;對于APSO-LSSVM,因為粒子采用了自適應調節(jié)步長,相比于PSO-LSSVM精度進一步提高,APSO找到全局最優(yōu)解的概率提高。因此在使用APSO-LSSVM對軸承的運行狀態(tài)進行分類評估時,可以完全識別出前期故障,同時對故障后期的判斷精度明顯優(yōu)于GWO-LSSVM和GA-LSSVM,同時搜索到最優(yōu)解的穩(wěn)定性也高于PSO-LSSVM。
為了提前預警,實時在線監(jiān)測軸承的運行狀態(tài),以便于發(fā)現問題及時報警,本文的方法還可用于對軸承的剩余壽命進行預測。以PCA降維后的顆粒累計數量和累計體積為特征值,軸承剩余壽命(單位/萬轉)為標簽,對軸承壽命模型進行回歸。在進行軸承壽命預測時,需要保證模型在未經過訓練的新軸承上也可以表現良好,這就需要模型具有較好的泛化能力,本文分別單獨選取5個軸承作為測試集,采用均方誤差(Mean Squared Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)3個參數作為描述模型精準度的指標,5種種群算法初始種群數量都為25,迭代次數為10次,參數γ和σ的搜索范圍都設為[0,200],模型輸入為油液磨屑信息進行PCA降維后的5維特征向量,輸出為1維的剩余壽命,分別給出5種模型在每個測試集軸承上的預測精度指標,結果如表3所示。
表3 5個模型在每種測試集軸承上的預測精度指標
由表3可知:APSO-LSSVM模型的預測結果各項指標都優(yōu)于其他4種模型,又因為模型在搜索最佳參數的過程中是以MSE為適應度函數,所以MSE指標顯著高于其他模型。接下來本文結合APSO-LSSVM模型具體討論其在各個軸承上的表現。APSO-LSSVM在5個軸承上的剩余壽命預測表現如圖5所示。
圖5 APSO-LSSVM在5個軸承上的剩余壽命預測表現
結合圖5和表3可知:模型在3號軸承和4號軸承上表現較好,預測結果與真實結果基本一致,MSE比其他3個軸承的預測結果小一個數量級,MAE也遠小于其他軸承預測結果,其中3號軸承預測結果的MAPE最小;1號軸承和5號軸承預測結果的趨勢整體上與真實結果相似,但在軸承破壞前期預測結果誤差較大,導致MSE、MAE、MAPE結果相比于3號軸承和4號軸承的預測明顯增加;2號軸承的預測結果只能大體上預測出趨勢,誤差較大,可能是因為其個體的獨特性,所以其MSE、MAE、MAPE均最大。結合以上分析,本文的模型能夠整體上預測出軸承剩余壽命的變化趨勢,算法的泛化性較好。
本文提出了一種APSO-LSSVM模型,應用其對軸承的運行狀態(tài)進行故障分類和剩余壽命預測,并采用中國航發(fā)四川燃氣渦輪研究院的軸承試驗數據進行分析和驗證,得出如下主要結論。
① 在處理樣本特征數據時,采用PCA對軸承特征數據進行處理,在保留原始數據99.9%信息的同時可極大地降低特征向量的維度。
② 在使用試驗數據對軸承進行狀態(tài)評估時,APSO-LSSVM相比于GWO-LSSVM、GA-LSSVM、PSO-LSSVM具有顯著優(yōu)勢,模型訓練速度更快、預測結果準確度更高,且掉入局部最優(yōu)的概率更低,算法穩(wěn)定性好。
③ 在使用試驗數據對軸承剩余壽命進行預測時,模型在新軸承數據上可以預測出剩余壽命的整體趨勢,模型泛化能力較好,但鑒于某些軸承的個體差異及樣本數量的限制,預測的精度有待提升,需要在后續(xù)的使用過程中不斷擴充數據庫,使模型更加精確。