陸建濤,姚 通,李舜酩,崔榮慶
(南京航空航天大學 能源與動力學院,南京 210016)
滾動軸承廣泛應用于大型旋轉(zhuǎn)機械中,如航空發(fā)動機、風力發(fā)電機、動車組等,是其不可或缺的支撐部件。在旋轉(zhuǎn)機械運行過程中,軸承不可避免發(fā)生故障,輕則造成巨大的經(jīng)濟損失,重則機毀人亡造成災難性事故。若能及時對其進行智能故障診斷,就有望能夠保障設備運行安全,避免重大經(jīng)濟損失和事故發(fā)生。因此,對滾動軸承進行智能故障診斷具有重要的工程應用價值[1-2]。
振動信號中蘊含著豐富的故障信息,因此基于振動信息的滾動軸承故障診斷一直是研究熱點[3]。振動信號常規(guī)時域特征指標主要包含兩類:一類是有量綱指標,例如最大值、最小值、峰峰值、均值和方差等;另一類是無量綱指標,例如峭度因子,脈沖因子,波形因子等。這些指標在一定程度上反映設備故障特征,如峭度因子反映信號中沖擊成分大小,裕度因子反映機械裝備的磨損狀況,波形因子能反映轉(zhuǎn)子點蝕或者磨損。因此,特征參數(shù)的變化可反映出設備運行狀態(tài)變化情況,可作為對其進行故障診斷的依據(jù)。然而,有量綱指標易受外界運行環(huán)境和運行工況影響,無量綱指標雖然受外界因素影響較小,但其在故障特征相似程度較高時,識別效果不佳。因此,僅使用常規(guī)特征對設備進行故障診斷,診斷準確率較低[4-5]。
超階分析是在去趨勢波動分析法(detrended fluctuation analysis,DFA)基礎(chǔ)上提出的用于分析子系統(tǒng)激勵源區(qū)分度的新方法,利用極值點包含的豐富狀態(tài)信息,分析極值點背后的因素,有助于解釋信號的本質(zhì)特征[6]。江星星等[7]提出基于超階分析的排量檢測法,提取泵車液壓泵體振動信號標度指數(shù),實現(xiàn)泵車的排量標定。超階分析法既保留了去趨勢波動分析法的原有優(yōu)點,減小序列中趨勢成分的影響,又能反映信號的長程相關(guān)特性,突出時間序列本來的狀態(tài)特征,能夠揭示信號波動的內(nèi)在驅(qū)動機制。
支持向量機(support vector machine,SVM)是Cortes等[8]提出的基于統(tǒng)計學習理論的機器學習方法,對小樣本和非線性問題有較好的表現(xiàn),目前主要應用于模式識別領(lǐng)域。SVM是從線性可分情況下的最優(yōu)分類超平面發(fā)展而來,首先轉(zhuǎn)化成二次規(guī)劃問題,然后利用拉格朗日乘子法轉(zhuǎn)化成二次規(guī)劃的對偶問題來求解。對于線性不可分問題,先把原始數(shù)據(jù)映射到線性可分的更高維空間,在高維空間構(gòu)造最優(yōu)超平面,并映射回原空間,能夠較好地解決原空間內(nèi)線性不可分問題。然而SVM參數(shù)的選取較為困難,參數(shù)選擇不恰當,會造成過擬合或者欠擬合現(xiàn)象,而且核函數(shù)中包含的參數(shù)對訓練和預測的速度有較大影響[9]。
本文針對采用傳統(tǒng)特征指標進行故障診斷準確率較低的問題,提出一種基于混合特征指標的滾動軸承智能故障診斷方法。將超階分析所得標度律指數(shù)作為故障特征指標,與常規(guī)特征指標相結(jié)合構(gòu)造混合特征指標矩陣,并采用SVM實現(xiàn)滾動軸承的智能故障診斷。為了實現(xiàn)SVM參數(shù)的自適應選取,提出基于粒子群優(yōu)化(particle swarm optimization,PSO)的改進SVM(improved SVM,ISVM)法。最后,通過軸承故障模擬試驗臺數(shù)據(jù)對提出方法有效性進行驗證。
常規(guī)有量綱指標容易受到外界工況因素的影響,難以用于實際的故障診斷。無量綱特征指標能夠在一定程度上反應設備故障情況,包括:峭度因子、脈沖因子、峰值因子、裕度因子和波形因子等。
(1) 峭度因子
峭度因子是表征振動信號波形尖峰度的一個統(tǒng)計量,具體的含義表示波形的平緩程度,用來描述變量的分布特征[10]。計算公式為
(1)
式中:μ為信號x的均值;σ為信號的標準差;E(t)為t期望值。當軸承發(fā)生故障時,振動信號中通常出現(xiàn)周期性的沖擊成分,此時峭度因子值大于3,振動信號的整體分布曲線會呈現(xiàn)“陡峭”現(xiàn)象。
(2) 脈沖因子
脈沖因子表征信號振動脈沖的頻率,用來檢測信號中有無沖擊成分的一個指標,其值是振動信號的峰峰值與其整流平均值的比值,計算公式為
I=pk/av
(2)
式中:I為脈沖因子;pk為所監(jiān)測振動信號的峰峰值;av為所監(jiān)測振動信號的整流平均值,亦即信號絕對值的平均值。
(3) 峰值因子
峰值因子表征信號峰值在振動信號整體分布波形中的極端程度,跟脈沖因子類似,也是用于檢測是否存在沖擊成分的一個指標[11],計算公式為
C=pk/rm
(3)
式中:C為信號的峰值因子;rm為振動信號的有效值(信號的均方根值)。由于振動信號的整流平均值小于有效值,所以脈沖因子大于峰值因子。
(4) 裕度因子
裕度因子是信號的峰峰值與方根幅值的比值,同樣對沖擊特征比較敏感,但當故障逐漸加重時,其數(shù)值反而會下降,表明裕度因子對振動信號中蘊含的早期故障具有較高敏感性,因而常被用來表征機械運行裝備磨損狀況,計算公式為
L=pk/xr
(4)
式中:L為振動信號的裕度因子;xr為振動信號的方根幅值。
(5) 波形因子
波形因子S是信號有效值與平均幅值之比,可以反映轉(zhuǎn)子出現(xiàn)點蝕或者磨損故障的信號特征,其計算公式為
S=rm/av
(5)
上述5個無量綱特征參數(shù)都可以反映設備發(fā)生故障時產(chǎn)生的故障特征,但是與信號的頻率無關(guān),這也使得在變工況狀態(tài)下,這5個常規(guī)特征參數(shù)仍能夠表征故障信息。
對振動信號進行超階分析過程如下:
(1) 對原始時間序列取極值
(6)
式中,xn≤xn+1,xn+1≥xn+2或xn≥xn+1,xn+1≤xn+2。
(2) 將極值序列變換為極值增量序列
(7)
(3) 對于序列Δxm,計算其累積離差y(t)
(8)
首先濾去了時間序列的平均值。由于一個時間序列可能有隨機成分,把序列的這些成分過濾掉有助于后續(xù)分析。
(4) 序列重構(gòu)
對具有N個數(shù)據(jù)的y(t)分別進行等長分割,以長度n將序列分割成m個不重疊的區(qū)間,其中
(9)
由于序列長度N并不總是長度n的整數(shù)倍,序列尾端有時會出現(xiàn)小部分的數(shù)據(jù)信息未能被利用。為了充分利用數(shù)據(jù),對序列的顛倒順序進行同樣的操作,共得到m個等長度的區(qū)間。
(5) 對每個區(qū)間v,用最小二乘法對所包含的數(shù)據(jù)進行一階線性擬合,如下
yv(i)=ayv+byv×i
(10)
式中:i=1,2,…,n;yv=1,2,…,m。
(6) 計算每個區(qū)間濾去趨勢后的均方差。
(7) 對所有等長度區(qū)間求均值并開方,計算得到DFA波動函數(shù)。
(11)
(8) 如果時間序列x(t)長程冪律相關(guān),則F(n)與n滿足冪律關(guān)系。
在雙對數(shù)坐標{lgn,lg[F(n)]}中做散點圖,用最小二乘法擬合數(shù)據(jù),其中直線部分的斜率即為超階分析方法所得的信號標度律指數(shù),記為α。
超階分析所得到的標度律指數(shù)可以作為表征故障信號故障信息的特征參數(shù),突出信號序列本來的狀態(tài)特征。因此,與1.1小節(jié)得到的常規(guī)信號特征參數(shù)(峭度因子、峰值因子、脈沖因子、裕度因子和波形因子)相結(jié)合,就可得到混合信號特征參數(shù)向量,作為滾動軸承智能故障診斷的特征向量。
在利用SVM進行數(shù)據(jù)分類時,需設定兩個重要參數(shù):懲罰系數(shù)C和核函數(shù)參數(shù)γ。懲罰系數(shù)C決定對所取樣本依賴程度,當C為無窮大時,所有樣本將都滿足約束,造成過擬合現(xiàn)象;而當C太小時,只有少數(shù)樣本滿足約束,導致欠擬合現(xiàn)象。γ是選擇高斯核函數(shù)后自帶的一個參數(shù),代表著映射之后的空間分布。γ值越大,SVM個數(shù)越少,反之,γ值越小,SVM個數(shù)越多。γ值的選取對訓練和預測速度有較大影響。為了實現(xiàn)參數(shù)自適應選取,本文采用PSO對SVM的參數(shù)進行優(yōu)化選取。
PSO是從鳥類捕食行為的研究中發(fā)展而來,每個問題的解稱為“粒子”,所有粒子的搜索空間都是N維的解空間,粒子優(yōu)劣由適應度函數(shù)判定。每個粒子需保存自己搜索到的最佳位置,其速度根據(jù)其當前位置、其歷史最優(yōu)位置和群體最優(yōu)位置動態(tài)調(diào)整[12-13]。粒子的速度和位置更新公式分別為
(12)
(13)
信號故障特征提取與人工智能結(jié)合形成新故障診斷方法是智能故障診斷領(lǐng)域的一種趨勢[14-16]。本文將構(gòu)造的混合特征指標向量與ISVM相結(jié)合,形成基于混合特征向量和ISVM的滾動軸承智能故障診斷方法,其基本步驟為:
步驟1常規(guī)信號特征提取。將采集的信號分組,并標記每個分組的故障類別標簽,對每個樣本信號分別計算峭度因子、峰值因子、脈沖因子、裕度因子和波形因子。
步驟2標度律特征參數(shù)提取。按照超階分析法的流程,提取每一個樣本的標度律指數(shù)作為表征信號故障信息的特征參數(shù)。
步驟3混合特征向量構(gòu)造。結(jié)合已提取的常規(guī)信號特征和標度律特征,構(gòu)造混合特征參數(shù)向量。所有樣本的特征向量構(gòu)成一個特征矩陣,矩陣的每一行代表一個樣本的特征集,依次為峭度因子、峰值因子、脈沖因子、裕度因子、波形因子和標度律指數(shù)屬性值,特征矩陣的每一列樣本的特征屬性。
步驟4歸一化。用最值歸一化方法分別對特征矩陣的每一列進行歸一化處理,并將歸一化后的混合特征矩陣作為ISVM的輸入。
步驟5模型訓練。利用PSO對SVM的參數(shù)進行優(yōu)化,用交叉驗證法防止訓練模型的過擬合,并將模型訓練準確率用作判斷模型訓練好壞的標準,獲得最佳模型參數(shù)。
步驟6智能故障分類。對測試數(shù)據(jù)進行類似處理,得到測試數(shù)據(jù)的特征集,用已獲得分類模型對測試數(shù)據(jù)集進行智能故障分類。
提出的滾動軸承智能故障診斷方法框圖,如圖1所示。
圖1 提出的滾動軸承智能故障診斷方法框圖Fig.1 Block diagram of the proposed intelligent fault diagnosis method for rolling bearing
采用UCI標準數(shù)據(jù)庫中Wine數(shù)據(jù)集(網(wǎng)址:http://archive.ics.uci.edu/ml/datasets/Wine)對提出的ISVM的有效性進行驗證,并與傳統(tǒng)SVM方法性能進行對比。數(shù)據(jù)集的基本信息如表1所示。
表1 Wine數(shù)據(jù)集Tab.1 Dataset of Wine
粒子群算法的適應度函數(shù)取為支持向量機訓練的準確率,提出算法優(yōu)化過程的適應度曲線如圖2所示。從圖2中可知,第3代粒子最優(yōu)適應度上升到92.7,第6代粒子最優(yōu)適應度達93.26,此后迭代過程一直穩(wěn)定在93.26保持不變。由圖中平均適應度曲線可以看出,隨著搜索得到的最佳適應度的穩(wěn)步上升,當前迭代代數(shù)的平均適應度并不是線性上升的,而是呈現(xiàn)無規(guī)律的變化,說明C和g值對適應度的影響并不是線性變化的,一點小小的擾動就可能導致較大適應值的變化。
圖2 粒子群算法適應度曲線圖Fig.2 Fitness curve of particle swarm optimization algorithm
傳統(tǒng)方法選取參數(shù)時,多采用網(wǎng)格搜索法,即用一個預先設置的網(wǎng)格去全域搜索k折交叉檢驗法下的最佳準確率。傳統(tǒng)方法得到的最佳參數(shù)配合下的最佳準確率曲線,如圖3所示。由圖3可知,隨著γ值的增加,所得模型訓練的準確率在穩(wěn)步上升。由傳統(tǒng)方法得到的最佳準確率在90.45,小于ISVM所得到的最佳準確率,驗證了提出方法的有效性。
圖3 傳統(tǒng)方法準確率曲線圖Fig.3 The accuracy curve of traditional method
采用QPZZⅡ型滾動軸承故障模擬試驗臺對提出滾動軸承智能故障診斷方法的有效性進行驗證,試驗臺如圖4所示。采集的數(shù)據(jù)有4種故障類型:正常、內(nèi)圈故障、外圈故障和滾動體故障。每一類故障包含3個故障尺寸,0.2 mm,0.4 mm,0.6 mm,一共10類數(shù)據(jù)。每一個樣本組的數(shù)據(jù)長度為1 000,各個樣本組數(shù)據(jù)之間沒有重疊。每一類數(shù)據(jù)有20個樣本組,共計200個樣本。
圖4 QPZZⅡ型故障診斷試驗臺總體布置圖Fig.4 Layout of fault diagnosis test bed of QPZZⅡ
按照7∶3的比例對樣本數(shù)據(jù)集進行訓練集和測試集的分組,即每一類標簽數(shù)據(jù)中有14個樣本作為訓練集,6個樣本作為測試集,數(shù)據(jù)分組情況如表2所示。
表2 滾動軸承數(shù)據(jù)集Tab.2 Dataset of rolling bearing
對每一個樣本故障數(shù)據(jù)進行混合特征向量的提取,包括峭度因子、波形因子、峰值因子、脈沖因子、裕度因子和標度律指數(shù)。不同故障類型的標度律指數(shù)分布曲線圖如圖5所示。由圖5可知,在同一故障類型和故障尺寸下不同樣本間的標度律指數(shù)值波動較小,可以作為表征故障的特征指標。不同故障類型間相比較,不同故障類型故障信號的標度率指數(shù)均有一定的波動,但波動范圍較小,不同的故障之間有較明顯的區(qū)分,因此標度律指數(shù)可以作為特征指標對不同故障進行智能診斷。
圖5 不同故障類型的標度律指數(shù)分布曲線圖Fig.5 Scale exponent exponential distribution curve of different fault types
將得到的標度律指數(shù)向量與常規(guī)特征指標向量結(jié)合組成混合特征矩陣,并將歸一化之后的特征矩陣輸入到提出的ISVM中。設置PSO參數(shù)為:c1=c2=1.5,粒子數(shù)量為20,速度更新的權(quán)重設置為線性遞減權(quán)重,初始權(quán)重wstart=0.9,結(jié)尾權(quán)重為wend=0.4,按照迭代的次數(shù)進行權(quán)重的線性插值。SVM的懲罰系數(shù)范圍為:Cmin=0.1,Cmax=1 000,徑向基函數(shù)參數(shù)范圍為:γmin=0.01,γmax=100。所得到的混合特征向量優(yōu)化的支持向量機模型訓練適應度曲線如圖6所示。由圖6中可以看出,第10代粒子的最佳適應度上升到90.71,此后基本保持穩(wěn)定。最終得到分類模型的最佳參數(shù)為:Cbest=163.037,γbest=10.465。
圖6 基于混合特征的ISVM模型訓練適應度曲線Fig.6 Training fitness curve of ISVM model based on hybrid characteristic vector
使用測試集對訓練模型進行測試,結(jié)果如表3所示。由表3知,提出的滾動軸承智能故障診斷方法的分類準確率為96.67%,僅在標簽6(滾動體故障,故障尺寸0.4 mm)的樣本中出現(xiàn)了錯分的情況,其他的故障類型分類準確率都達到100%。
表3 混合特征優(yōu)化的支持向量機故障診斷結(jié)果表Tab.3 Fault diagnosis results of SVM based on hybrid feature optimization
作為對比,僅采用1.1節(jié)介紹的常規(guī)無量綱特征指標作為故障特征,即峭度因子、峰值因子、脈沖因子、裕度因子和波形因子,采用同樣的處理流程,將得到的常規(guī)特征參數(shù)矩陣輸入到ISVM中,得到模型的訓練準確率為77.86%,低于采用混合特征得到的訓練準確率90.71%。使用常規(guī)特征和混合特征進行分類得到的測試準確率結(jié)果對比表如表4所示。由表4可知,使用常規(guī)特征的總體測試準確率僅為73.33%,低于使用混合特征得到的測試準確率,驗證了提出方法的有效性。
表4 兩種故障診斷方法測試準確率結(jié)果對比表Tab.4 Comparison of test accuracy results of two fault diagnosis methods
采用超階分析法獲得分析信號的標度律指數(shù),并結(jié)合常規(guī)無量綱參數(shù)構(gòu)造了混合特征參數(shù)矩陣,進而采用ISVM實現(xiàn)滾動軸承故障智能診斷,結(jié)論如下:
(1) 提出ISVM法能夠?qū)崿F(xiàn)參數(shù)的自適應優(yōu)化,相比于傳統(tǒng)的網(wǎng)格搜索法,能獲得更好的訓練效果,提高模型的分類準確率。
(2) 由超階分析得到的標度律特征可以作為表征故障的特征參數(shù),通過與常規(guī)特征參數(shù)結(jié)合可以有效實現(xiàn)滾動軸承故障的智能診斷。與僅采用常規(guī)特征相比,提出方法得到的測試準確率增加了23%左右。
(3) 提出方法不僅能實現(xiàn)滾動軸承故障類型識別,而且能實現(xiàn)同一故障類型不同故障程度的有效識別。通過對故障程度更精細劃分,有望實現(xiàn)故障程度的定量識別。