汪峰, 周鳳星, 嚴(yán)???/p>
(武漢科技大學(xué)信息科學(xué)與工程學(xué)院, 武漢 430081)
滾動(dòng)軸承是大多數(shù)生產(chǎn)流水設(shè)備和運(yùn)輸設(shè)備的核心[1]。一旦出現(xiàn)了故障,輕則造成生產(chǎn)停止,工廠效益受到影響,重則造成人員傷亡,影響整個(gè)作業(yè)間人員的生命安全。因此,對(duì)滾動(dòng)軸承的各種類型故障進(jìn)行精確診斷和定點(diǎn)維修具有重要的工程意義。
現(xiàn)代化的軸承故障診斷大多依托人工智能算法方法,首先需要采集軸承運(yùn)行狀態(tài)時(shí)的各種故障振動(dòng)信號(hào),然后從振動(dòng)信號(hào)中提取出數(shù)學(xué)特征,再輸入到人工智能算法中進(jìn)行狀態(tài)識(shí)別以完成故障診斷[2]。振動(dòng)信號(hào)的特征提取一直是這一流程中的關(guān)鍵的一環(huán)。楊婧等[3]提出了將信號(hào)相關(guān)度分析方法和網(wǎng)格搜索算法結(jié)合來進(jìn)行特征提取。王圣杰等[4]將集合經(jīng)驗(yàn)?zāi)B(tài)分解引進(jìn)到希爾伯特黃變換(Hilbert-Huang transform,HHT)實(shí)現(xiàn)對(duì)HHT的改進(jìn),將改進(jìn)的HHT結(jié)合拉普拉斯變換進(jìn)行特征提取。韓松等[5]通過比較了不同算法的標(biāo)準(zhǔn)差和拉依達(dá)準(zhǔn)則對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,再通過主成分分析(principal component analysis,PAC)降維特征數(shù)據(jù)實(shí)現(xiàn)了特征提取。
經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)依據(jù)信號(hào)自身的局部特征進(jìn)行自適應(yīng)分解成若干個(gè)本征模態(tài)函數(shù)(intrinsic mode function,IMF)分量,廣泛應(yīng)用于滾動(dòng)軸承復(fù)雜、波動(dòng)的振動(dòng)信號(hào)的特征提取[6]。時(shí)域信號(hào)包含的信息量大,是機(jī)械故障診斷的原始依據(jù),通過選擇和考察合適的信號(hào)時(shí)域參數(shù)可以對(duì)不同類型的故障做出準(zhǔn)確的判斷[7]。提取出來的多維特征量之間的相關(guān)性容易影響故障診斷率且多維特征量不利于支持向量機(jī)算法(support vector machines,SVM)的訓(xùn)練和預(yù)測(cè),而主成分分析是一種可以有效消除數(shù)據(jù)的冗余、復(fù)雜信息并對(duì)其進(jìn)行壓縮的方法。鑒于此,現(xiàn)選擇將EMD分解得到的IMF分量的上、下包絡(luò)值矩陣的奇異值和時(shí)域特征參數(shù)作為特征量來提取,提取出兩種特征量后使用PCA降維融合成新的融合特征量完成特征提取,再將融合特征量輸入到SVM模型中以實(shí)現(xiàn)軸承故障信號(hào)更精確的診斷。
EMD算法本質(zhì)是依據(jù)振動(dòng)信號(hào)的特征時(shí)間尺度得出一套流程來對(duì)原始信號(hào)多次篩分,最終篩選出多個(gè)IMF分量[8]。各IMF分量必須滿足下面兩個(gè)條件:極值點(diǎn)的個(gè)數(shù)與過零點(diǎn)的個(gè)數(shù)必須相等或最多相差1個(gè);信號(hào)局部極大值與局部極小值確定的包絡(luò)線的均值為零。其算法流程如圖1所示。
n為循環(huán)次數(shù);hn為原始信號(hào)x(t)與上下包絡(luò)線均值序列mn的 差序列;c(n)為分離出的各IMF分量;rn為余項(xiàng)序列圖1 經(jīng)驗(yàn)?zāi)B(tài)算法流程Fig.1 Empirical modal algorithm flow
(1)對(duì)EMD分解出來的IMF分量c1(t),c2(t),…,cn(t)進(jìn)行Hilbert變換[9],則有
(1)
式(1)中:ci(t)為各個(gè)IMF分量;t為時(shí)間;τ為積分變量。
(2)再求出每個(gè)IMF分量的包絡(luò):
(2)
(3)由式(2)得到的振動(dòng)信號(hào)的包絡(luò)值矩陣記為C,假設(shè)C為m×n階矩陣,由奇異值分解理論可知,存在正交矩陣U=[u1,u2,…,um]∈Rm×m和V=[v1,v2,…,vn]∈Rn×n,其中:um和vn分別為矩陣U和V的最后一列。使得
UTCV=diag[σ1σ2…σp]=S
(3)
則矩陣C的奇異值分解為
C=USVT
(4)
式(4)中:σ1≥σ2≥…≥σp≥0;σi(i=1,2,…,p)為C的奇異值;diag為取對(duì)角矩陣;S為奇異值組成的對(duì)角矩陣;矩陣U和V是C的奇異向量矩陣。
標(biāo)準(zhǔn)SVM分類算法是二分類算法,只能將樣本分為兩類。軸承的故障類型往往不止兩類,所以要用到SVM多分類器。SVM多分類器采用“一對(duì)一”算法[10],即在樣本中任意選擇兩類訓(xùn)練成一個(gè)標(biāo)準(zhǔn)SVM分類器,N類樣本則得到N(N-1)/2個(gè)標(biāo)準(zhǔn)SVM分類器。在預(yù)測(cè)過程中,將測(cè)試樣本依次輸入到這N(N-1)/2個(gè)標(biāo)準(zhǔn)SVM分類器,每個(gè)分類器都會(huì)預(yù)測(cè)出一個(gè)結(jié)果,然后統(tǒng)計(jì)出次數(shù)最多的預(yù)測(cè)類別即被認(rèn)定為最終結(jié)果。標(biāo)準(zhǔn)SVM分類過程如下。
(1)將兩個(gè)不同類別的樣本(訓(xùn)練樣本)的標(biāo)簽分別定義為1和-1。
(2)選定核函數(shù)類型,求解最優(yōu)朗格朗日乘子a*。
(5)
式(5)中:ai為拉格朗日乘子;K(xi,xj)為核函數(shù);aj、bi、bj為推導(dǎo)過程變量。
(3)將任一支持向量X代入到式(6)中求偏差值b*得出判別公式f(X)構(gòu)建SVM模型,將測(cè)試樣本的屬性值輸入到SVM模型,根據(jù)判別公式f(X)輸出的值將測(cè)試樣本分類。
(6)
PCA是一種廣泛用于特征降維融合的方法,通過線性變換將數(shù)據(jù)從高維空間映射到低維空間,消除了數(shù)據(jù)本身冗余、復(fù)雜的相關(guān)成分從而能更容易地對(duì)數(shù)據(jù)進(jìn)行處理。將振動(dòng)信號(hào)樣本用向量矩陣表示成X=[x1x2…xn],xi為設(shè)備的各種故障信號(hào),第l列Xl=[x1lx2l…xnl]T表示樣本的特征量。其協(xié)方差矩陣[11]為
(7)
Sxui=λiui,i=1,2,…,n
(8)
計(jì)算樣本xj和樣本均值的差再與特征向量ui相乘得到對(duì)應(yīng)的主成分分量為
(9)
所求特征向量構(gòu)成n維正交空間,將樣本投影到該空間即可得到對(duì)應(yīng)的n維主成分量。定義累計(jì)貢獻(xiàn)率為
(10)
通常當(dāng)累積貢獻(xiàn)率θ≥0.95時(shí),認(rèn)為這l個(gè)主元包含了原始數(shù)據(jù)95%以上的信息,可用l個(gè)主元來表征原始數(shù)據(jù),達(dá)到降維融合的目的。
由于振動(dòng)信號(hào)的復(fù)雜性和不確定性,單一特征量無法全面地表征軸承振動(dòng)信號(hào)故障特征信息,從而難以確保故障診斷準(zhǔn)確率。因此,從軸承振動(dòng)信號(hào)中提取出IMF分量上、下包絡(luò)值矩陣的奇異值和原始信號(hào)的各種時(shí)域特征參數(shù)后,然后利用PCA將這兩種故障特征量融合后得到信息互補(bǔ)的特征量,最后使用SVM進(jìn)行故障診斷,故障診斷步驟如圖2所示。
圖2 故障診斷步驟Fig.2 Trouble shooting steps
實(shí)驗(yàn)的軸承數(shù)據(jù)選擇美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心發(fā)布的軸承故障信號(hào)[12]。實(shí)驗(yàn)軸承為SKF6205深溝球軸承,電機(jī)荷載為0 hp,電機(jī)近似轉(zhuǎn)速為1 797 r/min,采樣頻率為12 kHz,數(shù)據(jù)長(zhǎng)度為2 048個(gè)點(diǎn),具體的樣本集如表1所示,樣本集中4種狀態(tài)下振動(dòng)信號(hào)的時(shí)域圖如圖3所示。
表1 樣本集Table 1 Sample set
圖3 4種狀態(tài)振動(dòng)信號(hào)Fig.3 Four state vibration signals
EMD分解無須預(yù)先設(shè)定任何基函數(shù),對(duì)任一信號(hào)具有自適應(yīng)分解能力,分解的結(jié)果是唯一的,通常前幾個(gè)IMF分量具有原始信號(hào)的主要信息[13]。所以本文選擇對(duì)前5個(gè)IMF分量進(jìn)行分析,圖4為內(nèi)圈故障1信號(hào)EMD分解的前5個(gè)IMF分量。由于篇幅有限,只給出圖4中分量IMF1的上下包絡(luò)圖,如圖5所示。
IMF分量突出了信號(hào)的局部特征且都是調(diào)幅調(diào)制信號(hào),這樣對(duì)IMF分量進(jìn)行包絡(luò)分析有利于特征提取?,F(xiàn)在需要對(duì)包絡(luò)信號(hào)定義一個(gè)合適的描述參數(shù)來作為特征量,奇異值是信號(hào)矩陣的固有特征且具有很好的穩(wěn)定性,所以將奇異值作為特征向量顯然是可以的。圖6為前5個(gè)IMF分量上、下包絡(luò)奇異值對(duì)比。
圖4 內(nèi)圈故障1信號(hào)前5個(gè)IMF分量Fig.4 The first five IMF components of the inner ring fault 1 signal
圖5 分量IMF1的上下包絡(luò)圖Fig.5 Upper and lower envelope diagram of component IMF1
圖6 前5個(gè)IMF分量上、下包絡(luò)奇異值對(duì)比Fig.6 Comparison of the upper and lower envelope singular values of the first five IMF components
從圖6中可以看出,奇異值的差異性逐漸在減小,這也說明了EMD分解的前幾個(gè)IMF分量包含了原始信號(hào)大部分特征信息。為了從原始信號(hào)中挖掘出更多有用的特征信息以提高故障診斷準(zhǔn)確率,選取前5個(gè)IMF分量。
軸承運(yùn)行狀態(tài)的改變引起振動(dòng)信號(hào)的改變從而導(dǎo)致時(shí)域特征參數(shù)的變化,時(shí)域特征參數(shù)包含了其最根本的特征信息。在對(duì)每個(gè)樣本提取出前5個(gè)IMF分量上、下包絡(luò)值矩陣的奇異值后,再計(jì)算樣本的13個(gè)時(shí)域特征參數(shù),依次是最大值、最小值、峰峰值、均值、方差、標(biāo)準(zhǔn)差、均方根、峭度、偏度、波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo),即對(duì)每個(gè)樣本提取出23維特征向量。所選時(shí)域特征參數(shù)計(jì)算如表2所示。
奇異值和時(shí)域特征參數(shù)包含了不同角度的故障信息,將它們進(jìn)行融合將得到比信號(hào)單一特征更為敏感的特征向量。將得到的23維特征向量進(jìn)行基于PCA的特征量融合,提取累計(jì)貢獻(xiàn)率達(dá)到95%的主成分。經(jīng)過PCA融合后,得到各主成分的貢獻(xiàn)率及累積貢獻(xiàn)率如表3所示。
從表3中可以看出,前5個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到了95.41%,因此,可以將前5個(gè)主成分代替原來的高維特征向量,剩余的主成分貢獻(xiàn)率所占比重不到5%可以看作噪聲成分而忽略不計(jì)。這樣原來的23維特征向量被降維融合成了5維融合特征向量(前5個(gè)主成分)。同一故障尺寸不同狀態(tài)和同一狀態(tài)不同故障尺寸(以內(nèi)圈故障為例)的前3個(gè)主成分繪制的樣本空間三維圖如圖7和圖8所示。
表2 所選時(shí)域特征參數(shù)
表3 主成分貢獻(xiàn)率及累積貢獻(xiàn)率
圖7 同一故障尺寸不同狀態(tài)前3個(gè)主成分樣本分布圖Fig.7 The sample distribution diagram of the first three principal components of the same fault size in different states
圖8 同一狀態(tài)不同故障尺寸前3個(gè)主成分樣本分布圖Fig.8 Distribution diagram of the first three principal component samples of different fault sizes in the same state
從圖7和圖8中可以看出,同一狀態(tài)不同故障尺寸的故障信號(hào)分離情況較好,而同一故障尺寸不同狀態(tài)的故障信號(hào)也基本得到分離,只有正常和滾動(dòng)體1這兩種狀態(tài)出現(xiàn)了少部分干涉現(xiàn)象。下面將使用SVM進(jìn)行更精確的故障診斷,將表1樣本集的10種類型的樣本標(biāo)簽依次定義為0、1、2、3、4、5、6、7、8、9。將樣本進(jìn)行PCA融合提取出融合特征向量后,對(duì)訓(xùn)練集進(jìn)行SVM算法訓(xùn)練建立起SVM分類模型后,將測(cè)試集輸入到模型中進(jìn)行分類識(shí)別。為了驗(yàn)證融合特征量診斷的優(yōu)越性,同樣對(duì)表1樣本集提取出前5個(gè)IMF分量的能量熵后輸入SVM中進(jìn)行故障診斷。能量熵和本文融合特征量的分類結(jié)果如圖9所示。
由圖9可知,能量熵的分類準(zhǔn)確率為90.6%,融合特征量的分類準(zhǔn)確率達(dá)到了98.6%,診斷準(zhǔn)確率有了明顯的提升。
對(duì)滾動(dòng)軸承的故障診斷問題進(jìn)行了研究,得到以下結(jié)論。
(1)使用PCA將奇異值與時(shí)域特征參數(shù)兩種不同的特征量相融合以提高故障的診斷準(zhǔn)確率,結(jié)果表明融合特征量比常用的特征量診斷效果要更好。
(2)基于PCA的特征量融合能夠?qū)⒉煌嵌鹊奶卣餍畔⑦M(jìn)行融合得到更為敏感的特征,剔除了無用、冗余、復(fù)雜的特征信息從而更簡(jiǎn)潔、全面地表征了滾動(dòng)軸承各種運(yùn)行狀態(tài)。