王昊天
(重慶交通大學(xué)機(jī)電與車輛工程學(xué)院,重慶 400074)
滾動(dòng)軸承被認(rèn)為是旋轉(zhuǎn)機(jī)械中的關(guān)鍵部件之一,許多機(jī)械設(shè)備停工都是因其故障引起的,其健康狀況直接關(guān)系到整個(gè)機(jī)械系統(tǒng)的運(yùn)行。為使機(jī)械設(shè)備穩(wěn)定工作,減少非生產(chǎn)時(shí)間,避免發(fā)生災(zāi)難性故障對(duì)機(jī)器和人的生命造成損害,應(yīng)對(duì)滾動(dòng)軸承故障進(jìn)行準(zhǔn)確診斷和分析。
振動(dòng)信號(hào)被廣泛應(yīng)用于滾動(dòng)軸承故障診斷中,對(duì)信號(hào)進(jìn)行優(yōu)化處理提取特征,是進(jìn)行故障診斷的主要手段。滾動(dòng)軸承的振動(dòng)信號(hào)是非平穩(wěn)、非線性的,如何從中提取有效故障信息,準(zhǔn)確診斷并識(shí)別軸承狀態(tài)是當(dāng)前研究的熱點(diǎn)。針對(duì)振動(dòng)信號(hào)的特點(diǎn),將時(shí)頻分析技術(shù)引入旋轉(zhuǎn)機(jī)械故障診斷中。Huang et al.[1]于1998年提出的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)可將信號(hào)自適應(yīng)分解為多個(gè)固有模態(tài)函數(shù)(IMF),非常適合非平穩(wěn)、非線性的振動(dòng)信號(hào),目前已成功應(yīng)用于滾動(dòng)軸承故障診斷中[2-4]。但EMD存在模態(tài)混淆的缺陷,為解決此問(wèn)題,Wu et al.[5]研究白噪聲信號(hào)的統(tǒng)計(jì)特性后提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)。為了提高分解效率,Yeh et al.[6]提出了一種互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD),向原始信號(hào)中添加2個(gè)相反的白噪聲信號(hào),并對(duì)每個(gè)噪聲情況分別執(zhí)行EMD,該算法有效減少了白噪聲對(duì)原始信號(hào)的影響。
極端梯度提升(XGBoost)樹(shù)模型是近年來(lái)被廣泛使用的一種模式識(shí)別分類方法。Chen et al.[7]提出的XGBoost算法是目前最快、集成度最高的決策樹(shù)算法。該算法融合了梯度提升、隨機(jī)森林等算法的優(yōu)勢(shì),創(chuàng)造性地提出了模型的離散意識(shí)和離核計(jì)算方法,不僅提升了算法模型對(duì)分布式數(shù)據(jù)庫(kù)的預(yù)測(cè)效果,也大大提高了模型訓(xùn)練的速度。
受以上研究的啟發(fā),本文提出一種基于CEEMD能量算子和XGBoost樹(shù)模型的滾動(dòng)故障診斷方法。使用CEEMD算法對(duì)原始振動(dòng)信號(hào)進(jìn)行分解,然后提取各IMF分量中能量算子這一特征,并將特征值輸入到XGBoost模型進(jìn)行訓(xùn)練,最后使用需要訓(xùn)練完畢的模型對(duì)滾動(dòng)軸承的4種故障進(jìn)行分類識(shí)別。通過(guò)對(duì)滾動(dòng)軸承故障試驗(yàn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析,驗(yàn)證該模型的有效性。
EEMD算法可以在一定程度上抑制EMD算法中的模態(tài)混淆現(xiàn)象,但添加的白噪聲并不能完全中和。針對(duì)此缺陷提出CEEMD算法,在分析信號(hào)中成對(duì)加入符號(hào)相反的白噪聲,降低重構(gòu)誤差。CEEMD算法的詳細(xì)步驟如下。
步驟1:成對(duì)添加符號(hào)與原始信號(hào)相反的白噪聲信號(hào),如式(1)所示。
(1)
式中:X為原始信號(hào)序列;Ni為第i次添加的白噪聲序列。
步驟3:取各分量的均值得:
(2)
(3)
步驟4:將n次疊加白噪聲迭代產(chǎn)生的分量相加并求均值,最后得到CEEMD結(jié)果:
(4)
式中:cj是CEEMD分解后的第j個(gè)模態(tài)分量。
能量算子的求解過(guò)程如下。
步驟1:對(duì)滾動(dòng)軸承的振動(dòng)信號(hào)進(jìn)行CEEMD分解,獲得各IMF分量和殘差。
步驟2:求各個(gè)IMF分量的能量算子E,如公式(5)所示。
(5)
式中:N為樣本中采樣點(diǎn)數(shù);Δcj=cj2-cj(t-1)cj(t+1)。
XGBoost使用的是CART回歸樹(shù)模型,該算法的思想為:不斷添加樹(shù),即不斷分割特征生成樹(shù)。它本質(zhì)上是學(xué)習(xí)一個(gè)新的函數(shù)來(lái)擬合先前預(yù)測(cè)的殘差,然后重新裝配,直到滿足要求。假設(shè)XGBoost模型本身由K個(gè)CART組成,則模型可以表示為:
(6)
XGBoost與大多數(shù)機(jī)器學(xué)習(xí)模型類似,其目標(biāo)函數(shù)可以是損失函數(shù)和正則項(xiàng)之和,分別控制模型的準(zhǔn)確度和復(fù)雜度,具體公式如下。
(7)
(8)
(9)
式中的優(yōu)化過(guò)程與泰勒展開(kāi)式(10)近似,以t步優(yōu)化為例,優(yōu)化目標(biāo)函數(shù)如下。
f(x+Δx)=f(x)+f′(x)x+f″(x)Δx
(10)
(11)
(12)
(13)
式中:gi和hi分別為損失函數(shù)第一和第二步統(tǒng)計(jì)。
在去除式(11)中的常數(shù)項(xiàng)后,獲得以下簡(jiǎn)化目標(biāo)。
(14)
為驗(yàn)證本文方法,采用美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集。該實(shí)驗(yàn)使用軸承為6205-2RSJ型軸承,數(shù)據(jù)集分為48K基線、12K驅(qū)動(dòng)端故障、48K驅(qū)動(dòng)端故障、12K風(fēng)扇端故障共4類,每個(gè)子故障數(shù)據(jù)集均有滾子、內(nèi)圈、外圈故障數(shù)據(jù)。本文使用48K基線和12K驅(qū)動(dòng)端故障數(shù)據(jù),其中主軸轉(zhuǎn)速1 772 r/min,故障直徑0.021 mm,加速度傳感器位于電機(jī)的驅(qū)動(dòng)端,采樣頻率12 kHz。
使用重疊采樣的方式對(duì)數(shù)據(jù)進(jìn)行隨機(jī)分割,每類狀態(tài)(健康、滾子故障、內(nèi)圈故障、外圈故障)400個(gè)樣本,共1 600個(gè)樣本,按照8:2的比例劃分為訓(xùn)練集和測(cè)試集。本文所選用數(shù)據(jù)中軸承轉(zhuǎn)速為1 772 r/min,根據(jù)N=fs×60/ns可得每個(gè)周期內(nèi)采樣點(diǎn)數(shù)為406個(gè),為保證每個(gè)數(shù)據(jù)樣本故障信息的完整性,設(shè)置每個(gè)樣本長(zhǎng)度為2 048個(gè)采樣點(diǎn)。
本文以滾子故障中某一樣本為例進(jìn)行分析,原始振動(dòng)信號(hào)如圖1所示。對(duì)該樣本使用CEEMD算法進(jìn)行分解,本文設(shè)置分解為6個(gè)IMF分量。因IMF分量很多,若不進(jìn)行篩選而使用所有IMF分量,計(jì)算過(guò)程會(huì)過(guò)于冗余。因此,僅選取IMF分量中包含原始信號(hào)信息較多的幾個(gè)分量,本文使用4個(gè)分量。選取原則為:計(jì)算比較各IMF分量與未分解前原始信號(hào)的相關(guān)系數(shù)。
圖1 滾子故障原始信號(hào)及CEEMD分解圖
該樣本經(jīng)過(guò)CEEMD分解后的各IMF分量與原始信號(hào)的相關(guān)系數(shù)如表1所示。IMF分量1~4相關(guān)系數(shù)較大,相關(guān)系數(shù)排名前4的IMF分量已經(jīng)包含有原始信號(hào)中存在的主要信息,故使用前4名IMF分量。
表1 各IMF分量與原始信號(hào)的相關(guān)系數(shù)
對(duì)排名前4的IMF 1~4分別提取能量算子作為特征值,如表2所示。
表2 各IMF分量的特征值
重復(fù)上述過(guò)程對(duì)全部1 600個(gè)樣本進(jìn)行CEEMD分解,對(duì)相關(guān)系數(shù)排名前4的IMF分量分別提取能量算子作為特征值。
將獲得的特征矩陣按照類別分別劃為0類、1類、2類和3類,其中0類代表滾子故障,1類代表健康,2類代表內(nèi)圈故障,3類代表外圈故障。將數(shù)據(jù)按照8:2的比例劃分為訓(xùn)練集與測(cè)試集(訓(xùn)練集有1 280個(gè)樣本,測(cè)試集有320個(gè)樣本),將訓(xùn)練集輸入模型。模型參數(shù)中的最大深度設(shè)置為50,學(xué)習(xí)率設(shè)置為0.05,其他參數(shù)均為默認(rèn)值。模型訓(xùn)練完畢后,用測(cè)試集進(jìn)行測(cè)試,測(cè)試準(zhǔn)確率為97%。準(zhǔn)確率的公式為:
(15)
式中:TP為正確識(shí)別的陽(yáng)性樣本數(shù)量;TN為正確識(shí)別的陰性樣本數(shù)量;FN為錯(cuò)誤識(shí)別的陽(yáng)性樣本數(shù)量;FP為識(shí)別錯(cuò)誤的陰性樣本數(shù)量。
其混淆矩陣如圖2所示。滾子故障樣本中有1個(gè)樣本誤判為健康;健康樣本中有1個(gè)樣本誤判為滾子故障,有3個(gè)樣本誤判為內(nèi)圈故障;內(nèi)圈故障樣本中有2個(gè)樣本誤判為健康;外圈故障樣本中全都預(yù)測(cè)正確??傮w預(yù)測(cè)效果較優(yōu)。
圖2 XGBoost模型測(cè)試混淆矩陣
本文提出了一種利用CEEMD和XGBoost模型分析振動(dòng)信號(hào)來(lái)識(shí)別滾動(dòng)軸承故障的方法。實(shí)驗(yàn)結(jié)果表明:CEEMD算法分解振動(dòng)信號(hào)后提取的能量算子作為特征,通過(guò)XGBoost數(shù)模型可以較好地實(shí)現(xiàn)識(shí)別故障類型,證明了本文方法的有效性。