于 飛,樊清川,宣 敏
(海軍工程大學(xué) 電氣工程學(xué)院, 湖北 武漢 430033)
軸承在電機(jī)的運(yùn)行中起著支撐和引導(dǎo)旋轉(zhuǎn)的作用,據(jù)統(tǒng)計,電機(jī)故障有40%左右是由軸承故障引發(fā)[1]。軸承是電機(jī)健康監(jiān)測的重要對象,直接影響到電機(jī)運(yùn)轉(zhuǎn)的整體性能。因此,開展電機(jī)軸承的故障診斷研究意義重大。
目前基于振動信號的軸承故障診斷是最為常見的方法,當(dāng)電機(jī)軸承出現(xiàn)故障時振動信號會出現(xiàn)明顯的沖擊波動,若對振動信號的時頻信號進(jìn)行有效的提取,就能為電機(jī)軸承的故障診斷提供有利的數(shù)據(jù)基礎(chǔ)。文獻(xiàn)[2]利用經(jīng)驗(yàn)?zāi)B(tài)分解獲得振動信號的固有模態(tài)函數(shù)(intrinsic mode function, IMF),再提取IMF分量的奇異值以獲得降維后的新特征向量,最后利用模糊神經(jīng)網(wǎng)絡(luò)有效地評估了電機(jī)軸承的運(yùn)行狀況。文獻(xiàn)[3]提取了振動信號的能量特征,然后利用隱馬爾可夫模型建立分類模型,能夠有效區(qū)分不同類型故障的序列。文獻(xiàn)[4]將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)應(yīng)用于電機(jī)軸承的故障診斷中,同時還使用了傳統(tǒng)的快速傅里葉變換進(jìn)行振動信號特征提取,但無法充分發(fā)揮CNN的特征提取優(yōu)勢,從而造成診斷效果欠佳。文獻(xiàn)[5]利用集成經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)提取IMF分量,并通過Hilbert變換獲得包絡(luò)譜,最后利用優(yōu)化過的深度信念網(wǎng)絡(luò)(deep belief network, DBN)進(jìn)行故障分類,結(jié)果較好,但在識別滾動體故障時準(zhǔn)確率較低。文獻(xiàn)[6]采用連續(xù)小波變換將振動信號轉(zhuǎn)換為二維灰度圖像,將CNN從灰度圖像中提取的特征輸入射頻,有效診斷滾動軸承故障。文獻(xiàn)[7]提出了一種廣義多尺度動態(tài)時間彎曲算法,用于從風(fēng)力發(fā)電機(jī)組齒輪箱振動信號中提取故障特征,采用拉普拉斯評分法選擇敏感特征構(gòu)造特征向量,采用隨機(jī)森林進(jìn)行故障狀態(tài)分類。結(jié)果表明,該方法不僅能準(zhǔn)確、高效地識別出不同的故障狀態(tài),而且與其他故障狀態(tài)分類方法相比,準(zhǔn)確性更高。
針對電機(jī)軸承振動信號,本文提出利用變分模態(tài)分解(variational mode decomposition, VMD)獲得振動信號的IMF分量,并計算各IMF分量的多尺度熵重構(gòu)特征向量,再利用改進(jìn)的WOA算法對XGBoost模型進(jìn)行超參數(shù)尋優(yōu),最后利用GWOA-XGBoost模型對重構(gòu)的特征向量進(jìn)行故障診斷,并通過實(shí)驗(yàn)案例證明所提模型的可行性。
VMD是在維納濾波、Hilbert變換以及外差調(diào)解的基礎(chǔ)上建立的一種新的非線性信號分解方法,避免了EMD在處理信號時可能出現(xiàn)端點(diǎn)效應(yīng)或模態(tài)混跌的情況。VMD算法預(yù)先確定模態(tài)分量個數(shù)K,保證它們的帶寬之和最小,每個IMF分量被新定義成一個調(diào)幅-調(diào)頻信號,表示如下:
uk(t)=Ak(t)cos(φk(t))
(1)
其中:Ak(t)為cos(φk(t))的幅值;φk(t)為uk(t)的相位,ωk(t)=φ′k(t)為uk(t)的瞬時頻率。具體分解步驟如下:
1)利用Hilbert變換求出每個IMF分量的解析信號,其單邊頻譜表示如下:
(2)
2)估算K個IMF分量的中心頻率,引入指數(shù)項e-jωkt,調(diào)制各IMF分量的頻譜到其所屬基頻帶:
(3)
3)求出調(diào)節(jié)信號的梯度平方范數(shù),估算每個IMF分量的帶寬。最后基于約束條件,得到變分約束模型:
(4)
4)將二次罰參數(shù)α和Lagrange乘數(shù)λ引入,使變分約束模型轉(zhuǎn)換成變分非約束模型:
L({uk(t)},{ωk(t)},{λ(t)})=
(5)
在使用VMD進(jìn)行分解時,分解層數(shù)K和懲罰因子α決定著信號處理的效果。當(dāng)K值較小時,會存在分解不完全造成原始信號信息丟失的情況;當(dāng)K值較大時,相鄰IMF分量的頻率中心間距較小,可能出現(xiàn)模態(tài)混疊的現(xiàn)象。懲罰因子α影響著分解過程的降噪性能以及細(xì)節(jié)保留度。本文利用粒子群優(yōu)化算法(particle swarm optimization, PSO)獲得最優(yōu)K與α的組合。
局部極小熵的值反映了概率分布特性,可將其作為判斷信號稀疏度的標(biāo)準(zhǔn)。引入局部極小熵作為PSO的適應(yīng)度函數(shù),迭代尋優(yōu)步驟如下:
步驟1:確定PSO的適應(yīng)度函數(shù)并初始化其關(guān)鍵參數(shù)。
步驟2:將待優(yōu)化參數(shù)(K,α)作為個體位子坐標(biāo),隨機(jī)生成每個個體的初始坐標(biāo)與初始速度。
步驟3:每次迭代更新,使用VMD對每個個體進(jìn)行分解,計算其對應(yīng)的局部極小熵值,將所有個體進(jìn)行比較,更新局部極值以及全局極值。
步驟4:更新個體的速度和位置,跳至步驟3,當(dāng)?shù)M(jìn)行到預(yù)設(shè)最大次數(shù)或滿足預(yù)設(shè)適應(yīng)度值條件時停止,最優(yōu)個體即為所需最佳VMD參數(shù)。
基于樣本熵概念Costa等[9]提出了多尺度熵(multi scale entropy,MSE)理論,從不同的尺度定義了時間序列的不規(guī)則變化,對原始信號進(jìn)行粗?;嬎?得到樣本序列在多個尺度下的樣本熵。樣本熵反映了信號在不同尺度下的復(fù)雜特性,進(jìn)而可區(qū)分信號間的差異性,計算方法如下:
步驟1:設(shè)一組數(shù)據(jù)X={X1,X2,X3,…,Xn},對其進(jìn)行粗?;庸?目的在于改變原始數(shù)據(jù)的尺度,組成新的向量,即:
(6)
步驟2:設(shè)置相似限度r以及嵌入維度m,粗?;蒻維矢量:
Y(i)={Yi,Yi+1,Yi+2,…,Yi+m-1}
(7)
其中,i=1,2,3,…,n-m。
步驟3:Y(i)與Y(j)兩個樣本之間最大距離的絕對值記為D(i,j):
D(i,j)=|Y(i)-Y(j)|=max|X(i+k)-X(i-k)|
(8)
其中:i,j=1,2,3,…,n-m;k=1,2,3,…,m-1。
(9)
步驟5:若重構(gòu)數(shù)據(jù)有m+1個時,重復(fù)步驟1~4得到Bm+1(r)。則數(shù)列X={X1,X2,X3,…,Xn}的樣本熵為:
(10)
當(dāng)N為有限數(shù)時,樣本熵表示為:
(11)
步驟6:不同尺度τ的樣本熵共同表示多尺度熵:
(12)
計算多尺度熵時需預(yù)先設(shè)置嵌入維度m、相似限度r以及尺度因子τ,基于經(jīng)驗(yàn)設(shè)置m=2,r為0.1δ~0.25δ(δ表示數(shù)據(jù)序列標(biāo)準(zhǔn)差),τ≤20[10]。本文選擇m=2,r=0.2δ,τ=15。
XGBoost模型是基于樹模型集成的一種新型機(jī)器學(xué)習(xí)算法,它主要是將多個分類精度不高的分類回歸樹(classification and regression tree, CART)模型結(jié)合,搭建出一個精度較高的模型。模型精度迭代增加,每一輪迭代使用一個新的CART樹模型去擬合前一個樹模型的殘差,該過程叫作梯度提升。XGBoost模型構(gòu)建如下。
對于某一數(shù)據(jù)集D={(xi,yi)}(xi∈Rm,yi∈R)包含n個樣本、m維特征,K棵樹模型最終輸出為:
(13)
F={f(x)=ωq(x)},q:Rm→T,ω∈RT
(14)
其中:每個fk對應(yīng)著一個單獨(dú)的樹模型;q表示一個從樣本指向?qū)?yīng)葉子標(biāo)簽的結(jié)構(gòu);ω表示樹模型的權(quán)重,即第i個節(jié)點(diǎn)的權(quán)重為ωi;T表示葉子節(jié)點(diǎn)的數(shù)量;F表示樹模型組成的集合;ωq(x)表示對樣本x的打分,即模型輸出值。
XGBoost的目標(biāo)函數(shù)正則化可以表示為:
(15)
(16)
WOA[11]是在2016年提出的一種元啟發(fā)式群體智能優(yōu)化算法,該算法是受鯨魚的氣泡網(wǎng)攝食行為啟發(fā)而來的。如圖1(a)所示,鯨魚在獵物的正下方,沿著螺旋狀路徑,使用收縮包圍的方法逐步逼近獵物,在逼近的同時,不斷向上噴吐氣泡,獵物無法游過氣泡網(wǎng),與此同時鯨魚加速上升,吃掉獵物,完成狩獵。WOA的參數(shù)優(yōu)化如圖1(b)所示,包含三個機(jī)制:環(huán)繞包圍、螺旋更新和全局搜索。
(a) 捕食行為(a) Predation
2.2.1 環(huán)繞收縮
在該階段,設(shè)定種群中的最優(yōu)單位作為目標(biāo),其他個體更新自己的位置并向目標(biāo)獵物逼近,其數(shù)學(xué)模型為:
X(t+1)=Xp(t)-A·D
(17)
D=|B·XP(t)-X(t)|
(18)
其中:X(t)是鯨魚個體的位置向量;t為當(dāng)前的迭代次數(shù);Xp(t)是獵物的位置向量[12];A和B表示系數(shù)向量,表達(dá)式如式(19)所示。
(19)
其中:r1和r2是[0,1]內(nèi)的隨機(jī)向量;a表示調(diào)控參數(shù),隨著迭代的進(jìn)行,a從2遞減至0,即
(20)
其中,tmax是最大迭代次數(shù)。
2.2.2 螺旋更新
螺旋更新機(jī)制的數(shù)學(xué)模型為:
X(t+1)=Xp(t)+D′·ebl·cos(2πl(wèi))
(21)
D′=|XP(t)-X(t)|
(22)
其中:D′表示搜索目標(biāo)和搜索個體之間的距離;b是形狀參數(shù)用來輔助定義圖1(b)中的對數(shù)螺旋線,l是[-1,1]之間的隨機(jī)數(shù)。
但要注意,捕獵過程中,鯨魚收縮環(huán)形路徑的過程與鯨魚沿環(huán)形路徑前進(jìn)的過程是同步進(jìn)行的,因此,在優(yōu)化時,群體進(jìn)行環(huán)繞包圍和螺旋更新的概率p是相同的,均為0.5,如下所示:
(23)
其中,p是[0,1]之間隨機(jī)生成的一個數(shù)。
2.2.3 全局搜索
在該階段,對鯨魚搜尋獵物的行為進(jìn)行建模。搜索個體的位置是根據(jù)種群中隨機(jī)選取的一個搜索個體進(jìn)行更新,而非當(dāng)前的最優(yōu)個體。該階段其他個體將遠(yuǎn)離隨機(jī)選取的搜索個體,以執(zhí)行全局搜索:
X(t+1)=Xrand(t)-A·|B·Xrand(t)-X(t)|
(24)
其中,Xrand(t)為種群中隨機(jī)選取的尋優(yōu)個體位置。
WOA往往存在過早陷入局部最優(yōu)解的現(xiàn)象,于是在WOA中引入GA的選擇、交叉、變異操作(獲得GWOA算法),能夠使得個體跳出局部最優(yōu)解而獲得全局最優(yōu)解,其基本模型參見文獻(xiàn)[13]。
在進(jìn)行選擇操作時常用“輪盤賭法”,該操作能夠增加種群的平均適應(yīng)度,但難以產(chǎn)生更優(yōu)的個體,會導(dǎo)致種群多樣性下降,造成部分有意義的點(diǎn)丟失,所以在進(jìn)行選擇時增加一定的選擇比例既可提高平均適應(yīng)度,又可保證種群基因的多樣性。對于選擇操作,在整個迭代過程的早期,使用較大的交叉概率盡可能獲得更優(yōu)的個體;在算法迭代的后期,個體間的差異較小,為避免優(yōu)秀個體被破壞,需降低交叉概率。同理,當(dāng)進(jìn)行變異操作時,前期使用較小的變異概率促進(jìn)種群前期的進(jìn)化,后期增加變異概率,避免陷入局部最優(yōu)。改進(jìn)的WOA算法流程如圖2所示。借用Srinivas等[14]所提自適應(yīng)遺傳算法里的思想得到的自適應(yīng)交叉概率和變異概率的計算如下:
圖2 改進(jìn)WOA算法流程Fig.2 Improved WOA algorithm flow
(25)
(26)
利用XGBoost模型進(jìn)行分類訓(xùn)練時,迭代次數(shù)n過少存在欠擬合現(xiàn)象,導(dǎo)致模型無法充分訓(xùn)練,當(dāng)n過大,則存在過擬合現(xiàn)象,導(dǎo)致模型對數(shù)據(jù)訓(xùn)練過于極限而泛化能力下降;學(xué)習(xí)率η過小時,模型訓(xùn)練過慢,過大時可能忽略全局最優(yōu)解;決策樹最大深度dmax、隨機(jī)樣本比rsubsample、特征占比rcolsample以及決策樹分裂點(diǎn)指標(biāo)γsplit等共同影響模型的分類能力和預(yù)測精度。利用改進(jìn)的WOA算法對這6個參數(shù)進(jìn)行迭代尋優(yōu),以增強(qiáng)模型的故障診斷性能?;贕WOA優(yōu)化的XGBoost電機(jī)軸承故障診斷流程如圖3所示。
圖3 電機(jī)軸承故障診斷流程Fig.3 Motor bearing fault diagnosis process
本文所使用的實(shí)驗(yàn)數(shù)據(jù)來源于美國凱斯西儲大學(xué)[15],數(shù)據(jù)集包含電機(jī)軸承的內(nèi)圈、外圈、滾動體的輕微故障以及嚴(yán)重故障再加上正常運(yùn)行狀態(tài)共七類數(shù)據(jù)。樣本運(yùn)行狀態(tài)編碼如表1所示。
選擇電機(jī)運(yùn)行工況為735 W、轉(zhuǎn)速1 772 r/min、采樣頻率12 kHz的電機(jī)軸承故障數(shù)據(jù)集,將數(shù)據(jù)集切分成長度為1 200個點(diǎn)的700組數(shù)據(jù)來驗(yàn)證所提模型的可行性,不同故障狀態(tài)的時頻波形如圖4所示。
(a) 時域(a) Time domain
利用PSO算法訓(xùn)練VMD以獲得最優(yōu)超參數(shù)組合,將局部極小熵值作為適應(yīng)度,適應(yīng)度變化曲線如圖5所示。
圖5 適應(yīng)度變化曲線Fig.5 Fitness curve
由圖5看出,在8次迭代后適應(yīng)度值基本不變,進(jìn)行10次計算取其平均值,獲得最優(yōu)超參數(shù)組合(K,α)=(4,134 7),此時的局部最小包絡(luò)熵值最小。使用優(yōu)化后的VMD對軸承故障數(shù)據(jù)進(jìn)行分解,由于篇幅有限,此處僅列出外圈嚴(yán)重故障分解的時頻波形,如圖6所示。
(a) 時域(a) Time domain
正交性指數(shù)(index of orthogonality, IO)可以用來表征各IMF分量的整體正交性,IO值越小,則各IMF分量的正交性越強(qiáng);能量保存度(index of energy conservation, IEC)表示分解前后能量對比量,IEC的值與1越接近,則分解時保留下的能量越多,分解穩(wěn)定性越好[16]。優(yōu)化前后VMD分解效果對比見表2,可以看出優(yōu)化后的VMD分解正交性與穩(wěn)定性都更優(yōu)異。
表2 VMD優(yōu)化前后效果對比
使用優(yōu)化后的VMD對電機(jī)軸承振動信號分解后獲得多個IMF分量,由于MSE能夠反映信號的復(fù)雜性,于是再進(jìn)行MSE計算重構(gòu)特征向量。
將處理好的700組數(shù)據(jù)隨機(jī)抽取90%作為訓(xùn)練集,剩下10%作為測試集。利用改進(jìn)WOA算法優(yōu)化XGBoost參數(shù),設(shè)置WOA尋優(yōu)個體數(shù)量為20,維數(shù)為7,最大迭代次數(shù)為100,將訓(xùn)練集數(shù)據(jù)輸入GWOA-XGBoost模型訓(xùn)練,得最優(yōu)超參數(shù)如表3所示。
表3 最優(yōu)超參數(shù)
將訓(xùn)練好的XGBoost分類器應(yīng)用于測試集,故障診斷結(jié)果如圖7所示。為驗(yàn)證GWOA-XGBoost模型對電機(jī)軸承故障診斷的提升效果,分別利用WOA-XGBoost、PSO-XGBoost、GA-XGBoost、XGBoost對相同的訓(xùn)練集和測試集進(jìn)行故障診斷,故障診斷結(jié)果如圖8~11所示??梢钥闯?未經(jīng)優(yōu)化的XGBoost模型的故障診斷效果是很差的,而GWOA-XGBoost模型的故障診斷效果極好,僅在滾動體嚴(yán)重故障中出現(xiàn)了2處錯誤診斷,診斷準(zhǔn)確率高達(dá)97.14%,完全滿足工程需求。出現(xiàn)誤診的原因是采集振動信號時,傳感器離內(nèi)圈和外圈更近,能夠更清晰地采集到內(nèi)外圈的振動特性,同時滾動體在運(yùn)轉(zhuǎn)時除了隨著內(nèi)外圈進(jìn)行公轉(zhuǎn)還存在自傳現(xiàn)象,這也為振動信號的采集造成了干擾,因此滾動體的故障診斷更容易出現(xiàn)誤診現(xiàn)象。
圖7 GWOA-XGBoost故障診斷結(jié)果Fig.7 GWOA-XGBoost fault diagnosis results
圖8 WOA-XGBoost故障診斷結(jié)果Fig.8 WOA-XGBoost fault diagnosis results
圖9 PSO-XGBoost故障診斷結(jié)果Fig.9 PSO-XGBoost fault diagnosis results
圖10 GA-XGBoost故障診斷結(jié)構(gòu)Fig.10 GA-XGBoost fault diagnosis results
圖11 XGBoost故障診斷結(jié)構(gòu)Fig.11 XGBoost fault diagnosis results
為了進(jìn)一步說明本文建立的電機(jī)軸承故障診斷模型的可靠性與準(zhǔn)確性,將所建模型與常用的故障診斷模型如BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(support vector machine,SVM)、極限學(xué)習(xí)機(jī)[17-19](extreme learning machine,ELM)進(jìn)行對比,結(jié)果如表4所示。從表中可以看出,本文建立的GWOA-XGBoost模型的故障診斷準(zhǔn)確率均高于其他算法,準(zhǔn)確率高達(dá)97.14%。
表4 不同模型的故障診斷準(zhǔn)確率
針對電機(jī)軸承故障的多樣性和模糊性造成診斷精度較低的問題,建立了一種基于XGBoost的
電機(jī)軸承故障診斷模型,結(jié)合算例分析,所得結(jié)論如下:
1)針對軸承振動信號的非線性和非平穩(wěn)性特點(diǎn),利用優(yōu)化的VMD算法對振動信號進(jìn)行預(yù)處理,結(jié)合多尺度熵理論提高信號特征提取的能力,有助于深度挖掘振動信號與故障狀態(tài)的內(nèi)在聯(lián)系。
2)在WOA算法中引入遺傳算法的選擇、交叉、變異操作,有效地幫助WOA跳出局部最優(yōu)解,再利用改進(jìn)后的WOA算法優(yōu)化XGBoost模型。所提模型與傳統(tǒng)算法相比在電機(jī)軸承的故障診斷中具有更高的診斷精度。