鄭惠萍,王卓,彭立強,秦志英,趙月靜,裴春興
(1.河北科技大學機械工程學院,河北石家莊 050018;2.中車唐山機車車輛有限公司,河北唐山 063000 )
從振動信號中提取有效的故障特征是機械故障診斷的關(guān)鍵,特征提取的效果可以決定故障診斷的準確性[1]。由于大多數(shù)機械設備的振動信號具有非線性、非平穩(wěn)性的特點,在特征提取上具有一定困難,如何提取到有效的故障特征成為目前研究的熱點[2]。
小波變換具有很好的高低頻信號處理能力,可用于處理非線性、非平穩(wěn)信號,但是小波變換仍存在小波基選擇困難等問題[3]。經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)在處理非穩(wěn)定信號上可以突出信號的局部特征,但是由于過分解及邊界效應等原因,導致產(chǎn)生模態(tài)混疊和虛假分量[4]。局部均值分解(Local Mean Decomposition,LMD)在分解故障信號時存在模態(tài)混疊問題,分解得到的PF分量包含原始信號中不同尺度特征,導致故障特征提取困難[5]。自適應噪聲完備集合經(jīng)驗模態(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)雖然有效地解決了EMD模態(tài)混疊問題,但仍存在過包絡和欠包絡現(xiàn)象[6]。
t-分布隨機鄰近嵌入(t-Distributed Stochastic Neighbor Embedding,t-SNE)算法是由VAN DER MAATEN、 HINTON[7]提出的一種基于概率分布的流形學習算法,可以有效實現(xiàn)高維數(shù)據(jù)的降維,對高維數(shù)據(jù)的處理具有優(yōu)異的效果。王望望等[8]計算原始振動信號的時頻域特征,構(gòu)建高維特征數(shù)據(jù)集,再利用t-SNE充分發(fā)掘高維故障特征數(shù)據(jù)的局部特征信息,準確地提取了低維敏感特征。王雙海等[9]采用MIGA-VMD分解振動信號,計算各IMF分量的排列熵組成特征向量,再利用t-SNE進行降維處理得到三維特征向量,取得很好的效果。
經(jīng)上述分析,本文作者通過改進CEEMDAN分解振動信號,基于相關(guān)系數(shù)準則挑選出含故障信息多的有效IMF分量,計算有效分量的時域特征、頻域特征、能量值和奇異值組成高維故障特征集,再結(jié)合t-SNE算法對高維特征降維處理得到低維敏感特征,最后通過實驗驗證所提方法的有效性。
三次Hermite插值相比于傳統(tǒng)的三次樣條插值法,能保持曲線的光滑性,若插值點的一階導數(shù)選擇合適,插值曲線就能保持單調(diào),避免三次樣條插值出現(xiàn)過包絡、欠包絡現(xiàn)象。
三次Hermite插值定義式[10]如下:對于數(shù)據(jù)(ai,bi,di),其中bi和di分別是ai處的函數(shù)值和一階導數(shù)值,Δai、Δi、Δbi分別為
Δai=ai+1-ai,Δbi=bi+1-bi,Δi=Δbi/Δai
(1)
在a∈[ai,ai+1]內(nèi)對于初值F(ai)=bi,F(xiàn)′(ai)=di給定的三次Hermite插值F(a)∈C[m,n]可定義為
(2)
改進CEEMDAN是在CEEMDAN基礎上提出的一種時頻分析方法。CEEMDAN在EMD分解的基礎上很大程度減少了模態(tài)混疊現(xiàn)象,且重構(gòu)誤差較小。但是CEEMDAN還存在一些不足,比如它延續(xù)EMD分解中求解包絡線的方法[11]。改進CEEMDAN算法通過采用三次Hermite插值法構(gòu)造包絡線,有效解決了過包絡和欠包絡問題。除此之外,改進CEEMDAN算法在包絡線構(gòu)造中也借鑒了ITD基線構(gòu)造方法[12],在相鄰的2個極大(小)值之間插入極值對稱點k,再利用三次Hermite插值生成包絡線,使原始信號更多的信息傳遞到包絡線中,大大提高了CEEMDAN的分解精度。
改進CEEMDAN算法步驟如下:
(1)原始信號為x(t),分解得到的模態(tài)分量為δIMF,a(a=1,2,3,…,A)。同時定義Ea表示由EMD分解得到的第a個模態(tài)分量,Di(i=1,2,3,…,l)為標準正態(tài)分布的白噪聲。利用Hermite插值法對極大(小)值和插入的價值對稱點形成上下包絡線,對信號xi(t)=x(t)+Di分解得到第一個模態(tài)分量IMF1表達式
(3)
(2)從原始信號中除去IMF1計算第一個余量:
r1=x(t)-δIMF,1
(4)
(3)再對信號r1(t)+εE1(Di(t))進行分解,得到第2個分量IMF2表達式;
(5)
(4)對于a=1,2,3,…,A,先求出第a個余量ra(t),再算出第a+1個IMF模態(tài)分量表達式:
ra(t)=ra-1(t)-δIMF,a
(6)
(7)
(5)重復執(zhí)行以上步驟,直到殘差余量不適合分解停止,最終余量為RA(t)。原信號可以表示為
(8)
為直觀地對比改進前后CEEMDAN處理非平穩(wěn)信號的特點,構(gòu)造仿真信號y=sin(2πf1t)+sin(2πf2t)+sin(2πf3t),其中f1=10 Hz,f2=20 Hz,f3=50 Hz;采樣頻率為1 000 Hz,采樣時間為1 s。對仿真信號進行CEEMDAN分解和Hermite插值改進的CEEMDAN分解,得到的結(jié)果如圖1、2所示。
圖1 仿真信號CEEMDAN分解結(jié)果
圖2 仿真信號改進CEEMDAN分解結(jié)果
由2種方法分解仿真信號的結(jié)果可以看出:Hermite插值法改進后的CEEMDAN分解效果更好,能夠有效地改善CEEMDAN端點附近存在的誤差現(xiàn)象,使信號分解更精準。為了定量對比改進后的CEEMDAN和CEEMDAN分解效果,引入各IMF分量之間的正交性作為評價指標。理論上信號分解后得到的所有分量兩兩正交,但是由于迭代誤差造成正交指標近似為0,所以可由正交性均值IO來評價分解效果,正交性均值IO計算公式如下:
(9)
其中:T為原始信號長度;X(t)為原始信號;j≠k。
最終由公式(9)計算得到傳統(tǒng)CEEMDAN對仿真信號處理得到的δIO值為0.031,改進后的CEEMDAN對仿真信號處理得到的δIO值為0.025,證明了改進CEEMDAN的分解效果更好。
在振動信號特征提取中,時域和頻域特征分析屬于最簡單、基礎的分析方法,同時部分機械故障也可以由時域頻域特征表現(xiàn)[13]。由改進CEEMDAN分解后得到的IMF分量比原始信號包含更加清晰、準確的故障信息。因此,對每個有效IMF分量提取6個時域特征和2個頻域特征構(gòu)建時頻域混合特征S=[S1,S2,…,Si],Si表示改進CEEMDAN分解得到的第I個IMF分量。所選時域特征如表1所示,頻域特征如表2所示。其中:x(n)是時域信號序列,n=1,2,…,N,N為樣本點數(shù);x(k)是x(n)的頻譜,k=1,2,…,K,K是譜線數(shù);fk是第k條譜線的頻率值。
表1 時域特征表達式
表2 頻域特征表達式
奇異值分解在振動信號特征提取中被廣泛應用,奇異值作為矩陣固有的特征,能表現(xiàn)出矩陣中所包含的信息。除此之外奇異值具有良好的穩(wěn)定性,在采樣時間內(nèi)振動信號各頻段的特征可以由不同IMF分量的奇異值反映出[14]。因此,采用改進的CEEMDAN對振動信號分解后得到的IMF分量進行奇異值分解,得到的奇異值能夠表現(xiàn)出機械設備的狀態(tài)。計算各階IMF分量的奇異值為σ=[σ1,σ2,…,σi]。其中i為IMF分量個數(shù)。
能量特征是振動信號的重要特征,不同狀態(tài)下設備的運行狀況可以由能量值準確地反映出來。當發(fā)生不同故障時,振動信號的頻率成分和各頻段內(nèi)信號的幅值能量都會發(fā)生改變?;诟倪M的CEEMDAN對振動信號分解得到IMF分量,其能量分布特征可以在一定程度上表征機械設備的運行狀態(tài)。計算各IMF分量|ci(t)|幅值能量Ei:
(10)
綜上分析,時域和頻域特征、奇異值特征、能量特征都能從一方面表現(xiàn)機械設備的故障特征,所以結(jié)合3種特征建立高維混合域特征:G=[Si,σi,Ei]。混合域特征可以實現(xiàn)對故障信息的全面表征,從而為故障診斷提供更充分的特征。
t-SNE作為一種無監(jiān)督非線性流形學習算法,可以充分地將低維敏感特征信息從高維數(shù)據(jù)中提取出來,從而實現(xiàn)數(shù)據(jù)的降維和二次特征提取。它采用條件概率分布思想對原始高維數(shù)據(jù)和嵌入空間低維數(shù)據(jù)進行建模,將高維數(shù)據(jù)映射到低維數(shù)據(jù)并且盡可能地保證分布概率不變。具體步驟[15]如下:
(1)設高維空間中含有n個數(shù)據(jù)樣本,表示為{x1,x2,…,xn},高維空間中數(shù)據(jù)點xi、xj相似的條件概率可以表示為
(11)
其中:σi是以數(shù)據(jù)點xi為中心的高斯分布差。
(2)計算高維空間中聯(lián)合分布概率Pij:
(12)
(3)設低維空間中的數(shù)據(jù)點為{y1,y2,…,yn},利用自由度為1的t分布計算在低維空間中樣本概率密度qij:
(13)
(4)采用KL散度表示低維空間概率分布Q和低維空間概率分布P之間的相似度為
(14)
(5)為了獲取最佳的低維嵌入數(shù)據(jù)yi,利用梯度下降算法進行優(yōu)化,得到最小KL散度表達式:
(15)
由以上步驟得到降維后的結(jié)果{y1,y2,…,yn},同時可以進行多次迭代運算,來提升低維空間點的準確性。
考慮機械設備振動信號非平穩(wěn)特性,通過改進后的CEEMDAN對原始振動信號分解,得到若干個IMF分量,根據(jù)相關(guān)系數(shù)準則挑選出含有故障信息多的有效IMF分量。從有效IMF分量中提取反映故障的特征,構(gòu)建高維混合域特征集來充分表征設備的狀況。通過t-SNE方法對高維混合域特征進行降維、二次特征提取,使混合域特征成為更易被識別的低維特征向量,最后采用支持向量機對該方法提取的特征進行分類。具體的流程如圖3所示。
圖3 改進CEEMDAN和t-SNE的故障特征提取流程
具體步驟如下:
(1)通過三次Hermite插值法改進CEEMDAN;
(2)采用改進的CEEMDAN對原始信號分解,并根據(jù)相關(guān)系數(shù)準則挑選出包含故障信息多的有效IMF分量;
(3)計算每個有效IMF分量的時域頻域特征、能量值特征和奇異值特征,構(gòu)建高維混合域特征;
(4)采用t-SNE算法對高維的混合域特征進行降維處理,得到低維敏感特征;
(5)把低維特征集輸入到SVM進行分類識別,根據(jù)結(jié)果判斷該方法特征提取的效果。
為驗證所提特征提取方法的有效性,在QPZZ-II型實驗臺上分別模擬了齒面磨損和齒根裂痕故障,故障齒輪如圖4所示。
圖4 兩種故障齒輪
振動信號通過安裝在齒輪箱靠近故障齒輪外殼的加速度傳感器采集。加速度傳感器的安裝位置如圖5所示。電機轉(zhuǎn)速為1 400 r/min,采樣頻率為6 600 Hz,采樣點數(shù)為1 600。采集正常工況、齒面磨損故障、齒根裂痕故障3種狀態(tài)下各40組數(shù)據(jù)。隨機從每種故障類型的40組數(shù)據(jù)中選出20組作為SVM的訓練樣本,其余20組作為測試樣本。
圖5 加速度傳感器位置選擇
首先,通過改進CEEMDAN分解3種狀態(tài)下的振動信號得到多個IMF分量。以齒根裂痕故障信號為例,對齒根裂痕故障振動信號分解得到9個IMF分量,如圖6所示。
圖6 齒根裂痕故障信號分解結(jié)果
由公式(9)計算齒根裂痕、齒面磨損和正常3種工況的IO值如表3所示??梢姡焊倪M的CEEMDAN處理擁有更低的δIO值,對3種工況下振動信號處理效果更好。
表3 兩種算法分解得到的正交性均值
分解過程中受到所加白噪聲與迭代次數(shù)的影響,得到的IMF分量中存在偽分量。為了挑選出能夠反映故障信息的有效IMF分量來提取到明顯的故障特征,采用相關(guān)系數(shù)分析各IMF分量和原始信號的相關(guān)程度。3種狀態(tài)下各IMF分量與原始信號的相關(guān)系數(shù)如圖7所示??芍篒MF1-IMF4相關(guān)系數(shù)明顯大于其余分量,所以選取前4個IMF分量作為有效分量,計算其時域頻域特征、奇異值和能量值構(gòu)建高維混合域特征。
圖7 各IMF分量相關(guān)系數(shù)
采用t-SNE算法將32維混合域特征集進行降維處理得到3維特征向量,為了驗證t-SNE算法的降維效果,同時采用ISOMAP、LLE和t-SNE 3種方法進行降維處理,結(jié)果如圖8所示。
由圖8可以看出:t-SNE算法對多維特征進行降維處理后,3種數(shù)據(jù)樣本分類清晰,同種故障下的樣本點能夠聚集在一起,不同故障狀態(tài)下的樣本數(shù)據(jù)在低維空間距離較遠。相較于其他2種方法具有明顯的優(yōu)勢,能夠很好地滿足特征穩(wěn)定性的需求。
為驗證特征提取方法的有效性,將60組訓練樣本輸入到SVM分類器中進行訓練,得到用于故障診斷的SVM模型。再將剩余60組測試樣本通過訓練好的SVM模型進行分類處理,測試樣本分類結(jié)果如圖9所示。其中,SVM的核函數(shù)選擇RBF核函數(shù)。齒輪故障對應的SVM標簽為:1代表齒面磨損故障,2代表齒根裂痕故障,3代表正常狀態(tài)。由圖9可以看出:采用改進CEEMDAN和t-SNE結(jié)合的故障特征提取方法,對齒輪箱的故障診斷準確率可以達到98.3%。
圖9 SVM測試集分類結(jié)果
選用與上述同樣的樣本數(shù)據(jù),分別采用EMD、CEEMDAN和改進CEEMDAN進行信號分解,提取有效IMF分量時域頻域特征、奇異值和能量值構(gòu)建高維特征向量,并通過t-SNE降維處理得到低維特征向量訓練SVM模型,用訓練好的SVM模型對測試樣本分類,診斷結(jié)果如表4所示。
表4 不同特征提取方法的診斷準確率
由于大多數(shù)機械設備在實際工作時通常工況是變化的,轉(zhuǎn)速的變化在信號特征引起的反應與故障所造成的特征變化比較相似,使得特征提取更加困難。為證明基于改進CEEMDAN和t-SNE的特征提取方法在變工況條件下也具有有效性,進行以下實驗分析。在QPZZ-II型實驗臺上采集正常齒輪、齒面磨損故障、齒根裂痕故障在電機轉(zhuǎn)速為1 200、1 000、800 r/min狀態(tài)下的振動信號。對同一故障、不同工況下的故障信號按圖3流程進行處理,各種故障信號通過改進CEEMDAN和t-SNE方法提取的3維特征如圖10所示。其中,工況1代表電機轉(zhuǎn)速為1 200 r/min,工況2代表電機轉(zhuǎn)速為1 000 r/min,工況3代表電機轉(zhuǎn)速為800 r/min。
圖10 變工況下改進CEEMDAN和t-SNE特征提取結(jié)果
從圖10可以看出:齒輪箱在正常狀態(tài)、齒面磨損故障和齒根裂痕故障同種工況下的樣本點能夠聚集在一起,不同工況下的樣本數(shù)據(jù)在低維空間距離較遠。說明基于改進CEEMDAN和t-SNE的特征提取方法能夠有效獲取變工況下齒輪箱故障振動信號的特征,驗證了該方法特征提取能力的優(yōu)越性。采用SVM對齒輪箱4種工況下提取到的特征進行分類識別,各種故障分類準確率如表5所示。
表5 不同轉(zhuǎn)速下SVM故障診斷結(jié)果
由表5可知:在不同電機轉(zhuǎn)速情況下SVM故障診斷平均準確率都在95%以上,進一步證明文中方法不僅能夠?qū)Ψ€(wěn)定工況下不同故障的特征進行有效提取,也能實現(xiàn)變工況條件下故障特征的準確提取。實驗結(jié)果證明了所提出的改進CEEMDAN和t-SNE特征提取方法具有廣泛適用性。
文中提出了一種基于改進CEEMDAN和t-SNE的故障特征提取方法。通過Hermite插值法構(gòu)造包絡線改進CEEMDAN解決了傳統(tǒng)方法的過包絡和欠包絡問題,利用改進CEEMDAN對振動信號分解并通過相關(guān)系數(shù)準則篩選出有效分量,提取有效IMF分量的時域頻域特征、奇異值特征和能量值特征構(gòu)建高維特征向量,再由t-SNE對高維特征向量降維得到低維特征向量。通過齒輪箱故障模擬實驗臺進行驗證,實驗結(jié)果表明:該特征提取方法在同類特征聚集、類間間距以及故障診斷的準確率上都優(yōu)于其他傳統(tǒng)方法。同時該方法在變工況條件下也能夠提取到有效的特征,為振動信號故障特征提取提供了新思路。