張 敏 ,蔡振宇 ,包珊珊
(1.西南交通大學(xué)機(jī)械工程學(xué)院,四川 成都 610031;2.西南交通大學(xué)軌道交通運(yùn)維技術(shù)與裝備四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610031)
滾動(dòng)軸承廣泛存在于機(jī)械結(jié)構(gòu)中,作為重要的旋轉(zhuǎn)結(jié)構(gòu),是最容易出現(xiàn)故障的部件之一.滾動(dòng)軸承振動(dòng)信號(hào)具有非線性與非穩(wěn)定的特性,單從時(shí)域或頻域進(jìn)行故障診斷較困難[1].于德介等[2]首次引入固有模態(tài)函數(shù)(intrinsic mode function,IMF)分量應(yīng)用于機(jī)械故障診斷,本文簡稱模態(tài)函數(shù),將M 距離函數(shù)和支持向量機(jī)(support vector machine,SVM)進(jìn)行結(jié)合實(shí)現(xiàn)故障模式識(shí)別,但經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[3]分解出具有原始信號(hào)特征的IMFS 容易出現(xiàn)模態(tài)混疊,掩蓋原始信號(hào)的真實(shí)特征[4-5].Wu 和Huang 等[6]在EMD 的基礎(chǔ)上改進(jìn)提出集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD),引入高斯白噪聲能夠有效地避免模態(tài)混疊[7],分解出的IMFS 具有完整信息,但I(xiàn)MF 所含信息有限,還需進(jìn)一步處理.Hilbert 包絡(luò)解調(diào)是一種運(yùn)用廣泛的信息解調(diào)技術(shù),但在確定帶通濾波參數(shù)時(shí)需要豐富的經(jīng)驗(yàn),限制了該技術(shù)的發(fā)展[8],若直接在模態(tài)函數(shù)上進(jìn)行Hilbert 變換則可避免帶通濾波參數(shù)的確定.
多分類SVM 通過核參數(shù)將特征向量映射到高維空間實(shí)現(xiàn)分類,參數(shù)的確定影響整個(gè)分類效果.何青等[9]用果蠅優(yōu)化算法優(yōu)化SVM 參數(shù),但測試集量少,大數(shù)據(jù)下還有待驗(yàn)證.煙花算法(firework algorithm,F(xiàn)WA)[10]是Tan 和Zhu 在2010年提出的一種新型進(jìn)化算法,具有很強(qiáng)的優(yōu)化求解能力,應(yīng)用在優(yōu)化SVM參數(shù)時(shí)比粒子群算法(particle swarm optimization,PSO)迭代時(shí)間快且更準(zhǔn)確[11],近年來逐漸受到研究者的關(guān)注.
本文提出利用EEMD 將原始數(shù)據(jù)分解成IMFS,再對(duì)IMF 進(jìn)行Hilbert 變換,避免帶通濾波參數(shù)的確定,同時(shí)可對(duì)模態(tài)函數(shù)進(jìn)行信息解調(diào)分析;將模態(tài)函數(shù)及其變換后的解調(diào)信息進(jìn)行統(tǒng)計(jì)特征提取并降維處理;最后采用新型煙花算法優(yōu)化SVM 分類參數(shù),代入數(shù)據(jù)實(shí)現(xiàn)快速、準(zhǔn)確的故障診斷.
EEMD 是通過給目標(biāo)信號(hào)加入一定幅值的高斯白噪聲,利用白噪聲頻譜均衡分布的特點(diǎn)來均衡噪聲,有效地解決了EMD 出現(xiàn)模態(tài)混疊的現(xiàn)象.適用于各種非線性和非穩(wěn)定的信號(hào)處理,步驟如下:
步驟1隨機(jī)生成均值 μ為0,標(biāo)準(zhǔn)差 σ為en的高斯白噪聲nm(t),t為時(shí)間,設(shè)定原始參數(shù),m表示第m次分解,1 ≤m≤M,M表示EMD 分解次數(shù).
步驟2將高斯白噪聲nm(t)加入待處理的信號(hào)y(t)中 ,得到信號(hào)為ym(t),t為時(shí)間,即
步驟3對(duì)處理后的信號(hào)ym(t)進(jìn)行EMD 分解,得到S個(gè)IMF 分量cs,m(t),
式中:rm(t)為 第m次分解得到的余項(xiàng);cs,m(t)為進(jìn)行第m次EMD 分解后的第s個(gè)IMF 分量,由頻率從高到低排列.
步驟4若m<M,則返回執(zhí)行步驟(2),M=m+1,到M次終止;
步驟5計(jì)算進(jìn)行M次EMD 分解后得到每個(gè)IMF 分量的均值,根據(jù)不相關(guān)隨機(jī)序列統(tǒng)計(jì)均值為0,消除加入高斯白噪聲對(duì)真實(shí)IMF 分量的影響,即:
步驟6將(t)作為EEMD 最終得到的第s個(gè)IMF 分量.
信號(hào)進(jìn)行EEMD 分解得到排序降次的IMF,本文選取前幾個(gè)作為研究對(duì)象,后面殘存的以低頻噪聲為主,不予考慮.對(duì)選取的(t)進(jìn)行Hilbert 變換,解調(diào)原理如下:
濾波器公式h(t)為
式中:δ(t)為脈沖函數(shù).
解析信號(hào)公式q(t)為
將主要的IMF 及其對(duì)應(yīng)的解調(diào)信息作為提取特征對(duì)象,為有效提取特征值,挑選最合適的統(tǒng)計(jì)特征值來對(duì)處理的信息進(jìn)行特征提取,本文選取的統(tǒng)計(jì)特征值依次是均值、峰值、極差、標(biāo)準(zhǔn)差、偏度、峰度、變異系數(shù)和平方和.綜合上述的所有統(tǒng)計(jì)特征量,特征維度較高,本文采用核主元分析(kernel principal component analysis,KPCA)對(duì)特征維度進(jìn)行壓縮提取,實(shí)現(xiàn)特征降維,便于后面快速故障診斷.由于篇幅問題,本文不對(duì)KPCA 降維具體內(nèi)容進(jìn)行論述,詳細(xì)參考文獻(xiàn)[12].
支持向量機(jī)通過核函數(shù)來實(shí)現(xiàn)線性不可分向線性可分的轉(zhuǎn)化,研究表明徑向基核函數(shù)K(xi,yi)在SVM 中表現(xiàn)出良好的泛化能力[13],將輸入向量從原來的空間映射到高維特征空間P,并在該特征空間P內(nèi)建立優(yōu)化超平面.分類線方程為[14-15]
式中:(xi,yi)為 訓(xùn)練樣本;ω為權(quán)值;x為輸入向量值;b為閾值;l為向量的個(gè)數(shù).
根據(jù)Karush-Kuhn-Tucker,優(yōu)化各個(gè)系數(shù)得到最優(yōu)決策函數(shù)為
式中:ai為Lagrange 系數(shù).
最后得到適應(yīng)度函數(shù)為
式中:C為懲罰參數(shù);σ為核參數(shù).
由式(10)可知進(jìn)行SVM 分類模型構(gòu)建時(shí),性能的關(guān)鍵因素在于參數(shù)C和 σ的選取.
FWA 是將每個(gè)煙花都當(dāng)作一個(gè)解空間中的可行解,通過爆炸產(chǎn)生煙花點(diǎn)作為全局搜索的可行解.通過每個(gè)煙花的適應(yīng)度值來變化爆炸半徑和爆炸數(shù),適應(yīng)度值越小的點(diǎn)爆炸范圍越小,爆炸數(shù)越多,適應(yīng)度值大的則相反.煙花算法核心包括爆炸算子、變異操作、映射規(guī)則、選擇策略4 個(gè)部分[16].
假定待求解的優(yōu)化問題形式為minf(u)∈R,u∈Ω,Ω為可行解.煙花算法對(duì)SVM 參數(shù)優(yōu)化步驟如下:
步驟1在解空間內(nèi)隨機(jī)生成N個(gè)初始un,有N個(gè)煙花;
步驟2計(jì)算每個(gè)煙花的適應(yīng)度值與它們的爆炸半徑Bn和爆炸花火個(gè)數(shù)Qn;
式中:ymin=min{f(un)},為這次迭代中的最優(yōu)值,也為最小值,n=1,2,...,N;ymax=max{f(un)}為當(dāng)前迭代中的最劣值,也為最大值;H為爆炸火花數(shù)的大??;ε為機(jī)器最小量,避免出現(xiàn)零操作.
為了避免適應(yīng)度值優(yōu)的或者劣的產(chǎn)生過多或者過少的爆炸火花,文獻(xiàn)[10]對(duì)火花個(gè)數(shù)做出如下的限制:
式中:Sn為火花個(gè)數(shù);a、b為常數(shù).
步驟3產(chǎn)生爆炸火花,集合DC具有z個(gè)維度,z=round(D×rand(0,1)),D為煙花un的維數(shù).在DC中的每個(gè)維度k下進(jìn)行爆炸操作,再經(jīng)過越界處理將Tnk保存到火花種群中.
式中:h為偏移量;unk為第n個(gè)煙花在第k維上的位置;Tnk為unk爆炸操作后的火花位置.
步驟4進(jìn)行高斯變異操作,每個(gè)維度通過式(16)進(jìn)行高斯變異,再經(jīng)過越界處理保存到高斯種群當(dāng)中.
式中:e~N(1,1)表示均值為1,方差為1 的高斯分布.
步驟5選擇操作,在所有得到的種群中挑選最好的一個(gè),另外N-1 個(gè)則通過輪盤賭法進(jìn)行選擇如式(17)、(18).
式中:P(un)為R(un)的 概率;R(un)為個(gè)體un與其它個(gè)體的距離之和;d(un-uj)是 指任意兩個(gè)個(gè)體un和uj之間的歐式距離.
步驟6判斷是否滿足終止迭代條件,滿足則結(jié)束輸出最優(yōu)SVM 參數(shù),不滿足就繼續(xù)迭代.
基于EEMD-Hilbert 特征提取和FWA-SVM 故障診斷具體步驟如下:
步驟1原始信號(hào)樣本提取.獲得設(shè)備運(yùn)行所采集到的數(shù)據(jù)樣本,對(duì)樣本進(jìn)行分組.
步驟2EEMD 分解處理.將樣本數(shù)據(jù)進(jìn)行EEMD 分解得到若干個(gè)IMF 函數(shù).
步驟3Hilbert 變換處理.對(duì)選取的IMF 進(jìn)行Hilbert 變換,獲得瞬時(shí)頻率.
步驟4統(tǒng)計(jì)特征提取.對(duì)IMF 分量和解調(diào)信息分別計(jì)算其對(duì)應(yīng)的統(tǒng)計(jì)特征值.
步驟5KPCA 特征降維.提取出有用的信息特征實(shí)現(xiàn)特征降維.
步驟6FWA 尋SVM 最佳參數(shù).將訓(xùn)練樣本帶入FWA-SVM 進(jìn)行訓(xùn)練,得到最佳的SVM 分類參數(shù).
步驟7模式識(shí)別.將訓(xùn)練好的FWA-SVM 模型進(jìn)行測試集故障分類,輸出結(jié)果.
基于EEMD-Hilbert 特征提取和FWA-SVM 故障診斷流程如圖1所示.
圖1 故障診斷流程Fig.1 Flowchart for troubleshooting
為驗(yàn)證算法模型的可行性和有效性,本文采用美國Case Western Reserve University 電氣工程實(shí)驗(yàn)室的滾動(dòng)軸承實(shí)驗(yàn)平臺(tái)數(shù)據(jù)[17],實(shí)驗(yàn)中測試的軸承是由SFK 公司生產(chǎn)的6205-2RS 深溝球軸承.
選取滾動(dòng)軸承在轉(zhuǎn)速為1797 r/min,采樣頻率為12 kHz 情況下的正常工作狀態(tài),內(nèi)圈故障、滾動(dòng)體故障和外圈故障3 種故障狀態(tài),其中外圈故障選擇發(fā)生在6 點(diǎn)鐘方向上.同時(shí)考慮3 種故障狀態(tài)下的3 種損傷尺寸,分別為0.178、0.356、0.533 mm,具體數(shù)據(jù)如表1.
表1 軸承故障樣本Tab.1 Bearing failure samples
將信號(hào)進(jìn)行EEMD 分解,得到正常、內(nèi)圈故障、滾動(dòng)體故障和外圈故障,故障點(diǎn)直徑為0.178 mm的4 個(gè)IMF 分量與其對(duì)應(yīng)的原始信號(hào)如圖2所示.
3.2.1 不同信號(hào)處理方法的比較研究
方法a 將信號(hào)進(jìn)行EEMD 和Hilbert 變換,通過統(tǒng)計(jì)特征量提取,再進(jìn)行KPCA 降維,將特征數(shù)據(jù)代入PSO 優(yōu)化SVM 參數(shù)模型內(nèi)進(jìn)行分類,記為EEMD_H模型.方法b 與方法a 類似,但不進(jìn)行Hilbert 變換,記為EEMD 模型.方法c 對(duì)原始信號(hào)進(jìn)行EMD 分解[18],后面和方法a 一樣,記為EMD_H 模型.PSO 初始參數(shù)為20 種群數(shù),400 的最大迭代數(shù).結(jié)果如表2(數(shù)據(jù)結(jié)果為5 次平均值)所示,圖3是同一信號(hào)分別進(jìn)行EEMD 和EMD 分解之后選擇首個(gè)IMF 進(jìn)行圖像化的波形圖.
進(jìn)行EEMD 分解的迭代時(shí)間比進(jìn)行EMD 分解時(shí)間更短,且正確率要低4%左右.圖3說明EEMD可以較好避免EMD 的模態(tài)混疊現(xiàn)象.不加Hilbert變換處理的數(shù)據(jù)比加Hilbert 變換數(shù)據(jù)要差5%,說明加Hilbert 變換特征更全面,達(dá)到更好的數(shù)據(jù)特征提取.以上證明了EEMD_H 方法能夠更精確地提取原始信號(hào)的特征信號(hào),達(dá)到高效、準(zhǔn)確的特征提取,證明了該特征提取方法的有效性與可行性.
3.2.2 算法參數(shù)尋優(yōu)收斂性對(duì)比研究
圖2 原始信號(hào)和 IMF1~I(xiàn)MF4 分量波形圖Fig.2 Original signal and IMF1- IMF4 component waveforms
表2 3 種分類結(jié)果Tab.2 Classification results for the three methods
利用目前成熟的粒子群算法和遺傳算法(genetic algorithm,GA)優(yōu)化SVM 參數(shù)構(gòu)造的模型與煙花算法優(yōu)化參數(shù)進(jìn)行對(duì)比,所選的粒子群算法和遺傳初始參數(shù)種群數(shù)為20,最大迭代數(shù)為200;煙花算法初始參數(shù)煙花種群數(shù)量為20,最大迭代數(shù)為200.結(jié)果如表3和圖4所示,其中適應(yīng)度值是原始算法中適應(yīng)度實(shí)值的絕對(duì)值.
由表3與圖4可知,F(xiàn)WA 優(yōu)化SVM 參數(shù)比PSO更早達(dá)到最大值,且FWA 比PSO、GA 得到的訓(xùn)練集正確率更高,說明煙花算法比PSO、GA 在搜索域內(nèi)能快速、準(zhǔn)確得到最優(yōu)的核函數(shù)參數(shù).GA 算法源于搜索域較廣,容易陷入局部最優(yōu),間接說明FWA的迭代收斂能力更強(qiáng).另外FWA 與PSO 出現(xiàn)此類差別原因需從算法構(gòu)造思路不同處進(jìn)行分析:(1)煙花算法通過分布式信息共享,根據(jù)分布在不同區(qū)域煙花的適應(yīng)度值決定爆炸強(qiáng)度大小和輻射范圍,但PSO 是單項(xiàng)流動(dòng),搜索迭代過程是跟隨當(dāng)代最優(yōu)解;(2)煙花算法中的高斯變異在變異中選出的不同維,而維度上的位移是相同的,保證了某些維度之間一些聯(lián)系,而PSO 中各維變異是不相同的;(3)煙花算法中的高斯變異每代都要進(jìn)行,而粒子群中每隔一定的迭代次數(shù)才運(yùn)行1 次.
3.2.3 不同模型的故障診斷效果對(duì)比研究
利用遺傳算法GA 和粒子群算法PSO 分別優(yōu)化SVM 參數(shù)構(gòu)造的模型與煙花算法FWA 優(yōu)化SVM 參數(shù)進(jìn)行對(duì)比,分別記為GA 模型、PSO 模型和FWA 模型.各算法初始種群數(shù)都為20,最大迭代數(shù)為400,其他都選各自最合適的參數(shù).將上述處理好的訓(xùn)練集和測試集代入構(gòu)造好的模型,進(jìn)行結(jié)果分析.結(jié)果如表4(數(shù)據(jù)結(jié)果為5 次平均值)和圖5所示.
從表4和圖5可以看出,在時(shí)間上FWA 優(yōu)化SVM 參數(shù)的平均時(shí)間只要14 s,相對(duì)較好迭代時(shí)間效果GA 縮短了100 s 多,而PSO 迭代時(shí)間較長,效果較差;FWA 優(yōu)化的模型也在正確率上體現(xiàn)出優(yōu)勢(shì),比GA 高0.4%,比PSO 高0.2%.以上說明FWA能夠?qū)崿F(xiàn)快速、準(zhǔn)確地對(duì)SVM 參數(shù)優(yōu)化,因此驗(yàn)證了煙花算法能夠很好地優(yōu)化SVM 參數(shù),構(gòu)建的模式識(shí)別模型能準(zhǔn)確地進(jìn)行故障診斷.
圖3 兩種方法首個(gè)IMFFig.3 Two methods for the first IMF chart
表3 FWA、PSO、GA 對(duì)SVM 參數(shù)尋優(yōu)Tab.3 FWA,PSO,and GA for SVM parameter optimisation
圖4 3 種算法SVM 參數(shù)迭代對(duì)比Fig.4 Comparison of SVM parameters for the three algorithms
表4 3 種分類結(jié)果Tab.4 Classification results for the three algorithms
圖5 3 種分類結(jié)果對(duì)比Fig.5 Comparison of the three classification results
提出一種采用集合經(jīng)驗(yàn)?zāi)B(tài)分解、Hilbert 變換的特征提取方法,并利用煙花算法優(yōu)化支持向量機(jī)分類參數(shù)的滾動(dòng)軸承故障診斷方法.將振動(dòng)信號(hào)進(jìn)行EEMD 分解,避免了EMD 分解的模態(tài)混疊現(xiàn)象,準(zhǔn)確提取信號(hào)特征;通過對(duì)IMF 分量進(jìn)行Hilbert 變換獲得頻域統(tǒng)計(jì)特征,綜合了Hilbert 處理數(shù)據(jù)的優(yōu)點(diǎn),避免帶通濾波參數(shù)的選取,實(shí)現(xiàn)原始信號(hào)特征更準(zhǔn)確提?。蛔詈罄脽熁ㄋ惴▋?yōu)化SVM 參數(shù),比傳統(tǒng)的遺傳算法、粒子群算法識(shí)別率更高,迭代時(shí)間更少,實(shí)現(xiàn)了快速、準(zhǔn)確的故障診斷.案例分析的結(jié)果證明,運(yùn)用該算法模型在故障診斷方面是一條可行的途徑.