劉曉平, 鄭海起, 祝天宇
(1.軍械工程學(xué)院,石家莊 050003;2.武漢軍械士官學(xué)校,武漢 430075)
機(jī)械故障診斷是一個(gè)典型的模式分類問題。首先,通過安裝在機(jī)械設(shè)備上的各類傳感器提取該設(shè)備的運(yùn)行信息。然后,利用各種信號(hào)處理方法進(jìn)行分析處理,形成原始特征集。最后,將特征集作為分類器的輸入,達(dá)到故障分類的目的。然而,在實(shí)際的故障診斷中,原始特征集中常常包含冗余特征,導(dǎo)致計(jì)算量的加大以及分類精度的降低。因此,研究如何尋找最優(yōu)的特征子集,提高診斷精度是一個(gè)有重要意義的課題[1,2]。
在實(shí)際應(yīng)用中,尋找最優(yōu)的特征子集通常是很難的,高維數(shù)據(jù)情況下特征選擇問題通常是 NP難問題。因此只能通過非窮盡搜索算法在運(yùn)算效率和特征子集質(zhì)量間折中考慮。遺傳算法、模擬退火等非窮盡式隨機(jī)搜索算法在特征選擇中已有了較多的研究[3,4]。然而傳統(tǒng)的遺傳算法易于過早收斂和陷入局部極小。在模擬退火中,任何比對(duì)數(shù)下降快的降溫方式都不能保證算法收斂到全局最優(yōu)點(diǎn),而足夠慢的降溫過程又導(dǎo)致了極低的搜索效率。
進(jìn)化蒙特卡洛(EMC)[5,6]是一種基于總體的蒙特卡洛方法,它聯(lián)合了遺傳算法與模擬回火各自的優(yōu)點(diǎn)。運(yùn)用遺傳算法中變異和交叉的思想指導(dǎo)馬爾可夫蒙特卡洛移動(dòng),是一種具有“學(xué)習(xí)”能力的蒙特卡洛方法。研究表明,進(jìn)化蒙特卡洛對(duì)于高維分布采樣模擬和優(yōu)化問題是非常有效的[7-9]。
將進(jìn)化蒙特卡洛方法引入機(jī)械故障診斷的特征選擇,采用支持向量機(jī)(SVM)作為分類決策器,Wrapper式特征子集評(píng)價(jià)標(biāo)準(zhǔn),利用進(jìn)化蒙特卡洛算法搜索最優(yōu)特征子集。以滾動(dòng)軸承振動(dòng)信號(hào)特征選擇為例,驗(yàn)證了方法的有效性。
進(jìn)化蒙特卡洛(EMC)是一種基于總體的蒙特卡洛方法,它將遺傳算法中的變異和交叉運(yùn)算引入到模擬回火的框架,運(yùn)用變異和交叉的思想指導(dǎo)馬爾可夫蒙特卡洛移動(dòng)。它同時(shí)運(yùn)行多條馬爾可夫鏈,每一條鏈均與固定的溫度相聯(lián)系。這些鏈通過變異、交叉和交換操作來更新[5,6]。假設(shè)目標(biāo)分布為:
在EMC中,為了從上述目標(biāo)分布中模擬抽樣,首先建立N個(gè)Boltzmann分布:
其中Zi(ti)是該分布的歸一化常數(shù)。
T=(t1,t2,t3,…,tN)是 N 個(gè)給定的不同溫度值,并且t1>t2>t3>…>tN=τ,這樣(·)就是采樣的目標(biāo)分布。用xi表示從(xi)中的一個(gè)采樣,x1,x2,…,xN組成一個(gè)總體X,其中N表示總體的容量,X={x1,是一個(gè)d維的向量,稱為個(gè)體或染色體。在EMC中,應(yīng)用的是增廣狀態(tài)空間X上的馬爾可夫抽樣。目標(biāo)分布為總體的Boltzmann分布:
在變異操作中,從當(dāng)前總體X中隨機(jī)選取一個(gè)染色體xk,在xk的二值序列的一個(gè)隨機(jī)位置上隨機(jī)改變其值,將xk變異為 yk。新的建議總體為 Y={x1,…,yk,…xN}。根據(jù) Metropolis準(zhǔn)則,以概率 min(1,rm)接受建議總體。在變異操作中,總體中的每個(gè)染色體都獨(dú)立進(jìn)行變異:
在交叉操作中,根據(jù)某種選擇方式(例如隨機(jī)選擇或輪盤賭),從當(dāng)前總體X中選取一個(gè)染色體對(duì)xi和xj,新的后代yi和yj通過一次交叉運(yùn)算獲得。一個(gè)新的建議總體為 Y={x1,…,yi,…,yj,…xN},根據(jù) Metropolis準(zhǔn)則,以概率min(1,rc)接受建議總體。
建議轉(zhuǎn)移函數(shù)為:
父輩染色體的選擇方法如下:首先按照輪盤賭的方式以Boltzmann權(quán)重選出第一個(gè)染色體xi,即以概率選出xi。第二個(gè)染色體xj從剩余的總體中隨機(jī)的選取。選中(xi,xj)的概率為:
交叉運(yùn)算可以選擇在遺傳算法中常用的1點(diǎn)交叉、2點(diǎn)交叉和均勻交叉。這些交叉都是對(duì)稱的,即:
還有一種新的交叉運(yùn)算:自適應(yīng)交叉。在自適應(yīng)交叉運(yùn)算中,兩個(gè)后代的產(chǎn)生方法如下。若xi和xj在它們的二值序列的第k個(gè)位子上的值相等,則后代yi和yj復(fù)制該值,并且獨(dú)立地以概率p0改變該值;若xi和xj在它們的二值序列的第k個(gè)位子上的值不相等,則yi復(fù)制xi的值并以概率p2改變它,yj復(fù)制xj的值并以概率p1改變它。通常有0<p0≤p1≤p2<1,這種自適應(yīng)交叉可以將一個(gè)總體好的基因型保存下來,同時(shí)算法的學(xué)習(xí)能力也加強(qiáng)了。在交叉操作中,通過迭代的方式約40%的染色體被選中進(jìn)行交叉。
交換操作和并行回火[10]是一樣的,給定當(dāng)前總體X 和溫度階梯 T,(X,T)=(x1,t1,…,xN,tN),在 xi和 xj之間進(jìn)行一個(gè)交換操作但不改變溫度階梯,即初始狀態(tài)為:
交換之后的狀態(tài)為:
根據(jù)Metropolis準(zhǔn)則,以概率min(1,re)接受建議總體。
特征選擇的目的是從原始特征集中選擇一個(gè)特征子集。這個(gè)子集對(duì)于一個(gè)評(píng)價(jià)函數(shù)來說是最優(yōu)的。因此,特征選擇是個(gè)最優(yōu)化過程。特征選擇需要解決兩個(gè)問題:①特征子集的評(píng)價(jià)準(zhǔn)則;②采用何種尋優(yōu)策略來找到滿足條件的最優(yōu)子集。本文采用Wrapper模型,以學(xué)習(xí)算法的性能作為特征選擇的評(píng)估標(biāo)準(zhǔn)。利用二值編碼的進(jìn)化蒙特卡洛作為搜索策略尋優(yōu)特征子集。
假設(shè)通過特征提取共得到了d個(gè)故障特征,那么特征集的維數(shù)為d。在特征選擇問題中,一個(gè)特征要么在解中要么不在解中,因此,對(duì)解采用0和1的二進(jìn)制編碼。在二值編碼的EMC中,每個(gè)染色體xi可用一個(gè)長度為d的0、-1二值序列表示,0表示對(duì)應(yīng)的特征沒被選中,1表示對(duì)應(yīng)的特征被選中。
以特征子集學(xué)習(xí)訓(xùn)練得到的分類錯(cuò)誤率作為適應(yīng)度函數(shù),為了盡可能減小輸入數(shù)據(jù)維數(shù),采用如下適應(yīng)度函數(shù):
A(xi)為特征子集的分類錯(cuò)誤率估計(jì)值;m為選中的變量數(shù);d為原始特征數(shù);p為調(diào)整參數(shù),平衡最小錯(cuò)分率與選中特征個(gè)數(shù)。
采用交叉驗(yàn)證法(Cross-validation)來估計(jì)分類器的錯(cuò)誤率。用支持向量機(jī)作為學(xué)習(xí)分類器對(duì)特征樣本進(jìn)行訓(xùn)練并估計(jì)特征集的分類錯(cuò)誤率。支持向量機(jī)是Vapnik等人[11]根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種機(jī)器學(xué)習(xí)方法。統(tǒng)計(jì)學(xué)習(xí)理論是目前針對(duì)小樣本統(tǒng)計(jì)估計(jì)和預(yù)測學(xué)習(xí)的最佳理論。支持向量機(jī)具有較強(qiáng)的泛化能力,能夠收斂到全局最優(yōu),有效地克服了“維數(shù)災(zāi)難”,現(xiàn)已在機(jī)械故障診斷中得到廣泛的應(yīng)用[1,12]。
特征選擇是一個(gè)優(yōu)化問題,我們可以通過在特征子空間上的形式分布中抽樣:
從而將優(yōu)化問題轉(zhuǎn)化為模擬問題。H(xi)是xi的適應(yīng)度。二值編碼的EMC可以用來從上述模型中進(jìn)行抽樣:
① 選擇一個(gè)容量為N的總體X和溫度階梯T,隨機(jī)初始化X;
② 計(jì)算每個(gè)染色體的適應(yīng)度;
③ 以概率qm對(duì)總體進(jìn)行變異,或以概率1-qm對(duì)總體進(jìn)行自適應(yīng)交叉;
④ 進(jìn)行交換操作。在總體中隨機(jī)的選取xi,以概率選取
⑤ 若算法終止準(zhǔn)則滿足,則停止。否則,返回步驟②。
實(shí)驗(yàn)中采用減速機(jī)輸入端6206軸承,在不影響軸承正常使用性能的情況下,分別在滾動(dòng)軸承外圈和內(nèi)圈加工寬為0.5 mm,深為1.5 mm的小槽來模擬軸承的局部裂紋故障。實(shí)驗(yàn)時(shí)測試系統(tǒng)為LMS多分析儀,振動(dòng)傳感器為B&K4508,采用兩路傳感器采集信號(hào),測點(diǎn)1位于軸承座,測點(diǎn)2位于齒輪箱體上。采樣頻率為8 192 Hz。分別在輸入軸轉(zhuǎn)速為600 r/min和1 200 r/min兩種工況下進(jìn)行采樣,每種工況重復(fù)采樣40次,實(shí)驗(yàn)中軸承共有3種工作狀態(tài):① 正常;② 外圈故障;③ 內(nèi)圈故障。選擇一半數(shù)據(jù)進(jìn)行訓(xùn)練,其余數(shù)據(jù)用于測試。在訓(xùn)練階段采用5折交叉驗(yàn)證。
對(duì)每一組軸承原始振動(dòng)信號(hào)數(shù)據(jù)分別從時(shí)域統(tǒng)計(jì)、EMD分解提取特征。選取無量綱參數(shù)峰值因子、斜度因子、波形因子、脈沖因子、裕度因子及峭度因子等6個(gè)時(shí)域統(tǒng)計(jì)量為特征參數(shù)。使用EMD方法對(duì)原振動(dòng)信號(hào)進(jìn)行分解[12],選擇包含有用信息的前8個(gè)本征模式分量進(jìn)行研究。分別計(jì)算各本征模式分量的能量,得到8個(gè)能量值,對(duì)本征模式分量矩陣進(jìn)行奇異值分解,得到8個(gè)奇異值。
將上述提取的特征進(jìn)行歸一化處理。用x={β1,β2,…,βi,…,βd}表示原始特征集,每個(gè)測點(diǎn)信號(hào)依次提取上述時(shí)域特征、能量值、奇異值等22個(gè)特征,這樣兩路傳感器共提取44個(gè)故障特征,x的維數(shù)就為44。圖1~圖4分別為其中一組外圈、內(nèi)圈故障時(shí)的振動(dòng)信號(hào)及EMD分解。
EMC的初始設(shè)置為:初始種群數(shù)N=20,溫度在10和0.5 之間等間隔分布,變異率 qm=0.15,p0=0.02,p1=0.06,p2=0.1,最大迭代次數(shù)為 1 000。
圖4 滾動(dòng)軸承內(nèi)圈故障時(shí)的振動(dòng)信號(hào)EMD分解Fig.4 EMD results of the vibration signal of the rolling bearing with inner raceway fault
圖5 為外圈故障時(shí)各個(gè)特征被選擇的概率。最后找到6個(gè)特征,尋優(yōu)特征子集的維數(shù)為6,它們被選擇的概率均大于0.8,分別是測點(diǎn)1的斜度因子、峭度因子、前兩個(gè)IMF能量值及奇異值。圖6為內(nèi)圈故障時(shí)各個(gè)特征被選擇的概率。最后找到7個(gè)特征,尋優(yōu)特征子集的維數(shù)為7,它們被選擇的概率均大于0.7,分別是測點(diǎn)1的斜度因子、峭度因子、第2、3個(gè)IMF能量值及前三個(gè)奇異值。
表1 不同特征子集SVM分類結(jié)果Tab.1 Classification results of SVM with different feature subset
為檢驗(yàn)該方法的有效性,使用SVM分類器對(duì)原始特征集和優(yōu)化子集的分類性能進(jìn)行比較,結(jié)果如表1所示。由表1可知,經(jīng)EMC算法搜索到的優(yōu)化特征子集提高了SVM的分類精度。同時(shí),經(jīng)過特征選擇后,大大降低了SVM輸入向量的維數(shù)及其復(fù)雜度,提高了SVM的訓(xùn)練效率。
針對(duì)在機(jī)械故障診斷中,由于原始特征集中冗余特征的存在,影響了診斷性能和效率,將進(jìn)化蒙特卡洛方法引入機(jī)械故障診斷的特征選擇,采用二值編碼的EMC作為搜索策略從模型中進(jìn)行抽樣,利用特征子集對(duì)SVM分類性能的影響作為特征集的評(píng)價(jià)標(biāo)準(zhǔn)。實(shí)驗(yàn)表明,該方法能夠從原始特征集中找到優(yōu)化特征子集,提高故障診斷精度和效率。
[1] 王新峰,邱 靜,劉冠軍.基于靈敏度分析的支持矢量機(jī)特征選擇[J] .機(jī)械工程學(xué)報(bào),2006,42(4):122-126.
[2] 潘宏俠,黃晉英,毛鴻偉,等.基于粒子群優(yōu)化的故障特征提取技術(shù)研究[J] .振動(dòng)與沖擊,2008,27(10):144-147.
[3] Wang X F,Qiu J,Liu G J.New feature selection method in machine fault diagnosis[J] .Chinese Journal of Mechanical Engineering,2005,18(2):251-254.
[4] Lin SW,Lee Z J,Chen SC,et al.Parameter determination of support vector machine and feature selection using simulated annealing approach [J] .Applied Soft Computing,2008,8:1505-1512.
[5] Liang F,Wong W H.Evolutionary monte carlo:applications to cpmodel sampling and change point problem[J] .Statistica Sinica,2000,10(2):317-342.
[6] Liang F,Wong W H.Real-parameter evolutionary monte carlo with applications to bayesian mixture models[J] .Journal of the American Statistical Association,2001,96(454):653-666.
[7] Liang F,Wong W H.Evolutionary monte carlo for protein folding simulations[J] .Journal of Chemical Physics,2001,115(7):3374-3380.
[8] Goswami G,Liu J S,Wong W H.Evolutionary monte carlo methods for clustering[J] .Journal of Computational and Graphical Statistics,2007,16(4):1 -22.
[9] Goswami G,Liu J S.On learning strategies for evolutionary monte carlo[J] .Stat Comput,2007,17:23 -38.
[10] Wang C M,Hyman J D.Allon percus,russel caflisch.parallel tempering for the traveling salesman problem[J] .International Journal of Modern Physics C,2009,20(4):539-556.
[11] Vapnik V.Statistical learning theory[M] .New York:Wiley,1998.
[12] 程軍圣,于德介,楊 宇.基于內(nèi)稟模態(tài)分解奇異值分解和支持向量機(jī)的故障診斷方法[J] .自動(dòng)化學(xué)報(bào),2006,32(3):476-480.