郭 亮,姚 磊,高宏力,黃海鳳,張?bào)愠剑?西南交通大學(xué)機(jī)械工程學(xué)院 成都,6003)(.中國(guó)空氣動(dòng)力研究與發(fā)展中心吸氣式高超聲速研究中心 綿陽(yáng),6000)
基于字典學(xué)習(xí)和稀疏編碼的振動(dòng)信號(hào)去噪技術(shù)*
郭 亮1,姚 磊2,高宏力1,黃海鳳1,張?bào)愠?
(1.西南交通大學(xué)機(jī)械工程學(xué)院 成都,610031)
(2.中國(guó)空氣動(dòng)力研究與發(fā)展中心吸氣式高超聲速研究中心 綿陽(yáng),621000)
針對(duì)現(xiàn)有機(jī)械振動(dòng)信號(hào)去噪算法需要一定先驗(yàn)知識(shí)的問(wèn)題,提出了一種基于字典學(xué)習(xí)和稀疏編碼的自適應(yīng)去噪濾波方法。根據(jù)信號(hào)的本質(zhì)特性,應(yīng)用在線字典學(xué)習(xí)方法對(duì)原始數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練,尋求數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)字典空間。引入正交匹配追蹤算法,確定原始信號(hào)在最優(yōu)字典空間上的稀疏表示?;谙∈杈幋a和優(yōu)化字典,重構(gòu)原始信號(hào),實(shí)現(xiàn)信號(hào)去噪。仿真和試驗(yàn)結(jié)果表明,相對(duì)于現(xiàn)有去噪方法,基于字典學(xué)習(xí)和稀疏編碼的方法自適應(yīng)能力強(qiáng),去噪效果好。
字典學(xué)習(xí);稀疏編碼;自適應(yīng)濾波;振動(dòng)信號(hào)
機(jī)械振動(dòng)信號(hào)分析是有效識(shí)別機(jī)器的運(yùn)轉(zhuǎn)狀態(tài)、判別機(jī)器的性能和故障的關(guān)鍵技術(shù)。機(jī)械設(shè)備具有結(jié)構(gòu)復(fù)雜性、工況多樣性和故障多變性等特點(diǎn),導(dǎo)致其振動(dòng)信號(hào)呈現(xiàn)非平穩(wěn)特性,且實(shí)際工況下的振動(dòng)信號(hào)往往被各種噪聲污染,振動(dòng)信號(hào)與噪聲信號(hào)相互調(diào)制和疊加,導(dǎo)致信號(hào)分離和去噪難度大,難以準(zhǔn)確進(jìn)行故障診斷和狀態(tài)識(shí)別[1]。
多年來(lái),國(guó)內(nèi)外學(xué)者對(duì)機(jī)械故障振動(dòng)信號(hào)去噪技術(shù)取得大量研究成果。文獻(xiàn)[2]通過(guò)對(duì)小波變換降噪性能的研究,提出了利用梳狀小波對(duì)旋轉(zhuǎn)機(jī)械振動(dòng)信號(hào)的降噪方法,該方法與線性平均法進(jìn)行了比較,得到了很好的結(jié)果。為了彌補(bǔ)經(jīng)典小波變換自適應(yīng)能力差的問(wèn)題,文獻(xiàn)[3]利用提升小波提取軸承故障的脈沖特性,與傳統(tǒng)線性小波相比,提升小波對(duì)脈沖信號(hào)的保持和抗噪能力較強(qiáng)。文獻(xiàn)[4]針對(duì)旋轉(zhuǎn)機(jī)械的噪聲污染問(wèn)題,采用形態(tài)開(kāi)-閉和閉-開(kāi)組合運(yùn)算的濾波方法對(duì)染噪的振動(dòng)信號(hào)進(jìn)行處理,無(wú)須考慮振動(dòng)信號(hào)的頻譜特性。傳統(tǒng)的基于傅里葉變換的高通、低通和帶通濾波器適用于對(duì)平穩(wěn)信號(hào)的分析,但不能反映非平穩(wěn)信號(hào)局部區(qū)域的頻率特性和對(duì)應(yīng)的時(shí)域關(guān)系[5]。小波變換通過(guò)伸縮和平移運(yùn)算,實(shí)現(xiàn)對(duì)信號(hào)的多尺度細(xì)化分析,在動(dòng)態(tài)信號(hào)去噪、機(jī)械故障特征提取等方面表現(xiàn)出明顯優(yōu)勢(shì)[6]。小波閾值濾波方法雖然實(shí)現(xiàn)簡(jiǎn)單,但是選取缺乏依據(jù),且小波基函數(shù)的選擇依賴于先驗(yàn)知識(shí),自適應(yīng)能力不強(qiáng)[7]。字典學(xué)習(xí)和稀疏編碼是目前機(jī)器學(xué)習(xí)界的研究熱點(diǎn),在圖像去噪和語(yǔ)音信號(hào)處理領(lǐng)域取得了突破性進(jìn)展,目前在振動(dòng)信號(hào)處理方面鮮見(jiàn)報(bào)道[8-11]。
筆者提出了一種基于字典學(xué)習(xí)和稀疏編碼的自適應(yīng)去噪濾波方法(dictionary learning and sparse coding adaptive filter,簡(jiǎn)稱DLSCF)。利用期望目標(biāo)函數(shù)代替經(jīng)驗(yàn)?zāi)繕?biāo)函數(shù),運(yùn)用在線字典學(xué)習(xí)的方法構(gòu)建信號(hào)的本質(zhì)特性字典,使其具有目標(biāo)數(shù)據(jù)驅(qū)動(dòng)性,對(duì)特定的振動(dòng)數(shù)據(jù)去噪具有自適應(yīng)能力。以旋轉(zhuǎn)機(jī)械振動(dòng)仿真信號(hào)和軸承振動(dòng)信號(hào)為例,與現(xiàn)有去噪方法進(jìn)行了比較。試驗(yàn)結(jié)果表明,該方法去噪能力強(qiáng),具有較高的推廣應(yīng)用價(jià)值。
字典學(xué)習(xí)和稀疏編碼近年來(lái)在信號(hào)處理和機(jī)器學(xué)習(xí)界引起了極大關(guān)注,尤其是文獻(xiàn)[12]給出了壓縮感知的詳細(xì)數(shù)學(xué)推導(dǎo)后,這個(gè)領(lǐng)域取得了一系列突破性的進(jìn)展。壓縮感知的思想是對(duì)采集信號(hào)進(jìn)行自適應(yīng)非線性投影,根據(jù)相應(yīng)的重構(gòu)算法由測(cè)量值重構(gòu)出原始信號(hào)。根據(jù)這一思想,信號(hào)的非線性投
影需要構(gòu)建一個(gè)自適應(yīng)字典空間。字典分為兩種:一種是隱性字典,由算法表示,而不是矩陣結(jié)構(gòu);另一種是通過(guò)機(jī)器學(xué)習(xí)的方法從樣本中學(xué)習(xí)獲取字典,這種字典表現(xiàn)為一種顯性矩陣,能夠表征原始數(shù)據(jù)所包含的本質(zhì)屬性。基于字典學(xué)習(xí)和稀疏編碼的自適應(yīng)去噪技術(shù)數(shù)學(xué)表達(dá)式為
其中:‖·‖0為零范數(shù),指序列中非零系數(shù)的個(gè)數(shù);x為編碼向量;x為通過(guò)最小化‖x‖0求得的x最稀疏解;D為數(shù)據(jù)驅(qū)動(dòng)的字典空間,由優(yōu)化算法學(xué)習(xí)得到;γ為跟噪聲水平有關(guān)的誤差控制參數(shù);y為輸入信號(hào),也是含噪信號(hào);s為輸入信號(hào)y的重構(gòu)信號(hào)。
1.1 稀疏編碼模型
輸入信號(hào)Y=[y1,y2,…,yn]T可以抽象為
其中:D∈Rn×k為字典,它的列向量為基向量原子di;ε為高斯白噪聲;信號(hào)y可以近似地表示為y≈Dx,且滿足‖y-Dx‖p≤γ,這里p取值為2;X= [x1,x2,…,xk]T為信號(hào)y在字典D上的表示系數(shù)。
如何找到非零元素最少的表示系數(shù)是信號(hào)稀疏編碼中最根本的問(wèn)題。信號(hào)稀疏編碼的實(shí)現(xiàn)可以表示為D
上述問(wèn)題是一個(gè)非確定性多項(xiàng)式難(non-deterministic polynomial hard,簡(jiǎn)稱NP hard)問(wèn)題,只能采用一些近似算法求解。匹配追蹤算法是一種將信號(hào)在字典庫(kù)上進(jìn)行稀疏分解的算法。當(dāng)字典庫(kù)很大的時(shí)候找出最佳吻合解,其中大部分原子信號(hào)的系數(shù)都為0,只有少部分的系數(shù)不為0。正交匹配追蹤算法對(duì)分解的每一步所選擇的全部原子進(jìn)行正交化處理,這使得在精度要求相同的情況下,正交匹配追蹤算法的收斂速度更快[13]。
1.2 字典學(xué)習(xí)
字典是由函數(shù)組成的超完備冗余框架,字典中的元素被稱為原子,是信號(hào)的基本組成部分。從滿足獨(dú)立同分布(independent and indentically distributed,簡(jiǎn)稱IID)的樣本空間Y={yi}Ni=1中選擇訓(xùn)練樣本集合訓(xùn)練一個(gè)合適字典的問(wèn)題可以看作是一個(gè)最大似然估計(jì)問(wèn)題[14]
對(duì)于每個(gè)樣本的似然函數(shù)可以公式化為
針對(duì)式(6)的求解問(wèn)題,可以直接使用梯度下降法優(yōu)化求解。還可以從K-means聚類算法出發(fā),運(yùn)用K-奇異值分解的優(yōu)化求解方法。目前的字典學(xué)習(xí)算法在每次迭代求解過(guò)程中,都要求載入所有的訓(xùn)練樣本,因此它們不能有效解決大數(shù)據(jù)量問(wèn)題和動(dòng)態(tài)數(shù)據(jù)問(wèn)題。利用期望目標(biāo)函數(shù)代替原始的經(jīng)驗(yàn)?zāi)繕?biāo)函數(shù),可以得到一個(gè)新的字典更新問(wèn)題
其中:x為稀疏編碼階段得到的稀疏系數(shù)。
筆者采用基于隨機(jī)近似的在線算法在每一次的迭代求解中,通過(guò)概率分布選取一個(gè)訓(xùn)練樣本。字典更新的目標(biāo)函數(shù)為
1.3 基于字典學(xué)習(xí)和稀疏編碼的自適應(yīng)濾波器設(shè)計(jì)
基于式(1)和字典學(xué)習(xí)與稀疏編碼算法,可以將DLSCF自適應(yīng)去噪問(wèn)題寫(xiě)成一般形式
圖1 基于字典學(xué)習(xí)和稀疏編碼的去噪算法Fig.1 De-noising algorithm based on dictionary learning and sparse coding
選用一個(gè)合成的機(jī)械振動(dòng)仿真信號(hào)作為參考數(shù)據(jù)集,驗(yàn)證提出的方法對(duì)振動(dòng)信號(hào)的去噪效果。仿真信號(hào)的數(shù)學(xué)表達(dá)式為
其中:T為沖擊信號(hào)的周期;τk為沖擊信號(hào)的相位;Ak為信號(hào)的幅值;ν(t)為零均值白噪聲;h(t)為沖擊響應(yīng)函數(shù),用來(lái)表示旋轉(zhuǎn)機(jī)械的局部故障特征信號(hào);sin( 2πf1t)為載波信號(hào)。
將表1中的參數(shù)帶入式(11)中,得到圖2所示的波形。根據(jù)圖1所示的算法流程,考慮到振動(dòng)信號(hào)的大數(shù)據(jù)量和動(dòng)態(tài)性,采用在線字典學(xué)習(xí)算法學(xué)習(xí)字典,正交匹配追蹤算法進(jìn)行稀疏編碼。參數(shù)設(shè)置如表2所示。
由字典學(xué)習(xí)和稀疏編碼優(yōu)化得到字典如圖3所示。每一行波形代表長(zhǎng)度為80的基向量,它是原始信號(hào)的基本組成單元,10個(gè)基向量組成了10*80的字典。可以看出,學(xué)習(xí)字典分解了混合信號(hào)的噪聲部分和原始信號(hào)部分h(t)。第1,2,3,5,8,10行波形為擬合出的衰減信號(hào),第4,6,7,9行為隨機(jī)噪聲信號(hào)。設(shè)稀疏系數(shù)閥值為2,即由字典中的兩個(gè)基向量重構(gòu)原始信號(hào)。重構(gòu)信號(hào)如圖4(a)所示,圖4(b)為小波去噪后的信號(hào)。比較圖4(a)和4(b)可知,采用DLSCF算法降噪效果更佳。
為了定量評(píng)價(jià)兩種不同去噪算法的效果,提出用信噪比和均方根誤差進(jìn)行評(píng)估。未加入噪聲的原始信號(hào)作為標(biāo)準(zhǔn)信號(hào)?x(i),則降噪后的估計(jì)信號(hào)x(i)的信噪比(signal noise ratio,簡(jiǎn)稱SNR定義為)
表1 仿真信號(hào)的各參數(shù)值Tab.1 Parameters of simulation signal
圖2 原始信號(hào)和加入噪聲后的信號(hào)Fig.2 Original signal and noised signal
表2 字典學(xué)習(xí)和稀疏編碼濾波器的各參數(shù)值Tab.2 Parameters of dictionary learning and sparse coding filter
圖3 學(xué)習(xí)字典Fig.3 Learneddictionary
將未加入噪聲信號(hào)的原始信號(hào)與降噪信號(hào)之間的均方根誤差(root mean square error,簡(jiǎn)稱RMSE)定義為其中:n為離散采樣信號(hào)的長(zhǎng)度。
估計(jì)信號(hào)的信噪比越高,原始信號(hào)與估計(jì)信號(hào)的均方根誤差越小,則估計(jì)信號(hào)就越接近于原始信號(hào),降噪效果越好。
圖4 DLSCF去噪和小波去噪Fig.4 DLSCF de-noising and wavelet de-noising
由表3和圖4比較可知,DLSLF去噪算法在去噪能力上明顯優(yōu)于傳統(tǒng)的小波去噪法。
表3 兩種去噪方法的信噪比和均方根誤差比較Tab.3 SNR and RMSE of two filters
為驗(yàn)證提出方法在實(shí)際機(jī)械振動(dòng)信號(hào)上的去噪能力,設(shè)計(jì)了應(yīng)用CWRU軸承數(shù)據(jù)中心的軸承故障振動(dòng)數(shù)據(jù)作為測(cè)試集的試驗(yàn)。測(cè)試系統(tǒng)如圖5所示,左端為三相電機(jī),右端為測(cè)力儀,用于確定系統(tǒng)的負(fù)載大小,中間通過(guò)力矩傳感器連接。筆者所用數(shù)據(jù)為安裝在電機(jī)驅(qū)動(dòng)端的振動(dòng)傳感器采集的軸承外圈故障和內(nèi)圈故障振動(dòng)信號(hào)。軸承型號(hào)為SKF6205-2RS,缺陷故障最大直徑為0.35mm,電機(jī)轉(zhuǎn)速為1 797r/min,采樣頻率為12k Hz。
圖5 絲杠故障診斷系統(tǒng)結(jié)構(gòu)圖Fig.5 Structure of the screw fault diagnosis system
分別對(duì)外圈故障數(shù)據(jù)和內(nèi)圈故障數(shù)據(jù)進(jìn)行小波和DLSCF去噪處理。在DLSCF去噪過(guò)程中,將原始信號(hào)分成80個(gè)數(shù)據(jù)點(diǎn)為一個(gè)數(shù)據(jù)段的數(shù)據(jù)塊,外圈故障數(shù)據(jù)和內(nèi)圈故障數(shù)據(jù)分別被分為了236*80 和269*80的數(shù)據(jù)塊,即為樣本個(gè)數(shù)。生成的字典大小為10*80。原始信號(hào)重構(gòu)去噪后信號(hào)如圖6(a)和圖7(a)所示。原始信號(hào)與去噪后信號(hào)對(duì)比可知,去噪后信號(hào)波形更光滑。
為進(jìn)一步驗(yàn)證提出方法的去噪效果,對(duì)比去噪前、后信號(hào)的快速傅里葉變換(fast Fourier transfor mation,簡(jiǎn)稱FFT)如圖6和圖7(b)和(c)所示??梢钥闯觯盘?hào)去噪后的頻率成分更為集中。計(jì)算去噪前后的時(shí)域特征量值如表4所示??梢?jiàn),去噪前的均值比值為2.85,峰值因子比值為1.07,峭度指標(biāo)比值為1.26。去噪后相應(yīng)的比值分別變?yōu)?.25,1.24,1.58。這說(shuō)明去噪后通過(guò)這幾項(xiàng)指標(biāo)進(jìn)行故障區(qū)分更加容易。數(shù)據(jù)分析可知,濾波前的軸承故障識(shí)別準(zhǔn)確率為86.2%,濾波后的軸承故障識(shí)別準(zhǔn)確率為95.3%,通過(guò)選取小波分解系數(shù)作為特征向量,多類線性回歸模型Softmax Regression作為分類器,DLSDF去噪算法可以有效提高軸承的故障識(shí)別準(zhǔn)確率。
表4 去噪前后時(shí)域特征值比較Tab.4 Time domain features before and after filtering
圖6 軸承外圈故障狀態(tài)信號(hào)Fig.6 The bearing faultsignal of outer race
圖7 軸承內(nèi)圈故障狀態(tài)信號(hào)Fig.7 The bearing fault signal of inner race
本方法可以有效去除信號(hào)的噪聲分量,有效分離噪聲和信號(hào)波形。去噪后得出的波形是根據(jù)原始數(shù)據(jù)所攜帶的本質(zhì)特性所決定,濾波算法具有自適應(yīng)能力。提出的濾波算法對(duì)于機(jī)械振動(dòng)信號(hào)的濾波效果明顯,可以有效地用于振動(dòng)信號(hào)的預(yù)處理。
[1] 何正嘉,袁靜,訾艷陽(yáng),等.機(jī)械故障診斷內(nèi)積變換原理與驗(yàn)證[J].振動(dòng)、測(cè)試與診斷,2012,32(2):175-185.He Zhengjia,Yuan Jing,Zi Yanyang,et al.The principle of converting mechanical fault diagnosis plot and verification[J].Journal of Vibration,Measurement&Diagnosis,2012,32(2):175-185.(in Chinese)
[2] 徐敏強(qiáng),王日新.基于梳狀小波的旋轉(zhuǎn)機(jī)械振動(dòng)信號(hào)降噪方法的研究[J].振動(dòng)工程學(xué)報(bào),2002,15(1):90-92.Xu Minqiang,Wang Rixin.Study on rotating machinery vibration signal noise reduction method based onwavelet[J].Journal of Vibration Engineering,2002,15(1):90-92.(in Chinese)
[3] 李兵,張培林,劉東升,等.基于形態(tài)提升小波變換的滾動(dòng)軸承故障特征提?。跩].振動(dòng)、測(cè)試與診斷,2011,31(1):36-40.Li Bing,Zhang Peilin,Liu Dongsheng,et al.Fault feature extraction based on morphological lifting wavelet transform[J].Journal of Vibration,Measurement&Diagnosis,2011,31(1):36-40.(in Chinese)
[4] 張文斌,楊辰龍,周曉軍.形態(tài)濾波方法在振動(dòng)信號(hào)降噪中的應(yīng)用[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2009,43(11):2096-2099.Zhang Wenbin,Yang Chenlong,Zhou Xiaojun.Morphological filtering method in vibration signal de-noising[J].Journal of Zhejiang University:Engineering Science,2009,43(11):2096-2099.(in Chinese)
[5] 丁康,朱文英,楊志堅(jiān),等.FFT+FT離散頻譜校正法參數(shù)估計(jì)精度[J].機(jī)械工程學(xué)報(bào),2010,46(7):68-73.Ding Kang,Zhu Wenying,Yang Zhijian,et al.Parameter estimation accuracy of FFT and FT discretespectrum correctionmethod[J].Chinese Journal of Mechanical Engineering,2010,46(7):68-73.(in Chinese)
[6] Wang Yanxue,He Zhengjia,Zi Yanyang.Enhancement of signal denoising and multiple fault signatures detecting in rotating machinery using dual-tree complex wavelet transform[J].Mechanical Systems and Signal Processing,2010,24(1):119-137.
[7] 程承,潘泉,王申龍,等.基于壓縮感知理論的MEMS陀螺儀信號(hào)降噪研究[J].儀器儀表學(xué)報(bào),2012,33(4):769-773.Cheng Cheng,Pan Quan,Wang Shenlong,et al.Study on MEMS gyroscopes signal de-nosing based on compressed sensing theory[J].Chinese Journal of Scientific Instrument,2012,33(4):769-773.(in Chinese)[8] Lewicki M S,Olshausen B A.Probabilistic framework for the adaptation and comparison of image codes[J].Journal of the Optical Society of America A,1999,16(7):1587-1601.
[9] Olshausen B A.Emergence of simple-cell receptive field properties by learning a sparse code for natural images[J].Nature,1996,381(6583):607-609.
[10]Aharon M,Elad M,Bruckstein A.An algorithm for designing overcomplete dictionaries for sparse representation[J].Signal Processing,IEEE Transactions on,2006,54(11):4311-4322.
[11]Mairal J,Bach F,Ponce J,et al.Online dictionary learning for sparse coding[C]∥Proceedings of the 26th Annual International Conference on Machine Learning.New York:[s.n.],2009:689-696.
[12]Candes E J,Tao T.Near-optimal signal recovery from random projections:universal encoding strategies[J].Information Theory,IEEE Transactions on,2006,52(12):5406-5425.
[13]Donoho D L,Tsaig Y,Drori I,et al.Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J].Information Theory,IEEE Transactions on,2012,58(2):1094-1121.
[14]Lewicki M S,Sejnowski T J.Learning overcompleterepresentations[J].Neural Computation,2000,12(2):337-365.
TH17;TP206
10.16450/j.cnki.issn.1004-6801.2015.04.025
郭亮,男,1988年4月生,博士研究生。主要研究方向?yàn)樾盘?hào)處理、故障診斷、機(jī)器學(xué)習(xí)。曾發(fā)表《數(shù)控機(jī)床主軸系統(tǒng)性能退化評(píng)估方法》(《振動(dòng)、測(cè)試與診斷》2013年第4期)等論文。
E-mail:paper2210@163.com
*國(guó)家自然科學(xué)基金資助項(xiàng)目(51275426)
2014-04-18;
2014-06-06