許 理, 李 戈, 余 亮, 姚 毅
(四川理工學院a.自動化與信息工程學院; b.物理與電子工程學院, 四川 自貢 643000)
滾動軸承故障診斷的常用方法是振動分析法,而采集的軸承振動信號具有非平穩(wěn)性等特點,使得對其進行特征提取變得比較困難。小波包(Wavelet Packet,WP)時頻分析方法能有效提取非平穩(wěn)信號的時頻特征,具有精細的時頻分辨率,可以克服小波變換高頻低分辨率的缺陷[1]。小波包已經被廣泛應用在機械設備故障診斷[2]、地震檢測[3]、醫(yī)學[4]等領域。文獻[5]使用小波包對軸承振動信號進行頻譜分析,有效提取了軸承的故障特征,且在復合故障中采用小波包分析效果明顯優(yōu)于小波分析。傳統(tǒng)的智能識別方法如反向傳播(Back Propagation, BP)神經網絡等淺層網絡隱含層數(shù)量少,特征學習的表達能力有限,訓練易陷入局部極值[6]。卷積神經網絡(Convolutional Neural Network,CNN)通過引入權值共享、局部感知以及池化層對傳統(tǒng)的神經網絡結構進行優(yōu)化,具有深層次的體系結構和強大的特征學習能力[7-9]。CNN目前在醫(yī)學、認知科學和人工智能等領域得到了廣泛應用[10]。Zhang[11]等使用卷積神經網絡實現(xiàn)了滾動軸承的故障診斷,表明當用足夠的訓練樣本進行訓練時,CNN的故障識別效果優(yōu)于其他方法。張晴晴[12]等將CNN用于語音識別,相比于目前普遍使用的深層神經網絡,CNN的識別性能更好,而且降低了模型的復雜度。Chen等[13]將變速箱振動信號的統(tǒng)計特征組成一特征圖,作為CNN的輸入,通過CNN實現(xiàn)了變速箱故障的診斷識別,并表現(xiàn)出優(yōu)于其他方法的識別率和效率。
鑒于小波包精細的時頻分辨率和CNN強大的特征學習與識別能力,本文提出了一種基于小波包和CNN的滾動軸承故障診斷方法(WPD_CNN)。
小波變換對信號中的高頻段不再進行分解,具有高頻低分辨率的缺陷。而小波包對信號的低、高頻部分同時進行分解,提高了總體時頻分辨率,解決了小波分解存在的問題。小波包的具體算法如下[14]:
對于給定的正交小波函數(shù)Φ(t)與正交尺度函數(shù)Φ(t),那么它們之間的二尺度方程為:
其中,hk為φ(t)對應的低通濾波器,gk為φ(t)對應的高通濾波器。則小波包的分解算法為:
小波包分解的實質就是將信號通過一組正交的低通與高通濾波器,分解得到低頻部分與高頻部分。然后對分解后得到的兩組信號進行進一步的分解,實現(xiàn)信號的均勻分解。
訓練深度學習網絡一般都要求樣本量在1萬以上,如果樣本量太少,那么訓練出來的模型精度就會比較低,容易出現(xiàn)過擬合現(xiàn)象。Fine-tuning技術解決了少量樣本訓練分類模型的問題;CaffeNet模型結構如圖1所示,它是caffe團隊使用大量圖片迭代30多萬次訓練產生的,實現(xiàn)了對1000類圖片的識別分類,具有很好的圖片分類效果。本文在caffeNet模型的基礎上,采用fine-tuning技術訓練自己的模型,在深度學習框架caffe的基礎上實現(xiàn)CNN模型的訓練。
影響模型預測精度的因素有很多,主要有學習率、卷積核的個數(shù)與大小、一次用于測試的樣本大小batchsize以及dropout層的dropoutratio參數(shù)。本文選取的卷積核的個數(shù)與大小與caffeNet模型保持一致,不作改變。而deploy.prototxt文件中的基礎學習率base_lr要設置很小,本文base_lr設置為0.001。輸出層fc8控制著樣本的分類數(shù),從圖1可看出,caffeNet的分類數(shù)為1000,本文修改為5(因為是實現(xiàn)5分類),為了著重學習,該層的學習率應該設置比較大,包括權重系數(shù)w_lr和偏置系數(shù)b_lr的兩個學習率,本文w_lr的學習率設為10,偏置系數(shù)b_lr的學習率設為20。剩下的兩個參數(shù)batchsize和dropoutratio對于防止過擬合起著關鍵性的作用,本文重點對這兩個參數(shù)進行尋優(yōu)以獲得比較理想的模型。
圖1 caffeNet模型結構
本文使用的實驗數(shù)據為凱斯西儲大學軸承數(shù)據庫(Case Western Reserve University, CWRU)的滾動軸承振動加速度數(shù)據[15]。采樣頻率為12000 Hz。實驗數(shù)據包括軸承四種工況下的振動信號,分為正常信號、滾動體故障信號、內圈故障信號和外圈故障信號。由于軸承運行時經常有復合故障的發(fā)生,本文將內、外圈故障信號進行疊加生成內外圈復合故障信號,所以共有五種軸承運行狀態(tài)。
每類收集1420個樣本,每個樣本包含1024個采樣點,共收集7100個樣本。
訓練集:每類信號隨機選出1000個樣本作為訓練集,訓練集共包括5000個樣本。
驗證集:在訓練集剩余的樣本中,每類信號隨機360個樣本作為驗證集,驗證集共包括1800個樣本。
測試集:剩余的樣本作為測試集,每類60個樣本,共包括300個樣本。
(1) 采用小波包對樣本集進行時頻分析,得到各個樣本的特征時頻圖。
(2) 時頻圖預處理:調整時頻圖的尺寸為256×256像素。
(3) 預處理后的時頻圖作為CNN的輸入,采用soft-max作為分類器,訓練模型。
(4) 根據模型的測試準確率對CNN網絡的參數(shù)進行調整,選出一個性能最優(yōu)的模型,實現(xiàn)故障的分類識別。
機械振動信號大都屬于非平穩(wěn)信號,時頻分析在處理非平穩(wěn)信號方面具有獨特的優(yōu)勢,通過時頻分析得到的時頻圖能直觀地反映信號時域和頻域的綜合信息,使振動信號包含的特征信息得到充分展現(xiàn)。本文使用短時傅里葉變換(STFT)、連續(xù)小波變換(CWT)和小波包分解(WPD)三種時頻分析方法對故障信號進行分析。以外圈故障信號為例,四種分析方法的時頻圖如圖2所示(取1024個采樣點,縱軸范圍:0~6000 Hz(下同))。
圖2 三種時頻分析方法的效果圖
從圖2可以看出,采用STFT得到的時頻圖,其時間分辨率較低。CWT得到的時頻圖雖然具有較好的時間分辨率,但其頻率分辨率不理想。而采用WPD得到的時頻圖,其綜合的時頻分辨率明顯優(yōu)于其他兩種分析方法,所以本文采用WPD對滾動軸承信號進行故障特征圖提取。預處理后的WPD時頻圖如圖3所示。
圖3 預處理后的WPD時頻圖
2.5.1 dropout參數(shù)對結果的影響
分別設置dropoutratio為0.1、0.3、0.5、0.7、0.9進行試驗(兩個dropout層參數(shù)設置相同),這里batchsize暫取150。圖4給出了dropoutratio取不同值時驗證集的識別準確率(5次試驗取平均值,下同)。從圖4可知,當dropoutratio為0.3時收斂速度最快,效果最好。表1給出了測試集的真實識別準確率,從中可知,dropoutratio取0.3識別準確率最高,達到了92%,而dropoutratio取0.1時的外圈故障、取0.7時的內外圈復合故障以及取0.9時的多種故障(內圈、外圈和內外圈復合故障)都出現(xiàn)了嚴重的過擬合現(xiàn)象。
圖4 dropoutratio取值對結果影響的效果圖
0.10.30.50.70.9正常1.0001.0001.0001.0001.000滾動體故障1.0001.0001.0001.0000.500內圈故障0.9380.9070.4920.7840.000外圈故障0.0611.000.8921.000.031內外圈復合故障0.9530.6920.7530.0920.000整體準確率0.7910.920.8270.7750.307
2.5.2 批量尺寸batchsize對結果的影響
由2.5.1節(jié)可知,dropoutratio取值為0.3時效果最好,所以這里設置dropoutratio為0.3。由于驗證集的樣本總數(shù)為1800,為了使其得到充分利用,選擇的batchsize要能被1800整除,因此本文分別取batchsize為90,100,120,150,180,200,225,300進行模型訓練。圖5給出了驗證集的識別結果(為了圖片便于觀察,僅顯示5個效果較好的batchsize),圖6是圖5的局部放大圖。從中可知,5種情況下訓練的模型都能迅速收斂,batchsize取200時收斂速度最快(圖中黑色實線),準確率最高。表2給出了對五種工況進行測試的真實準確率,當batchsize=200時,識別的準確率最高,達到了99.1%。
綜上所述,參數(shù)dropoutratio和batchsize對故障識別的準確率有很大的影響,本文采用網格法對這兩個參數(shù)進行尋優(yōu),尋優(yōu)后參數(shù)dropoutratio值為0.3(兩dropout層一樣),batchsize值為200.最終滾動軸承故障診斷的識別率為99.1%.
圖5 batchsize取值對結果影響的效果圖
圖6 圖5的局部放大圖
150180200225300正常1.0001.0001.0001.0001.000滾動體故障1.0001.0001.0001.0001.000內圈故障0.9230.9230.9690.8610.784外圈故障1.0000.9691.0001.0000.861內外圈復合故障0.6920.9230.9840.8000.969整體準確率0.9230.9630.9910.9320.923
2.5.3 PCA_SVM與CNN識別結果對比
PCA_SVM故障診斷用到的訓練集和測試集同2.3小節(jié),每個樣本包含1024個采樣點。采用PCA算法對樣本進行壓縮降維,為了使主成分的貢獻率在 95% 以上,每個樣本由1024維降到了15維。最后采用SVM對樣本進行訓練和故障識別,識別結果見表3(5次實驗取均值)。
表3給出了多種識別算法的識別準確率,采用CNN算法分別與STFT、CWT和WPD相結合,模型的準確率都明顯優(yōu)于PCA_SVM。采用CWT和WPD對滾動軸承信號進行時頻分析,得出的CNN識別率高于STFT。而采用WPD_CNN算法對軸承的故障識別率最好,達到了99.1%。
表3 多種識別算法的預測準確率對比
利用WPD綜合時頻分辨率優(yōu)于STFT和CWT的特性,結合CNN強大的特征提取能力,提出了一種基于WPD與CNN相結合的滾動軸承故障診斷方法。通過參數(shù)尋優(yōu)和模型訓練,找到了比較理想的用于軸承故障診斷的模型。通過與多種故障識別算法對比分析可知,本文提出的WPD_CNN算法對軸承的故障識別的準確率最高。
參考文獻:
[1] 王紅軍,萬鵬.基于EEMD和小波包變換的早期故障敏感特征獲取[J].北京理工大學學報,2013,33(9):945-950.
[2] 肖順根,宋萌萌.基于小波包能量神經網絡的滾動軸承故障診斷方法[J].機械強度,2014,36(3):340-346.
[3] SU W C,HUANG C S.Identification of structural stiffness parameters via wavelet packet from seismic response[J].Procedia Engineering,2017,199:1032-1037.
[4] SILVEIRA T L T D,KOZAKEVICIUS A J,RODRIGUES C R.Automated drowsiness detection through wavelet packet analysis of a single EEG channel[J].Expert Systems with Applications,2016,55:559-565.
[5] YANG Z,GAO L.Wavelet analysis and fault feature extraction of rolling bearing[M].London:Springer London,2014.
[6] 劉春艷,凌建春,寇林元,等.GA-BP神經網絡與 BP神經網絡性能比較[J].中國衛(wèi)生統(tǒng)計,2013,30(2):173-176.
[7] 陳銳,林達.基于級聯(lián)卷積神經網絡的人臉關鍵點定位[J].四川理工學院學報:自然科學版,2017,30(1):32-37.
[8] ABDEL-HAMID O,MOHAMED A R,JIANG H,et al.Convolutional Neural Networks for Speech Recognition[J].IEEE/ACM Transactions on Audio Speech & Language Processing,2014,22(10):1533-1545.
[9] KIM Y.Convolutional Neural Networks for Sentence Classification[J].Eprint Arxiv,2014.DOI: 10.3115/v1/D14-1181.
[10] 龍飛,王永興.深度學習入門與實踐[M].北京:清華大學出版社,2017.
[11] ZHANG W,PENG G,LI C.Rolling element bearings fault intelligent diagnosis based on convolutional neural networks using raw sensing signal[M].Berlin:Springer International Publishing,2017.
[12] 張晴晴,劉勇,潘接林,等.基于卷積神經網絡的連續(xù)語音識別[J].工程科學學報,2015,37(9):1212-1217.
[13] CHEN Z Q,LI C,SANCHEZ R V.Gearbox fault identification and classification with convolutional neural networks[J].Shock and Vibration,2015(2):1-10.
[14] FEI M,PENG C,SU Z,et al.Computational Intelligence,Networked Systems and Their Application[M].Berlin:Springer Publishing Company,2014.
[15] LOPARO K. Bearing vibration data set[D].Cleveland:Case Western Reserve University,2003.