宋乾坤,周孟然
1.安徽理工大學(xué) 人工智能學(xué)院,安徽 淮南 232001 2.安徽理工大學(xué) 電氣與信息工程學(xué)院,安徽 淮南 232001
隨著智能制造時(shí)代的到來(lái),機(jī)械設(shè)備在生產(chǎn)領(lǐng)域中扮演著重要的角色,滾動(dòng)軸承作為絕大多數(shù)機(jī)械設(shè)備必不可少的零件,它的故障與否,時(shí)刻關(guān)系著機(jī)械設(shè)備的正常運(yùn)行,對(duì)生產(chǎn)經(jīng)濟(jì)以及安全方面均產(chǎn)生著巨大的影響。因此,若能準(zhǔn)確及時(shí)地檢測(cè)識(shí)別軸承的狀態(tài),對(duì)于機(jī)械設(shè)備的正常運(yùn)行至關(guān)重要。
針對(duì)滾動(dòng)軸承故障診斷的理論研究從未間斷過(guò),國(guó)內(nèi)外學(xué)者提出了各種理論方案用于軸承的故障診斷。陳剛等[1]通過(guò)將軸承信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對(duì)得到的本征模態(tài)函數(shù)(IMF)分量作包絡(luò)分析,再根據(jù)包絡(luò)譜的故障特征頻率判斷滾動(dòng)軸承故障類型;楊宇等[2]采用雙樹(shù)復(fù)小波包變換對(duì)滾動(dòng)軸承的振動(dòng)信號(hào)進(jìn)行分解和重構(gòu),再通過(guò)支持向量機(jī)(SVM)進(jìn)行故障診斷;ALI等[3]利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對(duì)振動(dòng)信號(hào)處理,然后通過(guò)神經(jīng)網(wǎng)絡(luò)完成軸承的故障診斷。除此之外,BP網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等機(jī)器學(xué)習(xí)算法也被廣泛應(yīng)用于軸承故障診斷中。這些方法在軸承故障診斷準(zhǔn)確率上均取得了不錯(cuò)的效果(90%以上),但存在著分類類別少、應(yīng)對(duì)數(shù)據(jù)量較大引起的特征提取過(guò)度依賴人工以及不同振動(dòng)信號(hào)適應(yīng)性低的問(wèn)題。近年來(lái),隨著深度學(xué)習(xí)的快速發(fā)展,一些新的理論方法被不斷地提出并取得了廣泛的應(yīng)用。Shao 等[4]針對(duì)滾動(dòng)軸承的故障診斷采用了壓縮感知方法結(jié)合卷積深度置信網(wǎng)絡(luò)(CDBN);薛妍等[5]以軸承原始振動(dòng)信號(hào)為輸入,利用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)自適應(yīng)學(xué)習(xí)特征和分類;Udmale等[6]對(duì)滾動(dòng)軸承振動(dòng)信號(hào)通過(guò)譜峭度圖包含的時(shí)頻能量特性進(jìn)行編碼,再將特征圖輸入卷積神經(jīng)網(wǎng)絡(luò)中完成故障分類;丁承君等[7]通過(guò)變分模態(tài)分解(VMD)與深度卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法實(shí)現(xiàn)故障分類。相比于傳統(tǒng)故障診斷方法,基于深度學(xué)習(xí)的新方法在應(yīng)對(duì)數(shù)據(jù)量較大引起的特征提取過(guò)度依賴于人工以及不同振動(dòng)信號(hào)適應(yīng)性低等方面都有了較大的改善,但在檢測(cè)準(zhǔn)確率、模型訓(xùn)練收斂速度以及混雜了噪聲的軸承振動(dòng)信號(hào)的檢測(cè)上仍有著較大提升空間。
卷積神經(jīng)網(wǎng)絡(luò)作為一種能有效進(jìn)行圖片特征提取與分類的方法,已經(jīng)成為當(dāng)下故障診斷中的研究熱點(diǎn)。針對(duì)滾動(dòng)軸承故障樣本不足造成的訓(xùn)練收斂速度慢、訓(xùn)練出的模型性能不穩(wěn)定的問(wèn)題,本文提出采用連續(xù)小波變換獲取振動(dòng)數(shù)據(jù)時(shí)頻圖,再對(duì)時(shí)頻圖進(jìn)行垂直方向隨機(jī)裁剪的方法用于數(shù)據(jù)集的擴(kuò)充,然后將擴(kuò)充的數(shù)據(jù)集輸入搭建的卷積神經(jīng)網(wǎng)絡(luò)中,最終實(shí)現(xiàn)滾動(dòng)軸承的故障分類檢測(cè),還加入了常規(guī)構(gòu)建數(shù)據(jù)集的方法用于對(duì)比。為了驗(yàn)證所搭建的卷積神經(jīng)網(wǎng)絡(luò)性能,使用不同的圖像編碼方式處理數(shù)據(jù),構(gòu)建數(shù)據(jù)集導(dǎo)入網(wǎng)絡(luò)中進(jìn)行測(cè)試。另外對(duì)原始數(shù)據(jù)加入6 dB高斯白噪聲,采用常規(guī)方法構(gòu)建數(shù)據(jù)集測(cè)試所提軸承故障診斷模型的抗噪性能。本文數(shù)據(jù)處理與實(shí)驗(yàn)均基于Windows10系統(tǒng)下的python和pytorch完成。
存在不同故障類型的滾動(dòng)軸承轉(zhuǎn)動(dòng)時(shí)所產(chǎn)生的振動(dòng)頻率是不同的,因此針對(duì)滾動(dòng)軸承的故障診斷主要是對(duì)其轉(zhuǎn)動(dòng)時(shí)的振動(dòng)頻率進(jìn)行判別。卷積神經(jīng)網(wǎng)絡(luò)針對(duì)二維圖片信息的提取與分類,一維振動(dòng)數(shù)據(jù)的處理也就成為滾動(dòng)軸承故障診斷的首要任務(wù),本研究采用連續(xù)小波變換進(jìn)行一維振動(dòng)數(shù)據(jù)的處理。
小波變換是一個(gè)平方可積函數(shù)f(t)與一個(gè)時(shí)頻域上具有良好局部性質(zhì)的小波函數(shù)ψ(t)的內(nèi)積,將任意L2(R)空間中的函數(shù)f(t)在小波基下展開(kāi),稱這種展開(kāi)為函數(shù)f(t)的連續(xù)小波變換(CWT):
(1)
式(1)中,b為位移因子;*表示復(fù)數(shù)共軛;ψa,b(t)為
(2)
它是母小波經(jīng)ψ(t)位移和伸縮所產(chǎn)生的函數(shù),稱為小波基函數(shù)。
連續(xù)小波變換可以在不同的頻率范圍、不同的時(shí)間(空間)位置對(duì)信號(hào)進(jìn)行各種分析,通過(guò)這種多分辨率分析,在高頻信號(hào)中獲得一個(gè)好的時(shí)間分辨率和較差的頻率分辨率,低頻信號(hào)中獲得較好的頻率分辨率和較高的時(shí)間分辨率 ,明顯解決了傅里葉變換應(yīng)用于非平穩(wěn)信號(hào)的弊端。小波變換提供了信號(hào)的時(shí)頻混合表示,在眾多的領(lǐng)域都有著非常高效的用途。對(duì)于軸承的振動(dòng)數(shù)據(jù)就可以采用連續(xù)小波變換將一維振動(dòng)時(shí)域信號(hào)轉(zhuǎn)化為二維時(shí)頻圖,用于卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練與測(cè)試。
研究采用美國(guó)凱斯西儲(chǔ)大學(xué)公開(kāi)的軸承數(shù)據(jù)集,選用1 797 r/min的轉(zhuǎn)速電機(jī),12 KHz驅(qū)動(dòng)端收集的振動(dòng)數(shù)據(jù)。該數(shù)據(jù)集包含了軸承發(fā)生內(nèi)圈、外圈和滾動(dòng)體故障時(shí)振動(dòng)的數(shù)據(jù),每個(gè)部位的故障又含有3種故障直徑:7密爾、14密爾和21密爾,這樣就組成了9種故障類型以及正常類型總共10種類型。其中9種故障類型數(shù)據(jù)大小分別為120 000~130 000個(gè)數(shù)據(jù)點(diǎn)不等,正常類型有240 000個(gè)數(shù)據(jù)點(diǎn)。
方式1 每次取凱斯西儲(chǔ)大學(xué)軸承一維振動(dòng)數(shù)據(jù)400個(gè)數(shù)據(jù)點(diǎn)經(jīng)過(guò)連續(xù)小波變換生成400×400的時(shí)頻圖共3 000張,每個(gè)類別300張,再將圖片進(jìn)行歸一化處理,按4∶1進(jìn)行隨機(jī)劃分?jǐn)?shù)據(jù)集,最后進(jìn)行256×256的尺寸大小調(diào)整,獲得訓(xùn)練集2 400張和測(cè)試集600張。這是一種比較常規(guī)的構(gòu)建數(shù)據(jù)集的方法。
方式2 為了對(duì)數(shù)據(jù)庫(kù)進(jìn)行擴(kuò)充,提出了對(duì)連續(xù)小波變換后的時(shí)頻圖進(jìn)行垂直方向上隨機(jī)裁剪方法。具體方法如下:
每次取軸承一維振動(dòng)600個(gè)數(shù)據(jù)點(diǎn)經(jīng)過(guò)連續(xù)小波變換生成600×400的時(shí)頻圖共2 000張,每個(gè)類別200張,再將圖片進(jìn)行歸一化處理,按4∶1進(jìn)行隨機(jī)劃分?jǐn)?shù)據(jù)集(為了避免訓(xùn)練集與測(cè)試集有重疊造成測(cè)試準(zhǔn)確率偏高,故而在擴(kuò)充前進(jìn)行劃分),訓(xùn)練集1 600張,測(cè)試集400張;接著進(jìn)行數(shù)據(jù)庫(kù)的擴(kuò)充,針對(duì)數(shù)據(jù)庫(kù)中的每張圖,采取400×400的垂直方向上隨機(jī)裁剪3次,裁剪后的圖片在垂直方向上的分辨率與原時(shí)頻圖保持一致,避免了信息的失真;對(duì)經(jīng)過(guò)裁剪后的圖片最后進(jìn)行256×256的尺寸大小調(diào)整,最終擴(kuò)充后的數(shù)據(jù)庫(kù)共有6 000張圖片,包含訓(xùn)練集4 800張和測(cè)試集1 200張。數(shù)據(jù)處理過(guò)程見(jiàn)圖1。
圖1 數(shù)據(jù)處理方式2Fig.1 Data processing with method two
其步驟可總結(jié)如下:振動(dòng)信號(hào)經(jīng)連續(xù)小波變換生成時(shí)頻圖;將圖片進(jìn)行歸一化處理;按4∶1進(jìn)行隨機(jī)劃分?jǐn)?shù)據(jù)集;對(duì)數(shù)據(jù)集中的各個(gè)圖片進(jìn)行3次垂直方向上的隨機(jī)裁剪;尺寸大小調(diào)整。
方式1與方式2處理后的每個(gè)二維圖片都含有原始振動(dòng)數(shù)據(jù)400個(gè)點(diǎn),相比之下,方式2處理后的數(shù)據(jù)集比方式1擴(kuò)大了一倍。
軸承振動(dòng)數(shù)據(jù)經(jīng)方式1處理,將構(gòu)建好的數(shù)據(jù)集導(dǎo)入到以LeNet-5為基礎(chǔ)的卷積神經(jīng)網(wǎng)絡(luò)中,Batch size設(shè)為16,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練測(cè)試結(jié)果,調(diào)整模型框架以及相應(yīng)的超參數(shù),直至測(cè)試準(zhǔn)確率達(dá)到較高水平(99%以上)。整體流程見(jiàn)圖2。
圖2 卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造過(guò)程Fig.2 Construction process of the convolutional neural network
經(jīng)過(guò)多次測(cè)試修改,最終本文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)采用了5次卷積,5次最大池化,3次全連接,每層均采用了Relu激活函數(shù),該網(wǎng)絡(luò)主要針對(duì)256×256的圖片輸入。
搭建的卷積神經(jīng)網(wǎng)絡(luò)第一層卷積采用5×5的卷積核共32個(gè),剩下4次卷積則采用3*3的卷積核,分別有32、64、64、128個(gè),可以幫助獲取更多的數(shù)據(jù)特征信息。每一層卷積,步長(zhǎng)均設(shè)置為1,通過(guò)零填充使得每次卷積過(guò)后的圖片尺寸仍保持為卷積前的尺寸大小,在每次卷積后加入了批量歸一化層。第一層最大池化選擇了4×4的池化操作,盡快地縮小輸入圖像的尺寸,其余4層池化均采用2×2尺寸,最終將輸入的256×256圖片尺寸轉(zhuǎn)變?yōu)?×4的大小。經(jīng)過(guò)3次全連接以及兩次神經(jīng)元50%的隨機(jī)失活后,最終輸出10個(gè)類別對(duì)應(yīng)值,其余的參數(shù)設(shè)置與改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖3所示。
圖3 改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)Fig. 3 Framework of improved convolutional neural network
搭建的卷積神經(jīng)網(wǎng)絡(luò)中加入了批量歸一化(Batch Normalization)與隨機(jī)失活(Dropout)操作,可以進(jìn)一步提升網(wǎng)絡(luò)模型訓(xùn)練的收斂速度以及泛化能力。
(3)
(4)
(5)
然后,對(duì)正規(guī)化后的數(shù)據(jù)進(jìn)行縮放和平移的變換,如式(6),γ和β是參數(shù)。開(kāi)始,γ=1,β=0,接著,通過(guò)學(xué)習(xí)調(diào)整到合適的值:
(6)
批量歸一化操作解決了在訓(xùn)練過(guò)程中,中間層數(shù)據(jù)分布發(fā)生改變的問(wèn)題,以防止梯度消失或爆炸,加快了訓(xùn)練速度。
隨機(jī)失活就是隨機(jī)將部分隱含層節(jié)點(diǎn)的權(quán)重歸零,它消除或減弱了神經(jīng)元節(jié)點(diǎn)之間的聯(lián)合,降低了網(wǎng)絡(luò)對(duì)單個(gè)神經(jīng)元的依賴,從而增加了泛化能力,如圖4所示。
圖4 隨機(jī)失活示意圖Fig. 4 Schematic diagram of dropout
本文選擇的損失函數(shù)為交叉熵?fù)p失函數(shù)。采用隨機(jī)梯度下降優(yōu)化算法(SGD),經(jīng)過(guò)多輪模型訓(xùn)練測(cè)試,學(xué)習(xí)率設(shè)置為0.003。
為了測(cè)試搭建的卷積神經(jīng)網(wǎng)絡(luò)性能,分別通過(guò)連續(xù)小波變換(CWT)、短時(shí)傅里葉(STFT)以及格拉姆角場(chǎng)對(duì)應(yīng)做角度差(GADF)的圖像編碼方法處理軸承數(shù)據(jù),采用常規(guī)方法(方式1)構(gòu)建訓(xùn)練數(shù)據(jù)集。將3種方法構(gòu)建的數(shù)據(jù)集導(dǎo)入到搭建的卷積神經(jīng)網(wǎng)絡(luò)中,迭代50次,學(xué)習(xí)率均設(shè)為0.003。最終3種方法構(gòu)建的數(shù)據(jù)集在搭建的卷積神經(jīng)網(wǎng)絡(luò)中訓(xùn)練的模型測(cè)試最高準(zhǔn)確率分別為CWT(99.67%)、STFT(99.62%)、GADF(98.75%),如圖5所示。
圖5 不同編碼方法的測(cè)試最高準(zhǔn)確率Fig. 5 The highest accuracy of different coding methods
對(duì)于滾動(dòng)軸承故障診斷,本文所搭建的卷積神經(jīng)網(wǎng)絡(luò),通過(guò)上述實(shí)驗(yàn)結(jié)果可以看出該網(wǎng)絡(luò)能夠很好地對(duì)軸承故障進(jìn)行分類,訓(xùn)練出的模型準(zhǔn)確率高,具有很好的泛化能力。近年來(lái),不少文獻(xiàn)用不同方法對(duì)滾動(dòng)軸承故障進(jìn)行診斷,將本文方法與其他文獻(xiàn)所述方法進(jìn)行比較,結(jié)果如表1所示。
表1 不同方法對(duì)比Table 1 Comparison of different methods
針對(duì)遇到的數(shù)據(jù)集不足,采用方式2的數(shù)據(jù)集擴(kuò)充方法。將經(jīng)過(guò)方式2處理好的數(shù)據(jù)集導(dǎo)入搭建的卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行測(cè)試。
擴(kuò)充后的數(shù)據(jù)集在卷積神經(jīng)網(wǎng)絡(luò)50輪的訓(xùn)練中,獲得了99.75%的最高準(zhǔn)確率,且第2輪準(zhǔn)確率就已達(dá)到95.83%,第3輪以后基本維持在99%以上,見(jiàn)圖6。數(shù)據(jù)集擴(kuò)充前后在測(cè)試集上的平均損失(每輪測(cè)試集的總體損失與測(cè)試集中圖片個(gè)數(shù)之比)見(jiàn)圖7,也展現(xiàn)了較快的下降趨勢(shì)和后期較小波動(dòng)的穩(wěn)定性。
圖6 數(shù)據(jù)集擴(kuò)充前后的測(cè)試準(zhǔn)確率Fig. 6 Test accuracy before and after data set expansion
圖7 數(shù)據(jù)集擴(kuò)充前后的測(cè)試集平均損失值Fig. 7 Average loss of test sets before and after data set expansion
從進(jìn)行了數(shù)據(jù)集擴(kuò)充(方式2)與未進(jìn)行數(shù)據(jù)集擴(kuò)充(方式1)的試驗(yàn)測(cè)試結(jié)果對(duì)比(圖6和圖7)看出:經(jīng)過(guò)擴(kuò)充后的數(shù)據(jù)集,可以獲得更高的測(cè)試準(zhǔn)確率,更快地訓(xùn)練出較高測(cè)試準(zhǔn)確率和較低測(cè)試損失值的模型,并且在網(wǎng)絡(luò)持續(xù)訓(xùn)練過(guò)程中維持較高的準(zhǔn)確率。通過(guò)測(cè)試,證明了本文所提出的數(shù)據(jù)集擴(kuò)充方法的可行性,對(duì)今后數(shù)據(jù)集擴(kuò)充提供了新的方法與思路。
對(duì)于滾動(dòng)軸承,其工作的環(huán)境基本不會(huì)處于理想的安靜狀態(tài),因此進(jìn)行軸承故障診斷研究就必須要考慮到噪聲對(duì)原始振動(dòng)信號(hào)的影響。
為了模擬傳感器在對(duì)軸承振動(dòng)信號(hào)收集時(shí)混雜了噪聲,筆者在原始軸承振動(dòng)數(shù)據(jù)中加入了信噪比為6 dB的高斯白噪聲進(jìn)行測(cè)試。圖8是故障直徑為7密爾的滾動(dòng)體故障在加入6 dB高斯白噪聲的50個(gè)數(shù)據(jù)點(diǎn)變化對(duì)比。
圖8 加入噪聲后的數(shù)據(jù)變化Fig. 8 Changes in data after adding noise
將加入噪聲的數(shù)據(jù)采用方式1來(lái)構(gòu)建數(shù)據(jù)集,導(dǎo)入到搭建的卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行測(cè)試,測(cè)試數(shù)據(jù)見(jiàn)圖9和圖10。
圖9 加入噪聲后的測(cè)試準(zhǔn)確率Fig. 9 Test accuracy after adding noise
圖10 加入噪聲后的測(cè)試集平均損失值Fig.10 Average loss values of test set after adding noise
加入了6 dB白噪聲的數(shù)據(jù)集在訓(xùn)練過(guò)程中獲得的模型最高準(zhǔn)確率仍達(dá)到了98.67%,基本滿足了軸承故障診斷在實(shí)際工程中的需求。
在完成上述研究工作過(guò)程中,取得了如下創(chuàng)新性成果:
通過(guò)連續(xù)小波變換與改進(jìn)CNN的滾動(dòng)軸承故障診斷模型,經(jīng)過(guò)測(cè)試,該模型最終能達(dá)到99.67%的準(zhǔn)確率,基本滿足對(duì)軸承故障診斷精確度的要求。
針對(duì)出現(xiàn)數(shù)據(jù)樣本不足的情況,提出通過(guò)對(duì)振動(dòng)數(shù)據(jù)生成的時(shí)頻圖進(jìn)行垂直方向隨機(jī)裁剪3次擴(kuò)大數(shù)據(jù)集的方法。經(jīng)實(shí)驗(yàn)數(shù)據(jù)表明:該擴(kuò)大數(shù)據(jù)集的方法可以讓網(wǎng)絡(luò)經(jīng)過(guò)較少輪訓(xùn)練就能獲得不錯(cuò)的訓(xùn)練模型,證明了所提出擴(kuò)大數(shù)據(jù)集方法的可行性。
針對(duì)模型的抗噪性,對(duì)原始數(shù)據(jù)加入了6 dB高斯白噪聲,測(cè)試的最高準(zhǔn)確率仍達(dá)到了98.67%,展現(xiàn)了搭建的卷積神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的抗噪性和泛化能力的特性。