龐 俊,劉 鑫,段敏霞,任海莉,侯鑫燁
(太原科技大學(xué)電子信息工程學(xué)院,太原 030024)
現(xiàn)代機(jī)械設(shè)備正在朝復(fù)雜、高強(qiáng)度的工作條件下進(jìn)行,一旦發(fā)生故障,那就可能是災(zāi)難性的,因此機(jī)械故障隱藏著巨大的風(fēng)險(xiǎn)和經(jīng)濟(jì)損失[1]。軸承是機(jī)械設(shè)備重要的零部件,為了使一些設(shè)備能夠正常運(yùn)行,軸承的診斷就是必不可少的[2],據(jù)統(tǒng)計(jì)有30%是由軸承的損壞造成的[3]?,F(xiàn)在機(jī)械設(shè)備故障數(shù)據(jù)海量化,機(jī)械設(shè)備檢測(cè)邁入了“大數(shù)據(jù)”時(shí)代。
大數(shù)據(jù)時(shí)代是如何在海量的數(shù)據(jù)中自動(dòng)進(jìn)行特征挖掘,以取代人工進(jìn)行特征提取,對(duì)軸承進(jìn)行實(shí)時(shí)檢測(cè),保證故障診斷的準(zhǔn)確性和高效性。因此處理工業(yè)“大數(shù)據(jù)”的智能診斷就慢慢發(fā)展起來(lái),其中卷積神經(jīng)網(wǎng)絡(luò)故障診斷就受到廣泛的關(guān)注[4]。軸承故障診斷是機(jī)械研究領(lǐng)域的一個(gè)重要方向,故障診斷主要分為兩個(gè)步驟:一是特征提取,二是模式識(shí)別。傳統(tǒng)的特征提取的方法可以分為時(shí)域分析、頻域分析、時(shí)頻域分析這三大類方法;模式識(shí)別的方法主要有支持向量機(jī)[5]、多層感知器[6]等。由于卷積神經(jīng)網(wǎng)絡(luò)在模式識(shí)別、圖片分類等領(lǐng)域有良好的特征學(xué)習(xí)能力,將深度學(xué)習(xí)模型運(yùn)用于軸承故障診斷中,成為近些年來(lái)國(guó)內(nèi)外專家學(xué)者們研究的熱點(diǎn)[3]。Janssens O等用卷積神經(jīng)網(wǎng)絡(luò)機(jī)械軸承故障診斷,比傳統(tǒng)故障診斷準(zhǔn)確率提高了6%[7];Chen Lu等運(yùn)用貪婪訓(xùn)練的逐層傳遞規(guī)則,對(duì)深層次結(jié)構(gòu)進(jìn)行魯棒性訓(xùn)練[8];Hoang Duy tang等建立神經(jīng)網(wǎng)絡(luò)模型進(jìn)行軸承故障診斷,把原始信號(hào)轉(zhuǎn)換成圖像作為輸入,可以達(dá)到較高的精度和性能[9]。雖然CNN提高了故障診斷的準(zhǔn)確率,但在數(shù)據(jù)預(yù)處理和網(wǎng)絡(luò)結(jié)構(gòu)上還存在一定的問(wèn)題:①如果對(duì)輸入數(shù)據(jù)進(jìn)行快速傅里葉變換或者小波變換,會(huì)使得一些故障信號(hào)的時(shí)域特征丟失;②激活函數(shù)的運(yùn)用會(huì)使模型出現(xiàn)梯度消失和均值偏移,影響模型對(duì)軸承故障診斷準(zhǔn)確率。因此,本文提出了對(duì)激活函數(shù)線性修正單元進(jìn)行改進(jìn),以解決梯度消失所帶來(lái)的診斷準(zhǔn)確率低的問(wèn)題;卷積神經(jīng)網(wǎng)絡(luò)加入了兩層殘差神經(jīng)元層加深網(wǎng)絡(luò);結(jié)合成一種新的故障診斷CNN模型,在與一些其它智能故障診斷相比較,顯示出了更好的故障診斷優(yōu)勢(shì)。
激活函數(shù)就是將非線性的的特征映射到神經(jīng)網(wǎng)絡(luò)中的,如果不用激活函數(shù),在網(wǎng)絡(luò)中的每層輸入都是上一層的線性輸出,不管網(wǎng)絡(luò)有多少層都是沒(méi)有意義,這樣只認(rèn)為有一個(gè)隱藏層的作用,網(wǎng)絡(luò)的訓(xùn)練能力就有限;如果使用,激活函數(shù)就會(huì)讓網(wǎng)絡(luò)中加入一些非線性因子,這樣深層卷積神經(jīng)網(wǎng)絡(luò)的表達(dá)能力就更強(qiáng)。
1.1.1 修正線性單元
CNN中通常采用的激活函數(shù)為修正線性單元(The Rectified Linear Unit,ReLU),它的一般形式為:
(1)
1.1.2 改進(jìn)修正線性單元
ReLU函數(shù)解決sigmoid激活函數(shù)出現(xiàn)的梯度消失,但ReLU函數(shù)出現(xiàn)了均值偏移。在x<0時(shí),由于x=0神經(jīng)元是非激活狀態(tài),后續(xù)訓(xùn)練中網(wǎng)絡(luò)無(wú)法學(xué)習(xí),運(yùn)行結(jié)果不收斂。PReLU函數(shù)是ReLU的改進(jìn),很好的解決了x<0上的均值偏移問(wèn)題[10]。迭代次數(shù)的增多會(huì)出現(xiàn)不收斂,過(guò)擬合,導(dǎo)致訓(xùn)練結(jié)果失真,于是出現(xiàn)了變體ReLU閾值函數(shù)[11]。
雖然ReLU閾值函數(shù)解決了過(guò)擬合問(wèn)題,仍然存在均值偏移問(wèn)題,所以對(duì)ReLU閾值函數(shù)選取不同的閾值位置,測(cè)試對(duì)應(yīng)的loss,如表1所示。
表1 在x<0處不同閾值與測(cè)試準(zhǔn)確率的關(guān)系
根據(jù)表1的結(jié)果選擇x=-1,如公式(2),定義此函數(shù)為tReLU。
(2)
網(wǎng)絡(luò)深度的增加,能更好的提取一些潛在,不容易被發(fā)掘的特征。已有研究證明,單純?cè)黾泳W(wǎng)絡(luò)深度,會(huì)在數(shù)據(jù)驗(yàn)證時(shí)出現(xiàn)準(zhǔn)確率先升后降的現(xiàn)象,這就是所謂的退化問(wèn)題[12]。加入殘差神經(jīng)會(huì)解決這些問(wèn)題[13],原理如圖1所示。
如圖1所示,x表示輸入,F(xiàn)(x)表示第二層?前的輸入,即公式(3):
F(x)=W2f(W1x+b)+b
(3)
其中,W1、W2表示第一層和第二層的權(quán)重,f(·)表示ReLU激活函數(shù),b表示偏置。
在圖1中,設(shè)?之后激活函數(shù)之前的輸出為H(x),如果沒(méi)有恒等映射,殘差塊就是一個(gè)普通的2層卷積網(wǎng)絡(luò),只將其優(yōu)化成H(x)=x;但如果有恒等映射,則H(x)=F(x)+x,如果最優(yōu)輸出是x,則要把F(x)優(yōu)化為0即可。
在CNN結(jié)構(gòu)模型中為了減少計(jì)算量,運(yùn)用1×1,3×3,1×1的卷積層[14],兩個(gè)1×1卷積分別負(fù)責(zé)通道上減少和增加維度,3×3卷積在它們之間提取特征。過(guò)程如圖2所示。
圖1 殘差塊的構(gòu)成 圖2 殘差塊結(jié)構(gòu)圖
在CNN中,用卷積和池化交替連接,引入殘差神經(jīng)元,最后用全連接,softmax分類,貫穿整個(gè)結(jié)構(gòu),其中激活函數(shù)運(yùn)用tReLU。把此模型定義為RLCNN,結(jié)構(gòu)如圖3所示。
在提出的CNN模型中,先是把振動(dòng)信號(hào)轉(zhuǎn)換成二維振動(dòng)圖像[15],然后在4層交替的卷積池化中,加入殘差同維神經(jīng)元兩層,最后兩層全連接層分類。在RLCNN故障診斷中,基本的流程如圖4所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
圖4 CNN故障診斷基本流程圖
圖3中,第1、2、5、6層的卷積核大小依次是5×5,3×3,3×3,3×3,個(gè)數(shù)依次是32,64,128,256,每層都運(yùn)用最大池化層,其大小是2×2。第3、4層中運(yùn)用殘差神經(jīng)元建立。
實(shí)驗(yàn)中應(yīng)用凱斯西儲(chǔ)大學(xué)和德國(guó)帕德?tīng)柌鞔髮W(xué)軸承公開(kāi)數(shù)據(jù)集對(duì)提出的RLCNN模型軸承故障診斷方法進(jìn)行驗(yàn)證。其中RLCNN模型代碼是通過(guò)Python3.5和TensorFlow進(jìn)行編寫(xiě),在Windows下的Pycharm2018 2.4下運(yùn)行。
2.1.1 數(shù)據(jù)集
圖5 10種故障的振動(dòng)圖像
運(yùn)用凱斯西儲(chǔ)大學(xué)的軸承數(shù)據(jù)集[16]對(duì)提出的RLCNN模型進(jìn)行驗(yàn)證。3種類型,有外圈故障(OF)、滾動(dòng)體故障(RF)、內(nèi)圈故障(IF),每種類型有3種受損程度,受損直徑0.18 mm、0.36 mm、0.54 mm,共9種故障類型,再加一種正常(NO)類型。這些數(shù)據(jù)是在4種負(fù)載條件(0 hp、1 hp、2 hp、3 hp)下記錄的,在訓(xùn)練數(shù)據(jù)集中,每種負(fù)載有2000張振動(dòng)圖像;在測(cè)試數(shù)據(jù)集中,每種負(fù)載有400張振動(dòng)圖像,圖像大小為64×64。它們的振動(dòng)圖像樣品如圖5所示。
從圖5中可以看出,不同故障具有不同紋理,所以用圖像特征的識(shí)別方式可以區(qū)分故障類型。
2.1.2 故障仿真結(jié)果
實(shí)驗(yàn)運(yùn)行10組,每組經(jīng)過(guò)50次的迭代,最后取10組的平均值為最終的識(shí)別準(zhǔn)確率,則分類準(zhǔn)確率與迭代次數(shù)的關(guān)系變化如圖6所示。
圖6 分類準(zhǔn)確率和迭代次數(shù)的關(guān)系圖
從圖6中可以看出,從第1次迭代到第5次迭代故障識(shí)別準(zhǔn)確率上升的快,到后面就慢慢平穩(wěn)了,尤其是從40~50次迭代達(dá)到收斂,分類準(zhǔn)確率達(dá)到了99.18%。圖10為RLCNN第6組結(jié)果的混淆矩陣。
圖7 RLCNN故障診斷的混淆矩陣
從圖7可以看出,行表示預(yù)測(cè)標(biāo)簽,列表示實(shí)際的標(biāo)簽。結(jié)果顯示,在IF0.36、IF0.54、OF0.36、OF0.54、NO、RF0.54的準(zhǔn)確率均為100%,在RF0.18是最壞的,準(zhǔn)確率為97%,在RF0.54錯(cuò)誤分類最多為3%,2%的RF0.36、OF0.18分別被錯(cuò)誤的分到OF0.54,OF0.36。IF0.36、IF0.54、NO的準(zhǔn)確率為100%,沒(méi)有其他條件被錯(cuò)誤分類,顯示著軸承故障完全識(shí)別。
為了評(píng)價(jià)提出卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型的性能,將RLCNN模型與改進(jìn)lenet-5的CNN[15]的故障診斷方法相比,其診斷準(zhǔn)確率結(jié)果如表2所示。
表2 CNN模型與其他方法比較結(jié)果
從表2中可以看出,RLCNN模型的故障診斷準(zhǔn)確率達(dá)到了99.18%,運(yùn)行時(shí)間為4 h,改進(jìn)lenet-5的CNN故障診斷的運(yùn)行時(shí)間為5.8 h。雖然準(zhǔn)確率不及改進(jìn)lenet-5的CNN方法,但從時(shí)間差異上看出RLCNN模型在運(yùn)算量上要少于改進(jìn)lenet-5的CNN,模型運(yùn)算效率有了較大提升。
2.2.1 數(shù)據(jù)集
運(yùn)用德國(guó)帕德?tīng)柌鞔髮W(xué)提供的軸承數(shù)據(jù)集[17]對(duì)提出的RLCNN模型故障診斷方法進(jìn)行分析。選中數(shù)據(jù)集中的一部分進(jìn)行訓(xùn)練和測(cè)試,在數(shù)據(jù)集中有人為損傷和真實(shí)損傷(加速壽命的實(shí)驗(yàn)所產(chǎn)生),在真實(shí)損傷中選中內(nèi)圈的5種損傷,點(diǎn)蝕多重?fù)p傷1級(jí)(KI04)、點(diǎn)蝕單一損傷3級(jí)(KI16)、點(diǎn)蝕重復(fù)損傷1級(jí)(KI17)、點(diǎn)蝕單一損傷2級(jí)(KI18)、點(diǎn)蝕單一損傷1級(jí)(KI21)和正常(NO)共6種故障類型。每種類型共1200張振動(dòng)圖像,圖像大小為128×128,分別從每種類型隨機(jī)選擇240張作為測(cè)試集,剩余為訓(xùn)練集。振動(dòng)圖像樣品如圖8所示。
圖8 6種故障的振動(dòng)圖像
2.2.2 故障仿真結(jié)果
運(yùn)行10組實(shí)驗(yàn),每組迭代50次,對(duì)10組分類結(jié)果求平均值,故障分類準(zhǔn)確率與迭代次數(shù)的關(guān)系如圖9所示。
圖9 故障分類準(zhǔn)確率與迭代次數(shù)的關(guān)系圖
從圖9中所得,在第1次迭代到第30次迭代準(zhǔn)確率都在變化,直到迭代30次后,故障分類準(zhǔn)確率收斂,達(dá)到100%。為了更好地看清每種故障的分類準(zhǔn)確率,繪制如圖10為RLCNN模型故障診斷的混淆矩陣。
圖10 RLCNN故障診斷的混淆矩陣
在圖10中,每種故障的分類都是100%,從圖中可以看出,KI04、KI16、KI17、KI18、KI21和NO沒(méi)有其他錯(cuò)誤分類,說(shuō)明已被完全分離。
為了更好的體現(xiàn)RLCNN模型處理故障診斷的性能,此方法分別與JCNN[18]和STFT-CNN[19]中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相比,其結(jié)果如表3所示。
表3 CNN模型與其他方法的比較結(jié)果
從表3可以看出,在處理大小為128×128振動(dòng)圖像,分6種故障,RLCNN模型診斷準(zhǔn)確率達(dá)到100%,分別用JCNN、STFT-CNN對(duì)相同數(shù)據(jù)進(jìn)行故障診斷,診斷準(zhǔn)確率達(dá)到99.72%、94.03%,本文方法有了改進(jìn)。
基于一種改進(jìn)的 ReLU 和殘差神經(jīng)元相結(jié)合新的CNN 網(wǎng)絡(luò)模型可自動(dòng)對(duì)振動(dòng)圖像進(jìn)行特征學(xué)習(xí),有效地實(shí)現(xiàn)對(duì)軸承故障診斷。相比于改進(jìn)的 lenet-5 的 CNN 和JCNN,此方法更能提取出振動(dòng)圖像的深層次故障紋理特征,具有更好的分類能力。分別用凱斯西儲(chǔ)大學(xué)和帕德?tīng)柌鞔髮W(xué)的軸承故障數(shù)據(jù)對(duì) RLCNN 模型進(jìn)行測(cè)試,故障診斷準(zhǔn)確率達(dá)到了 99.18%和 100%。