摘要:機械設(shè)備健康運轉(zhuǎn)對生產(chǎn)加工起到至關(guān)重要的作用,如何快速地監(jiān)測設(shè)備運行狀態(tài)成為了重要的研究課題。其中機器軸承因長期負荷運轉(zhuǎn),易產(chǎn)生機械疲勞,因此軸承的質(zhì)量檢測仍占據(jù)重要地位。傳統(tǒng)的故障識別效果較差,很大程度上依賴于專家經(jīng)驗和領(lǐng)域知識。本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的故障識別模型,該方法從兩層卷積-池化層、全連接層組成的網(wǎng)絡(luò)中準(zhǔn)確提取振動信號特征,使用softmax分類器對不同故障的振動信息進行分類,其中在卷積層之間加入批標(biāo)準(zhǔn)化和ReLU函數(shù),在全連接層進行Dropout操作。該實驗診斷效率和精度方面均有較好表現(xiàn),準(zhǔn)確率可達到99.84%。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);軸承故障檢測、故障分類;深度學(xué)習(xí)
0 引言
改革開放以來,我國在現(xiàn)代機械制造方面已得到質(zhì)的飛越。然而,現(xiàn)代機械設(shè)備運行的工況環(huán)境復(fù)雜多變,一旦發(fā)生機械故障,極易造成無法挽回的損失。軸承在現(xiàn)代制造業(yè)中占有極其重要地位,其質(zhì)量直接關(guān)系著產(chǎn)品的安全性和可靠性。因此,對于軸承的狀態(tài)監(jiān)測及質(zhì)量檢測仍是當(dāng)下研究的熱點問題。
近年來,隨著“大數(shù)據(jù)”的發(fā)展及其在工業(yè)方面的應(yīng)用,基于深度學(xué)習(xí)的模型,如深度自編碼網(wǎng)絡(luò)(Deep Auto-Encoder Network,簡稱DAEN)、深度置信網(wǎng)絡(luò)(Deep Belief Network,簡稱DBN)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)[1-5]發(fā)展迅速,引發(fā)越來越多研究者的關(guān)注。深度神經(jīng)網(wǎng)絡(luò)憑借其強大的數(shù)據(jù)分析和學(xué)習(xí)能力,能夠主動從數(shù)據(jù)中學(xué)習(xí)到故障的潛在特征,被廣泛運用于機械故障診斷并取得良好進展。文獻[6]提出了一種批標(biāo)準(zhǔn)化(BN)的CNN和LSTM相結(jié)合的混合模型,無需對振動信號進行復(fù)雜預(yù)處理,也能在小樣本中充分提取其內(nèi)在特征,彌補了單一CNN的缺點,不僅提高診斷精度,還縮短了時間。文獻[7]通過改進Relu函數(shù)和加入殘差神經(jīng)元,使模型能提取更深層次的故障紋理特征,具有高識別精度和分類效果。
本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的故障識別方法,使用一維振動信號,可以避免人工信號處理,使其在含噪數(shù)據(jù)上(無需其他預(yù)處理),后通過調(diào)整模型參數(shù),加入批標(biāo)準(zhǔn)化和Dropout操作,結(jié)合成一種新的CNN模型,解決梯度消失造成的準(zhǔn)確率低的問題。并對數(shù)據(jù)進行多次實驗分析,驗證了方法的有效性。本文結(jié)構(gòu)安排如下。第1節(jié)簡要介紹CNN的理論;第2節(jié)表述故障診斷模型;第3節(jié)通過實驗驗證了方法的有效性;最后,在第4節(jié)得出結(jié)論。
1 基本理論
卷積神經(jīng)網(wǎng)絡(luò)CNN是深度學(xué)習(xí)代表算法之一,是一類仿造生物的視覺機制建立的前饋神經(jīng)網(wǎng)絡(luò)。因為其具有強大的特征學(xué)習(xí)能力及很強的容錯性和魯棒性,被廣泛應(yīng)用于計算機視覺、自然語言處理等任務(wù)中。
圖1展示了一個典型CNN網(wǎng)絡(luò)結(jié)果,其中,包含輸入層、卷積層、池化層和全連接層。通常全連接層與Softmax或sigmoid等函數(shù)組成分類器,可以對故障信號進行有效診斷和識別。
1.1 卷積層
卷積層的核心是局部感受野和權(quán)值共享。利用卷積實現(xiàn)局部連接,然后輸出數(shù)據(jù)里的每個神經(jīng)元通過同一個卷積核(共享權(quán)重),卷積圖像后再加上同一個偏置(共享偏置),最后得到輸出特征圖中的一個圖,卷積操作的數(shù)學(xué)公式如下:
為第i層的輸入特征圖;表示卷積后第i+1層的特征圖;表示卷積運算;為卷積核;為偏置。
在卷積運算之后,通常對特征圖使用激活函數(shù)實現(xiàn)非線性線性變換,提高模型的表達能力,更好地解決復(fù)雜問題。式(1)中加入激活函數(shù)后的數(shù)學(xué)公式:
表示使用激活函數(shù)后輸出的特征圖;表示激活函數(shù),近年來,線性整流函數(shù)(ReLU)由于比sigmoid和tanh函數(shù)更加有效的梯度下降及反向傳播,避免了梯度爆炸和梯度消失的問題,并且有更快的訓(xùn)練速度而被廣泛使用。
1.2 池化層
池化層是一種降采樣操作,在卷積層之后對特征圖進行壓縮,減少參數(shù)計算量,簡化網(wǎng)絡(luò)計算復(fù)雜度,并且進行特征壓縮,提取主要代表特征。通常采用的池化層分為最大池化層和平均池化層兩種。其中最大池化層(max-pooling)使用最多,其方法是從對應(yīng)區(qū)域內(nèi)神經(jīng)元的最大值作為代表值,數(shù)學(xué)表達式如下:
該表達式中,是區(qū)域中每個神經(jīng)元的活性值。
1.3 全連接層
全連接層用于連接所有之前的特征映射,全連接層的作用是細化卷積層提取的特征。值得一提的是,在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,尤其是在訓(xùn)練數(shù)據(jù)集很小的情況下,通常使用Dropout層來防止模型過擬合,提升模型的泛化能力。此外,Dropout可以被認為是網(wǎng)絡(luò)內(nèi)模型集成的一種簡單方式,以提高特征提取的能力。
2 構(gòu)建故障診斷模型
目前,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于軸承故障診斷任務(wù)中,CNN的結(jié)構(gòu)和參數(shù)的選擇沒有明確的標(biāo)準(zhǔn),所以,選擇合適的網(wǎng)絡(luò)結(jié)構(gòu)可以降低網(wǎng)絡(luò)的復(fù)雜性并且提高執(zhí)行效率。
2.1 CNN模型結(jié)構(gòu)
本文提到的一種軸承故障診斷的CNN網(wǎng)絡(luò)模型結(jié)構(gòu),由圖2可知,在該卷積神經(jīng)網(wǎng)絡(luò)模型中,以軸承原始一維振動信號為輸入,使用兩層卷積層和池化層交替連接,然后使用批標(biāo)準(zhǔn)化操作,讓每一個輸入有一個穩(wěn)定的分布,最后使用兩層全連接層及softmax分類。故障診斷基本流程圖如圖3所示。
實驗中的部分網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如表1所示,卷積層和池化層的步長分別設(shè)置4和2。隨后,為了進一步的特征檢測,跟隨全連接層。最后,利用softmax層進行故障識別和分類。值得注意的是,在第一層全連接層和第二層全連接層之間加入了Dropout操作,旨在避免過擬合,提高泛華能力。神經(jīng)元的失活概率設(shè)置為0.5。
2.2 激活函數(shù)
激活函數(shù)對神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)、理解某些非線性函數(shù)來說具有重要作用。它將非線性的特征引入到我們的網(wǎng)絡(luò)中,使網(wǎng)絡(luò)可以完成非線性映射。如果不使用激活函數(shù),無論網(wǎng)絡(luò)有多少層,都只是線性組合而已,沒有意義。加入激活函數(shù),可以使它學(xué)習(xí)復(fù)雜的事物,使網(wǎng)絡(luò)的表達能力增強。
2.3 優(yōu)化模型
實驗使用交叉熵損失函數(shù)作為目標(biāo)函數(shù),使得振動信號通過CNN模型的輸出與其目標(biāo)值具有一致性。交叉熵損失函數(shù)是現(xiàn)使用最多的損失函數(shù),數(shù)學(xué)公式如下:
式中p(x)為目標(biāo)的概率分布,q(x)為預(yù)測分布。
損失函數(shù)的梯度計算采用反向傳播法,網(wǎng)絡(luò)參數(shù)優(yōu)化采用Mini-Batch梯度下降法,將模型收斂到全局最優(yōu)點。對于每個時期,樣本被隨機分為多個小批量。本實驗中,批量大小設(shè)置為75,加快參數(shù)更新速度。同時為解決局部最優(yōu)解的問題,使模型達到更好效果,使用Adam算法,通過計算梯度為不同參數(shù)設(shè)計獨立的自適應(yīng)學(xué)習(xí)率,加快收斂速度。由于多次迭代更新后,各層參數(shù)在不停變化,面臨內(nèi)部斜變量偏移問題,為方便后續(xù)處理,使用批標(biāo)準(zhǔn)化(batch normalization,BN)對輸入數(shù)據(jù)分布變換到均值為0,方差為1的正態(tài)分布,加速神經(jīng)網(wǎng)絡(luò)的收斂速度,不會造成梯度消失問題。該試驗在卷積層之后均添加BN操作,用來規(guī)范數(shù)據(jù)分布,然后經(jīng)過ReLU激活函數(shù)得到輸出。同時在全連接層之間使用0.5的概率進行Dropout,防止過擬合。模型訓(xùn)練參數(shù)列于表2。
3 實驗驗證及分析
3.1 數(shù)據(jù)集
本文采用美國斯凱西儲大學(xué)(Case Western Reserve University)的公開軸承數(shù)據(jù)集進行實驗,CWRU軸承故障的采集試驗臺如圖4所示
該實驗?zāi)M真實故障,共分為滾珠故障、內(nèi)圈故障、外圈故障和正常四種健康狀態(tài),每種狀態(tài)有三種不同受損程度,受損直徑為:0.18mm、0.36mm和0.54mm,共十種故障狀態(tài)。這些數(shù)據(jù)有四種不同負載狀態(tài):0hp、1hp、2hp和3hp。
本文對四種不同負載狀態(tài)下的數(shù)據(jù)做實驗,共有792個數(shù)據(jù)樣本,每段信號由6000個按時間序列連續(xù)采樣的振動信號構(gòu)成。將樣本以4:1比例隨機劃分為訓(xùn)練集和測試集,其中訓(xùn)練集和測試集的數(shù)據(jù)樣本數(shù)量分別為633和159個。為了滿足深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練要求,提高模型泛化性的目的。由于每種故障狀態(tài)的樣本數(shù)目不一樣,因此對軸承的十種故障信號樣本進行等額抽樣,具體的數(shù)據(jù)集參數(shù)如表4所示:
3.2 結(jié)果
在本節(jié)中,主要檢驗所構(gòu)建故障診斷網(wǎng)絡(luò)的性能和結(jié)果。為了保證實驗結(jié)果了客觀性,對于每組實驗均重復(fù)多次,以減少特殊性、偶然性和隨機性的影響。在所構(gòu)建的網(wǎng)絡(luò)中,我們選取了CNN常用的激活函數(shù),Sigmoid,Tanh和Relu函數(shù)作為對比使用。表3為迭代次數(shù)為50時,使用不同激活函數(shù)的準(zhǔn)確率,結(jié)果表明該實驗使用Relu函數(shù)的準(zhǔn)確率最高,可見ReLU激活函數(shù)因其分段線性的特點,導(dǎo)致網(wǎng)絡(luò)在前向傳播和后向傳導(dǎo)過程中都保持線性,網(wǎng)絡(luò)更易學(xué)習(xí)優(yōu)化,進而使網(wǎng)絡(luò)模型保持收斂。
使用ReLU激活函數(shù),在迭代次數(shù)設(shè)置為100次,并以步長為10次時,所構(gòu)建軸承故障識別網(wǎng)絡(luò)的結(jié)果,由圖5所示,從第1次到第20次迭代的故障識別準(zhǔn)確率在逐步上升,當(dāng)?shù)?0次訓(xùn)練之后,慢慢趨于平穩(wěn),尤其是在迭代50到迭代60時達到收斂,分類的準(zhǔn)確率達到了99.8%。結(jié)果表明,該模型識別故障準(zhǔn)確率較高,可應(yīng)用于軸承故障的精確識別。
為了較好觀察每種故障的分類情況,得到詳細分類信息和誤分類信息,繪制如圖6所示的混淆矩陣。由圖6可知,每種故障的準(zhǔn)確率都是100%,沒有被錯誤分類,表明軸承故障被完全識別。
4、結(jié)論
相較于傳統(tǒng)信號處理、支持向量機等機械故障診斷,本文改善了其準(zhǔn)確率不高的問題,提出了一種有效的卷積神經(jīng)網(wǎng)絡(luò),對振動信號進行特征提取,提高軸承故障診斷準(zhǔn)確率,能夠準(zhǔn)確識別CWRU十種不同故障狀態(tài)。結(jié)果表明,利用深度學(xué)習(xí)技術(shù),尤其,使用一種卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可以較為準(zhǔn)確對軸承故障進行診斷,為機械故障快速診斷提供了一種新的思路。
參考文獻:
[1]童靳于,羅金,鄭近德.基于增強深度自編碼網(wǎng)絡(luò)的滾動軸承故障診斷方法[J/OL].中國機械工程:1-10[2021-05-22].
[2]張星博.基于小波分析和機器學(xué)習(xí)的滾動軸承故障診斷方法研究[D].長春大學(xué),2020.
[3]劉海龍.基于優(yōu)化深度置信網(wǎng)絡(luò)的電機軸承故障診斷方法研究[D].大連交通大學(xué),2020.
[4]高佳豪,郭瑜,伍星.基于SANC和一維卷積神經(jīng)網(wǎng)絡(luò)的齒輪箱軸承故障診斷[J].振動與沖擊,2020,39(19):204-209+257.
[5]吳定海,任國全,王懷光,張云強.基于卷積神經(jīng)網(wǎng)絡(luò)的機械故障診斷方法綜述[J].機械強度,2020,42(05):1024-1032.
[6]沈濤,李舜酩.針對滾動軸承故障的批標(biāo)準(zhǔn)化CNN-LSTM診斷方法[J/OL].計算機集成制造系統(tǒng):1-16[2021-05-22].
[7]龐俊,劉鑫,段敏霞,任海莉,侯鑫燁.基于改進卷積神經(jīng)網(wǎng)絡(luò)軸承故障診斷[J].組合機床與自動化加工技術(shù),2021(03):66-69.
[8]齊愛玲,李琳,朱亦軒,張廣明.基于融合特征的雙通道CNN滾動軸承故障識別[J].機械與電子,2021,39(05):15-19.
[9]蔡文波,賈延,吳一鳴,李默,郭大志.基于卷積神經(jīng)網(wǎng)絡(luò)的軸承精細化診斷技術(shù)研究[J].機械工程與自動化,2021(02):135-137.
[10] Jinyang Jiao et al. A Multivariate Encoder Information based Convolutional Neural Network for Intelligent Fault Diagnosis of Planetary Gearboxes[J]. Knowledge-Based Systems, 2018.
作者簡介:王藝璇(1999.08-),女,蒙古族,內(nèi)蒙古自治區(qū)巴彥淖爾市人,呼和浩特市內(nèi)蒙古師范大學(xué)2018級計算機科學(xué)與技術(shù)專業(yè) 本科生 研究方向:深度學(xué)習(xí)
內(nèi)蒙古師范大學(xué) 內(nèi)蒙古自治區(qū) 呼和浩特 011500