尚東方,申浩,王正
(1.中國礦業(yè)大學 安全工程學院,江蘇 徐州 221116;2.黃河水利職業(yè)技術(shù)學院,河南 開封 475001;3.上海電機學院 電氣學院,上海 201306)
隨著科技發(fā)展的日新月異,電動機設(shè)備的功能越來越強大,設(shè)施越來越復雜,作為電動機關(guān)鍵部件的電機軸承極易損壞,對其故障診斷的要求也越來越高[1]。目前,對于電機軸承故障診斷的主要方法有基于模型的方法和基于數(shù)據(jù)的方法。傳統(tǒng)的機器學習方法在故障診斷領(lǐng)域取得了不錯成果,如文獻[2]提出一種基于信息熵的軸承故障特征提取方法,將提取的故障特征向量作為優(yōu)化支持向量機(SVM)的輸入,使用集成經(jīng)驗?zāi)B(tài)分解提取各階分量的信息熵,通過主成分分析(PCA)提取主要信息,利用Grid Search優(yōu)化SVM參數(shù)并對故障信息進行分類,從而快速有效地識別了不同的軸承故障信息。
隨著AlexNet的問世,深度學習方法逐漸進入故障診斷領(lǐng)域并成為眾多學者的研究對象[3-5],如文獻[6-8]將深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)以及堆疊自編碼器(Stacked Auto Encoder,SAE)應(yīng)用于故障診斷領(lǐng)域,著重于提取輸入的故障特征,均取得了較好的診斷效果。目前,將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)應(yīng)用于軸承故障診斷領(lǐng)域的研究更為廣泛:文獻[9]將多通道原始軸承信號經(jīng)過短時傅里葉變換轉(zhuǎn)換為二維時頻圖像,送入深度殘差網(wǎng)絡(luò)進行故障分類,準確率得到了很大提升;文獻[10]提出了一種具有殘差結(jié)構(gòu)的一維擴張卷積網(wǎng)絡(luò)方法,將鋸齒形擴張卷積引入神經(jīng)網(wǎng)絡(luò)模型,并在網(wǎng)絡(luò)中添加注意力模塊進行特征增強,很大程度上提高了故障識別率。上述方法均是將軸承信號輸入卷積神經(jīng)網(wǎng)絡(luò)模型提取故障特征從而達到診斷效果,但實際工況復雜,干擾因素較多[11],使用單一卷積核構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò)模型的特征提取能力有限,很大程度上會堆疊重復特征,存在較多的冗余信息。
針對以上問題,本文提出一種基于多卷積核(Multiple Convolution Kernels,MCK)卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷方法(MCK-CNN)。經(jīng)過預網(wǎng)絡(luò)特征提取后產(chǎn)生輸出特征圖,再將其分別輸入基于Involution卷積核搭建的NET1和常規(guī)Convolution卷積搭建的NET2進行故障特征提取,然后通過CBAM模塊自適應(yīng)融合二者提取的特征,使網(wǎng)絡(luò)更加關(guān)注有判別能力的特征以提高網(wǎng)絡(luò)診斷能力,最后通過Softmax函數(shù)輸出分類結(jié)果。
二維卷積的目的是提取圖片中的特征,卷積核相當于過濾器,通過在特征圖上的不停移動提取輸入特征圖的信息。其卷積過程如圖1所示。
圖1 二維卷積
卷積的運算過程可表示為
(1)
Involution卷積沒有像Convolution卷積一樣采用固定尺寸的權(quán)重作為可學習參數(shù),而是基于特征圖生成對應(yīng)的Involution核,從而確定卷積核的尺寸與輸入特征矩陣的大小在空間維度上是可以對齊的[12]。Involution算子可以表示為
(2)
式中:X為輸入圖片的通道數(shù);H為Involution卷積核,H∈RH×W×K×K×G,通用形式為Hi,j=φ(XΨi,j);φ為Involution卷積核生成函數(shù);Ψi,j為坐標(i,j)鄰域的集合,表示特征圖上包含Xi,j的某個鄰域,生成圖如圖2所示。
圖2 Involution卷積
卷積注意力模塊(Convolutional Block Attention Module,CBAM) 包含2個獨立的子模塊[13],通道注意力模塊(Channel Attention Module,CAM)和空間注意力模塊(Spartial Attention Module,SAM)如圖3所示。
圖3 CBAM結(jié)構(gòu)圖
給定一個特征圖作為輸入,CBAM的運算過程總體分為2個部分:1)對輸入按通道進行全局最大池化和均值池化,將池化后的2個一維向量送入全連接層運算后相加,生成一維通道注意力并與輸入元素相乘,獲得通道注意力調(diào)整后的特征圖F′;2)將F′按空間進行全局最大池化和均值池化,將池化生成的2個二維向量拼接后進行卷積操作,最終生成二維空間注意力并與F′按元素相乘得到輸出F″。
本文采用的神經(jīng)網(wǎng)絡(luò)模型結(jié)合了Involution卷積和Convolution卷積,而且可通過CBAM注意力機制進行自適應(yīng)特征融合,如圖4所示:將通過小波變換產(chǎn)生的時頻圖裁剪為64*64*3的尺寸輸入神經(jīng)網(wǎng)絡(luò)模型;經(jīng)過NET0中9個5*5的卷積核提取特征以及擴充維度之后產(chǎn)生60*60*9尺寸的輸出,通過最大池化層下采樣壓縮特征并去除冗余信息后得到30*30*9尺寸的輸出特征圖并分別作為NET1和NET2的輸入;在NET1中,Involution卷積根據(jù)輸入特征圖尺寸產(chǎn)生對應(yīng)的Involution卷積核并進行逐個像素點的特征提取,得到30*30*9尺寸的Involution輸出特征;在NET2中,輸入分別經(jīng)過6個1*1的卷積核和9個1*1的卷積核升降維度后產(chǎn)生30*30*9尺寸的Convolution輸出特征;通過CBAM注意力模塊自適應(yīng)分配Involution和Convolution特征所占權(quán)重并進行融合,通過Softmax函數(shù)輸出分類結(jié)果。
圖4 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖
基于MCK-CNN的滾動軸承故障診斷方法包含3個模塊,其流程如圖5所示:
圖5 故障診斷流程圖
1)數(shù)據(jù)處理。通過電動機驅(qū)動端的傳感器獲取滾動軸承一維振動信號并通過小波變換轉(zhuǎn)換為二維時頻圖,經(jīng)過裁剪、翻轉(zhuǎn)等操作后將數(shù)據(jù)集劃分為訓練集、驗證集和測試集,進行網(wǎng)絡(luò)初始化后將訓練集、驗證集輸入神經(jīng)網(wǎng)絡(luò)模型。
2)網(wǎng)絡(luò)訓練。將劃分后的數(shù)據(jù)集經(jīng)過卷積層NET0進行簡單的特征提取以及維度擴充,得到輸出特征圖后分別送入基于Convolution卷積的NET2和基于Involution卷積的NET1進一步提取特征,由CBAM模塊自適應(yīng)融合NET2和NET1分別產(chǎn)生的特征,最后展平成一維送入全連接層并通過Softmax函數(shù)輸出分類結(jié)果。訓練完成后輸出準確率曲線和損失函數(shù)曲線,保存網(wǎng)絡(luò)權(quán)重。
3)網(wǎng)絡(luò)性能測試。將測試集輸入訓練好的網(wǎng)絡(luò)模型中,計算得到混淆矩陣。
為驗證MCK-CNN模型的性能和泛化能力,采用CWRU軸承數(shù)據(jù)集[14]以及實驗室采集的軸承數(shù)據(jù)進行試驗分析,數(shù)據(jù)集的劃分見表1。CWRU軸承數(shù)據(jù)集軸承型號為6205,采樣頻率為48 kHz,轉(zhuǎn)速為1 797 r/min,N代表正常軸承,OR,IR,B分別代表外圈、內(nèi)圈、鋼球故障,007,014,021分別表示直徑0.178,0.356,0.534 mm的故障。實驗室軸承測試平臺如圖6所示,在電動機驅(qū)動端的橫向、徑向、軸向分別安裝傳感器采集得到三通道的振動信號,采樣頻率為10 kHz,轉(zhuǎn)速為1 420 r/min,試驗軸承型號為6206-2RS,故障類型如圖7所示。
表1 試驗軸承數(shù)據(jù)集
(a) 正常軸承 (b) 保持架故障
試驗配置如下:CPU為Intel(R)Core(TM)i5-10400 CPU@2.90GHz,顯卡為RTX2060,運行程序軟件為PyCharm Community Edition 2020.3 x64。神經(jīng)網(wǎng)絡(luò)模型設(shè)置參數(shù)為:學習率設(shè)為0.002,迭代次數(shù)為50,batchsize為32。由于輸入圖片64*64*3的尺寸較小,在Involution卷積操作中的壓縮率r和組數(shù)G均取為3。
為更好地驗證MCK-CNN模型的故障診斷性能,在保證NET0的基礎(chǔ)上設(shè)置了只有NET1(Involution卷積)或NET2(Convolution卷積)的網(wǎng)絡(luò)進行對比分析,結(jié)果如圖8所示:
1)對于實驗室軸承數(shù)據(jù)集,由于故障類型僅有4類,各模型的故障檢測準確率均較穩(wěn)定,在只有Convolution卷積進行特征提取的狀態(tài)下準確率即可達到94%,在Involution卷積進行二次特征提取的狀態(tài)下準確率達到了97%;當把二者提取的特征通過CBAM模塊進行自適應(yīng)融合之后,模型準確率達到了99%,故障識別率得到了較大程度的提高。
2)對于CWRU軸承數(shù)據(jù)集,在10種故障類型情況下,MCK-CNN模型的故障識別率達到了99.25%,仍高于僅通過單一卷積核提取特征的網(wǎng)絡(luò)模型,說明其能夠有效進行滾動軸承故障識別。
為進一步驗證本文算法的優(yōu)越性,選取2個較為前沿的神經(jīng)網(wǎng)絡(luò)模型算法進行對比:1)通過短時傅里葉變換將一維軸承振動信號轉(zhuǎn)為時頻圖再輸入改進的深度殘差網(wǎng)絡(luò)(STFT-DRNN)模型;2)將一維軸承振動信號輸入由空洞卷積搭建的神經(jīng)網(wǎng)絡(luò)(FAC-CNN)模型。
由于實驗室軸承數(shù)據(jù)集的故障類型較少,3種網(wǎng)絡(luò)均取得了較好的故障識別率,因此在相同試驗條件下采用CWRU軸承數(shù)據(jù)集進行試驗。學習率為0.02,batch_size為32,迭代50次,試驗結(jié)果如圖9所示:MCK-CNN達到了99.25%的故障識別率,比FAC-CNN,STFT-DRNN分別高出1.50%和2.75%;另外,相對于同樣將軸承一維振動信號轉(zhuǎn)換為二維時頻圖的STFT-DRNN,MCK-CNN模型的訓練時間僅為其50.4%,極大縮短了模型訓練耗時;因此,本文所提MCK-CNN模型可以高效、準確地實現(xiàn)滾動軸承故障診斷。
建立了一種用于滾動軸承故障診斷的多卷積核特征提取自適應(yīng)融合的神經(jīng)網(wǎng)絡(luò)模型(MCK-CNN),并采用公開軸承數(shù)據(jù)集驗證了該方法在理論上和實際上的可行性。采用多種卷積核共同提取輸入信號特征時,由于每類卷積核的故障特征提取方式不同,側(cè)重點不同,可以更全面、充分的提取故障特征,自適應(yīng)融合則可以提高模型的訓練效率,從而高效、準確地實現(xiàn)滾動軸承的故障診斷,具備較好的實用性。