孫 巖, 彭高亮
(哈爾濱工業(yè)大學(xué) 機(jī)電工程學(xué)院, 哈爾濱 150001)
滾動(dòng)軸承在各類機(jī)電一體化設(shè)備中使用廣泛,由于工作過(guò)程中長(zhǎng)時(shí)間旋轉(zhuǎn)磨損、高溫等原因,軸承故障是常發(fā)故障之一. 軸承發(fā)生故障可能造成嚴(yán)重的經(jīng)濟(jì)損失或人員傷亡,因此提高診斷效率和準(zhǔn)確率十分重要. 軸承故障診斷方法經(jīng)歷了人工經(jīng)驗(yàn)判斷、信號(hào)時(shí)域分析[1]、頻域譜分析[2]、時(shí)頻域分析[3]、模態(tài)分析[4]等階段,目前應(yīng)用廣泛的方法有人工經(jīng)驗(yàn)判斷,如經(jīng)驗(yàn)豐富的工人通過(guò)聽(tīng)機(jī)器響動(dòng)判斷工作狀態(tài);時(shí)域指標(biāo)分析如峭度值、平滑指數(shù)、基尼指數(shù)等;頻域分析如傅里葉變換包絡(luò)分析;時(shí)頻域分析如短時(shí)傅里葉變換、小波變換、S變換等;模態(tài)分析即信號(hào)通過(guò)一定規(guī)則分解,得到模態(tài)分量后分析的方法,如EMD分解后包絡(luò)譜分析等. 目前,機(jī)電一體化產(chǎn)品日益增多,而傳統(tǒng)的故障診斷方法要求人員具有較高的經(jīng)驗(yàn)知識(shí),且需多指標(biāo)聯(lián)合分析后得出診斷結(jié)論,無(wú)法滿足自動(dòng)化診斷的需求.
隨著人工智能技術(shù)的發(fā)展,應(yīng)用決策樹(shù)[5]、支持向量機(jī)[6]、樸素貝葉斯[7]等機(jī)器學(xué)習(xí)手段開(kāi)展故障診斷日益增多,特別是以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)方法的使用,使故障診斷逐步走向智能化、自動(dòng)化. ZHANG Wei等[8]提出了一種基于一維深度卷積網(wǎng)絡(luò)的故障診斷模型,實(shí)現(xiàn)了基于一維卷積神經(jīng)網(wǎng)絡(luò)端到端的診斷模式;黃馳城[9]利用時(shí)頻變換和三種經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了二維卷積神經(jīng)網(wǎng)絡(luò)在軸承故障診斷中的應(yīng)用. 雖然一維、二維卷積神經(jīng)網(wǎng)絡(luò)均在故障診斷中取得了一定的效果,但存在神經(jīng)元輸入輸出采用標(biāo)量形式導(dǎo)致的細(xì)節(jié)特征提取不足,池化層丟失部分有用信息,較大規(guī)模網(wǎng)絡(luò)才能提取更詳細(xì)特征等一系列問(wèn)題,因此提出許多改進(jìn)方案. 本文采用的基礎(chǔ)膠囊網(wǎng)絡(luò)結(jié)構(gòu)由Hinton 等提出,主要思想為將神經(jīng)元標(biāo)量輸入輸出改為向量形式,網(wǎng)絡(luò)結(jié)構(gòu)保留空間位置等信息,舍棄池化層結(jié)構(gòu),從而實(shí)現(xiàn)更好的效果. Hinton 等提出的膠囊網(wǎng)絡(luò)特征提取部分僅采用單層卷積,在此基礎(chǔ)上楊平等[10]提出了雙卷積層膠囊網(wǎng)絡(luò)的診斷方法,相較于單卷積層取得了一定的改進(jìn),但雙卷積層膠囊網(wǎng)絡(luò)僅增加了一個(gè)卷積層,卷積層之間采用串聯(lián)式連接,沒(méi)有從原始圖像數(shù)據(jù)中進(jìn)一步提取特征,細(xì)節(jié)特征仍存在丟失,特征提取能力需進(jìn)一步優(yōu)化.
本文利用膠囊結(jié)構(gòu)的同時(shí),采用多尺度Inception結(jié)構(gòu),配合空間注意力機(jī)制,從原始圖像數(shù)據(jù)中,進(jìn)行多尺度的特征提取和關(guān)鍵信息的識(shí)別,配合損失值計(jì)算方法的優(yōu)化,達(dá)到更好的分類診斷效果,通過(guò)低信噪比實(shí)驗(yàn),證明了方法的適用性.
卷積神經(jīng)網(wǎng)絡(luò)特征提取過(guò)程主要由卷積結(jié)構(gòu)完成,采用共享卷積核的形式對(duì)輸入圖像或矩陣進(jìn)行局部卷積運(yùn)算,得到結(jié)果經(jīng)激活函數(shù)非線性化輸入下一層. 采用k×k卷積核的卷積過(guò)程公式為
式中:ai,j為輸出值,xi,j為第i行j列的元素,ωm,n為第m行n列的權(quán)重,參數(shù)b為偏置項(xiàng),f為激活函數(shù),常用的激活函數(shù)有sigmoid、tanh、Relu等,其中Relu函數(shù)表達(dá)式為
y=max(0,x).
式中y為輸出值,x為輸入值.
Relu函數(shù)為分段線性函數(shù),所有的負(fù)值和0輸出為0,所有的正值輸出原值不變,這種操作為單側(cè)抑制,實(shí)現(xiàn)稀疏后更好地挖掘相關(guān)特征,加速模型收斂.
2012年,AlexNet采用Relu激活函數(shù)、全局池化層、Dropout方式得到性能優(yōu)良的成果后,主流的網(wǎng)絡(luò)結(jié)構(gòu)突破大致是網(wǎng)絡(luò)更深(層數(shù)),但是純粹的增大網(wǎng)絡(luò)存在容易過(guò)擬合,計(jì)算復(fù)雜,梯度彌散等問(wèn)題. 為解決這些問(wèn)題,GoogleLeNet采用了Inception結(jié)構(gòu),初始V1結(jié)構(gòu)如圖1所示.
圖1 多尺度卷積結(jié)構(gòu)
Inception結(jié)構(gòu)[11]通過(guò)改深度增加為寬度增加的方法,解決梯度彌散等問(wèn)題,但寬度增加同樣增加了參數(shù)量,在后續(xù)的改進(jìn)過(guò)程中,V2和V3結(jié)構(gòu)均采用卷積核拆分的方式,V2采用3個(gè)3×3的卷積核代替7×7卷積,V3采用1×7和7×1卷積核代替7×7卷積,達(dá)到了減小網(wǎng)絡(luò)結(jié)構(gòu)的目的. Inception結(jié)構(gòu)展示了特征提取過(guò)程中,采用卷積核由小到大的方式可以提取更多的細(xì)節(jié)特征;多層卷積核通過(guò)激活函數(shù)的增多,非線性表達(dá)能力進(jìn)一步得到提高;寬度代替深度的增加可以避免一定的梯度彌散.
注意力機(jī)制模仿人觀察事物關(guān)注重點(diǎn)部位的特點(diǎn)[12],廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域. 空間注意力機(jī)制將原始圖像信息變換到另外一個(gè)空間,通過(guò)訓(xùn)練空間轉(zhuǎn)換模塊輸出與原信息的疊加實(shí)現(xiàn)關(guān)鍵信息的識(shí)別,空間轉(zhuǎn)換模塊采用類池化的方式,關(guān)注重點(diǎn)區(qū)域,與原圖像或矩陣的融合保證重點(diǎn)信息不丟失,其結(jié)構(gòu)如圖2所示.
圖2 空間注意力模塊
膠囊網(wǎng)絡(luò)的概念在2017年由Hinton提出,主要思想為將神經(jīng)元的輸入輸出由標(biāo)量形式改為向量形式,從而擁有空間位置特征提取能力,膠囊向量神經(jīng)元與普通標(biāo)量神經(jīng)元類比如圖3所示.
圖3 標(biāo)量與向量神經(jīng)元
向量神經(jīng)元與標(biāo)量神經(jīng)元主要區(qū)別在于輸入輸出數(shù)據(jù)的結(jié)構(gòu)形式,采用向量結(jié)構(gòu)具有更豐富的特征表達(dá)能力;神經(jīng)元之間采用動(dòng)態(tài)路由的方式進(jìn)行特征傳遞,通過(guò)相關(guān)性計(jì)算,特征得到很好的歸類,更加符合現(xiàn)實(shí)場(chǎng)景的需要;動(dòng)態(tài)路由每次迭代以0初始化參數(shù),參數(shù)規(guī)模得到了優(yōu)化,壓縮向量的尺度,保證了每一層向量神經(jīng)元之間權(quán)重的一致性. 算法過(guò)程如下:
1)初始化l層第i個(gè)膠囊和l+1層第j個(gè)膠囊間特征傳遞參數(shù)bi,j為0;
2)利用softmax方式計(jì)算兩層膠囊間權(quán)重ci,j,具體公式為
3)低層膠囊特征ui傳遞至高層膠囊,得到高層特征
sj=∑ci,j·ui;
4)壓縮高層膠囊特征,得到壓縮后的特征
5)迭代更新為
bi,j=bi,j+ui·vj.
動(dòng)態(tài)路由實(shí)現(xiàn)低層膠囊結(jié)構(gòu)與高層膠囊之間的向量式傳遞,通過(guò)二者標(biāo)量積來(lái)度量相關(guān)性,向量的模長(zhǎng)代表實(shí)體的存在性,構(gòu)建了空間位置等關(guān)鍵特征.
為提高膠囊網(wǎng)絡(luò)的特征提取能力,本文改進(jìn)膠囊網(wǎng)絡(luò)的單一卷積結(jié)構(gòu)為多尺度卷積Inception模塊和空間注意力模塊的結(jié)合體,構(gòu)建更加全面豐富、特征突出的特征提取單元,與初始膠囊結(jié)構(gòu)和數(shù)字膠囊結(jié)構(gòu)結(jié)合,提出了一種前端特征提取提升的改進(jìn)膠囊網(wǎng)絡(luò)SAP- CapsNets(Start ability promotion capsule network),其結(jié)構(gòu)如圖4所示.
圖4 改進(jìn)膠囊網(wǎng)絡(luò)
SAP-CapsNets輸入數(shù)據(jù)為振動(dòng)信號(hào)時(shí)頻分析(短時(shí)傅里葉變換)得到的二維時(shí)頻域數(shù)據(jù)(數(shù)組非圖像),網(wǎng)絡(luò)前端采用Inception結(jié)構(gòu)配合空間注意力模塊進(jìn)行特征提取,保證信息提取的充分性,同時(shí)具有較強(qiáng)的抗噪聲作用,特征采集作用明顯;后端采用膠囊結(jié)構(gòu)構(gòu)造向量神經(jīng)元,通過(guò)動(dòng)態(tài)路由實(shí)現(xiàn)特征傳遞;激活函數(shù)采用Relu函數(shù).
損失函數(shù)采用間隔損失和重構(gòu)損失結(jié)合計(jì)算總損失的方式,間隔損失表示為
Lk=Tk·(max(0,m)-‖vk‖)2+
λ·(1-Tk)·max(0,‖vk‖-m).
式中:k是分類數(shù),Tk是分類的指示函數(shù) (存在為 1,不存在為 0);m+為上界,懲罰假陽(yáng)性;m-為下界,懲罰假陰性;λ比例系數(shù),調(diào)整兩者比重.
重構(gòu)損失計(jì)算方法為膠囊層后構(gòu)造3層全連接層如圖5所示,得到與原數(shù)據(jù)數(shù)據(jù)點(diǎn)數(shù)相同的輸出值,計(jì)算原數(shù)據(jù)與輸出數(shù)據(jù)距離平方和,作為損失值.
總損失為間隔損失和λ倍重構(gòu)損失的和,λ平衡二者比重,取0.01左右.
圖5 重構(gòu)結(jié)構(gòu)
為驗(yàn)證方法模型的效果,采用凱斯西儲(chǔ)大學(xué)軸承公開(kāi)數(shù)據(jù)集. 軸承的損傷為電火花加工的單點(diǎn)損傷,人工制造故障的方式,故障特征相對(duì)實(shí)際工況明顯,故本文采用人工降低信號(hào)信噪比的方法,模擬噪聲工況環(huán)境,開(kāi)展實(shí)驗(yàn)分析. 數(shù)據(jù)為原始數(shù)據(jù)12 kHz采樣頻率下的驅(qū)動(dòng)端軸承故障,包含1 797、1 772、1 750和1 730 r/min這4種轉(zhuǎn)速數(shù)據(jù);軸承狀態(tài)為健康、內(nèi)圈故障、滾動(dòng)體故障和外圈故障.
深度學(xué)習(xí)網(wǎng)絡(luò)參數(shù)量大,需大樣本數(shù)據(jù)驅(qū)動(dòng)得到模型,且軸承數(shù)據(jù)集中正常狀態(tài)相對(duì)其他故障狀態(tài)的樣本較少,樣本存在不均衡問(wèn)題. 因此本文采用單個(gè)數(shù)據(jù)文件重復(fù)采樣的方式減小樣本間的不平衡問(wèn)題. 本文實(shí)驗(yàn)中采用單個(gè)數(shù)據(jù)文件中單次選取6 000個(gè)點(diǎn),每次向后移動(dòng)500個(gè)點(diǎn)的形式進(jìn)行采樣,采樣后數(shù)據(jù)進(jìn)行時(shí)頻變換(短時(shí)傅里葉變換[13]),由一維數(shù)據(jù)變換為二維數(shù)據(jù),短時(shí)傅里葉變換公式為
( 8 )
式中:f和g為信號(hào)和窗函數(shù),輸出結(jié)果S為時(shí)頻域數(shù)據(jù),自變量為時(shí)間,變量ω為頻率,變量τ為移動(dòng)窗口設(shè)置量.
變換二維后,為避免數(shù)據(jù)轉(zhuǎn)圖像格式容易出現(xiàn)格式轉(zhuǎn)換誤差的問(wèn)題,本文將數(shù)據(jù)直接按數(shù)組形式保存使用,不轉(zhuǎn)換圖像類型,避免格式在轉(zhuǎn)換過(guò)程中引起的原始數(shù)據(jù)特征損失. 樣本分布情況如表1所示.
表1 數(shù)據(jù)樣本類型分布
為驗(yàn)證模型的優(yōu)劣性,采用雙卷積膠囊網(wǎng)絡(luò)和傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)[14]作為對(duì)比分析,二者結(jié)構(gòu)如圖6、7所示.
圖6 雙卷積層膠囊網(wǎng)絡(luò)
圖7 卷積神經(jīng)網(wǎng)絡(luò)
模型均采用Relu激活函數(shù);雙卷積膠囊網(wǎng)絡(luò)將傳統(tǒng)膠囊結(jié)構(gòu)單卷積層擴(kuò)展為雙卷積層,結(jié)合了卷積網(wǎng)絡(luò)和膠囊網(wǎng)絡(luò)的特點(diǎn);傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)為適應(yīng)時(shí)頻變換后的數(shù)據(jù)結(jié)構(gòu),采用了一個(gè)4×3卷積核,通過(guò)卷積和池化的方式,逐層特征提取和壓縮.
樣本按8∶2的比例隨機(jī)劃分訓(xùn)練集和驗(yàn)證集. 訓(xùn)練過(guò)程采用未做處理的原始信號(hào)二維數(shù)據(jù). 3種方法均采用Adam優(yōu)化方法,學(xué)習(xí)率0.001,訓(xùn)練時(shí)單次讀入數(shù)據(jù)量batch_size為50,全部樣本迭代次數(shù)epoch設(shè)置為20,均運(yùn)行3次取平均結(jié)果,改進(jìn)膠囊網(wǎng)絡(luò)(SAP-CapsNets)、雙卷積神經(jīng)網(wǎng)絡(luò)(CNN-CapsNets)和傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)(CNN)3種模型訓(xùn)練結(jié)果如表2所示.
表2 模型訓(xùn)練結(jié)果
從表2中可得,改進(jìn)膠囊網(wǎng)絡(luò)在模型訓(xùn)練時(shí)間上沒(méi)有明顯的增加,訓(xùn)練集正確率有了一定的提升.
驗(yàn)證過(guò)程首先采用未做處理的驗(yàn)證集數(shù)據(jù)試驗(yàn),3個(gè)模型驗(yàn)證集準(zhǔn)確率分別為98.2%、96.2%和95.1,從驗(yàn)證集結(jié)果看,模型均達(dá)到了訓(xùn)練效果.
采用添加不同幅值高斯白噪聲,降低信噪比的方式,對(duì)訓(xùn)練集和驗(yàn)證集進(jìn)行處理,信噪比公式為
R=10 lg(Ps/Pn).
式中Ps為信號(hào)有效功率,Pn為噪聲功率,R為信噪比.
相同坐標(biāo)下,降低西儲(chǔ)大學(xué)軸承數(shù)據(jù)集中的內(nèi)圈故障信號(hào)信噪比,信號(hào)時(shí)域圖變化如圖8所示.
圖8 不同信噪比狀態(tài)(原始、-1、-2、-3dB)時(shí)域圖
統(tǒng)計(jì)圖8中幾種不同信噪比狀態(tài)信號(hào),統(tǒng)計(jì)指標(biāo)使用敏感度較高的時(shí)域峭度值[15]、方差、歪度,結(jié)果如表3所示.
表3 不同信噪比狀態(tài)時(shí)域指標(biāo)
采用希爾伯特變換構(gòu)造4種狀態(tài)下信號(hào)的解析函數(shù),得到包絡(luò)信號(hào),求解包絡(luò)譜[16],觀察信噪比調(diào)整過(guò)程中信號(hào)頻域的幅值變化情況,得到包絡(luò)譜如圖9所示.
從時(shí)域指標(biāo)統(tǒng)計(jì)和包絡(luò)譜圖信號(hào)幅值變換情況分析得出,信噪比降低后信號(hào)的時(shí)域、頻域變化較大,噪聲嚴(yán)重影響了原始信號(hào)本身的特征,采用簡(jiǎn)單的分析方法,難以直接提取故障特征和判斷故障類型.
圖9 幾種信噪比信號(hào)包絡(luò)譜
采用上文正常信噪比信號(hào)為訓(xùn)練集樣本,訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)、雙卷積膠囊網(wǎng)絡(luò)和改進(jìn)膠囊網(wǎng)絡(luò)3個(gè)模型,輸入調(diào)整3種不同信噪比的數(shù)據(jù)作為診斷驗(yàn)證集,模型的診斷情況如圖10.
圖10 幾種信噪比驗(yàn)證集正確率
從圖10可以看出SAP-CapsNets具有一定的抗噪能力,在信噪比-3 dB的情況下,仍能達(dá)到80%以上的正確率,相比雙卷積層膠囊網(wǎng)絡(luò)和傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)能達(dá)到更好的特征提取和故障診斷效果.
為進(jìn)一步驗(yàn)證改進(jìn)方法的效果,訓(xùn)練集數(shù)據(jù)直接采用降低信噪比后數(shù)據(jù),將-1、-2、-3 dB數(shù)據(jù)混合作為訓(xùn)練集樣本,模型訓(xùn)練過(guò)程正確率71%,驗(yàn)證集采用正常信噪比數(shù)據(jù)正確率為64%,模型結(jié)果較差. 分析原因后認(rèn)為:直接采用低信噪比數(shù)據(jù)訓(xùn)練模型,受噪聲影響,訓(xùn)練時(shí)模型未能準(zhǔn)確學(xué)習(xí)軸承故障主要特征,因此對(duì)正常信噪比數(shù)據(jù)分類正確率仍較低. 采用正常信噪比數(shù)據(jù)開(kāi)展訓(xùn)練,以低信噪比數(shù)據(jù)進(jìn)行驗(yàn)證的方式,具有更好的效果,且當(dāng)前可用實(shí)際工況數(shù)據(jù)較少,研究實(shí)驗(yàn)室信噪比條件下模型訓(xùn)練,逐步遷移至實(shí)際工況的意義更加明顯.
本文提出了一種前端特征提取模塊提升的膠囊網(wǎng)絡(luò)模型(SAP-CapsNets),實(shí)驗(yàn)對(duì)比在噪聲環(huán)境下的特征提取能力,實(shí)驗(yàn)結(jié)果表明:
1) 噪聲環(huán)境影響信號(hào)的整體指標(biāo),深度學(xué)習(xí)模型識(shí)別效果同樣受到嚴(yán)重影響.
2) 相比雙卷積層膠囊網(wǎng)絡(luò),本文改進(jìn)膠囊網(wǎng)絡(luò)通過(guò)Inception模塊和空間注意力模塊的結(jié)合,起到抗噪和特征提取能力提升的作用,模型穩(wěn)定性和泛化能力更好.
3) 本文提出的模型還需進(jìn)一步優(yōu)化,在實(shí)驗(yàn)中模型各層參數(shù)經(jīng)過(guò)調(diào)整,才取得了較好的結(jié)果,后續(xù)進(jìn)一步優(yōu)化分析,提高模型參數(shù)選擇的穩(wěn)定性和通用性.