姜 山,封松林,吳 波,王文瑞,魯方林,袁曉兵
(1.中國(guó)科學(xué)院 上海高等研究院,上海 201210;2.中國(guó)科學(xué)院大學(xué),北京 100049;3.中國(guó)科學(xué)院 上海微系統(tǒng)與信息技術(shù)研究所 無(wú)線(xiàn)傳感網(wǎng)與通信重點(diǎn)實(shí)驗(yàn)室,上海 200050)
軸承作為機(jī)械設(shè)備的旋轉(zhuǎn)核心,廣泛地使用在各種旋轉(zhuǎn)機(jī)械設(shè)備中。對(duì)軸承故障診斷的研究一直都是學(xué)者的研究重點(diǎn),一般故障診斷方法可以分為:基于搭建故障模型的方法、基于故障信號(hào)處理的方法、基于故障診斷知識(shí)的方法和多方法混合的方法[1,2]。其中,傳統(tǒng)基于故障模型搭建和故障信號(hào)處理的診斷方法,如小波變換[3]、短時(shí)傅里葉變換[4,5]、經(jīng)驗(yàn)?zāi)J椒纸猓?~8]、支持向量機(jī)[9,10]等,要求通過(guò)構(gòu)建數(shù)學(xué)模型來(lái)探索故障類(lèi)型與故障現(xiàn)象之間的關(guān)聯(lián),隨著機(jī)械裝備不斷向大型化和精細(xì)化方向發(fā)展,這種傳統(tǒng)的方法[11]逐漸難以勝任診斷任務(wù)的要求。
深度學(xué)習(xí)算法由于其強(qiáng)大的特征提取能力,在故障診斷領(lǐng)域引起廣泛的關(guān)注[12,13]。但傳統(tǒng)深度學(xué)習(xí)算法需要大量數(shù)據(jù)訓(xùn)練模型,而軸承數(shù)據(jù)天然分布不均,帶標(biāo)簽的異常數(shù)據(jù)十分稀缺。針對(duì)上述問(wèn)題,遷移學(xué)習(xí)技術(shù)被應(yīng)用在軸承故障診斷上[14]。趙宇凱等人[15]提出的基于VGG16網(wǎng)絡(luò)的遷移學(xué)習(xí)算法,通過(guò)ImageNet數(shù)據(jù)集作為源域數(shù)據(jù)對(duì)VGG16網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,保存預(yù)訓(xùn)練后的網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)用于對(duì)軸承故障數(shù)據(jù)進(jìn)行分類(lèi);張根保等人[16]利用棧式稀疏編碼器進(jìn)行特征提取,利用SoftMax 函數(shù)進(jìn)行分類(lèi),最終只需利用少量樣本即可調(diào)整模型,完成變工況故障診斷;Yang B等人[17]提出一種利用遷移學(xué)習(xí)方法進(jìn)行軸承故障診斷的方法,通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行遷移,同時(shí)添加正則項(xiàng),最終實(shí)現(xiàn)了在缺乏數(shù)據(jù)的情況下訓(xùn)練可靠模型;Wen L 等人[18]在稀疏自編碼器中加入最大均值差異(maximum mean discrepancy,MMD)以衡量源域和目標(biāo)域的相似程度,泛化模型在變工況下的有效性。
本文針對(duì)單一帶標(biāo)簽軸承故障數(shù)據(jù)稀缺,但物聯(lián)網(wǎng)技術(shù)可以采集多源異構(gòu)軸承故障數(shù)據(jù)的現(xiàn)象[19],提出一種基于并行網(wǎng)絡(luò)多尺度特征融合的軸承診斷方法:首先,獲取不同視角下采集的軸承振動(dòng)數(shù)據(jù),分別作為并行網(wǎng)絡(luò)的輸入;其次,利用遷移學(xué)習(xí)理論,通過(guò)預(yù)訓(xùn)練、微調(diào)的方式,分別獲取針對(duì)不同視角數(shù)據(jù)的遷移網(wǎng)絡(luò)模型,且將遷移網(wǎng)絡(luò)并行布置,得到并行網(wǎng)絡(luò)結(jié)構(gòu);再次,對(duì)并行網(wǎng)絡(luò)提取的中間特征進(jìn)行多尺度特征融合,用融合后特征訓(xùn)練分類(lèi)神經(jīng)網(wǎng)絡(luò);最后,通過(guò)測(cè)試集數(shù)據(jù)對(duì)訓(xùn)練的網(wǎng)絡(luò)進(jìn)行測(cè)試,驗(yàn)證網(wǎng)絡(luò)的準(zhǔn)確性。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[20~22]是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一,其通常由卷積層、激活層、池化層和全連接層組成,結(jié)構(gòu)見(jiàn)圖1。
圖1 CNN示意
卷積運(yùn)算的數(shù)學(xué)模型為
式中 xl為第l 層卷積層的輸入特征,wl為第l 層卷積核對(duì)應(yīng)的權(quán)重,bl為偏置,xl+1為第l層卷積運(yùn)算的輸出特征,同時(shí)也是第l +1層的輸入特征。
本文采用ReLU函數(shù)作為激活函數(shù)[23],激活層表達(dá)式如下
式中 f(·)為ReLU 激活運(yùn)算,yl+1為經(jīng)過(guò)激活后新的輸出特征,xl+1為上層輸入特征。
本文采用最大池化[24],表達(dá)式如下
式中 yl+1為激活層輸出的特征圖;x,y 為池化窗起始坐標(biāo);L,W為池化窗的長(zhǎng)和寬;pl+1為池化窗范圍內(nèi)取得的最大值。
全連接層最后輸出等于分類(lèi)數(shù)量的結(jié)果,公式見(jiàn)下
式中 fc為全連接層最終輸出,c 為第c 類(lèi)分類(lèi),c =1,2,…,C;input為全連接層輸入。
通過(guò)SoftMax函數(shù)得出不同分類(lèi)出現(xiàn)的概率公式如下
式中 Pc為經(jīng)過(guò)SoftMax函數(shù)后第c類(lèi)對(duì)應(yīng)概率。
本文選用VGG16網(wǎng)絡(luò)作為并行網(wǎng)絡(luò)支路的組成網(wǎng)絡(luò),表1為VGG16網(wǎng)絡(luò)詳細(xì)結(jié)構(gòu)。
表1 VGG16 網(wǎng)絡(luò)結(jié)構(gòu)
本文采用遷移學(xué)習(xí)中的模型遷移方法,采用預(yù)訓(xùn)練—微調(diào)操作,先在大數(shù)據(jù)集上對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行充分預(yù)訓(xùn)練,然后將預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)局部或者完整結(jié)構(gòu)及參數(shù)遷移至新任務(wù)情景中實(shí)現(xiàn)“知識(shí)”遷移;再用目標(biāo)域數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行參數(shù)微調(diào),獲得更匹配目標(biāo)數(shù)數(shù)據(jù)分布的網(wǎng)絡(luò)。由于神經(jīng)網(wǎng)絡(luò)淺層結(jié)構(gòu)用于提取圖像的通用特征,基于預(yù)訓(xùn)練—微調(diào)的模型遷移方法可以節(jié)約大量用于訓(xùn)練網(wǎng)絡(luò)淺層結(jié)構(gòu)的數(shù)據(jù)。
如圖2所示,本文并行網(wǎng)絡(luò)結(jié)構(gòu)由2 條遷移VGG16 卷積網(wǎng)絡(luò)并行組成,遷移VGG16 網(wǎng)絡(luò)均采用預(yù)訓(xùn)練—微調(diào)的模型遷移方法獲得。首先,利用自然圖像數(shù)據(jù)集ImageNet對(duì)VGG16網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,然后,用連續(xù)小波變換(continuous wavelet transform,CWT)處理1D 信號(hào)所獲取時(shí)頻圖PCWT微調(diào)支路1網(wǎng)絡(luò)參數(shù),用直接截取的軸承振動(dòng)監(jiān)控波形圖Pwave微調(diào)支路2 網(wǎng)絡(luò)參數(shù)。完成預(yù)訓(xùn)練—微調(diào)的遷移VGG16網(wǎng)絡(luò)模型分別提取軸承故障數(shù)據(jù)的中間特征fVGG16—CWT,fVGG16—wave。式(6)、式(7)為所提取特征的表達(dá)式
圖2 并行遷移VGG16 網(wǎng)絡(luò)結(jié)構(gòu)
式中 fVGG16—CWT,fVGG16—wave為2條支路分別提取的故障數(shù)據(jù)中間特征;PCWT,Pwave為并行神經(jīng)網(wǎng)絡(luò)不同分支的輸入數(shù)據(jù);ImageNet 為遷移學(xué)習(xí)的源域數(shù)據(jù)集,fc1 為最終輸出特征的網(wǎng)絡(luò)層次。
本文提出一種多尺度特征融合方法。如圖3(a)所示,首先,將并行CNN提取出的中間特征進(jìn)行拼接,獲取聯(lián)合特征fjoint。然后,對(duì)拼接特征fjoint分別進(jìn)行1 ×1、3 ×1、5 ×1卷積以及3 ×1池化操作;通過(guò)1 ×1 卷積操作獲取特征的非稀疏表達(dá),通過(guò)3 ×1 和5 ×1 卷積獲取特征不同尺度的稀疏特征,通過(guò)3 ×1池化獲取局部寬尺度特征。經(jīng)過(guò)上述多尺度采樣操作,獲取最終融合特征ffusion。式(8)、式(9)為聯(lián)合特征fjoint和融合特征ffusion表達(dá)式
圖3 特征融合模塊和分類(lèi)模塊
式中 fn(fjoint)為第n路子結(jié)構(gòu)對(duì)拼接特征fjoint進(jìn)行特征提取后所得子特征;n為子結(jié)構(gòu)總數(shù)量;n =1,2,3,4。
分類(lèi)模塊第一層為全連接層輸入層,直接取特征融合模塊輸出的最終融合特征;經(jīng)過(guò)全連接網(wǎng)絡(luò)后輸入SoftMax層得到最終分類(lèi)結(jié)果。為了增強(qiáng)分類(lèi)模模塊的泛化能力,在分類(lèi)模塊的全連接層與全連接層、全連接層與SoftMax層之間添加Dropout層以及ReLU層。圖3(b)為分類(lèi)模塊結(jié)構(gòu)。
1)獲取軸承不同視角振動(dòng)信號(hào);2)對(duì)輸入網(wǎng)絡(luò)的數(shù)據(jù)進(jìn)行預(yù)處理,如信號(hào)采樣、獲取信號(hào)時(shí)頻圖、波形圖等;3)將預(yù)處理后數(shù)據(jù)分別輸入并行VGG16網(wǎng)絡(luò),獲得對(duì)應(yīng)的特征輸出fVGG16—CWT,fVGG16—wave;4)將步驟(3)所得特征輸入特征融合模塊,輸出融合特征向量;5)利用融合特征訓(xùn)練分類(lèi)模塊,直至模型最終收斂;6)驗(yàn)證融合模型,用測(cè)試集數(shù)據(jù)驗(yàn)證模型檢測(cè)準(zhǔn)確性。上述診斷步驟如圖4。
圖4 故障診斷流程
本文采用凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)軸承數(shù)據(jù)中心提供的軸承測(cè)試數(shù)據(jù)集作為實(shí)驗(yàn)訓(xùn)練集。該數(shù)據(jù)集中一共設(shè)置了3 種類(lèi)型的故障類(lèi)型,分別為軸承內(nèi)圈故障(inner-ring fault,IF)、外圈故障(outerring fault,OF)和球體故障(sphere fault,SF),同時(shí)也采集了無(wú)故障(NO)數(shù)據(jù),每種故障分別用電火花加工出0.007,0.014,0.021,0.028 in(1in =2.54 cm)4 種不同的故障直徑,共有12種故障,此12種故障分別用0,1,2,3 hp驅(qū)動(dòng)力進(jìn)行驅(qū)動(dòng)。
驅(qū)動(dòng)電機(jī)轉(zhuǎn)速取值范圍為1 730 ~1 797 r/min,信號(hào)采樣率為12 kS/s,為保證輸入信號(hào)至少包含一個(gè)完整的軸承旋轉(zhuǎn)周期,每個(gè)取樣窗中至少包含400(12 000/1 797 ×60 =400.7)個(gè)采樣點(diǎn);考慮到信號(hào)邊緣的無(wú)效區(qū)域,為了增強(qiáng)信號(hào)魯棒性,最終采用1 024 個(gè)采樣點(diǎn)作為一個(gè)訓(xùn)練樣本,相鄰的樣本之間取50%的重疊采樣率;在最終獲取的所有樣本集中隨機(jī)選取50%作為訓(xùn)練集,其余作為測(cè)試集。
本文設(shè)計(jì)實(shí)驗(yàn)針對(duì)2 種軸承故障情況進(jìn)行驗(yàn)證,情況1,同樣的軸承故障尺寸,不同的故障位置;情況2,同樣故障位置,不同的故障尺寸。圖5 為不同情況下軸承故障數(shù)據(jù)圖像。其中,第1行為正常軸承數(shù)據(jù),左側(cè)為采集的軸承振動(dòng)波形,右側(cè)為對(duì)應(yīng)的CWT時(shí)頻圖;第2 行為2 hp驅(qū)動(dòng)下不同軸承故障位置對(duì)應(yīng)的故障數(shù)據(jù),上部數(shù)據(jù)為振動(dòng)波形,下部數(shù)據(jù)為對(duì)應(yīng)的時(shí)頻圖,從左到右依次為軸承IF、SF和OF;第3行為2 hp驅(qū)動(dòng)下不同尺寸的軸承IF,從左到右依次對(duì)應(yīng)0.007,0.014,0.021 in 大小故障,同樣上層數(shù)據(jù)為軸承振動(dòng)波形圖,下側(cè)數(shù)據(jù)為對(duì)應(yīng)時(shí)頻圖。
圖5 軸承故障數(shù)據(jù)
本文中設(shè)計(jì)表2結(jié)構(gòu)的CNN作為對(duì)照模型,設(shè)振動(dòng)波形數(shù)據(jù)輸入對(duì)照CNN組為實(shí)驗(yàn)1,時(shí)頻圖輸入對(duì)照CNN組為實(shí)驗(yàn)2;同時(shí)設(shè)遷移VGG16網(wǎng)絡(luò)分別輸入振動(dòng)波形圖和時(shí)頻圖作為實(shí)驗(yàn)3 和實(shí)驗(yàn)4;設(shè)并行網(wǎng)絡(luò)結(jié)構(gòu)但不進(jìn)行多尺度特征融合為實(shí)驗(yàn)5;設(shè)并行網(wǎng)絡(luò)結(jié)構(gòu)及多尺度特征融合為實(shí)驗(yàn)6。每組實(shí)驗(yàn)分別針對(duì)情況1 和情況2 進(jìn)行驗(yàn)證。
表2 對(duì)照CNN結(jié)構(gòu)
表3記錄情況1和情況2下各組實(shí)驗(yàn)最終收斂所需迭代輪數(shù)和最終收斂準(zhǔn)確率。由于各組實(shí)驗(yàn)收斂輪數(shù)相差較多,故只取前50輪迭代準(zhǔn)確率,如圖6。
表3 實(shí)驗(yàn)結(jié)果
圖6 情況1 和情況2 下各組實(shí)驗(yàn)50 輪迭代準(zhǔn)確率
由表3和圖6(a)可得情況1 結(jié)果:實(shí)驗(yàn)6 為最終提出算法,經(jīng)實(shí)驗(yàn)驗(yàn)證只需經(jīng)過(guò)約11 輪迭代即可收斂于99.6%的準(zhǔn)確率。由表3和圖6(b)可得,實(shí)驗(yàn)6驗(yàn)證本文所提算法,最終以最快的收斂速度取得最高的準(zhǔn)確率。
從6組實(shí)驗(yàn)結(jié)果中可以得出:1)無(wú)論是振動(dòng)波形圖數(shù)據(jù)還是時(shí)頻圖數(shù)據(jù),均包含可供神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的故障特征。2)實(shí)驗(yàn)5驗(yàn)證并行遷移VGG16 網(wǎng)絡(luò)提取特征直接拼接進(jìn)行故障診斷方法效果,結(jié)果證明,在2種情況下其最終診斷準(zhǔn)確率均要高于單一神經(jīng)網(wǎng)絡(luò)模型。值得注意的是:在情況1下,雖然實(shí)驗(yàn)5收斂準(zhǔn)確率最高,但其前期收斂速度慢于實(shí)驗(yàn)4,而在情況2下,實(shí)驗(yàn)5 收斂速度和準(zhǔn)確率均高于實(shí)驗(yàn)3和實(shí)驗(yàn)4,表明并行網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)于單一神經(jīng)網(wǎng)絡(luò)可以對(duì)故障進(jìn)行更多角度的表征。但從不同故障數(shù)據(jù)處理方法中提取的特征并不一定正相關(guān),如果提取的兩個(gè)特征起始相關(guān)性不強(qiáng),融合模型初始表現(xiàn)并不一定會(huì)優(yōu)于單獨(dú)神經(jīng)網(wǎng)絡(luò)的表現(xiàn)。3)實(shí)驗(yàn)6 驗(yàn)證本文提出的算法效果,主要與實(shí)驗(yàn)5進(jìn)行對(duì)比可以發(fā)現(xiàn):加入多尺度特征融合模塊后,其網(wǎng)絡(luò)模型在2種情況下表現(xiàn)均優(yōu)于實(shí)驗(yàn)5,證明多尺度特征融合方法可以更好地提取包含在單一網(wǎng)絡(luò)模型提取出特征中的有效信息,通過(guò)更多角度、更多尺度的故障特征表征。
通過(guò)實(shí)驗(yàn)得到如下結(jié)論:1)直接采集的振動(dòng)信號(hào)數(shù)據(jù)和監(jiān)視器屏幕截圖數(shù)據(jù),可以提取出有用的故障特征并應(yīng)用于軸承的故障分類(lèi),從而減少了對(duì)數(shù)據(jù)處理先驗(yàn)經(jīng)驗(yàn)的依賴(lài)、也減少了人為處理數(shù)據(jù)造成的有效數(shù)據(jù)丟失。2)利用并行CNN結(jié)構(gòu),同步提取不同視角下軸承故障數(shù)據(jù)中的中間特征;設(shè)計(jì)多尺度特征提取模塊,獲取對(duì)多視角特征的多尺度表達(dá),實(shí)現(xiàn)對(duì)故障特征進(jìn)行大尺度的全局解釋和小尺度的局部特征高精度解釋?zhuān)@取更好的故障特征表征。
3)針對(duì)軸承故障的不同分布,設(shè)計(jì)不同的實(shí)驗(yàn)進(jìn)行驗(yàn)證,多角度驗(yàn)證本文算法的故障診斷能力。