唐 波, 陳慎慎, 郭必奔, 郝家琦
(中國計(jì)量大學(xué) 計(jì)量測(cè)試工程學(xué)院,浙江 杭州 310018)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械的基礎(chǔ)零部件之一,其運(yùn)轉(zhuǎn)狀態(tài)直接影響整個(gè)機(jī)械設(shè)備的生產(chǎn)狀態(tài)[1],一旦滾動(dòng)軸承發(fā)生故障,輕則致使機(jī)械設(shè)備運(yùn)行不正常,重則導(dǎo)致設(shè)備停運(yùn)或生產(chǎn)事故,可能造成嚴(yán)重的經(jīng)濟(jì)損失。因此,對(duì)于滾動(dòng)軸承的狀態(tài)監(jiān)測(cè)與故障診斷顯得尤為重要[2,3]。傳統(tǒng)的智能診斷方法一般包括滾動(dòng)軸承的故障特征提取、特征選擇及分類器3個(gè)步驟。由于淺層診斷模型如支持向量機(jī)只適用于單工況下小樣本的滾動(dòng)軸承故障診斷,且需要相關(guān)診斷專家知識(shí)經(jīng)驗(yàn),易造成淺層算法應(yīng)用于滾動(dòng)軸承故障診斷時(shí)泛化性能不好,故障診斷率低。近年來,深度學(xué)習(xí)逐漸應(yīng)用于滾動(dòng)軸承的故障診斷,如Wang Jianyu等[4]將二維時(shí)頻特征輸入Alexnet模型中實(shí)現(xiàn)滾動(dòng)軸承故障診斷。但機(jī)器學(xué)習(xí)方法假設(shè)網(wǎng)絡(luò)模型的數(shù)據(jù)集分布一致,而滾動(dòng)軸承經(jīng)常工作于變工況下,因此采集的滾動(dòng)軸承信號(hào)的數(shù)據(jù)分布存在差異,加之大量的標(biāo)記樣本數(shù)據(jù)獲得代價(jià)昂貴,導(dǎo)致深度學(xué)習(xí)在滾動(dòng)軸承故障診斷中受到限制。而遷移學(xué)習(xí)是運(yùn)用已存有的知識(shí)對(duì)不同但相關(guān)領(lǐng)域問題進(jìn)行求解的一種新的機(jī)器學(xué)習(xí)方法[5]。雷亞國等[6]構(gòu)建領(lǐng)域共享的深度殘差網(wǎng)絡(luò),通過領(lǐng)域適配正則項(xiàng)約束,實(shí)現(xiàn)不同機(jī)械設(shè)備的滾動(dòng)軸承故障診斷。陳淑英等[7]利用少量目標(biāo)域已知樣本更新基礎(chǔ)變量預(yù)測(cè)模型,建立遷移變量預(yù)測(cè)模型實(shí)現(xiàn)滾動(dòng)軸承故障診斷。
基于遷移學(xué)習(xí)的故障診斷研究主要針對(duì)源域和目標(biāo)域中特征樣本進(jìn)行處理,通過算法選擇源域和目標(biāo)域中具有相同分布的樣本數(shù)據(jù),或?qū)㈩I(lǐng)域中數(shù)據(jù)映射至同一特征空間中,來實(shí)現(xiàn)遷移學(xué)習(xí)算法。上述遷移學(xué)習(xí)的故障診斷方法需要選擇合適特征映射空間,使得故障診斷模型復(fù)雜度增加,導(dǎo)致網(wǎng)絡(luò)模型故障診斷率低且易出現(xiàn)過擬合問題。本文提出一種遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(transfer learning con-volutional neural network,TCNN)方法。相較于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)故障診斷方法,微調(diào)經(jīng)遷移模型參數(shù)知識(shí)的CNN模型實(shí)現(xiàn)滾動(dòng)軸承故障的快速診斷,提高故障診斷效率和識(shí)別率。
CNN采用卷積層和池化層相結(jié)合的網(wǎng)絡(luò)基本結(jié)構(gòu),從輸入數(shù)據(jù)中自動(dòng)學(xué)習(xí)數(shù)據(jù)的層次特征,在最后輸出特征圖后接上全連接層和分類器實(shí)現(xiàn)準(zhǔn)確的分類。卷積神經(jīng)網(wǎng)絡(luò)一般包含卷積層、池化層和全連接層3層[8,9]。圖1是一個(gè)典型的2個(gè)卷積塊的卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
CNN中卷積層通過多個(gè)卷積核檢測(cè)輸入特征圖所有位置上的特定特征,卷積操作的一般形式為:
(1)
f(x)=max(0,x)
(2)
池化層對(duì)通過卷積層特征圖的不同位置的特征進(jìn)行聚合統(tǒng)計(jì),實(shí)現(xiàn)圖像從高層次到低層次的特征表達(dá)。最大池化是最常用的池化類型,得到輸入的最大值。
(3)
式中L為池化局部區(qū)域的長(zhǎng)度。
全連接層網(wǎng)絡(luò)對(duì)經(jīng)多個(gè)卷積和池化提取的特征進(jìn)行分類,輸入到Softmax分類器輸出分類結(jié)果。
xl=f(wLxL-1+bL)
(4)
式中:xL-1為展開的一維特征向量;wL為權(quán)重系數(shù)矩陣;bL為偏置項(xiàng)。
遷移學(xué)習(xí)應(yīng)用在故障診斷領(lǐng)域中的2個(gè)步驟為:1)源域數(shù)據(jù)預(yù)訓(xùn)練CNN模型,提取出共享故障特征信息;2)目標(biāo)域CNN模型進(jìn)行微調(diào)實(shí)驗(yàn)。遷移學(xué)習(xí)可實(shí)現(xiàn)預(yù)訓(xùn)練CNN模型較低層特征信息的遷移,微調(diào)目標(biāo)域CNN模型的更高隱含層實(shí)現(xiàn)數(shù)據(jù)集抽象特征的快速學(xué)習(xí)。
最大均值差異(maximum mean discrepancy,MMD)是衡量?jī)蓴?shù)據(jù)集分布差異的非參數(shù)距離指標(biāo),可度量源域數(shù)據(jù)到目標(biāo)域數(shù)據(jù)的可遷移性,以避免“負(fù)遷移”[10]。如果用Γ表示一個(gè)在樣本空間上的連續(xù)函數(shù)集,那么MMD定義為:
(5)
式中數(shù)據(jù)集x和y分別滿足概率分布p和q。
將兩數(shù)據(jù)集映射到可再生希爾伯特空間內(nèi)進(jìn)行MMD近似度量,可計(jì)算目標(biāo)域和源域數(shù)據(jù)輸入下的卷積神經(jīng)網(wǎng)絡(luò)模型輸出特征知識(shí)的概率分布差異[11]。其計(jì)算過程為:
(6)
基于TCNN的滾動(dòng)軸承故障診斷框架如圖2所示。首先,利用短時(shí)傅里葉變換(short time Fourier transform,STFT)處理滾動(dòng)軸承振動(dòng)信號(hào)得到時(shí)頻數(shù)據(jù)集;其次,微調(diào)經(jīng)遷移預(yù)訓(xùn)練模型參數(shù)知識(shí)的CNN模型實(shí)現(xiàn)滾動(dòng)軸承故障診斷。
圖2 基于遷移學(xué)習(xí)的CNN框架
1)源域和目標(biāo)域樣本集合獲取:對(duì)多工況的滾動(dòng)軸承振動(dòng)信號(hào)進(jìn)行STFT分析,得到源域和目標(biāo)域兩個(gè)時(shí)頻譜數(shù)據(jù)集合。
2)卷積神經(jīng)網(wǎng)絡(luò)模型預(yù)訓(xùn)練:將步驟(1)中的源域時(shí)頻譜數(shù)據(jù)集及其標(biāo)簽預(yù)訓(xùn)練CNN模型,并保存其網(wǎng)絡(luò)結(jié)構(gòu)。
3)遷移CNN模型微調(diào)實(shí)驗(yàn):將預(yù)訓(xùn)練好的CNN模型的參數(shù)知識(shí)對(duì)一新設(shè)置的CNN模型結(jié)構(gòu)進(jìn)行初始化,并設(shè)置全連接的權(quán)重及偏置進(jìn)行目標(biāo)域樣本集合的微調(diào)實(shí)驗(yàn),得到目標(biāo)域滾動(dòng)軸承時(shí)頻譜樣本集合的診斷結(jié)果。
滾動(dòng)軸承實(shí)驗(yàn)數(shù)據(jù)來自于2個(gè)不同的故障診斷實(shí)驗(yàn)臺(tái),一組軸承型號(hào)為SKF 6205的實(shí)驗(yàn)數(shù)據(jù),采用CWRU軸承實(shí)驗(yàn)裝置,包括電機(jī)、扭矩傳感器、功率計(jì)和電子控制設(shè)備,采樣頻率fs為12 kHz;另一組軸承型號(hào)為N/NU 205EM的實(shí)驗(yàn)數(shù)據(jù),采樣頻率為80 kHz。其中SKF 6205型號(hào)的滾動(dòng)軸承包括內(nèi)圈、外圈、滾動(dòng)體3類故障,不同缺陷直徑(0.18,0.36,0.54 mm)、不同負(fù)載(0,0.7,1.4,2.2 kW)等各種工況數(shù)據(jù)。而N/NU 20 5EM型號(hào)的滾動(dòng)軸承包括滾動(dòng)體故障(900 r/min)、外圈故障(1 200 r/min)及內(nèi)圈故障(1 500 r/min)數(shù)據(jù)。對(duì)數(shù)據(jù)集中的每類樣本以50%的重疊率進(jìn)行分割實(shí)現(xiàn)樣本集擴(kuò)容,如圖3所示。
圖3 數(shù)據(jù)集增強(qiáng)技術(shù)
對(duì)每個(gè)樣本(1 024點(diǎn))進(jìn)行STFT分析,經(jīng)PCA降維后(累計(jì)貢獻(xiàn)率為95%以上)將時(shí)頻矩陣reshape為64階矩陣。遷移學(xué)習(xí)故障診斷數(shù)據(jù)集詳細(xì)信息見表1。數(shù)據(jù)集A~D對(duì)應(yīng)0~2.2 kW負(fù)載下的正常、內(nèi)圈故障、外圈故障及滾動(dòng)體四類狀態(tài),加之不同缺陷共有10類故障合計(jì)4 000個(gè)樣本。數(shù)據(jù)集E為不同負(fù)載、不同缺陷滾動(dòng)軸承數(shù)據(jù)集共4 000個(gè)。數(shù)據(jù)集F為注入噪聲的不同負(fù)載、不同缺陷滾動(dòng)軸承數(shù)據(jù)集共4 000個(gè)。數(shù)據(jù)集G為軸承型號(hào)N/NU 205EM的數(shù)據(jù)集共計(jì)6 000個(gè)。
表1 遷移學(xué)習(xí)數(shù)據(jù)集
以滾動(dòng)軸承型號(hào)SKF6205的點(diǎn)蝕故障直徑為0.54 mm四類振動(dòng)信號(hào)為例,其時(shí)域波形圖如圖4所示,可以看出軸承不同狀態(tài)下的時(shí)域波形存在振幅差異,但正常軸承與外圈故障軸承的信號(hào)波形相近難以區(qū)分。
圖4 軸承振動(dòng)信號(hào)時(shí)域波形圖
隨機(jī)選擇數(shù)據(jù)集A中3200個(gè)訓(xùn)練樣本和800測(cè)試樣本,通過超參數(shù)實(shí)驗(yàn)確定CNN模型,實(shí)驗(yàn)結(jié)果如圖5所示。則數(shù)據(jù)集A預(yù)訓(xùn)練CNN故障診斷模型的損失函數(shù)經(jīng)7次達(dá)到收斂,最后識(shí)別率穩(wěn)定在99.75%。
圖5 預(yù)訓(xùn)練CNN模型
預(yù)訓(xùn)練CNN模型的參數(shù)知識(shí)遷移至目標(biāo)域,CNN模型的可遷移信息如表2所示。
表2 CNN參數(shù)設(shè)置
4.3.1 最大均值差異統(tǒng)計(jì)分析
為驗(yàn)證遷移學(xué)習(xí)微調(diào)實(shí)驗(yàn)的有效性,使用MMD分析源域數(shù)據(jù)集A與目標(biāo)域數(shù)據(jù)集B、C、D、E、F的分布差異。實(shí)驗(yàn)結(jié)果如圖6所示,其中A→B表示源域數(shù)據(jù)集A到目標(biāo)域數(shù)據(jù)集B的遷移診斷。
圖6 MMD統(tǒng)計(jì)分析
由圖6可見,CNN模型經(jīng)微調(diào)實(shí)驗(yàn)后,源域數(shù)據(jù)集與目標(biāo)域數(shù)據(jù)集的最大均值差異變小,說明遷移學(xué)習(xí)放寬機(jī)器學(xué)習(xí)中訓(xùn)練樣本集與測(cè)試樣本集滿足獨(dú)立同分布的條件,增強(qiáng)源域到目標(biāo)域的可遷移性,有利于CNN故障診斷分類。
4.3.2 目標(biāo)域微調(diào)數(shù)據(jù)量試驗(yàn)
為進(jìn)一步研究源域與目標(biāo)域數(shù)據(jù)量比例對(duì)CNN模型診斷性能的影響,進(jìn)行目標(biāo)域微調(diào)數(shù)據(jù)量實(shí)驗(yàn),結(jié)果如圖7示。
圖7 目標(biāo)域微調(diào)數(shù)據(jù)量試驗(yàn)
從圖7可見,隨著目標(biāo)域樣本數(shù)量的增加,TCNN模型診斷精度穩(wěn)步增加且趨于100%。即使目標(biāo)域樣本集很小時(shí),當(dāng)源域與目標(biāo)域樣本數(shù)據(jù)量比例為5:1,TCNN模型故障診斷的準(zhǔn)確率依然保持在98%以上。說明遷移學(xué)習(xí)方法打破機(jī)器學(xué)習(xí)中必須有足夠訓(xùn)練樣本的限制,使得少量標(biāo)簽數(shù)據(jù)訓(xùn)練TCNN模型也可具有良好的診斷精度。
4.3.3 遷移學(xué)習(xí)滾動(dòng)軸承故障診斷實(shí)驗(yàn)
使用數(shù)據(jù)集A預(yù)訓(xùn)練的CNN模型,分別實(shí)現(xiàn)對(duì)數(shù)據(jù)集G的故障類型識(shí)別和遷移故障診斷實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 遷移學(xué)習(xí)故障診斷結(jié)果對(duì)比圖
圖8中CNN模型故障識(shí)別率為92.45%,TCNN故障識(shí)別率為99.42%,基于遷移學(xué)習(xí)的故障診斷率提升了7%??梢?變工況或不同種類的滾動(dòng)軸承使得CNN模型的泛化性能受到影響,致使?jié)L動(dòng)軸承故障診斷率低于基于遷移學(xué)習(xí)的故障診斷方法。
為直觀分析TCNN的有效性,利用t-分布鄰域嵌入(t-distribution stochastic neighbor embedding,t-SNE)算法將2類方法提取的故障特征降維至二維平面以散點(diǎn)圖呈現(xiàn),如9所示。圖9(a)所示為利用數(shù)據(jù)集A預(yù)訓(xùn)練CNN模型可得到較高的故障診斷率,但是用該模型進(jìn)行不同種類的滾動(dòng)軸承故障診斷時(shí)的故障診斷率低。通過分析散點(diǎn)圖可知,由于提取數(shù)據(jù)集A的軸承故障特征與數(shù)據(jù)集G的軸承故障特征間存在較大分布差異,使得訓(xùn)練的CNN模型無法全面識(shí)別數(shù)據(jù)集G的各類狀態(tài)滾動(dòng)軸承樣本。而圖9(b)顯示,TCNN故障診斷方法在縮小了數(shù)據(jù)集A和數(shù)據(jù)集G的故障特征間的分布差異的同時(shí),增大數(shù)據(jù)集間故障特征的類間距離,提高故障診斷識(shí)別率。
圖9 故障診斷特征散點(diǎn)圖
為驗(yàn)證TCNN模型對(duì)于不同工況下滾動(dòng)軸承故障診斷的性能,對(duì)現(xiàn)有的7種滾動(dòng)軸承故障數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),如表3所示。表3中實(shí)驗(yàn)結(jié)果為10次實(shí)驗(yàn)的平均值,且遷移學(xué)習(xí)實(shí)驗(yàn)源域與目標(biāo)域數(shù)據(jù)集比例為1。通過全連接層權(quán)重的微調(diào)實(shí)驗(yàn)操作縮小因變工況、不同測(cè)試環(huán)境等因素引入的數(shù)據(jù)分布差異,以適應(yīng)滾動(dòng)軸承故障診斷的實(shí)際工程應(yīng)用需求。由表3實(shí)驗(yàn)診斷結(jié)果準(zhǔn)確率可知,滾動(dòng)軸承故障識(shí)別率均在99%以上,表明TCNN模型具有較高的故障診斷精度。
表3 遷移學(xué)習(xí)實(shí)驗(yàn)
為驗(yàn)證本文的TCNN模型較目前遷移學(xué)習(xí)的滾動(dòng)軸承故障診斷算法的識(shí)別性能的優(yōu)越性,將TCNN與文獻(xiàn)[7]遷移多變量預(yù)測(cè)模型模式識(shí)別(transfer variable predictive model based class discrim-inate,TVPMCD)方法、文獻(xiàn)[12]VGG模型、文獻(xiàn)[13]改進(jìn)聯(lián)合分配適應(yīng)方法(improved joint dis-tribution adaptation,IJDA)三種遷移算法進(jìn)行對(duì)比,對(duì)比實(shí)驗(yàn)的實(shí)驗(yàn)平臺(tái)為Windows 10,CPU采用Intel?CoreTMi5-4210,且采用相同的滾動(dòng)軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖10所示。
圖10 遷移學(xué)習(xí)診斷方法比較
從圖10中可知,基于VGG模型的遷移學(xué)習(xí)算法具有較高的診斷精確度,但由于VGG模型的復(fù)雜性導(dǎo)致故障識(shí)別分類時(shí)間較長(zhǎng)。而IJDA方法將源域和目標(biāo)域的數(shù)據(jù)映射到同一子空間中,致使遷移模型結(jié)構(gòu)的復(fù)雜化,導(dǎo)致該模型的故障識(shí)別分類時(shí)間也較高。雖然TVPMCD方法的診斷精度和分類時(shí)間均有較好表現(xiàn),但其本質(zhì)上是一種淺層結(jié)構(gòu)故障診斷方法,不適用于識(shí)別數(shù)據(jù)量大的樣本數(shù)據(jù)集。以其它3種方法作對(duì)比,本文的TCNN方法不僅故障識(shí)別準(zhǔn)確率最高,且具有最少的分類時(shí)間,綜合性能最優(yōu)。
本文提出一種基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)滾動(dòng)軸承故障診斷方法,實(shí)現(xiàn)滾動(dòng)軸承故障高效準(zhǔn)確的診斷。主要結(jié)論如下:1)創(chuàng)建多個(gè)變工況下的滾動(dòng)軸承數(shù)據(jù)集,利用遷移學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)滾動(dòng)軸承故障診斷。且通過MMD分析、源域與目標(biāo)域數(shù)據(jù)量比例微調(diào)實(shí)驗(yàn)驗(yàn)證,遷移學(xué)習(xí)方法克服了機(jī)器學(xué)習(xí)需要充足樣本數(shù)據(jù)量及其數(shù)據(jù)分布一致的缺陷。2)基于TCNN模型實(shí)現(xiàn)了兩類滾動(dòng)軸承故障診斷。相較與其它遷移學(xué)習(xí)方法,故障診斷精度高為99.8%,分類時(shí)間最少0.016 s,綜合性能最優(yōu)。