黃曉玲, 周 磊, 張德平
1(南京航空航天大學(xué) 計算機科學(xué)與技術(shù)學(xué)院, 南京 211106)
2(北京中船信息科技有限公司, 北京 100044)
滾動軸承是旋轉(zhuǎn)機械中易發(fā)故障的零件. 在旋轉(zhuǎn)機械中由軸承損壞引起的故障約占30%. 因此, 滾動軸承故障診斷對旋轉(zhuǎn)機械設(shè)備的狀態(tài)監(jiān)測與維護(hù)有著重要意義[1].
傳統(tǒng)的機器學(xué)習(xí)故障診斷方法流程包括: 數(shù)據(jù)獲取, 人工設(shè)計特征, 特征提取和選擇, 分類器訓(xùn)練. 然而,在數(shù)據(jù)預(yù)處理階段, 機器學(xué)習(xí)故障診斷存在一定的局限性: 為復(fù)雜操作條件下的數(shù)據(jù)人工設(shè)計特征需要耗費大量人力, 并且嚴(yán)重依賴領(lǐng)域?qū)I(yè)知識, 難度較高.此外, 特征挖掘和決策是分開設(shè)計的, 這種不同步的優(yōu)化將消耗大量時間并限制模型的性能.
作為機器學(xué)習(xí)的一個分支, 深度學(xué)習(xí)方法旨在構(gòu)建非線性轉(zhuǎn)換的深度神經(jīng)網(wǎng)絡(luò), 挖掘數(shù)據(jù)深層特征. 與傳統(tǒng)數(shù)據(jù)驅(qū)動的機器學(xué)習(xí)方法相比, 深度學(xué)習(xí)無需大量專業(yè)知識即可自動從原始輸入的簡單表示中學(xué)習(xí)到隱藏的高級層次特征, 是一種端到端的模型. 基于這些優(yōu)點, 深度學(xué)習(xí)在過去幾年中引發(fā)了智能故障診斷的浪潮. 陳志剛等[2]提出一種改進(jìn)集成深層自編碼器方法, 設(shè)計了3種小波卷積自編碼器對軸承振動信號進(jìn)行無監(jiān)督預(yù)訓(xùn)練和有監(jiān)督微調(diào), 最后, 為保證診斷結(jié)果的準(zhǔn)確性和穩(wěn)定性, 用加權(quán)平均法輸出診斷結(jié)果. 楊平等[3]基于卷積膠囊網(wǎng)絡(luò), 使用帶有兩個卷積層的卷積網(wǎng)絡(luò)直接對原始一維時域信號進(jìn)行特征提取, 然后將其送入膠囊網(wǎng)絡(luò), 輸出故障診斷結(jié)果. 周陳林等[4]基于提出的改進(jìn)型卷積神經(jīng)網(wǎng)絡(luò)設(shè)計基本準(zhǔn)則, 挖掘原始信號的特征, 直接用卷積神經(jīng)網(wǎng)絡(luò)在滾動軸承原始振動信號上進(jìn)行“端到端”的學(xué)習(xí)訓(xùn)練. Ramu等[5]提出一種基于希爾伯特變換和人工神經(jīng)網(wǎng)絡(luò)的電機故障診斷方法, 首先提取信號的幅值和頻率成分, 然后以最小均方誤差為優(yōu)化目標(biāo), 訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)對故障的高精度識別. Li等[6]通過小波包變換, 將小波包系數(shù)轉(zhuǎn)化為矩陣形式進(jìn)而轉(zhuǎn)化為像素, 形成灰度圖輸入到二維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行故障診斷.
在實際工業(yè)環(huán)境中, 不同的工作負(fù)載會導(dǎo)致同類型故障信號的內(nèi)部特征分布存在巨大差異, 使得模型在某個工況下訓(xùn)練完成后, 在另一工況下的數(shù)據(jù)上表現(xiàn)不佳. 這種因數(shù)據(jù)分布不同而引起的模型性能下降現(xiàn)象被稱為域適應(yīng)問題. 深度學(xué)習(xí)要想應(yīng)用到工業(yè)領(lǐng)域, 必須具有良好的域適應(yīng)能力, 能夠在變化的工況下實現(xiàn)高精度故障診斷. 目前, 針對深度學(xué)習(xí)故障診斷的域適應(yīng)問題, 大多數(shù)研究采用遷移學(xué)習(xí)理論. Wen等[7]提出帶有 51 個卷積層的 TCNN網(wǎng)絡(luò)用于故障診斷. 該方法與遷移學(xué)習(xí)結(jié)合, 用預(yù)訓(xùn)練的ResNet-50 網(wǎng)絡(luò)對原始二維振動信號進(jìn)行故障診斷; 院老虎等[8]將收集到的原始振動數(shù)據(jù)轉(zhuǎn)換為振動信號圖作為訓(xùn)練樣本, 用預(yù)訓(xùn)練的AlexNet網(wǎng)絡(luò)進(jìn)行訓(xùn)練和微調(diào), 完成故障診斷任務(wù). 陳仁祥等[9]提出一種自適應(yīng)正則化遷移學(xué)習(xí),首先訓(xùn)練基分類器預(yù)測目標(biāo)樣本的偽標(biāo)簽, 然后利用聯(lián)合分布對齊兩域分布, 最后使用結(jié)構(gòu)風(fēng)險最小化框架建立的分類器完成不同工況下的故障診斷. 但是以上文獻(xiàn)中應(yīng)用的遷移學(xué)習(xí)方法仍然依賴于測試集樣本的統(tǒng)計信息, 微調(diào)模型需要的參數(shù)量大, 且調(diào)參步驟復(fù)雜, 不具備很好的應(yīng)用性. 此外, 這些研究因為重點關(guān)注模型的遷移能力而忽略了對數(shù)據(jù)特征的充分預(yù)處理過程, 沒有從數(shù)據(jù)的角度挖掘出能增強網(wǎng)絡(luò)識別能力的判別性工況特征, 缺少全面性.
因此, 針對當(dāng)前研究中存在的數(shù)據(jù)預(yù)處理不充分和深度學(xué)習(xí)故障診斷方法在域適應(yīng)上的局限性, 本文提出一種基于特征融合和混類增強的故障診斷方法.貢獻(xiàn)如下:
(1) 針對故障數(shù)據(jù)特征提取不足的問題, 提出一種特征融合方法, 在數(shù)據(jù)預(yù)處理階段, 綜合考慮原始振動信號的時頻域特征、工況特征和時間差分特征, 并將這些特征與原始信號融合在一起形成新的特征向量,增加特征多樣性.
(2) 針對變工況下數(shù)據(jù)分布差異大導(dǎo)致模型故障識別率低的問題, 提出一種混類增強策略拓展訓(xùn)練數(shù)據(jù)分布, 增大訓(xùn)練集規(guī)模, 增加訓(xùn)練樣本的多樣性, 使模型學(xué)習(xí)到數(shù)據(jù)的本質(zhì)特征, 提高模型域適應(yīng)能力.
(3) 在CWRU數(shù)據(jù)集上的實驗結(jié)果表明, 該方法在同工況下的預(yù)測精度高達(dá)100%, 在變工況下的平均預(yù)測精度高達(dá)93.28%, 域適應(yīng)性強.
本文提出的基于特征融合和混類增強的深度滾動軸承故障診斷方法框架如圖1所示.
圖1上方虛線框是訓(xùn)練過程, 下方虛線框是測試過程. 上方信號和下方信號來源于不同的工況, 即樣本的分布不同. 在訓(xùn)練過程中, 原始一維振動信號經(jīng)多特征融合后形成新的一維特征向量, 再經(jīng)相空間重構(gòu)轉(zhuǎn)換成二維圖像信號, 通過本文提出的混類增強策略拓展訓(xùn)練數(shù)據(jù)的分布, 提高模型在對抗樣本上的魯棒性.最終, 訓(xùn)練好的模型可以在訓(xùn)練樣本分布之外的測試樣本上進(jìn)行高精度故障診斷. 整個故障診斷流程可以概括為以下5步:
圖1 特征融合和混類增強故障診斷方法框架
(1) 對原始信號采用時頻分析方法提取時頻特征,并根據(jù)工況條件構(gòu)建工況特征, 再計算時間差分特征,然后將這3類特征與原始一維信號融合, 得到新的一維特征向量;
(2) 基于相空間重構(gòu)理論, 將新的一維信號樣本轉(zhuǎn)換為二維圖像格式, 作為神經(jīng)網(wǎng)絡(luò)的輸入;
(3) 對轉(zhuǎn)換后的訓(xùn)練樣本做混類增強, 構(gòu)造新的虛擬樣本和虛擬標(biāo)簽, 擴充訓(xùn)練樣本分布;
(4) 用混類增強后得到的樣本作為訓(xùn)練集輸入ResNet18網(wǎng)絡(luò)中訓(xùn)練模型;
(5) 將訓(xùn)練完畢的模型在未做過混類增強的樣本上測試, 獲得故障診斷分類結(jié)果.
得益于硬件的高速發(fā)展, 現(xiàn)代工業(yè)設(shè)備的歷史數(shù)據(jù)大多由傳感器記錄保存. 但是, 傳感器獲取的數(shù)據(jù)可能會存在異常值, 適當(dāng)?shù)墓收咸卣魈崛】梢詼p輕異常值對故障診斷的負(fù)面影響.
由于機械故障信號存在周期性脈沖, 因此提取具有信息性和判別性的時頻域特征有助于提高故障數(shù)據(jù)的質(zhì)量[10]. 另一方面, 故障數(shù)據(jù)的原始特征通常是固定的, 當(dāng)設(shè)備在單一工況下運行時, 這些特征用于故障診斷是足夠的. 當(dāng)設(shè)備在變化的負(fù)載中工作時, 深度學(xué)習(xí)模型無法僅利用單工況下的固定特征掌握數(shù)據(jù)的本質(zhì)信息. 由傳感器在不同操作條件下觀測到的幀間動態(tài)變化數(shù)據(jù)中包含大量的設(shè)備降級信息[11], 因此, 獲取工況特征和時間差分特征也是有必要的.
綜上所述, 本文提出一種新的特征融合方法, 在將原始信號輸入模型前對數(shù)據(jù)進(jìn)行預(yù)處理, 從多個角度提取多個特征, 包括時頻特征、工況特征和時間差分特征, 實現(xiàn)多特征融合, 增加特征多樣性和全面性, 為網(wǎng)絡(luò)提供高質(zhì)量的輸入. 以下是對這些特征的具體描述:
(1) 原始特征: 原始一維振動信號, 由加速度計獲得, 未經(jīng)過任何處理, 形式為時間序列.
(2) 時頻特征: 時窗信號的最大值、均值、方差、均方根值、偏度、峰度、峰值、譜偏態(tài)系數(shù)、譜峰態(tài)系數(shù)、小波系數(shù). 對于小波系數(shù), 本文使用db1進(jìn)行8級小波包分解, 得到與故障特征頻率相關(guān)的能量較高的小波系數(shù). 每個時頻特征是一個統(tǒng)計值, 統(tǒng)計出的多個時頻特征可以構(gòu)建形成新的一維時頻特征向量.表1給出了各個時頻特征的計算公式.
表1 時頻特征計算公式
(3) 工況特征: 當(dāng)前工作條件的獨熱(one-hot)編碼. 以本文實驗的4種工況為例, 獨熱編碼對應(yīng)的特征向量分別為 [1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0,0, 1].
(4) 時間差分特征: 由于樣本是時間序列, 將每個樣本看成一個時間窗, 計算該時間窗內(nèi)的變化幅度特征, 構(gòu)成時間差分特征向量. 具體地, 定義一個時間窗的時間序列為:
X=(x1,x2,···,xm)
以第一個時間點為起點, 依次從后往前求后一個時間點對應(yīng)值相對于前一個時間點對應(yīng)值的變化幅度,作為新的特征, 即:
最終得到新的時間差分特征向量為:
為解決新的時間序列與原始時間序列的時間點錯位問題(新時間序列的第i個點表示的是原始特征序列的第i+1個點相對前一時間點的變化幅度), 通過時間窗進(jìn)行序列劃分時, 從第2個時間窗開始, 其起始時間為上一時間窗結(jié)束時間, 這樣可以保證數(shù)據(jù)變化特征的連續(xù)性.
經(jīng)過以上步驟后, 將提取的時頻特征向量、工況特征向量和時間差分特征向量與原始一維信號拼接形成新的一維特征向量, 該向量增加了特定工況下的判別性信息, 更具全面性, 如圖2所示.
圖2 新的特征向量
本文設(shè)計的一維振動信號到二維時頻特征圖像的轉(zhuǎn)換過程如圖3所示, 包括兩個步驟:
圖3 故障信號到圖像的轉(zhuǎn)換
(1) 一維振動信號采樣, 經(jīng)第1.1節(jié)的特征融合方法形成新的一維特征向量;
(2) 一維特征向量重構(gòu)為二維圖像.
以一維格式為輸入數(shù)據(jù)的故障診斷方法受感受野限制, 在學(xué)習(xí)的過程中很難提取到設(shè)備故障固有模式的相關(guān)特征. 與一維信號相比, 圖像是二維數(shù)據(jù)矩陣,能夠承載更強大的信息, 表示更復(fù)雜的結(jié)構(gòu)分布. 為了捕獲周期性信號的特征并利用深度神經(jīng)網(wǎng)絡(luò)在圖像分類上的強大特征提取能力, 本文基于相空間重構(gòu)理論,將特征融合后的一維信號重構(gòu)為二維圖像格式作為深度神經(jīng)網(wǎng)絡(luò)的輸入, 具體轉(zhuǎn)換過程為:
(1) 將原始一維信號劃分為n個相等的部分;
(2) 每個部分按信號圖像的行順序排列:
其中,I表示重構(gòu)后的信號圖像,x(t)是t時刻的振動信號. 得到二維圖像格式的樣本后, 對每個樣本歸一化處理并賦予像素值:
其中,pi表 示當(dāng)前樣本的第i個采樣點,pmin和pmax分別表示當(dāng)前樣本所有采樣點的最小值和最大值. 轉(zhuǎn)換后的圖像格式為單通道, 為了滿足本文選用神經(jīng)網(wǎng)絡(luò)模型的輸入格式, 將單通道拓展為3通道, 每個通道擁有相同的信息.
深度學(xué)習(xí)的另一個局限性在于: 網(wǎng)絡(luò)深度的增加會帶來許多優(yōu)化相關(guān)問題, 如梯度爆炸、消失等. 深度殘差網(wǎng)絡(luò)(residual network, ResNet)[12]的提出有效緩解了深度神經(jīng)網(wǎng)絡(luò)模型增加層數(shù)后帶來的退化問題,從根本上杜絕了梯度消失現(xiàn)象, 分類和收斂性能均優(yōu)于普通的深層網(wǎng)絡(luò)結(jié)構(gòu). 因此本文采用深度殘差網(wǎng)絡(luò)作為故障診斷訓(xùn)練模型.深度殘差網(wǎng)絡(luò)由殘差模塊構(gòu)建, 圖4展示了殘差網(wǎng)絡(luò)塊的結(jié)構(gòu).
如圖4所示, 在殘差塊中, 輸入可通過跨層的數(shù)據(jù)線路更快地向前傳播, 不會給網(wǎng)絡(luò)增加額外的參數(shù)和計算量. 殘差網(wǎng)絡(luò)通過采用這樣一種跳躍連接的結(jié)構(gòu),學(xué)習(xí)信號的差值, 在保持網(wǎng)絡(luò)深度的同時提高了模型準(zhǔn)確率, 并且易于優(yōu)化. 由于工業(yè)落地環(huán)境要求神經(jīng)網(wǎng)絡(luò)模型有速度快、體型小的特點, ResNet18網(wǎng)絡(luò)相較于其他ResNet50、ResNet101等網(wǎng)絡(luò)更為輕量, 并且足夠完成實驗中數(shù)據(jù)場景, 因此本文選用ResNet18網(wǎng)絡(luò)作為訓(xùn)練模型, 該網(wǎng)絡(luò)有17個卷積層和1個全連接層.
圖4 殘差網(wǎng)絡(luò)塊結(jié)構(gòu)示意圖
深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練、更新參數(shù)的依據(jù)來源于給定的訓(xùn)練數(shù)據(jù), 但是在故障診斷領(lǐng)域, 單一工況下的訓(xùn)練數(shù)據(jù)只涵蓋整個數(shù)據(jù)分布的一部分, 導(dǎo)致訓(xùn)練出來的網(wǎng)絡(luò)只能在擁有類似分布的數(shù)據(jù)上表現(xiàn)良好, 在分布差異大的數(shù)據(jù)上表現(xiàn)不佳. 為了充分利用有限數(shù)據(jù), 更好地描述數(shù)據(jù)的整個分布, 提高模型的域適應(yīng)能力, 有必要進(jìn)行數(shù)據(jù)增強[13]. 在計算機視覺領(lǐng)域, 傳統(tǒng)的數(shù)據(jù)增強方式通過對圖像進(jìn)行裁剪、旋轉(zhuǎn)、縮放等幾何變換生成新的訓(xùn)練樣本, 圖像標(biāo)簽保持不變. 然而, 這樣的數(shù)據(jù)增強方法存在以下局限性[14]:
(1) 生成的新樣本局限于同一類別;
(2) 不同類別不同樣本之間的關(guān)系沒有被建模;
(3) 由于先驗知識有限, 能拓展的分布也有限, 模型仍然可能會產(chǎn)生過擬合現(xiàn)象.
為解決上述問題, 本文提出一種新的混類增強方法, 改善故障診斷模型在變工況下由于數(shù)據(jù)分布不一致表現(xiàn)出的域適應(yīng)性差的問題. 該方法是一種非常規(guī)的數(shù)據(jù)增強方式, 通過線性插值得到新的拓展數(shù)據(jù), 即來源于訓(xùn)練樣本鄰近分布的虛擬訓(xùn)練樣本和標(biāo)簽.混類增強對樣本的處理過程如下:
其中,xi和xj代表從訓(xùn)練數(shù)據(jù)中隨機抽取的兩個樣本,yi和yj代表對應(yīng)的標(biāo)簽獨熱編碼. λ ~Beta[α,α],α∈(0,∞). 從式(4)和式(5)可以看出, 新的樣本——標(biāo)簽數(shù)據(jù) (x?,y?)由兩個樣本——標(biāo)簽數(shù)據(jù)對以凸組合的方式線性疊加生成. 該方法使得新樣本來源于訓(xùn)練樣本的鄰近分布, 不同樣本間的分布更為平滑, 規(guī)范了模型的線性表達(dá), 加強了模型抵御分布外的對抗樣本的能力. 混類增強實際可以看作對模型的一種正則化方案. 此外, 混類增強的實現(xiàn)簡單而有效, 符合奧卡姆剃刀原理.
混類增強具體算法如算法1.
算法1. 混類增強算法D={(xi,yi)}Ni=1輸入: 數(shù)據(jù)集 批次大小M D={(?xi,?yi)}Ni=1輸出: 數(shù)據(jù)集{xi,yi}Mi=1←Sample(D,M)1) #按批次采樣樣本;Shuffle({xi,yi}Mi=1)2) #隨機打亂順序;3) #隨機配對樣本;for{(xi,yi),(xj,yj)}inPairData{(xi,yi)Mi=1,(xj,yj)Mj=1}do λ←Beta(α,α)4) #采樣樣本的混類因子;?x=λxi+(1-λ)xj 5) #按式(2)合成虛擬樣本;?y=λyi+(1-λ)yj 6) #按式(3)合成虛擬標(biāo)簽.
為了驗證本文提出方法的有效性, 在美國凱斯西儲大學(xué)(CWRU)軸承實驗數(shù)據(jù)上進(jìn)行了測試. 關(guān)于數(shù)據(jù)集更詳細(xì)的信息可在文獻(xiàn)[15]中查看. 該數(shù)據(jù)來源于驅(qū)動端軸承, 由加速度傳感器計以12 kHz的頻率采集得到. 滾動軸承有4種故障類型: 內(nèi)圈故障、滾動體故障、外圈故障、正常. 每種故障類型的故障直徑分別為0.017 78 cm, 0.035 56 cm和0.053 34 cm, 因此, 共有10種故障標(biāo)簽. 表2為滾動軸承數(shù)據(jù)集的具體描述.數(shù)據(jù)集A為在轉(zhuǎn)速1 772 RPM、負(fù)載1馬力下收集的振動信號, 數(shù)據(jù)集B為在轉(zhuǎn)速1 750 RPM、負(fù)載2馬力下收集的振動信號, 數(shù)據(jù)集C為在轉(zhuǎn)速1 730 RPM、負(fù)載3馬力下收集的振動信號, 數(shù)據(jù)集D為在轉(zhuǎn)速1 772 RPM、1 750 RPM、1 730 RPM和負(fù)載1、2、3馬力下收集的混合振動信號.
表2 數(shù)據(jù)集描述
實驗以1 024個采樣點作為一個樣本, 每種故障類型采樣2 200個樣本. 訓(xùn)練時, 長度為1 024的樣本會被重塑為32×32大小的矩陣, 以二維圖像格式作為ResNet18網(wǎng)絡(luò)的輸入. 訓(xùn)練集、驗證集、測試集的劃分比例為6:2:2. 模型訓(xùn)練的參數(shù)設(shè)置如表3所示.
表3 參數(shù)設(shè)置
本文實驗在Windows 10 的64位操作系統(tǒng)下進(jìn)行, 內(nèi)存為16 GB, 處理器為Intel(R) Core(TM) i7-9750H CPU. 所用深度學(xué)習(xí)框架為TensorFlow和Keras,編程語言為Python 3.6.
為了驗證本文所提方法的優(yōu)越性, 將其與流行的WDCNN[16]、TICNN[17]、LeNet-5網(wǎng)絡(luò)[18]和孿生神經(jīng)網(wǎng)絡(luò)模型[19]在同一實驗環(huán)境下進(jìn)行單一工況、變工況對比分析. 表4給出了不同模型在單一工況下的準(zhǔn)確率對比.
表4 單一工況結(jié)果對比 (%)
由表4可知, 在單一工況下, WDCNN、TICNN、LeNet-5和孿生神經(jīng)網(wǎng)絡(luò)模型的平均分類精度都可達(dá)到97%以上, 但是本文的混類增強模型的平均分類精度可達(dá)到100%, 優(yōu)于現(xiàn)有的流行方法.
表5為變工況下域適應(yīng)方案設(shè)置的具體描述. 其中, 源域指打上標(biāo)簽的訓(xùn)練數(shù)據(jù), 目標(biāo)域指未打標(biāo)簽的測試數(shù)據(jù). 根據(jù)3種不同工況下數(shù)據(jù)集的組合, 共有6種域適應(yīng)方案設(shè)置.
表5 域適應(yīng)方案設(shè)置
表6給出了變工況下各個模型在數(shù)據(jù)集A、B、C的6種域適應(yīng)設(shè)置方案上對滾動軸承故障分類準(zhǔn)確率的對比分析結(jié)果.
表6 變工況結(jié)果對比 (%)
由表6可知, WDCNN、TICNN和孿生神經(jīng)網(wǎng)絡(luò)模型在域適應(yīng)方案設(shè)置中的平均精度在80%以上,LeNet-5模型的平均精度最低, 僅有66%. 受變工況操作條件影響, 這幾種模型的精度與在單一工況下相比都下降了很多. 而本文方法的平均精度達(dá)到了93.28%,比WDCNN提高了3.6%, 比One-shot提高了11.52%,比Five-shot提高了11.43%, 比TICNN提高了8.35%,比LeNet-5提高了27.28%, 明顯改善了模型的域適應(yīng)性, 提高了模型的泛化能力. 實驗結(jié)表表明, 在跨域分類問題上, 基于特征融合和混類增強的深度學(xué)習(xí)滾動軸承故障診斷方法抗干擾能力強, 有效解決了故障診斷在實際工業(yè)中因跨域?qū)е绿卣鞑町惔蠖鵁o法識別的問題.
本節(jié)設(shè)計消融實驗分別探索特征融合和混類增強對故障診斷精度提升的貢獻(xiàn), 表7為具體對比方案. 其中, 方案1對一維信號做特征融合, 在訓(xùn)練模型時不加入混類增強策略; 方案2用原始一維信號重構(gòu)二維圖像, 不加入特征融合, 在模型訓(xùn)練時采用混類增強; 方案3即本文提出方法, 對一維信號做特征融合形成新的特征向量, 重構(gòu)成二維圖像后在訓(xùn)練時采用混類增強策略.
表7 方案對比
其中, 方案1對一維信號做特征融合, 在訓(xùn)練模型時不加入混類增強策略; 方案2用原始一維信號重構(gòu)二維圖像, 不加入特征融合, 在模型訓(xùn)練時采用混類增強; 方案3即本文提出方法, 對一維信號做特征融合形成新的特征向量, 重構(gòu)成二維圖像后在訓(xùn)練時采用混類增強策略.
表8和表9分別展示了方案1、方案2、方案3在單一工況和變工況下的模型故障診斷分類結(jié)果.
表9 變工況結(jié)果對比 (%)
由表8可知, 在單一工況下, 方案1和方案2都可以達(dá)到99%以上的分類精度, 但是方案3可以使模型提高到100%的分類精度, 證明了特征融合和混類增強結(jié)合的有效性, 在單工況條件下表現(xiàn)極佳.
表8 單一工況結(jié)果對比 (%)
由表9可知, 在域適應(yīng)方案設(shè)置中, 方案3的平均分類精度分別比方案1、方案2的平均分類精度高8.13%和10.8%. 在域適應(yīng)設(shè)置C→A和C→B中, 方案3相較于方案1和方案2, 分類精度提升十分明顯,最大提升跨度可達(dá)28.57%.
綜上, 可得出結(jié)論: 特征融合和混類增強結(jié)合的方法比僅做特征融合和僅做混類增強的方法在單一工況和變工況下具有更好的分類性能和域適應(yīng)能力. 本文提出的特征融合和混類增強結(jié)合的方法對提高模型同工況下的分類精度和變工況下的域適應(yīng)能力具有顯著效果.
第2節(jié)以準(zhǔn)確率為評價指標(biāo), 通過比較網(wǎng)絡(luò)分類層的最終預(yù)測標(biāo)簽與真實標(biāo)簽獲得模型的精度, 以此評估模型的有效性. 本節(jié)從網(wǎng)絡(luò)的中間層出發(fā), 用特征可視化來展示神經(jīng)網(wǎng)絡(luò)對樣本特征的學(xué)習(xí)過程, 驗證本文提出方法對不同故障類別的識別能力, 增加網(wǎng)絡(luò)的可解釋性.
本節(jié)采用t-SNE (t-distributed stochastic neighbor embedding)方法[20]對故障樣本的分類過程進(jìn)行降維和特征可視化. t-SNE方法可以將高維數(shù)據(jù)映射到適合人類直覺觀察的低維空間, 是一種出色的非線性降維方法, 非常適合數(shù)據(jù)探索和可視化分析.
圖5(a)–圖5(f)以數(shù)據(jù)集D為例, 展示了測試樣本在已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)結(jié)構(gòu)上從中間層到最后一個全連接層的特征分布. 圖中每種顏色類別代表一類故障標(biāo)簽, 共有10類.
圖5可以看出, 在早期的一些層中, 從圖5(a)到圖5(c), 特征是重疊聚合在一起的, 無法輕易區(qū)分. 從圖5(d)到圖5(f), 隨著層數(shù)的逐漸加深, 每個類別的特征點開始聚類在一起, 10個故障的類別特征變得越來越可分割, 說明訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型分類效果顯著.
圖5 特征可視化示意圖
t-SNE可視化直觀形象地展示了神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中層與層之間逐步提取更深層次數(shù)據(jù)內(nèi)部特征的步驟, 增加了網(wǎng)絡(luò)的可解釋性, 同時驗證了本文提出方法能夠很好地學(xué)習(xí)到樣本特征, 實現(xiàn)高精度的故障診斷.
針對深度學(xué)習(xí)滾動軸承故障診斷模型數(shù)據(jù)預(yù)處理不充分和域適應(yīng)性差的問題, 本文提出了一種基于特融合和混類增強的故障診斷方法. 該方法在深度學(xué)習(xí)的基礎(chǔ)上加入了特征工程, 在數(shù)據(jù)預(yù)處理階段綜合考慮原始信號的時域特征、工況特征和時間差分特征,
豐富特征表示, 改善訓(xùn)練數(shù)據(jù)的質(zhì)量. 在模型訓(xùn)練階段,提出一種混類增強策略構(gòu)造虛擬樣本和標(biāo)簽, 拓展訓(xùn)練數(shù)據(jù)分布, 增加訓(xùn)練集多樣性, 并利用ResNet18強大的特征提取能力學(xué)習(xí)數(shù)據(jù)的本質(zhì)特征. 實驗結(jié)果表明, 該方法有效緩解了深度學(xué)習(xí)故障診斷在不同工況下故障識別率低的問題, 提高了滾動軸承故障診斷模型的域適應(yīng)能力, 適合變工況下故障診斷. 在未來工作中, 將嘗試優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu), 進(jìn)一步提高模型收斂速度.