侯召?lài)?guó), 王華偉, 周 良, 付 強(qiáng)
(南京航空航天大學(xué)民航學(xué)院, 江蘇 南京 211106)
旋轉(zhuǎn)機(jī)械是工業(yè)應(yīng)用中的關(guān)鍵部件,已廣泛應(yīng)用于電機(jī)、直升機(jī)、航空發(fā)動(dòng)機(jī)、水輪機(jī)和其他類(lèi)型的復(fù)雜機(jī)械設(shè)備[1]。大型旋轉(zhuǎn)機(jī)械設(shè)備工作環(huán)境極為惡劣,具有負(fù)載重、轉(zhuǎn)速快、運(yùn)行時(shí)間長(zhǎng)等特點(diǎn),容易出現(xiàn)各種故障,最終導(dǎo)致不必要的停機(jī)時(shí)間、經(jīng)濟(jì)損失甚至人員傷亡[1]。因此,及時(shí)準(zhǔn)確的故障診斷對(duì)于旋轉(zhuǎn)機(jī)械系統(tǒng)設(shè)計(jì)、智能運(yùn)維和安全可靠運(yùn)行至關(guān)重要。傳統(tǒng)上,旋轉(zhuǎn)機(jī)械故障診斷主要包括3個(gè)階段:數(shù)據(jù)采集、特征提取與選擇、故障分類(lèi)。當(dāng)前旋轉(zhuǎn)機(jī)械故障特征提取主要面臨三大挑戰(zhàn):工況復(fù)雜且多變;振動(dòng)信號(hào)具有極強(qiáng)的非線(xiàn)性;采集的數(shù)據(jù)樣本存在不平衡性,體現(xiàn)在正常與故障樣本的數(shù)量級(jí)不平衡。目前,傳統(tǒng)的特征提取方法主要有小波變換(wavelet transform,WT)、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和集成經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)等[2]。傳統(tǒng)的特征提取與故障分類(lèi)方法對(duì)于人工特征工程和專(zhuān)家知識(shí)的依賴(lài)較為嚴(yán)重。特別是,隨著工業(yè)大數(shù)據(jù)時(shí)代的到來(lái)和傳感器技術(shù)的發(fā)展,傳統(tǒng)的特征提取與故障分類(lèi)方法已經(jīng)無(wú)法滿(mǎn)足海量數(shù)據(jù)的診斷需求。在此背景下,智能故障診斷開(kāi)始發(fā)展與推廣,智能故障診斷是指將人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和深度神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)理論應(yīng)用于機(jī)器故障診斷[3]。然而,基于人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等傳統(tǒng)的機(jī)器學(xué)習(xí)智能診斷方法,由于網(wǎng)絡(luò)結(jié)構(gòu)較淺,限制了其對(duì)復(fù)雜故障特征的提取能力。近年來(lái),深度自動(dòng)編碼器、深度卷積神經(jīng)網(wǎng)絡(luò)等深度神經(jīng)網(wǎng)絡(luò)被廣泛用于構(gòu)建端到端智能診斷模型,減少了對(duì)人工勞動(dòng)和專(zhuān)家知識(shí)的依賴(lài),極大地推動(dòng)了智能故障診斷的發(fā)展[3]。由于能夠直接從原始數(shù)據(jù)或低層次特征數(shù)據(jù)中挖掘代表性信息,以及強(qiáng)大的多模式分解能力,基于深度學(xué)習(xí)的智能診斷引起了越來(lái)越多的國(guó)內(nèi)外學(xué)者的關(guān)注[4]。
Shao等[5]提出了一種基于壓縮感知的改進(jìn)卷積深度信念網(wǎng)絡(luò)方法,大大提升了模型的特征提取能力和泛化性能。Li等[6]提出了一種基于殘差連接自適應(yīng)一維可分離卷積的混合工況齒輪點(diǎn)蝕故障診斷方法,并驗(yàn)證了其良好的診斷性能。Zhang等[7]通過(guò)突出小波系數(shù)的本質(zhì)頻帶和卷積通道的故障特征,提出了一種基于混合注意力改進(jìn)殘差網(wǎng)絡(luò)的風(fēng)電齒輪箱故障診斷方法,并在傳動(dòng)系統(tǒng)診斷模擬器仿真數(shù)據(jù)集和風(fēng)電場(chǎng)實(shí)測(cè)數(shù)據(jù)上驗(yàn)證了該方法的有效性。Hoang等[8]提出了一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷方法,并驗(yàn)證了其較高的診斷精度和強(qiáng)大的抗噪能力。Yu等[9]提出基于一維殘差卷積自動(dòng)編碼器的齒輪箱故障診斷特征學(xué)習(xí)方法,在行星齒輪箱數(shù)據(jù)集上表現(xiàn)出良好的信號(hào)去噪和特征提取性能。Mao等[10]提出了一種融合多種故障類(lèi)型判別信息的深度自動(dòng)編碼器方法,并用于軸承故障診斷。Lu等[11]提出了一種基于分層卷積神經(jīng)網(wǎng)絡(luò)健康狀態(tài)分類(lèi)的滾動(dòng)軸承智能故障診斷方法,并驗(yàn)證了其在滾動(dòng)軸承故障分類(lèi)中的有效性。Jia等[12]提出了一種新的深度神經(jīng)網(wǎng)絡(luò)智能診斷方法,并在軸承和行星齒輪箱數(shù)據(jù)集上驗(yàn)證了其良好的性能。針對(duì)現(xiàn)代機(jī)械設(shè)備復(fù)雜多樣、信號(hào)源多、類(lèi)型差異大、耦合性強(qiáng)、動(dòng)力學(xué)建模困難、非線(xiàn)性強(qiáng)以及不確定性干擾強(qiáng)等問(wèn)題,仍需要故障診斷理論進(jìn)一步深入研究[13]。當(dāng)前的智能診斷模型在融入工業(yè)實(shí)際需求與模型動(dòng)態(tài)優(yōu)化更新方面還存在很大不足,實(shí)現(xiàn)智能故障診斷真正落地還有很長(zhǎng)的路要走。因此,隨著機(jī)械設(shè)備向著更加復(fù)雜化和智能化的方向發(fā)展,在更好地滿(mǎn)足工業(yè)實(shí)際需求與融入工業(yè)實(shí)際應(yīng)用方面,必將為當(dāng)前的智能診斷模型的性能改進(jìn)提出更加嚴(yán)峻的挑戰(zhàn)。面向未來(lái)工業(yè)實(shí)際,亟需更加精準(zhǔn)且高效的智能故障診斷方法。
深度殘差網(wǎng)絡(luò)(deep residual network, DRN)是為了解決卷積神經(jīng)網(wǎng)絡(luò)的梯度消失現(xiàn)象而提出的一種深層神經(jīng)網(wǎng)絡(luò),不僅保留了卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的故障特征提取能力,而且有效緩解了網(wǎng)絡(luò)退化現(xiàn)象。為了進(jìn)一步改善深度殘差網(wǎng)絡(luò)的特征提取能力和收斂速度,本文提出了一種改進(jìn)深度殘差網(wǎng)絡(luò)(improved DRN, IDRN)。在深度殘差網(wǎng)絡(luò)中引入長(zhǎng)短時(shí)記憶(long short-term memory, LSTM)網(wǎng)絡(luò)可以最大限度地考慮到故障的時(shí)序信息,在殘差塊中加入Dropout層可以有效緩解過(guò)擬合并提升診斷效率,通過(guò)改進(jìn)深度殘差網(wǎng)絡(luò)可以實(shí)現(xiàn)端到端的故障診斷,通過(guò)與當(dāng)前廣泛使用的幾種網(wǎng)絡(luò)模型的對(duì)比實(shí)驗(yàn),驗(yàn)證了該方法的有效性和可行性。
針對(duì)卷積神經(jīng)網(wǎng)絡(luò)隨著層的堆疊容易出現(xiàn)梯度消失的問(wèn)題,He等[14]首次提出了深度殘差網(wǎng)絡(luò),并將其用于圖像識(shí)別任務(wù),表現(xiàn)出了較高的分類(lèi)精度。深度殘差網(wǎng)絡(luò)由多個(gè)帶有跳躍連接線(xiàn)的殘差塊構(gòu)成,殘差思想的引入大大緩解了深層神經(jīng)網(wǎng)絡(luò)的梯度消失問(wèn)題。其中殘差塊的結(jié)構(gòu)如圖1所示。
殘差塊包含兩種映射:一種是恒等映射;另一種是殘差映射。假設(shè)要求的最優(yōu)解為H(X)=X,殘差映射是指映射H(X)和X的殘差值,用F(X)表示,即F(X)=H(X)-X。當(dāng)F(X)無(wú)限接近于0時(shí),網(wǎng)絡(luò)達(dá)到最佳狀態(tài),繼續(xù)加深網(wǎng)絡(luò)深度,網(wǎng)絡(luò)也將一直處于最優(yōu)狀態(tài)[15]。當(dāng)殘差塊的輸入為Xn時(shí),可得計(jì)算后的輸出[15]為
Xn+1=f(Xn+F(Xn,Wn))
(1)
式中:F(·)為殘差映射;Wn為相應(yīng)的權(quán)重參數(shù);f(·)為激活函數(shù)。由圖1可知,不同殘差塊之間可能存在維度不匹配的情況,此時(shí)只需要對(duì)恒等映射Xn做一個(gè)線(xiàn)性變換Ws[15]即可:
Xn+1=f(WsXn+F(Xn,Wn))
(2)
式中:Ws為權(quán)重參數(shù)。
殘差結(jié)構(gòu)具有兩個(gè)結(jié)構(gòu)優(yōu)勢(shì):第一,網(wǎng)絡(luò)前向傳播時(shí)淺層的特征可以在深層得以重用;第二,網(wǎng)絡(luò)反向傳播時(shí)深層的梯度可以直接傳回淺層。因此,帶有快捷連接的殘差塊可以在網(wǎng)絡(luò)的輸入與輸出之間有較大的重構(gòu)誤差時(shí),直接通過(guò)快捷連接將誤差信息反饋給前面的網(wǎng)絡(luò)層,這種結(jié)構(gòu)設(shè)計(jì)不僅提升了模型訓(xùn)練速度,而且有效緩解了網(wǎng)絡(luò)退化問(wèn)題。
Dropout是Hinton等[16]于2012年提出的處理過(guò)擬合問(wèn)題的方法,常用于深度網(wǎng)絡(luò)的優(yōu)化中,其中Dropout前的深度前饋網(wǎng)絡(luò)至Dropout后的深度前饋網(wǎng)絡(luò)的原理過(guò)程如圖2所示,其中虛線(xiàn)圓表示被刪除的神經(jīng)元,與其連接的邊也被刪除了。
Dropout層的工作過(guò)程如下:首先,隨機(jī)“丟棄”網(wǎng)絡(luò)中的一部分隱藏層神經(jīng)元,構(gòu)造新的隱藏層,同時(shí)保持輸入輸出神經(jīng)元不變,并將小批量訓(xùn)練輸入樣本通過(guò)新構(gòu)造的隱藏層進(jìn)行前向傳播;然后,根據(jù)返回的損失函數(shù)結(jié)果進(jìn)行反向傳播。通過(guò)優(yōu)化算法更新未隱藏的神經(jīng)元參數(shù),最后恢復(fù)“丟棄”的神經(jīng)元,并重復(fù)Dropout過(guò)程直至訓(xùn)練完成[17]。
經(jīng)過(guò)添加Dropout層,網(wǎng)絡(luò)的計(jì)算公式可以表示為
(3)
為了避免網(wǎng)絡(luò)在層數(shù)較深時(shí),出現(xiàn)過(guò)擬合的現(xiàn)象,對(duì)殘差塊的結(jié)構(gòu)進(jìn)行了改進(jìn)。其中標(biāo)準(zhǔn)的殘差塊結(jié)構(gòu)如圖1所示,改進(jìn)的殘差塊結(jié)構(gòu)如圖3所示。
圖1中,殘差塊僅僅包含卷積層和批量標(biāo)準(zhǔn)化層,在網(wǎng)絡(luò)堆疊過(guò)多的層時(shí)很容易出現(xiàn)過(guò)擬合現(xiàn)象。為了緩解殘差塊的過(guò)擬合現(xiàn)象[18],在殘差塊中引入了丟棄層,其結(jié)構(gòu)如圖3所示。丟棄層可以舍棄網(wǎng)絡(luò)的一些隨機(jī)單元和冗余單元,使網(wǎng)絡(luò)在提取主要特征信息的同時(shí)簡(jiǎn)化計(jì)算量,而且也有效緩解了網(wǎng)絡(luò)的退化現(xiàn)象。因此,丟棄層的這一特性特別適用于處理冗余信息較多的旋轉(zhuǎn)機(jī)械振動(dòng)信號(hào)。
2.3.1 CNN基本原理
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)具有強(qiáng)大的特征提取能力,它包含卷積層、激活層、池化層、批量標(biāo)準(zhǔn)化層、全連接層和分類(lèi)層,其中分類(lèi)層由多層感知機(jī)組成[19]。
卷積層進(jìn)行深層特征提取,其中卷積過(guò)程[19]可以描述如下:
(4)
池化層通常連接在卷積層之后,它利用下采樣操作減小了特征和網(wǎng)絡(luò)參數(shù)的空間大小,其中最大池化操作[19]可以描述如下:
(5)
2.3.2 LSTM基本原理
LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(reccurrent neural networks, RNN)的變體,其經(jīng)過(guò)結(jié)構(gòu)的改進(jìn),有效緩解了RNN的梯度問(wèn)題。LSTM的結(jié)構(gòu)主要包括遺忘門(mén)、輸入門(mén)和輸出門(mén)[20]。
LSTM的遺忘門(mén)決定信息的通過(guò)量,其計(jì)算過(guò)程[20]如下:
ft=σ(ωL1·[ht-1,xt]+bL1)
(6)
式中:σ是sigmoid函數(shù);ωL1和bL1分別是權(quán)重和偏置;ht-1是前一個(gè)單元的輸出;xt是當(dāng)前輸入。
LSTM的輸入門(mén)決定了新信息能否被細(xì)胞單元記憶,其計(jì)算過(guò)程[20]如下:
it=σ(ωL2·[ht-1,xt]+bL2)
(7)
(8)
(9)
LSTM單元的最終輸出ht由輸出門(mén)的輸出οt與記憶單元輸出Ct決定,具體計(jì)算[20]如下:
οt=σ(ωL4[ht-1,xt]+bL4)
(10)
ht=οt·tanh (Ct)
(11)
式中:ωL4、bL4分別是輸出門(mén)的權(quán)重和偏置。
2.3.3 IDRN模型
考慮到不同模型具有各自的優(yōu)勢(shì),模型融合可以?xún)?yōu)勢(shì)互補(bǔ)、取長(zhǎng)補(bǔ)短。CNN具有強(qiáng)大的特征提取能力,可以提取更深層次的故障特征,能夠捕捉故障發(fā)生的屬性信息[21]。LSTM具備長(zhǎng)短時(shí)記憶的能力,能夠捕捉故障發(fā)生的時(shí)序信息[22]。因此,為了最大程度地保留振動(dòng)信號(hào)的時(shí)序特征[22],本文設(shè)計(jì)了融合改進(jìn)殘差塊和LSTM層的IDRN作為旋轉(zhuǎn)機(jī)械故障診斷模型,不僅可以直接處理原始機(jī)械信號(hào),而且在提取故障屬性信息的同時(shí)也可以將故障發(fā)生的時(shí)序信息融入到模型之中。IDRN結(jié)構(gòu)如圖4所示,包括兩個(gè)初始卷積層、一個(gè)池化層、一個(gè)LSTM網(wǎng)絡(luò)層和3個(gè)改進(jìn)殘差塊,然后經(jīng)過(guò)卷積層、全局平均池化層、展開(kāi)層、全連接層和分類(lèi)層進(jìn)行故障分類(lèi)。以初始卷積層為例描述參數(shù),(Conv1D,32,3)表示模型是一維卷積神經(jīng)網(wǎng)絡(luò),濾波器尺寸為32,卷積核大小為3;(MaxPooling,3)表示最大池化操作,池化塊尺寸為3;(LSTM,32)表示模型是LSTM網(wǎng)絡(luò),神經(jīng)元個(gè)數(shù)為32;(Dropout,0.25)表示丟棄層,丟棄率為0.25;(Dense,64)表示全連接層,神經(jīng)元個(gè)數(shù)為64;Flatten表示展開(kāi)層;ReLU表示整流后的線(xiàn)性單元激活函數(shù);Softmax表示分類(lèi)層激活函數(shù)。LSTM層被設(shè)計(jì)用來(lái)進(jìn)行時(shí)序特征提取,多層殘差塊被設(shè)計(jì)用來(lái)進(jìn)行深層故障特征提取,全局平均池化層被設(shè)計(jì)為處理所學(xué)習(xí)的特征,其將每個(gè)特征圖視為一個(gè)區(qū)域來(lái)執(zhí)行池化操作,并且其輸出大小等于特征圖的數(shù)量[23]。分類(lèi)層中的神經(jīng)元個(gè)數(shù)與故障類(lèi)別個(gè)數(shù)相同。
針對(duì)旋轉(zhuǎn)機(jī)械工況復(fù)雜多變、振動(dòng)信號(hào)具有極強(qiáng)的非線(xiàn)性和有標(biāo)簽樣本不足而導(dǎo)致的故障特征提取困難等問(wèn)題,本文提出了一種用于旋轉(zhuǎn)機(jī)械故障診斷的IDRN?;贗DRN的旋轉(zhuǎn)機(jī)械故障診斷流程如圖5所示。通過(guò)對(duì)滾動(dòng)軸承和齒輪箱振動(dòng)信號(hào)進(jìn)行分析,發(fā)現(xiàn)其中存在大量的噪聲和冗余信息。因此,在數(shù)據(jù)處理階段,首先需要進(jìn)行數(shù)據(jù)采樣和數(shù)據(jù)標(biāo)準(zhǔn)化處理,然后劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集的比例,最后對(duì)數(shù)據(jù)標(biāo)簽進(jìn)行one-hot編碼處理。在模型訓(xùn)練階段,首先初始化網(wǎng)絡(luò)參數(shù),然后將預(yù)處理之后的訓(xùn)練集數(shù)據(jù)輸入到融合LSTM層和Dropout層的IDRN進(jìn)行訓(xùn)練,并利用驗(yàn)證集進(jìn)行參數(shù)調(diào)整,訓(xùn)練完成之后可以得到故障診斷模型。在故障診斷階段,將測(cè)試數(shù)據(jù)輸入到故障診斷模型之中,輸出故障診斷結(jié)果,完成故障診斷流程。
滾動(dòng)軸承與齒輪都是旋轉(zhuǎn)機(jī)械的關(guān)鍵部件,其運(yùn)行狀態(tài)直接關(guān)系到旋轉(zhuǎn)機(jī)械的安全可靠運(yùn)行。因此,為了測(cè)試該故障診斷方法的性能并驗(yàn)證其有效性,在滾動(dòng)軸承單工況、變工況和齒輪箱三個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)。此外,還進(jìn)行了對(duì)比實(shí)驗(yàn),以比較現(xiàn)有方法的分類(lèi)精度。
3.1.1 滾動(dòng)軸承實(shí)驗(yàn)數(shù)據(jù)描述
滾動(dòng)軸承實(shí)驗(yàn)利用文獻(xiàn)[24]中的凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)進(jìn)行驗(yàn)證。該數(shù)據(jù)采樣頻率設(shè)置為12 kHz和48 kHz,采用電火花技術(shù)來(lái)加工軸承故障。軸承故障分為內(nèi)圈故障、外圈故障和滾珠故障。每種故障類(lèi)型包括7 mils、14 mils和21 mils 3種故障直徑。電機(jī)負(fù)荷包括0 HP、1 HP、2 HP和3 HP 4種狀態(tài);電機(jī)轉(zhuǎn)速包括1 797 rpm、1 772 rpm、1 750 rpm和1 730 rpm 4種狀態(tài)。
3.1.2 齒輪實(shí)驗(yàn)數(shù)據(jù)描述
齒輪實(shí)驗(yàn)利用文獻(xiàn)[25]中東南大學(xué)齒輪箱數(shù)據(jù)集進(jìn)行驗(yàn)證,該數(shù)據(jù)是從東南大學(xué)齒輪箱實(shí)驗(yàn)平臺(tái)驅(qū)動(dòng)系統(tǒng)動(dòng)力學(xué)模擬器中收集的。在轉(zhuǎn)速系統(tǒng)負(fù)載設(shè)置為20 Hz-0 V或30 Hz-2 V的情況下,該平臺(tái)研究了兩種不同工作條件下的多種故障模式。
3.1.3 實(shí)驗(yàn)數(shù)據(jù)設(shè)置
滾動(dòng)軸承單工況實(shí)驗(yàn)數(shù)據(jù)組成如表1所示,其中故障標(biāo)號(hào)N為正常樣本,F1~F5為故障位置不同的5種故障樣本。單工況的軸承故障診斷實(shí)驗(yàn)中故障直徑、電機(jī)負(fù)荷和電機(jī)轉(zhuǎn)速都是保持同一條件,不能很好地展示模型在變工況下的診斷性能,為了驗(yàn)證模型的泛化能力,又進(jìn)一步設(shè)置了變工況下軸承故障診斷實(shí)驗(yàn),針對(duì)故障直徑、電機(jī)負(fù)荷和電機(jī)轉(zhuǎn)速都不同的故障類(lèi)型進(jìn)行識(shí)別。其中變工況軸承數(shù)據(jù)包括1種正常樣本N′和3種不同類(lèi)型的故障樣本F1′~F3′,其組成如表2所示。
表1 單工況軸承故障數(shù)據(jù)組成
表2 變工況軸承故障數(shù)據(jù)組成
為了驗(yàn)證模型對(duì)多種旋轉(zhuǎn)機(jī)械的故障診斷性能,進(jìn)而在工業(yè)應(yīng)用領(lǐng)域進(jìn)一步推廣,又設(shè)置了齒輪箱故障診斷實(shí)驗(yàn)。齒輪故障診斷中選用同一電機(jī)負(fù)荷下的5種運(yùn)行狀態(tài)進(jìn)行實(shí)驗(yàn),其中H代表健康狀態(tài),G1~G4代表4種不同類(lèi)型的故障狀態(tài),其組成如表3所示。
表3 齒輪故障數(shù)據(jù)組成
3.1.4 實(shí)驗(yàn)參數(shù)設(shè)置
實(shí)驗(yàn)設(shè)置訓(xùn)練批次大小為128、周期大小為20、樣本長(zhǎng)度為2 048,其中每種故障類(lèi)型采集1 000個(gè)樣本,訓(xùn)練集、驗(yàn)證集和測(cè)試集的比率為0.7、0.2和0.1,如表1、表2和表3所示。以軸承單工況故障診斷為例,IDRN的模型參數(shù)如表4所示,以改進(jìn)殘差塊1為例,(32,3)表示濾波器尺寸為32、卷積核大小為3。實(shí)驗(yàn)中,學(xué)習(xí)率設(shè)置為0.001,損失函數(shù)采用交叉熵?fù)p失函數(shù),優(yōu)化器采用Adam,分類(lèi)層激活函數(shù)采用Softmax分類(lèi)函數(shù)。
表4 IDRN模型參數(shù)
3.2.1 實(shí)驗(yàn)?zāi)P驮u(píng)價(jià)
為了顯示模型在測(cè)試集中對(duì)各個(gè)故障類(lèi)型的詳細(xì)識(shí)別效果[26],引入了多分類(lèi)混淆矩陣對(duì)軸承單工況和變工況以及齒輪箱故障診斷的實(shí)驗(yàn)結(jié)果進(jìn)行更加精準(zhǔn)全面的分析。多分類(lèi)混淆矩陣詳細(xì)展示了所有故障類(lèi)型的分類(lèi)結(jié)果,既包含正確分類(lèi)信息,也包含錯(cuò)誤分類(lèi)信息?;煜仃嚨目v軸代表分類(lèi)的實(shí)際標(biāo)簽,橫軸代表預(yù)測(cè)標(biāo)簽。因此,混淆矩陣主對(duì)角線(xiàn)位置上的值代表每種故障類(lèi)型正確分類(lèi)的比例,而非主對(duì)角線(xiàn)位置上的值代表一種故障類(lèi)型被誤分類(lèi)為其他故障類(lèi)型的比例。顏色條顯示從0到1的值和顏色之間的相關(guān)性。其中軸承單工況和變工況的以及齒輪箱的診斷模型測(cè)試結(jié)果混淆矩陣分別如圖6、圖7和圖8所示。
由圖6~圖8可知,模型對(duì)軸承單工況和變工況的每一類(lèi)故障樣本都沒(méi)有出現(xiàn)誤分類(lèi)的情況,但在齒輪箱故障診斷中大部分樣本標(biāo)注正確[27],除了故障類(lèi)型G4準(zhǔn)確率為66%之外,其余故障類(lèi)型分類(lèi)準(zhǔn)確率都在85%以上,說(shuō)明了本文所提出模型在軸承故障診斷中表現(xiàn)出了比齒輪箱故障診斷更高的精度。這可能是由于齒輪箱故障特征微弱或不同故障類(lèi)型之間的故障特征較為相似。
3.2.2 實(shí)驗(yàn)結(jié)果可視化
為了驗(yàn)證該方法自適應(yīng)挖掘故障特征的能力,引入了流形學(xué)習(xí)中的t分布隨機(jī)近鄰嵌入(t-distributed stochastic neighbor embedding, t-SNE)算法對(duì)模型隱藏層提取的高維特征進(jìn)行降維可視化分析[28]。其中軸承單工況和變工況以及齒輪箱的隱藏層輸出特征t-SNE可視化結(jié)果分別如圖9~圖11所示。由圖9~圖11可知,該模型具有強(qiáng)大的特征提取能力,在軸承故障診斷中,類(lèi)間的樣本被完美地分離,類(lèi)內(nèi)的樣本被完美地聚類(lèi)[29],在齒輪箱故障診斷中,除了G4、G2和H 3種故障類(lèi)型之間略微有些重疊之外,其余相同故障類(lèi)型之間可以很好地聚類(lèi),不同故障類(lèi)型之間可以很好地分離。結(jié)果表明,該方法能夠自適應(yīng)地挖掘旋轉(zhuǎn)機(jī)械在不同工況下的故障特征。
3.2.3 對(duì)比實(shí)驗(yàn)結(jié)果分析
為了更加全面地驗(yàn)證本文所提出模型的性能,分別與反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)、多層感知機(jī)(multilayer perception, MLP)、堆疊自編碼器(stacked auto-encoder, SAE)、CNN、RNN、DRN等當(dāng)前廣泛使用的故障診斷模型進(jìn)行了對(duì)比實(shí)驗(yàn)。以單工況實(shí)驗(yàn)為例,各對(duì)比實(shí)驗(yàn)?zāi)P偷膮?shù)設(shè)置如表5所示。各對(duì)比實(shí)驗(yàn)?zāi)P驮\斷精度如表6所示,表6中IDRN(本文所提方法)是本文所設(shè)計(jì)的IDRN模型,針對(duì)3個(gè)故障診斷實(shí)驗(yàn)的測(cè)試集及測(cè)試集平均中精度最高的值都進(jìn)行了加粗表示,各診斷模型在3個(gè)實(shí)驗(yàn)的測(cè)試將重復(fù)5次,5次測(cè)試樣本的平均診斷精度作為各診斷模型在3個(gè)實(shí)驗(yàn)的測(cè)試集診斷精度,為了使對(duì)比實(shí)驗(yàn)更有說(shuō)服力,同時(shí)避免偶然誤差,再取3個(gè)實(shí)驗(yàn)測(cè)試集的平均診斷精度[30]作為各模型最終診斷結(jié)果對(duì)算法性能進(jìn)行評(píng)價(jià)。由表6可知,IDRN模型在軸承單工況和變工況以及齒輪箱下的測(cè)試集故障診斷精度及測(cè)試集平均故障診斷精度都達(dá)到了最高,從而驗(yàn)證了本文所提方法的有效性。
表5 對(duì)比模型訓(xùn)練參數(shù)
表6 模型對(duì)比實(shí)驗(yàn)精度
本文針對(duì)旋轉(zhuǎn)機(jī)械工況復(fù)雜多變、振動(dòng)信號(hào)具有極強(qiáng)的非線(xiàn)性以及有標(biāo)簽樣本不足而導(dǎo)致的故障特征提取困難等問(wèn)題,提出了一種用于旋轉(zhuǎn)機(jī)械故障診斷的IDRN,主要得到了以下結(jié)論。
(1) 將該模型在軸承與齒輪箱數(shù)據(jù)集上進(jìn)行了驗(yàn)證,在軸承單工況、變工況及齒輪箱3個(gè)實(shí)驗(yàn)中的測(cè)試集平均診斷精度達(dá)到了96.83%,高于當(dāng)前廣泛使用的其他診斷模型。
(2) IDRN在旋轉(zhuǎn)機(jī)械智能故障診斷實(shí)驗(yàn)中,展示了強(qiáng)大的自適應(yīng)挖掘故障特征的能力和穩(wěn)定的識(shí)別性能。
(3) LSTM具有長(zhǎng)短時(shí)記憶的能力,能夠捕捉故障發(fā)生的時(shí)序信息,對(duì)于時(shí)序型振動(dòng)信號(hào),可以獲得更加豐富的特征表示。
(4) 殘差塊中引入Dropout層可以丟棄網(wǎng)絡(luò)中的一些冗余信息,防止網(wǎng)絡(luò)過(guò)擬合,提升診斷效率。
為了提升模型的診斷性能,并進(jìn)一步推廣到工業(yè)實(shí)際應(yīng)用中,應(yīng)該充分考慮各模型的優(yōu)勢(shì),實(shí)現(xiàn)多種模型之間的相互融合與協(xié)調(diào),充分發(fā)揮多模型融合的優(yōu)勢(shì)。