孫潔娣,劉 保,溫江濤,時(shí)培明,閆盛楠,肖啟陽(yáng)
(1.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北 秦皇島 066004;2.燕山大學(xué) 河北省信息傳輸與信號(hào)處理重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004;3.燕山大學(xué) 河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004;4.河南大學(xué) 人工智能學(xué)院,鄭州 475000)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械的重要部件,對(duì)整個(gè)旋轉(zhuǎn)機(jī)械的安全運(yùn)行有著直接影響。軸承出現(xiàn)故障可能導(dǎo)致大量人力財(cái)力損失,因此快速準(zhǔn)確的軸承故障診斷在機(jī)械健康狀態(tài)管理中意義重大。近年來(lái),軸承故障診斷已由傳統(tǒng)方法向智能化方向轉(zhuǎn)變,基于數(shù)據(jù)驅(qū)動(dòng)的智能機(jī)械故障診斷方法取得了較大發(fā)展[1-4]。
隨著深度學(xué)習(xí)在多學(xué)科交叉研究中取得了令人矚目的成績(jī),學(xué)者們將其引入機(jī)械故障診斷中,形成了一類新的智能故障診斷方法。該類方法主要通過(guò)復(fù)雜的學(xué)習(xí)算法提取高維特征中的隱藏信息,建立輸入數(shù)據(jù)與預(yù)測(cè)類別之間的關(guān)系,繼而實(shí)現(xiàn)端到端的識(shí)別。在眾多方法中,深度卷積網(wǎng)絡(luò)因其具有的強(qiáng)大特征提取能力得到了廣泛關(guān)注,文獻(xiàn)[5]利用卷積網(wǎng)絡(luò)從振動(dòng)信號(hào)頻譜中自動(dòng)學(xué)習(xí)特征,實(shí)現(xiàn)了變速箱健康狀態(tài)診斷。文獻(xiàn)[6]利用三維卷積網(wǎng)絡(luò)對(duì)原始振動(dòng)信號(hào)的時(shí)頻圖像進(jìn)行自動(dòng)化特征提取,實(shí)現(xiàn)了齒輪箱復(fù)合故障的識(shí)別。文獻(xiàn)[7]利用CNN對(duì)原始監(jiān)測(cè)信號(hào)的二維矩陣進(jìn)行自適應(yīng)特征提取,實(shí)現(xiàn)了軸承故障識(shí)別。
分析文獻(xiàn)發(fā)現(xiàn),多數(shù)診斷方法均假設(shè)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)同分布,數(shù)據(jù)來(lái)自同一工況下機(jī)械振動(dòng)信號(hào)。而實(shí)際軸承診斷應(yīng)用中,運(yùn)行工況復(fù)雜多變,不同工況下軸承的振動(dòng)信號(hào)差別較大,直接將前述方法應(yīng)用于變工況的軸承故障診斷中將導(dǎo)致故障識(shí)別準(zhǔn)確率大幅度降低,嚴(yán)重限制了很多理論上成功的診斷方法在復(fù)雜工況下的應(yīng)用。因此,針對(duì)軸承實(shí)際應(yīng)用中的多工況變化導(dǎo)致的數(shù)據(jù)分布差異問(wèn)題,研究自適應(yīng)的特征提取及識(shí)別方法,實(shí)現(xiàn)復(fù)雜變工況環(huán)境下的軸承智能故障診斷是目前該領(lǐng)域的迫切需要。
遷移學(xué)習(xí)(transfer learning,TL)為解決變工況下的軸承故障診斷帶來(lái)了新思路[8-10],其嘗試將源域知識(shí)應(yīng)用于目標(biāo)域的樣本分類任務(wù)中。很多學(xué)者研究了多種遷移識(shí)別方法,文獻(xiàn)[11]利用自動(dòng)編碼機(jī)提取軸承故障信號(hào)的敏感特征,通過(guò)引入特征域適應(yīng),提升了網(wǎng)絡(luò)在小樣本情況下的診斷準(zhǔn)確度。文獻(xiàn)[12]基于卷積神經(jīng)網(wǎng)絡(luò)提出一種遷移學(xué)習(xí)分析方法,實(shí)現(xiàn)了齒輪箱故障識(shí)別。文獻(xiàn)[13]基于卷積神經(jīng)網(wǎng)絡(luò),在全連接層處的域適應(yīng)損失及卷積網(wǎng)絡(luò)分類誤差共同作用下實(shí)現(xiàn)了不同機(jī)械間的故障識(shí)別。為了更好的對(duì)齊源域和目標(biāo)域特征分布,文獻(xiàn)[14]在卷積神經(jīng)網(wǎng)絡(luò)的多層中引入最大均值差異來(lái)最小化數(shù)據(jù)的特征分布差異,在兩種機(jī)械間的跨域診斷任務(wù)中實(shí)現(xiàn)了很好的識(shí)別結(jié)果。文獻(xiàn)[15]在以上深度遷移學(xué)習(xí)的基礎(chǔ)上,通過(guò)結(jié)合域適應(yīng)和域分類器損失實(shí)現(xiàn)了目標(biāo)機(jī)械的故障診斷識(shí)別。
上述文獻(xiàn)表明,源域和目標(biāo)域間的特征分布差異信息能夠有效提高網(wǎng)絡(luò)的跨工況適應(yīng)性、輔助深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)不同工況下的軸承故障診斷任務(wù)。以上算法雖然取得了較好的識(shí)別效果,但是忽略了信號(hào)特征提取過(guò)程的優(yōu)化以及不同域中樣本的標(biāo)簽概率分布信息對(duì)故障分類的潛在作用。
針對(duì)以上問(wèn)題,本文提出優(yōu)化的特征提取和知識(shí)遷移的故障診斷方法。該方法引入稠密卷積網(wǎng)絡(luò)和注意力機(jī)制來(lái)優(yōu)化信號(hào)的特征提取過(guò)程,同時(shí)引入標(biāo)簽概率分布適應(yīng)來(lái)對(duì)網(wǎng)絡(luò)輸出的源域和目標(biāo)域樣本標(biāo)簽分布進(jìn)行優(yōu)化。模型中的稠密卷積網(wǎng)絡(luò)和注意力機(jī)制負(fù)責(zé)信號(hào)多層特征的提取及特征重要程度標(biāo)識(shí);標(biāo)簽概率分布適應(yīng)在特征分布適應(yīng)的基礎(chǔ)上進(jìn)行二次分布對(duì)齊,從而更有效的實(shí)現(xiàn)域知識(shí)遷移,實(shí)現(xiàn)變工況軸承故障診斷。實(shí)驗(yàn)結(jié)果表明,相較于傳統(tǒng)方法,本文所提出的方法從特征提取和域適應(yīng)的角度都實(shí)現(xiàn)了更高的跨工況故障診斷準(zhǔn)確率。
深度卷積神經(jīng)網(wǎng)絡(luò)CNN因其良好的性能常被用作機(jī)械故障信號(hào)特征提取模型,但其本身也存在不足之處[16-19]。稠密卷積網(wǎng)絡(luò)(DenseNet)作為CNN的一種變體,通過(guò)將網(wǎng)絡(luò)內(nèi)部不同層次的特征合并傳遞,增強(qiáng)特征的傳遞性,實(shí)現(xiàn)淺層特征重復(fù)利用,有效緩解梯度消失并提高網(wǎng)絡(luò)的收斂效率[20-21]。
DenseNet本質(zhì)上是一種具有較深層數(shù)的卷積神經(jīng)網(wǎng)絡(luò),主要由稠密卷積塊和過(guò)渡層構(gòu)成。
稠密卷積塊在特征提取過(guò)程中,為了確保網(wǎng)絡(luò)的前饋性以及網(wǎng)絡(luò)各層能夠提取最大信息量,對(duì)各層特征進(jìn)行拼接,每一個(gè)卷積層都從前面的各卷積層中獲得額外的輸入,并將本層的特征映射傳遞給后面所有層。設(shè)x0為稠密卷積塊的輸入,x0經(jīng)過(guò)稠密塊第一層卷積處理得到特征x1,第二層卷積層的輸入為[x0,x1],第L層卷積的輸入特征則為[x0,x1,…,xL-1]。每層卷積的處理可表述為下式
(1)
式中:xi為輸入特征;wi為權(quán)重參數(shù);b為偏置;f(·)為非線性激活函數(shù)。
為了有效控制網(wǎng)絡(luò)參數(shù)數(shù)量,在每個(gè)稠密卷積塊后連接一個(gè)包含1*1卷積層和平均池化層的過(guò)渡層,對(duì)特征進(jìn)行降維處理。
對(duì)于稠密卷積網(wǎng)絡(luò)所提取的信號(hào)特征,卷積注意力機(jī)制(convolutional block attention module,CBAM)[22]通過(guò)通道及空間注意力處理分析,實(shí)現(xiàn)了特征權(quán)重的差異性區(qū)分。結(jié)合一維卷積網(wǎng)絡(luò)結(jié)構(gòu),本文基于CBAM的特征區(qū)分處理過(guò)程如圖1所示。
圖1 本文基于CBAM的特征區(qū)分Fig.1 Feature distinguishing processing based on CBAM
通道注意力處理包含降維、特征變換、特征激活三部分。輸入特征F在空間維度上進(jìn)行全局平均池化和全局最大池化,得到降維后的特征Favg、Fmax。該特征在共享權(quán)重的卷積網(wǎng)絡(luò)中進(jìn)行非線性變換,得到特征Convc(Favg)、Convc(Fmax)。利用Sigmoid函數(shù)對(duì)輸出的兩個(gè)特征求和結(jié)果進(jìn)行激活,得到通道注意力權(quán)重分布圖Wc,權(quán)重分布圖中標(biāo)識(shí)了各個(gè)通道特征的重要性,代表著特征圖的各通道特征對(duì)網(wǎng)絡(luò)跨域識(shí)別任務(wù)的貢獻(xiàn)率。通道注意力的輸出特征權(quán)重可用式(2)表示。
Wc=σ(Convc(AvgPool(F))+Convc(MaxPool(F)))=
σ(Convc(Favg)+Convc(Fmax))
(2)
式中,σ為sigmoid激活函數(shù),Convc為通道注意力處理中權(quán)重共享的卷積層。
Ws=σ(Convs([AvgPool(F′);MaxPool(F′)]))=
(3)
式中,σ為sigmoid激活函數(shù),Convs為權(quán)重共享卷積層。
通過(guò)特征映射尋找兩個(gè)域的相關(guān)性,找到對(duì)兩個(gè)域分布影響較小的潛在參數(shù),實(shí)現(xiàn)域不變特征的遷移是基于特征的遷移學(xué)習(xí)主要解決的問(wèn)題。
遷移學(xué)習(xí)基于領(lǐng)域適配理論[23]將兩個(gè)域中的特征非線性的映射到同一個(gè)高維空間,在該空間中對(duì)不同分布特征進(jìn)行對(duì)齊,特征域適應(yīng)過(guò)程如圖2所示。
圖2 基于特征映射的遷移學(xué)習(xí)結(jié)構(gòu)圖Fig.2 Transfer learning based on feature mapping
最大均值差異MMD[24-25]常用于判斷圖中兩個(gè)特征分布是否相同,但該指標(biāo)側(cè)重度量不同域分布間的整體差異,未考慮不同域分布中任何細(xì)粒度信息。局部最大均值差異(local maximum mean discrepancy,LMMD)[26]將源域和目標(biāo)域特征劃分為多個(gè)子域分布,并計(jì)算源域和目標(biāo)域中相關(guān)子域特征分布間的距離。給定兩個(gè)獨(dú)立數(shù)據(jù)集x和y,LMMD計(jì)算如式(4)。
(4)
(5)
lic為標(biāo)簽編碼向量li的第c項(xiàng)。
為了更好的利用不同域間的特征知識(shí),在特征域適應(yīng)的基礎(chǔ)上,從跨工況情境下兩個(gè)域共享相同標(biāo)簽空間的角度出發(fā),本文提出對(duì)跨域識(shí)別任務(wù)中兩個(gè)域內(nèi)的標(biāo)簽概率分布進(jìn)行適配,在特征子域分布適配之后,增加標(biāo)簽概率分布適配,改善識(shí)別效果。
考慮到目標(biāo)域數(shù)據(jù)的無(wú)標(biāo)簽問(wèn)題,本文結(jié)合網(wǎng)絡(luò)softmax層的輸出結(jié)果實(shí)現(xiàn)對(duì)源域和目標(biāo)域的標(biāo)簽概率分布對(duì)齊。Softmax層中的計(jì)算公式為
(6)
式中:i代表k中的某個(gè)分類;gi代表該分類的值。
一方面,softmax層作為網(wǎng)絡(luò)的最后一層,包含著數(shù)據(jù)集的非線性特征信息;另一方面,softmax層將源域和目標(biāo)域數(shù)據(jù)的多分類結(jié)果以概率分布p和q的形式展現(xiàn),分別刻畫(huà)了網(wǎng)絡(luò)預(yù)測(cè)標(biāo)簽對(duì)不同類別的歸屬程度。對(duì)于網(wǎng)絡(luò)中softmax層的輸出,可以應(yīng)用MMD距離度量函數(shù)度量?jī)蓚€(gè)標(biāo)簽概率分布的差異。進(jìn)一步將該差異作為網(wǎng)絡(luò)的損失函數(shù),約束網(wǎng)絡(luò)的訓(xùn)練過(guò)程。標(biāo)簽概率分布差異的度量如式(7)
(7)
式中:dk(·)為MMD距離度量函數(shù);pl,ql為softmax層輸出的源域、目標(biāo)域標(biāo)簽概率分布;K為高斯徑向基核函數(shù)的數(shù)量;γ為各個(gè)核函數(shù)系數(shù)。
綜合考慮網(wǎng)絡(luò)特征提取能力和數(shù)據(jù)特征及標(biāo)簽信息利用,本文提出結(jié)合注意力機(jī)制的稠密卷積網(wǎng)絡(luò)以及標(biāo)簽概率域適應(yīng)的軸承跨域診斷模型。如圖3所示。
圖3 本文的深度遷移診斷模型Fig.3 Proposed deep transfer diagnosis network
本文首先采用稠密連接的一維卷積網(wǎng)絡(luò)對(duì)輸入信號(hào)進(jìn)行特征提取,網(wǎng)絡(luò)的第一層卷積采用1×6卷積核,實(shí)現(xiàn)一維振動(dòng)信號(hào)向高維特征轉(zhuǎn)換。兩個(gè)稠密卷積塊具有相同結(jié)構(gòu),包含四層卷積層和四層批標(biāo)準(zhǔn)化(batch normalization,BN)層。兩個(gè)過(guò)渡層包含卷積層、批標(biāo)準(zhǔn)化層、整流線性單元(ReLU)和平均池化(Avg-pooling)層。
之后采用CBAM從通道和空間兩個(gè)維度對(duì)網(wǎng)絡(luò)提取的特征進(jìn)行處理,CBAM作為一個(gè)輕量級(jí)的模塊,本文將其在稠密網(wǎng)絡(luò)提取特征之后加入,以便于對(duì)總體特征實(shí)現(xiàn)重要性區(qū)分。
模型的全連接層包含一個(gè)展平層、兩個(gè)全連接層和一個(gè)softmax層。為了提升源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)特征知識(shí)的匹配程度,在全連接層對(duì)網(wǎng)絡(luò)提取的高維特征及標(biāo)簽概率分布進(jìn)行領(lǐng)域適配。如圖3所示,高維特征經(jīng)展平后,輸入全連接層FC1,利用式(4)對(duì)FC1層輸出的源域和目標(biāo)域特征分布進(jìn)行差異度量并匹配,得到源域和目標(biāo)域局部特征分布差異LMMD(Fs,Ft),其中Fs,Ft為源域目標(biāo)域的高維展平特征。特征經(jīng)過(guò)全連接FC2層非線性變換處理后,輸入softmax層進(jìn)行標(biāo)簽預(yù)測(cè)。在softmax層利用式(7)計(jì)算源域和目標(biāo)域標(biāo)簽概率分布差異MMD(Ls,Lt),Ls,Lt為源域和目標(biāo)域的標(biāo)簽概率分布。
為了更好的對(duì)源域和目標(biāo)域特征知識(shí)、標(biāo)簽分布信息進(jìn)行綜合利用,提高軸承跨域故障診斷準(zhǔn)確度,結(jié)合式(4)與式(7)的分布差異值,構(gòu)建如下優(yōu)化目標(biāo):
Min(losss+γLMMD(Fs,Ft)+γMMD(Ls+Lt))
(8)
式中,γ為域適應(yīng)的懲罰項(xiàng)系數(shù),losss為源域數(shù)據(jù)集分類損失,定義為:
(9)
網(wǎng)絡(luò)在式(8)的約束下,模型的每次更新都進(jìn)行了特征概率分布對(duì)齊、標(biāo)簽概率分布對(duì)齊,經(jīng)過(guò)多次的雙重對(duì)齊操作,模型提取的源域特征知識(shí)分布逐漸趨近于目標(biāo)域的特征知識(shí)分布,從而借助源域數(shù)據(jù)集的特征知識(shí)來(lái)實(shí)現(xiàn)目標(biāo)域數(shù)據(jù)的正確分類。
模型訓(xùn)練過(guò)程主要包括如下步驟:
(1) 初始化:初始化模型參數(shù)。對(duì)源域數(shù)據(jù)集和目標(biāo)域數(shù)據(jù)集進(jìn)行Z-score標(biāo)準(zhǔn)化預(yù)處理:
(10)
式中,σ和μ分別代表原始振動(dòng)信號(hào)x的均值和方差。
(2) 前向傳播:依據(jù)本文方法搭建特征提取及域適應(yīng)網(wǎng)絡(luò),輸入源域和目標(biāo)域數(shù)據(jù),利用網(wǎng)絡(luò)對(duì)數(shù)據(jù)樣本進(jìn)行特征提取。提取的特征在全連接層中按照式(4)、式(7)、式(9)分別計(jì)算域適應(yīng)損失和源域分類損失。
(3) 反向傳播:采用小批量梯度下降(mini-batch gradient descent,MBGD)優(yōu)化算法,逐層反向訓(xùn)練更新遷移網(wǎng)絡(luò)模型參數(shù)。返回繼續(xù)執(zhí)行(2)的前向傳播過(guò)程,直到達(dá)到設(shè)定的迭代次數(shù)后結(jié)束訓(xùn)練過(guò)程。
(4) 目標(biāo)域測(cè)試樣本識(shí)別:將目標(biāo)域測(cè)試數(shù)據(jù)輸入訓(xùn)練好的網(wǎng)絡(luò),返回網(wǎng)絡(luò)識(shí)別結(jié)果。
為了測(cè)試本文提出的跨域故障診斷模型的性能,以軸承不同工作負(fù)載下采集的數(shù)據(jù)集為基礎(chǔ)進(jìn)行遷移故障診斷,下述實(shí)驗(yàn)都在如下配置的PC端進(jìn)行:Intel Core i7 CPU,NVIDIA GEFORCE GTX 1070 Ti GPU。
實(shí)驗(yàn)采用了凱斯西儲(chǔ)大學(xué)提供的軸承振動(dòng)信號(hào)數(shù)據(jù)集[27],識(shí)別的軸承狀態(tài)包括:正常NO(normal)、內(nèi)圈故障IF(inter race fault)、外圈故障OF(outer race fault)、滾珠故障BF(ball roller fault)。每種故障有三種嚴(yán)重程度,故障直徑分別為0.007英寸、0.014英寸、0.021英寸。信號(hào)采樣速率為12 kHz和48 kHz。四種不同的設(shè)備運(yùn)行負(fù)載為0 HP,1 HP,2 HP,3 HP。實(shí)驗(yàn)中選取12 kHz采樣頻率下的驅(qū)動(dòng)端軸承信號(hào)進(jìn)行分析,考慮三種不同故障下的三種嚴(yán)重程度,與正常狀態(tài)信號(hào)共計(jì)故障類別為10類,文中故障類型分別表示為0~9,每類234個(gè)樣本,每個(gè)樣本包含1 024個(gè)采樣點(diǎn),數(shù)據(jù)標(biāo)簽處理結(jié)果如表1所示。
表1 狀態(tài)標(biāo)簽Tab.1 State labels
本文實(shí)驗(yàn)中將不同負(fù)載記為load0、load1、load2、load3,研究四種不同負(fù)載工況軸承之間的跨域診斷。
按照本文方法構(gòu)建深度特征提取網(wǎng)絡(luò)及域適應(yīng)網(wǎng)絡(luò),網(wǎng)絡(luò)參數(shù)如表2所示。
表2 網(wǎng)絡(luò)參數(shù)表Tab.2 Parameters of the network
基于以上參數(shù),構(gòu)建深度遷移網(wǎng)絡(luò),對(duì)本文所提出的多種跨域識(shí)別方法進(jìn)行10次重復(fù)實(shí)驗(yàn),統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果如表3所示。
表3 文中所提方法的跨域診斷結(jié)果Tab.3 Cross-domain diagnosis results of the proposed method
由表3可以看出,本文方法在多數(shù)遷移診斷任務(wù)中實(shí)現(xiàn)的故障識(shí)別準(zhǔn)確率保持在99.0 %以上,且具有較低的標(biāo)準(zhǔn)偏差,表明文中所提方法在處理不同負(fù)載遷移診斷問(wèn)題時(shí)總體效果較好,且單次的可信度高。
深度遷移模型構(gòu)建過(guò)程中,合適的參數(shù)可以有效提高目標(biāo)域軸承故障的診斷準(zhǔn)確率,下文將從多方面分析重要參數(shù)的不同取值對(duì)跨域診斷結(jié)果的影響。
4.3.1 網(wǎng)絡(luò)模型深度對(duì)診斷結(jié)果的影響
網(wǎng)絡(luò)模型深度對(duì)特征提取過(guò)程和訓(xùn)練時(shí)間有直接影響。網(wǎng)絡(luò)模型過(guò)淺會(huì)導(dǎo)致網(wǎng)絡(luò)特征提取能力下降,難以提取到具有表示性的域不變特征;網(wǎng)絡(luò)模型過(guò)深會(huì)加長(zhǎng)網(wǎng)絡(luò)訓(xùn)練時(shí)間,并且?guī)?lái)過(guò)擬合、梯度消失等風(fēng)險(xiǎn)。下文比較的三種不同深度網(wǎng)絡(luò)結(jié)構(gòu)如下:
網(wǎng)絡(luò)a:(稠密卷積塊+過(guò)渡層)×1、注意力機(jī)制層×1、全連接層×2。
網(wǎng)絡(luò)b(本文方法):(稠密卷積塊+過(guò)渡層)×2、注意力機(jī)制層×1、全連接層×2。
網(wǎng)絡(luò)c:(稠密卷積塊+過(guò)渡層)×3、注意力機(jī)制層×1、全連接層×2。
下表為10次識(shí)別結(jié)果的統(tǒng)計(jì)值。
表4 不同網(wǎng)絡(luò)層數(shù)下跨域識(shí)別統(tǒng)計(jì)結(jié)果Tab.4 Cross-domain recognition results with different layers
從統(tǒng)計(jì)結(jié)果可以看出,三種網(wǎng)絡(luò)中,本文所提出的網(wǎng)絡(luò)b診斷準(zhǔn)確率最高,且具有較高的魯棒性。從訓(xùn)練時(shí)間可以看出,隨著網(wǎng)絡(luò)結(jié)構(gòu)的加深,網(wǎng)絡(luò)訓(xùn)練所需時(shí)間隨之增加,而本文網(wǎng)絡(luò)訓(xùn)練所需時(shí)間適中。以上分析也表明本文的網(wǎng)絡(luò)結(jié)構(gòu)b診斷效果較好。
4.3.2 特征注意力機(jī)制處理的影響
本文特征提取中引入卷積注意力機(jī)制進(jìn)行特征的重要性區(qū)分。在前文確定的網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,此部分分析卷積注意力機(jī)制對(duì)分類識(shí)別的影響,主要對(duì)比了三組不同的結(jié)構(gòu),如下所示。
網(wǎng)絡(luò)①:僅兩個(gè)稠密卷積塊而無(wú)注意力機(jī)制處理,即(Dense block1+Dense block2)。
網(wǎng)絡(luò)②:CBAM注意力機(jī)制處理層置于第一個(gè)稠密卷積網(wǎng)絡(luò)之后,即Dense block1+CBAM+Dense block2。
網(wǎng)絡(luò)③(本文方法):CBAM注意力機(jī)制處理置于第二個(gè)稠密卷積塊之后,即(Dense block1+Dense block2+CBAM)。
為避免偶然因素影響,現(xiàn)進(jìn)行十次實(shí)驗(yàn)結(jié)果統(tǒng)計(jì),以跨域診斷實(shí)驗(yàn)load2→load3為例,結(jié)果如圖4所示。
圖4 不同網(wǎng)絡(luò)結(jié)構(gòu)對(duì)應(yīng)的識(shí)別結(jié)果Fig.4 Results of different network structures
由圖中可以看出,網(wǎng)絡(luò)③即本文方法的識(shí)別準(zhǔn)確率最高,而沒(méi)有卷積注意力機(jī)制處理的網(wǎng)絡(luò)對(duì)多數(shù)樣本分類效果較差,跨域識(shí)別準(zhǔn)確率較低。表明文中將注意力機(jī)制結(jié)合稠密網(wǎng)絡(luò)進(jìn)行特征的提取及優(yōu)化,可以更好的實(shí)現(xiàn)特征的重要性區(qū)分,改善了跨域診斷網(wǎng)絡(luò)的識(shí)別效果,獲得了最高的識(shí)別準(zhǔn)確率。
4.3.3 懲罰項(xiàng)系數(shù)取值對(duì)識(shí)別結(jié)果的影響
域適應(yīng)中的懲罰項(xiàng)系數(shù)表征了網(wǎng)絡(luò)在訓(xùn)練過(guò)程中域適應(yīng)的強(qiáng)度。懲罰項(xiàng)系數(shù)過(guò)小會(huì)導(dǎo)致域適應(yīng)強(qiáng)度不夠,難以實(shí)現(xiàn)滿意的跨域診斷結(jié)果;懲罰項(xiàng)系數(shù)過(guò)大則會(huì)顯著增加網(wǎng)絡(luò)反向傳播的損失,帶來(lái)梯度爆炸風(fēng)險(xiǎn)。為探究不同懲罰項(xiàng)系數(shù)值對(duì)識(shí)別結(jié)果的影響,重復(fù)十次實(shí)驗(yàn)并對(duì)不同跨域診斷效果進(jìn)行分析,圖5以load0→load3為例,給出懲罰項(xiàng)系數(shù)取值為0,0.01,0.5,1,10,0-1的識(shí)別結(jié)果,其中0-1取值按照公式2/((1+exp(-10*q))-1)變化,q為網(wǎng)絡(luò)訓(xùn)練過(guò)程中已訓(xùn)練次數(shù)與總訓(xùn)練次數(shù)的比值。
圖5 不同懲罰項(xiàng)系數(shù)的跨域診斷識(shí)別率Fig.5 Cross-domain diagnosis accuracies with different penalty coefficients
從圖中可以看出,在多組實(shí)驗(yàn)中,變化的懲罰項(xiàng)系數(shù)取得了最好的遷移診斷結(jié)果。分析其原因,在網(wǎng)絡(luò)訓(xùn)練前期更注重對(duì)源域數(shù)據(jù)特征的提取,此時(shí)懲罰項(xiàng)系數(shù)應(yīng)取較小值;隨著訓(xùn)練過(guò)程進(jìn)行,網(wǎng)絡(luò)優(yōu)化重點(diǎn)逐漸轉(zhuǎn)移到不同域間的特征適配任務(wù)上,因此懲罰項(xiàng)系數(shù)應(yīng)逐漸增大,提升網(wǎng)絡(luò)的域不變特征提取能力。
源域及目標(biāo)域提取特征的差異性度量是影響跨域識(shí)別結(jié)果的重要因素,此處以實(shí)驗(yàn)load3→load2為例,分析本文采用的LMMD與傳統(tǒng)的MMD對(duì)跨域識(shí)別結(jié)果的影響。記錄某次實(shí)驗(yàn)網(wǎng)絡(luò)訓(xùn)練過(guò)程中測(cè)試準(zhǔn)確率和測(cè)試損失值,如圖6所示。
圖6 測(cè)試準(zhǔn)確率曲線及損失曲線圖Fig.6 Accuracy curve and test loss curve
由圖中可以看出,與傳統(tǒng)MMD距離度量對(duì)應(yīng)的網(wǎng)絡(luò)相比,文中所提方法實(shí)現(xiàn)了更平滑的測(cè)試損失曲線和更低的損失值,說(shuō)明文中所提網(wǎng)絡(luò)具有更好的收斂性能和故障分類能力。表5為試驗(yàn)統(tǒng)計(jì)結(jié)果。
為了提高源域和目標(biāo)域之間的特征匹配程度,本文所提方法增加了對(duì)網(wǎng)絡(luò)輸出的標(biāo)簽概率分布進(jìn)行適配的處理,此處以跨域?qū)嶒?yàn)load1→load3為例,分析標(biāo)簽概率分布適配對(duì)跨工況軸承故障診斷結(jié)果的影響,某次實(shí)驗(yàn)結(jié)果混淆矩陣如圖7所示。
(a) 本文考慮標(biāo)簽概率分布影響的結(jié)果
圖中結(jié)果表明,在使用相同特征提取網(wǎng)絡(luò)的情況下,增加標(biāo)簽概率分布適配層對(duì)跨域診斷結(jié)果有較大影響。無(wú)標(biāo)簽概率分布適配層的網(wǎng)絡(luò)模型在目標(biāo)域數(shù)據(jù)分類過(guò)程中容易出現(xiàn)錯(cuò)誤識(shí)別,其原因在于,無(wú)標(biāo)簽概率分布適配方法中,各類別決策邊界不夠明確,分類準(zhǔn)確率較低;而利用標(biāo)簽概率分布適配對(duì)該特征值進(jìn)行映射對(duì)齊后,在各個(gè)類別上都實(shí)現(xiàn)了較好的識(shí)別結(jié)果。下表統(tǒng)計(jì)了兩種不同域適應(yīng)網(wǎng)絡(luò)實(shí)現(xiàn)的識(shí)別結(jié)果。
本文在傳統(tǒng)跨域診斷模型基礎(chǔ)上進(jìn)行改進(jìn),提出一種包含稠密卷積網(wǎng)絡(luò)、注意力機(jī)制、特征及標(biāo)簽概率分布適配的網(wǎng)絡(luò)模型,提高了變工況下的軸承故障識(shí)別準(zhǔn)確率。為了驗(yàn)證本文方法的性能,將其與三種常用的方法進(jìn)行對(duì)比實(shí)驗(yàn),基于不同的對(duì)比目的,設(shè)置三類對(duì)比方法,各方法的模型結(jié)構(gòu)如表5所示。
表5 對(duì)比模型結(jié)構(gòu)表Tab.5 Different structures for comparing models
多個(gè)遷移診斷任務(wù)上的實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果如表6所示。
表6 不同方法遷移結(jié)果對(duì)比Tab.6 Transfer diagnosis comparison of different methods
不同方法的準(zhǔn)確率結(jié)果如圖8所示。
圖8 不同方法對(duì)比結(jié)果Fig.8 Comparison of different methods
由統(tǒng)計(jì)結(jié)果可以得出,(1)本文方法在多種變工況故障識(shí)別中均實(shí)現(xiàn)了較高的準(zhǔn)確率,說(shuō)明了文中方法的有效性;(2)處理跨域故障診斷任務(wù)時(shí),本文網(wǎng)絡(luò)相較于傳統(tǒng)卷積網(wǎng)絡(luò)在故障診斷時(shí)更具優(yōu)勢(shì)。(3)文中提出方法的故障診斷準(zhǔn)確率高于沒(méi)有遷移過(guò)程的稠密卷積網(wǎng)絡(luò)的診斷準(zhǔn)確率,說(shuō)明源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的特征分布、標(biāo)簽概率分布適配遷移了數(shù)據(jù)的特征知識(shí),有效改善了跨工況故障診斷結(jié)果。(4)相比傳統(tǒng)基于手動(dòng)提取特征的淺層遷移學(xué)習(xí)方法TCA,本文提出的診斷網(wǎng)絡(luò)可以自動(dòng)而全面的提取數(shù)據(jù)中的深層次特征知識(shí),并且能夠在深層特征空間內(nèi)降低源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的特征知識(shí)差異性,改善遷移故障診斷結(jié)果。
為了進(jìn)一步驗(yàn)證該方法的有效性,本文在西安交通大學(xué)軸承數(shù)據(jù)集(XJTU-SY Bearing Datasets)[29]上做進(jìn)一步實(shí)驗(yàn)。選取了數(shù)據(jù)集中11 kN和12 kN兩種工況下的軸承振動(dòng)信號(hào),主要識(shí)別了軸承的保持架(cage)故障、外圈(outer)故障、正常(normal)三種故障狀態(tài)。數(shù)據(jù)處理中,每類故障狀態(tài)包含315個(gè)數(shù)據(jù)樣本,每個(gè)樣本包含1024個(gè)采樣點(diǎn),數(shù)據(jù)處理結(jié)果如表7所示。
表7 故障狀態(tài)標(biāo)簽Tab.7 Fault labels
基于以上兩種工況以及分別進(jìn)行兩種情景下的跨工況診斷實(shí)驗(yàn),試驗(yàn)結(jié)果如表8所示。
表8 遷移識(shí)別結(jié)果Tab.8 Diagnosis results with different transfer methods
由上表的統(tǒng)計(jì)數(shù)據(jù)可以看出,本文方法在多場(chǎng)景下的跨工況故障診斷中均能有效提高目標(biāo)域的故障診斷準(zhǔn)確率,表明了本文所提方法在處理跨工況診斷問(wèn)題時(shí)的有效性。
機(jī)械的運(yùn)行環(huán)境差異大,導(dǎo)致采集的振動(dòng)信號(hào)差別較大,且多為無(wú)標(biāo)簽數(shù)據(jù),給傳統(tǒng)的軸承故障診斷方法的實(shí)現(xiàn)帶來(lái)了很大的困難?;诖耍疚奶岢隽艘环N基于深度遷移學(xué)習(xí)的跨工況軸承故障診斷方法,在深度卷積網(wǎng)絡(luò)基礎(chǔ)上引入卷積注意力機(jī)制,改善特征提取性能;并通過(guò)域適應(yīng)實(shí)現(xiàn)了軸承故障的變工況遷移識(shí)別。實(shí)驗(yàn)結(jié)果表明,通過(guò)深層卷積神經(jīng)網(wǎng)絡(luò)的自動(dòng)學(xué)習(xí),解決了傳統(tǒng)淺層機(jī)器學(xué)習(xí)需要手動(dòng)提取特征的不足;通過(guò)將特征分布差異和標(biāo)簽概率分布差異最小化,提取了源域和目標(biāo)域樣本集中的域不變特征,解決了不同運(yùn)行工況下標(biāo)簽數(shù)據(jù)不足導(dǎo)致的軸承故障識(shí)別準(zhǔn)確率低的問(wèn)題。本文提出的方法在跨工況情境下,利用大量的無(wú)標(biāo)簽?zāi)繕?biāo)域輔助數(shù)據(jù)即可實(shí)現(xiàn)較好的跨工況軸承故障診斷效果,為提高機(jī)械實(shí)際作業(yè)中的故障識(shí)別準(zhǔn)確率提供了新思路。