鄒 建
(成都天奧測控技術(shù)有限公司,成都 611731)
滾動軸承作為機械裝備中被廣泛使用的零部件之一,對其進行故障診斷可以大幅度提高機械裝備的工作穩(wěn)定性[1]。滾動軸承通常在變工況條件(如轉(zhuǎn)速不同、受力大小以及受力方式不同等)下工作,復雜的變工況條件不僅會造成軸承各類故障(例如:軸承內(nèi)圈故障,軸承外圈故障,滾動體故障),同時由于軸承當前工況的類標簽很難獲取甚至無法獲取,造成滾動軸承故障診斷當前工況(即源域)可用樣本少。此外,不同的工況也會導致歷史工況(即目標域)樣本與當前工況樣本之間的概率分布存在差異,包括邊緣概率分布和條件概率分布。因此,利用歷史工況下的有標簽樣本對當前工況的滾動軸承樣本進行故障診斷具有重要意義,但也面臨著挑戰(zhàn)。
目前滾動軸承故障診斷方法主要分為信號處理法、解析模型法和數(shù)據(jù)驅(qū)動法三類[3]。3種方法的共同點在于都需要提取特征值作為故障識別的基礎(chǔ),而且都依賴于閾值判斷;不同之處在于辨識模型的差異:信號處理法能夠快速實現(xiàn)在線診斷而且利用小波分析可以最大程度的保證故障診斷準確性,但是需要對研究對象熟悉度高,并且選取故障特征值較困難而且通用性差。解析模型不需要先驗知識而且有較快的診斷速度,但是對模型的準確性要求較高,容易因參數(shù)偏差、采樣誤差等外界因素帶來模型估計誤差,從而影響診斷結(jié)果的準確性。數(shù)據(jù)驅(qū)動法結(jié)合人工智能算法實現(xiàn)故障特征的自動分類與識別,不需要了解系統(tǒng)模型與工作機理,抗擾性強,對于復雜系統(tǒng)的故障診斷具有明顯優(yōu)勢,但是該類方法相對復雜、依賴大量歷史數(shù)據(jù)并且其診斷速度依賴于算法自身的計算復雜度以及計算機的硬件性能。
由于計算機性能的提升使得診斷速度慢的問題可以得到有效解決,因此選擇利用歷史工況數(shù)據(jù)驅(qū)動法來解決變工況條件下的滾動軸承故障診斷問題已成為研究熱點和技術(shù)趨勢。文獻[4]將通道注意力機制引入多尺度非對稱卷積模塊用于提取滾動軸承故障特征,然后將多尺度非對稱卷積模塊中的全連接層改進為膠囊全連接層用于對滾動軸承進行故障分類。文獻[5]引入均勻化分布Chebyshev混沌映射和自適應慣性權(quán)重到麻雀算法中,提高麻雀算法(SSA,sparrow search algorithm)的全局和局部搜索能力,并將該改進的麻雀算法用于支持向量機(SVM,support vector machine)的參數(shù)優(yōu)化,優(yōu)化后的支持向量機再用于對滾動軸承的故障信號進行分類診斷。文獻[6]將全局可微的稀疏模型引入深度神經(jīng)網(wǎng)絡來學習具有數(shù)據(jù)協(xié)同鏈接性能的深度網(wǎng)絡稀疏去噪(DNSD,deep network-based sparse denoising)網(wǎng)絡的超參數(shù),并利用優(yōu)化后的該網(wǎng)絡對模擬滾動軸承故障信號數(shù)據(jù)集進行故障診斷。文獻[7]利用卷積神經(jīng)網(wǎng)絡(CNN,convolutional neural network,)從時頻圖像中提取滾動軸承固有故障的特征。最后,將提取的特征輸入到gcForest分類器中,以實現(xiàn)對滾動軸承故障的準確診斷。文獻[8]利用變分頻域特征提取器提取特征,然后局部異常因子對離群點進行剔除,最后將特征輸入分類器對滾動軸承進行故障診斷。
然而,以上基于傳統(tǒng)機器學習的數(shù)據(jù)驅(qū)動方法都是基于概率分布一致的假設(shè),并且在提取特征時缺乏對樣本特征本身的深度提取和信息融合,因此在變工況條件下的域泛化能力[9]以及診斷精度并不高。遷移學習[10](Transfer Learning)具有良好的域泛化性能,能適應變工況條件下樣本概率分布不一致的問題;而多頭自注意力機制[11](Multi-Head Self-Attention Mechanism)能有效考慮到樣本特征提取時的信息融合問題,即它能將深層分類信息融合進卷積特征提取網(wǎng)絡[12]中,使所提取的特征有更好的分類性[13-14]。因此,本文結(jié)合遷移學習、多頭自注意力機制和卷積神經(jīng)網(wǎng)絡的各自優(yōu)勢,提出了一種具有更好的域泛化性能和分類性能的新型遷移學習方法——卷積注意力特征遷移學習(CAFTL,convolutional attention-based feature transfer learning)用于滾動軸承故障診斷,該方法可提高變工況條件下的滾動軸承故障診斷準確性。
CAFTL主要由卷積多頭自注意力特征提取網(wǎng)絡和域自適應遷移學習網(wǎng)絡構(gòu)成。首先,對空間滾動軸承原始振動加速度信號樣本做適應多頭自注意力輸入形式的編碼預處理,得到對應的注意力分數(shù)之后,將注意力分數(shù)與源域以及目標域樣本相加,再經(jīng)過歸一化層,歸一化層輸出的結(jié)果再輸入到卷積神經(jīng)網(wǎng)絡中得到對應的源域和目標域特征;然后通過域自適應遷移學習網(wǎng)絡將兩域特征投影到同一個公共特征空間內(nèi),接著利用由源域有標簽樣本構(gòu)建的分類器進行分類。最后,利用隨機梯度下降法對整個CAFTL進行訓練和更新,得到CAFTL對目標診斷任務的最優(yōu)參數(shù),再利用訓練好的CAFTL對待測樣本進行故障診斷。
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
然后,利用縮放點積方式計算源域和目標域樣本多頭自注意力:
(9)
(10)
圖1 多頭注意力計算示意圖
(11)
(12)
(13)
(14)
提取到高維特征后,通過分布差異度量函數(shù)φ(·)來構(gòu)造如下高維特征遷移損失函數(shù)l(θ):
(15)
于是可以通過優(yōu)化該特征遷移損失函數(shù)來學習域自適應遷移學習網(wǎng)絡的參數(shù)集θ,以實現(xiàn)源域樣本高維特征向目標域樣本高維特征的遷移,使得它們之間的概率分布差異最小化。
接下來,利用由源域有標簽的樣本構(gòu)建的分類器對同分布的目標域待測樣本進行分類。首先計算目標域待測樣本的高維特征與源域帶類別標簽樣本特征的相似度,相似度度量函數(shù)為ζ(·,·),并選擇相似度最大的源域高維特征所對應的類標簽作為滾動軸承目標域待測樣本的預測偽類標簽kl(kl代表目標域第l個樣本對應的偽類標簽),該過程表達如下:
(16)
隨后,計算該目標域待測樣本屬于偽類標簽kl的概率如下:
(17)
接下來,將所有目標域待測樣本屬于其對應的偽類標簽概率的負對數(shù)之和作為分類損失函數(shù)Φ(θ),該分類損失函數(shù)推導如下:
(18)
然后,結(jié)合域自適應遷移學習網(wǎng)絡的特征遷移損失函數(shù)l(θ)以及分類損失函數(shù)Φ(θ)作為CAHTL的聯(lián)合損失函數(shù)數(shù)Γ(θ),該聯(lián)合損失函數(shù)表達如下:
Γ(θ)=ρl(θ)+Φ(θ)=
(19)
式(19)中,ρ為聯(lián)合損失函數(shù)的平衡約束參數(shù),分別用于約束域自適應遷移學習網(wǎng)絡的局部尋優(yōu)行為。
使用隨機梯度下降法(SGD)將CAFTL的聯(lián)合損失函數(shù)訓練至收斂。假設(shè)第λ次訓練CAFTL學習網(wǎng)絡的參數(shù)初始值集合為θλ,則參數(shù)更新過程表達如下:
θλ+1=θλ-α▽θΓ(θλ)=θλ-α▽θ[ρl(θ)+Φ(θ)]=
(20)
待CAFTL訓練完成后,就完成對CFHTL網(wǎng)絡的參數(shù)微調(diào),此時得到CAFTL對該任務的最優(yōu)參數(shù)θ*,也即完成對CAFTL的訓練。
(21)
基于CAFTL的滾動軸承故障診斷方法的實現(xiàn)過程如圖2所示,具體說明如下:
圖2 基于CAFTL的滾動軸承故障診斷方法實現(xiàn)過程
1)將滾動軸承源域(即歷史工況)帶標簽樣本和目標域(即當前工況)待測樣本進行域切分并矩陣變換后,計算各自的多頭自注意力分數(shù),然后將多頭自注意力分數(shù)與源域、目標域樣本相加,再經(jīng)過層歸一化處理,層歸一化處理后得到的計算結(jié)果輸入到卷積神經(jīng)網(wǎng)絡中得到對應的源域和目標域樣本的高維特征。
2)將源域樣本的高維特征和目標域樣本的高維特征通過域自適應遷移學習網(wǎng)絡遷移到同一公共特征空間內(nèi),并且構(gòu)造域自適應遷移學習網(wǎng)絡的特征遷移損失函數(shù)。通過優(yōu)化該特征遷移損失函數(shù)以達到將不同分布的樣本在公共特征空間內(nèi)最大化同分布的目的。
3)利用由源域有標簽的樣本構(gòu)建的分類器對同分布的目標域待測樣本進行分類,并且構(gòu)造分類損失函數(shù)。
4)結(jié)合特征遷移損失函數(shù)和分類損失函數(shù)來構(gòu)造CAFTL的聯(lián)合損失函數(shù),采用隨機梯度下降法將聯(lián)合損失函數(shù)訓練至收斂,完成對CAFTL參數(shù)的微調(diào),即得到CAHFL的最優(yōu)參數(shù)集。
5)將訓練好的CAFTL用于對目標域待測樣本的分類,完成滾動軸承的故障診斷全過程。
本文使用的實驗數(shù)據(jù)來自凱斯西儲大學電氣工程實驗室滾動軸承數(shù)據(jù)中心。實驗使用了驅(qū)動端滾動軸承(型號為SKF6205—2RS)的振動加速度數(shù)據(jù)作為實驗數(shù)據(jù)源(實驗平臺如圖3所示)。為了模擬故障情況,實驗室通過采用電火花加工的方式,在軸承的內(nèi)圈、外圈和滾動體上各加工了一個小槽,槽的直徑為0.335 6 mm,深度為0.279 mm。信號采集儀以12 kHz的采樣頻率采集了C1、C2和C3三種工況下的滾動軸承振動加速度信號。每個樣本由連續(xù)的1 024個振動加速度數(shù)據(jù)點組成。在每種工況下,分別獲得了約220個內(nèi)圈點蝕故障、外圈點蝕故障、滾動體點蝕故障和正常狀態(tài)的樣本,總共有220×4個樣本。
圖3 凱斯西儲大學滾動軸承故障模擬實驗平臺
表1中被標記為工況C4的實驗數(shù)據(jù)是來自Cincinnati大學的常規(guī)滾動軸承加速壽命試驗數(shù)據(jù)。如圖4所示,將4個型號為ZA-2115雙列滾子軸承安裝在軸承試驗臺的旋轉(zhuǎn)軸上,使用轉(zhuǎn)速為2 000 r/min的電機通過皮帶驅(qū)動轉(zhuǎn)軸,并通過彈簧機構(gòu)在轉(zhuǎn)軸和軸承上施加6 000 lbs的徑向載荷,采樣頻率為20 kHz,每10 min采集一次軸承的振動加速度數(shù)據(jù)。對每次采集的加速度數(shù)據(jù)截取前1 024個連續(xù)點作為一個樣本,共獲得1號雙列滾子軸承全壽命期的984個樣本。
表1 實驗工況表
圖4 Cincinnati大學滾動軸承加速壽命退化實驗臺
為了更真實地模擬工業(yè)現(xiàn)場環(huán)境,對表1中所有工況下的全部故障的振動加速度數(shù)據(jù)加入高斯白噪聲,使這些數(shù)據(jù)的信噪比為-2 dB。
CAFTL參數(shù)設(shè)置如下:特征提取網(wǎng)絡中小區(qū)域樣本切分個數(shù)H=32,小區(qū)域長度d=32;多頭自注意力頭數(shù)為4頭(g=4),每個頭的輸入向量維度為8維;特征映射函數(shù)F(·)都采用五層的卷積神經(jīng)網(wǎng)絡,該網(wǎng)絡的具體配置如表2所示;域自適應遷移學習網(wǎng)絡中的分布差異度量函數(shù)φ(·)選擇最大均值差異(MMD,Max Mean Discrepancy)[15],即:
表2 五層卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)表
(22)
(23)
式中,a、b分別表示向量;故障類別數(shù)K=4;平衡約束參數(shù)ρ=0.7;CAFTL網(wǎng)絡參數(shù)學習率α=2e-4。基于CAFTL的故障診斷方法的參數(shù)設(shè)置好后在以下的所有實驗中就一直保持不變。
在本實驗中,將工況C1下的滾動軸承內(nèi)圈故障、外圈故障、滾動體故障以及正常狀態(tài)樣本作為源域(有標簽樣本),工況C3下樣本作為目標域(無標簽樣本)用于滾動軸承故障診斷實驗(即:C1→C3)。實驗開始之前,在源域中按照1∶3∶4∶1的比例選取內(nèi)圈故障樣本數(shù)為40,外圈故障樣本數(shù)為120,滾動體故障樣本數(shù)為160和正常狀態(tài)樣本數(shù)為40用作源域有類標簽訓練樣本;在目標域按照2∶1∶3∶3的比例選取內(nèi)圈故障樣本數(shù)為60,外圈故障樣本數(shù)為30,滾動體故障樣本數(shù)為90和正常狀態(tài)樣本數(shù)為90用作目標域待測樣本。按照第2節(jié)所述的基于CAFTL的故障診斷方法的實現(xiàn)流程,將源域和目標域樣本輸入到設(shè)置好參數(shù)的CAFTL來對工況C3下的滾動軸承進行故障診斷。實驗結(jié)束后,將本文所提出的CAFTL獲得的各故障診斷準確率和平均診斷準確率與其他4種典型遷移學習方法,即:中心力矩匹配[17](CMD,central moment matching)、域遷移多核學習[18](DTMKL,domain transfer multiple kernel learning)、遷移聯(lián)合匹配[19](TJM,transfer joint matching)和分發(fā)匹配嵌入(DME,distribution matching embedding)做了比較。其中,使用了k折交叉驗證方法來優(yōu)化CMD、DTMKL和TJM的參數(shù)以確保它們能夠獲得最高的滾動軸承故障診斷精度。優(yōu)化后的參數(shù)如下:對于CMD,其學習速率為η=e-2,其平衡約束參數(shù)為λ=0.30;對于DTMKL,其正則化參數(shù)為λ=0.30,其子空間維數(shù)為D=3;對于TJM,其正則化參數(shù)為λ=0.25,其子空間維數(shù)為D=4;對于DME,其懲罰因子為λ=0.25。為了降低隨機性帶來的誤差,每種方法取了前20次實驗結(jié)果的平均值作為最后的實驗結(jié)果,實驗對比結(jié)果如表3所示。同時為了直觀地驗證CAFTL遷移和分類的有效性,利用t-分布隨機鄰域嵌入 (t-SNE,t-distributed stochastic neighbor embedding)算法[20]將CAFTL以及其它4種被對比方法提取到的高維特征降維到二維平面,并以散點圖的形式呈現(xiàn)在圖5~9中。
表3 C1→C3時4種遷移學習方法的故障診斷準確率
圖5 CAFTL輸出的高維特征經(jīng)t-SNE降維后的散點圖
圖6 CMD輸出的高維特征經(jīng)t-SNE降維后的散點圖
圖7 DTMKL輸出的高維特征經(jīng)t-SNE降維后的散點圖
圖8 TJM輸出的高維特征經(jīng)t-SNE降維后的散點圖
圖9 DME輸出的高維特征經(jīng)t-SNE降維后的散點圖
由表3可知,基于CAFTTL的方法在源域和目標域樣本所處的工況條件不同并且對兩域樣本都增加了高斯白噪聲的情況下,依舊保持著良好的分類性能,并且分類精度始終優(yōu)于基于CMD的故障診斷方法、基于DTMKL的故障診斷方法、基于TJM的故障診斷方法以及、基于DME的故障診斷方法。由圖5~9的對比結(jié)果亦可知,所提出的CAFTL相比CMD、DTMKL、TJM和DME這4種遷移學習方法能使得源域和目標域中相同類別的樣本更好地聚合在一起,且能使兩域中不同類別的樣本之間也相對更為分散,因此相比后4種遷移學習方法,CAFTL的遷移和分類性能更好,從而基于CAFTL的滾動軸承故障診斷方法的診斷精度也就更高。
在本實驗中,將工況C1下的滾動軸承內(nèi)圈故障、外圈故障、滾動體故障以及正常狀態(tài)樣本作為源域(有標簽樣本),工況C3下樣本作為目標域(無標簽樣本)用于滾動軸承故障診斷實驗(即:C1→C4)。實驗開始之前,在源域中按照4∶1∶2∶3的比例選取內(nèi)圈故障樣本數(shù)為160,外圈故障樣本數(shù)為40,滾動體故障樣本數(shù)為80和正常狀態(tài)樣本數(shù)為120用作源域有類標簽訓練樣本;在目標域按照2∶1∶4∶3的比例選取內(nèi)圈故障樣本數(shù)為80,外圈故障樣本數(shù)為40,滾動體故障樣本數(shù)為160和正常狀態(tài)樣本數(shù)為120用作目標域待測樣本。按照第2節(jié)所述的基于CAFTL的故障診斷方法的實現(xiàn)流程,將源域和目標域樣本輸入到設(shè)置好參數(shù)的CAFTL來對工況C4下的滾動軸承進行故障診斷。為了降低隨機性帶來的誤差,每種方法取了前20次實驗結(jié)果的平均值作為最后的實驗結(jié)果,實驗對比結(jié)果如表4所示。
表4 C1→C4時4種遷移學習方法的故障診斷準確率
由表4可知,在源域和目標域樣本概率分布不一致的前提下,基于CAFTL的方法在源域和目標域樣本所處的工況條件不同并且對兩域樣本都增加了高斯白噪聲的情況下,依舊保持著良好的分類性能,并且分類精度始終優(yōu)于基于CMD的故障診斷方法、基于DTMKL的故障診斷方法、基于TJM的故障診斷方法以及、基于DME的故障診斷方法。
實驗開始之前,在源域中按照4∶1∶2∶3的比例選取內(nèi)圈故障樣本數(shù)為160,外圈故障樣本數(shù)為40,滾動體故障樣本數(shù)為80和正常狀態(tài)樣本數(shù)為120用作源域有類標簽訓練樣本;在目標域按照2∶1∶4∶3的比例選取內(nèi)圈故障樣本數(shù)為80,外圈故障樣本數(shù)為40,滾動體故障樣本數(shù)為160和正常狀態(tài)樣本數(shù)為120用作目標域待測樣本。在 C1→C3,C1→C4,C2→C3,C2→C4,4種情況下對多頭自注意力機制經(jīng)行消融實驗,并且取前30次實驗結(jié)果的平均值作為消融實驗結(jié)果,結(jié)果如表5所示。并且,將算法實時性結(jié)果記錄在表6中。
表5 消融實驗平均識別準確率對比
表6 算法實時性
由表6結(jié)果可知,多頭注意力機制會增加算法的計算復雜度,從而導致算法的實時性降低。通過表5的消融實驗結(jié)果可以看出注意力機制對于模型的識別精度有一定的提升,這也進一步證明了本文所提方法的有效性。
本文所提出的CAFTL通過優(yōu)化域自適應遷移學習網(wǎng)絡中的特征遷移損失函數(shù)使得源域和目標域樣本分布差異最小化,因此它具有較好的域泛化性能,可以適應更多的變工況環(huán)境。其次,CAFTL融合了多頭自注意力機制,而多頭自注意力機制中不同的頭可以提取到不同的故障信息,提取到的故障信息越多,就使CAFTL后續(xù)提取到的高維特征具有更好的分類性。因CAFTL在域泛化性能和分類性能這兩方面的優(yōu)勢,使其在滾動軸承源域和目標域樣本概率分布不一致的情況下,依舊能夠保持對目標域待測樣本較高的故障診斷精度,且其對待測樣本的故障診斷精度總是高于典型遷移學習方法所能得到的滾動軸承故障診斷精度。