楊 青, 王笑臣, 吳東升, 董巖松
(沈陽(yáng)理工大學(xué) 自動(dòng)化與電氣工程學(xué)院,遼寧 沈陽(yáng) 110159)
在工業(yè)4.0、數(shù)字化以及工業(yè)互聯(lián)網(wǎng)的大力推動(dòng)下,智能制造的發(fā)展更為迅速。同時(shí),隨著互聯(lián)網(wǎng)、智能制造的不斷推進(jìn),機(jī)械設(shè)備安全面臨著更為嚴(yán)峻的考驗(yàn)。滾動(dòng)軸承作為機(jī)械設(shè)備中重要的旋轉(zhuǎn)零件,也是機(jī)械設(shè)備的重要故障源之一。滾動(dòng)軸承的狀態(tài)監(jiān)測(cè)與故障診斷技術(shù),在了解軸承的性能狀態(tài)和及時(shí)發(fā)現(xiàn)潛在故障等方面起著至關(guān)重要的作用。
近年來(lái),以大數(shù)據(jù)為背景的深度學(xué)習(xí)方法在目標(biāo)檢測(cè)[1]、語(yǔ)義分割[2]、圖像分類(lèi)[3]和雷達(dá)[4]等任務(wù)上取得了迅猛發(fā)展。當(dāng)有足夠的樣本數(shù)量時(shí),基于遷移學(xué)習(xí)的方法已經(jīng)實(shí)現(xiàn)了良好且穩(wěn)定的性能,如基于微調(diào)的方法[5]、基于度量的方法[6-8]和基于對(duì)抗的方法[9-11]等。在故障診斷領(lǐng)域,越來(lái)越多的學(xué)者也將深度學(xué)習(xí)方法應(yīng)用于滾動(dòng)軸承的狀態(tài)監(jiān)測(cè)[12],且取得了不錯(cuò)的故障診斷效果。但在實(shí)際應(yīng)用中,有些設(shè)備的信號(hào)獲取極其困難,當(dāng)采集到的各類(lèi)故障數(shù)據(jù)都很稀少時(shí)(振動(dòng)信號(hào)生成的灰度圖往往只有幾幅或十幾幅),基于遷移學(xué)習(xí)的方法往往會(huì)在目標(biāo)域出現(xiàn)過(guò)擬合的現(xiàn)象,魯棒性不佳,會(huì)陷入小樣本困境[13],導(dǎo)致模型無(wú)法充分訓(xùn)練,只能學(xué)習(xí)到少量的特征信息,從而引發(fā)嚴(yán)重的過(guò)擬合問(wèn)題。滾動(dòng)軸承故障診斷中,樣本分布不均衡會(huì)降低算法對(duì)故障的診斷效果,使模型更偏向于正常類(lèi)別。
為緩解此類(lèi)問(wèn)題的出現(xiàn),基于元學(xué)習(xí)[14]的方法利用歷史經(jīng)驗(yàn)來(lái)引導(dǎo)新任務(wù)的學(xué)習(xí)。Oreshkin等[15]提出一種基于度量的元學(xué)習(xí)算法TADAM,通過(guò)輔助任務(wù)協(xié)同訓(xùn)練,使得具有任務(wù)依賴(lài)性的特征提取更容易訓(xùn)練,并且具有很好的泛化能力。近幾年,MTL(Meta Transfer Learning,元遷移學(xué)習(xí))算法的出現(xiàn)進(jìn)一步提升了小樣本的檢測(cè)精度。楊青等[16]提出基于MTLSAM模型實(shí)現(xiàn)了小樣本下的變工況故障診斷。Li等[17]提出的ADMTL方法實(shí)現(xiàn)了少樣本細(xì)粒度下的故障診斷。盡管當(dāng)前對(duì)元遷移學(xué)習(xí)的研究取得了很多進(jìn)展,但其提取特征的能力[18-20]仍有待提高。宋振軍等[21]利用ECA-ResNet解決了軸承故障診斷中故障分類(lèi)模型參數(shù)多且泛化性能弱、故障識(shí)別率低、識(shí)別速度慢的問(wèn)題。狄子鈞等[22]提出基于多尺度高效通道注意力網(wǎng)絡(luò)的刀具故障診斷方法,提升了刀具磨損狀態(tài)診斷精度。
以上方法使得單工況和變工況的故障診斷取得了較好的效果,但在實(shí)際工程應(yīng)用中,針對(duì)軸承故障,往往采用停機(jī)拆解、逐一檢測(cè)的方法來(lái)判斷具體的故障位置。該方法的操作復(fù)雜,且必須停止整條生產(chǎn)線,影響了生產(chǎn)效率。
針對(duì)上述問(wèn)題,本文在預(yù)訓(xùn)練階段引入高效通道網(wǎng)絡(luò)增強(qiáng)模型對(duì)重要特征的關(guān)注度,從而提高模型的分類(lèi)和泛化能力。同時(shí),利用元學(xué)習(xí)可快速學(xué)習(xí)歷史經(jīng)驗(yàn)和知識(shí)的特點(diǎn),對(duì)數(shù)據(jù)進(jìn)行分段處理,將前70%的部分作為歷史經(jīng)驗(yàn),后一小部分作為現(xiàn)有的知識(shí),模擬在線變工況軸承故障診斷。
小樣本是指訓(xùn)練類(lèi)別樣本較少的情況下,進(jìn)行相關(guān)的學(xué)習(xí)任務(wù),通過(guò)學(xué)習(xí)大量的基類(lèi)后,僅僅需要少量樣本就能快速學(xué)習(xí)到新類(lèi)。
同時(shí)小樣本的訓(xùn)練集中包含了多個(gè)類(lèi)別,每個(gè)類(lèi)別中有多個(gè)樣本。在訓(xùn)練階段,從訓(xùn)練集中隨機(jī)抽取N個(gè)類(lèi)別,每個(gè)類(lèi)別K個(gè)樣本(總共NK個(gè)數(shù)據(jù))構(gòu)建一個(gè)元任務(wù),作為模型輸入,再?gòu)倪@N類(lèi)中剩余的數(shù)據(jù)中抽取一批樣本作為模型的預(yù)測(cè)對(duì)象。
MTL[23]是一種結(jié)合元學(xué)習(xí)和遷移學(xué)習(xí)來(lái)進(jìn)行圖像分類(lèi)的算法。該算法分為2個(gè)階段:① 預(yù)訓(xùn)練階段;② 元訓(xùn)練階段。預(yù)訓(xùn)練階段用大量帶標(biāo)簽的數(shù)據(jù)集訓(xùn)練基礎(chǔ)網(wǎng)絡(luò),再將基礎(chǔ)網(wǎng)絡(luò)遷移至小樣本數(shù)據(jù)集進(jìn)行元學(xué)習(xí)。由于基礎(chǔ)網(wǎng)絡(luò)參數(shù)量過(guò)大,直接微調(diào)可能增加過(guò)擬合風(fēng)險(xiǎn),因此該算法在微調(diào)階段設(shè)計(jì)了SS(Scaling and Shift,SS)操作,為每個(gè)“凍結(jié)”的卷積核添加縮放與移位參數(shù)ΦS1和ΦS2(如圖1深色部分),去適應(yīng)新的小樣本學(xué)習(xí)任務(wù)。同時(shí),針對(duì)小樣本學(xué)習(xí)場(chǎng)景,模型不需要更新所有參數(shù)。SS操作如式(1)所示。
圖1 SS操作
SS(X;W,b;ΦS(1,2))=(W⊙ΦS1)X+(b+ΦS2)
(1)
式中:SS為SS操作的函數(shù)表示;X為輸入;⊙為逐元素相乘;S1和S2為元學(xué)習(xí)器。圖1為SS操作示意圖。
Wang等[24]于2019年提出了無(wú)須降維的輕量級(jí)注意模塊ECANet(Efficient Channel Attention Network,高效通道注意力網(wǎng)絡(luò)),如圖2所示,在保證涉及極少參數(shù)的同時(shí),大幅度提升了網(wǎng)絡(luò)模型的性能。因?yàn)镋CANet通道交互信息范圍由卷積核K的尺寸來(lái)確定,且每一組權(quán)重完全相同,因此,模塊所需參數(shù)減少。而隨著通道數(shù)C變化的同時(shí),K也隨之變化,所以C與K存在某種映射Φ:
圖2 ECANet結(jié)構(gòu)
C=Φ(K)
(2)
最簡(jiǎn)單的映射是線性函數(shù),即
C=Φ(K)≈γ×K-b
(3)
但由于線性函數(shù)對(duì)于某些相關(guān)特征的局限性,這里采用以2為底的指數(shù)函數(shù)來(lái)表示非線性映射關(guān)系:
C=Φ(K)=2γ×K-b
(4)
因此給定通道維數(shù)C,自適應(yīng)確定尺寸K:
(5)
式中:|t|odd為最接近的t的奇數(shù),本文中的所有實(shí)驗(yàn)將取γ和b分別為2和1。
ECAMTL網(wǎng)絡(luò)模型如圖3左側(cè)所示,它是由特征提取器和分類(lèi)器組成,具體如下。
圖3 ECAMTL故障診斷流程圖
特征提取器:以ResNet[25]為基礎(chǔ)網(wǎng)絡(luò),通過(guò)引入ECANet,在不增加模型復(fù)雜度的前提下,獲得性能提升,增強(qiáng)模型對(duì)重要特征的關(guān)注度,如圖3黑色虛線部分所示。
分類(lèi)器:采用一個(gè)全連接層FC-Classification與Sofmax層作為類(lèi)別分類(lèi)器,全連接層對(duì)特征提取器的輸出進(jìn)行處理,并采用Sofmax對(duì)輸出進(jìn)行歸一化處理,從而獲得輸入數(shù)據(jù)屬于每個(gè)類(lèi)別的概率。
同時(shí),在算法中添加正則化項(xiàng)的交叉熵?fù)p失函數(shù)來(lái)緩解過(guò)擬合問(wèn)題。
本文提出的基于ECAMTL的變工況軸承故障診斷方法流程圖如圖3所示。
預(yù)訓(xùn)練階段:將12 kHz采樣頻率下的4種工況、5種故障類(lèi)型,共20類(lèi)作為預(yù)訓(xùn)練特征提取網(wǎng)絡(luò)的輸入。同時(shí)用梯度下降算法優(yōu)化特征提取器Θ和分類(lèi)器θ:
[Θ;θ]=[Θ;θ]-α▽LD{[Θ;θ]}
(6)
式中:α為學(xué)習(xí)率;LD為交叉熵?fù)p失函數(shù)。
(7)
元學(xué)習(xí)階段:本階段將丟棄分類(lèi)器θ,對(duì)48 kHz采樣頻率下的某一工況進(jìn)行隨機(jī)采樣,并形成100個(gè) 5way 5shot和 5way 1shot 的元學(xué)習(xí)任務(wù),將預(yù)訓(xùn)練好的特征參數(shù)與元學(xué)習(xí)器結(jié)合,形成新的元學(xué)習(xí)模型。
元測(cè)試階段:對(duì)不同工況的故障數(shù)據(jù)進(jìn)行隨機(jī)采樣,輸入到訓(xùn)練好的元學(xué)習(xí)模型種,得到變工況診斷結(jié)果。
為了驗(yàn)證本文所提方法的有效性,采用美國(guó)凱斯西儲(chǔ)大學(xué)[26](Case Western Reserve University,CWRU)和東南大學(xué)[27]開(kāi)放軸承數(shù)據(jù)庫(kù)的樣本進(jìn)行實(shí)驗(yàn)分析。本實(shí)驗(yàn)所用的環(huán)境配置如下:CPU為Intel Core i7-8700;GPU為INVIDIA GTX 1080 Ti;深度學(xué)習(xí)框架為 Tensorflow 和 Pytorch。
(1) CWRU數(shù)據(jù)。
本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自于CWRU的軸承數(shù)據(jù)中心。選用電機(jī)型號(hào)為 SKF6205 的深溝球軸承,振動(dòng)信號(hào)由16通道的加速度傳感器垂直固定在風(fēng)扇端和驅(qū)動(dòng)端的軸承座上方采集而得,采樣頻率分別為12 kHz和48 kHz。
選取12 kHz風(fēng)扇端作為預(yù)訓(xùn)練數(shù)據(jù)集,目的是為了通過(guò)預(yù)訓(xùn)練得到特征提取模塊,為后續(xù)元訓(xùn)練、元測(cè)試做鋪墊。同時(shí)選取48 kHz驅(qū)動(dòng)端數(shù)據(jù)集用于元學(xué)習(xí)階段,以驗(yàn)證ECAMTL模型的優(yōu)越性。
本文將數(shù)據(jù)集隨機(jī)劃分為元訓(xùn)練數(shù)據(jù)集、元驗(yàn)證數(shù)據(jù)集和元測(cè)試數(shù)據(jù)集。每個(gè)子集隨機(jī)抽取5個(gè)類(lèi)別,每個(gè)類(lèi)別隨機(jī)抽取5個(gè)樣本進(jìn)行 5way 5shot訓(xùn)練,隨機(jī)抽取一個(gè)樣本進(jìn)行 5way 1shot訓(xùn)練。
(2) 東南大學(xué)數(shù)據(jù)。
泛化實(shí)驗(yàn)數(shù)據(jù)來(lái)自東南大學(xué)的傳動(dòng)系統(tǒng)動(dòng)態(tài)模擬器(Driveline Dynamics Simulator,DDS)。數(shù)據(jù)來(lái)源于傳動(dòng)系統(tǒng)動(dòng)態(tài)模擬器。該數(shù)據(jù)集包含2個(gè)子數(shù)據(jù)集,包括軸承數(shù)據(jù)和齒輪數(shù)據(jù),均通過(guò)DDS獲取。有轉(zhuǎn)速-負(fù)荷配置為20 Hz-0 V和30 Hz-2 V這2種工況。在每種工況下,考慮了滾珠裂紋(Ball Cracks,BC)、內(nèi)環(huán)裂紋(Inner Ring Cracks,IRC)、內(nèi)外環(huán)裂紋(Inner Outer Ring Crack,IORC)和正常(Health)4種軸承故障狀態(tài)。變工況故障診斷任務(wù)為20 Hz-0 V~30 Hz-2 V(將訓(xùn)練好的12 kHz風(fēng)扇端預(yù)訓(xùn)練模型用20 Hz-0 V的工況數(shù)據(jù)集進(jìn)行元訓(xùn)練,得到的結(jié)果對(duì)30 Hz-2 V的工況進(jìn)行測(cè)試,實(shí)現(xiàn)跨型號(hào)的變工況故障診斷)。由于東南大學(xué)的軸承數(shù)據(jù)集有4類(lèi)故障狀態(tài),所以須重新采樣。每個(gè)子集隨機(jī)抽取4個(gè)類(lèi)別,每個(gè)類(lèi)別隨機(jī)抽取4個(gè)樣本進(jìn)行 4way 4shot訓(xùn)練,隨機(jī)抽取一個(gè)樣本進(jìn)行 4way 1shot訓(xùn)練。
目前基于DNN[28]等方法可以直接處理一維數(shù)據(jù),但在干擾較多的實(shí)際環(huán)境下,數(shù)據(jù)的特征會(huì)被模糊化,一維數(shù)據(jù)的特征提取分析尤為困難?;谝陨蠁?wèn)題,在數(shù)據(jù)處理階段,對(duì)一維信號(hào)進(jìn)行二維化。步驟如下。
① 生成初始圖像為64×64個(gè)像素點(diǎn)且元素都為0的矩陣。
② 用長(zhǎng)度為64×64的窗口滑動(dòng),并在原始時(shí)域信號(hào)上分割樣本,然后從原始時(shí)域信號(hào)中選擇長(zhǎng)度為64×64的振動(dòng)信號(hào)樣本。
③ 利用式(8)對(duì)矩陣進(jìn)行歸一化處理,將得到的結(jié)果依次填充到構(gòu)建圖像的行中,以完成尺寸為4 096的灰度頻譜圖像的構(gòu)建。
(8)
式中:x為預(yù)處理數(shù)據(jù);ymin、ymax為列最小值和最大值;xmin、xmax為行最小值和最大值。
4種工況5種故障類(lèi)型共20類(lèi)3 812個(gè)樣本。實(shí)驗(yàn)數(shù)據(jù)劃分如圖4所示,轉(zhuǎn)換后的灰度圖如圖5所示。數(shù)據(jù)集的故障類(lèi)別和工況如表1和表2所示。
表1 CRWU軸承樣本的5種故障類(lèi)別
表2 CRWU軸承樣本的4種工況
圖4 實(shí)驗(yàn)數(shù)據(jù)劃分
圖5 故障灰度圖
為了驗(yàn)證本文方法在小樣本下變工況故障診斷方面的有效性,分別與MAML[29](Model-Agnostic Meta-Learning)、Protonet[30]、Baseline[31]這3種效果較好的方法進(jìn)行對(duì)比,本節(jié)實(shí)驗(yàn)選取CWRU軸承數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象分別進(jìn)行變工況故障診斷實(shí)驗(yàn)(故障類(lèi)型如表1所示)。4種工況具體情況如表2所示,5種方法試驗(yàn)?zāi)P偷膮?shù)為:網(wǎng)絡(luò)的輸入為64×64的灰度圖;初始學(xué)習(xí)率為0.01;批次大小為32;迭代次數(shù) 5way 1shot為15次、 5way 5shot為15次。同時(shí)為了避免實(shí)驗(yàn)結(jié)果的偶然性,每種方法各測(cè)試10次后取平均準(zhǔn)確率,結(jié)果如表3、表4、圖6所示。
表3 變工況故障診斷結(jié)果(5way 1shot)
表4 變工況故障診斷結(jié)果(5way 5shot)
圖6 平均訓(xùn)練測(cè)試時(shí)間( 5way 5shot)
通過(guò)對(duì)比不同模型的識(shí)別結(jié)果發(fā)現(xiàn):在變工況條件下,ECAMTL的識(shí)別精度相較于其他方法均有不同程度的提升,且5shot的準(zhǔn)確率全部?jī)?yōu)于1shot的準(zhǔn)確率,這是因?yàn)?shot所包含的故障信息比1shot更為全面,包含更多的特征,增強(qiáng)了模型的泛化能力。同時(shí),在工況相近的情況下,由于故障信號(hào)、包含的信息相似,因此在變工況故障診斷任務(wù)中能夠取得較好的結(jié)果。如:A→B,A→C。在工況變化較大的情況下,因?yàn)楣收蠑?shù)據(jù)分布差異大,使得模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,因此降低了模型的泛化能力。如:A→D。圖6中,ECAMTL與MTL模型相比,在不增加模型復(fù)雜度的情況下獲得了性能的提升。
圖7是ECAMTL模型在不同數(shù)量樣本下故障分類(lèi)的混淆矩陣(圖7(a)、圖7(b)為東南大學(xué)數(shù)據(jù)集,圖7(c)~圖7(e)為CWRU數(shù)據(jù)集)?;煜仃嚢?種或4種不同的故障類(lèi)型,每種類(lèi)型有5個(gè)或4個(gè)測(cè)試樣本,直觀地給出了誤判的故障類(lèi)型。
圖7 MCAMTL模型在不同樣本不同數(shù)量下的診斷結(jié)果混淆矩陣
在實(shí)際生產(chǎn)中,對(duì)運(yùn)行狀態(tài)下故障原因做出粗線條的診斷可防止事故擴(kuò)大,因此在診斷時(shí)間上要求很緊迫。為了驗(yàn)證模型的在線測(cè)試準(zhǔn)確率,本節(jié)試驗(yàn)選取數(shù)據(jù)的后一部分(如圖5所示)形成在線數(shù)據(jù),進(jìn)行訓(xùn)練測(cè)試,結(jié)果如圖8、圖9所示。
圖8 在線測(cè)試訓(xùn)練時(shí)間(5way 5shot)
圖9 在線測(cè)試準(zhǔn)確率(5way 5shot)
為驗(yàn)證ECAMTL模型在不同軸承條件下的擬合能力,設(shè)置了泛化性實(shí)驗(yàn),采用東南大學(xué)軸承數(shù)據(jù)集,以20 Hz-0 V作為訓(xùn)練數(shù)據(jù),30 Hz-2 V作為測(cè)試數(shù)據(jù),實(shí)驗(yàn)結(jié)果如圖10所示,與其他模型相比仍有較高的準(zhǔn)確度,與原模型相比,改進(jìn)后的模型有較強(qiáng)的擬合能力,適應(yīng)不同設(shè)備的能力更強(qiáng),證明了ECAMTL有較強(qiáng)的魯棒性。
圖10 泛化性實(shí)驗(yàn)驗(yàn)證結(jié)果
針對(duì)小樣本條件下的變工況故障診斷,本文提出了ECAMTL方法,通過(guò)比較CRWU軸承數(shù)據(jù)和東南大學(xué)軸承數(shù)據(jù)集,并在不同環(huán)境下進(jìn)行實(shí)驗(yàn),得出以下結(jié)論。
① 綜合圖7、表3和表4可知,在數(shù)據(jù)減少的情況下,復(fù)雜的模型與過(guò)多的參數(shù)會(huì)導(dǎo)致模型出現(xiàn)過(guò)擬合問(wèn)題。本文提出的ECAMTL方法能夠解決這一問(wèn)題。
② 在MTL模型中引入ECANet減輕了過(guò)擬合的現(xiàn)象,同時(shí)提升了模型的特征提取能力。在不提升模型復(fù)雜度的前提下,增強(qiáng)了對(duì)重要特征的關(guān)注度,從而獲取更多的特征,以提高模型分類(lèi)的準(zhǔn)確率和泛化能力。
③ 改進(jìn)后的網(wǎng)絡(luò),在跨工況、跨型號(hào)的故障診斷中,網(wǎng)絡(luò)在1 shot和5 shot的平均分類(lèi)準(zhǔn)確率分別達(dá)到91.00%和93.49%,基本滿足了軸承故障診斷的要求。
本文針對(duì)傳統(tǒng)元學(xué)習(xí)算法存在的特征提取能力有限的問(wèn)題,提出在特征提取網(wǎng)絡(luò)中引入ECANet來(lái)增強(qiáng)特征提取能力,從而提升模型的泛化能力。同時(shí),將本文算法與現(xiàn)有的小樣本算法進(jìn)行對(duì)比試驗(yàn),驗(yàn)證了本文算法的優(yōu)越性。