賈美霞,韓寶坤,王金瑞,張 驍,郭 雷,趙偉濤
(1.山東科技大學(xué)機械電子工程學(xué)院,山東 青島 266000;2.特雷克斯(常州)機械有限公司,江蘇 常州 213022)
滾動軸承作為旋轉(zhuǎn)機械設(shè)備的關(guān)鍵部件,一旦出現(xiàn)故障極易引發(fā)事故。實際工程中滾動軸承發(fā)生故障的類型多種多樣,軸承失效會影響整個機械系統(tǒng)的正常運行,因此對軸承進(jìn)行故障診斷和狀態(tài)監(jiān)測具有重要的意義[1]。研究人員一直致力于找到合適的方法進(jìn)行故障診斷并預(yù)警,早期的故障診斷方法需要對檢測數(shù)據(jù)進(jìn)行手動特征提取,如經(jīng)驗?zāi)B(tài)分解[2]、小波分解[3]、信息熵[4],根據(jù)先驗知識進(jìn)行特征對比來識別故障,制約了識別率的提高。
近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,深度學(xué)習(xí)在滾動軸承故障檢測診斷中的應(yīng)用取得了成功。如:唐立力等[5]利用遺傳算法進(jìn)行BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值優(yōu)化,實現(xiàn)故障診斷。李晴晴等[6]基于改進(jìn)的Dropout方法構(gòu)建自編碼網(wǎng)絡(luò)模型,采用逐層貪婪算法提取高維數(shù)據(jù)的有效特征。徐活耀等[7]基于堆棧稀疏自編碼器和Softmax 層構(gòu)建的深度神經(jīng)網(wǎng)絡(luò),通過逐層貪婪學(xué)習(xí)從振動信號中提取時域特征構(gòu)建特征向量和高級特征。上述文獻(xiàn)表明,深度學(xué)習(xí)具有強大的表征能力,能有效提取振動信號的特征,解決軸承故障診斷問題,但是對于不同工況軸承故障診斷的泛化能力不夠。
遷移學(xué)習(xí)是近年來人工智能領(lǐng)域的一個重大突破,旨在運用已有的知識解決相關(guān)但不完全相同領(lǐng)域中的問題[8]。遷移學(xué)習(xí)能減小領(lǐng)域數(shù)據(jù)的分布差異,能夠利用原有的模型解決工況改變后樣本數(shù)據(jù)不帶標(biāo)簽和少樣本的問題。安增輝等[9]利用域適應(yīng)方法度量不同域數(shù)據(jù)特征分布的相似性,提高模型的泛化性,實現(xiàn)了不同工況下滾動軸承故障診斷。張振良等[10]提出一種基于遷移學(xué)習(xí)的半監(jiān)督集成學(xué)習(xí)器,分別遷移不同目標(biāo)空間的高相似度樣本加入到源樣本空間進(jìn)行訓(xùn)練。趙宇凱等[11]將軸承原始振動信號數(shù)據(jù)用轉(zhuǎn)圖像方法進(jìn)行處理,利用VGG16卷積神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)實現(xiàn)故障診斷。上述研究內(nèi)容實現(xiàn)單一工況改變條件下軸承故障診斷,不能同時解決單一與多工況都改變條件下的問題和小樣本目標(biāo)域的問題。
結(jié)合上述遷移學(xué)習(xí)的應(yīng)用,為了解決單一及多工況都改變條件下無標(biāo)簽故障類型和少樣本的分類問題,本文提出一種基于遷移堆棧自動編碼器的軸承故障診斷方法。該方法采用帶標(biāo)簽的源域數(shù)據(jù)預(yù)訓(xùn)練堆棧自編碼器分類模型,得到相應(yīng)的模型參數(shù)并加以微調(diào),利用多核最大均值差異作為評價源域和目標(biāo)域的距離指標(biāo),對單一及多工況改變和少樣本的目標(biāo)域數(shù)據(jù)集進(jìn)行故障診斷,能取得較好的分類效果。
自編碼器(Auto-Encoder,AE)一種無監(jiān)督的神經(jīng)網(wǎng)絡(luò),它通過提取高維抽象特征達(dá)到降維的目的。AE由輸入層、隱層、輸出層(重構(gòu)數(shù)據(jù))3層網(wǎng)絡(luò)結(jié)構(gòu)組成。其中輸入層到隱層的正向傳導(dǎo)稱為編碼(Encoder),隱層到輸出層的正向傳導(dǎo)稱為解碼(Decoder),隱層主要起到特征提取的作用,自編碼器網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。AE 的目的是盡可能地通過輸入數(shù)據(jù)的重構(gòu)以獲得代表性的特征表示,其基本公式為如式(1)至式(3)所示。
圖1 自編碼器結(jié)構(gòu)圖
AE的編碼過程:
AE的解碼過程:
AE的損失函數(shù):
其中:f(·)為編碼器函數(shù),g(·)為解碼器函數(shù),W1為編碼器權(quán)重,b1為編碼器偏置,W2為解碼器權(quán)重,b2為解碼器偏置,M為輸入樣本維數(shù),xi表示輸入數(shù)據(jù),xi表示輸出重構(gòu)數(shù)據(jù)。
堆棧自編碼器(Stacked Auto Encoders,SAE)是以AE 為基本模型構(gòu)建的一種深度全連接前向神經(jīng)網(wǎng)絡(luò)。一個n層SAE 就是先訓(xùn)練出一個自編碼器,然后使用該編碼器的編碼輸出部分作為第二個編碼器的輸入,繼續(xù)訓(xùn)練下一個自編碼器,以此類推。最后采用Softmax分類層[12],其神經(jīng)元個數(shù)與故障類別數(shù)相同,以(x1,…,xi,…,xm)為輸入,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 SAE網(wǎng)絡(luò)結(jié)構(gòu)圖
一個n層SAE的每一個編碼過程如下:
一個n層SAE的每一個解碼過程如下:
其中:hl表示編碼的輸出值,hnl+l表示解碼的輸出值,f(·)表示編碼函數(shù),g(·)表示解碼函數(shù),hl-1表示編碼層的輸入,hhl+l-1表示解碼層的輸入,Wl、bl表示編碼層參數(shù),Whl+l、bnl+l表示解碼層參數(shù)。
輸出層采取Softmax 多層進(jìn)行分類,類型的標(biāo)簽有k個,樣本中包括m個訓(xùn)練樣本,即目標(biāo)函數(shù)采用交叉熵的形式:
其中,1{·}表示指示函數(shù),y(i)=j為樣本的條件概率,當(dāng)成立時返回1,不成立返回0,θ表示所有參數(shù)的集合。
最大均值差異(Maximum mean discrepancies,MMD)是一種非參數(shù)度量,用于衡量兩個分布差異性的重要指標(biāo),可以簡單理解成兩個不同分布的特征在樣本空間連續(xù)函數(shù)上的期望。給定兩個樣本足夠多數(shù)據(jù)分布s和t,通過映射函數(shù)f(?)來計算兩域的MMD:
其中:F表示樣本空間上函數(shù)集合,f(?)表示樣本空間上的連續(xù)函數(shù),Xs和Xt分布表示s和t上的特征,E代表求期望。MMD越大說明分布的差異性越大。
Gretton 等[13]在研究中證明當(dāng)F是通用再生希爾伯特空間單位球內(nèi)的一系列函數(shù)時,可使式(7)得到一定程度的簡化,簡化形式為:
其中:φ(?)為特征空間到希爾伯特空間?的映射,ns和nt分別是s和t的樣本大小。
低維空間線性不可分通過非線性映射映射到高維空間時可能實現(xiàn)線性可分,但是極易出現(xiàn)“維數(shù)災(zāi)難”,核函數(shù)k(Xs,Xt)能很好解決這一問題[13-14]。將核函數(shù)的公式代入(8)中可展開MMD,表達(dá)式為:
多核最大均值差異(Multi-kernel maximum mean discrepancies,MK-MMD)是MMD 的延伸。采用單一的核函數(shù)處理分布不均衡的數(shù)據(jù)時,其效果通常不夠理想[15]。為改變這一狀況,本文采用多個高斯徑向基核函數(shù)進(jìn)行組合,達(dá)到獲取最佳特征映射的目的。
通過SAE對帶標(biāo)簽源域S=進(jìn)行訓(xùn)練,源域xsi通過SAE 模型后轉(zhuǎn)化為重構(gòu)數(shù)據(jù)xsi,隱含層特征經(jīng)過Softmax后轉(zhuǎn)化為分類數(shù)據(jù)osi,通過其損失函數(shù)Lce的迭代訓(xùn)練,得到源域故障分類。通過SAE 對不帶標(biāo)簽?zāi)繕?biāo)域T={xt,…,xti,…,}xtM進(jìn)行訓(xùn)練得到隱含層的特征。
通過構(gòu)造多核函數(shù)將源域和目標(biāo)域的數(shù)據(jù)映射到一個再生的希爾伯特空間,用于縮小數(shù)據(jù)的分布差異。其公式為:
其中:k表示核函數(shù)的個數(shù),Hsi、Hti是源域和目標(biāo)域第i層向量特征,λi是調(diào)節(jié)參數(shù),ep表示迭代次數(shù)。
通過MK-MMD 損失函數(shù)Ld的迭代減小源域和目標(biāo)域的隱含層特征的分布距離,采用多個核函數(shù)計算前三層源域和目標(biāo)域的距離。
聯(lián)立式(6)和式(12)可得總的損失函數(shù)為:
本文提出的基于遷移堆棧自編碼器的軸承故障診斷方法的總框架分為兩部分:SAE 模型訓(xùn)練分類和MK-MMD遷移,所提出方法的主要步驟如下,其結(jié)構(gòu)如圖3所示。
圖3 遷移堆棧自編碼器網(wǎng)絡(luò)結(jié)構(gòu)圖
(1)采集不同工況下模擬試驗臺的數(shù)據(jù),對采集到的數(shù)據(jù)進(jìn)行快速傅里葉轉(zhuǎn)換,把轉(zhuǎn)換后的數(shù)據(jù)分類成源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)。
(2)采用SAE 網(wǎng)絡(luò)對帶標(biāo)簽源域數(shù)據(jù)進(jìn)行分類,為防止過擬合在前三層加入Dropout層并逐層加入批標(biāo)準(zhǔn)化(BN)層。
(3)把不帶標(biāo)簽的目標(biāo)域網(wǎng)絡(luò)放入訓(xùn)練好的SAE 網(wǎng)絡(luò),使用前三層用于測量源域和目標(biāo)域隱含特征的分布差異。
(4)通過隨機梯度下降優(yōu)化對損失函數(shù)L(θ;xs,ys,xt)的參數(shù)進(jìn)行迭代更新,最終確定目標(biāo)域的分類結(jié)果。
為了檢驗基于遷移堆棧自動編碼器的軸承故障診斷方法在不同工況下故障診斷的結(jié)果,設(shè)計了一個模擬軸承故障的實驗平臺,如圖4(a)所示。該平臺主要有電動機、轉(zhuǎn)盤、軸承座、齒輪箱和制動器組成。
收集到的數(shù)據(jù)集包括9種健康狀況:正常(NC)、外圈故障(OF 0.2 mm、OF0.4 mm)、內(nèi)圈故障(IF0.2 mm、IF0.4 mm)、滾珠故障(RF0.2 mm、RF0.4 mm)、混合故障(ROF0.2 mm、ROF0.4 mm),其狀況類型如圖4(b)所示。本文選取1 個數(shù)據(jù)集作為源域,用DS 表示。選取3個數(shù)據(jù)集作為目標(biāo)域,分別用DT1、DT2、DT3 表示,其工況描述如表1 所示。從表1 可以看出,與DS相比較,DT1僅載重工況改變,DT2僅轉(zhuǎn)速工況改變,DT3為轉(zhuǎn)速和載重工況同時改變。
圖4 模擬試驗臺及其故障狀況
表1 源域和目標(biāo)域數(shù)據(jù)描述
在模擬試驗臺上采集原始振動信號,抽取每種健康狀況的信號200 段,每段包括2 400 個樣本點。對樣本進(jìn)行快速傅里葉變換將其轉(zhuǎn)換為頻域信號,樣本長度為1 200 維。本文設(shè)計的SAE 網(wǎng)絡(luò)結(jié)構(gòu)維數(shù)為[1 200,600,200,100,9],在SAE 隱含層加入Softmax 層,除最后分類層外,其余采用ReLU 作為激活函數(shù),學(xué)習(xí)率為0.001,采用批訓(xùn)練方法,共訓(xùn)練400 次。對于通過SAE 的前三層基于MK-MMD 測量源域和目標(biāo)域的距離。
對充足數(shù)據(jù)樣本DS-DT1 進(jìn)行遷移訓(xùn)練,隨著優(yōu)化的進(jìn)行MK-MMD 測量層的損失函數(shù)都在減小,兩域的分布距離都在下降,三層MK-MMD損失函數(shù)和準(zhǔn)確率優(yōu)化曲線如圖5所示。其中Ld1、Ld2、Ld3 分別表示第一層、第二層、第三層MMD 測量函數(shù)損失值,Acctrain、Acctest 分別表示源域和目標(biāo)域的準(zhǔn)確率。
圖5 優(yōu)化函數(shù)損失值和準(zhǔn)確率對比圖
為避免偶發(fā)性,所有的遷移模型均執(zhí)行15次重復(fù)試驗。DS-DT1的分類平均準(zhǔn)確率為99.4%,其混淆矩陣如圖6(a)所示。DS-DT2 遷移的分類平均準(zhǔn)確率為99.1 %,其分類的混淆矩陣如圖6(b)所示。為形象展示,采用一種非線性降維算法即t-SNE 算法[16]對所有故障類型訓(xùn)練樣本的高維特征向量分別進(jìn)行降維處理,基于DS-DT1得到可視化映射見圖7(a),基于DS-DT2得到可視化映射圖見圖7(b)。圖中S-表示DS域故障類型,T-表示DT1域故障類型。
通過圖6 和圖7 可以看出對于9 種健康狀況,DS-DT1、DS-DT2 對正常(NC)和單一的故障類型(IF、OF、RF)分類準(zhǔn)確。對于混合故障(ROF),DSDT1的分類準(zhǔn)確率為0.987和0.999,DS-DT2的分類準(zhǔn)確率為0.994 和0.993,雖略有差異但都表明分類效果較好。
DT3 對應(yīng)轉(zhuǎn)速和載重雙工況同時改變的情況,對DS-DT3進(jìn)行遷移,其準(zhǔn)確率平均為96.8%,其分類的混淆矩陣如圖8 所示。與圖6 中的混淆矩陣進(jìn)行對比,由圖8 可知DS-DT3 遷移混合故障(ROF)分類和單一故障(IF0.4、RF0.4)分類出現(xiàn)差異,但結(jié)果依然令人滿意。
圖6 混淆矩陣對比圖
圖7 降維可視化對比圖
圖8 DS-DT3遷移混淆矩陣
當(dāng)數(shù)據(jù)集的樣本較少時,在進(jìn)行模型訓(xùn)練時不能充分提取數(shù)據(jù)集的隱含特征,極易出現(xiàn)過擬合[17]。由于采用少樣本訓(xùn)練的模型泛化能力差,在進(jìn)行未知特征提取時,模型不再適用,本文提出的模型將能有效解決這個問題。分別選取DT1 的5 %、10 %、20%、50%、100%進(jìn)行遷移學(xué)習(xí),每種情況訓(xùn)練15次,取平穩(wěn)后的50 次的平均值,其目標(biāo)域準(zhǔn)確率如表2 所示。從表2 可以看出模型在目標(biāo)域訓(xùn)練樣本較少情況下,依然能達(dá)到比較準(zhǔn)確的分類效果。
表2 少樣本條件下目標(biāo)域準(zhǔn)確率
由表2可知,基于100%目標(biāo)域數(shù)據(jù)集的平均準(zhǔn)確率為99.4 %,基于5 %目標(biāo)數(shù)據(jù)集的準(zhǔn)確率為95.2%??梢钥闯鲭S著樣本的減少準(zhǔn)確率的平均值和標(biāo)準(zhǔn)差降速平穩(wěn)。
堆棧自編碼器網(wǎng)絡(luò)作為一種深度學(xué)習(xí)的模型,具有強大的中間特征提取能力,能夠很好提取數(shù)據(jù)集的特征。但是在實際工程中,帶有標(biāo)簽的數(shù)據(jù)通常是稀缺的,且采集的健康狀況數(shù)據(jù)通常不充足。數(shù)據(jù)的不充足在深度神經(jīng)網(wǎng)絡(luò)強大的表征能力下極易導(dǎo)致過擬合現(xiàn)象的產(chǎn)生。提出的基于遷移堆棧自編碼器的軸承故障診斷方法能很好解決這兩個問題。實驗表明不論單一工況改變還是雙工況同時改變,在進(jìn)行遷移時采用該方法都能取得較好的分類效果。即使樣本在不充足情況下,采用該方法進(jìn)行遷移依然能取得較好的分類效果。