馬航宇, 周 笛, 衛(wèi)宇杰, 吳 偉, 潘爾順
(1. 上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院, 上海 200240; 2. 上海電機(jī)學(xué)院 凱撒斯勞滕智能制造學(xué)院, 上海 201306)
故障診斷是對(duì)機(jī)械設(shè)備故障原因的追溯,通常包括特征信號(hào)采集、信號(hào)提取處理、故障類別判斷3個(gè)環(huán)節(jié).伴隨互聯(lián)網(wǎng)技術(shù)發(fā)展和以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)興起,部分學(xué)者將神經(jīng)網(wǎng)絡(luò)融合多領(lǐng)域技術(shù)用于故障識(shí)別、分類和診斷[1-6].孫旺等[1]將蟻群算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合,解決神經(jīng)網(wǎng)絡(luò)在關(guān)鍵設(shè)備性能檢測(cè)時(shí)收斂速度慢、容易陷入最小值的問(wèn)題;雷亞國(guó)等[2]利用頻域信號(hào)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),擺脫對(duì)信號(hào)處理技術(shù)與診斷經(jīng)驗(yàn)的依賴,完成故障特征自適應(yīng)提取與健康狀況智能診斷;Wen等[3]將主成分分析法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過(guò)降低數(shù)據(jù)特征冗余度以提高診斷準(zhǔn)確性;Hashim等[4]將離散小波變換和神經(jīng)網(wǎng)絡(luò)相結(jié)合,有效提升故障狀態(tài)聚類和分類的速度效果.隨著統(tǒng)計(jì)分析、信號(hào)處理、啟發(fā)式算法等各類方法的融入,神經(jīng)網(wǎng)絡(luò)在故障診斷領(lǐng)域的應(yīng)用愈發(fā)普及且取得較好效果.
軸承是旋轉(zhuǎn)機(jī)械的重要組成零件,也是故障高發(fā)零件之一.在旋轉(zhuǎn)機(jī)械故障中,僅軸承故障就高達(dá)30%[7].同時(shí),在工程實(shí)際過(guò)程中,由于生產(chǎn)環(huán)境和工況條件不斷變化,設(shè)備服役工況并非恒定不變,定工況的神經(jīng)網(wǎng)絡(luò)故障診斷方法不足以有效識(shí)別所有故障類型,誤診率較高,所以需考慮變工況下系統(tǒng)運(yùn)轉(zhuǎn)過(guò)程與服役特征.結(jié)合部件服役的工況變化提取變工況特征信息和軸承故障信息,開展變工況下軸承故障診斷研究具有重要理論研究?jī)r(jià)值和工程應(yīng)用意義.
變工況故障診斷主要難點(diǎn)之一在于如何提取保留故障深層特征,使其在不同工況下依然能被有效識(shí)別.圍繞該問(wèn)題的故障特征提取方法大致可分為信號(hào)處理、遷移學(xué)習(xí)(Transfer Learning, TL)和神經(jīng)網(wǎng)絡(luò)等.在信號(hào)處理過(guò)程中,通常采用多尺度熵從振動(dòng)信號(hào)提取故障特征,以時(shí)間序列動(dòng)態(tài)變化表征變工況.Minhas等[8]借助互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解法處理原始信號(hào),采用加權(quán)多尺度熵提取故障特征;Ma等[9]針對(duì)故障多元信號(hào)問(wèn)題,提出多元多尺度模糊分布熵提取故障特征,并用支持向量機(jī)識(shí)別工作狀態(tài).兩者均實(shí)現(xiàn)了對(duì)變工況振動(dòng)信號(hào)的處理和故障診斷.在遷移學(xué)習(xí)方面,主要通過(guò)降低源域和目標(biāo)域的故障提取特征差異,實(shí)現(xiàn)不同工況下故障特征遷移.沈飛等[10]針對(duì)變工況需要建立不同模型的問(wèn)題,提出譜質(zhì)心遷移學(xué)習(xí)模型,通過(guò)最小化源工況和目標(biāo)工況領(lǐng)域質(zhì)心均值距離實(shí)現(xiàn)特征遷移,減少后者的建模代價(jià)并增強(qiáng)模型通用性;Li等[11]提出基于知識(shí)映射的對(duì)抗域適應(yīng)法,將知識(shí)從目標(biāo)域泛化到源域,提取領(lǐng)域不變特征.而神經(jīng)網(wǎng)絡(luò)則是憑借其優(yōu)秀的自學(xué)習(xí)能力完成深層故障特征提取.Zhao等[12]針對(duì)設(shè)備頻繁改變工況的問(wèn)題,設(shè)計(jì)了歸一化卷積神經(jīng)網(wǎng)絡(luò),通過(guò)批量歸一化消除特征分布差異,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)提取故障特征;趙小強(qiáng)等[13]針對(duì)軸承多工況下時(shí)域信號(hào)時(shí)變性較強(qiáng)等問(wèn)題設(shè)計(jì)改進(jìn)殘差神經(jīng)網(wǎng)絡(luò),采用小卷積層串聯(lián)和堆疊以及加入殘差連接方式構(gòu)建數(shù)據(jù)池化層,有效提取深層特征信息.基于所提取深層特征,結(jié)合深度學(xué)習(xí)等各類方法進(jìn)一步完成變工況智能故障診斷.
在提取數(shù)據(jù)特征方面,作為典型神經(jīng)網(wǎng)絡(luò)之一的深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[14],基于貝葉斯思想,通過(guò)找出數(shù)據(jù)的聯(lián)合概率分布,自動(dòng)獲取潛藏在數(shù)據(jù)中難以解讀的深層信息.當(dāng)樣本數(shù)量較多時(shí),DBN擁有強(qiáng)大的故障深層特征信息提取能力,是變工況智能故障診斷的有力工具.李艷峰等[15]將奇異值分解和DBN結(jié)合,通過(guò)把高維相關(guān)變量壓縮為低維獨(dú)立特征矢量完成故障特征提取;Ma等[16]將卷積殘差網(wǎng)絡(luò)、深層自動(dòng)編碼器和DBN進(jìn)行加權(quán)集成,提出多目標(biāo)多工況的整體深度學(xué)習(xí)診斷方法;Wang等[17]提出基于半監(jiān)督受限玻爾茲曼機(jī)的DBN以縮減不同工況間的分類差距,提高故障分類準(zhǔn)確性;Che等[18]將時(shí)頻域特征輸入DBN,通過(guò)遷移學(xué)習(xí)將不同工況間數(shù)據(jù)差異最小化,實(shí)現(xiàn)變工況軸承故障診斷.通過(guò)融合各領(lǐng)域相關(guān)技術(shù),DBN提取深層故障特征的優(yōu)勢(shì)得到進(jìn)一步增強(qiáng),在變工況故障診斷中具有更優(yōu)越的泛化性和更高的準(zhǔn)確率.
上述對(duì)于DBN故障診斷的相關(guān)研究主要通過(guò)統(tǒng)計(jì)分析或信號(hào)處理等方法對(duì)輸入?yún)?shù)進(jìn)行降噪優(yōu)化預(yù)處理,特征提取過(guò)程均基于預(yù)處理數(shù)據(jù)進(jìn)行,雖在一定程度上提高了故障診斷正確率,但也導(dǎo)致原始數(shù)據(jù)深層特征和信息并未被完全保留.為更好發(fā)揮DBN在變工況下特征提取和故障診斷的優(yōu)勢(shì),考慮系統(tǒng)運(yùn)轉(zhuǎn)的變工況特征,以滾動(dòng)軸承為分析案例,通過(guò)有機(jī)融合DBN、遷移學(xué)習(xí)、數(shù)據(jù)丟失技術(shù)等提出考慮平移不變特征的自適應(yīng)深度置信網(wǎng)絡(luò)(Domain Adaptive Deep Belief Network with Shift-Invariant Features, SIF-DADBN),實(shí)現(xiàn)變工況智能故障診斷,具體如下:①針對(duì)變工況故障特征提取困難,設(shè)計(jì)固定學(xué)習(xí)步長(zhǎng)的特征提取方法,結(jié)合DBN優(yōu)勢(shì)充分提取原始數(shù)據(jù)的平移不變特征,是變工況故障診斷的基礎(chǔ);②針對(duì)變工況同類故障難以被有效識(shí)別并分類,引入領(lǐng)域自適應(yīng)方法并加以改進(jìn),增強(qiáng)提取特征的普適性,是變工況故障診斷的關(guān)鍵;③針對(duì)本文特征提取方法導(dǎo)致的參數(shù)維度過(guò)高問(wèn)題,結(jié)合數(shù)據(jù)丟失技術(shù)簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)的同時(shí)避免過(guò)擬合現(xiàn)象,最終提升變工況智能故障診斷的泛化性和準(zhǔn)確性.
DBN是由多個(gè)受限玻爾茲曼機(jī)(Restricted Boltzmann Machine, RBM)堆疊而成.如圖1所示,RBM是由顯層和隱層組成的隨機(jī)神經(jīng)網(wǎng)絡(luò)[19],顯層表征輸入數(shù)據(jù),通過(guò)訓(xùn)練完成權(quán)重計(jì)算形成隱層并作為第2個(gè)RBM的顯層,依次進(jìn)行堆疊,形成完整DBN網(wǎng)絡(luò).
為實(shí)現(xiàn)進(jìn)一步判別,需在DBN頂層加入數(shù)據(jù)標(biāo)簽和Softmax函數(shù)等進(jìn)行分類.在此基礎(chǔ)上,Hinton等[14]在Softmax之前添加多層前饋神經(jīng)網(wǎng)絡(luò),通過(guò)反向微調(diào)優(yōu)化網(wǎng)絡(luò)權(quán)值以提高判別準(zhǔn)確率,這就是經(jīng)典的DBN-深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)模型,也是DBN改進(jìn)的重要基礎(chǔ).
圖1 DBN結(jié)構(gòu)示意圖Fig.1 Schematic diagram of DBN structure
DBN-DNN運(yùn)行主要包含兩個(gè)關(guān)鍵步驟:基于RBM和對(duì)比散度(Contrastive Divergence, CD)算法的無(wú)監(jiān)督訓(xùn)練;基于反向傳播(Back Propagation,BP)算法的有監(jiān)督微調(diào).
1.2.1基于RBM和CD算法的無(wú)監(jiān)督訓(xùn)練 在訓(xùn)練過(guò)程中,需對(duì)RBM逐層訓(xùn)練最終完成對(duì)DBN整體的無(wú)監(jiān)督訓(xùn)練.考慮最底層RBM(記為第1層),顯層節(jié)點(diǎn)v1=(v1,v2, …,vi)(i=1, 2, …,I)和隱層節(jié)點(diǎn)h1=(h1,h2, …,hj)(j=1, 2, …,J)的聯(lián)合狀態(tài)能量函數(shù)表示為[20]
(1)
式中:ai和bj為顯、隱層的偏置;I和J為顯、隱層的節(jié)點(diǎn)數(shù);wij為顯隱層的連接權(quán)重.第j個(gè)隱層節(jié)點(diǎn)激活函數(shù)為
(2)
第i個(gè)顯層節(jié)點(diǎn)激活函數(shù)為
(3)
考慮軸承振動(dòng)信號(hào)作為顯層向量v1輸入,利用式(2)可對(duì)隱層狀態(tài)函數(shù)求解,利用式(3)重構(gòu)顯層狀態(tài)函數(shù).因此,RBM通過(guò)調(diào)節(jié)參數(shù)w1、a1=(a1,a2, …,ai)和b1=(b1,b2, …,bj),使重構(gòu)誤差達(dá)到最小值實(shí)現(xiàn)信號(hào)特征提取和降維.其中
基于Hinton[21]提出的CD算法,權(quán)重和偏置變化量如下:
(4)
式中:ε為學(xué)習(xí)率;γ為采樣階次;〈 〉0為原始數(shù)據(jù)期望值;〈 〉γ為經(jīng)過(guò)γ次采樣并重構(gòu)后的數(shù)據(jù)期望值.基于式(4)進(jìn)一步可得權(quán)重和偏置更新公式為
(5)
式中:η為迭代次數(shù).
結(jié)合式(4)和(5),迭代計(jì)算各層RBM的參數(shù),用于下一步有監(jiān)督微調(diào).
(6)
式中:Xl為第l層理想輸出;wl和bl為該層待更新的權(quán)重和隱層偏置.采用梯度下降法進(jìn)行微調(diào)和更新,通過(guò)有監(jiān)督反向微調(diào)提高DBN分類準(zhǔn)確率,完成DBN訓(xùn)練和調(diào)優(yōu)過(guò)程.
在DBN軸承故障診斷相關(guān)研究中,為提升診斷正確率,通常對(duì)信號(hào)數(shù)據(jù)進(jìn)行預(yù)處理從而導(dǎo)致原始信號(hào)一定程度特征損失.因此,本文從盡可能保留原始數(shù)據(jù)特征的角度出發(fā),按固定學(xué)習(xí)步長(zhǎng)(S)將原始信號(hào)進(jìn)行分解后充分學(xué)習(xí).
考慮包含M個(gè)數(shù)據(jù)的軸承振動(dòng)信號(hào),基于固定學(xué)習(xí)步長(zhǎng)S將其分解成N段,每段表示為yn(t),n=1, 2, …,N,N=
M/S
,其中“
”表示向下取整.將分解后各段信號(hào)輸入到RBM網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,結(jié)合式(1),得到此時(shí)RBM的能量函數(shù)如下:
(7)
fn=sigmoid(wnyn(t)+bn),fn∈R1×J1
參照GB-T14452-93標(biāo)準(zhǔn)A型試樣,將釬焊后試樣線切割為長(zhǎng)約34 mm、寬5±0.25 mm、高5±0.25 mm的條狀小試樣進(jìn)行三點(diǎn)彎曲試驗(yàn),測(cè)定釬焊接頭的抗彎強(qiáng)度。
(8)
式中:wn和bn為第n段信號(hào)的權(quán)重和偏置.將每段信號(hào)均做訓(xùn)練計(jì)算并進(jìn)行堆疊,得到原始信號(hào)特征向量矩陣,進(jìn)一步獲得該RBM層的輸出特征,表示為
(9)
F1∈R1×J1
式中:colmax表示對(duì)矩陣每一列求取最大值.具體平移不變特征提取過(guò)程如圖2所示.
圖2 基于固定學(xué)習(xí)步長(zhǎng)的平移不變特征提取示意圖Fig.2 Schematic diagram of shift-invariant feature extraction based on fixed learning step size
基于提取并訓(xùn)練強(qiáng)化后的深層數(shù)據(jù)特征,進(jìn)一步和變工況特征進(jìn)行比對(duì)遷移,完成對(duì)同一故障不同工況特征的淡化.此處引入遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法,以多核最大平均差異(Multi-Kernel Maximum Mean Discrepancies, MK-MMD)概念表征不同工況下兩種數(shù)據(jù)樣本差異:針對(duì)存在于再生核希爾伯特空間Hk的概率分布p和q之間的距離,其MK-MMD的平方公式[22]為
(10)
式中:k為空間Hk中的特征核;xs~p和xt~q分別表示數(shù)據(jù)來(lái)源為源域的概率分布p和目標(biāo)域的q.在特征映射Φ當(dāng)中,核映射表示為k(xs,xt)=〈Φ(xs),Φ(xt)〉,可進(jìn)一步被定義為由m個(gè)內(nèi)核組合成的凸組合K,具體[23]表示為
(11)
式中:ku和αu為第u個(gè)內(nèi)核和對(duì)應(yīng)的權(quán)重,且所有權(quán)重之和為1.相比傳統(tǒng)單一核的最大平均差異,MK-MMD區(qū)別在于通過(guò)多核來(lái)構(gòu)造總的大核,使其能夠在運(yùn)算過(guò)程中擁有更多內(nèi)核選擇,提高特征差異計(jì)算準(zhǔn)確性.
考慮在變工況下進(jìn)行智能故障診斷,需使不同工況特征差異最小化,將領(lǐng)域自適應(yīng)和DBN相結(jié)合,采用MK-MMD計(jì)算不同工況間特征差異;另一方面,為保證故障診斷分類準(zhǔn)確率,需使DBN損失函數(shù)最小化.結(jié)合式(6)和(10),得到新的最小化目標(biāo)函數(shù)如下:
E=EDBN+EMK-MMD=
(12)
利用式(12)對(duì)目標(biāo)函數(shù)進(jìn)行調(diào)整,可使BP算法在更新網(wǎng)絡(luò)參數(shù)過(guò)程中,兼顧故障分類準(zhǔn)確率和變工況特征差異.如圖3所示,在2.1節(jié)中采用固定學(xué)習(xí)步長(zhǎng)的特征提取,已實(shí)現(xiàn)軸承原始數(shù)據(jù)的各類深層特征提取(特征A~C),此時(shí)如果將工況三的測(cè)試集樣本直接輸入到由工況一訓(xùn)練好的DBN中,不同工況差異可能導(dǎo)致相同故障難以正確歸類,生成新故障種類(故障D~F);但若先將工況一和二的數(shù)據(jù)通過(guò)領(lǐng)域自適應(yīng)進(jìn)行學(xué)習(xí)調(diào)整,生成更具泛化性的訓(xùn)練集,在該情況下將工況三的測(cè)試集輸入到訓(xùn)練好的DBN中,就能準(zhǔn)確輸出故障種類,完成變工況下智能故障診斷.
圖3 基于領(lǐng)域自適應(yīng)法的特征遷移示意圖Fig.3 Schematic diagram of feature migration based on domain adaptive method
基于固定學(xué)習(xí)步長(zhǎng)的特征提取方法能夠充分保留原始數(shù)據(jù)有效信息,雖更好地發(fā)揮了DBN優(yōu)勢(shì),但同時(shí)也存在維數(shù)過(guò)高的弊端.結(jié)合神經(jīng)網(wǎng)絡(luò)運(yùn)作模式不難發(fā)現(xiàn),維度過(guò)高不僅會(huì)增加神經(jīng)網(wǎng)絡(luò)處理時(shí)間,也會(huì)增大網(wǎng)絡(luò)過(guò)擬合可能性,嚴(yán)重影響故障診斷準(zhǔn)確率.為保證所提方法有效性,在基于固定學(xué)習(xí)步長(zhǎng)的特征提取上,引入數(shù)據(jù)丟失技術(shù)應(yīng)對(duì)上述兩個(gè)問(wèn)題.
數(shù)據(jù)丟失技術(shù)是Hinton針對(duì)過(guò)擬合問(wèn)題提出的有效技術(shù)之一[24].該技術(shù)核心在于訓(xùn)練過(guò)程中隨機(jī)將部分隱層節(jié)點(diǎn)舍棄.其中,舍棄節(jié)點(diǎn)并非永久移除,只是暫時(shí)不參與本次迭代和權(quán)值更新,從而完成訓(xùn)練過(guò)程中的網(wǎng)絡(luò)精簡(jiǎn),提高各隱層節(jié)點(diǎn)獨(dú)立性.集成數(shù)據(jù)丟失技術(shù)優(yōu)化DBN結(jié)構(gòu),能夠在提升運(yùn)行效率的同時(shí),一定程度上規(guī)避過(guò)擬合問(wèn)題.
結(jié)合所設(shè)計(jì)的DBN網(wǎng)絡(luò),在無(wú)監(jiān)督訓(xùn)練過(guò)程中,式(2)給出隱層節(jié)點(diǎn)激活函數(shù),加入數(shù)據(jù)丟失技術(shù)二進(jìn)制隨機(jī)變量r后如下所示:
(13)
式中:r服從參數(shù)為P的伯努利分布.當(dāng)r=1時(shí)概率為P,表示該隱層單元正常工作;當(dāng)r=0時(shí)概率為1-P,表示該單元暫時(shí)失效.
在后續(xù)有監(jiān)督微調(diào)中,計(jì)算節(jié)點(diǎn)誤差項(xiàng)時(shí)也以隨機(jī)概率將該節(jié)點(diǎn)舍棄并完成DBN訓(xùn)練.在測(cè)試階段,需將隱層節(jié)點(diǎn)輸出按照數(shù)據(jù)丟失技術(shù)設(shè)置的比例對(duì)應(yīng)減少.集成數(shù)據(jù)丟失技術(shù)的本文DBN訓(xùn)練過(guò)程如圖4所示.圖中:“×”代表該單元暫時(shí)失效.
圖4 集成數(shù)據(jù)丟失技術(shù)的DBN示意圖Fig.4 Schematic diagram of DBN in combination with dropout
融合DBN、遷移學(xué)習(xí)和數(shù)據(jù)丟失技術(shù)等方法,設(shè)計(jì)搭建DBN網(wǎng)絡(luò)架構(gòu)如圖5所示.圖中:w1~w5為第一輪訓(xùn)練時(shí)的權(quán)重;w1F~wF5為基于第1輪訓(xùn)練結(jié)果在第2輪訓(xùn)練時(shí)的權(quán)重.其中第1層(v0)為特征提取層,第2、3層(h1和h2)為訓(xùn)練優(yōu)化層,第4、5層(h3和h4)為自適應(yīng)訓(xùn)練層,第6層(Softmax)為分類輸出層.
圖5 DBN整體設(shè)計(jì)架構(gòu)示意圖Fig.5 Schematic diagram of DBN overall design architecture
在故障診斷過(guò)程中,首先結(jié)合DBN優(yōu)勢(shì)充分且有效提取故障特征,在提升診斷準(zhǔn)確率同時(shí)確保故障特征在變工況下依然能被有效識(shí)別;進(jìn)一步結(jié)合領(lǐng)域自適應(yīng)方法,通過(guò)變工況下的特征遷移學(xué)習(xí)減少特征差異,淡化工況特征,強(qiáng)化故障特征,最終實(shí)現(xiàn)變工況下智能故障診斷.具體診斷流程如圖6所示.圖中:η1~η4為各工況最大迭代次數(shù).
圖6 變工況診斷流程圖Fig.6 Diagnosis flow chart under variable working conditions
作為故障高發(fā)零件,軸承在工程實(shí)際中受變化服役工況的影響,故障診斷困難程度大大增加.對(duì)于變工況下軸承智能故障診斷,確保診斷方法正確率和泛化性尤為重要.
為驗(yàn)證所設(shè)計(jì)方法在變工況下故障診斷的有效性,采用凱斯西儲(chǔ)大學(xué)驅(qū)動(dòng)端軸承公開數(shù)據(jù)集作為樣本.基于電機(jī)轉(zhuǎn)速建立4個(gè)不同工況樣本數(shù)據(jù)集A、B、C、D,如表1所示,其中空白表示無(wú)此項(xiàng).軸承故障位置分別有內(nèi)圈、外圈和滾動(dòng)體3處,每處故障均包含3種損傷直徑,組合后共計(jì)9種故障類型.每個(gè)數(shù)據(jù)集選取1組正常樣本與9組不同類型故障樣本的組合,共計(jì)400個(gè)樣本,每個(gè)樣本包含 2 000 數(shù)
表1 數(shù)據(jù)集劃分情況Tab.1 Data set division
據(jù)點(diǎn),且均從原始數(shù)據(jù)的隨機(jī)位置開始提取,但在48 kHz采樣頻率下需保證提取至少1個(gè)周期的信號(hào)數(shù)據(jù).在此基礎(chǔ)上,進(jìn)一步劃分訓(xùn)練和測(cè)試集.其中,訓(xùn)練和測(cè)試集分別包含500和100個(gè)樣本,具體選取規(guī)則如下:訓(xùn)練集應(yīng)包括至少兩種工況,例如將數(shù)據(jù)集A的400個(gè)樣本作為源域進(jìn)行訓(xùn)練,將數(shù)據(jù)集B的100個(gè)樣本作為目標(biāo)域協(xié)助遷移學(xué)習(xí);測(cè)試集任取某一工況的100個(gè)樣本(如數(shù)據(jù)集C),此時(shí)組合記為A-B~C,表1中訓(xùn)練集和測(cè)試集劃分以A-B~C組合為例.
由圖5可知,所提網(wǎng)絡(luò)共由6層組成,節(jié)點(diǎn)數(shù)設(shè)置依次為200、200、160、100、50、10.RBM訓(xùn)練、BP算法微調(diào)的學(xué)習(xí)率均設(shè)為0.1,迭代次數(shù)分別設(shè)為100和150,訓(xùn)練批次為20,初始動(dòng)量為0.1,持續(xù)動(dòng)量為0.5.參數(shù)設(shè)置與傳統(tǒng)DBN無(wú)明顯差異.
本文搭建的DBN增加了固定學(xué)習(xí)步長(zhǎng)S、領(lǐng)域自適應(yīng)法中的懲罰因子β和數(shù)據(jù)丟失概率P等3個(gè)參數(shù).其中,S是對(duì)原始信號(hào)數(shù)據(jù)的分解程度,設(shè)置大小應(yīng)適宜具體情況(本文設(shè)定為10).β在目標(biāo)能量函數(shù)中直接影響診斷結(jié)果,需進(jìn)行重點(diǎn)選擇.以A-B~B為例,令P=1(保留所有節(jié)點(diǎn)),β∈[0, 6](步進(jìn)0.3)且每組參數(shù)輸入DBN后重復(fù)10次,取其平均值和標(biāo)準(zhǔn)偏差,得到β和診斷正確率(Q)的關(guān)系如圖7所示.由圖可知,初始階段診斷正確率隨β增大而提升,說(shuō)明遷移學(xué)習(xí)在變工況故障診斷中逐漸發(fā)揮重要作用.當(dāng)β=2.4,診斷正確率達(dá)到最高點(diǎn)并開始下降,說(shuō)明β設(shè)置過(guò)高覆蓋了故障分類差異的能量函數(shù).
圖7 不同β取值下的診斷正確率Fig.7 Diagnostic accuracy rate at different β values
為配合數(shù)據(jù)丟失技術(shù)尋找最佳組合參數(shù),令β∈[1.6, 3.2](步進(jìn)0.2),與P∈[0.1, 1.0](步進(jìn)0.1)進(jìn)行交叉組合實(shí)驗(yàn),結(jié)果如圖8所示.由圖可知,β整體趨勢(shì)無(wú)明顯變化,診斷率最高點(diǎn)仍集中在2.4附近;P值較小時(shí),由于舍棄網(wǎng)絡(luò)單元過(guò)多,導(dǎo)致正確率明顯下滑,隨著P值增長(zhǎng)至0.4并逐漸接近1時(shí)(所有單元幾乎重新被激活),正確率逐漸提升.當(dāng)0.6≤P≤0.8且β=2.2時(shí),故障診斷正確率達(dá)到峰值且附近幾乎為平面,說(shuō)明此時(shí)正確率無(wú)明顯差異.令P取最小值0.6,可有效簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu)(暫時(shí)舍棄盡可能多的單元).綜上,參數(shù)選擇β=2.2,P=0.6,可在有效提升診斷正確率的同時(shí)提升診斷速率.
圖8 β和P的交叉組合實(shí)驗(yàn)曲面圖Fig.8 Curved surface diagram of cross combination experiment of β and P values
基于3.2節(jié)參數(shù)設(shè)置,仍以A-B~B組合為例得到重構(gòu)誤差,如圖9所示(第1層RBM經(jīng)分解后重構(gòu)誤差較復(fù)雜,未在圖中表示).由圖可知,隨著迭代次數(shù)增加,每層重構(gòu)誤差逐漸減少,最后一層穩(wěn)定后接近0.05,說(shuō)明提取特征已得到充分訓(xùn)練強(qiáng)化.
圖9 各層RBM重構(gòu)誤差圖Fig.9 RBM reconstruction error of each layer
試驗(yàn)發(fā)現(xiàn),集成數(shù)據(jù)丟失技術(shù)后損失函數(shù)能更快下降(見圖10).當(dāng)?shù)螖?shù)約大于150時(shí),損失函數(shù)便提前進(jìn)入平穩(wěn)低值,神經(jīng)網(wǎng)絡(luò)已得到充分訓(xùn)練,說(shuō)明數(shù)據(jù)丟失技術(shù)能有效提升分類正確率和運(yùn)算速率.
圖10 最終損失函數(shù)變化趨勢(shì)圖Fig.10 Trend chart of final loss function
在此基礎(chǔ)之上進(jìn)一步探究所提網(wǎng)絡(luò)運(yùn)行過(guò)程的故障分類效果,借助t分布隨機(jī)近鄰嵌入算法(t-distributed Stochastic Neighbor Embedding,t-SNE)[24]將訓(xùn)練過(guò)程關(guān)鍵節(jié)點(diǎn)可視化,如圖11所示.圖中僅展示內(nèi)圈故障(Inner race Fault, IF)、滾動(dòng)體故障(Roller Fault, RF)、外圈故障(Outer race Fault, OF)和正常4類樣本.如圖11(a)所示,經(jīng)過(guò)基于固定學(xué)習(xí)步長(zhǎng)的信號(hào)特征提取,4種樣本基本已相互分離,但各自并未完全聚集在一起,以IF為例就有多個(gè)聚集中心點(diǎn).通過(guò)多層RBM反復(fù)強(qiáng)化訓(xùn)練,得到輸出情況如圖11(b)所示,各類故障逐漸圍繞某一中心點(diǎn)開始聚攏,說(shuō)明該DBN已經(jīng)基本能夠完成定工況下故障診斷.進(jìn)一步結(jié)合遷移學(xué)習(xí)后,由圖11(c)可知,此時(shí)DBN仍有較好的故障分類效果,且已具備變工況下故障診斷能力.圖中:t1和t2分別表示不同的t-SNE尺寸.
對(duì)A-B~B組合重復(fù)實(shí)驗(yàn)10次取均值,測(cè)得診斷正確率為97.8%,說(shuō)明該方法已成功實(shí)現(xiàn)變工況故障診斷.為進(jìn)一步探究該方法的準(zhǔn)確性和泛化性,分別取數(shù)據(jù)集A-B和C-D作為訓(xùn)練集,并取數(shù)據(jù)集A~D作為測(cè)試集,獲取變工況故障診斷正確率如圖12所示.由圖可見,測(cè)試集選擇對(duì)故障診斷率有較大影響,正確率高低依次為源域>目標(biāo)域>其他.然而從A-B~C、A-B~D、C-D~A和C-D~B也能發(fā)現(xiàn),即便相較于其他4組診斷率較低,但正確率也均在90%以上.8個(gè)組合平均故障診斷正確率高達(dá)95.65%,說(shuō)明所提網(wǎng)絡(luò)能有效實(shí)現(xiàn)變工況的故障診斷.
圖12 不同工況組合下的故障診斷正確率Fig.12 The diagnostic accuracy rate with different combinations of working conditions
為進(jìn)一步證明所提方法的準(zhǔn)確性和泛化性,選取另外5種方法進(jìn)行實(shí)驗(yàn)且相關(guān)參數(shù)設(shè)置如表2所示.其中,方法1為考慮平衡不變特性(Shift-Invariant Features, SIF)的自適應(yīng)DBN(SIF-DADBN),采用本文所提出的DBN:方法2(Raw-DBN)采用傳統(tǒng)DBN,以所有信號(hào)數(shù)據(jù)作為顯層直接輸入網(wǎng)絡(luò);方法3則參照文獻(xiàn)[18]采用快速傅里葉變換(Fast Fourier Transform, FFT)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,提取12個(gè)時(shí)頻域特征輸入DBN;方法4參照文獻(xiàn)[25],將遷移學(xué)習(xí)和支持向量機(jī)(Support Vector Machine, SVM)相結(jié)合,通過(guò)遷移高相似度樣本到源空間進(jìn)行訓(xùn)練并以SVM識(shí)別和分類;方法5僅以傳統(tǒng)SVM方法進(jìn)行診斷;方法6為基于遷移學(xué)習(xí)的生長(zhǎng)型DBN(TL-GDBN),參照文獻(xiàn)[26]同樣將遷移學(xué)習(xí)和DBN結(jié)合形成自適應(yīng)DBN進(jìn)行診斷.各方法相關(guān)參數(shù)(如學(xué)習(xí)率、迭代次數(shù)等)盡量與本文保持一致,同樣集成數(shù)據(jù)丟失技術(shù),且方法4~6采用本文固定學(xué)習(xí)步長(zhǎng)的信號(hào)分解方法提取故障特征作為輸入.
表2 不同方法的參數(shù)設(shè)置和比較Tab.2 Parameter setting and comparison of different methods
通過(guò)實(shí)驗(yàn),定工況下(測(cè)試集與源域相同,如A-B~A、B-C~B組合等)各方法故障診斷正確率如圖13所示.由圖可見,采用DBN的深度學(xué)習(xí)方法能更好提取數(shù)據(jù)特征并完成故障診斷,正確率穩(wěn)定在90%以上;進(jìn)一步對(duì)比方法1~3,發(fā)現(xiàn)本文所提方法的診斷正確率均相對(duì)較高,說(shuō)明采用固定學(xué)習(xí)步長(zhǎng)的特征提取方法更好地保留數(shù)據(jù)深層特點(diǎn),具有更高準(zhǔn)確率.
圖13 定工況下不同方法的故障診斷正確率Fig.13 Comparison of diagnostic accuracy of different methods under invariable working conditions
變工況下(測(cè)試集和源域不同)各方法診斷正確率如圖14所示.比較圖13和14發(fā)現(xiàn),變工況下未結(jié)合遷移學(xué)習(xí)的方法2、3、5正確率下降較為嚴(yán)重,基本難以達(dá)到90%.而結(jié)合遷移學(xué)習(xí)的方法1、4、6正確率僅呈小幅度下降,說(shuō)明遷移學(xué)習(xí)在變工況故障診斷中發(fā)揮重要作用.進(jìn)一步觀察方法1和6,發(fā)現(xiàn)將深度學(xué)習(xí)和遷移學(xué)習(xí)結(jié)合后,無(wú)論是定工況和變工況下均有良好的表現(xiàn),診斷正確率均高于其他方法.
圖14 變工況下不同方法的故障診斷正確率Fig.14 Comparison of diagnostic accuracy of different methods under variable working conditions
綜合來(lái)看,SIF-DADBN在各類工況的故障診斷正確率均能穩(wěn)定高達(dá)90%,平均正確率接近95%,說(shuō)明該方法能有效實(shí)現(xiàn)變工況故障診斷.此外,相較其他5種方法,該方法在變工況下具有更高的故障診斷正確率和泛化水平.
本文通過(guò)DBN、遷移學(xué)習(xí)和數(shù)據(jù)丟失技術(shù)等方法的有機(jī)融合,提出考慮平移不變特征的自適應(yīng)深度置信網(wǎng)絡(luò),并用于軸承智能故障診斷,網(wǎng)絡(luò)共由4部分組成.特征提取層考慮固定學(xué)習(xí)步長(zhǎng)對(duì)原始信號(hào)進(jìn)行分解,提取數(shù)據(jù)平移不變的深層特征,并集成數(shù)據(jù)丟失技術(shù)進(jìn)行全網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化以規(guī)避過(guò)擬合問(wèn)題;強(qiáng)化訓(xùn)練層基于RBM逐層堆疊對(duì)提取特征進(jìn)行反復(fù)強(qiáng)化;自適應(yīng)學(xué)習(xí)層結(jié)合MK-MMD完成變工況特征差異計(jì)算并進(jìn)行特征遷移,淡化工況特征,強(qiáng)化故障特征;分類輸出層基于特征和工況差異對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行二次微調(diào)更新,輸出變工況故障診斷結(jié)果.該方法對(duì)變工況故障識(shí)別率較高,實(shí)驗(yàn)樣本診斷正確率能穩(wěn)定在90%以上,平均診斷正確率高達(dá)95.65%;通過(guò)與其他方法的比較,進(jìn)一步驗(yàn)證所提方法在變工況下具有更高的準(zhǔn)確率和泛化性.未來(lái),針對(duì)該方法樣本需求量較大和診斷對(duì)象單一的局限性,將通過(guò)結(jié)合標(biāo)記樣本擴(kuò)充方法研究小樣本下智能故障診斷,并應(yīng)用于齒輪等其他零部件故障診斷.
上海交通大學(xué)學(xué)報(bào)2022年10期