于樹博 劉占生 趙辰
摘要:高質(zhì)量標(biāo)記數(shù)據(jù)是基于深度學(xué)習(xí)的故障診斷方法有效性的重要保障,然而在實(shí)際中難以獲取大量工業(yè)標(biāo)記故障案例,導(dǎo)致模型的泛化診斷能力弱。針對該問題,提出了動(dòng)力學(xué)仿真數(shù)據(jù)驅(qū)動(dòng)的域自適應(yīng)智能診斷方法,該方法考慮仿真數(shù)據(jù)與實(shí)際數(shù)據(jù)的本質(zhì)差異,引入了一種特征分離網(wǎng)絡(luò)域自適應(yīng)診斷模型,在傳統(tǒng)的域自適應(yīng)模型基礎(chǔ)上增加了目標(biāo)域獨(dú)有特征提取器以顯式分離實(shí)際數(shù)據(jù)中的環(huán)境噪聲等特征,增強(qiáng)域不變故障特征表示和聚類能力。提出了將域共享特征提取器診斷結(jié)果用于域獨(dú)有特征提取器模型參數(shù)的訓(xùn)練策略,進(jìn)一步提高模型的訓(xùn)練穩(wěn)定性。采用凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)集測試了所提方法的診斷性能,結(jié)果表明診斷準(zhǔn)確率和特征提取及聚類能力均優(yōu)于其他對比遷移方法,并經(jīng)驗(yàn)性地分析了模型超參數(shù)敏感度。
關(guān)鍵詞:動(dòng)力學(xué)模型;故障診斷;域自適應(yīng);特征分離網(wǎng)絡(luò)
中圖分類號(hào):TH17;TP183
DOI:10.3969/j.issn.1004-132X.2023.23.007
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Dynamics Simulation Data Driven Domain Adaptive Intelligent
Fault Diagnosis
YU Shubo LIU Zhansheng ZHAO Chen
School of Energy Science and Engineering,Harbin Institute of Technology,Harbin,150001
Abstract:High-quality labeled data was a crucial prerequisite for the effectiveness of deep learning-based fault diagnosis methods. However,obtaining a substantial number of industrial labeled fault cases was challenging,which led the models generalization ability weak. A novel domain adaptive intelligent diagnosis method driven by dynamics simulation data was proposed to address the above issue. This method considered the fundamental disparity between simulation data and actual data,and introduced a feature separation network for domain adaptation in diagnostic modeling. Based upon traditional domain adaptation models,a unique feature extractor that was specific to the target domain was incorporated to explicitly separate environmental noises present in actual data. This enhancement improved fault feature representation and clustering capabilities through other features that remain invariant across domains. Furthermore,a novel training strategy was proposed that leveraged diagnostic results obtained from the shared feature extractor to iteratively update the model parameters of the unique feature extractor,thereby enhancing training stability even further. The proposed method was evaluated using the bearing dataset from Case Western Reserve University,demonstrating improved feature extraction and clustering capabilities compared to other transfer methods for comparison,as evidenced by enhanced performance and diagnostic accuracy. Additionally,the hyper-parameter sensitivity was analyzed empirically.
Key words:dynamics model; fault diagnosis; domain adaptation; feature separation network
收稿日期:2023-05-24
基金項(xiàng)目:國家科技重大專項(xiàng)(2017-IV-0008-0045)
0 引言
旋轉(zhuǎn)機(jī)械功率密度大、運(yùn)行效率高,被廣泛應(yīng)用于工業(yè)、航空、航天等重要領(lǐng)域,但高溫、重載、高轉(zhuǎn)速等惡劣工作環(huán)境使旋轉(zhuǎn)機(jī)械易發(fā)生故障,輕則降低效率,重則機(jī)毀人亡。滾動(dòng)軸承被譽(yù)為“工業(yè)的關(guān)節(jié)”[1],是旋轉(zhuǎn)機(jī)械中使用最多的零部件之一。在旋轉(zhuǎn)機(jī)械失效原因統(tǒng)計(jì)中,有45%~55%是由滾動(dòng)軸承引起的[2]。研究滾動(dòng)軸承智能監(jiān)測與診斷技術(shù),及時(shí)準(zhǔn)確判斷潛在的故障,對確保機(jī)械裝備安全服役具有重要意義。
隨著機(jī)械工業(yè)智能化水平的日益提高,現(xiàn)代旋轉(zhuǎn)機(jī)械故障診斷步入大數(shù)據(jù)時(shí)代,以時(shí)頻域特征分析、支持向量機(jī)及專家系統(tǒng)等為代表的傳統(tǒng)故障診斷方法在數(shù)據(jù)處理和故障診斷精度等方面存在明顯不足。得益于深度學(xué)習(xí)技術(shù)強(qiáng)大的特征提取和數(shù)據(jù)處理優(yōu)勢,近年來基于數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)智能故障診斷方法迅猛發(fā)展,且取得了比傳統(tǒng)診斷方法更好的診斷效果[3]。CHOUDHARY等[4]提出了基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的聲-振多傳感器信息融合智能診斷模型,在軸承和齒輪箱的故障診斷中取得了較好的效果。CHEN等[5]利用多尺度CNN網(wǎng)絡(luò)提取輸入信號(hào)的多尺度特征,結(jié)合長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)進(jìn)一步提取時(shí)間相關(guān)度特征,結(jié)果表明該模型在噪聲環(huán)境下能夠取得較高的診斷精度。WU等[6]提出了混合分類自動(dòng)編碼器(autoencoder,AE)的半監(jiān)督故障診斷模型,可同時(shí)輸入有標(biāo)簽和無標(biāo)簽數(shù)據(jù)對模型參數(shù)進(jìn)行訓(xùn)練,并使用電機(jī)軸承故障數(shù)據(jù)集和工業(yè)水輪機(jī)數(shù)據(jù)驗(yàn)證了模型的有效性。雖然這些方法取得了較為成功的應(yīng)用,但上述方法都只是在訓(xùn)練集和測試集數(shù)據(jù)分布一致的情形下才能取得較好的效果,對數(shù)據(jù)要求較高。而實(shí)際中,旋轉(zhuǎn)設(shè)備不同工況、不同設(shè)備之間存在差異,上述訓(xùn)練集和測試集數(shù)據(jù)的同分布假設(shè)往往不成立。
為此,遷移學(xué)習(xí)故障診斷技術(shù)應(yīng)運(yùn)而生,作為一種深度學(xué)習(xí)范式,遷移學(xué)習(xí)技術(shù)旨在將某一特定領(lǐng)域?qū)W習(xí)的故障診斷知識(shí)遷移用于其他領(lǐng)域,如跨工況、跨設(shè)備診斷等。SUN等[7]提出了稀疏堆疊降噪自編碼器與最大均值差異(maximum mean discrepancy,MMD)遷移損失結(jié)合的診斷方法,在滾動(dòng)軸承跨工況診斷中達(dá)到了較好的診斷效果。KIM等[8]提出了一種語義聚類(semantic clustering,SC)的領(lǐng)域自適應(yīng)智能診斷方法,在現(xiàn)有框架下增加了SC損失,使相同類別的運(yùn)行數(shù)據(jù)更加聚集,并在軸承跨設(shè)備診斷中驗(yàn)證了方法的有效性。雖然遷移學(xué)習(xí)方法可有效解決旋轉(zhuǎn)機(jī)械遷移診斷問題,但這些方法均需要以高質(zhì)量數(shù)據(jù)為支撐,包括標(biāo)記完好的源域數(shù)據(jù)以及無標(biāo)簽的目標(biāo)域數(shù)據(jù)。
可以看出,“數(shù)據(jù)”是確保這些遷移學(xué)習(xí)診斷模型有效性的重要保障,當(dāng)前故障診斷領(lǐng)域面臨的一個(gè)巨大問題是數(shù)據(jù)不足甚至缺失。雖然利用相近工況、相似設(shè)備的故障數(shù)據(jù)可作為解決數(shù)據(jù)問題的一種途徑,但搭建故障模擬試驗(yàn)器、開展故障模擬試驗(yàn)需要消耗大量的資源,且無法獲取任意工況運(yùn)行數(shù)據(jù)。動(dòng)力學(xué)模型仿真手段是解決該問題的另一種有效途徑,在掌握故障機(jī)理的基礎(chǔ)上,建立旋轉(zhuǎn)機(jī)械故障動(dòng)力學(xué)模型,利用仿真技術(shù)手段獲取旋轉(zhuǎn)機(jī)械豐富的運(yùn)行數(shù)據(jù),甚至是危險(xiǎn)工況下(試驗(yàn)無法進(jìn)行)的故障數(shù)據(jù),可為數(shù)據(jù)驅(qū)動(dòng)的故障診斷模型提供重要的數(shù)據(jù)支撐,目前已有學(xué)者進(jìn)行了相關(guān)研究工作。DONG等[9]提出了滾動(dòng)軸承動(dòng)力學(xué)模型與遷移學(xué)習(xí)結(jié)合的故障診斷方法,該方法利用動(dòng)力學(xué)模型仿真獲取大量的故障數(shù)據(jù),結(jié)合實(shí)際少量樣本數(shù)據(jù)共同訓(xùn)練CNN遷移故障診斷模型,在小樣本場景達(dá)到了較高的故障診斷準(zhǔn)確率。董紹江等[10]提出了一種利用仿真數(shù)據(jù)和域自適應(yīng)的故障診斷方法,該方法將通道注意力機(jī)制融入殘差神經(jīng)網(wǎng)絡(luò)中,構(gòu)建了殘差通道注意力模塊(residual channel attention module,Re-CAM),結(jié)合條件最大均值差異(condition maximum mean discrepancy,CMMD)度量準(zhǔn)則來適配仿真數(shù)據(jù)源域和真實(shí)數(shù)據(jù)目標(biāo)域之間的差異,在目標(biāo)域小樣本監(jiān)督診斷場景下取得了較好的效果。ZHU等[11]提出了一種仿真數(shù)據(jù)驅(qū)動(dòng)的子域適應(yīng)對抗遷移診斷模型,該模型利用殘差堆疊延展(residual squeeze-and-excitation,Re-SE)模塊提取不同數(shù)據(jù)域的故障遷移特征,并利用局部最大均值差異(local maximum mean discrepancy,LMMD)準(zhǔn)則降低不同域故障特征之間的差異性,通過試驗(yàn)驗(yàn)證了該模型在小樣本場景下故障診斷的優(yōu)勢。
這些研究成果證明了動(dòng)力學(xué)模型仿真技術(shù)可豐富故障案例庫,是緩解工業(yè)數(shù)據(jù)缺失問題的一種有效手段。但這些模型在訓(xùn)練中均使用了目標(biāo)域有標(biāo)簽數(shù)據(jù),而實(shí)際中由于設(shè)備運(yùn)行條件限制,可能無法對全部數(shù)據(jù)進(jìn)行標(biāo)記,上述方法在目標(biāo)域不含標(biāo)簽無監(jiān)督場景下的診斷性能有待進(jìn)一步探討。邵海東等[12]和YU等[13]對無監(jiān)督場景“仿真-實(shí)際”遷移診斷問題進(jìn)行了初步嘗試,但是這兩個(gè)診斷模型通用性較強(qiáng),在建模過程中沒有考慮動(dòng)力學(xué)仿真數(shù)據(jù)與實(shí)際數(shù)據(jù)的本質(zhì)差異。
本文提出一種動(dòng)力學(xué)仿真數(shù)據(jù)驅(qū)動(dòng)的域自適應(yīng)智能診斷方法,根據(jù)實(shí)際設(shè)備滾動(dòng)軸承的內(nèi)外圈尺寸、滾動(dòng)體數(shù)量、故障尺寸等結(jié)構(gòu)參數(shù),以及轉(zhuǎn)速、不平衡激勵(lì)等運(yùn)行參數(shù),建立相應(yīng)的動(dòng)力學(xué)模型并獲取能夠表征真實(shí)滾動(dòng)軸承故障動(dòng)力學(xué)行為和故障特征表示的仿真數(shù)據(jù),利用提出的特征分離網(wǎng)絡(luò)域自適應(yīng)模型縮小仿真源域和實(shí)際目標(biāo)域之間的差異,并提取具有一致性表征的域無關(guān)故障判別性特征,實(shí)現(xiàn)了從仿真數(shù)據(jù)學(xué)習(xí)的故障診斷知識(shí)向真實(shí)設(shè)備的遷移。該方法僅以動(dòng)力學(xué)模型仿真源域數(shù)據(jù)和實(shí)際目標(biāo)域無標(biāo)簽數(shù)據(jù)訓(xùn)練模型即可達(dá)到較高的診斷精度,并利用凱斯西儲(chǔ)大學(xué)公開的軸承數(shù)據(jù)集驗(yàn)證了所提方法的有效性和優(yōu)越性。所提方法的具體創(chuàng)新之處為:①針對“仿真-實(shí)際”遷移診斷問題的本質(zhì)特點(diǎn),提出了一種特征分離網(wǎng)絡(luò)域自適應(yīng)診斷模型,在利用共享特征提取器從仿真源域和試驗(yàn)?zāi)繕?biāo)域提取域不變故障判別特征的基礎(chǔ)上,增加了目標(biāo)域獨(dú)有特征提取器以顯式分離實(shí)際數(shù)據(jù)中的環(huán)境噪聲特征,增強(qiáng)域不變故障特征表示;②提出了域獨(dú)有特征提取器模型訓(xùn)練策略,以域共享特征提取器的診斷結(jié)果為標(biāo)簽,訓(xùn)練域獨(dú)有特征提取器模型參數(shù),避免因目標(biāo)域獨(dú)有的特征提取器坍塌而提取到無用的特征,進(jìn)一步提高了故障診斷準(zhǔn)確率。
1 軸承故障動(dòng)力學(xué)建模
1.1 軸承動(dòng)力學(xué)建模
滾動(dòng)軸承的動(dòng)力學(xué)模型可以真實(shí)地反映實(shí)際軸承的動(dòng)力學(xué)特性,本文采用DONG等[9]基于集中質(zhì)量法建立的四自由度滾動(dòng)軸承動(dòng)力學(xué)模型,該模型將滾動(dòng)體建模為提供非線性彈性恢復(fù)力的彈簧系統(tǒng)。詳細(xì)建模過程見文獻(xiàn)[9]中的相關(guān)描述,這里僅給出后續(xù)軸承局部故障建模中所依賴的滾動(dòng)體彈性接觸變形δn的表達(dá)式,即
δn=(xi-xo)sinθn+(yi-yo)cosθn-cr(1)
式中,xi、yi分別為內(nèi)圈沿水平和豎直方向的位移;xo、yo分別為外圈沿水平和豎直方向的位移;θn為第n個(gè)滾動(dòng)體的角位置;cr為軸承的徑向游隙。
根據(jù)牛頓第二定律,結(jié)合軸承各部件的受力關(guān)系,考慮外部載荷作用,給出滾動(dòng)軸承系統(tǒng)動(dòng)力學(xué)方程的矩陣表示形式為
式中,M、C、K分別為系統(tǒng)的質(zhì)量、阻尼和剛度矩陣;q為各自由度位移;Fb為滾動(dòng)體非線性彈性恢復(fù)力;Fu、Fg分別為不平衡激勵(lì)載荷和重力載荷。
1.2 軸承故障動(dòng)力學(xué)建模
針對滾動(dòng)軸承常見的滾動(dòng)體、內(nèi)圈和外圈等局部故障模型,在本文軸承故障動(dòng)力學(xué)建模中,將局部故障視為具有幾何形狀的凹坑(其中故障寬度為b、深度為h),且局部故障表現(xiàn)為滾動(dòng)體徑向游隙的變化。在滾動(dòng)體彈性接觸變形表達(dá)式(式(1))的基礎(chǔ)上,局部故障造成的接觸變形可以表示為
δn=(xi-xo)sinθn+(yi-yo)cosθn-cr-H??? (3)
式中,H為局部故障導(dǎo)致的徑向變形。
軸承內(nèi)圈故障動(dòng)力學(xué)建模中,根據(jù)幾何關(guān)系,當(dāng)0≤mod((θn-?in)/2π)≤φin/2時(shí)(其中,?in為內(nèi)圈故障角位置;φin為內(nèi)圈故障對應(yīng)的圓心角,本文中φin≈b/ri;mod(·)為求余函數(shù)),滾動(dòng)體經(jīng)過內(nèi)圈故障區(qū)域時(shí)產(chǎn)生的徑向變形Hi的定義如下:
式中,rb為滾動(dòng)體半徑;ri為軸承內(nèi)圈半徑;h為故障深度。
其余情況Hi=0。
軸承外圈故障動(dòng)力學(xué)模型與內(nèi)圈模型類似,當(dāng)0≤mod((θn-?out)/2π)≤φout/2時(shí)(其中?out為外圈故障角位置;φout為外圈故障對應(yīng)的圓心角,本文中φout≈b/ro),滾動(dòng)體經(jīng)過外圈故障區(qū)域時(shí)產(chǎn)生的徑向變形Ho定義為
式中,ro為軸承外圈半徑。
其余情況Ho=0。
滾動(dòng)體故障動(dòng)力學(xué)模型與上述兩種均不同,實(shí)際運(yùn)行中滾動(dòng)體故障區(qū)域與軸承內(nèi)圈和外圈均接觸。根據(jù)幾何關(guān)系,由滾動(dòng)體故障引起的徑向變形Hb的表達(dá)式為
式中,δmb為第m個(gè)滾動(dòng)體的故障位置;Z為滾動(dòng)體的個(gè)數(shù);φb為滾動(dòng)體故障對應(yīng)的圓心角;?b0為初始故障角位置;ωb為滾動(dòng)體自轉(zhuǎn)角速度,本文中ωb采用文獻(xiàn)[14]的計(jì)算公式。
采用四階龍格-庫塔數(shù)值積分方法求解上述軸承動(dòng)力學(xué)模型,得到正常和常見故障狀態(tài)下軸承動(dòng)力學(xué)響應(yīng),構(gòu)建仿真數(shù)據(jù)庫。
2 本文提出的診斷方法
2.1 域自適應(yīng)故障診斷問題定義
下面對本文動(dòng)力學(xué)仿真數(shù)據(jù)驅(qū)動(dòng)的域自適應(yīng)診斷問題進(jìn)行數(shù)學(xué)定義。在域自適應(yīng)遷移學(xué)習(xí)問題中,數(shù)據(jù)域D(χ,P(X))由特征空間χ和數(shù)據(jù)的邊緣概率分布P(X)構(gòu)成,診斷任務(wù)T(η,P(Y|X))由類別空間η和數(shù)據(jù)的條件概率分布P(Y|X)組成[15]。本文中的源域?yàn)閹?biāo)簽的仿真數(shù)據(jù)DS={(x(i)S,y(i)S)},目標(biāo)域?yàn)闊o標(biāo)簽的真實(shí)數(shù)據(jù)DT={(x(i)T)},仿真源域和真實(shí)目標(biāo)域的特征空間和類別空間相同,即χS=χT、ηS=ηT,但數(shù)據(jù)分布不同,即P(XS)≠P(XT)。
2.2 模型建立
本文在滾動(dòng)軸承動(dòng)力學(xué)建模過程中忽略了系統(tǒng)設(shè)備結(jié)構(gòu)布置、環(huán)境噪聲等的影響,直接對滾動(dòng)軸承進(jìn)行動(dòng)力學(xué)建模,得到的仿真數(shù)據(jù)可直接表征軸承故障的動(dòng)力學(xué)行為,從這些信號(hào)中提取的故障特征可視為與數(shù)據(jù)域無關(guān)。而實(shí)際軸承運(yùn)行過程中,由于設(shè)備安裝、環(huán)境噪聲、傳感器誤差等影響,采集的信號(hào)中除了包含域無關(guān)的故障特征外,還包含了大量域獨(dú)有的故障判別特征,如不同故障類別的噪聲特征等。本文借鑒域分離網(wǎng)絡(luò)(domain separation networks,DSN)的思想,針對“仿真-實(shí)際”域自適應(yīng)故障診斷問題中真實(shí)場景數(shù)據(jù)的故障特性,對原始DSN模型進(jìn)行了更改,提出了特征分離網(wǎng)絡(luò)域自適應(yīng)故障診斷方法,其總體框架如圖1所示。由圖1可以看出,本文提出的特征分離網(wǎng)絡(luò)域自適應(yīng)故障診斷方法由域共享特征提取器EI、目標(biāo)域私有特征提取器EP、域判別器D和故障判別器C等模塊組成。與原始DSN模型的不同之處在于:①提出的模型中不含源域私有特征提取器和共享特征解碼器兩類模塊,模型結(jié)構(gòu)更加簡潔;②提出了利用目標(biāo)域分類損失函數(shù)訓(xùn)練目標(biāo)域私有特征提取器模塊的訓(xùn)練策略,防止該模塊坍塌提取到無效的特征。
2.3 模型損失函數(shù)
本文提出的特征分離網(wǎng)絡(luò)域自適應(yīng)故障診斷方法的損失函數(shù)包含源域分類損失LCS、目標(biāo)域分類損失LCT、域適應(yīng)損失LS及域分離損失LD,各損失函數(shù)的表達(dá)式及作用如下所述。
源域分類損失使用交叉熵?fù)p失函數(shù):
式中,x(i)S為仿真源域第i個(gè)樣本數(shù)據(jù);y(i)為仿真源域?qū)?yīng)的類別標(biāo)簽;C(*)可以理解為運(yùn)算算子,指將*輸入故障判別器C之后得到的結(jié)果,EI(*)同理;nS為源域樣本數(shù)量。
該損失函數(shù)有效地縮小了模型對仿真源域數(shù)據(jù)的故障預(yù)測結(jié)果與實(shí)際標(biāo)簽之間的差距。通過有監(jiān)督學(xué)習(xí)方式,訓(xùn)練域共享特征提取器和故障判別器參數(shù),促使域共享特征提取器提取有效的故障判別性特征、故障判別器學(xué)習(xí)到有效的故障類別分割函數(shù)。
目標(biāo)域分類損失同樣使用分類交叉熵函數(shù),但目標(biāo)域數(shù)據(jù)沒有標(biāo)簽信息,無法直接利用該函數(shù),為此,提出利用共享特征提取器EI和故障判別器C得到的目標(biāo)域預(yù)測值作為標(biāo)簽,計(jì)算該標(biāo)簽與私有特征提取器EI和故障判別器C預(yù)測結(jié)果之間的交叉熵,得到目標(biāo)域分類損失LCT,表示為
式中,x(i)T為實(shí)際目標(biāo)域第i個(gè)樣本數(shù)據(jù);nT為目標(biāo)域樣本數(shù)量。
域適應(yīng)損失采用領(lǐng)域?qū)股窠?jīng)網(wǎng)絡(luò)(domain adversarial neural network,DANN)模型[16]中的領(lǐng)域?qū)箵p失函數(shù),利用對抗訓(xùn)練的方法促使共享特征提取器從仿真源域和實(shí)際目標(biāo)域數(shù)據(jù)提取到域無關(guān)的故障判別性特征,并且域判別器無法區(qū)分這些特征來源于仿真源域還是實(shí)際目標(biāo)域,達(dá)到縮小仿真源域和真實(shí)目標(biāo)域差異的目的。域適應(yīng)損失函數(shù)是一個(gè)二分類交叉熵?fù)p失函數(shù),即
域分離損失借鑒DSN模型[17]中的Difference損失的構(gòu)造思想,針對共享特征提取器和私有特征提取器所提取的故障判別性特征和環(huán)境噪聲特征,采用兩類特征的正交約束對域分離損失進(jìn)行定義。域分離損失的作用是促使私有特征提取器從實(shí)際目標(biāo)域數(shù)據(jù)中獲取與故障判別性特征相互獨(dú)立的環(huán)境噪聲特征,并將其從故障判別性特征中分離,表達(dá)式為
式中,‖·‖2F為Feobenius范數(shù)平方。
正式地,所提出方法的總損失為
式中,λC、λS、λD為損失函數(shù)權(quán)重超參數(shù)。
2.4 模型參數(shù)更新策略
所提出的模型參數(shù)包括域共享特征提取器EI的參數(shù)θEI、目標(biāo)域私有特征提取器EP的參數(shù)θEP、域判別器D的參數(shù)θD及故障判別器C的參數(shù)θC。模型的總損失函數(shù)L為上述四類參數(shù)的函數(shù),通過優(yōu)化式(12)可得到模型的最優(yōu)參數(shù)值θ^EI、θ^EP、θ^D及θ^C,即
采用Adam算法優(yōu)化模型的參數(shù),參數(shù)的更新策略為
式中,δ為學(xué)習(xí)率;τ為迭代步。
2.5 故障診斷流程
圖2展示了本文提出的動(dòng)力學(xué)仿真數(shù)據(jù)驅(qū)動(dòng)的域自適應(yīng)智能診斷方法的診斷流程。
具體實(shí)施步驟如下:
(1)仿真數(shù)據(jù)獲取。根據(jù)真實(shí)設(shè)備的軸承參數(shù)建立軸承故障動(dòng)力學(xué)模型,以實(shí)際運(yùn)行工況條件為邊界,仿真求解得到不同運(yùn)行狀態(tài)下的動(dòng)力學(xué)響應(yīng),構(gòu)成仿真源域有標(biāo)簽數(shù)據(jù)。
(2)數(shù)據(jù)集劃分。對采集的目標(biāo)域真實(shí)設(shè)備的歷史運(yùn)行數(shù)據(jù)進(jìn)行劃分,一部分無標(biāo)簽數(shù)據(jù)與仿真源域數(shù)據(jù)構(gòu)成訓(xùn)練數(shù)據(jù)集,另一部分構(gòu)成測試數(shù)據(jù)集。
(3)模型構(gòu)建。根據(jù)輸入數(shù)據(jù)尺寸以及輸出的故障類別數(shù)量,構(gòu)建CNN特征提取器模型、故障判別器模型和域判別器模型等,并對模型參數(shù)進(jìn)行初始化。
(4)模型訓(xùn)練。將訓(xùn)練集數(shù)據(jù)輸入模型中進(jìn)行前向傳播,根據(jù)式(12)計(jì)算模型的損失值,通過反向傳播利用式(14)的更新策略訓(xùn)練模型參數(shù),使損失函數(shù)L的值逐漸減小。重復(fù)更新過程,直至損失函數(shù)L滿足要求(收斂或者達(dá)到最大迭代步),模型訓(xùn)練結(jié)束。
(5)模型測試。將目標(biāo)域測試集輸入訓(xùn)練好的診斷模型中進(jìn)行分類診斷,得到故障診斷準(zhǔn)確率。
3 試驗(yàn)驗(yàn)證及討論
3.1 數(shù)據(jù)集構(gòu)建及診斷任務(wù)設(shè)定
使用美國凱斯西儲(chǔ)大學(xué)公開的軸承試驗(yàn)數(shù)據(jù)集[18]驗(yàn)證本文提出方法的有效性。選取風(fēng)扇端軸承(型號(hào)SKF-6203-RS)正常狀態(tài)(N)、軸承內(nèi)圈故障(IR)、軸承外圈故障(OR)、滾動(dòng)體故障(B)四種運(yùn)行狀態(tài)的振動(dòng)加速度數(shù)據(jù),其中故障區(qū)域長度為0.36 mm,采樣頻率為12 kHz。根據(jù)實(shí)際軸承的運(yùn)行工況不同,設(shè)定試驗(yàn)?zāi)繕?biāo)域T1、T2、T3對應(yīng)的轉(zhuǎn)速分別為1772,1750,1732 r/min。結(jié)合軸承參數(shù)、故障區(qū)域長度以及采樣頻率等特點(diǎn),建立軸承動(dòng)力學(xué)模型,仿真求解得到不同運(yùn)行狀態(tài)下的動(dòng)力學(xué)響應(yīng),設(shè)定源域?yàn)镾1、S2和S3。構(gòu)建的試驗(yàn)?zāi)繕?biāo)域與仿真源域數(shù)據(jù)集具體信息如表1所示,其中單個(gè)樣本截取的數(shù)據(jù)長度為2048。
在實(shí)際軸承模型尺寸、轉(zhuǎn)速工況以及采樣頻率/步長一致的基礎(chǔ)上,設(shè)定仿真求解參數(shù)[9,19]后,得到的仿真結(jié)果如圖3所示,其中,圖3a~圖3d分別對應(yīng)正常、內(nèi)圈故障、外圈故障以及滾動(dòng)體故障狀態(tài)下的軸承外圈豎直方向時(shí)域波形。
真實(shí)數(shù)據(jù)如圖4所示,對比可以發(fā)現(xiàn),仿真數(shù)據(jù)與真實(shí)數(shù)據(jù)的故障沖擊波形較為符合。
針對軸承不同的運(yùn)行轉(zhuǎn)速,本文設(shè)定三個(gè)診斷任務(wù),具體描述如表2所示。
3.2 參數(shù)設(shè)置及實(shí)施細(xì)節(jié)
CNN模型可有效提取旋轉(zhuǎn)機(jī)械判別性故障特征,在故障診斷領(lǐng)域一維振動(dòng)信號(hào)處理中已有大量成功應(yīng)用案例[20]。但CNN模型中包含了網(wǎng)絡(luò)層數(shù)、卷積核大小、滑動(dòng)步長、池化方式等大量網(wǎng)絡(luò)結(jié)構(gòu)超參數(shù),這些超參數(shù)調(diào)優(yōu)非常耗時(shí),本文充分借鑒現(xiàn)有的研究成果,建立特征提取器網(wǎng)絡(luò)模型。HAN等[21]和XU等[22]建立了5層深度卷積神經(jīng)網(wǎng)絡(luò)模型,結(jié)合最大池化層,在旋轉(zhuǎn)機(jī)械故障診斷中取得了較高的診斷準(zhǔn)確率。ZHANG等[23]研究結(jié)果表明第一層使用寬卷積核有助于提高模型的抗噪聲性能和診斷精度。根據(jù)上述文獻(xiàn)中CNN模型設(shè)計(jì)研究結(jié)果,結(jié)合本文模型數(shù)據(jù)輸入尺寸以及特征表征維度設(shè)計(jì)的特征提取器模型結(jié)構(gòu)參數(shù)如表3所示,其中Conv表示卷積層,Maxp表示最大池化層。采用Batch Normalizaiton技巧[24]以增強(qiáng)模型的訓(xùn)練穩(wěn)定性,卷積層的激活函數(shù)為線性整流函數(shù)(rectified linear unit,ReLU)。
故障判別器由兩層全連接神經(jīng)網(wǎng)絡(luò)構(gòu)成,模型結(jié)構(gòu)參數(shù)如表4所示,其中FC表示全連接層。本文的診斷任務(wù)中共包含四種運(yùn)行狀態(tài),故障判別器模型的輸出維度為4。
域判別器也由兩層全連接神經(jīng)網(wǎng)絡(luò)構(gòu)成,如表5所示,本文中涉及的數(shù)據(jù)域有源域和目標(biāo)域,模型的輸出維度為2。
本文提出的模型以及后續(xù)的對比模型均在Pytorch深度學(xué)習(xí)框架下實(shí)現(xiàn),batchsize大小設(shè)定為64,學(xué)習(xí)率為固定的1×10-4,最大迭代次數(shù)為300,λC、λS、λD的默認(rèn)取值分別為1、0.1和0.1。
3.3 對比方法
對比方法為Based、MMD、DSN、DANN以及文獻(xiàn)[12]方法。其中,Based指的是用仿真數(shù)據(jù)訓(xùn)練的模型直接用于實(shí)際場景診斷,即沒有真實(shí)數(shù)據(jù)參與模型訓(xùn)練的方法,本文將該方法視為基線方法。在模型參數(shù)設(shè)置方面,Based、MMD、DSN以及DANN等對比方法與本文方法均采用相同結(jié)構(gòu)的特征提取器及故障判別器網(wǎng)絡(luò)模型,文獻(xiàn)[12]為仿真數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法。所有模型的學(xué)習(xí)率、Batchsize數(shù)量等參數(shù)均一致。
3.4 故障診斷結(jié)果
使用仿真源域和無標(biāo)簽實(shí)際目標(biāo)域訓(xùn)練數(shù)據(jù)集訓(xùn)練模型后,將測試數(shù)據(jù)集的故障診斷準(zhǔn)確率作為衡量所提出的方法以及各種對比方法診斷性能的標(biāo)準(zhǔn),計(jì)算公式如下:
其中,Ncorrect為正確預(yù)測的樣本數(shù)量;Ntotal為總樣本數(shù)量。為消除訓(xùn)練過程中隨機(jī)因素影響,每次試驗(yàn)均進(jìn)行20次,給出診斷準(zhǔn)確率的平均值及標(biāo)準(zhǔn)差。
不同方法在設(shè)定的三個(gè)軸承診斷任務(wù)中的診斷準(zhǔn)確率匯總?cè)鐖D5所示,其中Proposed表示本文提出的方法。
由圖5分析可以發(fā)現(xiàn):
(1)Based方法的診斷準(zhǔn)確率較低,平均僅為60.32%,主要原因是仿真源域與試驗(yàn)?zāi)繕?biāo)域之間存在環(huán)境噪聲等差異,無法將仿真源域數(shù)據(jù)訓(xùn)練的模型直接應(yīng)用于實(shí)際目標(biāo)域,這也表明遷移診斷技術(shù)的必要性。
(2)加入無標(biāo)簽實(shí)際目標(biāo)域數(shù)據(jù)的MMD、DSN、DANN、文獻(xiàn)[12]及Proposed等遷移診斷方法的診斷性能均優(yōu)于Based方法的診斷性能,表明仿真源域和實(shí)際目標(biāo)域之間的差異有所緩解,但各種方法處理域差異的手段不同,診斷性能提升水平不同。
(3)本文所提出的方法在三個(gè)診斷任務(wù)中的平均診斷準(zhǔn)確率為96.91%,表明仿真數(shù)據(jù)和實(shí)際數(shù)據(jù)具有相似的故障特征,證明了利用動(dòng)力學(xué)模型仿真技術(shù)擴(kuò)充故障案例手段的有效性。
(4)相比于其他4種遷移對比方法,本文所提出的方法在三個(gè)任務(wù)中均達(dá)到了最高的診斷準(zhǔn)確率。與對比方法中診斷性能最好的DANN相比,平均診斷準(zhǔn)確率提高了2.10%,標(biāo)準(zhǔn)差降低了38.11%。這表明本文所提出的方法在“仿真-實(shí)際”遷移診斷場景具有最優(yōu)的診斷性能,同時(shí)也具有更好的診斷穩(wěn)定性。
3.5 模型可視化分析
為了進(jìn)一步分析所提出方法的優(yōu)勢,便于直觀上觀察遷移診斷結(jié)果,以目標(biāo)域?qū)嶋H數(shù)據(jù)為輸入,采用t分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding,t-SNE)技術(shù)[25]將特征提取器輸出的192維特征向量降至2維平面展示,以診斷任務(wù)一為例,各種方法的特征降維可視化結(jié)果如圖6所示。
由圖6可以發(fā)現(xiàn),六種方法均可將正常與故障特征劃分出明顯的界線,即使是不含鄰域適配的Based方法也可將正常狀態(tài)有效分離,但Based方法的不同故障特征映射結(jié)果嚴(yán)重混疊,無法區(qū)分,如圖6a所示。DSN方法對不同故障特征映射邊界不清晰,如圖6c所示。MMD方法從整體上看可以將不同故障的特征有效分割,但是誤診數(shù)量較多,主要是將滾動(dòng)體故障誤診為內(nèi)圈和外圈故障,如圖6b所示。DANN方法特征映射后具有清晰邊界,但同樣誤診數(shù)量較多,主要是存在內(nèi)圈和滾動(dòng)體故障相互誤分類的現(xiàn)象,如圖6d所示。文獻(xiàn)[12]方法對內(nèi)圈故障和滾動(dòng)體故障的分類邊界稍有重疊。相對而言,本文所提出的方法不僅使不同故障的邊界清晰,并且僅有少數(shù)樣本被誤分類,如圖6f所示,表明該方法特征映射效果最好,優(yōu)于其他對比方法。
圖6所示特征降維可視化結(jié)果無法定量分析不同方法的特征映射效果,在上述t-SNE的二維映射基礎(chǔ)上,以特征平均類間距和平均類內(nèi)散度為指標(biāo),進(jìn)一步定量對比不同方法的特征提取效果,最小類間距離和平均類內(nèi)散度的計(jì)算結(jié)果如圖7和圖8所示。
由圖7分析可知,本文所提方法在三個(gè)診斷任務(wù)中數(shù)據(jù)特征映射的綜合平均類間距最大,但是在診斷任務(wù)二中,雖然MMD方法的診斷準(zhǔn)確率低,但MMD方法類間距卻大于本文所提方法類間距。同時(shí)對比其他方法類間距可以發(fā)現(xiàn),故障類間距指標(biāo)與診斷準(zhǔn)確率并不成正比關(guān)系,造成這種現(xiàn)象的原因可能是在故障類間距計(jì)算中僅考慮了不同類別映射特征映射中心值,忽略了樣本的聚集特性,因此單純依靠類間距指標(biāo)無法有效衡量不同方法的特征提取聚集性能。相比于類間距指標(biāo),類內(nèi)散度指標(biāo)(圖8)更能體現(xiàn)不同方法的特征聚類性能。由圖8可以看出,本文所提出的方法在三個(gè)診斷任務(wù)中數(shù)據(jù)特征映射的類內(nèi)散度最小,平均類內(nèi)散度為8.57,與對比方法中性能最優(yōu)的DANN方法相比,平均類內(nèi)散度減小了9.02%,表明對故障特征的聚集性越好,越有利于故障診斷。
3.6 目標(biāo)域分類損失的影響分析
為提高模型訓(xùn)練穩(wěn)定性,本文提出的方法中設(shè)計(jì)了一種新的目標(biāo)域分類損失項(xiàng)LCT以提高訓(xùn)練穩(wěn)定性。下面進(jìn)一步分析LCT對診斷準(zhǔn)確率的影響。分別測試在不同診斷任務(wù)中含或不含LCT時(shí)模型的診斷準(zhǔn)確率,結(jié)果如表6所示。
由表6可以看出,模型不含LCT損失時(shí),三個(gè)診斷任務(wù)中的診斷準(zhǔn)確率均略微有所下降,平均降低了1.35%,但是診斷準(zhǔn)確率的標(biāo)準(zhǔn)差卻大幅度增加,平均增大了57.20%,模型的訓(xùn)練穩(wěn)定性變差。上述結(jié)果表明所提出的目標(biāo)域分類損失LCT不僅能夠提高模型的診斷準(zhǔn)確率,同時(shí)可有效提高模型訓(xùn)練的穩(wěn)定性。
3.7 超參數(shù)敏感度分析
本文所提方法中包含三個(gè)重要的超參數(shù),分別為目標(biāo)域分類損失、域適應(yīng)損失、域分離損失的權(quán)重超參數(shù)λC、λS和λD。下面經(jīng)驗(yàn)性地探討超參數(shù)的敏感度,三個(gè)權(quán)重超參數(shù)不同取值范圍的診斷準(zhǔn)確率展示在圖9中。
由圖9可以看出,當(dāng)λC<1時(shí),不同λC的取值對診斷準(zhǔn)確率影響較小。同樣當(dāng)λD<0.1時(shí),λD的取值對診斷結(jié)果不敏感。但λS對診斷結(jié)果的影響較大,在設(shè)定診斷任務(wù)中,λS取值在0.1以外時(shí),模型的診斷性能急劇下降?;谏鲜龇治鼋Y(jié)果,在應(yīng)用本方法時(shí),建議超參數(shù)的選擇范圍如下:λC<1、λS=0.1以及λD<0.1。
4 結(jié)論
本文提出了一種動(dòng)力學(xué)仿真數(shù)據(jù)驅(qū)動(dòng)的域自適應(yīng)智能診斷新方法,并通過試驗(yàn)分析驗(yàn)證了所提方法的有效性和優(yōu)越性,得到的主要結(jié)論如下:
(1)動(dòng)力學(xué)模型仿真技術(shù)可豐富故障案例庫,利用這些數(shù)據(jù)訓(xùn)練的遷移診斷模型能有效診斷出實(shí)際故障,證明了動(dòng)力學(xué)故障仿真技術(shù)可緩解現(xiàn)有遷移診斷模型依賴高質(zhì)量標(biāo)簽數(shù)據(jù)的困境,是解決工業(yè)數(shù)據(jù)缺失問題的一種有效手段,具有一定的工程研究價(jià)值。
(2)提出的特征分離網(wǎng)絡(luò)域自適應(yīng)診斷模型提取的特征表示具有較小的類內(nèi)散度,增強(qiáng)了域不變特征提取和聚類能力,且在多個(gè)遷移診斷任務(wù)中達(dá)到了最高的診斷準(zhǔn)確率。
(3)提出的將域共享特征提取器診斷結(jié)果用于域獨(dú)有特征提取器模型參數(shù)的訓(xùn)練策略,增強(qiáng)了模型的訓(xùn)練穩(wěn)定性,進(jìn)一步提高了模型的故障診斷準(zhǔn)確率。
在未來的研究中,可以基于本文提出的特征分離網(wǎng)絡(luò)模型,研究實(shí)際中缺失真實(shí)故障樣本場景下的智能診斷方法,進(jìn)一步提高特征分離網(wǎng)絡(luò)模型的適用性。
參考文獻(xiàn):
[1]雷亞國,韓天宇,王彪,等. XJTU-SY滾動(dòng)軸承加速壽命試驗(yàn)數(shù)據(jù)集解讀[J]. 機(jī)械工程學(xué)報(bào),2019,55(16):1-6.
LEI Yaguo,HAN Tianyu,WANG Biao,et al. XJTU-SY Rolling Element Bearing Accelerated Life Test Datasets:a Tutorial[J]. Journal of Mechanical Engineering,2019,55(16):1-6.
[2]RAI A,UPADHYAY S H. A Review on Signal Processing Techniques Utilized in the Fault Diagnosis of Rolling Element Bearings[J]. Tribology International,2016,96:289-306.
[3]LI W,HUANG R,LI J,et al. A Perspective Survey on Deep Transfer Learning for Fault Diagnosis in Industrial Scenarios:Theories,Applications and Challenges[J]. Mechanical Systems and Signal Processing,2022,167:108487.
[4]CHOUDHARY A,MISHRA R K,F(xiàn)ATIMA S,et al. Multi-input CNN Based Vibro-acoustic Fusion for Accurate Fault Diagnosis of Induction Motor[J]. Engineering Applications of Artificial Intelligence,2023,120:105872.
[5]CHEN X,ZHANG B,GAO D. Bearing Fault Diagnosis Base on Multi-scale CNN and LSTM Model[J]. Journal of Intelligent Manufacturing,2021,32(4):971-987.
[6]WU Xinya,ZHANG Yan, CHENG Changming,et al. A Hybrid Classification Autoencoder for Semi-supervised Fault Diagnosis in Rotating Machinery[J]. Mechanical Systems and Signal Processing,2021,149:107327.
[7]SUN M,WANG H,LIU P,et al. A Sparse Stacked Denoising Autoencoder with Optimized Transfer Learning Applied to the Fault Diagnosis of Rolling Bearings[J]. Measurement,2019,146:305-314.
[8]KIM M,KO J U,LEE J,et al. A Domain Adaptation with Semantic Clustering(DASC)Method for Fault Diagnosis of Rotating Machinery[J]. ISA Transactions,2022,120:372-382.
[9]DONG Y,LI Y,ZHENG H,et al. A New Dynamic Model and Transfer Learning Based Intelligent Fault Diagnosis Framework for Rolling Element Bearings Race Faults:Solving the Small Sample Problem[J]. ISA Transactions,2022,121:327-348.
[10]董紹江,朱朋,朱孫科,等. 基于仿真數(shù)據(jù)驅(qū)動(dòng)和領(lǐng)域自適應(yīng)的滾動(dòng)軸承故障診斷方法[J]. 中國機(jī)械工程,2023,34(6):694-702.
DONG Shaojiang,ZHU Peng,ZHU Sunke,et al. Fault Diagnosis Method of Rolling Bearing Based on Simulation Data Drive and Domain Adaptation[J]. China Mechanical Engineering,2023,34(6):694-702.
[11]ZHU P,DONG S,PAN X,et al. A Simulation-data-driven Subdomain Adaptation Adversarial Transfer Learning Network for Rolling Element Bearing Fault Diagnosis[J]. Measurement Science and Technology,2022,33(7):75101.
[12]邵海東,肖一鳴,顏深. 仿真數(shù)據(jù)驅(qū)動(dòng)的改進(jìn)無監(jiān)督域適應(yīng)軸承故障診斷[J]. 機(jī)械工程學(xué)報(bào),2023,59(3):76-85.
SHAO Haidong,XIAO Yiming,YAN Shen. Simulation Data-driven Enhanced Unsupervised Domain Adaptation for Bearing Fault Diagnosis[J]. Journal of Mechanical Engineering,2023,59(3):76-85.
[13]YU K,F(xiàn)U Q,MA H,et al. Simulation Data Driven Weakly Supervised Adversarial Domain Adaptation Approach for Intelligent Cross-machine Fault Diagnosis[J]. Structural Health Monitoring,2021,20(4):2182-2198.
[14]祁宏偉,牛藺楷,謝宏浩,等. 純滾動(dòng)條件下滾動(dòng)軸承滾球自轉(zhuǎn)速度的計(jì)算[J]. 機(jī)電工程,2021,38(7):822-828.
QI Hongwei,NIU Linkai,XIE Honghao,et al. Calculation of Self-rotation Speed of Balls in Rolling Bearings under Pure Rolling Condition[J]. Journal of Mechanical & Electrical Engineering,2021,38(7):822-828.
[15]PAN S J,YANG Q. A Survey on Transfer Learning[J]. IEEE Transactions on Knowledge and Data Engineering,2010,22(10):1345-1359.
[16]GANIN Y,USTINOVA E,AJAKAN H,et al. Domain-adversarial Training of Neural Networks[J]. The Journal of Machine Learning Research,2016,17(1):2096-2030.
[17]BOUSMALIS K,TRIGEORGIS G,SILBERMAN N,et al. Domain Separation Networks[C]∥Advances in Neural Information Processing Systems 29. La Jolla,2016:1-9.
[18]SMITH W A,RANDALL R B. Rolling Element Bearing Diagnostics Using the Case Western Reserve University Data:a Benchmark Study[J]. Mechanical Systems and Signal Processing,2015,64:100-131.
[19]SASSI S,BADRI B,THOMAS M. A Numerical Model to Predict Damaged Bearing Vibrations[J]. Journal of Vibration and Control,2007,13(11):1603-1628.
[20]溫江濤,張鵬程,孫潔娣,等. 殘差卷積自編碼網(wǎng)絡(luò)無監(jiān)督遷移軸承故障診斷[J]. 中國機(jī)械工程,2022,33(14):1707-1716.
WEN Jiangtao,ZHANG Pengcheng,SUN Jiedi,et al. Unsupervised Transfer Learning with Residual Convolutional Autoencoder Networks for Bearing Fault Diagnosis[J]. China Mechanical Engineering,2022,33(14):1707-1716.
[21]HAN T,LI Y,QIAN M. A Hybrid Generalization Network for Intelligent Fault Diagnosis of Rotating Machinery under Unseen Working Conditions[J]. IEEE Transactions on Instrumentation and Measurement,2021,70:3520011.
[22]XU K,LI S,WANG J,et al. A Novel Convolutional Transfer Feature Discrimination Network for Unbalanced Fault Diagnosis under Variable Rotational Speeds[J]. Measurement Science and Technology,2019,30(10):105107.
[23]ZHANG W,PENG G,LI C,et al. A New Deep Learning Model for Fault Diagnosis with Good Anti-noise and Domain Adaptation Ability on Raw Vibration Signals[J]. Sensors,2017,17(2):425.
[24]SERGEY I,CHRISTIAN S. Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shift[C]∥Proceedings of the 32nd International Conference on Machine Learning. New York:PMLR,2015:448-456.
[25]van der MAATEN L,HINTON G. Visualizing Data Using t-SNE[J]. The Journal of Machine Learning Research,2008,9(11):2579-2605.
(編輯 王艷麗)
作者簡介:于樹博,男,1993年生,博士研究生。研究方向?yàn)樾D(zhuǎn)機(jī)械智能故障診斷、動(dòng)力機(jī)械振動(dòng)與噪聲控制。劉占生(通信作者),男,1962年生,教授、博士研究生導(dǎo)師。研究方向?yàn)楹娇瞻l(fā)動(dòng)機(jī)及燃?xì)廨啓C(jī)高速旋轉(zhuǎn)機(jī)械故障診斷、航空發(fā)動(dòng)機(jī)及燃?xì)廨啓C(jī)振動(dòng)噪聲控制、流固耦合振動(dòng)等。E-mail:lzs@hit.edu.cn。