陶浩然,許 昕,潘宏俠,*,王 同,徐轟釗
(1.中北大學(xué) 機械工程學(xué)院,山西 太原 030051;2.中北大學(xué) 系統(tǒng)辨識與診斷技術(shù)研究所,山西 太原 030051)
行星齒輪傳動是一種多功能的機械傳動方式。該傳動方式可以實現(xiàn)功率分流,具有高效率、高承載能力、高可靠性等優(yōu)點,是許多旋轉(zhuǎn)機械設(shè)備的一個重要組成部分。然而,由于行星齒輪的齒面幾何形狀非常復(fù)雜,行星齒輪的制造和裝配需要很高的精度。另外,行星齒輪經(jīng)常處于高速和重載等惡劣工況[1],其關(guān)鍵部件的損壞都會導(dǎo)致設(shè)備的停機,甚至導(dǎo)致嚴(yán)重的后果。
因此,研究行星齒輪各振動模式的信號模型[2],保證設(shè)備運行的穩(wěn)定性與可靠性,在實際工程應(yīng)用中具有重要的意義。
在強烈的背景噪聲下,如何較好地提取行星齒輪的微弱故障特征,這是行星齒輪故障診斷領(lǐng)域需要解決的難題[3]。由于旋轉(zhuǎn)機械的故障通常伴隨著振動信號的變化,因此,其振動信號分析方法成為故障診斷的有效手段[4]。
針對行星齒輪實際工作條件下,收集到的振動信號的非線性和非平穩(wěn)性特點,HUANG N E等人[5]提出了一種經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)算法,由于該算法在處理非線性、非平穩(wěn)信號上具有自適應(yīng)等的優(yōu)點,使得其在一些領(lǐng)域得到了廣泛應(yīng)用。谷玉海等人[6]對軸承振動數(shù)據(jù)進行了經(jīng)驗?zāi)J椒纸夂皖l譜分析,將頻譜數(shù)據(jù)壓縮成特征二值化圖像,并將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)進行了訓(xùn)練,取得了不錯的效果;但使用EMD方法處理振動信號時,容易發(fā)生模態(tài)混疊的現(xiàn)象。在此基礎(chǔ)上,WU Z等人[7]提出了一種將EMD方法與白噪聲信號的統(tǒng)計特性相結(jié)合的新方法,即集合經(jīng)驗?zāi)B(tài)分解(EEMD),旨在提高經(jīng)驗?zāi)J椒纸獾臏?zhǔn)確性和有效性,在特征量提取困難的情況下,利用其自適應(yīng)性來提取故障特征[8],獲得本征模態(tài)函數(shù)成分后,直接將其輸入神經(jīng)網(wǎng)絡(luò),作為特征值[9-10],并根據(jù)所需特征用于故障診斷和識別。目前,這種方法已經(jīng)在故障診斷領(lǐng)域得到了廣泛應(yīng)用。
在實際工作條件下,收集到的振動信號可能會被各種噪聲源所破壞。針對這一問題,一些學(xué)者采用機器學(xué)習(xí)的方法,對旋轉(zhuǎn)機械進行了故障診斷。JIN Y等人[11]開發(fā)了一種處理一維格式數(shù)據(jù)的標(biāo)記序列生成方法,即時間序列變換器,并對其超參數(shù)進行了分析,采用該方法進行了滾動軸承故障診斷實驗,對該方法的有效性進行了驗證。
孫燦飛等人[12]采用參數(shù)自適應(yīng)變異模式分解方法,對強背景噪聲下的二階太陽齒輪裂紋進行了診斷;但其特征提取不夠充分。
為了彌補上述方法在特征提取方面的不足,一些學(xué)者在故障診斷系統(tǒng)中運用了深度學(xué)習(xí)方法[13-14]。馮浩楠等人[15]提出了基于批量歸一化的一維卷積神經(jīng)網(wǎng)絡(luò)模型,用于旋轉(zhuǎn)機械的故障診斷和故障特征的自適應(yīng)提取,該模型減少了故障診斷的工作量。HUANG W等人[16]使用一種多尺度級聯(lián)卷積神經(jīng)網(wǎng)絡(luò),以端對端的形式,實現(xiàn)了輸入信號分類信息增強的目的,并自適應(yīng)地提取和識別了故障類型;但是上述方法都沒有考慮故障在時間序列上的特征。
從時間序列數(shù)據(jù)入手,為提取更全面的故障特征,學(xué)者們開始利用長短期記憶(LSTM)網(wǎng)絡(luò)。作為一種經(jīng)改進的遞歸神經(jīng)網(wǎng)絡(luò),LSTM在時間序列任務(wù)中可以更好地捕捉長期依賴關(guān)系[17-18],已在很多基于時間序列的應(yīng)用中取得了不錯的成果。TAK A[19]在輸電系統(tǒng)的故障診斷中,使用LSTM網(wǎng)絡(luò)進行了診斷分類。呂云開等人[20]使用孿生神經(jīng)網(wǎng)絡(luò)與LSTM相結(jié)合的故障診斷方法,在小樣本數(shù)據(jù)條件下,取得了不錯的故障診斷效果。
然而,以上學(xué)者都未對LSTM網(wǎng)絡(luò)的超參數(shù)設(shè)置產(chǎn)生的影響進行深入研究。
綜上所述,針對行星齒輪工作過程中存在的復(fù)雜工況(比如,工作環(huán)境差、齒輪輪齒易發(fā)生復(fù)合故障等),筆者提出一種基于EEMD和LSTM相結(jié)合的方法,將其用于行星齒輪故障診斷。
首先,使用EEMD對復(fù)雜行星齒輪故障振動信號進行分解,得到其本征模態(tài)分量;隨后,將輸入數(shù)據(jù)送入經(jīng)遺傳算法優(yōu)化的LSTM模型中進行訓(xùn)練,并對網(wǎng)絡(luò)超參數(shù)進行自動尋優(yōu),以提高模型的分類精度和泛化能力;最后,采用4種狀態(tài)下采集的行星齒輪故障信號制作樣本集,對基于EEMD和GA-LSTM方法的故障識別準(zhǔn)確率進行驗證。
集成經(jīng)驗?zāi)B(tài)分解(EEMD)是為優(yōu)化EMD算法中模態(tài)混疊和端點效應(yīng)劣勢,而提出的一種用于分解非線性、非平穩(wěn)信號的方法。
EEMD算法是通過向原始信號添加不同尺度和振幅的隨機高斯白噪聲,利用所加噪聲的頻率均勻分布的統(tǒng)計特性,得到多個與原始信號有相同物理意義的本征模態(tài)函數(shù)(IMF)。
在每個IMF中添加適當(dāng)振幅的隨機高斯白噪聲,有助于消除離群點和擬合誤差,從而提高數(shù)據(jù)的可靠性與準(zhǔn)確性。
以下為EEMD算法步驟:
1)將高斯白噪聲si(t)加入原始信號x(t)中,得到待處理信號Xi(t):
Xi(t)=x(t)+csi(t)
(1)
式中:c為白噪聲信號的幅值系數(shù);si(t)為第i次加入的白噪聲;Xi(t)為第i次加入的白噪聲時得到的待處理信號;
2)利用EMD對待處理信號Xi(t)進行分解,得到各階IMF分量與余項Mi(t),其表達(dá)式如下:
(2)
3)對步驟1)和2)進行重復(fù),每次都加入不同序列的隨機高斯白噪聲,其表達(dá)式如下:
(3)
4)每次分解都會得到分量與余項。為消除多次加入高斯白噪聲對真實IMF值的影響,將兩項相加求平均。采用高斯白噪聲頻譜的均值為零,計算上述各IMF均值,得到最終IMF分量為:
(4)
式中:kin為第i次EMD分解所產(chǎn)生的第n個IMF;n為EEMD的集成次數(shù)。
遺傳算法(GA)是一種用于尋找最佳方案的計算模型,它模擬了生物進化的過程。GA模型使用選擇、交叉和變異運算符來創(chuàng)建新的候選解決方案,并隨著時間的推移提高群體的適配性。GA算法廣泛用于優(yōu)化問題,如工程設(shè)計、調(diào)度、機器學(xué)習(xí)等,對解決非線性和全局優(yōu)化問題等具有良好的效果。
GA模型的基本原理如圖1所示。
圖1 GA模型的基本原理
長短期記憶神經(jīng)網(wǎng)絡(luò)是遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)中的一種。與RNN相比,LSTM克服了梯度消失問題,且具有更強的記憶能力,更擅長處理冗長的順序信號。LSTM引入特殊的“門”機制,通過其3個門控(遺忘門、輸入門和輸出門)學(xué)習(xí)時間序列特征[21]。
神經(jīng)單元結(jié)構(gòu)如圖2所示。
圖2 LSTM神經(jīng)單元結(jié)構(gòu)
LSTM的運算過程為:遺忘門ft利用當(dāng)前輸入xt和最后時間步長的外部狀態(tài)ht-1,同時執(zhí)行sigmoid函數(shù),評估是否保留先前的神經(jīng)元信息Ct-1。
遺忘門ft的輸出為0,表示先前神經(jīng)元信息將被丟棄;當(dāng)輸出為1時,表示上一時刻信息被保留。
遺忘門的表達(dá)式如下:
ft=σ(Wf·(ht-1,xt)+bf)
(5)
式中:σ為sigmoid激活函數(shù);bf為偏置;Wf為權(quán)重;Ct-1為存儲先前記憶信息的單元狀態(tài);ft為由遺忘門控制的遺忘程度。
輸入門負(fù)責(zé)確定必要的新信息添加到單元狀態(tài)中,用來更新。輸入門的表達(dá)式如下:
it=σ(Wi·(ht-1,xt)+bc)
(6)
(7)
(8)
為了確定LSTM中當(dāng)前神經(jīng)元的輸出信息,采用了輸出門,其表達(dá)式如下:
ot=σ(Wo·(ht-1,xt)+bo)
(9)
ht=ot·tanh(Ct)
(10)
式中:ot為輸出門。
筆者使用sigmoid函數(shù)來確定當(dāng)前狀態(tài)信息中應(yīng)該被輸出的相關(guān)部分,然后將所得值與當(dāng)前狀態(tài)信息Ct相乘,由tanh激活;隨后,所得的內(nèi)部狀態(tài)信息被轉(zhuǎn)發(fā)到外部狀態(tài),即隱藏層輸出ht。
LSTM網(wǎng)絡(luò)使用一個存儲單元來存儲和檢索長時間的信息,這使得網(wǎng)絡(luò)能夠保持順序數(shù)據(jù)的長期依賴性。但是其泛化能力差,收斂速度慢。
筆者使用GA-LSTM就是在其基礎(chǔ)上進行的改進,并利用GA選取最佳參數(shù)。
故障診斷模型如圖3所示。
圖3 故障診斷模型
故障診斷模型步驟如下:
步驟一。采集行星齒輪的時域加速度數(shù)據(jù),將各種狀態(tài)的振動數(shù)據(jù)分割成固定長度的序列;隨后進行預(yù)處理,用數(shù)值進行標(biāo)注,將其分為訓(xùn)練集和測試集,作為深度神經(jīng)網(wǎng)絡(luò)故障診斷模型的輸入;
步驟二。在GA-LSTM層,利用遺傳算法優(yōu)化權(quán)重和偏差,在訓(xùn)練過程中分批接收訓(xùn)練樣本,并為學(xué)習(xí)率、LSTM單元數(shù)、訓(xùn)練次數(shù)等超參數(shù)選擇合適的值迭代;采用GA-LSTM層對時序數(shù)據(jù)進行計算,整合計算值后,將其輸入到SoftMax層;
步驟三。SoftMax層為每個可能的輸出類別產(chǎn)生一個概率分?jǐn)?shù),預(yù)測的類別是具有最高分?jǐn)?shù)的類別。該層通過概率分布對故障狀態(tài)進行分類。通過比較樣本的輸出概率和實際值,得到損失率,并使用梯度下降算法不斷優(yōu)化權(quán)重和偏置;
步驟四。模型訓(xùn)練達(dá)到指定的迭代次數(shù)后,使用訓(xùn)練好的模型對測試樣本進行預(yù)測,將預(yù)測結(jié)果與實際類別進行對比,得到模型對測試集的分類準(zhǔn)確率。
故障模擬實驗在晉中學(xué)院故障診斷實驗室進行。
該實驗臺由驅(qū)動電機、扭矩速度傳感器和采集儀、螺旋錐齒輪箱、行星齒輪箱、底板、磁粉制動器、保護罩和控制系統(tǒng)組成。
實驗臺底板尺寸為1 800 mm×900 mm,齒輪箱尺寸為350 mm×250 mm。實驗內(nèi)容為采集不同故障工況齒輪的振動加速度信號。
行星齒輪故障模擬實驗臺如圖4所示。
圖4 行星齒輪故障診斷實驗臺
實驗電機轉(zhuǎn)速為2 200 r/min。筆者設(shè)定采樣頻率為5 kHz。
ICP三向加速度傳感器X、Y、Z軸分別對應(yīng)信號采集通道1、2、3;ICP單向加速度傳感器Z軸對應(yīng)信號采集通道4,筆者將其分別設(shè)置在大小齒輪軸線處的箱蓋上,每種工況采樣時間為10 s。
為了獲得IMF分量,需要對每種狀態(tài)的信號都用EEMD進行分解。筆者將數(shù)據(jù)分為500個數(shù)據(jù)點的集合,并使用EEMD將每個集合分解為IMF分量。
在這項研究中,原始信號和前6個IMF分量被選為特征量,從而使每組數(shù)據(jù)被分解為一個特征樣本。筆者使用該方法對不同狀態(tài)的數(shù)據(jù)進行分解,共得到750組特征樣本。
故障數(shù)據(jù)集描述如表1所示。
表1 故障數(shù)據(jù)集
在試驗過程中,筆者考慮了4種不同的條件(狀態(tài)):正常狀態(tài)、齒根斷裂、齒面磨損和缺齒。
在正常和3種故障條件下,從實驗臺獲得的信號時域圖如圖5所示。
圖5 4種狀態(tài)信號的時域圖
由圖5可得:不同條件下的振動信號表現(xiàn)出不同的特征,其中,正常情況下表現(xiàn)為穩(wěn)定的周期性振動信號,故障條件下的振動信號更不規(guī)則,包含脈沖狀的特征。
筆者使用EEMD,對行星齒輪振動加速度進行信號分解,以獲得IMF分量,然后按頻率對IMF分量進行排序,并在其中加入標(biāo)準(zhǔn)偏差為0.1的高斯白噪聲,共得到6個IMF分量。
在不同的運行條件下,對齒輪信號進行分解,其中一種IMF分量如圖6所示。
圖6 齒根斷裂信號EEMD分解圖
為了提高預(yù)測精度,筆者采用遺傳算法(GA)[22-23]對LSTM進行優(yōu)化,這樣可避免人為設(shè)置超參數(shù)時存在的主觀性影響,也節(jié)省了計算資源和時間成本。
GA-LSTM網(wǎng)絡(luò)參數(shù)設(shè)置如表2所示。
表2 網(wǎng)絡(luò)參數(shù)設(shè)置
筆者利用GA-LTSM網(wǎng)絡(luò)模型來識別最初的6個模態(tài)成分,并為其配置相應(yīng)的參數(shù)。GA-LSTM模型由1個GA-LTSM層、1個SoftMax層、1個全連接層和1個分類輸出層組成。其中,為避免模型的過擬合問題,在全連接層中增加了Dropout隨機失活層,并在Dropout層中設(shè)置失活概率為0.6。
此外,還可以使用小批次設(shè)定,使模型更頻繁地更新參數(shù),并且可以降低對內(nèi)存的需求。
經(jīng)GA優(yōu)化的LSTM網(wǎng)絡(luò)的超參數(shù)如表3所示。
表3 GA-LSTM網(wǎng)絡(luò)模型超參數(shù)設(shè)置
循環(huán)數(shù)代表訓(xùn)練次數(shù),筆者設(shè)置為100次,每個循環(huán)后網(wǎng)絡(luò)都會迭代更新。模型的運行環(huán)境為MATLAB。
在該實驗中,筆者隨機選取90%的數(shù)據(jù)作為訓(xùn)練樣本,并使用GA-LSTM網(wǎng)絡(luò)對樣本進行訓(xùn)練。
損失隨迭代次數(shù)變化的情況如圖7所示。
圖7 迭代次數(shù)與模型的訓(xùn)練損失率的關(guān)系
從圖7中可以看出:該網(wǎng)絡(luò)的損失率低于2%,證明了該網(wǎng)絡(luò)具有良好的穩(wěn)定性。
筆者使用剩余10%的數(shù)據(jù)進行測試。模型訓(xùn)練準(zhǔn)確率曲線如圖8所示。
圖8 模型訓(xùn)練準(zhǔn)確率曲線
由圖8可知:模型經(jīng)過測試后,得到了該模型的精度為94.17%;同時,在迭代計算過程中,訓(xùn)練曲線會產(chǎn)生一定的波動,表明該模型在進一步迭代中可以達(dá)到穩(wěn)定的預(yù)測效果。
筆者利用混淆矩陣展示模型分類的評估性能,如圖9所示。
圖9 測試結(jié)果混淆矩陣
由圖9可以發(fā)現(xiàn):模型能比較準(zhǔn)確地識別出行星齒輪的缺齒、正常和齒面磨損情況,但是對行星齒輪齒根斷裂情況的識別率最低,為90.0%,這表明模型還存在齒根斷裂被誤判的問題,導(dǎo)致結(jié)果偏差增加(其原因是在特征判斷上,與其他故障類型相比,齒根斷裂容易被誤判為正常情況)。
因此,筆者還需要進一步優(yōu)化模型,以提高對齒根斷裂的識別率。
綜上所述,該網(wǎng)絡(luò)在行星齒輪故障識別方面表現(xiàn)良好,是一個可靠的分類工具。
3.4.1 必要性驗證
未經(jīng)EEMD處理以及經(jīng)過EEMD處理的網(wǎng)絡(luò),在迭代測試精度方面的情況如圖10所示。
圖10 網(wǎng)絡(luò)精度隨EEMD處理前后迭代次數(shù)的變化
由圖10可以得知:未進行EEMD處理的網(wǎng)絡(luò)表現(xiàn)出相對較差的穩(wěn)定性,其精度僅能達(dá)到78%;經(jīng)過使用EEMD處理后的網(wǎng)絡(luò),可以實現(xiàn)94%的準(zhǔn)確率,同時穩(wěn)定性和精度也得到了顯著提升。
這表明,使用EEMD方法處理數(shù)據(jù)有利于改善網(wǎng)絡(luò)的穩(wěn)定性和精度,同時也說明LSTM網(wǎng)絡(luò)更適合用于處理時序信號。
由于該實驗是模擬的,而在實際工作條件下,行星齒輪可能會遇到更多的噪聲干擾,這會大大削弱故障信號的特征,使得其特征提取更具有挑戰(zhàn)性。
為了進一步模擬行星齒輪的實際工作情況,筆者在其原始振動信號中加入了噪聲,并對這種添加噪聲的影響進行了分析,結(jié)果如圖11所示。
圖11 添加噪聲后EEMD處理對模型精度的影響
由圖11可以看出:如果沒有對添加噪聲的信號進行EEMD降噪處理,其分類結(jié)果會變差;反之,添加噪聲后,對EEMD和GA-LSTM網(wǎng)絡(luò)而言,其分類精度仍然保持在相對較高的水準(zhǔn)上。這說明,在實際應(yīng)用中,EEMD方法能有效地減少噪聲的干擾,提高行星齒輪的故障診斷精度;
當(dāng)加入噪聲后,該模型的準(zhǔn)確度達(dá)到了90.0%;而當(dāng)使用沒有經(jīng)EEMD分解的信號時,其準(zhǔn)確度只有75.3%。這證明,使用EEMD算法的信號分解有效地減輕了噪聲的影響,并提高了模型的準(zhǔn)確性;
此外,與直接將噪聲信號輸入模型相比,使用分解后的信號,其在精確度上顯著提高了15%。因此,可以推斷:EEMD處理方法及其結(jié)合LSTM網(wǎng)絡(luò)的方法可能會在時序信號處理領(lǐng)域有更為廣闊的應(yīng)用。
3.4.2 優(yōu)越性驗證
在初始迭代測試階段中,2個網(wǎng)絡(luò)都表現(xiàn)出了快速收斂狀態(tài),GA-LSTM和LSTM網(wǎng)絡(luò)的準(zhǔn)確性對比如圖12所示。
圖12 迭代次數(shù)與不同網(wǎng)絡(luò)模型準(zhǔn)確性之間的關(guān)系
由圖12可知:實驗結(jié)果表明,與沒有優(yōu)化的模型相比,用GA算法優(yōu)化的LSTM網(wǎng)絡(luò)的準(zhǔn)確性從85%提升到94%,預(yù)測的準(zhǔn)確度提高了9%,其原因是兩種網(wǎng)絡(luò)都采用類似的訓(xùn)練方式,即單向的往前訓(xùn)練方式;
兩者相比而言,GA-LSTM網(wǎng)絡(luò)更加平滑,這是因為GA優(yōu)化是通過優(yōu)化LSTM層參數(shù)去除其人為設(shè)定的隨意性,避免了網(wǎng)格尋優(yōu)方式耗費大量時間和計算資源。隨著迭代次數(shù)的增加,2個網(wǎng)絡(luò)的精度逐漸提高。
值得注意的是,到達(dá)后期迭代階段時,GA-LSTM網(wǎng)絡(luò)比未經(jīng)過優(yōu)化的LSTM網(wǎng)絡(luò)獲得了更好的精度。這證明了GA-LSTM網(wǎng)絡(luò)的優(yōu)化策略確實有效地提升了網(wǎng)絡(luò)性能。
筆者將EEMD與基于GA-LSTM的神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種新的行星齒輪故障診斷方法,并利用故障模擬實驗平臺,對4種不同狀態(tài)的行星齒輪數(shù)據(jù)集進行了測試,對該方法的有效性與泛化性進行了驗證。
研究結(jié)論如下:
1)相比于傳統(tǒng)的故障診斷技術(shù),EEMD方法能有效地將非線性和非平穩(wěn)信號分解為多個本征模式函數(shù)分量,IMF分量可以作為進一步處理和分析的特征,從而提高故障診斷的準(zhǔn)確性和可靠性;
2)使用遺傳算法來優(yōu)化LSTM網(wǎng)絡(luò)模型,可以顯著提高網(wǎng)絡(luò)的泛化能力,并且在加快訓(xùn)練過程和降低過擬合的風(fēng)險方面也具有優(yōu)勢。實驗結(jié)果顯示,相比于傳統(tǒng)LSTM算法,GA-LSTM算法的準(zhǔn)確率更高(達(dá)到了94%),而傳統(tǒng)LSTM算法僅能達(dá)到85%的準(zhǔn)確率;
3)GA-LSTM模型的總體故障診斷準(zhǔn)確率達(dá)到了94.17%。在人為加入噪聲信號后,與未經(jīng)EEMD分解的模型相比,該模型在精確度上提升了15%,表明該模型對噪聲信號具有較強的魯棒性,具備良好的抗噪聲能力。
綜上所述,筆者所提出的故障診斷方法具有更高的識別率和更強的魯棒性,該方法可為行星齒輪故障診斷提供良好的應(yīng)用前景。
在未來的研究中,筆者旨在將上述行星齒輪故障診斷方法擴展到更具挑戰(zhàn)性的場景中,如強噪聲干擾和可變工況,以進一步優(yōu)化并提高該模型的抗噪聲能力和泛化能力,使其更加適用于不同的環(huán)境和場景。