卓鵬程,夏唐斌,2,鄭美妹,鄭 宇,奚立峰,2
(1.上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240;2.上海交通大學(xué) 機(jī)械系統(tǒng)與振動(dòng)國家重點(diǎn)實(shí)驗(yàn)室,上海 200240)
隨著我國工業(yè)水平的不斷發(fā)展,工業(yè)領(lǐng)域的設(shè)備在不斷趨向大型化、復(fù)雜化。大型復(fù)雜裝備的平穩(wěn)安全運(yùn)行關(guān)系到生產(chǎn)安全的關(guān)鍵核心[1]。滾動(dòng)軸承作為大型復(fù)雜設(shè)備的重要組成部分,其性能退化或失效將影響整機(jī)性能甚至導(dǎo)致設(shè)備非計(jì)劃停機(jī),造成嚴(yán)重經(jīng)濟(jì)損失甚至重大人員傷亡。據(jù)統(tǒng)計(jì),約45%~55%的旋轉(zhuǎn)機(jī)械故障是由于滾動(dòng)軸承的損傷所造成的[2]。然而當(dāng)滾動(dòng)軸承處于故障初期時(shí),其故障信息往往表現(xiàn)比較模糊,振動(dòng)信號異常不明顯。同時(shí)因?yàn)槿狈S承故障程度的掌控,往往當(dāng)滾動(dòng)軸承處于故障晚期時(shí)才有明顯表征,診斷滯后會(huì)造成嚴(yán)重的失效風(fēng)險(xiǎn)。因此,對于滾動(dòng)軸承故障中早期的診斷則十分必要,可以有效地預(yù)先設(shè)計(jì)維修與更換方案。在當(dāng)前制造業(yè)中,對滾動(dòng)軸承建立退化模型或進(jìn)行剩余壽命預(yù)測需要大量全生命周期狀態(tài)數(shù)據(jù),且預(yù)測模型與實(shí)際退化狀態(tài)之間的誤差較大。因此,實(shí)現(xiàn)滾動(dòng)軸承實(shí)時(shí)精確的故障初期、中期及晚期診斷,可以有效降低事故發(fā)生率,對于提高企業(yè)的制造運(yùn)維和健康管理水平具有重要意義。
滾動(dòng)軸承故障診斷技術(shù)目前主要包括兩個(gè)方面:故障信號提取與故障模式識(shí)別。在故障信號提取方面,目前常用的方法有Hilbert-Huang變換、小波變換(wavelet transform,WT)、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)與集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)等[3-6]。EEMD對于滾動(dòng)軸承振動(dòng)信號有著較好的去噪效果,可以有效地提取出滾動(dòng)軸承早期故障信息。在故障模式識(shí)別方面,常用的方法包括概率統(tǒng)計(jì)方法、支持向量機(jī)(support vector machine,SVM)和人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)等[7-12]。滾動(dòng)軸承故障早期數(shù)據(jù)具有非線性、強(qiáng)干擾與數(shù)據(jù)源復(fù)雜等特性,概率統(tǒng)計(jì)方法與支持向量機(jī)均存在一定的局限性,目前神經(jīng)網(wǎng)絡(luò)由于其自適用能力與容錯(cuò)性,成為最熱門的滾動(dòng)軸承故障診斷方法。Shi等[13]基于Elman神經(jīng)網(wǎng)絡(luò)提出OHF Elman (output hidden feedback Elman) 網(wǎng)絡(luò),并證明了OHF Elman相較Elman神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。但是,單個(gè)OHF Elman神經(jīng)網(wǎng)絡(luò)無法保證對所有測試樣本都有較好的適用性。為了實(shí)現(xiàn)更為精確的滾動(dòng)軸承全樣本故障診斷方法,Singh等[14]通過Bagging (bootstrap aggregating) 算法將樸素貝葉斯(Na?ve Bayes)與決策樹結(jié)合,提高了對多類分類的準(zhǔn)確度。Li等[15]提出了一種AdaBoost-BP檢測器,實(shí)現(xiàn)了對液壓執(zhí)行器內(nèi)部泄露故障的自動(dòng)評估。鑒于滾動(dòng)軸承不同故障時(shí)期特征信號的相似性,本文提出一種基于OHF Elman神經(jīng)網(wǎng)絡(luò)與AdaBoost的新型集成算法,以適用早期故障信號的多樣性與魯棒性。
為了對滾動(dòng)軸承不同時(shí)期的故障進(jìn)行有效的診斷,本文提出整合EEMD與OHF Elman-AdaBoost算法的整體診斷框架,重點(diǎn)將集成算法引入故障診斷領(lǐng)域。鑒于Bagging算法是通過選擇不同的樣本數(shù)據(jù)訓(xùn)練得到不同的弱學(xué)習(xí)器,弱學(xué)習(xí)器的個(gè)數(shù)與樣本數(shù)量有關(guān),而AdaBoost算法則是調(diào)整樣本權(quán)重得到不同的弱學(xué)習(xí)器。相比較而言,AdaBoost算法原理更易理解且更具有適用性,因此,本文選擇以O(shè)HF Elman神經(jīng)網(wǎng)絡(luò)作為弱回歸器,利用AdaBoost集成算法構(gòu)造一個(gè)強(qiáng)回歸器,從而實(shí)現(xiàn)對滾動(dòng)軸承故障診斷誤差的顯著降低。
以滾動(dòng)軸承振動(dòng)信號作為原始數(shù)據(jù)進(jìn)行故障多時(shí)期診斷。在故障診斷中,不僅需要診斷出滾動(dòng)軸承所處故障時(shí)期,同時(shí)也需要準(zhǔn)確剖析出故障源。本研究全面分析了滾動(dòng)體、內(nèi)圈與外圈這三種主要故障部件,因此所涵蓋的滾動(dòng)軸承故障多時(shí)期診斷可轉(zhuǎn)化為多分類問題,如圖1所示。
圖1 滾動(dòng)軸承故障分類圖Fig.1 Classification diagram of rolling bearing faults
由于滾動(dòng)軸承振動(dòng)信號的非平穩(wěn)性、非線性,且摻雜不同程度的噪聲,選用EEMD進(jìn)行模態(tài)分解與信號重構(gòu),從振動(dòng)信號中提取有效的特征向量。在此基礎(chǔ)上,選擇OHF Elman神經(jīng)網(wǎng)絡(luò)作為故障模式識(shí)別的方法,并結(jié)合AdaBoost算法集成得到強(qiáng)回歸器,研究對滾動(dòng)軸承進(jìn)行更為準(zhǔn)確地故障診斷。所構(gòu)建的技術(shù)方法框架如圖2所示。
圖2 滾動(dòng)軸承故障診斷技術(shù)框架圖Fig.2 Technical framework of fault diagnosis for rolling bearing
該框架主要由故障信號提取與故障模式識(shí)別兩部分組成。故障信號提取方面,采用峭度與相關(guān)系數(shù)作為EEMD模態(tài)分解得到基本模態(tài)分量(intrinsic mode function,IMF)篩選的判斷準(zhǔn)則。故障模式識(shí)別方面,通過Elman神經(jīng)網(wǎng)絡(luò)的診斷誤差效果確定OHF Elman的隱含層數(shù),從而保證兩種神經(jīng)網(wǎng)絡(luò)的參數(shù)一致性,進(jìn)而證明OHF Elman神經(jīng)網(wǎng)絡(luò)相較于Elman神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。在與AdaBoost算法集成時(shí),采用樣本誤差閾值作為樣本權(quán)重變化的判斷準(zhǔn)則。利用所構(gòu)建的機(jī)制,最終形成的OHF Elman-AdaBoost強(qiáng)回歸器在全樣本數(shù)據(jù)上可實(shí)現(xiàn)更為準(zhǔn)確的故障診斷水平。
OHF Elman基于Elman神經(jīng)網(wǎng)絡(luò)增加輸出層對隱含層的反饋實(shí)現(xiàn)處理動(dòng)態(tài)數(shù)據(jù)的能力。鑒于單個(gè)OHF Elman神經(jīng)網(wǎng)絡(luò)無法保證對所有測試樣本都有較好的適用性,本研究為了提供更為精確地診斷滾動(dòng)軸承全樣本故障,將AdaBoost集成算法引入故障診斷領(lǐng)域。所建立的OHF Elman-AdaBoost算法的優(yōu)勢在于:
(1) 選擇以O(shè)HF Elman神經(jīng)網(wǎng)絡(luò)作為診斷算法核心,以其獨(dú)特的反饋結(jié)構(gòu),擁有對數(shù)據(jù)的動(dòng)態(tài)處理能力,特別適用于滾動(dòng)軸承的故障診斷。
(2) AdaBoost算法通過集成多個(gè)弱學(xué)習(xí)器得到一個(gè)強(qiáng)學(xué)習(xí)器,從而擁有對樣本數(shù)據(jù)更強(qiáng)的學(xué)習(xí)能力。
(3) 以O(shè)HF Elman神經(jīng)網(wǎng)絡(luò)作為弱回歸器,結(jié)合AdaBoost算法集成出新的強(qiáng)回歸器,從而實(shí)現(xiàn)對滾動(dòng)軸承全樣本數(shù)據(jù)更有效的故障診斷。
人工神經(jīng)網(wǎng)絡(luò)在理論上可以任意精度逼近任意非線性映射,無需建立精確的數(shù)學(xué)模型,一旦輸入輸出數(shù)據(jù)確定,神經(jīng)網(wǎng)絡(luò)即可挖掘輸入輸出之間的連接關(guān)系。與BP神經(jīng)網(wǎng)絡(luò)相比,Elman神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上增加了一層隱含層對輸入層的反饋,具有更高的動(dòng)態(tài)性與準(zhǔn)確性。而OHF Elman神經(jīng)網(wǎng)絡(luò)則是在Elman神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上增加了輸出與隱含層的反饋,進(jìn)一步提高了網(wǎng)絡(luò)對歷史數(shù)據(jù)的記憶功能。OHF Elman結(jié)構(gòu)如圖3所示。
圖3 OHF Elman網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.3 Illustration of OHF Elman network structure
OHF Elman神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型
x(k)=f(wI1xc(k)+wI2u(k-1))
(1)
xc(k)=αxc(k-1)+x(k-1)
(2)
yc(k)=γyc(k-1)+y(k-1)
(3)
y(k)=g(wI3x(k)+wI4yc(k))
(4)
式中:g(·)為線性函數(shù);α,γ均為反饋增益因子,其取值范圍為(0,1);f(t)通常取為sigmoid函數(shù),即
(5)
誤差函數(shù)為
(6)
式中:k為系統(tǒng)迭代步數(shù);u為r維輸入向量;x,xc分別為n維隱含層與承接層輸出;y,yc分別為m維輸出層與承接層2的輸出;wI1,wI2,wI3,wI4分別為n×n,n×r,m×n,m×m維權(quán)值矩陣;yd為實(shí)際輸出。
AdaBoost是一種常用于提高數(shù)據(jù)訓(xùn)練性能的機(jī)器學(xué)習(xí)集成算法。一般AdaBoost算法在使用的時(shí)候會(huì)選擇一種弱學(xué)習(xí)器,目前常用的有分類樹、支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)等。AdaBoost主要是通過在下一次弱學(xué)習(xí)器訓(xùn)練之前適當(dāng)調(diào)整訓(xùn)練數(shù)據(jù)分布中的權(quán)重,來強(qiáng)調(diào)先前學(xué)習(xí)效果錯(cuò)誤或者學(xué)習(xí)誤差較大的樣本。因此,通過集成每一步的弱學(xué)習(xí)器可以更好地對測試數(shù)據(jù)進(jìn)行預(yù)測診斷[16-17]。
AdaBoost算法主要解決分類與回歸問題,分類算法目前主要有AdaBoost基本算法、AdaBoost M1與AdaBoost M2算法,分別適用于兩類分類、多類離散分類與多類連續(xù)分類問題?;貧w算法主要有AdaBoost R2與AdaBoost RT算法。AdaBoost算法構(gòu)建強(qiáng)學(xué)習(xí)器時(shí)比較靈活且結(jié)果不易發(fā)生過擬合。AdaBoost R2模型的流程如下。
弱回歸器個(gè)數(shù):K
弱回歸器:Gj(X),j=1,…,K
輸出:強(qiáng)回歸器G(X)
(1) 訓(xùn)練集樣本權(quán)重初始化:w1(i)=1/N,i=1,…,N
(2)j=1,…,K循環(huán)訓(xùn)練
① 對樣本進(jìn)行訓(xùn)練并得到弱回歸器Gj(X),計(jì)算弱回歸器Gj(X)在樣本數(shù)據(jù)上的最大誤差Ej
Ej=maxi|Oji-Yji|,i=1,…,N
(7)
式中,Oji為弱回歸器Gj(X)對訓(xùn)練集Xi的預(yù)測結(jié)果。
(8)
(9)
(10)
上面分別為線性誤差、平方誤差與指數(shù)誤差情況下的相對誤差計(jì)算公式。
③ 計(jì)算弱回歸器Gj(X)的誤差率ej
(11)
④ 計(jì)算弱回歸器Gj(X)的權(quán)重系數(shù)αj
(12)
⑤ 訓(xùn)練集樣本權(quán)重更新
(13)
(14)
(3) 強(qiáng)回歸器G(X)獲得
(15)
為了進(jìn)一步提高對滾動(dòng)軸承故障多時(shí)期診斷的準(zhǔn)確性,本研究構(gòu)建了一種OHF Elman-AdaBoost算法:選擇以O(shè)HF Elman神經(jīng)網(wǎng)絡(luò)作為弱回歸器,反復(fù)訓(xùn)練OHF Elman神經(jīng)網(wǎng)絡(luò)預(yù)測輸出,通過AdaBoost算法集成得到一個(gè)由多個(gè)OHF Elman神經(jīng)網(wǎng)絡(luò)組成的強(qiáng)回歸器。
OHF Elman-AdaBoost模型流程如下。
弱回歸器個(gè)數(shù):K
弱回歸器:OHF Elman神經(jīng)網(wǎng)絡(luò)Cj(X),j=1,…,K
輸出:強(qiáng)回歸器H(X)
(1) 訓(xùn)練集樣本權(quán)重初始化:w1(i)=1/N,i=1,…,N
(2)j=1,…,K循環(huán)訓(xùn)練
① 初始化ej=0,對樣本Xi與wj(i)(i=1,…,N)進(jìn)行弱回歸器Cj(X)訓(xùn)練,并計(jì)算弱回歸器Cj(X)在各個(gè)樣本數(shù)據(jù)上的絕對誤差εi
(16)
② 計(jì)算弱回歸器Cj(X)的誤差率ej
ej=∑wj(i),εi>τ
(17)
式中,τ為預(yù)先設(shè)定的閾值,高于τ即為預(yù)測不準(zhǔn)確。
③ 計(jì)算弱回歸器Cj(X)的權(quán)重系數(shù)αj
(18)
④ 訓(xùn)練集樣本權(quán)重更新
(19)
(20)
(3) 弱回歸器Cj(X)權(quán)重系數(shù)歸一化
(21)
(4) 強(qiáng)回歸器H(X)獲得
(22)
OHF Elman-AdaBoost模型與AdaBoost R2模型的區(qū)別:①在計(jì)算弱回歸器的誤差率部分,OHF Elman-AdaBoost模型使用樣本的絕對預(yù)測誤差閾值進(jìn)行樣本劃分,因?yàn)楫?dāng)閾值設(shè)置合理時(shí),小于閾值的樣本預(yù)測誤差已經(jīng)可以達(dá)到要求,只考慮預(yù)測誤差較大樣本會(huì)加快模型迭代;②在計(jì)算弱回歸器的權(quán)重系數(shù)部分,OHF Elman-AdaBoost模型借鑒了AdaBoost分類模型,通過對數(shù)函數(shù)減慢弱分類器權(quán)重系數(shù)的變化,從而得到更好的強(qiáng)回歸器;③在訓(xùn)練樣本權(quán)重更新部分,OHF Elman-AdaBoost模型選擇使用不同的常數(shù)系數(shù)來更新,這樣會(huì)加快樣本權(quán)重的變化,也是對第二點(diǎn)的呼應(yīng),中和弱分類器權(quán)重變化速度,從而加快強(qiáng)回歸器的集成。
本研究采用自凱斯西儲(chǔ)大學(xué)軸承中心的滾動(dòng)軸承振動(dòng)數(shù)據(jù),即采用SKF軸承進(jìn)行的0.017 78 cm,0.035 56 cm和0.053 34 cm故障直徑的實(shí)驗(yàn)。分析電機(jī)轉(zhuǎn)速為1 797 r/min,采樣頻率為12 kHz的內(nèi)圈、滾動(dòng)體與外圈故障數(shù)據(jù)(包括正常模式),共有十種故障模式。每種故障狀態(tài)選擇120 000個(gè)樣本點(diǎn),正常狀態(tài)選擇240 000個(gè)樣本點(diǎn)。該實(shí)驗(yàn)是采用電火花加工將單點(diǎn)故障引入試驗(yàn)軸承,0.017 78 cm,0.035 56 cm和0.053 34 cm均為故障點(diǎn)的直徑,現(xiàn)實(shí)設(shè)備的滾動(dòng)軸承一旦發(fā)生單點(diǎn)故障,故障點(diǎn)的直徑會(huì)隨著故障時(shí)間的發(fā)展而增大。因此,本文選擇故障直徑為0.017 78 cm的故障狀態(tài)為故障初期,故障直徑為0.035 56 cm的故障狀態(tài)為故障中期,故障直徑為0.053 34 cm的故障狀態(tài)為故障晚期。下文中b017,b035,b053代表直徑為0.017 78 cm,0.035 56 cm和0.053 34 cm下的滾動(dòng)體故障;IR017,IR035,IR053代表直徑為0.017 78 cm,0.035 56 cm和0.053 34 cm下的內(nèi)圈故障;OR017,OR035,OR053代表直徑為0.017 78 cm,0.035 56 cm和0.053 34 cm下的外圈故障。
軸承故障振動(dòng)信號通常表現(xiàn)為周期性瞬態(tài)脈沖,為了有效地顯示時(shí)頻域內(nèi)的特征,采樣信號應(yīng)至少覆蓋兩個(gè)或三個(gè)周期。考慮采樣頻率和特征頻率,本文選擇2 000個(gè)樣本點(diǎn)代表故障振動(dòng)信號的特征。因此,按時(shí)序每2 000個(gè)樣本點(diǎn)設(shè)定為一組輸入數(shù)據(jù),即每種故障狀態(tài)(涵蓋滾動(dòng)體、內(nèi)圈、外圈的各自初期、中期、晚期故障共九種)各有60組樣本數(shù)據(jù),正常狀態(tài)有120組樣本數(shù)據(jù)。
以2 000個(gè)樣本點(diǎn)正常信號的EEMD分解波形圖為例,其結(jié)果如圖4所示。從上至下,10個(gè)波形圖分別為2 000樣本點(diǎn)分解出的9個(gè)IMF分量和一個(gè)殘余分量R。從圖4中可見,各個(gè)IMF分量之間基本消除了模態(tài)混疊且殘余分量R單調(diào)遞減。
圖4 正常信號EEMD分解波形圖Fig.4 Decomposition waveform of normal signal
3.2.1 信號重構(gòu)
由于噪聲與原時(shí)序信號完全無關(guān)與無量綱參數(shù):峭度K對信號的沖擊成分比較敏感,因此可將IMF分量與原時(shí)序信號的相關(guān)系數(shù)與分量的峭度值作為IMF分量選擇的指標(biāo)。本文選取相關(guān)系數(shù)0.1作為篩選閾值,相關(guān)系數(shù)高于0.1的IMF分量保留下來,相關(guān)系數(shù)低于0.1的IMF分量移除。不同故障模式保留的IMF分量不盡相同,正常模式選擇保留IMF1~I(xiàn)MF5,而OR017故障模式選擇保留IMF1與IMF2。通過計(jì)算保留下來的IMF分量峭度值發(fā)現(xiàn),內(nèi)圈與外圈故障保留的IMF分量峭度值較高,且在故障直徑上存在較大差異。選取峭度值較高的前兩個(gè)IMF分量進(jìn)行信號重構(gòu):正常狀態(tài)選擇IMF3與IMF5;b017與b053故障狀態(tài)選擇IMF1與IMF3;b035故障狀態(tài)選擇IMF1與IMF4;IR017,IR035,IR053,OR017與OR053故障狀態(tài)選擇IMF1和IMF2;OR035故障狀態(tài)選擇IMF3和IMF4。
3.2.2 故障特征提取
選擇合適的故障特征是進(jìn)行準(zhǔn)確故障診斷的前提,通過EEMD的重構(gòu)信號分析可以計(jì)算信號的特征參數(shù),以此來判斷軸承是否發(fā)生故障與發(fā)生故障的類型。在時(shí)域內(nèi)分別選擇三種有量綱參數(shù):均值、標(biāo)準(zhǔn)差、均方根值與三種無量綱參數(shù):偏度、峭度、裕度,見表1。
表1 三種有量綱與三種無量綱參數(shù)Tab.1 Three dimensional and three dimensionless parameters
在模型參數(shù)設(shè)計(jì)之前,首先明確樣本數(shù)據(jù)。樣本數(shù)據(jù)的輸入由故障特征提取的六種時(shí)域參數(shù)組成,每種故障狀態(tài)下選擇60組樣本數(shù)據(jù),正常狀態(tài)下選擇120組樣本數(shù)據(jù)。樣本數(shù)據(jù)的輸出則由[0,…,0,1,0,…,0]T向量表示(1對應(yīng)的位置i表示為第i種故障模式,其余為0),正常、b017,b035,b053,IR017,IR035,IR053,OR017,OR035,OR053分別代表第1~第10種故障模式。同時(shí)將樣本數(shù)據(jù)按照5∶1的比例進(jìn)行隨機(jī)分成訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)。
3.3.1 OHF Elman神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)計(jì)
OHF Elman神經(jīng)網(wǎng)絡(luò)算法的參數(shù)主要有精度指標(biāo)與隱含層神經(jīng)元數(shù)。參數(shù)確定過程與結(jié)果如下:
(1) 精度指標(biāo),選取均方誤差MSE(mean square error)
(23)
式中:Ti為真實(shí)輸出數(shù)據(jù);Oi為網(wǎng)絡(luò)輸出數(shù)據(jù);s為數(shù)據(jù)維度。
(2) 神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)n的確定
根據(jù)式(24)首先確定隱含層神經(jīng)元數(shù)在4~14。通過Elman神經(jīng)網(wǎng)絡(luò)在不同隱含層神經(jīng)元數(shù)下進(jìn)行訓(xùn)練,選擇測試誤差MSE較小的神經(jīng)元數(shù)作為隱含層神經(jīng)元數(shù)。如圖5所示,隱含層數(shù)n確定為10。
圖5 神經(jīng)元個(gè)數(shù)不同的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測誤差圖Fig.5 Elman neural network prediction error graph with different number of neurons
(24)
式中:n為隱含層神經(jīng)元數(shù);r為輸入層神經(jīng)元數(shù);m為輸出層神經(jīng)元數(shù);a為1~10的常數(shù)。
3.3.2 OHF Elman-AdaBoost模型參數(shù)設(shè)計(jì)
根據(jù)OHF Elman-AdaBoost模型流程,OHF Elman-AdaBoost模型參數(shù)主要是閾值τ與弱回歸器數(shù)量K,參數(shù)確定過程與結(jié)果如下:
(1) 閾值τ的確定
閾值τ的確定直接決定了樣本的權(quán)重變化,從而決定了強(qiáng)回歸器對樣本的預(yù)測誤差水平。為了確定閾值τ,首先選擇弱回歸器OHF Elman神經(jīng)網(wǎng)絡(luò)進(jìn)行樣本數(shù)據(jù)訓(xùn)練與測試,結(jié)果為:平均絕對誤差為0.051 1,最大絕對誤差為2,最小絕對誤差為8.427 2×10-19,因此τ確定為0.01。
(2) 弱回歸器數(shù)量K的確定
由于強(qiáng)回歸器的診斷效果與弱回歸器數(shù)量之間的相關(guān)性并不確定,弱回歸器數(shù)量的增加甚至可能造成過擬合??紤]到集成學(xué)習(xí)的迭代時(shí)間和有效性,首先選擇8~15作為弱回歸器的數(shù)量范圍,并分別進(jìn)行OHF Elman-AdaBoost算法的測試訓(xùn)練,試驗(yàn)結(jié)果如圖6所示。
為了選擇弱回歸器數(shù)量,以所有測試樣本的MSE誤差之和作為判別準(zhǔn)則,如圖6中的縱軸所示。圖6說明了弱回歸器數(shù)量對強(qiáng)回歸器的影響是非線性的,并且在弱回歸器數(shù)量為13時(shí)預(yù)測誤差之和較小,因而確定弱回歸器的數(shù)量K=13。
圖6 不同數(shù)量弱回歸器下的強(qiáng)回歸器預(yù)測誤差Fig.6 Prediction error of strong regressor under different numbers of weak regressors
時(shí)小虎等學(xué)者在理論上證明了OHF Elman神經(jīng)網(wǎng)絡(luò)的收斂性與相較于Elman神經(jīng)網(wǎng)絡(luò)的優(yōu)越性,但是這一結(jié)論還是需要進(jìn)行實(shí)例驗(yàn)證。因此,本文在進(jìn)行OHF Elman-AdaBoost模型的測試訓(xùn)練之前,首先進(jìn)行Elman神經(jīng)網(wǎng)絡(luò)與OHF Elman神經(jīng)網(wǎng)絡(luò)的對比訓(xùn)練,其結(jié)果如圖7所示。
圖7 Elman與OHF Elman神經(jīng)網(wǎng)絡(luò)預(yù)測誤差圖Fig.7 Prediction error of Elman and OHF Elman neural network
因?yàn)橐唤M測試樣本會(huì)得到一個(gè)10×1的絕對誤差矩陣,將0.2作為誤差數(shù)據(jù)的上限,10個(gè)誤差結(jié)果均低于0.2為診斷正確,否則為診斷錯(cuò)誤。根據(jù)診斷結(jié)果,Elman神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率為90.91%,OHF Elman神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率為91.82%。表2為OHF Elman神經(jīng)網(wǎng)絡(luò)的部分測試樣本診斷結(jié)果。
表2 OHF Elman神經(jīng)網(wǎng)絡(luò)的部分測試樣本診斷結(jié)果Tab.2 Diagnostic results of some test samples under OHF Elman neural network
圖7是兩種神經(jīng)網(wǎng)絡(luò)在各個(gè)測試樣本上的診斷效果??梢钥闯?,除去一組樣本數(shù)據(jù)的預(yù)測誤差上兩種神經(jīng)網(wǎng)絡(luò)基本相同,在其他樣本數(shù)據(jù)上的預(yù)測誤差,OHF Elman神經(jīng)網(wǎng)絡(luò)皆小于Elman神經(jīng)網(wǎng)絡(luò),證明OHF Elman神經(jīng)網(wǎng)絡(luò)的預(yù)測性能確實(shí)優(yōu)于Elman神經(jīng)網(wǎng)絡(luò)。
在證明了OHF Elman神經(jīng)網(wǎng)絡(luò)更適合滾動(dòng)軸承的故障診斷后,進(jìn)行OHF Elman-AdaBoost的訓(xùn)練與測試,測試結(jié)果如圖8與圖9所示。
圖8展示了每個(gè)弱回歸器與強(qiáng)回歸器對滾動(dòng)軸承樣本數(shù)據(jù)的平均診斷效果。如圖8所示,強(qiáng)回歸器的預(yù)測誤差要遠(yuǎn)小于每一個(gè)弱回歸器的預(yù)測誤差。各個(gè)弱回歸器的平均預(yù)測誤差具體數(shù)據(jù)如表3所示。
表3 各個(gè)弱回歸器的樣本平均預(yù)測誤差MSETab.3 Average of sample prediction error MSE for each weak regressor
圖8 強(qiáng)回歸器與各個(gè)弱回歸器的預(yù)測誤差對比圖Fig.8 Comparison of prediction error between strong regressor and each weak regressor
圖9展示了OHF Elman-AdaBoost算法得到的強(qiáng)回歸器與OHF Elman神經(jīng)網(wǎng)絡(luò)弱回歸器在各個(gè)測試樣本上的預(yù)測誤差效果??梢钥闯?,除去在一組樣本上強(qiáng)回歸器與弱回歸器預(yù)測誤差幾乎相等,強(qiáng)回歸器基本上在所有測試樣本上都取得了更好的預(yù)測效果。
圖9 強(qiáng)、弱回歸器在測試樣本上的預(yù)測誤差MSE對比圖Fig.9 Comparison of prediction errors between strong and weak regressors on test samples
表4計(jì)算了表3中弱回歸器的預(yù)測誤差均值,并與強(qiáng)回歸器預(yù)測誤差進(jìn)行了對比。結(jié)果可見,通過OHF Elman-AdaBoost算法得到的強(qiáng)回歸器在弱回歸器OHF Elman神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上降低了61.7%的預(yù)測誤差。
表4 強(qiáng)、弱回歸器預(yù)測誤差對比表Tab.4 Comparison of prediction error between strong and weak regressors
表5對比了所有弱回歸器對于不同故障時(shí)期的平均預(yù)測誤差與強(qiáng)回歸器對于不同故障時(shí)期的預(yù)測誤差,強(qiáng)回歸器在不同故障時(shí)期的預(yù)測效果均優(yōu)于弱回歸器,其中在故障晚期預(yù)測效果提升最為明顯,同時(shí)也在故障初期與故障中期上降低了約25%與66.5%的預(yù)測誤差。在不同的故障部位上,強(qiáng)回歸器也擁有較好的診斷效果,其中,對于內(nèi)圈故障診斷效果最好,外圈故障次之,滾動(dòng)體故障診斷誤差最大。
表5 強(qiáng)、弱回歸器下不同故障時(shí)期診斷預(yù)測誤差對比圖Tab.5 Comparison of prediction errors between strong regressor and weak regressor in different fault periods
表6則進(jìn)一步細(xì)分對比了所有弱回歸器對于不同故障不同時(shí)期的平均預(yù)測誤差與強(qiáng)回歸器對于不同故障不同時(shí)期的預(yù)測誤差。如表所示,強(qiáng)回歸器對于故障初期與故障中期的診斷誤差主要集中于滾動(dòng)體故障診斷,對于故障晚期診斷均具有非常好的效果。對于內(nèi)圈故障的三種時(shí)期均具有較低的診斷誤差,對于外圈的故障診斷誤差主要來源于故障中期,而對于滾動(dòng)體的故障初期與中期診斷效果較差。與弱回歸器診斷結(jié)果相比,強(qiáng)回歸器同時(shí)提高了在三種故障的不同時(shí)期診斷精度。由此可以驗(yàn)證,所提出的OHF Elman-AdaBoost算法在滾動(dòng)軸承故障多時(shí)期診斷的精確性方面有著很好的性能優(yōu)勢。
表6 強(qiáng)、弱回歸器下三種故障的不同時(shí)期診斷預(yù)測誤差對比圖Tab.6 Comparison of prediction errors for different periods of three faults under strong regressor and weak regressor
針對滾動(dòng)軸承不同故障時(shí)期故障信息的相似性與振動(dòng)信號的非平穩(wěn)性和非線性,本文提出了一種基于EEMD與OHF Elman-AdaBoost算法的研究框架。通過EEMD進(jìn)行信號分解與重構(gòu),提取了有效的故障特征。然后選擇OHF Elman神經(jīng)網(wǎng)絡(luò)作為滾動(dòng)軸承故障診斷的主要方法,通過其獨(dú)特的反饋結(jié)構(gòu),提高了對不同故障時(shí)期信息的動(dòng)態(tài)處理功能。然后結(jié)合AdaBoost算法設(shè)計(jì)了一種新穎的OHF Elman-AdaBoost算法模型。經(jīng)算例分析,OHF Elman-AdaBoost算法可以有效地對滾動(dòng)軸承進(jìn)行故障多時(shí)期診斷,同時(shí)提高了對全樣本數(shù)據(jù)的預(yù)測精度。未來將進(jìn)一步考慮優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與AdaBoost算法參數(shù)設(shè)計(jì),以期在滾動(dòng)軸承故障多時(shí)期診斷上提供更為精確的解決方案。