莊 敏,李 革,范智軍,孔德成
(1.杭州科技職業(yè)技術(shù)學(xué)院 智能制造學(xué)院,浙江 杭州 311402;2.浙江理工大學(xué) 機(jī)械與自動控制學(xué)院,浙江 杭州 310018;3.河南工業(yè)大學(xué) 機(jī)電工程學(xué)院,河南 鄭州 450001;4.鄭州機(jī)械研究所有限公司,河南 鄭州 450052)
行星齒輪箱是旋轉(zhuǎn)機(jī)械中的重要組成部件,具有承載能力大和工作平穩(wěn)的優(yōu)點(diǎn),因而被大量用于風(fēng)力發(fā)電機(jī)組等具有復(fù)雜結(jié)構(gòu)的傳動系統(tǒng)中[1]。
由于工作環(huán)境惡劣,齒輪箱易發(fā)生各種故障,影響整個機(jī)組的可靠性。因此,對行星齒輪箱的故障進(jìn)行可靠的檢測具有十分重要的意義。
行星齒輪箱的故障會導(dǎo)致振動信號中出現(xiàn)周期性的脈沖。因此,通過分析振動信號能夠獲取表征齒輪箱狀態(tài)的信息[2-3]。
由于系統(tǒng)受到機(jī)械摩擦和噪聲的耦合作用,振動信號呈現(xiàn)非線性特性,線性分析方法無法進(jìn)行處理[4]。
隨著非線性科學(xué)在故障診斷領(lǐng)域的應(yīng)用,基于熵的指標(biāo),如樣本熵、排列熵、散布熵[5]和對應(yīng)的多尺度熵(multiscale entropy, MSE)等,被廣泛用于信號的特征提取。
李怡等人[6]提出了一種基于自適應(yīng)噪聲完備集合經(jīng)驗(yàn)?zāi)B(tài)分解-MSE的滾動軸承故障診斷方法。刁寧昆等人[7]開發(fā)了一種基于多尺度排列熵的滾動軸承故障檢測模型。曲全鵬等人[8]開發(fā)了一種結(jié)合變分模態(tài)分解和多尺度散布熵(multiscale dispersion entropy,MDE)的柱塞泵故障診斷方法,取得了良好的結(jié)果。隨后,錢恩麗等人[9]對MDE的粗?;椒ㄟM(jìn)行了改進(jìn),并在考慮了數(shù)據(jù)波動性的基礎(chǔ)上,引入了復(fù)合多尺度波動散布熵(composite multiscale fluctuation dispersion entropy,CMFDE),用于單向閥的狀態(tài)特征提取。GAN Xiong等人[10]將CMFDE用于軸承的故障特征挖掘。ZHOU Fu-ming等人[11]1-13對CMFDE進(jìn)行了進(jìn)一步改進(jìn),并提出了精細(xì)的CMFDE(refined CMFDE,RCMFDE),用于液壓泵的故障診斷。
然而,CMFDE或RCMFDE的粗粒化處理僅基于數(shù)據(jù)的均值,對于齒輪箱振動信號,基于數(shù)據(jù)均值的一階矩處理還不足以表征時間序列的復(fù)雜性[12]。為此,SONG Mei-ping等人[13]基于均方根的粗?;幚?實(shí)現(xiàn)了信號的多尺度分析,提出了廣義精細(xì)復(fù)合多尺度散布熵,并與傳統(tǒng)的精細(xì)復(fù)合多尺度散布熵進(jìn)行了比較,結(jié)果驗(yàn)證了其優(yōu)越性。
振動信號通常包含較多的沖擊分量和諧波周期分量,成分比較復(fù)雜。單一的特征提取指標(biāo)無法提取出足夠的故障特征。
針對這個問題,ROSTAGHI M等人[14]提出了一種基于偏斜度、方差和平均值的精細(xì)復(fù)合廣義多尺度散布熵,采用該方法實(shí)現(xiàn)了對滾動軸承較為全面的診斷。隨后,QIN Ai-song[15]在此基礎(chǔ)上,更加詳細(xì)地考慮了信號的一階特征和二階特征,提出了集成復(fù)合多尺度散布熵,并將其與傳統(tǒng)的精細(xì)復(fù)合多尺度散布熵進(jìn)行了對比,驗(yàn)證了其有效性。
筆者綜合上述方法的優(yōu)勢,全面地考慮信號的一階、二階和三階特征,并結(jié)合波動散布熵,提出混合精細(xì)復(fù)合多尺度波動散布熵(HRCMFDE)。其主要原理是將粗粒化處理由均值擴(kuò)展至均方根值、方差值、根振幅值、最大值和偏斜度,從而提取出更多的故障信息。因此,HRCMFDE能夠從一階矩(均值(mean)、最小值(min)),二階矩(均方根(rms)、方根幅值(ra))和三階矩(偏斜度(sk))來實(shí)現(xiàn)信號的特征提取。相比于原始的RCMFDE,HRCMFDE能夠從信號中挖掘出更全面和更豐富的故障特征,從而可靠地反映信號的故障狀態(tài)。
在挖掘了故障特征后,需要對故障狀態(tài)做出檢測。顯然,由HRCMFDE提取的故障特征具有很高的維數(shù),直接利用其進(jìn)行分類無法獲得可靠的分類效果,且嚴(yán)重影響分類效率。
特征選擇是一種通過對特征的重要性進(jìn)行評估的特征降維方法,典型的特征排序方法如Fisher分?jǐn)?shù)(fishes score,FS)和拉普拉斯分?jǐn)?shù)(Laplace score,LS)。其中,FS專注于含標(biāo)簽數(shù)據(jù)的特征,遺漏了已有特征的局部屬性。作為無監(jiān)督的特征降維方案,LS保留了FS特征的局部保留能力,并采用方差值來表征包含信息的性能。吉哲等人[16]將LS用于柴油機(jī)故障特征的選擇和降維,取得了優(yōu)異的效果。因此,筆者利用LS對初始特征進(jìn)行維數(shù)壓縮,獲得低維的敏感特征[17]1-8。
目前,常見的故障識別分類器模型包括極限學(xué)習(xí)機(jī)(ELM)和支持向量機(jī)(SVM)等。其中,SVM是一種用于非線性小樣本的有監(jiān)督分類器,其性能穩(wěn)定且泛化性好,但存在著參數(shù)選擇的問題。
周付明等人[18]和阮婉瑩等人[19]分別提出了基于遺傳算法和粒子群算法的支持向量機(jī),也取得了不錯的分類效果;但遺傳算法和粒子群算法易陷入局部最優(yōu),搜索能力較弱。
為了提高SVM的參數(shù)優(yōu)化精度,筆者引入基于蝙蝠算法的支持向量機(jī)(bat algorithm-support vector machine,BA-SVM)分類器,隨后將該故障特征輸入至BA-SVM中,進(jìn)行故障分類[20]。
綜上所述,筆者提出一種基于HRCMFDE特征提取、LS特征降維優(yōu)化和BA-SVM故障識別的行星齒輪箱故障診斷方法。
首先,筆者利用HRCMFDE提取行星齒輪箱振動信號的故障特征;然后,采用LS對原始高維特征進(jìn)行降維和優(yōu)化,以獲得低維的高分辨率特征;最后,利用基于蝙蝠算法優(yōu)化的支持向量機(jī),對行星齒輪系不同故障特征向量進(jìn)行訓(xùn)練和分類,利用真實(shí)故障數(shù)據(jù)集對故障診斷方法進(jìn)行驗(yàn)證。
筆者給定長度為N的序列x=x1,x2,…,xN,波動散布熵(fluctuation dispersion entropy,FDE)方法描述如下:
(1)使用正態(tài)累積分布函數(shù)將xj(j=1,2,…,N)映射到具有從1到2c-1的整數(shù)索引的2c-1類。
分類后的信號為zj;
(4)對于每個散布模式,相對概率為:
(1)
(5)根據(jù)定義,FDE計算如下:
(2)
FDE僅對信號開展單一尺度的分析,這會遺漏其他尺度上的模式信息。為此,文獻(xiàn)[21]開發(fā)了多尺度波動散布熵(multiscale fluctuation dispersion entropy,MFDE),通過將原始序列分割為多個粗粒度子序列來實(shí)現(xiàn)信號的多尺度分析。精細(xì)復(fù)合多尺度波動散布熵是在MFDE方法的基礎(chǔ)上進(jìn)一步改進(jìn),通過將初始數(shù)據(jù)基于起始點(diǎn)分別為[1,τ]連續(xù)地劃分成長度為τ的片段,并計算其平均值獲得τ個粗粒度子序列來完成RCMFDE的計算。
傳統(tǒng)RCMFDE是基于數(shù)據(jù)的均值來進(jìn)行粗粒度序列的采樣,僅考慮了數(shù)據(jù)的一階特征。而振動信號由于工況和環(huán)境復(fù)雜且耦合,信號具有多個階次的特征,原始的基于均值的粗?;幚頍o法提取信號中的多階特征。因此,筆者提出HRCMFDE方法,從均值、最小值,均方根、方根幅值和偏斜度來實(shí)現(xiàn)信號的特征提取。相比于RCMFDE,HRCMFDE考慮信號中的多階特征,采用HRCMFDE特征提取得更加全面。
HRCMFDE的原理如下:
(1)對于信號x={x1,x2,…,xN},基于公式來生成粗粒度序列,其中,1≤k≤τ,1≤j≤[N/τ];
基于均值的粗粒度時間序列為:
(3)
基于均方根值的粗粒度時間序列為:
(4)
基于方根幅值的粗粒度時間序列為:
(5)
基于最小值的粗粒度時間序列為:
(6)
基于偏斜度值的粗粒度時間序列為:
(7)
式中:τ—尺度因子。
(2)對于每個尺度,RCMFDE定義為:
(8)
(3)筆者分別對每種粗粒度時間序列執(zhí)行固定操作,可以得到τ個熵值,總共可以得到5*τ個熵值。HRCMFDE可以表示如下:
HRCMFDE=RCMFDEmean&rms&ra&min&ske
(9)
HRCMFDE混合多個形式的RCMFDE,特征提取的更加完備,避免信息的遺漏,因此更適合用于振動信號的特征提取。
HRCMFDE的計算流程圖,如圖1所示。
圖1 HRCMFDE的流程圖
在HRCMFDE方法中,有4個參數(shù)需要預(yù)先設(shè)置,分別是數(shù)據(jù)長度N,嵌入維數(shù)m,類別數(shù)c和時間延遲d。由于HRCMFDE方法中僅是粗粒度處理存在不同,其他方法均相似,因此,不同形式的RCMFDE保持相同的參數(shù)設(shè)置。
根據(jù)文獻(xiàn)[11]6的建議,RCMFDE在嵌入維數(shù)m=2,c=6;d=1和N=4 096時能夠取得較優(yōu)異的特征提取性能。此外,由于集成了多種類型的RCMFDE,特征維數(shù)比較大,尺度因子的選擇影響特征的數(shù)量。
為充分提取故障信息,并減小特征數(shù)量,筆者設(shè)置尺度因子為τ=15。
HRCMFDE由多個RCMFDE組成,這導(dǎo)致HRCMFDE提取的特征具有較高的維數(shù)。雖然多個特征能夠提供更加全面和完整的信息,但是會引入較多冗余信息,降低分析效率和精度。
為此,筆者引入基于LS的特征選擇方法,根據(jù)各尺度特征的重要性對特征進(jìn)行重新排序,以獲得低維敏感的特征。LS的原理詳見文獻(xiàn)[16]3,筆者不再贅述。
支持向量機(jī)是一種泛化性好,且適用于小樣本的分類器。然而,SVM的核函數(shù)σ和懲罰系數(shù)C會嚴(yán)重影響其性能,人為設(shè)置參數(shù)難以獲得SVM的最佳性能。因此,筆者采用具有優(yōu)異全局搜索性能的蝙蝠算法來對SVM的參數(shù)進(jìn)行優(yōu)化,以實(shí)現(xiàn)參數(shù)的自適應(yīng)選擇。
蝙蝠算法是基于蝙蝠利用聲納系統(tǒng)進(jìn)行追殺目標(biāo)和躲避障礙物行為的啟發(fā)式方法。
利用BA方法對SVM參數(shù)進(jìn)行優(yōu)化的詳細(xì)程序,如圖2所示。
圖2 BA-SVM的流程圖
基于上述理論分析,筆者將HRCMFDE、LS和BA-SVM相結(jié)合,用于齒輪箱的故障診斷,其詳細(xì)診斷步驟如下:
(1)采集行星齒輪箱G個工況下的振動信號,以長度為2 048的滑動窗口進(jìn)行采樣,每種工況獲得M個互不重疊樣本。隨機(jī)選擇P組樣本用于訓(xùn)練,余下M-P組樣本用于測試;
(2)計算每個樣本的HRCMFDE,每個樣本得到5τ個熵值,生成初始特征矩陣Op×5×τ;
(3)為了降低特征的維數(shù)并減小冗余特征,利用LS方法對訓(xùn)練樣本和測試樣本的特征進(jìn)行選擇,得到低維敏感故障特征;
(4)將訓(xùn)練樣本的敏感特征輸入至BA-SVM進(jìn)行訓(xùn)練,隨后將完備的BA-SVM分類器對測試樣本進(jìn)行故障識別,輸出故障工況。
為了驗(yàn)證上述故障診斷方案的有效性,筆者利用PHM 2009年數(shù)據(jù)挑戰(zhàn)賽的行星齒輪箱數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。
實(shí)驗(yàn)平臺由感應(yīng)電動機(jī)、電磁制動器、齒輪箱和變頻控制器組成,如圖3所示。
圖3 IEEE PHM 2009故障實(shí)驗(yàn)平臺
該數(shù)據(jù)是在實(shí)驗(yàn)室環(huán)境下,采集得到的齒輪箱輸入端的振動信號。該數(shù)據(jù)的詳細(xì)信息參照文獻(xiàn)[22],不同的故障包含行星齒輪箱中的軸承,齒輪和軸故障的復(fù)合故障。
筆者以斜齒輪嚙合故障進(jìn)行研究,并基于齒面裂紋(TSC)、齒根斷裂(TRF)、軸承外圈故障(BOF)、軸承內(nèi)圈故障(BIF)、軸承滾動體故障(BBF)、齒輪不平衡(GI)和輸入軸不平衡(ISI)等故障。
不同故障類型齒輪如圖4所示。
圖4 齒輪不同故障類型
筆者仿真8個斜齒輪嚙合復(fù)合故障工況的結(jié)果,分別表示為G1、G2、G3、G4、G5、G6、G7、G8,不同故障的具體形式如表1所示。
表1 斜齒輪復(fù)合故障的類型
實(shí)驗(yàn)中,振動信號的采樣頻率為66.67 kHz,輸入軸的額定轉(zhuǎn)速為3 000 r/min,采樣時間為4 s。每個工況的振動信號長度為266 600點(diǎn),實(shí)驗(yàn)中將每個工況振動信號分割為50個長度為4 096的樣本。其中30組樣本作為訓(xùn)練集,20組樣本作為測試集。
實(shí)驗(yàn)數(shù)據(jù)的詳細(xì)信息如表2所示。
表2 實(shí)驗(yàn)數(shù)據(jù)的詳細(xì)信息
在不同工況下,齒輪振動信號的時域波形如圖5所示。
圖5 齒輪箱不同工況振動信號的時域波形
3.2.1 HRCMFDE特征提取
筆者利用HRCMFDE方法提取振動信號中的特征組成初始的特征矩陣。每個工況都由75個熵值特征進(jìn)行描述,即特征矩陣由5個不同類型的RCMFDE組成。
不同故障狀態(tài)振動信號的基于均值、均方根值、方根幅值、最小值和偏斜度粗粒度處理的RCMFDE,如圖6所示。
圖6 5種RCMFDE熵值
從圖6可以發(fā)現(xiàn):不同形式的RCMFDE對不同工況具有不同的區(qū)分度,如RCMFDE_ske無法有效地區(qū)分各個工況,即特征的區(qū)分度較低;而RCMFDE_rms能夠較好地區(qū)分各個工況。
類似地,其他類型的RCMFDE具有比較明顯的區(qū)分度,即不同類型的RCMFDE能夠區(qū)分不同類型的齒輪箱故障。
通過混合多個形式的RCMFDE,能夠增強(qiáng)特征的提取性能,提供更多有效的信息,避免單一特征提取模型的缺陷??傮w來說,基于HRCMFDE的方法能夠提取出豐富的故障特征。
3.2.2 LS特征降維優(yōu)化
隨后,筆者利用LS對初始高維特征進(jìn)行選擇,以獲得高價值故障特征。該處,筆者將新特征的數(shù)量為設(shè)置為20。
初始的75維特征的LS排序結(jié)果如圖7所示。
圖7 經(jīng)過LS排序后的新特征分布
筆者發(fā)現(xiàn):新特征在不同尺度上分布的更加合理,區(qū)分度更加明顯??梢?通過對原始特征進(jìn)行合理的特征選擇能夠增強(qiáng)特征的質(zhì)量。
3.2.3 BA-SVM故障識別
筆者選擇前7個新特征,輸入至BA-SVM分類器進(jìn)行故障識別[23,24]。
測試樣本的分類結(jié)果如圖8所示。
圖8 筆者所提方法識別結(jié)果的混淆矩陣
從識別結(jié)果可以發(fā)現(xiàn):1個G4樣本被誤分類為G5樣本,2個G6樣本被錯誤分類為G7,總的故障識別準(zhǔn)確率為98.13%,G4樣本的識別準(zhǔn)確率為95%,G6樣本為90%。
雖然G4和G6樣本出現(xiàn)了樣本識別錯誤的情況,但總體上證明該方法是有效的。
3.3.1 HRCMFDE
為了證明HRCMFDE方法的優(yōu)越性,筆者將其與典型的基于均值和均方根的RCMFDE、精細(xì)復(fù)合多尺度排列熵(RCMPE)(嵌入維數(shù)m=5,時間延遲d=1)、精細(xì)復(fù)合多尺度散布熵(RCMDE)和精細(xì)復(fù)合多尺度熵(RCMSE)(嵌入維數(shù)m=2,相似容限r(nóng)=0.2,時間延遲d=1)進(jìn)行對比。
筆者將由上述6種特征提取方法提取的故障特征經(jīng)過LS處理,然后輸入至BA-SVM進(jìn)行訓(xùn)練和識別。此外,為了避免隨機(jī)性和微小的擾動因素對對比結(jié)果的干擾,每種方法都重復(fù)實(shí)驗(yàn)15次。
實(shí)驗(yàn)結(jié)果如圖9所示。
圖9 6種特征提取方法的15次分類結(jié)果
筆者發(fā)現(xiàn):基于HRCMFDE的方法具有最高的平均分類準(zhǔn)確率,且曲線的波動也較小。這表明該方法獲得的識別結(jié)果非常穩(wěn)定;其他方法的準(zhǔn)確率均明顯低于筆者所提方法,并且具有較明顯的波動,這說明獲得的準(zhǔn)確率不穩(wěn)定,容易出現(xiàn)大量失真的分類結(jié)果。
筆者對所提方法與現(xiàn)有方法進(jìn)行多次實(shí)驗(yàn),結(jié)果表明:單一的特征提取指標(biāo)無法全面地反映振動信號的故障屬性,刻畫不夠細(xì)致;筆者所提出的HRCMFDE方法通過混合多個基礎(chǔ)特征提取模型,具有更加全面和可靠的特征提取能力,優(yōu)于其他方法。
3.3.2 LS
隨后,筆者對特征進(jìn)行LS排序的重要性作研究,將經(jīng)過LS排序后的特征與原始特征的不同數(shù)量的特征,輸入至BA-SVM進(jìn)行故障分類。
由于特征數(shù)量較多,因此,筆者僅對特征數(shù)量在40個以內(nèi)的準(zhǔn)確率進(jìn)行計算,其結(jié)果如圖10所示。
圖10 不同特征數(shù)量與識別準(zhǔn)確率之間的關(guān)系
從圖10可以發(fā)現(xiàn):對特征進(jìn)行LS排序后的表現(xiàn)優(yōu)于未經(jīng)LS排序的。當(dāng)經(jīng)過LS排序后,特征數(shù)量為20時,準(zhǔn)確率達(dá)到了97.5%;當(dāng)特征數(shù)量較多或者較少都無法取得較佳的分類準(zhǔn)確率(這是因?yàn)樘卣鲾?shù)量較少無法提供足夠的信息,導(dǎo)致分類器未獲得足夠的有效信息來區(qū)分不同工況;特征數(shù)量較多會產(chǎn)生冗余特征,影響識別的精度)。
因此,通過對特征數(shù)量與識別精度關(guān)系的研究,可以看出:對特征進(jìn)行LS排序,能夠提升故障識別的精度,并且減少所需特征的數(shù)量。
3.3.3 BA-SVM
為了驗(yàn)證BA-SVM的優(yōu)勢,筆者利用粒子群優(yōu)化(particle swarm optimization, PSO)優(yōu)化的SVM(PSO-SVM),遺傳算法(genetic algorithm, GA)優(yōu)化的SVM(GA-SVM)和未優(yōu)化的SVM進(jìn)行對比。
筆者將由HRCMFDE和LS提取的故障特征輸入至4種分類器進(jìn)行故障分類,其結(jié)果如表3所示。
表3 4種分類器的性能對比
從表3可以發(fā)現(xiàn):筆者所使用的BA-SVM具有最高的分類準(zhǔn)確率,另外3種分類器的識別準(zhǔn)確率均低于BA-SVM,表明BA-SVM具有優(yōu)越性。雖然,BA-SVM的分類效率較低,但是能夠通過識別準(zhǔn)確率進(jìn)行彌補(bǔ)。
針對行星齒輪箱的特征提取以及故障識別問題,筆者提出了一種基于HRCMFDE特征提取、LS特征降維優(yōu)化和BA-SVM故障識別的行星齒輪箱故障診斷方法;通過齒輪箱故障實(shí)驗(yàn)數(shù)據(jù),對基于HRCMFDE、LS、BA-SVM的方法的有效性進(jìn)行了驗(yàn)證。
研究結(jié)論如下:
(1)HRCMFDE通過混合多階次的粗?;幚?避免了原始的基于單一粗?;问降腞CMFDE容易遺漏數(shù)據(jù)中關(guān)鍵信息的缺點(diǎn),可以可靠地從齒輪箱中提取出豐富和高分辨率的故障特征;
(2)利用LS對特征進(jìn)行了處理能夠降低特征的維數(shù),保留主要特征,并且故障識別準(zhǔn)確率和效率也優(yōu)于原始特征;
(3)采用BA方法對SVM的核心參數(shù)進(jìn)行了尋優(yōu),能夠顯著地提高故障識別準(zhǔn)確率,優(yōu)于未優(yōu)化的SVM,GA-SVM和PSO-SVM分類器模型。
由于混合多個特征提取方法,基于HRCMFDE、LS、BA-SVM方法的效率比較低下,需要耗費(fèi)較多時間。
在后續(xù)的研究中,筆者將就特征提取效率提高、模型通用性拓展等方面,開展進(jìn)一步的相關(guān)研究工作。