何葵東,陳 伽,金 艷,蔣文君,肖志懷
(1.湖南五凌電力科技有限公司,長沙410004;2.五凌電力有限公司株溪口水電廠,湖南益陽413599;3.武漢大學(xué)動力與機械學(xué)院,武漢430072)
水電機組運行環(huán)境不斷復(fù)雜化,其運行的安全性與穩(wěn)定性越發(fā)受到眾人關(guān)注[1]。水電機組的運行穩(wěn)定性通過機組振動信號特征體現(xiàn),大部分故障由機組振動引起[2]。研究機組振動特性,準(zhǔn)確提取機組振動信號中的特征,有效進(jìn)行機組狀態(tài)評價和故障預(yù)警,進(jìn)而實現(xiàn)故障診斷并及時對機組進(jìn)行檢修與維護(hù),能一定程度上延長機組壽命,為企業(yè)帶來巨大的經(jīng)濟效益[3]。
水電機組本質(zhì)上是多因素耦合的復(fù)雜系統(tǒng),運行過程中同時受水力、機械和電磁因素影響,引發(fā)機組振動故障[2]。特征提取的目的在于將原始信號中表征機組實際狀態(tài)的特征準(zhǔn)確提取,這對于機組狀態(tài)評價和故障預(yù)警具有重要意義[4]。針對水電機組振動信號的非線性、非平穩(wěn)性和強噪聲性,常采用小波變換、變分模態(tài)分解(VMD)、經(jīng)驗?zāi)B(tài)分解(EMD)等時頻分析方法進(jìn)行分析[5]。小波變換和VMD 都為非自適應(yīng)分解算法,依靠經(jīng)驗性結(jié)論選取參數(shù)以得到準(zhǔn)確分析結(jié)果[6]。經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)根據(jù)信號自身特點進(jìn)行分解,有效避免小波基函數(shù)及分解層數(shù)的選取,但端點效應(yīng)及模態(tài)混疊問題較為明顯[7]。在EMD 的基礎(chǔ)上提出的集合經(jīng)驗?zāi)B(tài)分解(Ensemble empirical mode decomposition,EEMD),有效抑制了端點效應(yīng)和模態(tài)混疊問題[8],廣泛應(yīng)用于非平穩(wěn)信號分析中[9-11]。
基于熵理論的特征提取方法近年來在非線性非平穩(wěn)信號特征提取中多有應(yīng)用[4],熵表現(xiàn)了信號序列的復(fù)雜程度,將信號的隨機性和復(fù)雜動力學(xué)突變行為轉(zhuǎn)化為統(tǒng)計學(xué)指標(biāo),更直觀地表征信號特征[12]。將先進(jìn)時頻分析方法與熵理論結(jié)合的信號特征提取,對于現(xiàn)階段機械復(fù)雜運行環(huán)境中所采集的非平穩(wěn)、非線性信號,具有良好的應(yīng)用效果。唐貴基等[13]結(jié)合奇異譜分解(SSD)和多尺度排列熵(MPE),采用峭度最大原則篩選經(jīng)SSD分解的滾動軸承振動信號主分量,并計算主分量MPE,采用K 近鄰(KNN)進(jìn)行模式識別,有效提取了滾動軸承特征。茍先太等[14]對高速列車橫向減振器振動信號進(jìn)行變分模態(tài)分解(VMD),計算互信息指標(biāo)篩選的模態(tài)多尺度熵(MSE)特征值,采用支持向量機有效進(jìn)行了故障判別。程曉宜[15]等構(gòu)造水電機組振動信號時域、頻域特征和EEMD 樣本熵多維特征,經(jīng)遺傳算法對高維特征進(jìn)行降維處理后,分別輸入支持向量機、反向傳播神經(jīng)網(wǎng)絡(luò)和樸素貝葉斯分類器進(jìn)行融合診斷,有效提高了診斷準(zhǔn)確率。張煒博[16]采用快速集合經(jīng)驗?zāi)B(tài)分解(FEEMD)分解水電機組振動信號,計算各IMF 分量的精細(xì)復(fù)合多尺度散布熵作為特征向量,采用最大相關(guān)最小冗余(mRMR)方法進(jìn)行特征簡約后輸入隨機森林分類器實現(xiàn)水電機組振動故障識別。
本文提出基于EEMD 和MSE 的水電機組振動信號特征提取方法,采用ELM 實現(xiàn)模式識別。對降噪后水電機組振動信號進(jìn)行EEMD 分解,并根據(jù)峭度—標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)篩選有效本征模態(tài)分量(IMF),計算有效IMF 的MSE 特征值并構(gòu)建特征向量集,將故障特征集輸入ELM 后,有效評價機組運行狀態(tài),實現(xiàn)機組故障預(yù)警,為后續(xù)具體故障判別做好了充分準(zhǔn)備。本文對機組實測振動信號進(jìn)行了特征提取,并采用EEMD 樣本熵方法作為對比試驗,結(jié)果表明,本文所提方法對于水電機組振動信號特征提取具有普適性且應(yīng)用效果更優(yōu)。
EEMD 算法由Wu 等[8]提出,該算法在EMD 基礎(chǔ)上應(yīng)用了噪聲輔助分析,白噪聲的加入增強了模態(tài)的抗混疊性[17]。白噪聲具有頻率分布均勻的統(tǒng)計學(xué)特性,該特性彌補EMD方法所存在的模態(tài)不連續(xù)缺陷,改進(jìn)極值點特性,進(jìn)一步抑制了模態(tài)混疊現(xiàn)象;同時,EEMD 在分解過程中對各模態(tài)多次取平均,使得噪聲相互抵消,抑制了噪聲的影響[8]。
EEMD算法的計算過程如下[7,8]:
(1)將一定噪聲等級的高斯白噪聲ni(t)加入原始信號x(t)中,得到待處理信號xi(t):
(2)對xi(t)進(jìn)行EMD 分解,得到各階IMF 分量cij(t)和對應(yīng)殘余分量ri(t):
式中:cij(t)為第i次加入白噪聲后分解得到的第j個IMF分量;m為IMF分量的個數(shù)。
(3)重復(fù)M次步驟(1)~(2),對各階分量取平均,得到最終IMF分量cj(t)為:
式中:M為添加白噪聲的次數(shù)即總體平均數(shù),通常取值范圍為100~300。
(4)信號x(t)經(jīng)EEMD分解最終結(jié)果為:
式中:r(t)為信號x(t)經(jīng)EEMD分解后得到的殘余分量。
實驗研究表明,在處理非平穩(wěn)非線性信號時,噪聲等級k=0.2,總體平均數(shù)M為100時,具有較好地處理效果[6]。本文選取噪聲等級k= 0.2,總體平均數(shù)M= 100。
多尺度熵(Multi-scale entropy,MSE)算法最先由Costa[18]等提出,該算法基于樣本熵,從不同尺度描述時間序列的不規(guī)則程度。通過對原始數(shù)粗粒化處理,計算得到數(shù)據(jù)序列在多個尺度下的樣本熵[18]。對于相同尺度下的不同數(shù)據(jù)序列,樣本熵值高的序列具有更高的復(fù)雜性,由此體現(xiàn)數(shù)據(jù)序列之間的差異性[19]。對于給定原始數(shù)據(jù)序列X={x1,x2,…,xL},L為序列長度,其多尺度熵的由以下步驟計算得到[20]:
(1)采用粗?;惴ㄌ幚碓夹蛄?,得到新的時間序列:
式中:j= 1,2,…,N,τ為尺度因子,每一個粗?;蟮臅r間序列的長度N=L/τ,τ= 1時即為原始序列。
(2)將粗?;蛄薪M成一組m維矢量:
式中:i= 1,2,…,N-m+ 1。
(3)定義Y(τ)(i)與Y(τ)(j)的距離為d[Y(τ)(i),Y(τ)(j)],計算公式如下:
式中:i,j= 1,2,…N-m+ 1,j≠i。
(4)給定閾值r(r稱作容差,r>0),對于每個i≤N-m+ 1的值,統(tǒng)計d[Y(τ)(i),Y(τ)(j)]<r的數(shù)目H與距離總數(shù)N-m+1的比值,記作Cτi,m(r),其平均值記作Cτ,m(r):
(5)增加維數(shù)至m+ 1,重復(fù)步驟(2)~(4),從而得到尺度為τ,嵌入維數(shù)為m+ 1時的Cτi,m+1(r),求其平均值得到Cτ,m+1(r);
(6)當(dāng)N為有限數(shù),尺度為τ時,定義樣本熵為:
多尺度熵由不同尺度的樣本熵組成集合,表示為:
多尺度熵的計算需確定嵌入維數(shù)m、相似容限r(nóng)和尺度因子τ三個參數(shù),一般情況下,m= 2,r= 0.1~0.25δ(δ為原始數(shù)據(jù)序列的標(biāo)準(zhǔn)差),τ≤20[18]。本文選取m= 2,r= 0.2δ,τ= 15。
極限學(xué)習(xí)機(Extreme Learning Machine,ELM)網(wǎng)絡(luò)由Huang G B 等[21]提出,ELM 的本質(zhì)是單隱含層前饋神經(jīng)網(wǎng)絡(luò)(Single Hidden Layer Feedforward Neural Networks,SLFN),該算法的輸入層與隱含層的權(quán)重及隱含層偏差是隨機分配的,訓(xùn)練過程中無需再進(jìn)行調(diào)整,通過隱藏的簡單廣義逆運算來分析確定SLFN 的輸出權(quán)重,對于梯度下降學(xué)習(xí)算法中訓(xùn)練速度慢,易陷入局部極小值,學(xué)習(xí)率敏感等問題,能一一避免[16]。只設(shè)置隱含層神經(jīng)元個數(shù)這一學(xué)習(xí)參數(shù),就能得到唯一最優(yōu)解。相較于傳統(tǒng)的學(xué)習(xí)方法,ELM 的學(xué)習(xí)速度更快,易于實現(xiàn),且泛化能力更強[22]。
任意給定N個不同的學(xué)習(xí)樣本集(xi,yi),1 ≤i≤N,其中xi∈Rm,yi∈Rn,設(shè)隱含層有L個神經(jīng)元,激活函數(shù)為g(x),則網(wǎng)絡(luò)訓(xùn)練模型如圖1所示[23]。
圖1中,輸入層的m個神經(jīng)元和輸出層的n個神經(jīng)元分別對應(yīng)m和n個變量。網(wǎng)絡(luò)輸出由下式表示:
式中:權(quán)值向量βj=[βj1,βj2,…,βjn]T,連接第j個隱含層節(jié)點和輸出層節(jié)點;權(quán)值向量ωj=[ω1j,ω2j,…,ωmj]T,表示輸入層節(jié)點與第j個隱含層節(jié)點的輸入;bj是第j個隱含層節(jié)點的閾值;oj=[oj1,oj2,…,ojn]T,表示網(wǎng)絡(luò)輸出值。
本文提出基于EEMD 多尺度熵和ELM 的水電機組振動信號特征提取方法,采用EEMD 分解降噪后信號,根據(jù)峭度—標(biāo)準(zhǔn)相關(guān)指標(biāo)篩選有效模態(tài),計算有效IMF 分量尺度因子為1~15的特征量,分析得到最佳尺度因子的組合特征向量,將特征向量輸入ELM進(jìn)行模式識別。具體特征提取流程如圖2所示。
具體步驟:
(1)采集得到水電機組原始振動信號,對信號進(jìn)行非局部均值降噪處理;
(2)對降噪后信號進(jìn)行EEMD分解,計算IMF分量峭度及與原信號的標(biāo)準(zhǔn)相關(guān)系數(shù),篩選蘊含故障信息豐富且與原信號相關(guān)性較強的IMF分量;
(3)計算有效IMF 分量的多尺度熵,并構(gòu)建最佳尺度下信號高維特征向量;
(4)將特征向量集輸入ELM進(jìn)行模式識別。
XK 電站1 號機組2018年8月,機組頂蓋振動出現(xiàn)異常,機組發(fā)生不明原因故障。采集得到該機組2018年3月1日至3月24日內(nèi)的頂蓋X向振動波形數(shù)據(jù)作為正常狀態(tài)信號,將2018年7月26日至8月20日間采集到的頂蓋X向振動波形數(shù)據(jù)視為故障信號。采樣頻率為640 Hz,每組數(shù)據(jù)采樣長度為2 048,采集得到兩種狀態(tài)下各50組數(shù)據(jù)。
對采集到的信號進(jìn)行信號預(yù)處理,所采用方法為非局部均值去噪[24],經(jīng)實驗,搜索窗口半徑設(shè)為5,領(lǐng)域窗口半徑設(shè)置為2,高斯平滑參數(shù)設(shè)為1時,在達(dá)到較好的降噪效果的同時基本保留了原信號的信息。對機組正常和故障狀態(tài)下的頂蓋X向振動波形進(jìn)行非局部均值降噪處理,信號降噪前后對比如圖3所示。
對降噪后信號進(jìn)行EEMD 分解,噪聲等級取k= 0.2,總體平均數(shù)取M= 100,正常和故障狀態(tài)信號經(jīng)EEMD 分解后的結(jié)果如圖4所示。根據(jù)峭度—標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)篩選有效IMF分量,峭度作為一種無量綱參數(shù),能表征信號的受沖擊程度,其值越大,信號所蘊含的故障信息越豐富[25];計算各IMF 分量與原信號的標(biāo)準(zhǔn)相關(guān)系數(shù),標(biāo)準(zhǔn)相關(guān)系數(shù)越大則說明與原信號相關(guān)性越強[26]。對于正常和故障狀態(tài)下信號所得IMF 分量,計算IMF分量的峭度—標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo),據(jù)此篩選有效IMF分量,不同狀態(tài)信號所得IMF分量的兩個評價指標(biāo)如圖5所示。由圖5可知,在標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)較小的情況下,兩種狀態(tài)下信號IMF7~I(xiàn)MF10 的峭度指標(biāo)較小,因此選取IMF1~I(xiàn)MF6 作為有效IMF 分量,并計算其多尺度熵特征值。嵌入維數(shù)選取m= 2,相似容限取r= 0.2δ,尺度因子取τ= 15。部分信號IMF1~I(xiàn)MF6在不同狀態(tài)下的多尺度熵值如圖6所示。由圖6可知,隨著尺度因子增大,不同狀態(tài)下IMF 分量的多尺度熵越發(fā)難以用于區(qū)分各個狀態(tài),選取IMF1~I(xiàn)MF6 尺度因子為2~5 的多尺度熵組建高維特征向量,輸入ELM 進(jìn)行模式識別。所構(gòu)建的特征向量可由下式表示:
采用ELM 對尺度因子為2~5 的EEMD 多尺度熵特征集進(jìn)行分類,ELM 的隱層神經(jīng)網(wǎng)絡(luò)個數(shù)設(shè)置為20,每種狀態(tài)隨機選取30 組作為訓(xùn)練集,剩下的樣本作為測試集,不同狀態(tài)EEMD多尺度熵特征向量集經(jīng)ELM 訓(xùn)練后,進(jìn)行一次實驗的識別結(jié)果如圖7所示。圖7中,1 表示正常狀態(tài)分類,2 表示故障狀態(tài)分類。由圖7可知,尺度因子為2~5 的EEMD 多尺度熵特征向量集,經(jīng)ELM 后,能完全識別。采用EEMD 樣本熵特征提取作為對比試驗,將信號EEMD 樣本熵作為特征向量,輸入ELM 進(jìn)行模式識別,所設(shè)定的參數(shù)同于EEMD 多尺度熵特征提取方法。每種狀態(tài)下隨機選取30 組作為訓(xùn)練集,余下各20 組作為訓(xùn)練集,EEMD 樣本熵特征提取方法經(jīng)ELM 后的識別結(jié)果如圖8所示。由圖8可知,EEMD 樣本熵特征向量經(jīng)一次ELM 識別后識別率低于EEMD 多尺度熵的識別率。實驗次數(shù)過少容易導(dǎo)致識別結(jié)果存在較大差異,故兩種方法各重復(fù)ELM 識別過程50次,每次實驗隨機選取60組樣本為訓(xùn)練集,剩下樣本為測試集,經(jīng)重復(fù)ELM 模式識別后,兩種方法的識別精度統(tǒng)計結(jié)果如表1所示。由表1可知,本文所提方法的識別精度更高,對于水電機組振動信號特征提取效果更優(yōu)。
表1 經(jīng)ELM重復(fù)識別50次不同方法識別精度統(tǒng)計 %Tab.1 The identification accuracy of different methods after repeating identification of ELM for 50 times
SK 電站3 號機組在2015年8月下旬,機組軸向振動劇烈,后經(jīng)相關(guān)人員分析,發(fā)現(xiàn)機組轉(zhuǎn)輪室里襯脫落,由水力不平衡因素引起機組軸向振動異常。采集得到機組發(fā)生故障前較長一段時間的軸向振動波形作為正常狀態(tài)數(shù)據(jù),機組剛發(fā)生故障時較短一段時間的軸向振動波形作為故障中數(shù)據(jù),機組發(fā)生故障后的軸向振動波形作為故障后數(shù)據(jù)。采樣頻率為458 Hz,采樣長度為4 096,不同狀態(tài)各采集得到40組數(shù)據(jù)。
對原始振動信號進(jìn)行非局部均值去噪處理,對降噪后信號進(jìn)行EEMD 分解,隨后采用峭度—標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)篩選有效IMF分量。正常狀態(tài)信號IMF分量峭度標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)如圖9所示,由圖9可知,在標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)較小的情況下,IMF8~I(xiàn)MF12 的峭度指標(biāo)也較小,因此正常狀態(tài)信號有效IMF分量為IMF1~I(xiàn)MF7。采用同樣方法分析故障中和故障后信號的有效IMF 分量,經(jīng)分析,該兩種狀態(tài)下的有效IMF 分量均為IMF1~I(xiàn)MF7,因此對于水口電站機組3種狀態(tài)下軸向振動信號,選取IMF1~I(xiàn)MF7 作為有效IMF 分量并計算其多尺度熵值。嵌入維數(shù)選取m= 2,相似容限取r= 0.2δ,尺度因子取τ= 15。分析信號IMF1~I(xiàn)MF7在三種狀態(tài)下的多尺度熵值,多尺度熵值區(qū)分較為明顯的IMF 分量為IMF1~I(xiàn)MF4,部分信號IMF1~I(xiàn)MF4 的多尺度熵值計算結(jié)果如圖10所示。由圖10可知,選取尺度為2~5的IMF多尺度熵構(gòu)建高維特征向量,區(qū)分效果明顯。
將3種狀態(tài)下IMF1~I(xiàn)MF7尺度因子為2~5的多尺度熵特征集輸入ELM 進(jìn)行模式識別,每種狀態(tài)隨機選取20 組作為訓(xùn)練,剩余共60 組特征集作為測試集。采用EEMD 樣本熵特征提取方法做對比實驗,計算信號IMF1~I(xiàn)MF7 的樣本熵值作為特征集,每種狀態(tài)隨機選取20 組作為訓(xùn)練集,其余特征集作為測試集。為避免單次試驗結(jié)果存在的偶然性,進(jìn)行50 次ELM 重復(fù)訓(xùn)練與識別,每次識別隨機選取60 組作為訓(xùn)練集,60 組作為測試集,兩種方法識別精度統(tǒng)計結(jié)果如表2所示。由表2可知,本文所提方法具有更高的識別精度,在水電機組振動信號特征提取應(yīng)用上具有更好的效果。
表2 經(jīng)ELM重復(fù)識別50次不同方法識別精度統(tǒng)計 %Tab.2 The identification accuracy of different methods after repeating identification of ELM for 50 times
本文提出基于EEMD 多尺度熵和ELM 的水電機組振動信號特征提取方法,對信號進(jìn)行EEMD 分解后采用峭度—標(biāo)準(zhǔn)相關(guān)系數(shù)指標(biāo)篩選有效IMF 分量,并計算有效IMF 分量的多尺度熵,選取最佳尺度下的熵值構(gòu)建故障特征向量集,將特征向量集輸入ELM 進(jìn)行模式識別。分別分析了水電機組實測頂蓋振動信號和實測軸向振動信號,并采用EEMD 樣本熵特征提取方法作對比試驗,采用重復(fù)實驗的方法避免了一次識別存在的偶然性。結(jié)果表明,本文所提的方法對于水電機組振動信號具有優(yōu)良的特征提取效果,在實際工程中具有十分可觀的應(yīng)用前景。 □