游仕豪,鄭陽,閆懂林,陳盛,陳天涯,陳啟卷
(武漢大學動力與機械學院,湖北武漢 430072)
水電機組是水電能源轉(zhuǎn)換的核心設(shè)備,其高效安全穩(wěn)定運行是保證電站安全和電網(wǎng)穩(wěn)定的重要前提。因此,開展水電機組故障診斷研究,能減少水電機組事故的發(fā)生,對保障電網(wǎng)安全穩(wěn)定的運行具有重要意義。
到目前為止,學者們針對水電機組的故障診斷進行了諸多研究。黨建等[1]通過經(jīng)驗?zāi)B(tài)分解(EMD)和連續(xù)幾何分布相似性結(jié)合實現(xiàn)對水電機組振動信號降噪;杜義等[2]提出經(jīng)驗?zāi)B(tài)分解的奇異值為基礎(chǔ)的水電機組特征提取方法,并結(jié)合時域和頻域特征,實現(xiàn)對工況的精確識別;陳喜陽[3]等利用PSO優(yōu)化BP 神經(jīng)網(wǎng)絡(luò)的連接權(quán)值,提高BP 分類器的識別速度和精度。何葵東[4]等通過采用EEMD 分解后各本征模態(tài)函數(shù)(IMF)的多尺度熵作為特征值,并結(jié)合極限學習機(ELM)對水電機組進行故障診斷。
經(jīng)過上述的分析可以看出,現(xiàn)已形成了以信號去噪、信號特征提取、診斷模型構(gòu)建為核心的水電機組故障診斷基本流程。在信號去噪方面,EMD降噪[1],小波降噪[5]、EEMD[6]降噪等方法被廣泛使用。但上述降噪方法分別存在模態(tài)混疊、適應(yīng)范圍不廣泛、IMF分量中殘留白噪聲等問題,往往導致降噪的效果不理想。本文采用CEEMDAN 方法[7]對振動信號進行降噪處理,能很好的解決模態(tài)混疊現(xiàn)象和信號中殘留白噪聲的問題。在信號特征提取方面,單一的時域特征、頻域特征或者信號復(fù)雜程度等特征往往不能全面地表征信號特性,在本文中,分別對時域、頻域和各IMF 分量樣本熵進行提取,構(gòu)建混合特征向量來表征振動信號特性。最后對于模型構(gòu)建方面,BP 神經(jīng)網(wǎng)絡(luò)[8]、SVM[9]、樸素貝葉斯網(wǎng)絡(luò)[10]等方法被廣泛使用,但存在訓練速度慢、精度較低等問題。而GAO Huang等[11]提出了極限學習機(ELM),該方法無需通過迭代調(diào)節(jié)網(wǎng)絡(luò)參數(shù),因此訓練速度得到大幅提升,具有學習速度快、泛化能力強等優(yōu)點。本文利用Adaboost算法[12]和ELM 進行組合,能大大提高對水電機組故障診斷的精度和穩(wěn)定性。
綜上,本文將首先對機組原始振動信號利用CEEMDAN 進行分解降噪和重構(gòu)。然后對降噪后的水電機組振動信號,提取常規(guī)的時域和頻域特征,通過特征的離散程度大小實現(xiàn)特征的降維,并結(jié)合CEEMDAN 分解后主要IMF 分量的樣本熵構(gòu)建混合特征向量,將其作為ELM-Adaboost 強分類器的輸入最終得到智能診斷模型,從而實現(xiàn)對水電機組實測振動故障樣本集的高精度識別診斷。
完全自適應(yīng)噪聲集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN)是互補集合經(jīng)驗?zāi)B(tài)分解(CEEMD)算法的一種改進算法,該方法能更有效地消除模態(tài)混疊現(xiàn)象并且分解后的IMF 分量中無白噪聲殘留[7]。CEEMDAN分解的步驟如下:
(1)將服從正態(tài)分布的高斯白噪聲uj(t)(j=1,2,…,N為加入白噪聲的次數(shù))加入待分解信號y(t)中得到新信號y(t)+εvj(t),對其進行EMD 分解,得到第一階本征模態(tài)函數(shù)分量C1,對產(chǎn)生的N個模態(tài)分量取均值得到CEEMDAN 分解的第一個IMF分量為:
(2)計算原始信號去除IMF1后相應(yīng)的殘差。
(3)在殘差r1(t)中加入服從正態(tài)分布的高斯白噪聲uj(t)(j=1,2,…,N為加入白噪聲的次數(shù))得到新信號,對新信號進行EMD分解得到第一階模態(tài)分量D1,則有:
(4)計算相應(yīng)的殘差。
(5)重復(fù)上述步驟,直至殘差信號為單調(diào)函數(shù)且不適合被分解時,算法結(jié)束。此時得到m個本征模態(tài)函數(shù)分量和剩余的殘差分量。則原始信號可以表示為:
Adaboost 算法[12]的核心是合并多個弱分類器的輸出實現(xiàn)更加精確的分類,從而形成強分類器。ELM-Adaboost強分類器即把ELM 分類算法作為弱分類器,通過多次迭代訓練ELM 分類器,并通過Adaboost 算法賦予每個ELM 分類器相應(yīng)的權(quán)重并組合成強分類器。ELM-Adaboost 強分類器相比傳統(tǒng)的ELM 弱分類器具有分類精度高,分類結(jié)果波動性小的優(yōu)點,其具體步驟如下[13]:
(1)隨機選擇m組樣本作為強分類器的訓練數(shù)據(jù),賦予每組樣本初始權(quán)值D1,同時根據(jù)數(shù)據(jù)的輸入輸出確定ELM 弱分類器的輸入層、隱含層和輸出層中神經(jīng)元的個數(shù)。
(2)對于每次迭代t(t為ELM-Adaboost 中ELM 弱分類器的個數(shù)),重復(fù)以下步驟:
①訓練第t個ELM 弱分類器并對訓練數(shù)據(jù)的輸出進行預(yù)測,得到訓練數(shù)據(jù)的預(yù)測序列g(shù)(t)以及其預(yù)測誤差和et,預(yù)測誤差和的計算公式為:
②根據(jù)第t個弱分類器的預(yù)測誤差和et計算該分類器的權(quán)重αt,分類器權(quán)重計算公式為
③根據(jù)弱分類器的權(quán)重αt調(diào)整下一次迭代中訓練樣本的權(quán)重,調(diào)整公式為
式中:Bi是歸一化因子,i=1,2,…,m
(3)經(jīng)過n次迭代后,得到n組弱分類器的輸出函數(shù)f(gt,αt),并將其組合成強分類的輸出函數(shù)h(x)。
基于CEEMDAN-ELM-Adaboost 的水電機組故障診斷流程如圖1所示,其步驟如下:利用CEEMDAN 對振動信號進行分解重構(gòu),實現(xiàn)對振動信號的降噪。提取樣本數(shù)據(jù)的IMF 樣本熵特征、時域特征和頻域特征,建立包含21個特征的特征數(shù)據(jù)池,充分挖掘出蘊藏在振動信號中的故障信息??紤]到特征量之間可能存在耦合性和特征冗余性,故對特征池中的特征量做降維處理,從每類特征數(shù)據(jù)中篩選出差異性明顯的特征,構(gòu)建包含樣本數(shù)據(jù)的時域、頻域以及IMF 樣本熵的混合特征向量矩陣,將所有樣本的混合特征向量劃分為訓練集和測試集,輸入到ELM-Adaboost 強分類器中訓練強分類器模型并輸出測試集的預(yù)測結(jié)果。
圖1 基于CEEMDAN-ELM-Adaboost的故障診斷流程圖Fig.1 Fault diagnosis flow based on CEEMDAN-ELM-Adaboost
本文數(shù)據(jù)來源于某水電站的三號機組,該機組水輪機型號ZZA315-LJ-800,發(fā)電機型號SF200-56/11950,額定功率200 MW,立軸半傘式。分析數(shù)據(jù)為機組主軸軸向的振動數(shù)據(jù),機組故障類型為轉(zhuǎn)輪室碰摩故障。分別將采自于機組故障發(fā)生前的數(shù)據(jù)標記為故障預(yù)警狀態(tài)、故障發(fā)生后的數(shù)據(jù)標記為故障狀態(tài)、檢修后正常運行的數(shù)據(jù)標記為正常運行狀態(tài),其中每種狀態(tài)數(shù)據(jù)各40組,每組數(shù)據(jù)波形長度為4 096 個采樣點,數(shù)據(jù)點的采樣頻率為458 Hz。
對每個樣本中的原始振動信號進行CEEMDAN 分解,經(jīng)過多次試驗分析,設(shè)定加入高斯白噪聲的次數(shù)為100,高斯白噪聲標準差為0.2,最大的迭代次數(shù)為1 000。信號分解得到若干個IMF分量,同時計算每個IMF分量與原始振動信號的相關(guān)系數(shù),各個IMF分量的相關(guān)系數(shù)如表1所示。由表1可知,前幾個IMF分量與原始信號的相關(guān)系數(shù)較大,能很大程度地表征原始信號的特征,故可通過選取前幾個相關(guān)系數(shù)較大的IMF 分量進行重構(gòu)從而達到信號去噪的效果[14-16]。綜合120 個樣本的分解結(jié)果,本文選取前6個IMF分量進行信號重構(gòu)。
表1 IMF分量與原始數(shù)據(jù)的相關(guān)系數(shù)表Tab.1 Table of IMF components in relation to raw data
為更加全面獲取振動信號深度蘊含的信息,提高故障診斷的準確性,本文對樣本數(shù)據(jù)中常規(guī)的時域特征、頻域特征和各IMF 分量的樣本熵進行提取,提取的特征及其對應(yīng)的編號如表2所示。
表2 振動信號特征集Tab.2 Characteristic set of vibration signal
考慮到提取的特征量過多,特征量之間可能存在耦合性和特征冗余性,本文對提取的高維特征集進行降維處理,通過特征值離散程度的差異對提取的特征進行篩選。計算14個時域、頻域特征的標準差,得到各特征的離散程度(即標準差的大?。┮妶D2。由圖2 可知,部分特征的離散程度幾乎趨近于0,即特征值基本都聚集于某一個值的附近,不能對3 種運行狀態(tài)進行有效區(qū)分,故分別剔除掉時域特征和頻域特征中離散程度較小的無效特征。通常前幾個IMF 分量集中了原始振動信號中最顯著、最重要的信息[17]。為保證提取特征的代表性和算法運行的快速性,本文選用CEEMDAN 分解后的前3 個與原始信號相關(guān)性系數(shù)較大的IMF 分量并計算其樣本熵,最后篩選出T1、T4、T5、F2、F3、F4、S1、S2、S3九個特征用來構(gòu)建混合特征向量。
圖2 樣本特征的離散程度Fig.2 Degree of dispersion of sample features
圖3、4 和圖5 分別為特征降維處理后的篩選出的時域特征、頻域特征和樣本熵在不同樣本上的分布圖,其中樣本序號1~40 為正常運行樣本,序號41~80 為故障預(yù)警樣本,序號81~120為故障樣本。由圖3、4和圖5可知,在所篩選出的特征分布圖中,故障樣本和其他兩種樣本有較明顯的差異,正常運行樣本和故障樣本在部分特征上的分布上也存在差異。
圖3 樣本的時域特征分布圖Fig.3 Time-domain distribution of the sample
圖4 樣本的頻域特征分布圖Fig.4 Frequency domain feature distribution of the sample
圖5 樣本的IMF樣本熵分布圖Fig.5 IMF sample entropy distribution of samples
將降維后的9 個特征組合成混合特征向量,其格式為[T1,T4,T5,F(xiàn)2,F(xiàn)3,F(xiàn)4,S1,S2,S3]。依據(jù)每種運行狀態(tài)對120 組樣本按6∶4 的比例隨機劃分為72 組訓練集和48 組測試集。首先對ELM-Adaboost 的輸入?yún)?shù)進行初始化,經(jīng)過多次試驗分析,設(shè)定ELM 選取的個數(shù)為10,ELM 的輸入層節(jié)點數(shù)為9,輸出層節(jié)點數(shù)為3,單隱含層的節(jié)點數(shù)為50,激活函數(shù)為sigmoid 函數(shù)。利用訓練樣本對模型進行訓練,對比在EMD 和CEEMDAN 兩種不同降噪方法下不同分類方法的分類準確性??紤]到ELMAdaboost 算法在水電機組小樣本故障診斷上的適用性,設(shè)置訓練集和測試組樣本數(shù)量比例為4∶6 的對照組,并對每種組合運行100 取平均值來避免隨機誤差的影響,對比試驗結(jié)果如表3所示。其中實驗組中最能代表平均結(jié)果的分類結(jié)果見圖6和圖7。
圖6 基于CEEMDAN降噪的分類結(jié)果Fig.6 Classification result based on CEEMDAN denoising
圖7 基于EMD降噪的分類結(jié)果Fig.7 Classification result based on EMD denoising
從表3 可知,相比于EMD 分解降噪,利用CEEMDAN 方法進行降噪可以提高分類的準確性。此外,對比相同降噪方法下的3 中分類方法的分類情況,ELM-Adaboost 相比于ELM 和BPNN 分類方法,其對水電機組的故障分類更加精確。同時ELM-Adaboost 也繼承了ELM 網(wǎng)絡(luò)訓練速度快的優(yōu)點,其相比于BPNN 分類方法其運行時間更短。最后,相比于其他兩者分類方法,ELM-Adaboost 方法在水電機組小樣本故障分類問題上,其識別精度基本不隨樣本數(shù)量的變化而變化,表現(xiàn)出良好的魯棒性。綜上,本文提出的基于CEEMDAN-ELM-Adaboost的水電機組故障診斷方法相比于傳統(tǒng)方法具有更好的應(yīng)用性。
表3 分類準確度對比Tab.3 Comparison of classification accuracy
本文提出了基于CEEMDAN-ELM-Adaboost 的水電機組故障診斷方法,并利用水電機組轉(zhuǎn)輪室碰摩故障的實際數(shù)據(jù)進行分析,得到以下結(jié)論。
(1)相比于傳統(tǒng)的EMD 降噪方法,通過CEEMDAN 對原始信號降噪能提高后續(xù)故障分類的準確性。
(2)相對于傳統(tǒng)的BPNN 和ELM 方法,ELM-Adaboost 方法在水電機組小樣本的故障分類問題上具有更高的識別精度和魯棒性。此外,該方法在保證高識別率的前提下具有訓練速度的特點。
(3)CEEMDAN-ELM-Adaboost方法在水電機組轉(zhuǎn)輪室碰摩故障識別問題上具有很好的適應(yīng)性,其識別精度可以達到97.92%。