趙榮珍 孫澤金
摘要:針對轉(zhuǎn)子故障信號非線性、非平穩(wěn)性的特點(diǎn),提出了一種基于互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解、多尺度排列熵和GK聚類的故障特征提取和識別方法。首先采用互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解對故障信號進(jìn)行分解,依據(jù)相關(guān)系數(shù)原則,選取相關(guān)系數(shù)最大的模態(tài)分量作為分析對象;然后利用多尺度排列熵量化模態(tài)分量的故障特征作為特征向量;最后,將經(jīng)過PCA(Principal Component Analysis)降維后的低維特征集輸入到GK模糊聚類算法中進(jìn)行故障識別分類。將所提方法應(yīng)用于典型轉(zhuǎn)子實(shí)驗(yàn)臺的故障特征集,通過分類系數(shù)與劃分熵對分類效果進(jìn)行檢驗(yàn),并與其他模式組合方法進(jìn)行比較。結(jié)果表明,本文所提方法能夠更有效提取故障特征。
關(guān)鍵詞:故障診斷;互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解;多尺度排列熵;GK模糊聚類
中圖分類號:TH165+。3;TH133.33+1文獻(xiàn)標(biāo)志碼:A 文章編號:1004-4523(2020)03-0629-07
DOI:10.16385/j.cnki.issn.1004-4523.2020.03.023
引言
在對轉(zhuǎn)子故障診斷研究中,對轉(zhuǎn)子振動信號進(jìn)行分析,從而提取出有用的故障特征信息是常用的手段之一。在實(shí)際中,采集到的轉(zhuǎn)子振動信號多是非線性、非平穩(wěn)的,而傳統(tǒng)的故障特征提取方法在處理這類振動信號時,相對比較困難。
對于故障的非平穩(wěn)復(fù)雜信號,需同時在時域與頻域進(jìn)行分析與處理。常用的時頻分析方法有固有時間尺度分解(Intrinsic Time-scalc Decomposi-tion,ITD)、小波變換(Wavelct Transform,WT)等。但上述方法存在一定的缺陷,比如ItD分解后分量波形易出現(xiàn)失真的情況;WT只能對信號的低頻部分進(jìn)行處理,而不能精確提取高頻信息,而且小波基函數(shù)不具有唯一性,不同的小波基波形差異很大,其規(guī)則性也有很大的差異,因此,對于同一個信號選用不同的基函數(shù)進(jìn)行處理得到的結(jié)果往往也不同。經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical M0dc Decom-position,EMD)在處理非線性、非平穩(wěn)信號時無需選擇基函數(shù),可以自適應(yīng)地將信號分解成若干本征模態(tài)分量(Intrinsic M0dc Function,IMF),非常適合處理此類信號。然而,EMD存在以下問題:①模態(tài)混疊;②端點(diǎn)效應(yīng)。針對上述問題,Wu等借助輔助噪聲對EMD進(jìn)行了改進(jìn),提出了集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemblc Empirical M0dc Decomposi-tion,EEMD),通過在原始信號中添加高斯白噪聲,使信號分解具備抗噪特性。但EEMD在一定程度上存在白噪聲殘留帶來重構(gòu)誤差的問題,而且計算運(yùn)行的時間大大地延長。Yeh等提出了互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(Complementary Ensemblc Em-pirical M0dc Decomposition,CEEMD),在EEMD的基礎(chǔ)上將添加的白噪聲采用正、負(fù)成對的形式,將重構(gòu)信號中的殘余分量抵消,減少了計算時間。
經(jīng)過CEEMD分解,原始信號中的故障特征信息存在于得到的本征模態(tài)分量中,為量化這些故障特征,引入熵理論。排列熵(Permutation Entropy,PE)是一種用來檢測隨機(jī)性和動力學(xué)突變的方法,其計算簡單、抗噪能力強(qiáng)。Yan等證實(shí)將排列熵引入旋轉(zhuǎn)機(jī)械振動信號特征提取中的結(jié)果表明可以有效地對不同狀態(tài)下的滾動軸承的工況特征進(jìn)行表達(dá)。但是,在單一尺度上描述時間序列的不規(guī)則性往往存在一定的局限性,為此文獻(xiàn)在排列熵的基礎(chǔ)上提出多尺度排列熵(Multi-scalc Permuta-tion Entropy,MPE)算法用于衡量時間序列在不同尺度下的復(fù)雜性和隨機(jī)性,使魯棒性得到加強(qiáng)。
文獻(xiàn)在軸承故障診斷上運(yùn)用多尺度排列熵提取故障特征,取得了良好的診斷效果。對CEEMD方法分解得到的各模態(tài)分量進(jìn)行MPE分析,能夠使轉(zhuǎn)子的故障特征信息得到更好的表達(dá)。
故障診斷的實(shí)質(zhì)是模式識別,聚類分析是模式識別的常用方法之一,常用的有模糊C均值(FuzzyC-Mean,F(xiàn)CM)、GK(Gustafson-Kessel)聚類等。其中FCM僅適用于球形分布的數(shù)據(jù),這使得它在聚類分析時具有一定的局限性;GK聚類通過自適應(yīng)距離范數(shù)和協(xié)方差矩陣獲取目標(biāo)函數(shù),所以它對分布不均勻的數(shù)據(jù)點(diǎn)都能夠很好的表達(dá),適用于變量間存在相關(guān)性的數(shù)據(jù)集的聚類分析。
基于上述分析,本研究結(jié)合CEEMD算法與MPE的優(yōu)點(diǎn),提出將CEEMD算法與MPE結(jié)合用于轉(zhuǎn)子的故障特征提取,并用GK模糊聚類算法進(jìn)行轉(zhuǎn)子故障的識別的方法,并通過實(shí)驗(yàn)驗(yàn)證它的有效性。
1 方法基本理論
1.1 互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解
CEEMD是Yeh在EEMD基礎(chǔ)上提出的一種改進(jìn)的方法。EEMD是對EMD分解方法的改進(jìn),它通過在原始信號中加入均勻的高斯白噪聲解決了原算法造成的模式混疊問題。針對EEMD方法迭代次數(shù)多、運(yùn)算效率慢的問題,CEEMD分解方法進(jìn)一步做出了改進(jìn)。在原有方法的基礎(chǔ)上加入的輔助噪聲都是正負(fù)對形式,可以抵消處理后得到信號的噪聲影響,迭代次數(shù)也相應(yīng)減少,運(yùn)算效率得到極大提升。具體步驟如下:
1)在原始信號x(t)中添加N組正負(fù)對形式的白噪聲n(t),得到兩組模態(tài)分量;
2)對信號采用EMD方法進(jìn)行分解,每個信號都可分解為一系列IMF分量,其中Cij為第i個信號的第j個IMF分量。
3)通過多組分量組合得到分解結(jié)果式中 Cj為CEEMD分解得到的第j個分量。n為加入白噪聲的次數(shù)。
1.2 多尺度排列熵
MPE的基本思想是將原始時間序列進(jìn)行粗?;幚?,在多個尺度上計算時間序列的排列熵,然后計算各個不同尺度下的排列熵,即多尺度排列熵。具體計算步驟參考文獻(xiàn)。
2 基于GK模糊聚類的模式識別
GK模糊聚類算法的具體步驟如下:
對于一個給定的數(shù)集X=[x1,s2,…,xn],設(shè)利用隸屬度劃分矩陣U=[βjk]x×n作為判據(jù),可將X聚成c類(2≤c≤n)。其中,βjk表示第j個樣本隸屬于第i個類別的程度。n為樣本數(shù)目,βjk為聚類中心式中
D表示任意數(shù)據(jù)點(diǎn)xi到聚類中心vi的距離。
對給定終止容許誤差c>0,若迭代次數(shù)l=0,1,2,…,如果||Ul+2-Ul||≤ε,則迭代終止,否則增加迭代次數(shù),使l=l+1,重復(fù)上述步驟,直到滿足條件。
3 故障識別方法的設(shè)計
本研究所提出的基于CEEMD、多尺度排列熵和GK模糊聚類相結(jié)合的新的故障診斷方法,充分利用CEEMD可以自適應(yīng)處理信號和排列熵,計算簡單、抗噪性好的優(yōu)勢,通過相關(guān)系數(shù)篩選出CEEMD分解后的最優(yōu)模態(tài)分量,計算最優(yōu)模態(tài)分量的多個尺度的排列熵作為特征向量。針對用此方式得到的熵值特征向量存在著高維度的新問題,利用PCA進(jìn)行降維,從而獲取低維敏感的特征向量,最后輸入到GK模糊聚類算法中,具體步驟如下:
a)對采集的振動信號進(jìn)行CEEMD分解,得到若干IMF分量。
b)對若干個IMF分量進(jìn)行相關(guān)性分析,相關(guān)系數(shù)最大的即為最優(yōu)模態(tài)分量,EMD分解后的模態(tài)分量與原信號的相關(guān)性約等于各分量的自相關(guān)系數(shù),以此篩選出最優(yōu)模態(tài)分量,剔除無關(guān)模態(tài)分量。
c)計算篩選出的最優(yōu)模態(tài)分量的多尺度排列熵值,選取12個尺度的排列熵將其作為特征向量。
d)利用PCA對特征向量進(jìn)行維數(shù)約簡。
c)將約簡后的低維、敏感特征向量作為GK模糊聚類算法的輸入,并采用聚類評價指標(biāo)對聚類結(jié)果進(jìn)行判定。
轉(zhuǎn)子故障信號診斷流程圖如圖1所示。
4 實(shí)驗(yàn)分析
本項(xiàng)工作所使用的故障數(shù)據(jù)集源自圖2所示的雙跨度轉(zhuǎn)子試驗(yàn)臺。該實(shí)驗(yàn)臺安裝了13個電渦流傳感器。其中,前12個傳感器用于采集不同截面下的轉(zhuǎn)子的振動信號(即前12個通道),最后一個傳感器(即最后一個通道)用于采集系統(tǒng)中轉(zhuǎn)子的轉(zhuǎn)速信號。實(shí)驗(yàn)數(shù)據(jù)選取在采樣頻率為5000Hz,驅(qū)動電機(jī)轉(zhuǎn)速為2800r/min下采集的振動信號。在實(shí)驗(yàn)數(shù)據(jù)處理時,本實(shí)驗(yàn)選擇前12個通道的數(shù)據(jù)進(jìn)行處理。模擬如下四種典型故障:支座松動、動靜碰摩、質(zhì)量不平衡和軸系不對中,以及正常狀態(tài)下的實(shí)驗(yàn)。每種狀態(tài)取50組樣本,數(shù)據(jù)長度為2048.
由于篇幅限制,本研究以不對中狀態(tài)進(jìn)行分析,其原始振動信息如圖3所示。本文根據(jù)Yeh等針對CEEMD添加參數(shù)的研究,選擇CEEMD添加的白噪聲幅值為0.15,添加白噪聲對數(shù)為50.圖4為原始振信號經(jīng)CEEMD自適應(yīng)分解后得到12個IMF分量。分別計算各階IMF與原信號的相關(guān)系數(shù),得到表1.由此可以得出,IMF與原始振動信號的相關(guān)系數(shù)最大為1.0000,因此選擇IMFl為最優(yōu)分量進(jìn)行下一步故障分類和識別。
在計算多尺度排列熵時,需對以下4個參數(shù)進(jìn)行設(shè)定:時間序列長度N、嵌入維數(shù)f、時延因子r和尺度因子s。嵌入維數(shù)一般取3-7,若廠太小,重構(gòu)序列中可能包含的狀態(tài)會太少,難以檢測出時間序列的動態(tài)突變;若廠太大,將無法反映時間序列的細(xì)微變化。本文選取f=4.延遲時間r對時間序列的計算影響較小,尺度因子s的最大值一般取大于10即可。圖5為不同時延下排列熵數(shù)值變化情況,可以看出時延對信號的影響較小,因此取r=1.尺度因子取s=12,計算12個粗粒向量的排列熵,得到5種狀態(tài)結(jié)果如圖6所示。
圖6是5種狀態(tài)隨尺度因子s增大時最優(yōu)模態(tài)分量的多尺度排列熵變化情況??梢钥闯?,不同狀態(tài)的MPE值不同,這是因?yàn)楫?dāng)轉(zhuǎn)子發(fā)生故障時,振動信號的變化隨機(jī)性使排列熵值發(fā)生變化。當(dāng)尺度因子s=1,即單一尺度排列熵時,正常狀態(tài)熵值與故障狀態(tài)熵值相差不明顯,很難區(qū)分故障狀態(tài),因而需要對最優(yōu)分量進(jìn)行多尺度分析,故本文選取12個尺度的熵值當(dāng)作特征向量。
對轉(zhuǎn)子5種狀態(tài)分別進(jìn)行CEEMD分解并通過相關(guān)性分析選出最優(yōu)模態(tài)分量,在多個尺度下計算最優(yōu)模態(tài)分量的排列熵。選取12個尺度排列熵作為特征向量,得到5組50×12×12的排列熵。采用PCA降維算法將特征向量從144維降到3維。因?yàn)橛?種不同狀態(tài),所以聚類中心個數(shù)設(shè)定為5個,迭代終止容差ε=0.0001.將經(jīng)PCA降維后的特征向量輸入GK聚類算法,其2維等高線聚類圖如圖7所示,其中“O”代表聚類中心。
圖7中,V1,V2,V3,V4,V5分別代表{不對中、不平衡、碰摩、松動、正常}共5種狀態(tài)的聚類中心。從圖7可以看出轉(zhuǎn)子的5種狀態(tài)明顯被分開,且均聚集在聚類中心附近,聚集緊密,沒有出現(xiàn)混疊的現(xiàn)象,間距較大。通過計算各樣本的平均隸屬度,分別將各個樣本歸屬于某一特定類別,同類別的狀態(tài)依附在各聚類中心附近,實(shí)現(xiàn)故障狀態(tài)的分類。為說明本文提出方法的有效性,本文直接對原始振動信號進(jìn)行多尺度排列熵計算和CEEMD分解后提取單一尺度排列熵作對比實(shí)驗(yàn),并把結(jié)果輸入到FCM,GK聚類算法中,結(jié)果如圖8所示。
由圖8可知:1)將圖8(a)和(b)與圖8(c),(d)和(c)進(jìn)行對比可以得出,直接對原始信號進(jìn)行多尺度排列熵提取得到的特征向量經(jīng)FCM,GK聚類算法處理的聚類效果不理想,而經(jīng)CEEMD多尺度排列熵提取的特征向量聚類效果較好。顯然,這是原始信號經(jīng)CEEMD處理,保留了更多故障信息的結(jié)果。2)圖8(d)與8(e)聚類效果不佳。這是因?yàn)閱我怀叨扰帕徐夭⒉荒芎芎玫乇碚鞴收蠣顟B(tài),而且經(jīng)過CEEMD后并沒有篩選出最優(yōu)模態(tài)分量,沒有去除冗余信息,這對聚類效果造成了一定的不利影響為進(jìn)一步說明方法的有效性,再進(jìn)行CEEMD,EEMD和EMD多尺度排列熵對比實(shí)驗(yàn),在對比實(shí)驗(yàn)中對于EEMD和EMD分解信號同樣依據(jù)相關(guān)系數(shù)原則,選出相關(guān)系數(shù)最大的模態(tài)分量作為分析對象進(jìn)行實(shí)驗(yàn),并把結(jié)果輸入到GK聚類算法中,結(jié)果如圖9所示。
通過圖7與圖9對比分析和表2可以得出結(jié)論:CEEMD多尺度排列熵組合較其他組合模型,其聚類結(jié)果的類內(nèi)緊致性最好,聚類中心基本吻合。這是因?yàn)镋MD處理后各模態(tài)之間會存在混疊現(xiàn)象,從而導(dǎo)致提取出的故障信息不準(zhǔn)確,使得聚類效果不好;而EEMD雖然改進(jìn)了EMD中存在的模態(tài)分量的混疊現(xiàn)象,但某種程度上仍存在,而且其計算度復(fù)雜、迭代次數(shù)多也都影響聚類的效果。
最后,聚類效果通過聚類評價指標(biāo)——劃分系數(shù)(Partition Coefficient,PC)和劃分熵(Classifica-tion Entropy,CE)對圖7-9中不同模型聚類效果進(jìn)行評估。劃分系數(shù)PC越接近于1,劃分熵CE接近于0,聚類效果越好。根據(jù)表3可得出如下推論:1)GK聚類相對于FCM聚類方法效果更好。這是因?yàn)镕CM聚類的聚類形狀為圓球形,它僅反映超球形數(shù)據(jù)結(jié)構(gòu)的標(biāo)準(zhǔn)距離范圍規(guī)范;GK聚類的聚類形狀為橢球形,這有助于降低GK聚類方法對數(shù)據(jù)類型的限制,擴(kuò)大該聚類的應(yīng)用范圍。2)CEEMD多尺度排列熵組合在GK聚類中PC值最大,達(dá)到了0.9875,CE值最小為0.0420.由此看出,CEEMD多尺度排列熵組合較其他組合模式具有一定優(yōu)勢,因此本文提出的方法較好。
5 結(jié)論
CEEMD通過加入正、負(fù)成對的輔助噪聲,既解決了傳統(tǒng)EMD方法中模態(tài)混疊的問題,同時又消除了重構(gòu)信號中的殘余輔助噪聲,克服了EEMD方法分解結(jié)果中白噪聲中和不徹底的問題,并且加入的噪聲集合次數(shù)低,解決了運(yùn)算時間長、效率低的問題。與相關(guān)系數(shù)準(zhǔn)則結(jié)合,篩選出相關(guān)系數(shù)最大的模態(tài)分量作為研究對象,有效地降低了噪聲干擾,保留了故障沖擊成分。在此基礎(chǔ)上,提出了一種CEEMD分解、多尺度排列熵、GK聚類算法相結(jié)合的故障診斷方法,并把它應(yīng)用到轉(zhuǎn)子故障診斷中。該方法首先采用CEEMD對原始信號進(jìn)行分解、得到一系列本征模態(tài)分量,通過計算各個本征模態(tài)分量與原始信號的相關(guān)系數(shù),篩選最優(yōu)模態(tài)分量達(dá)到剔除冗余信息的目的,對最優(yōu)模態(tài)分量進(jìn)行多尺度的排列熵計算,對于得到的多尺度排列熵特征向量存在高維度和數(shù)據(jù)無法可視化問題,采用PCA進(jìn)行降維之后再輸入到GK聚類算法中。實(shí)驗(yàn)結(jié)果表明,本研究提出的故障診斷方法在處理非線性、非平穩(wěn)性的信號時,能夠有效地提取出有用的故障信息,能夠較好地區(qū)分轉(zhuǎn)子的不同狀態(tài),各故障數(shù)據(jù)類內(nèi)聚集緊湊,類間無重疊,是一種有效的自適應(yīng)故障特征提取和故障數(shù)據(jù)聚類與分類方法,為處理非線性、非平穩(wěn)性信號提供了一種新的解決思路。