禹杭,高海波,付博,林治國(guó),尚前明,盛晨興
1.武漢理工大學(xué) 能源與動(dòng)力工程學(xué)院,湖北 武漢 430063 2.中船黃埔文沖船舶有限公司,廣東 廣州 510000
永磁同步推進(jìn)電機(jī)作為一種新型的電機(jī),相對(duì)傳統(tǒng)的同步電機(jī)長(zhǎng)度和體積降低了40%,且因其具有高效率、高功率密度等優(yōu)點(diǎn),使得永磁同步電機(jī)的應(yīng)用愈加廣泛。電機(jī)在運(yùn)行過(guò)程中一旦發(fā)生故障,會(huì)對(duì)設(shè)備的生產(chǎn)、安全等造成不同程度的影響,并產(chǎn)生難以估計(jì)的損失,因此開展其故障診斷研究工作具有重大意義[1]。永磁電機(jī)振動(dòng)信號(hào)中蘊(yùn)含大量特征信息,利用振動(dòng)信號(hào)對(duì)電機(jī)進(jìn)行故障診斷是目前的研究熱點(diǎn)。
由于永磁電機(jī)運(yùn)行環(huán)境包含諸多復(fù)雜多變的因素,采集到的振動(dòng)信號(hào)往往是復(fù)雜的非周期、非線性信號(hào),其信號(hào)隨機(jī)性大,幅值波動(dòng)性強(qiáng),特征提取困難。對(duì)此近年來(lái)關(guān)于電機(jī)的特征提取與故障診斷已有較多研究,常用的方法可分為時(shí)域法[2]、頻域法[3]及時(shí)頻域法[4]。其中基于時(shí)域特征的故障診斷方法多利用智能化的方式來(lái)實(shí)現(xiàn)。Xu Tongle 等[5]提出了一種基于局部均值分解(local mean decomposition,LMD)形態(tài)學(xué)濾波和最小二乘支持向量機(jī)(least square support vector machine,LS-SVM)的旋轉(zhuǎn)機(jī)械故障診斷方法,對(duì)振動(dòng)信號(hào)混合降噪,再用LMD 分解得到的能量比特征作為故障特征,實(shí)現(xiàn)了軸承的故障診斷;陳勇等[6]用定子電流信號(hào)和振動(dòng)信號(hào)的頻譜特征融合作為匝間短路故障判斷依據(jù),結(jié)合改進(jìn)小波包變換算法與快速傅里葉變換,實(shí)現(xiàn)了永磁電機(jī)匝間短路的故障檢測(cè);黃文靜[7]提取原始信號(hào)的時(shí)域特征參數(shù)均值、標(biāo)準(zhǔn)差、峭度、偏度、樣本熵,經(jīng)LMD 分解得到的能量特征來(lái)表征其軸承真實(shí)運(yùn)行狀態(tài),用粒子群優(yōu)化的BP 神經(jīng)網(wǎng)絡(luò)得到了較好的診斷效果。盡管以上方法都取得了不錯(cuò)的診斷結(jié)果,但是并沒(méi)有分析不同特征信息之間相互影響的作用,難免會(huì)喪失特征的部分信息,對(duì)故障分類會(huì)造成一定影響。較少的特征參數(shù)涵蓋信息較少,較多的特征參數(shù)會(huì)增加診斷難度,選取合適的特征參數(shù)及從不同角度利用時(shí)域數(shù)據(jù)對(duì)特征進(jìn)行提取是研究難點(diǎn)。實(shí)際工程中,故障信號(hào)的時(shí)域特征隨著電機(jī)運(yùn)行狀態(tài)而變化。不同的故障類型、不同故障深度下的時(shí)域特征會(huì)有所重疊,會(huì)對(duì)分類精度產(chǎn)生影響[8]。
針對(duì)以上電機(jī)振動(dòng)信號(hào)非周期、非線性、特征提取復(fù)雜且困難的問(wèn)題,本文提出了一種主成分分析與隨機(jī)森林的永磁電機(jī)故障診斷方法。首先采集了永磁電機(jī)原始時(shí)域振動(dòng)位移信號(hào),再將原始時(shí)域信號(hào)以15 個(gè)轉(zhuǎn)速周期分成若干段,分別提取每段共13 個(gè)時(shí)域特征和數(shù)學(xué)統(tǒng)計(jì)特征,然后引入主成分分析法對(duì)特征信號(hào)進(jìn)行降維去噪,最后將提取后的二維特征信號(hào)使用隨機(jī)森林進(jìn)行故障分類。
在用統(tǒng)計(jì)方法研究多變量問(wèn)題時(shí),變量個(gè)數(shù)太多會(huì)增加算法運(yùn)算的復(fù)雜性。在很多情形,變量之間有一定的相關(guān)關(guān)系,當(dāng)2 個(gè)變量之間有一定相關(guān)關(guān)系時(shí),可以解釋為這2 個(gè)變量之間具有重疊信息。為了解決該問(wèn)題,設(shè)法將原來(lái)變量重新組合成一組新的互相無(wú)關(guān)的幾個(gè)綜合變量。引入主成分分析法(PCA)對(duì)信息進(jìn)行處理,核心思想是將高維相關(guān)聯(lián)系的特征減為少數(shù)不關(guān)聯(lián)特征,同時(shí)盡可能多地反映原來(lái)的信息[9]。本文引入PCA 方法對(duì)提取的13 組特征數(shù)據(jù)進(jìn)行降維去噪,具體方法如下。
假設(shè)輸入的數(shù)組有m個(gè)特征,共有n組數(shù)據(jù),輸出得到二維的拓?fù)浣Y(jié)構(gòu),輸出的神經(jīng)元個(gè)數(shù)為j,具體的向量過(guò)程如下。
1) 輸入(n,m)特征矩陣。
2) 相關(guān)性分析。
3) 標(biāo)準(zhǔn)化數(shù)據(jù)。
4) 歸一化處理。
式中n和m是式(1)中標(biāo)準(zhǔn)化后的數(shù)據(jù)樣本對(duì)應(yīng)的維度。X(1)是歸一化之后的特征矩陣,目的是為讓數(shù)據(jù)結(jié)果映射在(0,1)。
5)求協(xié)方差矩陣。
6) 主成分計(jì)算。
式中:Zk為第k個(gè)主成分(k≤m),vk是其方差貢獻(xiàn)率。
用方差Dvar來(lái)表示該成分所含信息的多少。在所有的線性組合中選取的F1方差最大,故稱F1為第一主成分。如果第一主成分不足以代表原來(lái)特征的信息,再考慮選取F2即選第二個(gè)線性組合。為了有效地反映原來(lái)信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov(F1,F2)=0,則稱F2為第二主成分。依此類推可以構(gòu)造出第三、第四,……,第Q個(gè)主成分[10]。通常用方差貢獻(xiàn)率來(lái)表示各主成分的方差值占總方差值的比例,一般方差貢獻(xiàn)率超過(guò)90%就代表該成分足以涵蓋特征的大量信息。
隨機(jī)森林算法是由Leo Breiman 和 Adele Cutle等提出[11-12]的,它結(jié)合了Breimans 的 Bootstrap aggregating 和 Tin Kam Ho 的 random decision forests 方法,是一種由多棵決策樹組成的集成分類器。由于隨機(jī)森林算法的強(qiáng)抗噪能力,且能評(píng)估各個(gè)特征在分類問(wèn)題上的重要性,常用于密碼學(xué)[13]、生物信息學(xué)[14]、生態(tài)學(xué)[15]等領(lǐng)域。本文用隨機(jī)森林算法來(lái)處理電機(jī)運(yùn)行過(guò)程中振動(dòng)信號(hào)的隨機(jī)性強(qiáng)、噪音大等問(wèn)題。
隨機(jī)森林由多個(gè)決策樹組成,每個(gè)決策樹是一個(gè)樹結(jié)構(gòu)。其中每個(gè)非葉節(jié)點(diǎn)表示一個(gè)特征屬性上的測(cè)試,每個(gè)分支代表這個(gè)特征屬性在某個(gè)閾值上的輸出,而每個(gè)節(jié)點(diǎn)存放一個(gè)類別。決策樹一般模型如圖1 所示。
圖1 決策圖一般模型
隨機(jī)森林是決策樹基礎(chǔ)上的衍生,首先輸入數(shù)據(jù)集D={Xi,Yi},其中Xi∈Rk,Yi∈{1,2,···,C};再隨機(jī)建立由多個(gè)決策樹{g(D,θu),u=1,2,···,U}組成的森林,每個(gè)決策樹之間相互獨(dú)立。每當(dāng)有數(shù)據(jù)輸入時(shí),每個(gè)決策樹根據(jù)相應(yīng)的分類屬性對(duì)其判斷,將投票多的類別作為該輸入的分類[16]。具體流程如圖2 所示。
圖2 隨機(jī)森林流程
1)從訓(xùn)練集樣本中有放回地隨機(jī)選取N個(gè)樣本作為訓(xùn)練子集,且此訓(xùn)練子集約為原始訓(xùn)練集的三分之二[17],以此來(lái)訓(xùn)練一個(gè)決策樹,作為決策樹根節(jié)點(diǎn)處的樣本。
2)若每個(gè)樣本中含有U個(gè)屬性,決策樹的每個(gè)節(jié)點(diǎn)需要進(jìn)行分裂時(shí),隨機(jī)的從這U個(gè)屬性中選取出u個(gè)屬性,且定義滿足條件遠(yuǎn)小于U,防止局部最優(yōu)。然后從這u個(gè)屬性中采用某種策略來(lái)選擇一個(gè)屬性作為該節(jié)點(diǎn)的分裂屬性。
3)決策樹的形成過(guò)程中每個(gè)節(jié)點(diǎn)都按照步驟2)來(lái)分裂,直到不能分裂為止,且決策樹形成過(guò)程沒(méi)有剪枝。
每棵決策樹都會(huì)產(chǎn)生一個(gè)決策,多棵決策樹則會(huì)產(chǎn)生多個(gè)決策,被投票數(shù)最多的決策作為最終診斷結(jié)果。
本文所用船舶電力推進(jìn)系統(tǒng)永磁電機(jī)振動(dòng)信號(hào)相關(guān)數(shù)據(jù)樣本均出于推進(jìn)電機(jī)性能綜合實(shí)驗(yàn)室,實(shí)驗(yàn)臺(tái)架如圖3 所示。
圖3 實(shí)驗(yàn)臺(tái)架
該永磁電機(jī)采用的是眾聯(lián)能創(chuàng)T 系列電機(jī),TZ205XS70K01 型船用電動(dòng)機(jī)和傳感器相關(guān)參數(shù)如下:額定電壓,DC350 V;輸入電壓,DC240~420 V;額定轉(zhuǎn)速,3 000 r/min;額定功率,55 kW;效率(額定功率時(shí)),大于等于95%;過(guò)載能力1,110%額定電流(T≤60 s);過(guò)載能力2,150%額定電流(T≤10 s);防護(hù)等級(jí),IP44;冷卻方式,水冷;旋向,逆時(shí)針;控制方向,矢量控制;體積,365×305×232 m3;流量,8~12 L/min;凈質(zhì)量,70 kg;傳感器類型,壓電式傳感器;采樣頻率,20 kHz。現(xiàn)以20 kHz 采集電機(jī)的一維振動(dòng)信號(hào),設(shè)置4 種工況如下:G1 為正常工況;G2 為轉(zhuǎn)子偏心;G3 為定子短路;G4 為軸承內(nèi)圈故障。采用Matlab 軟件繪制時(shí)間與振動(dòng)位移的關(guān)系如圖4~7 所示。通過(guò)實(shí)驗(yàn)臺(tái)提取正常工況1 000 000 個(gè)數(shù)據(jù),轉(zhuǎn)子偏心800 000 個(gè)數(shù)據(jù),定子短路800 000 個(gè)數(shù)據(jù),軸承內(nèi)圈故障700 000個(gè)數(shù)據(jù)??梢姇r(shí)域信號(hào)并無(wú)明顯規(guī)律,無(wú)法直觀地辨識(shí)正常工況和故障工況,需要通過(guò)智能算法進(jìn)行辨識(shí)。
圖4 正常工況
圖5 轉(zhuǎn)子偏心
圖6 定子短路
圖7 軸承內(nèi)圈故障
由于電機(jī)運(yùn)行環(huán)境復(fù)雜,且提取的振動(dòng)信號(hào)的數(shù)據(jù)量大,且沒(méi)有明顯的周期性,難以進(jìn)行常規(guī)診斷。對(duì)此運(yùn)用PCA-RF 方法對(duì)電機(jī)以時(shí)間序列運(yùn)用數(shù)學(xué)處理方法進(jìn)行特征提取、降維,進(jìn)而進(jìn)行故障診斷,基本流程如圖8 所示。
圖8 PCA-RF 流程
1)數(shù)據(jù)分段。電機(jī)額定轉(zhuǎn)速為3 000 r/min,采樣頻率為20 kHz,視每轉(zhuǎn)為一個(gè)周期,每周期包含400 個(gè)數(shù)據(jù)樣本。為選擇合適的時(shí)間長(zhǎng)度來(lái)表征每段時(shí)域信息的特征,避免小周期信號(hào)波動(dòng)的隨機(jī)性,故選取15 個(gè)周期作為1 個(gè)數(shù)據(jù)樣本。時(shí)域中的時(shí)間順序?qū)⒚? 000 個(gè)數(shù)據(jù)作為一個(gè)時(shí)間窗口,故正常工況數(shù)據(jù)中150 段數(shù)據(jù)樣本,共6 000×150 個(gè)數(shù)據(jù);轉(zhuǎn)子偏心含120 段,共6 000×120 個(gè)數(shù)據(jù);定子短路含120 段,共6 000×120 個(gè)數(shù)據(jù);軸承內(nèi)圈含100 段,共6 000×100 個(gè)數(shù)據(jù)。
2)特征提取。提取每6 000 個(gè)數(shù)據(jù)中的典型時(shí)域特征參數(shù)包括最大值(Pmax)、最小值(Pmin)、方差(Pvar)、標(biāo)準(zhǔn)差(Pstd)、均值(Pmean)、峰度(Pkurtosis)、偏度(Pskew);數(shù)學(xué)統(tǒng)計(jì)特征包括每6 000 個(gè)數(shù)據(jù)中前5%分位的數(shù)值(P5%)、前95%分位的數(shù)值(P95%)、前99%分位的數(shù)值(P99%)、中位數(shù)(Pmedian)、總數(shù)之和(Psum)、絕對(duì)值之和(Pabs_sum)、典型時(shí)域特征參數(shù)和數(shù)學(xué)統(tǒng)計(jì)特征共累計(jì)13 個(gè)特征參數(shù)。
3)特征降維。將每段時(shí)域特征數(shù)據(jù)利用PCA 降維去噪,將13 個(gè)特征數(shù)據(jù)降為含有高度組合信息的2 個(gè)主成分。
4)隨機(jī)森林診斷。將PCA 處理的2 個(gè)主成分作為二維輸入特征,實(shí)現(xiàn)了對(duì)數(shù)據(jù)的降維去噪,大大減少了算法診斷的復(fù)雜性。將二維數(shù)據(jù)引入隨機(jī)森林模型,隨機(jī)產(chǎn)生20%的測(cè)試集得出診斷結(jié)果。
電機(jī)運(yùn)行包括正常工況、轉(zhuǎn)子偏心、定子短路、軸承內(nèi)圈故障共4 個(gè)工況,以每6 000 個(gè)采樣數(shù)據(jù)為時(shí)間窗口(490,6 000)的數(shù)據(jù)矩陣,這490 行數(shù)據(jù)的前150 行為正常工況數(shù)據(jù),命名為標(biāo)簽0,后續(xù)的120 行、120 行和100 行分別為標(biāo)簽1、標(biāo)簽2 和標(biāo)簽3,分別對(duì)應(yīng)轉(zhuǎn)子偏心、定子短路和軸承內(nèi)圈故障等3 種故障。取每種工況的首行數(shù)據(jù)如表1所示。
表1 原始數(shù)據(jù)矩陣
將原始一維數(shù)據(jù)以時(shí)間分段之后,形成490 行、6 000 列時(shí)間矩陣,并以每行數(shù)據(jù)進(jìn)行特征提取,與文獻(xiàn)[18-19]有所不同,前人所做的研究更多的是將典型時(shí)域特征進(jìn)行特征提取,本文將典型時(shí)域特征參數(shù)和數(shù)學(xué)統(tǒng)計(jì)特征參數(shù)作為PCA 的降維去噪特征參數(shù),把一維振動(dòng)信號(hào)當(dāng)作大量數(shù)字,從數(shù)學(xué)統(tǒng)計(jì)層面對(duì)數(shù)據(jù)進(jìn)行信息挖掘,從而對(duì)數(shù)據(jù)進(jìn)行更有效地特征提取。一維振動(dòng)信號(hào)的數(shù)據(jù)共13 個(gè)統(tǒng)計(jì)特征,組成(490,13) 的特征矩陣,列舉正常工況下的前5 行的特征數(shù)據(jù),如表2 所示。
表2 特征矩陣部分?jǐn)?shù)據(jù)
由表2 可見,正常工況下,即使是不同時(shí)間窗口下同種特征參數(shù)的數(shù)據(jù)差異也很小??梢娺x取涵蓋了15 個(gè)轉(zhuǎn)速周期的數(shù)據(jù)樣本,避免了只提取小周期信號(hào)波動(dòng)對(duì)特征提取造成的影響,為故障模型的診斷降低了難度。
PCA 方法經(jīng)常用于基礎(chǔ)數(shù)學(xué)的統(tǒng)計(jì)分析,對(duì)于以上13 個(gè)時(shí)域特征和數(shù)學(xué)統(tǒng)計(jì)特征有很好的降維去噪作用。將13 個(gè)數(shù)學(xué)統(tǒng)計(jì)特征進(jìn)行主成分分析,得到第一成分方差貢獻(xiàn)率(指各主成分的方差值占總方差值的比例)約為99.6%,第二成分方差貢獻(xiàn)率約0.4%。一般認(rèn)為第一主成分的方差貢獻(xiàn)率超過(guò)90%,則經(jīng)過(guò)降維去噪處理后的第一成分就可以涵蓋大量信息。
將4 種工況特征可視化,其特征為無(wú)量綱量,二維分類散點(diǎn)圖如圖9 所示??梢娊?jīng)過(guò)PCA 處理的特征具有明顯區(qū)分度,為后面的診斷模型提供了可靠數(shù)據(jù)。
圖9 4 種特征可視化
將主成分分析后降維去噪的2 個(gè)主成分作為含有大量信息的特征引入隨機(jī)森林模型。其中構(gòu)建的決策樹個(gè)數(shù)為50 個(gè),4 種工況下共490 個(gè)故障類型,隨機(jī)選取其中20%(98 個(gè)類別)作為測(cè)試集。表3 為輸出分類器的混合矩陣。
表3 分類器輸出的混合矩陣
由輸出的混合矩陣可見故障得到了較準(zhǔn)確分類,本案例中診斷精度高達(dá)98.97%??梢钥闯?,本文運(yùn)用PCA-RF 方法對(duì)永磁電機(jī)的故障診斷有很高的診斷精度。
13 個(gè)統(tǒng)計(jì)特征同時(shí)引用時(shí)可達(dá)到98.97%的準(zhǔn)確率。為探尋特征提取個(gè)數(shù)以及數(shù)學(xué)統(tǒng)計(jì)特征對(duì)診斷精度的影響,只取7 個(gè)典型時(shí)域特征進(jìn)行降維帶入隨機(jī)森林模型,診斷精度為86.7%。將剩下的6 個(gè)數(shù)學(xué)統(tǒng)計(jì)特征依次加入,診斷精度分別為88.7%、89.7%、93.8%、96.9%、97.9%和98.97%。
經(jīng)分析可知,在常規(guī)時(shí)域特征不能很好地涵蓋信息特征時(shí),加入幾個(gè)數(shù)學(xué)統(tǒng)計(jì)特征可以有效提高PCA-RF 的診斷精度。因?yàn)橹鞒煞址治龇ū举|(zhì)上是一種數(shù)學(xué)統(tǒng)計(jì)方法,對(duì)數(shù)學(xué)統(tǒng)計(jì)特征參數(shù)有很好的識(shí)別作用,加入數(shù)學(xué)統(tǒng)計(jì)特征可從最大程度上保留原始信號(hào)的有效信息,以此全面反應(yīng)電機(jī)的運(yùn)行狀態(tài)。
傳統(tǒng)機(jī)器學(xué)習(xí)診斷方法大多將典型時(shí)域特征作為輸入特征進(jìn)行分類。傳統(tǒng)機(jī)器學(xué)習(xí)算法雖然模型簡(jiǎn)單,但在面對(duì)大量多類特征或變量,且樣本屬性有關(guān)聯(lián)時(shí),對(duì)于非線性問(wèn)題難以找到合適的參數(shù)。由于本文典型時(shí)域特征與數(shù)學(xué)統(tǒng)計(jì)特征涵蓋的信息類型有所重疊或沖突,且13 個(gè)特征數(shù)目較多,傳統(tǒng)機(jī)器學(xué)習(xí)算法診斷準(zhǔn)確率反而很低,降低特征數(shù)將典型時(shí)域特征作為輸入特征能取得更好的診斷效果?,F(xiàn)將PCA-RF 算法與傳統(tǒng)分類算法作對(duì)比,提取均值、最大值、最小值、標(biāo)準(zhǔn)差、方差、偏度和峰度7 個(gè)典型時(shí)域特征作為特征輸入,轉(zhuǎn)子偏心為標(biāo)簽0,定子短路為標(biāo)簽1,軸承內(nèi)圈故障為標(biāo)簽2,正常工況為標(biāo)簽3。與極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)、概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)、廣義回歸神經(jīng)網(wǎng)絡(luò)(generalized regression neural network,GRNN)診斷精度作對(duì)比,取420 個(gè)樣本為訓(xùn)練集,70 個(gè)樣本為測(cè)試集。診斷結(jié)果如圖10~12 所示。
圖10 極限學(xué)習(xí)機(jī)準(zhǔn)確度
圖11 概率神經(jīng)網(wǎng)絡(luò)準(zhǔn)確度
圖12 廣義回歸神經(jīng)網(wǎng)絡(luò)準(zhǔn)確度
傳統(tǒng)算法ELM、PNN、GRNN 的診斷精度分別為87.14%、95.71%、72.85%。由于不同算法適用的特點(diǎn)不同,導(dǎo)致不同的分類算法有不同的診斷精度,診斷效果并不能達(dá)到本文提出的PAC-RF算法98.97%的診斷精度。
本案例采用不同算法所用時(shí)間的對(duì)比如表4所示,可見在采用多特征時(shí),PCA-RF 診斷方法比傳統(tǒng)機(jī)器學(xué)習(xí)方法診斷速度有了極大改善。
表4 不同算法在電機(jī)診斷中的時(shí)間對(duì)比
針對(duì)永磁電機(jī)振動(dòng)信號(hào)特征提取困難且復(fù)雜、故障難以辨識(shí)的問(wèn)題,本文利用電機(jī)實(shí)驗(yàn)平臺(tái),提取電機(jī)的正常和故障工況數(shù)據(jù),提出了主成分分析法,并結(jié)合隨機(jī)森林算法建立了PCA-RF的診斷模型。分析實(shí)驗(yàn)結(jié)果可得出:
1)引入PCA 方法,克服了典型時(shí)域特征和數(shù)學(xué)統(tǒng)計(jì)特征對(duì)信息涵蓋的重疊性以及單一特征的不充分性,實(shí)現(xiàn)了數(shù)據(jù)的最大化利用。
2)相較于傳統(tǒng)分類算法ELM、PNN、GRNN等,PCA-RF 的雙去噪方法對(duì)電機(jī)故障有更高的診斷精度,更快的診斷速度。
3)本研究從數(shù)學(xué)統(tǒng)計(jì)層面對(duì)數(shù)據(jù)進(jìn)行了進(jìn)一步挖掘,拓寬了電機(jī)故障特征提取的研究思路,具有一定的工程應(yīng)用前景。