洪文鵬 廖明俊/東北電力大學能源與動力工程學院
離心式風機是火電廠中的主要輔助設(shè)備[1-2],也是火電廠中廠用電耗量較大的設(shè)備,其地位很重要,但常常由于出現(xiàn)各種不同形式的振動故障而影響其正常工作[3],有時會發(fā)生嚴重的事故,造成重大的經(jīng)濟損失。
由于支持向量機中的核函數(shù)的參數(shù)選擇問題直接影響到支持向量機模型的推廣能力,所以,為了提高離心式風機故障分類的精確性,本文基于流形學習原理,研究應用局部線性嵌入法對汽輪發(fā)電機組振動信號進行有效降維的方法,從而實現(xiàn)在復雜的噪聲信號中提取有效的識別機組軸系振動故障的特征信息[4-5]。嘗試支持向量機(Support vector machine,SVM)[6]進行模式識別,同時運用果蠅算法(Fruit Fly Optimization Algorithm,F(xiàn)OA)[7]對支持向量機所選擇的核函數(shù)進行參數(shù)優(yōu)化。
因此FOA-SVM故障診斷模型可以很好地解決參數(shù)優(yōu)化問題同時能提高診斷的速度。運用FOA-SVM 模型對故障進行了診斷,同時與粒子群優(yōu)化[8]最小二乘支持向量機和蟻群算法[9-10]優(yōu)化最小二乘支持向量機的診斷進行了比較。
自流形學習原理提出以后,出現(xiàn)了各種流形學習方法。一種典型的流形學習方法是局部線性嵌入法(Locally Linear Embedding,LLE)。LLE法是一種典型的非線性降維方法,它主要是從局部入手,將非線性數(shù)據(jù)分割成具有局部線性結(jié)構(gòu)的數(shù)據(jù),通過歐氏距離以局部線形來保持整體拓撲結(jié)構(gòu),因此,對非線性數(shù)據(jù)有很好的降維效果。
LLE法的主要過程如下[13]:
1)尋找每個樣本點xi的k 個近鄰。定義樣本集矩陣X={x1,x2,…,xN}中樣本點xi與xj的距離dij為
式中,通常取p=2,即采用歐氏距離。根據(jù)式(1)計算得到樣本點xi的k個距離最近的點作為gj的k個近鄰點。
2)計算樣本點局部重構(gòu)的權(quán)值矩陣wi。為此,首先定義誤差函數(shù)
式中:gj(j=1,2,…,k)為xi的k 個近鄰點;wij為xi與gj之間的權(quán)值系數(shù),且滿足
將式(3)代入式(2)得到
3)將所有樣本點映射嵌入到低維空間中。映射嵌入滿足
式中:φ(Y)是損失函數(shù);yi是xi的輸出向量;hj(j=1,2,…,k)是yi的k個近鄰點,且滿足
式中:I 為d×d 的單位矩陣。這里,wij(i=1,2,…,N)可以存儲在N×N的稀疏矩陣W中。當{xj}是{xi}的近鄰點時,Wij=wij;否則Wij=0。用Wi表示W(wǎng)矩陣的第i列,Ii表示單位矩陣的第i列,Y表示輸出向量,即Y=[y1,y2,…,yN],則式(5)可寫為
為使損失函數(shù)L(Y)最小,則
將M 的特征值按從小到大順序排列,Y 取M的最小d 個非零特征值所對應的特征向量。一般地,M 的第一個特征值幾乎等于零。因此,取2~(d+1)個特征值所對應的特征向量作為低維嵌入Y。
由上述過程可以看出,LLE法的主要參數(shù)是近鄰數(shù)k和嵌入維數(shù)d。
支持向量的基本思想是:通過非線性映射函數(shù)把數(shù)據(jù)樣本映射到高維特征空間,再在高維特征空間中求得最優(yōu)分類面來分離訓練樣本點,使得訓練樣本點與最優(yōu)分離面距離最大化。
給定樣本集T={xi,yi│i=1,2,…,m},其中xi∈Rn表示輸入矢量;yi∈{+1,-1}表示對應的期望輸出矢量;m 為樣本數(shù)。通過非線性映射函數(shù),將輸入數(shù)據(jù)從原空間映射到高維特征空間,在高維特征空間中構(gòu)造最優(yōu)分類超平面
式中:w 表示權(quán)值矢量;b 為閾值。w 和b 確定了分類面的位置。分類面必須滿足以下約束:
引入松弛變量ξi,ξi用于衡量實際指標值yi與支持向量機輸出之間的距離。數(shù)據(jù)分離面的優(yōu)化問題轉(zhuǎn)變?yōu)橐韵聝?yōu)化問題:
式中:C 為懲罰參數(shù),用于實現(xiàn)對錯分樣本懲罰程度的控制。
引入Lagrangian 乘子αi,上述優(yōu)化問題轉(zhuǎn)化為二次規(guī)劃的優(yōu)化問題:小二乘線性系統(tǒng),降低了計算復雜性,提高了求解速度。
根據(jù)KKT條件,優(yōu)化系數(shù)必須滿足:
求解上述問題,于是得到最優(yōu)分類函數(shù):
其中,K(xi,x)=Φ(xi)Φ(x)為核函數(shù)。采用不同的核函數(shù)可以實現(xiàn)多種從輸入空間到特征空間的非線性映射形式,典型的核函數(shù)形式有以下3種。
多項式核函數(shù):K(x,y)=[(x y)+1]d
徑向基核函數(shù):K(x,y)=exp{-γ‖x-y‖2}
Sigmoid核函數(shù):K(x,y)=S[(xy)+c]
研究表明,在SVM 核函數(shù)的選取中,徑向機核函數(shù)具有良好的非線性[11],因此本文亦采用徑向基核函數(shù)。
FOA是臺灣學者潘文超于2011 年提出的一種基于果蠅覓食行為推演出的尋求全局優(yōu)化的方法[14]。果蠅嗅覺器官非常發(fā)達,可以很好地利用嗅覺和視覺上的優(yōu)勢搜集飄浮在空氣中的各種氣味并獲食物源方向,然后飛近食物位置后亦可使用敏銳的視覺發(fā)現(xiàn)食物與同伴聚集的位置,并且向該方向飛去。
用果蠅優(yōu)化算法系統(tǒng)來選擇風機故障特征實現(xiàn)步驟如下。
步驟1:初始果蠅群體位置,隨機設(shè)置果蠅群體的初始位置。
步驟2:賦予果蠅個體利用嗅覺搜尋食物的隨機方向和距離(x0,y0)。
步驟3:估計果蠅與原點的距離(Dist),然后計算味道濃度的判定值(S),此值為距離的倒數(shù)。
步驟4:將味道濃度判定值(S)帶入味道濃度判定函數(shù)求出各果蠅個體位置的味道濃度(Smell)。
步驟5:找出此果蠅群體當中味道濃度最高的果蠅。
步驟6:找出此果蠅群體當中味道濃度最高的果蠅及其對應的果蠅群位置坐標,此時果蠅群內(nèi)各個體果蠅利用視覺往該位置飛去。
步驟7:迭代尋優(yōu)。重復執(zhí)行步驟2~5,并判斷味道濃度是否優(yōu)于前一迭代味道濃度,若是則執(zhí)行步驟(6)。
SVM 對非線性問題分類性能取決于相結(jié)合的幾個因素,首先應該選擇合適的徑向基參數(shù)σ2將數(shù)據(jù)映射到高維的特征空間,然后對此特征空間尋找合適的懲罰因子C,使學習機的置信范圍和經(jīng)驗風險具有最佳比例。因此對σ2和C 的聯(lián)合優(yōu)化具有重大的意義。為了便于編程,對SVM中核函數(shù)參數(shù)σ2做簡單變換:1/σ2=g,把g作為徑向基核函數(shù)參數(shù)進行研究,在此,使用FOA 算法對其進行優(yōu)化,具體步驟如下:
1)初始果蠅群體的位置和參數(shù)的初始化。初始化果蠅群體位置區(qū)間為[1,2],種群規(guī)模30,迭代次數(shù)為100,設(shè)定SVM的初始參數(shù)。
2)果蠅尋優(yōu)開始。利用FOA調(diào)整參數(shù)C和g。
3)利用味道濃度判定函數(shù)求出味道濃度。
4)根據(jù)味道濃度值尋找極值,保留最佳位置。
5)檢查結(jié)束條件。若滿足,則結(jié)束尋優(yōu);否則轉(zhuǎn)至(2)。結(jié)束條件為尋優(yōu)達到最大進化代數(shù)或味道濃度是否優(yōu)于前一個迭代味道濃度。
實驗數(shù)據(jù)來自于東北電力大學流體機械實驗室離心式風機實驗臺,試驗采用的離心風機的型號為Y5-47-315D,主軸轉(zhuǎn)速2 900r/min,風量1 890m3/h,風壓8.09Pa,電機型號Y-90-Z,功率1.5kW,進口風溫20℃,出口方向右0°。對風機動故障中較為常見的5種故障進行識別,故障類型為:轉(zhuǎn)子不平衡,轉(zhuǎn)子不對中,基座松動,動靜摩擦,軸承內(nèi)圈損壞。所采用故障信號通過風機故障試驗臺測取,數(shù)據(jù)采集選用INV306F 數(shù)據(jù)采集器,采樣頻率設(shè)為800Hz,采樣時間為5s,數(shù)據(jù)存儲及處理由與采集器連接的臺式計算機完成。離心通風機試驗的故障原始信號見圖1。
圖1 故障的振動信號圖
為了提高信號頻譜分析的幅值和相位精度,采用了多通道同步采集方式,并對采集的信號進行整周期截取。通過小波去噪后進行時域和頻域分析,獲得所有信號的時域特征參數(shù)和頻域特征參數(shù),并由此構(gòu)成診斷所需的觀測空間。其中,時域特征參數(shù)包括:波形指標、脈沖指標、峰值指標、裕度指標、歪度指標、峭度指標等6個無量綱參數(shù);頻域特征參數(shù)包括[15]:(0.01~0.49)X,0.5X,1X,2X,3X,(3~5)X,(5~10)X,odd X 等8 個頻率或頻段的頻譜幅值或頻譜幅值和。這里,X表示諧波,odd X 表示奇數(shù)倍諧波。這樣,每個樣本空間都由這14個特征參數(shù)構(gòu)成。
每一樣本都是一個14 維的向量,包含有14個特征屬性。此時,用于識別的特征屬性較多,為了簡化判斷識別過程,就要對多個識別特征屬性所包含的信息進行濃縮,在保存樣本整體信息的基礎(chǔ)上,對特征屬性的數(shù)量進行壓縮。流形學習算法能夠在保存樣本的非線性信息的情況下對特征信息進行壓縮,將振動故障樣本矩陣作為流形學習算法的輸入,選取d=6,以故障診斷精度為目標,選取最佳鄰域值k=10,輸出即為經(jīng)過特征提取后的學習特征樣本和測試特征樣本。經(jīng)過流形學習特征提取之后,每一特征樣本由原來的14 個特征屬性變成了由8 個特征屬性組成的特征樣本,其中這8個特征屬性代表了每一樣本的特征信息,并將每一樣本的特征屬性作為神經(jīng)網(wǎng)絡(luò)的輸入征兆,用來診斷振動故障。首先每種算法都對每類故障各30 組特征向量共150 組樣本進行訓練。訓練完成后,從訓練樣本以外的數(shù)據(jù)中每類故障隨機抽取20組典型數(shù)據(jù)進行測試。
SVM 分類器各核函數(shù)的參數(shù)均采用交叉驗證的優(yōu)化方法來確定,分別選用蟻群和粒子群兩種智能算法與果蠅優(yōu)化算法進行比較,本文分別采用ACO-SVM、PSO-SVM和FOA-SVM3種算法對上述樣本進行識別,其中ACO-SVM,PSO-SVM,F(xiàn)OA-SVM 分別表示蟻群優(yōu)化支持向量機,粒子群優(yōu)化支持向量機和果蠅優(yōu)化支持向量機。由于3 種算法都是全局尋優(yōu)的概率搜索算法,因此參數(shù)均為如下設(shè)置:種群最大數(shù)量均為30,最大進化代數(shù)均為100,SVM參數(shù)C變化范圍均為[10-1,10-2],g 變化范圍均為[10-2,10-3]。每種算法都對每類故障的30組訓練集數(shù)據(jù)進行訓練,用其余的20 組測試集數(shù)據(jù)進行測試。測試結(jié)果如下:
圖2 測試結(jié)果圖
圖2中的accuracy為測試集識別的正確率,1為轉(zhuǎn)子不平衡,2為轉(zhuǎn)子不對中,3為基座松動,4為動靜摩擦,5為軸承內(nèi)圈損壞,對測試集的識別結(jié)果見表1。
表1 不同算法下的識別結(jié)果表
表1 可以看出,F(xiàn)OA-SVM 與PSO-SVM 在時間上相當,但在識別率上FOA-SVM 比PSO-LSSVM 高出6%。FOA-SVM 與ACO-SVM在識別率上分別達到99%和96%,都具有較高的識別率,但運行時間前者比后者快了接近一倍。所以經(jīng)過FOA 算法優(yōu)化過的SVM,無論在準確度上還是在運行時間上都優(yōu)越于其余的兩種算法,因此在風機振動故障類型識別上有很大的應用前景。
1)在SVM參數(shù)優(yōu)化方面。FOA算法比PSO算法更穩(wěn)定,比ACO算法進化的更快。
2)在故障的識別率上。FOA 算法達到了99%,而PSO與ACO分別為93%和96%。
3)在運行時間上FOA 算法僅用了2.102s,PSO與ACO分別用了2.572s和3.406s。
相比之下,F(xiàn)OA-SVM 在參數(shù)優(yōu)化上快速穩(wěn)定,在識別率上最高、識別速度最快。
[1]李斌,柴巖.風機異常振動故障的診斷與治理[J].風機技術(shù),2010(3):80-82.
[2]李嵩,朱之墀.離心風機氣動設(shè)計方法的發(fā)展及其應用[J].風機技術(shù),2012(4):60-67.
[3]李燕坡,劉廣州,楊建.大型機組日常管理與維護[J].風機技術(shù),2012(2):86-88.
[4]張倩,張志新,王亮.基于振動測試的滾動軸承故障診斷技術(shù)進展[J].風機技術(shù),2012(1):60-70,78.
[5]劉宇,譚偉,聞婧.大型雙饋風力發(fā)電機振動特性分析與故障診斷[J].風機技術(shù),2012(4):56-59.
[6]Burges C J C.A tutorial on support vectormachines for pattern recognition[J].DataMining and Knowledge Discovery,1998,2(2):121-167.
[7]Wen-Tsao Pan.A new Fruit Fly Optimization Algorithm:Taking the financial distress model as an example [J].Knowledge-Based Systems,2012,26:69-74.
[8]趙麗基.基于粒子群算法神經(jīng)網(wǎng)絡(luò)的多重化整流電路智能故障診斷[D].中南大學,2008.
[9]Dorigo M,Maniezzo V,Colorni A.Ant system optimization by acolony of cooperating agents[J].IEEE Transactions on System,Man and Cybernetics-Part B:Cybernetics,1996,26(1):29-41.
[10]陸靜.蟻群算法在變壓器故障診斷中的應用研究[D].南京航空航天大學,2008.
[11]S T Roweis,L K Saul.Nonlinear dimensionality reduction by locally linear embedding[J].Science,2000,290:2323-2326.
[12]J B Tenenbaum,V D Silva,J C Langford.A global geometric frame-work for nonlinear dimensionality reduction[J].Science,2000,290:2319-2323.
[13]陳高曙,曾慶寧.基于LLE 算法的人臉識別方法[J].計算機應用研究,2007,24(10):176-178.
[14]潘文超.果蠅優(yōu)化算法[M].臺灣:滄海書局,2011.
[15]鐘秉林,黃仁.機械故障診斷學[M].機械工業(yè)出版社,1997.