孫凱,田國清,田宏,段文超,田洋,陳立軍
(1.東北電力大學自動化工程學院,吉林吉林132012;2.華能新華發(fā)電有限責任公司,黑龍江大慶163815;3.包頭鋼鐵職業(yè)技術學院自動化系,內蒙古包頭014010)
隨著電力工業(yè)的迅速發(fā)展,電力設備自動化程度的不斷提高,越來越多的大容量、高參數(shù)汽輪機組陸續(xù)投入運行,機組容量的增大使其結構和系統(tǒng)日趨復雜,不安全因素必然越來越多[1]。因此如何有效地提高汽輪機故障診斷的準確率,保證其穩(wěn)定安全的運行是十分重要的。
近年來,專家系統(tǒng)、人工神經(jīng)網(wǎng)絡、聚類分析等多種方法被應用于汽輪機故障診斷中,并取得了一定成果[2-6]。由于汽輪機結構的復雜性和故障機理的多樣性,這些故障診斷分析方法的有效性和準確性還有待提高。支持向量機(Support Vector Machine,SVM)是由Vapnik等人在統(tǒng)計學習理論的基礎上建立起來的一種機器學習方法[7],該算法很好地執(zhí)行了統(tǒng)計學習理論的結構風險最小化原則,將其應用于故障診斷最大的優(yōu)勢在于它適合于小樣本決策,其學習方法的本質在于能夠在有限特征信息情況下,最大限度地發(fā)掘數(shù)據(jù)中隱含的分類知識[8],如文獻[9-11]將支持向量機應用于泵、汽輪機等故障診斷中。但支持向量機參數(shù)的選取比較困難,目前關于參數(shù)的選取還只是憑借經(jīng)驗。而遺傳算法(Genetic Algorithm,GA)是一種智能搜索方法,它源于生物進化的模型。由于遺傳算法具有強大的全局搜索能力,可以在很短的時間內搜索到全局最優(yōu)點,所以應用遺傳算法優(yōu)化支持向量機的參數(shù),以減少參數(shù)選擇的盲目性,有效地提高支持向量機的分類識別能力。文獻[12]將改進的遺傳算法優(yōu)化支持向量機尋找較優(yōu)的SVM參數(shù),并成功地將其應用于精餾塔故障診斷中,進一步提高了支持向量機的分類識別能力。
本文利用代溝選擇和可變交叉概率的改進遺傳算法(Improved Genetic Algorithm,IGA)優(yōu)化支持向量機(Support Vector Machine,SVM)尋找較優(yōu)的SVM參數(shù),并將其應用到汽輪機故障診斷中。通過診斷實例表明,經(jīng)IGA優(yōu)化后的支持向量機分類模型較GA-SVM模型具有更高的分類準確率。
支持向量機算法有效地改善了傳統(tǒng)分類方法的缺陷,具有較強的理論依據(jù),非常適合于小樣本、非線性及高維模式情況下的分類問題,表現(xiàn)出很多優(yōu)于已有方法的性能。
基于支持向量機算法進行分類的基本思想分以下五步:
Step1:首先給出訓練樣本
其中:xi∈Rn,yi∈{-1,+1},i=1,2,…,l,n為樣本空間的維數(shù);
Step 2:選擇合適的核函數(shù)并初始化懲罰參數(shù)C>0;
Step 3:構造最優(yōu)超平面對應的規(guī)劃問題
求解得到α*=(,…)T,其中為對應的訓練樣本的支持向量;
Step 4:計算分類閾值b*,在開區(qū)間(0,C)中選取α*的一個分量,根據(jù)計算
Step 5:由w*和b*構造最優(yōu)超平面(w*·φ(x))+b*=0,這樣得到其對應的最優(yōu)分類面的決策函數(shù)為
其中K(xi·xj)=φ(xi)·φ(xj)為滿足Mercer核定理的核函數(shù)。
核函數(shù)是支持向量機的重要組成部分,支持向量機常用的四種核函數(shù):線性核函數(shù)、多項式核函數(shù)、高斯徑向基核函數(shù)和兩層感知器核函數(shù)[13]。對不同核函數(shù)的支持向量機的訓練結果進行對比,實驗表明,當采用高斯徑向基核函數(shù)和兩層感知器核函數(shù)時,支持向量機的分類效果相當,并且均優(yōu)于采用線性核函數(shù)和多項式核函數(shù)的支持向量機分類效果[14]。由于在實際應用中高斯徑向基核函數(shù)被廣泛的采用,而兩層感知器核函數(shù)的參數(shù)個數(shù)多于高斯徑向基核函數(shù),考慮到后續(xù)遺傳算法優(yōu)化核函數(shù)參數(shù)的復雜度,本文采用高斯徑向基核函數(shù),其中為2個向量間的距離,i=1,2,…,N,j=1,2,…,N,σ為寬度參數(shù),高斯徑向基核函數(shù)參數(shù)。
遺傳算法(Genetic Algorithm,GA)是基于達爾文進化論,在計算機上模擬生命進化機制而發(fā)展起來的搜索最優(yōu)解方法。它根據(jù)“適者生存、優(yōu)勝劣汰”等自然進化規(guī)則來進行搜索計算和問題求解。遺傳算法對于復雜的優(yōu)化問題無需建模和復雜運算,只要利用遺傳算法的三種算子就能得到最優(yōu)解。標準遺傳算法是由染色體的編碼、種群規(guī)模、適應度函數(shù)、遺傳算子構成的[15]。
本文采用的改進遺傳算法(IGA)與標準遺傳算法(GA)的主要差別是在選擇和交叉兩步遺傳操作上。選擇操作中采用了代溝選擇和基于適應度值的重插入,確保當前種群中最適應的個體總是被連續(xù)傳播到下一代;交叉操作中采用可變交叉概率。
基于改進遺傳算法的參數(shù)優(yōu)化過程如圖1所示。具體步驟如下:
Step 1:給定參數(shù)C、g的范圍,并對其進行二進制編碼。
Step 2:適應度評估。采用K-折交叉確認(K-fold Cross Validation)方法評估個體的適應度。
Step 3:設置初始種群數(shù)量,及最大進化代數(shù)。
Step 4:計算群體中各個體的適應度,檢查是否滿足終止條件,若滿足,則結束尋優(yōu);否則轉至Step 5。終止條件為連續(xù)幾代種群不能再進化,最優(yōu)個體的適應度相等或尋優(yōu)達到最大進化代數(shù)。
Step 5:依次執(zhí)行遺傳算子操作。對于選擇操作,使用隨機遍歷抽樣,設置代溝ggap,根據(jù)適應度值從當前種群中選擇m×ggap個個體復制到子代種群中。對于交叉操作,對選擇操作中復制的子代種群進行單點交叉。對于交叉概率,本文采用動態(tài)參數(shù)法,這樣做可以使進化后期優(yōu)化的對象比較容易穩(wěn)定,以減少無用計算。
Step 6:基于適應度值的重插入。由于使用了代溝,子代種群的數(shù)量比當前種群數(shù)量要小,用子代群體中的個體代替當前種群中最不適應的個體?;谶m應度的重插入確保當前種群中m×(1-ggap)個最適應的個體總是被連續(xù)傳播到下一代,并且每一代中不創(chuàng)建比現(xiàn)存種群多的個體,計算次數(shù)減少,內存要求也小。
Step 7:進化代數(shù)加1,檢查是否滿足終止條件,若滿足,則結束尋優(yōu);否則轉至步驟Step 5。
圖1 改進遺傳算法的SVM參數(shù)優(yōu)化流程圖
本文利用ZT-3型汽輪機模擬轉子實驗臺對汽輪機轉子振動的四種典型故障(轉子質量不平衡、轉子動靜碰磨、軸系不對中、支座松動)及無故障進行了模擬實驗,提取175組數(shù)據(jù)進行試驗分析,從中選取100組已知類別的故障樣本進行訓練,其余的75組數(shù)據(jù)作為測試樣本。
為了使SVM訓練和測試時能有效的區(qū)分出各故障類型,給各故障(這里暫且把無故障情況作為一種特殊的故障類型)賦予相應的類標簽,如表1所示。
表1 故障類別與標簽對應關系
本實驗采用“一類對余類法”策略,利用遺傳算法優(yōu)化SVM參數(shù)的模型,對汽輪機各故障進行識別分類。分別采用改進遺傳算法和標準遺傳算法對SVM進行參數(shù)優(yōu)化。IGA和標準GA的參數(shù)設置如下:C、g的范圍為[0,100],二進制編碼長度為20,初始種群數(shù)量m=20,進化最大代數(shù)maxgen=100,變異概率pm=0.002;標準GA的交叉概率pc=0.4;IGA的代溝ggap=0.9,交叉概率的初始值pc=0.4。
圖2給出了由IGA-SVM得到的分類準確率(目標函數(shù))隨進化代數(shù)的變化曲線,可以看出隨著進化代數(shù)的增加,分類準確率趨近于恒定值96%,而此時得到的懲罰因子C為14.1562,核函數(shù)參數(shù)g為2.0975,終止進化代數(shù)為50。圖3給出了由標準GA-SVM得到的分類準確率(目標函數(shù))隨進化代數(shù)的變化曲線,可以看出隨著進化代數(shù)的增加,分類準確率趨近于恒定值90%,而此時得到的懲罰因子C為6.3183,核函數(shù)參數(shù)g為6.0768,終止進化代數(shù)為100。
由圖2和圖3可以看出,IGA-SVM方法進化到50代時連續(xù)幾代最優(yōu)個體的適應度相等,認為種群不能再進化,此時已達到最優(yōu)的優(yōu)化效果;而標準GA-SVM方法進化到了100代,達到了終止進化代數(shù)的條件,有可能沒有達到最優(yōu)的優(yōu)化效果??梢奍GA-SVM方法參數(shù)優(yōu)化的效果明顯優(yōu)于標準GA-SVM方法優(yōu)化的效果。
圖2 IGA-SVM分類準確率隨進化代數(shù)的變化曲線
圖3 標準GA-SVM分類準確率隨進化代數(shù)的變化曲線
表2 IGA-SVM及標準GA-SVM故障識別結果
將IGA-SVM方法與標準GA-SVM方法得出的各故障識別結果進行了對比分析,結果如圖4所示。由圖4可以看出,除無故障情況外,IGA-SVM方法的各故障分類準確率均明顯高于GA-SVM方法,說明利用改進遺傳算法優(yōu)化支持向量機的相關參數(shù)能有效的提高SVM多故障分類能力。
圖4 兩種方法分類準確率比較
針對SVM參數(shù)選取困難的問題,本文采用改進遺傳算法優(yōu)化支持向量機分類模型的相關參數(shù),并將其應用到汽輪機故障診斷中,通過與標準遺傳算法優(yōu)化的支持向量機分類模型比較,表明基于改進遺傳算法優(yōu)化支持向量機的模型能較好的對汽輪機故障樣本進行分類,提高了故障診斷的準確率,對汽輪機故障診斷的實踐有非常顯著的指導作用。
[1]黃保海,李巖,王東風,等.基于KPCA和KFCM集成的汽輪機故障診斷[J].電力自動化設備,2010,30(7):84-86.
[2]侯志花,張超,牛麗瓊,等.基于專家系統(tǒng)的汽輪機振動故障診斷[J].河北省科學院學報,2009,26(3):51-54.
[3]阮躍,徐世昌,黃文虎.汽輪機故障診斷專家系統(tǒng)的知識獲?。跩].中國電力,1997,30(2):11-13.
[4]凌六一,黃友銳,魏圓圓.基于多傳感器信息融合和神經(jīng)網(wǎng)絡的汽輪機故障診斷研究[J].中國電力,2010,43(3):46-50.
[5]陳平,謝志江,歐陽奇.多層傳遞函數(shù)的量子神經(jīng)網(wǎng)絡在汽輪機故障診斷中的應用[J].動力工程,2007,27(4):569-572.
[6]翟永杰,毛繼佩,于麗敏,等.分級聚類支持向量機在汽輪機故障診斷中的應用[J].華北電力大學學報,2003,30(6):25-29.
[7]V N Vapnik.Statistical Learning Theory[M].NY:Wiley,1998:100-105.
[8]肖燕彩,陳秀海,朱衡君.遺傳支持向量機在電力變壓器故障診斷中的應用[J].上海交通大學學報,2007,41(11):1878-1886.
[9]嵇斗,王向軍,張民.基于支持向量機的電路故障診斷模型[J].微計算機信息,2007,23(11):198-200.
[10]田路,田干,張煒,等.基于支持向量機的渦輪泵故障診斷方法研究[J].控制工程,2007,14(S):138-140.
[11]張超,韓璞,唐貴基.基于K-L變換的支持向量機在汽輪機故障診斷中的應用[J].汽輪機技術,2007,49(2):148-150.
[13]Simon Haykin著,申富饒,徐燁,鄭俊,等譯.神經(jīng)網(wǎng)絡與機器學習[M].北京:機械工業(yè)出版社,2011:176-179.
[14]鄭蕊蕊,趙繼印,趙婷婷,等.基于遺傳支持向量機和灰色人工免疫算法的電力變壓器故障診斷[J].中國電機工程學報,2011,31(7):56-63.
[15]張艷秋,王蔚.利用遺傳算法優(yōu)化的支持向量機垃圾郵件分類[J].計算機應用,2009,29(10):2755-2757.