楊 梅
在冶金行業(yè)中,變壓器作為電氣設(shè)備的樞紐,其運(yùn)行情況直接影響整個(gè)電力系統(tǒng)的安全。對(duì)變壓器進(jìn)行故障檢測(cè),對(duì)于提高電力系統(tǒng)的可靠性有著重要意義。對(duì)變壓器故障進(jìn)行識(shí)別,及時(shí)發(fā)現(xiàn)變壓器內(nèi)部故障的性質(zhì)和未來(lái)發(fā)展趨勢(shì),準(zhǔn)確掌握變壓器的運(yùn)行狀況,也是制定變壓器維護(hù)措施和檢修計(jì)劃的重要依據(jù)。目前廣泛使用的氣體色譜分析法是檢測(cè)變壓器內(nèi)部故障性質(zhì)的重要方法[1]。
支持向量機(jī)是一種以小樣本統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ)發(fā)展起來(lái)的新型通用學(xué)習(xí)方法,有效地解決了小樣本、高維數(shù)、非線(xiàn)性等的學(xué)習(xí)問(wèn)題,并克服了人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)難以確定合理結(jié)構(gòu)和存在局部最優(yōu)的缺點(diǎn),大大地提高了學(xué)習(xí)方法的泛化能力。目前支持向量機(jī)已經(jīng)廣泛應(yīng)用于手寫(xiě)字體識(shí)別[2]、人臉識(shí)別[3]、遙感圖像分類(lèi)[4]等領(lǐng)域,并取得了良好的效果。本文將支持向量機(jī)引入變壓器故障診斷中,提出了基于多分類(lèi)支持向量機(jī)的變壓器故障診斷方法,對(duì)變壓器故障進(jìn)行分類(lèi),以達(dá)到設(shè)備狀態(tài)監(jiān)測(cè)的目的。
支持向量機(jī)方法在處理非線(xiàn)性問(wèn)題時(shí),將輸入空間通過(guò)特定的函數(shù)進(jìn)行非線(xiàn)性映射,將原輸入空間變換到高維特征空間;然后,在高維空間中根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則尋找最大間隔最優(yōu)線(xiàn)性分類(lèi)超平面。此超平面對(duì)應(yīng)著原輸入空間的非線(xiàn)性分類(lèi)面,分類(lèi)后將高維空間的最優(yōu)線(xiàn)性分類(lèi)超平面做逆映射,從而得到原輸入空間的非線(xiàn)性分類(lèi)面。支持向量分類(lèi)器只涉及到向量間(原輸入空間或變換后的空間)的內(nèi)積運(yùn)算,因此,可以很好地應(yīng)用核函數(shù)的方法來(lái)解決高維空間中的維數(shù)災(zāi)難問(wèn)題,減少計(jì)算量。
最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LS-SVM)則是在標(biāo)準(zhǔn)支持向量機(jī)的一種擴(kuò)展。它采用最小二乘線(xiàn)性系統(tǒng)誤差平方和作為損失函數(shù)[5],將求解過(guò)程變成了解一組等式方程,提高了求解速度,減少了計(jì)算資源。在原始空間的最小二乘支持向量機(jī)分類(lèi)問(wèn)題描述為:
定義拉格朗日函數(shù):
其中,αi∈R,根據(jù)優(yōu)化條件
消除ω和ε后,得到矩陣方程:
定義 Ω=ZZT=[qij]l×l,根據(jù) Mercer[6]條件,該矩陣的元素可以表示為:
求解上述問(wèn)題后可得到最優(yōu)分類(lèi)函數(shù)如下:
假定高維特征空間的內(nèi)積函數(shù)為:
稱(chēng)上式的內(nèi)積函數(shù)為核函數(shù)。只要一種核函數(shù)k(xi,xj)滿(mǎn)足Mercer條件它就對(duì)應(yīng)某一變換空間中的內(nèi)積。
本文選用高斯徑向基函數(shù),如式(8)所示:
其中,σ≠0為方差。由此可知,待優(yōu)化的變量包括核參數(shù)σ和正則化參數(shù)γ。
電力變壓器故障識(shí)別對(duì)象最常見(jiàn)的有4種狀態(tài):電力變壓器的高能放電、低能放電、過(guò)熱和正常狀態(tài)?;诙喾诸?lèi)支持向量機(jī)的電力變壓器故障識(shí)別過(guò)程,包括變壓器故障狀態(tài)的特征提取、訓(xùn)練和測(cè)試。
變壓器故障診斷是個(gè)多分類(lèi)問(wèn)題,而支持向量機(jī)適用于二分類(lèi)問(wèn)題,因此,采用支持向量機(jī)解決變壓器故障診斷問(wèn)題時(shí),就需要將多分類(lèi)問(wèn)題轉(zhuǎn)化為二分類(lèi)問(wèn)題。
通常通過(guò)構(gòu)造多個(gè)二分類(lèi)器,將一個(gè)多分類(lèi)問(wèn)題轉(zhuǎn)化為多個(gè)二分類(lèi)問(wèn)題。處理多分類(lèi)問(wèn)題時(shí),最小輸出編碼相對(duì)于其他編碼方式所需計(jì)算時(shí)間最短[7]。因此,本文采用最小輸出編碼方式解決多分類(lèi)問(wèn)題。
已知多分類(lèi)問(wèn)題的樣本類(lèi)別數(shù)為C。當(dāng)采用最小輸出編碼方式解決多分類(lèi)問(wèn)題時(shí),對(duì)于C類(lèi)問(wèn)題需要的二分類(lèi)器數(shù)為能表示C的最小二進(jìn)制數(shù)的位數(shù)。在支持向量機(jī)的參數(shù)優(yōu)化問(wèn)題中,為減少計(jì)算量,不需要對(duì)每個(gè)子二分類(lèi)支持向量機(jī)的超參數(shù)都進(jìn)行選擇,而是通過(guò)最小輸出編碼方法的編碼和解碼過(guò)程把個(gè)二分類(lèi)機(jī)作為一個(gè)整體,形成一個(gè)多分類(lèi)支持向量機(jī)。
由上可知,支持向量機(jī)需要選擇的超參數(shù)為σ和γ,根據(jù)仿真優(yōu)化問(wèn)題模型,直接利用支持向量機(jī)分類(lèi)后的結(jié)果,通過(guò)計(jì)算分類(lèi)正確率來(lái)表示個(gè)體的適應(yīng)度,具體表示如下:
其中,m為遺傳算法中的種群規(guī)模,本文中3.2章節(jié)有詳細(xì)介紹。
通過(guò)獨(dú)立輸出編碼方法得到的多分類(lèi)支持向量機(jī)模型的性能采用正確率(theAccuracyRate,AR)作為評(píng)價(jià)指標(biāo),記為:
其中,yi為實(shí)際值,為模型預(yù)測(cè)輸出,l為樣本數(shù)。表示分類(lèi)結(jié)果,分類(lèi)正確為1,反之為0。
遺傳算法[8](GeneticAlgorithms,GA)是基于生物界的自然選擇和自然遺傳機(jī)制的基本思想形成的一類(lèi)優(yōu)化方法。由于它采用群體搜索和基于交叉算子、變異算子實(shí)現(xiàn)群體中個(gè)體之間的信息交換,使其具有隱含并行性,大大提高了搜索的效率,同時(shí)克服了傳統(tǒng)優(yōu)化方法對(duì)于目標(biāo)函數(shù)有連續(xù)、可微的要求。因此,遺傳算法在實(shí)際問(wèn)題中得到了廣泛應(yīng)用。
遺傳算法中,描述和評(píng)價(jià)待優(yōu)化問(wèn)題中的每個(gè)解,以及實(shí)現(xiàn)選擇、交叉、變異等進(jìn)化操作是算法的核心問(wèn)題。
遺傳算法中,搜索空間中的每個(gè)解都是通過(guò)以一定編碼方式表示的個(gè)體加以描述的。因此,合理的編碼方式是保證后續(xù)進(jìn)化操作的基礎(chǔ)。目前,常用的編碼方式有二進(jìn)制編碼、實(shí)數(shù)編碼等。本章中,支持向量分類(lèi)模型中的超參數(shù)通常為實(shí)數(shù),因此,采用實(shí)數(shù)編碼方式描述待優(yōu)化參數(shù)σ和γ,記個(gè)體為 x=(γ,σ)。
選擇算子根據(jù)種群中個(gè)體的適應(yīng)度,按照一定的規(guī)則,從第t代種群中選擇出較優(yōu)勢(shì)個(gè)體遺傳到下一代種群。目前,常用的選擇算子有輪盤(pán)賭選擇、聯(lián)賽選擇、精英保留選擇等選擇方法。本章中,為保證每代的最優(yōu)個(gè)體進(jìn)入下一代種群,采用隨機(jī)聯(lián)賽選擇和最優(yōu)個(gè)體保留方法相結(jié)合的方法選擇算子,具體操作如下。
第一步:從當(dāng)前種群中選出具有最高適應(yīng)度值的個(gè)體和具有最低適應(yīng)度值的個(gè)體。如果當(dāng)前種群中最優(yōu)個(gè)體適應(yīng)度大于保留集中的最優(yōu)個(gè)體適應(yīng)度,則將當(dāng)前種群中的最優(yōu)個(gè)體保存在保留集中,作為新的保留集最優(yōu)個(gè)體;同時(shí),用保留集最優(yōu)個(gè)體替代當(dāng)前種群中的最差個(gè)體。
第二步:從種群中隨機(jī)選取N(N=2)個(gè)個(gè)體,比較其適應(yīng)度大??;并將具有較大適應(yīng)度的個(gè)體遺傳到下一代種群中。
第三步:將上述過(guò)程重復(fù)m次,得到下一代種群的m個(gè)個(gè)體。這里,m為種群規(guī)模。
交叉算子是將種群中隨機(jī)配對(duì)的個(gè)體,以某一概率對(duì)二者進(jìn)行基因重組。針對(duì)不同編碼方式的個(gè)體,有多種不同的交叉算子。目前,常用的交叉算子包括實(shí)數(shù)編碼的算數(shù)交叉,二進(jìn)制編碼的單點(diǎn)交叉、多點(diǎn)交叉等。本章中,鑒于個(gè)體采用實(shí)數(shù)編碼方式,所以采用算術(shù)交叉。
算術(shù)交叉就是將兩個(gè)個(gè)體通過(guò)線(xiàn)性組合,生成兩個(gè)新個(gè)體。針對(duì)個(gè)體xa(t)和xb(t),以交叉概率Pc運(yùn)用算術(shù)交叉后產(chǎn)生的新個(gè)體是:
其中,g為[0,1]之間的常數(shù)。
變異操作就是對(duì)種群中的某些個(gè)體,以某一概率改變其某一個(gè)或某一些基因位上的取值。該操作對(duì)于提高算法的搜索能力具有重要作用。針對(duì)不同編碼方式的個(gè)體,有多種不同的變異算子。目前,常用的變異算子包括實(shí)數(shù)編碼的非均勻變異,二進(jìn)制編碼的單點(diǎn)變異、多點(diǎn)變異等。本章中,考慮到個(gè)體采用實(shí)數(shù)編碼方式,所以采用非均勻變異算子。
非均勻變異算子就是以變異概率Pm隨機(jī)對(duì)個(gè)體中某一變量值進(jìn)行非均勻變異。例如:假設(shè)變異前后的個(gè)體分別為。若發(fā)生變異的變量 γ 的取值范圍為[γmin,γmax],那么非均勻變異操作記為:
其中,△(t,e)(e 代表 γmax-γ 或 γ-γmin)表示[0,e]范圍內(nèi)符合非均勻分布的一個(gè)隨機(jī)數(shù)。
本文分析的基礎(chǔ)是利用色譜分析得到的各種特征氣體(包括 H2、CH4、C2H6、C2H4和 C2H2等)含量信息,它反映了電力變壓器的高能放電、低能放電、過(guò)熱和正常4種狀態(tài)的特征信息,這些數(shù)據(jù)都是絕對(duì)值數(shù)據(jù),每個(gè)測(cè)試數(shù)據(jù)都是由反映這些特征氣體含量的n+1個(gè)分量[9]組成(n由實(shí)際情況決定)。為方便進(jìn)行訓(xùn)練和識(shí)別,需要對(duì)檢測(cè)出的特征氣體含量進(jìn)行預(yù)處理,以得到變壓器故障識(shí)別需要的各種特征量,組成的訓(xùn)練樣本具體如下。
(1)n種特征氣體的相對(duì)含量:
其中,cn為第n種特征氣體的絕對(duì)含量。
(2)反映各組測(cè)試數(shù)據(jù)之間橫向比較信息的一個(gè)特征量,它通過(guò)下式得到:
這樣就得到了n+1個(gè)特征量,組成一個(gè)n+1維的特征向量 X=[x1x2x3…xnxn+1]T,該特征向量反映了識(shí)別高能放電、低能放電、過(guò)熱和正常4種變壓器狀態(tài)需要的各種特征信息。
將特征向量作為多分類(lèi)支持向量機(jī)的輸入對(duì)模型進(jìn)行訓(xùn)練,4類(lèi)問(wèn)題需要的二分類(lèi)器數(shù)為2個(gè)。根據(jù)實(shí)際情況,將訓(xùn)練好的支持向量機(jī)用于測(cè)試。
本文將遺傳算法與支持向量機(jī)結(jié)合,提出了一種基于遺傳算法的支持向量分類(lèi)超參數(shù)選擇方法。進(jìn)一步將遺傳算法優(yōu)化得到的參數(shù)應(yīng)用到多分類(lèi)支持向量機(jī)模型中,針對(duì)電力變壓器故障識(shí)別問(wèn)題,利用氣體色譜分析法采集數(shù)據(jù),并對(duì)采集的數(shù)值進(jìn)行預(yù)處理得到特征值,對(duì)多分類(lèi)支持向量機(jī)進(jìn)行訓(xùn)練和識(shí)別,判斷輸出變壓器所處的狀態(tài),預(yù)測(cè)設(shè)備的未來(lái)發(fā)展趨勢(shì),降低故障發(fā)生率。
參考文獻(xiàn):
[1]孫才新,郭俊峰,鄭海平等.基于行為的變壓器油色譜分析模糊診斷專(zhuān)家系統(tǒng)研究.電工技術(shù)學(xué)報(bào),2001,16(3):49-53.
[2]張 凱,王建平.基于混合核函數(shù)的脫機(jī)手寫(xiě)漢字識(shí)別.計(jì)算機(jī)與數(shù)字工程,2007(12):25-27.
[3].賈云得.機(jī)器視覺(jué).科學(xué)出版社,2000.
[4]Yi-nan Guo, Mei Yang,Da-wei Xiao.The Selection Method for Hyper-parameters of Support Vector Classification by Chaotic Cultural Algorithm.International Journal of Intelligent Computing and Cybernetics,2010,3(3):449-462.
[5]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法:支持向量機(jī).北京:科學(xué)出版社,2004.
[6]方瑞明.支持向量機(jī)理論及其應(yīng)用分析.北京:中國(guó)電力出版社,2007.
[7]陳小娟.支持向量機(jī)及其在多屬性決策中的應(yīng)用.西安電子科技大學(xué),2008.
[8]Yi-nan Guo,Da-wei Xiao,Mei Yang.Genetic Algorithm-Based Support Vector Classification Method for Multispectral Remote Sensing Image,Lecture Notes in Computer Science.2010.6328:213-221.
[9]呂干云,程浩忠,董立新,等.基于多級(jí)支持向量機(jī)分類(lèi)器的電力變壓器故障識(shí)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2005,17(1):19-22.