王鶴,姜鴻儒,王振丁
(1. 東北電力大學(xué),吉林 吉林 132012; 2. 國(guó)網(wǎng)山東省電力公司黃島供電公司,山東 青島 266000)
電力變壓器作為電力系統(tǒng)中能量轉(zhuǎn)換、傳輸?shù)暮诵?,能否快速、?zhǔn)確地診斷出變壓器故障,直接影響系統(tǒng)的安全、穩(wěn)定運(yùn)行[1-2]。我國(guó)目前已有較多變壓器在長(zhǎng)期運(yùn)行過(guò)程中出現(xiàn)絕緣老化、材質(zhì)劣化等故障隱患,這將導(dǎo)致發(fā)生事故的概率不斷增加[3]。由此有必要采取合理的方法來(lái)及時(shí)的發(fā)現(xiàn)變壓器潛伏性故障,進(jìn)而預(yù)防和降低事故發(fā)生的概率[4]。
目前,變壓器油中溶解氣體分析法(Dissolved Gas Analysis,DGA)已成為診斷和檢測(cè)變壓器內(nèi)部故障性質(zhì)的重要方法[5]?;贒GA已形成了IEC推薦的三比值法、Rogers法等傳統(tǒng)診斷方法[6-7]。隨著人工智能技術(shù)的發(fā)展,國(guó)內(nèi)外學(xué)者將人工神經(jīng)網(wǎng)絡(luò) (ANN)[6]、貝葉斯分類(lèi)器[8]、極限學(xué)習(xí)機(jī)(ELM)[9]和支持向量機(jī)(SVM)[10]等人工智能算法引入到變壓器故障診斷領(lǐng)域,為電力變壓器故障診斷技術(shù)的發(fā)展提供了新思路。其中,支持向量機(jī)因所需訓(xùn)練樣本數(shù)據(jù)少、泛化能力強(qiáng)等優(yōu)點(diǎn)廣泛應(yīng)用于變壓器故障診斷中[11-12]。文獻(xiàn)[12]利用布谷鳥(niǎo)算法對(duì)SVM的參數(shù)進(jìn)行尋優(yōu),利用優(yōu)化后的SVM模型進(jìn)行變壓器故障判斷。文獻(xiàn)[13]利用建立的快速相關(guān)向量機(jī)多層次分類(lèi)模型減少了模型的訓(xùn)練時(shí)間,并利用量子粒子群算法優(yōu)化了模型參數(shù),提高了診斷的精度。文獻(xiàn)[14]利用多核學(xué)習(xí)向量機(jī)將模型分解為2個(gè)凸優(yōu)問(wèn)題進(jìn)行求解,降低了計(jì)算復(fù)雜度。以上基于SVM的智能算法最終均是以故障類(lèi)型作為診斷的結(jié)果,但是考慮到變壓器結(jié)構(gòu)復(fù)雜,故障現(xiàn)象與故障特征間存在著模糊性,其仍存在誤診斷問(wèn)題。
提出一種基于MCPO模型的變壓器故障診斷方法,其在繼承了SVM優(yōu)點(diǎn)的基礎(chǔ)上,通過(guò)利用Sigmoid函數(shù)實(shí)現(xiàn)SVM的概率輸出,進(jìn)而綜合多個(gè)二分類(lèi)輸出結(jié)果,將模型的求解轉(zhuǎn)化為一個(gè)凸二次規(guī)劃求解問(wèn)題實(shí)現(xiàn)多分類(lèi)概率輸出。該方法能夠判別故障特征是否明確,減少了對(duì)變壓器故障的誤判,仿真結(jié)果驗(yàn)證了基于MCPO模型的變壓器故障診斷方法的有效性。
所建立的基于SVM的MCPO模型是在傳統(tǒng)SVM方法的基礎(chǔ)上,通過(guò)引入Sigmoid函數(shù)將SVM的決策函數(shù)輸出映射為二分類(lèi)概率輸出,進(jìn)而綜合多個(gè)二分類(lèi)輸出結(jié)果,將模型的求解轉(zhuǎn)化為一個(gè)凸二次規(guī)劃求解問(wèn)題實(shí)現(xiàn)多分類(lèi)概率輸出。
支持向量機(jī)的本質(zhì)是在訓(xùn)練樣本數(shù)據(jù)中找出用于構(gòu)造最優(yōu)分類(lèi)超平面的支持向量,在數(shù)學(xué)上可歸結(jié)為求解一個(gè)二次優(yōu)化問(wèn)題[12]。
對(duì)于線(xiàn)性可分的樣本,其可被最優(yōu)分類(lèi)超平面區(qū)分開(kāi),超平面方程為:
ex+f=0,e∈Rn,f∈R
(1)
式中e為超平面法線(xiàn);f為分類(lèi)閾值;n為樣本空間維數(shù)。
設(shè)一組樣本(xi,yi),xi為樣本數(shù)據(jù),yi為樣本類(lèi)別標(biāo)志。最優(yōu)分類(lèi)超平面問(wèn)題的求解可轉(zhuǎn)化為求解帶約束條件的優(yōu)化問(wèn)題:
(2)
式中l(wèi)為訓(xùn)練樣本總數(shù)。
對(duì)于線(xiàn)性不可分的樣本,在約束條件中引入松弛變量βi來(lái)解決分類(lèi)誤差問(wèn)題,則約束條件可表示為:
yie·xi+f≥1-βii=1,2,…,l
(3)
由此可得到線(xiàn)性不可分時(shí)的最優(yōu)分類(lèi)面,其可表示為如式(4)所示的優(yōu)化問(wèn)題:
(4)
式中C(C>0)為懲罰參數(shù),其作用是控制對(duì)錯(cuò)分樣本的懲罰程度。
利用拉格朗日函數(shù)求解上述優(yōu)化問(wèn)題:
(5)
式中ai為拉格朗日乘子。
對(duì)于非線(xiàn)性問(wèn)題,SVM通過(guò)引入核函數(shù)實(shí)現(xiàn)某一非線(xiàn)性變換后的線(xiàn)性分類(lèi)。文中采用RBF作為模型的核函數(shù):
(6)
式中σ為RBF函數(shù)寬度參數(shù)。
則SVM的分類(lèi)決策函數(shù)為:
(7)
采用文獻(xiàn)[15]的方法利用Sigmoid函數(shù)將g(x)映射在區(qū)間[0,1],則概率輸出表達(dá)式:
(8)
式中a,b為Sigmoid函數(shù)的待定參數(shù)。
Sigmoid函數(shù)的參數(shù)a,b可通過(guò)最小化交叉熵誤差函數(shù)獲得,其求解模型可表示為:
(9)
其中:
(10)
式中M是樣本類(lèi)型為yi=1的樣本個(gè)數(shù);M′是樣本類(lèi)型為yi=-1的樣本個(gè)數(shù)。
式(10)可利用牛頓法獲得最優(yōu)解,即令G(a,b)的梯度矩陣等于0時(shí)的解為最優(yōu)解。G(a,b)的梯度矩陣如式(11)所示。
(11)
獲得參數(shù)a,b后,則可利用Sigmoid函數(shù)將g(x)映射成概率輸出形式。對(duì)于一個(gè)二分類(lèi)問(wèn)題,利用式(8)可獲得x屬于某一類(lèi)(w或v類(lèi))的概率估計(jì)swv:
(12)
電力變壓器的故障類(lèi)型眾多,其診斷的過(guò)程應(yīng)屬于多分類(lèi)問(wèn)題。一個(gè)m分類(lèi)的問(wèn)題應(yīng)該綜合考慮1/2m(m-1)個(gè)二分類(lèi)SVM的結(jié)果,進(jìn)而將其swv綜合為多分類(lèi)的概率輸出,則x為每一類(lèi)的概率pw可表示為:
(13)
利用文獻(xiàn)[16]給出的從二分類(lèi)概率得到多分類(lèi)概率的方法實(shí)現(xiàn)多分類(lèi)的概率輸出??紤]有:
(14)
即:
swv/svw≈pw/pv
(15)
對(duì)上式進(jìn)行變換并求和:
(16)
利用式(16)求解以下模型進(jìn)而獲得pw:
(17)
上述模型的求解可轉(zhuǎn)化為求解一個(gè)凸二次規(guī)劃問(wèn)題:
(18)
當(dāng)滿(mǎn)足式(19)時(shí),其獲得最優(yōu)解。
(19)
式中e=[1,1, …,1]T,pT=[p1,p2, …,pm]?;赟VM的MCPO模型構(gòu)建流程見(jiàn)圖1。
MCPO模型的輸入為(x,y),其中x是DGA數(shù)據(jù)中H2、CH4、C2H6、C2H4、C2H2這五種氣體含量,分別記作x1、x2、x3、x4、x5,則特征向量x=(x1、x2、x3、x4、x5);特征向量y為故障類(lèi)型,所考慮的故障類(lèi)型如表1所示。
圖1 MCPO模型構(gòu)建流程
序號(hào)故障類(lèi)型簡(jiǎn)稱(chēng)樣本數(shù)1熱故障t<300 ℃T1502熱故障300 ℃
MCPO模型的輸出為(pT1,pT2,pT3,pPD,pD1,pD2),pT1,pT2,pT3,pPD,pD1,pD2分別代表變壓器的狀態(tài)為T(mén)1,T2,T3,PD,D1,D2的概率??紤]到DGA數(shù)據(jù)中各氣體含量存在較大差異,將各種溶解氣體含量換算為[0,1]范圍內(nèi)的相對(duì)含量,按照式(20)對(duì)DGA數(shù)據(jù)進(jìn)行歸一化處理。
(20)
式中xiq為第i個(gè)樣本第q類(lèi)故障氣體的含量。
所提出的MCPO模型,其參數(shù)(C,σ)的選擇對(duì)提高故障診斷的準(zhǔn)確率至關(guān)重要。因此,采用網(wǎng)格搜索的方法,對(duì)訓(xùn)練樣本集進(jìn)行交叉驗(yàn)證,并選擇其中準(zhǔn)確率最高的一組(C,σ)作為模型的參數(shù)。同時(shí),實(shí)現(xiàn)概率輸出還要形成Sigmoid函數(shù)的參數(shù)訓(xùn)練集,同樣利用交叉驗(yàn)證的方法形成Sigmoid函數(shù)的參數(shù)訓(xùn)練集(gi,yi)。獲得最優(yōu)參數(shù)的流程如下:
(1)給定參數(shù)(C,σ);
(2)將樣本隨機(jī)分成k個(gè)互不相交的子集,每次選擇一個(gè)子集作為測(cè)試集,其他作為訓(xùn)練集;
(3)訓(xùn)練SVM,計(jì)算驗(yàn)證集gi;
(4)k個(gè)子集交叉驗(yàn)證形成Sigmoid函數(shù)的訓(xùn)練集(gi,yi),訓(xùn)練Sigmoid函數(shù)的參數(shù)a,b;
(5)計(jì)算全部swv,得到多分類(lèi)概率估計(jì)pw,若完成對(duì)所有子集的計(jì)算,則計(jì)算交叉驗(yàn)證的準(zhǔn)確率。否則,返回到第二步。
(1)數(shù)據(jù)處理,歸一化輸入特征向量,形成訓(xùn)練、測(cè)試集樣本;
(2)確定最優(yōu)參數(shù)(C,σ);
(3)利用最優(yōu)參數(shù)訓(xùn)練SVM及Sigmoid函數(shù)的參數(shù)a、b,進(jìn)而獲得診斷模型;
(4)應(yīng)用診斷模型對(duì)測(cè)試樣本進(jìn)行故障診斷。
選擇了270組已確定故障類(lèi)型的DGA數(shù)據(jù)進(jìn)行研究,并將樣本數(shù)據(jù)按2∶1比例分為訓(xùn)練集和測(cè)試集。模型參數(shù)(C,σ)分別在取值范圍[2-15,2-14,…,214,215],[2-7,2-6,…,26,27]內(nèi)以指數(shù)增長(zhǎng)方式獲取。將訓(xùn)練樣本分為5組進(jìn)行交叉驗(yàn)證,得到的最優(yōu)參數(shù)為(2-1,23)。表2列舉了10組測(cè)試樣本的DGA數(shù)據(jù)。表3給出了MCPO模型的診斷結(jié)果。
表2 測(cè)試樣本DGA數(shù)據(jù)
由表2可知,MCPO模型的診斷結(jié)果是變壓器的狀態(tài)為每類(lèi)故障的概率。如果將概率最大作為判斷故障類(lèi)型的依據(jù),基于MCPO模型的故障診斷正確率為90%??紤]到上述方法在故障特征不明顯(樣本故障分類(lèi)概率相差較小)的情況時(shí)存在一定的誤判,因此本文進(jìn)一步對(duì)診斷判據(jù)進(jìn)行研究。
利用MCPO模型的故障診斷數(shù)據(jù),提出基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)。其中,Pm=max{p1、p2、p3、p4、p5、p6},ε為{p1、p2、p3、p4、p5、p6}的標(biāo)準(zhǔn)差。為了能夠方便的說(shuō)明Pm和ε的意義,對(duì)測(cè)試樣本進(jìn)行分類(lèi)。分類(lèi)原則如下:如果MCPO模型的診斷結(jié)果中概率最大的故障為實(shí)際故障,則樣本標(biāo)記為Rh,若不是樣本標(biāo)記為Rl。
由表2、表3可知,依據(jù)上述分類(lèi)原則樣本3屬于Rh,此時(shí)Pm=83.79%,ε=0.301。樣本4屬于Rl,此時(shí)Pm=43.17%,ε=0.15。結(jié)果表明,故障特征顯著的樣本,Pm和ε的取值較大;故障特征不顯著的樣本,Pm和ε的取值較小。
表4給出了基于上述分類(lèi)原則,所有測(cè)試樣本的分類(lèi)結(jié)果。
表3 模型診斷結(jié)果
表4 測(cè)試樣本分類(lèi)結(jié)果
表4中,Pmax-z和εz為Pm和ε的平均值。由表4可知,樣本集Rh中Pmax-z和εz的值均大于樣本集Rl中的值。以上分析結(jié)果表明,故障特征明顯的樣本,樣本故障分類(lèi)概率相差較大,Pm、ε取值較大;故障特征不明顯的樣本,樣本故障分類(lèi)概率較為接近,Pm、ε取值較小。因此,可以利用Pm和ε表征樣本的故障特征是否顯著。計(jì)算了所有測(cè)試集的Pm和ε,計(jì)算結(jié)果見(jiàn)圖2。
圖2 Pm、ε計(jì)算結(jié)果
由圖2可知,對(duì)于故障特征不明確的樣本主要分布在Pm<0.6和ε<0.25的區(qū)域中。因此,本文給出判斷標(biāo)準(zhǔn)為Pm=0.6和ε=0.25,即認(rèn)為Pm<0.6且ε<0.25的樣本為故障特征不明確的樣本,對(duì)于這類(lèi)樣本需要利用MCPO模型的診斷結(jié)果針對(duì)可能存在的故障做出相應(yīng)的校正措施。
表5列舉了采用SVM方法和MCPO方法對(duì)同樣的樣本進(jìn)行故障診斷得到的結(jié)果。
表5 不同診斷方法的比較
由表5可知,故障特征顯著的樣本利用SVM方法和MCPO方法都能有效的辨別故障類(lèi)型;故障特征不顯著的樣本,利用SVM方法會(huì)導(dǎo)致誤診斷,而MCPO方法可利用基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)有效的辨識(shí)故障特征不顯著的樣本,對(duì)于這類(lèi)樣本,可參考概率較大的兩三個(gè)故障類(lèi)型進(jìn)行相應(yīng)的校正措施,彌補(bǔ)了傳統(tǒng)SVM方法在辨別故障特征不明確的樣本時(shí)會(huì)導(dǎo)致誤診斷的問(wèn)題。
提出的基于多分類(lèi)概率輸出模型的變壓器故障診斷方法分類(lèi)效果較好,并能夠提供概率信息。針對(duì)故障特征不明確的樣本,可參考概率較大的兩三個(gè)故障類(lèi)型進(jìn)行相應(yīng)的校正措施,進(jìn)而降低了對(duì)變壓器故障的誤判。通過(guò)仿真分析驗(yàn)證了基于最大概率Pm和標(biāo)準(zhǔn)差ε的兩種故障診斷判據(jù)的有效性,為進(jìn)一步開(kāi)展合理的校正措施提供了一定的依據(jù)。