李啟迪,黃治翰,汪 晗,劉 闖
(1.國(guó)網(wǎng)湖北省電力有限公司荊門(mén)供電公司,湖北 荊門(mén) 448000; 2.國(guó)網(wǎng)湖北省電力有限公司鄂州供電公司,湖北 鄂州 436000)
隨著經(jīng)濟(jì)的快速發(fā)展,中國(guó)電網(wǎng)結(jié)構(gòu)日益復(fù)雜,變壓器是電力系統(tǒng)的核心設(shè)備,承擔(dān)著電力交換和能量傳輸?shù)闹匾巧?,保障變壓器安全穩(wěn)定運(yùn)行尤為重要[1]。大型變壓器結(jié)構(gòu)復(fù)雜,安全隱患較多且不易發(fā)現(xiàn),如何快速準(zhǔn)確地找出變壓器的潛在隱患,建立有效的數(shù)學(xué)模型,提高變壓器故障診斷工作的準(zhǔn)確性,對(duì)于制定科學(xué)合理的檢修計(jì)劃和減少變壓器的非計(jì)劃停運(yùn),具有非常重要的意義。
目前,變壓器故障診斷已成為研究的熱點(diǎn),針對(duì)變壓器故障診斷方法,專(zhuān)家學(xué)者們提出了不同的觀點(diǎn)。文獻(xiàn)[2]將遺傳算法的慣性權(quán)重因子、變異算子引入標(biāo)準(zhǔn)粒子群算法,對(duì)標(biāo)準(zhǔn)粒子群算法進(jìn)行改進(jìn),并用改進(jìn)粒子群算法對(duì)小波神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,建立了變壓器診斷模型,仿真結(jié)果表明,該方法提高了變壓器故障診斷的精度。文獻(xiàn)[3]采用差分進(jìn)化算法對(duì)BP(back propagation)神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化,利用優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)對(duì)變壓器進(jìn)行了故障診斷,取得了較好的診斷結(jié)果。但神經(jīng)網(wǎng)絡(luò)對(duì)樣本容量的要求較高,通常樣本容量越大,神經(jīng)網(wǎng)絡(luò)的應(yīng)用效果越好。對(duì)于小樣本數(shù)據(jù),支持向量機(jī)(support vector machine,SVM)的優(yōu)勢(shì)更明顯,文獻(xiàn)[4]提出了一種采用帝國(guó)殖民競(jìng)爭(zhēng)算法優(yōu)化SVM的變壓器故障診斷方法,該方法雖然得到了一定的應(yīng)用,但計(jì)算精度有待進(jìn)一步提高。文獻(xiàn)[5]對(duì)變壓器油中溶解氣體的特征量進(jìn)行優(yōu)選后建立了基于遺傳算法(genetic algorithm,GA)優(yōu)化SVM的變壓器故障診斷模型,提高了變壓器故障診斷的精度,但由于遺傳算法存在早熟及不收斂的現(xiàn)象,因此SVM的參數(shù)尋優(yōu)方法還有待進(jìn)一步改進(jìn)。
針對(duì)現(xiàn)有變壓器診斷方法中存在的不足,采用改進(jìn)遺傳算法對(duì)SVM的懲罰因子和徑向基核函數(shù)參數(shù)進(jìn)行優(yōu)化,以變壓器油中溶解氣體成分為輸入量,故障類(lèi)型編碼為輸出量,建立基于改進(jìn)遺傳算法優(yōu)化SVM的變壓器故障診斷模型,并用算例分析驗(yàn)證所提變壓器診斷方法的正確性。
20世紀(jì)90年代,數(shù)學(xué)家Vapnik在統(tǒng)計(jì)學(xué)理論的基礎(chǔ)上提出了一種新的機(jī)器學(xué)習(xí)方法——SVM,SVM的思想是將低維空間中的樣本映射到高維空間,在高維空間構(gòu)造最優(yōu)超平面,完成對(duì)樣本的分類(lèi)和回歸[6]。
SVM最初的目的是解決二分類(lèi)問(wèn)題,而變壓器故障診斷屬于典型的多分類(lèi)問(wèn)題,因此需要將該多分類(lèi)問(wèn)題分解為多個(gè)二分類(lèi)SVM問(wèn)題。1-v-1多分類(lèi)SVM的中心思想是把任意兩類(lèi)數(shù)據(jù)在1個(gè)子分類(lèi)器中進(jìn)行訓(xùn)練,此時(shí)類(lèi)別數(shù)目為n的樣本需要構(gòu)造n(n-1)/2個(gè)SVM子分類(lèi)器,每個(gè)子分類(lèi)器的訓(xùn)練數(shù)據(jù)只來(lái)自與之相關(guān)的兩類(lèi),測(cè)試時(shí),測(cè)試數(shù)據(jù)分別帶入n(n-1)/2個(gè)SVM 子分類(lèi)器中進(jìn)行測(cè)試,并對(duì)各類(lèi)別的得分進(jìn)行統(tǒng)計(jì),得分最高的那一類(lèi)即為測(cè)試數(shù)據(jù)所屬的類(lèi)別。
1-v-1多分類(lèi)SVM的優(yōu)點(diǎn)是訓(xùn)練速度快;缺點(diǎn)是當(dāng)樣本的類(lèi)別數(shù)目較多時(shí),子分類(lèi)器數(shù)量迅速增加導(dǎo)致計(jì)算時(shí)間過(guò)長(zhǎng),降低分類(lèi)精度。變壓器故障類(lèi)別通常分為高溫過(guò)熱、中溫過(guò)熱、低溫過(guò)熱、高能放電和低能放電等5種,即決策屬性數(shù)量為5,數(shù)量相對(duì)較少,只需要構(gòu)造10個(gè)子分類(lèi)器,不會(huì)增加太多計(jì)算量,也能保證正確率,因此采用1-v-1多分類(lèi)SVM進(jìn)行變壓器故障診斷。
遺傳算法是一種常用的優(yōu)化算法,其實(shí)質(zhì)是模擬生物遺傳進(jìn)化[7]。在算法進(jìn)化初期,由于初始種群是隨機(jī)給定的,初始種群可能存在少量適應(yīng)度較好的個(gè)體,這些個(gè)體在GA進(jìn)化過(guò)程中可能會(huì)被重復(fù)選擇,導(dǎo)致它們的子代在進(jìn)化后的種群中占據(jù)了主導(dǎo)地位,經(jīng)過(guò)交叉和變異后,得到的后代仍與父本相同或相近,從而使GA出現(xiàn)早熟的現(xiàn)象。在算法進(jìn)化后期,種群中個(gè)體的適應(yīng)度值相對(duì)穩(wěn)定,相互之間的多樣性大大降低,導(dǎo)致算法收斂緩慢甚至不收斂。為了避免出現(xiàn)早熟和不收斂的現(xiàn)象,對(duì)GA的交叉概率和突變概率進(jìn)行動(dòng)態(tài)設(shè)定,形成改進(jìn)遺傳算法(improved genetic algorithm,IGA),IGA的交叉概率和突變概率的設(shè)定方法如下:
(1)
(2)
式中:pc為交叉概率,pc,min為突變概率的最小值,fi為個(gè)體i的適應(yīng)度值,favg為種群中所有個(gè)體的平均適應(yīng)度值,N為種群容量,pc,a為交叉概率調(diào)節(jié)參數(shù),pm為突變概率,pm,max為突變概率的最大值,pm,a為突變概率調(diào)節(jié)參數(shù)。
在進(jìn)化初期,種群中個(gè)體適應(yīng)度較差,個(gè)體之間差距不大,IGA通過(guò)增大交叉概率,使優(yōu)秀個(gè)體能夠盡快顯示出來(lái),縮小最優(yōu)解的搜索范圍;相反在進(jìn)化后期,種群中個(gè)體適應(yīng)度普遍較好,相互之間差異不大,IGA通過(guò)增大突變概率,增強(qiáng)種群局部搜索能力,快速找到最優(yōu)解,加快算法收斂。
研究表明,SVM具有所需樣本少、分類(lèi)效果好等優(yōu)點(diǎn),但其計(jì)算精度受懲罰參數(shù)C和徑向基核函數(shù)寬度σ的影響很大,采用交叉驗(yàn)證獲取最優(yōu)參數(shù)的計(jì)算量太大,因此采用IGA對(duì)SVM的C和σ進(jìn)行優(yōu)化,建立基于IGA優(yōu)化SVM的變壓器故障診斷模型,對(duì)變壓器進(jìn)行故障診斷。
根據(jù)1-v-1多分類(lèi)SVM原理,以油中溶解氣體成分為輸入量,故障類(lèi)型編碼為輸出量,建立變壓器故障診斷模型,建模流程如圖1所示,具體建模步驟如下:
1)對(duì)樣本數(shù)據(jù)進(jìn)行歸一化,以減小數(shù)據(jù)之間量綱的影響,公式為
(3)
式中:xi為某一特征量;xmax為該特征量的最大值;xmin為該特征量的最小值。
2)對(duì)IGA的相關(guān)參數(shù)進(jìn)行初始化,確定編碼方式、種群規(guī)模、突變概率最小值、交叉概率最大值及最大迭代次數(shù)。
3)對(duì)SVM的相關(guān)參數(shù)進(jìn)行初始化,設(shè)置C和σ的初始值和搜索范圍。
4)在C和σ的搜索范圍內(nèi),利用IGA展開(kāi)搜索,然后把初始解分別帶入各SVM故障診斷模型中,計(jì)算初始解的診斷正確率,即初始適應(yīng)度值。診斷正確率(適應(yīng)度值)的計(jì)算式為
(4)
式中:χj為第j類(lèi)故障的故障率;pj為第j類(lèi)故障的樣本總量;qj為第j類(lèi)故障診斷錯(cuò)誤的樣本個(gè)數(shù)。
5)執(zhí)行迭代過(guò)程,每完成一次迭代,根據(jù)式(4)計(jì)算適應(yīng)度值,判斷個(gè)體適應(yīng)度值是否滿足迭代終止條件,若已達(dá)到最大迭代次數(shù),則解碼獲得適應(yīng)度值對(duì)應(yīng)的最優(yōu)個(gè)體;否則,繼續(xù)迭代。
6)執(zhí)行選擇、交叉和突變等操作,產(chǎn)生新一代種群,返回步驟5),重新執(zhí)行迭代。
7)判斷迭代后的結(jié)果能否滿足尋優(yōu)及迭代次數(shù)的要求,若是,則結(jié)束計(jì)算,輸出最優(yōu)適應(yīng)度值對(duì)應(yīng)的C和σ即為全局最優(yōu)解;否則,返回步驟5)。
8)將步驟7)中的全局最優(yōu)解賦值給SVM變壓器故障診斷模型,即可對(duì)變壓器進(jìn)行故障診斷。
圖1 IGA優(yōu)化SVM的變壓器故障診斷流程
變壓器發(fā)生故障時(shí),其絕緣油中會(huì)溶解一定量的H2、CH4、C2H6、C2H4和C2H2等氣體,可以根據(jù)絕緣油中溶解氣體的含量對(duì)變壓器故障類(lèi)型進(jìn)行判斷。該文收集了100組運(yùn)行條件和容量相同變壓器油中溶解氣體數(shù)據(jù)及相應(yīng)的故障類(lèi)型(高溫過(guò)熱、中溫過(guò)熱、低溫過(guò)熱、高能放電和低能放電各20組),部分?jǐn)?shù)據(jù)如表1所示。將100樣本數(shù)據(jù)劃分為測(cè)試集和訓(xùn)練集,訓(xùn)練集數(shù)據(jù)用于模型訓(xùn)練,測(cè)試集數(shù)據(jù)用于檢驗(yàn)?zāi)P偷姆诸?lèi)精度,訓(xùn)練集和測(cè)試集的樣本容量均為50,訓(xùn)練集和測(cè)試集各有10組不同故障類(lèi)型的樣本。為了便于計(jì)算,對(duì)變壓器的5種故障類(lèi)型進(jìn)行編碼,具體如表2所示。
表1 變壓器故障數(shù)據(jù)
表2 變壓器故障類(lèi)型編碼
在Matlab軟件中進(jìn)行仿真分析,利用訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,分別采用GA和IGA對(duì)SVM的懲罰因子C和徑向基核函數(shù)參數(shù)σ進(jìn)行參數(shù)尋優(yōu),設(shè)置C的尋優(yōu)范圍為[1,100],σ的尋優(yōu)范圍設(shè)置為[0,1],C和σ的初值分別設(shè)置為100和1。IGA參數(shù)設(shè)置如下:種群規(guī)模為30,突變概率最小值為0.5,交叉概率最大值為0.05,最大迭代次數(shù)kmax=30。GA參數(shù)設(shè)置如下:突變概率為0.7、交叉概率為0.04,其他參數(shù)與IGA相同。IGA與GA迭代尋優(yōu)過(guò)程如圖2所示,由圖2可知,相比GA,IGA找到全局最優(yōu)解所需的迭代次數(shù)更少、計(jì)算精度更高。
圖2 改進(jìn)PSO與PSO算法迭代尋優(yōu)過(guò)程
2種算法找到最優(yōu)解需要的迭代次數(shù)、最大適應(yīng)度值及收斂時(shí)間如表3所示。
表3 2種算法尋優(yōu)結(jié)果對(duì)比
由表3可知,IGA只需12次迭代就找到了全局最優(yōu)解,最大適應(yīng)度值為0.98,收斂時(shí)間為4.92×10-3s,均優(yōu)于GA。由此可見(jiàn),改進(jìn)遺傳算法能夠有效減少迭代次數(shù),加快算法收斂,提高計(jì)算精度。
利用訓(xùn)練好的IGA-SVM變壓器故障診斷模型和GA-SVM變壓器故障診斷模型分別對(duì)測(cè)試集數(shù)據(jù)進(jìn)行故障診斷,IGA-SVM模型和GA-SVM模型的診斷結(jié)果分別如圖3和圖4所示,2種方法故障診斷結(jié)果的正確率如表4所示。
圖3 IGA-SVM故障診斷模型診斷結(jié)果
綜合分析圖3、圖4和表4可知,IGA-SVM變壓器故障診斷模型的診斷結(jié)果存在2個(gè)錯(cuò)誤,一個(gè)是將中溫過(guò)熱誤診斷為低溫過(guò)熱,另一個(gè)是將低溫過(guò)熱誤診斷為中溫過(guò)熱。中溫過(guò)熱和低溫過(guò)熱診斷正確率為90%,其余故障類(lèi)型診斷正確率均為100%,綜合正確率為96%。出現(xiàn)誤診斷的原因可能是這兩組氣體成分可能處于中溫過(guò)熱和低溫過(guò)熱邊界條件的附近,造成誤判。而GA-SVM變壓器故障診斷模型的診斷結(jié)果共有7個(gè)錯(cuò)誤,5種故障類(lèi)型的診斷正確率依次為90%、80%、90%、80%和90%,綜合正確率僅為86%。診斷錯(cuò)誤的原因除了邊界條件外,最大的可能是GA在尋優(yōu)過(guò)程中容易陷入局部極值。由此可見(jiàn),IGA優(yōu)化的SVM變壓器故障診斷模型的診斷效果更好、分類(lèi)正確率更高。
圖4 GA-SVM故障診斷模型診斷結(jié)果
表4 2種方法故障診斷結(jié)果的正確率
采用動(dòng)態(tài)設(shè)定交叉、突變概率的方式對(duì)遺傳算法進(jìn)行改進(jìn),以提高算法的收斂速度和計(jì)算精度。應(yīng)用改進(jìn)遺傳算法對(duì)SVM的懲罰因子和徑向基核函數(shù)參數(shù)進(jìn)行優(yōu)化,以變壓器油中溶解氣體成分為輸入量,故障類(lèi)型編碼為輸出量,建立了基于IGA-SVM的變壓器故障診斷模型。采用實(shí)際變壓器故障數(shù)據(jù)進(jìn)行仿真分析,結(jié)果表明,IGA-SVM模型診斷結(jié)果綜合正確率高達(dá)96%,驗(yàn)證了模型的正確性和實(shí)用性。