馮志亮, 肖涵麒, 任文鳳, 杜艷麗
(北華大學(xué)電氣與信息工程學(xué)院,吉林 吉林 132021)
變壓器是電力系統(tǒng)中最重要的設(shè)備之一,承擔(dān)輸電、配電樞紐的重任,其安全穩(wěn)定運(yùn)行與生產(chǎn)生活息息相關(guān),一旦發(fā)生故障,會(huì)帶來許多不利的影響。因此,明確變壓器的故障類型,以便對變壓器進(jìn)行故障處理,對電力系統(tǒng)的安全穩(wěn)定運(yùn)行具有十分重要的意義。
變壓器在發(fā)生不同故障時(shí),高溫、放電作用于變壓器的絕緣油,會(huì)產(chǎn)生不同種類的氣體,變壓器的溶解氣體分析方法(DGA)[1]已經(jīng)成為研究變壓器故障的重要手段。變壓器DGA故障診斷的方式有常規(guī)方法和人工智能方法,常規(guī)方法包括特征氣體法和三比值法等[2]。特征氣體法無法全面反映變壓器的故障類型,三比值法存在編碼缺失的情況,在一定程度上降低了診斷正確率。近年來,機(jī)器學(xué)習(xí)和人工智能技術(shù)的發(fā)展,為變壓器故障診斷技術(shù)提供了新的研究方向,模糊理論[3]、神經(jīng)網(wǎng)絡(luò)[4]、貝葉斯分類器、支持向量機(jī)[5]等人工智能方法的應(yīng)用都在特定情況下發(fā)揮了很好的作用。文獻(xiàn)[6]利用布谷鳥優(yōu)化算法對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,使神經(jīng)網(wǎng)絡(luò)算法易陷入局部最優(yōu)、收斂困難的問題得到了改善。但神經(jīng)網(wǎng)絡(luò)算法還存在收斂速度慢、系統(tǒng)相對復(fù)雜、易過擬合等缺點(diǎn),文獻(xiàn)[7]采用蝙蝠優(yōu)化算法對LS-SVM參數(shù)進(jìn)行優(yōu)化,能更好地處理局部極值和提高泛化能力,但核參數(shù)和懲罰因子的選取限制了SVM的分類能力,致使故障診斷準(zhǔn)確率不能達(dá)到一個(gè)比較好的效果。
針對上述問題,本文提出了基于海鷗優(yōu)化算法(seagulls optimization algorithm, SOA)的支持向量機(jī)故障診斷方法,先用PCA方法[8]對選取的多維氣體特征數(shù)據(jù)進(jìn)行降維處理,將故障數(shù)據(jù)的維數(shù)遞減,然后用SOA方法對SVM的核參數(shù)和懲罰因子這兩個(gè)參數(shù)進(jìn)行優(yōu)化,使之貼合實(shí)際故障分類,最后和傳統(tǒng)PSO-SVM優(yōu)化效果進(jìn)行比較,確定海鷗算法優(yōu)化支持向量機(jī)進(jìn)行變壓器故障診斷具有較強(qiáng)的泛化能力和較高的準(zhǔn)確率。
油浸式變壓器中的絕緣油是一種含有多種碳?xì)浠旌匣鶊F(tuán)的混合物,當(dāng)變壓器發(fā)生故障時(shí),在高溫、放電等條件作用下各種碳?xì)浠鶊F(tuán)的化學(xué)鍵會(huì)發(fā)生斷裂,裂解產(chǎn)生各種烴類氣體混入變壓器油中,目前對變壓器油的研究處理已成為一個(gè)熱門領(lǐng)域。
經(jīng)過對變壓器故障的統(tǒng)計(jì)分析,發(fā)現(xiàn)過熱故障和放電故障是變壓器發(fā)生的主要故障,而H2、CH4、C2H6、C2H4、C2H2是與這兩類故障相關(guān)的主要特征氣體,所以就利用這5種特征氣體對變壓器的故障進(jìn)行判斷。
使用傳統(tǒng)的 H2、CH4、C2H6、C2H4、C2H25 種故障特征氣體作為DGA輸入變量,會(huì)出現(xiàn)局部最優(yōu)的問題,這5種特征變量所包含的故障信息不完整,導(dǎo)致故障診斷準(zhǔn)確率較低,所以在改良三比值法 C2H2/C2H4、CH4/H2、C2H4/C2H6三維故障數(shù)據(jù)的基礎(chǔ)上,擴(kuò)充到16維故障數(shù)據(jù),再加上原先的H2、CH4、C2H6、C2H4、C2H2五維特征數(shù)據(jù),可以有效地提升故障診斷的準(zhǔn)確率,多維故障特征數(shù)據(jù)如表1所示。
表1 多維故障特征數(shù)據(jù)比值
5種氣體濃度的絕對含量,用S1到S5表示;10種氣體濃度的相對含量,用S6到S15表示;以及六種氣體和總烴TH(CH4+C2H6+C2H4+C2H2)的比值用S16-S21表示。
針對21維數(shù)據(jù)維數(shù)較多的問題,本文采用主成分分析法(PCA)對DGA數(shù)據(jù)降維,并生成新的綜合變量。累積方差貢獻(xiàn)率法(CPV)如下式所示:
其中PVi為方差貢獻(xiàn)率,。將這21個(gè)故障特征作為輸入變量,計(jì)算它們的累積可解釋性方差比例,結(jié)果如圖1所示。
圖1 累積可解釋性方差貢獻(xiàn)率
根據(jù)圖1中所示的累積可解釋性方差貢獻(xiàn)率可知,當(dāng)降維后的故障特征維數(shù)為7時(shí),方差貢獻(xiàn)率可以達(dá)到95%以上,之后的方差貢獻(xiàn)率趨于平穩(wěn),所以本文所用的PCA降維維數(shù)選擇為7。
輸入變量為上述7維變量特征數(shù)據(jù),選取低能放電故障(D1)、高能放電故障(D2)、正常狀態(tài)(N)、局部放電故障(PD)、低溫過熱故障(T1)、中溫過熱故障(T2)和高溫過熱故障(T3)7種變壓器故障類別作為輸出變量,分類編碼見表2。
表2 故障類型分類編碼
DGA數(shù)據(jù)有其本身的特點(diǎn),一是同一種氣體在量值上差異很大;二是這種分布并不均勻,往往大量樣本分布在較小的區(qū)間上,而少量樣本分布在較大的區(qū)間上;三是不同的類型的故障樣本數(shù)量差異較大,有的故障類型數(shù)據(jù)量較多,有的故障類型數(shù)據(jù)量較少,所以要對這些故障數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,使之達(dá)到較好的分類效果。
傳統(tǒng)的數(shù)據(jù)預(yù)處理方法有歸一化和標(biāo)準(zhǔn)化。表3為數(shù)據(jù)歸一化、數(shù)據(jù)標(biāo)準(zhǔn)化和對數(shù)標(biāo)準(zhǔn)化的預(yù)處理結(jié)果對比。
表3 不同數(shù)據(jù)預(yù)處理形式下的診斷效果
1)歸一化
2)標(biāo)準(zhǔn)化
其中μ和σ分別表示樣本數(shù)據(jù)的均值和標(biāo)準(zhǔn)差。
3)對數(shù)標(biāo)準(zhǔn)化
綜上,本文選用對數(shù)標(biāo)準(zhǔn)化對數(shù)據(jù)進(jìn)行預(yù)處理,可以對數(shù)據(jù)量級差異較大的情況進(jìn)行量級壓縮,既可以盡量保留數(shù)據(jù)原有信息,又可以減少數(shù)據(jù)的量級差異,加快訓(xùn)練速度。
為了驗(yàn)證故障特征在PCA降維后對支持向量機(jī)的故障診斷的改善作用,將傳統(tǒng)方法與PCA降維后的故障數(shù)據(jù)作為輸入變量,用支持向量機(jī)進(jìn)行故障診斷,得出經(jīng)過PCA降維后的故障數(shù)據(jù)的診斷準(zhǔn)確率和診斷時(shí)間有較為明顯的改善,實(shí)驗(yàn)結(jié)果如表4所示。
表4 PCA降維前后診斷對比
支持向量機(jī)(SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的新型學(xué)習(xí)機(jī),是結(jié)構(gòu)風(fēng)險(xiǎn)最小化方法的近似實(shí)現(xiàn),適用于小樣本數(shù)據(jù),通過某種非線性映射,將輸入變量x升維到高維空間z,使在低維空間難以線性可分的輸入變量在高維空間易于構(gòu)造一個(gè)最優(yōu)超平面,將樣本數(shù)據(jù)分為正例和負(fù)例兩個(gè)分類,并使之與最優(yōu)超平面的間隔最大[9],最優(yōu)超平面的示意圖如圖2所示。SVM 具有求解速度快、泛化能力強(qiáng)等優(yōu)點(diǎn),從而被廣泛地應(yīng)用在許多領(lǐng)域中。
圖2 支持向量機(jī)超平面分類示意圖
尋找最優(yōu)超平面的過程,可以將其表示為一個(gè)二次規(guī)劃問題,如下式所示:
標(biāo)準(zhǔn)SVM是二分類線性模型,而故障診斷是多分類模型,本文采用一對一的多分類支持向量機(jī)進(jìn)行故障診斷,不會(huì)使計(jì)算量增加太多,而且保持比較高的分類準(zhǔn)確率,并引入徑向基核函數(shù)(RBF)向高維空間映射,表達(dá)式如下:
根據(jù)文獻(xiàn)[10-12]中收集到的變壓器故障數(shù)據(jù),共188組樣本數(shù)據(jù),如表5所示。
表5 變壓器故障樣本
用支持向量機(jī)對故障數(shù)據(jù)進(jìn)行仿真分析,用網(wǎng)格搜索法對SVM的核參數(shù)和懲罰因子進(jìn)行參數(shù)尋優(yōu),其中懲罰因子的搜索范圍為[0.001,120]共30個(gè)搜索間隔,核參數(shù)的搜索范圍為:[0.001,50]共30個(gè)搜索范圍,形成一個(gè)30×30的搜索網(wǎng)格。參數(shù)尋優(yōu)的效果圖如圖3所示,由網(wǎng)格搜索法可得到核參數(shù)和懲罰因子的最優(yōu)值分別為:2.472、109.245,故障診斷準(zhǔn)確率為84.31%。
圖3 SVM參數(shù)尋優(yōu)示意圖
海鷗是最常見的海鳥之一,群居生活。海鷗最重要的特征是遷徙和覓食,遷徙時(shí)每只海鷗朝著最佳位置方向前進(jìn),以獲取豐富的食物資源,海鷗經(jīng)常以螺旋形態(tài)攻擊其他鳥類,其行為如圖4所示。
圖4 海鷗遷徙和攻擊行為示意圖
根據(jù)文獻(xiàn)[13],可知海鷗優(yōu)化算法的數(shù)學(xué)原理為:
1)遷徙
遷徙時(shí),該算法模仿海鷗從一個(gè)位置飛到另一個(gè)位置,在遷徙過程中,海鷗群應(yīng)該滿足3個(gè)條件。
避免碰撞:為了不與其他海鷗發(fā)生碰撞,在計(jì)算海鷗的新位置時(shí)添加附加變量A。
最佳位置方向:海鷗在避免與其他同類發(fā)生碰撞的同時(shí),會(huì)向最佳位置的方向前進(jìn)。
靠近最佳位置:海鷗向著最佳位置方向前進(jìn),到達(dá)新的位置。
其中Ds(t)就是海鷗的新位置。
2)攻擊(局部搜索)
海鷗在遷徙的時(shí)候通過翅膀和體重保持適當(dāng)?shù)母叨龋圆粩喔淖児魰r(shí)的角度和速度。當(dāng)海鷗在覓食攻擊獵物的時(shí)候,以螺旋形方式進(jìn)行移動(dòng),海鷗的攻擊位置式子可得:
通過對海鷗算法的理論分析,可以將變壓器故障診斷尋優(yōu)的過程歸納為以下步驟:
步驟一:從發(fā)表的文獻(xiàn)和資料中搜集有確切結(jié)論的變壓器故障數(shù)據(jù),將5種氣體分?jǐn)?shù)特征和16種比值特征共21維特征數(shù)據(jù)作為輸入變量。
步驟二:對步驟一處理后的輸入變量進(jìn)行對數(shù)標(biāo)準(zhǔn)化處理,減少數(shù)據(jù)的離散程度,再經(jīng)過PCA降維,將21維數(shù)據(jù)降為7維數(shù)據(jù)。然后將這些故障數(shù)據(jù)按照7∶3的比例分為互不相交兩部分,分別為訓(xùn)練集和測試集,并對故障類型進(jìn)行編號(hào)處理。
步驟三:采用海鷗優(yōu)化算法對支持向量機(jī)的參數(shù)進(jìn)行尋優(yōu),選擇出支持向量機(jī)達(dá)到最高準(zhǔn)確率時(shí)的參數(shù)C和g,確定故障診斷模型。
步驟四:將測試集數(shù)據(jù)輸入到最佳參數(shù)確定的故障診斷模型中,對所建立的故障診斷模型的分類性能進(jìn)行測試和評估。變壓器故障診斷的流程圖如圖5所示。
圖5 變壓器故障診斷流程圖
從發(fā)表的文獻(xiàn)和資料中收集到343個(gè)樣本數(shù)據(jù),按照7∶3的比例將樣本數(shù)據(jù)分為240個(gè)訓(xùn)練集樣本數(shù)據(jù)和103個(gè)測試集樣本數(shù)據(jù),使用海鷗優(yōu)化算法優(yōu)化支持向量機(jī)參數(shù)的變壓器故障診斷,算法優(yōu)化出的最優(yōu)參數(shù)組合Bestc和Bestg分別為:297.191和0.998。從訓(xùn)練集樣本數(shù)據(jù)和測試集樣本數(shù)據(jù)中分別隨機(jī)選擇出40個(gè)樣本,其實(shí)際故障與預(yù)測故障對比如圖6所示。
圖6 PSO-SVM樣本診斷示意圖
在本次仿真實(shí)驗(yàn)中,訓(xùn)練集的準(zhǔn)確率達(dá)到了94.17%。從圖7的測試集樣本混淆矩陣中可以看出,測試集樣本有103個(gè),其中94個(gè)樣本正確分類,測試集樣本分類準(zhǔn)確率為:91.26%,達(dá)到了較好的分類效果。
圖7 測試集樣本混淆矩陣
在本次實(shí)驗(yàn)中,表現(xiàn)效果不佳的低能放電故障,故障診斷正確率為83.33%,有兩個(gè)低能放電故障分別被分類為局部放電和高溫故障。低溫過熱故障和高溫過熱故障的診斷正確率分別為87.50%和88.89%,而高能放電故障、中溫過熱故障、局部放電故障和正常狀態(tài)的診斷正確率都達(dá)到了90%以上,其中局部放電故障和正常狀態(tài)的診斷正確率都達(dá)到了100%,如表6所示。
表6 決策模型診斷實(shí)例
文獻(xiàn)[14]提出了一種基于改進(jìn)人工蜂群優(yōu)化支持向量機(jī)(IABC-SVM)的故障診斷方法,該方法通過種群初始化和食物源更新的改進(jìn)實(shí)現(xiàn)了收斂性的提高。為了驗(yàn)證本文方法的尋優(yōu)能力,將本文方法與IABC-SVM方法進(jìn)行比較。將種群數(shù)量設(shè)置為20,最大迭代次數(shù)為100,優(yōu)化得到的C和g的參數(shù)分別為12.106和5.645,IABC-SVM測試集的診斷正確率為90.29%。本文方法的測試集故障診斷正確率達(dá)到了91.26%,本文方法與IABC-SVM方法相比,診斷正確率有了提高。并且通過圖8中兩種方法的適應(yīng)度曲線可以看出,本文方法的收斂速度較快,可以通過較少的迭代達(dá)到收斂狀態(tài),收斂性能得到提高。
圖8 IABC-SVM與SOA-SVM適應(yīng)度曲線
為了驗(yàn)證基于SOA-SVM的變壓器故障診斷方法的可行性和有效性,分別利用遺傳算法GA、粒子群PSO這兩種常用的參數(shù)優(yōu)化方法和神經(jīng)網(wǎng)絡(luò)算法對變壓器故障進(jìn)行診斷,故障樣本數(shù)據(jù)采用上文所用的343個(gè)樣本。采用文獻(xiàn)[15]提出的QPSO算法優(yōu)化支持向量機(jī)參數(shù),QPSO相關(guān)參數(shù)設(shè)置為:種群規(guī)模為100,種群權(quán)重系數(shù)為0.8,迭代次數(shù)為100次;GA相關(guān)參數(shù)設(shè)置為:種群規(guī)模為200,變異概率為0.01,交叉概率為0.6,進(jìn)化迭代次數(shù)為300次;神經(jīng)網(wǎng)絡(luò)算法使用4層網(wǎng)絡(luò),使用L1正則化。
將以上三種優(yōu)化方法分別對變壓器故障進(jìn)行診斷,對這三種算法選取40個(gè)測試集樣本,其實(shí)際故障與預(yù)測故障對比如圖9所示。
圖9 各優(yōu)化算法故障診斷分類模型
使用QPSO-SVM算法的故障診斷率為86.41%,使用GA-SVM方法的故障診斷率達(dá)到了85.43%,使用神經(jīng)網(wǎng)絡(luò)模型的正確率為82.52%,而采用本文所使用的SOA-SVM算法的故障診斷正確率達(dá)到91.26%,與以上幾種算法相比,準(zhǔn)確率分別提高了4.85%、5.83%、8.74%,其診斷結(jié)果如表7所示。仿真結(jié)果表明,在測試樣本中采用SOA-SVM方法的故障診斷正確率高于其他三種方法,該方法的診斷結(jié)果與實(shí)際故障具有較高的一致性,驗(yàn)證了本文提出的優(yōu)化算法對于變壓器故障診斷的有效性,也從側(cè)面反映出SOA-SVM具有較強(qiáng)的全局尋優(yōu)能力。
表7 診斷結(jié)果比較
本文提出了基于SOA-SVM算法的變壓器故障診斷方法,對傳統(tǒng)變壓器特征氣體分?jǐn)?shù)做了進(jìn)一步處理,與傳統(tǒng)溶解氣體分析法相比,增加了16個(gè)氣體比值變量,使采集到的變壓器的故障信息更加具體完整,并且使用海鷗優(yōu)化算法優(yōu)化支持向量機(jī)的參數(shù),提高了支持向量機(jī)的泛化能力和故障診斷準(zhǔn)確性,有效解決了傳統(tǒng)支持向量機(jī)訓(xùn)練大規(guī)模樣本數(shù)據(jù)容易造成“維數(shù)災(zāi)難”的問題。并將本文所提出的方法與傳統(tǒng)QPSO-SVM、GA-SVM以及神經(jīng)網(wǎng)絡(luò)故障診斷方法進(jìn)行比較。結(jié)果表明,本文方法對支持向量機(jī)核參數(shù)和懲罰因子的參數(shù)尋優(yōu)方面的故障準(zhǔn)確率有明顯的優(yōu)勢,克服了其他方法容易陷入局部最優(yōu)的缺點(diǎn),提高了全局搜索能力。根據(jù)仿真實(shí)例,本文方法對變壓器故障診斷的正確率達(dá)到了91.26%,高于其他傳統(tǒng)算法,證明了基于海鷗算法優(yōu)化支持向量機(jī)在變壓器故障診斷過程中的有效性,能夠?qū)ψ儔浩鞴收献龀鲚^為精確的診斷,具有較強(qiáng)的泛化能力,并且具備一定的研究價(jià)值和工程應(yīng)用價(jià)值。