鄧燕山, 趙凱利, 呂文超, 白杰, 董杰, 高嶺
(國(guó)網(wǎng)冀北電力有限公司唐山供電公司, 河北 唐山 063000)
溶解氣體分析法(DGA)是診斷電力變壓器故障的常見(jiàn)方法[1]。DGA的原理是故障電力變壓器在熱應(yīng)力和電應(yīng)力作用下,其油紙絕緣層會(huì)分解出可溶解的氣體,通過(guò)氣體分析可以診斷變壓器的故障類(lèi)型[2]。本文將使用深度神經(jīng)網(wǎng)絡(luò)算法(DNN)對(duì)溶解氣體數(shù)據(jù)進(jìn)行挖掘分析,以實(shí)現(xiàn)變壓器故障的自動(dòng)分類(lèi)。
DNN需要大量數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)。為了降低對(duì)高可用性數(shù)據(jù)的依賴(lài),本研究將使用杜瓦爾三角法生成模擬DGA數(shù)據(jù),并將其應(yīng)用于DNN訓(xùn)練中。為了證明DNN在電力變壓器故障診斷應(yīng)用中的有效性和性能,本文針對(duì)分類(lèi)準(zhǔn)確性將DNN與隨機(jī)森林分類(lèi)算法(RFC)、K最近鄰分類(lèi)算法(KNN)進(jìn)行了對(duì)比測(cè)試。
KNN算法是簡(jiǎn)單的且廣泛使用的監(jiān)督聚類(lèi)算法之一。其主要思想是通過(guò)數(shù)據(jù)點(diǎn)之間距離的計(jì)算,實(shí)現(xiàn)對(duì)未分類(lèi)的數(shù)據(jù)進(jìn)行分類(lèi)。k是最近數(shù)據(jù)點(diǎn)的數(shù)量。對(duì)于每個(gè)未分類(lèi)的點(diǎn),該算法將計(jì)算其與k個(gè)最近的數(shù)據(jù)點(diǎn)之間的距離,如圖1所示。
圖1 KNN算法
如果k設(shè)置為3,則未知點(diǎn)將歸為B類(lèi),因?yàn)槿齻€(gè)最近點(diǎn)中的兩個(gè)屬于B類(lèi);如果k設(shè)置為7,則未知點(diǎn)將屬于A類(lèi),因?yàn)閷儆贏類(lèi)的點(diǎn)最近。
KNN算法通常會(huì)產(chǎn)生一致的結(jié)果,并且計(jì)算過(guò)程較簡(jiǎn)單[3]。但是,該算法的效率會(huì)隨著數(shù)據(jù)量的增大而大幅下降[4]。
RFC是一種監(jiān)督聚類(lèi)算法。該分類(lèi)算法由多個(gè)決策樹(shù)組成,這些決策樹(shù)用于對(duì)未分類(lèi)的數(shù)據(jù)集進(jìn)行分類(lèi)。每個(gè)決策樹(shù)都是一個(gè)分類(lèi)器。如果有N個(gè)訓(xùn)練數(shù)據(jù),則在訓(xùn)練過(guò)程中,隨機(jī)替換M個(gè)訓(xùn)練數(shù)據(jù)(M 神經(jīng)網(wǎng)絡(luò)是從生物神經(jīng)元結(jié)構(gòu)衍生而來(lái)的抽象和簡(jiǎn)化模型。通常,神經(jīng)網(wǎng)絡(luò)模型由輸入層、隱藏層和輸出層組成。每層中的節(jié)點(diǎn)都模仿神經(jīng)元,節(jié)點(diǎn)之間使用不同的權(quán)重進(jìn)行連接[7]。 神經(jīng)網(wǎng)絡(luò)算法的過(guò)程包括輸入數(shù)據(jù)正向傳播和誤差反向傳播。在正向傳播中,原始數(shù)據(jù)從輸入層傳輸?shù)诫[藏層,隱藏層使用激活函數(shù)提取數(shù)據(jù)的特征。激活函數(shù)的目的是通過(guò)加權(quán)輸入的非線性組合產(chǎn)生非線性決策邊界。輸出層完成分類(lèi)過(guò)程[8]。在誤差反向傳播中,該算法利用監(jiān)督的分類(lèi)結(jié)果并修改神經(jīng)元連接的權(quán)重[9]。 DNN由多個(gè)隱藏層組成,如圖2所示。 圖2 神經(jīng)網(wǎng)絡(luò) 每個(gè)層都應(yīng)提取不同級(jí)別的數(shù)據(jù)特征。分類(lèi)器包含兩個(gè)隱藏層。輸入層的激活函數(shù)為tanh,兩個(gè)隱藏層的激活函數(shù)為ReLU,輸出層的激活功能為SoftMax。 tanh函數(shù)將實(shí)數(shù)值映射到[-1,1]范圍,如圖3所示。 圖3 tanh函數(shù)圖形 ReLU函數(shù)的計(jì)算式為f(x)=max(0,x),如圖4所示。 圖4 ReLU函數(shù)圖形 與tanh函數(shù)相比,ReLU函數(shù)的優(yōu)點(diǎn)之一是極大地加快了隨機(jī)梯度下降的收斂速度[10]。因此,將兩個(gè)隱藏層的激活函數(shù)選擇為ReLU。Softmax(歸一化指數(shù)函數(shù))函數(shù)[11]的計(jì)算式為式(1)。 (1) σ(z)是輸出向量,zj是輸入向量z的元素,如圖5所示。 圖5 Softmax函數(shù)圖形 在反向傳播過(guò)程中,本研究使用Adam優(yōu)化方法更新網(wǎng)絡(luò)權(quán)重。相對(duì)于隨機(jī)梯度下降優(yōu)化方法,Adam優(yōu)化方法可以根據(jù)梯度的第一和第二矩的估計(jì)來(lái)計(jì)算不同參數(shù)的單獨(dú)學(xué)習(xí)率。經(jīng)驗(yàn)結(jié)果表明,Adam優(yōu)化方法在實(shí)踐中比隨機(jī)梯度下降方法效果更好[12]。 常見(jiàn)的分析變壓器油中所溶解氣體的方法有關(guān)鍵氣體法、Rogers比率法、Doernenburg比率法和杜瓦爾三角法[13-14]。通過(guò)338個(gè)油樣的對(duì)比試驗(yàn)表明,與其他溶解氣體分析方法相比,杜瓦爾三角方法具有最高的一致性。 因此,在本研究中隨機(jī)生成大量的氣體化合物百分比數(shù)據(jù),并使用杜瓦爾三角法生成相應(yīng)的故障類(lèi)型。這些模擬數(shù)據(jù)分為用于深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。杜瓦爾三角分析法如圖6所示。 圖6 杜瓦爾三角 杜瓦爾三角故障區(qū)域如表1所示。 表1 杜瓦爾三角故障區(qū) 實(shí)驗(yàn)首先是隨機(jī)生成包含三種氣體的數(shù)量的1 000個(gè)數(shù)據(jù)點(diǎn)的數(shù)據(jù)集,并使用杜瓦爾三角方法確定相應(yīng)的故障類(lèi)型。從故障變壓器歷史數(shù)據(jù)得出的最小值和最大值邊界,以確保所生成的數(shù)據(jù)樣本落在經(jīng)驗(yàn)值邊界之內(nèi)。三種溶解氣體為CH4、C2H2和C2H4,它們各自的百分比為三種氣體占?xì)怏w總量的比例。由于某些故障類(lèi)型的發(fā)生概率較低,本實(shí)驗(yàn)將七種故障類(lèi)型組合為五種:低能放電(D1和PD)、高能放電(D2)、最高700℃的發(fā)熱故障(T1、T2)、高于700℃發(fā)熱故障(T3)以及熱電故障(DT)。每個(gè)樣本的故障類(lèi)型編碼都為0到4之間的整數(shù),如表2所示。 表2 故障編碼 為了測(cè)試數(shù)據(jù)大小的影響,實(shí)驗(yàn)采用生成的數(shù)據(jù)集的子集的方式來(lái)形成其他數(shù)據(jù)集。具體而言,創(chuàng)建分別具有350、700和1000個(gè)數(shù)據(jù)點(diǎn)的三個(gè)數(shù)據(jù)集。對(duì)于這三個(gè)數(shù)據(jù)集的每一個(gè),將80%的數(shù)據(jù)點(diǎn)用作訓(xùn)練數(shù)據(jù)集,并將其余的數(shù)據(jù)點(diǎn)(20%)用作測(cè)試數(shù)據(jù)集。實(shí)施的DNN模型的每一層中的節(jié)點(diǎn)數(shù)分別為256、126、32和5。實(shí)驗(yàn)首先以10-3的學(xué)習(xí)率訓(xùn)練網(wǎng)絡(luò),然后將其更改為10-5進(jìn)行測(cè)試。深度神經(jīng)網(wǎng)絡(luò)的參數(shù)如表3所示。 表3 DNN參數(shù) 基于表3指定參數(shù),深度神經(jīng)網(wǎng)絡(luò)模型(DNN)在具有1 000個(gè)數(shù)據(jù)點(diǎn)的數(shù)據(jù)集上實(shí)現(xiàn)了99.68%的精度。實(shí)驗(yàn)還使用相同的數(shù)據(jù)集測(cè)試了KNN和RFC。KNN算法的準(zhǔn)確率為97%,而RFC為97.65%。 為了檢查數(shù)據(jù)大小對(duì)準(zhǔn)確性的影響,實(shí)驗(yàn)采用了三種不同大小的數(shù)據(jù)集,這三個(gè)實(shí)驗(yàn)過(guò)程的準(zhǔn)確性如表4所示。 表4 每種故障類(lèi)型與整體精度的準(zhǔn)確性比較 從表4可以看出,隨著數(shù)據(jù)點(diǎn)數(shù)量的增加,實(shí)驗(yàn)的準(zhǔn)確性都會(huì)提高。實(shí)驗(yàn)結(jié)果可以總結(jié)如下:(1) 數(shù)據(jù)集越大,每種方法在電力變壓器故障識(shí)別應(yīng)用中的總體精度就越高;(2) 測(cè)試結(jié)果表明,與KNN和RFC方法相比,DNN具有更高的識(shí)別準(zhǔn)確性。 本文使用DNN來(lái)識(shí)別變壓器的故障類(lèi)型。在本研究的實(shí)驗(yàn)中隨機(jī)生成數(shù)據(jù)點(diǎn),并使用杜瓦爾三角法確定用于監(jiān)督學(xué)習(xí)的故障類(lèi)型。DNN被設(shè)計(jì)為具有四層的網(wǎng)絡(luò)結(jié)構(gòu),其激活函數(shù)分別是Tanh、ReLU和SoftMax。權(quán)重更新使用Adam優(yōu)化器。試驗(yàn)結(jié)果表明,與KNN和RFC相比,DNN在識(shí)別變壓器故障類(lèi)型方面具有更高的準(zhǔn)確性。1.3 深度學(xué)習(xí)網(wǎng)絡(luò)
2 采用杜瓦爾三角生成仿真數(shù)據(jù)
3 實(shí)驗(yàn)驗(yàn)證
4 總結(jié)