張蒙,朱永利,賈亞飛,張寧,張媛媛
(新能源電力系統(tǒng)國家重點實驗室(華北電力大學(xué)),河北保定071003)
局部放電是變壓器安全運行的主要威脅之一。局部放電既是變壓器絕緣老化的原因,又是絕緣老化的表現(xiàn)形式[1]。局部放電的檢測和識別是變壓器在線監(jiān)測和故障診斷的重要組成部分[2]。識別局部放電類型有利于了解設(shè)備的絕緣狀態(tài),制定合理的檢修計劃。
局部放電的分類本質(zhì)上是模式識別的問題。近些年,國內(nèi)外的學(xué)者這個領(lǐng)域做了大量的工作,許多方法如神經(jīng)網(wǎng)絡(luò)[3-5]、支持向量機(jī)[6-8]、聚類算法[9-11]以及貝葉斯分類[12-13]等都已經(jīng)應(yīng)用局部放電類型的識別中。然而,這些算法也存在著各種的問題。神經(jīng)網(wǎng)絡(luò)分類器的網(wǎng)絡(luò)結(jié)構(gòu)要靠先驗知識確定,且易出現(xiàn)過學(xué)習(xí),欠學(xué)習(xí)和局部極小值等問題。支持向量機(jī)是基于VC維和結(jié)構(gòu)風(fēng)險最小化的統(tǒng)計學(xué)習(xí)方法,非常適合于處理非線性、小樣本的數(shù)據(jù)分類問題。但是支持向量機(jī)的分類效果很大程度取決于核函數(shù)及其參數(shù)的選擇。聚類算法屬于非監(jiān)督式機(jī)器學(xué)習(xí)算法,在樣本量較大或噪聲水平較高時,聚類效果較差。并且以上算法都沒有利用所提取特征量之間的相互關(guān)系。2008年,Raghuraj等人提出一種新的模式識別方法——基于變量預(yù)測模型(VPMCD)的識別方法,并將其成功應(yīng)用在蛋白質(zhì)結(jié)構(gòu)的識別中[14-16]。VPMCD算法利用特征值之間的內(nèi)在相互關(guān)系建立變量預(yù)測模型并完成分類,不需要先驗知識,避免了神經(jīng)網(wǎng)絡(luò)的迭代和支持向量機(jī)的尋優(yōu)過程,計算速度快。同時,該方法使用多項式響應(yīng)面法建立變量預(yù)測模型,對非線性數(shù)據(jù)有著較好的分類效果。
文中將VPMCD引入到變壓器局部放電信號的模式識別領(lǐng)域。首先在實驗室條件下構(gòu)造四種變壓器局部放電實物模型,并對采集的放電信號提取18維的統(tǒng)計特征。最后使用VPMCD實現(xiàn)變壓器局部放電信號的識別。
文獻(xiàn)[15]認(rèn)為,在給定的多變量系統(tǒng)中,反映系統(tǒng)狀態(tài)的不同特征量之間不僅存在獨立性也存在相關(guān)性。這種性質(zhì)可用變量預(yù)測模型近似表示,其定義如下:在一個多變量系統(tǒng)中,特征向量[x1,x2,…xp]用來表征系統(tǒng)狀態(tài)。則有:
xi=g(xj,…,xk,bm,…,bn)+ε (1)式中 i=1,…,p;1≤j,…,k≤p,且 j,…,k≠i;bm,…,bn為模型參數(shù);ε為預(yù)測誤差。VPMCD采用多項式響應(yīng)面法求解變量預(yù)測模型:
Y=D·B (2)式中Y是模型響應(yīng)值,也就是特征Xi的預(yù)測值。D是輸入變量的多項式基函數(shù)。B是模型參數(shù)。四種變量模型的結(jié)構(gòu)和相應(yīng)細(xì)節(jié)如表1所示。其中r≤p-1,為模型階數(shù),代表著在多項式響應(yīng)模型中輸入變量的數(shù)目。對于多變量系統(tǒng)某一特征Xi來說,選定變量預(yù)測模型的類型和模型階數(shù)r后,可建立個多項式響應(yīng)模型。則從個多項式響應(yīng)模型選出預(yù)測誤差最小的模型,即為特征Xi的最優(yōu)變量預(yù)測模型vpmi。這樣,變量預(yù)測模型的建立問題就轉(zhuǎn)化成用最小二乘法求解模型參數(shù)B的回歸問題。
VPMCD算法簡單流程圖如圖1所示。
圖1 VPMCD算法簡單流程圖Fig.1 Simple flow chart of VPMCD algorithm
1.2.1 模型訓(xùn)練
(1)給定一個由C類樣本組成的訓(xùn)練集,N[n×p;C];n為訓(xùn)練樣本總數(shù);p為特征維數(shù)。其中每類樣本記作 Ng[ng×p],g=1,…,C,∑ng=n。選擇最大模型階數(shù)rmax;
(2)用 m表示預(yù)測模型的類型(L,LI,Q和 QI分別用1,2,3和4表示),r表示模型階數(shù)。令 m=1,r=1;
(3)對樣本集 Ng[nj×p]的特征 Xi(i=1,2,…,p按照式(2)建立個變量預(yù)測模型,計算并保存模型預(yù)測誤差;
(4)先后令 m=m+1和 r=r+1,循環(huán)步驟(2)和(3),直到m=4和r=rmax為止。這樣共有nk=4×種組合方式。從nk個組合方式中選取預(yù)測誤差SSE最小的模型作為第g類樣本中特征 Xi(i=1,2,…,p)的最優(yōu)變量預(yù)測模型保存相應(yīng)的自變量集合,模型類別和模型參數(shù);
(5)循環(huán)步驟(2)~(4),直到所有 C類樣本中每個特征值都建立最優(yōu)變量預(yù)測模型。這樣就得到訓(xùn)練樣本的變量預(yù)測矩陣VPM[C×p]。
1.2.2 模型測試
(1)選擇測試樣本,提取特征值 S[X1,X2,…,Xp];
(2)將測試樣本特征集S分別帶入VPM[C×p]中,求出相應(yīng)預(yù)測值 S^g(g=1,2,…,C);
(3)把預(yù)測的誤差平方和值 SSEg=∑(S-S^g)2,g=1,2,…,C作為分類的依據(jù)。若測試樣本在使用第 g(g=1,2,…,C)類樣本的最優(yōu)預(yù)測模型時,預(yù)測誤差平方和最小,則把樣本歸為第g類。
表1 不同變量預(yù)測模型的結(jié)構(gòu)和相應(yīng)細(xì)節(jié)Tab.1 Structures and the corresponding details of different VPMs
根據(jù)變壓器局部放電的形式和特點,在實驗室中構(gòu)造四種放電模型。為使采集的放電信號更有代表性,對每一種類型的放電都設(shè)計多種尺寸和參數(shù)的放電模型。四種局部放電實驗室模型如圖2所示。
圖2 四種局部放電實驗室模型Fig.2 Four types of partial discharge models in lab
(1)電暈?zāi)P?。此模型用來模擬變壓器在空氣中的電暈放電。放電尖端分別采用長度為30 mm,50 mm和70 mm,直徑1 mm的銅絲。放電尖端下接直徑320 mm的圓形無暈電極;
(2)沿面模型。此模型用來模擬變壓器內(nèi)部的沿面放電。使用的圓形環(huán)氧樹脂絕緣板直徑分別為30 mm,40 mm和50 mm;
(3)針板模型。此模型用來模擬變壓器內(nèi)部存在尖銳導(dǎo)體而引起的局部放電。模型分別使用3,4和5根針電極,均由直徑3 mm的鋁棒制成,端部打磨成30°的錐形。針電極按照環(huán)形排列,針電極和板電極之間放置厚度為1 mm的絕緣板;
(4)懸浮放電。此模型用來模擬變壓器內(nèi)部接觸不良或接地不良產(chǎn)生的懸浮放電。絕緣板直徑為50 mm,厚度為1mm。金屬墊片厚度為3mm,直徑分別為5 mm和10 mm。
模型所有部件的表面和邊緣都打磨光滑。除電暈?zāi)P屯?,其余三種模型都放置在盛滿變壓器油的容器中。使用帶寬為100 kHz~500 kHz的寬頻電流傳感器和TWPD-2F局部放電綜合分析儀采集放電信號,采集頻率為 40 MHz。高壓試驗平臺型號為TWI5133-10/100am。實驗條件見表2。
表2 放電模型試驗條件Tab.2 Test conditions of partial dischargemodel
將連續(xù)50個工頻周期的放電信號作為一個放電樣本,構(gòu)造最大放電量相位分布qmax-φ,平均放電量相位分布qmean-φ和放電次數(shù)相位分布n-φ三個二維譜圖,并從中提取偏斜度,陡峭度等18個統(tǒng)計參數(shù),如表3所示。
表3 PD信號的統(tǒng)計特征Tab.3 Statistical feature of PD signal
采集320個局部放電樣本(每種放電類型80個),其中訓(xùn)練樣本200個,測試樣本120個。用VPMCD算法對訓(xùn)練樣本進(jìn)行訓(xùn)練,模型階數(shù)設(shè)為3,得到4類樣本的最優(yōu)變量預(yù)測模型。由于篇幅所限,表4只給部分預(yù)測結(jié)果。
表4 基于VPMCD的PD信號識別的部分結(jié)果Tab.4 Part of the results of classification of PD signal based VPMCD
為了進(jìn)行對比分析,分別使用BP神經(jīng)網(wǎng)絡(luò)和VPMCD兩種分類算法實現(xiàn)局部放電信號的識別。BP神經(jīng)網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為18,隱層節(jié)點數(shù)為5,輸出層節(jié)點為4,訓(xùn)練截止誤差為10-3,學(xué)習(xí)率為0.1。兩種算法都采用10折交叉驗證。
從表5可以看出,VPMCD的識別效果要明顯好于BP神經(jīng)網(wǎng)絡(luò)。電暈放電脈沖多出現(xiàn)在工頻周期的270°附近且具有明顯的極性效應(yīng),特征明顯。故兩種算法對電暈放電都能準(zhǔn)確識別。而在其余三種放電類型的識別上,VPMCD的表現(xiàn)明顯好于BP神經(jīng)網(wǎng)絡(luò)。這是由于VPMCD利用預(yù)測誤差最小原則從全局選擇最優(yōu)預(yù)測模型,穩(wěn)定性強(qiáng),也避免了BP神經(jīng)網(wǎng)絡(luò)算法可能出現(xiàn)的局部最優(yōu)。
同時,VPMCD算法的訓(xùn)練時間為1.793 s,而BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間要35.064 s。當(dāng)輸入的特征維數(shù)和樣本類別較高時,需要建立的預(yù)測模型數(shù)量也隨之增加,但是多項式響應(yīng)面法建立的變量預(yù)測模型結(jié)構(gòu)簡單,不需要迭代學(xué)習(xí),計算速度快,訓(xùn)練時間反而要比BP神經(jīng)要少。最優(yōu)變量預(yù)測模型是從所有可能的模型(類型和階數(shù)不同)中選擇預(yù)測誤差最小的模型,在訓(xùn)練時不需要進(jìn)行參數(shù)調(diào)整,保證了模型的精度和泛化能力。
表5 PD信號識別的準(zhǔn)確率Tab.5 Recognition accuracy rate of PD signal
(1)VPMCD算法利用多項式響應(yīng)面法建立特征量的預(yù)測模型,通過預(yù)測誤差來識別不同放電類型,能夠有效解決局部放電信號模式識別問題,分類正確率要高于BP神經(jīng)網(wǎng)絡(luò)。
(2)VPMCD本質(zhì)上是利用特征值之間相互內(nèi)在聯(lián)系的參數(shù)估計方法建立預(yù)測模型,運算速度快,同時避免了參數(shù)選擇的主觀性。