李君科,李明江,李德光
(1.黔南民族師范學院計算機與信息學院,貴州都勻 558000;2.洛陽師范學院信息技術(shù)學院,河南洛陽 471934)
氣體絕緣開關(guān)設(shè)備(gas insulated switchgear,GIS)因其安全運行可靠性高、低成本、低污染運行等特點,在電力系統(tǒng)中得到了廣泛應(yīng)用[1-2]。但GIS 設(shè)備的長時間運行以及制造和安裝時存在的疏漏會導(dǎo)致內(nèi)部絕緣缺陷,引起設(shè)備的局部放電(partial discharge,PD)行為[3]。對GIS 設(shè)備內(nèi)部各種絕緣缺陷的PD 信號監(jiān)測并進行分析和識別,能夠為評估設(shè)備運行狀態(tài)和制定可靠的檢修方案提供合理依據(jù)[4-5]。
目前在GIS的PD 模式識別的研究中,主要是從特高頻(ultrahigh frequency,UHF)測量[6]信號中提取出類別特征集以便于分類,常用的特征量提取方法有分形特征法[7-8]、統(tǒng)計特征法[9-10]和矩陣特征法[11-12]等。但是,特征提取所得到的高維數(shù)據(jù)不僅增加分類器的計算量,更會引起識別率的下降。目前常用的降維方法是主成分分析法(principal components analysis,PCA)[13-14],但是該方法基于求得樣本協(xié)方差矩陣的特征貢獻率,沒有體現(xiàn)樣本間的類別信息。屬于監(jiān)督降維的線性判別分析法(linear discriminant analysis,LDA)能夠使樣本空間具有明顯的類別信息,提高模式識別的正確率,在各領(lǐng)域得到了很好的應(yīng)用[15-16]。
國內(nèi)外學者對GIS 的PD 模式識別進行了大量研究,其中,BP 神經(jīng)網(wǎng)絡(luò)(back propagation neural networks,BPNN)[13,17]和支持向量機(support vector machine,SVM)的應(yīng)用比較廣泛[7,14]。但BP網(wǎng)絡(luò)在訓(xùn)練時存在過擬合、容易陷入局部極值以及收斂速度慢等問題。SVM是基于二次規(guī)劃求解支撐向量,該方法隨著樣本增加,矩陣階數(shù)上升,且相應(yīng)的運算量和運算時間也急劇攀升。概率神經(jīng)網(wǎng)絡(luò)(probabilistic neural network,PNN)可以從海量樣本中學習出類別特征信息,與其他方法相比,該方法具有收斂速度快且分類能力強等特點,在模式分類領(lǐng)域得到了廣泛應(yīng)用[12]。由于PNN對訓(xùn)練樣本的類別信息的要求比較高,所以本文采用LDA數(shù)據(jù)分析方法,且引入遺傳算法對平滑因子進行優(yōu)化來提高網(wǎng)絡(luò)的收斂速度和識別精度。
本文針對GIS 的PD 模式識別開展如下研究工作:利用GIS 局部放電高壓實驗平臺模擬了5類典型的GIS 設(shè)備缺陷模型,采用UHF 獲取局部放電的原始信號參量;采用統(tǒng)計特征法提取出18個統(tǒng)計參量并進行LDA 分析,對統(tǒng)計參量進行降維處理得到新的特征參量;用優(yōu)化平滑因子后的概率神經(jīng)網(wǎng)絡(luò)作為PD 類型識別器對低維樣本進行模式識別。
Ronald Fisher 于1936 年提出的LDA 分析法是提取特征的有效方法。采用Fisher準則函數(shù)對多類樣本數(shù)據(jù)進行線性判別分析,其目標是通過計算高維特征空間的類內(nèi)離散度矩陣和類間離散度矩陣,提取出具有類別可分性的低維特征,即新樣本有最大的類間距離和最小的類內(nèi)距離。
式中:Sb,Sw分別為類間離散度矩陣和類內(nèi)離散度矩陣;w為待求的最優(yōu)投影集;ml為各個類內(nèi)樣本均值;m為樣本空間均值。
構(gòu)造拉格朗日乘子,將式(1)表示為
概率神經(jīng)網(wǎng)絡(luò)是在徑向基神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上發(fā)展起來的,融合了Parzen 窗概率密度函數(shù)估計和Bayes 分類準則,可以實現(xiàn)任意的非線性逼近,收斂于貝葉斯分類最優(yōu)解。基本思想為:設(shè)有d維輸入特征樣本x=[x1,x2,x3,…,xd],對應(yīng)于C個類別w1,w2,…,wC之一。P(wi)和P(x|wi)分別為類wi的先驗概率和類條件概率密度函數(shù)。貝葉斯決策通過最小化風險進行決策,決策規(guī)則為
式中:d(x)為決策;P(wi)為類wi的先驗概率;Ni為類別i的訓(xùn)練樣本數(shù);N為訓(xùn)練樣本總數(shù)。
類條件概率密度函數(shù)P(x|wi)采用Parzen 窗非參概率密度函數(shù)方法進行估計,且將多元高斯核函數(shù)作為窗函數(shù),即P(x|wi)的Parzen 窗估計表示為
式中:Ni為i類的訓(xùn)練樣本數(shù);xij為該神經(jīng)元的權(quán)向量(同時也是第i類中的第j個訓(xùn)練樣本);σ為平滑因子,決定了以樣本點為中心的曲線寬度。
PNN 模型由輸入層、模式層、求和層和輸出層組成,結(jié)構(gòu)如圖1所示。
圖1 PNN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 PNN network structure diagram
1)輸入層神經(jīng)元個數(shù)與特征樣本x的維數(shù)相等,該層接收特征空間樣本并傳遞給網(wǎng)絡(luò)模式層。
3)求和層神經(jīng)元個數(shù)與樣本類別數(shù)C相同,該層神經(jīng)元與僅屬于同一類的模式層神經(jīng)元連接,將模式層中所有同類神經(jīng)元的輸出累計后取均值:
式中:Ni為訓(xùn)練樣本類別i的數(shù)量。
4)輸出層有C個神經(jīng)元(對應(yīng)每個模式類),該層接受求和層輸出的類別條件概率密度函數(shù),采用貝葉斯分類準則,每個神經(jīng)元的輸出為
對于未知類別的特征樣本x,有r,s(r,s∈{1,2,3,…,C},且r≠s),若存在Or>Os,則判定特征樣本屬于r類。
由概率密度函數(shù)可知,平滑因子σ的變化會影響PNN 網(wǎng)絡(luò)的性能。取值過小,密度估計會出現(xiàn)過擬合,容易受到噪聲干擾;取值過大,函數(shù)逼近平滑,會增加參與計算的模式層神經(jīng)元,兩者皆會影響分類器的識別效果。
目前常采用經(jīng)驗法確定平滑因子,但該方法不能完全表述特征樣本的概率特性。遺傳算法可以無需先驗知識進行全局尋優(yōu),在模式識別、函數(shù)優(yōu)化、控制和故障診斷等方面得到了廣泛的應(yīng)用[18-19]。本文選取遺傳算法對PNN分類器的平滑因子進行優(yōu)化,找到適合對特征樣本識別的平滑因子。
采用樣本特征分布信息設(shè)計初始種群來代替?zhèn)鹘y(tǒng)的隨機分布初始種群。Parzen 概率的估計值主要是取決于臨近點距離影響,當待測樣本與模式樣本的距離分別為1σ,2σ,3σ時,產(chǎn)生的相應(yīng)高斯值相差懸殊,能夠直接影響概率估計值。因此σ值的選取要有一定的范圍,可采用下式表示:
式中:pˉav[k]為同類樣本最小距離平均值;g為比例系數(shù),選取為0.9~1.8。
遺傳算法的適應(yīng)度函數(shù)采用誤差函數(shù)計算個體的適應(yīng)度,如下式所示:
式中:E為誤差值;d(xj)為期望輸出;o(xj)為網(wǎng)絡(luò)的實際輸出。
綜上,基于遺傳算法優(yōu)化的概率神經(jīng)網(wǎng)絡(luò)步驟如下:
1)計算特征空間的同類樣本的最小距離平均值集,并利用比例系數(shù)在區(qū)間內(nèi)形成初始種群{σ′1,σ′2,σ′3,…,σ′M},M為種群規(guī)模;
2)進行種群二進制編碼;
3)執(zhí)行遺傳算法的選擇、交叉、變異操作,并解碼;
4)評價適應(yīng)度函數(shù),得到理想平滑因子則進行步驟5),否則轉(zhuǎn)入2)繼續(xù)執(zhí)行;
5)優(yōu)化后平滑因子確定PNN 網(wǎng)絡(luò)分類器模型。
基于GIS局部放電高壓實驗平臺進行模擬局步放電缺陷類型。實驗平臺示意圖如圖2 所示,試驗變壓器的額定電壓為150 kV,額定容量為15 kV·A,隔離開關(guān)動作速度3 s 左右。瓷套用于電氣設(shè)備引線的絕緣支撐。試驗腔內(nèi)設(shè)置缺陷類型模型,腔體內(nèi)含有少量空氣并充以SF6 氣體至0.4 MPa。仿真平臺采用UHF 檢測法,檢測頻段為300~3 000 MHz,用以避開電暈放電等干擾。實驗電路接線示意圖如圖3所示。
圖2 實驗仿真平臺示意圖Fig.2 Schematic diagram of experimental simulation platform
圖3 實驗接線示意圖Fig.3 Schematic diagram of experimental wiring
針對GIS 設(shè)備在實際運行中的典型絕緣缺陷類型,設(shè)計了如尖端導(dǎo)體放電(T)、分散型顆粒放電(D)、集群型顆粒放電(C)、絕緣子內(nèi)部放電(I)、懸浮放電(S)等5 種典型的PD 模型,如圖4 所示。
圖4 典型的局部放電模型Fig.4 Typical partial discharge model
模型規(guī)格:尖端放電,選取長度l=15 mm、針尖直徑d=0.5 mm 的銅質(zhì)尖端導(dǎo)體,距離電極7 mm;懸浮電位放電,接地電極上放置厚5 mm 的環(huán)氧樹脂材質(zhì)板,環(huán)氧樹脂板上面放置直徑10 mm、高10 mm 的銅質(zhì)導(dǎo)體;分散性顆粒群放電,選取若干直徑d=0.4 mm、高h=10 mm 的銅質(zhì)三角錐體,分散于GIS母線導(dǎo)體的絕緣子上;絕緣子表面金屬顆粒群放電,選取若干直徑d=0.4 mm、長高h=10 mm 銅絲,分堆放置于GIS 母線導(dǎo)體的絕緣子上;絕緣子內(nèi)部缺陷放電,將絕緣子替換成內(nèi)部有介質(zhì)缺陷的絕緣材質(zhì)。
3.2.1 信號采集概述特征參量提取
利用3.1 節(jié)實驗平臺進行局部放電實驗,將上述放電模型置于試驗腔內(nèi),接高、低壓電極進行實驗,通過UHF 檢測各類缺陷的信號。每種缺陷類型采集3 000 個工頻周期內(nèi)的局部放電波形。將50 個周期的工頻數(shù)據(jù)存為1 個樣本,即每類信號含有60個樣本。不同缺陷模型的PD 放電次數(shù)m,放電相位φ,放電電荷量q等統(tǒng)計參數(shù)有明顯的差異,各缺陷類型的UHF 二維圖譜如圖5~圖9所示。
由圖5~圖9 可知,T 類放電缺陷在負半周有較高的放電量,D 類缺陷在正負半周的峰值處的放電次數(shù)比較多且正半周的峰值處存在離散樣本,C 類缺陷放電主要發(fā)生在正負半周的峰值之前且相應(yīng)的放電量比較多,I 類缺陷在正負半周存在較少的放電量,S 類缺陷的放電分布比較分散且放電量表現(xiàn)比較平穩(wěn)。
圖5 尖端導(dǎo)體放電相位分布圖譜Fig.5 Discharge phase distribution of tip conductor defect type
圖6 分散型顆粒放電相位分布圖譜Fig.6 Discharge phase distribution of dispersed particles defect type
圖7 集群型顆粒放電相位分布圖譜Fig.7 Discharge phase distribution of clustered particles defect type
圖8 懸浮放電相位分布圖譜Fig.8 Discharge phase distribution of suspension defect type
圖9 絕緣內(nèi)部放電相位分布圖譜Fig.9 Discharge phase distribution of insulation internal defect type
依據(jù)各類缺陷的二維圖譜,分別提取能夠描述局部放電特性的統(tǒng)計算子,包含偏斜度SK,陡峭度Ku,放電量因數(shù)Q,互相關(guān)系數(shù)CC,峰值不對稱度P等共18個統(tǒng)計參量,如表1所示。
表1 統(tǒng)計算子表Tab.1 Table of statistical parameters
3.2.2 統(tǒng)計參量的線性判別分析
以偏斜度的6 個參量為例進行LDA 數(shù)據(jù)分析,求解Fisher 準則函數(shù)矩陣的特征值及其主導(dǎo)向量。對求得特征值的貢獻率和累計貢獻率(如表2所示)進行分析,選擇較大特征值的特征向量作為主要向量用以確定轉(zhuǎn)換矩陣。
表2 特征值及其貢獻率Tab.2 Characteristic values and their contribution rates
如表2 所示,從第3 個特征值之后貢獻率已經(jīng)很小,累計貢獻率波動不大。因此,提取前3個特征值就能夠代表99.7%的信息,此時將此3 個特征值所對應(yīng)的特征向量作為最優(yōu)投影集,經(jīng)過最優(yōu)投影后將原始的樣本空間的維數(shù)降低,這樣就能夠?qū)⑵倍葏⒘繌? 維空間降為3 維。同樣對整個統(tǒng)計參量空間進行LDA 數(shù)據(jù)分析,對特征空間的18個參量進行分析,提取貢獻率高且累計貢獻率在99.8%的前6個特征值,得到對應(yīng)的6個特征向量并建立轉(zhuǎn)換矩陣,進行最優(yōu)投影后將原始特征空間的18維數(shù)據(jù)降為6維的樣本空間。
輸入向量的選擇:本次GIS 局部放電實驗是采用表征圖譜特性的特征參數(shù)(偏斜度、陡峭度、放電量因數(shù)等18 個特征量)經(jīng)過LDA 方法降維后的6維樣本空間作為網(wǎng)絡(luò)的輸入特征量。采用標準化后的特征量作為輸入向量,以消除量綱的影響。
輸出向量的選擇:PNN 網(wǎng)絡(luò)模式識別的輸出層的設(shè)計取決于放電類型數(shù),文中模擬了5 類比較典型的GIS 局部放電類型,因此輸出層為5 個輸出節(jié)點且分別對應(yīng)于模式類別,用于識別局部放電類型。
平滑因子優(yōu)化:采用遺傳算法進行平滑因子的優(yōu)化,選取種群規(guī)模popsize為10,個體長度chromlength取為5,進化次數(shù)maxgeneration為50,交叉概率pcross為0.4,變異概率pmutation為0.2,適應(yīng)度函數(shù)誤差為0.001。經(jīng)過遺傳算法尋優(yōu)后,本次實驗的平滑因子確定為0.052。
基于LDA 和GA_PNN 分類器的模式識別方法流程圖如圖10所示,并利用Matlab編程實現(xiàn):
圖10 模式識別流程圖Fig.10 Flow chart of pattern recognition
1)針對UHF 所檢測得到的各類GIS 局部放電類型的特征,確定各局部放電類型的二維圖譜,并采用統(tǒng)計特征法提取特征參量;
2)引入線性判別分析對特征空間進行降維處理;
3)依據(jù)降維后的樣本空間,確定PNN 的輸入向量以及輸出向量;
4)降維后的特征樣本劃分為訓(xùn)練樣本和測試樣本,并依據(jù)訓(xùn)練樣本確定分類器的結(jié)構(gòu)(各層的神經(jīng)元個數(shù));
5)采用遺傳算法對PNN 的平滑因子進行優(yōu)化;
6)將訓(xùn)練樣本送入GA_PNN 網(wǎng)絡(luò)進行模式識別。
4.2.1 各放電類型的模式識別
為驗證所提出的模式識別方法對局部放電模式的識別效果,從每類缺陷類型的樣本集選取30 個測試樣本和30 個訓(xùn)練樣本,分類進行識別,試驗結(jié)果如表3 所示。由表3 中的數(shù)據(jù)可以看出,基于該方法的模式總體識別率達到96.0%,其中有2 類模式存在少量樣本的誤分類,主要原因是這2類模式的二維圖譜存在少量的離散樣本。
表3 各類模式的識別率Tab.3 Recognition rate of various patterns
4.2.2 不同分類器的識別效果比較
為模擬現(xiàn)實工作中故障的隨機性,本次實驗從經(jīng)過降維的5 類共300 個樣本中,隨機選取150個訓(xùn)練樣本和150 個測試樣本,模式識別效果圖如圖11 所示??梢钥闯?,經(jīng)過訓(xùn)練后,所選取的150 個測試樣本中,除了少數(shù)的絕緣內(nèi)部放電類型之外,其余類別都能和其實際的類別對應(yīng)上,識別率達96.7%。
圖11 隨機選取測試樣本的識別結(jié)果Fig.11 Recognition results of randomly selected test samples
利用BPNN,SVM,PNN 和GA_PNN 方法對相同的訓(xùn)練樣本和測試樣本進行GIS 模式識別。BPNN 的隱節(jié)點采用試湊法確定,采用監(jiān)督學習方式進行權(quán)值和閾值的訓(xùn)練,訓(xùn)練目標為0.000 05;大量實驗表明,SVM 的核函數(shù)選用徑向基核函數(shù)能夠得到較優(yōu)的結(jié)果,擴展常數(shù)為1,因SVM是二分類器,因此采用4 個SVM 分類器拓展成五分類器;PNN 的平滑因子采用經(jīng)驗法設(shè)為0.1。分別將降維前和降維后的特征樣本送入4個分類器進行模式識別,結(jié)果如表4和表5所示。
表4 降維前4種識別方法的識別率和識別時間Tab.4 Recognition rate and recognition time of four recognition methods before dimension reduction
由表4 和表5 可知,相比較于降維前的樣本數(shù)據(jù),各識別方法在處理降維后的特征樣本時具有更短的識別時間和更高的識別率。這是因為降維方法提供的低維樣本空間便于縮短識別時間,且LDA 降維后的樣本空間具有明顯的類間信息,能夠提高識別率。
表5 降維后4種識別方法的識別率和識別時間Tab.5 Recognition rate and recognition time of four recognition methods after dimension reduction
由表5 可知,GA_PNN 與PNN 的識別速度快并且相差不多,SVM 的速度次之,BP 網(wǎng)絡(luò)則需要更多時間。這是由于PNN 網(wǎng)絡(luò)無需反復(fù)訓(xùn)練,SVM 需要求得支撐向量,建立分類超平面,BP 網(wǎng)絡(luò)則需要多次迭代以更新權(quán)值和閾值,且極易陷入局部最優(yōu)而表現(xiàn)出較差的識別率和識別時間。SVM 和PNN 識別效果相差不大,識別率能夠達到88%左右,而經(jīng)過遺傳算法優(yōu)化平滑因子的PNN方法的識別率能夠達到96%,且擁有最短的識別時間。
對于GIS 局部放電信號的特性,提出了采用LDA 數(shù)據(jù)分析方法并結(jié)合改進的概率神經(jīng)網(wǎng)絡(luò)進行局部放電模式識別?;贕IS 高壓實驗平臺,模擬了5 類典型的GIS 局部放電模式,并采用線性判別分析法對超高頻信號的統(tǒng)計特征參量進行降維處理,結(jié)合GA_PNN 的識別方法進行局部放電模式識別,并與目前常用的分類方法進行比較,結(jié)論如下:
1)對于GIS 局部放電原始信號的特性,采用線性判別分析法對特征空間進行降維處理,得到含有明顯類別信息的低維特征空間,提供給PNN識別模型具有類別信息的訓(xùn)練樣本,能夠有效提高識別率。
2)采用遺傳算法對PNN 的平滑因子進行優(yōu)化,得到適合PD 模式分類的平滑因子,相對于常用的經(jīng)驗法選取的平滑因子而言,優(yōu)化平滑因子后的PNN 更適合解決GIS 局部放電模式識別問題。
3)采用優(yōu)化后的PNN 作為模式識別器,分別對降維前和降維后的特征樣本進行局部放電模式識別,相比較于常用的BPNN,SVM,PNN 等識別方法,GA_PNN 方法具有較高的識別精度和較快的識別速度。所提方法并不局限于解決GIS設(shè)備的局部放電問題,亦適用于其他電氣設(shè)備的局部放電問題。
4)采用常見的高斯窗函數(shù)作為概率密度函數(shù)。依據(jù)實際問題,選擇最佳的窗函數(shù),能夠直接影響GIS 局部放電模式的識別結(jié)果,該部分研究仍需進一步展開。