林偉,王昕,鄭益慧,李立學
(上海交通大學 電工與電子技術(shù)中心,上海 200240)
基金項目:國家自然科學基金項目(61673268),國家自然科學基金重點項目(61533012)資助。
氣體絕緣開關(guān)(Gas Insulated Switchgear,GIS)因其具有占地面積小、穩(wěn)定性高等優(yōu)點,在電力系統(tǒng)中占據(jù)重要的地位[1]。然而,由于GIS的封閉性,一旦發(fā)生故障,便會造成嚴重后果[2]。數(shù)據(jù)表明,絕緣故障在GIS 故障中占大多數(shù)[3]。局部放電(Partial Discharge,PD)作為一種有效表征GIS絕緣缺陷的現(xiàn)象,被廣泛研究。
基于特高頻電磁波的特高頻(Ultra High Frequency,UHF)局部放電檢測法具有高靈敏度、高精確度等優(yōu)點,已經(jīng)成為GIS局放檢測的重要手段[4]。由于不同的絕緣缺陷所激發(fā)的特高頻信號具有不同的特征,自上世紀90年代起,模式識別開始應(yīng)用于局部放電類型識別分類領(lǐng)域。人工神經(jīng)網(wǎng)絡(luò)[5](Artificial Neural Network,ANN)、支持向量機[6](Support Vector Machine,SVM)和K近鄰[7](K Nearest Neighbor,KNN)等方法都在GIS局部放電領(lǐng)域有所應(yīng)用。在模式識別領(lǐng)域,反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)作為ANN的一種算法應(yīng)用十分廣泛,具備良好的分類能力,但其樣本需求量大、訓練周期長、易陷入局部最優(yōu);SVM可解決小樣本下的分類識別,可數(shù)據(jù)量大時,計算速度會變得非常慢;KNN算法運算速度較快,但效果受到近鄰數(shù)目K的影響,且未考慮樣本差異,均存在問題。另一方面,模式識別方法依賴于所輸入的特征參量。因此,設(shè)計并選取具有代表性和區(qū)分度的特征參量至關(guān)重要。文獻[8]使用基于灰度譜圖的圖像矩特征參量識別,可以較好地反映局放信號的形狀紋理特征,但需要對圖片進行縮放裁剪等預(yù)處理,破壞了數(shù)據(jù)的完整性,且該方法未考慮到局放信號的統(tǒng)計特征,對極性現(xiàn)象描述不夠;而采用相窗內(nèi)的放電平均值和放電量描述局放的統(tǒng)計參量則更多考慮數(shù)據(jù)正負半周間的差異與總體統(tǒng)計規(guī)律[9],卻無法描述局放PRPD圖譜的局部形狀特征;文獻[10]采用多種圖譜聯(lián)合參數(shù),可以反映局放信號的形狀特征和統(tǒng)計特征,但丟失了局部放電信號的相位信息。
針對以上問題,本文提出了基于概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)的分類方法以及表述信號形狀與統(tǒng)計特征的聯(lián)合參量。首先,利用GIS局放模擬裝置產(chǎn)生特高頻(Ultra High Frequency,UHF)局放信號并采集,生成數(shù)據(jù)集;其次,在傳統(tǒng)的統(tǒng)計參量與圖像矩參量的基礎(chǔ)上,根據(jù)信號的圖譜特點選取聯(lián)合參量,以描述信號的整體統(tǒng)計特征和局部形狀特征;同時,對采集的數(shù)據(jù)直接進行預(yù)處理與參量提取,避免破壞數(shù)據(jù)的完整性,并通過主成分分析(Principal Component Analysis,PCA)法[11]進行降維;在數(shù)據(jù)集中,隨機抽取樣本形成訓練集和測試集,利用訓練集生成概率神經(jīng)網(wǎng)絡(luò)的隱含層;而概率神經(jīng)網(wǎng)絡(luò)具有訓練速度快、結(jié)構(gòu)簡單和容錯率高的特點,不易陷入局部最優(yōu),并能夠應(yīng)對小樣本數(shù)據(jù),解決了傳統(tǒng)模式識別方法的缺陷。最后,訓練完成的概率神經(jīng)網(wǎng)絡(luò)對測試數(shù)據(jù)進行分類,得到結(jié)果。試驗表明,本文提出概率神經(jīng)網(wǎng)絡(luò)具有良好的識別能力,且聯(lián)合參量相比于傳統(tǒng)統(tǒng)計參量具有顯著的優(yōu)越性。
GIS在發(fā)生局部放電時,伴隨著正負電荷的中和,會產(chǎn)生上升沿為納秒級的電流脈沖,從而激發(fā)高達幾百兆到幾千兆的特高頻電磁波。如圖1(a)所示,GIS的同軸結(jié)構(gòu)相當于圓柱形同軸線波導,可供特高頻電磁波傳播。
電磁波在GIS的封閉式結(jié)構(gòu)中進行傳播時,會通過盆式絕緣子等絕緣結(jié)構(gòu)泄漏出部分電磁波。因此,可選用外置式的UHF傳感器對其進行采集。或通過預(yù)置在GIS腔體內(nèi)部的內(nèi)置式UHF接收天線將信號傳輸至外界,如圖1(b)所示。
圖1 (a) GIS內(nèi)部特高頻信號傳播示意圖(b) 和某線路變電站GIS
本文采用內(nèi)置式UHF傳感器,對GIS局部放電故障模擬裝置產(chǎn)生的特高頻信號進行采集,獲取信號數(shù)據(jù),如圖2(a)所示,內(nèi)置式UHF傳感器具有更加良好的抗干擾能力,且能夠捕捉到幅值較低的特高頻信號。圖2(b)所示模擬裝置可產(chǎn)生懸浮電極、自由金屬顆粒、絕緣氣隙和金屬尖端四種絕緣缺陷的放電信號。UHF傳感器采樣率為10 kS/s,即每周期200個數(shù)據(jù)點。利用峰值檢波方法獲取放電周期內(nèi)的最大值表示該放電周期內(nèi)局放信息。
圖2 (a) UHF信號采集與預(yù)處理裝置(b) GIS局部放電故障模擬裝置
為了確定特征參量,本文根據(jù)采集得到的數(shù)據(jù)繪制PRPD散點圖,如圖3所示。其中,圖像橫坐標代表放電數(shù)據(jù)對應(yīng)的時刻;縱坐標為放電量的歸一化幅值,為無量綱數(shù)值。四種絕緣缺陷之間的特征區(qū)別十分明顯。顯然,除自由金屬顆粒缺陷外,其余局部放電的分布具有相位相關(guān)性,因此,將整個工頻周期區(qū)分為正半周和負半周兩個區(qū)域。據(jù)此,本文提取如下包含形狀信息和統(tǒng)計信息的聯(lián)合特征參量。
1)外觀比RA(Aspect Ratio)
外觀比是比較常用的形狀緊湊性描述符,定義為:RA=L/W。其中,L和W分別是可以正好完全覆蓋目標的矩形區(qū)域的長和寬。局部放電信號幅值越集中、相位分布越廣,則外觀比越小。
2)實心度SD(Solid Degree)
實心度的定義為:SD=N/AR,表達為區(qū)域內(nèi)局部放電信號點數(shù)與其包裹其集合的最小矩形面積比值。實心度描述局放信號的稀疏程度,當局放信號在工頻周期內(nèi)越集中,則實心度的值越大。
3)Hu不變矩η
由M.K.Hu提出的Hu不變矩是通過二值圖像中心矩的代數(shù)運算得到的矩特征參量。二值圖像f(x,y)表示形狀區(qū)域,則圖像p+q階矩和p+q階中心矩定義為:
mpq=∑xpyqf(x,y) (p,q=0,1,2…)
(1)
μpq=∑(x-x0)p(y-y0)qf(x,y)
(p,q=0,1,2…)
(2)
式中:(x0,y0)為形狀質(zhì)心,由二階、三階中心矩通過代數(shù)運算,組合得到7個Hu不變矩特征,詳細計算見文獻[8]。
1)偏斜度Sk(Skewness)
偏斜度是描述圖形偏斜程度的統(tǒng)計量,其值的正負分別代表圖譜形狀向左與向右偏移。公式如下:
(3)
式中:i是每半個周期內(nèi)的數(shù)據(jù)點序數(shù),即每100個數(shù)據(jù)點為一個計數(shù)循環(huán);φi是第i個數(shù)據(jù)點的相位;pi、μ和σ分別為該相位點的放電最大值的概率、均值和標準差。
2)陡峭度Ku(Kurtosis)
陡峭度是表示圖譜平坦與否的統(tǒng)計量,其值正負表示圖譜與正態(tài)分布的比較更加陡峭或更加平坦,其計算見式(4),式中各參數(shù)意義與Sk相同:
(4)
3)互相關(guān)系數(shù)CC(Correlation Coefficient)
(5)
圖3 四種缺陷局放圖譜
4)放電量因數(shù)Q
放電量因數(shù)表示正負半周內(nèi)局放放電量的差異,表達為:
(6)
5)數(shù)據(jù)稠密度DD(Data Density)
數(shù)據(jù)稠密度是用來表征局放信號在相位分布上的稠密程度提出的統(tǒng)計量。定義為在有效放電閾值以上的放電區(qū)間相位占總相位的比值,即DD=neff/N。
上文提出三類形狀參量和五類統(tǒng)計參量,考慮到部分參量的正負半周區(qū)域區(qū)分,共計十八個特征參量,即:
(7)
如此產(chǎn)生的特征參量維度過高,本文采用PCA法對特征參量組進行降維,其具體步驟可見文獻[11]。經(jīng)過降維后,根據(jù)累計方差貢獻率選取降維維數(shù),本文選取貢獻率90%以上,主分量貢獻率見表1。
表1 PCA降維特征參量貢獻率
PNN神經(jīng)網(wǎng)絡(luò)是徑向基網(wǎng)絡(luò)(Radical Basis Function,RBF)的分支,是基于貝葉斯最小風險準則的有監(jiān)督分類器。如圖4所示,本文采用PCA降維特征參量為5維,并獲得4種分類結(jié)果。特征參量通過輸入層進入PNN神經(jīng)網(wǎng)絡(luò),隱含層為已明確類別的樣本層,圖中隱含層每個數(shù)字代表該類的樣本矢量,隱含層神經(jīng)元數(shù)目等同于樣本矢量數(shù)目,每種樣本個數(shù)不定。通過隱含層累和,參量傳輸至競爭層,得到數(shù)據(jù)分類在每種類型的概率,最終輸出概率最高的結(jié)果,即為最終的分類。
圖4 PNN神經(jīng)網(wǎng)絡(luò)示意圖
PNN輸出變量的判別函數(shù)為[12]:
(8)
本文通過對圖2(b)所示的GIS局部放電模擬裝置產(chǎn)生的局部放電信號進行采集,獲取氣隙放電、懸浮放電、自由金屬顆粒放電和尖端放電四種特高頻信號,其信號圖像如圖5所示。其中,橫縱坐標分別代表信號相位(°)和放電量幅值(dBm)。本文直接獲取信號原始數(shù)據(jù),并對其進行預(yù)處理,獲得PRPD三維數(shù)據(jù),并以此繪制散點圖與最大值曲線。
圖5 GIS局放模擬裝置放電圖譜
由表2可知,本文選取聯(lián)合參量組的正確率明顯高于統(tǒng)計參量組,識別率均在80%以上,而懸浮放電和顆粒放電的識別率均高達95%以上,其中,懸浮放電50組測試數(shù)據(jù)無一錯判,顯示很良好的分類能力。
表2 GIS局放信號PNN識別結(jié)果
本文提出了應(yīng)用于GIS局部放電特高頻信號的特征參量選取方式以及基于概率神經(jīng)網(wǎng)絡(luò)的局放分類器,經(jīng)過試驗驗證了聯(lián)合參量的優(yōu)越性,并得出如下結(jié)論:
(1)利用GIS局放模擬裝置產(chǎn)生局放UHF信號,并將其預(yù)處理作為數(shù)據(jù)集,針對灰度譜圖和最大值譜圖的不足,在傳統(tǒng)的形狀參量和統(tǒng)計參量基礎(chǔ)上結(jié)合數(shù)據(jù)集生成的散點圖特征提出外觀比、實心度和數(shù)據(jù)密度等新的特征參量,并組成聯(lián)合參量,具備更完整的描述局放信號特征的能力;
(2)通過PCA分析法獲得降維特征參量,規(guī)避了高緯度帶來的低效率,并減少了信息冗余;
(3)利用隨機抽樣法對數(shù)據(jù)集分類,可有效減少人為選取的偏向性;
(4)測試數(shù)據(jù),通過概率神經(jīng)網(wǎng)絡(luò)得到最終分類結(jié)果,具備一定的準確度,對比傳統(tǒng)統(tǒng)計參量,本文提出的聯(lián)合參量對分類的準確率有明顯提高。