唐 炬謝顏斌周 倩張曉星
(1. 重慶大學輸配電裝備及系統(tǒng)安全與新技術國家重點實驗室 重慶 400030 2. 重慶電力公司江北供電局 重慶 401147)
基于最優(yōu)小波包變換與核主分量分析的局部放電信號特征提取
唐 炬1謝顏斌1周 倩2張曉星1
(1. 重慶大學輸配電裝備及系統(tǒng)安全與新技術國家重點實驗室 重慶 400030 2. 重慶電力公司江北供電局 重慶 401147)
UHF法作為GIS設備PD檢測的有效方法已得到廣泛應用,但GIS內(nèi)UHF PD信號的特征提取一直是研究的難點問題。作者從小波包對UHF PD信號分解過程入手,根據(jù)已建立的GIS內(nèi)4種典型缺陷UHF PD數(shù)學模型,分別采用熵最小原則選取最優(yōu)小波包基,利用所得到的最優(yōu)小波包基對UHF PD信號進行分解得到的小波包系數(shù),計算信號在各頻帶投影序列的能量、在各個尺度下的模極大值和絕對平均值,構造出能完整描述UHF PD信號的特征空間,并用KPCA法將高維特征空間降到低維特征空間,解決了維數(shù)危機,消除了類內(nèi)散度矩陣的奇異性,并最大限度地保持原有信號的特性。由此作為模式識別的特征量能夠較好地應用于UHF PD信號模式識別。
局部放電 特征提取 最優(yōu)小波包 核主分量分析
氣體絕緣組合電器(Gas Insulated Switchgear,GIS)最常見的電氣故障特征是在絕緣完全擊穿或閃絡前產(chǎn)生局部放電(Partial Discharge,PD)[1-3]。采用超高頻(Ultra High Frequency,UHF)檢測GIS內(nèi)PD可以及時發(fā)現(xiàn)設備內(nèi)部缺陷[3-4]。對局部放電信號進行有效模式識別,可以進一步準確地了解和掌握 GIS內(nèi)缺陷類型性質(zhì)和特征[5-9],對于保證GIS安全可靠運行,掌握GIS絕緣狀況及指導GIS檢修工作有著十分重要的意義。特征提取品質(zhì)的優(yōu)劣極大地影響著分類器的設計和性能,是模式識別最重要的核心問題之一。在 PD模式識別中,由于圖像或者波形所獲得的數(shù)據(jù)量相當大,對放電模式直接識別是很困難的。為了有效地實現(xiàn)UHF PD分類識別,就要對原始數(shù)據(jù)進行變換,得到最能反映分類本質(zhì)的特征。
小波包變換(Wavelet Packet Transform,WPT)[10]在滿足海森堡測不準原理的前提下,自由選擇不同時間點、頻率點上的時頻分辨率,可以更精練地在時頻聯(lián)合分析相平面上提取非穩(wěn)定信號的特征。20世紀90年代末,Bernhard Scholkopf小組在主分量分析的基礎上,將核主分量分析(Kernel Principal Component Analysis,KPCA)推廣到非線性領域,它通過核函數(shù)將輸入空間的非線性問題轉(zhuǎn)化到特征空間成為普通的特征值問題,比主成分分析具有更優(yōu)越的降維效果[11]。
本文從WPT對UHF PD信號分解過程入手,根據(jù)已建立的GIS內(nèi)4種典型缺陷UHF PD數(shù)學模型[12],分別采用熵最小原則選取最優(yōu)小波包基,綜合選用了UHF PD信號在各頻帶投影序列的能量、在各個尺度下的模極大值和絕對平均值,構造出能完整描述UHF PD信號的特征空間;利用KPCA法將高維特征空間降到低維特征空間,解決了維數(shù)危機,消除了類內(nèi)散度矩陣的奇異性,并最大限度地保持原有信號的特性。研究結果表明,基于熵最小原則的最優(yōu)小波包變換和KPCA法獲得的信號特征均能夠較好的應用于UHF PD信號模式識別。
作者根據(jù)GIS設備絕緣缺陷放電形式和特點,設計了4種GIS模擬裝置內(nèi)局部放電物理模型[3]:分別是:高壓導體金屬突出物缺陷,簡稱N(needle)類放電模型缺陷;自由金屬微粒缺陷,簡稱 P(particle)類放電模型;絕緣子表面固定金屬微粒缺陷,簡稱M(metal)類放電模型;氣隙缺陷,簡稱G(gap)類放電模型。
將上述4種人工物理缺陷模型分別置于研制的GIS模擬裝置中[13],并充以0.5MPa的SF6與N2的混合氣體(體積比 4∶1),通過研制的內(nèi)置超高頻傳感器和高速數(shù)字采集系統(tǒng)[12-14](模擬帶寬1GHz、采樣率為20GS/s、存儲深度48MB)獲取UHF PD信號的數(shù)據(jù)和波形。實測放電波形如圖1所示。
圖1 4種缺陷的UHF PD信號Fig.1 UHF PD signals of four insulated defects
小波包分解是一種更加精細的離散小波變換,對頻帶進行多層次劃分,對每一節(jié)點系數(shù)采用近似值矢量分離法分解成兩部分,從而得到完整的二進樹。雙尺度方程可以定義為式中,h(k),g(k)為共軛濾波器組;W1,0(t)為尺度函數(shù);W1,1(t)為小波函數(shù)。每一節(jié)點(j,n)的小波包系數(shù)(Wavelet Packet Coefficients,WPC)由時間序列x(t)計算得到
WPC{Cj,n(k)}包含了重構信號的所有信息,其平方值代表了小波包樹特定子帶中信號的能量。
本文采用db系列小波包對UHF PD信號進行分解,分解層數(shù)4層,最優(yōu)小波基的選擇采用熵最小原則,且花費函數(shù)為Shannon熵[10]。對于離散的時間序列 x = (x1,x2,… ,xN),Shannon熵定義如下:
當 xi=0,則有M(x)反映了時間序列能量集中的程度,其最優(yōu)小波包基快速搜索算法如下:
(1)對已進行歸一化處理了的UHF PD信號的數(shù)學模型,采用小波包函數(shù)進行4層小波包分解,并計算出各節(jié)點的Shannon熵值。
(2)對最低層的各節(jié)點作標記,而對其他各層節(jié)點不作標記。
(3)將每層從左至右每兩個節(jié)點構成一組,由下往上進行相鄰兩層的下一層每組的兩個節(jié)點之和與上一層對應節(jié)點的熵值比較。
(4)若下一層的兩個節(jié)點的Shannon熵和大于等于上一層對應節(jié)點的Shannon熵值,則對上一層的該節(jié)點作標記,而去掉下一層的該兩個節(jié)點的標記;否則,以下一層該兩個節(jié)點的Shannon熵之和取代上一層的該節(jié)點的Shannon熵值,但對標記不作處理。
(5)從下往上對相鄰兩層按上述過程逐層進行比較,直至所有層均處理完畢。被作上標記的所有節(jié)點所對應的小波包函數(shù)即是搜索到的最優(yōu)小波包基。
針對GIS中4種常見缺陷研制的物理模型,作者采用5階高斯函數(shù)構建了相應的數(shù)學模型[12],其數(shù)學表達式為
式中,參數(shù)ai表示波峰的高度;bi表示波峰所在位置的橫坐標x的值;ci反映了波峰的陡度;n表示放電脈沖極值的個數(shù);對應參數(shù)值參見文獻[12]。
作者選用了 db系列小波構成的小波包并采用Shannon熵對GIS內(nèi)4種典型缺陷對UHF PD數(shù)學模型進行4層分解后得到了最優(yōu)小波包基。圖2分別表示了以db4小波包為例經(jīng)分解后得到的最優(yōu)小波包基。從圖中可以看出,對于不同的信號,即使采用同一小波包進行分解,所得到的最優(yōu)小波包基也可能是不同的。
圖2 4種缺陷的UHF PD數(shù)學模型的最優(yōu)小波包基Fig.2 Best basis of wavelet packet for UHF PD mathematical models of four insulated defects
UHF PD信號經(jīng)過快速最優(yōu)小波包基選取后,使信號的能量更加集中,在“最佳”頻率分片上得到一系列的小波包系數(shù),這些系數(shù)完備地描述了信號的特征,因而可以用作分類的特征子集。信號經(jīng)m層小波包分解后,原UHF PD信號的能量被分解到 2m個正交頻帶上,信號在各頻帶上的能量總和與原信號的能量一致,每個頻帶內(nèi)的UHF PD信號表征原信號在該頻率范圍內(nèi)的放電信息。因此,可將 UHF PD信號在各頻帶投影序列的能量或與能量對應的值作為特征矢量。另外,Mallat證明[10]了當各個尺度下的模極大值已知時,可利用投影迭代法恢復各尺度的子波變換值,從而完全實現(xiàn)原信號的重建。這表明利用各個尺度下的極大值作特征具有信息不丟失的優(yōu)點,因而有望取得較高的識別能力。此外,每個尺度下小波包系數(shù)的統(tǒng)計特征也是工程上常用的特征之一[15]。在本文的研究中,綜合選用了 UHF PD信號在各頻帶投影序列的能量、在各個尺度下的模極大值和絕對平均值完整地構造了其特征空間。但是該特征空間的特征維數(shù)仍然非常多,如果都作為識別的特征量,勢必嚴重降低分類器的性能,而且很不適合實時應用的場合,因此必須進行降維處理,以除去那些對分類沒有太多貢獻的特征,同時可以用較低維數(shù)的向量作為分類器的輸入向量,從而簡化分類器的設計,并提高其識別能力。
PCA是一種基于目標統(tǒng)計特性的最佳正交變換,具有提取模式中具有最大描述特征的能力,然而PCA是一種線性算法,只考慮數(shù)據(jù)中的二階統(tǒng)計特性,當UHF PD信號特征存在著大量非線性關系時,已經(jīng)不能滿足要求。因此,本文采用PCA與核學習方法的有機融合而形成的KPCA不僅特別適合處理非線性問題,而且能夠提供更多的信息。
KPCA的基本思想是通過一個非線性映射,將輸入數(shù)據(jù)映射到一個高維特征空間,再在特征空間上進行線性主成分分析。設輸入數(shù)據(jù) xk被映射為Φ(xk) 假設它們已被中心化,即滿足
式中, xk(k = 1,… ,N) 是N個輸入訓練樣本;Φ(xk)是變換后的訓練樣本。
映射后訓練樣本的協(xié)方差矩陣C為
求解下列特征方程:
式中,α1,…,αi為常數(shù)。
定義一個N×N的矩陣K
稱 K為核矩陣。將式(7)、式(9)和式(10)代入式(8)得
這樣求解式(8)的特征向量v的問題就轉(zhuǎn)化為求特征方程(11)的特征向量α。由式(10)可知核矩陣K是對稱、半正定方陣,且它的特征值將是非負的。通過對特征方程(11)的求解,可得到一組非零特征值λj以及對應的滿足歸一化條件(12)的特征矢量 αj(j=1,…,N)。
設x是一檢驗樣本,則其在vj上的投影為
這樣就可得到原始信號的投影特征矢量。
采用第2節(jié)所述試驗得到的UHF PD信號為樣本,該樣本由4種放電缺陷模型在不同條件下測得,每類同種條件下均有100個有效放電樣本,取其中50個樣本作為訓練樣本,其余 50個為測試樣本。因此,N類樣本數(shù)為3200,P類樣本數(shù)為1200,M類樣本數(shù)為1600,G類樣本數(shù)為1600。
將歸一化處理后訓練樣本按照第3節(jié)介紹的方法經(jīng)最優(yōu)小波包變換后,得到一系列的小波包系數(shù),計算出UHF PD信號在各頻帶投影序列的能量、在各個尺度下的模極大值和絕對平均值,構造出其特征空間分別用 x1,…,xN來表示。然后利用第 4.1節(jié)的KPCA法從特征空間中抽取核主成分特征,采用高斯核函數(shù),其表達式為
式中,參數(shù) σ= 0.3×N ,N為原始輸入空間的維數(shù)。
圖3為4種GIS典型缺陷歸一化的最大特征值遞減示意圖。圖中n代表第n個特征量。通過計算可得前 20個特征值對應的累計方差貢獻率達到了87.5%以上,這樣既減少了計算機的存儲量,又大大縮短計算時間。然后將訓練樣本向該特征向量構成的空間投影,這些投影值構成原測試樣本經(jīng)KPCA提取后的新特征向量,作為分類器的輸入進行模式識別。
圖3 歸一化特征量遞減示意圖Fig.3 Sketch map of normalized descending features
按照上述方法和步驟采用db系列最優(yōu)小波包4層分解對UHF PD信號提取的特征向量進行放電模式識別,分類器選用了徑向基函數(shù)神經(jīng)網(wǎng)絡,訓練方法為正交最小二乘法,結果如下表所示。
表 UHF PD信號識別率Tab. Recognition rate of UHF PD signals
由上表看出,識別率均在 75%以上,其中采用db3、db4最優(yōu)小波包對UHF PD信號分解識別率最高,均在85%以上。這是因為:當支集長度不消失矩太低時,不利于信號能量的集中;當支集長度太長時則會產(chǎn)生邊界問題。另外,N類和M類缺陷識別率高于P類和G類缺陷的識別率。這是由于對于自由金屬微粒缺陷(P類)存在的狀態(tài)比較復雜,隨著外加電壓的變化,自由金屬微粒缺陷有可能處于靜止、起跳、舞動等不同運動狀態(tài),因此測量數(shù)據(jù)具有一定的分散性;對于氣隙缺陷(G類)來說,主要是由于產(chǎn)生氣隙缺陷的絕緣子在多次放電后,有數(shù)次擊穿并伴有輕微炭化現(xiàn)象,因此導致對該缺陷所采集的波形發(fā)生較大的變化,從而導致識別率下降。
(1)根據(jù)UHF PD的特點,提出一種適合UHF PD模式識別特征提取的新方法。在 GIS內(nèi)典型缺陷UHF PD數(shù)學模型上,分別采用熵最小原則選取最優(yōu)小波包基,綜合選用了UHF PD信號在各頻帶投影序列的能量分部特征、在各個尺度下的模極大值和絕對平均值,構造出能完整描述UHF PD信號的特征空間,并用KPCA法從特征空間中成功提取了GIS內(nèi)UHF PD信號特征量。
(2)采用Shannon熵最小原則法選取最優(yōu)小波包,使UHF PD信號能量更加集中,并用最優(yōu)小波包系數(shù)得到了UHF PD信號在各頻帶投影序列的能量、在各個尺度下的模極大值和絕對平均值完整地描述UHF PD信號的特征。
(3)利用KPCA法對特征空間進行特征壓縮,解決了維數(shù)危機,成功地提取了UHF PD信號的特征向量,對實驗室獲取的UHF PD信號數(shù)據(jù)的識別效果證明了KPCA法選取UHF PD信號特征量是可行的。同時,用db4最優(yōu)小波包對UHF PD信號進行分解所得到的小波包系數(shù)具有85.5%以上的識別率。
[1] 邱毓昌. GIS裝置及其絕緣技術[M]. 北京: 水利電力出版社, 1994.
[2] 邱昌容, 王乃慶. 電工設備局部放電及其測試技術[M]. 北京: 機械工業(yè)出版社, 1994.
[3] 唐炬. 組合電器局放在線監(jiān)測外置傳感器和復小波抑制干擾的研究[D]. 重慶: 重慶大學, 2004.
[4] 成永紅, 謝小軍, 陳玉, 等. 氣體絕緣系統(tǒng)中典型缺陷的超寬頻帶放電信號的分形分析[J]. 中國電機工程學報, 2004, 24(8): 99-102. Cheng Yonghong, Xie Xiaojun, Chen Yu, et al. Study on the fractal characteristics of ultra-wide band partial discharge in gas-insulated system(GIS) with typical defects[J]. Proceedings of the CSEE, 2004, 24(8): 99- 102.
[5] Hans Gerd Kranz. PD pulse sequence analysis and its relevance for on-site PD defect identification and evaluation[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2005, 12(2): 276-284.
[6] Sahoo N C, Salama M M A. Trends in partial discharge pattern classification: a survey[J]. IEEE Transactions on Dielectrics and Electrical Insulation, 2005, 12(2): 248-263.
[7] 劉云鵬, 律方成, 李成榕. 局部放電灰度圖像數(shù)學形態(tài)譜的研究[J]. 中國電機工程學報, 2004, 24(5): 179-183. Liu Yunpeng, Lv Fangcheng, Li Chengrong. Study on pattern spectrum of partial discharge grayscale image [J]. Proceedings of the CSEE, 2004, 24(5): 179-183.
[8] 肖燕, 黃成軍, 郁惟鏞,等. 波形匹配追蹤算法在多局放脈沖提取中的應用[J]. 中國電機工程學報, 2005, 25(11): 157-162. Xiao Yan, Huang Chengjun, Yu Weiyong, et al. Application of wavelet-based matching pursuits algorithm to multiple partial discharge pulses extraction [J]. Proceedings of the CSEE, 2005, 25(11): 157-162.
[9] 王國利, 鄭毅, 郝艷捧, 等. 用于變壓器局部放電檢測的超高頻傳感器的初步研究[J]. 中國電機工程學報, 2002, 22(4): 154-160. Wang Guoli, Zheng Yi, Hao Yanpeng, et al. Study on the Ultra-high-frequency sensor for PD detection in power transformer[J]. Proceedings of the CSEE, 2002, 22(4): 154-160.
[10] Stephane Mallat. 信號處理的小波導引[M]. 楊力華,戴道清, 黃文良, 等譯, 北京: 機械工業(yè)出版社, 2002.
[11] 孔銳, 施澤生, 郭立,等. 利用組合核函數(shù)提高核主分量分析的性能[J]. 中國圖象圖形學報, 2004, 9(1): 40-45. Kong Rui, Shi Zesheng, Guo Li, et al. Improving performance of kernel principal component analysis using combination kernel functions[J]. Journal of Image and Graphic, 2004, 9(1): 40-45.
[12] 周倩, 唐炬, 唐銘, 等. GIS內(nèi)4種典型缺陷的局部放電超高頻數(shù)學模型構建[J]. 中國電機工程學報, 2006, 26(8): 99-105. Zhou Qian, Tang Ju, Tang Ming, et al. Mathematical model of four typical defects for UHF partial discharge in GIS[J]. Proceedings of the CSEE, 2006, 26(8): 99-105.
[13] 孫才新, 許高峰, 唐炬, 等. 以盒維數(shù)和信息維數(shù)為識別特征量的GIS局部放電模式識別方法[J]. 中國電機工程學報, 2005, 24(2): 100-104. Sun Caixin, Xu Gaofeng, Tang Ju, et al. PD pattern recognition method using box dimension and information dimension as discriminating features in GIS[J]. Proceedings of the CSEE, 2005, 24(2): 100- 104.
[14] 孫才新, 許高峰, 唐炬, 等. 檢測 GIS局部放電的內(nèi)置傳感器的模型及性能研究[J]. 中國電機工程學報, 2004, 24(8): 89-94. Sun Caixin, Xu Gaofeng, Tang Ju, et al. Model and performance of inner sensors used for partial discharge detection in GIS[J]. Proceedings of the CSEE, 2004, 24(8): 89-94.
[15] 張曉文, 楊煜普, 許曉鳴. 基于小波變換的特征構造與選擇[J]. 計算機工程與應用, 2003, 19: 25-28. Zhang Xiaowen, Yang Yupu, Xu Xiaoming. Wavelet based feature representation[J]. Computer Engineering and Applications, 2003, 19: 25-28.
Feature Extraction for Partial Discharge Signals Based on the Optimal Wavelet Packet Basis Transform and Kernel Principal Component Analysis
Tang Ju1Xie Yanbin1Zhou Qian2Zhang Xiaoxing1
(1. State Key Laboratory of Power Transmission Equipment & System Security and New Technology Chongqing University Chongqing 400044 China 2. Chongqing Jiangbei Power Supply Bureau Chongqing 401147 China)
Ultra-high frequency (UHF) method has been widely used for partial discharge (PD) detection in gas insulated switchgear (GIS), but the feature extraction for UHF PD signals is a difficult issue all the while. In this paper, a method using wavelet packet transform (WPT) is proposed to decompose the UHF PD signals, and the best basis is selected using minimum entropy criterion based on UHF PD mathematical model of four typical defects in GIS, then the energy in each frequency range, maximal values of module and absolute average values in each scale are computed according to WP coefficients, and the features space is constructed integrally; Kernel principal component analysis (KPCA) is also proposed for reducing dimension of features, and dimension crisis is resolved well, and the divergence matrix strangeness in every class is eliminated. At the same time, the characteristics of signals are retained the farthest. The classification results show that the features used in this paper are quite well for UHF PD defect identification.
Partial discharge, feature extraction, best wavelet packet basis, kernel principal component analysis
TM835
唐 炬 男,1960年生,博士,教授,博士生導師,主要從事電氣設備絕緣在線監(jiān)測及故障診斷研究。
國家重點基礎研究(973計劃)(2009CB724506)和國家自然科學基金(50777070)資助項目。
2009-11-05 改稿日期 2009-03-12
謝顏斌 男,1980年生,博士研究生,主要從事 GIS設備在線監(jiān)測及信號處理研究。