楊 帆,王干軍,彭小圣,文勁宇,陳清江,楊光垚,李朝暉
(1. 華中科技大學 電氣與電子工程學院 強電磁工程與新技術國家重點實驗室,湖北 武漢 430074;2. 廣東電網公司中山供電局,廣東 中山 528400)
高壓電纜是電力系統(tǒng)重要的電力設備,其運行狀態(tài)影響著電網供電的安全性與可靠性[1]。然而由于設計缺陷、安裝過程中的工藝缺陷、外力破壞、水樹入侵等因素,電纜系統(tǒng)中不可避免地會產生絕緣缺陷[1-2]。局部放電PD(Partial Discharge)既是絕緣劣化的主要原因,又是電纜絕緣缺陷和絕緣老化的重要表征[2]。電纜絕緣缺陷形式多樣,不同缺陷類型引發(fā)的PD具有不同的表現(xiàn)形式,對設備安全運行的影響以及絕緣的危害程度也不同[3-4]。準確識別出電纜PD類型進而判斷絕緣缺陷類型有著十分重要的意義。利用電纜不同絕緣缺陷下PD產生機理存在的差異性,通過對PD信號進行檢測和特征分析,可以識別絕緣缺陷類型,評估電纜的絕緣狀態(tài),及時發(fā)現(xiàn)故障征兆,實現(xiàn)故障預警,為制定合理的檢修計劃提供科學依據(jù)[5-6]。
不同類型的電纜絕緣缺陷誘發(fā)的PD信號具有一定的差異性,但是部分絕緣缺陷類型之間具有很高的相似度,這給電纜PD模式識別帶來了很大挑戰(zhàn)。電纜PD模式識別方面已有大量的研究成果,其中以反向傳播神經網絡(BPNN)和支持向量機(SVM)的應用較為廣泛[7-10]。傳統(tǒng)BPNN由于網絡層數(shù)限制,對大規(guī)模樣本的學習能力有限,在深層次特征提取方面存在不足[7-8]。SVM也因核函數(shù)受Mercer條件限制、規(guī)則化參數(shù)選取困難以及當識別對象類型多時計算復雜等特點,而在實際應用中具有一定的局限性[9-10]。
近年來深度學習理論引領了人工智能的前沿,以卷積神經網絡(CNN)為典型代表的深度學習算法在語音識別、圖像識別等諸多領域取得了很高的識別精度,并在電力行業(yè)也引起了研究人員的廣泛關注[11]。深度神經網絡在敏感性與魯棒性特征提取與構建方面表現(xiàn)優(yōu)異,能從海量數(shù)據(jù)中自動學習特征信息,為電纜PD模式識別帶來了新的契機。
本文提出了基于CNN的高壓電纜PD模式識別方法,首先在實驗室環(huán)境下模擬了5種電纜絕緣缺陷類型,通過加壓測試獲取了大量PD實驗數(shù)據(jù),然后提取PD瞬時脈沖,并構建了34個特征參數(shù),最后利用CNN實現(xiàn)缺陷類型的識別。為證明所提方法的有效性,本文分別研究了不同網絡層數(shù)、不同激活函數(shù)以及不同池化方式對CNN性能的影響,并在電纜絕緣缺陷識別效果方面將CNN與傳統(tǒng)的淺層分類器SVM和BPNN進行了比較,結果表明CNN在識別精度和識別速度上都具有一定的優(yōu)勢,優(yōu)于傳統(tǒng)的BPNN和SVM模式識別方法。
實驗選取實際電力系統(tǒng)中應用的11kV乙丙橡膠EPR(Ethylene Propylene Rubber)電纜進行PD測試。EPR電纜由鋁芯、內半導電層、EPR層、外半導電層、屏蔽銅帶、鋁鎧甲層及聚氯乙烯PVC(PolyVinyl Chloride)護套構成,如圖1所示。實驗采用無缺陷電纜構建5種典型的電纜絕緣缺陷[12-13]如圖2所示,圖中,各數(shù)據(jù)單位為mm。
圖1 EPR電纜樣品示意圖Fig.1 Schematic diagram of EPR cable sample
圖2 5種典型的電纜絕緣缺陷Fig.2 Five kinds of typical cable insulation defects
a. 電纜絕緣缺陷類型1:絕緣層空穴,直徑0.4mm,深2mm。通過以下方法得到:使用直徑0.4mm的鉆頭從外壁向電纜本體鉆孔,在主絕緣產生圓柱形空穴,然后將銅帶固定在空穴上,與PVC護套接觸,用以密封缺陷。
b. 電纜絕緣缺陷類型2:外半導體尖刺缺陷,直徑0.4mm,深2mm,通過將印刷電路板鉆頭插入電纜中得到。
c. 電纜絕緣缺陷類型3:外半導體非接觸性尖刺缺陷,直徑0.4mm,深2mm,通過將印刷電路板鉆頭插入電纜中得到。電纜絕緣缺陷類型3與電纜絕緣缺陷類型2的區(qū)別在于,電纜絕緣缺陷類型2中尖刺與外導體及PVC護套接觸,而缺陷類型3中的尖刺則不與外導體及PVC護套接觸。
d. 電纜絕緣缺陷類型4:電纜外護套破損,通過在電纜護套上切下面積為7mm×7mm的區(qū)域得到。
e. 電纜絕緣缺陷類型5:電纜端部沿面放電,通過將電纜樣品屏蔽銅帶的一部分暴露并接地得到。
采用結合高頻電流互感器HFCT(High Frequency Current Transformer)和IEC60270的實驗系統(tǒng)進行PD測試[12-13],實驗系統(tǒng)的連接示意圖見圖3。圖中,電壓探頭用于獲取50Hz相位信息并作為PD數(shù)據(jù)采集的觸發(fā)裝置,寬帶放大器用于將HFCT耦合到的信號調整到示波器輸入范圍(±10V)內,示波器以100MS/s(S/s為采樣點/s)的采樣率采集原始數(shù)據(jù)。
圖3 實驗系統(tǒng)原理圖Fig.3 Principle diagram of experiment system
EPR電纜樣品的長度為1.5~2m,每根電纜設置圖2所示的5種缺陷之一,然后連接到實驗系統(tǒng)進行PD測試。采樣時間長度設置為20ms,即50Hz工頻周期。
實驗電壓從0開始以1kV的步長增加到PD起始電壓,直至超過預先設定的最大電壓。對于電纜絕緣缺陷類型1、4和5,最大電壓為電纜額定電壓,即11kV。對于缺陷類型2和3,最大電壓分別為13kV和12kV。表1列出了每次PD測試的電壓水平和獲取的相應原始數(shù)據(jù)的數(shù)目。
表1 每種電纜絕緣缺陷的PD測試電壓和原始數(shù)據(jù)數(shù)目Table 1 PD testing voltage and number of original data for each cable insulation defect type
基于PD測試原始數(shù)據(jù)提取PD瞬時脈沖,獲得了5種電纜絕緣缺陷對應的PD瞬時脈沖樣本,并對每種缺陷類型各挑選了700個樣本用于后續(xù)的PD模式識別研究。5種類型缺陷的PD相位譜圖如圖4所示。從圖4可以看出,電纜絕緣缺陷類型2和3對應PD信號的混疊程度相對較大。而結合1.1節(jié)中人工缺陷的構造可知,電纜絕緣缺陷類型2和3的區(qū)別為尖刺是否與外導體及PVC護套接觸,差別較小,因而誘發(fā)的局放信號區(qū)分度較低。
圖4 HFCT耦合的5種PD信號的相位圖譜Fig.4 Phase diagram of five types of PD signals detected by HFCT
特征構建是開展模式識別的基礎。本文基于1.2節(jié)得到的3500組PD瞬時脈沖信號,從頻率、幅值、相位圖譜方面考慮并參考其他文獻中廣泛使用的特征,構建了34個PD脈沖的特征參數(shù)如下。
a. 幅值特征:放電量、峰值電壓、平均電壓、均方根值、標準差。
b. 頻率特征:脈沖寬度、上升時間、下降時間、等效時間長度[12-13]、等效寬度[12-13]、主頻、小波特征參數(shù)(ED1—ED5,EA5,Ea1—Ea5,Ed1—Ed5)。其中,小波特征參數(shù)獲取方法為:使用小波變換對信號進行5層分解,根據(jù)小波系數(shù)構造信號的小波特征參數(shù)。ED1—ED5為分解后5層信號的細節(jié)能量比參數(shù),Ea1—Ea5為分解后5層信號的全局能量比參數(shù),Ed1—Ed5為分解后5層信號的細節(jié)能量參數(shù),EA5為全局的能量比參數(shù)。
c. 相位圖譜特征:相位角。
d. 其他特征:脈沖極性、偏度、峰度、波峰因數(shù)、形狀因子、PD位置。
包括單位和示例在內的PD脈沖的特征參數(shù)的詳細信息如表2所示。
CNN是受生物視覺系統(tǒng)結構的啟發(fā)提出,能夠學習和識別視覺圖像中的特定特征和模式[11,14]。20世紀60年代,Hubel等發(fā)現(xiàn)視覺信息從視網膜傳遞到大腦進行處理由多層次的感受野激發(fā)完成[14]。1980年Fukushima第一次提出基于感受野思想的自組織多層神經網絡模型Neocognitron[14]。1998年LeCun等提出采用基于梯度的反向傳播算法進行有監(jiān)督訓練的CNN—LeNet-5[15]。2012年Krizhevsky等提出的AlexNet在ImageNet圖像分類競賽中奪冠,使得以CNN為代表的深度學習成為學術界關注的焦點[16-17]。CNN由于出色的特征提取能力已經被廣泛的應用在圖像識別、語音識別等領域。
典型CNN結構見圖5,其由輸入層、1個或多個交替連接的卷積層和池化層、全連接層以及輸出層組成[11]。CNN的輸入為二維數(shù)據(jù)矩陣,即原始圖像。
表2 PD特征Table 2 PD features
卷積層可直接從二維圖像中提取特征并形成特征圖,多個卷積層間穿插池化層能夠減小特征圖大小并逐漸建立更高程度的空間和結構不變性。經過多個卷積層和池化層的交替?zhèn)鬟f,全連接層使用所提取的特征進行預測。最后由輸出層給出識別結果。CNN本質上是使原始輸入經過多個層次的數(shù)據(jù)變換與降維而映射到一個新的特征表達的數(shù)學模型[14]。
圖5 CNN結構Fig.5 Structure of CNN
a. 卷積層。
卷積層的卷積核完成感受野的功能,可以將低層的局部區(qū)域信息通過卷積核激發(fā)到更高層次。前一層的輸入特征圖與可學習的卷積核進行卷積運算,卷積后的數(shù)據(jù)經激活函數(shù)作用后得到該層的輸出特征圖。
b. 非線性激活函數(shù)層。
激活函數(shù)用來在網絡中加入非線性,對CNN性能有著重要影響。典型的非線性激活函數(shù)有雙曲正切函數(shù)(tanh)、Sigmoid函數(shù)和ReLU函數(shù)等[17]。
Google Brain團隊提出了一種新型自門控激活函數(shù)Swish,其具備無上界有下界、平滑且非單調的特性[18]。Google Brain團隊指出,Swish在深度學習模型上的性能優(yōu)于ReLU函數(shù),訓練Swish網絡時使用稍低于ReLU網絡的學習率可取得更好效果[18]。
c. 池化層。
原始輸入特征圖包含的特征數(shù)目較多,直接使用從卷積層得到的所有特征可能會使計算開銷過大。池化操作對池化窗口內的特征進行聚合統(tǒng)計,能減小特征圖尺寸,實現(xiàn)數(shù)據(jù)降維。不同池化方法的效果存在差異。目前2種主流的池化方式為最大池化和平均池化。最大池化選取池化窗口內的最大值形成輸出特征,是現(xiàn)階段應用最廣泛的池化方式,平均池化函數(shù)則是在池化窗口內取輸入的平均值。
d. 全連接層。
在CNN架構的最后通常設置一個全連接層。該層網絡使用卷積層和池化層的輸出特征進行預測和分類。
CNN一般使用梯度下降法進行有監(jiān)督訓練。CNN中所有濾波器的權重都通過訓練過程進行迭代更新以使損失函數(shù)最小化。標準梯度下降法在整個訓練數(shù)據(jù)集上更新權重,計算開銷太大。小批量隨機梯度下降算法通過小批量訓練樣本集上的平均梯度來更新權重,可以有效減小計算代價[18]。
基于CNN的PD模式識別流程如圖6所示。首先開展5種電纜絕緣缺陷的測試實驗并收集原始數(shù)據(jù),進行數(shù)據(jù)去噪和PD脈沖提取,構建34個PD特征參數(shù)得到PD特征數(shù)據(jù)集。然后將特征數(shù)據(jù)集分為訓練集和測試集(兩者所占比重分別為85%和15%),通過在訓練集上使用小批量隨機梯度下降算法以最小化模型預測輸出和實際輸出之間的誤差來訓練優(yōu)化CNN,通過測試集來評估基于CNN的PD模式識別性能。
圖6 基于CNN的PD模式識別流程Fig.6 Flowchart of PD pattern recognition based on CNN
本節(jié)對CNN的分類性能進行評估,研究了不同網絡層數(shù)、不同激活函數(shù)和不同池化方式對PD模式識別效果的影響,并與淺層分類器BPNN和SVM進行了比較。所使用的計算機配置為:Windows 7操作系統(tǒng),Intel i5-4200M CPU,12G內存。
研究表明,CNN分類性能與網絡層數(shù)有較大相關性[19]。本文分別測試了1層、2層、3層、4層、6層和9層CNN的性能,使用的池化方式為最大池化,激活函數(shù)采用ReLU函數(shù),每層的卷積核數(shù)目均為32,卷積核大小均為3×3,測試結果見表3和圖7。
表3 不同層數(shù)CNN的識別精度Table 3 Recognition accuracy of CNN with different layers
圖7 不同網絡層數(shù)的CNN的PD模式識別誤差對比Fig.7 Comparison of PD pattern recognition error among CNN with different layers
當網絡層數(shù)減少時,CNN對樣本數(shù)據(jù)的擬合能力會降低;當網絡層數(shù)增加時,CNN的學習能力增強,但所需訓練的參數(shù)會增多,對樣本數(shù)據(jù)量的需求也會相應增大,對于小樣本數(shù)據(jù)會產生過擬合的風險[18-19]。而本文有3500個樣本,數(shù)量較少,對應的最佳網絡層數(shù)也應該較少。由圖7可知,2層CNN效果最好,不同迭代輪次的誤差率均低于其他網絡層數(shù)的CNN,并且當步數(shù)達到40時,模型誤差率降低到10.03%。
不同類型的激活函數(shù)對識別效果會產生較大的影響[18]。基于前文設計的2層CNN,本文比較了Swish函數(shù)的ReLU函數(shù)的性能,結果如圖8所示。
圖8 不同池化方式和激活函數(shù)CNN識別誤差對比Fig.8 Comparison of recognition error among CNN withdifferent pooling modes and activation functions
Swish函數(shù)無上界有下界、平滑且非單調的特點使其收斂性能好于ReLU函數(shù)。由圖8可見,使用Swish函數(shù)的CNN在不同迭代輪次的誤差均小于使用ReLU函數(shù)的CNN;在迭代至40輪的時候,采用Swish函數(shù)的識別精度比使用ReLU函數(shù)高0.7%。
基于Swish函數(shù)的2層CNN,本文還比較了最大池化和平均池化方式的性能,結果見圖8。由圖8可見,最大池化方式由于能夠提取最有表征能力的特征,相比平均池化方式具有更好的識別精度。
根據(jù)前文分析,本文最終使用的CNN架構包含2個卷積層和2個池化層,采用最大池化方式和Swish激活函數(shù),每個卷積層的卷積核數(shù)目為32,卷積核大小為3×3。CNN模式識別的混淆矩陣見表4。
表4 CNN識別混淆矩陣Table 4 Confusion matrix of CNN recognition
由表4可知,電纜絕緣缺陷類型2和3是PD模式識別誤差的主要來源,這2種類型的識別結果之間存在較大程度的混淆。電纜絕緣缺陷類型3的樣本有17.40%被誤識別為電纜絕緣缺陷類型2,電纜絕緣缺陷類型2的樣本則有18.21%被誤識別為電纜絕緣類型3,這在很大程度上降低了總體識別率。5種電纜絕緣缺陷類型中,電纜絕緣缺陷類型4和5與其他3種類型的表現(xiàn)形式差異最大,識別精度也最高,分別達到了99.07%和99.15%,這印證了1.3節(jié)中關于PD相位譜圖的分析。
本文比較了CNN與BPNN和SVM的性能,結果如表5和圖9所示。
從表5可知:3種方法中CNN的總體精度最高,達到了90.67%;SVM其次,總體精度為86.96%;BPNN最差,總體精度為86.61%;CNN方法的總體精度分別比BPNN和SVM高4.06%和3.71%。
表5 CNN、BPNN和SVM的識別精度對比Table 5 Comparison of recognition accuracy among CNN,BPNN and SVM
圖9 CNN、BPNN和SVM的識別誤差對比Fig.9 Comparison of recognition error among CNN,BPNN and SVM
由于電纜絕緣缺陷類型1、4、5的差異較為明顯,比較容易識別,CNN對三者的識別精度分別為95.37%、99.07%和99.15%,與BPNN和SVM方法相同。而電纜絕緣缺陷類型2和3的相似度較高,識別難度較大。CNN特殊的網絡結構能夠對數(shù)據(jù)特征進行深入挖掘,可以較好地捕捉細節(jié)信息并學習到更全面、更抽象的特征。CNN對電纜絕緣缺陷類型2的識別精度為80.86%,相比BPNN和SVM分別提高了3.55%和14.20%;CNN對電纜絕緣缺陷類型3的識別精度為78.90%,相比BPNN和SVM分別提高了16.51%和5.20%。
本文將CNN應用于5種高壓電纜缺陷類型的模式識別,研究了不同網絡層數(shù)、不同激活函數(shù)和不同池化方式下CNN的性能,并與傳統(tǒng)方法的識別效果進行了比較,得到的結論如下:
a. 網絡層數(shù)、激活函數(shù)、池化方式、迭代輪數(shù)對CNN的識別精度具有較大的影響,在CNN構建時,應該充分考慮這些因素;
b. 采用Swish函數(shù)的情況下,CNN的識別精度比采用ReLU函數(shù)的情況高0.70%,Swish函數(shù)無上界有下界、平滑且非單調的特點使其收斂性能好于ReLU;
c. CNN中的卷積層和池化層具有優(yōu)異的特征學習能力,可以捕捉到數(shù)據(jù)的細節(jié)特征,信息丟失少,對高相似度缺陷識別能力強、魯棒性好,對于相似度較高的電纜絕緣缺陷類型2和3的識別精度,相比SVM分別提高了14.20%和5.20%,相比BPNN分別提高了3.55%和16.51%;
d. CNN能更全面地捕捉到輸入數(shù)據(jù)表現(xiàn)的高階相關性,在頂層形成更具表征能力的高維抽象特征向量,相比傳統(tǒng)淺層分類器BPNN和SVM,總體識別精度分別提高了4.06%和3.71%。
參考文獻:
[1] WANG X,WANG C C,WU K,et al. An improved optimal design scheme for high voltage cable accessories[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2014,21(1):5-15.
[2] 王德文,劉曉建. 基于MapReduce的電力設備并行故障診斷方法[J]. 電力自動化設備,2014,34(10):116-120.
WANG Dewen,LIU Xiaojian. Parallel fault diagnosis based on Map-Reduce for electric power equipments[J]. Electric Power Automation Equipment,2014,34(10):116-120.
[3] International Electrotechnical Commission. High-voltage test techniques:partial discharge measurements:IEC60270[S]. Geneva,Switzerland:International Electrotechnical Commission,2015.
[4] 孫文星,李朝暉,程時杰,等. 一種發(fā)電機故障放電信號特征實時在線自動識別方法及其應用[J]. 電網技術,2015,39(2):543-549.
SUN Wenxing,LI Zhaohui,CHENG Shijie,et al. A real time on-line method for automatic signal feature recognition of fault discharge in generator and its application[J]. Power System Technology,2015,39(2):543-549.
[5] 魏振,齊波,左健,等. 基于局部放電圖像特征的換流變壓器油紙絕緣缺陷診斷方法[J]. 電網技術,2015,39(4):1160-1166.
WEI Zhen,QI Bo,ZUO Jian,et al. A method to diagnose defects in oil-paper insulation of converter transformer based on image feature of partial discharge[J]. Power System Technology,2015,39(4):1160-1166.
[6] 常文治,李成榕,蘇錡,等. 電纜接頭尖刺缺陷局部放電發(fā)展過程的研究[J]. 中國電機工程學報,2013,33(7):192-201,S25.
CHANG Wenzhi,LI Chengrong,SU Qi,et al. Study on development of partial discharges at the defect caused by a needle damage to a cable joint[J]. Proceedings of the CSEE,2013,33(7):192-201,S25.
[7] SCHAIK N V,CZASZEJKO T. Conditions of discharge-free operation of XLPE insulated power cable systems[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2008,15(4):1120-1130.
[8] WU M,CAO H,CAO J,et al. An overview of state-of-the-art partial discharge analysis techniques for condition monitoring[J]. IEEE Electrical Insulation Magazine,2015,31(6):22-35.
[9] 尹金良,朱永利,俞國勤,等. 相關向量機及其在變壓器故障診斷中的應用[J]. 電力自動化設備,2012,32(8):130-134.
YIN Jinliang,ZHU Yongli,YU Guoqin,et al. Relevance vector machine and its application in transformer fault diagnosis[J]. Electric Power Automation Equipment,2012,32(8):130-134.
[10] 張哲,趙文清,朱永利. 基于支持向量機的電力變壓器狀態(tài)評估[J]. 電力自動化設備,2010,30(4):81-84.
ZHANG Zhe,ZHAO Wenqing,ZHU Yongli. Power transformer condition evaluation based on support vector machine[J]. Electric Power Automation Equipment,2010,30(4):81-84.
[11] LECUN Y,BENGIO Y,HINTON G. Deep learning[J]. Nature,2015,521(7553):436-444.
[12] PENG X,WEN J,LI Z,et al. SDMF based interference rejection and PD interpretation for simulated defects in HV cable diagnostics[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2017,24(1):83-91.
[13] PENG X,WEN J,LI Z,et al. Rough set theory applied to pattern recognition of partial discharge in noise affected cable data[J]. IEEE Transactions on Dielectrics and Electrical Insulation,2017,24(1):147-156.
[14] LEE Y P. Multidimensional Hebbian learning with temporal coding in neocognitron visual recognition[J]. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2017,47(12):3386-3396.
[15] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE,1998,86(11):2278-2324.
[16] DONG C,LOY C C,HE K,et al. Image super-resolution using deep convolutional networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(2):295-307.
[17] SZEGEDY C,VANHOUCKE V,IOFFE S,et al. Rethinking the inception architecture for computer vision[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas,NV,USA:IEEE,2016:2818-2826.
[18] ELFWING S,UCHIBE E,DOYA K. Sigmoid-weighted linear units for neural network function approximation in reinforcement learning[J/OL].(2017-12-12)[2018-01-11]. https:∥doi.org/10.1016/j.neunet.2017.12.012.
[19] ZEILER M D,F(xiàn)ERGUS R. Visualizing and understanding convolutional networks[C]∥European Conference on Computer vision. Cham,Switzerland:Springer,2014:818-833.