汪 穎,盧 宏,楊曉梅,肖先勇,張文海
(1. 四川大學 電氣信息學院,四川 成都 610065;2. 國網(wǎng)四川檢修公司,四川 成都 610042)
電纜是電力系統(tǒng)輸配電線路中的重要設備,其故障過程為漸進過程,可分為電纜缺陷、電纜早期故障和電纜永久性故障3個階段。電纜在安裝后受到土壤、水分和機械應力的影響,隨著運行時間的增加,會在電纜中形成缺陷,極易出現(xiàn)局部放電、水樹枝和電樹枝現(xiàn)象,使電纜絕緣水平逐漸降低,但并未造成絕緣擊穿。隨著局部放電的增強,電纜缺陷變?yōu)樵缙诠收稀k娎|早期故障概念首先在文獻[1]中被提出,也被稱為自清除故障。本文在分析已有研究成果的基礎上[1-9],將電纜早期故障總結為:由于電纜絕緣水平的惡化產(chǎn)生局部放電,局部放電后期使電纜發(fā)生間歇性絕緣擊穿,不能引起保護動作跳閘,但可能引起電纜永久性故障的一種重復性瞬時故障。準確檢測和識別電纜早期故障,可以消除潛在故障隱患,在永久性故障發(fā)生前更換電纜,提高供電可靠性。因此,對電纜早期故障進行準確識別具有實際的意義。
對于電纜早期故障的特征,文獻[2-4]進行了相關研究。由于電纜早期故障多發(fā)生在電纜接頭,文獻[2]通過電纜接頭故障時記錄的饋線電壓和電流波形,對電纜早期故障特征進行分析。文獻[3-4]同時記錄了電纜早期故障和由早期故障導致的永久性故障波形,分析后發(fā)現(xiàn)在永久性故障前會重復出現(xiàn)早期故障。因此電纜早期故障的特征可歸納為:電纜中同一相發(fā)生永久性故障的先兆;通常發(fā)生在電壓峰值時刻;按故障持續(xù)時間長短可分為半周期早期故障和多周期早期故障,前者持續(xù)時間約為1/4個周期,后者持續(xù)時間約為1~ 4個周期[5];不會引起保護裝置動作;多為單相接地故障。
電纜早期故障的特征決定了其電壓和電流波形,故障多發(fā)生在電壓峰值附近,是因為此時電纜絕緣體上的電壓應力最大[4],更容易造成絕緣擊穿。當電纜發(fā)生早期故障時,電纜中出現(xiàn)間歇性電弧,使故障相電流瞬時增大,同時使故障相電壓迅速下降,非線性高奇次諧波的存在使得故障相電壓波形類似于失真的方波[3]。但電弧的持續(xù)時間很短,電弧電流會在交流電流過零點自動熄滅,早期故障被清除,電纜電流和電壓重新恢復正常。
目前針對電纜早期故障的檢測識別已有大量研究[5-9]。文獻[5]利用小波變換對電流信號進行分解,通過發(fā)生故障時的能量和均方根值檢測過電流擾動,再利用設定的閾值識別電纜早期故障。但由于電纜中類似過電流擾動很多,誤檢測率高。文獻[6]采用人工神經(jīng)網(wǎng)絡方法,對電容投切信號和電纜早期故障信號進行諧波分析,選取時域特征向量,通過構造人工神經(jīng)網(wǎng)絡分類器進行分類識別。文獻[7]結合小波變換和灰色關聯(lián)分析方法,利用小波判據(jù)對電纜中的過電流擾動進行檢測,并構造了時域特征向量和參考樣本,通過計算兩者之間的灰色關聯(lián)度,判定關聯(lián)度最大的信號為電纜早期故障。文獻[8]將電弧電壓引入對電纜早期故障的檢測中,假設早期故障為電弧故障,利用電弧電壓畸變的特點,計算了故障電壓總諧波畸變率,將故障電壓總諧波畸變率與參考值進行比較,判斷是否為電纜早期故障。文獻[9]利用高壓電纜具有金屬護套的特點,假設電纜護套為單端接合,通過單端護套電流的總和來檢測早期故障?,F(xiàn)有的分析方法中,小波變換容易受噪聲影響,文獻[8]和文獻[9]分別以電弧故障和電纜護套單端接合假設為前提,在實際電力系統(tǒng)運行過程中,條件變化可能導致上述方法不再適用。
現(xiàn)代電力系統(tǒng)中信號采集裝置的大量安裝為實現(xiàn)錄波數(shù)據(jù)分析、提取電纜早期故障信號提供了可能,如故障錄波儀、電能質量監(jiān)測儀等,可以準確地記錄擾動波形,通過分析擾動波形數(shù)據(jù)和深度學習,可以識別電纜早期故障。深度學習網(wǎng)絡是含有多個隱藏層的網(wǎng)絡結構,相比傳統(tǒng)模式識別方法[10-14]可以更深入地進行數(shù)據(jù)挖掘,發(fā)現(xiàn)隱藏特征,目前已經(jīng)廣泛應用于故障的檢測中[15-17],并取得了較好的效果。
本文基于對電纜過電流擾動的研究[8],將深度學習引入早期故障識別中,提出一種堆疊自動編碼器SAE(Stacked AutoEncoder)與S變換相結合的電纜早期故障識別算法。由于早期故障信號經(jīng)過S變換后空間維數(shù)高、數(shù)據(jù)量大,本文對S變換后求得的模時頻矩陣進行進一步的處理,提取S變換能量熵SEE(S-transform Energy Entropy)和S變換奇異熵SSE(S-transform Singular Entropy)等特征量,利用SAE網(wǎng)絡對特征量進行建模,將特征量作為網(wǎng)絡的輸入,最后完成對電纜早期故障和其他過電流擾動(如電容投切、恒定阻抗故障和變壓器激磁涌流引起的過電流擾動)的分類識別。將本文算法與傳統(tǒng)模式識別方法進行比較,結果證明本文算法具有更高的故障識別準確率。
S變換解決了短時傅里葉變換中窗口寬度和高度固定不變的問題,具有良好的頻率和時間分辨率,且不易受噪聲的干擾,非常適合對電纜早期故障和其他過電流擾動信號進行分析。
Stockwel在1996年將短時傅里葉變換與小波變換相結合,提出了S變換[18]的思想。對于一個連續(xù)時間信號g(t),其對應的S變換為:
exp(-j2πft)dt
(1)
其中,τ為時間,表示控制高斯窗口在時間軸上位置的參數(shù);f為頻率。
S變換函數(shù)與傅里葉變換函數(shù)具有一定的關系,這使得S變換可以利用g(t)的傅里葉變換G(f)來達到快速運算的目的。其關系式如下:
exp(j2πστ)dσf≠0
(2)
設g[iT](i=0,1,…,S-1)表示以T為采樣間隔對連續(xù)時間信號g(t)采樣得到的離散時間序列(其中,S為總采樣點數(shù)),則可以得到該序列的離散傅里葉變換為:
(3)
其中,s1為離散后的采樣點,s1∈[0,S)。
令式(2)中的f=s1/(ST)、τ=s2T(s2為離散后的采樣點,s2∈[0,S)),可以得到離散時間序列g[iT]的S變換為:
(4)
通過對信號進行S變換,可以得到S變換矩陣,它是一個復時頻矩陣,矩陣的列表示時間、行表示頻率。
對信號的S變換矩陣取模,獲得模時頻矩陣,但變換后的矩陣仍然具有很大數(shù)據(jù)量和信息量,在將其直接輸入SAE網(wǎng)絡的過程中,可能引起訓練時間過長等問題,不利于進行分類識別,因此可對原始數(shù)據(jù)進行處理,提取初始特征向量。由于電纜早期故障信號在不同頻段的信息不同,對選取的樣本進行S變換后,令S變換模時頻矩陣為M×N階矩陣H,其中第i行第j個元素為Hij,按照H的行數(shù)將矩陣分為低頻段、中頻段和高頻段[19]。本文基于熵的理論和奇異值分解理論,分別對不同頻段的矩陣進行分析,提取用于識別電纜早期故障的初始特征向量,再利用SAE網(wǎng)絡進一步挖掘初始特征向量中的隱藏信息。
(5)
利用SSE衡量低、中、高頻段信號的復雜程度。根據(jù)奇異值分解理論,可將低頻段的矩陣Hl∈RMl × N(其中,Ml=M2-M1)轉化為一個對角矩陣Λ,其奇異值分解為:
Hl=UΛVT
(6)
其中,U和V分別為Ml×Ml階和N×N階正交矩陣;Λ的對角線元素為奇異值λk(k=1,2,…,Ml),可以表示對應時間和頻率上信息量的大小。相應地,低頻段的SSEESl定義如下:
(7)
同理,可以計算中、高頻段的SSEESm和ESh。
由于矩陣經(jīng)過奇異值分解后獲得的奇異值是衰減的,利用式(8)、(9)分別表示不同頻段的信息量大小。
L1=λlmax-λmmax
(8)
L2=λmmax-λhmax
(9)
其中,L1為低頻段與中頻段最大奇異值之差;L2為中頻段與高頻段最大奇異值之差。當信號越集中于某一頻段時,該頻段有最大的奇異值。
同時選取矩陣H的低、中、高頻段模最大值Hlmax、Hmmax、Hhmax作為特征量,組成包含11個時頻域特征量的向量X。
X={EEl,EEm,EEh,ESl,ESm,ESh,Hlmax,Hmmax,
Hhmax,L1,L2}
(10)
利用大量的擾動波形數(shù)據(jù)進行故障識別需要從原始數(shù)據(jù)中提取有效的初始特征量。因此本文擬采用S變換對信號進行處理,提取初始特征量,將提取出的這11個初始特征量作為SAE網(wǎng)絡的輸入,通過深度學習,獲得更高層次和抽象的特征,進而實現(xiàn)電纜早期故障的識別。
深度學習作為深層的神經(jīng)網(wǎng)絡[20],相對于傳統(tǒng)的淺層網(wǎng)絡,可以無限堆疊,通過增加網(wǎng)絡的隱藏層數(shù)目,以及逐層初始化和提取特征,實現(xiàn)復雜高維函數(shù)的表示,提高分類和預測的準確性。目前深度學習模型有深度置信網(wǎng)絡、卷積神經(jīng)網(wǎng)絡和SAE[21]等。本文主要研究SAE在電纜早期故障識別中的應用。
圖1 AE結構圖Fig.1 Structure of AE
自動編碼器[22](AE)的結構是一個3層神經(jīng)網(wǎng)絡,包括輸入層、隱藏層和輸出層,如圖1所示。AE的訓練過程由編碼過程和解碼過程構成,當數(shù)據(jù)輸入AE網(wǎng)絡后,該網(wǎng)絡就自動進行編碼操作,將輸入數(shù)據(jù)X∈Rn×1編碼成Y∈Rm×1,Y再經(jīng)過解碼操作變成Z∈Rn×1。在實際訓練中,輸出相當于是輸入的復現(xiàn),AE的編碼和解碼過程可分別用式(11)和式(12)表示。
Y=f1(W1X+b1)
(11)
Z=f2(W2Y+b2)
(12)
其中,f1和f2為激活函數(shù),本文采用的是sigmoid函數(shù);Y為隱藏層;Z為輸出層;W1和W2分別為編碼矩陣和解碼矩陣;b1和b2為偏置向量。
在網(wǎng)絡的訓練過程中,要選擇一個目標函數(shù)體現(xiàn)模型性能的優(yōu)劣,其中涉及對目標函數(shù)的優(yōu)化。在深度學習過程中,AE的訓練目標是盡可能地使輸出Z等于輸入X,通常采用均方誤差構造代價函數(shù),即:
(13)
求解該代價函數(shù),獲得表征輸入信號特征Y的參數(shù)(W,b)。
選擇的激活函數(shù)為sigmoid函數(shù)時,由于其輸出映射在0~1之間,因此在訓練過程中,當神經(jīng)元輸出為1時,表示被激活;當神經(jīng)元輸出為0時,表示未被激活。當隱藏層數(shù)目較多時,為了使大多數(shù)情況下隱藏層神經(jīng)元不被激活,可以采用稀疏性限制。假設yj(xi)表示隱藏層第j個單元的激活量,則隱藏層第j個單元的平均激活量為:
(14)
(15)
(16)
SAE是由多個AE堆疊形成的深度學習網(wǎng)絡,由1個輸入層、多個隱藏層和1個輸出層構成。SAE的輸入層來自于第1層AE的輸入層X1,第1層AE訓練完后獲得的隱藏層輸出Y1用作第2層AE的輸入層,也構成SAE的第1個隱藏層;第2層AE訓練完后獲得的隱藏層輸出Y2用作第3層AE的輸入層,也構成SAE的第2個隱藏層。依此類推,最后一層的AE的輸出層作為SAE的輸出層,從而構建出SAE深度網(wǎng)絡。圖2為一個由3個AE堆疊形成的SAE網(wǎng)絡。
圖2 SAE生成過程Fig.2 Process of constructing SAE
SAE的訓練過程包括有監(jiān)督訓練和無監(jiān)督訓練2個過程。無監(jiān)督訓練過程為預訓練過程,通過無標記數(shù)據(jù)從第1層開始訓練整個網(wǎng)絡,得到各層網(wǎng)絡的參數(shù);無監(jiān)督訓練過程為從輸出層到輸入層的有監(jiān)督訓練,通過有標記數(shù)據(jù)對第1步獲得的參數(shù)進行微調,提高網(wǎng)絡的識別性能。在SAE的訓練過程中,采用隨機梯度下降法,通過式(17)和式(18)完成對參數(shù)θ=(W,b)的更新。
(17)
(18)
在本文中,輸出類別只包含2類,即電纜早期故障和非電纜早期故障(其他過電流擾動),是一個二元分類問題。訓練完SAE網(wǎng)絡后,采用softmax回歸對輸出結果進行分類識別。訓練集由{(x1,y1),(x2,y2),…,(xn,yn)}組成,xi為輸入樣本;yi為對應輸入樣本xi的標簽,取值為0或1,yi=1表示電纜早期故障,yi=0表示非電纜早期故障。對于輸入的測試集數(shù)據(jù)xi,可利用函數(shù)計算它屬于每種類別yi=j(j=0,1)的概率值p(yi=j|xi),此時假設函數(shù)為:
(19)
其中,θ1和θ2分別為softmax回歸模型中第1種和第2種類別對應的輸入?yún)?shù)。
本文基于SAE和S變換提出一種深度學習的方法,利用SAE網(wǎng)絡,從電纜眾多的過電流擾動中,識別電纜早期故障,具體流程如圖3所示。
圖3 基于S變換和SAE的算法流程圖Fig.3 Flowchart of proposed method based on S transform and SAE
a. 在PSCAD/EMTDC中搭建仿真模型,獲得不同擾動的樣本數(shù)據(jù)。由于在設備發(fā)生故障時,電流波形的變化更為明顯。在實際運行中,選擇變電站端饋線測量電流作為原始數(shù)據(jù)。樣本數(shù)據(jù)包括半周期電纜早期故障和多周期電纜早期故障,及其他不屬于電纜早期故障的過電流擾動,如變壓器激磁涌流、恒定阻抗故障、電容器投切引起的過電流擾動等。
b. 對獲得的樣本數(shù)據(jù)在MATLAB中進行S變換,求得各種情況下的S變換模時頻矩陣,計算對應的11個特征量。
c. 通過無監(jiān)督的預訓練和有監(jiān)督的微調完成SAE網(wǎng)絡的搭建。預訓練可以學習到輸入信號的復雜非線性變換,微調過程可提高網(wǎng)絡的識別精度,這2個過程保證了SAE網(wǎng)絡可以從原始輸入信號中挖掘有效特征,并且建立輸入信號與實際類別的非線性映射關系。
d. 利用測試樣本和softmax回歸來測試訓練好的SAE網(wǎng)絡的性能,輸出分類識別結果。
本文用于驗證所提出方法的數(shù)據(jù)集在PSCAD/EMTDC系統(tǒng)中獲得,搭建了25 kV無支路電纜故障線路模型如圖4所示(圖中,D為設置的故障距離),采樣頻率為10 kHz。
圖4 電纜線路故障模型Fig.4 Model of cable line with fault
在電網(wǎng)中,除電纜早期故障外,還存在其他過電流擾動類別,在仿真中考慮了變壓器激磁涌流、恒定阻抗故障、電容器投切。仿真樣本分布情況如表1所示。不同早期電纜故障和過電流干擾下的饋線電流波形圖如圖5所示,其與文獻[2-4]中現(xiàn)場記錄的電纜早期故障波形一致。由于圖5中的所有故障或干擾類型都會造成電流增大,因此采用第1節(jié)所提出的基于S變換的特征提取方法,提取波形的11個初始特征量,并對它們全部進行歸一化處理,限制在[0,1]范圍內。
表1 仿真樣本分布情況Table 1 Distribution of simulation samples
圖5 不同電纜早期故障和過電流干擾下的饋線電流波形圖Fig.5 Feeder current waveforms under different cable incipient faults and over-current interferences
實際類別實驗分類類別電纜早期故障非電纜早期故障電纜早期故障TPFN非電纜早期故障FPTN
為了評估模型的性能,對于本文中出現(xiàn)的二元分類問題,以混淆矩陣的形式表示按照實際類別和通過實驗分類得到的類別結果。表2是電纜早期故障類型識別的混淆矩陣,表中TP、TN和FP、FN分別為電纜早期故障和非電纜早期故障樣本分類正確和分類錯誤的數(shù)量。
通過表2可以得到以下評估模型性能的指標。
a. 準確率Paccuracy:實驗分類類別和實際類別一致的樣本占總樣本的比例。
(20)
b. 精確率Pprecision:實驗分類為電纜早期故障的樣本中,實際類別為電纜早期故障的樣本所占的比例。
(21)
c. 召回率Precall:實驗分類且實際類別為電纜早期故障樣本占所有實際類別為電纜早期故障樣本的比例。
(22)
d.F1評價指標:由于實際情況中要進行分類的類別可能存在不平衡的問題,僅靠準確率評估是不行的,于是引入F1評價指標[23],它表示精確率和召回率的調和均值,如式(23)所示。
(23)
e. ROC曲線是利用分類的真正率TPR(True Positive Rate)和假正率FPR(False Positive Rate)作為坐標軸,利用圖形化的形式來表示分類方法的準確率的高低,曲線與坐標軸的面積(AUC)可以用于表示分類模型準確率的高低。
本節(jié)采用相同的訓練和測試樣本,將本文方法與支持向量機(SVM)[10]法、K近鄰(KNN)算法[11]、集成學習(JC)法[12]和隨機森林(RF)算法[13]進行比較。
圖6為本文方法、SVM法、KNN算法、JC法[12]和RF算法[13]的ROC曲線。從圖6可以看出,本文方法的曲線與坐標軸的面積最大,準確率更高,分類效果比其他方法更好。
圖6 不同方法的ROC曲線Fig.6 ROC curves of different methods
表3為具體的比較結果,從表中可以得出本文方法的Paccuracy可達到98.8%,比JC法、SVM法、KNN法分別高出12.1%、25.5%、31.3%;RF利用了多個決策樹投票得出最后的分類結果,比其他3種模式識別方法更好,但與本文的方法相比,仍有一定的差距。本文方法還具有更高的F1(98.5%)、Pprecision(98.7%)、Precall(98.9%)和AUC(0.974),比其他4種傳統(tǒng)模式識別方法更優(yōu)越。這是因為SAE可以通過多特征的變換自動地從初始特征向量中學習到更有價值的信息,能在眾多過電流擾動中準確識別出電纜早期故障。
表3 不同方法的比較結果Table 3 Comparison among different methods
理論上,訓練SAE網(wǎng)絡時,迭代次數(shù)越多,最后得到的誤差會更小,因此本節(jié)考慮了深度學習模型訓練過程中迭代次數(shù)的影響,如圖7所示。由圖可見,當?shù)螖?shù)小于2 000次時,準確率很低,只有58.3%;此后隨著迭代次數(shù)增加,準確率上升,當次數(shù)為6 000時,準確率已經(jīng)為91.7%,當次數(shù)大于10 000 時,準確率為98.8%,之后不再變化,因此本文取迭代次數(shù)為10 000次。
圖7 迭代次數(shù)對結果的影響Fig.7 Impact of iterations number on results
與直接利用原始數(shù)據(jù)作為SAE網(wǎng)絡的輸入相比,本文方法基于S變換與熵理論,提取了初始時頻域特征向量,最大的優(yōu)點是使輸入數(shù)據(jù)的維數(shù)和SAE網(wǎng)絡的復雜程度降低,減少了仿真時間。采用相同的SAE網(wǎng)絡測試基于S變換提取的特征和原始數(shù)據(jù),結果如表4所示。
表4 提取特征向量與原始時域數(shù)據(jù)的比較結果Table 4 Comparison between extracted eigenvector and original time-domain data
從表4中可見,本文提出的先提取初始特征向量的方法在仿真時間和準確率方面都優(yōu)于直接對原始數(shù)據(jù)進行處理的方法,證明了本文方法的有效性和可行性。
本文將S變換與SAE相結合,提出一種深度學習方法識別電纜早期故障。在PSCAD/EMTDC系統(tǒng)中搭建25 kV無支路電纜故障線路模型進行仿真研究,結論如下:
a. 本文所提電纜早期故障識別的特征提取方法,結合S變換模時頻矩陣與熵理論,獲得了11個時頻域特征量,解決了電纜早期故障信號維數(shù)大和信息量復雜的問題,更有利于SAE網(wǎng)絡的分類;
b. 本文提出了一種SAE和S變換相結合的電纜早期故障識別方法,與傳統(tǒng)模式識別方法相比,其準確率可達98.8%;
c. 本文方法與直接運用原始數(shù)據(jù)作為SAE網(wǎng)絡輸入的方法相比,仿真時間僅需后者的10%,準確率較后者高8.6%。
本文研究證明了深度學習方法在電纜早期故障識別中應用的可能性,為該領域的相關研究提供了新思路。本文基于仿真信號進行分析,為了使所提方法在實際中得到運用,還需使用大量實測波形數(shù)據(jù)進行分析驗證。