張建文,王曼,解浩,嚴家明,張寰宇
(中國礦業(yè)大學(xué) 電氣與動力工程學(xué)院,江蘇 徐州 221008)
局部放電信號一直都是國內(nèi)外學(xué)者的研究熱點,它也是油浸式變壓器絕緣運行狀態(tài)的評估依據(jù)。有研究證實通過局放信號的統(tǒng)計指紋[1]、韋伯分布[2]、分形維數(shù)[3]和數(shù)字圖像矩特征等[4]可以對油紙絕緣不同老化階段進行評估。奇異值分解(Singular Value Decomposition,SVD)特征提取可以在保留信號真實特征的前提下進行數(shù)據(jù)壓縮。經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)自適應(yīng)的將原始信號拆分成由高到低多個頻段的或多個窄帶頻率的固有模式分量(Intrinsic Mode Function,IMF)?;贓MD-SVD特征提取方法在生物信息識別、故障診斷等方面也取得了相應(yīng)研究成果[5-6]。
已有中外學(xué)者成功將支持向量機(Support Vector Machines,SVM)和BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于電力系統(tǒng)狀態(tài)診斷識別領(lǐng)域[7-8]。但BP神經(jīng)網(wǎng)絡(luò)缺點在于收斂速度慢,效率低,學(xué)習(xí)過程不穩(wěn)定,SVM對某些特殊值存在識別障礙。隨機森林(Random Forest,RF)是Leo Breiman 在2001年提出的一種組合學(xué)習(xí)算法[9],因其準確率很高且對特殊值和環(huán)境噪聲干擾具有較好的包容度,不易出現(xiàn)過擬合現(xiàn)象,在電力系統(tǒng)狀態(tài)診斷中得到了很好的應(yīng)用[10-11]。
基于此,提出局放信號的EMD-SVD特征和隨機森林結(jié)合識別評估油紙絕緣老化狀態(tài)。分別利用隨機森林分類器與傳統(tǒng)單一分類器BP神經(jīng)網(wǎng)絡(luò)和支持向量機對油紙絕緣熱老化不同階段局部放電信號EMD-SVD特征進行分類識別,并對比和分析各分類器的識別結(jié)果。
設(shè)計老化實現(xiàn)試驗的流程圖如圖1所示。
圖1 加速熱老化試驗流程Fig.1 Process of accelerated thermal aging test
步驟如下:
(1)制作絕緣紙試品,采用普通纖維素絕緣紙(剪裁紙樣、篩選紙樣、真空浸油、油紙比例的調(diào)節(jié)、粘合絕緣紙氣隙模型),選用國產(chǎn)25#變壓器礦物油作為絕緣油材料,將絕緣油和絕緣紙盛放在燒杯中;
(2)在無異常的老化箱內(nèi)分批放置初處理過的試品,并將溫度盤調(diào)節(jié)至130 ℃來加速熱老化試驗。保證每次試驗試品初處理和每個階段加速熱老化過程完全相同,使得試驗具備統(tǒng)一性;
(3)對0 h、24 h、72 h、144 h、264 h、384 h和504 h時間段各取20個油紙絕緣樣本。
目前,判斷絕緣紙?zhí)幵诤畏N絕緣老化程度最為準確、有效、可靠的判據(jù)是其自身聚合度(Degree of Polymerization,DP)的水平,有規(guī)程約定:新絕緣紙的平均DP值約為1 000;DP值低至新絕緣紙的一半時代表變壓器壽命已過半;DP值跌落至250時,變壓器已經(jīng)達到壽命的終點[12]。圖2是各老化階段的絕緣紙樣品隨時間變化趨勢,驗證了在進行加速熱老化試驗中七個取樣點設(shè)置的合理性。
圖3是油紙絕緣局放的人工氣隙缺陷試品試驗?zāi)P?。依?jù)CIGRE MethodⅡ基準制備試驗電極,用AB膠粘合三層絕緣紙,位于上下兩層的圓形絕緣紙試品厚度為0.5 mm,半徑為40 mm,在中央夾著外內(nèi)直徑分別為80 mm和38 mm,且0.2 mm厚的絕緣紙圓環(huán)。
不同老化時間的油紙試品分別進行局放信號測量,圖4是具體測量電路。
圖2 試品取樣時間對應(yīng)DP變化Fig.2 Sample sampling time corresponds to the DP change
圖3 油紙絕緣局放氣隙缺陷試驗?zāi)P虵ig.3 Test model of oil-paper insulation-partial discharge air gap defect
圖4 油紙絕緣試品局放測量電路Fig.4 Partial discharge measurement circuit of oil-paper insulation test sample
用db8軟閾值[13]對采集的階段Ⅲ單周期信號進行消噪并分析。單周期消噪后局放信號如圖5所示。
圖5 去噪后的局部放電信號Fig.5 Signals of partial discharge after de-noising
對時域中統(tǒng)計分析后的熱老化局部放電信號采用EMD分解,分解后獲得的一系列IMF分量篩選后構(gòu)成多維矩陣并進行奇異值分解,獲得的奇異值能反應(yīng)矩陣的固有特性,上述過程簡稱為EMD-SVD特性提取,將奇異值組成的特征向量稱為EMD-SVD特征向量。圖6是提取EMD-SVD特征的流程圖。
圖6 提取EMD-SVD特征流程圖Fig.6 Flow chart of the EMD-SVD feature extracting
以老化72 h時刻對應(yīng)階段Ⅲ為例,介紹EMD-SVD特征提取過程:首先,將信號去噪后通過EMD方法獲得多個IMF分量及余項,圖7是分解后的IMF分量。
圖7 分解后的IMF分量Fig.7 IMF component after decomposition
其次,計算每個IMF和消噪后原始復(fù)雜信號的互相關(guān)系數(shù)[14],將其作為閾值來決定相應(yīng)分量的保留與否,系數(shù)較大的前14位IMF分量構(gòu)成特征矩陣,得到14個IMF分量的疊加信號,如圖8所示,據(jù)圖可直觀看出14個IMF分量合成的信號能保留原信號的基本特征。最后,對14×20 000維的特征矩陣進行SVD分解,得到奇異值組成的14維向量,即EMD-SVD特征向量。
圖8 14個IMF分量的疊加信號Fig.8 Superimposed signal of 14 IMFs
針對試驗設(shè)計的老化七個階段的油紙絕緣試品,分別采集到局部放電信號經(jīng)EMD-SVD分解,最后得到奇異值對應(yīng)于每個老化階段,結(jié)果如表1所示。
表1 不同老化階段的奇異值Tab.1 Singular value of the different stages
圖9是EMD-SVD分解值隨老化時間加長變化規(guī)律。老化初期特征量值有明顯增長趨勢,接著趨于穩(wěn)定,老化中期又有大幅增長趨勢后又趨于穩(wěn)定,老化末期有明顯增長趨勢且特征值量達到最大。老化七個時間階段,EMD-SVD特征量分布有較明顯的差異性,區(qū)分度較好,對進一步老化階段識別研究有重要的參考意義。
圖9 EMD-SVD特征量隨老化時間變化Fig.9 Change of EMD-SVD features with ageing time
相比于SVM和BP神經(jīng)網(wǎng)絡(luò)等機器識別算法,RF是一種集成學(xué)習(xí)分類器。單一分類方法需將所有樣本分為訓(xùn)練樣本和測試樣本兩部分,再通過測試樣本的識別率評估識別特征及識別方法的優(yōu)劣,即輸入訓(xùn)練樣本利用分類器建模產(chǎn)生一系列規(guī)則,然后通過擬定的規(guī)則對測試樣本進行數(shù)據(jù)分析得出預(yù)測結(jié)果。RF識別核心原理是bootstrap重抽樣法[15]作為抽樣數(shù)據(jù)第一步,從原始樣本中得到多個樣本數(shù)據(jù),經(jīng)過決策樹建模,在每棵決策樹節(jié)點對數(shù)據(jù)進行特征分裂,并匯總各決策樹分類結(jié)果,最終投票得出最真實的識別結(jié)果。RF分類器不需要采用獨立的測試樣本數(shù)據(jù)就能實現(xiàn)分類誤差的無偏估計,提高了對待評估樣本的分類正確率。構(gòu)建RF過程如圖10所示。其構(gòu)建過程如下所示:
(1) 在RF模型中導(dǎo)入全部原始數(shù)據(jù),定義為樣本數(shù)據(jù),生成訓(xùn)練集X;
(2) 對訓(xùn)練集采用bootstrap重抽樣法進行抽樣,抽取N個訓(xùn)練集,記為訓(xùn)練集1,訓(xùn)練集2,……,訓(xùn)練集N,保證每個小的集合與X擁有相同的抽樣數(shù);
(3)對N個訓(xùn)練集分別進行分類回歸樹建模,針對某個訓(xùn)練集,找到將其作為袋外數(shù)據(jù)(out of bag,OOB)的最優(yōu)分類精度,N個訓(xùn)練集得到對應(yīng)數(shù)目的決策結(jié)果;
(4)根據(jù)N個分類結(jié)果對每個決定再進行投票表決得出該樣本的最終分類結(jié)果。
圖10 RF構(gòu)建示意圖Fig.10 Schematic diagram of produce RF
RF分類器學(xué)習(xí)效果的好壞與泛化誤差的大小成反比,Breiman研究表明,可利用OOB對RF泛化誤差進行無偏估計,OOB分類錯誤率越小,反映出RF分類力越強,識別可靠率越高。
提取了14維的EMD-SVD特征,EMD-SVD特征樣本集大小為3 500。文應(yīng)用RF作為分類器。圖11是基于EMD-SVD特征的OOB誤差與決策樹數(shù)量的關(guān)系,設(shè)R為森林中樹的數(shù)量,由文獻[17]可知,當R=100時,RF分類準確度最高。
圖11 EMD-SVD特征的OOB分類誤差估計Fig.11 Out-of-bag classification error of EMD-SVD feature
RF具有的隨機性會造成每次測試結(jié)果的微小差異,所以設(shè)置同樣參數(shù)進行多次測試,取其中5次分類結(jié)果的平均值作為樣本的最終識別率。5次分類識別見表2,平均識別正確率90.42%。
表2 RF分類識別結(jié)果Tab.2 Classification recognition results of RF
利用MATLAB平臺分別利用BP神經(jīng)網(wǎng)絡(luò)、SVM和RF對上文獲得的各熱老化局部放電信號特征向量進行老化階段分析識別。三種分類器對各熱老化階段的識別效果有所區(qū)別,呈現(xiàn)在表3中。
文中將原始訓(xùn)練集大小為3 500的14維的EMD-SVD特征中2 100個樣本數(shù)據(jù)組成訓(xùn)練集,另外1 400個樣本組成測試集,分別運用BP神經(jīng)網(wǎng)絡(luò)和SVM進行分類識別,識別出的結(jié)果分別為84.32%和87.00 %;將七個熱老化階段的全部樣本輸入RF分類器進行分類,油紙絕緣老化階段的總識別率為90.42 %,如表4所示。
對比兩種單一分類器與RF分類器對油紙絕緣熱老化階段樣本的EMD-SVD特征識別結(jié)果可知:基于EMD-SVD特征,RF表現(xiàn)出優(yōu)于傳統(tǒng)非集成分類器的識別效果。RF分類器不需要獨立的測試樣本就能實現(xiàn)分類誤差的無偏估計,故其樣本利用率高,與BP神經(jīng)網(wǎng)絡(luò)、SVM識別結(jié)果相比,其識別分類力更強,并且RF分類器識別穩(wěn)定性更高。
表3 對比分類器各老化時間的識別效果Tab.3 Compare the recognition effect of the aging time of the classifier
表4 對比分類器的識別效果Tab.4 Compare the effect of the classifier
首次將EMD-SVD特征與隨機森林分類器結(jié)合應(yīng)用于油紙絕緣熱老化階段識別中。首先提取局部放電信號EMD-SVD特征,利用BP神經(jīng)網(wǎng)絡(luò)、SVM這兩種單一分類器與RF分類器分別對信號特征量分類,對老化階段的識別結(jié)果進行對比,結(jié)果表明:利用RF分類器進行識別的結(jié)果比獨立使用BP神經(jīng)網(wǎng)絡(luò)或SVM好;較之BP神經(jīng)網(wǎng)絡(luò)和SVM需要進行確定訓(xùn)練樣本與測試樣本的分類,利用RF分類器對老化階段進行識別是采用獨立的訓(xùn)練樣本數(shù)據(jù),實現(xiàn)了分類誤差的無偏估計,識別可靠度提高。由分析得:基于EMD-SVD特征和隨機森林分類器結(jié)合對變壓器油紙絕緣熱老化階段評估具有一定的工程指導(dǎo)價值。