丁學輝,許海林,羅穎婷,楊 鑫,鄂盛龍
(1.長沙理工大學電氣與信息工程學院,湖南 長沙 410114;2.廣東電網有限責任公司電力科學研究院,廣東 廣州 510080)
變壓器承擔著對電壓的轉換和對電能的分配,及時發(fā)現(xiàn)變壓器內部潛在故障并準確診斷其故障類型對維護整個電網的安全運行與供電可靠性具有重要意義。
隨著變壓器油中溶解氣體(DGA)在線監(jiān)測技術不斷發(fā)展,越來越多的基于DGA數據的人工智能算法被運用在變壓器故障診斷領域并取得了不錯的效果,如支持向量機、人工神經網絡、貝葉斯分類器等[1]。這些智能算法克服了傳統(tǒng)IEC三比值法分類邊界過于絕對、反映故障類型與表現(xiàn)特征之間關聯(lián)關系準確率不足的局限性[2],但診斷模型訓練效果差,難以滿足實際工程運用需求。
近年來,極限學習機(extreme learning machine,ELM)以其學習速度快、泛化能力優(yōu)良、分類準確率高等特點在變壓器故障診斷領域運用廣泛,然而ELM 對變壓器故障分類時,隨機產生的輸入層權值和隱層閾值對故障診斷準確率會帶來不良影響[3]。常用粒子群優(yōu)化(particle swarm optimization,PSO)算法求解ELM參數[4],但該算法在搜索過程中易導致群體多樣性喪失、早熟、陷入局部最優(yōu)。為此,本文利用多尺度協(xié)同變異的自適應粒子群優(yōu)化(multi-scale cooperative mutatingly self-adaptive escape PSO,MAEPSO)算法對ELM參數進行優(yōu)化,建立多尺度協(xié)同變異粒子群極限學習機(MAEPSO-ELM)變壓器故障診斷模型。MAEPSO算法的多尺度高斯變異機制,能促使整個種群以盡量分散的變異尺度對解空間進行更加詳盡的探索,在強化算法全局尋優(yōu)能力的同時兼顧局部精細化探索的能力,找到適應值更高的參數以提高ELM的診斷效果。
此外,目前基于DGA和智能算法建立的診斷方法大部分采用H2、CH4、C2H2、C2H4、C2H6等主要特征氣體及部分比值作為算法輸入特征,在選擇特征量時并沒有充足的依據,而各種人工智能診斷方法會因為輸入特征不同影響診斷結果[5]。文獻[6]基于篩選器模式利用粗糙集方法對變壓器故障輸入特征進行約簡;文獻[7]基于封裝器模式利用SVM分類準確率評估變壓器故障輸入特征并通過遺傳算法搜索適應度最高的輸入特征集。篩選器模式獨立于后續(xù)的智能分類算法,選取的輸入特征集準確度不高;封裝器模式使用的智能搜索算法計算量大且需要提前設定輸入特征維數。隨機森林算法利用變量重要性評分(variable importance measure,VIM)值這一指標反映各輸入特征對因變量變化所做貢獻的重要性,在輸入特征選擇領域應用廣泛[8]。本文擬利用隨機森林算法計算候選特征集各特征重要性評分并降序排列,結合優(yōu)化的ELM,基于序列前向選擇法逐一添加VIM值最高的輸入特征計算其分類準確率,由分類準確率最大確定最優(yōu)輸入特征。該方法相比篩選器模式和封裝器模式,具有計算量小且無需提前設定特征個數并能給出各輸入特征對故障分類影響程度的優(yōu)點。
綜上所述,本文基于變壓器DGA數據及相關運算屬性構建候選特征集,建立基于隨機森林特征優(yōu)選與MAEPSO-ELM算法的變壓器故障診斷方法,通過實例驗證所提方法的有效性與正確性。
隨機森林算法是利用bootstrap重采樣技術從原始樣本中抽取多個樣本,對每個采樣得到的樣本集建立決策樹進行訓練,然后組合多棵決策樹投票得到最終分類結果的集成決策樹算法,同時該算法能給出各輸入變量重要性評分,廣泛應用于特征選擇場景[9]。隨機森林算法對特征進行評估主要思想是通過對未參與決策樹訓練的袋外(out-of-bag,OOB)數據施加擾動,再計算預測準確率的變化來獲得特征重要性。
假定變壓器故障數據訓練集(X,y),每個樣本含n個輸入特征x1、x2、…、xn,隨機森林算法通過bootstrap方法隨機抽取K個子樣本數據集,對應K個OOB數據集,特征重要性排序步驟如下:
1)初始化k=1;
4)當k=2,3,…,K時,重復步驟2、3;
5)計算特征xi重要性,即
(1)
6)對VIMi降序排列,得到特征重要度排序,VIM越大特征越重要。
由于PSO算法中粒子的運動軌跡是一個有限的并逐漸減小的區(qū)域,無法覆蓋整個可行空間解,因此,存在早熟收斂、易陷入局部最優(yōu)等不足[10]。鑒于此,引入多尺度協(xié)同變異粒子群算法,該算法粒子速度變異能力由粒子所在子群高斯變異算子決定,不同子群的變異算子尺度由該子群的適應度決定,有助于粒子群在搜索空間中分散式搜索,增強算法全局尋優(yōu)能力,同時變異算子的大小隨著適應度的提升逐漸減小,在算法后期有利于提高最優(yōu)解的精度。
設粒子變異尺度為M,并設置M個高斯變異算子標準差的初始值,其值為優(yōu)化變量取值范圍內的隨機值:
(2)
隨著算法的迭代,不同尺度變異算子的標準差會改變,規(guī)律如下:首先,將種群中的N個粒子依據適應度F的大小升序排列;然后,將排好序的種群按照適應度大小劃分為M個子群,每個子群的粒子個數為P=N/M。t為算法當前迭代次數,則第m個子群在第t次迭代時平均適應度值可定義為
(3)
(4)
(5)
為最大范圍實現(xiàn)空間搜索能力,粒子速度Vij達到一定閾值Tj時按偽代碼進行一次變異操作,計算變異后所有粒子適應度及M個變異算子,取適應度最大位置作為下一次粒子新的逃逸點,代碼描述如下:
(6)
其中,Tj記錄種群中第j維的當前速度閾值且恒為正數,其自適應設定原理參考文獻[11],xi為粒子位置,rand為均勻分布在[0,1]范圍內的隨機數。
將隨機森林特征優(yōu)選與MAEPSPO-ELM算法變壓器DGA故障診斷方法分為3步:建立候選特征集、確定最優(yōu)輸入特征以及ELM參數優(yōu)化過程。
本文采用廣東電科院提供的已確認變壓器故障類型樣本,共417組。根據相關規(guī)程,診斷結果可劃分為7種狀態(tài):正常(N)、低能放電(D1)、高能放電(D2)、局部放電(PD)、中低溫過熱(T12)、高溫過熱(T3)、放電兼過熱(TD),分別用{1,2,3,4,5,6,7}表示,樣本分布如表1所示。隨機選取80組樣本為訓練集、186組為驗證集、120組為測試集。
表1 變壓器故障樣本Table 1 Transformer fault samples
目前,常用CH4、C2H2、C2H4、C2H6、H2的體積分數檢測變壓器是否發(fā)生故障而利用其對故障狀態(tài)與性質進行更明確判斷時依舊存在較大程度偏差。IEC三比值法、Duval三角形法、無編碼比值法等一系列方法則常用于判定具體的故障類型。此外,文獻[12]表明,與 DGA 全部數據相比,DGA氣體中2種氣體的相對比值和變壓器運行狀態(tài)聯(lián)系更緊密。為此,以上述5種氣體為典型故障特征氣體,并參照相關比值法構造故障特征的規(guī)則,選取關鍵氣體的相關比率以及氣體之間的總體占比作為候選特征集,如表2所示,其中CH為總烴含量。
表2 候選輸入特征Table 2 Candidate input features
首先,在訓練集中通過隨機森林算法計算各候選輸入特征的VIM值并降序排列;然后,假設最優(yōu)輸入特征集合為空集,依據特征重要度排序,使用序列前向選擇法,每次無放回地選取排序最前的特征加入最優(yōu)輸入特征集合,在驗證集上利用MAEPSO-ELM模型進行訓練,得到最優(yōu)輸入特征集合的分類準確率。遍歷完所有特征后,最優(yōu)輸入特征集合即為分類準確率最高對應的特征。最優(yōu)輸入特征選擇流程如圖1所示。
圖1 最優(yōu)輸入特征集合篩選流程Figure 1 Optimal input feature set screening process
利用MAEPSO算法優(yōu)化ELM的輸入層權值和隱層閾值,其中ELM算法分類準確率作為粒子適應度,算法流程如圖2所示。
MAEPSO算法優(yōu)化步驟如下。
1)預設網絡拓撲結構、PSO算法的慣性權重、學習因子等固有參數。
圖2 MAEPSO-ELM算法流程Figure 2 Flowchart of MAEPSO-ELM algorithm
3)根據粒子適應度競爭機制,更新所有微粒當前最優(yōu)適應度Pbest、種群當前最優(yōu)適應度gbest。
4)根據PSO粒子速度進化公式調整微粒速度。
5)判斷粒子速度是否滿足Vij 6)按PSO粒子位置更新公式調整微粒的位置。 7)根據式(3)~(5)更新M個高斯變異算子的大小,并更新每一維速度的閾值Tj。 8)判斷是否滿足迭代條件。迭代次數t>tmax則退出循環(huán),輸出最優(yōu)適應度對應的ELM輸入權值和隱層閾值,否則轉至步驟3。 9)由訓練求出的最優(yōu)參數建立ELM分類模型。 按本文方法通過隨機森林算法計算訓練集22個候選輸入特征VIM值,在驗證集下結合優(yōu)化的ELM,可得到不同輸入特征個數時的分類準確率,如圖3所示。本文隨機森林參數設置: 回歸樹數目為400,節(jié)點最小尺寸為5, mtry 節(jié)點值為8。 圖3 變量重要性評分及分類準確率曲線Figure 3 Variable importance score and prediction error curve 由圖3可知,輸入特征維數較低時模型提取表征輸出特性的關鍵信息較困難,分類準確率低;當按照VIM值排序逐個增加故障特征量時,進一步豐富了信息,分類準確率有所提高,并且在特征個數為9時準確率最大;繼續(xù)增加特征量,分類準確率又呈下降趨勢,最后趨于平穩(wěn)。這說明在特征增加到一定個數時輸入特征混入冗余特征,隨之而來的冗余信息對模型的分類性能有副作用。由此可見特征選擇的必要性,選擇VIM值排序前9的特征作為本文方法的最優(yōu)輸入特征,分別為C2H4/C2H6、CH4/H2、C2H2/CH、C2H4/CH、C2H2/C2H4、H2/CH、CH4、C2H6/CH4、H2。 從結果來看,最優(yōu)輸入特征排序的前幾個特征包括CH4/H2、C2H4/C2H6、C2H2/C2H4,即IEC導則推薦的三比值特征量,說明本文方法篩選的特征量與傳統(tǒng)變壓器故障診斷理論中故障特征比值量的選取有較大一致性。 本文方法參數最終設置:種群總規(guī)模N=50,尺度個數M=5,慣性權重w采用隨進化次數線性遞減方式,粒子學習因子c1、c2均取1.5,Vmax為100,迭代次數tmax為160。ELM輸入節(jié)點為篩選出的特征維數9,輸出節(jié)點個數對應變壓器7種狀態(tài)設為7,采用嘗試對比法確定隱含層節(jié)點數為50,因此ELM拓撲結構為9-50-7。 構建粒子群極限學習機(PSO-ELM)、量子粒子群極限學習機(quantum particle swarm extreme learning machine,QPSO-ELM)、MAEPSO-ELM模型,當輸入為最優(yōu)輸入特征時,驗證集在相同參數情況下各方法迭代過程的適應度進化曲線如圖4所示。 圖4 適應度隨迭代次數的變化曲線Figure 4 Variation curve of fitness with the number of iterations 圖4表明在PSO-ELM模型中,粒子迭代早期就陷入局部最優(yōu),導致后續(xù)迭代搜索無法優(yōu)化出適應度更高的曲線,此即為標準PSO算法的“早熟”缺陷,在約第35次迭代時訓練精度收斂于83.3%;QPSO-ELM全局尋優(yōu)性能略好于PSO-ELM,在第45次迭代時進化陷入停滯,并收斂于86.7%的訓練正確率;MAEPSO-ELM利用多尺度高斯變異算子對粒子速度進行變異,迭代初期粒子訓練精度就達到81%,遠大于PSO-ELM、QPSO-ELM;迭代后期,當粒子適應度陷入局部最優(yōu)后,通過多尺度協(xié)同變異多次跳出局部最優(yōu)在搜索空間中分散式搜索,在有限的迭代次數內提高搜索精度,最終收斂于95.2%。綜合對比,本文引入的MAEPSO算法尋優(yōu)能力最好。 為驗證本文方法高效性,將MAEPSO-ELM及對比模型輸入特征分為4類:①最優(yōu)輸入特征;②DGA氣體比值,即H2/CH、CH4/CH、C2H6/CH、C2H2/CH、C2H4/CH;③IEC氣體比值,即CH4/H2、C2H4/C2H6、C2H2/C2H4;④DGA全數據。 3種方法在4種輸入特征下及IEC三比值法的測試樣本整體診斷結果對比如圖5所示,得出結論: 1)當采用相同診斷方法、最優(yōu)輸入特征作為輸入時,診斷準確率比DGA全數據高20%左右; 2)當采用相同特征量時,該文方法的識別準確率比PSO-ELM、QPSO-ELM故障診斷準確率高5.6%~13.1%; 3)當同時采用最優(yōu)輸入特征與該文方法進行故障診斷時,能獲得最高的故障診斷準確率;本文方法識別準確率為91.3%,高于IEC三比值法32.9%、QPSO-ELM法7.9%、PSO-ELM法13.1%,診斷效果最好。 圖5 不同方法診斷準確率Figure 5 Diagnosis accuracy of different methods 利用本文方法對廣東電網某供電局提供的4組變壓器油色譜在線監(jiān)測異常數據進行故障診斷,樣本如表3所示。本文方法和IEC三比值法對 4組樣本的診斷結果及經吊芯檢查后得出的明確變壓器狀態(tài)結論如表4所示。 表3 故障樣本Table 3 Failure samples μL/L 表4 故障樣本診斷結果Table 4 Fault sample diagnosis results 由于IEC三比值分類邊界過于絕對、所選用參數較少不能準確反映故障類型與表現(xiàn)特征之間的關聯(lián)關系,因而無法正確識別第1、2、3組樣本。本文方法診斷結果顯示1、4組樣本為高能放電故障,第2、3組樣本分別為低溫過熱和局部放電故障,與吊芯檢查結論基本一致,驗證了該模型的有效性與正確性。 本文通過隨機森林算法結合MAEPSO-ELM進行變壓器故障特征量的優(yōu)選和故障診斷;結合變壓器樣本數據,篩選出與故障類型最相關的輸入特征;并對比本文方法與不同組合的ELM在不同輸入特征集下的診斷效果;最后,用某供電局的故障數據進行測試。 1)隨機森林結合智能分類算法進行特征優(yōu)選,能以較少的優(yōu)選特征提高分類算法的診斷效果; 2)通過3種不同組合ELM模型的參數尋優(yōu)曲線可知,PSO、QPSO算法較易陷入局部最優(yōu),尋優(yōu)結果一般;而MAEPSO算法多次跳出局部最優(yōu),搜索空間中分散式搜索,找到適應值更高的參數,證明了多尺度協(xié)同變異機制的有效性; 3)本文方法測試集的識別準確率為91.3%,高于IEC三比值法32.9%、QPSO-ELM法7.9%、PSO-ELM法13.1%,診斷效果最好。4 算例計算與分析
4.1 基于隨機森林的故障特征優(yōu)選
4.2 輸入量的選擇
4.3 技術應用
5 結語