鄭偉欽,何勝紅,鐘 煒,馬 欣,張 勇,張哲銘,龔令愉,譚泳嵐,鐘嘉燊
(廣東電網有限責任公司佛山供電局 廣東 佛山 528000)
電力變壓器是電力系統(tǒng)中最重要和最關鍵的電氣設備之一,承擔著不同電壓等級電網的互聯以及功率交換的樞紐作用,其可靠運行直接關系到電力系統(tǒng)的安全與穩(wěn)定。據有關研究資料表明,繞組變形是電力變壓器最主要的故障類型之一[1]。因此,對于新生產和投運的變壓器,繞組具有變形的可能性和一定的隱蔽性,對電網的運行存在嚴重的安全隱患,積極開展繞組狀態(tài)檢測和故障診斷非常關鍵。
目前對于變壓器繞組變形診斷的研究方法主要有短路阻抗法、低壓脈沖法、振動分析法、發(fā)散系數法和頻率響應分析法(frequency response analysis, FRA)[2-3]。其中FRA因具有試驗設備便攜、靈敏度高、信息豐富等優(yōu)點而得到國內外電力行業(yè)的一致認可。但是這些診斷方法屬于離線檢測,需要結合設備停電檢修進行,無法第一時間發(fā)現繞組健康狀況。另外,基于FRA主要是通過橫向比較變壓器同一電壓等級的三相繞組幅頻響應特性,通過計算三相繞組頻率響應曲線在低、中、高頻段以及整個頻段的相關系數來評估變壓器繞組是否存在變形,但是該分析方法過于依賴完善的頻率響應原始數據庫。針對以上問題,國內外研究學者分析了繞組變形引起的頻率響應機理,結合等值電路模型探究繞組變形與頻率響應的關系[4-5]。但是目前這些研究對于引起變壓器繞組變形的根本原因及其對應的故障類型的認識還不夠系統(tǒng),難以獲得數量和種類豐富的故障樣本,缺乏完備的繞組變形數據庫。
為此,本文提出了一種基于時間動態(tài)變分自動編碼器(TD-VAE)和邏輯正則極限學習機(LogRELM)的變壓器繞組變形故障診斷方法。首先沿用魯非等[4]和鄒林等[5]提出的基于“結構參數—電氣參數—試驗結果”繞組變形故障診斷的新思路,通過變壓器有限元模型模擬不同程度變壓器繞組徑向形變、軸向位移和繞組餅間變化3種故障,求解繞組變形時變壓器主要電氣參數(電容、電感)。根據所求的電氣參數在Matlab軟件中搭建變壓器繞組等值電路模型,仿真不同繞組變形下變壓器的FRA曲線,構建繞組變形故障數據庫。以FRA曲線為基礎,首次利用基于TD-VAE對原始FRA數據進行重構,生成與原始FRA數據相似的高質量新樣本,實現數據樣本的增強。同時采用粒子群優(yōu)化算法(PSO)對LogRELM模型參數進行優(yōu)化,構建PSO-LogRELM組合模型對變壓器繞組變形類別進行診斷。實驗結果表明,在繞組變形樣本數據匱乏和不平衡的情況下,所提方法可以有效提高繞組變形故障診斷精度。
針對現有電力變壓器繞組變形FRA曲線識別和異常檢測存在樣本數據匱乏的問題,本文提出了一種基于時間動態(tài)變分自動編碼器的電力變壓器繞組變形頻率響應曲線生成模型,學習原始變壓器繞組變形FRA曲線的樣本分布規(guī)律,生成與原始數據相似的高質量新樣本,從而實現訓練集數據增強。
變分自編碼器(VAE)是一種深度學習生成模型,其網絡結構包括輸入層、隱變量層和輸出層[6]。變分自編碼器通過建立樣本的概率密度分布模型來學習樣本的分布規(guī)律,模型由編碼器和解碼器兩部分組成。在變分自編碼器中,編碼器用于建立原始輸入數據的變分推斷,生成隱變量的變分概率分布;解碼器根據推斷網絡生成的隱變量變分概率分布,生成與原始數據接近的概率密度分布。如圖1所示,編碼器將原始數據編碼生成隱變量z,生成網絡根據隱變量z還原生成原始數據的近似概率分布。
由于隱變量z的分布未知,無法直接利用最大期望值算法進行變分推斷求解(也即解碼過程),因此變分自編碼器模型在編碼器中引入了一個識別模型,來代替無法確定的真實概率分布,這樣模型就可以作為變分自編碼器的編碼器部分,條件分布作為解碼器部分。為了使識別模型與真實的概率密度分布近似相等,變分自編碼器訓練過程引入了噪聲,并且使隱變量的分布盡可能地靠近正態(tài)分布N(μ,σ2),其中μ為均值,σ2為方差。VAE模型的損失函數是帶正則項的負對數似然函數,其表達式為:
式(1)中第1項是重構損失函數,其作用是控制生成數據和原始數據盡可能相近,第2項是Kullback-LeiblerL(KL)散度,其作用是衡量生成分布與真實分布的近似程度。p(z)為先驗分布,通常情況下設置為標準正態(tài)分布N(0,1)。其中,KL散度的計算公式如下:
L(Θ ,Φ;x)為變分下界,通過極大似然法來求解變分下界的最大值。
電力變壓器繞組變形頻率響應曲線低、中和高頻段可以看作是時間序列數據,這些時間序列數據具有短暫性和動態(tài)性的特點,為了能夠很好捕捉電力變壓器繞組變形頻率響應曲線時間序列數據的這些特點,本文提出了一種時間動態(tài)變分自編碼器(Time Dynamics VAE, TD-VAE),其結構圖如圖1所示。
圖1 時間動態(tài)變分自編碼器結構圖
TD-VAE模型的編碼器與標準變分自編碼器一樣(原始編碼器),解碼器部分包括原始解碼器和趨勢分析器。原始編碼器由一維卷積層、平面化層和全連接層構成,一維卷積層采用修正線性單元(Rectified linear unit,ReLU)激活函數。
假設輸入模型原始編碼器的電力變壓器繞組變形頻率響應曲線X的維度為M×T×D,其中M為批量計算中batch size的大小,T為時間序列的步長,D為每個變量的特征維度,ReLU激活函數的計算公式如下:
平面化層的作用是將輸入“壓平”,即把多維的輸入壓縮成一維。圖2中,平面化層將一維卷積層的輸出數據壓平,然后直接輸入到全連接層。
全連接層采用線性激活函數,其輸出結果的達式如公式(4)所示:
其中W為權值矩陣,K(·)為核函數,Bias為偏置矩陣,Linear(·)表示線性激活函數,其表達式為:
其中Wlinear為權值矩陣。
原始解碼器包括全連接線性層Dense層、Reshape層、反卷積層Conv1DTransp以及時序全連接層Time-Dist Dense層。如圖2所示,根據觀測值X采樣隱變量z,并將隱變量z輸入到Dense層。Conv1DTransp層與Conv1D層的作相反,其是將Dense層的輸出進行反卷積計算,此次也是采用ReLU激活函數。最后通過時序全連接層Time-Dist Dense層輸出與原始輸入維度一致的重構數據。
趨勢分析器能夠動態(tài)捕捉電力變壓器繞組變形頻率響應曲線的時序模式,曲線的趨勢主要表現為上升、下降和平穩(wěn),并且將這種趨勢反映到解碼器中。利用趨勢分析器對時間序列數據進行分析,能夠捕捉到數據的不確定性和動態(tài)性。趨勢分析器采用多項式函數表示,假設預先設置多項式的次數為p=[0 ,1,…,P],對于根據觀測值X采樣得來的隱變量z,分別計p=[0 , 1,…,P]算隱變量z的pi(i= 1 ,…,P+1)次項式的展開系數ρtr,其維度為M×D×P。接著利用多項式展開系數矩陣ρtr來建立原始輸入數據的趨勢模型,其表達式如下:
其中R=[1,r,...,rp]為時間矩陣r的p次冪矩陣,其維度為P×T,時間矩陣r=[0,1,2,...,T-1],T為時間步長。多項式展開系數矩陣ρtr與r的p次冪矩陣相乘,得到匹配模型輸入的矩陣格式,其維度為M×T×D。p=0時,表示時間序列數據沒有出現上升或下降的趨勢,時間序列趨于平穩(wěn)狀態(tài),可以看成是原始時間序列的平均。
標準極限學習機(ELM)算法因具有學習速度快、泛化能力強等特點而在回歸問題、分類和故障診斷上得到廣泛應用。ELM算法在訓練時過程中隨機分配輸入層與隱含層之間的輸入權值參數w與隱含層上的偏置參數b,在確定輸入權值參數w與隱含層上的偏置參數b之后,就可以通過廣義逆矩陣來對輸出權值參數進行求解,標準ELM算法的訓練過程具體如下:
給定一個樣本量為N的繞組變形曲線訓練集{xi,yi}(i=1,...,N),其中輸入變量xi∈Rm,yi為繞組故障類別,則ELM模型可以表示為:
式中,L為隱含層神經元個數,wk=[wk1,...,wkn]T為輸入層與第k個隱含層神經元之間的權值,bk為第k個隱含層神經元的偏置,wk和bk都為隨機產生。βk=[β1,...,βm]T為輸出層與第k個隱含層神經元之間的權值。f(x)為激活函數,且
為方便紹,將公式(7)改寫為
式中,隱含層輸出矩陣H和輸出權值矩陣β的表達式可以參考Zhang等[7]的研究。
ELM在學習過程中是利用隨機分配的輸入權值參數和偏置參數來尋找最優(yōu)的輸出權值β。而問題的求解是轉化為求解最小二范數,即
根據公式(9)可以最終求得輸出權值矩陣β的解
式中,H+是H的Moore-Penrose廣義逆矩陣。
ELM模型的訓練機制是考慮訓練誤差最小化,通過最小二乘解法來求解模型最優(yōu)參數。然而,這種處理方式可能會引起模型的“過擬合”問題,導致故障診斷精度降低。另外,隨機分配輸入層與隱含層之間的權值參數和隱含層上的偏置參數也會影響變壓器繞組變形故障診斷結果。
為了解決以上問題,借鑒Tan等[8]的改進機理,本文提出了一種基于邏輯混沌映射的正則ELM(Logistic Regularized ELM,LogRELM)的變壓器繞組變形故障診斷方法。引入正則化系數η來權衡模型訓練誤差和輸出權值,對目標函數(9)進行修正:
利用拉格朗日算子求解式(11)中的最優(yōu)問題,最終求得輸出權值矩陣:
式中,I為單位矩陣。
為了解決ELM算法隨機分配輸入權值參數和偏置參數的問題,Tan等[8]提出利用邏輯混沌映射來初始化ELM算法的輸入權值矩陣,其計公式如公式(13)所示。
式中,u1∈(0,1),λ為混沌系統(tǒng)調節(jié)系數,其經驗取值范圍為(3.569 95,4)時邏輯映射系統(tǒng)表現為混沌狀。根據公式(13)可以求得輸入權值矩陣如下:
由于LogRELM算法利用混沌原理來生成模型輸入矩陣,這種生成方式具有很強的隨機性。因此,與標準ELM算法不同,LogRELM算法無需隨機預設偏置參數,即b=0。
本文所提的LogRELM變壓器繞組變形故障診斷方法中,需要考慮混沌系統(tǒng)初始值u1和調節(jié)系數λ,RELM算法隱含層神經元個數L和調節(jié)系數η對故障診斷精度的影響。因此,利用粒子群算法[9](particle swarm optimization, PSO)對參數Ω=(u1,λ,L,η)進行優(yōu)化,優(yōu)化的目標函數為:
本文基于實際變壓器的結構尺寸及材料特性在Ansoft Maxwell中搭建了變壓器有限元模型,變壓器的主要電氣參數來源于鄒林等[5]的研究。本文以高壓繞組為例,通過構建不同變形類型和變形程度的繞組有限元模型,計算繞組軸心偏移、輻向變形和餅間距變化繞組的等值電路參數。仿真模擬變壓器繞組軸向形變和輻向形變時分別以繞組高度和內外徑差值的1%為間隔設置變形程度,輻向變形模型采用鄒林等[5]設計的4種輻向變形類型。仿真模擬變壓器繞組餅間間距變化時,以正常餅間間距的1%為間距設置變形程度。根據仿真得到的等值電路參數,利用Matlab建立電路模型進行仿真,獲取健康繞組和變形繞組(6種類型)的FRA曲線。
根據以上的設置,仿真模擬收集到355組繞組變形樣本數據,對于每一種變形類別,隨機選取樣本數據的90%作為訓練樣本,剩下的10%作為測試樣本,具體的樣本分布況如表格1所示。
表1 樣本數據分布
繞組變形FRA曲線具有1 000個采樣點,為了更好捕捉繞組變形FRA曲線的特征和提高診斷精度,提取能反映FRA曲線的時域統(tǒng)計指標值作為特征向量,包括平均值、絕對值、峰值、均方根值、標準差、偏度、陡度、脈沖因子、波形因子、波峰因子、變異系數和方差。每種指標值的計算可以參考胡超等[10]的研究。
為了提高PSO-LogRELM算法的泛化能力和考慮到激活函數對預測精度的影響,將特征向量按照式(16)進行數據標準化:
式中,xi和分別為FRA曲線特征向量的原始數據和標準化后的數據,為特征向量的平均值,xmax和xmin分別為特征向量的最大值和最小值。
為了驗證所提方法的診斷性能,本文將PSO-LogRELM模型與PSO-RELM模型、PSO-SVM模型、LogRELM模型、RELM模型以及SVM模型的診斷結果進行比較。在進行繞組變形故障診斷之前,需要對模型TD-VAE和PSO-LogELM的網絡結構進行設計,各模型的參數設置如下:
(1)PSO算法參數設置:迭代次數為100代,粒子個數為20,最小誤差為0.001。
(2)RELM模型參數設置:隱含層節(jié)點L個數為25,正則化系數η為25;PSO-RELM模型中,隱含層節(jié)點L的優(yōu)化區(qū)間為[5,10,...,100],正則化系數η的優(yōu)化區(qū)間為[2-10,2-8,...,220]。
(3)LogRELM模型參數設置:混沌系統(tǒng)初始值u1=0.6,混沌系統(tǒng)調節(jié)系數的優(yōu)化區(qū)間為0<λ<4;PSO-LogRELM模型中,混沌系統(tǒng)初始值u1的優(yōu)化區(qū)間為(0,1),混沌系統(tǒng)調節(jié)系數λ的優(yōu)化區(qū)間為(0,4),隱含層節(jié)點L的優(yōu)化區(qū)間為[5,10,...,100],正則化系數η的優(yōu)化區(qū)間為[2-10,2-8,...,220]。
(4)SVM模型參數設置:采用RBF核函數,核函數參數為0.5,懲罰系數為28;PSO-SVM模型中,核函數參數的優(yōu)化區(qū)間為(0,1),懲罰系數的優(yōu)化區(qū)間為[2-10,2-8,...,220]。
在進行參數尋優(yōu)時,利用評價指標每類準確性的平均值Eave作為PSO算法的目標函數,Eave值越大表示模型診斷精度越高,其計算公式如下:
式中,AACC,i為第i類正確分類的數量與該類別的總數的比值,T為數據集類別的總數。
3.3.1 TD-VAE模型有效性驗證
為了驗證TD-VAE模型的有效性,利用TD-VAE生成數據樣本來擴充訓練數據集,從而提高診斷模型的精度。首先利用TD-VAE對每種繞組變形類別的樣本數據進行擴充,為了充分對比分析,將原始訓練集分別擴充20%、40%、60%和80%的數據量,擴充后的訓練集分別為381、445、508和572。把擴充后的樣本集來訓練PSO-LogRELM模型,并對測試樣本進行故障類型診斷,診斷結果的準確率如表3所示。
表3 不同數據擴充比例下繞組變形故障診斷精度對比
由表3和圖2可以得出,(1)采用TD-VAE對原始訓練集數據樣本進行擴充,能夠有效提高診斷模型對繞組變形故障的診斷精度,提高不平衡數據集的分類精度;(2)原始訓練集數據樣本擴充數據量的比例越大,診斷模型對于繞組變形故障診斷的精度越高,擴充后的精度分別提高了7.980%、7.980%、6.176%和2.581%;(3)從圖2可以發(fā)現,數據擴充60%和80%時,模型PSO-LogRELM模型能夠將測試樣本全部診斷正確,并且對比原始數據(擴充比例為0)時僅出現3個測試樣本診斷錯誤;(4)同時也反映出基于TD-VAE的繞組變形頻率響應曲線生成模型,學習原始繞組變形FRA曲線的樣本分布規(guī)律,生成與原始數據更加近似的高質量新樣本,能夠解決訓練樣本數據不平衡的問題,實現訓練集數據增強。
圖2 不同數據擴充比例下PSO-LogRELM模型繞組變形診斷結果
3.3.2 PSO-LogRELM模型有效性驗證
為驗證PSO-LogRELM診斷模型的科學性和有效性,選取不同擴充比例下的訓練樣本搭建繞組變形診斷模型,模型包括:PSO-RELM模型、PSO-SVM模型、LogRELM模型、RELM模型以及SVM模型。測試樣本的診斷結果如表4所示。
表4 不同數據擴充比例下不同模型繞組變形故障診斷精度對比
(1)由表4可以看出,PSO-LogRELM模型在不同數據擴充比例下繞組變形診斷精度都優(yōu)于其他對比方法,在80%和60%擴充比例下的預測精度均為100%。
(2)相比于LogRELM、RELM、SVM模型,利用PSO算法優(yōu)化后的模型診斷精度均具有更高的診斷精度。以20%擴充比例為例,PSO-LogRELM模型的診斷精度與其他模型相比,Eave值分別提高了6.41%、1.79%、10.53%和14.98%,這表明PSO算法能夠有效優(yōu)化模型參數,從而提高LogRELM模型的診斷精度。
(3)相比較RELM模型,本文采用的LogRELM模型無論是否經過參數優(yōu)化,其繞組變形診斷精度均高于RELM模型,Eave值分別提高了2.06%、4.03%、3.74%、2.62%和3.58%。
針對傳統(tǒng)變壓器繞組變形診斷方法無法精準確定繞組變形類型以及試驗數據匱乏的問題,提出了一種基于時間動態(tài)變分自動編碼器(TD-VAE)和邏輯正則極限學習機(Logistic-ELM)的變壓器繞組變形故障診斷方法。通過仿真分析和實驗驗證,得出以下結論:
(1)利用Ansoft Maxwell軟件建立變壓器三維有限元模型來仿真計算變壓器繞組變形(軸心偏移、輻向變形和餅間間距變化)時的主要電氣參數。根據所求的電氣參數在Matlab搭建變壓器繞組等值電路模型,模擬仿真不同繞組變形下變壓器的頻率響應曲線。
(2)在模型訓練前,利用TD-VAE算法預先學習原始數據的真實分布,通過生成與原始數據相似的樣本來擴充訓練集,減少各類樣本之間的不平衡度,有效地提高模型對少數類樣本的識別能力。
(3)對比其他診斷模型,所提的基于TD-VAE和PSOLogRELM模型具有更高的診斷精度,在解決少數樣本情況下變壓器繞組變形故障診斷問題上提供了一種新思路,具有一定的參考價值。