黃新波,宋桐,王婭娜,李文君子,林淑凡
(西安工程大學電子信息學院,西安市710048)
智能化變電站的安全可靠運行是實現(xiàn)整個智能電網穩(wěn)定運行的主要條件之一,而智能化電力變壓器又是智能化變電站的重要組成部分,因此及時、可靠地對智能化電力變壓器潛在的故障進行診斷,對于保障智能電網運行具有十分重要的意義[1]。如何準確預測變壓器的運行狀態(tài),已成為電力行業(yè)研究的重點。目前油中溶解氣體分析法 (dissolved gas analysis,DGA)作為變壓器油中溶解氣體監(jiān)測技術中最為成熟的技術之一,已被列為油浸式變壓器32項預試項目中的第1位,對診斷變壓器故障狀況具有顯著效果[2]。然而,電力系統(tǒng)中的重要設備電力變壓器結構復雜,故障不確定因素很多,正確診斷很難,因此我國目前診斷變壓器故障最方便有效的方法——DGA三比值法(IEC和國標推薦)在現(xiàn)場應用中也發(fā)現(xiàn)有“缺編碼”、編碼邊界過于絕對等不足[3],故各種智能技術如模糊推理、人工神經網絡等已被用于變壓器故障診斷以提高診斷準確率[4]。
在寧夏銀川東±660kV換流站項目中,通過對在線監(jiān)測技術的研發(fā)工作,實現(xiàn)了變壓器、斷路器、容性設備和氧化鋅避雷器等一次設備的在線監(jiān)測。其中針對變壓器采用了油色譜、局部放電、鐵芯接地、變壓器油溫等監(jiān)測方案,上述裝置已經獲得了準確的運行數(shù)據,但如何根據監(jiān)測數(shù)據診斷變壓器運行狀態(tài)成為一個關鍵技術問題。本文采用貝葉斯方法來確定超參數(shù),使其在網絡的訓練過程中自適應地調節(jié)超參數(shù)的大小,并使其達到最優(yōu),從而提高神經網絡的泛化能力。同時,結合模糊理論法簡化L-M(Levenberg-Marquardt)神經網絡的輸入單元數(shù),貝葉斯正則化算法提高網絡的泛化能力,建立貝葉斯正則化的模糊L-M神經網絡預測模型。最后,與幾種常用的預測方法進行對比研究,以驗證本文建立的模型的仿真和預測能力。
神經網絡的推廣能力是衡量神經網絡結構性能好壞的一個重要標志,“過度訓練”的神經網絡會對訓練樣本集達到較高的匹配效果,但是對于一個新的輸入樣本矢量可能會產生與目標矢量差別較大的輸出,因而神經網絡不具有或具有較差的推廣能力[5]。我們采用貝葉斯正則化的神經網絡算法。一般算法是以均方誤差函數(shù)為目標函數(shù),因而權值問題不能得到優(yōu)化,但貝葉斯正則化方法則在目標函數(shù)中增加權值這一項,并能自動調節(jié)參數(shù),優(yōu)化網絡結構,從而提高網絡的泛化與推廣能力[6]。
式中:n為樣本總數(shù);ti為網絡的期望輸出值;yi為實際輸出值。
但貝葉斯正則化方法為了提高網絡的泛化能力,在目標函數(shù)里加上網絡權值平方的算術平均值,即目標函數(shù)變換為:
式中:ωi為神經網絡的連接權值;m為神經網絡連接權的個數(shù);φ、φ為目標函數(shù)的參數(shù)。貝葉斯正則化方法可以在網絡訓練過程中自適應的調節(jié)參數(shù)φ、φ的大小。在保證網絡誤差平方和最小的前提下,能夠有效地控制網絡的復雜度,進而有助于顯著提高網絡的泛化能力。
φ、φ控制著其他參數(shù)(權及閾值)的分布形式,被稱為超參數(shù)。超參數(shù)的大小決定著神經網絡的訓練結果。若φ<<φ,則訓練算法的目的在于盡量減小網絡的訓練誤差;若φ>>φ,則訓練算法的目的在于使網絡產生更為平滑的響應,即盡可能減少有效的網絡參數(shù),以彌補較大的網絡誤差。在實際應用中,這二者之間需要折中考慮,即極小化目標函數(shù)在減少網絡訓練誤差的同時,還能降低網絡結構的復雜性。常規(guī)的正則化方法通常很難確定正則化參數(shù)的大小,而采用貝葉斯理論可以在網絡訓練過程中自適應地調節(jié)正則化參數(shù)的大小,并使其達到最優(yōu)。
在變壓器故障診斷中,基于貝葉斯正則化的模糊L-M網絡模型的建立主要分為3個部分:數(shù)據預處理,診斷模型的建立以及應用與評估。具體變壓器故障診斷模型總體架構如圖1所示。
圖1 基于貝葉斯正則化模糊L-M網絡的變壓器故障診斷框圖Fig.1 Transformer fault diagnosis based on Bayesian regularization and fuzzy L-M networks
由圖1可知,首先,運用模糊理論對數(shù)據進行預處理作為神經網絡的輸入;其次,基于貝葉斯正則化方法對L-M神經網絡進行優(yōu)化,以F=φE+φEW作為目標函數(shù)進行訓練,當γ、EW、E穩(wěn)定時,變壓器故障診斷模型建立;最后,對所建立的模型代入訓練和測試數(shù)據進行仿真,根據運行結果對網絡進行評估。
模糊三比值法是引入模糊數(shù)學理論來診斷變壓器故障,將三比值法的比值邊界區(qū)間模糊化,建立基于三比值法的模糊隸屬函數(shù)。根據傳統(tǒng)三比值法編碼規(guī)則,特征氣體的體積(單位為 μL/L)之比:V(CH4)/V(H2),V(C2H4)/V(C2H6),V(C2H2)/V(C2H4)的比值的劃分邊界分別為“0.1”,“1”,“3”。根據經驗知識,將“0.1”的邊界模糊為“0.08~0.12”,“1”的邊界模糊為“0.85~1.15”和“0.9~1.1”,“3”的邊界模糊為“2.9~3.1”和“2.85~3.15”[7]。運用指派法將各氣體比值分別隸屬于0、1、2的隸屬度函數(shù)指派為偏小型Γ、中間型嶺型、偏大型Γ模糊分布。所以,當C2H2與C2H4的比值編碼為0、1、2 時,相應隸屬函數(shù)為 u0(xbi)、u1(xbi)、u2(xbi),然后根據最大隸屬度原則確定最終編碼。特征氣體V(CH4)/V(H2),V(C2H4)/V(C2H6)的比值編碼確定方法同V(C2H2)/V(C2H4)比值編碼方法一致。模糊三比值法的優(yōu)點是在一定程度上克服了編碼邊界區(qū)間過于絕對化的缺點,有利于提高診斷準確率[7]。因而,本文所用到的特征氣體樣本數(shù)據變換為由“0、1、2”組成的編碼序列作為網絡的輸入。
神經網絡建模的實質是找出蘊含在有限樣本數(shù)據中的輸入和輸出之間的本質聯(lián)系,即映射關系,從而對未經訓練的輸入也能給出合適的輸出,即具備泛化功能。參閱文獻[8-10]可知,標準BP算法采用的是最速梯度下降法修正權值,訓練過程從某一起點沿誤差函數(shù)的曲面逐漸到達最小點使誤差為0。當網絡復雜時,在訓練的過程中可能會陷入某個局部最小點,并且收斂速度緩慢。為了克服算法中的這些不足,本文采用L-M優(yōu)化算法,又稱為阻尼最小二乘法。它比傳統(tǒng)的BP及其他改進算法迭代次數(shù)少,收斂速度快,準確度高。
其權值調整公式如下:
式中:e為誤差向量;J為誤差對權值微分的雅可比矩陣;μ為標量,當μ增加時,它接近于具有較小學習速率的最速下降法,當μ下降到0時,該算法就變成高斯 -牛頓法了。因此,L-M算法是在最速梯度下降法和高斯 -牛頓法之間的平滑過度[11]。
L-M算法具體的迭代步驟如下:
(1)將所有輸入送到網絡并計算出網絡的輸出,另用誤差函數(shù)計算出訓練集中所有目標的誤差平方和;
(2)計算出誤差對權值微分的雅可比矩陣J;
(3)用公式(4)求出Δω;
(4)用ωi+Δω重復計算誤差的平方和,其中ωi(i=1,2,…,n)為網絡權值。如果新的和小于步驟(1)中計算的和,則用μ除以θ(θ>1),并有ωi=ωi-1+ Δω,轉到步驟(1);否則,用 μ 乘以 θ,轉到步驟(3)。當誤差平方和減小到某一目標誤差時,算法即被認為收斂[12]。
變壓器故障診斷模型建立的重點在參數(shù)φ和φ的確立,即如何確立φ,φ的大小使參數(shù)γ、EW、E的大小趨于穩(wěn)定,進而保證網絡訓練達到最優(yōu)。下面通過貝葉斯公式推出變量φ,φ的取值。
φ和φ的后驗分布根據貝葉斯定理則有:
假設先驗分布P(φ,φ|S)是一種很寬的分布函數(shù),且φ,φ這2個變量的后驗概率與式(5)中歸一化因子P(D|S)無關,因此,只需使似然函數(shù)P(D|φ,φ,S)最大,即可使φ,φ的后驗分布最大。
貝葉斯方法著眼于權值在整個權空間中的概率分布。若用S表示網絡結構,在網絡結構已確定的情況下,在沒有樣本數(shù)據時,若知道權值的先驗分布P(ω|φ,S),其中:ω為權值向量,有了樣本數(shù)據集D后,權值的后驗分布為P(ω|D,φ,φ,S),根據貝葉斯定理有:
式中:P(D|φ,φ,S)為全概率;P(ω|φ,S)表示權值向量的先驗概率密度函數(shù);P(D|φ,φ,S)表示權值給定時輸出的似然函數(shù)。在沒有數(shù)據時,由于對權的分布只是很少的知識,因此先驗分布是一個很寬的分布;一旦有了數(shù)據,它就可轉化為后驗分布,后驗分布較為緊湊,即只有在很小范圍中的權值才可能與網絡的映射一致。由公式(6)可知,為得到后驗分布P(ω|D,φ,φ,S),必須知道 P(ω|φ,S)和P(D|ω,φ,S),下面即為二者的具體求解過程。
(1)ω的先驗分布P(ω|φ,S)的求解;在沒有權值的先驗知識時,假設P(ω|φ,S)服從高斯分布,則有:
(2)似然函數(shù)P(D|ω,φ,S)的求解如下:
(3)權值后驗分布 P(ω|D,φ,φ,S)的求解。注意到P(D|φ,φ,S)與ω無關,因此代入P(ω|φ,S)和P(D|ω,φ,S)可以得出權值的后驗分布為
由于ZF(φ,φ)與ω無關,因此最小化F(ω)可以求得后驗分布的最大值,此時所對應的權值即為所求。若φ<<φ,網絡訓練將使得誤差盡可能小;若φ>>φ網絡訓練將盡可能減小有效地網絡參數(shù),可以彌補較大的網絡誤差??梢姴捎眯碌哪繕撕瘮?shù),在保證網絡訓練誤差盡可能小的情況下,使得網絡的參數(shù)盡可能小,從而自動縮小了網絡的規(guī)模。
由公式(6)和(9)可得:
為了確定 ZF(φ,φ),把 F(ω)在最小點 ω*展開,由于梯度為0,因此近似有:
將式(13)代入式(10),兩邊取對數(shù),并利用最優(yōu)值的一階條件可以獲得最優(yōu)的正則化參數(shù):
式中:N為網絡權值的總個數(shù);γ為N個總參數(shù)中真正起作用的有效參數(shù)的個數(shù),γ∈(0,N),它反應了網絡的實際規(guī)模。通過參數(shù)φ和φ的確立,可使L-M算法訓練神經網絡時運用含有權值的誤差目標函數(shù),保證了網絡誤差平方和最小的前提下,能夠有效地控制網絡的復雜度,進而有助于顯著提高網絡的泛化能力[13]。
本文進行仿真試驗的數(shù)據來源于寧夏銀川東±660kV換流站的主變壓器油色譜監(jiān)測智能電子設備(intelligent electronic device,IED),此IED 就地安裝于主變智能組件柜,通過IEC61850通信規(guī)約實現(xiàn)了變壓器油中溶解氣體的監(jiān)測與數(shù)據遠傳等功能。寧夏銀川東±660kV監(jiān)控中心通過安裝后臺軟件界面,實時監(jiān)測變壓器各特征氣體濃度。主變壓器油色譜監(jiān)測IED的現(xiàn)場安裝,如圖2所示;圖3為根據智能變電站監(jiān)控中心后臺軟件界面得到的現(xiàn)場油色譜實時數(shù)據圖。
圖2 油色譜監(jiān)測IED現(xiàn)場安裝圖Fig.2 Installation pictures of DGA monitoring IED
圖3 油色譜實時數(shù)據Fig.3 Real-time data of DGA
本文根據主變壓器油色譜IED監(jiān)測的運行數(shù)據,并收集具有典型特征的變壓器故障數(shù)據共80組數(shù)據,以模糊化邊界后的編碼作為網絡的輸入,運用貝葉斯正則化方法改進的L-M算法對變壓器運行狀態(tài)進行診斷。本文所選的80組數(shù)據均包括5種特征氣體及其對應的變壓器運行狀態(tài)。將所選數(shù)據中V(CH4)/V(H2),V(C2H4)/V(C2H6),V(C2H2)/V(C2H4)的比值作為輸入量,代碼“1”、“2”、“3”、“4”、“5”分別表示變壓器“正?!?、“中低溫過熱”、“高溫過熱”、“火花放電”、“電弧放電”等狀態(tài),將這5種運行狀態(tài)作為輸出量。選取80組數(shù)據中的70組作為網絡的訓練樣本,剩余10組作為測試樣本,進行仿真,結果如圖4,5所示。
圖4 基于貝葉斯正則化的L-M模型仿真結果Fig.4 Simulation results of L-M model based on Bayesian regularization
圖5 基于模糊貝葉斯正則化的L-M模型仿真結果Fig.5 Simulation results of L-M model based on fuzzy Bayesian regularization
為了進一步說明貝葉斯正則化的模糊L-M神經網絡在變壓器故障診斷中的優(yōu)勢,以10組測試樣本為依據,現(xiàn)將它同以下幾種預測方法進行對比分析,仿真對比見表1。
表1 仿真對比表Tab.1 Simulation comparison
由上述4種模型的變壓器故障仿真結果可知:
(1)對比方法1和方法2的訓練步長可知,由于BP網絡是利用誤差的反向傳播不斷調整權值的變化,因而計算冗長,在第94步才達到目標誤差,而L-M算法通過在最速梯度下降法和高斯-牛頓法之間自適應的調整來優(yōu)化網絡權值,使其能夠有效收斂,大大提高了網絡的收斂速度,因此L-M網絡的學習速度是BP網絡所無法比擬的[14];
(2)對比方法2和一般貝葉斯正則化L-M模型的仿真結果發(fā)現(xiàn),基于L-M網絡的模型在第17步就達到最小誤差范圍,訓練速度比方法1快,然而其實際輸出與預期輸出在第5、6、7個測試樣本處差距加大,甚至出現(xiàn)誤判變壓器的故障類型,而基于貝葉斯正則化的L-M模型的實際輸出與預期輸出趨勢一致,泛化能力強;
(3)對比方法4和一般貝葉斯正則化L-M模型的仿真結果得出,基于模糊貝葉斯正則化的L-M模型,由于模糊化編碼邊界去除了原始氣體數(shù)據的冗余信息使得訓練速度遠遠優(yōu)于貝葉斯正則化L-M模型,并且使得變壓器的實際輸出與預期輸出完全吻合。
由此可見,基于模糊貝葉斯正則化的L-M模型是集訓練速度與準確率于一體的優(yōu)化算法。
本文提出的基于貝葉斯正則化模糊L-M網絡變壓器故障診斷模型,僅經過21次訓練就使網絡誤差達到了期望值,實際值與預測值的誤差平方和僅為0.000 618,且擬合曲線光滑,預測效果明顯優(yōu)于一般的梯度下降法和L-M算法。
(1)該方法利用模糊理論將三比值法的邊界編碼模糊化,運用模糊分布的隸屬度函數(shù),克服了傳統(tǒng)改良三比值編碼過于絕對的缺陷。
(2)通過L-M算法使得網絡每次迭代不再沿著單一的負梯度方向,而是允許誤差沿著惡化的方向進行搜索,同時通過在最速梯度下降法和高斯-牛頓法之間自適應調整來優(yōu)化網絡權值。
(3)結合貝葉斯正則化L-M算法對權值進行訓練,不僅汲取了L-M算法較快的收斂速度,而且彌補了其在過度擬合,預測效果不佳,對新數(shù)據預測不起作用等方面的不足。
通過實例分析得出,本方法能夠快速、準確地診斷變壓器的運行狀況,同時能夠使網絡有效收斂、大大提高網絡的收斂速度和泛化能力,在實際工程中得到了良好應用。
致 謝
本文中實驗方案的制定和實驗數(shù)據的測量記錄工作是在金源電氣集團有限公司舒佳、陳小雄等工作人員的大力支持下完成的,在此向他(她)們表示衷心的感謝。
[1]黃新波.變電設備在線監(jiān)測與故障診斷[M].北京:中國電力出版社,2008:13-18.
[2]廖懷東,李海威.變壓器油色譜分析及故障判斷[J].電力建設,2003,24(10):25-29.
[3]周喜超,劉峻,鄭偉.數(shù)學形態(tài)學融合多神經網絡的變壓器故障診斷[J].電力建設,2009,30(1):38-40.
[4]彭寧云,文習山,陳江波,等.電力變壓器BP神經網絡故障診斷法的比較研究[J].高壓電器,2004,40(3):173-176.
[5]黃鞠銘,朱子述,胡文華,等.BP網絡在基于DGA變壓器故障診斷中的應用[J].高電壓技術,1996,22(2):21-23.
[6]王永強,律方成,李和明.基于貝葉斯網絡和油中溶解氣體分析的變壓器故障診斷方法[J].電工技術學報,2004,19(12):75-77.
[7]李林,萬志聰.基于模糊三比值法的電力變壓器絕緣故障診斷研究[J].浙江電力,2011(2):12-14.
[8]程加堂,熊偉,徐紹坤.基于改進粒子群優(yōu)化神經網絡的電力變壓器故障診斷[J].高壓電器,2012,48(2):42-45.
[9]賈嶸,徐其惠,李輝,等.基于鄰域粒子群優(yōu)化神經網絡的變壓器故障診斷[J].高壓電器,2008,44(1):8-10.
[10]潘翀,陳偉根,云玉新,等.基于遺傳算法進化小波神經網絡的電力變壓器故障診斷[J].電力系統(tǒng)自動化,2007,31(13):88-92.
[11]宋功益,郭清淘,涂福榮,等.模糊貝葉斯網的變壓器故障診斷[J].電力系統(tǒng)及其自動化學報,2012,24(2):103-105.
[12]張德豐.MATLAB神經網絡應用設計[M].北京:機械工業(yè)出版社,2009:107-113.
[13]魏星,舒乃秋,崔鵬程,等.基于改進PSO_BP神經網絡和D_S證據理論的大型變壓器故障綜合診斷[J].電力系統(tǒng)自動化,2006,30(7):46-50.
[14]王曉霞,王濤.基于粒子群算法優(yōu)化神經網絡的變壓器故障診斷[J].高電壓技術,2008,34(11):2362-2367.