摘? 要:變壓器作為電壓轉(zhuǎn)換設(shè)備,一旦發(fā)生故障,直接影響設(shè)備性能。然而在設(shè)備運(yùn)行過(guò)程中,變壓器系統(tǒng)大多處于正常狀態(tài),故障發(fā)生頻率較低,所監(jiān)測(cè)到的正常狀態(tài)數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于故障狀態(tài)數(shù)據(jù),存在樣本不平衡問(wèn)題。在變壓器系統(tǒng)故障診斷技術(shù)和不平衡樣本處理技術(shù)的基礎(chǔ)上,研究了基于Wasserstein生成對(duì)抗網(wǎng)絡(luò)與決策樹(shù)相結(jié)合的WGAN-DT故障診斷技術(shù)。結(jié)果表明,樣本平衡時(shí),采用WGAN-DT模型在測(cè)試集上的故障診斷準(zhǔn)確度高達(dá)96.00%。
關(guān)鍵詞:變壓器;故障診斷;不平衡數(shù)據(jù);生成對(duì)抗網(wǎng)絡(luò);決策樹(shù)
中圖分類號(hào):TP39;TM432 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2023)12-0043-05
Research on Transformer Fault Diagnosis Based on WGAN-DT under Unbalanced Conditions
WANG Jin1,2
(1.School of Electronics and Information, Xi'an Polytechnic University, Xi'an? 710048, China;
2.State Grid Xi'an Gao Ling District Power Supply Company, Xi'an? 710299, China)
Abstract: As a voltage conversion device, a transformer can directly affect the performance of the device if it malfunctions. However, during the operation of the equipment, the transformer system is mostly in a normal state, with a low frequency of faults. The monitored normal state data is far more than the fault state data, resulting in sample imbalance issues. On the basis of transformer system fault diagnosis technology and imbalanced sample processing technology, WGAN-DT fault diagnosis technology based on Wasserstein generative adversarial network and decision tree is studied. The results indicate that the fault diagnosis accuracy of using the WGAN-DT model on the test set is as high as 96.00% when the sample is balanced.
Keywords: transformer; fault diagnosis; unbalanced data; generative adversarial network; decision tree
0? 引? 言
變壓器作為大型設(shè)備電源系統(tǒng)的關(guān)鍵組成部分,對(duì)機(jī)載用電設(shè)備的穩(wěn)定性發(fā)揮著重要作用。隨著設(shè)備智能化、自動(dòng)化的飛速發(fā)展,變壓器系統(tǒng)也呈現(xiàn)出大功率、不間斷的特點(diǎn),表征變壓器系統(tǒng)的運(yùn)行參數(shù)也呈現(xiàn)出海量、高維等特征。然而在設(shè)備運(yùn)行過(guò)程中,變壓器系統(tǒng)大多處于正常狀態(tài),故障發(fā)生頻率較低,所監(jiān)測(cè)到的正常狀態(tài)數(shù)據(jù)遠(yuǎn)遠(yuǎn)多于故障狀態(tài)數(shù)據(jù)[1],存在樣本不平衡的問(wèn)題。
針對(duì)以上問(wèn)題,通過(guò)Wasserstein生成對(duì)抗網(wǎng)絡(luò)(Wasserstein Generative Adversarial Network, WGAN)擬合數(shù)據(jù)的特點(diǎn),構(gòu)造用于訓(xùn)練決策樹(shù)(Decision Tree, DT)故障診斷模型的增強(qiáng)樣本集,通過(guò)改善樣本集的不平衡情況來(lái)提升故障診斷效果。實(shí)驗(yàn)結(jié)果表明,隨著生成樣本的增多,故障診斷準(zhǔn)確度不斷提升,最高可達(dá)到96.00%。與經(jīng)典的故障診斷模型和采樣方法相比,所提的WGAN-DT方法在不平衡樣本故障診斷問(wèn)題上具有顯著優(yōu)勢(shì)。
1? WGAN-DT基本理論
針對(duì)變壓器系統(tǒng)故障診斷領(lǐng)域存在的樣本不平衡問(wèn)題,以及傳統(tǒng)重采樣方法存在的生成數(shù)據(jù)質(zhì)量差、類間重疊度高、多樣性不足等問(wèn)題[2],提出一種基于WGAN-DT的故障診斷方法,對(duì)樣本不平衡條件下變壓器的故障類型進(jìn)行準(zhǔn)確分類。
1.1? WGAN
生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN)基于零和博弈的思想,生成器和判別器在雙方的對(duì)抗中不斷更新達(dá)到納什均衡。生成器和判別器的損失函數(shù)設(shè)置如式(1)和式(2)所示[3]:
其中:V(D, G)表示目標(biāo)函數(shù);D表示判別器;G表示生成器;x表示真實(shí)樣本的數(shù)據(jù);z表示輸入的隨機(jī)噪聲,Pdata(x)表示x的數(shù)據(jù)分布,Pz表示z的數(shù)據(jù)分布。
GAN雖然能夠生成與真實(shí)樣本近似的生成樣本,但在實(shí)際應(yīng)用中仍存在訓(xùn)練過(guò)程不穩(wěn)定、梯度消失等問(wèn)題,且生成器生成的樣本缺乏多樣性,存在模式崩潰等問(wèn)題。因此Arjovsky等人[4]將Wasserstein距離引入到判別器和生成器的損失函數(shù)中,用于度量?jī)蓚€(gè)分布之間的距離,解決了GAN中KL散度和JS散度突變帶來(lái)的損失函數(shù)不連續(xù)、訓(xùn)練不穩(wěn)定以及模式崩潰等問(wèn)題。
1.2? ?WGAN-DT
在各類DT模型中,C4.5算法[5]適于處理變壓器系統(tǒng)的連續(xù)型參數(shù)值,并根據(jù)各類參數(shù)的信息增益率選取各個(gè)節(jié)點(diǎn)的分類規(guī)則,因此選用C4.5算法構(gòu)建用于變壓器系統(tǒng)故障診斷的DT模型,能夠有效提高變壓器系統(tǒng)的故障診斷準(zhǔn)確度。
在采用故障診斷模型對(duì)變壓器系統(tǒng)的各類典型故障模式進(jìn)行學(xué)習(xí)分類之前,使用WGAN生成各種少數(shù)類故障狀態(tài)樣本,增加故障狀態(tài)樣本的數(shù)量和多樣性,構(gòu)造平衡數(shù)據(jù)集作為DT故障診斷模型的輸入,避免由于樣本不平衡而導(dǎo)致模型過(guò)擬合,提升變壓器系統(tǒng)的故障診斷準(zhǔn)確度。不平衡樣本條件下基于WGAN-DT方法的變壓器故障診斷流程如圖1所示。
2? 不平衡樣本條件下基于WGAN-DT的故障診斷技術(shù)
將正常樣本作為多數(shù)類樣本,其余8類故障狀態(tài)作為少數(shù)類樣本,分別是變壓器電樞繞組單相開(kāi)路故障、電樞繞組相間短路故障、電樞繞組單相對(duì)電機(jī)外殼短路故障、交流勵(lì)磁機(jī)電樞繞組單相開(kāi)路故障、交流勵(lì)磁機(jī)電樞繞組相間短路故障、旋轉(zhuǎn)整流器單個(gè)二極管開(kāi)路故障、交流勵(lì)磁機(jī)勵(lì)磁繞組開(kāi)路故障、交流勵(lì)磁機(jī)勵(lì)磁繞組對(duì)電機(jī)外殼短路故障,以此構(gòu)造不平衡數(shù)據(jù)集,作為后續(xù)基于WGAN-DT方法實(shí)現(xiàn)樣本不平衡條件下故障診斷的數(shù)據(jù)基礎(chǔ)。研究將不平衡比例設(shè)為100:1,開(kāi)展不平衡樣本條件下的故障診斷技術(shù)研究。
按照一定的信噪比SNR向初始仿真數(shù)據(jù)加入噪聲,增加樣本的多樣性,進(jìn)而保證WAGN方法生成的數(shù)據(jù)具有多樣性。
其中,PS表示信號(hào)能量,PN表示噪聲能量。
2.1? 基于WGAN的樣本生成模型構(gòu)建
根據(jù)多層感知機(jī)實(shí)現(xiàn)非線性函數(shù)擬合的特點(diǎn),構(gòu)建WGAN的生成器和判別器,實(shí)現(xiàn)生成樣本真假判定值的非線性映射。WGAN算法的偽代碼如下:
WGAN算法:更新k次判別器后更新1次生成器(設(shè)置k = 3),生成器迭代次數(shù)為t。
1)隨機(jī)初始化生成器和判別器的參數(shù)θ0、w0。
2)輸入:少數(shù)類故障狀態(tài)樣本data,隨機(jī)噪聲數(shù)據(jù)z。
3)對(duì)0→t次迭代。
4)對(duì)0→k次迭代。
5)從故障狀態(tài)樣本data中選取m個(gè)樣本{x1, x2,…, xm}。
6)從噪聲數(shù)據(jù)z中選取m個(gè)樣本{z1, z2,…, zm}。
7)基于判別器損失值更新參數(shù):
8)w - α×RMSProp(w, gw)→w。
9)結(jié)束。
10)從噪聲數(shù)據(jù)z中選取m個(gè)樣本{z1, z2,…, zm}。
11)基于隨機(jī)梯度下降法更新生成器參數(shù):
12)θ - α×RMSProp(w, gw)→θ。
13)結(jié)束。
14)輸出:完成訓(xùn)練的WGAN模型。
在基于WGAN的樣本生成模型中,生成器由兩層全連接層構(gòu)成,判別器由三層全連接層構(gòu)成。WAGN模型采用RMSprop作為優(yōu)化器,學(xué)習(xí)率為0.001,批量樣本數(shù)量大小設(shè)置為40,迭代次數(shù)設(shè)置為10 000次,樣本歸一化范圍為0到1,生成器輸入的隨機(jī)噪聲范圍為0到1。
2.2? 基于WGAN的故障狀態(tài)樣本生成
針對(duì)變壓器系統(tǒng)存在的樣本不平衡問(wèn)題,采用WGAN模型生成的少數(shù)類故障狀態(tài)樣本,對(duì)原始不平衡樣本集中的少數(shù)類樣本進(jìn)行擴(kuò)充,共訓(xùn)練96個(gè)WGAN模型。圖2以交流勵(lì)磁機(jī)A相電樞繞組電流這一參數(shù)為例,將其中4種典型故障狀態(tài)下真實(shí)樣本的參數(shù)波形和基于WGAN模型得到的生成樣本參數(shù)波形進(jìn)行展示。
通過(guò)對(duì)比變壓器系統(tǒng)8種典型故障狀態(tài),交流勵(lì)磁機(jī)A相電樞繞組電流的真實(shí)樣本和生成樣本波形的變化趨勢(shì)、周期、幅值等與真實(shí)樣本具有較高的相似度,WGAN很好地學(xué)到了不同故障模式間原始參數(shù)的特征,生成效果良好,為后續(xù)擴(kuò)充樣本集,實(shí)現(xiàn)故障診斷提供良好的數(shù)據(jù)基礎(chǔ)。
3? 結(jié)果分析
3.1? 基于增強(qiáng)樣本集的故障診斷實(shí)驗(yàn)
基于訓(xùn)練好的WGAN模型生成變壓器系統(tǒng)8種典型故障狀態(tài)(故障代號(hào)為F1-F8)的各類監(jiān)測(cè)參數(shù),用于擴(kuò)充原始不平衡樣本集中的少數(shù)類故障狀態(tài)樣本。通過(guò)在原始不平衡樣本集的每類故障狀態(tài)樣本中分別加入數(shù)量為10、90、190、990的生成樣本,構(gòu)造不平衡比例分別為50:1、10:1、5:1和1:1的增強(qiáng)樣本集。
為驗(yàn)證基于WGAN模型生成的變壓器系統(tǒng)故障狀態(tài)樣本對(duì)于改善樣本集不平衡情況以及提升故障診斷的有效性,采用上述完成8種少數(shù)類故障狀態(tài)樣本擴(kuò)充的增強(qiáng)樣本集,訓(xùn)練DT故障診斷模型,并采用測(cè)試集對(duì)完成訓(xùn)練的DT模型進(jìn)行測(cè)試,訓(xùn)練集和測(cè)試集的故障診斷準(zhǔn)確度變化如圖3所示,原始不平衡樣本與增強(qiáng)樣本集故障診斷結(jié)果的混淆矩陣對(duì)比如圖4至圖8所示。
由圖3至圖8可知,隨著WGAN生成的少數(shù)類故障樣本的不斷補(bǔ)充,原始樣本的數(shù)量和多樣性都得到了提高,此外,樣本的不平衡比例隨之減小,樣本不平衡對(duì)模型診斷性能和泛化能力的影響不斷降低,因此,DT故障診斷模型在測(cè)試集上的故障診斷準(zhǔn)確度得到不同程度的提升。在最原始的樣本不平衡比例100:1條件下,故障診斷模型在測(cè)試集上的準(zhǔn)確度僅為62.22%,隨著生成樣本的不斷增加,基于增強(qiáng)樣本集訓(xùn)練的DT故障診斷模型在測(cè)試集上的診斷準(zhǔn)確度不斷提升,最終基于平衡的增強(qiáng)樣本集訓(xùn)練的DT模型,在測(cè)試集上的準(zhǔn)確度可以達(dá)到96.00%,充分說(shuō)明生成樣本在很大程度上增強(qiáng)了各類故障狀態(tài)樣本的多樣性,提升了故障診斷模型的性能。
3.2? 故障診斷方法對(duì)比實(shí)驗(yàn)
為驗(yàn)證WGAN-DT故障診斷方法的有效性,將故障診斷領(lǐng)域常用的支持向量機(jī)模型、K近鄰模型和DT模型與之進(jìn)行對(duì)比。此外,為顯示W(wǎng)GAN模型在變壓器系統(tǒng)少數(shù)類故障狀態(tài)樣本生成方面的優(yōu)勢(shì),將經(jīng)典的重采樣方法與DT模型相結(jié)合,構(gòu)建不平衡樣本條件下的變壓器系統(tǒng)故障診斷方法。選取的重采樣方法包括隨機(jī)過(guò)采樣、SMOTE、隨機(jī)欠采樣、Tomek Link以及SMOTE和Tomek相結(jié)合的混合采樣方法等,用于對(duì)樣本集進(jìn)行平衡化處理。方法對(duì)比的故障診斷結(jié)果如表1所示。
通過(guò)與其他模型、重采樣方法和DT模型相結(jié)合的故障診斷方法進(jìn)行對(duì)比可知,WGAN-DT方法在變壓器系統(tǒng)的不平衡樣本集上的故障診斷準(zhǔn)確率最高,達(dá)到了96.00%,比RUS-DT的方法高出7.33%,表現(xiàn)出明顯的優(yōu)勢(shì)。經(jīng)典故障診斷模型直接基于原始不平衡樣本集進(jìn)行訓(xùn)練,存在過(guò)擬合、泛化能力差等問(wèn)題,使得診斷的正確率不高,而WGAN-DT訓(xùn)練增強(qiáng)樣本集,避免了樣本數(shù)據(jù)不平衡導(dǎo)致的模型過(guò)擬合,對(duì)少數(shù)類樣本診斷正確度低的問(wèn)題。
4? ?結(jié)? 論
在不平衡樣本條件下,本文提出基于WGAN-DT的故障診斷技術(shù),構(gòu)造不同不平衡比例的增強(qiáng)樣本集,并對(duì)比基于不同不平衡比例的增強(qiáng)樣本集進(jìn)行訓(xùn)練后,DT模型故障診斷準(zhǔn)確度的變化情況。結(jié)果表明,采用WGAN模型能夠生成接近真實(shí)故障樣本概率分布的生成樣本,實(shí)現(xiàn)少數(shù)類故障狀態(tài)樣本數(shù)量和多樣性的增加,有效提升了故障診斷模型對(duì)少數(shù)類故障狀態(tài)樣本的識(shí)別率,從數(shù)據(jù)層面解決了經(jīng)典故障診斷模型在不平衡樣本條件下診斷準(zhǔn)確度較低的問(wèn)題,顯著提升了故障診斷模型的準(zhǔn)確度。
參考文獻(xiàn):
[1] 鄧永成,蕭偉云,李偉,等.變壓器的運(yùn)行狀態(tài)檢測(cè)方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì):CN 111524118 A [P].2020-08-11.
[2] 蘇磊,徐鵬,黃華,等.一種考慮不平衡數(shù)據(jù)樣本的變壓器故障診斷方法及系統(tǒng):CN 110133146 A [P].2019-08-16.
[3] GOODFELLOW I J,POUGET-ABADIE J,MIRZA M,et al. Generative Adversarial Nets [C]//Proceedings of the 27th International Conference on Neural Information Processing Systems.Montreal:MIT Press,2014:2672-2680.
[4] ARJOVSKY M,CHINTALA S L. Wasserstein generative adversarial networks [C]//Proceedings of the 34th International Conference on Machine Learning. Sydney:JMLR.org,2017,70:214-223.
[5] QUINLAN J R. C4.5 Programs for Machine Learn-ing [M].San Mateo:Morgan Kaufmann Publishers Inc,1992.
作者簡(jiǎn)介:王錦(1996—),女,漢族,陜西西安人,助理工
程師,碩士研究生,研究方向:電力設(shè)備故障診斷、模式識(shí)別與深度學(xué)習(xí)。