■ 華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院 趙文清
針對傳統(tǒng)的變壓器故障診斷方法的不足.各種智能技術(shù)被引入變壓器故障診斷中.并取得了比較好的效果[1-5]。變壓器檢修試驗(yàn)所獲取的數(shù)據(jù)包括離線試驗(yàn)數(shù)據(jù)和連續(xù)監(jiān)測的在線數(shù)據(jù).在實(shí)際應(yīng)用中。由于受到環(huán)境和條件的限制。大部分情況下得到的數(shù)據(jù)樣本或者包含不完整數(shù)據(jù)或者變壓器故障樣本數(shù)很少,如何充分利用有限的變壓器數(shù)據(jù)樣本和不完整數(shù)據(jù)樣本中包含的信息。始終是變壓器診斷領(lǐng)域研究的熱點(diǎn)問題。
貝葉斯網(wǎng)絡(luò)用概率測度的權(quán)重來描述數(shù)據(jù)間的相關(guān)性.從而解決了數(shù)據(jù)間的不一致性問題和信息不完備問題[6-8]。針對變壓器故障診斷中原始試驗(yàn)數(shù)據(jù)的屬性缺失問題。文獻(xiàn)[9]使用粗糙集進(jìn)行屬性的約簡,然后再利用貝葉斯網(wǎng)絡(luò)分類器進(jìn)行故障甄別,取得了較好的效果:但即使是經(jīng)過屬性約簡之后的試驗(yàn)數(shù)據(jù),可能還有部分?jǐn)?shù)據(jù)不完整。本文將使用選擇性貝葉斯分類器解決該問題,直接從不完整數(shù)據(jù)計(jì)算貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的測度值來學(xué)習(xí)一般的貝葉斯網(wǎng)絡(luò)。選擇性分類器通過刪除數(shù)據(jù)集中的無關(guān)屬性和冗余屬性可有效地提高分類精度和效率。
在不完整數(shù)據(jù)條件下,一般貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)是一個難點(diǎn)問題。雖然在這方面取得了一定的成果,如近似邊緣分布方法[10]、AutoClass方法[11]、SEM(Structural EM)算法[12]等。但這些方法的共同策略是對不完整數(shù)據(jù)進(jìn)行修補(bǔ),采用循環(huán)迭代、逐步求精的學(xué)習(xí)過程.這需多次迭代才能收斂,并且每向前迭代一步都要進(jìn)行一次數(shù)據(jù)修補(bǔ)。變壓器故障診斷中。即使經(jīng)過粗糙集約簡,不完整數(shù)據(jù)仍有可能比較多,若采用以上方法學(xué)習(xí)貝葉斯網(wǎng)絡(luò)。將是很耗時甚至是不可行的:同時,這些方法都基于缺值數(shù)據(jù)滿足MAR(Missing At Random)假設(shè)[13]。當(dāng)不滿足這個假設(shè)時,其數(shù)據(jù)修補(bǔ)方法的精度會顯著下降,由此構(gòu)造的分類器的精度也會下降[14]。為避免MAR假設(shè),文獻(xiàn)[15]提出了一種RBC(Robust Bayes Classifier),該方法在不要求缺值數(shù)據(jù)滿足MAR假設(shè)的前提下,可以直接從不完整數(shù)據(jù)構(gòu)造貝葉斯分類器。文獻(xiàn)[16]提出了用于不完整數(shù)據(jù)的選擇性貝葉斯分類器SRBC(Selective Robust Bayes Classifiers),SRBC是在RBC基礎(chǔ)上利用包裝法構(gòu)建的用于不完整數(shù)據(jù)的選擇性貝葉斯分類器;并證明該方法在大幅度減少屬性數(shù)目的同時,能顯著提高分類準(zhǔn)確率和穩(wěn)定性,分類效果優(yōu)于樸素貝葉斯和其他選擇性分類器。
變壓器故障屬性集、故障類、訓(xùn)練樣本集分別如表1、表2、表3所示[9]。表3中x2=0、x2=l、x2=2、x5=0、x5=1、x5=2分別表示油中溶解氣體分析(DGA)結(jié)果為無過熱、低溫過熱、高溫過熱、無放電、低能量放電、高能量放電;x1、x3、x4、x7、x8、x9、x10、x11、x13、x14、的值為 0、l、2分別表示屬性值和趨勢值均不超標(biāo)、屬性值或趨勢值超標(biāo)、屬性值和趨勢值均超標(biāo);*表示因試驗(yàn)未做而不能確定的值。
本文利用文獻(xiàn)[16]提出的用于不完整數(shù)據(jù)的SRBC直接從不完整數(shù)據(jù)計(jì)算貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的測度值來學(xué)習(xí)一般的貝葉斯網(wǎng)絡(luò).從而構(gòu)建針對變壓器故障屬性缺失之下的故障診斷模型。文獻(xiàn)[16]在利用包裝法構(gòu)建SRBC的過程中,采用了搜索效果好而復(fù)雜度相對較低的最好優(yōu)先前向搜索方法對屬性空間進(jìn)行搜索。
表1 屬性集
表2 故障類
設(shè)X={x1、x2…xN}為整個變壓器故障屬性的集合。N為X中屬性的個數(shù),本文取N=14:Q為一個隊(duì)列。用來存放曾是最優(yōu)的變壓器故障屬性子集及其對應(yīng)的故障診斷正確率;Sb為當(dāng)前最優(yōu)變壓器故障屬性子集,d(S)表示RBC在變壓器故障屬性子集S上的故障診斷正確率;閾值T為用來控制搜索過程是否停止的參數(shù),即如果連續(xù)T次對Q的頭結(jié)點(diǎn)進(jìn)行擴(kuò)展都沒有使當(dāng)前最高故障診斷正確率改善,則搜索過程結(jié)束。
表3 訓(xùn)練樣本集
SRBC算法可描述如下:
a.初始化,設(shè)置參數(shù)T,令整數(shù)t=0,令變壓器故障屬性xS=arg max{d({xi})},當(dāng)前最高分類精度dmax=d({xS}),將變壓器故障屬性子集{xS}作為一個結(jié)點(diǎn)加入到隊(duì)列Q中;
b.當(dāng)t<T時執(zhí)行步驟c,d和e,否則執(zhí)行步驟f;
c.取出Q的頭結(jié)點(diǎn)Sh(為一屬性子集),令added=false(added用來標(biāo)志在對Q的頭結(jié)點(diǎn)的擴(kuò)展中,是否向Q中加入新的結(jié)點(diǎn)),對每一屬性x∈X-Sh,如果Sh∪{x}沒有被評價(jià)過,且d(Sh∪{x})>dmax,則令added=true,Sb= Sh∪{x},dmax=d(Sh∪{x}),以及t=0,并且將Sb作為一個新結(jié)點(diǎn)加入到隊(duì)列Q中;
d.如果added=false,那么t←t+l;
e.轉(zhuǎn)到步驟b繼續(xù)執(zhí)行;
f.在最終的變壓器故障屬性子集Sb上構(gòu)建RBC。
為了與文獻(xiàn)[9]的方法進(jìn)行對比,本文利用文獻(xiàn)[9]整理搜集的變壓器測試數(shù)據(jù),同樣地,取200個樣本中的150個實(shí)例作為訓(xùn)練集,50個實(shí)例作為檢測集,構(gòu)建了SRBC變壓器故障診斷模型。
a.屬性信息缺失時選擇性貝葉斯分類器與各種分類器診斷效果的比較。
工程實(shí)際中樣本的屬性信息經(jīng)常是殘缺的,為了模擬屬性殘缺情況,文獻(xiàn)[9]將上述50個待檢測樣本(多數(shù)存在屬性缺失現(xiàn)象)作為檢測樣本集的基礎(chǔ),隨機(jī)去掉2~10個屬性值的測試樣本各500個。本文利用相同的數(shù)據(jù)集,建立SRBC模型對測試樣本進(jìn)行診斷,同時與文獻(xiàn)[9]所建立的NB、TAN、BAN模型和粗糙集決策表匹配方法進(jìn)行比較,比較結(jié)果見表4。結(jié)果表明SRBC具有較強(qiáng)的處理不完備信息的能力,其診斷效果優(yōu)于TAN、NB、BAN及粗糙集決策表匹配方法。
表4 屬性不完備的測試樣本的診斷結(jié)果
b.與文獻(xiàn)[9]所建立的NB、TAN、BAN粗集分類器模型診斷效果的比較。
為了與各種診斷模型在診斷效果方面進(jìn)行比較,與文獻(xiàn)[9]一樣,本文在50個待檢測樣本的基礎(chǔ)上形成了30個缺失一個關(guān)鍵屬性的樣本(關(guān)鍵屬性個數(shù)為3~5個),診斷結(jié)果對比見表5。
表5 缺失一個關(guān)鍵屬性的診斷結(jié)果
某主變(SFSZ7-40000/110),所用有載開關(guān)為ZYI系列國產(chǎn)開關(guān),1995年5月18日安裝投運(yùn).由于供電用戶對電壓合格率要求高,調(diào)壓頻率比較頻繁,變壓器DGA數(shù)據(jù)如表6所示。
表6 實(shí)例的DGA數(shù)據(jù) μL/L
由于氣體組分中C2H2占主要成分,且超出注意值,IEC三比值碼為100,初步懷疑變壓器內(nèi)部存在高能量的放電故障。由表6和試驗(yàn)規(guī)程可知x2=0,x5=2,x9=0。油中微水含量為11.5μL/L,x4=0。另外,現(xiàn)場停電對變壓器進(jìn)行全面電氣檢查試驗(yàn),變壓器繞組直流電阻、空載損耗、繞組及鐵心絕緣、變壓比、繞組泄漏電流等試驗(yàn)項(xiàng)目均無異常,所以x1=0,x7=2,x13=0。
使用SRBC模型和文獻(xiàn)[9]中的模型分別進(jìn)行故障診斷,結(jié)果如圖1所示(圖中,i=0,1,…,12)。很明顯,在已知數(shù)據(jù)E的前提下SRBC模型、NB粗集、TAN粗集和BAN粗集模型計(jì)算所得的類C12的后驗(yàn)概率最大,分別為1.00、0.71、O.82、0.79;類C0的后驗(yàn)概率分別為0、0.002l、0.035、0.21。所以可判斷該變壓器故障為C12,即有載分接開關(guān)油滲漏。與當(dāng)時該變壓器吊芯檢查的結(jié)果相符。
圖l 各種模型對實(shí)例的診斷結(jié)果
針對已有變壓器故障診斷方法在信息缺失多、有偏差的情況下誤判率高的問題,提出了用于變壓器故障診斷的選擇性貝葉斯分類器模型.該模型直接從不完整的變壓器試驗(yàn)數(shù)據(jù)估算變量的概率分布.進(jìn)而完成故障診斷。另外,該模型的結(jié)構(gòu)和參數(shù)能夠隨著樣本集的擴(kuò)大而完善,因而具有學(xué)習(xí)功能。實(shí)驗(yàn)表明,該方法具有處理不完備信息的能力和容錯特性,其性能明顯優(yōu)于其他貝葉斯網(wǎng)絡(luò)分類器方法。
[1]WEI Shouzhi,JIN Ningle.Fault diagnosis system based on information fusion and embedded internet[C]//2007 IEEE International Conference on Integration Technology.Shenzhen,China:IEEE Computer Society,2007:203-207.
[2]WANG Chenhao,HUANG Huixian,XIAO Yewei,et a1.Fault diagnosis of power transformers based on BP network with colonial selection algorithm[C]//Third International Conference on Natural Computation.Haikou,China:IEEE Computer Society,2007:13-16.
[3]JIA Honghong,DAI Wenzhan.Fault diagnosis against oil-im-mersed transformer based on PNN and GM(1,1)[C]//2007 IEEE International Conference On Integration Technology.Shenzhen,China:IEEE Computer Society,2007:394-397.
[4]BABU P,KALAVATHI S.Use of wavelet and neural network(BPFN)for transformer fault diagnosis[C]//2006 IEEE Conference on Electrical Insulation and Dielectric Phenomena.Kansas City,Missouri,USA:IEEE Electrical Insulation Magazine,2006:93-96.
[5]董明,屈彥明,周孟戈,等.基于組合決策樹的油浸式電力變壓器故障診斷[J].中國電機(jī)工程學(xué)報(bào),2005,25(16):36-41.
[6]NILSSON N.Artificial intelligence,a new synthesis[M].San Francisco,USA:Morgan Kaufmann Publishers,1998:196-240.
[7]王華偉,周經(jīng)倫,何祖玉.等.基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障診斷[J].計(jì)算機(jī)集成制造系統(tǒng),2004,10(2):230-234.
[8]李儉川,胡蔦慶,秦國軍,等.貝葉斯網(wǎng)絡(luò)理論及其在設(shè)備故障診斷中的應(yīng)用[J].中國機(jī)械工程,2003,14(10):896-900.
[9]吳立增.變壓器狀態(tài)評估方法的研究[D].保定:華北電力大學(xué)電氣工程學(xué)院.2005.
[10]CHICKERING D M,HECKERMAN D,MEEK C.Large sample learning of Bayesian networks is NP-hard[J].Journal of Machine Learning Research,2004,39(5):1287-1330.
[11]CHEESEMAN P,STUTZ J.Bayesian classification(autoclass):theory and results[M]∥FAYYAD U M,PIATETSKY-SHAPIRO G.SMYTH P.et a1.Advances in knowledge discovery and datamining.Menlo Park,California.USA:AAAI Press,1996:153-180.
[12]FRIEDMAN N.The Bayesian structural EM algorithm[c]∥Proceedings of the 14th Conference on Uncertainty in Artificial Intelligence.San Francisco,USA:Morgan Kaufmann Publishers,1998:129-138.
[13]LITTLE R J A,RUBIN D B.Statistical analysis with missing data[M].New York,USA:Wiley.1987:120-149.
[14]SPIEGELHALTER D J,COWELL R G.Learning in probabilistic expert systems[C]//Proceedings of the Fourth Valencia International Meeting on Bayesian Statistics.Oxford,England:Oxford University Press.1992:447-466.
[15]RAMONI M,SEBASTIANI P.Robust Bayes classifiers[J].Artificial Intelligence.2001.125(1-2):209-226.
[16]陳景年,黃厚寬,田鳳占,等.用于不完整數(shù)據(jù)的選擇性貝葉斯分類器[J].計(jì)算機(jī)研究與發(fā)展,2007,44(8):1324.1329.