王 瑩 盧秀和
(長春工業(yè)大學(xué),吉林 長春130012)
電力變壓器是電力系統(tǒng)中非常重要的樞紐電氣設(shè)備,其正常運(yùn)行是電力系統(tǒng)安全運(yùn)行與穩(wěn)定的前提,所以準(zhǔn)確、有效地進(jìn)行變壓器故障診斷顯得尤為重要。油溶氣體分析(DGA)技術(shù)[1]中改良三比值法是近年來常用的變壓器故障診斷方法,但由于變壓器的多種故障類型與改良三比值法中特征氣體組分含量之間的關(guān)系存在一定的模糊性和不確定性,導(dǎo)致改良三比值法在變壓器故障診斷中存在一定的不足[2]。為此需對DGA技術(shù)的改良三比值法中有關(guān)變壓器故障的多種數(shù)據(jù)進(jìn)行研究,而聚類分析法是研究和挖掘數(shù)據(jù)的主要方法[3]之一,為此分析改良三比值法的特征氣體三對比值之間的數(shù)據(jù)關(guān)系,采用改進(jìn)K均值聚類法對變壓器進(jìn)行故障診斷,從而進(jìn)一步提高電力變壓器故障判斷的精準(zhǔn)性。
聚類[4]就是按照不同事物間所具有的某種相異性對事物進(jìn)行分類和劃分的過程,該過程屬于無監(jiān)督分類,沒有先驗(yàn)知識和教師指導(dǎo),而是通過不同事物間相異程度(可用距離表示)來進(jìn)行。而聚類分析則是融進(jìn)了數(shù)學(xué)方法,對采集到的數(shù)據(jù)集進(jìn)行分類的一種分析。聚類算法按照聚類的方式、準(zhǔn)則和分類結(jié)果的取值方法分為很多種,本文采用按聚類準(zhǔn)則分類中的K均值聚類分析(簡稱K均值)和改進(jìn)K均值聚類分析(簡稱改進(jìn)K均值)來進(jìn)行變壓器故障診斷。
K均值算法先隨機(jī)選取K個(gè)對象作為初始聚類中心,然后計(jì)算每個(gè)對象與各個(gè)聚類中心的距離。算法步驟如下:
(1)K均值算法使用聚類準(zhǔn)則函數(shù)為誤差平方和準(zhǔn)則Jc:返回(2);否則算法結(jié)束。
為使聚類結(jié)果優(yōu)化,應(yīng)使準(zhǔn)則Jc最小。
(2)采集n個(gè)樣本,令I(lǐng)=1,表示迭代次數(shù),選取K個(gè)初始聚合中心Zj(1),j=1,2,…,K。
(3)計(jì)算每個(gè)樣本與聚合中心的距離D[xk,Zj(I)],k=1,2,…,n;j=1,2,…,K。若。
(4)計(jì)算K個(gè)新聚類中心:
(5)判斷:若Zj(I+1)≠Zj(I),j=1,2,…,K,則I=I+1,
K均值進(jìn)行初始分類時(shí),先隨機(jī)選一批代表點(diǎn),然后依次計(jì)算其他樣本歸類。先計(jì)算第一個(gè)樣本,把它歸于最近的一類,形成新的分類。然后計(jì)算新聚類中心,再計(jì)算第二個(gè)樣本到新聚類中心距離,對第二個(gè)樣本進(jìn)行歸類,依次類推。
K均值受初始值影響很大,不同初始點(diǎn)選擇會導(dǎo)致不同結(jié)果,改進(jìn)K均值算法對K均值算法的初始聚類中心選擇方法進(jìn)行了改進(jìn),從數(shù)據(jù)對象分布出發(fā)動態(tài)地尋找并確定初始聚類中心點(diǎn)。本文采用基于最小距離的初始聚類中心選取法[5]進(jìn)行改進(jìn)K均值的初始聚類中心點(diǎn)確定,然后再利用K均值進(jìn)行運(yùn)算。
在MATLAB中,調(diào)用如下程序可實(shí)現(xiàn)K均值聚類:[IDX,C,SUMD,D]=kmeans(data,K)。其中,IDX為聚類結(jié)果;C為聚類中心;SUMD為每一行樣本到該聚類中心距離和;D為每一個(gè)樣本到各個(gè)聚類中心距離;data為要聚類的數(shù)據(jù)集合,每一行為一個(gè)樣本;K為分類個(gè)數(shù)。
樣本數(shù)據(jù)選取改良三比值法的三對特征氣體的比值作為三個(gè)樣本特征值,即x=C2H2/C2H4、y=CH4/H2、z=C2H4/C2H6,選擇變壓器故障中的四種故障作為劃分類別,即低溫過熱、中溫過熱、高溫過熱和低能放電,分別編號為1、2、3、4。樣本數(shù)據(jù)如表1所示。
表" 樣本數(shù)據(jù)
利用K均值算法和改進(jìn)K均值算法MATLAB仿真圖如圖1和圖2所示。
圖" ;均值聚類算法分析圖
圖- 改進(jìn);均值聚類算法分析圖
本文在改良三比值法的基礎(chǔ)上利用改進(jìn)K均值算法將采集到的14組變壓器樣本數(shù)據(jù)進(jìn)行正確的分類和識別,實(shí)現(xiàn)了變壓器故障的診斷。
由圖1和圖2對比可以看出,14個(gè)點(diǎn)中有一個(gè)藍(lán)色點(diǎn)偏離很大,這是由于不同的初始點(diǎn)對K均值算法的分類和識別結(jié)果影響很大,K均值算法不能完全將14組樣本數(shù)據(jù)良好地分類識別。而改進(jìn)K均值算法可以很好地對14組樣本數(shù)據(jù)進(jìn)行判別和分類。由表1可以看出,改進(jìn)K均值算法彌補(bǔ)了K 均值算法對編號3和4無法良好識別的缺陷。
二者結(jié)果圖和表的對比,進(jìn)一步驗(yàn)證了改進(jìn)K均值算法在變壓器故障診斷中的準(zhǔn)確性、可行性和有效性。
[1]高文勝,嚴(yán)璋,談克熊.基于油中溶解氣體分析的電力變壓器絕緣故障診斷方法[J].電工電能新技術(shù),2000,19(1):22-26.
[2]彭寧云.基于DGA技術(shù)的變壓器故障智能診斷系統(tǒng)研究[D].武漢:武漢大學(xué),2004.
[3]陳舵.模糊聚類分析及其在電力變壓器故障診斷中的應(yīng)用研究[D].西安:西安理工大學(xué),2008.
[4]王子建.模糊聚類分析及其在變壓器油色譜數(shù)據(jù)分析中的應(yīng)用[D].武漢:華中科技大學(xué),2006.
[5]周潤景,張麗娜.基于MATLAB與fuzzyTECH的模糊與神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)[M].北京:電子工業(yè)出版社,2010.