勒國(guó)慶,王 浩
(邵陽學(xué)院 多電源地區(qū)電網(wǎng)運(yùn)行與控制湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 邵陽,422000)
通過研究變壓器的故障診斷方法,并針對(duì)當(dāng)前故障診斷中存在的重點(diǎn)問題,在智能算法的改進(jìn)、實(shí)現(xiàn)和方法融合等方面做出了研究,其中主要研究的人工智能算法是PNN算法。
1989年,D.F.Specht博士最先提出PNN,這是一種并行算法,它源自于Bayes分類規(guī)則與Parzen窗的概率密度函數(shù)估計(jì)方法,并經(jīng)過長(zhǎng)期的發(fā)展而得來的[1]。PNN是一種具有強(qiáng)大的非線性分類能力的算法,它能較為準(zhǔn)確地把樣本空間反映到故障模式空間,使得最終的數(shù)據(jù)誤差在允許范圍內(nèi),并具有較強(qiáng)的自適應(yīng)結(jié)構(gòu)能力,較之前的Bayes神經(jīng)網(wǎng)絡(luò)相比不易陷入局部最優(yōu)解。通過分析Matlab仿真結(jié)果,得出其可以有效提高變壓器故障診斷的準(zhǔn)確性[2-5]。
變壓器故障分類方法因分類標(biāo)準(zhǔn)而異。在研究變壓器的故障類型時(shí),主要是按照故障的性質(zhì)分類的,主要包含5種故障類型,分別是中低溫過熱、高溫過熱、局部放電、低能放電以及高能放電[6]。表1是國(guó)家電網(wǎng)對(duì)359臺(tái)故障變壓器的故障類型統(tǒng)計(jì)。
表1 變壓器故障類型統(tǒng)計(jì)
三比值法是變壓器故障診斷的最基本方法,也是能夠最廣泛用于實(shí)踐的一種方法,其工作原理是:變壓器內(nèi)部發(fā)生故障時(shí)會(huì)產(chǎn)生氣體,根據(jù)各種氣體的相對(duì)比值在不同時(shí)間的變化,從而確定變壓器的運(yùn)行狀態(tài)。本次研究在進(jìn)行編碼時(shí),選用的是5種特征氣體,分別為甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)和氫氣(H2),從而構(gòu)成三對(duì)比值,分別為C2H2/C2H4、CH4/H2、C2H4/C2H6,然后根據(jù)各個(gè)比值的范圍,編寫不同的代碼[7]。首先將計(jì)算出每組氣體的比值,通過查找表中數(shù)據(jù)得到每組氣體所對(duì)應(yīng)的編碼,然后把這三組氣體對(duì)應(yīng)的編碼合并組合起來,最后對(duì)照編碼組合表,從中找出其對(duì)應(yīng)的變壓器基本故障類型。
通過上述分析可以發(fā)現(xiàn):測(cè)量后編碼并對(duì)三種氣體的比值進(jìn)行對(duì)比分析,仍然需要很大的人力和物力,故結(jié)合人工智能的變壓器故障診斷方法為變壓器的故障診斷開辟了新的途徑。在人工智能領(lǐng)域中,人工神經(jīng)網(wǎng)絡(luò)和專家系統(tǒng)的研究最為突出,所以文中主要對(duì)概率神經(jīng)網(wǎng)絡(luò)展開研究分析。
將油中溶解氣體三比值數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入特征向量,將5種變壓器故障類型作為輸出特征向量并在模型輸出層輸出,還可以通過實(shí)際的生產(chǎn)生活需要對(duì)診斷的故障類型數(shù)進(jìn)行擴(kuò)展,前提是要采集到足夠多種類的樣本集[8]。
采用Matlab對(duì)基于PNN的變壓器故障診斷模型進(jìn)行仿真整體設(shè)計(jì)流程框圖如圖1所示。
圖1 基于PNN的變壓器故障診斷模型整體設(shè)計(jì)框圖Fig.1 Overall design block diagram of transformer fault diagnosis model based on PNN
故障診斷模型建立成功后,用上文提到的Matlab調(diào)用PNN函數(shù)來進(jìn)行仿真。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和Matlab庫中函數(shù)有如下對(duì)應(yīng):第一層是輸入層,它屬于徑向基層,該層使用函數(shù)netprod計(jì)算,第二層是模式層,它是一種競(jìng)爭(zhēng)模式的網(wǎng)絡(luò)層,由dotprod函數(shù)來計(jì)算其所占的權(quán)重[1]。模型當(dāng)中使用函數(shù)netsum計(jì)算網(wǎng)絡(luò)輸入。只有newpnn的第一層才具有閾值向量,在設(shè)置的時(shí)候把第一層設(shè)置為輸入向量的轉(zhuǎn)置P′,并且將所有閾值向量設(shè)置為0.8326/spread,故在加權(quán)輸入向量中,徑向基函數(shù)設(shè)置+/-spread值為0.5,第二層權(quán)值向量為目標(biāo)向量T[9]。PNN是一種徑向基網(wǎng)絡(luò),并且十分適用于模式分類領(lǐng)域,在設(shè)置分類時(shí),其spread接近于0時(shí)構(gòu)成最近的鄰近分類器,當(dāng)spread值較大時(shí)可以形成對(duì)多個(gè)訓(xùn)練樣本的鄰近分類器。
文中研究的基于PNN的故障診斷系統(tǒng)中,訓(xùn)練樣本數(shù)和擴(kuò)散值spread都會(huì)影響到診斷結(jié)果的準(zhǔn)確性[10]。本研究需要確定兩者對(duì)PNN診斷性能有何具體影響,因此下面將展開如下的驗(yàn)證操作:首先通過實(shí)驗(yàn)探究故障樣本數(shù)目的大小對(duì)診斷準(zhǔn)確率的影響。為此,從所有搜集到的樣本數(shù)據(jù)中選取4組樣本數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,選取的樣本數(shù)分別為:15,25,35,45。為了能夠準(zhǔn)確檢測(cè)樣本數(shù)量對(duì)PNN網(wǎng)絡(luò)的診斷準(zhǔn)確率的影響,spread值全部取0.2,并使用15個(gè)樣本來對(duì)其驗(yàn)證。
在Matlab的仿真環(huán)境當(dāng)中可以直接通過newpnn()來調(diào)用pnn模塊。在仿真中輸入pnn4515.data,它是60x4維的矩陣,前三列代表不同的三種氣體的比值,矩陣的最后一列表示變壓器運(yùn)行的實(shí)際故障類型,60行則代表的是樣本集為60個(gè)。
當(dāng)訓(xùn)練樣本數(shù)量為45時(shí),根據(jù)圖2可以看出通過Matlab的figure繪圖函數(shù)調(diào)用之后,“筷”狀圖的頂點(diǎn)有“*”和“^”兩種圖形表示方式。其中“筷”狀圖頂點(diǎn)畫“*”的代表的是“t_train_temp”,即真實(shí)的樣本值,其對(duì)應(yīng)的縱坐標(biāo)為樣本的真實(shí)故障類型。頂點(diǎn)為“^”的代表“p_test”,即PNN網(wǎng)絡(luò)的變壓器故障分類預(yù)測(cè)值。
圖2是訓(xùn)練樣本為45的PNN訓(xùn)練與預(yù)測(cè)結(jié)果圖,樣本3,4,8,11,13的“筷”狀圖頂點(diǎn)“*”和“^”都沒有發(fā)生重合,這5個(gè)樣本在訓(xùn)練樣本數(shù)為35的訓(xùn)練環(huán)境下診斷預(yù)測(cè)出現(xiàn)失誤。
圖2 訓(xùn)練樣本為45診斷結(jié)果圖 Fig.2 Diagnostic result of training sample 45
訓(xùn)練樣本數(shù)量不同,診斷所得出的結(jié)果也不同,相應(yīng)的診斷的準(zhǔn)確率也不同,對(duì)診斷結(jié)果進(jìn)行統(tǒng)計(jì)與分析的結(jié)果詳見表2所示。
表2 基于PNN訓(xùn)練樣本數(shù)不同情況下對(duì)應(yīng)的檢測(cè)結(jié)果匯總表
續(xù)表
注:表中帶*號(hào)的為診斷與實(shí)際故障類型產(chǎn)生偏差的樣本,1-5所代表的故障類型依舊為:1代表正常狀態(tài);2代表低能放電;3代表高能放電;4代表中低溫過熱;5代表高溫過熱。
對(duì)表2中基于PNN訓(xùn)練樣本數(shù)不同情況下對(duì)應(yīng)的檢測(cè)結(jié)果匯總表進(jìn)行分類統(tǒng)計(jì),可以得到不同訓(xùn)練樣本數(shù)目分別對(duì)應(yīng)的檢測(cè)正確概率值,匯總后如表3所示。
表3 基于PNN訓(xùn)練樣本數(shù)不同情況下對(duì)應(yīng)的檢測(cè)正確率
由表2和表3可以得出如下結(jié)論:預(yù)測(cè)診斷的正確率和訓(xùn)練樣本的個(gè)數(shù)是成正比的,即能夠采集到足夠多的變壓器油中溶解氣體比值的樣本數(shù)據(jù),并對(duì)PNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,則故障診斷的準(zhǔn)確度會(huì)提升。另外,通過Matlab仿真結(jié)果可以發(fā)現(xiàn),樣本數(shù)據(jù)的質(zhì)量可以影響到故障診斷的準(zhǔn)確性,所以選取的樣本不但要具有典型性,還必須有一定的覆蓋率,還要能夠基本涵蓋所需要檢測(cè)的故障類型樣本。
而后,把Spread值以遞增形式分別取0.1,0.2,0.4,0.6,0.8,1.0,其他條件如訓(xùn)練樣本數(shù)和檢測(cè)樣本數(shù)都相同的情況下來進(jìn)行Matlab仿真研究。將訓(xùn)練樣本集和檢測(cè)樣本集建立一個(gè)mat文件做好存儲(chǔ),將其命名為“pnn.mat”。在Matlab進(jìn)行仿真研究過程當(dāng)中,均采用15組數(shù)據(jù)作為檢測(cè)樣本集進(jìn)行檢測(cè),由于數(shù)據(jù)繁瑣,所以直接在表4直接匯總展示。
表4 spread值對(duì)于診斷率的影響
從表4可以看出,spread值將直接影響診斷的精確度,且當(dāng)spread值為0.1時(shí),系統(tǒng)的故障診斷準(zhǔn)確率最高,準(zhǔn)確率達(dá)到73.3%。但對(duì)于各個(gè)生產(chǎn)生活領(lǐng)域?qū)ψ儔浩鞴收显\斷準(zhǔn)確率的需求來說,這還是遠(yuǎn)遠(yuǎn)不夠的,因此為了提高診斷精度,在下面將對(duì)基于PNN的變壓器故障診斷模型加上RS粗糙集理論進(jìn)行改進(jìn)。
RS和PNN用于診斷變壓器故障。把RS理論作為PNN網(wǎng)絡(luò)第一層輸入層結(jié)構(gòu)的前置環(huán)節(jié),使用RS對(duì)大量的樣本集進(jìn)行簡(jiǎn)約和優(yōu)化,因?yàn)镽S理論不在乎樣本數(shù)據(jù)集的分布,而且在獲取樣本數(shù)據(jù)信息不全面的境地下,也不會(huì)對(duì)RS理論產(chǎn)生影響,具有很強(qiáng)的適應(yīng)性,不需要主觀地評(píng)估知識(shí)和數(shù)據(jù),更不需要對(duì)先前的知識(shí)進(jìn)行足夠量的積累[11]。因此通過使用RS理論,在輸入層對(duì)即將輸入之前進(jìn)行數(shù)據(jù)預(yù)處理。具體診斷模型如圖3所示。
圖3 RS-PNN診斷模型Fig.3 RS-PNN diagnostic model
下面以一組數(shù)據(jù)來具體說明RS粗糙集理論是如何處理樣本輸入信息的(輸入分別為X1,X2,X3):
通過這樣一組公式有:
1)當(dāng)0≤X1<0.1時(shí),有I1取0.5;當(dāng)0.1≤X1<1時(shí),有I1取1;當(dāng)1 2)當(dāng)0≤X2≤1時(shí),有I2取0;當(dāng)0.1≤X2<3時(shí),有I2=1-e(-x2-0.1)2;當(dāng)3≤X2時(shí),I2取1; 3)當(dāng)0≤X3≤0.1時(shí),I3取0;當(dāng)1≤X3<3時(shí),有I3=1-e-0.5(x3-0.1)2;當(dāng)3≤X3時(shí),I3取1; 這樣一來原本的樣本輸入集就變成了I1=0,I2=1,I3=0。 神經(jīng)網(wǎng)絡(luò)的輸入特征矢量選取IEC(改良后的三比值法),分別為:CH4/H2,C2H2/C2H4,C2H4/C2H6;輸出故障類型選為5種,分別為:1.正常;2.低能放電;3.高能放電;4.中低溫過熱;5.高溫過熱[4]。 將RS粗糙集理論優(yōu)化后的樣本數(shù)據(jù)作為新的輸入量,保持樣本數(shù)據(jù)的數(shù)量與前面基于PNN的變壓器故障診斷樣本數(shù)據(jù)個(gè)數(shù)不變,Spread值仍然保持為0.2,可以得到下面的預(yù)測(cè)診斷結(jié)果。 將樣本為60的故障數(shù)據(jù)先通過RS粗糙集理論進(jìn)行處理后,再作為PNN診斷模型的輸入變量,通過圖4可以看出,在增大訓(xùn)練樣本集合RS理論的雙重作用下,15個(gè)診斷數(shù)據(jù)樣本中僅樣本6發(fā)生了預(yù)測(cè)錯(cuò)誤,較40個(gè)樣本集的準(zhǔn)確率又有了進(jìn)一步的提升。 圖4 RS-PNN網(wǎng)絡(luò)的預(yù)測(cè)效果圖(樣本為60)Fig.4 RS-PNN network prediction effect diagram(sample number is 60) 將相同變壓器運(yùn)行狀態(tài)下的數(shù)據(jù)樣本在通過PNN變壓器故障診斷模型處理后得到的輸出預(yù)測(cè)結(jié)果與通過RS粗糙集處理過后的RS-PNN模型處理預(yù)測(cè)結(jié)果匯總,如表5所示。 表5 基于RS-PNN不同訓(xùn)練樣本數(shù)對(duì)應(yīng)的檢測(cè)結(jié)果匯總表 續(xù)表 注:表中帶*號(hào)的為診斷與實(shí)際故障類型產(chǎn)生偏差的樣本,1-5所代表的故障類型依舊為:1代表正常狀態(tài);2代表低能放電;3代表高能放電;4代表中低溫過熱;5代表高溫過熱。 對(duì)表5中基于RS-PNN不同訓(xùn)練樣本數(shù)對(duì)應(yīng)的檢測(cè)結(jié)果匯總表進(jìn)行分類統(tǒng)計(jì),可以得到在RS-PNN網(wǎng)絡(luò)模型中不同訓(xùn)練樣本數(shù)目分別對(duì)應(yīng)的檢測(cè)正確概率值,匯總后如表6所示。 表6 基于RS-PNN訓(xùn)練樣本數(shù)不同情況下對(duì)應(yīng)的檢測(cè)正確率 由以上內(nèi)容可以知道,基于RS優(yōu)化的PNN故障診斷模型的診斷精確度比未經(jīng)過優(yōu)化的PNN網(wǎng)絡(luò)診斷的高,在診斷中引入RS粗糙集理論可以適量的去處冗余,簡(jiǎn)化系統(tǒng),并且提升診斷精確度。 下面列一表格來將相同樣本數(shù)量下,基于PNN的變壓器故障診斷模型診斷的結(jié)果和診斷準(zhǔn)確率與基于RS-PNN的變壓器故障診斷結(jié)果做對(duì)比,如表7所示。 表7 RS改進(jìn)前后的診斷模型對(duì)比 通過表7將PNN網(wǎng)絡(luò)診斷結(jié)果的判定結(jié)果對(duì)比分析RS優(yōu)化的PNN模型的診斷精確度最高,可達(dá)93.3%,而且該診斷模型的反應(yīng)速度也快,經(jīng)過對(duì)比證明,PNN網(wǎng)絡(luò)診斷更適合運(yùn)用于變壓器故障診斷中。 通過對(duì)基于PNN的變壓故障診斷模型進(jìn)行了仿真研究,得出的結(jié)論是選取樣本集的大小、質(zhì)量以及Spread值的大小都可以對(duì)診斷的準(zhǔn)確率產(chǎn)生一定的影響。除此之外,本次研究還通過RS對(duì)PNN診斷模型進(jìn)行了優(yōu)化,取得了一定的成果。但要想進(jìn)一步改進(jìn)神經(jīng)網(wǎng)絡(luò)診斷模型,仍然需要進(jìn)一步探討改進(jìn)。 1)欲實(shí)現(xiàn)變壓器能夠在線進(jìn)行故障診斷,如何進(jìn)行收集溶解氣體數(shù)據(jù)的比值樣本,如何實(shí)現(xiàn)樣本數(shù)據(jù)的傳輸和轉(zhuǎn)換,要對(duì)此進(jìn)行更深的考慮。 2)當(dāng)下使用DGA的各種變壓器故障診斷技術(shù)的最大缺點(diǎn),是它不能確定故障位置,因此,將氣體發(fā)生率與實(shí)驗(yàn)結(jié)合,利用超聲波定位技術(shù)來實(shí)現(xiàn)變壓器的故障診斷將擁有較好的研究潛力。4.2 RS-PNN網(wǎng)絡(luò)診斷結(jié)果的判定
4.3 RS-PNN仿真結(jié)果分析
4.4 對(duì)比與分析
5 總結(jié)與展望