南方電網(wǎng)文山供電局 申國標(biāo) 陳 浩 竇體權(quán)
GIS(Gas Insulated Switchgear)是封閉式氣體絕緣組合電器的簡稱,由于具有諸多優(yōu)點,目前已經(jīng)廣泛應(yīng)用于國內(nèi)外的電力系統(tǒng)中。然而GIS在制造、運輸、安裝過程中常留下潛伏性的絕緣缺陷,這些絕緣缺陷在強電場作用下會導(dǎo)致設(shè)備內(nèi)部發(fā)生局部放電(簡稱局放)。當(dāng)GIS設(shè)備內(nèi)部發(fā)生局部放電時,其放電源會產(chǎn)生劇烈的電磁波信號,因此基于特高頻的局放在線監(jiān)測系統(tǒng)被大量應(yīng)用,對GIS設(shè)備狀態(tài)監(jiān)測、盡早發(fā)現(xiàn)絕緣異常提供了較大幫助[1-2]。基于特高頻的GIS在線監(jiān)測系統(tǒng)因采集頻率高(分鐘級)、測點多等特點,產(chǎn)生了大量的監(jiān)測數(shù)據(jù),依賴人工對特高頻圖譜進行分析帶來了繁重的工作量,迫切需將人工智能等先進的算法應(yīng)用到特高頻在線監(jiān)測圖譜診斷應(yīng)用中。
根據(jù)電氣設(shè)備中絕緣缺陷的電場分布情況,可將局部放電的缺陷類型分為金屬尖端放電(電暈)、氣隙放電、沿面放電、懸浮電位、微粒放電等[3-4],不同類型的缺陷圖譜具有不同的信號分布特征,為基于人工智能的圖片分類算法的應(yīng)用提供了基礎(chǔ)[5]。人工智能算法在進行圖片分類識別應(yīng)用時,其核心在于樣本集的總體規(guī)模和各分類的均衡分布。GIS特高頻的圖譜數(shù)據(jù)來源于現(xiàn)場解體案例,而解體案例發(fā)生的次數(shù)少、缺陷類型不均勻,從而難以通過人工收集的方式積累較大規(guī)模、分類均衡的樣本集,使人工智能算法在GIS特高頻圖譜的應(yīng)用上異常困難。本文提出了一種GIS特高頻局部放電圖譜數(shù)據(jù)增強方法,能夠有效的增強局放樣本集,使樣本均勻分布,滿足智能算法的訓(xùn)練需求。利用增強后的樣本集訓(xùn)練出來的智能診斷算法診斷準(zhǔn)確率達到96%以上,很好的解決了大量在線監(jiān)測數(shù)據(jù)的診斷分析問題,具有實際應(yīng)用價值。
樣本數(shù)量不足。通過研究發(fā)現(xiàn),深度學(xué)習(xí)算法在其它行業(yè)成功應(yīng)用時,其各子分類的樣本量一般不低于1000條,而GIS特高頻局放的典型類型有5個分類,則有效樣本數(shù)量應(yīng)大于5千條,在分類均衡的情況下樣本數(shù)據(jù)量應(yīng)越多越好。樣本數(shù)據(jù)可通過自然產(chǎn)生和實驗室仿真等方式進行收集,但由于GIS處在不同的環(huán)境中運行(如馬路附近、機場附近、鐵路附近、工廠附近等),所受到的干擾也各種各樣,實驗室通過制作局放模型僅能模擬出幾種典型缺陷,與現(xiàn)場實際環(huán)境相差甚遠(yuǎn),樣本嚴(yán)重不足問題一直難以得到有效的解決。
樣本分布不均。GIS因其結(jié)構(gòu)的特性,現(xiàn)場發(fā)現(xiàn)的缺陷類型以懸浮缺陷為主,其它四類則發(fā)生概率太少,據(jù)統(tǒng)計,GIS現(xiàn)場發(fā)現(xiàn)的局放案例中懸浮、電暈、振動、微粒、沿面的比例約為5:2:1:1:1,導(dǎo)致樣本分類的數(shù)量嚴(yán)重失衡,難以積累有效樣本集,無法支撐智能算法的應(yīng)用。
本文提出的數(shù)據(jù)增強方法,通過設(shè)計了基于疊加噪聲、模糊處理的方案實現(xiàn),在添加現(xiàn)場常見噪聲的基礎(chǔ)上應(yīng)用高斯模糊方法對RGB像素進行隨機擾動,形成新的樣本(圖1)。
將輸入的樣本數(shù)據(jù)轉(zhuǎn)換成以相位為x軸、周期為y軸,幅值為z軸的三維數(shù)據(jù)inData[x][y][z],將典型的雷達噪聲、手機噪聲、微波硫燈干擾的圖譜轉(zhuǎn)換成以相位為x軸、周期為y軸,幅值為z軸的三維數(shù)據(jù),分別得到雷達噪聲三維數(shù)據(jù)Radar[x][y][z]、手機噪聲三維數(shù)據(jù)Phone[x][y][z]、微波硫燈干擾三維數(shù)據(jù)SulfurLamp[x][y][z](圖2、圖3)。
定義雷達噪聲增強后樣本數(shù)據(jù)為NoiseRadar [x][y][z]、手機噪聲增強后樣本數(shù)據(jù)為NoisePhone [x][y][z]、微波硫燈干擾增強后樣本數(shù)據(jù)為Noise SulfurLamp[x][y][z]:NoiseRadar[x][y][z]=inData [x][y][z]+Radar[x][y][z],NoisePhone[x][y][z]=inData[x][y][z]+Phone[x][y][z],NoiseSulfurLamp[x][y][z]=inData[x][y][z]+SulfurLamp[x][y][z],將經(jīng)此計算得到的增強后樣本數(shù)據(jù)恢復(fù)成圖譜數(shù)據(jù),如圖4所示。
將噪聲耦合后的圖譜數(shù)據(jù)作為輸入,提取輸入圖片文件的RGB(Red,Green,Blue)值,將圖譜數(shù)據(jù)的中心點設(shè)為零點,繪制橫縱坐標(biāo)軸;以二維高斯分布函數(shù)計算圖譜中各像素點的權(quán)重矩陣,二維高期分布計算公式為:
式中x、y分別為圖中各像素點距離零點的橫縱坐標(biāo),G(x,y)為該點到零點的權(quán)重值,π為圓周率,e為自然常數(shù),σ為正態(tài)分布的標(biāo)準(zhǔn)差,σ通常取1~3之間,取值越大圖像越平滑。以3×3像素的圖像為例,以圖像中點為零點時,各點的取值如表1。取σ為1.5,對各組(x,y)分別計算權(quán)重,結(jié)果如表2。對權(quán)重矩陣進行歸一化,計算權(quán)重矩陣中所有權(quán)重數(shù)值之和m,對權(quán)重矩陣中的每個權(quán)重值乘以1/m,得到歸一化后的權(quán)重矩陣,如表3。以權(quán)重更新圖片文件的RGB值,對每一個零點的權(quán)重矩陣,以各歸一化后的權(quán)重矩陣的權(quán)重值乘以該權(quán)重值位置的像素值并求和,作為該零點的新的像素值,以該種權(quán)重更新方法對RGB值分別更新,得到更新后的三色像素值。存儲更新RGB值后的圖片文件,作為新的樣本。
經(jīng)上述增強方法所得到的新樣本數(shù)據(jù)補充到樣本庫中,與原始樣本數(shù)據(jù)共同形成新的樣本庫,為基于人工智能的深度學(xué)習(xí)算法應(yīng)用奠定基礎(chǔ)。
為驗證兩種樣本增強方法的有效性,將GIS現(xiàn)場缺陷案例收集的樣本集利用本文提出的方法進行數(shù)據(jù)增強,得到增強前的樣本集和增強后的樣本集(表4)。本文通過搭建基于NVIDIA GeForce GTX 1080Ti的GPU、E5-1607v3@3.10GHz的CPU、64GB內(nèi)存、512GB固態(tài)硬盤的訓(xùn)練平臺,使用ResNet的深度學(xué)習(xí)模型,分別對原始樣本集數(shù)量、數(shù)據(jù)增強后的樣本集進行相同的訓(xùn)練,得到兩個GIS特高頻局放圖譜的診斷模型,其診斷準(zhǔn)確率的測試對比見表5。
由表5可知使用原始數(shù)據(jù)訓(xùn)練出來的診斷算法對不同類型缺陷診斷準(zhǔn)確率差異較大。而對于增強后樣本集來說,因為各分類的圖譜數(shù)量較均衡,診斷準(zhǔn)確率較高且沒有明顯偏差,基本保持在96%以上,顯著優(yōu)于原始樣本集訓(xùn)練得出的診斷模型。
表1 圖像中點為零點時的x、y取值
表2 σ為1.5時的x、y的計算權(quán)重
表3 權(quán)重矩陣歸一化權(quán)重
表4 樣本集情況表
表5 診斷準(zhǔn)確率的測試對比