王堅俊,孫林濤,劉昌標(biāo),劉江明,周國偉,郭創(chuàng)新
(1.國網(wǎng)浙江省電力有限公司,杭州 310007;2.浙江大學(xué) 電氣工程學(xué)院,杭州 310027)
變壓器在電力系統(tǒng)中發(fā)揮著電壓轉(zhuǎn)換和電力輸送的重要作用,是電力系統(tǒng)安全穩(wěn)定運行的基石。變壓器絕緣套管是變壓器箱外的主要絕緣裝置,保證變壓器繞組引出線與電網(wǎng)的安全連接。一臺變壓器包含數(shù)個套管,套管的任何故障都會直接導(dǎo)致變壓器發(fā)生故障。CIGRE(國際大電網(wǎng)會議)工作組于2015年通過統(tǒng)計指出,在變壓器的起火或爆炸事故中,由套管所引起的故障超30%[1]。因此準(zhǔn)確的變壓器絕緣套管故障診斷對保障變壓器安全穩(wěn)定運行具有重要意義。
變壓器絕緣套管的故障診斷方法包括超高頻法、介質(zhì)損耗法、頻域光譜技術(shù)等。文獻[2]使用超高頻法對絕緣套管中局部放電時產(chǎn)生的超高頻電磁波信號進行檢測,從而獲得局部放電信息,實現(xiàn)局部放電監(jiān)測,但這種方法不易實現(xiàn)故障定位。文獻[3]提出了利用介質(zhì)損耗測量法來判斷絕緣套管的絕緣性能,但是這種方法需要離線實驗,會影響變壓器的正常運行。文獻[4]提出了基于頻域光譜技術(shù)的絕緣套管潮濕故障診斷,這種方法的缺點是只對影響絕緣套管阻尼的故障敏感。上述方法難以實現(xiàn)在線故障定位或僅能診斷特定類型故障。由于不同類型的絕緣套管故障會導(dǎo)致不同的絕緣套管發(fā)熱特性,因此利用紅外圖像可以準(zhǔn)確地實現(xiàn)絕緣套管故障在線診斷。同時隨著智能電站和巡檢機器人的發(fā)展和普及,變壓器產(chǎn)生了大量的紅外圖像數(shù)據(jù)集,為利用深度學(xué)習(xí)算法實現(xiàn)絕緣套管故障診斷提供了數(shù)據(jù)支持。
近年來,國內(nèi)外學(xué)者也展開了一系列基于紅外圖像的缺陷智能診斷方法研究。在早期階段,研究人員主要通過利用閾值分割[5]、區(qū)域分割[6]、邊緣檢測[7]等算法實現(xiàn)紅外圖像中目標(biāo)與背景的分割,這些方法一般只適用于背景簡單的圖像,在處理復(fù)雜背景的圖像時,有魯棒性差、分離度低等問題。得益于人工智能方法的快速發(fā)展,越來越多的智能算法被運用到這一領(lǐng)域,例如文獻[8]基于YOLO 網(wǎng)絡(luò)實現(xiàn)了電力設(shè)備紅外診斷,YOLO 是典型的一階段算法,具有檢測速度快但精度有所欠缺的特點。文獻[9]利用Faster RCNN(更快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò))算法和溫度閾值法實現(xiàn)了變電設(shè)備紅外圖像缺陷識別,但電壓過熱型故障設(shè)備本身溫升較小,使用溫度閾值法不易實現(xiàn)電壓過熱型故障的準(zhǔn)確診斷。文獻[10]利用Gentle Adaboost 分類器實現(xiàn)了支柱絕緣子紅外圖像識別,但是這種算法在處理不同角度拍攝的支柱絕緣子紅外圖像時有一定局限性。文獻[11]基于R3Det 模型實現(xiàn)了變電設(shè)備電壓過熱型缺陷診斷,適用于不同角度的變電設(shè)備檢測,減小了干擾區(qū)域的影響,實現(xiàn)了較高的診斷精度。
利用紅外圖像實現(xiàn)絕緣套管故障的在線準(zhǔn)確診斷有3個關(guān)鍵點:一是提高紅外圖像中絕緣套管的目標(biāo)檢測準(zhǔn)確率;二是均衡正常樣本和故障樣本的影響;三是提高模型診斷速度以實現(xiàn)在線診斷。為此本文基于Mask R-CNN(改進掩膜區(qū)域卷積神經(jīng)網(wǎng)絡(luò))算法,通過數(shù)據(jù)增廣和改進損失函數(shù)實現(xiàn)樣本均衡和提高目標(biāo)檢測準(zhǔn)確率,并改進了其主干網(wǎng)絡(luò)以提高檢測速度,實現(xiàn)在線診斷。
變壓器運行時,絕緣套管、避雷器、電流互感器、電壓互感器以及環(huán)境溫度有明顯的差異,這種差異也體現(xiàn)在變壓器紅外圖像中。為了避免圖像中其他區(qū)域的干擾,有效提取絕緣套管溫度特征信息,必須從紅外圖像中準(zhǔn)確分割出絕緣套管,檢測的精度直接決定了變壓器缺陷診斷的準(zhǔn)確度。
常見的目標(biāo)檢測算法為圖像中每個目標(biāo)輸出一個類別標(biāo)簽和矩形邊界框坐標(biāo),而Mask RCNN[12]作為一種實例分割算法,在訓(xùn)練時使用的是像素級別的標(biāo)注,可以獲得更大信息量,不但給出檢測目標(biāo)的類別、矩形邊界框坐標(biāo),而且給出每個目標(biāo)像素級別的掩膜,實現(xiàn)了待檢測目標(biāo)的像素級別分割,非常適合本文提出的任務(wù)場景。
Mask R-CNN 是在Faster R-CNN 的基礎(chǔ)上改進得到的,屬于兩階段目標(biāo)檢測網(wǎng)絡(luò),如圖1所示,主要由主干網(wǎng)絡(luò)、特征金字塔網(wǎng)絡(luò)、區(qū)域生成網(wǎng)絡(luò)、3個輸出分支構(gòu)成。
圖1 Mask R-CNN網(wǎng)絡(luò)模型
主干網(wǎng)絡(luò)是用于提取原始圖像特征的多層神經(jīng)網(wǎng)絡(luò),基于遷移學(xué)習(xí)的思想,主干網(wǎng)絡(luò)可以使用預(yù)訓(xùn)練的參數(shù),而不需要從隨機初始參數(shù)中訓(xùn)練主干網(wǎng)絡(luò),從而提高訓(xùn)練速度、減少過擬合。因此骨干網(wǎng)絡(luò)一般采用固定的網(wǎng)絡(luò)結(jié)構(gòu),Mask R-CNN常用的主干網(wǎng)絡(luò)為VGG(超分辨率測試序列)、ResNet(殘差網(wǎng)絡(luò))、DenseNet(稠密卷積網(wǎng)絡(luò))等。
提出特征金字塔網(wǎng)絡(luò)的目的是充分提取多尺度特征圖。原始紅外圖像經(jīng)過主干網(wǎng)絡(luò)提取特征后分別得到不同尺度大小的特征圖,將不同大小的特征圖經(jīng)過特征金字塔網(wǎng)絡(luò)處理后得到多尺度特征圖信息。如果僅利用單個深層特征,會導(dǎo)致圖像中小物體的像素信息在下一個采樣的流程中丟失[13]。
因此利用特征金字塔網(wǎng)絡(luò)融合淺層與深層特征圖信息可增強網(wǎng)絡(luò)特征提取能力。
每個特征金字塔網(wǎng)絡(luò)連接一個區(qū)域生成網(wǎng)絡(luò),所有區(qū)域生成網(wǎng)絡(luò)共享參數(shù),通過ROI Align將不同尺度的候選區(qū)域歸一化到相同的尺寸大小。ROI Align使用雙線性差值,而不是ROI Pool采用的池化運算,因此降低了因舍入產(chǎn)生的誤差[14]。
基于ROI Align 算法提煉出的候選區(qū)域,有3個功能分支的輸出,分別是分類、檢測和分割。分類分支由全連接層和Softmax層組成,檢測分支將回歸擬合檢測框的左下、右上坐標(biāo),分割分支將連接全卷積網(wǎng)絡(luò),每個分類會生成一個二進制掩碼。
本文所使用的變壓器絕緣套管紅外圖像由某省電力公司提供,一共有1 342張樣本圖像,其中1 256張正常絕緣套管紅外圖像,86張故障絕緣套管紅外圖像。使用Labelme 軟件對絕緣套管紅外圖像進行標(biāo)注,在圖中框出絕緣套管,并標(biāo)記相應(yīng)的正常/故障標(biāo)簽,保存為XML文件。
從上文可以明顯看出,絕緣套管紅外圖像的正負(fù)樣本數(shù)量很不均衡,正樣本數(shù)量遠大于負(fù)樣本數(shù)量。通過在損失函數(shù)中為負(fù)樣本配置更大權(quán)重可以在一定程度上改善這個問題,但如果要從本質(zhì)上解決這個問題,可以利用數(shù)據(jù)增廣技術(shù)來擴增負(fù)樣本的數(shù)量,以平衡正負(fù)樣本的數(shù)量。常見的圖像增廣技術(shù)為水平垂直翻轉(zhuǎn)、旋轉(zhuǎn)縮放、裁剪平移等,完成擴增的數(shù)據(jù)集如圖2所示。
圖2 數(shù)據(jù)擴增
Mask R-CNN 是典型兩階段目標(biāo)檢測網(wǎng)絡(luò),包括第一階段的候選區(qū)域生成和第二階段的檢測框坐標(biāo)回歸、類別分類、掩碼生成[16]。因此Mask R-CNN的算法具有檢測精度高,但推理速度慢的問題。尤其以VGG、ResNet、Densenet 為代表的主干網(wǎng)絡(luò),網(wǎng)絡(luò)層數(shù)達到幾十層甚至上百層,模型權(quán)重大小達到上百兆,帶來了極大的計算壓力。為了解決這一問題并滿足運維檢修過程中實時性的要求,本文利用MobileNetv3[17]作為Mask RCNN 的主干網(wǎng)絡(luò),它是經(jīng)典的輕量級高效模型,可利用可分離卷積結(jié)構(gòu)降低卷積計算成本。
可分離卷積是由逐深度卷積和逐點卷積構(gòu)成,逐深度卷積將卷積核拆分成單通道形式,在不改變輸入特征圖像深度的情況下,對某一特定輸入通道進行卷積操作。逐深度卷積雖然大幅減小了卷積計算量,但其輸出的特征圖僅有輸入層所有特征圖的一部分信息,為了保證輸出的特征圖包含所有特征圖信息,提出了逐點卷積。逐點卷積使用1×1 的卷積核,將逐深度卷積每層的輸出結(jié)合起來,這樣能讓每個新的特征圖都包含上一層各個特征圖的信息。
假設(shè)卷積的輸入特征圖尺寸為W×H×Cin,輸出的特征圖尺寸為W×H×Cout,如果使用標(biāo)準(zhǔn)卷積計算,此時的理論計算量F0為:
式中:kw和kh分別為卷積核的寬和高。
利用逐深度卷積,把輸入特征圖拆分為m組,同樣將輸出特征圖也拆分為m組,按順序?qū)γ拷M內(nèi)的特征圖做普通卷積計算,則計算量F1為:
然后對逐深度卷積的輸出結(jié)果用1×1 的卷積核進行逐點卷積,此時的理論計算量為:
將逐深度卷積和逐點卷積的計算合并在一起,可以得到可分離卷積和常規(guī)卷積之間計算量之比:
可以看出可分離卷積能極大地減少計算量。對于一個3×3 大小的卷積核來說,可分離卷積大概可以減少8~9倍的計算量。
Mask R-CNN 的損失函數(shù)L由3 個輸出分支的損失函數(shù)構(gòu)成,分別為分類損失Lc、定位損失Lb和分割損失Lm,即:
式中:a、b、c分別為分類損失、定位損失、分割損失的權(quán)重。
本文提出絕緣套管故障診斷任務(wù)可以看作一個二分類任務(wù),其分類損失函數(shù)LCE可以寫作:
由于正負(fù)樣本數(shù)量和不同樣本分類的難度都存在一定差異,需要盡可能減小這種差異對神經(jīng)網(wǎng)絡(luò)帶來的影響,常見的方法為引入FocalLoss[18]作為損失函數(shù),在交叉熵?fù)p失函數(shù)的基礎(chǔ)上引入了兩個系數(shù)α和γ,F(xiàn)ocalLoss 的函數(shù)計算如式(7)所示:
式中:α用來平衡正負(fù)樣本數(shù)量不平衡的問題,正樣本的權(quán)重為α,負(fù)樣本的權(quán)重為1-α,如果負(fù)樣本數(shù)量較少,可使α取小于0.5的值,讓負(fù)樣本損失函數(shù)的權(quán)重更大,讓模型更關(guān)注負(fù)樣本;γ用來解決難分類樣本的問題,如對于正樣本中易分類樣本,其置信度p遠大于難分類樣本,因此賦予其損失函數(shù)(1-p)γ的權(quán)重參數(shù),使得易分類樣本的損失函數(shù)大小遠小于難分類樣本的損失函數(shù)大小,讓模型更多的關(guān)注難分類樣本。
但是FocalLoss 也存在兩個問題:一是α和γ的取值完全由實驗得到,只能根據(jù)實驗結(jié)果的好壞不斷調(diào)整(α、γ),為模型訓(xùn)練增添了難度;二是如果數(shù)據(jù)集中存在離群點,如圖3被圈出的樣本所示,這些離群點將被劃分為難分類樣本,采用FocalLoss 的模型會過度關(guān)注這些離群點,干擾模型的正常訓(xùn)練。
圖3 離群點的干擾示意圖
為了解決這一問題,本文引入GHMLoss[19],與FocalLoss 不同,GHMLoss 不再僅從單個樣本的置信度p來調(diào)整Loss,而是按一定置信度范圍的樣本數(shù)量來調(diào)整Loss。
首先定義梯度模長g為:
梯度模長與分類的難易程度成正相關(guān),g越大則該樣本越難分類。
傳統(tǒng)蔬菜育種多是以農(nóng)藝性狀調(diào)查結(jié)果為依據(jù),以抗逆性、豐產(chǎn)性、品質(zhì)為目標(biāo)進行品種選育[4],而關(guān)于加工專用型品種的篩選和評價研究較少[5]。但加工前原料品種的外觀、營養(yǎng)和加工特性直接影響了加工產(chǎn)品的質(zhì)量[6,7],針對加工要求對品種進行評價,選擇適宜的品種材料進行加工非常必要。本文以參試品比試驗的18個華南型黃瓜優(yōu)良新組合和對照(燕白黃瓜)作為研究對象,統(tǒng)一種植,測定了12項基礎(chǔ)指標(biāo),采用相關(guān)性分析確定加工適宜性評價因子,應(yīng)用層次分析確定評價因子權(quán)重,應(yīng)用灰色關(guān)聯(lián)度分析對 19個黃瓜育種材料鮮切加工適應(yīng)性進行排名和篩選,以期為鮮切加工型黃瓜的育種篩選及加工提供科學(xué)依據(jù)。
對一個數(shù)據(jù)集來說,易分類樣本的數(shù)量最多,但是難分類樣本的數(shù)量也不少,因此少關(guān)注易分類樣本的思路是正確的,但不能過多地關(guān)注難分類樣本(數(shù)據(jù)集中的離群點),否則會導(dǎo)致模型的整體準(zhǔn)確度下降。
為了更好地平衡易分類樣本和難分類樣本的影響,本文引入了梯度密度這一概念來衡量一定梯度范圍內(nèi)的樣本數(shù)量:
對于梯度密度越高的樣本,其損失函數(shù)應(yīng)越??;梯度密度越小的樣本,其損失函數(shù)應(yīng)越大。因此GHMLoss寫作:
式中:N表示梯度模長被劃分為N個區(qū)域;下標(biāo)i為樣本編號。
GHMLoss 與FocalLoss 不同,不再過度關(guān)注難分類樣本,而是按照樣本的梯度密度調(diào)整Loss,能夠更好地解決正負(fù)樣本不均衡的問題。
本文實驗采用Nvidia 1080Ti 圖形加速器進行訓(xùn)練與驗證,實驗環(huán)境為Ubuntu 17.04,利用CUDA 和Cudnn 加速訓(xùn)練,計算機語言為Python 3.8,深度學(xué)習(xí)框架為Pytorch。實驗數(shù)據(jù)集為1 342張包含絕緣套管的紅外圖像,經(jīng)過數(shù)據(jù)增廣后,共有1 863張絕緣套管紅外圖像,按8:1:1的比例劃分訓(xùn)練集、驗證集、測試集。
表1 給出了實驗過程訓(xùn)練主要的超參數(shù)設(shè)置,訓(xùn)練采用Adam優(yōu)化器優(yōu)化網(wǎng)絡(luò)參數(shù),每次按一個Batch中的紅外圖像數(shù)據(jù)優(yōu)化網(wǎng)絡(luò)參數(shù),達到設(shè)定的最大Epoch 后停止訓(xùn)練。同時采用weight decay和early stop機制[21],一開始使用較大的學(xué)習(xí)率,隨著訓(xùn)練輪次的加深,學(xué)習(xí)率逐漸減小,當(dāng)網(wǎng)絡(luò)損失連續(xù)5個Epoch變化率小于0.01%,即提前終止訓(xùn)練,以此來加快訓(xùn)練速度,提高模型魯棒性。
表1 模型訓(xùn)練超參數(shù)設(shè)置
本文使用故障診斷率、誤報率、推理時間3個評價指標(biāo)來驗證模型的性能。模型的故障診斷率表示模型將故障絕緣套管正確識別為故障的數(shù)量占故障絕緣套管的比率;誤報率代表模型將正常絕緣套管錯誤識別為故障的數(shù)量占正常絕緣套管的比率;推理時間代表模型在輸入紅外圖像后給出診斷結(jié)果需要的時間。診斷率和誤報率的具體計算方式為:
式中:ηFDR和ηFAR分別為故障診斷率和故障誤報率;nTP和nTN分別為正常樣本中被診斷為正常樣本、故障樣本的數(shù)量;nFP和nFN分別為故障樣本中被診斷為正常樣本、故障樣本的數(shù)量。
使用訓(xùn)練集數(shù)據(jù)集訓(xùn)練模型,驗證集數(shù)據(jù)集驗證模型性能,取驗證集準(zhǔn)確率最高的模型用于后續(xù)的測試。
4.3.1 不同主干網(wǎng)絡(luò)結(jié)構(gòu)的性能對比
將主干網(wǎng)絡(luò)為Resnet50的Faster R-CNN、主干網(wǎng)絡(luò)為Resnet50 的Mask R-CNN、主干網(wǎng)絡(luò)為Mobile Netv3 的Mask R-CNN 進行對比實驗,驗證不同模型進行絕緣套管故障的性能。每個模型采用的數(shù)據(jù)集相同,表2為實驗結(jié)果。
表2 不同主干網(wǎng)絡(luò)性能對比
從表2 可以看出,Mask R-CNN 網(wǎng)絡(luò)相比Faster R-CNN 準(zhǔn)確度更高,主要原因是Mask RCNN 能夠獲得更多的標(biāo)注信息,能夠?qū)^緣套管和背景做更精細的分類。但是Mask R-CNN 網(wǎng)絡(luò)的檢測時間較長,不能滿足絕緣套管實時故障診斷的要求。而使用MobileNetv3作為主干網(wǎng)絡(luò)診斷準(zhǔn)確率略差于使用ResNet50 作為主干網(wǎng)絡(luò)的模型,檢測速度卻有很大的提升,能夠很好地滿足實際需要。
4.3.2 不同損失函數(shù)的性能比較
使用MobileNetv3 作為Mask R-CNN 的主干網(wǎng)絡(luò),將損失函數(shù)為交叉熵的Mask R-CNN、損失函數(shù)為FocalLoss的Mask R-CNN、損失函數(shù)為GHMLoss 的Mask R-CNN 進行對比實驗,實驗結(jié)果如表3所示。
表3 不同損失函數(shù)性能比較
可以看出GHMLoss相比交叉熵?fù)p失函數(shù)可以明顯的提升故障診斷準(zhǔn)確率,和FocalLoss也有一定的優(yōu)勢,驗證了GHMLoss在平衡正負(fù)樣本、難易樣本問題上的作用。
從測試集中抽取的不同樣本的變壓器絕緣套管故障診斷效果如圖4 所示。圖4(a)和圖4(b)分別展示了含故障絕緣套管紅外圖像及其對應(yīng)的診斷結(jié)果,圖4(c)和圖4(d)分別展示了無故障絕緣套管紅外圖像及其對應(yīng)的診斷結(jié)果。從紅外圖像可以看出,圖4(a)中間的絕緣套管頂部出現(xiàn)了明顯的發(fā)熱,模型也成功地以97.8%的置信度將其診斷為故障絕緣套管,其他紅外圖像無異常的絕緣套管,模型也未發(fā)生誤判,驗證了模型故障診斷的準(zhǔn)確性。
圖4 改進Mask R-CNN診斷效果
本文提出了一種基于改進Mask R-CNN 的變壓器絕緣套管故障診斷方法,并將其應(yīng)用到變壓器絕緣套管故障診斷中。首先收集并標(biāo)注含變壓器絕緣套管的紅外圖像,使用數(shù)據(jù)增廣技術(shù)擴大數(shù)據(jù)集中故障絕緣套管的數(shù)量,緩解正負(fù)樣本不均衡的問題。然后針對Mask R-CNN 檢測精度高,但檢測時間慢的問題,提出利用輕量級網(wǎng)絡(luò)Mobile Netv3 替代Mask R-CNN 的主干網(wǎng)絡(luò)。同時使用GHMLoss 損失函數(shù)替代了交叉熵?fù)p失函數(shù),進一步解決了正負(fù)樣本、難易樣本之間的不平衡問題。最后通過實驗對比,分析了數(shù)據(jù)擴增、主干網(wǎng)絡(luò)、損失函數(shù)對模型性能的影響,改進后的模型在檢測準(zhǔn)確度、檢測時間等方面都有了一定的提升,故障診斷率達到89.72%、誤報率為6.78%,檢測時間為每幀216 ms,能夠滿足絕緣套管智能故障診斷的需求。不過目前受限于收集到的數(shù)據(jù)集標(biāo)簽僅有正常和故障兩類,模型僅實現(xiàn)了絕緣套管正常與故障的診斷,可以依據(jù)導(dǎo)則進一步確定套管故障類別。未來將考慮收集故障信息更具體的絕緣套管紅外圖像數(shù)據(jù)集,直接實現(xiàn)絕緣套管具體故障類別的準(zhǔn)確診斷。