鄭文杰,楊 祎,喬 木,呂俊濤,張峰達,洪欣媛
(1.國網(wǎng)山東省電力公司電力科學研究院, 濟南 250003;2.國網(wǎng)山東省電力公司, 濟南 250001;3.重慶大學 輸配電裝備及系統(tǒng)安全與新技術(shù)國家重點實驗室, 重慶 400044)
在電氣設(shè)備的長期使用過程中,其內(nèi)部器件可能發(fā)生老化和喪失絕緣,引起設(shè)備局部溫升或過熱,甚至造成嚴重事故[1]。據(jù)電網(wǎng)運行分析發(fā)現(xiàn),在常見的早期故障類型中,由電流互感器、隔離開關(guān)、套管等設(shè)備過熱引發(fā)的故障占關(guān)鍵變電設(shè)備早期故障的半數(shù)以上[2-3]。為了保障電網(wǎng)的安全運行,利用紅外診斷技術(shù)對變電設(shè)備進行監(jiān)測能夠在不停運的情況下有效識別設(shè)備內(nèi)部和外部缺陷[4-5]。然而,紅外技術(shù)在電氣領(lǐng)域的應用仍存在很多問題,一是對設(shè)備的故障診斷大多依賴人工進行,容易受主觀性的影響且效率低下;二是現(xiàn)有的機器視覺識別技術(shù)受限較大,不僅難以對復雜且種類繁多的電氣設(shè)備實現(xiàn)精準分類,還因紅外圖像存在各種背景噪聲干擾而難以實現(xiàn)設(shè)備過熱關(guān)鍵區(qū)域的特征提取[6]。
針對變電設(shè)備紅外圖像目標檢測和識別的研究主要分為圖像處理法和深度學習法兩大類。圖像處理法通過圖像分割、對比和增強等方法識別故障處的關(guān)鍵信息,采用Roberts、K-means聚類等多種邊緣檢測算法提取圖像邊緣[7-8],依據(jù)熱像特征、紋理特征等完成分割后紅外圖像的熱缺陷識別[9-10]。這些方法雖然在背景噪聲或干擾較小的紅外圖像中識別率較高,但難以完成復雜場景下多類型設(shè)備的缺陷診斷,診斷效率低下。
基于深度學習的目標檢測法能夠減輕對檢測人員經(jīng)驗程度的依賴,在識別的正確率和實時性方面表現(xiàn)良好,能夠?qū)崿F(xiàn)電氣設(shè)備熱缺陷故障診斷的自動化[10]。目前,在設(shè)備特征提取及熱缺陷故障識別算法中,代表性的有基于候選框的R-CNN系列算法和基于回歸的YOLO系列網(wǎng)絡(luò)[11-12]。前者根據(jù)目標特征提取預選框,在此基礎(chǔ)上對提取的每個區(qū)域進行分類和位置回歸,具有較高的準確率,但其結(jié)構(gòu)較為復雜,難以滿足實際應用需求。后者檢測速度快,滿足實時性要求,能保持較高的定位準確度和特征識別率。然而,現(xiàn)有電氣領(lǐng)域研究在采用YOLO系列算法獲取圖像先驗框及特征時,所涉及的對象多數(shù)為以輸電線路為代表的可見光圖像[13-14],以高壓開關(guān)設(shè)備為代表的紅外圖像[15-17]。這兩類圖像背景干擾較小,所提取特征與圖像雜散元素區(qū)分明顯,采用常規(guī)的YOLO系列算法便可以得到高質(zhì)量的預測框。而電流互感器、隔離開關(guān)、套管等設(shè)備具有不同的型號和結(jié)構(gòu),其紅外圖像背景干擾大,設(shè)備的過熱區(qū)域、正常區(qū)域和環(huán)境背景區(qū)域彼此重疊,難以區(qū)分,因此需要對YOLO算法加以改進。
YOLOv4算法在YOLOv3算法的基礎(chǔ)上融合了更好的方案,如其主干特征提取網(wǎng)絡(luò)由DarkNet53改進成CSPDarkNet53,提升了目標的檢測效果[18]。YOLOv4-Tiny網(wǎng)絡(luò)是YOLOv4網(wǎng)絡(luò)的簡化,其模型結(jié)構(gòu)更加簡潔,每秒傳輸幀數(shù)約為YOLOv4的8倍,能夠高效處理海量數(shù)據(jù)。為此,本文提出一種基于改進YOLO的變電設(shè)備熱缺陷識別及診斷方法。首先對多種變電設(shè)備紅外圖像進行標注,建立不同類型設(shè)備及熱缺陷數(shù)據(jù)庫;其次,采用改進的YOLOv4算法對發(fā)生故障的設(shè)備進行識別,并提取該設(shè)備所在區(qū)域的局部紅外熱圖;然后,基于聚集性連接思想,對分類所用網(wǎng)絡(luò)Resnet基礎(chǔ)結(jié)構(gòu)進行改進,提高設(shè)備故障類型的分類準確度;最后,基于貝葉斯優(yōu)化算法改進模型超參數(shù),自動獲取學習率、卷積核個數(shù)、正則化因子等的最佳組合,在提升準確率的同時節(jié)省大量計算量。該方法能夠克服變電設(shè)備紅外圖像熱缺陷識別精度不高、特征提取困難等難題,滿足變電設(shè)備紅外檢測實際應用場景的需求。
變電設(shè)備出現(xiàn)熱缺陷時,通常表現(xiàn)為設(shè)備局部溫度上升或溫度分布異常,使得故障下的紅外熱像與正常熱像特征差距較為明顯。利用機器學習向診斷網(wǎng)絡(luò)中輸入不同類型設(shè)備在不同故障下的紅外圖像進行訓練,然后輸入待檢測目標圖像,即可實現(xiàn)該圖像中設(shè)備特征提取及故障類型診斷。由于目前公開的數(shù)據(jù)集中并未包含變電設(shè)備紅外圖像,因此需要構(gòu)建一個包含多種設(shè)備、多類型缺陷的數(shù)據(jù)庫用于訓練。
采用的數(shù)據(jù)集來自于某省多座變電站近5年以來的運行數(shù)據(jù),包含電流互感器、隔離開關(guān)、套管、避雷器、斷路器等多種設(shè)備的紅外熱圖。選擇電流互感器、隔離開關(guān)、套管3種設(shè)備作為研究對象,這3類設(shè)備可作為相似設(shè)備的代表,提升模型的普適性。此外,該數(shù)據(jù)集還包含了不同的設(shè)備類型和型號,以及缺陷類型和缺陷部位,部分圖像具有較強的背景干擾,能夠反映變電設(shè)備紅外應用場景的真實狀況。數(shù)據(jù)集紅外圖像示例如圖1所示,詳細信息如表1所示,圖像數(shù)據(jù)分辨率范圍為(240×319)~(800×600)。
表1 訓練數(shù)據(jù)集介紹
圖1 數(shù)據(jù)集中部分樣本圖
YOLOv4-Tiny作為YOLOv4的壓縮版本,使得網(wǎng)絡(luò)結(jié)構(gòu)更加簡單,訓練速度更快。但是紅外數(shù)據(jù)集中部分圖像具有嚴重的背景干擾,直接采用YOLOv4-Tiny網(wǎng)絡(luò)進行設(shè)備局部提取時效果不佳。針對這一難題,從卷積核分解、網(wǎng)絡(luò)模塊化分解、多尺度特征融合及激活函數(shù)重選取這幾個方面對YOLOv4-Tiny網(wǎng)絡(luò)進行改進,主要包括:① 采用Gelu激活函數(shù)替換主干網(wǎng)絡(luò)中的LeakyRelu函數(shù);② 設(shè)計并使用2個Conv_DBNGelu模塊提升對網(wǎng)絡(luò)淺層特征的利用;③ 采用卷積核分解技術(shù)提升網(wǎng)絡(luò)的計算能力。改進YOLO模型結(jié)構(gòu)如圖2所示。
圖2 改進YOLO模型結(jié)構(gòu)
1) 對原YOLOv4-Tiny網(wǎng)絡(luò)中激活函數(shù)的改進
卷積神經(jīng)網(wǎng)絡(luò)中的激活函數(shù)可以使網(wǎng)絡(luò)增加非線性因素,提升模型傳遞不同尺度參數(shù)的能力。YOLOv4-Tiny原網(wǎng)絡(luò)使用LeakyRelu作為激活函數(shù),但該函數(shù)存在輸出結(jié)果不一致、無法為正負輸入值提供一致的關(guān)系預測等問題。且在訓練過程中,訓練參數(shù)α值難以選取,因此本文中使用Gelu激活函數(shù)替換主干網(wǎng)絡(luò)中的LeakyRelu函數(shù),Gelu函數(shù)的近似式為:
式中:x為輸入。與LeakyRelu函數(shù)相比,Gelu函數(shù)可以看作Dropout與Relu的結(jié)合,其在激活中加入了隨機正則的思想,使得模型在訓練過程中能夠具有更高的泛化能力。
2) 對原YOLOv4-Tiny網(wǎng)絡(luò)泛化能力的改進
改進思想來源于使用初始YOLOv4-Tiny網(wǎng)絡(luò)進行訓練時出現(xiàn)的嚴重過擬合現(xiàn)象。由于紅外數(shù)據(jù)集具備不同的背景干擾,測試集里紅外圖像的背景噪聲可能不同于測試集圖像的背景噪聲,因此需要從提升網(wǎng)絡(luò)模型模糊度的方面加以改進。采用網(wǎng)絡(luò)模塊化分解方法減少網(wǎng)絡(luò)的層數(shù);采用多尺度特征融合方法提取圖像的淺層特征;采用卷積核分解提升改進后網(wǎng)絡(luò)的計算能力,目的是在網(wǎng)絡(luò)“深度”已經(jīng)足夠的情況下提升網(wǎng)絡(luò)的“寬度”,提升模型的泛化能力。
將網(wǎng)絡(luò)各部分進行分解,得到Y(jié)OLOv4-Tiny主干網(wǎng)絡(luò)中便于分離的3個Resblock_body模塊,每個模塊的深度為16層。將淺層特征進行多次加操作,依照排列組合原理進行測試后,網(wǎng)絡(luò)在add_1處與add_2處實現(xiàn)加操作效果更優(yōu)。
紅外數(shù)據(jù)集中部分圖像熱缺陷部位較小,在深度卷積后可能丟失該局部圖像的數(shù)據(jù)特征[19]。因此,采用多尺度特征融合方法,設(shè)置2個捷徑模塊提取Resblock_body_1層前的淺層特征。捷徑模塊及其連接方式如圖2中Conv_DBNGelu所示,其輸出分別在add_1與add_2處實現(xiàn)降維加操作,各模塊輸入與輸出的關(guān)系為:
(2)
式中:x為U1、U2處的特征;f1i為第i個Resblock_body模塊的函數(shù)表達式;f2為Conv_DBNGelu模塊主網(wǎng)絡(luò)的表達式;f3為降維模塊的表達式,代表步幅為3的卷積過程;f4為ConvBNGelu模塊的表達式。
3) 對原YOLOv4-Tiny網(wǎng)絡(luò)計算速度的改進
為了避免增加網(wǎng)絡(luò)導致的進一步過擬合現(xiàn)象,盡可能地減少運算過程中的計算量,采用卷積核分解技術(shù)減少參數(shù)量,卷積核的分解過程為:
(2N+1)×(2N+1)→(3×3)×N
(3)
式中:N×N表示卷積核尺寸。對于3×3卷積核,可以分解為3×1和1×3的2個連續(xù)卷積核提升網(wǎng)絡(luò)的訓練速度,降低過擬合的風險,最后使用1×1卷積核進行特征聚合并降維輸出。
殘差網(wǎng)絡(luò)(residual network,Resnet)是經(jīng)典的神經(jīng)網(wǎng)絡(luò)之一,采用殘差網(wǎng)絡(luò)對提取的紅外圖像進行分類識別可以有效解決在網(wǎng)絡(luò)深度不斷增加的情況下難以訓練的問題,能得到較好的效果。但是,部分變電設(shè)備外形相似,故障特征存在故障面積小、易在深層網(wǎng)絡(luò)中丟失信息等特點,直接采用原始網(wǎng)絡(luò)對其訓練準確度不高。因此,需要對原始網(wǎng)絡(luò)進行改進。
Densenet網(wǎng)絡(luò)基于多層密集連接的思想,在網(wǎng)絡(luò)層數(shù)極深的情況下仍能兼顧圖像的淺層特征,對圖像中小目標和微特征的識別度較好[20-21]。將該網(wǎng)絡(luò)密集連接的特點應用于模塊化分解的Resnet_18網(wǎng)絡(luò)中,可以提高設(shè)備缺陷狀態(tài)識別的識別準確率。Densenet的連接方式及改進后的Res_DNet網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 改進Res_DNet模型結(jié)構(gòu)
改進思路為:在Resnet_18原網(wǎng)絡(luò)中,含有8個Res_Branch子模塊,淺層特征難以在高層網(wǎng)絡(luò)中得到應用,因此,令第i個模塊前輸出的Outij特征作為第j個模塊增加的輸入特征Inij,讓網(wǎng)絡(luò)具有更強的梯度流動性并保存低維度的特征。同時,使用過多Res_Branch子模塊可能造成模型過擬合。考慮自身的數(shù)據(jù)集特點,假設(shè)最終采用的子模塊數(shù)量為L,則需設(shè)計0.5L(L-1)條支路進行多層語義特征傳遞。由于紅外圖像的局部特征主要體現(xiàn)在淺層語義中,考慮對稱式結(jié)構(gòu)的設(shè)計,所使用的網(wǎng)絡(luò)最終采用6個Res_Branch子模塊。值得注意的是,在設(shè)置密集性連接時,網(wǎng)絡(luò)可能因卷積核的數(shù)量不同而無法直接采取加操作,此時可設(shè)置多個大小為1×1的卷積核進行聚合。
超參數(shù)(hyper-parameter)是機器學習算法的參數(shù),學習率、卷積核數(shù)量、正則化項系數(shù)等超參數(shù)的設(shè)置會影響模型分類的準確率。不同模型會有不同的最優(yōu)超參數(shù)組合,根據(jù)經(jīng)驗或隨機的方法來嘗試會浪費大量時間和計算資源。特別地,本文采用2個網(wǎng)絡(luò)逐層遞進的方式提高最終檢測的準確度,每個網(wǎng)絡(luò)的超參數(shù)設(shè)置都需要配合改進。因此,采用貝葉斯算法可以實現(xiàn)超參數(shù)的自動獲取與最優(yōu)選擇。
貝葉斯優(yōu)化的原理可表示為:
λ*=arg maxλf(λ,Dtrain,Dvalid)
(4)
式中:λ為機器學習模型超參數(shù)配置,λ*為最優(yōu)機器學習模型配置;D為給定數(shù)據(jù)集;f為待求的目標優(yōu)化函數(shù)。利用貝葉斯算法進行超參數(shù)優(yōu)化的流程如下:
1) 確定待優(yōu)化的超參數(shù)組合、超參數(shù)調(diào)節(jié)方式和尋優(yōu)取值范圍,各類超參數(shù)優(yōu)化設(shè)置如表2所示。
表2 超參數(shù)優(yōu)化設(shè)置
2) 隨機進行n次訓練,記錄分類準確率,根據(jù)采集函數(shù)的極大值確定下一個采樣點。
3) 設(shè)置最大優(yōu)化時間為8 h,時間結(jié)束后輸出超參數(shù)組合。
同一幅圖像中可能同時具有正常工況的設(shè)備和異常工況的設(shè)備。首先,采用改進后的YOLOv4-tiny算法對待訓練圖像中電氣設(shè)備的缺陷部位進行定位,并提取出該設(shè)備先驗框;然后,將先驗框內(nèi)的局部圖像作為改進Resnet網(wǎng)絡(luò)的輸入層進行訓練,并通過貝葉斯算法優(yōu)化訓練模型的超參數(shù);最后,驗證本文模型,并與目前流行的其余診斷模型進行對比,實驗整體流程如圖4所示。
圖4 實驗整體流程
將樣本按照7∶3劃分為訓練集和測試集,模型輸入尺度為224×224×3。運行環(huán)境為Windows 10操作系統(tǒng),NVIDIA GeForce RTX 3080 Ti顯卡。CPU為AMD Ryzen 9 5950X 16-Core,在Matlab 2022b環(huán)境下運行實驗。實驗參數(shù)設(shè)置如表3所示。
表3 實驗參數(shù)設(shè)置
表4 改進模型與其他模型的實驗結(jié)果
針對紅外巡檢任務的特殊性,使用改進YOLO算法提取局部圖像部分,使用召回率Rec(recall)、精確度Pre(precision)、每類目標的平均精度AP(average precision)、平均精度均值mAP(mean average precision)和每秒傳輸幀數(shù)FPS(frames per second) 來評估模型的性能。使用改進Resnet進行診斷部分,主要采用準確度Pac(accuracy)和FPS來評估改進網(wǎng)絡(luò)的性能。部分計算表達式如下:
(5)
(6)
式中:R為召回率;C為分類的總數(shù)。網(wǎng)絡(luò)模型的交并比IOU取值為0.5。
圖5展示了改進模型在訓練不同設(shè)備過程中70輪損失值的變化情況。隨著訓練輪數(shù)的增加,損失值逐漸下降,在60輪以后損失值趨于平穩(wěn)。
圖5 損失值變化曲線
為了驗證改進算法的先進性,在紅外熱像局部提取任務中與目前主流的算法進行對比,表3給出了本文模型與Fast-RCNN、YOLOv3、YOLOv4以及YOLOv4-Tiny的實驗結(jié)果。在訓練尺度為224×224×3時,改進算法的平均檢測精度為91.25%,mAP相比于原算法提升了5.3%。同時,改進算法在檢測速度上與原算法相比(抽取總樣本10%作為檢驗對象)雖然下降了7 FPS,但在精度上有了很大的提升。故綜上可發(fā)現(xiàn),改進后的算法對變電設(shè)備局部提取的綜合性能最好。
圖6與圖7更為直觀地展示了YOLOv4-Tiny原網(wǎng)絡(luò)和改進網(wǎng)絡(luò)對變電設(shè)備紅外圖像熱缺陷局部提取的結(jié)果。可以看出,改進模型在電流互感器、隔離開關(guān)、套管這幾類變電設(shè)備上的提取精度均高于原始模型。
圖6 YOLOv4_Tiny提取平均精度均值
圖7 改進模型提取平均精度均值
采用改進算法對數(shù)據(jù)集中隔離開關(guān)、套管、電流互感器3類設(shè)備進行檢測,并提取出設(shè)備所在的局部區(qū)域,提取結(jié)果如圖8所示??梢钥闯?改進算法具有較高的置信度,能夠在具有復雜背景干擾的情況下準確提取出目標設(shè)備。
圖8 紅外熱像局部提取結(jié)果
基于改進YOLOv4-Tiny算法進行圖像局部提取后,將其輸入到已訓練的分類模型中,得到模型預測的準確度。同時,采用貝葉斯優(yōu)化算法對模型超參數(shù)組合進行優(yōu)化,效果如圖9所示,表明以分類準確率作為最終期望時,超參數(shù)組合更偏向于選擇較低的正則化系數(shù)與較多的卷積核個數(shù)。
圖9 貝葉斯優(yōu)化超參數(shù)組合效果
圖10展示了本文模型與Alexnet、Resnet、Googlenet、Vgg16等模型在100次迭代訓練過程中的分類準確率。模型識別準確度隨迭代次數(shù)增加均不斷提升并趨于穩(wěn)定,最終檢測效果如表5所示。
表5 不同模型組合的分類準確率
圖10 不同模型組合識別準確度
由表5可知,在進行圖像局部提取之后,經(jīng)典網(wǎng)絡(luò)對各設(shè)備類型和缺陷的識別度均較高。在未進行提取時,即使是識別度最高的Googlenet也僅有85.56%的準確率,進行提取操作這一前步驟可以為最終的分類結(jié)果貢獻約5%的精度。同時,與其他模型相比,本文模型對各類設(shè)備熱缺陷狀態(tài)的識別準確率達到96.67%,比Googlenet等經(jīng)典網(wǎng)絡(luò)的準確率至少高出4.6%。圖11展示了紅外熱像經(jīng)提取、并將數(shù)據(jù)完全打亂后隨機抽取部分圖像進行訓練的結(jié)果,表明本文模型能夠有效識別設(shè)備的熱缺陷狀態(tài)。
圖11 本文模型檢測效果
使用Grad-CAM對Res_DNet網(wǎng)絡(luò)與其余網(wǎng)絡(luò)的識別效果進行對比,結(jié)果如圖12所示。不同的顏色代表著該區(qū)域?qū)︻A測結(jié)果的貢獻度,紅色區(qū)域表明該處的貢獻度最高。網(wǎng)絡(luò)順序從上至下為:Alexnet、Resnet_18、Googlenet、Vgg16、Res_DNet(本文模型)。
圖12 改進模型狀態(tài)識別結(jié)果可視化圖像
從圖12中可以看出,本文診斷模型對設(shè)備熱缺陷狀態(tài)進行識別時,將重點放在設(shè)備產(chǎn)生高熱量的熱缺陷部位,能夠合理判斷設(shè)備的運行狀態(tài),并識別出設(shè)備的故障位置。
針對變電設(shè)備紅外圖像背景干擾大、熱缺陷故障種類繁多、現(xiàn)有故障診斷方法效率低、難以滿足實際巡檢應用需求的問題,通過卷積核分解及多特征融合方法提出一種改進的YOLOv4-Tiny模型,用以提取設(shè)備的局部特征,構(gòu)建了融合密集連接思想的殘差網(wǎng)絡(luò)模型,提升了對設(shè)備熱缺陷的識別準確率。實驗結(jié)果表明,改進后的YOLOv4-Tiny算法相較于原算法提升了5.3%的準確率,改進后的Res_DNet算法相比于經(jīng)典算法提升了4.6%以上的準確率,2種算法組合后表現(xiàn)出輕量化和高精確度的特點,能在電氣設(shè)備紅外巡檢的真實環(huán)境中運用。
下一步將從提升某一類特定設(shè)備熱缺陷識別準確度的方向開展工作。如本文針對隔離開關(guān)的識別效果并未達到預期,這與隔離開關(guān)原紅外數(shù)據(jù)集中故障數(shù)據(jù)與正常數(shù)據(jù)過于相似有關(guān)。因此,針對易于混淆的設(shè)備故障狀態(tài),可對提取圖像進一步增強處理,如HSI、HSV等,從輸入的角度改進和提升檢測模型的準確率。