俞賢文,郝紅衛(wèi),馬永奎
(國(guó)網(wǎng)寧夏電力有限公司中衛(wèi)供電公司,寧夏中衛(wèi),755000)
紅外檢測(cè)技術(shù)已經(jīng)在電網(wǎng)中得到了大量應(yīng)用,是當(dāng)前電力設(shè)備狀態(tài)檢測(cè)的重要手段之一[1]。傳統(tǒng)的紅外檢測(cè)技術(shù),主要依賴于人工檢查,對(duì)技術(shù)人員專業(yè)背景和經(jīng)驗(yàn)知識(shí)要求較高,需要耗費(fèi)大量人力物力。因此,采用高效的目標(biāo)檢測(cè)方法對(duì)紅外電力設(shè)備圖像進(jìn)行快速分類(lèi)和精準(zhǔn)定位具有重要意義。
YOLOv3[2]算法使用深度神經(jīng)網(wǎng)絡(luò)提取深層特征和淺層特征,利用更具鑒別性的深層特征提高檢測(cè)的精確度,在兼顧速度的同時(shí)具有較高的精度。本文基于YOLOv3算法提出了改進(jìn)算法。將注意力機(jī)制,多尺度檢測(cè)層,Involution算子等與YOLOv3結(jié)合,實(shí)現(xiàn)紅外電力設(shè)備圖像的檢測(cè)。本文所提方法在自制紅外電力設(shè)備數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)方法相比,能在精度較高的同時(shí),減少模型參數(shù)量,并達(dá)到實(shí)時(shí)檢測(cè)的速度。
當(dāng)前注意力機(jī)制在計(jì)算機(jī)視覺(jué)領(lǐng)域中受到了研究者的廣泛關(guān)注,常常被應(yīng)用到圖像分類(lèi)、檢測(cè)和分割等視覺(jué)子任務(wù)當(dāng)中。
陳琳琳[3]等人針對(duì)傳統(tǒng)的圖像分類(lèi)方法精度低的問(wèn)題,在卷積神經(jīng)網(wǎng)絡(luò)的圖像分類(lèi)模型中加入了注意力機(jī)制,給出了一種基于注意力機(jī)制的特征提取模塊,利用該模塊可提取不同尺度下圖像的重要特征并對(duì)其進(jìn)行精確分類(lèi)。王翔[4]等人根據(jù)電磁數(shù)據(jù)的時(shí)空特征,通過(guò)引入通道注意力機(jī)制與空間注意力機(jī)制實(shí)現(xiàn)對(duì)關(guān)鍵特征的表示,實(shí)現(xiàn)時(shí)間序列異常檢測(cè)。儲(chǔ)珺[5]等人針對(duì)現(xiàn)有目標(biāo)檢測(cè)器特征金字塔無(wú)法充分利用不同尺度特征圖的特征信息,不適用于低分辨率圖像的目標(biāo)和小目標(biāo)的檢測(cè)。將通道注意力機(jī)制和殘差學(xué)習(xí)塊相結(jié)合,構(gòu)造新的目標(biāo)檢測(cè)器。該檢測(cè)器通過(guò)在不同通道中使用注意力機(jī)制學(xué)習(xí)其通道權(quán)重,有效增強(qiáng)了特征的全局表示能力。郭寧[6]等人將注意力機(jī)制引入卷及神經(jīng)網(wǎng)絡(luò)的解碼部分,通過(guò)增大關(guān)鍵信息權(quán)重以突出目標(biāo)區(qū)域抑制背景像素干擾,給出了一種融合注意力機(jī)制和密集空洞卷積的具有編碼—解碼模式的卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行肺部分割。
為了解決當(dāng)前應(yīng)用中YOLOv3算法存在的不足之處,使其更適用于自制紅外電力設(shè)備目標(biāo)檢測(cè)數(shù)據(jù)集,本文針對(duì)YOLOv3算法進(jìn)行了以下改進(jìn):首先,進(jìn)行k-means聚類(lèi)分析重新確定Anchor的尺寸并增加YOLOv3算法檢測(cè)層的尺度,提升變電站復(fù)雜環(huán)境中電力設(shè)備小目標(biāo)的檢測(cè)效果;隨后,將YOLOv3的特征提取網(wǎng)絡(luò)由Darknet53替換為CSPDarknet53結(jié)構(gòu),并使用了Involution卷積進(jìn)行對(duì)CSPDarknet53中的卷積操作進(jìn)行優(yōu)化在保證性能略有提升的情況下大幅度降低計(jì)算復(fù)雜度,最后,將一種輕量級(jí)局部空間嵌入通道注意力模塊引入到Y(jié)OLOv3算法中,能夠在僅僅增加少量計(jì)算復(fù)雜度的情況下,使算法獲得較大的精度提升。
針對(duì)紅外電力設(shè)備圖像尺度及形態(tài)的多樣性導(dǎo)致目標(biāo)檢測(cè)器性能下降的問(wèn)題,利用YOLOv3算法思想,選擇將低層特征和中層特征進(jìn)行融合,構(gòu)成包含多尺度位置信息和語(yǔ)義信息的特征融合層。在原有網(wǎng)絡(luò)的基礎(chǔ)上將深層特征通過(guò)上采樣操作將其特征圖尺寸放大到與低層特征相同,然后進(jìn)行Concat操作構(gòu)建160×160尺度的新檢測(cè)層,可以將圖像劃分為更加小的單元格,檢測(cè)出更小尺度的物體,提高對(duì)小目標(biāo)的檢測(cè)效果。
本文中提出的殘差融合模塊,設(shè)計(jì)思想是受殘差網(wǎng)絡(luò)的啟發(fā)而來(lái),殘差模塊實(shí)際上可以當(dāng)作通用函數(shù)逼近器,將特征提取網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)由擬合普通卷積的恒等映射函數(shù)H(x)=x轉(zhuǎn)換為學(xué)習(xí)殘差網(wǎng)絡(luò)中的殘差函數(shù)F(x)=H(x)-x,通過(guò)這種結(jié)構(gòu)可以在消除部分冗余特征的同時(shí)突出各層中特征的微小變化,并且可以實(shí)現(xiàn)不同通道信息的融合。
具體包括:1)本文所提出的殘差融合塊是用于獲取局部空間信息,優(yōu)化局部通道信息,最后進(jìn)行多個(gè)通道信息的融和。2)為了保存兩組分別沿著兩個(gè)空間方向聚合的空間信息嵌入特征,本文調(diào)整了殘差融合模塊中各卷積層的通道數(shù),使其輸入通道數(shù)和輸出通道數(shù)與聚合后的特征相同,對(duì)聚合后的輸入特征進(jìn)行優(yōu)化。
局部空間嵌入通道注意力模塊中空間嵌入通道注意力的網(wǎng)絡(luò)結(jié)構(gòu)中直接使用全局平均池化和全局最大池化獲取通道注意力的全局空間信息,會(huì)將所有空間信息壓縮到單一通道當(dāng)中,導(dǎo)致空間信息的丟失。為了解決這一問(wèn)題,本文對(duì)兩個(gè)全局池化操作進(jìn)行了拆解,變成兩對(duì)一維特征編碼操作,實(shí)現(xiàn)全局空間信息的嵌入。全局池化的計(jì)算方式公式(1)所示:
其中Fgp(xn)為與第n個(gè)輸出通道關(guān)聯(lián)的輸出特征。進(jìn)行分解后,對(duì)于輸入特征,分別對(duì)全局平局池化和全局最大池化使用尺寸為(H,1)或(1,W)的池化核沿著水平坐標(biāo)和垂直坐標(biāo)對(duì)所有通道進(jìn)行編碼。所以,高度為h的第n通道的輸出可以分別表示為:
寬度為w的第c通道的輸出可以表示為:
上述兩對(duì)變換,分別沿著空間中的兩個(gè)方向聚合特征,得到兩對(duì)嵌入空間信息的特征圖,具體來(lái)說(shuō),沿著其中一個(gè)方向獲取長(zhǎng)程依賴關(guān)系信息,沿著另一個(gè)方向保留精確的空間依賴信息,從而獲取全局感受野并精準(zhǔn)的編碼空間位置信息,幫助網(wǎng)絡(luò)更精準(zhǔn)的定位感興趣的目標(biāo)區(qū)域。
通過(guò)嵌入空間位置信息的變換之后,將利用上述特征信息進(jìn)行空間嵌入通道注意力的生成,這一過(guò)程必須滿足以下兩個(gè)標(biāo)準(zhǔn),首先,它能夠充分利用到獲取的精確位置信息,精確地定位感興趣的目標(biāo)區(qū)域。其次,可以有效的進(jìn)行跨通道的信息融合,精準(zhǔn)的捕捉到不同通道之間的關(guān)系。
為了驗(yàn)證本文算法那的檢測(cè)效果,在自制紅外電力設(shè)備數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),并與當(dāng)前主流檢測(cè)算法進(jìn)行對(duì)比實(shí)驗(yàn)。使用平均準(zhǔn)確率(mean average precision,mAP)和檢測(cè)幀率(frame per second,F(xiàn)PS),作為評(píng)價(jià)指標(biāo)。
本文的實(shí)驗(yàn)環(huán)境如下:windows 7操作系統(tǒng),32GB內(nèi)存,Intel i7-9700K CPU,NVIDA GeForce GTX 2080TI (11GB顯存) GPU,使用pytorch深度學(xué)習(xí)框架,版本為pytorch 1.7,并配置CUDA10.1+CUDNN7.6實(shí)現(xiàn)GPU加速運(yùn)算。
本文利用收集到的某變電站各類(lèi)可見(jiàn)光和紅外圖像樣本8475張,使用LabelImg工具按照2種電壓等級(jí)(500kV、220kV)、8大類(lèi)設(shè)備(變壓器、斷路器、CT、PT、GIS、高抗、電抗、避雷器)、各類(lèi)型號(hào)、各種部位對(duì)搜集到的紅外圖像進(jìn)行分類(lèi)、整理、標(biāo)注,最終篩選出7903張質(zhì)量較好的紅外圖像并制作成PASCAL VOC格式的紅外電力設(shè)備數(shù)據(jù)集。圖1和圖2分別為紅外電力設(shè)備數(shù)據(jù)集的樣例和檢測(cè)結(jié)果。
圖1 紅外電力數(shù)據(jù)集的樣本圖像
圖2 紅外電力數(shù)據(jù)集的樣本圖像檢測(cè)結(jié)果
從圖2可以看出,本文給出的算法其檢測(cè)框位置與原始標(biāo)定框位置重合度高,效果好。
表 1為 Faster-RCNN、YOLOv3、Ad-YOLO-SENet、Ad-YOLO-SECANet等算法檢測(cè)結(jié)果的對(duì)比,通過(guò)實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)本文所提Ad-YOLO-SECANet算法相比于YOLOv3算法精度提高了1.5個(gè)百分點(diǎn),相對(duì)于Ad-YOLO-SENet算法提高了0.6個(gè)百分點(diǎn),且檢測(cè)速度更快,實(shí)驗(yàn)結(jié)果表明,本文中的方法可以有效提升檢測(cè)的精度并具有實(shí)時(shí)檢測(cè)的能力。
表1 在紅外電力圖像數(shù)據(jù)集上的檢測(cè)結(jié)果
針對(duì)紅外電力設(shè)備檢測(cè)中存在的多尺度和多形態(tài)的問(wèn)題,本文在YOLOv3算法的基礎(chǔ)上,通過(guò)添加160×160尺度檢測(cè)層增加網(wǎng)絡(luò)對(duì)小目標(biāo)檢測(cè)的敏感性,然后使用Involution算子對(duì)Backbone的結(jié)構(gòu)進(jìn)行改進(jìn),在減小參數(shù)量的同時(shí),獲得了精度的提升,最后,提出新的輕量級(jí)注意力機(jī)制對(duì)特征進(jìn)行。實(shí)驗(yàn)結(jié)果證明,本文給出的算法在測(cè)試集上的精確度為83.1%,同其它網(wǎng)絡(luò)模型比較,具有較好的檢測(cè)性能和魯棒性,證明了本文所提出方法的有效性,為變電站設(shè)備紅外檢測(cè)提供了更加精準(zhǔn)高效的檢測(cè)思路。