摘" 要: YOLO系列算法已廣泛用于識別電力線路中的各類缺陷目標(biāo)。由于巡檢圖像背景復(fù)雜、缺陷目標(biāo)的尺度不一等,直接利用YOLO算法難以有效避免絕緣子閃絡(luò)、破損等小目標(biāo)的錯檢漏檢問題。為解決這一問題,在YOLOv8s模型的基礎(chǔ)上提出一種輕量化絕緣子缺陷檢測算法。在骨干網(wǎng)絡(luò)中引入雙層路由注意力機制(BRA),以提升對全局特征的關(guān)注度,抑制背景噪聲,降低小目標(biāo)缺陷的錯檢漏檢率。通過加權(quán)雙向特征金字塔網(wǎng)絡(luò)(BiFPN)實現(xiàn)跨尺度特征之間的加權(quán)融合,獲取各類缺陷更全面的特征信息。重構(gòu)Neck網(wǎng)絡(luò)來消除低貢獻度的網(wǎng)絡(luò)節(jié)點,在增強檢測性能的同時減少了模型的參數(shù)量,實現(xiàn)了性能提升和參數(shù)效率之間的平衡。實驗結(jié)果顯示,改進后的網(wǎng)絡(luò)模型平均檢測精度達到84.9%,而參數(shù)量僅為8.4×106,可實現(xiàn)對絕緣子缺陷的快速準(zhǔn)確檢測。
關(guān)鍵詞: 輕量化網(wǎng)絡(luò); YOLOv8s; 絕緣子缺陷; 小目標(biāo)缺陷檢測; 雙層路由注意力機制; 加權(quán)雙向特征金字塔網(wǎng)絡(luò); 特征融合
中圖分類號: TN911.73?34" " " " " " " " " " " " "文獻標(biāo)識碼: A" " " " " " " " " " " "文章編號: 1004?373X(2024)20?0072?09
Lightweight insulator multi?defect detection model based on YOLOv8s
LAN Guiwen1, 2, REN Xinyue1, 2, XU Zirui1, 2, GUO Ruidong1, 2, ZHONG Zhan1, 2
(1. College of Geomatics and Geoinformation, Guilin 541004, China; 2. Guangxi Key Laboratory of Spatial Information and Geomatics, Guilin 541004, China)
Abstract: The YOLO series algorithm has been widely used to identify various types of defect targets in power lines. Due to the complex background of inspection images and the varying sizes of defect targets, it is difficult to effectively avoid the problem of 1 detection and missed detection of small targets such as insulator flashover and damage by means of the YOLO algorithm. On this basis, a lightweight insulator defect detection algorithm is proposed on the basis of the YOLOv8s model. The bi?level routing attention (BRA) mechanism is inserted into the backbone network to enhance attention to global features, suppress background noise, and reduce the 1 positive detection rate of small target defects. The weighted bidirectional feature pyramid network (BiFPN) is used to achieve the weighted fusion of cross?scale features and obtain more comprehensive feature information of various defects. The Neck network is reconstructed to eliminate the low?contribution network nodes, and the number of parameters is reduced while the detection performance is enhanced, thus achieving a balance between performance improvement and parameter efficiency. The experimental results show that the improved network model has an average detection accuracy of 84.9% and a parameter size of only 8.4×106, which can achieve fast and accurate detection of insulator defects.
Keywords: lightweight network; YOLOv8s; insulator defect; small target defect detection; bi?level routing attention mechanism; weighted bidirectional feature pyramid network; feature fusion
0" 引" 言
絕緣子是輸電線路不可或缺的部件,具有固定輸電線路、防止電流回地的作用[1]。然而隨著使用時間的延長,絕緣子表面會受到外界環(huán)境的侵蝕和破損。這些缺陷可能導(dǎo)致設(shè)備故障,并引發(fā)安全事故。為了確保絕緣子串對電力系統(tǒng)的健康運行起到積極作用,需要定期進行巡檢[2]。近年來,由于無人機對地理、地形和環(huán)境因素不敏感,絕緣子已被廣泛應(yīng)用于電力線路檢測。然而,從大量巡檢圖像中定位缺陷需要高昂的人力和時間成本。目前的趨勢是采用基于深度學(xué)習(xí)的目標(biāo)檢測算法來完成缺陷檢測任務(wù),以減少電力巡檢的工作量,并減少錯檢和漏檢的現(xiàn)象。
其中Faster?RCNN[3]、SSD[4]和YOLO[5?7]系列等算法已被廣泛應(yīng)用于傳輸線路缺陷的檢測。Faster?RCNN兩階段算法已經(jīng)在許多研究[8?10]中被證明是有效的,但由于其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)和緩慢的速度,不適合進行實時性要求較高的檢測。相比之下,YOLO、SSD等單階段算法通過回歸方法直接獲得對象的邊界框和類型,比兩階段算法速度更快。正因如此,YOLO系列算法是最受關(guān)注的并被廣泛應(yīng)用于絕緣子缺陷檢測任務(wù)。這些研究的重點可以分為以下幾個方面。
1) 在主干網(wǎng)絡(luò)中引入許多注意力機制,提升網(wǎng)絡(luò)對于缺陷的定位能力[11?12]。
2) 提出一些特殊且高效的特征融合方法,在復(fù)雜背景下充分利用多尺度特征挖掘隱含的深層次信息,避免小目標(biāo)特征被遺漏[13?14]。
3) 通過輕量化模塊重構(gòu)檢測網(wǎng)絡(luò),旨在降低模型參數(shù)量,以提高檢測速度[15?16]。
眾所周知,直接堆疊注意力模塊和特征融合模塊能夠提升模型的檢測精度,但這些策略通常會使模型尺寸增大而導(dǎo)致檢測效率降低,很難在精度和速度之間達到平衡。以YOLO系列模型為例,最新版本YOLOv8s模型的準(zhǔn)確性比早期版本有了很大的提高,但它的模型參數(shù)量顯著上升,在訓(xùn)練和推理過程需要更大的計算成本。因此,本文為更好地滿足絕緣子缺陷的快速檢測,對YOLOv8s模型做出如下改進。
1) 在骨干網(wǎng)絡(luò)末端添加雙級路由注意力機制(Bi?Level Routing Attention, BRA)[17],增強主干網(wǎng)絡(luò)在特征提取過程中的深度,削弱巡檢圖像復(fù)雜背景帶來的影響,降低缺陷目標(biāo)的錯檢漏檢率。
2) 引入BiFPN[18]加權(quán)雙向金字塔模塊,以高效的跨尺度特征融合手段取代特征拼接,挖掘更有效的深層次特征信息,增強模型對于多類別缺陷的檢測效果。
3) 在BiFPN模塊基礎(chǔ)上重構(gòu)YOLOv8s模型的頸部網(wǎng)絡(luò),使得改進模型可以高效獲取和利用加權(quán)拼接的全局或局部特征信息,解決了網(wǎng)絡(luò)計算量過大的問題。
本文從CSDN網(wǎng)站(https://download.csdn.net/download/weixin_44404753/86933073)上獲取共1 408張存在破損、閃絡(luò)等不同類別缺陷的絕緣子圖像,以YOLOv8s網(wǎng)絡(luò)為基線模型進行注意力機制和特征融合機制間的消融實驗,并與當(dāng)前主流目標(biāo)檢測模型進行對比實驗,采用各實驗中絕緣子缺陷的檢測精度和模型計算量作為衡量指標(biāo)。
1" 方" 法
1.1" YOLOv8s模型
YOLOv8s算法的網(wǎng)絡(luò)結(jié)構(gòu)分為四個部分:輸入端(Input)、主干網(wǎng)絡(luò)(Backbone)、頸部網(wǎng)絡(luò)(Neck)和預(yù)測頭(Head),具體結(jié)構(gòu)如圖1所示。
在輸入端,模型采用Mosaic數(shù)據(jù)增強等策略達到豐富數(shù)據(jù)集樣本的效果。主干網(wǎng)絡(luò)和頸部網(wǎng)絡(luò)是組成該模型的核心部分,在主干部分YOLOv8s基于YOLOv5模型的CSP思想和SPPF模塊的基礎(chǔ)上,引入優(yōu)化后的C2f模塊替換原有的C3模塊。C2f模塊可通過并行更多的梯度流分支的操作,實現(xiàn)模型計算的輕量化,詳細結(jié)構(gòu)如圖2所示。
在頭部網(wǎng)絡(luò)中使用解耦頭結(jié)構(gòu),目標(biāo)分類和邊界框預(yù)測回歸采用獨立的分支進行,緩解兩類任務(wù)間存在的沖突;同時采用Anchor?Free[19?20]思想,直接預(yù)測樣本目標(biāo)的中心與寬高,進一步減少模型參數(shù)量和計算量。
1.2" 改進后的YOLOv8s模型結(jié)構(gòu)
針對跨尺度絕緣子缺陷在復(fù)雜噪聲影響下檢測精度較低、模型計算量偏大的問題,本文基于YOLOv8s結(jié)構(gòu),引入注意力機制、特征融合機制對其結(jié)構(gòu)進行優(yōu)化。改進模型的網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
首先在金字塔池化層后添加BRA注意力機制(見1.3節(jié)),利用其產(chǎn)生的稀疏注意力來剔除全局特征圖中低相關(guān)區(qū)域,提升模型特征提取網(wǎng)絡(luò)對于輸入特征的敏感度,增強網(wǎng)絡(luò)對于小目標(biāo)特征信息的學(xué)習(xí)能力。
其次,引入BiFPN模塊重新設(shè)計模型的特征融合機制(見1.4節(jié)),通過雙向跨尺度連接網(wǎng)絡(luò)提取缺陷樣本的不同尺度信息,并對不同尺度的特征自適應(yīng)添加權(quán)重,使得網(wǎng)絡(luò)能提供重要缺陷信息的特征并進行區(qū)分融合,提升網(wǎng)絡(luò)對于多尺度缺陷目標(biāo)的識別與定位能力。
然而直接添加改進策略會導(dǎo)致模型計算復(fù)雜度上升,因此針對于原頸部網(wǎng)絡(luò)中低貢獻度的網(wǎng)絡(luò)節(jié)點進行簡化,并為同級的原始特征提供跳躍連接的通道,參與特征融合,所形成的新頸部網(wǎng)絡(luò)可以有效消除冗余計算,降低模型參數(shù)量。
1.3" 基于BRA注意力機制的特征增強
由于無人機巡檢所獲得的絕緣子圖像背景復(fù)雜,導(dǎo)致絕緣子缺陷目標(biāo)的特征信息表達有限。YOLOv8s模型的主干網(wǎng)絡(luò)在特征提取過程中受到干擾,無法對缺陷信息進行準(zhǔn)確定位、識別。注意力機制的引入有效解決了上述問題。常見的注意力機制有通道注意力機制(SE[21])、結(jié)合通道和空間的注意力機制(CBAM[22])、坐標(biāo)注意力機制(CA[23])和稀疏注意力機制(BRA)等。其中,SE模塊考慮了特征的通道信息卻忽略了位置信息;CBAM模塊在前者的基礎(chǔ)上將空間信息與通道信息進行串聯(lián),但其只考慮特征的局部信息;CA模塊通過將位置信息嵌入到通道注意力中來實現(xiàn)對缺陷更好的定位,但因其計算復(fù)雜度太低,導(dǎo)致模型對特征的學(xué)習(xí)效果不佳;BRA模塊對接收到的全局特征圖自適應(yīng)地產(chǎn)生動態(tài)的稀疏注意力,剔除掉特征圖中與絕緣子缺陷特征低相關(guān)性的區(qū)域,并在缺陷區(qū)域及與其保持高相關(guān)性的區(qū)域施加注意力值,來有效抑制背景噪聲影響。本文在主干部分的特征提取網(wǎng)絡(luò)末端引入BRA注意力機制。該模塊的具體結(jié)構(gòu)見圖4。
具體實現(xiàn)過程可解釋為將全局特征圖的映射[X∈RH×W×C]劃分為M×M個非重疊區(qū)域。假定通過線性映射得到Q、K、V三個張量,計算公式如下:
[Q=XrWq]" " " (1)
[K=XrWk]" " " "(2)
[V=XrWv]" " "(3)
然后在Q和K上利用區(qū)域平均值分別求出區(qū)域級Qr、Kr,得到特征圖中不重疊區(qū)域親和度圖的鄰接矩陣Ar:
[Ar=QrKrT]" " (4)
將通過鄰接矩陣找到的缺陷語義信息表達相關(guān)的區(qū)域組合起來并存儲在索引矩陣Ir:
[Ir=topkIndexAr]" " (5)
在收集到的以Ir為索引的區(qū)域內(nèi),K個最關(guān)注區(qū)域Kg、Vg上使用注意力操作,并與利用局部上下文增強模塊LCE從相鄰區(qū)域張量V中獲取的局部信息相結(jié)合,構(gòu)成最終的特征表達,定義為:
[O=Attention(Q,Kg,Vg)+LCE(V)]" (6)
BRA注意力機制的加入可以高效地抑制背景噪聲對標(biāo)注區(qū)域的小尺度絕緣子缺陷目標(biāo)的影響,增強了主干網(wǎng)絡(luò)的抗干擾能力和特征提取效率,進一步提升了模型的學(xué)習(xí)性能。
1.4" 特征融合機制優(yōu)化
YOLOv8s原算法模型中,特征融合手段主要依靠路徑聚合網(wǎng)絡(luò)PANet[24]結(jié)構(gòu),該結(jié)構(gòu)是在FPN[25]結(jié)構(gòu)的基礎(chǔ)上演化而來。FPN是自上而下利用特征處理后的上下文信息,這種操作能夠增加特征映射的分辨率,將小目標(biāo)的特征轉(zhuǎn)移到更大的特征圖上,進行后續(xù)卷積操作,但其結(jié)構(gòu)走向過于單一;PANet則是在FPN基礎(chǔ)上增加了一條自下而上的路徑,從而形成一條雙向特征融合的鏈路,補償了在卷積過程中丟失的特征定位信息,與后者實現(xiàn)了互補的效果。FPN與PANet具體結(jié)構(gòu)如圖5所示。
盡管在YOLOv8s網(wǎng)絡(luò)中,這種特征融合機制做出了不可忽視的貢獻,但在處理大規(guī)模特征圖的映射信息時,無法對提供高相關(guān)性的特征信息進行重點利用,從而影響模型的檢測效果。因此,為提升絕緣子破損、閃絡(luò)缺陷間不同尺度特征的融合效率和質(zhì)量,本文引入BiFPN模塊替換原有特征融合機制并重構(gòu)頸部網(wǎng)絡(luò),這些改進在圖6中做了詳細展示。
BiFPN算法通過雙向跨尺度連接、特征加權(quán)融合的方式促進深層和淺層特征之間的信息融合。受此啟發(fā),本文對頸部網(wǎng)絡(luò)中原有的PAN?FPN結(jié)構(gòu)進行調(diào)整,形成雙向鏈接,保證不同尺度特征之間的有效流動;同時采用加權(quán)融合的方式取代特征拼接,引入權(quán)重因子,確定各尺度特征圖中所包含的缺陷語義信息的重要性,使網(wǎng)絡(luò)更好地學(xué)習(xí)不同尺度特征所表達的信息。經(jīng)過加權(quán)處理的特征采用快速歸一化的融合方法,公式為:
[O=ωiε+ωilj]" (7)
該融合方法是類似softmax對權(quán)重標(biāo)量進行歸一化處理方法的加強版本。式中:ωi是賦予每一個特征的權(quán)重,采用ReLU函數(shù)保證權(quán)重值大于0;lj是輸入的特征;ε是一個常數(shù)被用作穩(wěn)定數(shù)值。
同時,在輸入輸出節(jié)點之間添加跳躍連接通道來提升融合過程的完備性和便捷性,使僅具有單一連接點的節(jié)點失效,以消除由模塊堆疊帶來的冗余計算。因此本文在頸部網(wǎng)絡(luò)的P3到P5各層中于同級輸入、輸出節(jié)點之間增加一個跳躍性的特征傳遞渠道,來簡化跨尺度特征拼接過程中所耗費的計算成本并增強融合后特征的信息表達;同時,刪減特征融合網(wǎng)絡(luò)中僅具有單一連接點的節(jié)點,降低由層數(shù)較多導(dǎo)致小尺度特征信息流失帶來的影響。
優(yōu)化后的頸部結(jié)構(gòu)增大了模型對于絕緣子各類缺陷的感受野,對于小尺度的破損、閃絡(luò)缺陷特征信息具有更強的學(xué)習(xí)力,提升了模型對各類絕緣子缺陷的檢測精度。同時,優(yōu)化后的網(wǎng)絡(luò)結(jié)構(gòu)大大降低了模型在訓(xùn)練過程中的實驗參數(shù)量和計算量,實現(xiàn)了對絕緣子缺陷的快速檢測。
以圖6中BiFPN結(jié)構(gòu)圖中P5節(jié)點為例,在優(yōu)化后的特征融合機制中,其輸入、輸出特征計算公式如下:
[Ptd5=Convω1?Pin5+ω2?Resize(Pin6)ω1+ω2+ε] (8)
[Pout5=Convω1'?Pin5+ω2'?Ptd5+ω3'?Resize(Pout4)ω1'+ω2'+ω3'+η] (9)
式中:[Ptd5]為自上而下第5級的中間特征;[Pout5]則是自下而上第5級的輸出特征。將[Pin5]和[Pin6]代入公式(7)中即可得到式(8);同理,若將[Pin5]、[Pin6]和[Pout4]代入公式(7)即可得到式(9),其余各層的所有輸出特征都通過上述公式構(gòu)建。
2" 實驗與分析
2.1" 數(shù)據(jù)集介紹
實驗采用的數(shù)據(jù)集由國內(nèi)某電力巡檢公司操控?zé)o人機在電力巡檢過程中拍攝所得。為驗證研究的可行性,選取了1 408張絕緣子巡檢圖像作為實驗數(shù)據(jù)集。這些圖像中包含了絕緣子串較典型缺陷,如絕緣子閃絡(luò)、破損,將其作為檢測目標(biāo)。另外,為提升模型的泛化性,在選取圖像時著重關(guān)注其背景是否囊括樹林、草地、荒漠等不同場景。部分典型缺陷樣本集如圖7所示。
2.2" 實驗環(huán)境及訓(xùn)練
為驗證本文研究的可行性,在所搭建的實驗平臺上進行了一系列嚴(yán)格實驗。該平臺的系統(tǒng)環(huán)境具體配置如表1所示。
在訓(xùn)練過程中,按照14∶1∶1的比例將數(shù)據(jù)集隨機劃分為訓(xùn)練集、驗證集和測試集三個子集。實驗參數(shù)設(shè)置具體如下:輸入模型的圖像大小為640×640,訓(xùn)練批次為4,實驗總輪次為300輪,模型初始學(xué)習(xí)率為0.01,并使用隨機梯度下降法更新參與訓(xùn)練的各項參數(shù)。
2.3" 精度評價指標(biāo)
為合理地衡量模型的檢測性能,研究結(jié)果以精確率(P)、召回率(R)、浮點計算量(GFLOPS)和參數(shù)量作為評價指標(biāo)。其中,準(zhǔn)確率表示模型預(yù)測的樣本占據(jù)所有檢測到的樣本的百分比;召回率表示模型預(yù)測正確的樣本占實際樣本數(shù)的百分比;浮點計算量表示模型在訓(xùn)練過程中所需要用到的時間成本;參數(shù)量則可用于衡量網(wǎng)絡(luò)模型的復(fù)雜度,參數(shù)量大的網(wǎng)絡(luò)在結(jié)構(gòu)上更復(fù)雜,在訓(xùn)練過程中會耗費更多的計算資源。
2.4" 實驗結(jié)果及分析
2.4.1" 注意力機制的影響
表2中顯示了在特征提取網(wǎng)絡(luò)末端搭載不同注意力機制的模型檢測結(jié)果。
實驗數(shù)據(jù)表明加載不同注意力機制后,模型的參數(shù)量都有不同程度的增加,但檢測精度值表達各異。其中,添加坐標(biāo)注意力后模型的參數(shù)量增加并不明顯,但網(wǎng)絡(luò)的計算復(fù)雜度較低,導(dǎo)致其學(xué)習(xí)能力較弱,對缺陷的識別精度下降5.3%(相對于YOLOv8s+改進頸部結(jié)構(gòu));而將通道注意力和空間注意力單獨或者合并引入網(wǎng)絡(luò)時,模型的訓(xùn)練速度和參數(shù)量有小幅度上升,但檢測精度提升效果略小。然而,當(dāng)搭載BRA注意力時,模型的參數(shù)量和浮點計算量提升幅度較大,但其表現(xiàn)出了優(yōu)秀的檢測性能,因此綜合考慮可為最優(yōu)選擇。
為驗證BRA注意力機制對絕緣子各類別缺陷的優(yōu)秀檢測效果,本文在表3闡述了有無BRA注意力機制下各類別缺陷目標(biāo)的檢測精度值。表中的“√”表示添加了該模塊。實驗結(jié)果表明,未添加注意力機制時,YOLOv8s網(wǎng)絡(luò)對于絕緣子破損缺陷的檢測精度高于閃絡(luò)痕跡的識別,就細微目標(biāo)特征較大尺寸特征而言,在網(wǎng)絡(luò)卷積操作中存在更大的信息流失。但引入BRA注意力機制后,特征提取網(wǎng)絡(luò)對于微小閃絡(luò)缺陷的檢測精度P值提升了6.2%,同樣對絕緣子破損缺陷的檢測精度P值提升了2.6%。這表明在注意力機制的作用下模型能夠有效關(guān)注到全局特征圖中小尺度缺陷的信息,并抑制信息流失產(chǎn)生的負面影響。
2.4.2" 消融實驗及分析
為進一步驗證本文改進策略的有效性,以原YOLOv8s算法為基礎(chǔ),進行消融實驗,4組實驗均在相同的環(huán)境和條件參數(shù)下進行。其中各組實驗網(wǎng)絡(luò)結(jié)構(gòu)及檢測結(jié)果如表4所示,表格中的“√”表示本次實驗添加了該模塊。
從表4中的結(jié)果可知,與常規(guī)的YOLOv8s模型相比,本研究所提出的方法在降低模型計算參數(shù)量和浮點計算量的基礎(chǔ)上實現(xiàn)了檢測準(zhǔn)確度的提升。
1) 引入BRA注意力機制使得模型的檢測準(zhǔn)確度提升了0.8%,提高了在復(fù)雜背景下跨尺度缺陷的特征提取能力。
2) 基于BiFPN模塊構(gòu)建新的頸部網(wǎng)絡(luò),致使模型參數(shù)量降低了3.7×106,浮點計算量降低了12.5%,檢測準(zhǔn)確度提升了5.4%,改進后的特征融合機制能夠充分高效地利用全局或局部特征,既提升了檢測性能,又降低了模型的復(fù)雜度。
3) 將上述策略組合之后,模型的參數(shù)量降低了2.7×106,浮點計算量降低了9.0%,檢測精度提升了15.1%,表明本文所提出的改進模型實現(xiàn)了檢測效率與精度的良好平衡。
2.4.3" 對比實驗及分析
為進一步客觀評價本文提出的改進算法相比YOLO系列算法和當(dāng)前主流目標(biāo)檢測算法[26](GBH?YOLOv5)的優(yōu)勢所在,特進行以下5組參數(shù)相同的對比實驗,具體結(jié)果如表5所示。
表5中的數(shù)據(jù)展示了各算法的檢測性能及模型復(fù)雜度。根據(jù)實驗結(jié)果可知,在對比實驗中YOLOv5s模型的浮點計算量最小,模型復(fù)雜度最低,但低深度的卷積使得模型在訓(xùn)練過程中無法學(xué)習(xí)到深層次特征,致使其檢測準(zhǔn)確度僅有60.2%,模型的性能較差;GBH?YOLOv5模型在前者的基礎(chǔ)上提升了網(wǎng)絡(luò)的復(fù)雜度,對于缺陷目標(biāo)的檢測準(zhǔn)確度有所提升,但在訓(xùn)練過程中需要耗費數(shù)倍的時間;YOLOv7模型的參數(shù)量和訓(xùn)練時間是該系列算法中最高的,通過增加訓(xùn)練成本來追求較高的檢測精度,但過于復(fù)雜的模型在實際應(yīng)用中無法提供較高的實際價值;YOLOv8s模型的檢測效果與YOLOv7和GBH?YOLOv5兩組相比,在參數(shù)量和檢測準(zhǔn)確度之間保持了較好的平衡,但檢測準(zhǔn)確度仍具有提升空間;而本文所提出的改進模型綜合表現(xiàn)優(yōu)秀,以較低的計算資源實現(xiàn)了對絕緣子各類別缺陷的高精度識別,更適合電力巡檢過程中對絕緣子缺陷的檢測。
為了更直觀地展示改進模型的檢測效果,選取包含多尺度缺陷目標(biāo)的典型場景圖像進行推理實驗。推理實驗的模型采用表5中檢測精度較高的兩種算法(YOLOv7和改進算法),具體推理結(jié)果如圖8所示。
根據(jù)圖8中的實驗結(jié)果能夠看出,兩組參照實驗均未出現(xiàn)明顯的誤檢現(xiàn)象。從YOLOv7算法的推理結(jié)果中可以準(zhǔn)確地識別出大尺寸的破損、閃絡(luò)缺陷,但其存在少量的小目標(biāo)缺陷漏檢現(xiàn)象;反觀改進算法,不僅在大尺寸目標(biāo)上獲得了較高的目標(biāo)框得分置信度,也有效識別到了絕緣子表面細微的缺陷痕跡。
3" 結(jié)" 論
本文提出了一種既精確又輕量化的絕緣子缺陷檢測模型,致力于解決絕緣子缺陷檢測任務(wù)中背景噪聲復(fù)雜、缺陷尺度跨度較大等問題。創(chuàng)新包含以下三點。
1) 在主干網(wǎng)絡(luò)中引入BRA注意力機制,抑制背景噪聲干擾并加強模型在特征提取環(huán)節(jié)對小尺度缺陷樣本的關(guān)注。
2) 通過加權(quán)雙向金字塔BiFPN模塊優(yōu)化特征融合網(wǎng)絡(luò),以自適應(yīng)加權(quán)特征融合方法充分利用全局或局部特征,獲取跨尺度特征間的隱含信息。
3) 調(diào)整頸部網(wǎng)絡(luò)結(jié)構(gòu),降低網(wǎng)絡(luò)模型的參數(shù)量和計算復(fù)雜度,實現(xiàn)檢測性能和模型復(fù)雜度之間的平衡。
實驗結(jié)果表明,本文提出的改進模型較基準(zhǔn)模型表現(xiàn)出了良好的檢測性能,檢測精度提升15.1%,參數(shù)量降低了2.7×106,浮點計算量降低了9.0%,實現(xiàn)了絕緣子檢測任務(wù)中性能提升與參數(shù)量之間的平衡,為后續(xù)絕緣子缺陷快速準(zhǔn)確識別提供了有意義的參考。
注:本文通訊作者為任新月。
參考文獻
[1] 張劍銳,魏霞,張林鍹,等.改進YOLOv7的絕緣子檢測與定位[J].計算機工程與應(yīng)用,2024,60(4):183?191.
[2] 郝帥,趙新生,馬旭,等.基于TR?YOLOv5的輸電線路多類缺陷目標(biāo)檢測方法[J].圖學(xué)學(xué)報,2023,44(4):667?676.
[3] REN S, HE K, GIRSHICK R, et al. Faster R?CNN: towards real?time object detection with region proposal networks [J]. IEEE transactions on pattem analysis amp; machine intelligence, 2017, 39(6): 1137?1149.
[4] LIU W, ANGUELOV D, ERHAN D, et al. SSD: single shot multibox detector [C]// Eourpean Conference on Computer Vision. Netherlands: Springer, 2016: 21?37.
[5] REDMON J, DIVVALA S K, GIRSHICK R B, et al. You only look once: unified, real?time object detection [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 779?788.
[6] REDMON J, FARHADI A. YOLOv3: an incremental improvement [EB/OL]. [2024?01?15]. https://ui.adsabs.harvard.edu/abs/2018arXiv 180402767R.
[7] BOCHKOVSKIY A, WANG C, LIAO H M. YOLOv4: optimal speed and accuracy of object detection [EB/OL]. [2024?01?15]. https://arxiv.org/abs/2004.10934.
[8] 虢韜,楊恒,時磊,等.基于Faster RCNN的絕緣子自爆缺陷識別[J].電瓷避雷器,2019(3):183?189.
[9] 張燁,高玉菡,黃新波,等.基于Fine Mask RCNN的110~220 kV輸電鐵塔涉鳥故障識別與評估[J].電網(wǎng)技術(shù),2022,46(6):2132?2144.
[10] 顧超越,李喆,史晉濤,等.基于改進Faster?RCNN的無人機巡檢架空線路銷釘缺陷檢測[J].高電壓技術(shù),2020,46(9):3089?3096.
[11] ZHENG J, WU H, ZHANG H, et al. Insulator?defect detection algorithm based on improved YOLOv7 [J]. Sensors, 2022, 22(22): 8801.
[12] 王韻琳,馮天波,孫寧,等.融合注意力與多尺度特征的電力絕緣子缺陷檢測方法[J].高電壓技術(shù),2024,50(5):1933?1942.
[13] 楊露露,馬萍,王聰,等.結(jié)合特征重用與特征重建的YOLO絕緣子檢測方法[J].計算機工程,2024,50(7):303?313.
[14] CHEN J, FU Z, CHENG X, et al. An method for power lines insulator defect detection with attention feedback and double spatial pyramid [J]. Electric power systems research, 2023, 218: 109175.
[15] 翟永杰,趙曉瑜,王璐瑤,等.IDD?YOLOv7:一種用于輸電線路絕緣子多缺陷的輕量化檢測方法[J].圖學(xué)學(xué)報,2024,45(1):90?101.
[16] 王道累,張世恒,袁斌霞,等.基于改進YOLOv5的輕量化玻璃絕緣子自爆缺陷檢測研究[J].高電壓技術(shù),2023,49(10):4382?4390.
[17] ZHU L J, WANG X, KE Z H, et al. BiFormer: vision transformer with bi?level routing attention [C]// 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver, BC, Canada: IEEE, 2023:10323?10333.
[18] TAN M X, PANG R M, LE Q V. Efficientdet: scalable and efficient object detection [C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA: IEEE, 2019: 10778?10787.
[19] ZHU C C, HE Y H, SAVVIDES M. Feature selective anchor?free module for single?shot object detection [C]// 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Long Beach, CA, USA: IEEE, 2019: 840?849.
[20] YAN Y C, LI J P, QIN J, et al. Anchor-free person search [C]// 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Nashville, TN, USA: IEEE, 2021: 7686?7695.
[21] HU J, SHEN L, SUN G. Squeeze?and?excitation networks [C]// Proceediings of the 2018 Eourpean Conference on Computer Vision. Cham: Springer, 2018: 7132?7141.
[22] WOO S, PARK J, LEE J Y, et al. CBAM: convolutional block attention module [C]// Proceediings of the 2018 Eourpean Conference on Computer Vision. Cham: Springer, 2018: 3?19.
[23] HOU Q B, ZHOU D Q, FENG J S. Coordinate attention for efficient mobile network design [C]// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Nashville, TN, USA: IEEE, 2021: 13713?13722.
[24] LIU S, QI L, QIN H F, et al. Path aggregation network for instance segmentation [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE, 2018: 8759?8768.
[25] LIN T, R P D A, GIRSHICK R B, et al. Feature pyramid networks for object detection [C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE, 2016: 936?944.
[26] LI L L, WANG Z F, ZHANG T T. Gbh?yolov5: ghost convolution with bottleneckcsp and tiny target prediction head incorporating yolov5 for PV panel defect detection [J]. Electronics, 2023, 12(3): 561.
[27] 葉翔,孫嘉興,甘永葉,等.改進YOLOv3模型在無人機巡檢輸電線路部件缺陷檢測中的應(yīng)用研究[J]. 電測與儀表,2023,60(5):85?91.
[28] 王紅君,王金云,趙輝,等.一種改進YOLOv5s的自爆絕緣子檢測算法研究[J].重慶理工大學(xué)學(xué)報(自然科學(xué)),2023,37(4):235?244.
[29] 茍軍年,杜愫愫,劉力.基于改進掩膜區(qū)域卷積神經(jīng)網(wǎng)絡(luò)的輸電線路絕緣子自爆檢測[J].電工技術(shù)學(xué)報,2023,38(1):47?59.
[30] 霍超,谷曉鋼,黃玲琴,等.基于YOLO v4優(yōu)化的航拍絕緣子缺陷圖像檢測模型[J].電子測量技術(shù),2023,46(9):175?181.
作者簡介:藍貴文(1977—),男,廣西河池人,博士研究生,教授,主要從事地理信息集成應(yīng)用、地理要素智能識別研究工作等。
任新月(2001—),女,河南南陽人,在讀碩士研究生,研究方向為機器視覺與深度學(xué)習(xí)的工業(yè)應(yīng)用。
DOI:10.16652/j.issn.1004?373x.2024.20.012
引用格式:藍貴文,任新月,徐梓睿,等.基于YOLOv8s的輕量級絕緣子多缺陷檢測模型[J].現(xiàn)代電子技術(shù),2024,47(20):72?80.
收稿日期:2024?03?27" " " " " "修回日期:2024?04?28
基金項目:國家自然科學(xué)基金項目(41861050)