陳雷平,段意強(qiáng),瞿宏愿
1.懷化學(xué)院物電與智能制造學(xué)院,湖南 懷化 418000 2.廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東 惠州 516000 3.國(guó)網(wǎng)湖南省電力有限公司水電分公司,湖南 長(zhǎng)沙 410004
隨著我國(guó)國(guó)民經(jīng)濟(jì)持續(xù)發(fā)展,電力系統(tǒng)規(guī)模日益龐大,輸電線路的長(zhǎng)度不斷增加,輸電線路的缺陷如絕緣子缺陷、R銷缺失以及鳥巢[1-2]等也越來(lái)越多,輸電線巡檢工作變得越發(fā)重要。
目前,對(duì)于輸電線路缺陷檢測(cè)的方法主要在YOLO和Faster R-CNN的基礎(chǔ)上進(jìn)行改進(jìn)。例如文獻(xiàn)[3]在YOLOv3的基礎(chǔ)上對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),通過(guò)添加SPP[4]模塊和選擇新的激活函數(shù)保證模型檢測(cè)精度;文獻(xiàn)[5]在YOLOv4的基礎(chǔ)上,引入了注意力機(jī)制、調(diào)整預(yù)設(shè)先驗(yàn)框 (anchor)值以及修改網(wǎng)絡(luò)損失函數(shù)來(lái)改進(jìn)模型,試驗(yàn)證明了改進(jìn)方法能較好地識(shí)別絕緣子缺陷;文獻(xiàn)[6]對(duì)YOLOv5s金字塔結(jié)構(gòu)進(jìn)行改進(jìn)和添加注意力模塊并取得不錯(cuò)的檢測(cè)效果。針對(duì)復(fù)雜環(huán)境中輸電線路缺陷檢測(cè)精度低,難以有效處理超高分辨率的圖片以及小目標(biāo)檢測(cè)等問(wèn)題,本文提出一種基于改進(jìn)YOLOv5的輸電線路缺陷檢測(cè)方法,主要改進(jìn)內(nèi)容包括以下幾個(gè)方面。
1)采用帶重疊率滑動(dòng)窗口切圖將超高分辨率的原始圖片分割為低分辨率的小圖片 (chip),縮小目標(biāo)在不同分辨率的圖片差異。
2)利用K-means 聚類算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分析以獲得最佳尺寸的錨框,有效提高模型的泛化能力和定位精度以及加快模型的收斂速度。
3)改進(jìn)網(wǎng)絡(luò)模型,采用雙向特征金字塔網(wǎng)絡(luò)(bidirectional feature pyramid network,BiFPN)替換原YOLOv5的特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PAN)結(jié)構(gòu),以實(shí)現(xiàn)更加自由的信息交換和特征融合。
4)引入SimAM注意力模塊使網(wǎng)絡(luò)更加關(guān)注待檢測(cè)的目標(biāo),來(lái)解決復(fù)雜背景對(duì)缺陷識(shí)別精度的影響。
為了保留圖像細(xì)節(jié),無(wú)人機(jī)圖片為高分辨率圖片。本文采用帶重疊率的滑動(dòng)窗口切圖方法,為了避免2張小圖之間的一些目標(biāo)正好被分割截?cái)?在2張小圖之間設(shè)置重疊區(qū)域。
本文利用K-means聚類算法確定先驗(yàn)框。由于目標(biāo)檢測(cè)只關(guān)心先驗(yàn)框與候選框(box)的交并比,使用IoU作為度量更加合適。通過(guò)K-means聚類之后可以得到關(guān)于本論文數(shù)據(jù)集的9個(gè)先驗(yàn)框,部分如下:(53,54),(88,146),(176,128),(418,290)。
YOLOv5版本中YOLOv5x模型采用FPN和PAN結(jié)構(gòu),只考慮了FPN輸出的特征信息,并沒(méi)有考慮原始的特征信息,造成在特征融合階段存在特征信息丟失。采用BiFPN[7],即自下而上和自上而下的信息交換,實(shí)現(xiàn)更加自由的信息交換和特征融合。此外,BiFPN可在不同尺度上有效的聚合特征信息,從而進(jìn)一步地提升目標(biāo)檢測(cè)的性能。
SimAM[8]是一個(gè)簡(jiǎn)單、無(wú)需參數(shù)的注意力模塊,可推斷特征圖的三維注意力權(quán)重,為了能夠成功地實(shí)現(xiàn)注意力,需要估計(jì)單個(gè)神經(jīng)元的重要性。重要性越高的神經(jīng)元在視覺(jué)處理中應(yīng)被賦予更高的優(yōu)先級(jí),通過(guò)測(cè)量1個(gè)目標(biāo)神經(jīng)元和其他神經(jīng)元之間的線性可分離性來(lái)尋找重要性高的神經(jīng)元。
本文所用的數(shù)據(jù)集來(lái)自國(guó)網(wǎng)懷化分公司,采用LabelImg目標(biāo)檢測(cè)標(biāo)注工具對(duì)圖片進(jìn)行標(biāo)注,并將絕緣子自爆標(biāo)注為missinsulator,R銷缺失標(biāo)注為cotter,鳥窩標(biāo)注為nest。本文采用帶重疊率滑動(dòng)窗口切圖,得到640×640分辨率的圖片。
為了說(shuō)明帶重疊率滑動(dòng)窗口切圖在處理高分辨率的有效性,本文分別在原始數(shù)據(jù)集(高分辨率圖片)和chip圖片數(shù)據(jù)集(低分辨率圖片)上進(jìn)行訓(xùn)練。
試驗(yàn)分別對(duì)高分辨率和低分辨率圖片進(jìn)行對(duì)比說(shuō)明。
首先在原始高分率圖片數(shù)據(jù)集上進(jìn)行對(duì)比試驗(yàn)。本文提出的Improved YOLOv5x方法相比于原YOLOv5x算法在單個(gè)類別下和全部類別下均取得較好的性能。在單個(gè)類別下除了絕緣子自爆其余的檢測(cè)指標(biāo)效果均有所提升,尤其是R銷丟失檢測(cè)效果提升明顯;在全部類別下,Recall提高了3.8%、mAP@0.5提高了2.8%,以及mAP@0.5:0.95提高了4.2%。絕緣子自爆(missinsulator)檢測(cè)方面,Improved YOLOv5x方法稍微落后原YOLOv5x算法,可能是引入過(guò)多參數(shù)導(dǎo)致模型復(fù)雜度增加,從而出現(xiàn)過(guò)擬合的現(xiàn)象。
在分辨率為640×640的圖片數(shù)據(jù)集上進(jìn)行對(duì)比試驗(yàn),發(fā)現(xiàn)相比原YOLOv5x算法,Improved YOLOv5x算法無(wú)論在單個(gè)類別還是全部類別下均取得了較好的性能,且能夠避免一些錯(cuò)誤的檢測(cè)結(jié)果,如圖1所示。
(a)原YOLOv5x檢測(cè)結(jié)果 (b)Improved YOLOv5x檢測(cè)結(jié)果圖1 不同場(chǎng)景下檢測(cè)效果對(duì)比
圖2展示了原始高分辨率圖片和切圖預(yù)處理圖片輸入Improved YOLOv5x目標(biāo)檢測(cè)模型后的檢測(cè)效果,可以看出直接將原始超高分辨率圖片輸入檢測(cè)模型會(huì)導(dǎo)致較多目標(biāo)無(wú)法被正確檢測(cè)出來(lái),而采用帶重疊率的滑動(dòng)窗口切圖預(yù)處理后,可較好地改善這種情況,使大部分缺陷能夠被正確檢測(cè)出來(lái)。
圖2 原始高分辨率圖片和帶重疊率滑動(dòng)窗口切圖檢測(cè)效果對(duì)比
為驗(yàn)證不同注意力模塊對(duì)本文方法的影響。在同一位置上加入SE、CBAM、ECA、SimAM注意力機(jī)制的試驗(yàn)。試驗(yàn)結(jié)果表明,原YOLOv5x其Precision為91.1%,Recall為70.9,mAP@0.5為75%,mAP@0.5:0.95達(dá)到了59.6%,其加入SimAM注意力機(jī)制后效果最好,其Precision為95.2%,Recall為75.1,mAP@0.5達(dá)到了77.5%,mAP@0.5:0.95達(dá)到了61.7%。
本文提出了一種基于改進(jìn)YOLOv5的輸電線路缺陷檢測(cè)方法,旨在解決實(shí)際復(fù)雜環(huán)境導(dǎo)致絕緣子缺陷、R銷缺失已及鳥巢檢測(cè)精度低的問(wèn)題。首先,采用帶滑動(dòng)窗口切圖的方式將超高分辨率的原始圖片分割為低分辨率的小圖片,并利用K-means算法對(duì)數(shù)據(jù)進(jìn)行分析以獲得最佳尺寸的錨框;其次,采用BiFPN替換原先YOLOv5的特征金字塔網(wǎng)絡(luò),以實(shí)現(xiàn)更加自由的信息交換和特征融合;最后,在網(wǎng)絡(luò)中添加SimAM注意力模塊,使網(wǎng)絡(luò)更加關(guān)注待檢測(cè)的目標(biāo)。經(jīng)過(guò)以上操作,改進(jìn)后的YOLOv5算法mAP@0.5達(dá)到了77.5%,檢測(cè)效果明顯提升。未來(lái)應(yīng)進(jìn)一步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),以提高檢測(cè)準(zhǔn)確率和召回率,并降低漏檢率。