徐文校,張銀勝,2,王東平,黃文禮
(1. 南京信息工程大學(xué) 電子與信息工程學(xué)院,江蘇 南京 210044; 2. 無錫學(xué)院 電子與信息工程學(xué)院,江蘇 無錫 214105; 3. 中國人民解放軍特種電子裝備修造廠,安徽 合肥 230088; 4. 安徽南瑞繼遠(yuǎn)電網(wǎng)技術(shù)有限公司,安徽 合肥 230088)
電力系統(tǒng)涉及國計民生,對于社會的穩(wěn)定生產(chǎn)和人民群眾的正常生活具有重要意義[1]。我國領(lǐng)土廣闊無垠,作為電力系統(tǒng)的載體,輸電線路往往需要穿越山川河流、人煙稀少的地方,復(fù)雜的地理環(huán)境加大了輸電線路部件損壞的可能性。工程中,為在第一時間對損壞處進(jìn)行干預(yù),常采用定期巡檢的方式對輸電線路進(jìn)行維護(hù),以此來保證電力系統(tǒng)的穩(wěn)定運行。
傳統(tǒng)的巡檢方式是技術(shù)人員攜帶專業(yè)設(shè)備沿著輸電線路行走巡視,我國輸電線路總長度居世界第一,其部件損壞也存在極大的不確定性,因此人工巡檢的方式有著目的性弱、耗時長、成本高以及安全隱患大等缺點。隨著硬件技術(shù)的發(fā)展,無人機(jī)設(shè)備開始應(yīng)用于輸電線路巡檢中,操控人員通過無人機(jī)對輸電線路部位進(jìn)行拍攝,并將圖像數(shù)據(jù)傳輸至后臺,由審核人員進(jìn)行分析,這種巡檢方法雖然能夠避免資源浪費與安全隱患,但是對大批量的圖像進(jìn)行肉眼審查,會存在嚴(yán)重的漏檢、錯檢,同時巡查的結(jié)果也會隨著審核人員主觀意向的改變而改變。
為解決輸電線路巡檢過程中的低效率問題,許多研究學(xué)者考慮將計算機(jī)視覺技術(shù)遷移到輸電線路巡檢中,通過相關(guān)圖像處理算法對無人機(jī)拍攝的高清圖像進(jìn)行分析,Liao等[2]提出了一種基于機(jī)器學(xué)習(xí)的絕緣子檢測方法,采用多尺度的描述子獲得局部特征,通過匹配原則檢測出絕緣子。吳華等[3]通過改進(jìn)密度空間聚類算法,大幅度改善了圖像中目標(biāo)邊界部分被當(dāng)作背景處理的情況,提高了巡檢圖像的目標(biāo)分割精度。張桂南等[4]對待測圖像進(jìn)行Harris角點檢測和模糊聚類等,得到絕緣子邊緣輪廓,然后利用譜聚類實現(xiàn)絕緣子的破損檢測。以上幾種輸電線路器件或缺陷的檢測方法都是基于傳統(tǒng)的圖像識別實現(xiàn),識別過程需要人工參與,即通過分析圖像,手動設(shè)計特征進(jìn)行提取,過程較繁瑣,同時這些方法大都是針對特定的環(huán)境進(jìn)行設(shè)計,魯棒性以及泛化能力等較弱。
近年來,深度學(xué)習(xí)的興起使得計算機(jī)視覺技術(shù)有了快速發(fā)展,作為計算機(jī)視覺領(lǐng)域的重要分支,目標(biāo)檢測技術(shù)在許多工程項目中落地應(yīng)用,如混泥土裂縫檢測[5]、路面破損檢測[6]和可見光船艦檢測[7]等。基于深度學(xué)習(xí)的目標(biāo)檢測方法,采取端到端的訓(xùn)練方式,能夠自適應(yīng)提取特征,魯棒性更好。目前,大多數(shù)先進(jìn)的目標(biāo)檢測算法按照是否預(yù)先產(chǎn)生感興趣區(qū)域被劃分為單階段目標(biāo)檢測算法和雙階段目標(biāo)檢測算法。單階段目標(biāo)檢測算法檢測速度快,能夠做到實時檢測,主要以YOLO系列(v1~v5)[8-12]為代表,除此之外SSD[13]和FSSD[14]等也在諸多領(lǐng)域中廣泛應(yīng)用;雙階段目標(biāo)檢測算法以Fast-RCNN[15]和Faster-RCNN[16]為主,檢測精度相對較高。得益于這些算法的優(yōu)秀表現(xiàn),許多研究者已經(jīng)將目標(biāo)檢測技術(shù)與輸電線路巡檢相結(jié)合,通過相關(guān)算法對無人機(jī)拍攝到的高清圖像進(jìn)行智能分析,其中絕緣子類的目標(biāo)及缺陷被國內(nèi)外學(xué)者研究較多。Zhang等[17]將絕緣子的檢測劃分為2段,即先通過YOLOv5算法檢測出絕緣子,然后將檢測到的絕緣子進(jìn)行切割并送入由VGG16和SPP組成的級聯(lián)網(wǎng)絡(luò)中進(jìn)行最終的缺陷檢測,2段式的檢測方法能夠有效提升精度,但是檢測速度較慢。Li等[18]將Faster-RCNN與RPN網(wǎng)絡(luò)相結(jié)合,能夠識別小型的絕緣子自爆目標(biāo),邱靈華等以Faster-RCNN網(wǎng)絡(luò)為基礎(chǔ),并采用IOU閾值級聯(lián)結(jié)構(gòu),對絕緣子類缺陷進(jìn)行檢測,mAP值達(dá)到85.1%;Liu等[19]提出一種淺層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的特征信息重復(fù)利用及傳播的思想,并對YOLOv3算法進(jìn)行針對性改進(jìn),解決了不同背景下的絕緣子檢測問題。王凱等[20]提出了一種GC-SPP-YOLOv3算法,對于絕緣子類缺陷的識別率為89.8%。冉奇[21]基于Faster-RCNN算法,增加錨框類型進(jìn)行改進(jìn),改進(jìn)后的算法對絕緣子的識別率達(dá)到84.97%。Zhang等[22]為減少模型參數(shù),提高運算速度,對YOLOv3模型進(jìn)行精細(xì)化裁剪,裁剪后的模型推理速度雖得到較大提升,但識別率也有一定程度的下降。還有一部分學(xué)者對輸電線路中其他部件及缺陷的檢測進(jìn)行了研究,湯踴等[23]基于神經(jīng)網(wǎng)絡(luò),對常見的均壓環(huán)的檢測進(jìn)行研究,但效果不佳。戚銀城等[24]在Faster-RCNN的基礎(chǔ)上嵌入了注意力機(jī)制,對于螺栓類缺陷的識別,mAP值為82.05%。邱志斌等[25]建立YOLOv4網(wǎng)絡(luò)模型,并引入數(shù)據(jù)增強等策略,對電網(wǎng)涉及的20類鳥的識別精度達(dá)到92.2%。少部分學(xué)者對多類部件或缺陷的檢測展開了研究,楊罡等[26]使用深度可分離卷積與多尺度特征融合方法實現(xiàn)了對絕緣子、懸垂線夾和防震錘3類部件的識別,mAP值達(dá)到86%。戚銀城等[27]基于SSD模型,通過數(shù)據(jù)增強,改進(jìn)IOU等優(yōu)化方法,在均壓環(huán)、重錘等目標(biāo)上的平均識別率達(dá)到75.64%。Li等[28]在全卷積網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,加入可變形卷積等組件,對絕緣子、防震錘、均壓環(huán)與懸垂線夾4類對象的缺陷進(jìn)行檢測,識別精度達(dá)到83.3%。Zhao等[29]提出了一種特征融合的網(wǎng)絡(luò)結(jié)構(gòu),對絕緣子、防震錘、懸垂線夾、鳥巢、絕緣子自爆等6類對象進(jìn)行檢測,其識別精度為83%。
上述基于深度學(xué)習(xí)的檢測方法大都只針對少量類別進(jìn)行檢測,但當(dāng)前復(fù)雜的電力場景下存在多類待檢測目標(biāo),少數(shù)對多類別目標(biāo)的檢測方法符合當(dāng)前巡檢場景的復(fù)雜要求,但檢測精度較低。值得注意的是,2019—2021年間國家電網(wǎng)有限公司《架空輸電線路無人機(jī)智能巡檢作業(yè)體系建設(shè)三年工作計劃》中穩(wěn)步推進(jìn)與“十四五”規(guī)劃對堅強局部電網(wǎng)建設(shè)的要求,對當(dāng)前輸變電線路關(guān)鍵部件識別精度有了更高的要求。因此,本文基于目標(biāo)檢測模型最新發(fā)展方向,開展輸變電線路關(guān)鍵部件識別及缺陷檢測研究,解決關(guān)鍵部件及缺陷檢測精度上限不佳的問題。
輸電線路關(guān)鍵部件及缺陷的檢測是通過相關(guān)算法針對無人機(jī)巡檢的圖像進(jìn)行檢測,主要存在以下難點:① 輸電線路待檢測目標(biāo)本身就存在多尺度特性,無人機(jī)巡檢時,從不同的角度拍攝樣本不僅會導(dǎo)致目標(biāo)的局部特征消失,還會進(jìn)一步放大目標(biāo)間的尺度差異;② 目標(biāo)的類別較多,對于均壓環(huán)移位等,其目標(biāo)的定義是該部件的空間位置發(fā)生變化,器件本身并不存在缺陷,無人機(jī)拍攝角度的不同會加大這一類型目標(biāo)的檢測難度,而且多種目標(biāo)之間也存在一定的相似度特性;③ 目標(biāo)成像背景復(fù)雜,輸電線路往往需要穿越山川、河流等地理環(huán)境復(fù)雜的地方,復(fù)雜的地理環(huán)境使得待檢測目標(biāo)在圖像中的占比非常小,同時光照、霧氣、拍攝質(zhì)量等客觀條件也要求算法模型具有較強的泛化能力。針對輸電線路檢測中存在的難點,選擇YOLOX算法模型[30]為基準(zhǔn)模型,其具有的無先驗框策略能夠一定程度上解決目標(biāo)多尺度等問題,同時YOLOX是YOLO系列算法模型中的最新產(chǎn)品,相比于雙階段算法模型,YOLOX能夠做到實時檢測。
YOLO系列算法屬于單階段目標(biāo)檢測算法,單階段目標(biāo)檢測算法不產(chǎn)生候選區(qū)域,直接產(chǎn)生物體的類別概率和位置坐標(biāo)值,經(jīng)過一次檢測即可得到最終結(jié)果,檢測速度快,在檢測精度方面相比兩階段檢測算法,并不會下降太多。YOLOX算法模型是YOLO目標(biāo)檢測算法模型系列中的最新產(chǎn)品,旨在優(yōu)化基于YOLOv3的實時目標(biāo)檢測的速度和精度。YOLOX算法模型沿用了YOLO系列的總體布局,由輸入、主干特征提取網(wǎng)絡(luò)、頸部和頭部4個部分組成,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 YOLOX網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 YOLOX network structure
在圖像進(jìn)入主干特征提取網(wǎng)絡(luò)前,YOLOX算法模型采用了YOLOv5中同樣的Focus模塊,具體操作類似于鄰近下采樣,有利于后續(xù)的特征提取。CSP-Darknet[31]作為YOLOX主干網(wǎng)絡(luò)的特征提取網(wǎng)絡(luò),其主要作用是提取圖像特征并輸出相應(yīng)特征圖,主要包含CBS和SSP兩種操作。CBS由3部分組成:卷積、批歸一化和激活函數(shù);SSP實現(xiàn)了局部特征和全局特征的融合,擴(kuò)大了感受野。YOLOX中的頸部結(jié)構(gòu)主要目的是加強特征融合,進(jìn)一步豐富特征圖的表達(dá)能力。
YOLOX算法在延續(xù)YOLO系列算法的經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)的同時,也做出了一些改進(jìn),如通過Mosic數(shù)據(jù)增強和Mixup數(shù)據(jù)增強,降低圖像中噪聲給算法帶來的負(fù)面影響,提升模型的魯棒性;又如采用不生成先驗框策略,擺脫了使用先驗框時帶來的巨大計算量,推進(jìn)目標(biāo)檢測進(jìn)一步走向高效率;再如YOLOX算法使用解隅頭代替了之前YOLO系列算法中的頭部,解隅頭對經(jīng)頸部處理后的特征圖,通過先使用1×1的卷積層將通道數(shù)降至256減少參數(shù)量,使用2個并行分支分別用于處理分類問題和定位問題,這一操作解決了分類、回歸2種任務(wù)關(guān)注的特征圖層數(shù)重心不統(tǒng)一的問題,同時提高了檢測精度和速度。
(1)區(qū)域特征融合
淺層神經(jīng)網(wǎng)絡(luò)主要提取目標(biāo)的邊緣等細(xì)節(jié)信息,當(dāng)神經(jīng)網(wǎng)絡(luò)的層數(shù)加深時,感受野會變大,所提取特征中包含的細(xì)節(jié)信息會不斷丟失,不利于小目標(biāo)的檢測。
考慮到輸電線路檢測中,一些類別目標(biāo)的像素空間占比小,同時類別間待檢測目標(biāo)存在較大的尺度差異,因此決定在YOLOX的頸部通過特征圖相加的形式進(jìn)一步特征融合。這種融合方式會增加每一維度的信息量,以豐富特征圖包含的信息,提高特征圖的表達(dá)能力,有利于算法模型解決目標(biāo)多尺度的難點,而且不會增加特征的個數(shù)(即通道數(shù)),大幅度減少了計算量,融合后的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 特征融合后的網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Network structure after feature fusion
(2)新增位置注意力機(jī)制
針對輸電線路檢測中目標(biāo)成像背景復(fù)雜等特點,為進(jìn)一步提高檢測精度,提出新增一種注意力模塊,由于檢測效率的限制,現(xiàn)有的注意力模塊中使用最為廣泛的是SE-Net模塊(通道注意力機(jī)制)[32]。SE-Net機(jī)制利用通道信息采用全局池化的方式對特征圖進(jìn)行編碼,全局池化的方式雖能以相當(dāng)?shù)偷挠嬎愠杀居行嵘P托阅埽呛雎粤四繕?biāo)的位置信息,不利于回歸任務(wù)的展開。后續(xù)的注意力機(jī)制,如CBAM模塊(卷積注意力機(jī)制)[33],通過卷積引入了空間注意力機(jī)制,以此獲得位置信息,但是卷積操作相比于全局池化,捕獲的位置特征有一定的局限性。
對此,提出新增一種CA模塊(位置注意力機(jī)制),該模塊能夠?qū)⑽恢眯畔⑷谌胪ǖ捞卣髦?,使得神?jīng)網(wǎng)絡(luò)能夠在更大的區(qū)域上進(jìn)行注意力調(diào)節(jié),有利于更精準(zhǔn)定位敏感區(qū)域。
CA注意力機(jī)制如圖3所示。
圖3 CA注意力機(jī)制Fig.3 CA attention mechanism
首先將通道注意力分解為2個一維特征編碼過程,具體操作為使用2個大小為(H,1)和(1,W)的池化核對特征圖XC,H,W的每個通道進(jìn)行編碼,這樣做的好處是能夠沿2個空間方向分別聚合特征,有助于算法更加精準(zhǔn)定位目標(biāo)區(qū)域,更好地解決復(fù)雜背景下的目標(biāo)定位問題,編碼后寬度為w的第c通道的輸出和高度為h的第c通道的輸出如下:
(1)
(2)
經(jīng)上式變換后,會生成Zh和Zw兩個特征圖,然后對編碼后的特征圖進(jìn)行通道拼接操作,并通過1×1卷積進(jìn)行降維(本文維度降至c/16)并激活,生成中間層特征映射f:
f=δ(F(Concat(Zh,Zw))),
(3)
式中,Concat表示通道拼接;F表示卷積;δ表示非線性激活。
緊接著對中間特征圖f沿著2個空間方向分離成fh和fw,并通過1×1卷積將分離后張量的通道維度調(diào)整為c,生成特征向量gh和特征向量gw,具體過程如下:
gh=σ(Fh(fh)) ,
(4)
gw=σ(Fw(fw)) ,
(5)
式中,F(xiàn)h和Fw均為卷積操作;σ表示Sigmoid激活。最后對輸入的特征圖X進(jìn)行位置加權(quán)相乘,實現(xiàn)特征圖位置信息的聚合,最終的輸出如下:
(6)
添加注意力模塊后,網(wǎng)絡(luò)的參數(shù)量會有一定程度的增加,因此選擇在頸部層后加入CA模塊,經(jīng)CA注意力機(jī)制處理后的特征圖,再送入頭部層中進(jìn)行分類回歸。
(3)損失值分類處理
YOLOX中損失函數(shù)分為置信度損失、分類損失和回歸損失,為進(jìn)行回歸損失計算的可視化分析,假設(shè)預(yù)測框和真實框的分布情況如圖4所示,對其進(jìn)行回歸損失計算,結(jié)果如圖5所示,圖中橫坐標(biāo)為dx(單位為1),縱坐標(biāo)為回歸損失(單位為1)。由圖5可知,當(dāng)dx稍大時,也就是回歸效果比較差時,通過回歸損失函數(shù)公式-lb(iou)計算得到的損失值大于使用損失函數(shù)1-iouk(k=1,2,3)所得到的損失值,進(jìn)一步可理解為-lb(iou)針對檢測框的位置距目標(biāo)位置較遠(yuǎn)時,也就是對于那些回歸效果比較差的檢測框能夠給予更大的損失值,這有利于模型更好地學(xué)習(xí)那些回歸效果不好的樣本;而dx較小時,即預(yù)測框與真實框接近于重合時,1-iouk(k=2,3)計算得到的損失值要大于-lb(iou)計算得到的損失值,這有利于回歸效果較好的檢測框的進(jìn)一步優(yōu)化。需要說明的是,回歸效果較好的檢測框的損失值和回歸效果較差的檢測框的損失值之間存在一定大小的差距,這使得神經(jīng)網(wǎng)絡(luò)的關(guān)注重點并不會從回歸效果較差的檢測框轉(zhuǎn)移到較好的檢測框上。
圖4 真實框、預(yù)測框分布情況Fig.4 Distribution of real box and prediction box
圖5 各函數(shù)回歸損失Fig.5 Each function regression loss
對此,本文考慮利用分段函數(shù)的思想,提出一種新的回歸任務(wù)損失函數(shù)計算公式,能夠加大對回歸效果不好的檢測框的懲罰力度,提升其回歸精度,同時能夠進(jìn)一步優(yōu)化那些檢測效果較好的預(yù)測框,使其更加貼合真實標(biāo)注框:
(7)
將分段函數(shù)的自變量轉(zhuǎn)移到iou上,得到的回歸損失函數(shù)如下:
(8)
對于上式中的k,基于經(jīng)驗將其取值為2,在確定2段具體的函數(shù)表達(dá)式之后,式中b的取值通過尋找函數(shù)之間的交點并取近似值來確定,最終的結(jié)果為0.707 11,因此最終的回歸任務(wù)損失函數(shù)與iou之間的關(guān)系如圖6所示(橫縱坐標(biāo)單位均為1)。
圖6 本文算法回歸損失Fig.6 Regression loss of proposed algorithm
其具體表達(dá)式如下:
(9)
精確率、召回率是神經(jīng)網(wǎng)絡(luò)模型的2個經(jīng)典評價指標(biāo),其計算如下:
(10)
(11)
式中,TP為正確預(yù)測為正樣本的個數(shù);FP為錯誤預(yù)測為正樣本的個數(shù);FN為錯誤預(yù)測為負(fù)樣本的個數(shù)。通過上述公式可以進(jìn)一步理解精確率為預(yù)測正樣本中,實際為正樣本的概率,召回率為實際為正樣本中,預(yù)測為正樣本的概率,因此精度高低代表的是網(wǎng)絡(luò)模型預(yù)測能力的好壞,而召回率決定著模型是否能找出全部的正樣本。在目標(biāo)檢測任務(wù)中常用AP(Average Precision)和mAP(mean Average Precision)當(dāng)作精度指標(biāo)。AP是不同精確率和召回率所圍成曲線的面積,一般情況下,AP值越高,分類器的性能越好;mAP是所有類別AP的均值,計算方法如下:
(12)
(13)
式中,n為目標(biāo)的類別數(shù)。在本文中,設(shè)定的檢測閾值即iou為0.5,當(dāng)檢測框與真實框的重疊區(qū)域超過50%時,就認(rèn)為該檢測框正確。
本文對輸電線路的關(guān)鍵部件及缺陷進(jìn)行研究,主要檢測目標(biāo)為絕緣子、絕緣子灼傷、絕緣子破損、均壓環(huán)、均壓環(huán)移位以及防震錘。
本研究在Windows 10系統(tǒng)中采用Pytorch深度學(xué)習(xí)框架搭建網(wǎng)絡(luò),Python版本:3.7.10;CPU:Inter(R)Core(TM)i7-11700K@3.60@Hz;GPU:NVIDIA GeForce RTX 3070,同時實驗設(shè)置的輸入圖片尺寸為640 pixel×640 pixel,整個訓(xùn)練過程為250輪,采用SGD優(yōu)化算法對網(wǎng)絡(luò)模型的權(quán)值進(jìn)行更新優(yōu)化,權(quán)重衰減系數(shù)為5×e-5。
為驗證所提優(yōu)化YOLOX算法的檢測效果,本文設(shè)置了YOLOX,YOLOX_A(區(qū)域特征融合),YOLOX_B(區(qū)域特征融合+CA模塊),YOLOX_C(區(qū)域特征融合+CA模塊+優(yōu)化損失函數(shù))之間的多組消融實驗,取每種算法模型的最好訓(xùn)練權(quán)重進(jìn)行測試,結(jié)果如表1所示。
表1 消融實驗結(jié)果Tab.1 Ablation experiment results 單位:%
YOLOX_A相比于YOLOX,從87.07%提升至89%,mAP YOLOX_B在YOLOX_A的基礎(chǔ)上,添加CA模塊,mAP提升至89.99%,而YOLOX_C同時采用3種策略,mAP高達(dá)90.71%,從YOLOX到Y(jié)OLOX_C,每種算法模型的mAP均有提高,證明本文所述優(yōu)化方法的合理性。
YOLOX_B算法中,采用了添加CA注意力機(jī)制的策略,CA模塊相比于SE-Net,能夠?qū)⒖臻g信息融入通道中,有利于更加精準(zhǔn)地定位感興趣區(qū)域,而CBAM模塊中采用通道注意力機(jī)制和空間注意力機(jī)制相融合的方法來獲得位置信息,但是該空間注意力機(jī)制捕獲的位置特征不夠全局化,為了驗證所述內(nèi)容的準(zhǔn)確性,在YOLOX_A算法中分別添加SE-Net,CBAM以及CA模塊(YOLOX_C),并在測試數(shù)據(jù)集上進(jìn)行測試,結(jié)果如表2所示,mAP最高為添加CA模塊的YOLOX_A,證明所述方法的有效性。
表2 不同注意力機(jī)制檢測結(jié)果Tab.2 Detection results of different attentation mechanism 單位:%
本文將改進(jìn)的方法與原YOLOX算法進(jìn)行對比的同時,也與現(xiàn)階段主流的基于深度學(xué)習(xí)的目標(biāo)檢測算法進(jìn)行了mAP比較,同時考慮到工業(yè)中的輸電線路部件及缺陷檢測不僅僅需要高精度,而且需要快速度,因此本文在檢測速度方面也與現(xiàn)階段的主流檢測算法針對檢測每一張圖片所耗用的時間進(jìn)行了對比,結(jié)果如表3所示。
表3 不同算法檢測結(jié)果Tab.3 Detection results of different algorithms
在一系列優(yōu)秀目標(biāo)檢測算法中,本文所提算法在精度上表現(xiàn)最為優(yōu)異,mAP達(dá)到90.71%,在檢測速度方面,表現(xiàn)最為優(yōu)異的YOLOv5算法檢測單張圖像僅需10.37 ms。本文所提算法,在網(wǎng)絡(luò)結(jié)構(gòu)上進(jìn)行了針對性的改進(jìn),算法模型更加復(fù)雜,難免會犧牲時間成本,但是檢測單張圖像也僅僅消耗13.42 ms,遠(yuǎn)快于實時目標(biāo)檢測中所要求的33 ms指標(biāo)。
為更加直觀了解各算法模型的識別能力,對其檢測結(jié)果進(jìn)行可視化,如圖7所示。
圖7 不同算法可視化結(jié)果Fig.7 Visualization results of different algorithms
從可視化結(jié)果可以看出,本文所提算法相比于優(yōu)化之前的YOLOX算法,對密集小目標(biāo)的檢測效果更好,其余算法中,YOLOX和YOLOv5均有著不同程度的漏檢,YOLOv4和YOLOv3算法,檢測效果較差,而屬于兩階段的Faster-RCNN算法,漏檢現(xiàn)象雖較少,但存在錯檢,同一物體在相同情況下被多次檢測。
對于輸電線路的檢測,可能面臨著許多客觀條件干擾,比如攝像頭抖動導(dǎo)致的圖像模糊、光線過強導(dǎo)致圖像曝光度過高,因此本文將這些客觀因素考慮在內(nèi),檢測伴有干擾因素的圖像并可視化,驗證算法的泛化能力。曝光嚴(yán)重狀態(tài)和圖像模糊狀態(tài)下的檢測結(jié)果如圖8和圖9所示。
圖8 曝光嚴(yán)重狀態(tài)下檢測結(jié)果Fig.8 Detection results under severe exposure
圖9 圖像模糊狀態(tài)下檢測結(jié)果Fig.9 Detection results of fuzzy image
由圖8和圖9可以看出,在曝光嚴(yán)重以及圖像模糊的客觀因素干擾下,對于目標(biāo)的檢測,本文所提算法具有穩(wěn)定的表現(xiàn),而其余算法均有著不同程度的漏檢及錯檢,比如YOLOX在曝光嚴(yán)重狀態(tài)下,將均壓環(huán)移位誤檢成均壓環(huán),在圖像模糊狀態(tài)下,存在絕緣子損傷的漏檢。
輸電線路中部件及其缺陷的檢測也面臨著不同環(huán)境的干擾,比如大霧天氣以及傍晚光線欠佳等,考慮到這些,本文對霧天、傍晚光線不良以及正常環(huán)境下的圖像樣本進(jìn)行檢測,其可視化結(jié)果如圖10~圖12所示。
圖10 霧天干擾狀態(tài)下檢測結(jié)果Fig.10 Detection results in foggy interference
圖11 光線不良狀態(tài)下檢測結(jié)果Fig.11 Detection results in poor light condition
圖12 正常狀態(tài)下檢測結(jié)果Fig.12 Detection results in normal
由圖10~圖12可以看出,本文所提算法在不同環(huán)境下均展現(xiàn)出了優(yōu)秀的識別能力,而其他算法識別表現(xiàn)欠佳,如YOLOX在3種環(huán)境下均出現(xiàn)了漏檢或錯檢,YOLOv5在光線不良狀態(tài)下對于較小目標(biāo)存在嚴(yán)重的漏檢。
在同一環(huán)境下,神經(jīng)網(wǎng)絡(luò)對不同類別目標(biāo)的檢測效果也能很好地體現(xiàn)模型的性能,不同算法在同一環(huán)境下的各缺陷識別效果如圖13所示??梢钥闯?,所提算法對于不同的目標(biāo)都能夠起到較優(yōu)秀的識別效果,而YOLOX算法漏檢了防震錘這一目標(biāo),YOLOv5和Faster-RCNN等均出現(xiàn)了不同程度的錯檢。
圖13 同一環(huán)境下不同缺陷的檢測結(jié)果Fig.13 Detection results of different defects in the same environment
為了進(jìn)一步驗證算法的泛化能力,將本文所述算法對收集到的來自另一地區(qū)的輸電線路目標(biāo)進(jìn)行檢測,其可視化結(jié)果如圖14所示。
圖14 另一地區(qū)目標(biāo)的識別情況Fig.14 Identification of targets in other area
由圖14可以看出,所提算法的表現(xiàn)依然優(yōu)秀,沒有出現(xiàn)任何的漏錯檢情況,YOLOv4表現(xiàn)最差,沒有檢測出任何目標(biāo),其余算法均漏檢了防震錘這一目標(biāo),同時Faster-RCNN對于較密集目標(biāo)的檢測效果較差,同一目標(biāo)被多次檢測的情況較嚴(yán)重,再次證明了本文所述算法具有很好的泛化能力。
針對輸電線路關(guān)鍵部位及其缺陷開展目標(biāo)檢測,本文以最新的算法模型YOLOX為基準(zhǔn),通過區(qū)域特征融合,以增強特征圖的表達(dá)能力;添加CA模塊,以提高感興趣對象的定位準(zhǔn)度;分類處理回歸損失,以加大樣本的損失占比,優(yōu)化后YOLOX算法的mAP相比于基準(zhǔn)算法,提升了3.64%,證明了本文所提算法的有效性。針對復(fù)雜環(huán)境下的目標(biāo),優(yōu)化后的算法也展現(xiàn)出了優(yōu)秀的性能,證明了所提算法具有一定的泛化能力。
本文對于輸電線路關(guān)鍵部位及其缺陷檢測的mAP,雖然能夠達(dá)到90.71%,但是均壓環(huán)移位程度的不明顯加上無人機(jī)拍攝目標(biāo)圖像時的角度存在差異,使得均壓環(huán)和均壓環(huán)移位2類目標(biāo)的AP依舊不高,同時,所提算法檢測單張圖像需要耗時13.42 ms,而檢測速度最快的YOLOv5算法僅需10.37 ms,二者雖然均能達(dá)到實時檢測,但還是存在一定差距。因此,下一階段主要針對這2個方面進(jìn)行優(yōu)化。