李 磊,李英娜,2*,趙振剛,2
(1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500;2.云南省計(jì)算機(jī)技術(shù)運(yùn)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)
絕緣子廣泛應(yīng)用于智能電網(wǎng)系統(tǒng)中,在電氣隔離和固定導(dǎo)線方面具有非常重要的作用。由于絕緣子長(zhǎng)期處于高山、平原等相對(duì)惡劣的環(huán)境中,會(huì)受到雨雪、雷電、溫差等自然災(zāi)害的影響,因此,對(duì)輸電線路中的絕緣子進(jìn)行定期巡檢尤為重要[1]。
隨著科技的發(fā)展,廣大科研工作者將無(wú)人機(jī)技術(shù)引入圖像處理領(lǐng)域。通過(guò)使用無(wú)人機(jī),能夠及時(shí)獲得清晰的絕緣子圖片信息,利用目標(biāo)檢測(cè)方式提取圖中的絕緣子,從而進(jìn)行故障檢查、連接判斷等后續(xù)研究工作[2]。
目前傳統(tǒng)目標(biāo)檢測(cè)算法主要包括Two-stage(Fast-RCNN[3]、Faster-RCNN[4])和One-stage(YOLO系列[5-7])兩類目標(biāo)檢測(cè)算法。其中,YOLOv4[8]算法由于融合了其他算法的優(yōu)點(diǎn),在檢測(cè)準(zhǔn)確率和檢測(cè)速度上具有較高水平。劉悅等人[9]使用基于YOLOv4 和改進(jìn)分水嶺算法對(duì)絕緣子檢測(cè),解決了絕緣子在明暗交替區(qū)域背景難識(shí)別的問題;唐小煜等人[10]使用優(yōu)化的U-net 模型對(duì)絕緣子串語(yǔ)義分割,之后利用YOLOv4 網(wǎng)絡(luò)進(jìn)行定位,提高了絕緣子定位速度和準(zhǔn)確度;律方成等人[11]改進(jìn)了Mosaic數(shù)據(jù)擴(kuò)充算法,優(yōu)化YOLOv4 網(wǎng)絡(luò)參數(shù),降低了模型訓(xùn)練時(shí)的誤差。然而,以上各位學(xué)者關(guān)于理論算法的改進(jìn)和數(shù)據(jù)集的選取均針對(duì)大型絕緣子的檢測(cè),忽視了圖內(nèi)中小型絕緣子漏檢的情況。
中小目標(biāo)檢測(cè)近來(lái)成為研究熱點(diǎn),主要包括網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)和注意力機(jī)制的引入。黃繼鵬等人[12]通過(guò)修改Faster-RCNN 網(wǎng)絡(luò)結(jié)構(gòu),提高了利用低層特征為主要檢測(cè)依據(jù)的小目標(biāo)檢測(cè)的精度;梁延禹等人[13]引入密集連接結(jié)構(gòu),增強(qiáng)淺層中小目標(biāo)的上下文語(yǔ)義特征;張馨月等人[14]在SSD 算法上引入自注意力機(jī)制增強(qiáng)特征圖中關(guān)鍵信息權(quán)重,緩和特征圖的混疊效應(yīng)和位置偏移。這類改進(jìn)算法雖提高了小目標(biāo)檢測(cè)的準(zhǔn)確率,但是忽略了錯(cuò)誤檢測(cè)結(jié)果對(duì)網(wǎng)絡(luò)性能的影響。
中小型絕緣子相較完整絕緣子圖像會(huì)丟失更多的特征信息,導(dǎo)致模型預(yù)測(cè)時(shí)容易出現(xiàn)誤判現(xiàn)象。因此,本文提出改進(jìn)的YOLOv4 中小型絕緣子檢測(cè)算法,解決中小型絕緣子容易錯(cuò)檢、漏檢的問題。該改進(jìn)算法具備以下特點(diǎn):
(1)在特征提取網(wǎng)絡(luò)中引入SE 注意力機(jī)制改進(jìn)CSP 結(jié)構(gòu),使其能獲得更豐富的絕緣子中小特征信息;
(2)在特征融合網(wǎng)絡(luò)中增加一層特征融合層,提高小型絕緣子檢測(cè)能力;
(3)使用改進(jìn)k-means++方法對(duì)中小型絕緣子的標(biāo)注框重新聚類先驗(yàn)框以加快模型收斂速度,更適用于本文數(shù)據(jù)集特征;
(4)充分利用預(yù)測(cè)結(jié)果信息,引入負(fù)例挖掘模塊重新訓(xùn)練模型,以達(dá)到削弱復(fù)雜背景的干擾、提高模型檢測(cè)準(zhǔn)確度、增強(qiáng)模型性能的目的。
相比YOLOv3 目標(biāo)檢測(cè)算法,YOLOv4 算法在檢測(cè)精度和速度上都有提升,其網(wǎng)絡(luò)結(jié)構(gòu)主要由以下4 個(gè)部分構(gòu)成。
(1)CSPDarknet53 網(wǎng) 絡(luò)。CSPDarknet53 為 主干特征提取網(wǎng)絡(luò),由一個(gè)CBM 下采樣和多個(gè)CSP殘差結(jié)構(gòu)堆疊構(gòu)成,一方面提高了特征提取的能力,保留更多的特征信息;另一方面減少了計(jì)算量,提高了效率。CBM 卷積塊包括Conv 卷積網(wǎng)絡(luò)、BN標(biāo)準(zhǔn)化和Mish 激活函數(shù),結(jié)構(gòu)如圖1 所示。CSP塊由殘差塊、CBM 卷積塊和大殘差邊組成,如圖2所示。
圖1 CBM 結(jié)構(gòu)圖
圖2 CSP 結(jié)構(gòu)圖
Mish 激活函數(shù)的表達(dá)式為:
(2)SPP 結(jié)構(gòu)。SPP 模塊在進(jìn)行最大池化處理時(shí)采用13×13、9×9、5×5、1×1 四個(gè)不同大小的核,能夠有效增大感受野,將上下文特征分離出來(lái)。
(3)PANet 網(wǎng)絡(luò)。PANet 網(wǎng)絡(luò)具有反復(fù)提取特征的特點(diǎn),使用上采樣的方式對(duì)得到的特征層進(jìn)行融合,有效利用了各層的特征信息,提高了檢測(cè)精度。
(4)YOLO 頭部網(wǎng)絡(luò),進(jìn)行最后的預(yù)測(cè)輸出工作。
1.2.1 IoU 損失函數(shù)
IoU 損失函數(shù)[15]能夠用來(lái)確定正負(fù)樣本,評(píng)價(jià)目標(biāo)輸出框與標(biāo)注框之間的距離,并且具有尺度不變性,但是存在以下兩個(gè)問題:第一,如果兩個(gè)框沒有相交,則不能反映兩者的距離大小從而產(chǎn)生梯度消失的問題;第二,存在IoU值相等但是重合度不一樣的情況,從而導(dǎo)致無(wú)法篩選更優(yōu)回歸效果的目標(biāo)框。IoU損失函數(shù)的表達(dá)式為:
式中:A與B分別代表預(yù)測(cè)框和標(biāo)注框。
1.2.2 GIoU 損失函數(shù)
GIoU 損失函數(shù)[15]在IoU 損失的基礎(chǔ)上加入了懲罰項(xiàng),同時(shí)關(guān)注了重疊區(qū)域和非重疊區(qū)域,解決了IoU 損失在檢測(cè)非重疊輸出框時(shí)的梯度消失問題,但依然存在重合度問題。GIoU 損失函數(shù)的表達(dá)式為:
式中:Ac為預(yù)測(cè)框和標(biāo)注框的最小閉包區(qū)域的面積。
1.2.3 DIoU 損失函數(shù)
DIoU 損失函數(shù)[16]改進(jìn)了懲罰項(xiàng),比GIoU 更符合目標(biāo)框回歸機(jī)制,同時(shí)考慮了目標(biāo)框與標(biāo)注框之間的距離、重疊率及尺度,使得目標(biāo)框在回歸時(shí)能夠更穩(wěn)定、更迅速地收斂。DIoU 損失函數(shù)的表達(dá)式為:
式中:b為標(biāo)注框的中心點(diǎn),bgt為預(yù)測(cè)框的中心點(diǎn),ρ為兩個(gè)中心點(diǎn)的歐式距離,c為兩個(gè)框最小閉包區(qū)域的對(duì)角線距離。
1.2.4 CIoU 損失函數(shù)
CIoU 在DIoU 的基礎(chǔ)上保留了重疊面積、中心點(diǎn)距離的評(píng)價(jià)策略[16],引入了長(zhǎng)寬比的評(píng)價(jià)指標(biāo)。長(zhǎng)寬比的作用為控制目標(biāo)框的寬高能夠盡可能快速接近標(biāo)注框的寬高。YOLOv4 的損失函數(shù)包括坐標(biāo)位置損失,置信度損失及類別損失,本文采用CIoU計(jì)算模型的坐標(biāo)位置損失。CIoU 損失函數(shù)的表達(dá)式為:
式中:v為標(biāo)注框和預(yù)測(cè)框的寬高比重合度,α表示正權(quán)衡參數(shù)。αv值越低,標(biāo)注框與預(yù)測(cè)框越接近。
改進(jìn)后的YOLOv4 網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。改進(jìn)部分包括PANet 網(wǎng)絡(luò)增加特征提取層、Darknet53 網(wǎng)絡(luò)中CSP 結(jié)構(gòu)改進(jìn)以及模型結(jié)束部分的負(fù)例挖掘引入。
圖3 改進(jìn)YOLOv4 結(jié)構(gòu)圖
部分絕緣子在整個(gè)圖像中所占比例較小,且在自然場(chǎng)景下易受光照、形狀等復(fù)雜因素的影響,傳統(tǒng)的目標(biāo)檢測(cè)算法漏檢率高。因此,本文額外增加一層特征融合結(jié)構(gòu)進(jìn)行預(yù)測(cè),改善了小型絕緣子丟失的問題。
改進(jìn)后的YOLOv4 網(wǎng)絡(luò)使用4 種尺度來(lái)預(yù)測(cè)不同大小的目標(biāo)。特征圖在CSPDarknet53 網(wǎng)絡(luò)中先進(jìn)行下采樣,然后與第二個(gè)殘差塊的輸出相連接,建立一個(gè)4 層的特征融合層,如圖3 所示。輸入圖像的大小為416×416,4 個(gè)特征層的大小分別為(104,104,128),(52,52,256),(26,26,512),(13,13,1024)。
SE(Squeeze-and-Excitation)注意力[17]模塊在2017 年提出,其主要原理為通過(guò)學(xué)習(xí)獲得每個(gè)特征通道的重要性并根據(jù)重要程度在卷積運(yùn)算時(shí)加強(qiáng)更有用的特征通道,抑制相對(duì)不重要的特征通道。一方面,該方法增加了各個(gè)通道之間的相關(guān)性,能夠獲得更豐富的特征信息,提高了小型絕緣子檢測(cè)的準(zhǔn)確度;另一方面,由于整個(gè)SE 模塊使用了全連接層,避免了普通卷積層參數(shù)多且計(jì)算量大的問題,提高了檢測(cè)效率。SE 模塊由兩部分組成,如圖4所示。
圖4 SE 模塊結(jié)構(gòu)
SE 模塊的第一部分為壓縮(Squeeze)部分,利用全局平均池化操作將卷積之后的W×H×C的特征圖進(jìn)行處理,得到一個(gè)1×1×C的通道評(píng)價(jià)向量,其中每一個(gè)通道向量都會(huì)獲得一個(gè)分?jǐn)?shù)。第二部分為激勵(lì)(Excitation)部分,包括兩個(gè)FC(全連接層)和一個(gè)ReLU 函數(shù)(如式(6)所示)。首先經(jīng)過(guò)第一個(gè)FC 將通道計(jì)分向量的維度減少到輸入的1/r,然后使用ReLU 函數(shù)激活,接著使用另一個(gè)FC 將通道數(shù)量增加到與輸入時(shí)相同,最后經(jīng)過(guò)一個(gè)Sigmoid函數(shù)(如式(7)所示)化為0 到1 之間的歸一化權(quán)重,得到各個(gè)通道的權(quán)重值與SE 模塊輸入的特征圖對(duì)應(yīng)的輸出。
ReLU 函數(shù)表達(dá)式為:
Sigmoid 函數(shù)表達(dá)式為:
CSP 結(jié)構(gòu)將殘差塊分為兩個(gè)部分,一部分作為主干部分繼續(xù)進(jìn)行殘差卷積,另一部分為一個(gè)大的殘差邊,經(jīng)過(guò)一次CBM 卷積后直接連接輸出,最后將兩部分調(diào)整成相同的通道數(shù)并堆疊。本文在每一個(gè)CSP 中的殘差單元添加一個(gè)SE 模塊,以提高模型在小型絕緣子檢測(cè)中的性能。改進(jìn)的結(jié)構(gòu)如圖5所示。
圖5 CSP 模塊改進(jìn)圖
中小型絕緣子識(shí)別存在圖像中的絕緣子與背景混淆的問題,導(dǎo)致背景與目標(biāo)之間的邊界不明顯,從而干擾目標(biāo)檢測(cè)算法的性能,增加誤檢率。因此,本文在YOLOv4 網(wǎng)絡(luò)結(jié)構(gòu)的末尾增加負(fù)例挖掘模塊(Negative Example Mining,NEM),解決因復(fù)雜背景或桿塔遮擋出現(xiàn)的誤識(shí)別問題。例如,圖6(a)中編號(hào)為6 的預(yù)測(cè)框?qū)⒉莸乇尘罢`識(shí)別為絕緣子,圖6(b)中編號(hào)為8 的預(yù)測(cè)框?qū)U塔誤識(shí)別為絕緣子。
圖6 誤識(shí)別檢測(cè)圖
在二分類任務(wù)中,樣本根據(jù)實(shí)際值和預(yù)測(cè)值被分為4 種不同的結(jié)果,用混淆矩陣表示,參見表1。
表1 二分類結(jié)果表示
表1 中,TP表示正確分類為真的樣本數(shù),F(xiàn)P表示錯(cuò)誤分類為真的樣本數(shù),F(xiàn)N表示錯(cuò)誤分類為假的樣本數(shù),TN表示正確分類為假的樣本數(shù)。
本文分別計(jì)算小型絕緣子檢測(cè)算法預(yù)測(cè)出的每個(gè)預(yù)測(cè)框的置信度f(wàn)1以及該預(yù)測(cè)框和標(biāo)注框之間的IoU 值f2。一般地,f2值小于0.5 的邊界框表示假正例樣本(FP),即預(yù)測(cè)為目標(biāo)絕緣子對(duì)象實(shí)際為背景或其他信息。對(duì)于該類預(yù)測(cè)框,置信度f(wàn)1越高,檢測(cè)算法就越難正確識(shí)別。將這些負(fù)例樣本按照置信值f1降序排列,得到樣本數(shù)據(jù)集S(如式(8)所示),與之對(duì)應(yīng)的正例(TP)樣本集為S′(如式(9)所示):
發(fā)現(xiàn)負(fù)例時(shí),可以將預(yù)測(cè)框映射到對(duì)應(yīng)尺度的特征層中,然后將其放回到由主干網(wǎng)絡(luò)生成的特征圖里重新進(jìn)行特征融合,并計(jì)算這些負(fù)例與標(biāo)注框的損失值以達(dá)到優(yōu)化網(wǎng)絡(luò)的目的。具體過(guò)程如下。
訓(xùn)練開始時(shí),將訓(xùn)練集放入模型進(jìn)行訓(xùn)練。經(jīng)過(guò)訓(xùn)練后,選擇數(shù)據(jù)集S中前N個(gè)負(fù)例樣本并放入到模型中重新訓(xùn)練,可以使模型進(jìn)一步學(xué)習(xí)到絕緣子與桿塔或其他背景之間的差異性,以降低誤檢率。進(jìn)行重新訓(xùn)練時(shí),一方面需要考慮正例與負(fù)例數(shù)量平衡關(guān)系,如果負(fù)例遠(yuǎn)遠(yuǎn)大于正例的數(shù)量,模型不會(huì)收斂出更好的解[18],因此,本文設(shè)定正例n與負(fù)例N的比例為1∶3。另一方面,為了得到更好的效果,重新訓(xùn)練時(shí)鎖定主干特征提取網(wǎng)絡(luò)(CSPDarknet53),微調(diào)SPP 結(jié)構(gòu)和PANet 網(wǎng)絡(luò)的參數(shù)進(jìn)行預(yù)測(cè)。
先驗(yàn)框引入的目的是將目標(biāo)檢測(cè)的問題轉(zhuǎn)換為固定格子內(nèi)是否有目標(biāo)以及預(yù)測(cè)框與真實(shí)框之間偏差的問題。原始的YOLOv4 網(wǎng)絡(luò)根據(jù)VOC 數(shù)據(jù)集標(biāo)注聚類出大、中、小3 種尺度的9 個(gè)先驗(yàn)框。由于本文使用的數(shù)據(jù)集中絕緣子的占比較小,因此該先驗(yàn)框并不適用,會(huì)對(duì)預(yù)測(cè)結(jié)果造成偏差。
k-means++算法能夠進(jìn)一步改善分類結(jié)果的最終誤差。為了加快模型的收斂速度、提高模型訓(xùn)練能力,本文通過(guò)對(duì)數(shù)據(jù)集手工標(biāo)注,使用k-means++的方法聚類出適合訓(xùn)練的數(shù)據(jù)集的先驗(yàn)框。改進(jìn)的k-means++算法的具體步驟如下。
(1)從小型絕緣子數(shù)據(jù)集中選取隨機(jī)先驗(yàn)框作為初始聚類中心c。
(2)計(jì)算當(dāng)前聚類中心與其他先驗(yàn)框的距離d1,原始的歐式距離容易造成較大誤差,不適用于本文先驗(yàn)框的計(jì)算,因此改進(jìn)為IoU 距離計(jì)算:
(3)計(jì)算每個(gè)絕緣子先驗(yàn)框被選為下一個(gè)聚類中心的概率P(x):
(4)重復(fù)前三步,直到找到k個(gè)聚類中心,然后將數(shù)據(jù)集中每個(gè)樣本分配到最近的聚類中心,重新計(jì)算每個(gè)類別c的聚類中心,直到先驗(yàn)框大小趨于穩(wěn)定、不再變化,如式(12)所示:
經(jīng)過(guò)聚類后的先驗(yàn)框如表2 所示,新增一個(gè)特征融合層后共有4 個(gè)尺度,每個(gè)尺度有3 種不同的先驗(yàn)框。
表2 不同特征圖對(duì)應(yīng)先驗(yàn)框大小
3.1.1 中小型絕緣子圖片組合
本文數(shù)據(jù)集包括無(wú)人機(jī)拍攝和現(xiàn)有公共絕緣子數(shù)據(jù)集兩部分。因現(xiàn)有數(shù)據(jù)集中大部分絕緣子圖片在整幅圖中占比較大,不能滿足中小目標(biāo)檢測(cè),因此本文制作中小型絕緣子比重圖片。方法是分別將不同數(shù)量的絕緣子圖片與其他圖片拼接成2×2和3×3 的合成圖,同時(shí)為提高模型檢測(cè)能力,控制和調(diào)整絕緣子圖片所占合成圖中的比重。由于輸入圖片的像素大小是固定的(416×416),因此一張絕緣子圖在整張融合圖中的比例分別減少至原來(lái)的1/4 和1/9,可以進(jìn)行中型和小型絕緣子檢測(cè)任務(wù)。
3.1.2 數(shù)據(jù)集擴(kuò)充
為模擬自然場(chǎng)景下使用無(wú)人機(jī)拍攝絕緣子圖片時(shí)發(fā)生的光照條件變化以及被桿塔等結(jié)構(gòu)遮擋的情景,本文針對(duì)單張絕緣子圖片進(jìn)行變換以擴(kuò)充數(shù)據(jù)集,主要通過(guò)光照畸變、幾何畸變及圖像遮擋3 種方法。光照畸變包括改變圖像的亮度、對(duì)比度、飽和度以及加入噪聲等,幾何畸變包括翻轉(zhuǎn)、旋轉(zhuǎn)等,圖像遮擋為隨機(jī)遮擋某個(gè)部分,防止訓(xùn)練過(guò)擬合。訓(xùn)練圖片共5 100 張,具體分配如表3 所示。
表3 數(shù)據(jù)集分配
擴(kuò)充圖示例如圖7 所示。其中,圖7(a)為2×2 合成圖無(wú)變化;圖7(b)為3×3 合成圖,針對(duì)絕緣子進(jìn)行亮度調(diào)整和幾何旋轉(zhuǎn);圖7(c)為3×3合成圖,針對(duì)絕緣子進(jìn)行集合旋轉(zhuǎn)和隨機(jī)遮擋。
圖7 數(shù)據(jù)集擴(kuò)充圖片示例
實(shí)驗(yàn)的環(huán)境配置如表4 所示。
表4 實(shí)驗(yàn)環(huán)境配置
整個(gè)訓(xùn)練過(guò)程共100 個(gè)epoch,前50 個(gè)epoch為正常訓(xùn)練,設(shè)置學(xué)習(xí)速率參數(shù)為0.001,圖片的讀取數(shù)量為4 張。進(jìn)行第51 個(gè)epoch 時(shí),將負(fù)例和正例放入模型重新訓(xùn)練以便優(yōu)化網(wǎng)絡(luò),此時(shí)凍結(jié)Darketnet53 主干特征提取網(wǎng)絡(luò),調(diào)整學(xué)習(xí)速率參數(shù)為0.000 1,圖片的讀取數(shù)量為8 張。其中用于訓(xùn)練的圖片占總數(shù)據(jù)集的90%,驗(yàn)證的圖片占10%。計(jì)算并保留每一個(gè)epoch 的loss 值和驗(yàn)證集loss 值,其曲線如圖8 所示。從圖8 可以看出,從第51 輪開始loss 值進(jìn)一步減少,達(dá)到第90 輪時(shí)基本趨于穩(wěn)定。
圖8 模型訓(xùn)練損失曲線圖
檢測(cè)結(jié)果圖如圖9 所示。其中,圖9(a)、圖9(c)均為YOLOv4 算法的檢測(cè)結(jié)果,圖9(b)、圖9(d)均為相同3 幅圖的本文算法檢測(cè)結(jié)果。在準(zhǔn)確率方面,傳統(tǒng)YOLOv4 算法在檢測(cè)小型或超小型絕緣子時(shí)存在漏檢的情況,而使用本文算法對(duì)其檢測(cè)時(shí),中型、小型和超小型絕緣子均被檢測(cè)出來(lái),如圖9(b)的7 號(hào)絕緣子。在精準(zhǔn)度方面,根據(jù)圖9 的效果可得YOLOv4 的預(yù)測(cè)框范圍偏大,本文算法檢測(cè)出的預(yù)測(cè)框更貼合絕緣子的實(shí)際尺寸,效果更優(yōu)秀。在抗干擾方面,本文的改進(jìn)算法能夠?qū)⒈粭U塔遮擋的絕緣子識(shí)別出來(lái),如圖9(d)中的9 號(hào)預(yù)測(cè)框。
圖9 檢測(cè)效果圖
精確率(Precision,P)是指絕緣子正樣本個(gè)數(shù)(TP)占所有絕緣子預(yù)測(cè)個(gè)數(shù)的比例,表示絕緣子預(yù)測(cè)精度:
召回率(Recall,R)是指絕緣子的正樣本個(gè)數(shù)(TP)占標(biāo)注出的絕緣子個(gè)數(shù)的比例,表示絕緣子預(yù)測(cè)效果:
PR 曲線是精確率和召回率曲線,其中x軸為召回率,y軸為精確率。當(dāng)算法對(duì)預(yù)測(cè)的絕緣子進(jìn)行分類時(shí),通過(guò)置信度來(lái)評(píng)判預(yù)測(cè)框是否舍棄。利用置信度對(duì)所有樣本進(jìn)行排序,再根據(jù)樣本逐個(gè)選擇閾值,在該樣本之前的都屬于正例,之后的都屬于負(fù)例。為全面評(píng)估模型效果,需要對(duì)所有閾值進(jìn)行評(píng)判。使用每一個(gè)樣本作為標(biāo)準(zhǔn)進(jìn)行閾值劃分時(shí),都能計(jì)算對(duì)應(yīng)的精準(zhǔn)率和召回率,因此可以繪制PR 曲線。PR 曲線越右凸,表明效果越好。圖10 表示2×2 和3×3 合成圖時(shí)YOLOv3、YOLOv4、改進(jìn)YOLOv4 算法不含負(fù)例挖掘(NEM)、改進(jìn)YOLOv4算法含負(fù)例挖掘的PR 曲線圖。
圖10 不同合成圖的PR 曲線圖(IoU=0.5)
本文使用精確率、召回率、平均精度(Average precision,AP)、AP75衡量4 種算法的檢測(cè)精度,結(jié)果如表5所示。表5中的AP75指當(dāng)IoU取值為0.75時(shí)的AP值。AP的計(jì)算公式為:
表5 各算法評(píng)價(jià)結(jié)果
IoU 取值越高,表明檢測(cè)框和目標(biāo)框重合度越高,即檢測(cè)難度越大,精確度越低。另外,小型絕緣子檢測(cè)難度較大,3×3 合成圖的AP 值會(huì)低于2×2 合成圖的AP 值。根據(jù)表中數(shù)據(jù)可得,同時(shí)改進(jìn)主干特征提取網(wǎng)絡(luò)和特征融合網(wǎng)絡(luò)后的算法在中型和小型絕緣子識(shí)別中均優(yōu)于傳統(tǒng)YOLOv4 算法,AP 分別提升了11.7 和5.08 個(gè)百分點(diǎn),AP75值分別提升了12.44 和9.49 個(gè)百分點(diǎn)。引入負(fù)例挖掘模塊后,中小型絕緣子的檢測(cè)精確率和查全率進(jìn)一步提升,預(yù)測(cè)出的先驗(yàn)框更接近于目標(biāo)框。2×2 圖中絕緣子的AP 由87.8%提升到88.91%,3×3 圖中絕緣子的AP 由71.02%提升到73.09%。
針對(duì)中小型絕緣子在目標(biāo)檢測(cè)時(shí)漏檢、錯(cuò)檢的問題,本文提出了一種改進(jìn)YOLOv4 結(jié)構(gòu)的中小型絕緣子檢測(cè)算法。該算法的核心思想是通過(guò)改變網(wǎng)絡(luò)結(jié)構(gòu),增強(qiáng)中小型絕緣子的特征提取能力,在預(yù)測(cè)時(shí)能更準(zhǔn)確;同時(shí)利用預(yù)測(cè)的錯(cuò)誤目標(biāo)優(yōu)化和改善網(wǎng)絡(luò)性能,進(jìn)而提高檢測(cè)準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明,相較于傳統(tǒng)算法,本文的改進(jìn)算法在絕緣子占比小的情況下有更好的檢測(cè)效果。AP75值有顯著提升,使得預(yù)測(cè)框大小更接近真實(shí)框大小。下一步的工作是提高模型在高約束條件下的精確度和特殊角度下絕緣子小目標(biāo)的識(shí)別率,這樣能夠獲取到精準(zhǔn)的絕緣子位置信息,以便后續(xù)研究。