高志國,袁 牧,童 旸,倪修峰,程汪劉
(1.國網(wǎng)安徽省電力有限公司銅陵供電公司,安徽銅陵 244000;2.安徽大學(xué)電子信息工程學(xué)院,安徽合肥 230000;3.安徽南瑞繼遠(yuǎn)電網(wǎng)技術(shù)有限公司,安徽合肥 230000)
變電站中的設(shè)備包括變壓器、電力電纜、表計(jì)等,每一類設(shè)備出現(xiàn)故障都會對電網(wǎng)運(yùn)行造成不良影響。例如,表計(jì)出現(xiàn)故障(如表盤模糊、表盤破損與外殼破損)會使工作人員讀取表計(jì)數(shù)據(jù)出現(xiàn)誤差,使電力設(shè)備的運(yùn)行情況不能被完善監(jiān)控,為事故埋下了隱患。因此,需要對變電設(shè)備進(jìn)行定期巡檢。
傳統(tǒng)的變電設(shè)備巡視檢查是值班人員根據(jù)外觀、顏色、聲音、氣味、溫度等條件判斷當(dāng)前設(shè)備運(yùn)行是否正常。這種巡檢方式耗時耗力,對巡檢人員的經(jīng)驗(yàn)要求非常高,同時環(huán)境因素也很容易導(dǎo)致誤判[1],無法提前發(fā)現(xiàn)安全隱患。在全國大量分布的變電站中,專業(yè)巡檢工人的需求缺口很大,近些年來,隨著計(jì)算機(jī)技術(shù)與圖像視頻技術(shù)的發(fā)展,無人值守變電站建設(shè)逐漸提上了日程。
隨著智能變電站的推廣,基于計(jì)算機(jī)視覺技術(shù)的檢測機(jī)器人逐漸應(yīng)用于儀表的自動識別[2-5]。文獻(xiàn)[6]通過SSD(Single Shot MultiBox Detector)模塊和CNN(Convolutional Neural Network)模塊對圖像中的主變壓器定位并提取的缺陷信息進(jìn)行解析,同時利用VGG-Net(Visual Geometry Group-Net)遷移算法對缺陷樣本進(jìn)行擴(kuò)充,結(jié)果表明,該方法能較為準(zhǔn)確地識別出變壓器外觀缺陷。文獻(xiàn)[7]通過決策樹和聚類對電表異常數(shù)據(jù)進(jìn)行分析,建立了儀表數(shù)據(jù)矩陣,通過矩陣方程的求解計(jì)算出儀表誤差,并判斷儀表故障。文獻(xiàn)[8]利用SSD 網(wǎng)絡(luò)檢測出儀表,利用關(guān)鍵點(diǎn)模型檢測的中心點(diǎn)、零點(diǎn)、滿刻度點(diǎn)和終點(diǎn)等關(guān)鍵點(diǎn)指標(biāo)計(jì)算出不同的指針儀表。文獻(xiàn)[9]基于區(qū)域的卷積網(wǎng)絡(luò)(Faster R-CNN)檢測目標(biāo)儀表的位置,并通過霍夫變換檢測到指針位置后獲得讀數(shù)。文獻(xiàn)[10]使用ResNet-50 為主干網(wǎng)絡(luò)提取體征,并融合注意力機(jī)制,使得變電站設(shè)備缺陷檢測的mAP 達(dá)到了70.4%。文獻(xiàn)[11]針對變電站設(shè)備缺陷問題,提出了改進(jìn)Faster R-CNN 模型,提高了模型的檢測速度和精度,其mAP 可達(dá)到89.14%。文獻(xiàn)[12]通過霍夫圓檢測和感知哈希相似度算法,定位出圓型表計(jì)的位置。
表計(jì)破損是一種常見的變電站儀器缺陷。表計(jì)破損主要包括表盤模糊、表盤破損、外殼破損。文中的數(shù)據(jù)集圖像均是變電站工人巡檢時獲得的,其中表盤模糊有917 張圖像,表盤破損有828 張圖像,外殼破損有419 張圖像,共計(jì)圖像2 111 張。
文中使用LabelImg 標(biāo)注軟件進(jìn)行人工標(biāo)注:若電表表盤模糊,則將其標(biāo)注為bj_bpmu;若電表表盤破損,則將其標(biāo)注為bj_bpps;若電表外殼破損,則將其標(biāo)注為bj_wkps。同時將標(biāo)注的數(shù)據(jù)嚴(yán)格按照公開數(shù)據(jù)集PascalVOC 格式進(jìn)行制作,訓(xùn)練集和測試集比例為8∶2,標(biāo)注文件為xml格式。
CBAM(Convolutional Block Attention Module)[13]是一種輕量、通用的注意力模塊,其通過空間和通道注意力模塊串聯(lián)的形式,依次結(jié)合通道和空間信息提取關(guān)鍵特征,模塊結(jié)構(gòu)如圖1 所示。但在串聯(lián)形式下,一方面,由于表計(jì)缺陷圖像背景較為復(fù)雜,若通道注意力沒有達(dá)到最優(yōu)解,則會進(jìn)一步影響其串聯(lián)結(jié)構(gòu)后空間注意力的權(quán)重輸出;另一方面,對于表計(jì)缺陷圖像中較小的目標(biāo),經(jīng)過串聯(lián)結(jié)構(gòu)下兩次池化操作,小目標(biāo)的特征也愈發(fā)微弱,易發(fā)生錯檢情況。
圖1 CBAM模塊結(jié)構(gòu)圖
綜上考慮,文中在CBAM 基礎(chǔ)上進(jìn)行改進(jìn),提出了PCBAM(Parallel Convolutional Block Attention Module)模塊,結(jié)構(gòu)如圖2所示。首先將原始特征圖F同時輸入空間注意力模塊和通道注意力模塊,分別得到空間權(quán)重MS(F)和通道權(quán)重MC(F)。其次,將MS(F)和MC(F)分別與輸入特征圖做點(diǎn)乘得到空間注意力特征圖FS和通道注意力特征圖FC。然后,對原始輸入特征F應(yīng)用3×3 卷積以增加感受野,增強(qiáng)小目標(biāo)特征表征能力,得到特征圖Fi。最后,將FS和FC相加生成的混合注意力特征圖與原始輸入特征的卷積結(jié)果Fi相加,得到最終的特征圖FO。與傳統(tǒng)CBAM 相比,一方面,PCBAM 避免了串聯(lián)結(jié)構(gòu)下的部分權(quán)重系數(shù)干擾,以并聯(lián)的形式互補(bǔ)地給予關(guān)鍵缺陷特征更優(yōu)的權(quán)重;另一方面,PCBAM 對原始輸入特征進(jìn)行卷積并直接加權(quán)于最終的特征圖,在保證豐富的小目標(biāo)信息不丟失的同時增強(qiáng)了輸出特征圖的表征能力。
圖2 PCBAM模塊結(jié)構(gòu)圖
YOLOv5[14]模型結(jié)構(gòu)與其他YOLO 算法系列相似,分為輸入、主干、頸和預(yù)測四部分。YOLOv5 的結(jié)構(gòu)如圖3 所示。
圖3 YOLOv5結(jié)構(gòu)圖
輸入部分可實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)、自適應(yīng)錨框計(jì)算、自適應(yīng)圖像縮放。主干部分主要采用可以完成切片和卷積操作的Focus 結(jié)構(gòu)和增強(qiáng)特征網(wǎng)絡(luò)學(xué)習(xí)能力的CSP(Cross Stage Partial)結(jié)構(gòu)。由于不同網(wǎng)絡(luò)的Focus 和CBL(Conv+Bn+Leaky_relu)激活函數(shù)具有不同數(shù)量的卷積核,CSP 的殘差模塊數(shù)量也不同,因此通過控制網(wǎng)絡(luò)的寬度和深度,模型可以表現(xiàn)出不同的性能。頸部采用FPN(Feature Pyramid Network)和PAN(Personal Area Networks)結(jié)構(gòu),利用主干部分提取的信息加強(qiáng)網(wǎng)絡(luò)特征融合能力。將輸出層分為三個卷積層通道,通過損耗函數(shù)進(jìn)行計(jì)算,并對結(jié)果進(jìn)行最大值抑制處理,得出預(yù)測結(jié)果。
為了獲得更多需要注意的目標(biāo)的詳細(xì)信息,抑制來自不同渠道的其他無用信息,文中在原YOLOv5 的基礎(chǔ)上加入PCABM。在原YOLOv5 主干部分的每一個CBL 模塊后加入PCABM 模塊,如圖4 所示。由于電表缺陷圖像背景復(fù)雜,CBL 模塊無法很好地提取缺陷特征,而加入PCABM 模塊可以有效提升模型對重要缺陷特征的提取,減少無用背景信息的權(quán)重輸入。
圖4 PCBAM-YOLOv5結(jié)構(gòu)圖
文中基于Ubuntu18.04 LTS 64 位操作系統(tǒng)實(shí)現(xiàn),應(yīng)用深度學(xué)習(xí)框架PyTorch 實(shí)現(xiàn)和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。實(shí)驗(yàn)硬件、軟件環(huán)境配置如表1 所示。
表1 硬件、軟件環(huán)境配置
對于多分類目標(biāo)檢測模型而言,常用的性能評價指標(biāo)主要有精確率(Precision,P)、召回率(Recall,R)、平均精確率(Average Precision,AP)以及平均精確率均值(mean Average Precision,mAP)。其中,精確率表示預(yù)測框中預(yù)測正確的比例,召回率表示所有真實(shí)框中被預(yù)測出的比例,AP 為單個目標(biāo)類別的平均精度,mAP 用于衡量模型整體檢測效果,其值越大表示該模型的定位與識別的準(zhǔn)確率越高[15],定義式分別如式(1)-(4)所示。文中使用mAP 作為評價指標(biāo)來判斷模型的效果。
文中算法檢測的mAP 值為78.0%,其中表盤模糊、表盤破損和外殼破損的mAP 值分別為89.5%、82.2%和62.2%,如表2 所示。文中表計(jì)缺陷數(shù)據(jù)集背景復(fù)雜,檢測目標(biāo)尺寸不一、部分表計(jì)遮擋等原因,導(dǎo)致其平均mAP 值不高。表盤模糊和表盤破損特征相近,導(dǎo)致二者經(jīng)常發(fā)生錯檢。造成外殼破損檢測精度較低的主要原因是變電站的復(fù)雜背景,變電站表計(jì)外殼破損主要是由外殼腐蝕造成的,在變電站除了表計(jì)外,還有一些和表計(jì)形狀相似的圓形器件,例如絕緣子等,這些圓形器件由于拍攝角度、光照和顏色的因素,導(dǎo)致其與銹蝕引起的外殼破損相似,經(jīng)常會造成外殼破損錯檢。
表2 PCABM-YOLOv5檢測結(jié)果
為了進(jìn)一步驗(yàn)證文中算法對電表缺陷檢測的有效性,將其與YOLOv4、SSD[16]等主流算法進(jìn)行比較,同時將其與改進(jìn)前的YOLOv5 和CAMB-YOLOv5 進(jìn)行比較,實(shí)驗(yàn)結(jié)果如表3 所示。若以YOLOv5 為基線,首先與經(jīng)典網(wǎng)絡(luò)SSD 和YOLOv4 比較,YOLOv5的mAP 相對于YOLOv4 和SSD 分別提高了4.8%和4.4%。通過算法對比實(shí)驗(yàn)可知,針對于文中表計(jì)缺陷數(shù)據(jù)集,YOLOv5 的mAP 有著明顯的優(yōu)勢。其次,在YOLOv5 的基礎(chǔ)上,文中提出了PCBAM-YOLOv5,相對于CBAM-YOLOv5 和YOLOv5,文中所提出算法的mAP 分別提高了1.6%和1.2%。綜述所述,針對文中表計(jì)缺陷圖像數(shù)據(jù)集,所提出的算法PCBAMYOLOv5 是最優(yōu)的。
表3 算法對比分析結(jié)果
為了解決變電站電表缺陷圖像背景復(fù)雜、目標(biāo)尺寸不一、表計(jì)部分遮擋等問題,文中結(jié)合PCABM注意力機(jī)制對YOLOv5 算法進(jìn)行優(yōu)化,提出了PCABM-YOLOv5 電表缺陷檢測算法。在YOLOv5 的主干部分加入PCABM 模塊,將通道注意力、空間注意力和輸入特征的卷積進(jìn)行并聯(lián),在互補(bǔ)地給與關(guān)鍵特征缺陷,同時豐富小目標(biāo)信息。實(shí)驗(yàn)表明,PCABM-YOLOv5 在電表缺陷檢測測試集的mAP 可達(dá)78%,相較于YOLOv5 提高了1.6%。