李大川,楊志明
(國網(wǎng)甘肅省電力公司金昌供電公司,金昌 737100)
隨著變電規(guī)模的擴(kuò)大,變電站運(yùn)維工作量不斷增加,傳統(tǒng)人工巡檢存在執(zhí)行不規(guī)范和操作不到位等問題,提高變電站巡檢效率成為亟需解決的問題。近年來,人工智能機(jī)器在各領(lǐng)域應(yīng)用廣泛,為變電站智能巡檢帶來新的契機(jī),變電站巡檢機(jī)器人應(yīng)運(yùn)而生。變電站巡檢機(jī)器人可替代人工實現(xiàn)遠(yuǎn)程巡查與在線監(jiān)測,在減少工作量的同時,還可提升變電站運(yùn)維效率。正是基于這些特點,巡檢機(jī)器人被廣泛研究。文獻(xiàn)[1]提出一種巡檢機(jī)器人路徑規(guī)劃方法,通過在人工魚群算法中引入變指數(shù)函數(shù)的動態(tài)視野和泊松分布特征函數(shù),優(yōu)化擁擠度和轉(zhuǎn)換因子,結(jié)合柵格法構(gòu)建環(huán)境地圖,從而實現(xiàn)了巡檢機(jī)器人的路徑規(guī)劃。文獻(xiàn)[2]為提升變電站巡檢機(jī)器人的工作效率,提出一種改進(jìn)蟻群算法的路徑規(guī)劃方法,使得機(jī)器人具有更好的巡檢路徑。文獻(xiàn)[3]針對巡檢機(jī)器人的儀表問題,采用深度學(xué)習(xí)CRNN網(wǎng)絡(luò)進(jìn)行儀表數(shù)字識別,該研究的特點在于簡化了人工建模步驟,實現(xiàn)了變電站巡檢機(jī)器人的自動抄表識別,但該方法存在識別精度低的問題。此外,文獻(xiàn)[4]通過綜述研究認(rèn)為目前機(jī)器人儀表識別精度和效率較低。
作為變電站巡檢機(jī)器人的重要組成部分,提高機(jī)器人對圖象的識別精度,是做好巡檢智能化工作的重要任務(wù)。因此,本文嘗試以目前較為前沿的YOLOX神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),通過改進(jìn)其網(wǎng)絡(luò)結(jié)構(gòu)和輸出函數(shù),進(jìn)而提高變電站巡檢機(jī)器人自動抄表識別精度,為變電站巡檢智能應(yīng)用提供一種新的借鑒與參考。
YOLOX網(wǎng)絡(luò)是YOLO系列目標(biāo)檢測算法中一種經(jīng)典的模型,可解決YOLOV4和YOLOV5算法過度優(yōu)化的問題。YOLOX算法采用Darknet53作為骨干網(wǎng)和SPP層,由YOLOV3優(yōu)化而來。相較于YOLOV3算法,YOLOX算法在輸入端主要使用Mosaic進(jìn)行數(shù)據(jù)增強(qiáng),通過裁剪、縮放等方式對圖象進(jìn)行拼接,從而大大提高了對小目標(biāo)的檢測識別精度;通過使用Mixup,減小圖象分類的額外開銷,提高分類精度[5-8]。同時,YOLOX算法在預(yù)測部分通過解耦頭增強(qiáng)特征表達(dá)能力,通過Anchor-Free減少參數(shù)量,并采用SIMOTA進(jìn)行精細(xì)化篩選,從而在保證算法精度的前提下,提高了算法的收斂能力和訓(xùn)練速度。
YOLOX網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。圖1中,輸入圖象的規(guī)格為640×640,通道數(shù)為3。當(dāng)輸入圖象規(guī)格不滿足輸入條件時,需對輸入圖象進(jìn)行裁剪、縮放等預(yù)處理。輸入圖象后,先后經(jīng)過FOCUS網(wǎng)絡(luò)結(jié)構(gòu)和卷積層進(jìn)行間斷取點操作和標(biāo)準(zhǔn)化,同時增加四倍通道數(shù),然后進(jìn)入Resblock body操作,對圖象進(jìn)行壓縮并增加通道數(shù)。接下來先后進(jìn)入CspLayer操作提取特征和SPP進(jìn)行池化,并進(jìn)行卷積與上采樣;最后,將采樣的特征進(jìn)行融合。重復(fù)兩次上采樣與下采樣,即完成了整個圖象的識別。
YOLOX網(wǎng)絡(luò)實現(xiàn)了YOLO系列在目標(biāo)檢測與識別中端對端的性能,提高了收斂速度,但YOLOX算法識別精度與訓(xùn)練樣本的正負(fù)樣本數(shù)量有關(guān),而變電站巡檢機(jī)器人自動抄表的樣本數(shù)量可能存在正負(fù)樣本數(shù)量不均衡的問題,進(jìn)而影響網(wǎng)絡(luò)最終的識別精度。為解決該問題,對YOLOX網(wǎng)絡(luò)進(jìn)行改進(jìn),具體思路則是添加卷積注意力模塊,以及改進(jìn)其BCE-Loss函數(shù)。
2.1.1 引入卷積注意力模塊
卷積注意力模塊添加在YOLOX網(wǎng)絡(luò)中的通道層和空間層。在通道層的注意力上,采用Channel Attention進(jìn)行實現(xiàn)。設(shè)輸入特征為F,通過式(1)計算通道權(quán)重系數(shù)Mc(F),然后其與F相乘,得到新的特征Fmc。
(1)
在空間層面注意力上,采用Spatial Attention進(jìn)行實現(xiàn)。將輸入特征F通過式(2)計算空間權(quán)重系數(shù)Ms(F),并將其與F相乘得到新的特征Fms。
(2)
最后,將Fmc和Fms代入YOLOX的骨干網(wǎng)絡(luò)。
2.1.2 BCE-Loss函數(shù)改進(jìn)
改進(jìn)YOLOX網(wǎng)絡(luò)BCE-Loss函數(shù)的目的是使算法更側(cè)重于對難分辨的樣本進(jìn)行識別,以提高算法的識別精度??紤]到本研究是對儀表數(shù)據(jù)進(jìn)行識別,其屬于小目標(biāo)檢測,要提高小目標(biāo)檢測的精度,就必須解決正負(fù)樣本可能不均衡的問題。因此本研究選用Focal-Loss函數(shù)替代BCE-Loss函數(shù),具體函數(shù)公式:
FL(Pt)=-(1-Pt)γlog(Pt)
(3)
通過上述的改進(jìn),可進(jìn)一步提高YOLOX網(wǎng)絡(luò)的檢測與識別精度。
變電站巡檢機(jī)器人自動抄表識別遵循一般的識別思路[10-15]:一是采集智能電表圖象,通過移動巡檢機(jī)器人協(xié)調(diào)機(jī)械臂,使相機(jī)聚焦于目標(biāo)電表,以采集到清晰的電表圖象;二是圖象預(yù)處理,考慮到采集的圖象可能存在噪聲的干擾問題,需對圖象進(jìn)行預(yù)處理;三是讀取電表數(shù)據(jù),具體則采用目標(biāo)檢測與識別算法進(jìn)行識別?;谝陨纤悸?本研究將變電站機(jī)器人自動抄表識別步驟分為以下幾步:
(1)圖象獲取。通過變電站巡檢機(jī)器人機(jī)械臂實現(xiàn)自動抄表圖象的獲取。
(2)圖象預(yù)處理。考慮到變電站巡檢機(jī)器人采集的圖象為RGB圖象,而改進(jìn)發(fā)YOLOX網(wǎng)絡(luò)的輸入圖象為二階黑白圖象,因此在原始圖象輸入前,需要對圖象進(jìn)行預(yù)處理。首先對圖象進(jìn)行灰度化處理,提取輸入圖象R、G、B三原色亮度作為灰度化的三個灰度值,將彩色圖象轉(zhuǎn)化為黑白圖象;然后對圖象進(jìn)行平移、縮放、旋轉(zhuǎn)等集合閉環(huán),糾正圖象的系統(tǒng)誤差;最后使用平滑處理消除圖象噪聲,銳化物體輪廓,實現(xiàn)圖象增強(qiáng)。
(3)對改進(jìn)的YOLOX網(wǎng)絡(luò)進(jìn)行訓(xùn)練。在設(shè)置YOLOX網(wǎng)絡(luò)參數(shù)的基礎(chǔ)上,利用變電站巡檢機(jī)器人采集到的抄表數(shù)據(jù)集圖象樣本對改進(jìn)的YOLOX網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
(4)電表數(shù)據(jù)識別。將測試圖象輸入訓(xùn)練好的YOLOX網(wǎng)絡(luò)中進(jìn)行識別,并輸出儀表識別的結(jié)果。
本實驗基于Pytorch3.8.11深度學(xué)習(xí)框架搭建改進(jìn)的YOLOX網(wǎng)絡(luò),并在Windows10操作系統(tǒng)上進(jìn)行仿真訓(xùn)練和測試。系統(tǒng)安裝OPENCV等機(jī)器視覺基礎(chǔ)數(shù)據(jù)庫,同時采用VScode作為IDE工具。
改進(jìn)的YOLOX網(wǎng)絡(luò)驗證與對比部分選用COCO數(shù)據(jù)集作為實驗數(shù)據(jù)集。該數(shù)據(jù)集是一個大規(guī)模對象檢測、關(guān)鍵點檢測的數(shù)據(jù)集,共含32.8萬張圖象。
改進(jìn)YOLOX網(wǎng)絡(luò)的儀表圖象選用變電站巡檢機(jī)器人拍攝的智能電表圖片共500張作為實驗數(shù)據(jù),然后將500張圖片按照7∶2∶1的比例分為訓(xùn)練集、測試集和驗證集。訓(xùn)練集圖象格式統(tǒng)一為PascalVOC2007。測試集和驗證集首先圖象通過二值化處理,然后截圖歸類到0~9新建文件夾中,并設(shè)置其格式為XML。
本實驗選用平均精度均值Pavg、精確率P、召回率R作為性能指標(biāo),其計算公式[16-17]:
(4)
(5)
(6)
式中:TP表示真正例;TN表示真負(fù)例;FP表示假正例;FN表示假負(fù)例;K表示類別數(shù)量;AP通過下式計算:
(7)
式中:ri表示第i個精確率插值點對應(yīng)的召回率值。
改進(jìn)YOLOX網(wǎng)絡(luò)的參數(shù)為:迭代次數(shù)300,批大小200,confidence為0.5,學(xué)習(xí)率為0.01。同時YOLOX網(wǎng)絡(luò)的目標(biāo)檢測框是影響網(wǎng)絡(luò)性能的重要參數(shù),通常包括iou-loss和giou-loss兩種。其中iou-loss具有對成型和尺度不變性等特點,可用于回歸任務(wù),但存在iou不相交時loss為0的問題,導(dǎo)致YOLOX算法模型無法繼續(xù)訓(xùn)練,而giou-loss解決了該問題。因此,本實驗選用giou-loss作為改進(jìn)YOLOX算法的目標(biāo)檢測框方案。
圖2為以giou-loss為目標(biāo)檢測框的改進(jìn)YOLOX網(wǎng)絡(luò)模型的訓(xùn)練損失函數(shù)情況。由圖2可知,采用giou-loss作為改進(jìn)YOLOX算法的目標(biāo)檢測框進(jìn)行訓(xùn)練時,可快速收斂達(dá)到穩(wěn)定。
圖2 網(wǎng)絡(luò)損失函數(shù)值變化
3.5.1 算法驗證
為驗證改進(jìn)YOLOX網(wǎng)絡(luò)的有效性,實驗對比了YOLOX網(wǎng)絡(luò)改進(jìn)前后在COCO數(shù)據(jù)集上的性能,結(jié)果如圖3所示。從圖3可知,改進(jìn)YOLOX網(wǎng)絡(luò)的分類損失函數(shù)、置信度損失函數(shù)、重合框損失函數(shù)、總體損失函數(shù)均得到了不同程度的降低,Pavg值也由81.31%時提升到87.23%。由此說明,在YOLOX網(wǎng)絡(luò)的基礎(chǔ)上添加卷積注意力模塊對YOLOX網(wǎng)絡(luò)的改進(jìn)是有效的。
3.5.2 算法對比
為進(jìn)一步驗證改進(jìn)YOLOX網(wǎng)絡(luò)的有效性,實驗對比了網(wǎng)絡(luò)與常用目標(biāo)檢測識別方法SSD算法、DenseBox算法、GA-SVM在COCO數(shù)據(jù)集上的性能,結(jié)果如表1所示。由表1可知,相較于SSD算法和DenseBox算法等,改進(jìn)YOLOX網(wǎng)絡(luò)在Pavg、P和R三項指標(biāo)上的表現(xiàn)均具有明顯優(yōu)勢,分別達(dá)91.44%,96.36%和98.89%。由此說明,改進(jìn)YOLOX網(wǎng)絡(luò)在目標(biāo)檢測識別中具有明顯的優(yōu)勢。
表1 不同算法的識別性能對比
3.5.3 算法應(yīng)用
為檢驗改進(jìn)YOLOX網(wǎng)絡(luò)的實際應(yīng)用效果,研究采用算法對變電站巡檢機(jī)器人自動抄表的數(shù)據(jù)進(jìn)行識別。圖4為改進(jìn)YOLOX網(wǎng)絡(luò)的性能和識別結(jié)果。由圖4可知,改進(jìn)YOLOX算法對變電站巡檢機(jī)器人采集電表數(shù)據(jù)具有良好的識別準(zhǔn)確率,Iouloss值達(dá)到1.25%,Pavg值達(dá)到90.23%,P值達(dá)到93.56%,R值達(dá)到98.12%。由此說明,改進(jìn)YOLOX網(wǎng)絡(luò)可良好適應(yīng)變電站巡檢機(jī)器人的自動抄表識別工作,識別準(zhǔn)確率較高,具有一定的有效性和優(yōu)越性。
圖4 改進(jìn)YOLOX網(wǎng)絡(luò)性能
圖5為改進(jìn)YOLOX算法對變電站巡檢機(jī)器人自動抄表圖象進(jìn)行圖象預(yù)處理后的識別結(jié)果示例。由圖5可知,通過變電站巡檢機(jī)器人的目標(biāo)檢測與識別部分,可清晰識別三行數(shù)字。由此可以得出,改進(jìn)YOLOX網(wǎng)絡(luò)識別準(zhǔn)確率高,識別效果好。
圖5 改進(jìn)YOLOX網(wǎng)絡(luò)對變電站巡檢機(jī)器人抄表圖象的識別結(jié)果示例
綜上,通過對YOLOX網(wǎng)絡(luò)的改進(jìn),實現(xiàn)了對變電站巡檢機(jī)器人自動抄表數(shù)據(jù)的準(zhǔn)確識別。相較于標(biāo)準(zhǔn)YOLOX算法、SSD算法和DenseBox算法,改進(jìn)YOLOX算法在Pavg、P和R三項指標(biāo)上的表現(xiàn)均具有明顯優(yōu)勢,對變電站巡檢機(jī)器人自動抄表的識別Iouloss值達(dá)1.25%,Pavg值達(dá)90.23%,P值達(dá)93.56%,R值達(dá)98.12%。由此可以證明,改進(jìn)方法是可行的。但由于條件限制,本研究在變電站巡檢機(jī)器人圖象數(shù)據(jù)集獲取上,數(shù)據(jù)集還相對較小,同時只是對圖象進(jìn)行簡單的預(yù)處理,而對模糊圖象,機(jī)器人采集中存在的遮擋圖象等還沒有進(jìn)行詳細(xì)處理。下一步將嘗試從多方面獲取變電站巡檢機(jī)器人圖象,并對變電站機(jī)器人進(jìn)行詳細(xì)設(shè)計。