熊昌全 張宇寧 楊和生 唐道建 劉詩劍
(1.國家電投集團四川電力有限公司,四川 成都 610213;2.國家電投集團西南能源研究院有限公司,四川 成都 610218)
隨著我國大規(guī)模輸電線路網(wǎng)絡(luò)的發(fā)展建設(shè),部分輸電線路不可避免地需要穿越地質(zhì)復(fù)雜、易發(fā)生滑坡的區(qū)域。輸電桿塔作為輸電線路的連接節(jié)點,常常需要修建在人煙稀少的地區(qū),這樣的地理環(huán)境條件增加了地質(zhì)災(zāi)害發(fā)生的可能性,一旦出現(xiàn)滑坡災(zāi)害,不及時進行處理,則會導(dǎo)致桿塔基礎(chǔ)變形損壞,嚴(yán)重威脅輸電線路的安全運行。
2006年,Hinton等人在Science上發(fā)表的論文提出了“深度學(xué)習(xí)”的概念,解決了深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難的問題,打開了深度學(xué)習(xí)的大門。近二十年來,隨著計算機運算能力的大幅提高,深度學(xué)習(xí)得到了迅速發(fā)展,在各個領(lǐng)域都有大量應(yīng)用。
由于滑坡常發(fā)生于人煙稀少的地區(qū),故滑坡圖像一般為衛(wèi)星圖或無人機航拍圖,而衛(wèi)星圖中滑坡圖像尺寸較小,無人機航拍圖滑坡圖像尺寸較大,所以存在數(shù)據(jù)目標(biāo)尺寸差異較大、不統(tǒng)一的問題。
針對上述問題,Wang等人[1]使用地理數(shù)據(jù)庫,對比卷積神經(jīng)網(wǎng)絡(luò)這一深度學(xué)習(xí)方法以及強化學(xué)習(xí)、隨機森林、SVM、強化學(xué)習(xí)4種機器學(xué)習(xí)方法在識別滑坡時的精度,指出卷積神經(jīng)網(wǎng)絡(luò)具有較高的魯棒性及準(zhǔn)確率;Cheng等人[2]在YOLOv4的基礎(chǔ)上提出一種新的YOLO-SA滑坡檢測模型,對比11種現(xiàn)有的目標(biāo)檢測模型,在精度及運行速度上得到了極大的提升;巨袁臻等人[3]利用Mask R-CNN,結(jié)合谷歌地球影像數(shù)據(jù)實現(xiàn)了對黃土滑坡的自動識別。吳琪等人[4]針對10種網(wǎng)絡(luò)結(jié)構(gòu)以及4種注意力機制對滑坡識別的影響進行了分析,得出ResNet-101結(jié)構(gòu)具有最高的準(zhǔn)確率及召回率,ResNet-101+DAN模型為最佳模型。
本文以YOLOv5網(wǎng)絡(luò)模型為基礎(chǔ),提出一種改進YOLOv5(YOLOv5-BC)深度學(xué)習(xí)滑坡災(zāi)害識別方法,將原有的PANet層替換為BiFPN結(jié)構(gòu),提高網(wǎng)絡(luò)多層特征融合能力,引入CIoU損失函數(shù)替換原本的GIoU損失函數(shù),使最終預(yù)測框更接近真實框,提升了網(wǎng)絡(luò)的預(yù)測精度,通過在滑坡數(shù)據(jù)集上進行訓(xùn)練測試,取得了較好的識別效果。
YOLOv5算法是YOLO系列的一個延伸,可以看作是YOLOv3、YOLOv4的改進,相比YOLOv4算法,YOLOv5的輸入端保留了Mosaic增強,嵌入了自適應(yīng)錨框計算及自適應(yīng)圖片縮放,有效提高了檢測速度;Backbone部分保留了CSP(Cross Stage Partial Network)模塊,引入了Focus結(jié)構(gòu),減少了計算量,降低了內(nèi)存的使用量;Neck部分使用了FPN和PAN結(jié)構(gòu)進行采樣操作,增強了網(wǎng)絡(luò)進行特征提取的能力;Output部分使用GIoU損失函數(shù)作為邊框預(yù)測的損失函數(shù),采用非極大值抑制NMS對冗余的框進行抑制。
本文從Neck部分及Output部分入手,針對原版YOLOv5進行改進,提升算法對尺度差別很大的數(shù)據(jù)集的識別準(zhǔn)確率。
YOLOv5使用的PANet網(wǎng)絡(luò)較為簡單,是在Faster-RCNN中的FPN基礎(chǔ)上提出的從下向上的二次融合網(wǎng)絡(luò),簡單地增加了從下而上的融合路徑,在進行特征融合時,未考慮不同的輸入特征圖貢獻不同。針對這個問題,采用EfficentDet-BiFPN[5]替代PANet,BiFPN在原先的FPN基礎(chǔ)上增加了添加上下文信息的邊,對每個邊都乘一個對應(yīng)的權(quán)重,實現(xiàn)多尺度特征融合。FPN、PANet、BiFPN結(jié)構(gòu)如圖1所示。
圖1 FPN、PANet、BiFPN結(jié)構(gòu)
相比PANet,BiFPN有如下改進:(1)BiFPN刪除了只有一條輸入邊的節(jié)點,簡化了雙向網(wǎng)絡(luò);(2)當(dāng)原始輸入節(jié)點和輸出節(jié)點處于同一層時,在原始輸入節(jié)點和輸出節(jié)點之間添加一條額外的邊,在不增加太多運算成本的情況下實現(xiàn)了融合更多的特性;(3)相比只有一個自上而下和自下而上的雙向通路的PANet,BiFPN將每個雙向通路作為一個特征層,并重復(fù)同一個特征層多次,實現(xiàn)高層次特征融合;(4)為每個輸入增加權(quán)重值,在特征融合時區(qū)分各個輸入特征圖的重要性,可以快速歸一化地進行特征融合。
2.2.1 GIoU損失函數(shù)
YOLOv5網(wǎng)絡(luò)使用的回歸函數(shù)為GIoU[6]函數(shù),公式為:
式中:IoU為交互比函數(shù),用于評判預(yù)測框與真實框的重合程度,IoU越高,重合程度越高;A為目標(biāo)框;B為預(yù)測框;C為包括A與B的最小矩形框;LGIoU為GIoU的Loss函數(shù)。
GIoU解決了IoU存在的無法優(yōu)化兩框不相交的情況的問題,但在實際使用中發(fā)現(xiàn)GIoU存在以下兩個問題:(1)當(dāng)預(yù)測框和真實框不對齊時,會導(dǎo)致外接框C的面積增大,使GIoU值變??;(2)當(dāng)目標(biāo)框與預(yù)測框?qū)儆诎P(guān)系時,GIoU會退化為IoU,無法判斷兩者相對位置關(guān)系。
2.2.2 CIoU損失函數(shù)
針對GIoU存在的問題,引入CIoU[7]替代GIoU,CIoU將GIoU的最小外接框C替換為最小化兩個Box中心點的標(biāo)準(zhǔn)化距離,并將Bounding box的縱橫比考慮進損失函數(shù)中,公式如下:
式中:ρ2(b,bgt)為兩個框中心點的歐氏距離,b,bgt為預(yù)測框B與真實框A的中心點;c為同時包含預(yù)測框與真實框的最小區(qū)域的對角線距離;α為用作trade-off的參數(shù);v為用來衡量長寬比一致性的參數(shù);w與h分別表示預(yù)測框的寬和高;wgt、hgt分別表示真實框的寬和高。
CIoU相對GIoU有如下特點:(1)CIoU與GIoU均具有尺度不變性;(2)CIoU在目標(biāo)框不重疊時,仍可以為邊界框提供移動方向;(3)CIoU可以直接最小化兩個目標(biāo)框的距離,較GIoU收斂快;(4)CIoU在兩個框完全重疊時仍能很快回歸,GIoU則退化為IoU;(5)引入BoundBox的縱橫比,進一步提高了回歸精度。
實驗環(huán)境如表1所示。
表1 實驗環(huán)境
目前,公開數(shù)據(jù)集中并無公開的滑坡數(shù)據(jù)集,因此本文收集Google Earth滑坡發(fā)生后的衛(wèi)星云圖圖像及滑坡地區(qū)的無人機航拍圖像構(gòu)建滑坡數(shù)據(jù)集,共包含滑坡圖像1 247張,使用labelImg標(biāo)注圖像中的滑坡區(qū)域,數(shù)據(jù)集按照8:1:1比例劃分訓(xùn)練集、測試集、驗證集。
分別采用YOLOv5-BC模型、YOLOv5模型、Faster-RCNN模型對滑坡數(shù)據(jù)集訓(xùn)練300輪,使用SGD優(yōu)化器進行權(quán)重更新,學(xué)習(xí)率α設(shè)置為0.01,batch-size(批次大?。┰O(shè)置為64。
YOLOv5-BC訓(xùn)練Loss曲線如圖2所示。
圖2 YOLOv5-BC訓(xùn)練Loss曲線圖
識別效果如圖3所示。
圖3 YOLOv5-BC識別效果圖
最終實驗結(jié)果如表2所示。
表2 實驗結(jié)果
根據(jù)表2的對比結(jié)果可以看出,由于滑坡數(shù)據(jù)集存在目標(biāo)尺寸大小不一、差距過大的問題,YOLOv5算法及Faster-RCNN算法表現(xiàn)較差,改進算法YOLOv5-BC對滑坡數(shù)據(jù)集的計算精度相比Faster-RCNN及YOLOv5顯著提高,分別取得了37.7%及27.9%的提升。
本文提出了一種用于識別輸電線路走廊滑坡災(zāi)害的改進YOLOv5(YOLOv5-BC)算法,通過將YOLOv5的Neck部分PANet結(jié)構(gòu)替換為BiFPN結(jié)構(gòu),優(yōu)化了特征融合網(wǎng)絡(luò),增強了對尺寸差異大的圖像的檢測能力;將GIoU損失函數(shù)替換為CIoU損失函數(shù),提高了目標(biāo)框回歸損失,提高了檢測精度。
構(gòu)建了滑坡數(shù)據(jù)集,基于構(gòu)建的數(shù)據(jù)集對不同模型進行了測試,驗證了YOLOv5-BC模型的有效性,相比Faster-RCNN及YOLOv5模型的mAP@0.5分別提高了37.7%及27.9%,達到了79.2%。
實驗結(jié)果表明,本文提出的YOLOv5-BC模型,具有實際應(yīng)用于輸電線路走廊滑坡災(zāi)害識別的潛力。