廖承就,張磊,張惠榮,陳華超,鄭路銘
(1.廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東 惠州 516000;2.廣州中科智巡科技有限公司,廣東 廣州 510623)
輸電線路鐵塔大多分布在荒野地帶,線路分布廣、由于線路“無(wú)圍墻”容易導(dǎo)致線路周邊第三方施工、人為破壞、重車碾壓等隱患,因此需要投入很大成本在輸電線路巡檢等安全防護(hù)上?,F(xiàn)在主要采用人工徒步巡線、無(wú)人機(jī)巡線、人工監(jiān)控?cái)z像頭等判斷是否存在外力破壞危險(xiǎn)的手段。
近年來(lái),智能圖像視頻監(jiān)控技術(shù)被廣泛應(yīng)用于輸電線路場(chǎng)景下的施工機(jī)械入侵報(bào)警任務(wù)中,但是,其對(duì)小目標(biāo)及遮擋目標(biāo)的識(shí)別效果有待提升。本文通過(guò)引入CBAM 模塊,添加了注意力機(jī)制方法,設(shè)計(jì)了Fusion-CBAM 用于增強(qiáng)算法實(shí)現(xiàn),為輸電線路安全隱患分析提供基礎(chǔ)。
YOLOv5 包含3 個(gè)不同尺度的yolo head,每個(gè)yolo head 上預(yù)設(shè)了3 種錨框比例,在同類型算法上具有速度以及精度的優(yōu)勢(shì)。
CBAM 是一種混合注意力機(jī)制方法,是網(wǎng)絡(luò)的一種構(gòu)型,當(dāng)輸入是一組長(zhǎng)度可能會(huì)發(fā)生變化的向量時(shí),實(shí)際訓(xùn)練的時(shí)候無(wú)法充分發(fā)揮這些輸入之間的關(guān)系而導(dǎo)致模型訓(xùn)練結(jié)果效果極差,可以嵌入任何主干網(wǎng)絡(luò)中,以提高算法的性能。
YOLOv5 整體模型結(jié)構(gòu)如圖1 所示,具備以下的優(yōu)點(diǎn):(1)基于CSPDarknet53 網(wǎng)絡(luò)的干網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。(2)對(duì)特征金字塔網(wǎng)絡(luò)(FPN)進(jìn)行了改進(jìn),結(jié)合了路徑聚合網(wǎng)絡(luò)(PANet)。(3)檢測(cè)頭網(wǎng)絡(luò)進(jìn)行特征映射,這一步主要對(duì)融合后的特征圖進(jìn)行,輸出圖像中缺陷目標(biāo)的位置信息和類別信息。如圖1 所示。
圖1 網(wǎng)絡(luò)主體結(jié)構(gòu)
為了充分利用網(wǎng)絡(luò)的注意力,更好地檢測(cè)出被遮擋的施工機(jī)械防外破隱患,通過(guò)設(shè)計(jì)一種融合的CBAM 模塊并將其添加進(jìn)添加進(jìn)網(wǎng)絡(luò)中,如圖2。
圖2 CBAM 注意力機(jī)制
Fusion-CBAM 分別由融合空間注意力模塊以及融合通道注意力模塊的計(jì)算公式可表示為:
在YOLOv5 在訓(xùn)練時(shí)對(duì)錨框進(jìn)行相應(yīng)的計(jì)算,其主要方法如下所示:
(1)計(jì)算數(shù)據(jù)集中所有樣本的寬和高。(2)對(duì)圖片進(jìn)行壓縮,根據(jù)預(yù)設(shè)好的壓縮尺寸進(jìn)行處理。(3)修改框的坐標(biāo),由相對(duì)坐標(biāo)改為絕對(duì)坐標(biāo)。(4)篩選符合一定像素值的標(biāo)注框,過(guò)濾像素值不足的部分。(5)使用k 均值聚類三方得到錨框的計(jì)算結(jié)果。
2.4.1 定位損失
定位損失函數(shù)如下式:
回歸殘差定義如下:
2.4.2 分類損失
分類損失(Focal loss)通過(guò)添加不同的權(quán)重給到不同標(biāo)注數(shù)據(jù)的Loss,來(lái)解決對(duì)分類算法問(wèn)題中的類別不平衡,分類難度相差異較大的情況。交叉熵函數(shù)可表示為:
通過(guò)采集監(jiān)控?cái)?shù)據(jù),標(biāo)注的信息包含類別名稱和位置信息Xmin、Ymin、Zmin、Xmax、Ymax、Zmax。將數(shù)據(jù)按照3∶1∶1 的數(shù)量比例劃分。
配置4 核以上處理器CPU 設(shè)備,使用Tesla T4 顯卡設(shè)備進(jìn)行試驗(yàn)。
算法實(shí)驗(yàn)結(jié)果,如表1 所示。
表1 算法實(shí)驗(yàn)結(jié)果
如圖3 所示,對(duì)目標(biāo)物體進(jìn)行檢測(cè)。
圖3 算法檢測(cè)圖示
針對(duì)復(fù)雜場(chǎng)景下的目標(biāo)遮擋問(wèn)題,設(shè)計(jì)Fusion-CBAM 注意力模塊改進(jìn)YoloV5 算法。通過(guò)改進(jìn)的方法提升了算法對(duì)遮擋目標(biāo)的識(shí)別檢測(cè)的性能。該算法相比改進(jìn)前的分析方法大大提高了召回率。對(duì)視頻監(jiān)控的智能化算法具有很好的實(shí)用價(jià)值。結(jié)合該算法的日常巡檢系統(tǒng),已經(jīng)部署使用,提升了日常巡視的效率。