趙云龍,田生祥,李 巖,羅 龍,齊鵬文
(國網(wǎng)青海省電力公司檢修公司 西寧 810000)
隨著特高壓的逐漸普及,電網(wǎng)規(guī)模越來越大[1]。為了保障輸電安全和質(zhì)量,電力線路巡檢越來越被世界各國重視。由于輸電線架設(shè)高且多架設(shè)于崎嶇地形,人工檢查一方面需要花費(fèi)大量的時(shí)間和精力,另一方面不可避免地存在安全風(fēng)險(xiǎn)。無人機(jī)(unmanned aerial vehicle, UAV)為輸電線路提供了一種新的巡檢方式,即從多個(gè)角度拍攝密集的輸電線路巡檢圖像,建立事后人工查看照片的工作模式。“拍照和查看”的工作流程帶來了巨大的工作量,因此開發(fā)一種智能缺陷檢測方法來自動(dòng)檢查傳輸缺陷照片至關(guān)重要。
用于定位和分類目標(biāo)物體的目標(biāo)檢測算法有望實(shí)現(xiàn)傳輸缺陷照片的自動(dòng)檢查。在深度學(xué)習(xí)發(fā)展前,目標(biāo)檢測依賴于基于圖像處理的手工設(shè)計(jì)算法,如光流法、幀差法等。然而,傳統(tǒng)方法普遍抗干擾、抗噪聲能力較差,且較難適應(yīng)光照變化。當(dāng)前,基于深度學(xué)習(xí)的兩階段目標(biāo)檢測算法在精度上有著較好的表現(xiàn)。
由于架空線路上的鳥巢以及塑料袋、碎布等掛空懸浮物目標(biāo)多數(shù)為小目標(biāo),其包含像素少,且容易被背景干擾,導(dǎo)致檢測較為困難。此類小目標(biāo)物體的檢測有著長遠(yuǎn)的研究價(jià)值,一直廣受關(guān)注。一些研究證明組合不同特征層可以提升小目標(biāo)檢測的效果。文獻(xiàn)[2]利用特征金字塔融合機(jī)制構(gòu)建圖像金字塔,并將金字塔4 個(gè)不同特征層學(xué)習(xí)到的特征與SSD (single shot multibox detector)框架的原始特征進(jìn)行融合用于獲取全局信息。此外,他們將上一層與本層的特征進(jìn)行合并以獲取到局部信息。文獻(xiàn)[3]除了組合卷積層和反卷積層的特征圖外,還在“編碼器-解碼器”架構(gòu)中使用了反卷積層,進(jìn)一步提高了檢測效果。除了組合不同特征層,獲取上下文信息也被證明可用于提高小目標(biāo)檢測的效果。其中,基于注意力機(jī)制的方法通過為提取的特征分配不同權(quán)重以實(shí)現(xiàn)更好的上下文關(guān)聯(lián)效果。擠壓和激勵(lì)網(wǎng)絡(luò)(squeeze-and-excitation networks,SENet)[4]找到輸入特征中每個(gè)通道的重新校準(zhǔn)權(quán)重,并使用這些權(quán)重來提升重要通道。卷積塊注意模塊(convolutional block attention module, CBAM)[5]使用通道注意和空間注意來校準(zhǔn)特征并學(xué)習(xí)更好的表示,以便網(wǎng)絡(luò)可以在下游任務(wù)上表現(xiàn)更好。匯集和激發(fā)模塊(GE)[6]在全局級別聚合特征,并使用匯集的信息增強(qiáng)局部特征的重要組成部分。
當(dāng)前已有一些研究試圖驗(yàn)證深度學(xué)習(xí)在輸電線檢測中的有效性。文獻(xiàn)[7]提出了一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的對絕緣子狀態(tài)進(jìn)行分類的方法。文獻(xiàn)[8]介紹了深度隱含網(wǎng)絡(luò)在絕緣子分類任務(wù)中的有效性。這兩篇論文都展示了深度學(xué)習(xí)方法在傳輸線檢測領(lǐng)域的潛力。一些研究人員嘗試使用基于深度學(xué)習(xí)的目標(biāo)檢測方法來定位輸電線路塔上的組件。文獻(xiàn)[9]構(gòu)建了一個(gè)具有兩個(gè)前景類對象的數(shù)據(jù)集,并訓(xùn)練了一個(gè)六層的神經(jīng)網(wǎng)絡(luò)。文獻(xiàn)[10-12]采用更快的基于感興趣區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)(faster R-CNN[13])算法。文獻(xiàn)[14]提出了一種基于YOLO 算法的絕緣體和減振器檢測模型。這些研究僅應(yīng)用基于深度學(xué)習(xí)的對象檢測方法來定位塔上的組件,但未能檢測到傳輸線照片中的缺陷。
在深度學(xué)習(xí)與輸電線路的結(jié)合中,越來越多的研究集中在缺陷檢測[15-16]上。采用的方法主要分為兩階段方法(如Faster R-CNN[17-18])以及一階段方法(如YOLO 或SSD)。文獻(xiàn)[15]采用基于區(qū)域候選的卷積神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)絕緣子的端到端智能檢測,并可以檢測出故障爆炸的坐標(biāo)。文獻(xiàn)[19]通過基于 Faster R-CNN 以及U-net 來檢測破損絕緣子的位置。文獻(xiàn)[20]采用3 種方法對輸電線路異物實(shí)際數(shù)據(jù)集進(jìn)行測試驗(yàn)證,討論了不同參數(shù)對識別結(jié)果的影響。文獻(xiàn)[21]進(jìn)行了預(yù)測架構(gòu)的級聯(lián)設(shè)計(jì)和并行目標(biāo)檢測結(jié)果的邏輯推理,該機(jī)制可以更快地提高算法在實(shí)際項(xiàng)目下的應(yīng)用效果。文獻(xiàn)[22]基于YOLO 搭建檢測系統(tǒng),使用無人機(jī)自動(dòng)檢查電力傳輸塔和絕緣體。文獻(xiàn)[23]引入了超分辨率卷積神經(jīng)網(wǎng)絡(luò)來增強(qiáng)絕緣子或阻尼器故障的訓(xùn)練數(shù)據(jù)。文獻(xiàn)[24]利用了在線硬樣挖掘和樣本平衡等的優(yōu)點(diǎn)。這些研究為輸電線路航拍圖像缺陷檢測提供了初步的解決方案。
本文提出了一種基于注意力獲取和Soft-NMS的傳輸線路中鳥巢與掛空懸浮物的檢測算法。對比實(shí)驗(yàn)結(jié)果表明,提出的方法可以有效地提高輸電線路鳥巢與掛空懸浮物的檢測效果。本文的主要貢獻(xiàn)為:
1)設(shè)計(jì)了一種基于注意力機(jī)制和ResNet 的主干網(wǎng)絡(luò),允許提取的特征進(jìn)行自適應(yīng)權(quán)重調(diào)整,更充分地進(jìn)行上下文信息的學(xué)習(xí),有利于鳥巢和掛空懸浮物這類小型目標(biāo)的檢測;
2)將Faster R-CNN 中的后處理程序換為Soft-NMS。用于減少同類別檢測框重疊時(shí)的漏檢情況,防止小目標(biāo)的丟失。
本文設(shè)計(jì)的檢測網(wǎng)絡(luò)整體框圖如圖1 所示,其主要由特征提取模塊和檢測模塊兩部分組成。
圖1 網(wǎng)絡(luò)整體架構(gòu)
首先,對輸入的無人機(jī)圖像進(jìn)行尺寸縮放、填充和歸一化等預(yù)處理,接著將預(yù)處理后的圖像輸入特征提取模塊,獲得其深層特征表示,以進(jìn)行下一步的檢測。隨后,將獲得的圖像特征輸入檢測模塊,結(jié)合區(qū)域建議網(wǎng)絡(luò)產(chǎn)生的密集錨框和預(yù)設(shè)的篩選機(jī)制,獲取本文感興趣的鳥巢和掛空懸浮物的區(qū)域,并進(jìn)一步使用全連接層對感興趣區(qū)域中缺陷的位置和類別進(jìn)行檢測,輸出兩種缺陷的具體位置、標(biāo)簽和置信度。最后,對輸出的檢測框進(jìn)行濾除和非極大值抑制等后處理,輸出最終網(wǎng)絡(luò)認(rèn)為屬于鳥巢和掛空懸浮物的檢測結(jié)果。
本文設(shè)計(jì)的特征提取模塊主要包括主干網(wǎng)絡(luò)和特征金字塔結(jié)構(gòu),如圖2 所示。
圖2 加入特征金字塔網(wǎng)絡(luò)的Resnet50-CBAM 圖解
主干網(wǎng)絡(luò)被設(shè)計(jì)為嵌入注意力模塊的ResNet50[25]組合式結(jié)構(gòu)。主干網(wǎng)絡(luò)主要包括C1,C2,C3,C4,C5 共5 個(gè)部分。其中,C1 部分由一個(gè)卷積層、批歸一化層[26]、Relu 激活函數(shù)[27]和最大池化層構(gòu)成。C2,C3,C4,C5 則由參數(shù)不同而結(jié)構(gòu)相同的融入注意力機(jī)制的殘差塊堆疊構(gòu)成,所使用殘差塊的數(shù)量分別為3,4,6,3。預(yù)處理后的無人機(jī)圖像將依次通過C1,C2,C3,C4,C5 五個(gè)部分提取特征。
融入注意力機(jī)制的殘差塊是所提出主干網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu),如圖3 所示。每一個(gè)殘差塊會(huì)在輸入端將輸入的特征信息保留,并在末端將輸入端特征信息與輸出進(jìn)行融合,以防止網(wǎng)絡(luò)深度過深時(shí)梯度消失或梯度爆炸以及退化問題的發(fā)生。每個(gè)殘差塊由3 個(gè)卷積層(分別為一個(gè)1×1 卷積、3×3 卷積和另一個(gè)1×1 卷積)提取特征,本文選擇在每個(gè)殘差塊的3 個(gè)卷積層提取特征后,加入卷積塊注意力模塊,對殘差塊提取的特征進(jìn)行更加合理的權(quán)重分配。這樣的操作允許網(wǎng)絡(luò)在訓(xùn)練過程中,學(xué)習(xí)到更應(yīng)該關(guān)注小目標(biāo)的哪些信息,從而更好地判斷小目標(biāo)的位置和類別。
圖3 ResNet50-CBAM 中殘差塊的結(jié)構(gòu)圖
推斷一個(gè)小目標(biāo)的類別和位置并不一定只依賴其本身的少量像素,還可以利用其周邊信息,即上下文信息。如鳥巢更有可能出現(xiàn)在輸電塔而不會(huì)出現(xiàn)在輸電線路上。本文使用了CBAM 結(jié)構(gòu)來有效地提供這種上下文信息。
CBAM 是一種由卷積層、全連接層、激活函數(shù)等組成的有效的注意力模塊,結(jié)構(gòu)如圖4 所示。給定一個(gè)尺寸為C×H×W的中間特征圖,CBAM 會(huì)依次計(jì)算出通道注意力圖和空間注意力圖,并分別將其與輸入注意力模塊的特征圖進(jìn)行廣播相乘,以實(shí)現(xiàn)考慮了上下文信息的參數(shù)優(yōu)化,如式(1)所示。
圖4 卷積塊注意力模塊結(jié)構(gòu)圖
式中,F(xiàn)為輸入的張量;F′是學(xué)習(xí)到上下文信息的輸出張量;Mc與Ms分別為通道注意力和空間注意力的獲取過程。兩個(gè)過程可以分別表示為:
式中,A vgPool()和 M axPool()分別為全局平均池化和全局最大池化操作;f7×7為卷積核大小為7×7 的卷積層。
如圖中通道注意力虛線部分所示,在通道注意力圖的獲取部分,特征圖F分別經(jīng)過基于寬度W和高度H的池化操作后,得到兩個(gè)C×1×1 的特征圖。然后,將它們分別送入一個(gè)兩層的全連接層,并將輸出結(jié)果執(zhí)行對位相加操作。最后,將注意力圖和特征圖F進(jìn)行對位相乘,得到通道注意力校正后的特征圖。
如圖4 中空間注意力虛線部分所示,輸入特征圖首先通過基于通道維度C的池化操作得到兩個(gè)1×H×W的特征圖,然后將這兩個(gè)特征圖在通道維度上進(jìn)行拼接得到2×H×W的特征圖。接下來,經(jīng)過一個(gè)卷積核大小為7×7的卷積操作,將特征圖重新降維為單通道。再經(jīng)過Sigmoid 激活函數(shù)生成空間注意力圖。最后將該注意力圖和與空間注意力部分的輸入特征圖進(jìn)行廣播相乘,得到最終同時(shí)考慮了通道注意力和空間注意力的特征圖。
淺層的網(wǎng)絡(luò)更關(guān)注像素本身包含的信息,深層次的網(wǎng)絡(luò)則可以提煉出更準(zhǔn)確的語義信息,因此深層次的網(wǎng)絡(luò)更有利于準(zhǔn)確的檢測出較大的目標(biāo)。Faster R-CNN 只在最終特征圖上進(jìn)行預(yù)測,然而圖像中存在不同尺寸的目標(biāo),通過深度確定的網(wǎng)絡(luò)輸出的結(jié)果并不一定完全適配。而網(wǎng)絡(luò)深度增加后,也有可能在下采樣過程中丟失小目標(biāo)的信息。本文所采用的特征金字塔的設(shè)計(jì)思想就是融合主干網(wǎng)絡(luò)中提取的低層特征和高層特征,并且分別在不同的層同時(shí)進(jìn)行預(yù)測,尤其能夠有效改善小目標(biāo)的檢測效果。
如圖2 所示,特征金字塔網(wǎng)絡(luò)以主干網(wǎng)絡(luò)的C2、C3、C4、C5 結(jié)構(gòu)輸出的特征圖作為輸入,從語義信息最為豐富的最高層也就是第五層開始,進(jìn)行上采樣然后與第四層對位相加。融合特征圖進(jìn)一步與第三層以相同操作融合,依次操作,第二層融合特征圖融合了所有上層的信息。各融合特征圖分別經(jīng)過卷積層生成用于預(yù)測的特征圖。第五層融合特征圖還通過最大池化層產(chǎn)生僅用于在區(qū)域建議網(wǎng)絡(luò)中生成錨框和建議框的更高層特征圖。
在檢測模塊中,首先通過過濾預(yù)先設(shè)定的錨框,獲得代表前景區(qū)域的建議在RPN 中的坐標(biāo);然后將其投影到特征提取模塊生成的多尺度特征圖上。根據(jù)提出的方案在特征圖上分割特征矩陣,并利用ROI 池化層進(jìn)行平化。然后,分別通過回歸層和Soft max 層得到預(yù)測位置和標(biāo)簽信息。最后,利用后處理方法對網(wǎng)絡(luò)的冗余輸出進(jìn)行過濾。
后處理算法采用柔和的非極大值抑制(Soft-NMS)算法[28]。執(zhí)行過程如下。該算法對鳥巢和掛空懸浮物兩個(gè)類別分別執(zhí)行。Soft-NMS 算法偽代碼如下。
損失函數(shù)直接移植于Faster R-CNN 的損失函數(shù)。主要包括區(qū)域建議網(wǎng)絡(luò)和檢測網(wǎng)絡(luò)兩部分損失。其中區(qū)域建議網(wǎng)絡(luò)的損失可以表示為:
式中,Lcls表示前景背景的分類損失,類型為交叉熵?fù)p失;Lcls為初步的邊界框回歸損失,類型為光滑的L1損 失;pi表 示第i個(gè)錨框預(yù)測為真實(shí)標(biāo)簽的概率;為正樣本時(shí)為1,為負(fù)樣本時(shí)為0;ti表示預(yù)測第i個(gè)錨框的邊界框回歸參數(shù);表示第i個(gè)錨框?qū)?yīng)的真值框;Ncls表示一個(gè)批次中的所采樣的樣本數(shù)量;Nreg表示特征圖中生成錨框的位置的個(gè)數(shù)。
Fast R-CNN 檢測網(wǎng)絡(luò)的損失為:
式中,Lcls表示類別分類損失,類型為交叉熵?fù)p失;Lloc表 示邊界框回歸損失,類型為光滑的L1損失;p為分類器預(yù)測的softmax 概率分布;u為對應(yīng)目標(biāo)類別的真實(shí)標(biāo)簽;tu為邊界框回歸器預(yù)測的對應(yīng)類別u的回歸參數(shù);V對應(yīng)真實(shí)目標(biāo)的邊界框回歸參數(shù)
本文使用的數(shù)據(jù)集為無人機(jī)采集的輸電線路圖像,共有2 701 張。其中包括鳥巢圖像1 542 張,掛空懸浮物圖像1 159 張。數(shù)據(jù)集中小目標(biāo)(被定義為目標(biāo)邊界框小于 3 2×32像素或?qū)捀吲c圖像的寬高比例小于0.1 的目標(biāo))較多,如圖5 所示。此外,數(shù)據(jù)集圖像中鐵塔結(jié)構(gòu)和傳輸線路交錯(cuò),有著復(fù)雜的背景,給檢測小目標(biāo)帶來了較大的難度。所有真值框的標(biāo)注均由變電站工作人員通過數(shù)月標(biāo)注完成,并以XML 文件的形式與無人機(jī)圖像一同保存為PASCALL VOC 數(shù)據(jù)集格式。所有無人機(jī)采集的輸電線路圖像都為高質(zhì)量的PNG 格式。數(shù)據(jù)集中真值框的尺寸分布如圖6 所示,小目標(biāo)的數(shù)量大,顏色密集。據(jù)統(tǒng)計(jì),小目標(biāo)占比高達(dá)31%。
圖5 數(shù)據(jù)集中的小目標(biāo)樣例
圖6 測試集中真值框的尺寸分布
將2 701 張無人機(jī)圖像以8:2 的比例隨機(jī)制作成訓(xùn)練集和測試集,其中訓(xùn)練集和測試集分別包含2 160 幅和541 幅圖像。在實(shí)驗(yàn)過程中,始終保持訓(xùn)練集和測試集的嚴(yán)格分離。
在實(shí)驗(yàn)中使用隨機(jī)翻轉(zhuǎn)、亮度變換、仿射變換、圖像銳化、噪聲等對原始圖像進(jìn)行5 倍原始圖像數(shù)量的數(shù)據(jù)增強(qiáng),如圖7 所示。數(shù)據(jù)增強(qiáng)可以模擬不同亮度,以及無人機(jī)攝像頭損壞或遭遇信號干擾等情況,從而增加網(wǎng)絡(luò)在實(shí)際應(yīng)用中的魯棒性。
圖7 數(shù)據(jù)增強(qiáng)圖像示例
使用了在Imagenet[28]數(shù)據(jù)集上預(yù)訓(xùn)練的ResNet50主干網(wǎng)絡(luò)權(quán)重,對于加入的CBAM 結(jié)構(gòu)使用凱明初始化。本文模型在2 個(gè)GPU NVIDIA GeForce GTX 2080ti 顯卡上進(jìn)行訓(xùn)練,整個(gè)網(wǎng)絡(luò)架構(gòu)進(jìn)行端到端的訓(xùn)練。學(xué)習(xí)率預(yù)設(shè)為0.015,在前500 次迭代采用學(xué)習(xí)率升溫策略(warm-up),在第12 個(gè)和17 個(gè)迭代輪次執(zhí)行學(xué)習(xí)率的衰減。批次大小為16,采用SGD 梯度下降策略,動(dòng)量為0.9,權(quán)重衰減為0.000 1,共訓(xùn)練了24 個(gè)epoch。訓(xùn)練的流程如圖8 所示。圖9 表示了訓(xùn)練過程中損失與測試集AP 的變化,其中淺色線條為實(shí)際值曲線,深色線條為數(shù)值平滑后的變化曲線??梢娫谟?xùn)練后期,損失和AP 已經(jīng)不再有大幅度的變化,實(shí)現(xiàn)了收斂狀態(tài)。
圖8 模型訓(xùn)練流程
圖9 訓(xùn)練過程中損失與AP 的變化
除了分類的準(zhǔn)確性,還需要對檢測出的隱患的位置的準(zhǔn)確性進(jìn)行評估,因此圖片分類的評估標(biāo)準(zhǔn)不再適用。平均準(zhǔn)確率(AP)能夠同時(shí)兼顧檢測的準(zhǔn)確率和召回率,是最可靠也是當(dāng)前目標(biāo)檢測領(lǐng)域最常用的性能指標(biāo)。AP 的計(jì)算依賴于準(zhǔn)確率和召回率的計(jì)算。
準(zhǔn)確率(Precision)為:
召回率(Recall)為:
式中,TP 表示成功檢測到某個(gè)真值框的預(yù)測框的數(shù)量;FP 表示沒能匹配到某個(gè)真值框的預(yù)測框的數(shù)量;FN 表示沒能檢測出來的真值框的數(shù)量。判斷成功檢測到的標(biāo)準(zhǔn)為交并比閾值,當(dāng)檢測框與真值框的交并比高于閾值時(shí)視為成功檢測到物體。通常情況下交并比閾值設(shè)為0.5。
基于準(zhǔn)確率和召回率的計(jì)算,AP 的計(jì)算流程如下:1)網(wǎng)絡(luò)最終輸出的某一類別的檢測框?yàn)镹個(gè),將N個(gè)檢測框按照置信度進(jìn)行排序;2)依次計(jì)算排名的前1 個(gè)、前2 個(gè)、···、前N個(gè)檢測框的準(zhǔn)確率和召回率;3)將準(zhǔn)確率作為縱軸,召回率作為橫軸,依次將步驟2)中計(jì)算得到的準(zhǔn)確率和召回率連接成線,該曲線的下面積即為該類別的平均準(zhǔn)確率。
將具有代表性的目標(biāo)檢測架構(gòu)與本文模型的檢測效果進(jìn)行了對比,如表1 所示。所有代表性的網(wǎng)絡(luò)架構(gòu)都使用了與本文模型相同的數(shù)據(jù)作為訓(xùn)練集和測試集,使用相同的數(shù)據(jù)增強(qiáng)策略。訓(xùn)練過程中,所有網(wǎng)絡(luò)架構(gòu)均使用了Imagenet[29]上的預(yù)訓(xùn)練權(quán)重初始化主干網(wǎng)絡(luò),經(jīng)過參數(shù)的調(diào)整達(dá)到了最佳效果,以保證對比實(shí)驗(yàn)的有效性。
表1 檢測算法AP 對比
各架構(gòu)訓(xùn)練所得的結(jié)果均為IOU 閾值為0.5 時(shí)的AP 檢測結(jié)果。與基礎(chǔ) Faster R-CNN 相比,本文方法在兩個(gè)類別上分別提高了約4.7%和5.9%。
訓(xùn)練后的網(wǎng)絡(luò)在部分測試集中鳥巢和掛空懸浮物上的檢測效果分別如圖10 和圖11 所示。圖10中大部分鳥巢(如第二、三、五、六張)為像素占比極低的小目標(biāo),網(wǎng)絡(luò)有著較好的檢測效果。圖11中,部分懸浮物(如第一、三、四張)為小目標(biāo),且存在定位較難的長條形目標(biāo)(如第二、五、六張)。其中第五張由于懸浮物屬于長條形,其一部分也被定位為目標(biāo)。但同時(shí),網(wǎng)絡(luò)也檢測到了整體懸浮物,在實(shí)際應(yīng)用中,對檢測效果影響較小。此外,本文模型在復(fù)雜的背景下,如交錯(cuò)的鐵塔和線路構(gòu)造(圖10 中第三張,圖11 中第一、四張)采樣圖像中,模型也有可觀的表現(xiàn)。
圖11 掛空懸浮物檢測效果
使用熱力圖對提出方法的可視化結(jié)果如圖12所示,其中,第一行為在原圖中的熱力顯示,第二行為網(wǎng)絡(luò)的熱力圖。方框內(nèi)如期望檢測的目標(biāo)。第一張與第二張圖像為鳥巢檢測,第三與第四張為懸浮物檢測??梢姡岢龇椒▽旊娋€敏感,存在較低熱度,而對鳥巢與懸浮物極為敏感,在熱力圖中呈現(xiàn)為紅色。
圖12 提出方法的熱力圖可視化
表2 中使用基準(zhǔn)算法Faster R-CNN 以及本文提出的方法對邊界框小于3 2×32像素或?qū)捀吲c圖像的寬高比例小于0.1 的目標(biāo)進(jìn)行了檢測,召回率對比顯示,本文方法對于小目標(biāo)的召回率更高,有效減少了小目標(biāo)的漏檢。
表2 小目標(biāo)召回率對比
本文提出了一種基于注意力機(jī)制和Soft-NMS的兩階段傳輸線路目標(biāo)檢測方法。制作了包含鳥巢和掛空懸浮物無人機(jī)圖像的目標(biāo)檢測數(shù)據(jù)集。該方法利用了注意力機(jī)制的優(yōu)勢,更好地利用了圖像的上下文信息。此外,采用了更適配小目標(biāo)檢測的后處理算法,減少了小目標(biāo)的漏檢。