王智睿 康玉卓 曾 璇 汪越雷 張 汀 孫 顯*④
①(中國科學院空天信息創(chuàng)新研究院 北京 100094)
②(中國科學院大學 北京 100049)
③(中國科學院大學電子電氣與通信工程學院 北京 100049)
④(中國科學院網(wǎng)絡信息體系技術(shù)科技創(chuàng)新重點實驗室 北京 100190)
合成孔徑雷達(Synthetic Aperture Radar,SAR)是一種主動式的微波成像系統(tǒng),它不受光照、云霧和氣候等自然條件影響,具備全天時、全天候?qū)Φ赜^測的能力,已成為遙感領(lǐng)域重要的信息獲取平臺[1]。近年來,隨著遙感成像技術(shù)的蓬勃發(fā)展和SAR衛(wèi)星在軌數(shù)量的不斷增加,SAR系統(tǒng)獲取數(shù)據(jù)的數(shù)量和質(zhì)量得到顯著提升,促進了SAR在相關(guān)領(lǐng)域的發(fā)展和應用[2]。海量的高分辨率數(shù)據(jù)為SAR圖像精細化理解提供了豐富的數(shù)據(jù)基礎(chǔ)與支撐[3,4]。
目標檢測和識別是SAR圖像智能化解譯的重要一環(huán)。飛機作為SAR圖像中的典型目標,數(shù)量較多、種類豐富,具有較大的觀測價值[5]?;赟AR圖像的飛機檢測識別能獲取飛機目標的型號、種類、位置、狀態(tài)等信息,可有效輔助重點區(qū)域動態(tài)監(jiān)視、態(tài)勢分析、緊急救援等應用。因此,利用高分辨率SAR圖像對飛機目標進行檢測識別具有重要的研究意義[6]。
近年來,隨著深度學習理論和技術(shù)的發(fā)展,基于卷積神經(jīng)網(wǎng)絡的方法在SAR圖像目標檢測識別領(lǐng)域取得了較大進展[7,8]。在SAR飛機檢測識別方面,Zhao等人[9]提出一種多分支空洞卷積特征金字塔方法,通過建立密集連接來減少冗余信息并突出飛機的重要特征。文獻[10]設計了一個注意力模塊來融合細化低層紋理特征和高層語義特征,進一步提高飛機檢測率。在SAR艦船檢測識別任務中,文獻[11,12]通過直接學習回歸框的位置,來減少對預定義框超參數(shù)的依賴,并且進一步實現(xiàn)艦船目標的細粒度識別。海上艦船容易與海面形成強反射的二面角,在SAR圖像中通常呈現(xiàn)為輪廓完整、連通性強的強散射點集合。相比海上艦船,陸地飛機目標尺寸較小,特征不容易提取,散射點之間較為離散[13,14],準確定位和識別的難度較大。
在實際場景中,SAR飛機檢測識別是一項具有挑戰(zhàn)性的任務。首先,如圖1(a)所示,目標容易受到航站樓和停機坪等周圍背景的干擾,使得具有相似散射視覺屬性的物體被識別為飛機目標,導致出現(xiàn)虛警和漏警的現(xiàn)象[15]。其次,如圖1(b)所示,SAR圖像中飛機由一系列離散的不規(guī)則散射中心亮斑組成,呈現(xiàn)出散射強弱不一致的情況,目標容易被分割成多個離散的部件[16],導致SAR飛機檢測結(jié)果的不完整。此外,如圖1(c)所示,在不同的成像角度下,同一目標會呈現(xiàn)出不同的視覺特征,類內(nèi)差異大,增加了飛機識別的難度[17]。
圖1 SAR飛機檢測識別中的挑戰(zhàn)Fig.1 The challenges in SAR aircraft detection and recognition
針對SAR圖像中背景干擾嚴重和飛機散射點離散問題,本文提出了一種散射感知網(wǎng)絡(Scattering-Aware Network,SA-Net)用于復雜SAR圖像中飛機目標的檢測和識別。一方面,通過上下文引導的特征金字塔模塊來增強全局信息,抑制復雜場景中的強干擾,增強目標的可辨別特征,提高檢測識別的準確率。另一方面,利用散射關(guān)鍵點對目標進行定位,設計散射感知檢測模塊將關(guān)鍵點的分布特性與神經(jīng)網(wǎng)絡相結(jié)合,實現(xiàn)對回歸框的細化校正,提高目標定位的準確性。為了驗證SA-Net的有效性,本文構(gòu)建了一個面向大規(guī)模復雜場景的SAR飛機數(shù)據(jù)集,命名為SAR-AIRcraft-1.0?;谠摂?shù)據(jù)集,本文將幾種常用的深度神經(jīng)網(wǎng)絡模型和SA-Net進行了一系列檢測識別對比實驗。實驗結(jié)果表明,SANet方法的mAP0.5指標達到了77.7%,相比其他方法有較大的提升,證明了散射感知方法的優(yōu)異性能。SAR-AIRcraft-1.0數(shù)據(jù)集已公開發(fā)布在《雷達學報》官網(wǎng)中(https://radars.ac.cn/web/data/getData?newsColumnId=f896637b-af23-4209-8bcc-9320 fceaba19),為SAR飛機檢測、細粒度識別、檢測識別一體化等不同任務研究提供了數(shù)據(jù)基礎(chǔ)。
目前公開的SAR檢測識別數(shù)據(jù)集多數(shù)以艦船目標為主,如表1所示,其中包含了MSTAR (The Moving and Stationary Target Acquisition and Recognition)[18],OpenSARShip[19],SSDD (SAR Ship Detection Dataset)[20],SAR-Ship-Dataset[21],AIR-SARShip-1.0[22],HRSID (High-Resolution SAR Images Dataset)[23],FUSAR-Ship[24]。相比之下,SAR飛機目標檢測識別數(shù)據(jù)集較為有限,公開報道的數(shù)據(jù)集有SADD (SAR Aircraft Detection Dataset)[25]和MSAR-1.0 (large-scale Multi-class SAR image target detection dataset-1.0)[26]。SADD是SAR飛機檢測數(shù)據(jù)集,采集自TerraSARX衛(wèi)星,包含2,966張圖像切片。MSAR-1.0是大規(guī)模多類SAR目標檢測數(shù)據(jù)集,包括飛機、油罐、橋梁和艦船4類目標。這些數(shù)據(jù)促進了神經(jīng)網(wǎng)絡在SAR飛機目標檢測領(lǐng)域的發(fā)展。然而,SADD和MSAR-1.0數(shù)據(jù)集僅包含飛機目標的位置信息,缺少飛機細粒度類別的標注信息,限制了SAR飛機識別領(lǐng)域的進一步發(fā)展。
表1 SAR-AIRcraft-1.0數(shù)據(jù)集與其他SAR目標檢測識別數(shù)據(jù)集的比較Tab.1 Comparison between the SAR-AIRcraft-1.0 dataset and other SAR object detection datasets
為了驗證SA-Net方法的有效性、同時促進SAR飛機目標檢測與識別研究的發(fā)展,本文構(gòu)建了一個面向大規(guī)模復雜場景的SAR飛機目標公開數(shù)據(jù)集,命名為SAR-AIRcraft-1.0。該數(shù)據(jù)集分辨率為1 m,包含4,368張飛機切片,涉及7種細粒度飛機類型,具有場景復雜、類別豐富、目標密集、噪聲干擾、任務多樣、多尺度性的特點,已公開發(fā)布在《雷達學報》官網(wǎng)中(數(shù)據(jù)集下載鏈接,供更多學者免費下載使用,開展進一步的研究。
SAR-AIRcraft-1.0數(shù)據(jù)集中所有圖像采集自高分三號衛(wèi)星,極化方式為單極化,空間分辨率為1 m,成像模式為聚束式。綜合考慮機場規(guī)模和停放飛機的數(shù)量,數(shù)據(jù)集主要選用上海虹橋機場、北京首都機場、臺灣桃園機場3 個民用機場的影像數(shù)據(jù),包含800×800,1000×1000,1200×1200和1500×1500共4種不同尺寸,共有4,368張圖片和16,463個飛機目標實例。飛機的具體類別包含了A220,A320/321,A330,ARJ21,Boeing737,Boeing787,other,各個類別的實例以及數(shù)量如圖2和圖3所示,其中other表示不屬于其余6個類別的飛機實例。此外,該數(shù)據(jù)集具有以下特點:
圖2 不同類別SAR飛機和光學飛機樣本示例Fig.2 SAR and optical aircrafts of different categories
圖3 各個類別的實例數(shù)量Fig.3 The quantity of each type of instances
(1) 場景復雜:數(shù)據(jù)集包含多個民用機場不同時相的圖像,這些圖像覆蓋面積大,背景中包含了航站樓、車輛、建筑物等設施,增加了數(shù)據(jù)集場景的復雜性。
(2) 類別豐富:不同于一般的SAR飛機數(shù)據(jù)集,SAR-AIRcraft-1.0數(shù)據(jù)集包含了飛機目標的細粒度類別信息。此外,不同類別之間相似的散射表征增加了飛機識別的難度。
(3) 目標密集:一張切片圖像中包含多個飛機目標,如圖1(a),多個飛機目標停靠在航站樓附近,分布較為密集,目標之間存在互相干擾,影響檢測識別的準確率。
(4) 噪聲干擾:由于SAR的成像特性,圖像中存在著一些相干斑噪聲的干擾,給飛機目標準確檢測和識別帶來一定的挑戰(zhàn)。
(5) 任務多樣:該數(shù)據(jù)集不僅支持檢測任務,同時包含了類別信息,通過對數(shù)據(jù)集中飛機目標進行裁剪,得到多類別的目標切片,進而可以實現(xiàn)飛機的細粒度識別。此外,位置和類別信息的存在,使其可以應用在檢測識別一體化任務中。
(6) 多尺度性:該數(shù)據(jù)集中飛機目標切片的尺寸分布跨度廣。如圖4所示,有一部分目標尺寸在50×50以下,也有一部分飛機目標尺寸在100×100以上,整體呈現(xiàn)出目標多尺度的特點。
圖4 飛機目標的尺寸分布Fig.4 The size distribution of aircraft targets
在實例的標注方面,SAR-AIRcraft-1.0數(shù)據(jù)集中所有實例目標均使用水平矩形框進行標注,與Pascal VOC格式保持一致。圖5(a)展示了帶標注的目標示例,其中橘色矩形表示標注框,每個矩形左上角名稱表示該目標的類別。每張圖像都有對應的XML文件,如圖5(b)所示,其中每個XML文件包括圖像尺寸大小和實例的詳細信息,如類別和標注框的坐標等?!皊ize”表示切片的長度和寬度,“name”表示飛機類別,“bndbox”表示每個矩形標注框的坐標信息。以圖像的左上角為原點,“xmin”和“xmax”分別表示X坐標的最小和最大位置,“ymin”和“ymax”分別表示Y坐標的最小和最大位置。
圖5 數(shù)據(jù)集標注示意圖Fig.5 The annotated results in the dataset
在實際訓練過程中,將SAR-AIRcraft-1.0數(shù)據(jù)集中的圖像按照7∶1∶2比例分為訓練集、驗證集和測試集。數(shù)據(jù)集包含不同機場的多時相圖像,覆蓋面積大、背景復雜。此外,由于SAR的成像機理,同一場景不同成像角度獲得的圖像也有明顯的差異,這增加了場景的復雜性。因此,該數(shù)據(jù)集在檢測識別方面具有較大的挑戰(zhàn)性。
針對背景中存在強散射干擾的問題,本文提出了結(jié)合散射感知的SAR圖像飛機目標檢測識別一體化的方法??傮w框架如圖6所示,提出的方法基于無錨框(anchor-free)算法的結(jié)構(gòu),主要由上下文引導的特征金字塔網(wǎng)絡(Context-Guided Feature Pyramid Network,CG-FPN)和散射感知檢測頭(Scattering-Aware detection Head,SA-Head)兩個部分組成。
圖6 提出方法的整體結(jié)構(gòu)Fig.6 The overall structure of the proposed method
在特征提取網(wǎng)絡中,考慮到背景干擾對目標特征的影響,本文提出了改進的特征金字塔模塊用于增強全局信息并減少虛警。通過自適應調(diào)整感受野大小,CG-FPN能夠有效結(jié)合周圍信息并增強目標的顯著性。
在定位階段,SA-Head結(jié)合了散射感知檢測模塊中兩階段級聯(lián)回歸,以確保預測的回歸框更加準確。首先,在得到目標的散射關(guān)鍵點之后,利用它們的位置來獲得目標粗略回歸框。之后利用散射引導的自適應檢測頭模塊,將粗略回歸框進一步精細定位,得到位置更準確的檢測框。
上下文引導的特征金字塔模塊整體結(jié)構(gòu)如圖7所示。假設輸入圖像為I ∈RW×H×3,其中W和H表示輸入圖像的寬度和高度。通過對輸入圖像進行下采樣,得到不同層的特征Pl,該特征的大小為(W/sl)×(H/sl)×C,其中sl=2l表 示第l(l=3,4,5)層特征的下采樣率,C設為256。為了獲取最深層的特征,將特征{P3,P4,P5,P6}壓縮調(diào)整(resize)到P7的大小,并通過通道合并(concat)連接起來。
圖7 上下文引導的特征金字塔網(wǎng)絡結(jié)構(gòu)Fig.7 The framework of context-guided feature pyramid network
此外,CG-FPN在融合之后的深層特征上采用不同比率(rate=3,6,12,18,24)空洞卷積[11],并通過每一層特征的密集連接來聚合多尺度語義信息。如圖7所示,每個空洞卷積的輸出都被添加到復制的輸入特征中,與前一層特征整合后輸入到下一層的空洞卷積層。最后,原始特征經(jīng)過上采樣后與空洞卷積的輸出特征進行融合,保持原始特征有助于幫助網(wǎng)絡記憶之前的功能,進而得到包含了淺層細節(jié)和深層語義信息的特征圖。
除了不同層特征之間的融合,CG-FPN希望引入不同通道特征的交互融合。借鑒SENet通道注意力思想[27],首先使用全局平均池化[28]來壓縮空間維度以獲得全局信息;之后將每個特征通道的權(quán)重經(jīng)過自適應調(diào)整,用以反映不同通道之間的相關(guān)性;最后將不同的權(quán)重系數(shù)與對應原始特征進行相乘,得到修正的特征。
為了獲得更多的語義和全局信息,CG-FPN將注意力特征圖A與特征P7連接起來。在此基礎(chǔ)上,將低分辨率特征與上一層對應的特征融合,生成信息豐富的特征。最后,通過一個3×3卷積層輸出最終的特征圖Tl ∈R(W/sl)×(H/sl)×256,該過程計算如下:
3.3.1 粗略定位
本文提出了一種散射感知檢測頭模塊,它結(jié)合散射點的分布關(guān)系來解決離散性問題。該模塊包含定位分支和分類分支,如圖8所示,這兩個分支的卷積層是沒有共享的。將特征提取網(wǎng)絡的l(l=3,4,5,6,7)層 輸出特征作為兩個分支的輸入特征。
圖8 散射感知檢測頭的結(jié)構(gòu)Fig.8 The structure of scattering-aware detection head
在定位分支中,Tl首先經(jīng)過3個3×3的卷積層來獲得同樣尺寸大小的中間特征。然后該特征通過一個256維3×3卷積層和一個18維1×1卷積層來生成偏移域
受DenseBox[29]的啟發(fā),使用中心點的偏移量來得到第1次預測的散射關(guān)鍵點S1,其位置為
為了反映飛機散射點之間的位置關(guān)系,采用監(jiān)督學習的方式對飛機目標散射關(guān)鍵點的空間位置分布進行回歸更新。散射關(guān)鍵點的真值坐標獲取如下[17]:首先利用Harris角點檢測器[30]提取散射強度高的點來反映結(jié)構(gòu)輪廓。之后使用K-Means算法[31]將提取的點分成9個簇,并得到9個聚類關(guān)鍵點相對于飛機切片中心點的位置偏移。這個過程可以去除冗余點進而得到規(guī)則的結(jié)構(gòu)。其中,本文的飛機切片是根據(jù)如圖5所示的真值框(橙色框)進行裁切,對應的XML中包含了真值框的坐標。因此,飛機切片的坐標信息可以通過XML得到,聚類關(guān)鍵點的坐標信息可通過XML和位置偏移得到。本文將最終得到的9個聚類中心作為散射關(guān)鍵點的真值坐標。這些點體現(xiàn)了飛機的散射強度和結(jié)構(gòu)特征分布,可以為目標的判別提供有效信息。
3.3.2 精細定位
在檢測過程中,本文首先獲取目標的關(guān)鍵點坐標,得到其粗略位置。然而,由于散射機制的影響,目標中散射密度較低的組件容易被粗略回歸框遺漏,導致檢測框不夠準確。因此,SA-Head通過精細定位來進一步得到更精確的回歸框。
在分類分支中,特征Tl首先通過3個3×3卷積層以提取原始特征的高層類別語義信息,和定位分支類似,接下來經(jīng)過一個偏移量為 OF1的可變形卷積層和一個1×1卷積層對目標的類別表征信息進行優(yōu)化與修正,使得更加關(guān)注SAR飛機目標的重要散射部分,提高飛機的顯著性,從而增強分類分支的識別能力。總體而言,散射感知的檢測頭模塊結(jié)合了anchor-free框架的特點,利用關(guān)鍵點解碼得到目標框。
總的訓練損失函數(shù)可以分為4部分:
其中,Lloc1和Lloc2分別是第1個和第2個預測框與目標框真值的損失。Lloc計算如下:
其中,n代表目標Q的真值關(guān)鍵點,m代表目標Q的預測關(guān)鍵點。在損失函數(shù)不斷收斂后,模型將得到很好的訓練精度。
Lcls為分類損失,采用Focal Loss[34]函數(shù),通過調(diào)整正負樣本的權(quán)重,以緩解樣本不平衡。
其中,μt=0.25和γ=2 為式(10)的參數(shù),(1-ct)γ為調(diào)節(jié)因子,ct為對應的分類得分。
在第4節(jié)中,首先在SAR飛機檢測、細粒度識別、檢測識別一體化等不同任務中,將提出方法與先進方法進行比較,驗證SA-Net有效性,同時為提供數(shù)據(jù)集的指標基準。之后,對提出的方法進行消融實驗對比,并詳細地分析了實驗效果,對未來工作進行展望。
4.1.1 實驗細節(jié)
本文選取在ImageNet數(shù)據(jù)集上預訓練的Res-Net-50[35]來初始化模型。單次訓練的樣本個數(shù)設置為8,采用隨機梯度下降算法訓練模型。初始學習率被設置為0.001,在訓練40輪次后下降到0.0001以加快模型的收斂速度。所有實驗均在16 GB NVIDIA Tesla P100 GPU環(huán)境下進行。為了進行公平的比較,本文在后續(xù)檢測實驗中保持相同的設置。
4.1.2 目標檢測評價指標
為了定量評價算法的性能,本文指標包含準確率P和召回率R,其計算式如式(11)和式(12)所示:
其中,NTP表示正確檢測到的目標數(shù)量,NFP表示檢測結(jié)果為真,但是真實標簽為負例的虛警。NFN表示檢測結(jié)果為假,但是真實標簽為正例的漏警。本文采用 F1值來更完善評估算法的性能,其公式定義如下:
此外,本文采用了準確率召回率曲線(Precision-Recall Curve,PRC)和平均準確率(Average Precision,AP)。通過按照置信度的降序?qū)︻A測進行排序,在不同的步驟計算準確率召回率對,可以繪制PRC。AP反映了PRC的形狀,可以綜合評價算法的性能。AP指在一組召回率S={0,0.01,0.02,···,1.00}下,最大準確率的平均值,具體計算如式(14)所示:
4.1.3 實驗對比
目標檢測是SAR影像領(lǐng)域的一項基本任務,本文利用SAR-AIRcraft-1.0數(shù)據(jù)集對幾種通用的基準檢測方法進行了訓練和測試,包括Faster R-CNN(Faster Region Convolutional Neural Networks)[36]、Cascade R-CNN[37]雙階段卷積神經(jīng)網(wǎng)絡。近年來,一些無錨框單階段檢測方法的設計能夠大大降低網(wǎng)絡對錨框的參數(shù)敏感性,因此本文對比了Reppoints[38]經(jīng)典無錨框方法和一種SAR目標檢測方法SKG-Net[1]。數(shù)據(jù)利用方面,將所有飛機目標作為正樣本,背景作為負樣本,將所有的飛機目標視為一類。表2展示了不同檢測器下飛機目標的準確率、召回率、F1值、AP0.5和AP0.75指標,從中可以看出,SA-Net在不同閾值下的精度均取得了最高值,體現(xiàn)了方法的有效性。
表2 不同方法的檢測結(jié)果(%)Tab.2 The detection results of different methods (%)
在上述檢測方法中,考慮到SAR飛機目標的稀疏性,大多數(shù)錨框都是冗余的,無錨框檢測算法在AP0.5上取得了較優(yōu)異的效果,Reppoints與SKGNet分別達到了80.3%和79.8%。其原因可能在于無錨框方法減少了矩形框內(nèi)背景雜波的干擾,使得目標語義信息變得更加明確。然而,Reppoints與SKG-Net檢測器結(jié)果中的假陽性樣本(虛警)數(shù)量相對有錨框方法變得更多,導致檢測準確率下降。在雙階段檢測方法中,具有級聯(lián)結(jié)構(gòu)的Cascade RCNN相對于Faster R-CNN進一步提升了平均精度以及各項指標。圖9展示了本文方法和先進方法對比的測試結(jié)果可視化,從圖中可以看出,F(xiàn)aster R-CNN、Reppoints和Cascade R-CNN均存在虛警(黃色)和漏警(藍色框)的情形,而SA-Net有效地減少了漏警和虛警的情況,驗證了本文方法較好的檢測性能。
圖9 可視化結(jié)果展示Fig.9 The visualization results
4.2.1 數(shù)據(jù)描述
本文按照SAR-AIRcraft-1.0數(shù)據(jù)集中的標注框?qū)嵗繕诉M行了裁剪,得到一系列的實例樣本,對應的具體數(shù)量如表3所示。并選擇7類不同的飛機標簽,包括A330,A320/321,A220,ARJ21,Boeing737,Boeing787和other,來進行細粒度識別實驗。
表3 不同類別實例目標的數(shù)量Tab.3 The number of instance targets of different categories
4.2.2 細粒度識別評價指標
為了量化細粒度識別任務的性能,本文使用識別準確率作為評估指標。其對應的計算公式如式(15)所示:
其中,NCi和Nall分別代表Ci類別識別正確的樣本數(shù)量和樣本總數(shù)。
4.2.3 實驗對比
本文采用ResNet-50,ResNet-101,ResNeXt-50,ResNeXt-101[39]和Swin Transformer[40]在SARAIRcraft-1.0數(shù)據(jù)集上開展了相關(guān)實驗。本文選取了訓練集中50%的數(shù)據(jù)用于模型訓練,對應的細粒度識別結(jié)果展示在表4中,從中可以看出ResNet-101的效果優(yōu)于ResNet-50。ResNeXt系列模型在top-1的識別準確率上均達到了很好的性能。Swin Transformer不僅在top-3上性能最高,而且在大部分類別上達到了最好的識別能力,具有優(yōu)異的特征學習能力。
表4 細粒度識別結(jié)果(%)Tab.4 Fine-grained recognition results (%)
為了進一步定量評估模型性能和顯示識別結(jié)果的更多細節(jié),本文繪制了算法模型的混淆矩陣,以顯示不同網(wǎng)絡結(jié)構(gòu)的性能。如圖10所示,對角線上的概率為每個類別正確預測的識別準確率。其中A330,ARJ21和Boeing737的飛機目標識別難度較大,其對應的識別準確率相對較低。此外,Boeing737和Boeing787的圖像較為相似,識別結(jié)果中出現(xiàn)了混淆的情況,一定程度上體現(xiàn)了SAR-AIRcraft-1.0數(shù)據(jù)集的挑戰(zhàn)性。
圖10 混淆矩陣示意圖Fig.10 The confusion matrices for the methods
為了驗證不同深度學習算法的性能,本文選取4種不同方法進行檢測識別一體化的對比實驗,即Faster R-CNN,Cascade R-CNN,Reppoints和SKG-Net,這些方法涵蓋了anchor-based和anchorfree方法。
在實驗過程中,將不同類別的飛機各自視作一類。為了保持數(shù)據(jù)的原始特征,本文沒有使用任何數(shù)據(jù)增強,各個算法的檢測性能展示在表5中。在Faster R-CNN方法中,各個類別的mAP0.5為76.1%,mAP0.75為62.2%。這在一定程度上表明,SARAIRcraft-1.0數(shù)據(jù)集具有一定的檢測難度。首先,不同類別的SAR飛機目標具有相似的結(jié)構(gòu)和大小,目標類別難以區(qū)分。另外,由于SAR圖像的散射特性和成像條件差異,同一類別目標可能會產(chǎn)生不同的成像結(jié)果,進一步增加了識別的難度。
表5 基于深度學習算法的檢測結(jié)果(IoU=0.5)Tab.5 The performance of the algorithms based on deep learning (IoU=0.5)
此外,本文還選擇分割交并比(Intersection over Union,IoU)閾值為0.75的更嚴格指標AP0.75來評價模型,如表6所示。由于融合了全局上下文特征和散射信息,本文提出的SA-Net在mAP0.75上達到了62.8%。此外,每個類別的檢測精度都有一定的差異。例如,與其他類別相比,A320/321在不同算法中的AP0.5和AP0.75性能最好。這主要是因為A320/321的尺寸特殊,機身長度有40多米,很容易區(qū)分。對于某些類型的目標,如ARJ21和A220,由于體積較小,獲取的細節(jié)特征不夠充分,導致檢測精度較低。
表6 基于深度學習算法的檢測結(jié)果(IoU=0.75)Tab.6 The performance of the algorithms based on deep learning (IoU=0.75)
為了直觀地比較各種方法,本文繪制了不同閾值下各種方法的F1曲線,如圖11所示。從圖中可以看出,相比其他先進方法,SA-Net的F1分數(shù)在不同置信度下均取得最高值。這表明提出的方法魯棒性較好,在檢測率和召回率之間達到一個很好的平衡。
圖11 不同先進方法的F1曲線Fig.11 F1 curves of different advanced methods
本文將結(jié)合了可形變卷積的FCOS[41]作為基本網(wǎng)絡(Baseline)。并結(jié)合不同模塊在SAR-AIRcraft-1.0數(shù)據(jù)集上進行消融實驗,實驗結(jié)果如表7所示。從中發(fā)現(xiàn),提出的不同模塊對檢測效果帶來不同程度的提升。與Baseline相比,CG-FPN模塊在AP0.5指標上提升了0.8%。SA-Net網(wǎng)絡的AP0.5和AP0.75比Baseline分別高出0.8%和0.7%,目標可以實現(xiàn)更精準的定位。
表7 所提方法中各個模塊的影響(%)Tab.7 Influence of each component in the proposed method (%)
為了直觀地對不同模塊進行比較,圖12和圖13展示了對應的F1曲線和PR曲線。從圖12可以看出,SA-Net在AP0.5和AP0.75上取得了最優(yōu)的結(jié)果,且在F1曲線的高置信度區(qū)間上達到了最好的性能。本文通過引入SA-Head來對檢測框進行更精準的定位,從圖13可以看出,相比Baseline(藍色曲線),添加SA-Head模塊的PR曲線(橙色曲線)在AP0.5和AP0.75上均得到了有效提升,表明散射感知檢測模塊能夠提高網(wǎng)絡的檢測性能。此外,本文通過引入CG-FPN來增強全局特征以抑制背景中的散射干擾。圖14展示了一些檢測結(jié)果和可視化效果,其中綠色矩形框和黃色圓圈分別表示檢測到的目標和虛警。如圖14(a)所示,受背景中相似建筑物的影響,Baseline中產(chǎn)生了一些虛警。針對這個問題,CG-FPN通過對通道層賦予不同權(quán)重來增強特征的上下文連接。為了進行直觀的比較,將分類分支的最后一層特征圖進行可視化。從圖14(c)和圖14(d)可以看出,添加該模塊之后,飛機目標獲取到更多的注意力,實驗結(jié)果證明CG-FPN能夠有效地增強目標的顯著性,減少復雜背景下的虛警情況。
圖12 不同模塊的F1曲線Fig.12 F1 curves of different improvements in the proposed method
圖13 不同模塊的PR曲線Fig.13 PR curves of different improvements in the proposed method
圖14 檢測結(jié)果和可視化Fig.14 Detection results and visualization
本文利用不同的檢測算法在SAR-AIRcraft-1.0數(shù)據(jù)集上進行了一系列實驗,實驗結(jié)果證明提出的SA-Net方法具有優(yōu)越的性能。部分檢測結(jié)果如圖15所示,其中綠色矩形框、黃色圓圈、藍色圓圈、紅色圓圈分別表示檢測結(jié)果、虛警、漏警、識別錯誤的目標。SA-Net方法中大部分目標都能被準確檢測出來,但是結(jié)果中仍然存在一些虛警和漏警的目標。虛警情況主要是由于復雜背景下航站樓附近出現(xiàn)了與飛機相似的散射表征。此外,由于散射條件的變化,飛機一些部件的散射較弱,影響了目標特征的語義完整性,造成了漏警的問題。
圖15 SA-Net的檢測結(jié)果Fig.15 Detection results of SA-Net
除了這些問題之外,圖15還存在一些錯誤識別的實例,這些實例用紅色圓圈顯示標出。由于目標尺寸較小和語義特征的缺乏,一些飛機被錯誤地識別為其他類別。一些先驗信息的缺乏,例如飛機長度,導致不同類別之間的正確區(qū)分更加困難,總體而言,在SAR-AIRcraft-1.0數(shù)據(jù)集上進行檢測識別是一項具有挑戰(zhàn)性的任務。當前算法的檢測識別性能還存在一些不理想的情況,性能有待進一步提升。在后續(xù)工作中,可以將SAR成像機制和散射特征引入深度卷積神經(jīng)網(wǎng)絡中,進一步提高算法對SAR-AIRcraft-1.0數(shù)據(jù)集的檢測識別性能。
本文提出了一種結(jié)合散射感知的SAR飛機檢測識別方法,通過上下文引導的特征金字塔模塊來增強全局信息,抑制復雜場景中的強干擾,實現(xiàn)特征的有效融合,減少虛警漏警的情況。另外,文中利用散射關(guān)鍵點對目標檢測框進行細化校正,有利于提高定位的準確性。為了驗證方法有效性,本文公開了一個高分辨率的SAR-AIRcraft-1.0數(shù)據(jù)集。該數(shù)據(jù)集包含了不同類別的飛機目標,具有場景復雜、類別豐富、目標密集、噪聲干擾、任務多樣、多尺度性的特點,可以為模型訓練提供豐富的數(shù)據(jù),有利于SAR飛機檢測識別方面的研究。本文將提出的方法和其他深度學習算法在構(gòu)建的數(shù)據(jù)集上進行實驗,結(jié)果表明所提出方法的有效性。在后續(xù)工作中,可以將散射特征信息引入深度卷積神經(jīng)網(wǎng)絡中,進一步提高檢測識別性能。
附錄
SAR-AIRcraft-1.0:高分辨率SAR飛機檢測識別數(shù)據(jù)集依托《雷達學報》官方網(wǎng)站發(fā)布,數(shù)據(jù)及使用說明已上傳至學報網(wǎng)站“SAR-AIRcraft-1.0:高分辨率SAR飛機檢測識別數(shù)據(jù)集”頁面(附圖1),網(wǎng)址:https://radars.ac.cn/web/data/getData?newsColumnId=f896637b-af23-4209-8bcc-9320fceaba19。
附圖1 SAR-AIRcraft-1.0:高分辨率SAR飛機檢測識別數(shù)據(jù)集發(fā)布網(wǎng)頁App.Fig.1 Release webpage of SAR-AIRcraft-1.0: High-resolution SAR aircraft detection and recognition dataset