李洋,梁瀟,賈海薩
?目標(biāo)特性與探測跟蹤技術(shù)?
基于知識蒸餾的SAR圖像艦船目標(biāo)檢測*
李洋,梁瀟,賈海薩
(中國人民解放軍92941部隊,遼寧 葫蘆島 125000)
隨著深度學(xué)習(xí)的快速發(fā)展,目標(biāo)檢測網(wǎng)絡(luò)模型在SAR圖像艦船檢測取得了很大的成功。為了取得更好的效果,往往采取規(guī)模很大的檢測網(wǎng)絡(luò),這需要更多的計算資源并且推理更慢。知識蒸餾能夠有效地壓縮網(wǎng)絡(luò),但當(dāng)前的知識蒸餾大都是對于圖像分類問題。在分析SAR圖像中艦船與背景差異的基礎(chǔ)上,提出局部與全局蒸餾的艦船目標(biāo)檢測方法。考慮到艦船在SAR圖像中的散射特性,對艦船樣本數(shù)據(jù)進(jìn)行幅值方向的切片預(yù)處理,作為具有更顯著散射特性的單獨數(shù)據(jù)通道,提升了網(wǎng)絡(luò)輸入數(shù)據(jù)的質(zhì)量。利用SSDD(SAR ship detection dataset)艦船數(shù)據(jù)集開展目標(biāo)檢測實驗和評估。實驗結(jié)果表明,所提出的方法能夠在輕量化網(wǎng)絡(luò)下,提升艦船檢測性能,mAP能達(dá)到90.7%。
合成孔徑雷達(dá);目標(biāo)檢測;艦船;深度學(xué)習(xí);知識蒸餾
合成孔徑雷達(dá)(synthetic aperture radar,SAR)具有全天候、全時的成像特性。因此,它受到世界各國的廣泛重視,已成為人們觀察地球的重要工具之一。因此,SAR圖像廣泛應(yīng)用于地球觀測任務(wù),尤其是海洋目標(biāo)監(jiān)測、海上救援和港口安全。由于SAR圖像的特殊性,利用SAR圖像進(jìn)行艦船目標(biāo)檢測具有明顯的優(yōu)勢,使大范圍全天候艦船監(jiān)視任務(wù)成為可能。
在過去的幾十年里,人們在SAR圖像中提出了許多艦船目標(biāo)檢測方法。在所有傳統(tǒng)的檢測方法中,基于恒虛警率(constant false alarm rate,CFAR)的方法應(yīng)用最為廣泛。WANG Chonglei等[1]提出了一種強(qiáng)度空間域恒虛警檢測器,它利用數(shù)據(jù)相關(guān)性來檢測目標(biāo)像素和尾跡像素。LENG Xiangguang等[2]提出了一種具有雙邊結(jié)構(gòu)的恒虛警檢測器,該檢測器通過同時考慮強(qiáng)度信息和位置信息來減少斑點噪聲和海雜波的干擾。PAPPAS O等[3]提出了一種超像素級恒虛警檢測器,它通過利用超像素技術(shù)獲得感興趣的區(qū)域,在減少虛警方面提供了優(yōu)越的性能。這些方法在場景相對簡單的情況下,通過分析SAR圖像的特征,取得了具有良好的效果。然而,當(dāng)目標(biāo)區(qū)域被幾個像素占據(jù)時,基于CFAR的方法很難提取有效的目標(biāo)信息,導(dǎo)致性能有限,漏報率高。
近年來,隨著深度學(xué)習(xí)理論的蓬勃發(fā)展,基于深度網(wǎng)絡(luò)的目標(biāo)檢測取得了巨大進(jìn)展?;诰矸e神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的高性能檢測網(wǎng)絡(luò)分為兩階段網(wǎng)絡(luò)如Faster R-CNN[4],Cascade R-CNN[5]等,基于錨框的單階段如RetinaNet[6],Single-Shot-multibox-Detector(SSD)[7]等和無錨框的單階段檢測器如CenterNet[8],F(xiàn)COS[9]。一級檢測器直接在特征圖上獲取目標(biāo)的分類和回歸框。相比之下,兩級探測器利用RPN和R-CNN獲得更好的結(jié)果,但花費(fèi)更多的時間。之前的錨框提供了一個階段模型,提出了檢測目標(biāo)的建議。然而,錨框的數(shù)量遠(yuǎn)遠(yuǎn)超過目標(biāo),這會帶來額外的計算量。而無錨檢測器則提供了一種直接預(yù)測目標(biāo)關(guān)鍵點和位置的方法。
為了提高檢測精度以及效率,許多研究提出了不同的基于深度網(wǎng)絡(luò)的SAR圖像艦船目標(biāo)檢測方法,在各方面取得良好的效果。JIAO Jiao等[10]設(shè)計了一個具有密集連接結(jié)構(gòu)的網(wǎng)絡(luò),其目的是通過將上層的高分辨率特征地圖與下層提取的特征地圖合并來解決多尺度問題。FU Jiamei等[11]提出了一種特征平衡和細(xì)化網(wǎng)絡(luò),該網(wǎng)絡(luò)通過細(xì)化目標(biāo)特征和加強(qiáng)語義信息,極大地提高了檢測性能。CUI Zongyong等[12]提出了一種通過CenterNet在大尺寸SAR圖像中進(jìn)行艦船檢測的方法,該方法應(yīng)用了一個帶有組卷積的注意模塊,以增強(qiáng)所學(xué)習(xí)的特征,并排除海岸對艦船目標(biāo)檢測的干擾。
為了獲得更好的性能,通常使用更大的主干網(wǎng),這意味著需要更多的計算資源和更慢的推理。為了克服這個問題,有人提出了知識蒸餾[13]。知識蒸餾是一種將大型教師網(wǎng)絡(luò)中的信息繼承到一個緊湊的學(xué)生網(wǎng)絡(luò)中,并在推理過程中不增加額外成本而獲得強(qiáng)大性能的方法。Hinton等首先提出了該方法,該方法使用輸出作為軟標(biāo)簽,將從大型教師網(wǎng)絡(luò)轉(zhuǎn)移到小型學(xué)生網(wǎng)絡(luò),用于分類任務(wù)。最近,一些工作已經(jīng)成功地將知識蒸餾應(yīng)用于目標(biāo)檢測。CHEN Guobin等[14]首先通過提取頸部特征、分類頭和回歸頭的知識,將知識提取應(yīng)用于檢測。然而,由于前景和背景之間的不平衡,提取整個特征可能會引入很多噪聲。LI Quanquan等[15]選擇從區(qū)域生成網(wǎng)絡(luò)(region proposal network,RPN)中采樣的特征來計算蒸餾損失?;谔卣鞯闹R蒸餾(feature-based knowledge distillation,F(xiàn)BKD)[16]分別使用注意力掩膜和非局部模塊來引導(dǎo)學(xué)生并提取教師與學(xué)生之間的關(guān)系,它同時提取前景和背景。焦點和全局知識蒸餾(focal and global knowledge distillation,F(xiàn)GKD)[17]使用局部分離目標(biāo)與背景,使用全局蒸餾彌補(bǔ)局部蒸餾損失的全局信息。
然而,對SAR圖像艦船檢測,因為艦船與背景存在不同的散射信息,因此蒸餾的關(guān)鍵問題是選擇有價值的蒸餾區(qū)域,即艦船區(qū)域。之前的提取方法對所有像素和通道進(jìn)行同等處理,或同時提取所有區(qū)域。大多數(shù)方法缺乏對全局上下文信息的提煉。在本文中,使用真實標(biāo)注來分離圖像,然后使用教師的注意掩膜來選擇關(guān)鍵部分進(jìn)行蒸餾。此外,捕獲不同像素之間的全局關(guān)系,并將其提取給學(xué)生。
因為SAR圖像艦船檢測的一個主要難點是背景雜波的影響,為了抑制SAR圖像的雜波散射信息,引入二維切片來抑制雜波干擾,從而增強(qiáng)SAR圖像艦船散射強(qiáng)度信息。
考慮當(dāng)前SAR圖像艦船檢測面臨的復(fù)雜背景雜波的干擾問題,以及模型部署對于壓縮網(wǎng)絡(luò)模型的需求,本文提出通過輸入數(shù)據(jù)預(yù)處理來增強(qiáng)目標(biāo)散射信息以及抑制雜波背景,并通過知識蒸餾方法來壓縮網(wǎng)絡(luò)模型。
由于SAR特殊的電磁散射成像機(jī)理,導(dǎo)致SAR圖像特性不同于常見的光學(xué)圖像,這也是SAR圖像解譯的一個難點。SAR圖像艦船檢測中,背景通常是海面或者是近岸港口。影響SAR艦船檢測性能的一個重要因素就是近岸復(fù)雜背景雜波的干擾,這些干擾常常造成虛警。相比于散射特性起伏較大且變化雜亂的背景雜波,SAR圖像中的艦船目標(biāo)往往具有顯著的散射點或區(qū)域,并且呈現(xiàn)出較規(guī)則的特性。但,由于艦船為大型金屬目標(biāo),并具有復(fù)雜的人造結(jié)構(gòu),因此往往其強(qiáng)散射點帶來的旁瓣也較強(qiáng),這會影響深度神經(jīng)網(wǎng)絡(luò)的高層語義特征提取。
針對上述問題,本文考慮一種簡要的預(yù)處理方法,即在幅值方向上進(jìn)行量化得到二維切片圖像,以不同切片后的圖像表示不同的散射信息。
具體來說:將SAR圖像中()處像素值與設(shè)定的閾值進(jìn)行比較,如果()處像素值大于或等于設(shè)定的閾值,就保留該處的像素,否則置零。最后得到的二維切片圖像只保留想要的散射信息,這樣強(qiáng)散射中心導(dǎo)致的旁瓣得到有效抑制。閾值設(shè)定得越大,保留的散射信息對應(yīng)原始圖像中散射越強(qiáng)的部分。通過設(shè)定多個閾值,可以得到不同的切片圖像。
顯然,低閾值對應(yīng)底層的切片,其保留了原始圖中絕大部分的信息。而高閾值對應(yīng)的切片只保留較強(qiáng)的散射中心。由于艦船的散射往往呈現(xiàn)為強(qiáng)散射特征,因此,高閾值層切片也能保留大部分艦船目標(biāo)的信息。
圖1是對歸一化幅值按照等間隔取8個閾值并切片得到的圖像,其中a)~h)分別表示閾值從小到大的第1層到第8層切片。從圖中清晰可見,低層切片圖像保留了絕大部分的信息,而隨著閾值越大,濾除的強(qiáng)散射中心旁瓣和低值雜波越多。根據(jù)圖1h)可以看出,其中的背景雜波被明顯抑制,而對于艦船目標(biāo)信息卻能幾乎全部保留,而且目標(biāo)整體結(jié)構(gòu)更加清晰。
根據(jù)上述分析,又因為SAR圖像是單通道圖像,將選取中間和最高層的2片切片作為2個通道,和原SAR圖像一起作為三通道圖像送進(jìn)檢測網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)。
選取Faster R-CNN作為基準(zhǔn)檢測網(wǎng)絡(luò)驗證本文提出的通過切片抑制雜波散射信息, Faster R-CNN在Fast R-CNN的基礎(chǔ)上進(jìn)一步優(yōu)化,用CNN網(wǎng)絡(luò)代替Fast R-CNN中使用傳統(tǒng)Selective Search方法的Region Proposal模塊,從而實現(xiàn)了全神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測,在召回率和速度上都超過了傳統(tǒng)的Selective Search。
1.2.1局部知識蒸餾
對于前景和背景的不平衡,提出了局部蒸餾來分離圖像,并引導(dǎo)學(xué)生聚焦關(guān)鍵像素和通道。首先,設(shè)置一個二值掩碼來分離背景和前景。
式中:為真實標(biāo)注;,分別為特征圖的水平和垂直坐標(biāo)。如果(,)在真實標(biāo)簽內(nèi),那么(i,j)=1,否則為0。
尺度較大的目標(biāo)由于像素較多,損失較大,影響了小目標(biāo)的提取。在不同的圖像中,前景與背景的比例有很大的差異。因此,為了平等地對待不同的目標(biāo),平衡前景和背景的損失,所以應(yīng)用縮放掩模:
式中:H和W表示真實標(biāo)簽的高度和寬度。如果一個像素屬于不同的目標(biāo),選擇最小的框來計算。在本文中,應(yīng)用文獻(xiàn)[17]的方法來選擇焦點像素和通道,然后得到相應(yīng)的注意掩膜。
局部蒸餾損失函數(shù)如下:
1.2.2全局知識蒸餾
不同像素之間的關(guān)系具有寶貴的知識,可用于提高檢測任務(wù)的性能。因此提出了全局蒸餾,其目的是從特征圖中獲取不同像素之間的全局關(guān)系,并將其從教師網(wǎng)絡(luò)蒸餾到學(xué)生網(wǎng)絡(luò)。
利用GcBlock[18]在單個圖像中捕獲全局關(guān)系信息,并強(qiáng)制學(xué)生網(wǎng)絡(luò)從教師網(wǎng)絡(luò)那里學(xué)習(xí)全局關(guān)系。全局蒸餾損失函數(shù)如下:
式中:W,W1和W2表示卷積層;表示層標(biāo)準(zhǔn)化;N表示特征中的像素數(shù);表示平衡損失的超參數(shù)。
綜上所述,對學(xué)生網(wǎng)絡(luò)的總損失為
式中:original表示檢測器原始的損失。在本文中使用Faster R-CNN的損失函數(shù)。教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)分別使用不同的骨干網(wǎng)絡(luò),具體細(xì)節(jié)將在實驗部分介紹。
為了評價所提出方法的性能,采用公開發(fā)布的SAR圖像艦船檢測數(shù)據(jù)集SSDD作為實驗數(shù)據(jù)。SSDD數(shù)據(jù)集中的SAR圖像是通過RadarSat-2, TerraSAR-X, and Sentinel-1獲取的,共有1 160幅SAR圖像和2 456艘艦船。每張圖片的平均船只數(shù)量為2.12艘。SSDD中的SAR圖像包括HH,HV,VV和VH極化模式。場景包含近岸以及遠(yuǎn)海。圖像分辨率1~15 m。選取后綴索引為1和9的作為測試集(共232張圖像),其余作為訓(xùn)練集(共928張圖像)。圖2給出了該數(shù)據(jù)集中的部分樣本。
本文采用選擇準(zhǔn)確率(precision,P),召回率(recall,R),F(xiàn)1值(F1-score,F(xiàn)1)以及平均精度(mean average precision,mAP)作為指標(biāo)來評估本文方法性能。
2.2.1消融實驗
本文選取Faster R-CNN作為基線網(wǎng)絡(luò),為了說明本文提出的通過切片抑制雜波散射信息,以及學(xué)生網(wǎng)絡(luò)通過對教師網(wǎng)絡(luò)的局部和全局的蒸餾能夠提升網(wǎng)絡(luò)性能,以Faster R-CNN為基線模型,其中骨干網(wǎng)絡(luò)為ResNet50,并在SSDD數(shù)據(jù)集上進(jìn)行消融實驗。
從表1可以看出,切片預(yù)處理和局部與全局的蒸餾,這2種技術(shù)對檢測網(wǎng)絡(luò)的性能均有影響??梢钥闯鲱A(yù)處理與蒸餾都能提升檢測精度,mAP分別提升0.6%,1.0%。同時使用2種技術(shù)的平均精度達(dá)到最高??梢钥闯?,利用切片抑制雜波散射信息,以及局部蒸餾和全局蒸餾能夠有效地在壓縮模型規(guī)模的同時,一定程度地提升艦船檢測性能。
圖2 SSDD數(shù)據(jù)集中部分SAR圖像
表1 消融實驗結(jié)果
2.2.2蒸餾的影響
為了驗證蒸餾對網(wǎng)絡(luò)模型能夠進(jìn)行有效壓縮,以及分析不同蒸餾方式對實驗結(jié)果的影響,選擇教師網(wǎng)絡(luò)的骨干網(wǎng)絡(luò)為ResNet101,學(xué)生網(wǎng)絡(luò)的骨干網(wǎng)絡(luò)為ResNet50,從表2可以看出經(jīng)過蒸餾后得到的學(xué)生網(wǎng)絡(luò)比未經(jīng)過蒸餾的學(xué)生網(wǎng)絡(luò)模型,mAP達(dá)到了90.1%,并且與教師網(wǎng)絡(luò)的性能接近。說明通過局部和全局蒸餾,有效地將教師網(wǎng)絡(luò)模型的參數(shù)傳遞到了學(xué)生網(wǎng)絡(luò)模型中。
表2 教師網(wǎng)絡(luò)與學(xué)生網(wǎng)絡(luò)對比
表3給出了局部蒸餾以及全局蒸餾對學(xué)生網(wǎng)絡(luò)性能的影響??梢钥闯?,局部蒸餾以及全局蒸餾對于檢測性能mAP都有一定的提升。而兩者結(jié)合時,效果最好。
表3 不同蒸餾的實驗結(jié)果
2.2.3不同預(yù)處理方法的比較
為了說明本文方法的有效性,同時采用了其他的預(yù)處理方法進(jìn)行比較實驗??紤]通過提取SAR圖像的傳統(tǒng)圖像特征作為預(yù)處理方法,來增強(qiáng)圖像的特征信息。本文選擇2種傳統(tǒng)圖像特征,方向梯度直方圖(histogram of oriented gridients,HOG),以及局部二值模式(local binary pattern,LBP)紋理,進(jìn)行實驗并比較。表4給出了不同預(yù)處理方法的結(jié)果。
由表4可知,HOG特征或LBP特征,作為預(yù)處理在一定程度上提升了船舶檢測的性能。相對來說,HOG比LBP的效果更好,這是因為船舶輪廓信息更加明顯。但兩者均不如切片預(yù)處理方法對SAR圖像艦船檢測精度有更好的性能提升。
表4 不同預(yù)處理方法實驗結(jié)果
2.2.4與其他CNN檢測網(wǎng)絡(luò)比較
為了進(jìn)一步說明本文方法的性能,實驗中還與現(xiàn)有的單階段檢測網(wǎng)絡(luò)RetinaNet和無錨框檢測網(wǎng)絡(luò)FCOS進(jìn)行了性能比較。這些檢測網(wǎng)絡(luò)在SSDD數(shù)據(jù)集上的實驗結(jié)果如表5所示。從結(jié)果可以看出,本文所提出的方法獲得了最佳的檢測性能,優(yōu)于其他算法。
圖3給出了不同檢測方法的PR曲線。可以看出本文方法的平均精度整體優(yōu)于單階段檢測網(wǎng)絡(luò)RetinaNet和無錨框檢測網(wǎng)絡(luò)FCOS。
圖3 不同方法的檢測結(jié)果
為了驗證本文算法的實驗性能,選取了SSDD測試集中的4副測試圖像,這些圖像分別包含了港口,島礁等復(fù)雜情況。如圖4所示。
圖4 不同方法的檢測結(jié)果比較
其中,第1行表示真實標(biāo)注框,第2行至第5行分別表示,基線(Faster R-CNN),RetinaNet,F(xiàn)COS以及本文方法。對于第1個場景和第2場景,由于近岸雜波以及海上雜波的干擾,F(xiàn)aster R-CNN,RetinaNet產(chǎn)生了虛警,而FCOS產(chǎn)生了漏檢,本文的方法能夠較好地檢測出正確結(jié)果。對于第3個場景以及第4個場景,由于周圍島礁,小雜波的干擾,F(xiàn)aster R-CNN,RetinaNet以及FCOS都產(chǎn)生了虛警,而本文的方法能夠很大程度降低虛警的產(chǎn)生??偟膩碚f,通過對比真實標(biāo)注框與檢測結(jié)果,艦船檢測因為雜波以及小目標(biāo)的干擾,造成的虛警,通過本文實現(xiàn)的切片預(yù)處理以及局部與全局蒸餾能夠較好地識別出目標(biāo),具有較好的性能。
針對SAR圖像艦船檢測存在的困難,以及對于深度學(xué)習(xí)模型部署資源有限的需求,本文提出了一種結(jié)合切片預(yù)處理的知識蒸餾檢測算法。首先,通過對SAR圖像在幅值方向進(jìn)行二維切片處理,選取中高層切片來抑制雜波,并與原圖相組合送入目標(biāo)檢測網(wǎng)絡(luò)模型。然后,通過教師網(wǎng)絡(luò)模型進(jìn)行全局信息蒸餾,與局部的空間、通道蒸餾結(jié)合引導(dǎo)學(xué)生檢測網(wǎng)絡(luò)模型,從而達(dá)到壓縮網(wǎng)絡(luò)模型的目的。通過在SSDD數(shù)據(jù)集上的實驗表明,本文提出的算法相比傳統(tǒng)的Faster R-CNN模型,既能降低模型網(wǎng)絡(luò)規(guī)模和參數(shù)規(guī)模,又提升了檢測性能。
[1] WANG Chonglei, BI Fukun, ZHANG Weiping, et al. An Intensity-Space Domain CFAR Method for Ship Detection in HR SAR Images [J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(4): 529-533.
[2] LENG Xiangguang, JI Kefeng, YANG Kai, et al. A Bilateral CFAR Algorithm for Ship Detection in SAR Images[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(7): 1536-1540.
[3] PAPPAS O, ACHIM A, BULL D. Superpixel-Level CFAR Detectors for Ship Detection in SAR Imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(9): 1397-1401.
[4] REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-Cnn: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017, 39(6):1137-1149.
[5] CAI Zhaowei, VASCONCELOS N. Cascade R-Cnn: Delving into High Quality Object Detection[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6154-6162.
[6] LIN Sungyi, GOYAL P, GIRSHICK R, et al. Focal Loss for Dense Object Detection[C]∥Proceedings of the IEEE International Conference on Computer Vision. 2017: 2980-2988
[7] LIU Wei, ANGUELOV D, ERHAN D, et al. Ssd: Single Shot Multibox Detector[C]∥European Conference on Computer Vision. Springer, Cham, 2016: 21-37.
[8] ZHOU Xingyi, WANG Dequan, Kr?henbühl P. Objects as Points[J]. arXiv preprint arXiv:1904.07850, 2019:2103-2112.
[9] TIAN Zhi, SHEN Chunhua, CHEN Hao, et al. Fcos: Fully Convolutional One-Stage Object Detection[C]∥Proceedings of the IEEE/CVF International Conference on Computer Vision, 2019: 9627-9636.
[10] JIAO Jiao, ZHANG Yue, SUN Hao, et al. A Densely Connected End-to-End Neural Network for Multiscale and Multiscene SAR Ship Detection[J]. IEEE Access, 2018, 6: 20881-20892.
[11] FU Jiamei, SUN Xian, WANG Zhirui, et al. An Anchor-Free Method Based on Feature Balancing and Refinement Network for Multiscale Ship Detection in SAR Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 59(2): 1331-1344.
[12] CUI Zongyong, WANG Xiaoya, LIU Nengyuan, et al. Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 59(1): 379-391.
[13] HINTON G, VINYALS O, DEAN J. Distilling the Knowledge in a Neural Network[J]. arXiv Preprint arXiv:1503.02531, 2015, 2(7):21-29.
[14] CHEN Guobin, CHOI Wongun, YU Xiang, et al. Learning Efficient Object Detection Models with Knowledge Distillation[J]. Advances in Neural Information Processing Systems, 2017, 30(2):742-751.
[15] LI Quanquan, JIN Shengying, YAN Junjie. Mimicking Very Efficient Network for Object Detection[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 6356-6364.
[16] ZHANG Linfeng, MA Kaisheng. Improve Object Detection with Feature-Based Knowledge Distillation: Towards Accurate and Efficient Detectors[C]∥International Conference on Learning Representations, 2020:3327-3336.
[17] YANG Zhendong, LI Zhe, JIANG Xiaohu, et al. Focal and Global Knowledge Distillation for Detectors[C]∥Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022: 4643-4652.
[18] CAO Yue, XU Jiarui, LIN Stephen, et al. Gcnet: Non-Local Networks Meet Squeeze-Excitation Networks and Beyond[C]∥Proceedings of the IEEE/CVF International Conference on Computer Vision Workshops, 2019:1971-1980.
Ship Detection in SAR Images Based on Knowledge Distillation
LIYang,LIANGXiao,JIAHaisa
(PLA 92941 Troops,Huludao 125000,China)
With the rapid development of deep learning, the object detection network model hsa achieved great success in ship detection from synthetic aperture radar (SAR) images. In order to achieve better results, a large detection network is usually adopted, which requires more computing resources and slower inference. Knowledge distillation can effectively compress the network, but most of them are for image classification. Considering the difference between ships and background in SAR images, this paper proposes a combining local and global distillation method for ship detection. Considering the scattering characteristics of ships in SAR images, slice preprocessing in the amplitude direction is performed on the ship sample data constructing a separate data channel with more significant scattering characteristics, which improves the quality of input data fed to the network. Experimental results based on SAR ship detection dataset (SSDD) show that the proposed approach can effectively reduce the price of the network model and improve the detection performance, achieving 90.7% mAP.
synthetic aperture radar(SAR);object detection;ship;deep learning;knowledge distillation
10.3969/j.issn.1009-086x.2023.04.010
TN957.52;E925.6;TJ0
A
1009-086X(2023)-04-0078-08
李洋, 梁瀟, 賈海薩.基于知識蒸餾的SAR圖像艦船目標(biāo)檢測[J].現(xiàn)代防御技術(shù),2023,51(4):78-85.
LI Yang,LIANG Xiao,JIA Haisa.Ship Detection in SAR Images Based on Knowledge Distillation[J].Modern Defence Technology,2023,51(4):78-85.
2022 -09 -26 ;
2022 -11 -10
李洋(1982-),男,遼寧葫蘆島人。工程師,學(xué)士,研究方向為水面靶標(biāo)、目標(biāo)特性。
125001 遼寧省葫蘆島市龍港區(qū)怡心苑小區(qū) E-mail:42208848@qq.com