蔡 偉,徐佩偉,楊志勇,蔣昕昊,姜 波
(火箭軍工程大學(xué) 兵器發(fā)射理論與技術(shù)國(guó)家重點(diǎn)學(xué)科實(shí)驗(yàn)室,陜西 西安 710025)
由于紅外成像系統(tǒng)可以全天候提供清晰圖像,且能夠穿透霧、煙和其他大氣條件等障礙物,在民用與軍事領(lǐng)域都有著廣泛應(yīng)用。紅外弱小目標(biāo)檢測(cè)作為目標(biāo)識(shí)別與跟蹤領(lǐng)域的重要內(nèi)容,近年來(lái)已成為研究熱點(diǎn)[1]。根據(jù)國(guó)際光學(xué)工程學(xué)會(huì)(SPIE)的定義,把面積不大于9×9 像素的紅外目標(biāo)稱(chēng)為紅外弱小目標(biāo)[2-3]。紅外弱小目標(biāo)檢測(cè)的研究對(duì)象通常為距離較遠(yuǎn)的機(jī)動(dòng)目標(biāo)——紅外弱小目標(biāo),往往占有像素少,缺少顏色、形狀和紋理等細(xì)節(jié)信息,檢測(cè)難度較大。而且紅外圖像獲取受環(huán)境因素和設(shè)備的影響,會(huì)產(chǎn)生背景噪聲和固有噪聲,難以區(qū)分噪聲和弱小目標(biāo),使得紅外弱小目標(biāo)檢測(cè)更加困難[4-6]。
隨著計(jì)算機(jī)視覺(jué)的不斷發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法由于其突出的學(xué)習(xí)和表征能力,已經(jīng)廣泛應(yīng)用于各類(lèi)目標(biāo)檢測(cè)任務(wù)中[7]。李小寧等人[8]提出一種用于檢測(cè)車(chē)輛小目標(biāo)的方法,采取淺層與深層特征融合的策略來(lái)提高檢測(cè)效果,但在復(fù)雜背景下算法性能有待提高。受到可見(jiàn)光目標(biāo)檢測(cè)領(lǐng)域的啟發(fā),深度學(xué)習(xí)也被一些學(xué)者用于紅外目標(biāo)檢測(cè)。Zhao 等人[9]設(shè)計(jì)了一種用于紅外弱小目標(biāo)檢測(cè)卷積神經(jīng)網(wǎng)絡(luò)TBC-Net,使用語(yǔ)義約束提取目標(biāo)特征,解決了背景和目標(biāo)不平衡導(dǎo)致的特征學(xué)習(xí)困難問(wèn)題。總的來(lái)說(shuō),基于深度學(xué)習(xí)的檢測(cè)算法有更好的適應(yīng)性和更高的準(zhǔn)確性,但在復(fù)雜背景下弱小目標(biāo)檢測(cè)仍然會(huì)存在虛警的情況。
本文提出一種基于深度學(xué)習(xí)的網(wǎng)絡(luò)模型YOLO-FCSP,對(duì)于不同復(fù)雜背景下的紅外弱小目標(biāo)檢測(cè),具有良好的準(zhǔn)確性和實(shí)時(shí)性。首先,對(duì)YOLOv3 網(wǎng)絡(luò)采取減少下采樣次數(shù)的操作,并借鑒殘差學(xué)習(xí)和跨階段局部網(wǎng)絡(luò)構(gòu)建特征提取網(wǎng)絡(luò),以保證弱小目標(biāo)特征不丟失。其次,利用多路徑聚合網(wǎng)絡(luò)融合淺層和深層的特征,充分利用重要的目標(biāo)細(xì)節(jié)信息,同時(shí)使用兩個(gè)檢測(cè)輸出層負(fù)責(zé)檢測(cè)小目標(biāo),提高了紅外弱小目標(biāo)的檢測(cè)效果。
為了提高目標(biāo)檢測(cè)的速度,J.Redmon 等人提出將目標(biāo)檢測(cè)任務(wù)視作回歸問(wèn)題的端到端檢測(cè)算法YOLO。由于YOLO 集成了檢測(cè)的全流程,運(yùn)行速度快,但檢測(cè)精度有待提高。原作者受錨框策略的啟發(fā)提出了YOLOv2,有效地平衡了檢測(cè)速度和精度,但難以探測(cè)一些小目標(biāo)。為有效解決小目標(biāo)的檢測(cè)問(wèn)題,又進(jìn)一步提出了改進(jìn)版本YOLOv3。該網(wǎng)絡(luò)包含多個(gè)殘差模塊,能夠減少梯度消失的問(wèn)題,提高了檢測(cè)精度。YOLOv3 與前一版本不同,有9 個(gè)預(yù)測(cè)矩形框,并被分成了3 種不同尺度。此外,為了檢測(cè)到更多的細(xì)節(jié)特征,用上采樣的方式使特征圖尺寸變大獲取更多的深層語(yǔ)義信息。再對(duì)不同層融合,得到的特征圖包含更豐富的特征信息,提高了對(duì)小目標(biāo)的檢測(cè)準(zhǔn)確率。對(duì)于特征提取的骨干網(wǎng)絡(luò),借鑒殘差網(wǎng)絡(luò)設(shè)計(jì)了Darknet-53 代替Darknet-19,加深網(wǎng)絡(luò)的層數(shù),增強(qiáng)了特征提取能力。
由于YOLOv3 網(wǎng)絡(luò)層數(shù)較深和參數(shù)量巨大,檢測(cè)速度有待提升,因此輕量級(jí)網(wǎng)絡(luò)YOLOv3-tiny 被提出。相較于原始YOLOv3 網(wǎng)絡(luò),特征提取部分沒(méi)有采用復(fù)雜的Darknet-53,而是使用了池化操作和卷積簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu),使檢測(cè)速度得到大幅提升。特征融合部分將3 個(gè)不同尺度的特征層減少至2 個(gè)尺度,分別用于大、小目標(biāo)的獨(dú)立檢測(cè)。YOLOv3-tiny 通過(guò)減少網(wǎng)絡(luò)層數(shù)和檢測(cè)分支,減少網(wǎng)絡(luò)參數(shù)量和計(jì)算量,使得檢測(cè)速度大幅提升,適合對(duì)實(shí)時(shí)性要求比較高的場(chǎng)景。但由于其網(wǎng)絡(luò)深度較淺,高層次語(yǔ)義信息提取能力不足,網(wǎng)絡(luò)檢測(cè)精度受到一定影響。
YOLO-FCSP 網(wǎng)絡(luò)模型的設(shè)計(jì)主要從特征提取網(wǎng)絡(luò)和特征融合網(wǎng)絡(luò)2 個(gè)方面進(jìn)行考慮,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。在特征提取階段,考慮弱小目標(biāo)信息的完整性而使用8 倍下采樣,并通過(guò)使用CSPRBlock模塊增強(qiáng)信息傳遞,以更好地適應(yīng)紅外弱小目標(biāo)的檢測(cè)任務(wù)。在特征融合階段,使用多路徑聚合[10]對(duì)淺層空間位置信息和深層語(yǔ)義信息進(jìn)行融合,進(jìn)一步降低虛警,提高網(wǎng)絡(luò)檢測(cè)性能。
圖1 YOLO-FCSP 網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Structure of YOLO-FCSP network
由于弱小目標(biāo)在紅外圖像中像素少,特征細(xì)節(jié)不明顯,過(guò)深的網(wǎng)絡(luò)容易丟失特征信息,加之網(wǎng)絡(luò)模型參數(shù)量大而造成推理速度變慢,因此相對(duì)較淺的網(wǎng)絡(luò)更適合紅外弱小目標(biāo)的實(shí)時(shí)檢測(cè)。此外,下采樣會(huì)使特征圖縮小,無(wú)法判定目標(biāo)與原圖像素的對(duì)應(yīng)關(guān)系,從而影響定位精度。為提高檢測(cè)精度和速度,將YOLOv3[11]的32 倍下采樣調(diào)整至8 倍,避免弱小目標(biāo)空間位置信息過(guò)度丟失。
考慮到下采樣會(huì)導(dǎo)致目標(biāo)部分信息損失的問(wèn)題,在網(wǎng)絡(luò)的第一層引入Focus 結(jié)構(gòu),如圖2所示,該結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行切片操作,間隔采樣得到4 個(gè)特征圖,輸入通道數(shù)擴(kuò)充了4 倍。然后將得到的特征圖再經(jīng)過(guò)卷積操作進(jìn)行通道信息融合,最終得到?jīng)]有信息丟失的2 倍下采樣特征圖。不僅減少了網(wǎng)絡(luò)模型的參數(shù)量和計(jì)算量,還將圖像的寬度和高度信息整合到通道空間中去,為后續(xù)的特征提取保留了更完整的圖像信息,能夠進(jìn)一步提高網(wǎng)絡(luò)模型的檢測(cè)性能。
圖2 Focus 結(jié)構(gòu)Fig.2 Structure of Focus
受到跨階段局部網(wǎng)絡(luò)[12]啟發(fā),設(shè)計(jì)了網(wǎng)絡(luò)組件CSPRBlock 模塊,能夠增強(qiáng)網(wǎng)絡(luò)特征提取能力,并減少模型參數(shù)量和推理時(shí)間。CSPRBlock 模塊結(jié)構(gòu)如圖3所示,由跳躍連接和主體路徑兩部分構(gòu)成,主體路徑由1×1 卷積、n個(gè)堆疊的殘差學(xué)習(xí)模塊和1×1 卷積組成,其中2 個(gè)1×1 卷積作用是調(diào)整通道數(shù)實(shí)現(xiàn)降維,降低網(wǎng)絡(luò)參數(shù)量。跳躍連接部分經(jīng)過(guò)一次點(diǎn)卷積跨層連接到網(wǎng)絡(luò)的拼接層,與主體部分拼接,然后采用點(diǎn)卷積調(diào)整通道數(shù)與輸入一致,實(shí)現(xiàn)通道信息的融合。包含CSPResen 的特征提取網(wǎng)絡(luò)能夠保證檢測(cè)性能不下降,且比YOLOv3 的骨干網(wǎng)絡(luò)Darknet 擁有更少的參數(shù)量和計(jì)算量。
圖3 CSPRBlock 模塊Fig.3 CSPRBlock module
將空間金字塔池化(spatial pyramid pooling,SPP)作為特征提取網(wǎng)絡(luò)的最后一層,主要目的是分離上下文特征,增加感受野,便于后續(xù)融合全局特征信息,改進(jìn)后的SPP 如圖4所示。具體過(guò)程如下:首先對(duì)輸入特征進(jìn)行卷積操作,實(shí)現(xiàn)通道數(shù)減半;然后分別進(jìn)行不同大小的最大池化(maxpooling),池化核大小分別為5、9 和13,步長(zhǎng)均為1;最后將3 個(gè)池化層和上一層的輸出特征圖合并,輸入到下一個(gè)卷積層進(jìn)行特征學(xué)習(xí),得到更為豐富的局部特征。SPP 結(jié)構(gòu)幾乎不會(huì)降低網(wǎng)絡(luò)推理速度,同時(shí)還能提高網(wǎng)絡(luò)檢測(cè)精度。
圖4 改進(jìn)的SPP 模塊Fig.4 Improved SPP module
淺層特征圖具有分辨率高、空間位置信息豐富的特點(diǎn),而較深的網(wǎng)絡(luò)層特征圖的細(xì)節(jié)信息少,且存在像素錯(cuò)位的問(wèn)題,但后者能夠高效地提取豐富的語(yǔ)義信息。為充分利用深層特征圖語(yǔ)義信息,同時(shí)不損失淺層特征圖的空間位置信息,需要將淺層與深層進(jìn)行特征融合,融合后的特征圖兼具豐富的語(yǔ)義信息和位置信息。鑒于紅外弱小目標(biāo)的特殊性,結(jié)合PANet 優(yōu)化特征融合網(wǎng)絡(luò),充分融合淺層和深層的特征圖,增強(qiáng)各個(gè)網(wǎng)絡(luò)層的信息傳遞,形成自下而上和自上而下的網(wǎng)絡(luò)路徑,實(shí)現(xiàn)特征信息的重復(fù)利用,結(jié)構(gòu)如圖1所示。
特征融合網(wǎng)絡(luò)的輸入來(lái)自3 個(gè)部分,其中2 個(gè)來(lái)自特征提取網(wǎng)絡(luò)的2 倍和4 倍下采樣的特征圖,另一個(gè)是經(jīng)過(guò)SPP 處理的8 倍下采樣特征圖。特征融合網(wǎng)絡(luò)的輸出,又稱(chēng)檢測(cè)頭,是目標(biāo)檢測(cè)的輸入。由于弱小目標(biāo)特征細(xì)節(jié)少,特征圖感受野越大,越容易將噪點(diǎn)和強(qiáng)干擾誤認(rèn)為目標(biāo)。通過(guò)對(duì)比實(shí)驗(yàn)分析,去除128×128 像素大小的檢測(cè)輸出層,保留32×32 像素和64×64 像素大小的檢測(cè)輸出層。
錨框(anchor boxes)是一組寬高固定的初始先驗(yàn)框,對(duì)目標(biāo)的檢測(cè)精度和速度有影響,故重新設(shè)置了檢測(cè)頭對(duì)應(yīng)的初始錨框。根據(jù)紅外弱小目標(biāo)數(shù)據(jù)集中的先驗(yàn)框,利用K-means 聚類(lèi)算法進(jìn)行聚類(lèi),表1 為檢測(cè)輸出層特征圖的尺度參數(shù)。
表1 檢測(cè)輸出層的尺度Table 1 Scale of detected output layer
為驗(yàn)證本文提出的檢測(cè)網(wǎng)絡(luò)在復(fù)雜背景下紅外弱小目標(biāo)檢測(cè)的檢測(cè)效果,實(shí)驗(yàn)在不同背景下的紅外弱小目標(biāo)的數(shù)據(jù)集進(jìn)行測(cè)試,設(shè)計(jì)消融實(shí)驗(yàn)證明網(wǎng)絡(luò)模型所采用策略的有效性,并與其他典型的網(wǎng)絡(luò)模型檢測(cè)結(jié)果進(jìn)行對(duì)比。
實(shí)驗(yàn)所采用的是紅外序列圖像中弱小飛機(jī)目標(biāo)檢測(cè)跟蹤數(shù)據(jù)集[13],由國(guó)防科技大學(xué)和中國(guó)航天科工二院合作制作。從中選取5 個(gè)復(fù)雜背景下的紅外序列圖像作為實(shí)驗(yàn)數(shù)據(jù)集,圖像尺寸大小為256×256 像素,共3 299 張,利用Labelme 軟件對(duì)圖像進(jìn)行矩形框標(biāo)注,將數(shù)據(jù)集按照9:1 的比例分為訓(xùn)練集和測(cè)試集。圖5 展示了部分?jǐn)?shù)據(jù)集圖像,可以看出目標(biāo)尺寸均小于9×9 像素,符合紅外弱小目標(biāo)定義。表2 為5 個(gè)紅外弱小目標(biāo)序列詳細(xì)情況,涵蓋了地面、天空和地空交界多種復(fù)雜環(huán)境背景。
表2 5 個(gè)紅外弱小目標(biāo)序列詳細(xì)情況Table 2 Detailed information of 5 infrared dim-small target sequences
圖5 紅外弱小目標(biāo)數(shù)據(jù)集Fig.5 Infrared dim-small target dataset
選擇Python 作為實(shí)驗(yàn)編程語(yǔ)言,實(shí)驗(yàn)基于Pytorch1.8,訓(xùn)練和測(cè)試在Pycharm 中實(shí)現(xiàn),硬件平臺(tái)配置見(jiàn)表3。實(shí)驗(yàn)中,模型輸入圖像大小均為256×256 像素,不進(jìn)行壓縮、擴(kuò)大和裁剪等處理,采用馬賽克增強(qiáng)來(lái)增強(qiáng)訓(xùn)練數(shù)據(jù)[14],以保證網(wǎng)絡(luò)模型對(duì)弱小目標(biāo)的檢測(cè)效果。
表3 實(shí)驗(yàn)硬件平臺(tái)配置Table 3 Configuration of experimental hardware platform
網(wǎng)絡(luò)訓(xùn)練使用Adam 作為優(yōu)化器,將衰減權(quán)重設(shè)置為0.000 5,批次大小為16,初始學(xué)習(xí)率設(shè)置為0.01。采用余弦函數(shù)衰減法,學(xué)習(xí)率衰減至0.002左右,學(xué)習(xí)率曲線如圖6所示。圖7 為模型訓(xùn)練的損失下降曲線,約在500 次迭代后損失值穩(wěn)定。圖8 為平均準(zhǔn)確率曲線,檢測(cè)精度隨訓(xùn)練迭代次數(shù)增加而提升,最后基本保持穩(wěn)定,其中YOLO-FCSP的平均準(zhǔn)確率增幅比YOLOv3 更快。根據(jù)訓(xùn)練曲線和和檢測(cè)精度情況,可以看出訓(xùn)練結(jié)果比較理想,證明了網(wǎng)絡(luò)模型結(jié)構(gòu)的有效性。
圖6 學(xué)習(xí)率衰減曲線Fig.6 Decay curve of learning rate
圖7 損失值下降曲線Fig.7 Descent curve of loss value
圖8 平均準(zhǔn)確率曲線Fig.8 Average precision curve
為了評(píng)估紅外弱小目標(biāo)的檢測(cè)效果,使用以下評(píng)估指標(biāo):
1)精度、召回率和平均準(zhǔn)確率
精度(precision,P)是被預(yù)測(cè)為正樣本中實(shí)際為正樣本的比例,召回率(recall,R),也稱(chēng)查全率,是實(shí)際的正樣本被預(yù)測(cè)為正樣本的比例,兩者公式如下:
式中:TP 為目標(biāo)被正確預(yù)測(cè)為正樣本的數(shù)量;FP為目標(biāo)被錯(cuò)誤預(yù)測(cè)為正樣本的數(shù)量,即誤檢;FN為目標(biāo)被錯(cuò)誤預(yù)測(cè)為負(fù)樣本的數(shù)量,即漏檢。
平均準(zhǔn)確率(average precision,AP)指的是精度的平均值,越大檢測(cè)精度越高。其值是P-R 曲線同坐標(biāo)軸所圍成的面積,最大值為1,公式如下:
2)FPS
每秒幀數(shù)(frame per second,F(xiàn)PS),指的是每秒可以檢測(cè)到的圖像數(shù)量,是用來(lái)評(píng)估檢測(cè)速度的常用指標(biāo),F(xiàn)PS 值越大檢測(cè)速度越快。
3)參數(shù)量和計(jì)算量
參數(shù)量(parameters)對(duì)應(yīng)于模型的空間復(fù)雜度,占用顯存的量,包括模型總參數(shù)量和各層輸出特征圖大小。模型的參數(shù)量越多,需要訓(xùn)練的數(shù)據(jù)量越大,訓(xùn)練時(shí)容易導(dǎo)致過(guò)擬合。計(jì)算量(GFLOPS)又稱(chēng)為時(shí)間復(fù)雜度,指網(wǎng)絡(luò)模型完成一次前向傳播所需要的總計(jì)算量,通常用每秒浮點(diǎn)運(yùn)算次數(shù)來(lái)表示。計(jì)算量越大,訓(xùn)練和檢測(cè)的時(shí)間越長(zhǎng)。
3.4.1 消融實(shí)驗(yàn)
為驗(yàn)證特征提取網(wǎng)絡(luò)改進(jìn)的有效性和可靠性,將本文算法模型拆分成5 組進(jìn)行訓(xùn)練,分別在5 個(gè)不同背景下的序列圖像上進(jìn)行測(cè)試,測(cè)試結(jié)果如表4所示。第1 組為原始YOLOv3 算法;第2 組為將YOLOv3 的特征提取網(wǎng)絡(luò)下采樣次數(shù)由32 倍改為8 倍;第3 組在前一組的基礎(chǔ)上加入CSPRBlock組件;第4 組在第3 組的基礎(chǔ)上加入改進(jìn)的Focus結(jié)構(gòu);第5 組在第4 組的基礎(chǔ)上,將改進(jìn)的SPP 模塊加入特征提取網(wǎng)絡(luò)的最后階段。
由表4 可以看出:第1 組各個(gè)序列的AP 分別為89.8%、87.6%、90.9%、81.8%和91.5%,F(xiàn)PS 均在80 左右。由于YOLOv3 網(wǎng)絡(luò)模型層數(shù)較多,參數(shù)量和計(jì)算量十分巨大,分別為61 M 和154 GFLOPS。第2 組考慮到紅外弱小目標(biāo)信號(hào)弱特征少,調(diào)整網(wǎng)絡(luò)32 倍下采樣至8 倍,模型參數(shù)量和計(jì)算量大幅降低,且檢測(cè)速度提升較大。與第1 組相比,5 個(gè)背景下檢測(cè)的平均準(zhǔn)確率均有所下降,這與網(wǎng)絡(luò)的深度變淺有關(guān)。第3 組引入借鑒跨階段局部網(wǎng)絡(luò)設(shè)計(jì)的CSPRBlock 模塊,各個(gè)序列的AP 值均大幅上升,網(wǎng)絡(luò)模型參數(shù)量與第2 組相比降低20%,計(jì)算量減少一半,這是因?yàn)镃SPRBlock能夠增強(qiáng)網(wǎng)絡(luò)學(xué)習(xí)能力,有效消除網(wǎng)絡(luò)存在的計(jì)算瓶頸和減少內(nèi)存占用,從而提高了檢測(cè)網(wǎng)絡(luò)的推理速度和準(zhǔn)確性。第4 組將第一層卷積下采樣替換為Focus 結(jié)構(gòu),實(shí)驗(yàn)結(jié)果表明,針對(duì)占有少量像素的小目標(biāo),F(xiàn)ocus 結(jié)構(gòu)可以在一定程度上減少模型參數(shù)量和計(jì)算量,提升網(wǎng)絡(luò)檢測(cè)精度和速度。第5 組是在第4 組的基礎(chǔ)上添加了改進(jìn)的SPP 結(jié)構(gòu),網(wǎng)絡(luò)參數(shù)量和計(jì)算量分別增加了0.05 M 和0.5 GFLOPS,F(xiàn)PS 小幅降低,但各個(gè)序列的AP值分別提升了2.0%、0.4%、1.9%、2.6%和1.5%。
表4 消融實(shí)驗(yàn)結(jié)果Table 4 Results of ablation experiments
為驗(yàn)證多路徑聚合的特征融合對(duì)網(wǎng)絡(luò)模型檢測(cè)性能的提升,將使用FPN 融合策略的網(wǎng)絡(luò)模型YOLO-FCSF 和結(jié)合PANet 的YOLO-FCSP 算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表5所示。
表5 加入PANet 的效果對(duì)比Table 5 Effect comparison of add PANet
可以看出,使用結(jié)合多路徑聚合網(wǎng)絡(luò)的方法有效地融合了不同層的特征,精度、召回率和平均準(zhǔn)確率分別提升了54.4%、4.7%和8.7%,其FPS 小幅下降了30。綜合以上實(shí)驗(yàn)結(jié)果,本文設(shè)計(jì)的網(wǎng)絡(luò)模型可以有效提升復(fù)雜背景下的紅外弱小目標(biāo)檢測(cè)效果,且有著良好的實(shí)時(shí)性。
3.4.2 檢測(cè)網(wǎng)絡(luò)的對(duì)比實(shí)驗(yàn)
為進(jìn)一步驗(yàn)證本文提出算法的檢測(cè)性能,與經(jīng)典的Faster R-CNN[15]、SSD[16]、YOLO-V3 和YOLOTiny 進(jìn)行了對(duì)比,測(cè)試結(jié)果如表6所示。
表6 算法對(duì)比實(shí)驗(yàn)結(jié)果Table 6 Experimental results of methods comparison
從表6 可以看出,與經(jīng)典的深度學(xué)習(xí)算法YOLOv3、Faster R-CNN 和SSD 相比,YOLO-FCSP檢測(cè)準(zhǔn)確率、召回率和平均準(zhǔn)確率最高,分別達(dá)到91.9%、94.6%和92.6%,檢測(cè)速度大幅提高至170,紅外弱小目標(biāo)檢測(cè)效果提升顯著。在復(fù)雜背景條件下,YOLO-FCSP 各項(xiàng)指標(biāo)均能夠取得較好的結(jié)果,這表明相對(duì)較淺的網(wǎng)絡(luò)更適合特征不明顯的紅外弱小目標(biāo)。與輕量化網(wǎng)絡(luò)YOLO-Tiny 相比,檢測(cè)速度有小幅下降,但檢測(cè)性能提升較為明顯。盡管YOLO-FCSP 檢測(cè)結(jié)果比較突出,但檢測(cè)精度也并未達(dá)到100%,這主要是由于圖像中存在高亮邊緣、噪聲和大幅明暗變化的背景,與小目標(biāo)極其類(lèi)似而產(chǎn)生少量虛警。
為了能夠更加直觀地分析模型檢測(cè)性能,對(duì)復(fù)雜背景下5 種不同序列進(jìn)行紅外弱小目標(biāo)檢測(cè),結(jié)果如圖9所示。結(jié)果表明,在背景亮度劇烈變化的復(fù)雜背景下,YOLO-FCSP 可在一定程度上區(qū)分較強(qiáng)迷惑性的斑點(diǎn)狀背景和目標(biāo),對(duì)紅外弱小目標(biāo)具有較好的檢測(cè)性能,且能夠做到較低的虛警率。
圖9 5 種不同序列中YOLO-FCSP 算法的檢測(cè)結(jié)果Fig.9 Detection results of YOLO-FCSP in 5 different sequences
為解決復(fù)雜條件下紅外弱小目標(biāo)的檢測(cè)問(wèn)題,本文設(shè)計(jì)了一種基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,利用結(jié)合跨階段局部模塊的網(wǎng)絡(luò)高效提取弱小目標(biāo)特征,通過(guò)自下而上和自上而下的融合路徑將淺層細(xì)節(jié)和位置特征傳遞到高層。以紅外序列圖像中的弱小飛機(jī)目標(biāo)為研究對(duì)象進(jìn)行實(shí)驗(yàn),結(jié)果表明,本文提出的算法能夠有效解決檢測(cè)過(guò)程中弱小目標(biāo)細(xì)節(jié)丟失和虛警率高的問(wèn)題,提高了復(fù)雜背景下檢測(cè)紅外弱小目標(biāo)的準(zhǔn)確性和實(shí)時(shí)性。此外,網(wǎng)絡(luò)模型復(fù)雜度大幅降低,能夠又快又準(zhǔn)地檢測(cè)出紅外弱小目標(biāo),滿足了部署到移動(dòng)硬件平臺(tái)和嵌入式設(shè)備的條件。在后續(xù)工作中,將考慮加入注意機(jī)制來(lái)增強(qiáng)檢測(cè)算法的特征學(xué)習(xí)能力,繼續(xù)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),使用生成對(duì)抗網(wǎng)絡(luò)對(duì)紅外弱小目標(biāo)的數(shù)據(jù)集進(jìn)行數(shù)據(jù)擴(kuò)充。