王 磊,高 揚,張 慧,郝永平
(沈陽理工大學(xué)機械工程學(xué)院,遼寧 沈陽 110159)
紅外小目標檢測被廣泛應(yīng)用于紅外制導(dǎo)、預(yù)警等軍事領(lǐng)域[1]。紅外小目標的像素與整張圖的像素比不超過圖像整體的0.15%,成像面積只有幾個像素到十幾個像素,在復(fù)雜背景的情況下,小目標往往只含有少量的語義特征。由于目標在成像系統(tǒng)較遠處,紅外輻射的能量在距離上顯著衰弱狀態(tài),紅外小目標易淹沒在背景之中,目標檢測難度較大,在此條件下的檢測能力具有理論意義和應(yīng)用價值。
為提升小目標的檢測能力,國內(nèi)外學(xué)者通過深度學(xué)習(xí)的計算機視覺技術(shù)在目標檢測領(lǐng)域獲得了重大進展[2-11]。目前,基于卷積神經(jīng)網(wǎng)絡(luò)[4]的深度學(xué)習(xí)檢測算法成為主流,按照是否存在候選區(qū)可分為一階段目標檢測[5]和兩階段目標檢測[6]算法。兩階段算法是在產(chǎn)生候選框的前提下在對候選區(qū)域內(nèi)目標進行分類和回歸,如CNN[7],R-CNN[8],Fast R-CNN[9]等,算法雖精度高,實時性差,檢測小目標效果差;一階段算法不對候選區(qū)進行提取,只用一級網(wǎng)絡(luò)完成了分類和回歸,這類算法主要有SSD[10],YOLO[11]等,算法雖實時性高,但檢測精度低。
針對紅外小目標識別過程受到復(fù)雜背景的干擾,目標特征不明顯,易丟失等問題,提出了一種基于改進SSD與DSST方法的紅外小目標檢測算法,通過通道-空間注意力機制與FPN特征金字塔結(jié)構(gòu)改進SSD網(wǎng)絡(luò),采用DSST對目標下一幀目標進行位置和尺度預(yù)測。在PC端與ZYNQ嵌入式平臺聯(lián)合搭建了目標融合模擬系統(tǒng),可將待測小目標融入到復(fù)雜背景下,實現(xiàn)預(yù)定場景模擬,對所提算法進行評估和驗證。
傳統(tǒng)SSD卷積網(wǎng)絡(luò)特征非線性程度不夠,僅靠目標訓(xùn)練不能獲得理想的識別精度[11]。在主干檢測網(wǎng)絡(luò)生成特征圖階段引入注意力機制,使檢測網(wǎng)絡(luò)更加關(guān)注特征圖中目標可能存在的位置區(qū)域,提高卷積對特征圖的遍歷速度和小目標識別準確率。同時增加目標上下文信息,縮小檢測范圍,提升紅外小目標的檢測能力算法原理為:通過CBAM機制對網(wǎng)絡(luò)生成的特征圖Z分別產(chǎn)生一維通道注意力、二維空間注意力共兩個尺度的特征圖,推斷出特征圖的注意力權(quán)重系數(shù)。特征圖中每一個通道作為一個特征檢測器,選擇利用最大池化和平均池化的方法學(xué)習(xí)目標的判別性特征,將特征送入一個共享的多層感知機(MLP)網(wǎng)絡(luò)中得到通道注意力權(quán)重,將每個通道的權(quán)重與原卷積的特征加權(quán)融合[11]來提取目標特征信息,通道注意力參數(shù)矩陣為:
Mc(Z)=σ(W1(W0(Zavg,c))+W1(W0(Zmax,c)))
(1)
其中:Z為輸入特征圖;σ為激活函數(shù);Zavg,c和Zmax,c分別表示平均池化和最大池化;W0,W1為兩個全連接層各自的權(quán)重參數(shù)。
對于空間注意力機制關(guān)注特征圖中重要信息的位置,將通道注意力產(chǎn)生的特征圖拼接起來,對拼接起來的特征圖上進行卷積操作產(chǎn)生最終的空間注意力特征圖,空間注意力參數(shù)矩陣為:
Ms(Z)=σ(f7×7(Zavg,c;Zmax,c))
(2)
其中f表示卷積核為7×7的卷積核。
將通道注意力機制生成的通道注意力矩陣與輸入特征圖進行元素級相乘得到Z′,再將Z′與空間注意力矩陣進行元素級相乘得到輸出特征圖Z″,如式(3)、式(4)所示,式中?表示元素級相乘。
Z′=Mc(Z)?Z
(3)
Z″=Ms(Z)?Z′
(4)
針對紅外圖像對比度較低、分辨細節(jié)能力差、目標特征不明顯問題,以及傳統(tǒng)SSD卷積網(wǎng)絡(luò)模型中并沒有使用原始圖像的底層特征,其深層特征的語義信息無法與淺層結(jié)構(gòu)信息融合,造成目標細節(jié)信息丟失。
利用FPN算法將檢測網(wǎng)絡(luò)的淺層次特征與高層次特征在“自下而上”的數(shù)據(jù)流向基礎(chǔ)上采用橫向連接,把高層語義信息傳遞給淺層檢測網(wǎng)絡(luò),實現(xiàn)多尺度的信息融合,豐富底層特征圖的語義信息,提升小目標的檢測能力。FPN算法改進的SSD網(wǎng)絡(luò)架構(gòu)如圖1所示。
圖1 FPN算法改進SSD網(wǎng)絡(luò)架構(gòu)圖Fig.1 Improved SSD network architecture of FPN algorithm
以VGG16的SSD網(wǎng)絡(luò)為基礎(chǔ)對卷積網(wǎng)絡(luò)進行改進,紅色箭頭代表Conv1×1卷積核的卷積操作,意在改變特征的輸出個數(shù)的同時,不改變特征尺度,將反卷積和卷積輸出的特征圖保持數(shù)據(jù)一致性。綠色箭頭代表上采樣,通過反卷積操作使進行反卷積之后的深層特征圖與鄰近上一層特征圖保持大小和通道數(shù)相同。“⊕”表示將上采樣和Conv1×1卷積后的特征圖對應(yīng)元素線性疊加,所疊加兩個特征圖的寬度、高度以及通道數(shù)均相等。改進網(wǎng)絡(luò)輸出6種不同尺度的特征圖,利用3×3卷積核對融合疊加結(jié)果進行卷積計算來解決上采樣的混疊效應(yīng)。
上述的空間-通道注意力機制與FPN算法改進的SSD檢測網(wǎng)絡(luò)對紅外小目標的檢測能力有明顯提高,但在復(fù)雜背景下易受其他目標干擾,導(dǎo)致小目標丟失和誤檢。為解決問題,將DSST算法與改進的SSD檢測網(wǎng)絡(luò)相結(jié)合,利用上一幀對目標當(dāng)前幀位置和尺度進行精確估計,實現(xiàn)目標檢測。通過給改進的SSD檢測網(wǎng)絡(luò)設(shè)置閾值來判別檢測是否準確,將檢測不準確的圖像輸入到DSST算法進行二次檢測,此方法有效避免改進的SSD網(wǎng)絡(luò)誤檢和漏檢問題?;诟倪MSSD網(wǎng)絡(luò)與DSST的紅外小目標檢測算法總流程圖如圖2所示。
圖2 改進SSD網(wǎng)絡(luò)與DSST的紅外小目標檢測流程圖Fig.2 Flow chart of improving SSD network and DSST infrared small target detection