楊亞東,黃勝一,譚毅華
華中科技大學(xué)人工智能與自動化學(xué)院,湖北武漢430074
紅外弱小目標的檢測是許多實際應(yīng)用中的重要技術(shù)之一,包括精準制導(dǎo)、天基監(jiān)視系統(tǒng)、敏感目標跟蹤等,具有極高的安全應(yīng)用價值。在通常情況下,目標在圖像中的尺寸較小,占比小于整個圖像的0.12%[1]。紅外弱小目標輻射的能量較弱,往往會淹沒在復(fù)雜的背景中。并且由于超遠的成像距離,目標將缺失紋理信息。反映在紅外圖像上,紅外弱小目標呈現(xiàn)為無明顯輪廓的斑點,且其信雜比(signal to clutter ratio,SCR)較低。隨著紅外探測傳感器的發(fā)展,紅外弱小目標的檢測也越來越重要。各國學(xué)者也在此領(lǐng)域提出許多經(jīng)典的檢測算法,目前的單幀檢測算法可以大致分為基于背景一致性、目標顯著性和數(shù)學(xué)優(yōu)化方法3 個類別。
第1 類方法基于背景過渡緩慢,局部背景相似度高的假設(shè)。因此該類方法致力于平緩的背景雜波的抑制,間接實現(xiàn)目標增強。常見的算法有Tophat[2]、Max-Mean[3]、Max-Median[3]等,這類算法通過設(shè)計濾波器的濾波核來抑制背景雜波。缺點是固定的濾波器模板不能適應(yīng)復(fù)雜的情況,只在背景簡單時效果較好,從而導(dǎo)致檢測結(jié)果中往往存在大量殘留背景,導(dǎo)致很高的虛警率。
第2 類方法基于目標的顯著性,該假設(shè)受啟發(fā)于人眼的視覺系統(tǒng)。人眼往往關(guān)注于顯著的目標,而待檢測的弱小目標也往往是紅外圖像中平緩背景上的突兀點。因此,一些學(xué)者將人眼系統(tǒng)中的對比度機制、自適應(yīng)尺度等機制引入檢測算法中,LoG (Laplacian of Gaussian)[4]、LCM (local contrast method)[5]等是經(jīng)典的顯著性算法。近些年一些學(xué)者提出了更為復(fù)雜精細的度量方法,例如導(dǎo)數(shù)差異度量[6]、雙層局部對比度度量[7]、時空局部差異度量[8],此類算法要求目標具備一定的顯著性。然而真實場景很復(fù)雜,一旦存在高輻射干擾源時,此類算法將表現(xiàn)不佳。
第3 類方法基于數(shù)學(xué)優(yōu)化方法,從數(shù)學(xué)中數(shù)據(jù)特性出發(fā),對紅外背景提出低秩性假設(shè),紅外弱小目標提出稀疏性假設(shè),而后建立約束條件與優(yōu)化方程并迭代求解,以實現(xiàn)背景和目標分離。隨著稀疏表示和低秩矩陣恢復(fù)等理論的發(fā)展,優(yōu)化方法成為該領(lǐng)域熱點。文獻[9]提出基于紅外塊圖像模型(infrared patch-image,IPI)的紅外弱小目標檢測算法,算法首先將單幀圖像分塊重新排列元素,重新排列后的圖像叫做紅外塊圖像。然后將紅外小目標檢測算法轉(zhuǎn)為一個矩陣的分解問題,即將原始矩陣拆解為一個稀疏矩陣和一個低秩矩陣,分別代表檢測結(jié)果和背景矩陣。文獻[10] 提出了一種加權(quán)的紅外塊模型,將紅外圖像的先驗信息引入到優(yōu)化方程中。文獻[11] 在此基礎(chǔ)上做了高維擴展,提出了紅外塊張量模型(infrared patch-tensor,IPT)。文獻[12] 提出使用部分核范數(shù)的和來表達張量低秩性,減少了檢測結(jié)果中的背景干擾。文獻[13] 針對不同低秩分量重要性不同、局部先驗知識不足的問題,提出了一種基于低秩張量補全和Tophat 正則化的紅外目標檢測方法。借用傳統(tǒng)Tophat 變化的思想,作為一個正則化項引入低秩稀疏優(yōu)化方程中,以充分利用目標的局部結(jié)構(gòu)信息和提升抗噪聲能力。文獻[14] 提出了一種新的自正則化加權(quán)稀疏模型,利用能夠檢測出背景邊緣信息的重疊邊緣信息(overlapping edge information,OEI)特征圖對稀疏項進行約束,提高檢測精度。文獻[15] 為了提高高度異構(gòu)場景下的目標檢測性能,提出了一種基于多個子空間學(xué)習(xí)和時空分塊張量的紅外弱小目標檢測方法,并提出了一種基于張量奇異值分解(tensor singular value decomposition,tSVD)因子分解和交替方向乘子法(alternating direction method of multipliers,ADMM)的優(yōu)化框架,以準確高效地恢復(fù)目標分量。文獻[16] 提出了一個基于張量分解的檢測框架,該框架將空間結(jié)構(gòu)知識與張量分解結(jié)合起來。文獻[17] 在張量的角度上繼續(xù)進行探索,提出使用一種全新的范數(shù)來近似張量的秩,并添加了約束噪聲的正則項。這類基于數(shù)學(xué)優(yōu)化求解的方法相對于上述兩種方法,在魯棒性和檢測精度上有了大幅提升。
基于低秩稀疏表示的優(yōu)化方法是當前研究的熱點之一,該類方法屬于第3 類方法。檢測精度相對于傳統(tǒng)濾波算法有了明顯提升,但是代價是犧牲了速度。IPI 模型是該類方法的一個基線方法,該模型的核心是利用魯棒主成分分析(robust principal component analysis,RPCA)的目標函數(shù)min rank(B)+‖T‖0來描述該問題,然而該目標函數(shù)是一個NP-hard 問題。因此在求解時利用了矩陣的核范數(shù)來近似表示矩陣的秩,用L1范數(shù)近似表示L0范數(shù)以進行近似求解。這種簡單的近似會帶來檢測誤差,最明顯的是背景中的強邊緣往往會出現(xiàn)在稀疏分量中,造成較多的虛警。
因此為解決上述問題,本文以該基線方法為基礎(chǔ),重新分析與設(shè)計優(yōu)化方程。使用γ范數(shù)描述背景矩陣的低秩性,L2,1范數(shù)描述噪聲矩陣的分布,利用結(jié)構(gòu)張量提取紅外圖像的局部先驗信息權(quán)重,同時融合目標矩陣的自增強稀疏權(quán)重,使用加權(quán)L1范數(shù)來描述目標矩陣的稀疏性,使模型能夠更好地抑制背景提取目標。
在紅外弱小目標檢測問題中,一般將圖像視為3 個組成成分:背景、噪聲和目標。其中背景占圖像的絕大部分,且背景圖像灰度變化平緩,在空間上具備局部相似性;噪聲可能來自于探測器的隨機噪聲,鏡頭壞點等,其在空間中是隨機分布,且?guī)g沒有相關(guān)性;目標通常呈現(xiàn)弱小的亮斑或者亮點狀,缺乏紋理特性,占比通常小于整幅圖像的0.12%,且有時會淹沒在復(fù)雜背景中。因此背景的緩變性可以對應(yīng)于數(shù)學(xué)上的矩陣低秩性,目標的突兀點特性可以對應(yīng)于矩陣的稀疏性。于是通過低秩稀疏進行紅外弱小目標檢測的思想可以轉(zhuǎn)化為矩陣的魯棒主成分分析(RPCA)問題。如圖1 所示,圖(a) 可視為圖(b) 和(c) 的疊加。在RPCA 中一個數(shù)據(jù)矩陣D看作是由一個低秩分量B和一個稀疏分量T的疊加組成,公式為
圖1 RPCA 問題示意圖Figure 1 RPCA problem diagram
式中:D為原始的數(shù)據(jù)矩陣即紅外圖像,B為低秩分量即背景矩陣,T為稀疏分量即目標矩陣。優(yōu)化方程為
式中:λ為權(quán)重因子,rank(·) 為矩陣的秩,‖·‖0為L0范數(shù)。
一般的檢測流程是將單幀紅外圖像通過一定預(yù)處理后輸入到算法中,進行低秩稀疏矩陣分解,然后將所得的目標矩陣進行閾值分割即可得到最終的檢測結(jié)果。基于低秩稀疏表示的紅外弱小目標檢測算法一般都是基于式(2) 進行改進優(yōu)化的。經(jīng)典的IPI 模型就是在RPCA算法基礎(chǔ)上增添了噪聲模型,取得了不錯的效果。但是也存在一些問題,IPI 方程求解時的近似方式會帶來較大的檢測誤差,尤其是在處理帶有強邊緣紅外圖像時會造成較多的虛警。因此,本文將在此基礎(chǔ)上,改進近似求解方法以及增添先驗權(quán)重來提升檢測效果,提高求解效率。
IPI 模型[9]通過將單幀圖像重新排列為紅外塊圖像作為輸入圖像,從而進行低秩稀疏優(yōu)化分解。其核心思想是將紅外塊圖像Dp分解為塊背景矩陣Bp、塊目標矩陣Tp、塊噪聲矩陣Np,用公式表示為
通過RPCA 的思想,將rank(Bp) 用矩陣Bp的核范數(shù)來近似,將‖Tp‖0由矩陣的L1范數(shù)來近似。同時假設(shè)噪聲分量獨立同分布,且存在某個δ >0,使得‖Np‖F(xiàn)≤δ,即‖Dp-Bp-Tp‖F(xiàn)≤δ。于是IPI 的優(yōu)化方程寫為
式中:‖·‖*為核范數(shù),‖·‖1為L1范數(shù),‖·‖F(xiàn)為Frobenius 范數(shù)。
2.2.1 低秩表示
IPI 模型導(dǎo)致部分邊緣背景的殘留,其原因是由于該模型直接用核范數(shù)近似替代矩陣秩,鑒于此本文使用一種比核范數(shù)更加嚴密的近似。文獻[18] 中使用了γ范數(shù)來逼近矩陣的秩,矩陣B的γ范數(shù)定義為
式中:σi(B) 是矩陣B的奇異值,使用數(shù)學(xué)中的極限可推出rank(B)。當γ趨于0 時,該范數(shù)等于矩陣B的秩;當γ趨于無窮時,該范數(shù)等于矩陣核范數(shù)。γ范數(shù)是一種介于矩陣的秩和核范數(shù)之間的范數(shù),能夠比核范數(shù)更好地描述背景矩陣的低秩性。直接使用矩陣的秩會導(dǎo)致方程不可解,因此本文選用γ范數(shù)來近似替換矩陣的秩。
2.2.2 融合先驗和自增強的稀疏表示
在IPI 的檢測結(jié)果中存在邊緣虛警的問題,可以通過修改方程中的稀疏項來解決。利用結(jié)構(gòu)張量[19]提取圖像中的先驗信息,得到權(quán)重wE,并提取紅外塊目標矩陣的自增強稀疏權(quán)重wT,將兩個權(quán)重以加權(quán)形式放入L1范數(shù)中。接下來介紹具體的計算方式。
局部先驗權(quán)重wE是通過結(jié)構(gòu)張量獲得的。結(jié)構(gòu)張量廣泛地應(yīng)用于特征挖掘、圖像檢測等數(shù)字圖像處理領(lǐng)域,具體的計算過程可參看文獻[19]。結(jié)構(gòu)張量會為每個像素位置計算出兩個特征描述子λ1和λ2,這兩個特征描述子具備以下物理意義:當λ2≈λ1≈0 時,說明該像素點各方向灰度梯度值都很小,其屬于圖像中的平坦緩變區(qū)域;當λ2?λ1≈0 時,說明該像素點有灰度梯度值差異很大的兩個正交方向,其屬于圖像中的邊緣輪廓區(qū)域;當λ2?λ1?0時,說明該像素點有灰度梯度絕對值都很大的兩個正交方向,其屬于圖像中的離散角點區(qū)域。并且結(jié)構(gòu)張量的運算速度很快,可通過結(jié)構(gòu)張量來快速獲得圖像的先驗信息,提取其中的角點位置,抑制平坦區(qū)域和邊緣區(qū)域。根據(jù)兩個特征描述子λ1、λ2的物理含義,本文設(shè)計了先驗權(quán)重,公式為
式中:(x,y) 為像素位置,min(wet(x,y)) 為wp(x,y) 的最小值,max(wet(x,y)) 為wp(x,y) 的最大值。
文獻[20] 提出自增強稀疏權(quán)重,通過加權(quán)的L1范數(shù)來描述目標的稀疏性,目的同樣是緩解圖像中存在強邊緣或噪聲時L1范數(shù)的約束能力下降的問題,公式為
式中:‖·‖w,1為融合權(quán)重的L1范數(shù);wij為權(quán)重矩陣w在位置(i,j) 處的值;C為一個常數(shù),通??芍脼?;εT >0 表示一個很小的數(shù),為了防止|Tij| 為0 的情況,通常可置為0.001;wT為稀疏矩陣T的加權(quán)矩陣;⊙代表Hadamard 積。
通過對局部先驗權(quán)重wE和自增強稀疏權(quán)重wT的介紹,描述紅外塊目標矩陣Tp的稀疏性可以表示為
2.2.3 噪聲表示
圖像中的隨機噪聲容易被誤分至稀疏分量中,造成大量虛警。這些噪聲一般由相機成像造成,文獻[21] 提出使用L2,1范數(shù)來描述噪聲,以區(qū)分點目標的L1范數(shù),公式為
2.2.4 本文算法模型與優(yōu)化求解
基于上述分析與改進策略,本文采用矩陣的γ范數(shù)替代核范數(shù),以近似描述背景矩陣的秩;融合局部先驗權(quán)重和自增強稀疏權(quán)重以通過加權(quán)的L1范數(shù)來描述目標矩陣的稀疏性;用L2,1范數(shù)描述噪聲矩陣,最后構(gòu)建優(yōu)化方程,公式為
式中:‖Bp‖γ為紅外塊背景矩陣Bp的γ范數(shù),將其最小化可以近似最小化矩陣的秩;‖wE ⊙wT ⊙Tp‖1為紅外塊目標矩陣Tp的加權(quán)L1范數(shù),其中wE和wT分別表示圖像的局部先驗權(quán)重和自增強稀疏權(quán)重,融合兩個權(quán)重來約束稀疏矩陣,同時抑制背景中的強邊緣;‖Np‖2,1為紅外塊噪聲矩陣Np的L2,1范數(shù),該項用來描述噪聲部分;⊙表示Hadamard 乘積;λ,β均表示權(quán)衡因子。
式(11) 中的數(shù)學(xué)模型可通過基于交替方向乘子法[22]的優(yōu)化算法進行求解。具體過程為將原問題拆分為多個簡單子問題,然后依次得到各子問題的解析解,最后當滿足收斂條件時,協(xié)調(diào)多個子問題的解,得到原問題近似最優(yōu)解。引入拉格朗日乘子Y和懲罰項,表示為
式中:〈·〉 表示矩陣的內(nèi)積,μ為懲罰因子且μ >0。
模型的求解過程如下,分別固定每個元素進行優(yōu)化,直到滿足收斂條件迭代停止。整個算法的流程如圖2 所示。
圖2 本文算法流程圖Figure 2 Flowchart of the proposed algorithm
算法1基于低秩和重加權(quán)稀疏表示的紅外弱小目標檢測算法
為了驗證本文算法的魯棒性和有效性,在Intel Core i7-8700 處理器、32 GB 內(nèi)存硬件環(huán)境下進行了數(shù)據(jù)測試,并與其他經(jīng)典的檢測算法進行比較。
為了驗證本文提出的檢測算法的魯棒性,在8 個復(fù)雜場景序列中進行測試,如圖3 所示。測試場景包括天空厚云、地面、晴朗天空、衛(wèi)星視角下的云層、沙漠等,場景中的紅外弱小目標用紅色框標記。
圖3 8 種不同的紅外場景Figure 3 Eight diffierent infrared scenes
各場景的詳細描述如表1 所示。
表1 紅外序列場景詳情Table 1 Infrared sequence scene details
背景抑制因子(background suppression factor,BSF)用于描述算法對局部鄰域背景的抑制程度,公式為
式中:FBS為背景抑制因子,Cin和Cout分別代表原始紅外圖像和算法檢測結(jié)果圖中目標鄰域背景的灰度標準差。鄰域的范圍常設(shè)置為以目標為中心,上下左右各為20 像素。
信雜比增益(signal to clutter ratio gain,SCRG)常用來描述算法處理前后目標的增強程度,其公式為
式中:GSCR為信雜比增益,RSC為信雜比,μt為目標的平均灰度值,μb為目標鄰域的平均灰度,σb為目標鄰域的標準差,下標out 和in 分別代表輸入圖像與輸出圖像。當標準差為0時,我們將標準差設(shè)置為0.01 以避免出現(xiàn)SCRG 為無窮的情況。
受試者工作特征曲線(receiver operating characteristic curve,ROC)用來綜合評估算法的檢測性能,它能夠反映出各個算法在相同虛警率條件下達到的檢測率。ROC 曲線的橫坐標為虛警率(Fa),縱坐標為檢測率(Pd),公式為
式中:n1為正確檢測出的目標像素數(shù),n2為序列中真實的目標像素數(shù),n3為虛警的像素數(shù),n4為檢測的目標像素數(shù),F(xiàn)a 中的虛警是指算法檢測結(jié)果中的非目標背景區(qū)域。ROC 曲線通過動態(tài)調(diào)節(jié)判定閾值,得到不同閾值下的檢測率和虛警率,從而繪制得到。
圖4 是本文算法對8 種不同的紅外場景檢測結(jié)果,可以看出對序列圖像中的紅外弱小目標實現(xiàn)了有效的分離,避免了背景中的雜波干擾和噪聲干擾。
圖4 本文算法的檢測結(jié)果Figure 4 Detection results of the proposed algorithm
圖5 8 個場景下不同算法的ROC 曲線Figure 5 ROC curves of diffierent algorithms in 8 sequences
為了定量地比較各種檢測算法的效果,選取了7 個紅外弱小目標檢測算法進行對比實驗,包括:IPI[9]、MAXMEDIAN[3]、NIPPS[23]、RIPT[11]、TOPHAT[2]、NRAM[21]、NTFRA[17],計算并統(tǒng)計各算法的SCRG 和BSF。結(jié)果如表2 所示,黑色加粗字體表示這一行的最大值。
表2 所有檢測算法在不同序列中的BSF 和SCRG 值Table 2 BSF and SCRG values of all detection algorithms in diffierent sequences
表3 所有算法在不同序列中的單幀平均運行時間Table 3 Average running time of all algorithms in a single frame in diffierent sequences s
從表2 可知MAXMEDIAN、TOPHAT 算法能夠較好地增強目標,但是背景抑制能力較差,原因是此類方法均為基于濾波器的算法,固定的濾波核不能適應(yīng)各種復(fù)雜場景,因此導(dǎo)致殘留了大量的背景虛警。IPI、NIPPS、RIPT、NTFRA、NRAM 這些基于數(shù)學(xué)優(yōu)化方法的算法在背景抑制和目標增強上均有不錯表現(xiàn),NIPPS 在場景6 和場景7 中的SCRG 略高于本文算法,但是整體表現(xiàn)不如本文所提出的算法,不具備普適性。NRAM 在場景3 中的BSF 稍高于本文算法,但其他序列均低于本文算法。結(jié)合兩種評價指標,可以看出本文提出的模型在所有序列上的平均表現(xiàn)最好,對背景的抑制能力和對目標的增強能力較為平衡。
為了進一步驗證算法的綜合性能,引入ROC 曲線對算法進行評估。從8 個數(shù)據(jù)集的結(jié)果可以看出,MAXMEDIAN、TOPHAT 這兩個算法表現(xiàn)不穩(wěn)定,在相對容易檢測的數(shù)據(jù)集1和3 有不錯的表現(xiàn),但是在其他復(fù)雜場景下表現(xiàn)極差。IPI、NIPPS、RIPT、NRAM、NTFRA相較前述算法表現(xiàn)較優(yōu),但是在部分序列中表現(xiàn)很差,魯棒性較差。而本文提出的檢測算法在8 個序列中幾乎均表現(xiàn)出最優(yōu)的效果。
算法的速度也是紅外小目標檢測中的一個重要指標。我們測試了各算法在8 個序列上的時間,得到平均單幀處理時間,其中黑色加粗是本文算法,黑色加粗加下劃線是最優(yōu)算法。傳統(tǒng)濾波算法MAXMEDIAN、TOPHAT 算法的速度較快,正如前文介紹,這是該類算法的最大優(yōu)勢?;跀?shù)學(xué)優(yōu)化的算法如IPI、NIPPS、RIPT、NRAM、NTFRA 較慢,平均單幀處理時間大于0.158 s。本文算法同樣屬于數(shù)學(xué)優(yōu)化算法,平均單幀處理時間為0.024 s。雖然本文算法與基于濾波的傳統(tǒng)方法相比運行速度仍較慢,但考慮到性能上的優(yōu)勢,這個不足是可以接受的。
為了提升檢測精度和處理速度,本文提出了一種基于低秩和重加權(quán)稀疏表示的紅外弱小目標檢測算法。采用γ范數(shù)替代核范數(shù)來近似描述紅外塊背景矩陣的秩;通過結(jié)構(gòu)張量提取局部先驗信息權(quán)重,同時融合的自增強稀疏權(quán)重,在L1范數(shù)上增加權(quán)重描述目標矩陣的稀疏性;利用L2,1范數(shù)來描述噪聲矩陣。建立優(yōu)化方程,并對方程進行優(yōu)化求解,最終在目標矩陣中通過閾值分割檢測候選目標。與多個基線算法對比實驗說明:在信雜比增益、背景抑制比、ROC 等定量指標上都取得了較大優(yōu)勢。算法的速度平均為0.024 s/幀,雖然不及傳統(tǒng)濾波算法,但對比其他優(yōu)化算法仍有較大改進。從性能和時間兩個方面綜合考慮,本文的算法有著較好的優(yōu)越性。目前本文算法還存在弱小目標檢測像素丟失的問題,在后續(xù)研究中將進一步設(shè)計策略來保證目標的完整性,提高檢測精度。