張梓琪,王小龍
(中國科學院空天信息創(chuàng)新研究院, 北京 100094; 中國科學院大學, 北京 100049)
合成孔徑雷達(synthetic aperture radar, SAR)是20世紀50年代研制出的一種主動式微波遙感設備,它不受光照和氣候等客觀條件的限制,能夠全天時、全天候地對地面目標進行高分辨成像,甚至可以透過植被或地表獲取其掩蓋的信息,適用于目標的檢測、分類和識別等研究[1]。其中,大面積的船舶檢測與監(jiān)控是一項重要的民事與軍事應用,同時也是一項充滿挑戰(zhàn)的任務[2-4],因此,對SAR圖像海面船舶目標檢測的算法進行研究具有重要意義。
目前的SAR圖像船舶目標檢測算法中,應用最為廣泛的是恒虛警率(constant false alarm rate, CFAR)算法[5-11],它通過選取雜波模型,根據(jù)需要的恒虛警率,計算背景與目標的最佳分割閾值,達到檢測目標的效果。但是,隨著不同天氣、風速、海況的差異,呈現(xiàn)在SAR圖像中的海洋雜波效果也有很大的差別,這會導致圖像中局部背景雜波不均勻,從而影響檢測結果。由于雜波模型的選取對檢測精度有很大影響,為了適應不同的海況,產(chǎn)生了多種不同的CFAR算法。其中,最常用的是雙參數(shù)CFAR和K分布CFAR[12]。雙參數(shù)CFAR算法采用高斯分布估計背景雜波,并使用3個滑動窗口遍歷圖像,根據(jù)計算的局部閾值進行目標檢測。但高海況時,由于高斯分布很難準確描述海雜波,雙參數(shù)CFAR算法會出現(xiàn)檢測率降低的現(xiàn)象。K分布CFAR算法利用K分布描述海雜波,通過其形狀參數(shù)可以很好地描述高海況時海雜波的拖尾現(xiàn)象。然而,K分布的參數(shù)具有不確定性,難以準確估計。同時,CFAR算法普遍存在的問題是由于需要設定目標窗口,其檢測性能嚴重依賴于船舶長度等先驗知識,并且對于多種尺度目標共存的情況很難兼顧。
近年來,隨著人工智能技術的發(fā)展,針對SAR圖像的船舶目標檢測,陸續(xù)出現(xiàn)了基于機器學習或者深度學習的方法。這些方法利用訓練數(shù)據(jù)進行分類器學習,實現(xiàn)船舶目標檢測。但是,機器學習的方法都需要大量的訓練數(shù)據(jù)支撐,在實際應用中,由于SAR目標的圖像特征隨雷達入射角、方位角,乃至雷達系統(tǒng)的不同而差異明顯,導致SAR目標樣本數(shù)據(jù)往往難以滿足分類器學習的需要。此外,該類方法對算力要求較高,工程應用受限較多,因此,機器學習的方法在當前并沒有得到廣泛應用,而基于目標與雜波本質(zhì)差異實現(xiàn)目標檢測的傳統(tǒng)方法仍是應用關注的重點。
針對上述機器學習方法應用難題及傳統(tǒng)船舶檢測算法在高海況時出現(xiàn)的性能下降問題,考慮到人類視覺系統(tǒng)在處理復雜圖像時,能夠迅速確定感興趣區(qū)域,將視覺注意模型應用于高海況SAR圖像船舶目標檢測應具有積極作用。顯著性檢測算法就是通過模擬人類視覺系統(tǒng)的這種特性,突出顯著區(qū)域并抑制非顯著區(qū)域,實現(xiàn)目標檢測。該算法在光學圖像目標檢測中已經(jīng)得到了廣泛應用,如Itti方法[13],光譜殘差方法[14]和貝葉斯顯著性檢測方法[15]。但是,由于光學圖像和SAR圖像顯著的差異及成像機理的差別,傳統(tǒng)的光學圖像顯著性檢測方法不能直接應用到SAR圖像中。
本文基于傳統(tǒng)光學圖像顯著性檢測算法,結合SAR圖像自身特性,提出一種基于顯著性的高海況SAR圖像船舶目標檢測方法。該方法通過選取適合SAR圖像船舶目標檢測的金字塔層,在提取強度特征的基礎上,引入改進的方向特征和新的一致性特征,建立顯著性檢測模型,抑制背景雜波,生成顯著圖,從而獲取候選目標區(qū)域;然后,基于各區(qū)域之間的距離,采用密度約束進行區(qū)域連接性的判斷,最終實現(xiàn)船舶目標的魯棒檢測。
Itti算法是一種經(jīng)典的視覺注意模型,該模型能夠自適應地檢測出光學圖像中的感興趣區(qū)域(region of interest, ROI)。與大多數(shù)需要人工指定ROI的傳統(tǒng)算法相比,Itti模型在基于圖像的目標檢測和識別方面具有很大的優(yōu)勢。
對于一幅輸入圖像,Itti模型通過以下4個步驟獲取其顯著圖:
1) 通過線性濾波器提取圖像的顏色、亮度和方向特征,并對每個特征構建一個高斯金字塔,來模擬人類視網(wǎng)膜的非均勻采樣機制。對于顏色和亮度特征,Itti模型采用線性離散高斯濾波器分別對輸入圖像的3個顏色通道在水平方向和垂直方向進行平滑和下采樣,各形成8個不同分辨率的子圖像[16],包括原始圖像在內(nèi),構建出9層高斯金字塔結構。其中,平滑濾波器為[1 4 6 4 1],通過與[1 1]/2濾波器的卷積來實現(xiàn)下采樣。對于方向特征,Itti模型采用Gabor濾波器對圖像的亮度特征圖在4個不同方向進行濾波,得到方向特征圖。二維Gabor濾波器是一個帶通濾波器,可以定義為一個用高斯函數(shù)調(diào)制的復指函數(shù)[17]:
(1)
2) 對每個特征金字塔,利用中央差分法計算對應的特征圖。計算方法為:
I(c,s)=|I(c)-I(s)|,
(2)
RG(c,s)=|(R(c)?G(c))-(G(s)?R(s))|,
(3)
BY(c,s)=|(B(c)-Y(c))?(Y(s)-B(s))|,
(4)
O(c,s)=|O(c,θ)?O(s,θ)|,
(5)
其中:c∈{2,3,4},s=c+δ,δ∈{3,4},符號“?”表示將兩幅圖像通過插值轉(zhuǎn)換為相同大小,然后再進行逐點減法。
3) 將每個特征在不同尺度下的特征圖歸一化,得到對應特征的總特征圖。
4) 最后將3個特征對應的3幅總特征圖進行加權求和,同時利用勝者全贏機制從顯著圖中找出最顯著的點,利用返回抑制機制,保證該區(qū)域不再聚焦[18],得到最終的顯著圖。
由于成像機理的不同,光學圖像和SAR圖像的特性存在較大差異,將Itti模型用于高海況SAR圖像船舶目標檢測將出現(xiàn)以下4個問題:(1) 將圖像壓縮到不同的分辨率并保留重要信息對于視覺注意算法非常重要,但是SAR圖像的成像范圍更大,目標尺寸相對光學圖像更小,同時,高海況時SAR圖像的背景更加復雜,不同于光學圖像中背景相對均勻的情況。這使得原Itti模型的9層金字塔結構無法較好地保留目標與背景之間的邊界區(qū)域。(2) SAR圖像中,船舶目標與周圍的自然環(huán)境相比,方向信息更為顯著,但是,Itti模型利用Gabor濾波器提取圖像的方向特征,而Gabor濾波器的最大帶寬被限制在一倍頻,將其用于SAR圖像方向特征的提取中,會出現(xiàn)目標被模糊、不能較好地抑制背景的現(xiàn)象。(3) SAR圖像屬于灰度圖像,無法像光學圖像一樣提取顏色特征,直接套用Itti模型只能提取強度特征和方向特征,這會使得SAR圖像自身的特征不能得到充分利用,降低目標檢測的性能。(4) 隨著SAR成像技術的發(fā)展,SAR圖像的分辨率不斷提高,船舶目標的結構更加清晰,船頭和船尾的雷達散射截面較強,在圖像中形成較亮的區(qū)域,船舶內(nèi)部則相對較弱,這使得顯著性算法會將一個船舶目標檢測為兩個甚至多個,出現(xiàn)較多的虛警。
針對上述問題,本文在Itti模型的基礎上進行了4點針對性的改進。為了直觀展示算法改進的效果,下文逐一給出了在同一幅圖像上的實驗結果。實驗圖像來自“高分三號”獲取的高分辨率SAR船舶檢測數(shù)據(jù)集-1.0(AIR-SARShip-1.0)[19],圖像的像素尺寸為1 000×1 000,海況級別為3級,分辨率為3 m。原圖像以及人工標注出的船舶目標位置如圖1所示。
圖1 原始SAR圖像及其對應的真值圖像Fig.1 The original SAR image and its corresponding truth
利用Itti模型的線性離散高斯濾波器對實驗圖像進行平滑和下采樣,形成8個不同分辨率的子圖像,最終得到的9層金字塔結果如圖2所示。
圖2 實驗圖像的9層金字塔結構Fig.2 Nine-level pyramid structure of the experimental image
由圖2可以看出,對原始圖像進行平滑和下采樣后,雖然分辨率逐層降低,但是圖像中的目標區(qū)域和背景區(qū)域,由于強度相對均勻,金字塔層數(shù)增加造成的強度變化很平緩,而目標和背景間的邊緣區(qū)域,由于強度值會被臨近的背景像素點平均,金字塔層數(shù)增加造成的強度變化更加劇烈,中央差分操作就是利用這種差異,對不同層數(shù)的金字塔圖像進行差分,達到定位目標位置的效果。
但是,由于SAR圖像中的目標尺寸較小,即目標的像素點較少,同時高海況時圖像背景的異質(zhì)性較強,在對圖像構建金字塔時,隨著分辨率的降低,由于強度值逐漸被平均,目標像素點在金字塔層數(shù)較高時,強度會變得與背景相近,逐漸淹沒在背景中,而背景中較為明亮的噪聲逐漸凸顯,導致無法較好地保留目標與背景之間的邊界區(qū)域。如果在此9層金字塔結構上進行特征提取和中央差分的操作,并不能有效提取出高海況SAR圖像的相關特征。
為此,本文基于多幅高海況SAR圖像上的實驗,確定6層金字塔結構可以在模擬人類視網(wǎng)膜的非均勻采樣機制的同時,保留SAR目標與背景之間的邊界,從而在特征提取和中央差分操作后,可以較為有效地提取出SAR圖像的特征圖。因此,本文算法對高海況SAR圖像采用線性離散高斯濾波器,分別對圖像的水平和垂直方向進行平滑和下采樣,形成5個不同分辨率的子圖像,包括原始圖像在內(nèi),構建出6層高斯金字塔結構。在對每一層圖像分別進行3種特征提取后,將2層分別與3、4、5層,3層分別與4、5、6層進行中央差分操作,獲取每個特征的6幅特征圖,每個特征的6幅特征圖相加即得到對應的特征圖。
考慮到每個特征的提取方法不同,為了避免不同特征圖之間的幅度差異過大,需要將3組特征圖歸一化,將其幅度均線性映射到[0, 255]之間,這樣既使得不同特征圖之間的幅度較為一致,同時也進一步增大了顯著區(qū)域和非顯著區(qū)域之間的差異,得到相應的3幅總特征圖,對這3幅特征圖相加求均值后得到最終的總顯著圖。
Itti模型采用Gabor濾波器提取圖像的方向特征,Gabor濾波器是能夠取得空域-頻域聯(lián)合測不準原理下限的唯一函數(shù),在提取圖像的局部頻率信息方面效果顯著。但是,Gabor濾波器存在直流分量,其最大帶寬被限制在一倍頻,不能得到盡可能寬的譜信息。為此,F(xiàn)ield[20]提出Log-Gabor濾波器,實現(xiàn)了任意帶寬濾波器的構建,同時,Log-Gabor 濾波器更加符合人類視覺系統(tǒng)的特性。
所以,本文算法在顯著性算法中用Log-Gabor濾波器代替Gabor濾波器,對高海況SAR圖像提取6個尺度的方向特征,將2層分別與3、4、5層,3層分別與4、5、6層進行中央差分操作,歸一化后得到總的方向特征圖。在實驗圖像上分別驗證兩種方法對于方向特征的提取效果,結果如圖3所示。
由圖3可以看出,原Itti模型對SAR圖像提取的方向特征對復雜背景幾乎沒有抑制作用,同時因為Gabor濾波器的最大帶寬被限制在一倍頻,使圖像上較為明亮的點都產(chǎn)生了一定程度的模糊,這既不有利于凸顯目標,也會干擾目標位置的確定。而本文通過Log-Gabor濾波器提取SAR圖像的方向特征,增大了船舶目標與背景之間的差異,對高海況SAR圖像的背景進行了有效抑制,對船舶目標的定位更為準確。
由于原Itti模型針對的是光學圖像,沒有考慮SAR圖像特性,無法充分利用SAR圖像特征,為此,本文算法在對SAR圖像提取強度特征和方向特征的基礎上,引入了一致性特征的提取,進一步增強船舶目標、抑制背景,在高海況下實現(xiàn)船舶目標的準確檢測和定位。下面介紹一致性特征的提取方法。
在數(shù)學上,結構張量也稱為二階矩矩陣,是由函數(shù)的梯度導出的矩陣。它總結了梯度在點的特定鄰域中的主導方向,以及這些方向的相干程度。結構張量常用于圖像處理和計算機視覺。對于一幅圖像I,給定鄰域窗口的半徑r,則對于其中的每個像素點(x,y),其結構張量都是一個2×2的矩陣,計算公式為
(6)
(7)
[Iy(x+m,n+n)] ,
(8)
[Iy(x+m,n+n)] ,
(9)
(10)
其中:Ix和Iy分別為點(x,y)在x、y方向的梯度,w為權值矩陣,其尺寸與鄰域窗口相同。
鄰域窗口半徑r=0時,結構張量將簡化為
結構張量將這個矩陣奇異值分解,可以得到其特征值λ1、λ2(將較大的那個記為λ1)及其對應的特征向量e1、e2,特征向量體現(xiàn)了鄰域窗口內(nèi)的平均對比度,e1的方向為窗口內(nèi)梯度最大的方向,e2的方向則為一致性方向。所以λ1和λ2體現(xiàn)了對應像素點處梯度變化主次方向的強弱程度,可以通過下式衡量其一致性[21]:
圖3 Gabor與Log-Gabor提取的方向特征圖Fig.3 The orientation feature maps extracting by Gabor and Log-Gabor
coherence=(μ1-μ2)2,
(11)
本文算法通過對SAR圖像的6層金字塔結構分別計算其一致性特征圖,將2層分別與3、4、5層,3層分別與4、5、6層進行中央差分操作,獲取6幅特征圖,歸一化后得到總的一致性特征圖。
對實驗圖像提取一致性特征圖的結果如圖4所示。
圖4 一致性特征圖Fig.4 The coherence feature map
由圖4可以看出,雖然相對于前兩種特征圖,一致性特征圖的強度較弱,但是其應用于高海況SAR圖像中,對復雜的異質(zhì)背景的抑制和目標位置的保留較為準確,對提取最終的顯著圖具有重要作用。本文算法對實驗圖像提取的最終顯著圖Sm與原圖的對比結果如圖5所示。
圖5 最終顯著圖Fig.5 The final saliency map
由圖5可以看出,本文算法對高海況SAR圖像提取顯著圖的效果顯著,有效抑制了異質(zhì)背景,增強了目標,且由于方向特征提取方法的改進,本文算法對SAR圖像中的旁瓣具有很好的抑制作用,為更精確地提取船舶目標位置奠定了基礎。
由于船舶各部分結構的差異,船頭和船尾的雷達散射截面較強,在SAR圖像中會形成較亮的區(qū)域,而船舶內(nèi)部則相對較弱,這使得顯著性算法對船頭和船尾部分的增強更為顯著,如果在此基礎上對顯著圖進行閾值分割,常常會只檢測出較為顯著的船頭和船尾部分,從而將一個船舶目標檢測為兩個甚至多個,出現(xiàn)較多的虛警,特別是對于高分辨率SAR圖像尤為明顯。
本文算法首先利用提出的顯著性模型提取高海況SAR圖像的顯著圖Sm,船舶目標在顯著圖中最為顯著,且與背景差異較大,因此對顯著圖進行閾值運算,提取候選目標區(qū)域,并將閾值Th自適應地定義為
(12)
其中:maxSm和minSm分別為Sm的最大值與最小值,kth為給定參數(shù),實驗表明其最佳取值范圍為[1,3],本文實驗中將kth設為2。
同時,考慮到船舶目標的像素點較為集中,并且由于顯著圖提取的增強效果,目標區(qū)域在顯著圖中與背景的差異進一步增大,結合閾值計算公式(12),在閾值運算中目標的絕大部分像素點都可以被保留,得到較為完整的區(qū)域。而背景中可能存在的明亮噪聲點,一般分布較為孤立,為了避免其也被提取為候選目標區(qū)域,本文在閾值操作后,會進一步將面積過小(小于s)的區(qū)域去除,實驗表明s的最佳取值范圍為[2,6],本文實驗中將s設為5。
此外,考慮到船舶目標的首尾之間連通性較弱,存在一定的中斷,在這種情況下,為了防止算法將一個船舶目標檢測為多個,在完成候選目標區(qū)域的提取后,本文算法設計了進一步的區(qū)域間連接性判別操作,通過下式計算將多個候選區(qū)域檢測為同一目標時的密度:
(13)
其中:|P|為檢測出的目標中包含的候選區(qū)域的個數(shù),distance(pi,pj)為候選區(qū)域pi與pj之間的距離,用這兩個區(qū)域中任意兩點的最小距離表示。判斷連接性的依據(jù)為:當在目標中加入新的候選區(qū)域時,若目標密度ds增加,則該新的候選區(qū)域與原區(qū)域?qū)儆谕荒繕?,否則屬于不同目標。對所有候選目標區(qū)域進行判斷后,為每一個目標繪制其最小外接矩形,作為目標錨框。
本文選取雙參數(shù)CFAR算法和基于K分布的CFAR算法作為基線方法與本文算法進行比較,之所以選擇CFAR算法,是因為該類算法不僅是目前研究最深入、應用最廣泛的算法,而且也是最為經(jīng)典的目標檢測方法。同時,雙參數(shù)CFAR算法和基于K分布的CFAR算法都是針對海面復雜背景SAR圖像船舶目標檢測提出的,選取這兩種算法進行比較更有意義。
為了驗證本文方法的通用性和有效性,除上文的示例實驗圖像外,本文另選了4幅不同來源、尺寸、分辨率和海況等級的SAR圖像進行對比實驗,每一幅實驗圖像的詳細信息如表1所示。
表1 實驗圖像詳細信息Table 1 The detail information of the experimental images
在對比實驗中,雙參數(shù)CFAR、K分布CFAR和本文的Itti-SAR算法均使用相同的輸入圖像,為了使CFAR檢測器取得較好的檢測性能,實驗過程中各CFAR檢測器的虛警率設定為Pfa=10-3,同時,在檢測前根據(jù)船舶目標的尺寸設置合適的檢測窗口,并且都對檢測結果進行了形態(tài)學濾波,得到檢測結果。而Itti-SAR算法不需要船舶尺寸的先驗知識,對圖像進行了金字塔結構、顯著圖提取和連接性判斷,獲得最后的檢測結果。實驗結果如圖6所示。
由圖6可以看出,在陸地雜波干擾較大的情況下,雙參數(shù)CFAR算法雖然有時可以檢測出所有的船舶目標,但是往往會伴隨著較多的虛警(圖6(1.c));而在海況特別復雜的情況下,雙參數(shù)CFAR算法雖然有時可以檢測出部分船舶目標,但是對于船舶目標內(nèi)部強度較弱的情況,會將一個目標檢測為多個(圖6(4.c)),甚至會出現(xiàn)無法正確檢測出船舶目標的情形(圖6(2.c))。K分布CFAR算法也存在類似的問題,雖然在一些情況下可以檢測出所有的船舶目標,但會包含虛警(圖6(1.d) 、圖6(3.d)),也會出現(xiàn)將一個目標檢測為多個的情況(圖6(1.d)),或者出現(xiàn)較多的漏檢(圖6(4.d));在海況特別復雜的情況下,K分布CFAR算法雖然可能檢測出目標,但會出現(xiàn)無法準確定位船舶目標的情況(圖6(2.d))。與之相比,本文算法在實驗圖像中基本可以準確地檢測出船舶目標,且虛警較少,對于船舶目標的定位更加準確,也不需要船舶尺度等先驗知識支撐。
為了定量地比較上述算法的檢測性能,本文采用 “Precision-Recall”指標進行算法評價。其中,“Precision”即查準率,計算公式為
(14)
查準率越高,說明算法辨別虛警和真實船舶目標的能力越強,算法性能越好?!癛ecall”即召回率,計算公式為
(15)
召回率越高,說明算法檢測真實船舶目標的能力越強,算法性能越好。
對4幅實驗圖像進行兩個指標的計算結果如表2所示。
表2 不同算法船舶目標檢測指標統(tǒng)計Table 2 Indexes of ship detection results by different algorithms
通過對這3種方法的比較,兩種CFAR算法方法都產(chǎn)生了一定的虛警和漏檢,影響了檢測精度,并且在海況復雜程度較高的情況下,無法準確檢測出船舶目標。而本文算法的檢測率和召回率都很高,即可以在正確檢測出船舶目標的同時,獲得極低的虛警率。
本文研究了高海況SAR圖像船舶目標檢測問題,提出一種適用于SAR圖像的顯著性檢測方法,整個檢測方法的核心貢獻包括:1) 根據(jù)SAR圖像特點,選取適當?shù)慕鹱炙訑?shù)去模擬人類視覺系統(tǒng)的非均勻采樣機制,在保留目標與背景邊界的同時有效的抑制了雜波噪聲;2) 提出以符合SAR圖像特性的強度特征、方向特征和一致性特征以及新的中央差分機制去構建SAR特征圖,凸顯SAR目標的同時進一步降低了虛警;3) 引入密度約束對顯著區(qū)域的連接性進行判別,有效地降低單個目標不同部位被檢測為多個目標的可能。本文算法與目前公認穩(wěn)定的雙參數(shù)CFAR和K分布CFAR算法的對比實驗表明:本文方法可以更加準確地實現(xiàn)SAR船舶目標的檢測,查準率和召回率均高于另外兩種算法,且檢測過程不依賴于船舶尺寸等先驗知識。