(江南大學 物聯(lián)網(wǎng)工程學院,江蘇 無錫 214122)
合成孔徑雷達(synthetic aperture radar,SAR)是一種安裝在飛行器上利用天線的移動在目標區(qū)域進行探測的遙感成像技術[1]。和傳統(tǒng)的基于波束掃描的雷達相比,合成孔徑雷達圖像分辨率較高,且不受天時,氣候和光照的影響。因此SAR圖像在資源探測,遙感攝像,氣候變化等領域得到快速的發(fā)展和應用[2]。
SAR圖像識別一直是研究的熱點。由于SAR圖像的成像原理和一般光照條件下的圖像不同,因此給識別任務帶來了挑戰(zhàn)。SAR圖像識別的難點在于其成像過程中由于其回波信號在不同散射單元的強度具有隨機性,引入了相干斑[3]噪聲導致的圖像質量的下降。傳統(tǒng)的SAR圖像目標識別首先要進行預處理,然后是特征的提取,最后是利用分類算法分類。圖像預處理的目的是為了減少由于相干斑的存在而影響特征提取,從而給識別步驟造成困難。圖像的預處理算法包括Lee濾波、Kuan濾波等,這些方法用來降低相干斑噪聲對識別效果的影響,但預處理的過程存在兩個缺點,一是增加了識別的時間,二是部分有用的像素點丟失。
目前對SAR圖像識別研究的重點主要在于如何準確高效地提取有用的特征和對分類器的選擇上。劉思雨[4]等人根據(jù)圖像紋理特征的特點,使用支持向量機的方法對SAR影像進行分類,肖垚[5]等人利用主成分分析(PCA)法作為特征提取的工具,并結合稀疏求解進行SAR目標識別,薄瑜[6]等人提出一種基于一種改進的決策樹的遙感影像分類方法,徐牧[7]等人提出一種基于目標輪廓特征的SAR圖像識別方法,但這些方法都是基于單一特征進行識別,存在一定的缺點導致特征提取不充分;近年來,深層卷積網(wǎng)絡在圖像檢測、識別中得到飛速的發(fā)展。徐豐[8]等人改進了CNN模型,并結合SAR圖像特點進行目標識別,胡炎[9]等人在SAR艦船目標識別中也應用到了RNN算法,但由于SAR圖像中標注過的數(shù)據(jù)量較少,導致訓練樣本不足網(wǎng)絡無法收斂,給深度學習在SAR圖像識別中的應用帶來了困難。
SAR圖像受到相干斑的影響而導致目標模糊。非下采樣輪廓波(NSCT)[10]是一種多尺度分解方法,能夠將高頻特征和低頻特征分別提取出來,而在特征選擇上,梯度方向直方圖(HOG)[11]算子對圖像的平移、旋轉具有較高的魯棒性,在行人檢測領域廣泛使用;局部二值模式(LBP)[12]算法能夠衡量像素與鄰域的關系,準確描述紋理特征,在人臉特征提取方面應用較為廣泛。
本文提出一種基于NSCT和SVM的SAR圖像識別方法。首先在預處理階段,利用NSCT進行多尺度分解,提取高低頻信息;接著利用HOG算子和LBP算子在高頻分量和低頻分量提取特征,然后使用SVM進行目標分類。最后通過實驗對所提算法進行驗證。
NSCT是一種基于輪廓波變換的多尺度分解方法。經(jīng)NSCT分解后得到低頻分量和不同級別的高頻分量。低頻分量的特點是含有圖像輪廓信息,高頻分量則擁有圖像邊緣、細節(jié)等信息。經(jīng)NSCT分解后的zoneplate圖像如圖1所示。
圖1 zooneplate原圖和NSCT分解結果
NSCT的分解過程主要有兩個步驟。首先利用金字塔算法進行非下采樣分解,然后利用方向濾波器組進行采樣。塔型分解利用兩通道二維濾波組對圖像多尺度變換,通過對當前組波帶利用同一個濾波器進行上采樣得到下一組波帶,同時避免了重新設計濾波器的操作。
非下采樣方向濾波組取消了原算法上的下采樣操作,所以其在圖像分解過程中主要是上采樣。上采樣算法如式(1)所示:
(1)
式中,y[n]為輸出結果,h[k]是給定的濾波器,S[k]為樣本矩陣,x[n]為波帶矩陣。從式(1)可以看出,NSCT算法的優(yōu)點是在實現(xiàn)多尺度,多方向性分解的同時,并沒有增加算法的計算量。NSCT算法的分解過程如圖2所示。
圖2 NSCT算法的分解過程
本文提出的算法主要有3個步驟:1)通過NSCT算法分解源圖像獲得多尺度特征,保留圖像的低頻分量以及第一級高頻分量;2)在第一級高頻分量中提取HOG特征,在低頻分量提取LBP特征;3)將步驟二中得到的特征作為樣本SVM進行模型分類。最后對訓練成熟的模型進行實驗測試,算法流程如圖3所示。
圖3 本文算法流程圖
NSCT算法的作用主要是將源圖像中的目標與背景分開。第一級高頻分量中保存的是目標的邊緣,下面級別的圖像則包含了相干斑噪聲等特征。因此只對第一級高頻分量進行特征提取。算法的流程中并未進行其他的預處理操作,主要原因是因為圖像預處理的目的是降低噪聲的影響,但是這一過程消耗了時間,使整體的識別效率下降。使用NSCT算法代替Lee濾波算法等,抑制了部分噪聲,并將有用信息保存起來。將NSCT分解的級別分別設置為0、1、2和3,則分解出的高頻分量的方向子帶數(shù)分別是1、2、4和8。第一級高頻分量中的子帶數(shù)為1,包含了圖像主要目標的邊緣信息,其他級別子帶則將噪聲信息提取出來。
圖4為經(jīng)NSCT算法分解后的高低頻圖像,從圖像中可以看出,分解出的高頻特征展示了圖像的邊緣、細節(jié)等信息,低頻特征則展現(xiàn)了圖像的紋理、輪廓等特征。
圖4 NSCT分解圖
經(jīng)NSCT分解后得到的第一級高頻分量中包含目標的邊緣,使用HOG算子進行特征提取。HOG算法是一類用來描述物體形狀邊緣的特征特征算子,被廣泛應用于行人檢測中。使用HOG算子提取高頻特征,首先對高頻分量進行歸一化處理,如公式(2)所示:
I(x,y)=I(x,y)gamma
(2)
其中:Gamma的取值為0.5。歸一化處理可以減少不同背景和光照的影響,增強算法的魯棒性。然后計算圖像中每個位置(x,y)處的梯度值,如公式(3)所示:
(3)
其中:Gx表示x方向的梯度,Gy表示y方向的梯度值。梯度的幅值和方向角可表示如下:
(4)
式中,Gx和Gy分別由位置(x,y)處x軸方向和y軸方向相鄰位置差值得到的。最終得到的(x,y)處梯度的大小和方向如式(5)和式(6)所示:
赫章有三座“天橋”。一座是赫章縣平山鄉(xiāng)與七星關區(qū)放珠鎮(zhèn)交界處的大天橋,一座是赫章縣平山鄉(xiāng)與畢節(jié)市楊家灣鎮(zhèn)交界處的小天橋,一座是赫章縣媽姑鎮(zhèn)的天橋村。
(5)
(6)
經(jīng)NSCT獲得的高頻分量的長寬均為128。梯度方向設置為8個方向,區(qū)域(cell)的大小設為8,在每個區(qū)域中計算各個點的梯度大小和方向,并進行投票得到區(qū)域HOG特征,然后將4個cell組成一個塊(Block)并進行歸一化,每個block內的特征向量維數(shù)是8×4=32,x軸方向和y軸方向各有15個窗口進行掃描計算,最終HOG特征的維數(shù)是15×15×32=7 200維。
經(jīng)過NSCT分解后的低頻分量包含目標的紋理、背景等特征。LBP算子是一種用來描述圖像局部二值模式的算子,如公式(7)所示:
(7)
其中:在圖像位置(xc,yc)的像素值為ic,ip表示周圍的像素值。S為閾值函數(shù),定義為:
(8)
其計算過程為首先在低頻分量中選取一個中心點,然后比較周圍像素點的大小關系,在其鄰域范圍內比較與周圍像素值與這個點的大小關系,如果大于中心點的大小則置0,小于中心點的大小則置1,因此最終這幾個數(shù)的結果組成一個8位的二進制數(shù),由此可知LBP算子的種類共有256種。而經(jīng)非下采樣輪廓波變換后得到的低頻分量的長寬均為128,因此LBP特征有(128/3)2=1 764維。
將高頻圖像和低頻圖像的HOG特征和LBP特征提取之后,下一步就是進行分類。本文使用支持向量機算法作為分類器。
支持向量機(SVM)是機器學習中的有監(jiān)督的分類和回歸算法,其基本思想是在特征空間內使間隔最大化。對于線性可分SVM,可轉化為一個優(yōu)化問題,如式(9)所示:
s.t.yi(w·xi+b)-1≥0,i=1,2,...,N
(9)
k(xi,xj)=exp(-γ‖xi-xj‖2)
(10)
其中:γ為函數(shù)的寬度參數(shù),控制了核函數(shù)的作用范圍。
利用SVM對SAR圖像分類主要有兩個階段:訓練階段和測試階段。訓練階段,將梯度方向直方圖和局部二值模式提取出的特征使用SVM進行訓練,而測試階段使用測試集來測試算法的識別率。SVM適合對兩種目標進行分類,而一般情況下目標有多種。將SVM應用到多種目標分類時一般有兩種策略即,即一對多法(OVR SVMS)和一對一法(OVO SVMS)。一對多法會導致訓練集產(chǎn)生偏置,因此本文使用 “一對一”模型進行訓練和測試。本文共有八類目標,每對目標均需要一個SVM模型進行分類,因此共訓練28個SVM模型。測試時,用這28個SVM模型測試時,選擇輸出最多的那一類目標作為最終的結果。
本文使用了LIBSVM[13]進行模型訓練,LIBSVM是實現(xiàn)SVM算法的工具庫,基于一對一的方法進行多分類,并且支持多種語言包括Matlab、JAVA、PYTHON等。本文使用Matlab版本的LIBSVM進行實驗,部分參數(shù)如表5所示。
表1 LIBSVM部分參數(shù)
MSTAR(Moving and stationary Target Acquisition and Recognition)數(shù)據(jù)集是國內外公認的針對SAR圖像識別研究的數(shù)據(jù)集,包括裝甲車(BTR-60,BRDM-2)、坦克(T-62),火箭發(fā)射車(2S1)、防空單元(ZSU-234)、軍用卡車(ZIL-131)和推土機(D7)等多種目標。由SAR傳感器在X波段成像,俯仰角包括15度和17度,方位角范圍為0~360°。圖4為其中八種目標的光學和對應的SAR圖像。
圖4 八類目標展示:光學圖像與對應SAR圖像
參考文獻[8]中的MSTAR數(shù)據(jù)庫使用方式,將訓練的數(shù)據(jù)設置為俯仰角為17度的圖像,測試的數(shù)據(jù)設置為俯仰角15度的圖像。各個類別的數(shù)據(jù)個數(shù)如表2所示。
表3 傳感器主要技術指標
SAR圖像識別的實驗平臺為WINDOWS10操作系統(tǒng)的PC機,配置是3.40 GHz、I5-4200H的CPU,8 GB的RAM,型號為GTX950M的GPU。編程環(huán)境為MATLAB8.5版本。
為了驗證本文提出的算法的效果,選取了三組算法作為對比實驗,分別為HOG+SVM算法,LEP+SVM算法和HOG+LEB+SVM算法。識別的結果如表3所示。
表3 實驗的對比結果
表3結果顯示出使用多尺度直方圖特征結合SVM算法的方法的識別率為84.2%,使用局部二值模式結合SVM算法的方法的識別率為81.6%,將HOG特征和LEP特征結合SVM的算法識別率為89.2%,比單獨使用HOG特征和LBP特征分別高出5個百分點和7.6個百分點,突顯出多特征融合結合SVM算法的作用。而本文提出的算法在特征融合的基礎上加入了使用非下采樣輪廓波變換尺度分解的步驟,和方法三相比提高了1.5個百分點,說明了多尺度分解方法能夠抑制噪聲的影響,對于特征提取算法有促進作用。
為了進一步測試提出的算法對噪聲的影響,對測試集添加了不同程度的椒鹽噪聲,并使用4種算法進行測試。椒鹽噪聲是一種黑白相間的白點,在圖像形成過程中產(chǎn)生,可以近似模仿相干斑噪聲。設定椒鹽噪聲的信噪比依次為0.01,0.02,0.03,0.04和0.05。圖6是五級噪聲下目標的圖像。
圖6 五級椒鹽噪聲下的目標 從左到右信噪比依次為0.01~0.05
圖7是4種方法在五級椒鹽噪聲影響下的識別率變化的折線圖。從折線圖顯示出,隨著信噪比的不斷增大,局部二值模式結合支持向量機算法的識別效果影響最大,其他算法均有不同程度的降低,而本文提出的算法的魯棒性和穩(wěn)定性較強,在前四級噪聲下基本不受影響,在五級噪聲下受到輕微的擾動,僅下降了2個百分點,驗證了提出算法的魯棒性和有效性。
圖7 魯棒性測試圖
傳統(tǒng)的SAR圖像識別方法受相干斑的影響導致識別率較低,為了降低噪聲的影響,提高SAR圖像的識別率和魯棒性,提出一種基于NSCT和SVM的SAR圖像識別方法。利用NSCT對分解圖像,分解獲得高頻和低頻分量。使用HOG算子提取高頻分量中邊緣、細節(jié)等特征;使用LBP算子提取低頻分量紋理、輪廓等特征;最后把特征連結并使用SVM算法進行分類。實驗驗證了提出的算法能夠有效提高識別率,在公認的SAR圖像數(shù)據(jù)庫MSTAR上達到90.7%。同時對算法的魯棒性進行了測試,結果顯示該算法優(yōu)于單特征分類及多特征融合分類算法,具有較好的魯棒性。算法的不足之處在于使用支持向量機算法進行多分類時,需要訓練多個分類器從而導致運行時間較長,下一步如何提高算法的運行效率是研究的方向。