宋 斐
(寧夏醫(yī)科大學(xué)理學(xué)院,寧夏 銀川 750004)
隨著成像技術(shù)的不斷更新,SAR逐步得到廣泛應(yīng)用。SAR(Synthetic Aperture Radar)即合成孔徑雷達(dá),能夠獲取較高分辨率成像,由于存在全天候、高分辨率、遠(yuǎn)距離觀測(cè)的優(yōu)勢(shì),將其應(yīng)用軍事信息探測(cè)、生活信息遙感監(jiān)控等領(lǐng)域[1]。SAR成像技術(shù)不斷優(yōu)化完善,關(guān)于如何高效率、高精度的識(shí)別SAR圖像成為時(shí)下熱議的課題。鑒于SAR圖像目標(biāo)識(shí)別具有極大的應(yīng)用價(jià)值和圖像解譯應(yīng)用的急切需要,該領(lǐng)域的研究受到世界范圍的廣泛關(guān)注。文獻(xiàn)[2]提出了一種基于 SOFM 神經(jīng)網(wǎng)絡(luò)的 SAR 圖像目標(biāo)識(shí)別方法,該方法通過(guò)分析 SAR 圖像的特點(diǎn),選取了一組由三角函數(shù)生成法導(dǎo)出的5個(gè)新的不變矩組成的特征向量。利用自組織特征映射(SOFM)神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)進(jìn)行識(shí)別。實(shí)驗(yàn)表明,選取的特征向量能夠較準(zhǔn)確地描述目標(biāo),但此方法步驟過(guò)于復(fù)雜,不易實(shí)施。文獻(xiàn)[3]提出了一種基于Gabor濾波器的SAR目標(biāo)識(shí)別方法,該算法選用Gabor濾波器對(duì)匹配圖像進(jìn)行預(yù)處理,將多個(gè)不同方向角Gabor濾波器的結(jié)果進(jìn)行疊加和歸一化處理,突出了目標(biāo)輪廓特征,然后提取紋理圖像的4類(lèi)Haar-like特征,再利用RBF網(wǎng)絡(luò)模型進(jìn)行識(shí)別,但是該方法只是在圖像全局特征提取的基礎(chǔ)上進(jìn)行目標(biāo)識(shí)別,忽略了圖像局部紋理特征,并且容易受到噪聲的干擾,因此獲取的結(jié)果精確度較低,且耗費(fèi)的時(shí)間較長(zhǎng)。SAR圖像目標(biāo)識(shí)別關(guān)鍵之處在于如何獲取精準(zhǔn)的圖像特征以及特征分類(lèi)方法的正確選擇,上述傳統(tǒng)方法對(duì)SAR目標(biāo)識(shí)別,識(shí)別結(jié)果差的原因是忽略了這兩個(gè)關(guān)鍵點(diǎn)。因此,本文提出基于圖像局部紋理特征的SAR目標(biāo)識(shí)別算法,通過(guò)多層次提取圖像的局部紋理特征,采用ELM分類(lèi)器進(jìn)行目標(biāo)識(shí)別,最終獲取精確的、有效的目標(biāo)識(shí)別結(jié)果[4]。為SAR圖像目標(biāo)的準(zhǔn)確識(shí)別提供了有效手段,推動(dòng)SAR成像技術(shù)的發(fā)展與廣泛應(yīng)用。
基于SAR成像技術(shù)獲取的圖像難以直接進(jìn)行有效的目標(biāo)識(shí)別,所以對(duì)其紋理特征進(jìn)行特征提取,便于得到較優(yōu)的目標(biāo)識(shí)別結(jié)果[5]。采用偏微分模型對(duì)SAR圖像進(jìn)行增強(qiáng),具體如公式(1)所示:
(?)Ix]
(1)
其中,梯度倒數(shù)的線性變換用c(?)描述;增強(qiáng)結(jié)果、原始圖像值與梯度值分別用It、Ix、x描述。
(2)
設(shè)置閥值t′,目標(biāo)與背景的中心灰度分別用μ0(t)、μ1(t)表示,圖像的中心灰度用μ表示,目標(biāo)與背景的概率分別用w0(t)、w1(t)表示。為了能夠得到質(zhì)量較優(yōu)的圖像,閥值t′應(yīng)符合公式(3)的條件:
w1(t)[μ1(t)-μ]2}
(3)
上述獲取的圖像根據(jù)目標(biāo)自帶方位角數(shù)據(jù)旋轉(zhuǎn)到90°,不同的方位角對(duì)相同的目標(biāo)獲取的SAR圖像大小有所不同,應(yīng)通過(guò)選取合適的方法解決此問(wèn)題。現(xiàn)實(shí)的SAR目標(biāo)的邊不是直邊且大部分被遮蓋存在界限不明顯的弊端,僅僅面對(duì)雷達(dá)的那一側(cè)是接近于直邊,且界限比較明確便于識(shí)別其邊緣特征[6]。最好的狀況是同時(shí)存在3條邊不被遮蓋,此時(shí)應(yīng)滿足雷達(dá)方位角是0°、90°、270°、360°的條件;當(dāng)方位角是其他數(shù)值時(shí),則有2條邊沒(méi)有被遮蓋。文章挑選界限明確的邊緣進(jìn)行操作,使得SAR圖像大小不同的問(wèn)題得到明顯改善。通過(guò)上述步驟完成對(duì)SAR圖像進(jìn)行增強(qiáng)處理,便于接下來(lái)對(duì)SAR圖像紋理特征進(jìn)行提取。
TPLBP( Textural Property Local Binary Pattern)是基于LBP像素點(diǎn)圖像局部二值紋理特征描述器進(jìn)行優(yōu)化的特征描述器,文章引用該描述器進(jìn)行圖像局部紋理特征的提取[7]。TPLBP算法通過(guò)改善LBP算法對(duì)領(lǐng)域模塊LBP間的關(guān)系的方式進(jìn)行有效闡述,所以TPLBP算法對(duì)于圖像局部紋理特征的描述能力極強(qiáng),可以獲取最優(yōu)的SAR目標(biāo)圖像紋理特征識(shí)別結(jié)果。TPLBP算法基于模塊化的空間特征,能夠解決大面積紋理特征描述問(wèn)題[8]。由于TPLBP在特征點(diǎn)選擇方面不太敏感,且SAR圖像自身存在的一些問(wèn)題,采用TPLBP算法進(jìn)行局部紋理特征提取是最合適的選擇。
圖1 Three-Patch編碼示意圖
圖1對(duì)Three-Patch編碼進(jìn)行了詳細(xì)的描述。其編碼的主要內(nèi)容是:選取圖像中的任意像素點(diǎn),設(shè)定w×w大小的模塊是以像素點(diǎn)為中心獲取的,用Cp表示該模塊;以模塊Cp為圓心得到一個(gè)半徑是r的圓形,在圓形的周長(zhǎng)上生成多個(gè)尺寸一樣的模塊,不同的模塊中心像素點(diǎn)采用LBP算法計(jì)算其LBP碼值,見(jiàn)圖1。模塊的總數(shù)量用S表示,選取2個(gè)模塊的中心像素點(diǎn)的LBP碼值同中心模塊的中心像素點(diǎn)的LBP碼值,計(jì)算它們的相似度,被選用的2個(gè)模塊在以r為半徑形成的圓周內(nèi)間隔的模塊數(shù)量用α表示。接著算出2模塊與中心模塊的相似度差值獲取一組二進(jìn)制串,通過(guò)加權(quán)法獲取對(duì)應(yīng)的TPLBP碼值,公式(4)對(duì)TPLBP碼值進(jìn)行了詳細(xì)的表達(dá):
TPLBPr,?,w,α(p)=
(4)
式中,以r為半徑形成的圓中包含2個(gè)模塊,這兩個(gè)模塊的中心像素點(diǎn)的LBP碼值分別用Ci、Ci+α mod S來(lái)表示;圓的中心模塊的中心像素點(diǎn)LBP碼值用Cp、表示;兩個(gè)模塊的中心像素點(diǎn)相似度可通過(guò)函數(shù)d(?,?)來(lái)描述,文章使用歐氏距離獲取該相似度結(jié)果,具體計(jì)算過(guò)程用公式(5)描述:
(5)
公式中,定義τ=0.01。圖像中不同像素點(diǎn)的TPLBP碼值可以根據(jù)公式(4)進(jìn)行獲取[9]。對(duì)圖像進(jìn)行分割,獲取尺寸均等的矩形窗,定義為B×B,接著算出矩形窗的TPLBP碼值的頻率值將它們制作成TPLBP碼值直方圖。圖像的TPLBP紋理特征向量就是采用不同矩形窗繪制成的直方圖向量串連起來(lái)得到的[10]。根據(jù)上述步驟能夠獲取有效的圖像目標(biāo)局部紋理特征向量,再對(duì)其進(jìn)行目標(biāo)分類(lèi)與識(shí)別,實(shí)現(xiàn)SAR目標(biāo)的有效識(shí)別。
基于上述獲取的圖像局部紋理特征,通過(guò)基于ELM分類(lèi)器的SAR目標(biāo)識(shí)別算法,采用ELM分類(lèi)器對(duì)其進(jìn)行特征目標(biāo)分類(lèi)與識(shí)別,完成SAR目標(biāo)的準(zhǔn)確識(shí)別。一個(gè)隱含層與一個(gè)輸出層構(gòu)成了文章使用的ELM分類(lèi)器,該分類(lèi)器是一種神經(jīng)網(wǎng)絡(luò)[11]。ELM(Extreme Learning Machine)是一種單隱層前饋神經(jīng)網(wǎng)絡(luò)模型的新型學(xué)習(xí)算法,它區(qū)別于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)在于整個(gè)訓(xùn)練過(guò)程只需要一步,無(wú)需反復(fù)對(duì)網(wǎng)絡(luò)中的眾多參數(shù)進(jìn)行復(fù)雜的迭代運(yùn)算。所以極限學(xué)習(xí)機(jī)的訓(xùn)練過(guò)程極為快速,同時(shí)具備良好的泛化性能。該神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置可以任意確定無(wú)需選定特殊值,其突出的泛化能力擴(kuò)大其應(yīng)用范圍的同時(shí)提高了應(yīng)用價(jià)值[12]。定義L個(gè)節(jié)點(diǎn)存在于ELM隱含層中,那么公式(6)是對(duì)相應(yīng)的輸出函數(shù)進(jìn)行的描述,通過(guò)該輸出函數(shù)可獲取SAR識(shí)別結(jié)果:
(6)
公式中,x∈Rd,y∈Rc,隱含層L個(gè)節(jié)點(diǎn)與輸出間的權(quán)重用b描述;L個(gè)節(jié)點(diǎn)與輸入圖像局部紋理特征x間的關(guān)系用h(x)描述,h(x)屬于非線性激勵(lì)函數(shù)的一種,主要功能是在L維數(shù)據(jù)空間中表達(dá)d維數(shù)據(jù)。
隱含層第i節(jié)點(diǎn)同圖像局部紋理特征輸入層的連接權(quán)重用wi描述,隱含層第i節(jié)點(diǎn)的偏差用bi描述。公式(6)可以用公式(7)來(lái)描述:
Hb=Y
(7)
基于n個(gè)隨機(jī)圖像局部紋理特征樣本,則有:
Y=[y1;…;yn]∈Rn×c,b=[β1;…;βn]∈RL×c
(8)
變換后的H用公式(9)表示:
(9)
通過(guò)ELM最小化誤差訓(xùn)練以及最小化輸出權(quán)重范數(shù)的方式,增強(qiáng)神經(jīng)網(wǎng)絡(luò)的泛化能力[13],公式(10)對(duì)該過(guò)程進(jìn)行了詳細(xì)的描述:
Minimize:‖Hb-Y‖2,‖b‖2
(10)
那么得到結(jié)果是:
b=H+Y
(11)
公式中,H矩陣Moore-Penrose的廣義逆用H+表示,且滿足H+=HT(HHT)-1。
通過(guò)改變公式(11)形式的方式改善算法的穩(wěn)定性與泛化能力[14],獲取的表達(dá)式用公式(12)描述:
(12)
公式中,C為回歸系數(shù)。
文章引用一種基于核函數(shù)的ELM算法,通過(guò)核函數(shù)對(duì)ELM原始的激勵(lì)函數(shù)H進(jìn)行隱藏,達(dá)到了優(yōu)化算法泛化能力的目的[15]。定義樣本xi,它的輸出函數(shù)形式可以用公式(13)進(jìn)行描述,采用該式獲取最佳的SAR識(shí)別結(jié)果:
(13)
文章應(yīng)用的核函數(shù)是徑向基核函數(shù),基于核函數(shù)的ELM算法對(duì)圖像局部的紋理特征進(jìn)行SAR目標(biāo)識(shí)別,最終獲取理想的識(shí)別結(jié)果。
2.1.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置
實(shí)驗(yàn)為驗(yàn)證本文方法在SAR目標(biāo)識(shí)別方面的優(yōu)越性,采用本文方法對(duì)MSTAR公開(kāi)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)研究。MSTAR公開(kāi)數(shù)據(jù)集詳細(xì)信息為:128×128像素大小,0.3m×0.3m分辨率。MSTAR數(shù)據(jù)集包括10中目標(biāo)類(lèi)型,分別為BRDM2、T62、ZIL131、D7、2S1、BTR60、ZSU234、BMP2、BTR70和T72。本文針對(duì)SAR識(shí)別方面進(jìn)行研究所以實(shí)驗(yàn)采用的數(shù)據(jù)集主要包括坦克、戰(zhàn)車(chē)、裝甲車(chē)三種類(lèi)型七種型號(hào)的軍事武器,其俯仰角分別是17°、15°;類(lèi)型與型號(hào)的詳細(xì)信息為:BMP2含概9563、9666、C21三種型號(hào);BTR70含概C71型號(hào);T72含概132、812、S7三種型號(hào)。0°~360°是各個(gè)目標(biāo)方位能夠覆蓋的范圍。實(shí)驗(yàn)的訓(xùn)練樣本是17°俯仰角的目標(biāo)圖像,測(cè)試集是15°俯仰角的目標(biāo)圖像。且只有某一類(lèi)目標(biāo)的一種編號(hào)存在于訓(xùn)練樣本中,某一類(lèi)目標(biāo)的全部編號(hào)存在于測(cè)試樣本中。詳細(xì)的樣本設(shè)置用表1描述。
表1 訓(xùn)練樣本和測(cè)試樣本設(shè)置
為從不同角度驗(yàn)證本文方法的性能,使本文方法更具有說(shuō)服力,分兩種形式進(jìn)行實(shí)驗(yàn):一是采用本文方法單獨(dú)對(duì)MSTAR公開(kāi)數(shù)據(jù)集進(jìn)行識(shí)別,將獲取的識(shí)別率與平均識(shí)別率制成表格,用表2描述;一是采用本文方法、LBP方法方法、Gabor-LBP方法、PCA方法對(duì)數(shù)據(jù)集展開(kāi)對(duì)比實(shí)驗(yàn),獲取的4種圖像局部紋理特征識(shí)別的效果用圖2描述。
圖2 4種方法對(duì)圖像局部紋理特征識(shí)別的準(zhǔn)確率對(duì)比
2.1.2 實(shí)驗(yàn)結(jié)果分析
分析表2可以看出,在訓(xùn)練樣本同測(cè)試樣本的數(shù)據(jù)狀況相同的情況下,本文方法的識(shí)別率是100%,此時(shí)能夠獲取最佳的識(shí)別效果。采用本文方法對(duì)MSTAR公開(kāi)數(shù)據(jù)集進(jìn)行識(shí)別獲取的平均識(shí)別率高達(dá)98.75%,說(shuō)明其識(shí)別率高,對(duì)于基于圖像局部紋理特征目標(biāo)具有較好的識(shí)別能力。為驗(yàn)證本文方法的較高的識(shí)別性能,將其與LBP方法方法、Gabor-LBP方法、PCA方法獲取的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比。
表2 本文方法基于MSTAR公開(kāi)數(shù)據(jù)集的識(shí)別率
分析圖2,能夠明顯看出4種方法獲取的SAR目標(biāo)識(shí)別結(jié)果,采用PCA方法獲取的目標(biāo)識(shí)別準(zhǔn)確率最低,在70%左右,上下浮動(dòng)的狀況比較明顯,效果不穩(wěn)定;采用LBP方法方法、Gabor-LBP方法獲取的SAR目標(biāo)識(shí)別準(zhǔn)確率稍有提升,但也在徘徊在80%上下,且仍存在上下波動(dòng)的狀況;采用本文方法獲取的SAR目標(biāo)識(shí)別準(zhǔn)確率高達(dá)98%,總體準(zhǔn)確率均在90%以上,呈明顯上升的趨勢(shì);主要原因是本文方法在分析圖像的局部紋理特征的基礎(chǔ)上,進(jìn)行特征提取與SAR目標(biāo)識(shí)別,有效提高其精確度。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)于圖像局部紋理特征的識(shí)別準(zhǔn)確率最高,效果最優(yōu)。
2.2.1 實(shí)驗(yàn)數(shù)據(jù)設(shè)置
實(shí)驗(yàn)為驗(yàn)證本文方法在SAR目標(biāo)識(shí)別方面的優(yōu)越性,采用本文方法、EF特征檢測(cè)方法、雙參數(shù)CFAR檢測(cè)方法對(duì)高分辨率的SAR圖像進(jìn)行實(shí)驗(yàn)分
析,并對(duì)3種方法的性能進(jìn)行對(duì)比分析。圖3(a)是本次實(shí)驗(yàn)提供的高分辨率SAR圖像,尺寸是600×640,3m×3m的分辨率,對(duì)圖中白色框內(nèi)的圖像進(jìn)行目標(biāo)識(shí)別。圖3(b)~圖3(d)是采用3種方法獲取的圖像目標(biāo)識(shí)別結(jié)果,同樣用白色線框?qū)?yīng)識(shí)別的區(qū)域進(jìn)行標(biāo)記,用圓形線框標(biāo)記目標(biāo)識(shí)別形成的虛警。3種識(shí)別方法獲取的識(shí)別結(jié)果用表3描述,3種方法識(shí)別圖3(a)中的目標(biāo)耗費(fèi)時(shí)間狀況用表4描述。
圖3 三種方法的SAR圖像目標(biāo)識(shí)別結(jié)果與原始圖對(duì)比
識(shí)別方法識(shí)別目標(biāo)數(shù)虛警數(shù)本文方法93EF特征識(shí)別方法917雙參數(shù)CFAR識(shí)別方法922
表4 三種識(shí)別方法的運(yùn)行時(shí)間(ms)
2.2.2 實(shí)驗(yàn)結(jié)果分析
將3種方法獲取的目標(biāo)識(shí)別結(jié)果與SAR高分辨率原圖像進(jìn)行對(duì)比,分析圖3和表3能夠得出,本文方法能夠有效識(shí)別出圖像中的待識(shí)別目標(biāo),獲取的結(jié)果邊緣較明確,幾乎沒(méi)有模糊的狀況,總的目標(biāo)識(shí)別數(shù)量是9,只出現(xiàn)3個(gè)虛警,識(shí)別的效果較好;采用EF特征識(shí)別方法獲取的目標(biāo)識(shí)別結(jié)果大小不一,邊緣存在不清晰且部分模糊的現(xiàn)象,總的目標(biāo)識(shí)別數(shù)量是9,出現(xiàn)17個(gè)虛警,誤判的狀況相較本文方法較多,對(duì)圖像的目標(biāo)識(shí)別效果較差;采用雙參數(shù)CFAR識(shí)別方法取的目標(biāo)識(shí)別結(jié)果存在嚴(yán)重的邊緣不明確、模糊的狀況,總的目標(biāo)識(shí)別數(shù)量是9,出現(xiàn)22處虛警,是本文方法的7倍之高,識(shí)別結(jié)果極差,難以對(duì)圖像目標(biāo)進(jìn)行有效識(shí)別,是3種識(shí)別方法中誤判率最高、性能最差的方法。
分析表4能夠看出,本文方法識(shí)別圖3(a)花費(fèi)的時(shí)間為10.245 ms,采用EF特征識(shí)別方法花費(fèi)的時(shí)間為40.526 ms,約是本文方法的4倍;采用雙參數(shù)CFAR識(shí)別方法花費(fèi)的時(shí)間為610.051 ms,約是本文方法的60倍。因此可以判斷本文方法在保證目標(biāo)識(shí)別結(jié)果精確度較高的情況下花費(fèi)的時(shí)間最少,因此效率最高。實(shí)驗(yàn)結(jié)果表明,本文方法基于圖像局部紋理特征進(jìn)行SAR目標(biāo)識(shí)別獲取的誤判率低、效率高,總體性能優(yōu)。
傳統(tǒng)基于Gabor濾波器的SAR目標(biāo)識(shí)別方法根據(jù)圖像全局特征進(jìn)行目標(biāo)識(shí)別,忽略圖像局部紋理特征,容易受到噪聲因素的干擾,獲取的SAR目標(biāo)識(shí)別結(jié)果精確度較低。因此,提出基于圖像局部紋理特征的SAR目標(biāo)識(shí)別算法,引進(jìn)優(yōu)化的TPLBP特征描述器提取圖像局部紋理特征,以確保獲取理想的SAR目標(biāo)識(shí)別結(jié)果,從而完成目標(biāo)識(shí)別。經(jīng)實(shí)驗(yàn)證明,所提方法在識(shí)別準(zhǔn)確率高、誤判率低。但在識(shí)別效率方面尚且不足,未來(lái)將針對(duì)目標(biāo)識(shí)別效率展開(kāi)深入研究。致力于為軍事信息探測(cè)、農(nóng)業(yè)遙感信息監(jiān)控方面的應(yīng)用提供科學(xué)的實(shí)踐方案。