隋克林
(天津市測繪院,天津 300381)
極化合成孔徑雷達(dá)(Polarimetric Synthetic Aperture Radar,POLSAR)是獲取遙感信息的一種新型技術(shù)平臺。目前常用的極化方式有四種,分別是HH、HV、VH、VV。通過這四個極化通道獲取的地物信息比原來單極化合成孔徑雷達(dá)更加豐富、全面。極化合成孔徑雷達(dá)的顯著優(yōu)勢是它能獲得目標(biāo)的全極化散射特性[1],而目標(biāo)的全極化散射特性又與目標(biāo)本身的形狀結(jié)構(gòu)、物理屬性之間有著本質(zhì)的聯(lián)系,這為圖像解譯提供了豐富的信息。
目前,國內(nèi)外學(xué)者已經(jīng)就極化SAR影像分類做了一系列的研究。在進行SAR影像分類時,往往需要提取目標(biāo)的散射特性[2]。因此,許多分類方法都是在極化分解的基礎(chǔ)上進行的,比如采用由散射矩陣分解出的協(xié)方差矩陣或相干矩陣作為參數(shù)進行分類[3]。1997年,Cloude等人提出了一種基于部分相關(guān)目標(biāo)分解的H-α分類。該方法將極化散射特性用由H和α組成的分類平面上的某一點位置來描述。但由于物體散射機理與地物目標(biāo)并不是一一對應(yīng)的關(guān)系,所以H-α分類結(jié)果存在地物類別模糊的問題[4]。目前主要有兩種途徑來彌補這一問題,一是引入其他參數(shù),二是H、α與其他分類算法相結(jié)合[5]。引入恰當(dāng)?shù)钠渌麉?shù)與算法結(jié)合也能彌補H-α分類的不足[6]。2007年,曹芳、Kimura等人嘗試著用總功率SPAN、極化熵H、各向異性度A和散射角α這四個參數(shù)進行全極化SAR影像的分類研究[7],取得了較好的分類效果。該方法分類取得了一定的效果,但仍然存在海洋和植被等地物易出現(xiàn)錯分類的現(xiàn)象,而且其地物細(xì)致結(jié)構(gòu)也不夠清晰。此外,各參數(shù)與數(shù)學(xué)算法的結(jié)合能彌補H-α分類的不足,可以嘗試將各參數(shù)與FCM算法、EM算法等結(jié)合進行極化SAR影像分類。其中,EM算法是一種在缺失數(shù)據(jù)情況下對未知數(shù)據(jù)進行估計的算法,具有簡單,易實現(xiàn),穩(wěn)定的特點[8]。
本文在H-α平面劃分的基礎(chǔ)上,引入H,α,A,SPAN參數(shù),與EM算法結(jié)合進行極化SAR影像分類研究。
期望最大化(Expectation-Maximization,EM)算法是一種在數(shù)據(jù)缺失的情況下,對缺失數(shù)據(jù)進行估值的一種算法。EM算法假設(shè)數(shù)據(jù)符合某種分布,利用已知數(shù)據(jù)和最大似然方法對該分布的參數(shù)期望值進行估計,進而估計出缺失數(shù)據(jù)。
假設(shè)X為已知數(shù)據(jù),Y是丟失數(shù)據(jù),為分布參數(shù)。可定義函數(shù)期望似然值函數(shù)Q為:
Q(θi,θi-1)=E[logP(X,Y|θi)|X,θi-1]
(1)
式(1)中,i為第i次估值過程中的分布參數(shù),E表示期望值,Q為數(shù)據(jù)的期望似然值。EM算法的核心思想就是通過不斷地迭代,使Q最大化,以達(dá)到收斂,實現(xiàn)參數(shù)和丟失數(shù)據(jù)的精確估值。EM算法主要包含了兩個步驟:
E步:估計參數(shù)和未知數(shù)據(jù),計算p(Y|X,θi-1)和期望似然值;
M步:使期望似然值更新為最大值,即取θi=argmaxθQ(θi,θi-1)。
作為一個在含有隱含變量的模型中常用的估值算法,最常見的是用于高斯混合模型(Mixtures of Gaussians)下的聚類。EM算法實現(xiàn)簡單,數(shù)值計算穩(wěn)定,占資源較少,并具有良好的全局收斂性,用于圖像分類已被驗證能達(dá)到良好的效果[9]。
散射矩陣S描述了地物目標(biāo)的散射特性。在互易情況下,多視數(shù)據(jù)的S矩陣經(jīng)過Pauli基分解得出一種散射矢量k,由散射矢量k進行相干統(tǒng)計平均,便可得出相干矩陣T。
(2)
式(2)中的上標(biāo)“T”表示轉(zhuǎn)置。
(3)
式(3)中,N為視數(shù),H為共軛轉(zhuǎn)置。
易知,T為3×3的半正定Hermit復(fù)矩陣。則矩陣T必有三個特征值,分別為λ1、λ2、λ3,其中λ1>λ2>λ3。與λi對應(yīng),T有三個特征向量:
ui=ejφi[cosαi,sinαicosβiejδi,sinαisinβiejγi]T
(4)
其中αi表示目標(biāo)散射類型。
Cloude等人根據(jù)特征和散射機理,定義出地物目標(biāo)的極化熵H和散射角α。其定義表達(dá)式如下:
目標(biāo)極化熵H描述了地物目標(biāo)散射的無序程度,散射角α則描述了地物目標(biāo)的平均散射機制。極化熵和散射角的組合成的H-α分布可以描述地物目標(biāo)的基本散射機制[5]。將H-α分布顯示在二維平面內(nèi),該特征平面可以劃分成8個有效區(qū)域,如圖1所示。
圖1 H-α平面
利用H-α平面可以對SAR影像進行初步的分類,該分類方法簡單,容易實現(xiàn),但其分類結(jié)果往往無法清晰地區(qū)分地物,所以該方法通常作為一種快速初分類的方法。
極化熵H能反映小范圍內(nèi)的總體散射極值的信息,但對于熵值較小時,散射熵?zé)o法反映兩個較小特征值λ2、λ3的關(guān)系,所以Cloude等人定義反熵A來反映λ2、λ3的關(guān)系。此外,總功率SPAN能反映不同地物的散射強度,有利于區(qū)分地物的紋理和邊緣特征。
(5)
SPAN=λ1+λ2+λ3
(6)
本文利用H-α對SAR影像進行初分類,然后結(jié)合H,α,A,SPAN四個參數(shù),采用EM算法對極化SAR影像進行精細(xì)地分類。
本文將高斯模型下的EM算法結(jié)合H,α,A,SPAN四個參數(shù)應(yīng)用于極化SAR影像分類。高斯模型的主要參數(shù)包括均值μ,方差σ。分類流程如圖2所示。
圖2 EM算法分類流程
本文的EM算法分類的實驗步驟如下:
(1)采用Lee濾波法3×3的窗口對SAR影像進行濾波;
(2)提取濾波后影像的極化熵H、散射角α、反熵A和功率SPAN四個參數(shù);
(3)利用H-α的平面分布將影像初步分為八類,獲得初始化的聚類中心和相關(guān)模型參數(shù)(均值μ,方差σ);
(4)進行E步,重新估計各個模型參數(shù);
(5)進行M步,計算當(dāng)前模型參數(shù)下的似然值,與原來模型對應(yīng)的似然值進行比較,將最大值賦予;
(6)判斷是否滿足終止條件,即是否達(dá)到最大循環(huán)次數(shù)或者似然值變化幅度是否小于閾值。若不滿足,則循環(huán)進行E步、M步;若滿足終止條件,則退出迭代;
(7)根據(jù)最終估算出的模型參數(shù)對影像進行判別歸類。
為驗證本文所研究方法的效果,選取了NASA-JPL AIRSAR于1992年在美國加州舊金山海灣(San Francisco Bay)獲取的全極化SAR影像進行實驗。實驗數(shù)據(jù)的大小為650×600像素。該區(qū)域主要包括城區(qū)、山區(qū)、海洋、植被、金門大橋等地物目標(biāo)。圖3為實驗區(qū)的Pauli合成圖。
圖3 Pauli合成圖
如圖4所示,可以看出該方法對地物的細(xì)節(jié)描述比較模糊,尤其是城區(qū)和森林等部分,紋理信息缺失嚴(yán)重,邊緣不清晰。這是因為海洋表面的極化熵值絕大部分屬于中低熵值,且海洋表面相對簡單平坦,其散射機制多為單次散射。而森林與城區(qū)的地表情況比較復(fù)雜,這些地區(qū)的極化熵則多屬于中高熵,散射機制多是二次散射或多次散射。
圖4 H-α初分類圖
Paul R,J.S Lee等人根據(jù)H-α對極化SAR影像的初分類結(jié)果,采用協(xié)方差矩陣與EM結(jié)合進行再分類,其結(jié)果如圖5所示。這種分類方法取得了一定的效果。但是可以發(fā)現(xiàn),采用該方法,海洋、山區(qū)和植被三類地物出現(xiàn)較嚴(yán)重的錯分類現(xiàn)象,馬球場等草地有許多誤分類斑點,城區(qū)地物的紋理和細(xì)節(jié)也不夠清晰。
圖5 EM算法結(jié)合協(xié)方差矩陣分類圖
為了進一步改善分類精度,本文采用散射熵H,散射角α,反熵A和功率SPAN四個參數(shù)與EM算法結(jié)合進行分類。因為反熵A反映了T3矩陣3個特征值中λ2與λ3的相對關(guān)系,而且當(dāng)熵值較高時,反熵發(fā)揮的作用更明顯?;谶@個特點能更好地區(qū)分城區(qū)、植被等地物。功率SPAN反映地物目標(biāo)的散射強度,通過SPAN圖可以看出地物的明亮程度。將地物的物理散射機理和極化SAR影像中的空間紋理信息結(jié)合起來,能夠更為細(xì)致地描述目標(biāo),獲取更多的地物細(xì)節(jié),從而有利于不同地物的區(qū)分[10]。從圖5、圖6的對比分析可以看出,EM算法結(jié)合H/α/A/SPAN參數(shù)的分類效果優(yōu)于EM算法與協(xié)方差矩陣結(jié)合的分類效果,能夠更好地區(qū)分海洋、山區(qū)和植被,錯分類現(xiàn)象較少,如馬球場等草地植被出現(xiàn)的錯分類斑點較少,城區(qū)地物的細(xì)節(jié)和紋理也較為清晰。
圖6 EM算法結(jié)合H/α/A/SPAN分類圖
本文根據(jù)地物目標(biāo)的實際情況,將已分的8類地物合并成4類:人工建筑、高層植被、海洋、草地和低矮植被。合并后的分類圖如圖7、圖8所示。
圖7 EM算法結(jié)合協(xié)方差矩陣分類圖
圖8 EM算法結(jié)合協(xié)方差矩陣分類圖
不同方法的分類精度對比(%) 表1
從表1可以看出,EM算法結(jié)合H/α/A/SPAN參數(shù)的分類結(jié)果總體精度和Kappa系數(shù)都高于EM算法與協(xié)方差矩陣結(jié)合的分類結(jié)果。
本文將EM算法結(jié)合散射熵H,散射角α,反熵A和功率SPAN這四個參數(shù)進行極化SAR影像分類。實驗結(jié)果表明EM算法與H/α/A/SPAN參數(shù)結(jié)合比與協(xié)方差矩陣結(jié)合能更好地區(qū)分地物類別,改善分類精度。
[1] 宋才秀. 基于地物散射特性分析的機載極化SAR分類研究[D]. 長沙:中南大學(xué),2012.
[2] 何楚,劉明,許連玉等. 利用特征選擇自適應(yīng)決策樹的層次SAR圖像分類[J]. 武漢大學(xué)學(xué)報,2012,37(1):46~49.
[3] 趙偉穎. 極化SAR監(jiān)督分類方法對植被分類效果比較分析[C]. 第九屆長三角科技論·測繪分論壇,2012:117~120.
[4] 姜媛. 極化SAR圖像特征提取與分類方法研究[D]. 成都:電子科技大學(xué),2016.
[5] 周曉光,匡綱要,萬建偉. 極化SAR圖像分類綜述[J]. 信號處理,2008,29(5):806~811.
[6] 呂宏昌. 極化SAR圖像分類研究[D]. 西安:西安電子科技大學(xué),2015.
[7] 曹芳,洪文,吳一戎. 基于Cloude-Pottier 目標(biāo)分解和聚合的層次聚類算法的全極化SAR數(shù)據(jù)的非監(jiān)督分類算法研究[J]. 電子學(xué)報,2007,36(3):543~546.
[8] 安永輝. EM算法的研究及其在文本處理中的應(yīng)用[J]. 現(xiàn)代計算機,2013,4(上):3~8.
[9] 邱浩. 基于EM算法的醫(yī)學(xué)影像數(shù)據(jù)的分類研究[D]. 長沙:湖南師范大學(xué),2016.
[10] 付仲良,張文元,孟慶祥. 灰度和紋理特征組合的SAR影像SVM分類[J]. 應(yīng)用科學(xué)學(xué)報,2012,30(5):498~504.