楊 文 顏 衛(wèi) 涂尚坦 廖明生
①(武漢大學(xué)電子信息學(xué)院 武漢 430072)
②(武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室 武漢 430079)
極化干涉合成孔徑雷達(dá)(Polarimetric Interferometry SAR, PolInSAR)是利用極化合成孔徑雷達(dá)進(jìn)行干涉測(cè)量的新型成像雷達(dá)。極化干涉合成孔徑雷達(dá)通過(guò)極化信息和干涉信息的融合,有效地?cái)U(kuò)展了觀測(cè)空間。極化干涉SAR不僅具有對(duì)目標(biāo)散射體的精細(xì)物理形狀敏感的特性,而且包含目標(biāo)散射體空間分布的信息,大大提高了對(duì)地物的識(shí)別能力[1]。
非監(jiān)督分類是極化干涉 SAR圖像自動(dòng)解譯中最為基本和重要的應(yīng)用之一,也是研究的熱點(diǎn)領(lǐng)域。目前已有多種極化干涉 SAR非監(jiān)督分類方法被提出來(lái)。2001年,文獻(xiàn)[2]給出了利用L波段的E-SAR極化干涉SAR數(shù)據(jù)進(jìn)行地物分類的精細(xì)分析,通過(guò)利用極化干涉熵和極化干涉各向異性度特征,有效地改善了初始分類的效果。2004年,文獻(xiàn)[3]也利用極化干涉熵和極化干涉各向異性度進(jìn)行極化干涉SAR非監(jiān)督分類研究。2005年,文獻(xiàn)[4]基于極化干涉 SAR數(shù)據(jù)相干系數(shù)在單位復(fù)數(shù)橢圓中的分布形狀,并利用得到的橢圓率等參數(shù)對(duì)極化干涉SAR圖像進(jìn)行分類。文獻(xiàn)[5]利用Shannon熵特征的強(qiáng)度,極化度和干涉3個(gè)分量,進(jìn)行地物分類,獲得了好的效果。文獻(xiàn)[6,7]利用Shannon熵分解的強(qiáng)度,極化度和干涉度 3個(gè)貢獻(xiàn)度來(lái)均等地利用極化干涉SAR數(shù)據(jù)強(qiáng)度,極化和干涉信息。實(shí)驗(yàn)結(jié)果表明了利用Shannon熵特征進(jìn)行地物分類的有效性。
圖像的非監(jiān)督分類問(wèn)題,本質(zhì)上是判定哪些像素和哪些像素應(yīng)該被分在一類中,也就是應(yīng)該把哪些像素聚成一類,其中涉及到了每個(gè)像素類別標(biāo)號(hào)的確定和聚類類數(shù)的確定[8]。在前文所提到的極化干涉SAR圖像非監(jiān)督分類算法中,主要側(cè)重于研究如何更加準(zhǔn)確地進(jìn)行每個(gè)像素的標(biāo)號(hào)確定,而對(duì)如何確定聚類類別數(shù)的研究較少。2007年,文獻(xiàn)[9]利用自啟動(dòng)的方式來(lái)進(jìn)行極化干涉 SAR數(shù)據(jù)非監(jiān)督分類,同時(shí)利用極化干涉SAR中干涉相位差來(lái)自動(dòng)確定類別數(shù),獲得了比較好的實(shí)驗(yàn)效果。但文獻(xiàn)中只利用了部分極化干涉SAR數(shù)據(jù)信息來(lái)確定類別數(shù),存在一定的偏差。同年,文獻(xiàn)[10]利用對(duì)數(shù)似然函數(shù)作為判定準(zhǔn)則,采用交叉驗(yàn)證的方式,在極化SAR圖像非監(jiān)督分類中確定最佳類別數(shù)。文獻(xiàn)中利用對(duì)數(shù)似然函數(shù)的拐點(diǎn)來(lái)判斷類別數(shù),需要進(jìn)行人工判定,存在一定的人為誤差。
本文針對(duì)極化干涉 SAR圖像非監(jiān)督分類最佳類別數(shù)確定的問(wèn)題,提出了在Wishart統(tǒng)計(jì)模型下,基于貝葉斯信息準(zhǔn)則來(lái)自動(dòng)確定最佳類別數(shù)的方法。為了提高極化干涉SAR非監(jiān)督分類標(biāo)號(hào)確定的準(zhǔn)確性,本文利用Shannon熵分解特征中的強(qiáng)度,極化度和干涉3個(gè)分量對(duì)地物進(jìn)行初始分類,然后利用期望最大化(Expectation-Maximization, EM)和標(biāo)號(hào)代價(jià)(LabelCost)優(yōu)化[11]算法對(duì)分類結(jié)果進(jìn)行迭代優(yōu)化,以獲得穩(wěn)定的分類結(jié)果。最后利用德國(guó)航空航天中心(German Aerospace Center, DLR)E-SAR機(jī)載SAR德國(guó)Oberpfaffenhofen 地區(qū)的極化干涉SAR數(shù)據(jù)和中國(guó)電子科技集團(tuán)第38研究所(CETC 38)的機(jī)載 SAR海南陵水地區(qū)極化干涉SAR數(shù)據(jù)驗(yàn)證了算法的有效性。
在極化干涉SAR數(shù)據(jù)的基礎(chǔ)數(shù)學(xué)模型中,回波信號(hào)被定義成一個(gè)6維向量的形式,以表現(xiàn)兩根天線不同極化通道的反射強(qiáng)度。
其中h,v表示不同方向的發(fā)射波。
極化干涉SAR協(xié)方差矩陣滿足Wishart分布,其定義如下:
其中Γi為天線的極化協(xié)方差矩陣,包含了對(duì)應(yīng)天線的極化信息。Ω12表示天線間的相干性,包含了兩天線的干涉信息。
在標(biāo)準(zhǔn)的極化干涉SAR數(shù)據(jù)模型中,Shannon熵表示式如式(3)所示[12]。
極化干涉SAR數(shù)據(jù)的Shannon熵分解如下:
圖像的非監(jiān)督分類問(wèn)題,涉及到像素標(biāo)號(hào)的確定和圖像類別數(shù)確定的問(wèn)題。傳統(tǒng)的聚類算法,如Kmeans, EM等,聚類數(shù)目K需要預(yù)先根據(jù)經(jīng)驗(yàn)給定。而聚類數(shù)目的不同,直接影響到分類結(jié)果的好壞。貝葉斯信息準(zhǔn)則(Bayesian Information Criterion, BIC)是確定類別數(shù)目的常用方法,其定義如下:
其中Lk(X)是模型f(·|)在樣本集X上的對(duì)數(shù)似然函數(shù),是對(duì)模型復(fù)雜性(模型參數(shù)數(shù)目)的懲罰項(xiàng)。似然函數(shù)可以理解為條件概率的逆反,為了便于分析取對(duì)數(shù)變換,對(duì)數(shù)似然函數(shù)定義如下:
其中Θk為每一類的模型參數(shù),xl為測(cè)試樣本數(shù)據(jù)。對(duì)于極化干涉SAR圖像非監(jiān)督分類問(wèn)題,一般利用極化干涉 SAR數(shù)據(jù)協(xié)方差矩陣進(jìn)行分類?;趶?fù)Wishart分布可以得到
因此,基于復(fù)Wishart分布的BIC準(zhǔn)則定義如下:
根據(jù)BIC準(zhǔn)則,在同時(shí)考慮似然項(xiàng)和懲罰項(xiàng)的同時(shí),通過(guò)尋找似然函數(shù)與類別數(shù)的變化曲線的最小值得到最佳類別數(shù)。
傳統(tǒng)的迭代聚類算法都假定像素點(diǎn)之間是相互獨(dú)立的,尤其是在SAR數(shù)據(jù)中,SAR圖像中相干斑噪聲干擾比較嚴(yán)重。為了抑制相干斑噪聲對(duì)分類結(jié)果的影響,一般通過(guò)建立馬爾科夫隨機(jī)場(chǎng)(Markov Random Field, MRF),利用平滑先驗(yàn)信息,來(lái)提高分類精度和分類結(jié)果的可視性。
LabelCost算法,是Delong等人[13]最近提出的能量?jī)?yōu)化算法,其同時(shí)考慮了數(shù)據(jù)項(xiàng),平滑代價(jià)項(xiàng)和標(biāo)號(hào)代價(jià)項(xiàng),從而將能量函數(shù)描述為3項(xiàng)之和,提高了算法的準(zhǔn)確度與適用性,其能量函數(shù)表示如式(9):
其中,第1項(xiàng)為傳統(tǒng)的數(shù)據(jù)代價(jià)項(xiàng),表示觀測(cè)數(shù)據(jù)信息對(duì)分類標(biāo)號(hào)推理的勢(shì)能,第2項(xiàng)為平滑代價(jià)項(xiàng),主要考慮平滑先驗(yàn)信息的勢(shì)能。第3項(xiàng)為標(biāo)號(hào)代價(jià)項(xiàng),主要考慮標(biāo)號(hào)代價(jià)的勢(shì)能。本文,基于EM迭代框架,利用LabelCost能量?jī)?yōu)化算法,通過(guò)引入平滑代價(jià)項(xiàng)和標(biāo)號(hào)代價(jià)項(xiàng),抑制相干斑噪聲對(duì)分類結(jié)果的影響,從而有效的提高了非監(jiān)督分類的精度。
在本文中,分類算法首先利用Shannon熵特征進(jìn)行初始分類,并利用EM算法和LabelCost算法進(jìn)行迭代優(yōu)化,獲得穩(wěn)定的聚類結(jié)果。同時(shí)利用BIC準(zhǔn)則確定最佳類別數(shù),從而獲得在最佳類別數(shù)下的穩(wěn)定的分類結(jié)果。算法具體的流程如圖1所示,具體步驟如下:
圖1 自動(dòng)確定類別數(shù)的極化干涉SAR非監(jiān)督分類流程
(1)從極化干涉 SAR協(xié)方差矩陣數(shù)據(jù)提取對(duì)應(yīng)的Shannon熵特征,然后基于Shannon熵特征分解,得到強(qiáng)度,極化度和干涉度3個(gè)分量。
(2)根據(jù)強(qiáng)度,極化度和干涉度能量大小進(jìn)行初始化分類。按照每種能量大小分別把圖像分割成 3類,以有效利用極化干涉SAR數(shù)據(jù)中強(qiáng)度,極化和干涉3種不同的信息。
(3)融合3種不同貢獻(xiàn)的分類結(jié)果,按照每種貢獻(xiàn)的強(qiáng)度均分為3類,融合后圖像被分割成了27類。將此結(jié)果作為初始分類結(jié)果啟動(dòng)算法中的外層迭代。只要類別數(shù)不是最佳類別數(shù),每次外層迭代通過(guò)類類的聚合將類別數(shù)減少1類。
(4)在某一特定類別數(shù)情況下,在內(nèi)層循環(huán)中,利用EM迭代和LabelCost能量?jī)?yōu)化算法來(lái)改善分類結(jié)果,以獲得穩(wěn)定的分類結(jié)果。
(5)在獲得穩(wěn)定的分類結(jié)果后,利用BIC準(zhǔn)則判斷是否為最佳類別數(shù)。如果不是最佳類別數(shù),進(jìn)行類的合并,重新開(kāi)始進(jìn)行內(nèi)層循環(huán)。如果為最佳類別數(shù),則跳出循環(huán),并輸出最佳類別數(shù)下的分類結(jié)果。
為了驗(yàn)證算法的有效性,本文利用E-SAR德國(guó)Oberpfaffenhofen 地區(qū)的極化干涉 SAR數(shù)據(jù)和CETC38的機(jī)載SAR海南陵水地區(qū)極化干涉SAR數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。Oberpfaffenhofen 地區(qū)的數(shù)據(jù),其波段為L(zhǎng)波段,分辨率為3.0 m×2.2 m,圖像大小為1300像素×1200像素,平臺(tái)高度為3 km,視角從25°變化到 60°。通過(guò)分析該地區(qū)的光學(xué)遙感圖像,并結(jié)合地理坐標(biāo)信息,標(biāo)記對(duì)應(yīng)的地面實(shí)況(ground truth)。海南陵水地區(qū)數(shù)據(jù),其波段為X波段,分辨率為0.5 m×0.5 m,圖像大小為1200像素×400像素,平臺(tái)高度大約是7 km,視角為45°。通過(guò)實(shí)地考察標(biāo)記了對(duì)應(yīng)的地面真實(shí)圖。
圖2為Oberpfaffenhofen 地區(qū)數(shù)據(jù)分類結(jié)果,圖2(b)-圖2(i)分別為4-11類別數(shù)下的分類結(jié)果。從結(jié)果對(duì)比中可以看出,類別數(shù)在7類左右時(shí),分類結(jié)果會(huì)比較好。圖2(j)為不同類別下BIC準(zhǔn)則函數(shù)的曲線圖,曲線在8類時(shí)達(dá)到最小值,說(shuō)明通過(guò)BIC準(zhǔn)則判定最佳類別數(shù)為8類,這符合前面對(duì)類別數(shù)目的分析,在8類的情況下也獲得了好的分類結(jié)果,說(shuō)明了BIC準(zhǔn)則判定的有效性。
如圖3所示,圖3(b)-圖3(h)分別為海南陵水地區(qū)數(shù)據(jù)5-11類別數(shù)下的分類結(jié)果。從圖3(i)中可以看到,BIC準(zhǔn)則函數(shù)與類別數(shù)的變化曲線在第6類時(shí)取得最小值。因此確定最佳類別數(shù)為6類,對(duì)應(yīng)的分類結(jié)果也好于其他類別數(shù)下的分類結(jié)果。同時(shí),從分類結(jié)果圖中也可以看到,在加入了標(biāo)號(hào)代價(jià)項(xiàng)后,分類結(jié)果的噪聲干擾現(xiàn)象得到了很好的抑制,分類目標(biāo)區(qū)域也保持了很好的完整性。
圖2 Oberpfaffenhofen 地區(qū)數(shù)據(jù)不同類別數(shù)下的分類結(jié)果
圖3 海南陵水地區(qū)數(shù)據(jù)不同類別數(shù)下的分類結(jié)果
為了定量分析分類結(jié)果的好壞,引入純度(Purity)和條件熵(Conditional Entropy, CE)參量來(lái)對(duì)分類結(jié)果進(jìn)行評(píng)估。純度和條件熵的定義如下:
其中q為真實(shí)的類別(class)數(shù)目(人為設(shè)定),k為實(shí)際分類所得類別(cluster)數(shù)目。表示原本屬于第i種類別而最后被分為第r種類別的數(shù)據(jù)量大小。純凈度越高,熵就越低,說(shuō)明非監(jiān)督分類結(jié)果越好。表1和表2分別為Oberpfaffenhofen地區(qū)和海南陵水地區(qū)數(shù)據(jù)分類純度和條件熵比較結(jié)果。方法1和方法2分別是用FastPD能量?jī)?yōu)化(沒(méi)有考慮標(biāo)號(hào)代價(jià)項(xiàng))和LabelCost能量?jī)?yōu)化的非監(jiān)督分類算法。
從表中可以看出,隨著類別數(shù)的增加純度會(huì)增大,然后趨于穩(wěn)定。Oberpfaffenhofen地區(qū)數(shù)據(jù)的純度在7類附近開(kāi)始趨于穩(wěn)定,說(shuō)明最佳類別數(shù)為7類左右。海南陵水地區(qū)數(shù)據(jù)的純度在 6類附近開(kāi)始趨于穩(wěn)定,說(shuō)明最佳類別數(shù)為 6類左右。方法2使用了LabelCost能量?jī)?yōu)化算法,該優(yōu)化算法不僅考慮了數(shù)據(jù)代價(jià)項(xiàng)和平滑代價(jià)項(xiàng)的影響,還考慮了標(biāo)號(hào)代價(jià)項(xiàng)的影響,其分類結(jié)果更好,表現(xiàn)為純度更高,條件熵更低。在海南陵水地區(qū)的數(shù)據(jù)實(shí)驗(yàn)結(jié)果中,其效果更好。
表1 Oberpfaffenhofen地區(qū)數(shù)據(jù)純度和條件熵比較結(jié)果
表2 海南陵水地區(qū)地區(qū)數(shù)據(jù)純度和條件熵比較結(jié)果
本文提出了一種改進(jìn)的極化干涉 SAR非監(jiān)督分類算法,通過(guò)利用LabelCost能量?jī)?yōu)化,有效地抑制了噪聲對(duì)分類結(jié)果的影響,目標(biāo)區(qū)域完整性也得到了很好的保持。同時(shí),利用BIC準(zhǔn)則確定了非監(jiān)督分類的最佳類別數(shù),并在最佳類別數(shù)下獲得了良好的分類結(jié)果。
[1]Cloude S R and Papathanassiou K P. Polarimetric SAR interferometry[J].IEEE Transactions on Geoscience and Remote Sensing, 1998, 35(5): 1551-1565.
[2]Ferro-Famil L, Pottier E, and Lee J S. Unsupervised classification and analysis of natural scenes from polarimetric interferometric SAR data [C]. Proceedings of International Geoscience and Remote Sensing Symposium(IGARSS),Sydney Australia, July 7-13, 2001: 2715-2717.
[3]楊震, 楊汝良, 劉秀清, 等. SAR 圖像的極化干涉非監(jiān)督Wishart分類方法和實(shí)驗(yàn)研究[J]. 電子與信息學(xué)報(bào), 2004,26(5): 752-759.
Yang Zhen, Yang Ru-liang, Liu Xiu-qing,et al.. Study of polarimetric interferometric Wishart classification of SAR images[J].Journal of Electronics&Information Technology,2004, 26(5): 752-759.
[4]Neumann M, Reigber A, and Ferro-Famil L. Data classification based on PolInSAR coherence shapes[C].Proceedings of International Geoscience and Remote Sensing Symposium(IGARSS), Seoul, Korea, July 25-29, 2005:517-519.
[5]談璐璐, 楊汝良, 商建, 等. 利用Shannon熵參數(shù)的極化干涉SAR圖像非監(jiān)督分類[J]. 電子學(xué)報(bào), 2010, 38(10): 2264-2267.
Tan Lu-lu, Yang Ru-liang, Shang Jian,et al.. Unsupervised PolInSAR image classification with shannon entropy parameters[J].Acta Electronica Sinica, 2010, 38(10):2264-2267.
[6]Yan W, Yang W, Liu Y,et al.. Unsupervised classification of PolInSAR image based on shannon entropy characterization[C]. Proceedings of International Conference on Signal Processing Proceedings(ICSP), Oct. 24-28, 2010: 2192-2195.
[7]Yan W, Yang W, Sun H,et al.. Unsupervised Classification of PolInSAR data Based on shannon entropy characterization using iterative optimization[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing(JSTARS), 2011, 4(4): 949-959.
[8]代登信. 高分辨率SAR圖像分類研究[D]. [碩士論文], 武漢大學(xué), 2010.
Dai Deng-xin. Study on high-resolution SAR image classification[D]. [Master dissertation], Wuhan University,2010.
[9]J?ger M, Neumann M,et al.. A self initializing PolInSAR classifier using interferometric phase differences[J].IEEE Transactions on Geoscience and Remote Sensing, 2007,45(11): 3503-3518.
[10]Cao F, Hong W, Wu Y R,et al.. An unsupervised segmentation with an adaptive number of clusters using the SPAN H-α-A space and the complex Wishart clustering for fully polarimetric SAR data analysis[J].IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(11): 3454-3467.
[11]Delong A, Osokin A, Isack H.N,et al.. Fast approximate energy minimization with label costs [C]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco USA, Jan. 13-18, 2010:2173-2180.
[12]Morio J, Réfrégier P,et al.. A characterization of shannon entropy and bhattacharyya measure of contrast in polarimetric and interferometric SAR image[J].Proceedings of IEEE, 2009, 97(6): 1097-1108.
[13]Delong A, Osokin A, Isack H N,et al.. Fast approximate energy minimization with label costs[J].InternationalJournal of Computer Vision, 2012, 96(1): 1-27.