趙 園,潘 斌,邰建豪
(武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)
SAR圖像的分割是實(shí)現(xiàn)SAR圖像目標(biāo)識(shí)別的關(guān)鍵步驟,所以,快速、準(zhǔn)確地分割圖像,是SAR圖像解譯的關(guān)鍵技術(shù)之一。但是,由于SAR圖像特有的斑點(diǎn)噪聲的影響,使SAR圖像目標(biāo)的分割問(wèn)題較為復(fù)雜,是SAR圖像分割研究中的難點(diǎn)之一[1]。
基于圖論的圖像分割方法的核心是對(duì)圖像建模,生成描述圖的能量函數(shù)并使其最小化,再通過(guò)能量最小化,求取圖像的最大流進(jìn)行圖像分割。常見(jiàn)的算法有歸一化分割(Normalized cuts)、隨機(jī)游走(Random work)、圖割(Graph cuts)、迭代圖割(Grab Cut)等。GREID等提出了Graph Cuts算法,該算法指定背景區(qū)域,通過(guò)直方圖建模生成能量函數(shù),完成對(duì)圖像的分割[2-3],交互簡(jiǎn)潔,處理速度快,但僅限于對(duì)灰度圖像的分割;Boykov提出了GrabCut算法,該算法利用高斯混合模型(GMM)代替灰度直方圖,對(duì)前景和背景區(qū)域建立GMM模型,構(gòu)造能量函數(shù),并使用迭代的Graph Cuts算法完成圖像的分割[4]。迭代求解使得分割結(jié)果更為準(zhǔn)確,但同時(shí)也會(huì)減緩處理速度。
針對(duì)Grab Cut算法,目前已有不少改進(jìn)。在提升算法效率和準(zhǔn)確度上,Tomoyuki Nagahashi 等在 Grab cut 方法上引入多尺度高斯平滑;翟玲提出一種基于超像素與特征改進(jìn)的 Grab cut 算法[5];有學(xué)者提出一種結(jié)合分水嶺和Grab cut基于前景形態(tài)的多尺度圖像分割方法,以少量的像素點(diǎn)迭代估計(jì)GMM參數(shù),提高算法穩(wěn)定性與普適性[6]。在減少人工交互操作上,D.Khattab以聚類算法為基礎(chǔ),提出了Automatic Grab cut算法的目標(biāo)分割[7];張林對(duì)整幅圖像進(jìn)行建模,利用全局最大流鄰域生長(zhǎng)算法進(jìn)行SAR目標(biāo)的分割等[8]。
本文結(jié)合SAR圖像的乘性噪聲干擾、目標(biāo)較小等特點(diǎn),從提高算法準(zhǔn)確度和減少人工交互操作出發(fā),通過(guò)預(yù)分割的方式,利用FCM算法提供兩組準(zhǔn)確度較高的GMM參數(shù)初始值,迭代求得能量函數(shù)的最小值,得到含目標(biāo)、陰影、噪聲點(diǎn)的分割圖;對(duì)分割圖做濾波處理后,再結(jié)合二維熵濾去孤立的噪聲點(diǎn)和陰影,最終分割出目標(biāo)區(qū)域。
Grab cut是在Graph cuts的基礎(chǔ)上改進(jìn)得來(lái)的,該算法利用高斯混合模型(GMM)取代原有的直方圖,并通過(guò)多次迭代求得能量函數(shù)的最小值,精簡(jiǎn)了交互過(guò)程,使圖像分割準(zhǔn)確度更高[10]。其核心算法:
1)矩形框標(biāo)定。對(duì)于待分割圖像Z=(z1,z2,…,zn),如圖1所示,人工畫(huà)出一個(gè)包含目標(biāo)的矩形框??騼?nèi)表示未知區(qū)域,即“可能為目標(biāo)的像素”,初始化時(shí),該區(qū)域一般包含了目標(biāo)和一部分背景區(qū)域,標(biāo)記為TU;框外表示背景區(qū)域,標(biāo)記為TB;前景區(qū)域標(biāo)記為TF,即“確定為目標(biāo)的像素”,初始化時(shí)TF=?。圖像像素點(diǎn)集合α=(α1,α2,…,αn),α∈(0,1),0表示TB區(qū)域,1表示TU區(qū)域。
圖1 圖像區(qū)域示意圖
2)建立GMM模型及能量函數(shù)。由式1可以看出,Grab cut分割過(guò)程即為能量最小化的過(guò)程:
α=argminEα.
(1)
該算法的能量函數(shù)E表示:
E(α,θ,k,Z)=U(α,θ,k,Z)+V(α,Z),
(2)
(3)
其中,U表示能量函數(shù)的數(shù)據(jù)項(xiàng),即某個(gè)像素屬于目標(biāo)或者背景的概率的負(fù)對(duì)數(shù);V表示能量函數(shù)的邊界項(xiàng);D為表示GMM的函數(shù),θ為選用的GMM模型參數(shù),α為像素的標(biāo)記,k表示GMM個(gè)數(shù)。用來(lái)表示高斯混合模型的函數(shù)D包含多個(gè)高斯分量,每一個(gè)高斯分量又都是相互獨(dú)立的,因此,引入一組新的向量K={k1,k2,k3,…,kN},k=1,2,3,…,N,用來(lái)標(biāo)記像素Zn屬于第Kn個(gè)高斯分量。高斯混合模型的函數(shù)定義為
D(αn,kn,θ,Zn)=-logP(Zn|αn,kn,θ,Zn)-
logω(αn,kn).
(4)
化簡(jiǎn)后得到
D(αn,kn,θ,Zn)=-logω(αn,kn)+
μ(αn,kn)]T∑(αn,kn)-1[Zn-μ(αn,kn)].
(5)
其中,GMM的參數(shù)θ有三個(gè):ω(αn,kn)為GMM的權(quán)重,μ(αn,kn)為GMM的均值向量,∑(αn,kn)為GMM的協(xié)方差矩陣。一旦確定了這三個(gè)參數(shù),帶入目標(biāo)的GMM和背景的GMM,確定能量函數(shù)的數(shù)據(jù)項(xiàng)。故GMM的參數(shù)可表示為
θ={ω(α,k),μ(α,k),∑(α,k)}.
(6)
同時(shí),對(duì)于邊界項(xiàng)V:
V(α,Z)=γ∑(m,n)∈cexp(-β‖Zm-
Zn‖2)×δ(Zm,Zn).
(7)
邊界項(xiàng)主要體現(xiàn)鄰域像素之間不連續(xù)的懲罰,像素之間的相似性用歐式距離來(lái)表達(dá),兩鄰域像素差別越大,能量越小。γ,β是常數(shù),Rother[10]等人在實(shí)驗(yàn)中取得γ=50,β根據(jù)圖像對(duì)比度來(lái)確定。
3)迭代能量函數(shù)最小化。首先利用人工標(biāo)記的TU和TB兩個(gè)像素集合初始化GMM模型,建立能量函數(shù),并通過(guò)最大流-最小割算法進(jìn)行初始分割;根據(jù)初始分割結(jié)果更新前景區(qū)域TF和背景區(qū)域TB集合,更改前景和背景區(qū)域?qū)?yīng)的GMM參數(shù)θ,并通過(guò)最大流算法[11-12],使得能量函數(shù)E(α,k,θ,Z)越來(lái)越小,重復(fù)此過(guò)程,直到迭代終止。
Grab cut算法主要缺點(diǎn)有兩個(gè):一是需要進(jìn)行人工交互操作,不夠方便;二是算法穩(wěn)定性不夠高,GMM初始化參數(shù)的好壞會(huì)直接影響到分割結(jié)果[8]。Grab cut進(jìn)行圖像分割時(shí),利用背景集合和前景集合初始化了兩個(gè)GMM,相當(dāng)于將圖像分為了兩類,因此利用無(wú)監(jiān)督的聚類方法對(duì)圖像自動(dòng)預(yù)分割,并利用統(tǒng)計(jì)結(jié)果代替原有的GMM初始化參數(shù),既可以將算法改為自動(dòng)化,又可以得到更為準(zhǔn)確的GMM初始化參數(shù)。
GMM的參數(shù)估計(jì)由EM算法得到,GMM的初始化依賴于EM算法的初始化[13-14],則該問(wèn)題轉(zhuǎn)化為EM算法的初始值選擇。針對(duì)SAR圖像含噪的特點(diǎn),考慮用FCM算法代替原有的隨機(jī)參數(shù)的方法來(lái)選取EM算法的初始值,即利用FCM算法將SAR圖像粗略的劃分為兩類TU和TB,根據(jù)統(tǒng)計(jì)結(jié)果得到兩組參數(shù)作為EM算法的初始值。
SAR圖像中的乘性噪聲模糊了相鄰區(qū)域的對(duì)比度,使得相鄰區(qū)域的躍變趨于平緩,不同地物邊緣處出現(xiàn)過(guò)渡帶,難以確定邊緣的準(zhǔn)確位置,因此SAR圖像的地物邊緣具有模糊性。FCM 算法屬于模糊聚類的一種,該算法利用隸屬度來(lái)表示數(shù)據(jù)的真實(shí)分布,尤其適用于處理各類間有重疊的情況。它的目標(biāo)函數(shù):
(8)
(9)
其中,U為uki組成的矩陣集合,uki表示某個(gè)像素的隸屬度,其和為1;V為的集合,vk表示第k個(gè)聚類中心;m=2,表示模糊指數(shù),c表示聚類數(shù),‖·‖表示歐氏距離。
由式(6)可知GMM的參數(shù)θ是由μ,∑,w組成的。在改進(jìn)的算法中,采用FCM算法將特征向量歸為k類中,并將各類的方差和均值作為∑和μ,w是各個(gè)類中所含的特征向量百分比。
由于SAR目標(biāo)圖像中目標(biāo)較小,目標(biāo)的陰影較大且含噪,因此在使用本文改進(jìn)的Grab cut算法進(jìn)行分割后,圖像中不僅包含了目標(biāo),還有目標(biāo)的陰影及斑點(diǎn)噪聲,如圖2(b)所示。
圖2 原圖、含陰影的分割圖及灰度直方圖對(duì)比
為了將SAR目標(biāo)圖像中的目標(biāo)分割出來(lái),把陰影和噪聲濾去,根據(jù)圖2中顯示的灰度信息,閾值方法是比較簡(jiǎn)單實(shí)用的方法。二維熵法同時(shí)考慮了像素灰度分布信息和其鄰域空間相關(guān)信息,具有較強(qiáng)的抗干擾能力[15],且二維熵法可以產(chǎn)生多個(gè)閾值,有利于后續(xù)進(jìn)行SAR圖像多目標(biāo)分割的研究。故通過(guò)建立目標(biāo)及背景區(qū)域的概率密度函數(shù)迭代求出各自的二維熵,選擇合適的閾值,分割出SAR圖像中的目標(biāo)。
1)改進(jìn)的Grab cut分割。通過(guò)FCM聚類將原圖像分為兩組數(shù)據(jù),初始化兩個(gè)更準(zhǔn)確的GMM參數(shù);建立能量函數(shù),迭代更新至收斂閾值,得到目標(biāo)、陰影、噪聲分割圖。
2)采用中值濾波,消除圖像中孤立的噪聲點(diǎn),減少分割干擾,考慮到實(shí)驗(yàn)所用SAR圖像尺寸,窗口大小選擇3×3;
3)利用二維熵算法確定分割閾值,濾除陰影及噪聲,提取出目標(biāo)區(qū)域;
4)對(duì)分割后的圖像進(jìn)行二值化處理,完成SAR目標(biāo)的分割。
本文實(shí)驗(yàn)數(shù)據(jù)采用Sandia 實(shí)驗(yàn)室 MSTAR 數(shù)據(jù)庫(kù)的 SAR 圖像,MSTAR成像參數(shù)為 X波段、單極化(HH),分辨率為 0.3 m×0.3 m,大小為128×128,包含BMP-2、BTR-70、T-72 3類目標(biāo)。
根據(jù)本文算法,分別對(duì)數(shù)據(jù)庫(kù)中的3類目標(biāo)進(jìn)行實(shí)驗(yàn),結(jié)果如圖3、圖4、圖5所示。
由圖3(b)、圖4(b)、圖5(b)可以看出,利用本文改進(jìn)的自動(dòng)Grab cut算法進(jìn)行SAR圖像分割后,可以比較明顯的分割出目標(biāo)及陰影區(qū)域,且目標(biāo)及陰影的外部輪廓都比較完整,證明該改進(jìn)算法的可行性;但是還存在兩個(gè)問(wèn)題:一是有殘余的SAR目標(biāo)圖像的斑點(diǎn)噪聲,尤其是當(dāng)待分割的原圖中噪聲較為嚴(yán)重時(shí),結(jié)果會(huì)更明顯,這點(diǎn)可以從圖4(a)、圖4(b)看出;二是目標(biāo)與陰影相接區(qū)域的灰度值變化不明顯,輪廓顯得較模糊。
圖3 BMP-2數(shù)據(jù)分割算法結(jié)果
圖4 T-72數(shù)據(jù)分割算法結(jié)果
圖5 BTR-70數(shù)據(jù)分割算法結(jié)果
對(duì)分割圖進(jìn)行濾波可進(jìn)一步抑制噪聲及雜波,若是直接對(duì)原圖進(jìn)行濾波,可能會(huì)丟失一部分邊緣信息,導(dǎo)致分割結(jié)果不準(zhǔn)確。由圖3(c)、圖4(c)、圖5(c)可以看出,中值濾波對(duì)于脈沖噪聲具有較好的抑制作用,圖中的孤立噪聲明顯減少,且圖像的輪廓邊緣變形較小。
由圖3(d)、圖4(d)、圖5(d)可以看出,經(jīng)過(guò)二維熵算法分割后,SAR目標(biāo)圖像中的噪聲點(diǎn)進(jìn)一步減少,這是因?yàn)樵撍惴ɡ玫夹g(shù),抗干擾能力也有所提高;另外,通過(guò)設(shè)定合適的閾值,將陰影部分濾去,只保留了目標(biāo)區(qū)域,實(shí)現(xiàn)了SAR目標(biāo)圖像的分割。通過(guò)觀察可以看出,分割后的目標(biāo)輪廓較為完整,但是目標(biāo)內(nèi)部有部分缺失,這是由于目標(biāo)內(nèi)部灰度分布不均勻,導(dǎo)致部分區(qū)域隨著陰影被一起濾除掉。
為了更加客觀地評(píng)價(jià)本文算法,此處選用錯(cuò)誤概率(probability of error)和無(wú)監(jiān)督的兩種評(píng)價(jià)指標(biāo),分別將改進(jìn)后的Grab cut算法與改進(jìn)前的Grab cut算法進(jìn)行比較;同時(shí)將本文所提出的經(jīng)過(guò)后處理的改進(jìn)算法與傳統(tǒng)的ICM_MRF分割方法、雙參數(shù)CFAR分割方法進(jìn)行對(duì)比。
錯(cuò)誤概率[16](probability of error)屬于有監(jiān)督評(píng)價(jià)指標(biāo)的一種。其定義:
P(error)=P(O)P(B|O)+P(B)P(O|B).
(10)
其中,P(R)表示由人工分割圖計(jì)算得到的區(qū)域R的先驗(yàn)分割概率,P(R1|R2)表示把區(qū)域R2的像素劃分到區(qū)域R1的概率。錯(cuò)誤概率常用于二類分割算法的評(píng)價(jià),而本文所用圖像都為單目標(biāo)圖像,因此該評(píng)價(jià)方法具有適用性。
區(qū)域內(nèi)部均勻性度量[17]屬于無(wú)監(jiān)督評(píng)價(jià)的一種,不需要先驗(yàn)知識(shí)和標(biāo)準(zhǔn)參考分割圖,其定義:
(11)
該方法利用同類內(nèi)部均勻性的程度來(lái)表示圖像的分割質(zhì)量,即PP值越接近1說(shuō)明圖像分割質(zhì)量越高。
從MSTAR數(shù)據(jù)庫(kù)中隨機(jī)挑選50張圖像,評(píng)價(jià)指標(biāo)取結(jié)果均值,結(jié)果如表1所示。
表1 改進(jìn)前后Grabcut算法的性能指標(biāo)比較
由表1可以看出,使用改進(jìn)后Grab cut分割出的圖像質(zhì)量更好,但是準(zhǔn)確率卻低于改進(jìn)前的Grab cut 分割方法。主要原因是人工交互可以準(zhǔn)確的識(shí)別簡(jiǎn)單目標(biāo),而利用函數(shù)模型表達(dá)分割問(wèn)題則會(huì)有一定的出錯(cuò)率。
由表2可以看出,使用本文方法得到的分割結(jié)果在區(qū)域內(nèi)部均勻性度量和錯(cuò)誤概率兩項(xiàng)指標(biāo)上均優(yōu)于傳統(tǒng)的ICM-MRF和雙參數(shù)CFAR分割方法,具有更高的精度和一定的適用性。
表2 不同分割算法的性能指標(biāo)比較
本文通過(guò)FCM聚類進(jìn)行初始化分割,得到兩組質(zhì)量較好的GMM參數(shù),把傳統(tǒng)需要交互的Grab cut算法自動(dòng)化,得到了初步的分割圖。同時(shí)為了濾去SAR目標(biāo)圖像中的陰影及噪聲,引入二維熵算法,通過(guò)選定合適的閾值,最終分割出SAR圖像中的目標(biāo),改善了SAR圖像目標(biāo)分割方法對(duì)于噪聲敏感且需要人工交互的問(wèn)題。根據(jù)實(shí)驗(yàn)結(jié)果,本文方法取得的效果良好,有一定的適用性。
本文使用的實(shí)驗(yàn)圖像都為單一目標(biāo)SAR圖像,除了特有的噪聲外,SAR圖像背景也較簡(jiǎn)單,沒(méi)有其他地物等的干擾,因此在利用聚類算法初始化時(shí)能取得較好的預(yù)分割效果,后續(xù)進(jìn)行閾值分割時(shí)也比較容易;但是在多目標(biāo)圖像或者背景分布比較復(fù)雜的SAR圖像上時(shí),算法是否適用以及該怎樣改進(jìn),是后續(xù)研究重點(diǎn)之一。另外, Grab cut算法中進(jìn)行能量函數(shù)最小化的過(guò)程以及二維熵算法都使用了迭代技術(shù),增加了計(jì)算量,因此,在進(jìn)行大場(chǎng)景數(shù)據(jù)分割時(shí),還需要做出下一步的改進(jìn)提高算法的效率。
[1] 焦李成, 張向榮, 侯彪, 等. 智能SAR圖像處理與解譯[M]. 北京:科學(xué)出版社,2008:21-27.
[2] GREIG D,PORTEOUS B,SEHEULT A. Exact maximum a posteriori estimation for binary images[J]. Journal of the Royal Society, Series B,1989,51(2):271-279.
[3] SZELISKI R, ZABIN R, SCHARSTEIN D, et al. A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness Based Priors [J]. IEEE Transaction on Pattern Analysis and Machin Intelligence(S0162-8828),2008,30(6): 1068-1080.
[4] BOYKOV Y,KOLOMOGOROY V. An experimental comparison of min-cut/maxflow algorithms for energy Minimization in Computer Vision and Pattern Recognition[M]. Springer Verlag, 2001:359-374.
[5] 翟玲, 朱敏, 戴李君. 基于超像素與特征改進(jìn)的Grab cut前景分割[J].微型電腦應(yīng)用,2015,31(11):48-50.
[6] 伊聰聰, 吳斌, 張紅英. 一種改進(jìn)的Grab cut 圖像分割方法[J].小型微型計(jì)算機(jī)系統(tǒng),2014(35):1164-1168.
[7] KHATTAB D, EBIED H M, HUSSIEN A S,et al. Automatic Grab Cut based on unsupervised clustering for image segmentation[J]. Intelligent Systems and Computing, 2015( 323):579-592.
[8] 張林, 朱兆達(dá). 基于全局Maxflow領(lǐng)域生長(zhǎng)算法的SAR圖像目標(biāo)分割[J]. 南京航空航天大學(xué)學(xué)報(bào), 2010(12):15-16.
[9] BLAKE A, ROTHER C, BROWN M, et al.Interactive Image Segmentation using an adaptive GMMRF model[C]. In Proc. European Conf. Computer Vision,2004, 30(21):428-441.
[10] ROTHER C, KOLMOGOROV V, BLAKE A. Grabcut: Interactive foreground extraction using iterated graph cuts[C]. Transactions on Graphics (TOG). ACM, 2004.23(3): 309-314.
[11] 陳國(guó)良, 孫廣中, 徐云, 等. 并行算法研究方法學(xué)[J]. 計(jì)算機(jī)學(xué)報(bào),2008, 31(9):1493-1502.
[12] YUAN J,BAE E,TAI X C. A study on continuous max-flow and min-cut approaches[C].Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on. IEEE, 2010: 2217-2224.
[13] 王鑫.基于高斯混合模型的聚類算法及其在圖像分割中的應(yīng)用[D]. 太原:中北大學(xué),2013.
[14] WU W Y, WANG M J. Elliptical object detection by using geometric properties[J]. Pattern Recognition. 1993. 26(10):1499-1509.
[15] YIMIT A. A New Two-Dimensional Direction Histogram Based Entropic Thresholding[C].International Conference on Image & Graphics, 2011:106-110.
[16] 張曉敏. 一類馬氏樣本下假設(shè)檢驗(yàn)問(wèn)題錯(cuò)誤概率的估計(jì)[J]. 應(yīng)用數(shù)學(xué), 2008,21(1):179-184.
[17] ZELNIO E G, GARBER F D. Algorithms for Synthetic Aperture Radar Imagery X[J]. Society of Photo-optical Instrumentation Engineers Conference Series, 2012:8394.