黃 亮,舒 寧
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)
基于支持向量機(jī)(SVM)單目標(biāo)SAR圖像分割
黃 亮,舒 寧
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)
將考慮 SAR圖像局部灰度均值和方差及像素空間分布特征等統(tǒng)計(jì)量,以灰度共生矩陣產(chǎn)生的紋理統(tǒng)計(jì)量為特征向量,經(jīng)過(guò)歸一化后進(jìn)行特征選擇,然后輸入到支持向量機(jī)中進(jìn)行訓(xùn)練建模,利用支持向量機(jī)分類(lèi)方法,以實(shí)現(xiàn)分割結(jié)果。最后,將此方法分類(lèi)結(jié)果與傳統(tǒng)方法進(jìn)行了比較,從對(duì)比結(jié)果可以看出此方法行之有效。
SAR圖像;灰度共生矩陣;圖像分割;支持向量機(jī)
合成孔徑雷達(dá)(Synthetic ApertureRadar,簡(jiǎn)稱(chēng)SAR)是一種工作在微波波段的相干成像雷達(dá),是1951年美國(guó)的Wiley C第一個(gè)提出的。它作為一種可供選擇的遠(yuǎn)距離對(duì)地觀測(cè)途徑,具有高分辨率、全天候、強(qiáng)透射等優(yōu)點(diǎn),在遙感、軍事、水文、地礦等領(lǐng)域有著廣泛的應(yīng)用[1],得到了迅猛的發(fā)展,因而對(duì)SAR圖像的分析處理也變得越來(lái)越重要,其中,SAR圖像的分割則是一個(gè)重要方面。
圖像分割是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)經(jīng)典難題,盡管人們?cè)趫D像分割方面已取得了大量的研究成果,但目前尚無(wú)通用的分割理論提出,現(xiàn)已提出的算法大多都是針對(duì)具體問(wèn)題[2]。正是由于圖像分割的不確定性及分割任務(wù)的重要性,人們至今仍在不斷研究探索新的分割理論與分割算法。再加上SAR是一種相干成像系統(tǒng),因此要受其相干斑噪聲的嚴(yán)重影響。這種噪聲的存在降低了其圖像的質(zhì)量,SAR圖像的這種特性使其分割工作變得更為困難。
目前的分割方法在對(duì)高維特征向量,小樣本數(shù)據(jù)等方面很難獲得好的分割效果。因此,在進(jìn)行圖像分割時(shí),除了重視多種特征融合、多種分割算法的有效結(jié)合外,還需要繼續(xù)致力于將新的概念、新的方法引入圖像分割領(lǐng)域中,充分利用新方法的優(yōu)點(diǎn),以期取得好的分割效果。本文將支持向量機(jī) (Support Vector Machine)這種新方法應(yīng)用到SAR圖像分割中。
式中,C>0為懲罰因子,用于控制對(duì)錯(cuò)分樣本懲罰的程度。
注意到無(wú)論訓(xùn)練樣本在原始特征空間中是否線性可分,求解其對(duì)應(yīng)的優(yōu)化問(wèn)題以及最終得到的最優(yōu)分類(lèi)超平面都只需計(jì)算原始特征空間中樣本之間的內(nèi)積,而不需要知道從原始特征空間到高維特征空間的非線性映射的具體形式。統(tǒng)計(jì)學(xué)習(xí)理論指出,滿(mǎn)足 Mercer定理的函數(shù)K(x,y)可作為內(nèi)積使用,且能以系數(shù)展開(kāi)成稱(chēng)之為核函數(shù)。引入核函數(shù)后,當(dāng)樣本在高維特征空間中不是線性可分時(shí),可求得基于高維特征空間中廣義最優(yōu)分類(lèi)超平面的決策函數(shù)為
怎樣從理論上保證選擇最優(yōu)的核函數(shù),現(xiàn)在仍然是一個(gè)重要的問(wèn)題。在大多數(shù)應(yīng)用中,普遍采用的核函數(shù)有:
原始的SVM是兩類(lèi)分類(lèi)器,對(duì)于多類(lèi)分類(lèi)問(wèn)題,需要對(duì)其進(jìn)行擴(kuò)展。常用的方法有一類(lèi)對(duì)余類(lèi)和一類(lèi)對(duì)一類(lèi)。對(duì)N類(lèi)數(shù)據(jù)分類(lèi)問(wèn)題,前者通過(guò)構(gòu)N個(gè)SVM分別將各個(gè)類(lèi)與剩余的類(lèi)分開(kāi),后者則對(duì)每?jī)深?lèi)構(gòu)造一個(gè)SVM,共需N(N一1)/2個(gè)分類(lèi)器。本文采用一類(lèi)對(duì)一類(lèi)的方法。
2.1 基于灰度共生矩陣紋理特征
間隔d為歐式距離
一幅圖像的灰度共生矩陣反映了圖像灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息。它是分析圖像的局部模式和它們排列規(guī)則的基礎(chǔ),從它出發(fā)可以進(jìn)一步提取描述圖像紋理的一系列特征。我們考慮由以上灰度共生矩陣提取以下幾個(gè)反映紋理特征統(tǒng)計(jì)量:
同時(shí)要注意,在計(jì)算灰度共生矩陣時(shí),需要確定窗口的大小。太小的窗口,不能得到有效的紋理信息;然而,太大的窗口,同一窗口中可能包含有不同的紋理信息,同時(shí)增加了共生矩陣的儲(chǔ)存代價(jià)??梢远嘤脦讉€(gè)大小不一的窗口來(lái)進(jìn)行比較以便得到較好的結(jié)果。
按照上述原理,我們按照以下步驟進(jìn)行特征提取:
1)考慮到處理速度,通常以塊為處理單元。將原圖像分成N×N的小塊圖像 (子區(qū)域),N取值為8;
2)計(jì)算每個(gè)子區(qū)域圖像塊的灰度均值、灰度中值和方差,作為小塊圖像的局部統(tǒng)計(jì)紋理特征;
3)計(jì)算各個(gè)子區(qū)域圖像塊的灰度共生矩陣特征。首先計(jì)算每個(gè)子區(qū)域四個(gè)方向上的灰度共生矩陣,然后分別提取d=1時(shí)四個(gè)方向(0°,45°,90°,135°)上的5個(gè)特征值。
2.2 特征歸一化
在使用SVM分類(lèi)方法之前,對(duì)提取的特征進(jìn)行歸一化非常重要。主要的優(yōu)點(diǎn)是在建立分類(lèi)超平面時(shí),避免動(dòng)態(tài)范圍大的特征淹沒(méi)了動(dòng)態(tài)范圍小的特征,使它們具有同等的作用。另外一個(gè)優(yōu)點(diǎn)是,在特征向量的內(nèi)積計(jì)算時(shí)避免大數(shù)計(jì)算的困難,大的特征值可能引起計(jì)算的溢出。因此,常常需要對(duì)特征進(jìn)行歸一化處理。采用下面的公式進(jìn)行歸一化處理:
經(jīng)過(guò)上述公式歸一化處理后,特征的泛圍限制在[-1,1]之間。在進(jìn)行特征歸一化時(shí),需要對(duì)訓(xùn)練集與測(cè)試集樣本的特征采用同樣的方式進(jìn)行歸一化(如圖 1所示)。
圖1 紋理特征提取
本實(shí)驗(yàn)中,將 (2)和 (3)求得的特征值歸一化到[-1,1],經(jīng)組合后組成特征矢量,按照指定的格式作為訓(xùn)練輸入樣本,輸入到向量機(jī)中進(jìn)行訓(xùn)練建模,具體步驟如下:
將所需特征組成一個(gè)特征向量 (y1,x1,x2,…xi),y=1或-1,分別表示水體區(qū)或非水體區(qū),xi的值為fi經(jīng)歸一化后所對(duì)應(yīng)的值,通過(guò)支持向量機(jī)學(xué)習(xí)方法構(gòu)建一個(gè)基于SAR圖像的水體分類(lèi)器。訓(xùn)練樣本的選取對(duì)分類(lèi)的結(jié)果有一定的影響,樣本數(shù)太少,容易引起欠學(xué)習(xí)的問(wèn)題;樣本數(shù)過(guò)多,一方面,增加訓(xùn)練的代價(jià),另一方面,容易出現(xiàn)過(guò)學(xué)習(xí)的現(xiàn)象。關(guān)鍵在于需要選擇有代表性的樣本進(jìn)行訓(xùn)練。選取樣本中的一半作為訓(xùn)練集,另一半作為測(cè)試集。采用標(biāo)準(zhǔn)支持向量機(jī)進(jìn)行訓(xùn)練建模,在此過(guò)程中首先要確定合適的核函數(shù)類(lèi)型、核參數(shù)、懲罰因子以及窗口尺度,以便獲得最好的分割性能。然后通過(guò)訓(xùn)練后的模型就可對(duì)SAR圖像進(jìn)行分類(lèi),將圖像分割成水體區(qū)和非水體區(qū)的二值圖像。
為此,首先結(jié)合分割參考圖,對(duì)特定的模型及窗口尺度采用 5-折交叉驗(yàn)證法估計(jì)其分類(lèi)精度,選取分類(lèi)精度最高的模型及窗口尺度作為支持向量機(jī)的模型和特征形成窗口尺度。最終,我們選擇在窗口尺度為3的情況下,懲罰因子C=100、徑向基核函數(shù)RBF核函數(shù)作為最佳參數(shù),同時(shí)選取f1,f2,f3,f4,f5為特征向量,最后用訓(xùn)練好的分類(lèi)器對(duì)SAR圖像進(jìn)行分割。
2.3 試驗(yàn)結(jié)果
1)本次試驗(yàn)采用radarsat衛(wèi)星的單極化SAR圖像數(shù)據(jù),截取圖像大小為710*710。對(duì)SAR圖像,采用了不同分割方法對(duì)其進(jìn)行分割,效果對(duì)比如圖2所示。
圖2 不同方法分割效果對(duì)比圖
圖2(a)是SAR圖像原圖,(b)是迭代閾值分割的結(jié)果,(c)是區(qū)域生長(zhǎng)分割的結(jié)果,(d)是K-Means法分割結(jié)果,(e)是最佳熵閾值法分割結(jié)果,(f)是本文方法分割的結(jié)果,從圖可以看出以上方法均分割出了河流主干,而 (b)很明顯除河流主干部分外,其他水體部分分割不準(zhǔn)確,(c)、(d)和 (e)對(duì)于細(xì)節(jié)部分分割不清楚,而本文的方法分割出的圖像細(xì)節(jié)清楚,整體輪廓清晰,一目了然,說(shuō)明本文的分割方法是有效的,同時(shí)還優(yōu)于其他的閾值分割方法。
2)當(dāng)窗口尺度S=3時(shí),不同參數(shù)性能對(duì)比。
表1 不同模型參數(shù)下RBF核函數(shù)的分類(lèi)精度及支持向量數(shù)的比較結(jié)果
從表 1可以看出,通過(guò)試驗(yàn)結(jié)果分析,最優(yōu)參數(shù)為 C=100,2=8,因?yàn)榇藭r(shí)分類(lèi)精度最大,其值為97.54%,此時(shí)分類(lèi)器性能最好,也體現(xiàn)了本文設(shè)計(jì)算法的優(yōu)勢(shì)。
本文詳細(xì)討論了單目標(biāo)SAR圖像的分割過(guò)程。首先,對(duì)原始SAR圖像,從中提取局部統(tǒng)計(jì)特征和由灰度共生矩陣得到的 5個(gè)紋理特征,經(jīng)過(guò)歸一化處理后進(jìn)行特征選擇,然后輸入到支持向量機(jī)中進(jìn)行訓(xùn)練建模,用訓(xùn)練好的分類(lèi)器實(shí)現(xiàn)分割。最后,將本文方法分割結(jié)果與傳統(tǒng)方法進(jìn)行了比較,從對(duì)比結(jié)果可以看出本文方法還是行之有效的。
[1] HenriMaitre.孫洪譯.合成孔徑雷達(dá)圖像處理[M].北京:電子工業(yè)出版社,2005
[2] 章毓晉.圖像分割[M].北京:科學(xué)出版社,2001
[3] 宋建社,袁禮海,薛文通.SAR圖像處理的最新研究與應(yīng)用[J].遙感技術(shù)與應(yīng)用,2002,17(5):284-288
[4] 賈永紅.數(shù)字圖像處理[M].武漢:武漢大學(xué)出版社,2006
[5] 汪西莉,劉芳,焦李成.一種分層馬爾可夫圖像模型及其推導(dǎo)算法[J].軟件學(xué)報(bào),2003,14(9):1 558-1 563
[6] 徐海祥.基于支持向量機(jī)方法的圖像分割與目標(biāo)分類(lèi)[D].武漢:華中科技大學(xué),2005
[7] 楊強(qiáng).支持向量機(jī)的模型及其在圖像分割中的應(yīng)用[D].重慶:重慶大學(xué),2004
[8]Ulaby FT,Kouyate F,Brisco B.Textural Information in SAR Image[J].IEEE Transaction on Geoscience and Remote Sensing,1986,24(2):235-245
[9]Chew H,Bogener R andLM.Dual C.V-support Vector Machine w ith Error Rate and Training Size Beasing[J].Proceedings of IEEE Int.Conf.on Acoustics,Speech and Signa Processing,2001: 1269-1272
[10]Lin C and Wan S.Fuzzy Support Vector M achines[J].IEEE Trans.on NeuralNetworks,2002,13(2):464-471
Single Ob jective Segm entation of SAR Im ages Based on Support Vector Machine(SVM)
by Huang liang
In this paper,some SAR image Statistics in dice were considered such as the local gray mean,variance and the spatial distribution characteristics of pixel.Then,the texture statistics from GLCM was taken as features and was normalized,for which feature selection was carried on.In the end,the support vector machine training model(SVM)was constructed,the segmentation was achieved by SVM.This method of classification were com pared with the traditional method by test,it showed that it was more effective.
SAR,im age segmentation,GLCM,support vector machines(Page:60)
P237.3
B
1672-4623(2011)01-0060-03
2010-04-22
項(xiàng)目來(lái)源:湖北省自然科學(xué)基金資助項(xiàng)目 (2006ABD003)。
黃亮,碩士,主要從事 SAR影像分類(lèi)方面的研究。