胡學剛,段 瑤,嚴思奇
(重慶郵電大學 通信與信息工程學院,重慶 400065)
圖像分割是一種基本的計算機視覺技術,是從圖像處理到圖像分析的關鍵步驟[1].基于模糊C均值聚類的圖像分割算法(FCM算法)[2]作為一種結合了模糊理論和聚類分析的分割算法,被廣泛應用于圖像分割[3-6].與活動輪廓模型、馬爾可夫模型和水平集模型等算法相比,F(xiàn)CM算法應用于圖像分割具有步驟簡單、易于實現(xiàn)、執(zhí)行效率高等特點[4],但這種算法在聚類時未考慮圖像的空間信息,其分割結果很容易受到圖像中的噪聲、異常點和紋理的影響[5,6].為了解決上述問題,研究者們主要通過在FCM算法的目標函數(shù)中增加約束項來提高抗噪能力[7-11].例如,Ahmed等人提出FCM_S算法[7],通過在聚類的每次迭代中計算鄰域像素的影響,提高了算法的抗噪性能.但每次迭代都需要計算鄰域像素,明顯提升了時間復雜度.蔡偉玲等人同時考慮局部區(qū)域像素間灰度關系和空間關系提出的快速廣義的模糊C均值分割算法(FGFCM算法)[8],首先根據(jù)像素間相似性生成一張和圖像,然后對和圖像的直方圖進行聚類,其分割效果和效率都有明顯的提升.公茂果等人提出的算法[9]在利用空間鄰域信息的同時,引入核函數(shù)將原空間樣本映射到高維特征空間后再進行聚類,使得原本線性不可分的樣本變得近似線性可分,進一步提升了FCM算法的分割性能.Ma等人在FGFCM算法的框架下,提出一種基于非局部空間信息的FCM算法(NLFCM算法)[10],該算法使用像素間結構相似性來定義空間約束項,然后將基于此得到的和圖像引入FGFCM算法框架中求解,能得到更好的分割結果.Rajaby等人給出的分割方法[11]首先引入一種自適應權重,同時考慮色度和亮度來重構目標函數(shù),提高了分割性能,但增加了計算復雜度.
由于圖像各區(qū)域之間存在較多相似性,現(xiàn)有多數(shù)算法都容易產(chǎn)生過分割,得到不符合人視覺特性的分割結果.針對此問題,本文提出了一種基于區(qū)域合并的FCM圖像分割算法.該算法使用FGFCM算法獲得初始分割,然后給出一種合并策略對初始分割進行合并,得到最終的分割結果.所提出的算法解決了現(xiàn)有普遍存在的過分割問題,且有更好的分割效果.
在給定的圖像中,令xi表示圖像中第i個像素的灰度值,(pi,qi)表示xi的坐標,第i個像素與第j個像素的相似程度Sij表示為:
(1)
這里λs和λg分別是控制距離差異和灰度差異的尺度因子,λs通常取值為3,λg通常在0.5至6之間選擇[8],σi是一個反應局部區(qū)域平坦程度的值.
利用相似性度量值Sij創(chuàng)建和圖像ξ.由公式(2)可以得到圖像中第i個像素點的灰度值xi′:
(2)
ξ中第l個灰度級ξl的像素點個數(shù)為γl,由此可以得到FGFCM算法如下的目標函數(shù)Jm:
(3)
這里M是新圖像ξ的灰度直方圖中灰度級的總數(shù),c是聚類個數(shù),m為收斂常數(shù),通常在1.5至2.5之間取值[12].ujl為第l個灰度級屬于第j個類別的隸屬度,vj表示第j個聚類中心的灰度值.
利用拉格朗日乘數(shù)法,迭代求式(3)的極小值,以獲得最優(yōu)解或局部最優(yōu)解,由此得到聚類結果.即FGFCM算法的聚類中心與隸屬度矩陣的迭代公式分別為式(4)與式(5).
(4)
(5)
本文提出了一種基于區(qū)域合并的FCM圖像分割算法.該算法首先使用FGFCM算法獲得初始分割,然后利用區(qū)域間顏色信息、空間上的邊緣和鄰接關系建立帶權重的區(qū)域鄰接矩陣[13],最后根據(jù)區(qū)域間的權重和區(qū)域面積大小合并滿足條件的相鄰區(qū)域,得到最終分割結果.合并的關鍵問題包括區(qū)域間距離度量和區(qū)域合并策略.
在區(qū)域合并技術中,區(qū)域間關系需要使用距離度量來量化表示.使用帶權重的區(qū)域鄰接矩陣來表示和存儲區(qū)域間距離度量,其數(shù)學表達為如下的一個無向圖G.
G=(V,E,W)
(6)
其中,V是圖像中所有區(qū)域的集合(頂點集).E是圖像中所有區(qū)域?qū)χg邊的集合(邊集).W是圖像中所有區(qū)域?qū)χg邊的權重的集合,一對區(qū)域之間邊的權重是一個大于0的數(shù),可由區(qū)域間特性計算得到.
區(qū)域合并時,兩個區(qū)域間邊的權重是合并的重要依據(jù),定義兩個區(qū)域Ri與Rj間邊的權重為兩個區(qū)域間距離度量Dij.若兩個區(qū)域在空間上毗鄰,顏色上相似,并且交接處沒有明顯的邊緣存在,則將其合并.為此定義兩個區(qū)域間距離度量Dij如下式(7):
(7)
(8)
(9)
其中,μi和μj分別代表兩個區(qū)域Ri和Rj的顏色均值,‖·‖表示歐氏距離.Eij和Eji分別表示位于相鄰區(qū)域公共邊緣兩側(cè)的像素點的集合,|Eij|和|Eji|分別代表Eij和Eji中像素的個數(shù).xk和xl分別表示相鄰兩區(qū)域邊緣兩側(cè)第k個點和第l個點的顏色值.Δij表示兩個區(qū)域Ri和Rj的鄰接關系,其定義如下.
(10)
建立一個帶權重的v階區(qū)域鄰接矩陣,其第m行n列的值為第m個區(qū)域與第n個區(qū)域之間的距離,該矩陣主對角線上的值設為∞.
在區(qū)域合并過程中,以何種順序、在何種條件下進行區(qū)域合并決定了合并的效果.本文提出的區(qū)域合并策略包括基于區(qū)域間權重的合并順序、基于區(qū)域間權重和區(qū)域面積的合并決策規(guī)則.
合并順序以帶權重的區(qū)域鄰接矩陣為依據(jù),首先取其主對角線右上方的值,排除兩區(qū)域相互鄰接計算兩次的干擾.然后取出鄰接矩陣中所有不為無窮大的數(shù)進行升序排序,合并順序按權值從小到大進行,即先對距離較近的兩個區(qū)域作處理.
考慮到區(qū)域間的相似關系,以及面積較小區(qū)域通常無實際意義的因素,我們使用區(qū)域間權重和區(qū)域面積來建立合并決策規(guī)則:當區(qū)域Ri和Rj間權重小于閾值T1或者兩區(qū)域中任意一個面積小于閾值T2時,兩區(qū)域合并.這里使用3.1節(jié)中的區(qū)域間距離度量,將閾值T1設為所有區(qū)域間距離度量的均值μD和方差σD之差,其定義由式(11)給出.
T1=μD-σD
(11)
閾值T2用于去除圖像中面積過小的區(qū)域,根據(jù)圖像的用途不同,由人工確定T2的值(本文統(tǒng)一設定為10).按順序遍歷所有相鄰區(qū)域后,合并停止.
綜合上述思路,本文提出的分割算法步驟如下:
步驟1.使用FGFCM算法,得到初始分割結果;
步驟2.對初始分割結果進行區(qū)域標記,由區(qū)域間關系建立區(qū)域鄰接矩陣[14];
步驟3.計算鄰接區(qū)域間距離度量,代入?yún)^(qū)域鄰接矩陣中,得到帶權重的區(qū)域鄰接矩陣;
步驟4.計算權重閾值T1,設定面積閾值T2;
步驟5.根據(jù)合并規(guī)則合并相似區(qū)域,得到最終分割結果.
為了驗證本文算法的有效性,本節(jié)首先對兩幅圖像使用FGFCM算法和本文算法進行了分割對比實驗,然后選取兩幅圖像使用NLFCM算法和本文算法進行了分割對比實驗,分割結果中每個區(qū)域的顏色以該區(qū)域的顏色均值來表示.實驗平臺為Win10操作系統(tǒng),8GB內(nèi)存,酷睿i5 6300HQ處理器(2.3GHz),Matlab 2014b.FGFCM算法與NLFCM算法的參數(shù)選取與對應文獻中參數(shù)一樣,本文算法的閾值T2統(tǒng)一設定為10.在圖1(a)、圖1(d)、圖2(a)和圖2(d)所對應的實驗中,根據(jù)圖像中類別的多少,聚類數(shù)c的取值分別為3、3、4和5.
圖1是使用FGFCM算法和本文算法得到的分割結果對比.其中,圖1(a)是獨狼圖像的原圖,圖1(b)和圖1(c)分別是FGFCM算法的分割結果和本文算法的分割結果.從實驗結果可以看出,F(xiàn)GFCM算法分割結果沒有將狼的身體分割為一個整體,在身體上出現(xiàn)空洞形式的過分割區(qū)域,而本文算法正確地將狼的身體分割成為了一個整體.在背景的分割上,本文算法傾向于把后面的黑色山體分割為一個整體,更符合人類主觀視覺特點.
圖1(d)是飛鳥圖像的原圖,圖1(e)是FGFCM算法對圖1(d)的分割結果,圖1(f)是本文算法對圖1(d)的分割結果.由原圖可以看出,飛鳥的背景存在光照不均勻現(xiàn)象,F(xiàn)GFCM算法這種完全由聚類得到結果的分割方法不能將背景天空分割為一個整體,而本文算法經(jīng)過區(qū)域間相似性對比,正確地合并了圖1(f)中被過分割的天空背景,使其成為一個整體區(qū)域.
圖1 合并前后的分割對比Fig.1 Comparison of the results before and after the merger
為了客觀評價本文算法的分割性能,此處我們使用一種基于分割結果的評判標準:E指標[14].該指標基于分割結果的信息熵來評判分割效果,其值越小越好.E指標的定義如下:
E=Hl(I)+Hr(I)
(12)
其中,Hl(I)稱為布局熵(layout entropy),Hr(I)稱為期望區(qū)域熵(expected region entropy).Hl(I)和Hr(I)的定義分別如式(13)和式(14)所示.
(13)
(14)
上面兩式中,c是所有區(qū)域的數(shù)量,j表示分割出的第j個區(qū)域,I表示整個圖像,Sj表示區(qū)域j的面積,SI表示整個圖像的面積.H(Rj)表示第j個區(qū)域的期望區(qū)域熵,其定義為式(15).
(15)
式中Vj表示第j個區(qū)域內(nèi)所有可能出現(xiàn)的灰度值集合(這里是0-255),m是屬于Vj的一個灰度值,Lj(m)表示第j個區(qū)域中,出現(xiàn)灰度值m的像素個數(shù).
表1是對圖1(a)和圖1(d)對應實驗E指標的比較.從表1可以看出,本文算法在每一個圖中都得到了最優(yōu)的客觀指標數(shù)值,與主觀觀測結果一致,進一步說明本文算法有效.
表1 合并前后的E指標比較Table 1 Comparison of E indicators before and after merger
為了進一步說明本文算法的分割性能,我們使用本文算法與NLFCM算法對兩幅圖像做分割對比實驗,實驗結果如圖2所示.
圖2 與NLFCM算法分割對比表現(xiàn)Fig.2 Comparison of segmentation performance with NLFCM algorithm
圖2(a)是教堂圖像的原圖,圖2(b)是NLFCM算法對圖2(a)的分割結果,圖2(c)是本文算法對圖2(a)的分割結果.由原圖可以看出,教堂圖像的天空存在光照不均勻現(xiàn)象,房頂也有由反光導致的光照變化,NLFCM算法將天空和房頂錯誤地過分割為幾個區(qū)域,而本文算法正確地分割出了房頂與天空,將它們視為一個整體區(qū)域.
分別用NLFCM算法和本文算法對大象圖像圖2(d)作分割,得到圖2(e)和圖2(f),可以看出,NLFCM算法不能應對天空和草地的緩慢顏色變化,把天空和草地都分割成了多個區(qū)域,與人類的視覺特性不相符,存在過分割,而本文算法成功地消除了這些過分割,將天空和地面分為一個整體區(qū)域,得到了滿意的分割結果.
表2 合并前后的E指標比較Table 2 Comparison of E indicators before and after merger
表2是對圖2(a)和圖2(d)對應實驗E指標的比較.可以看出,本文算法的客觀指標在每一個圖中都有最小的數(shù)值,說明分割效果較好,與主觀觀測結果一致,進一步說明本文算法的有效性.
本文針對現(xiàn)有FCM算法容易產(chǎn)生過分割的問題,提出一種結合FCM聚類分割和區(qū)域合并的圖像分割算法.實驗表明,該算法能有效克服現(xiàn)有FCM算法容易產(chǎn)生過分割的缺點,得到更優(yōu)的主觀感受和客觀指標,比現(xiàn)有算法有更好的分割性能.