蘭 蓉,胡天隆,趙 強
(西安郵電大學 通信與信息工程學院,陜西 西安 710121)
圖像分割就是將一幅圖像按照顏色、灰度、紋理等劃分成若干個具有不同特性的區(qū)域,并分離出感興趣區(qū)域的過程[1,2]。在眾多圖像分割算法中,模糊C均值(fuzzy C means,F(xiàn)CM)聚類算法的應用最為廣泛[3]。然而,經(jīng)典的FCM算法具有收斂速度較慢[4]以及像素誤判等問題。針對上述問題,國內(nèi)外學者從不同的角度對FCM算法進行改進。Lei等引入形態(tài)學重構(gòu)操作,提出了一種快速魯棒的圖像分割算法[5]。Huang等結(jié)合超像素算法改善FCM算法處理高分辨率遙感影像時的性能[6]。Kashif利用區(qū)間2型模糊集進一步提高FCM算法處理不確定性信息的能力[7]。Fan等基于競爭學習的思想,提出了抑制式模糊C-均值(suppressed fuzzy C-means,SFCM)聚類算法[8],但未解決抑制因子的自適應選取問題。
為了實現(xiàn)對SFCM算法中抑制因子的自適應選取,進一步提升算法性能,許多改進算法被相繼提出。依據(jù)聚類有效性函數(shù),F(xiàn)an等提出了抑制因子的自適應選取算法[9]。Xiao等根據(jù)樣本隸屬度與樣本所在位置間的關(guān)系,在添加約束條件的基礎上改進了抑制因子的選取方式[10]。Yu等將可能性C均值聚類算法[11]與SFCM算法相結(jié)合,提出了抑制式可能性C均值聚類算法[12],該算法不僅可以實現(xiàn)抑制因子的自適應選取,同時改善了PCM算法的中心重合問題。
在上述算法中,F(xiàn)CM算法,結(jié)合超像素的改進算法和結(jié)合區(qū)間2型模糊集的改進算法并未對隸屬度進行修改。其余改進算法,雖然對隸屬度進行了修改,但修改過程只是簡單的濾波或是令其向“兩極”,即,0或1移動,并且大多僅利用了灰度信息,并未考慮像素點所屬區(qū)域的信息,從而導致了相應算法的分割準確率較低,收斂性能較差。
基于以上問題,本文提出了結(jié)合區(qū)域信息的雙抑制模糊C-均值聚類圖像分割(double suppressed fuzzy C-means clustering image segmentation with regional information,DSFCM-RI)。首先,對圖像進行初始區(qū)域劃分,并提取區(qū)域信息;接著,利用圖像區(qū)域信息對隸屬度進行一次抑制;最后,結(jié)合區(qū)域信息與數(shù)據(jù)的分布特性,構(gòu)建抑制因子的自適應選取公式,實現(xiàn)對隸屬度的二次抑制。相較于對比算法,本文算法提高了圖像的分割準確率,改善了收斂性能。采用本文算法對自然圖像進行分割實驗,實驗結(jié)果及評價指標表明了DSFCM-RI算法的有效性。
給定數(shù)據(jù)集X={x1,…,xn}, FCM聚類算法基于最小化目標函數(shù)將X劃分為c類,其目標函數(shù)為
(1)
式中:m>1是模糊指數(shù),vi表示第i個聚類的中心,uij表示數(shù)據(jù)點xj對于第i個聚類中心的隸屬程度,同時,由uij構(gòu)成的U稱為隸屬度矩陣,即U=(uij)c×n。
由拉格朗日乘子法可得以下迭代公式
(2)
(3)
為了提高FCM算法的收斂速度,并保持良好的分類性能,F(xiàn)an等提出了SFCM聚類算法,其主要思想是獎勵樣本的最大隸屬度,同時抑制其它隸屬度,具體過程如下。
針對式(2)計算的隸屬度矩陣進行修正。設第d個樣本為最大隸屬度,即
(4)
那么
(5)
uij=αuij,i≠d
(6)
其中,α∈[0,1] 為抑制因子。
為了提高SFCM算法的分割準確率,并改善收斂性能,本文提出一種結(jié)合區(qū)域信息的雙抑制FCM聚類圖像分割算法。該算法針對現(xiàn)有改進的SFCM算法中僅考慮灰度信息導致的像素錯分問題,首先利用區(qū)域信息對隸屬度進行一次抑制,使本文算法獲得更為理想的分割結(jié)果。此外,利用指數(shù)函數(shù)構(gòu)造抑制因子的自適應選擇公式,實現(xiàn)二次抑制,改善本文算法的收斂性能。
2.1.1 初始區(qū)域劃分
本文基于邊緣檢測和形態(tài)學處理對圖像進行初始區(qū)域劃分,具體步驟如下。
步驟1 通過Laplacian算子[13]得到圖像的邊緣檢測結(jié)果,并通過二值化閾值T強化不同區(qū)域的邊界;
步驟2 采用閉操作[14]改善邊緣連通性;
步驟3 進行孔洞填充[14],即,設定填充閾值FT, 對面積小于FT的區(qū)域判定為孔洞,進行填充;
步驟4 設定消除閾值ET, 對面積小于ET的區(qū)域判定為干擾數(shù)據(jù),將其劃分到面積較大區(qū)域;
步驟5 采用中值濾波對圖像進行平滑。
至此實現(xiàn)了圖像的初始區(qū)域劃分,即實現(xiàn)了對原圖像域的劃分。
2.1.2 區(qū)域信息提取
計算各區(qū)域的極差與平均信息,分別由R1,R2和A1,A2表示,定義如下
(7)
(8)
其中,N1和N2分別為劃分至區(qū)域S1和S2的像素數(shù)量。
區(qū)域位置、極差及平均信息共同構(gòu)成區(qū)域信息。至此,完成了圖像區(qū)域信息的提取。
在SFCM算法及其改進算法中,大多僅考慮圖像的灰度信息,易導致模糊劃分矩陣中某些像素的隸屬度發(fā)生偏移,從而出現(xiàn)誤分割現(xiàn)象。本文算法利用區(qū)域極差信息構(gòu)造修正因子的選取公式,并通過區(qū)域位置信息對分屬不同區(qū)域的像素點的隸屬度實現(xiàn)一次抑制,提高算法的分割準確率,具體如下:
第一步:對任意xj, 利用區(qū)域位置信息判斷其所屬區(qū)域;接著,通過隸屬度矩陣判斷在本次迭代中各區(qū)域所屬類別。
第二步:若xj屬于某一區(qū)域,則對該區(qū)域所屬類別的隸屬度進行獎勵,對其它隸屬度進行懲罰,稱為一次抑制,公式如下
(9)
uij=β×uij,i≠g
(10)
其中,g代表一次抑制過程中區(qū)域所屬類別,β代表修正因子,具體選取公式如下
(11)
式中:R1和R2由式(7)給出。
在SFCM算法中,抑制因子α的取值將影響算法的收斂性能。本文將區(qū)域均值信息和數(shù)據(jù)分布特征相結(jié)合,構(gòu)建指數(shù)函數(shù)型的抑制因子自適應選取公式,實現(xiàn)隸屬度的二次抑制,具體公式如下
(12)
式中:σ是原始數(shù)據(jù)標準差,A1,A2是區(qū)域平均信息,由式(8)給出。
由于式(12)不涉及任何參數(shù),因此,在實現(xiàn)自適應選取抑制因子的過程中,不會因為參數(shù)的人工設置影響圖像分割的效果。
相較于SFCM算法,本文提出的DSFCM-RI聚類圖像分割算法將圖像的區(qū)域信息引入聚類算法的迭代過程中,既能降低算法的迭代次數(shù),又能提高分割準確率。算法具體流程如下:
DSFCM-RI
輸入:數(shù)據(jù)集X,聚類數(shù)目c,模糊指數(shù)m,迭代終止閾值ε=1×10-5, 迭代次數(shù)k以及相關(guān)參數(shù)
輸出:隸屬度矩陣U,聚類中心V
步驟:
(1)對圖像進行初始區(qū)域劃分并運用式(7)、 式(8)提取區(qū)域信息。
(2)隨機初始化隸屬度矩陣U(k), 此時k=0。
(3)運用式(3)計算聚類中心V(k)。
(4)運用式(2)更新隸屬度矩陣U(k+1)。
(5)運用式(9)~式(11)實現(xiàn)對隸屬度矩陣的一次抑制。
(6)運用式(4)~式(6)和式(12)實現(xiàn)對隸屬度矩陣的二次抑制。
為了驗證本文算法的有效性,本節(jié)分別從4個方面檢驗并分析該算法的性能。首先,根據(jù)圖像的分割視覺效果和量化指標對本文算法的分割性能進行分析;其次,分析二值化閾值T的選取對算法性能的影響;接著,驗證采用區(qū)域信息的有效性;最后,通過迭代次數(shù)和運行時間的統(tǒng)計結(jié)果對本文算法的效率進行分析和說明。
實驗環(huán)境如下:Windows 8.1;Intel Core i5;4 G RAM;MATLAB R2018a.
為了客觀驗證本文算法的有效性,將經(jīng)典圖像以及Weizmann[15]圖像作為測試圖像,并與6種相關(guān)算法進行對比實驗:FCM算法、SFCM算法、MShFCM算法、IPSFCM算法[10]、SPCM算法[11]以及FRFCM算法[5]。
實驗中,本文算法的相關(guān)參數(shù)設置如下:由大量實驗確定二值化閾值T=100; 填充閾值FT和消除閾值ET取經(jīng)驗值,分別為FT=IMT/16,ET=IMT/300, 其中IMT表示原圖像面積。
3.1.1 性能指標
本文將從聚類指標和分割指標兩個方面分別量化分析算法的有效性。
首先介紹2種聚類有效性評價指標:劃分系數(shù)(partition coefficient,PC)[16]和劃分熵(prtition entropy,PE)[16],定義如下:
(13)
(14)
其中,劃分系數(shù)越大且劃分熵越小,說明算法的聚類性能越好。
此外,對于分割有效性的評價,本文選用了以下2種指標,分別是:
分割準確率(segmentation accuracy,SA)[17]定義為
(15)
式中:AM表示經(jīng)算法處理得到的屬于第M類的像素集,GM表示標準分割中屬于第M類的像素集,c為聚類數(shù)目,SA越接近1,表示分割結(jié)果越準確。其中,標準分割結(jié)果是由相關(guān)領域?qū)<胰斯俗⒍?,已在相應圖庫中列出。
峰值信噪比(peak signal to noise ratio,PSNR)[18]是一種全參考的圖像質(zhì)量評價指標,定義為
(16)
(17)
其中,P(i,j) 和Q(i,j) 分別表示大小為B×D的標準分割結(jié)果和算法實際分割結(jié)果。PSNR值越大,圖像分割效果越好。
3.1.2 經(jīng)典圖像的分割結(jié)果
本文選取eight、coins、house這3幅經(jīng)典圖像對相關(guān)算法性能進行測試。由于經(jīng)典圖像沒有提供可以參考的標準分割結(jié)果,故通過實驗可視化結(jié)果和聚類有效性指標驗證算法的有效性。
圖1(a)為原始圖像,圖1(b)~圖1(h)分別為7種算法對eight圖像的分割結(jié)果,其中,圖1(h)為本文算法的分割結(jié)果。顯然,大多數(shù)對比算法由于僅考慮了灰度信息,使得硬幣反光部分區(qū)域產(chǎn)生了錯誤分割,而本文算法結(jié)合了區(qū)域信息,實現(xiàn)了對隸屬度的一次抑制,避免了像素錯分現(xiàn)象。值得注意是,F(xiàn)RFCM算法由于采用了形態(tài)學重建的方法得到了最好的可視化結(jié)果,但是由于隸屬度濾波的影響,導致其聚類性能較差,由表1可知,本文算法具有最佳的聚類性能。
圖1 7種算法對#eight的分割結(jié)果
表1 6種算法對經(jīng)典圖像的分割量化結(jié)果
圖2為coins圖像及7種算法的分割結(jié)果對比,其展示次序與圖1一致。顯然,一枚硬幣由于表面灰暗導致其與背景的灰度值較為接近,是該圖像的分割難點之一。對比算法均未能有效的將該枚硬幣完整的分割出來,而DSFCM-RI算法能夠利用區(qū)域信息對模糊劃分矩陣進行修正,從而得到更為合理的分割結(jié)果。
圖2 7種算法對#coins的分割結(jié)果
圖3中,對比算法由于僅考慮灰度信息,故無法對房屋白漆部分及天空進行正確分割。本文算法結(jié)合區(qū)域信息,能夠極大地減少白漆錯分現(xiàn)象的產(chǎn)生,并得到更為接近原圖的房屋輪廓。
圖3 7種算法對#house的分割結(jié)果
由表1可知,與其它算法相比,DSFCM-RI算法由于自適應抑制因子,實現(xiàn)了對隸屬度的二次抑制,故在兩種聚類指標中均能保持一定的優(yōu)勢。
3.1.3 Weizmann數(shù)據(jù)庫的分割結(jié)果
在3.1.2節(jié)中,由于經(jīng)典圖像無標準分割圖像,僅對聚類性能進行量化分析。為了能夠量化分析本文算法在分割性能上的優(yōu)劣,選取Weizmann數(shù)據(jù)庫[15]中的多幅圖像進行測試。圖4~圖7給出了其中4幅圖像經(jīng)7種算法處理后的分割結(jié)果,表2列出了其聚類有效性指標和分割有效性指標,具體如下。
圖4 7種算法對#1013的分割結(jié)果
圖5 7種算法對#1051的分割結(jié)果
圖6 7種算法對#2003的分割結(jié)果
圖7 7種算法對#2051的分割結(jié)果
圖4(a)為#1013原始圖像,是一幅直升機圖片,其中的螺旋槳和牽引繩由于形狀較小且與背景灰度較為接近,是該圖像的分割難點。圖4(b)為標準類別標簽所生成的圖像,圖4(c)~圖4(i)是由7種算法處理后的分割結(jié)果。顯然,大部分算法無法對易錯分區(qū)域進行正確的分割,而本文算法通過引入?yún)^(qū)域信息,可對隸屬度進行一次抑制,較為完整的分割出螺旋槳的整體形狀,并且分割出牽引繩與直升機的連接部分,得到了與標準分割更為接近的結(jié)果。
圖5~圖7分別為#1051、#2003及#2051經(jīng)7種算法處理后的分割結(jié)果,圖像的展示次序均與圖3保持一致。
圖5中,原始圖像的分割難點在于白鷺眼部及嘴部的灰度值與其自身灰度相差較大,目標局部較暗導致了誤判情況的產(chǎn)生。由實驗可知,對比算法對于錯分區(qū)域并未產(chǎn)生明顯改善,與標準分割存在差距;本文算法則取得了較為理想的效果。
圖6中,對比算法由于僅考慮灰度信息,對于灰度值較為接近的沙灘與鋪滿沙粒的木板,無法完整分割出木板的形狀,同時由于后方鳥類的嘴部及腿部過細,導致其也難以被完整分割;而本文算法利用區(qū)域信息修正像素隸屬度,實現(xiàn)了對隸屬度的一次抑制,有效改善了錯分現(xiàn)象,得到較好的分割結(jié)果。
圖7中,老鷹受自身羽毛顏色的影響,導致其頭部與尾部區(qū)域的灰度值與自身灰度差別較大,因此對比算法無法正確分割出頭尾區(qū)域,而本文算法在考慮灰度信息的基礎上結(jié)合區(qū)域信息,使得頭尾區(qū)域的錯分現(xiàn)象得到了明顯的改善。
表2 7種算法對Weizmann圖像的分割量化結(jié)果
表2列出以上圖像分割結(jié)果的性能指標值。由表2可知,本文提出的DSFCM-RI算法由于結(jié)合區(qū)域信息實現(xiàn)了對抑制因子的自適應選取,完成了對隸屬度矩陣的二次抑制,故在大多圖像上都獲得了最佳的聚類性能,同時分割性能較對比算法也有所提高。
為了合理選取本文算法中二值化閾值T,并分析參數(shù)T對分割結(jié)果造成的影響,針對Weizmann數(shù)據(jù)庫,本文以分割準確率作為指導,統(tǒng)計不同的T值對圖像分割效果的影響,部分結(jié)果如表3和圖8所示。
表3 參數(shù)T對分割量化結(jié)果的影響
圖8 參數(shù)T對本文算法的影響
由表3可知,當T=100時,相應圖像的分割準確率在部分情況下可以得到最優(yōu),或次優(yōu)值。而當T取其它值時,分割準確率達到最優(yōu)及次優(yōu)的情況相對較少。
為了進一步說明閾值T造成的影響,根據(jù)表3繪制折線圖,如圖8所示。可以看出,T=50時,雖然在個別圖像上取得了最優(yōu)結(jié)果,但整體穩(wěn)定性較差;T=200時,存在迭代無法收斂的情況;其余2種情況下,分割準確率較為穩(wěn)定,皆保持在90%以上,但從整體效果和平均值可以看出,T取100時,得到了更為穩(wěn)定和較好的分割結(jié)果。
結(jié)合表3、圖8以及以上分析,針對Weizmann數(shù)據(jù)庫,二值化閾值T=100是更為合理的選取結(jié)果。
經(jīng)典圖像的閾值選取方式與上述步驟相同,故不再詳細說明。此外,可以看出當T值偏離最優(yōu)取值時,圖像的分割效果都會不同程度的受到影響。因此,針對不同圖像選取出其最優(yōu)T值,將會得到更為合理的實驗結(jié)果,同時也可擴大圖像的適用范圍。如何自適應選取閾值T將是下一階段的研究目標。
為了檢驗本文算法中的區(qū)域信息對于改善圖像分割性能及聚類性能的有效性,選取對比算法中分割性能整體較好的MShFCM算法,將結(jié)合區(qū)域信息的一次抑制方法與其相結(jié)合,提出MShFCM-RI算法,并對#2001圖像進行分割,實驗結(jié)果如圖9(d)所示。從圖中可知,MShFCM-RI算法較原算法在分割結(jié)果上與標準分割結(jié)果更為接近,更為完整地獲得螺絲的整體形狀。
同時,為了客觀驗證區(qū)域信息對聚類算法的作用,將MShFCM-RI算法針對Weizmann數(shù)據(jù)庫中的圖像進行仿真實驗,表4給出了3種算法對于該數(shù)據(jù)庫中部分圖像的平均性能指標測試結(jié)果。
由表4可知,添加區(qū)域信息后,由于對隸屬度進行了一次抑制,MShFCM-RI算法的聚類性能雖然有所降低,可分割性能卻較原算法有了明顯提升,指標值甚至略高于本文算法。由此可見,結(jié)合區(qū)域信息的一次抑制在提升算法分割性能上具有一定的作用。
圖9 區(qū)域信息影響
表4 區(qū)域信息對10幅圖像的指標平均值的影響
值得注意的是,MShFCM-RI算法雖然分割性能較本文算法有稍許提高,聚類性能卻仍有一定差距,這是由于抑制因子自適應方法的不同所造成的。這也在一定程度上印證了本文算法中結(jié)合區(qū)域信息的二次抑制亦可對聚類性能造成一定的影響。
通常,迭代次數(shù) (k) (單位:次)與執(zhí)行時間 (t) (單位:s)是用來衡量聚類收斂性能與算法運行效率的指標。本文從Weizmann數(shù)據(jù)庫中選取10幅測試圖像對DSFCM-RI算法與對比算法的迭代次數(shù)和運行時間進行比較,具體數(shù)據(jù)見表5,統(tǒng)計結(jié)果的平均值則以直方圖的形式呈現(xiàn)在圖10中。
由于FCM算法在迭代過程中并未對隸屬度進行修改,且其具有迭代次數(shù)多,執(zhí)行時間短的特點,而SPCM算法也繼承了PCM算法迭代次數(shù)多的特點,故FCM算法和SPCM算法不參與本小節(jié)的數(shù)據(jù)統(tǒng)計。
表5 5種算法對10幅圖像的分割的迭代次數(shù)和時間統(tǒng)計
圖10 5種算法對10幅圖像分割的 平均迭代次數(shù)及執(zhí)行時間
由表5可知,SFCM算法由于抑制因子采用固定值選取,迭代次數(shù)較高;MShFCM算法雖然改進了抑制因子的選取方式,但在迭代次數(shù)上并無明顯優(yōu)勢;IPSFCM算法由于為抑制因子添加了約束條件,迭代次數(shù)有所減少;FRFCM算法由于采用了對隸屬度進行濾波的方式,同樣也能獲得較少的迭代次數(shù);而本文提出的DSFCM-RI算法結(jié)合區(qū)域信息實現(xiàn)了抑制因子的自適應選取,使算法的收斂性能得到了改善。
結(jié)合表5和圖10中各算法的執(zhí)行時間和平均執(zhí)行時間可知,SFCM算法采用人工取值的抑制因子對隸屬度進行修正,加速了算法收斂,耗時較短;MShFCM算法則實現(xiàn)了對抑制因子的自適應選取,在每次迭代中更新抑制因子,耗時更短;而IPSFCM算法由于在迭代過程中加入了對隸屬度獎懲的判定過程,執(zhí)行時間明顯加長;FRFCM算法由于在灰度直方圖上實現(xiàn)聚類,同樣可以得到較短的執(zhí)行時間;本文提出的DSFCM-RI算法雖然結(jié)合區(qū)域信息指導抑制因子的自適應選取,但是初始區(qū)域劃分需要一定耗時,故執(zhí)行時間較長。綜上所述,本文算法雖然運行效率較低,但具有較高的收斂性能,同時分割性能與聚類性能也較對比算法具有一定的改善。
本文提出一種結(jié)合區(qū)域信息的雙抑制模糊C-均值聚類圖像分割算法,本文算法針對SFCM算法及其改進算法大多僅考慮圖像像素的灰度信息,分割準確率較低,算法收斂較慢等不足,通過提取并利用圖像的區(qū)域信息實現(xiàn)對隸屬度的一次抑制,有效克服像素錯分問題,達到提高分割準確率的目的。此外,本文將區(qū)域信息和數(shù)據(jù)分布特性相結(jié)合,采用指數(shù)函數(shù)設計抑制因子的選取公式,實現(xiàn)抑制因子的自適應確定,由于該公式可以不涉及任何參數(shù)的實現(xiàn)對隸屬度的二次抑制,因此對提升聚類性能起到了積極的作用。與此同時,引入?yún)^(qū)域信息也起到了加速收斂的目的。通過仿真實驗及定量分析可知,相較對比算法,本文算法有效降低了分割時的誤判,同時提高了算法的聚類性能,亦對收斂性能具有一定的積極影響。但是,二值化閾值T仍然采用主觀經(jīng)驗值方式進行選取,算法目前僅僅面向二分類問題。如何使閾值參數(shù)自適應和將算法推廣至多類問題將是下一步的研究課題。此外,初始區(qū)域劃分的可靠性會在一定程度上影響對算法性能,如何快速有效進行初始區(qū)域劃分是利用區(qū)域信息進行聚類的過程中值得進一步研究的課題。