王麗艷,戚大偉
(東北林業(yè)大學(xué) 理學(xué)院,黑龍江 哈爾濱 150040)
木材是人們生產(chǎn)生活中不可缺少的物質(zhì)資料。但是木材生長(zhǎng)周期長(zhǎng),得不到及時(shí)的供給,增加了供需矛盾。而人們不合理的利用木材,更加劇了供需矛盾。為了更好的保護(hù)森林資源,節(jié)約能源[1],木材缺陷檢測(cè)有很大的價(jià)值。對(duì)木材缺陷CT圖像的處理也是方法之一。木材缺陷CT圖像分割的方法有很多種,實(shí)質(zhì)都是將目標(biāo)與背景分離,即將缺陷與背景分離[2]。由于事物之間具有或多或少的相似性即產(chǎn)生了模糊現(xiàn)象,給圖像分割帶來(lái)了困難。利用模糊數(shù)學(xué)聚類的圖像分割方法就應(yīng)運(yùn)而生。而模糊C均值(Fuzzy C-Means,FCB)聚類算法是當(dāng)今比較流行的一種算法[3]。它的特點(diǎn)是不需要有先知經(jīng)驗(yàn)就可以將圖像分割成幾類,是一種無(wú)監(jiān)督的聚類算法。它以這種強(qiáng)大的優(yōu)勢(shì)應(yīng)用到生活的各個(gè)領(lǐng)域,例如醫(yī)院、氣象、經(jīng)濟(jì)管理等領(lǐng)域。
但是模糊C均值聚類算法并非十全十美,有很多問(wèn)題需要改善。主要分為兩大方面:一是圖像分割過(guò)程中,模糊C均值算法各項(xiàng)參數(shù)的選擇。二是模糊C均值算法對(duì)噪聲敏感,分割圖像時(shí),不能完整的保留邊緣細(xì)節(jié),丟失很多信息。針對(duì)以上問(wèn)題,許多學(xué)者從不同角度對(duì)算法進(jìn)行改進(jìn)。本文主要是針對(duì)模糊C均值算法各項(xiàng)參數(shù)的選擇問(wèn)題進(jìn)行研究。
采用圖論的圖像分割算法[4]首先分析圖像在不同F(xiàn)RFT域的能量分布特點(diǎn),通過(guò)歸一化剩余誤差因子評(píng)估和分析圖像所包含的信息,在采用最小生成樹的方法對(duì)圖像區(qū)域進(jìn)行分割。還有很多快速分割方法[5],將圖像數(shù)據(jù)劃分成一定數(shù)量的子集,然后利用區(qū)域粗糙度標(biāo)記所有子集,最后根據(jù)子集質(zhì)心及其權(quán)重進(jìn)行模糊聚類圖像分割。這兩種方法都是先將圖像預(yù)先分割成幾個(gè)區(qū)域,然后在通過(guò)一個(gè)適合的方法在將這幾個(gè)區(qū)域在分類。對(duì)于木材缺陷CT圖像,本文希望將其缺陷例如節(jié)子、空洞、腐朽、裂紋等從背景中分割出來(lái)[6]。這些缺陷在木材缺陷CT圖像中已經(jīng)自然形成幾類。針對(duì)木材缺陷CT圖像,我們采用半模糊聚類方法對(duì)其進(jìn)行分割[7]。
聚類也就是分類,即把相似的事物歸到一類。在現(xiàn)實(shí)生活中事物之間沒(méi)有明顯的界限,在某些方面上它們之間因?yàn)榫哂邢嗨频奶卣鳎沟盟鼈冎g存在著聯(lián)系[9]。模糊聚類分析是比較流行的分割方法。而模糊C均值聚類算法是模糊聚類經(jīng)典代表。假設(shè)在數(shù)據(jù)集X中,有n個(gè)樣本,即n個(gè)單元,可有如下表示:Xk(k=0,1,…n-1)。而聚類問(wèn)題的目的是把{X0,X1…,Xn-1}這個(gè)X數(shù)據(jù)集,分成c(2≤c≤n)個(gè)子集,要求相似的樣本應(yīng)盡量在同一子集(聚類)內(nèi),c為聚類數(shù)目。其原則是:較為相像的樣本應(yīng)歸納到同一個(gè)區(qū)域,C則為子集個(gè)數(shù),聚類的數(shù)量。
以往的聚類分析太過(guò)于死板,只能將分割好的塊嚴(yán)苛的歸類到某一區(qū)域,使之變成具有這一區(qū)域的塊的性質(zhì),事實(shí)上,好多模塊的性能并不能從一而論,它會(huì)具有好多好多特性,嚴(yán)格的分類反而會(huì)降低分析的效果,如果引用模糊聚類的方法,問(wèn)題就解決了.模糊聚類分析的處理方法為;:假如將所有的數(shù)據(jù)都規(guī)整到C類里,挑X中的其中一個(gè)子模塊Xk(k=0,1,2,…n-1),針對(duì)一于另一類i(i=0,1,2…c-1),則可得到μik(0≤μik≤1),得到的這個(gè)數(shù)據(jù)庫(kù)則可組成一個(gè)模糊聚類數(shù)據(jù)庫(kù),可稱作模糊聚類矩陣,其具備的性質(zhì)如下:
(1)
模糊C均值聚類之所以能得到大家的一致認(rèn)可,是因?yàn)樗哂衅渌垲惙治龇椒ㄋ鶝](méi)有的優(yōu)良性能,F(xiàn)CM具有很多智能的特性,比如清晰明了的敘述,將分割好的圖像自動(dòng)劃分結(jié)合。FCM聚類算法的提出者是J.C.Bezdek,他定義了這種算法的函數(shù),即模糊目標(biāo)函數(shù)法,其函數(shù)J(U,V)是:
(2)
式中:(Uik)(i=0,1,…c-1;k=0,1,…n-1)為模糊聚類矩陣,且滿足式(1);V={V0,V1,V2,…Vc-1}為C個(gè)聚類中心的集合,且Vi∈Rp;m∈[2,∞]為加權(quán)指數(shù);dik為第k個(gè)樣本到第i類的距離,其定義為
(dik)2=‖Xk-Vi‖2(Xk-Vi)T(Xk-Vi)。
(3)
這里Xk為數(shù)據(jù)樣本,且Xk∈RP;T表示矩陣轉(zhuǎn)置;‖·‖為范數(shù),表示歐幾里得距離。
如果想要分類得到的結(jié)果使人滿意,就要選擇適合的聚類原則和條件。而模糊C均值算法是通過(guò)不斷優(yōu)化目標(biāo)函數(shù)來(lái)實(shí)現(xiàn)的。目標(biāo)函數(shù)表示為J(U,V),加權(quán)指數(shù)是區(qū)域子集Xk對(duì)第i類隸屬度μik的m次方。Bezdek提出加權(quán)指數(shù)在1.1≤m≤5范圍內(nèi)推廣,后來(lái)給出經(jīng)驗(yàn)范圍是m=2時(shí)最合適[12]。把聚類的條件設(shè)置為求目標(biāo)函數(shù)J(U,V)的最小值minJ(U,V)。迭代方案如下:
(1)先將聚類數(shù)目C(2≤c≤n)與加權(quán)指數(shù)m(m∈[2,∞])確定好。
(2)確定模糊聚類矩陣的初始值ul=[uik]l,取l=0。
(3)由以上兩步可得到各類的聚類中心Vi的函數(shù)式:
(4)
(4)按照下面方法計(jì)算新的模糊聚類矩陣u(l)=(l=l+1)
Ik={i0≤i≤c;dik=‖Xk-Vi‖=0},
(5)檢查‖U(l-1)-U(l)‖是否小于預(yù)先設(shè)定的閾值。如果小于,則停止,否則轉(zhuǎn)至(3)步驟。其任務(wù)是確定‖U(l-1)-U(l)‖與先前確定的限值的大小,小于限值則不用繼續(xù),如果大于則返回到(3)步驟。
FCM迭代算法結(jié)束后,將閥值設(shè)為α,那么圖像分割的函數(shù),看以下公式uik=max{u0k,u1k,…uc-1k}≥α,則Xk∈第i類圖像分割,這是大區(qū)域內(nèi)的數(shù)據(jù)歸納范疇,F(xiàn)CM算法也有其限制性,究其原因,是因?yàn)檫\(yùn)算太過(guò)復(fù)雜的緣故,因?yàn)榈乃惴ㄒ磸?fù)的計(jì)算聚類中心及隸屬度矩陣[10],所以此方法未能極大限度的應(yīng)用。
(1)假設(shè)要分割的圖像為f(rk,ck),圖像所對(duì)應(yīng)的任一坐標(biāo)點(diǎn)為(rk,ck),那么函數(shù)Xk=f(rk,ck)代表圖像在這個(gè)點(diǎn)處的特征向量,如果圖像分割時(shí)設(shè)定的向量為S個(gè),
設(shè)E0為圖像中所有非“邊緣”點(diǎn)的區(qū)域集,E1為所有“邊緣”點(diǎn)的區(qū)域集,那么E0={Xk|E(rk,ck)=1,Xk∈X},且X=E0∪E1。
(2)已進(jìn)行了邊緣檢測(cè),接著便是分割“邊緣”部分,使之形成獨(dú)立的互補(bǔ)鏈接的個(gè)體,然后“邊緣”部分的這些獨(dú)立個(gè)體便智能的分到相近的區(qū)域,也就是物理學(xué)中的就近法則,從而形成的互相獨(dú)立而又連接不斷的子圖,這樣初次的圖像分割就成功了。
(4)以(2)和(3)給出的數(shù)據(jù)為基礎(chǔ),將其設(shè)定為模糊迭代的最初值,加以迭代計(jì)算,迭代時(shí)的隸屬度
只有在隸屬度公式中點(diǎn)Xk∈E1為“邊緣”點(diǎn)時(shí),其計(jì)算公式才能與普通的FCM相吻合,其采用的是模糊化隸屬關(guān)系的方法;
(5)
(5)當(dāng)以上4個(gè)步驟都順利的完成后,每一個(gè)像素的位置將被固定,就終止了迭代。終止迭代也是有相應(yīng)的條件和方法的,有兩種是被廣泛應(yīng)用的:第一,設(shè)定某個(gè)閥值為上限,控制兩代原型的變化范圍在其以內(nèi)。第二,設(shè)定某個(gè)閥值,使歸整的矩形變化范圍在其之內(nèi)。
(1)圖像分割的正確性是否高,關(guān)鍵取決于其是否具有抗外力的能力,在圖像分割的操作中,無(wú)論是檢測(cè)還是迭代都很容易受噪聲的干擾,以至于影響分割的準(zhǔn)確性,因此本文則主張用中值濾波[11]的方案。
圖1 去噪處理后的木材缺陷灰度圖像
(2)灰度圖像的邊緣檢測(cè)。本文提到的此邊緣檢測(cè)并非是以得到精確的邊緣圖像為目的,只是作為得到聚類用的最初數(shù)據(jù),為下一步得到更精確的圖像做鋪墊,至于邊緣的尺寸和形狀可先忽略。下面的邊緣圖像,是由Robert這種算子檢測(cè)后得到的。優(yōu)點(diǎn)是保留更多的信息[8]。
圖2 利用Robert算子邊緣檢測(cè)的木材缺陷圖像
圖3 利用區(qū)域生長(zhǎng)算法預(yù)分割的木材缺陷圖像
(3)ESFCM聚類迭代。針對(duì)灰度圖像來(lái)說(shuō),設(shè)圖像的區(qū)域集為X={X1,X2,…,Xn}?R是在特征向量區(qū)域R中的一個(gè)有值的區(qū)域集(包含多重集合的可能),因?yàn)閄k=f(rk,ck)代表的是第k個(gè)點(diǎn)(rk,ck)的灰度值,因此在ESFCM算法中,其目標(biāo)函數(shù)(2)可簡(jiǎn)單表示為:
(6)
在上述函數(shù)中,c可視為ESFCM算法類別數(shù)得初始值,那么聚類核心v=(V1,V2,…Vc)也可看作一個(gè)C特征向量,Dik可視為是點(diǎn)到類的物理距離D(p,Xj)=Min{d(p,q)|q∈Xj}其中d(p,q)為點(diǎn)p到點(diǎn)q的歐式距離[11]。
圖4 經(jīng)ESFCM處理的木材缺陷圖像
本文以含有缺陷的木材為研究對(duì)象,利用半模糊聚類算法進(jìn)行木材缺陷邊緣檢測(cè),首先對(duì)木材缺陷CT圖像進(jìn)行預(yù)處理,解決了聚類參數(shù)不好確定等問(wèn)題,利用區(qū)域生長(zhǎng)法將這些區(qū)域又重新分類。實(shí)驗(yàn)結(jié)果可知:木材缺陷CT圖像的缺陷中的節(jié)子和空洞邊緣連續(xù)、平滑,這樣就保留了更多的細(xì)節(jié)。通過(guò)這樣的方式使圖像缺陷分割出來(lái),并且取得理想的效果。
【參 考 文 獻(xiàn)】
[1]樸順姬,戚大偉,金雪蜻.多尺度分形特征在木材內(nèi)部缺陷檢測(cè)中的應(yīng)用[J].森林工程,2012,28(5):56-59
[2]張德豐.MATLAB數(shù)字圖像處理[M].北京:機(jī)械工業(yè)出版社,2012
[3]謝季堅(jiān),劉承平.模糊數(shù)學(xué)方法及應(yīng)用[M].武漢:華中科技大學(xué)出版社,2008
[4]張建梅,孫志田,余秀萍.基于圖論的圖像分割算法仿真研究[J].計(jì)算機(jī)仿真,2011,28(12):268-271.
[5]孫藝峰,王向陽(yáng),王春花.一種新的快速模糊C均值聚類圖像分割算法[J].小型微型計(jì)算機(jī)系統(tǒng),2008,29(2):320-323.
[6]戚大偉,李 莉.基于分形維數(shù)特征的原木漏節(jié)圖像的研究[J].森林工程,2007,23(5):11-14
[7]張愛華.基于模糊聚類分析的圖像分割技術(shù)研究[D].武漢:華中科技大學(xué),2004
[8]韓書霞,戚大偉,于 雷.基于多重分形理論的原木CT腐朽圖像分析與處理[J].森林工程,2007,23(5):15-18
[9]李永生.基于模糊理論的木材X射線圖像分析與處理[D].哈爾濱:東北林業(yè)大學(xué),2009
[10]范九倫,吳成茂.FCM算法中隸屬度的新解釋及其應(yīng)用[J].電子學(xué)報(bào),2004,32(2):350-352.
[11]唐權(quán)華,周 艷,金煒東.中值濾波算法的研究與改進(jìn)[J].微計(jì)算機(jī)信息,2008,24(8):187-189.
[12]王黎明.自適應(yīng)加權(quán)空間信息的FCM醫(yī)學(xué)圖像分割[J].微型機(jī)與應(yīng)用,2011,30(22):42-45.