陳 英,楊豐玉,符 祥
(1.南昌航空大學 軟件學院,江西南昌 330063;2.吉林大學計算機科學與技術學院,吉林 長春 130012)
圖像分割一直以來是計算機視覺領域具有挑戰(zhàn)性的難題,大量研究者在圖像分割方面已取得了一定的研究成果,但目前尚無通用的分割理論提出,現(xiàn)已提出的算法大多都是針對具體問題。一般的紋理圖像分割過程主要包括特征提取和基于特征空間的圖像分割。其中常用的方法有基于馬爾科夫模型[1],基于結(jié)構張量[2],基于分型特征[3],基于半局部信息[4],基于小波變換[5]等方法。以上方法雖然在分割精確度上有不同程度的效果,但是這些算法相對復雜,并且沒有充分考慮紋理圖像間固有的相關信息。1973年,Haralick R M[6]提出的著名的灰度共生矩陣(gray level cooccurrence matrix)是一種用來分析圖像紋理特征的重要方法,它是圖像灰度的二階統(tǒng)計度量,反映了圖像灰度在方向、局部鄰域和變化幅度的綜合信息,其描述了圖像中灰度值的空間依賴性,反映了紋理模式與灰度空間的內(nèi)在聯(lián)系,從而有效地描述了紋理。本文將支持向量機(support vector machine,SVM)對紋理圖像的灰度共生矩陣的特征屬性進行分類,以達到圖像分割的目的。
設有分辨率為Nx×Ny的圖像,Nx和Ny分別為水平和垂直方向上像素點的個數(shù),Ng是圖像所有像素點的灰度量化級數(shù)。設Lx={1,2,…,Nx}為水平空間域,Ly={1,2,… ,Ny}為垂直空間域,G={1,2,…,Ng}為灰度量化級集。設Lx×Ly是圖像的像素集,圖像函數(shù)I表明每個像素的灰度值都取自集合G,則I可以表示為I∶Lx×Ly→G。
灰度共生矩陣描述了在圖像中距離為d的像素對,在θ方向上具有灰度i和灰度j的出現(xiàn)概率,記為p(i,j,d,θ),具體表示如式(1)
其中,#表示大括號中成立的像素對數(shù)。
文獻[6]提出了14種基于灰度共生矩陣的紋理特征屬性,這些參數(shù)有其各自的特點,參考已有文獻和本文所做的大量實驗的結(jié)果,考慮由以下幾個灰度共生矩陣的特性屬性來反映紋理特征統(tǒng)計量,表達式如式(2)~式(6)。
1)能量(或角二階矩,ASM):它反映了圖像中像素的紋理粗細程度和灰度分布均勻程度,當圖像較細致、均勻時,能量值較大,最大值為1,表明灰度分布完全均勻;當圖像灰度分布很不均勻、比較粗糙時,能量值較小,表達式為
其中,p(i,j)表示歸一化后的灰度共生矩陣。
2)對比度(contrast):反映了圖像的清晰度、紋理的強弱,值越大,表明紋理效果越明顯;值越小,表明紋理效果越不明顯,當值為0時,表明圖像完全均一、無紋理,表達式為
3)熵(entropy):是一個隨機的變量,表征圖像中信息量的多少,它反映紋理的非均勻程度或復雜程度。當復雜度高時,熵值較大;復雜度低時,熵值較小或為0,表達式為
4)差方差(difference variance),記為fDV,設
其中,V(px-y(k))表示為px-y(k)的方差。
5)差熵(difference entropy)
SVM[7]是一種泛化能力很強的學習機,小樣本空間問題上有很多特有的優(yōu)勢。在SVM的主要思想中,核函數(shù)和核函數(shù)的構造技巧起到了至關重要的作用。在大多數(shù)的應用中,普遍采用的核函數(shù)主要有以下幾個
1)線性核函數(shù):
2)多項式核函數(shù)
3)徑向基核函數(shù)
4)二層神經(jīng)網(wǎng)絡核函數(shù)
本文采用徑向基核函數(shù)。
原始的SVM是兩類分類器,對于多類分類問題,常用的方法有:
1)一對多的方式:對于K類問題,把其中某一類的 樣本視為一類,其他所有類別歸為另一類,共有K個分類器。最后使用競爭判別方式,哪個類得票多就屬于哪個類。
2)一對一的方式:對于K類問題,把其中的任意兩類構造一個分類器,共有K(K-1)/2個分類器。
3)有向無環(huán)圖的方式:在方法在訓練階段采用一對一的方式,在判別階段采用有向無環(huán)圖的方式。
本文采用一類對一類的方法,該方法的實踐效果好于一對多的方式。
圖像的灰度共生矩陣的生成受移動移動窗口大小、像素對間隔距離、像素對方向和灰度量化級這4個方面的影響。
對于移動窗口的大小,一般大的紋理窗口有利于紋理特征的計算,因為它包含了更多的像素點,其可以獲得較準確的紋理特征,但是太大的紋理窗口將不利于計算邊界處的紋理特征,甚至會掩蓋小的組織結(jié)構;如果窗口太小則無法捕捉影像目標獨特的紋理特征。對于像素對間隔距離,一般細致紋理的分類需要較小的間隔距離,而較大的間隔距離更適合于粗糙的紋理描述。對于灰度量化級,大的灰度級更利于表達圖像特征,但是,灰度級選取太大,將大大增加共生矩陣的計算量,從實時性出發(fā),需要對灰度級的選取進行權衡。
基于上述情況的考慮,同時經(jīng)過大量的實驗,本文將按照以下的參數(shù)設置進行特征的提取:
1)移動窗口的大小設置為16×16;
2)像素對間隔設置為4;
3)灰度量化級設置為16;
4)像素對方向取4個方向,分別為水平(0°)、垂直(90°)、主對角線(135°)和副對角線(45°);
5)計算各個移動窗口圖像的灰度共生矩陣,取能量、對比度、熵、差方差和差熵這5個特性屬性作為分類特征。
為了避免在建立分類超平面時,使動態(tài)變化范圍大和
其中,Nev為歸一化后的特征值,Oev為原始的特征值,max(ev)表示最大的特征值,min(ev)為最小的特征值。在此需要強調(diào)的是,該歸一化并不是孤立地針對某一個樣本的所有特征值進行歸一化,而是針對所有的樣本,把所有樣本的相同屬性的特征進行歸一化處理,即歸一化是按特征向量的列進行歸一化處理,而不是按特征向量的行進行歸一化處理。經(jīng)過歸一化處理后,特征值的泛圍在[-1,1]之間,并且同時對訓練集和測試集樣本的特征采用同樣的方式進行歸一化。
實驗樣本圖片均來自Brodatz紋理庫,圖1為所用圖片為訓練用圖,圖2為用于圖像分割的測試用圖。圖像的大小均為512×512。詳情可見文獻[8]。其中 D9,D12,D15,D16,D19,D24,D29,D38,D68,D84,D92,D94 和 D112 分別表示所對應圖像在Brodatz紋理庫中的編號。動態(tài)變化范圍小的特征具有同等的作用,也為了避免不平衡的數(shù)據(jù)可能造成的計算困難或者可能引起計算的溢出的情況,本文對提取的特征進行歸一化處理。歸一化的處理過程如公式(11)
圖1 訓練用圖Fig 1 Training pictures
利用SVM進行特征分類時,訓練樣本的選取對分類的結(jié)果有一定的影響,樣本數(shù)太少,容易引起欠學習的問題;樣本數(shù)過多,一方面,增加訓練的代價,另一方面,容易出現(xiàn)過學習的現(xiàn)象。針對具體的情況,本文的實驗步驟如下:
1)分別對圖1(a)~(m)這13副圖像進行移動窗口的分割,移動子窗口的大小為16×16;
2)設置灰度量化級為16,分別生成子窗口圖像4個方向的灰度共生矩陣;
圖2 測試用圖Fig 2 Testing pictures
3)設置像素對間隔為4,分別計算子窗口圖像在4個方向灰度共生矩陣的能量、對比度、熵、差方差和差熵的值;
4)把步驟(3)所得到的值按照水平、垂直、主副對角線的順序進行排列,得到相應的特征向量,則每個特征向量中有4×5=20個數(shù)據(jù);同時,把所有圖像的所有子窗口所得到的特征向量作為一個樣本集,該樣本集共有13×512×512/16×16=13312個特征向量,20×13312=266240個數(shù)據(jù);
5)把步驟(4)的樣本集按照特征向量的列進行歸一化處理;把歸一化后的樣本集作為SVM的訓練樣本集;
6)對圖2的4副圖像重復步驟(1)~步驟(5),把最后得到的數(shù)據(jù)作為SVM的測試樣本集。
在此要說明的是,在實驗過程中,采用的是臺灣林智仁教授開發(fā)的LibSVM[9],相關的實驗參數(shù)也均采用LibSVM默認的參數(shù)設置。
同時,為了更好地區(qū)分分割后所得到的圖像不同區(qū)域所對應的原始圖像所屬的類,本文對分割后圖像不同區(qū)域的灰度值做了如下的處理:
1)8 位的灰度圖像的灰度值的取值范圍為[0,255],用于訓練的樣本圖像為13類,從圖1(a)~(m)分別標注為1~13類,故把255均分為13等份;
2)對于測試用圖,當該測試用圖的子窗口區(qū)域通過SVM的測試結(jié)果屬于第i類時,則該子窗口的灰度值為(unsigned char)(i×255/13)。
按照上述的步驟,對圖2中所有圖像的分割結(jié)果如圖3所示,圖3(a)~(d)分別為圖2(a)~(d)的分割結(jié)果。如圖3(a)中的從左到右,從上到下的4個區(qū)域分別屬于類1(D9)、類10(D84)、類11(D92)和類6(D24)。
最后,為了更好地說明問題,在相同SVM參數(shù)設置的情況下,不同子窗口大小對分類精確度、訓練向量數(shù)和測試向量數(shù)的影響如表1所示。
圖3 分割結(jié)果Fig 3 Segmentation results
表1 向量數(shù)和分類結(jié)果Tab 1 Vector number and classification results
從表1可以看出:當移動窗口設置過小時,由于測試樣本間的差距,雖然訓練樣本數(shù)很大,但是分類的精度并不理想。而當移動窗口設置過大時,由于訓練樣本數(shù)變小,導致分類的精度也在變小。
本文在利用灰度共生矩陣提取紋理圖像特征屬性的基礎上,進一步利用學習泛化學習能力很強的SVM對所得到的特征進行分類,實驗結(jié)果表明:SVM能夠很好地區(qū)分不同紋理區(qū)域的灰度共生矩陣屬性。但是,如果進一步縮小移動窗口的大小,則存在灰度共生矩陣的特性屬性的區(qū)分度不是太好的情況,這需要今后深入研究。
[1] 陳曉惠,鄭 晨,段 汕.形態(tài)小波域多尺度馬爾可夫模型在紋理圖像分割中的應用[J].中國圖像圖形學報,2011,16(5):761-766.
[2] 謝曉振,吳紀桃.基于結(jié)構張量和Wasserstein距離的紋理圖像分割[J].中國圖像圖形學報,2010,15(9):1345 -1351.
[3] 馬時平,畢篤彥,黃文濤.基于分形特征紋理圖像分割方法[J].計算機應用,2004,24(6):117 -118.
[4] 趙在新,成禮智.結(jié)合半局部信息與結(jié)構張量的無監(jiān)督紋理圖像分割[J].中國圖像圖形學報,2011,16(4):559 -565.
[5] 葉 樺,張國寶,陳維南.基于小波變換的紋理圖像分割[J].東南大學學報,1999,29(1):44 -48.
[6] Haralick R M.Statistical and structural approaches to texture[C]∥Proceedings of the IEEE,1979:786 -804.
[7] Vapnic V.Statistical learning theory[M].New York:Wiley,1998.
[8] The USC-SIPI Image Database[EB/OL].[2011—09—28].http:∥sipi.usc.edu/database/.
[9] A library for support vector machines[EB/OL].[2011—09—28].http:∥www.csie.ntu.edu.tw/~ cjlin/libsvm/index.html.