張文倩
(中北大學 信息與通信工程學院, 太原 030051)
隨著計算機技術(shù)的迅猛發(fā)展以及機器學習在軍事、工業(yè)、農(nóng)業(yè)等各方面的應用,機器視覺成為重要的熱點研究課題之一。紋理作為反應物體表面粗糙度、方向性和規(guī)則性的一種重要手段,是構(gòu)建機器視覺中非常重要的一環(huán),也是其研究的意義所在。目前對紋理的分析研究已經(jīng)有40多年的歷史,并且在紋理分割、紋理分類、紋理合成等領(lǐng)域取得了一定的成果。但因為紋理種類繁多,其中沒有一種算法能夠普遍適用于各種不同紋理種類的分類,還需要做進一步的工作提高紋理分類算法的魯棒性和適用性。本文由圖像的幾何拓撲屬性出發(fā)研究了統(tǒng)計幾何特征提取方法,結(jié)合支持向量機的多分類方法在紋理分類中取得了較好的成效。
本文對統(tǒng)計幾何特征提取方法進行了研究,利用圖像函數(shù)圖來進行紋理描述,使用一個可變的閾值把一幅灰度紋理圖像切割成一系列二進制圖像,由二進制圖像的連通域、幾何拓撲屬性推導紋理描述特征。實驗結(jié)果表明,統(tǒng)計幾何特征具有非常強的紋理描述能力,同時能夠克服圖像的旋轉(zhuǎn),其紋理識別能力高于常用的灰度共生矩陣、離散小波變換等方法。
統(tǒng)計幾何特征將一幅大小為nx×ny具有nl灰度級的圖像表示成一個二維函數(shù)f(x,y),其中,(x,y) ∈ {0 ,1,… ,nx-1} {0 ,1,… ,nx-1},f(x,y)∈ { 0 ,1,… ,nl-1},f(x,y)是像素點在(x,y)處的灰度值。當一幅圖像f(x,y)由一個閾值α,α∈{1 , … ,nl-1}截取時,便得到一個二值圖像,即:
其中,fb(x,y,α)是由閾值α得到的二值圖像。
對于一幅待分割的紋理圖像,可以用不同的α分割,α取值沒必要是連續(xù)的,可以是間隔幾個灰度值進行取值,這樣由α分割得到的一系列二值圖像的集合稱為二進制圖像棧。對于給定大小和灰度級的一組圖像,如果α的分割是從灰度的最小值到最大值,則構(gòu)成了從圖像空間到二進制圖像空間的完全映射如公式(2)所表示,這個變換沒有信息損失。在實際中,為了減少運算量,同時有跨度的α分割亦能包含圖像幾乎全部的信息內(nèi)容,所以采用有選擇的α分割。
在對二值圖像進行連通區(qū)域時,分為對二值圖像中的1值像素組成的連通區(qū)域的統(tǒng)計和對0值像素組成的連通區(qū)域的統(tǒng)計,保證了信息的完整性。在二值圖像fb(x,y,α)中的所有1值像素形成的連通區(qū)域的個數(shù)和0值像素形成連通區(qū)域的個數(shù)分別記為NOC1(α)和NOC0(α),連通區(qū)域的標記方法如圖(1)所示。顯然,NOC1(α)和NOC0(α)均為α的函數(shù),其中α∈{1 , … ,nl-1}。對于每個連通區(qū)域(1值像素或0值像素)該方法提出了一種不規(guī)則的度量方法:
每一幅圖像將對應于一系列的二值圖像(數(shù)量的多少取決于α的取值),每幅二值圖像又對應1值像素構(gòu)成的連通區(qū)域和0值像素構(gòu)成的連通區(qū)域。定義二值圖像fb(x,y,α)的第i個1值像素(0值像素)形成的連通區(qū)域的不規(guī)則度為IRGL1(i,α) (IRGL0(i,α) )。二值圖像fb(x,y,α)中所有1值像素的連通區(qū)域的不規(guī)則度均值如下定義,0值像素的連通區(qū)域類似。
NOP1(i,α)代表二值圖像fb(x,y,α)中第 i個1值像素大小的連通區(qū)域內(nèi)的像素個數(shù)。可類似定義。
目前共定義4個α函數(shù),NOC1(α)、NOC0(α)、,每個函數(shù)可以提取下述4個統(tǒng)計量特征:
其中g(shù)(α)分別是這4個函數(shù)之一。
目前為止,每一個紋理圖像共得到特征值16個,分別從NOC1(α)、NOC0(α)、這4個α函數(shù)里面各提取4個特征值得到。
圖1 連通區(qū)域標記法
圖像紋理識別系統(tǒng)由兩大部分組成,一是有效的紋理特征提取方法,二是高精度的特征分類器。實驗紋理庫中通常包括多種紋理類別,以二分類為前提的支持向量機需要進行多分類算法的研究,才應用到本文的分類系統(tǒng)中。本文采用RBF函數(shù)作為核函數(shù),采用基于"one-againstone”的“閾值投票法”進行多類分類向量器。一對一的方法對N類樣本分類問題的分析需構(gòu)造N(N-1)/2個分類器,即樣本種類兩兩都要訓練一個分類器。在訓練第i類樣本和第j類樣本之間的二分類器時,分別取i類和j類樣本作為正樣本和負樣本,它們的向量器表示為(i,j)向量器。以這種方式組合起來的多分類向量器在測試時,需要將測試樣本分別輸入到這N(N-1)/2個向量器中,采用“投票法”決定測試樣本的最終分類結(jié)果。本文將分類過程分為粗分類和細分類,粗分類設置一個得票數(shù)閾值,將得票數(shù)大于這個閾值的樣本類別作為細分類的選擇范圍,在細分類中采用二次投票法對粗分類的結(jié)果做精確的判別。二次投票法是利用粗分類得到的n個待選類別號,再對測試紋理子圖做一次投票選擇,選擇這n個類別得票最多的一個做為最終的判別結(jié)果。在此過程中有可能出現(xiàn)n個類別得票數(shù)一樣多的情況,為避免程序陷于循環(huán),我們引入二分類器的權(quán)值,當出現(xiàn)得票數(shù)一樣的情況時,由待測子圖在投票中的二分類向量器的權(quán)值大小作為判別標準。
根據(jù)公式(1)~(8)計算每幅圖分別基于4連通和8連通的統(tǒng)計幾何特征提取方法,獲得特征向量f1和f2。對于brodatz紋理庫和rotate紋理庫基于統(tǒng)計幾何特征提取方法分類結(jié)果如表1所示。其中brodatz紋理置投票法閾值設為72, rotate紋理庫投票法閾值設為16。
表1
分析表1中數(shù)據(jù)可以得到如下結(jié)論:
(a) 在brodatz和rotate紋理庫中,統(tǒng)計幾何特征提取方法識別率較高,表明統(tǒng)計幾何特征提取方法能夠很好地描述紋理的結(jié)構(gòu)和紋理變化。
(b) rotate紋理庫和brodatz紋理庫的四連通統(tǒng)計幾何特征分類性能都高于8連通SGF,說明4連通方法能夠更全面的包含紋理圖像的信息。
(c) 統(tǒng)計幾何特征提取方法在rotate紋理庫中正確率高達97.1453%,說明統(tǒng)計幾何特征提取方法本身能克服圖像所旋轉(zhuǎn)帶來的影響。
統(tǒng)計幾何特征提取方法在對brodatz和rotate紋理庫測試中,都能夠得到較高的識別率,可作為其它紋理庫分析的首選方法。本文的研究工作取得了初步進展,提供了一定理論基礎(chǔ)。然而,限于時間和能力,還有很多方面需要進一步研究。設計和研究更高效率、更具有推廣能力的支持向量機是今后工作的重點,尤其在降低訓練時間和減少向量機復雜度和多分類算法的研究上需要更多的努力。
[1]德偉,蒲曉蓉,章毅.基于Max-tree的連通區(qū)域標記新算法[J].計算機應用研究,2006.
[2]劉賢喜,李邦明,蘇慶堂,等.一種新的二值圖像連通區(qū)域準確標記算法[J].計算機工程與應用,2007,43(22).
[3]李伯宇.圖像紋理分析及分類方法研究[D].上海:復旦大學,2007:17-27.
[4]A. Mathur ,G. M. Foody. Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE GEOSCIENCE AND REMOTESENSING LETTERS,2008,5(2).
[5]Fabio Aio1li,Alessandro Sperduti. Multiclass Classification with Multi-Prototype Support Vector Machines[J].Journal of Machine Learning Research,2005:817-850.
[6]Xiaojing Yuan,Zhenyu Yang,Nizar Mullani. SVM-based Texture Classification and Application to Early Melanoma Detection[J].Proceedings of the 28th IEEE EMBS Annual international Conference.Aug 30-Sept 3,2006.
[7]A.Mathur,GM.Foody.Multiclass and Binary SVM Classification:Implications for Training and Classification Users[J].IEEE Geoscience and Remote Sensing Lettters,2008,5(2).
[8]劉浩一,劉明霞,孟祥.自然紋理分類與識別方法初探[J].微電子學與計算機,2006,23(8):153-155.
[9]謝菲.圖像紋理特征的提取和圖像分類系統(tǒng)研究及實現(xiàn)[J].CNKI: CDMD:2.2009.