張 航,顏永豐
(西北農(nóng)林科技大學(xué) 信息工程學(xué)院,陜西 咸陽712100)
植物的分類研究對于區(qū)分植物種類、探索植物間的親緣關(guān)系、闡明植物系統(tǒng)的進(jìn)化規(guī)律具有重要意義[1],計(jì)算機(jī)輔助植物分類可以極大地提高植物分類與管理效率。
在基于葉子特征的植物圖像分類識別領(lǐng)域,早期的研究主要采用葉子的形狀特征作為分類特征集合,后來的研究表明,由于紋理特征反映了圖像的灰度統(tǒng)計(jì)信息、空間分布信息以及結(jié)構(gòu)信息[2],能夠更加有效地描述圖像的特征。
常見的紋理特征提取方法主要有灰度共生矩陣、小波特征、Gabor濾波器特征、局部二值模式 (local binary pattern,LBP)、隨機(jī)場模型、分形維數(shù)等等[3-7]。傳統(tǒng)紋理分析方法主要問題在于不能從多尺度有效描述紋理特征,目前在諸多領(lǐng)域得到廣泛應(yīng)用的小波理論為時頻多尺度分析提供了精確統(tǒng)一的框架,解決了傳統(tǒng)紋理分析方法的瓶頸。小波變換提供了一種在不同尺度上圖像紋理細(xì)節(jié)分析的工具,能夠更加準(zhǔn)確地進(jìn)行圖像紋理分類。但是由于傳統(tǒng)的塔式小波分解僅利用了圖像低頻子帶的信息,然而高頻子帶包含了圖像的邊緣,輪廓和部分紋理信息,這導(dǎo)致紋理分類效果往往不夠理想[7]。
為了克服小波變換的這一缺陷,增強(qiáng)算法的適應(yīng)能力和魯棒性,可以通過引入灰度共生矩陣的方法來解決這一問題,灰度共生矩陣?yán)昧藞D像中像素相對位置的空間信息更加準(zhǔn)確地描述圖像的紋理,具有較強(qiáng)的適應(yīng)能力和魯棒性[3],可以用來統(tǒng)計(jì)各子帶小波系數(shù)的低頻和高頻信息。
本研究將小波變換和灰度共生矩陣結(jié)合起來,在不同尺度上分別對圖像高頻子帶和低頻子帶進(jìn)行灰度值統(tǒng)計(jì)分析,得到小波灰度統(tǒng)計(jì)特征,并結(jié)合形狀特征形成混合特征向量對植物進(jìn)行分類,克服了塔式小波分解丟失高頻信息的缺陷,通過對植物葉片分類實(shí)驗(yàn),證明該方法具有很強(qiáng)的分類能力。
圖像預(yù)處理主要有如下步驟:
(1)在計(jì)算圖像特征之前,首先要對圖像進(jìn)行尺度縮放處理以減少計(jì)算量,并且對圖像進(jìn)行N級塔式小波分解要求圖像的基礎(chǔ)長度和寬度必須能被2的N次方整除,綜合考慮計(jì)算機(jī)性能等影響,對其進(jìn)行規(guī)范化處理,使其尺寸變成128×128。
(2)在計(jì)算紋理特征時需要將RGB圖像轉(zhuǎn)化為灰度圖像。而計(jì)算形狀特征時,可以通過閾值分割的方法轉(zhuǎn)化為二值圖像,閾值的求取采用了顏色直方圖雙峰法來確定。
(3)由于獲取的圖像表面常常有小孔,邊緣區(qū)域有一些毛刺,可以通過形態(tài)學(xué)開運(yùn)算去除邊緣毛刺,閉運(yùn)算修復(fù)小孔等缺陷。
(4)在獲取圖像過程中,不可避免地要產(chǎn)生噪聲,因而需要先對圖像進(jìn)行平滑處理來消除噪聲干擾,本研究采用高斯濾波對圖像進(jìn)行平滑處理。平滑處理導(dǎo)致圖像邊緣模糊,為了減少這種影響,需要對圖像進(jìn)行銳化處理。該研究采用了拉普拉斯運(yùn)算擴(kuò)展模板對圖像進(jìn)行銳化處理,以增強(qiáng)圖像的顯示效果 (預(yù)處理過程如圖1所示)。
圖1 圖像預(yù)處理
圖像通常表示為和位置相關(guān)的二維f (x,y)系統(tǒng),x,y代表圖像的行列坐標(biāo),則f (x,y)表示原始圖像。對于f(x,y)進(jìn)行二維離散小波變換,需要分別對行和列進(jìn)行一維離散小波變換。一維離散小波變換通過對母小波的尺度因子和平移因子離散化得到。母小波的表示如下
式中:a——尺度因子,b——平移因子。通過對尺度因子和平移因子的離散化得到一維離散小波。令a=a-j0原字符串,b=kb0a-j0原字符串,通常a0=2,b0=1,則一維離散小波變換表示如下
將一維DWT擴(kuò)展到二維,需要定義一個尺度和平移基函數(shù),如式 (3)和式 (4)所示
圖像f (x,y)的二維小波變換可以寫成如下形式
其中j0是任意開始的尺度,(x,y)為可分離的尺度函數(shù),ψ(x,y)為可分離的方向敏感的小波函數(shù)。定義了圖像f (x,y)在尺度j0上的近似。Wψ定義了圖像f(x,y)在尺度j≥j0(j=0,1,2)上 H,V,D 方向上的細(xì)節(jié),分別代表水平、垂直和對角方向。
圖2顯示了圖像的小波分解步驟。
圖2 圖像的小波分解步驟圖示
其中,2↓1和1↓2分別表示對列和行像素集合進(jìn)行下采樣。第一行表示經(jīng)過兩次低通得到的圖像的低頻信息。第二行表示先低通再高通得到了水平方向的小波圖像。第三行代表先高通再低通得到垂直方向小波圖像,第四行代表經(jīng)過兩次高通之后得到對角方向的小波圖像。
在對圖像進(jìn)行三層小波分解之后,獲取10個子帶的系數(shù)矩陣,然后對各子帶小波系數(shù)構(gòu)建灰度共生矩陣,然后采用Harlick提出的特征對系數(shù)矩陣進(jìn)行計(jì)算。包括對比度、能量、熵、一致性、均值、方差、集群蔭、集群突出和最大概率等統(tǒng)計(jì)特征組成特征向量,具體公式參見文獻(xiàn) [8]。
由于植物葉片在不同情況下發(fā)育狀況的差異性比較大,并且隨著季節(jié)變化,周長、面積,縱軸長、橫軸長等常用的絕對值特征就不太適合作為分類依據(jù),在文獻(xiàn) [9]中對于絕對值特征和相對值特征的實(shí)驗(yàn)分析表明,絕對值特征不具有穩(wěn)定性,采用絕對值特征分類識別率較低。因此,本研究采用了文獻(xiàn) [10]計(jì)算的相對值作為幾何特征,其中主要包括:縱橫軸比、形狀因子、偏心率、矩形度、面積凹凸比、周長凹凸比,這些幾何特征具有平移旋轉(zhuǎn)和尺度不變性。
由于分類特征過多,而同時特征子集可能具有較高的相關(guān)性,使得特征空間存在冗余變量,造成了特征計(jì)算和分類時間過長,并且會冗余特征會干擾分類精度,影響了分類的準(zhǔn)確率和效率。所以,需要對特征進(jìn)行維數(shù)約減,以達(dá)到最高的識別率。
該研究采用多類LDA來對由小波灰度共生矩陣特征和形狀特征組成的特征集合進(jìn)行降維,產(chǎn)生最優(yōu)特征子集。
首先需要計(jì)算類內(nèi)散布矩陣Sw和類間散布矩陣Sb,設(shè)一共有c類公式定義如下:
類內(nèi)散布矩陣 (within-class scatter matrix)
其中μi是第i類樣本的均值,Sw代表同一樣本相聚的程度。式 (7)表示類內(nèi)各個樣本和所屬類別之間的協(xié)方差矩陣之和,從總體上反映類內(nèi)各個樣本與類之間的離散度。
類間散布矩陣 (between-class scatter matrix)
其中μi是第i類樣本的均值,μ是所有樣本的均值,Ni是第i類樣本的數(shù)目。該矩陣表示是該類與樣本總體之間的關(guān)系,式 (8)表示各類樣本與總體的協(xié)方差矩陣的總和,從宏觀上反映了各類和總體之間的離散度。
為了使投影空間最具有可分性,需要滿足Sb/Sw最大化。對Sb/Sw矩陣進(jìn)行變換,求取特征值和特征向量,查找特征值中非零元素的下標(biāo)和值,并進(jìn)行排序。選取最大的l個特征值對應(yīng)的特征向量作為列向量構(gòu)成變換矩陣。
SVM分類器的主要思想是:建立一個最優(yōu)決策超平面,使得該平面兩側(cè)距平面最近的兩類樣本之間的距離最大化,從而達(dá)到最好的分類效果[11]。
實(shí)驗(yàn)采用了臺灣林智仁開發(fā)的libsvm軟件進(jìn)行實(shí)驗(yàn),核函數(shù)選取徑向基函數(shù)。由于支持向量機(jī)是為了解決兩類問題設(shè)計(jì)的,因而對于多分類問題,需要將二類分類方法擴(kuò)展到多類問題。在擴(kuò)展算法中,由于One-against-One算法已經(jīng)被證明是貝葉斯最優(yōu)的,訓(xùn)練時間相對One-against-All算法較短,克服了后者每次必須處理全部樣本以及樣本不均衡的缺點(diǎn),測試精度和訓(xùn)練精度都明顯高于后者,適合于解決多類問題,所以分類器采用one-against-one算法。
本研究選取了兩組樣本集對特征向量分類能力進(jìn)行測試,一組是包含常見的23種植物的葉片,該樣本集一共包含1363片葉子,其中819片被用來作為訓(xùn)練樣本,其余的544片葉子作為測試樣本,另一組包含了28種植物的葉片,一共包含1563片葉子,其中1001片作為訓(xùn)練樣本,562片作為測試樣本。
根據(jù)文獻(xiàn) [12]對于小波基函數(shù)選取的分析,我們采用了常見的db2,sym4,bior4.4進(jìn)行比較,這些小波基函數(shù)具有正交性、雙正交性、緊支性以及對稱性 (近似對稱性)。
首先需要對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行降維預(yù)處理,去除冗余數(shù)據(jù),提高分類速度,該研究采用LDA降維方式對特征集合進(jìn)行約減。
實(shí)驗(yàn)一:低頻子帶與低、高頻子帶特征分類能力比較1
該實(shí)驗(yàn)中,采用樣本1進(jìn)行分類測試,對比只采用低頻子帶統(tǒng)計(jì)的特征和采用全部子帶統(tǒng)計(jì)的特征的分類精確率,并分別采用不同的小波基函數(shù)來排除干擾因素,實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 樣本1低頻系數(shù)與全部系數(shù)識別率比較
實(shí)驗(yàn)表明,只采用低頻子帶信息的統(tǒng)計(jì)特征對圖像進(jìn)行分類的精確性明顯低于采用低、高頻子帶統(tǒng)計(jì)特征,表明高頻子帶包含了部分分類信息。
實(shí)驗(yàn)二:低頻子帶與低、高頻子帶特征分類能力比較2
為了驗(yàn)證這一結(jié)論,實(shí)驗(yàn)二中采用樣本2進(jìn)行分類測試,實(shí)驗(yàn)結(jié)果如圖4所示。
通過實(shí)驗(yàn)結(jié)果分析發(fā)現(xiàn),實(shí)驗(yàn)二和實(shí)驗(yàn)一的結(jié)果是一致的,低頻子帶統(tǒng)計(jì)特征的分類能力相對較差。
實(shí)驗(yàn)一和實(shí)驗(yàn)二表明,與僅使用低頻子帶信息相比,通過引入灰度共生矩陣分別對不同頻率子帶進(jìn)行統(tǒng)計(jì)的特征向量具有更強(qiáng)的分類能力。下面我們以sym4小波為例,結(jié)合形狀特征和其它特征相比較,驗(yàn)證多尺度分析在紋理特征表示上的性能。
圖4 樣本2低頻系數(shù)與全部系數(shù)識別率比較
實(shí)驗(yàn)三:不同特征分類性能比較1
該實(shí)驗(yàn)中,選取樣本1進(jìn)行分類測試,分別比較小波灰度共生矩陣特征、LBP特征以及Gabor濾波器特征的分類能力,測試結(jié)過見表1。
表1 不同特征的分類能力比較
實(shí)驗(yàn)表明,與LBP特征和Gabor小波特征相比,小波灰度共生矩陣在植物葉子圖像上具有更好的紋理描述能力,分類性能最好。
實(shí)驗(yàn)四:不同特征分類性能比較2
該實(shí)驗(yàn)中,選取樣本2進(jìn)行分類測試,結(jié)果見表2。
表2 不同特征向量分類性能
實(shí)驗(yàn)表明,在不同的數(shù)據(jù)集下,該研究選用的方法識別率變化較小,仍然保持最高的識別率,分類性能優(yōu)良,證明了多尺度分析在紋理分析上具有良好的特征表達(dá)能力。
實(shí)驗(yàn)五:不同分類器下特征向量的分類能力比較
該實(shí)驗(yàn)選取了概率神經(jīng)網(wǎng)絡(luò) (probabilistic neural network,PNN)和K最近鄰 (K nearest neighbor,KNN)分類器對比分析小波灰度共生矩陣統(tǒng)計(jì)特征和形狀特征組成的混合特征的分類能力,對于KNN和PNN分類方法,首先對特征集合使用線性判別式分析降維,分別計(jì)算他們的識別率。
不同分類器的分類能力比較見表3。
表3 不同分類器的分類能力比較
實(shí)驗(yàn)結(jié)果表明,在不同的分類器下該特征集合仍然具有很好的分類能力,具有較強(qiáng)的健壯性。圖5和圖6顯示了在不同特征維度下分類器的識別能力。
通過實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)特征維度在15到20之間,識別率最為穩(wěn)定,保持在90%以上。
研究表明,與LBP、Gabor濾波器等常見的紋理特征相比,在基于葉子紋理信息的植物種類分類應(yīng)用中,將小波的多分辨分析與利用像素相對位置的空間信息的灰度共生矩陣結(jié)合起來的小波灰度共生矩陣能夠有效地表達(dá)葉子圖像信息,克服了僅利用低頻信息造成的識別率較低的問題,同時具有較強(qiáng)的適應(yīng)能力和魯棒性。實(shí)驗(yàn)對比分析表明了小波灰度共生矩陣在植物分類應(yīng)用中具有良好的性能,同時表明多尺度分析在紋理分析中具有很好的特征表達(dá)能力。
本文采用了小波灰度公式矩陣紋理特征作為主要特征,同時包括了具有旋轉(zhuǎn)平移和尺度不變的形狀特征組成特征集合,再經(jīng)過降維處理之后組成優(yōu)化的特征子集,并依此對植物種類進(jìn)行分類,并通過實(shí)驗(yàn)證明了該方法在分類能力和健壯性方面的優(yōu)良性能。同時對不同的小波和其它紋理特征進(jìn)行了比較,證明了該方法具有更好的分類能力。在后續(xù)的工作中,將重點(diǎn)研究灰度共生矩陣統(tǒng)計(jì)特征,通過計(jì)算更少的特征實(shí)現(xiàn)更加準(zhǔn)確的分類,提高特征集合的分類效率。
[1]WANG Lu,ZHANG Lei.Computer-aided plant species identification based on LVQ neural network [J].Journal of Jilin U-niversity(Science Edition),2007,45 (3):421-426 (in Chinese). [王路,張蕾.基于LVQ神經(jīng)網(wǎng)絡(luò)的植物種類識別[J].吉林大學(xué)學(xué)報(bào) (理學(xué)版),2007,45 (3):421-426.]
[2]SU Jie,WANG Bingqin,GUO Li.Textural feature extraction and classification study research of digital image [J].Electronic Measurement Technology,2008,31 (5):52-55 (in Chinese).[蘇杰,王丙勤,郭立.數(shù)字圖像的紋理特征提取與分類研究 [J].電子測量技術(shù),2008,31 (5):52-55]
[3]LONG Haixiang,GAO Xin.SVM classification of SAR images based on texture and internal edge [J].Application Research of Computers,2011,28 (9):3551-3553 (in Chinese). [龍海翔,高鑫.基于紋理和邊緣的SAR圖像SVM分類 [J].計(jì)算機(jī)應(yīng)用研究,2011,28 (9):3551-3553.]
[4]ZHANG Lei.The research of computer-aided plant species identification based on leaf feature [D].Jilin:Northeast Normal University,2007(in Chinese).[張蕾.基于葉片特征的計(jì)算機(jī)自動植物種類識別研究 [D].吉林:東北師范大學(xué),2007.]
[5]ZHANG Gang,MA Zongmin.An approach of using Gabor wavelets for texture feature extraction [J].Journal of Image and Graphics,2010,15 (2):247-254 (in Chinese). [張剛,馬宗民.一種采用Gabor小波的紋理特征提取方法 [J].中國圖形圖像學(xué)報(bào),2010,15 (2):247-254.]
[6]LIANG Peng,HE Junshi,LI Shaofa.Classification algorithm based on multi-scales LBP pyramid feature [J].Computer Engineering,2011,37 (8):166-168 (in Chinese). [梁鵬,何俊詩,黎紹發(fā).基于多尺度LBP金字塔特征的分類算法 [J].計(jì)算機(jī)工程,2011,37 (8):166-168.]
[7]LIU Li,KUANG Gangyao.Overview of image textural feature extraction methods [J].Journal of Image and Graphics,2009,14 (4):622-635 (in Chinese).[劉麗,匡綱要.圖像紋理特征提取方法綜述 [J].中國圖形圖像學(xué)報(bào),2009,14 (4):622-635.]
[8]Arivazhagan S,Ganesan L,Subash Kumar T G.Texture classification using riglet transform [J].Pattern Recognition Letters,2006,27 (16):1875-1883.
[9]HE Peng.Research of machine recognition for broad-leaved trees based on leaves’synthetic features [D].Xianyang:Northwest Agricultural and Forestry University,2008 (in Chinese). [賀鵬.基于葉片綜合特征的闊葉樹機(jī)器識別研究[D].咸陽:西北農(nóng)林科技大學(xué),2008.]
[10]WANG Xiaofeng,HUANG Deshuang,DU Jixiang,et al.Feature extraction and recognition for leaf images [J].Computer Engineering and Applications,2006,42 (3):190-193(in Chinese).[王曉峰,黃德雙,杜吉祥,等.葉片圖像特征提取與識別技術(shù)的研究 [J].計(jì)算機(jī)工程與應(yīng)用,2006,42 (3):190-193.]
[11]XIE Fei,CHEN Leiting,QIU Hang.Research of image classification method based on texture feature extraction and system to achieve [J].Application Research of Computers,2009,26 (7):2767-2770 (in Chinese). [謝菲,陳雷霆,邱航.基于紋理特征提取的圖像分類方法研究及系統(tǒng)實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2009,26 (7):2767-2770.]
[12]ZHOU Haixia.Application research of wavelet transformation in image compression [D].Xi’an:Chang’an University,2008(in Chinese).[周海霞.小波變換在靜態(tài)圖像壓縮中的應(yīng)用 [D].西安:長安大學(xué),2008.]