向+東++陳+宇++陳廣勝
摘要:針對(duì)傳統(tǒng)木材紋理分類(lèi)的準(zhǔn)確率低且難度大的問(wèn)題,依據(jù)LBP(局部二值)算子和AD-ABOOST(自適應(yīng)增強(qiáng))算法理論,提出了LBP-ADABOOST模型對(duì)木材紋理進(jìn)行識(shí)別分類(lèi),通過(guò)均勻旋轉(zhuǎn)不變特性與原始LBP算子相融合,提取紋理的特征值,結(jié)合自適應(yīng)增強(qiáng)算法,從而訓(xùn)練得到每類(lèi)紋理所對(duì)應(yīng)的分類(lèi)器模型參數(shù),構(gòu)造分類(lèi)器,實(shí)現(xiàn)對(duì)木材紋理準(zhǔn)確高效分類(lèi),實(shí)驗(yàn)結(jié)果表明相比于BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機(jī)等分類(lèi)算法,該模型的實(shí)驗(yàn)結(jié)果誤差率為4%左右,準(zhǔn)確率高,實(shí)用性強(qiáng),
關(guān)鍵詞:木材紋理分類(lèi);LBP算子;ADABOOST算法;分類(lèi)器
DOI:IO.15938/j.jhust.2015.02.011
中圖分類(lèi)號(hào):TP391.4
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1007-2683(2015)02-0057-06
0 引 言
木材紋理分類(lèi)是木材優(yōu)化利用過(guò)程的重要部分,木材紋理結(jié)構(gòu)精細(xì)復(fù)雜、無(wú)規(guī)律的天然屬性,使得紋理分類(lèi)一直是木材學(xué)的前沿課題.針對(duì)不同的研究,國(guó)內(nèi)外學(xué)者提出了不同的特征提取及紋理分類(lèi)算法,非負(fù)矩陣分解,灰度共生矩陣法,馬爾可夫隨機(jī)場(chǎng),尺度不變特征變換法等存特征提取方面取得了一定的突破,而常用的分類(lèi)算法有BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機(jī),決策樹(shù),極限學(xué)習(xí)機(jī)等.大多紋理分類(lèi)模型基于以上算法的結(jié)合,且取得了一定的成果,此外,我國(guó)對(duì)于木材紋理分類(lèi)的研究起步較晚,初期主要是對(duì)國(guó)外的經(jīng)驗(yàn)總結(jié),優(yōu)化傳統(tǒng)的分類(lèi)算法,現(xiàn)階段我國(guó)的紋理分類(lèi)技術(shù)發(fā)展較好,但也存在一定缺陷,主要由于實(shí)際應(yīng)用的訓(xùn)練樣本在個(gè)體之間存在著差異,導(dǎo)致分類(lèi)算法對(duì)分類(lèi)結(jié)果的差異性較大.如何提高木材紋理分類(lèi)的準(zhǔn)確性至關(guān)重要,也將是本文的重點(diǎn).
近些年,一種簡(jiǎn)單高效的紋理特征分析方法——局部二值模式(logical binary pattern,LBP)成為了眾多學(xué)者研究的對(duì)象,在描述、提取局部紋理特征方面取得了很好的效果.此外,Adaboost自適應(yīng)增強(qiáng)算法是通過(guò)訓(xùn)練樣本特征得到弱分類(lèi)器,對(duì)弱分類(lèi)器的線(xiàn)性組合得到最終的強(qiáng)分類(lèi)器,進(jìn)行分類(lèi)學(xué)習(xí),其在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方面應(yīng)用較廣.基于以上表述,本文采用LBP與ADABOOST的融合嘗試進(jìn)行木材紋理分類(lèi),且這種分類(lèi)算法在木材紋理分類(lèi)方面應(yīng)用極少.經(jīng)實(shí)驗(yàn),本文提出的基于LBP-ADABOOST模型的木材紋理分類(lèi)算法達(dá)到預(yù)期目的,并且正確率明顯高于BP神經(jīng)網(wǎng)絡(luò),SVM支持向量機(jī),不失為木材紋理分類(lèi)提供一種有效方法.
1 特征提取
局部二值模式(logical binary pattern,LBP)最早是由Ojala等在1996年提出,是一種描述圖像局部紋理特征的算子,原始的LBP算子定義為在3×3的窗體內(nèi),以窗體中心像素為閾值,與相鄰的8個(gè)像素的灰度值比較,若周?chē)袼刂荡笥谥行南袼刂?,則該像素點(diǎn)的位置被標(biāo)記為1,反之為0.這樣,3×3領(lǐng)域內(nèi)的8個(gè)點(diǎn)可產(chǎn)生8bit的無(wú)符號(hào)數(shù),即得到該窗體的LBP值,并用這個(gè)值來(lái)反映該區(qū)域的紋理信息,如圖l所示:
隨著LBP算子在圖像中的應(yīng)用,擴(kuò)展定義一個(gè)半徑為R(R>O)的圓形鄰域,B(B>O)個(gè)鄰域像素點(diǎn)均勻分布在圓周上面.設(shè)定該鄰域中心像素值是C,則C可用該鄰域內(nèi)的B+1個(gè)像素的函數(shù)來(lái)定義,即其中:gc為中心像素值;g0,g1,gb-1為B個(gè)鄰域像素值.中心像素的坐標(biāo)是(Xc,Yc),則其鄰域坐標(biāo)(Xi,Yi)為:
當(dāng)坐標(biāo)(Xi,Yi)不在中心,通過(guò)雙線(xiàn)性?xún)?nèi)插法,將鄰域的像素值減去中心的像素值計(jì)算得到局部的紋理特征像素值C:
假定在實(shí)際情況中中心像素值與鄰域像素值的差值g0-gc,gb-1-gc獨(dú)立于gc,則(3)可表示為:
由于c(g。)代表的是中心點(diǎn)的像素值,與圖像的局部紋理特征無(wú)必然聯(lián)系,故可以忽略不計(jì),得到:
上式(5)中的像素差值描述了每個(gè)紋理模式,若紋理不受像素值單調(diào)變化,只須考慮差值符號(hào)即可:
由此可以得到一個(gè)B為二進(jìn)制數(shù),乘以相應(yīng)的權(quán)重2i求和得到LBP特征值:
原始LBP算子是灰度不變的,但不是旋轉(zhuǎn)不變的,圖像經(jīng)過(guò)旋轉(zhuǎn)后可得到不同的LBP值.為了便于描述圖像信息,針對(duì)圖像旋轉(zhuǎn)之后還可以得到相同的LBP值,Maenpaa等人提出具有旋轉(zhuǎn)不變的LBP算子(rotation invariant LBP),不斷旋轉(zhuǎn)圓形鄰域得到LBP值,取其最小的作為鄰域的LBP值,表述如下式:其中ROI(x,i)是旋轉(zhuǎn)函數(shù),表示將x的二進(jìn)制數(shù)按位循環(huán)右移i次,
但隨著鄰域采點(diǎn)集數(shù)的增加,二進(jìn)制模式的種類(lèi)急劇增加,達(dá)到2B個(gè),這種數(shù)量無(wú)論是對(duì)紋理特征的提取,紋理的分類(lèi)都是不利的.針對(duì)二進(jìn)制模式的降維問(wèn)題,Ojala提出一種均勻模式(uniform pat-tern).均勻模式即根據(jù)編碼模式出現(xiàn)頻率的高低,在圓形二進(jìn)制編碼中,至多有兩個(gè)0到1或1到0的變化,表示如下:
上式的結(jié)果滿(mǎn)足U≤2的模式時(shí)稱(chēng)為均勻模式,用LBP表示,通過(guò)改進(jìn),二進(jìn)制的模式減少,且不會(huì)丟失信息,使得原來(lái)2B種減少到B(B-1)+2種,降低了特征矩陣的維數(shù).
基于以上兩種性質(zhì)的優(yōu)越性,可以將LBP的旋轉(zhuǎn)不變性與均勻模式結(jié)合得到更好的效果,稱(chēng)為旋轉(zhuǎn)不變均勻模式用符號(hào)LBPriu2表示,定義如下:其中:U(LBPb,r)的計(jì)算方法是(10)的表述,該模式下不儀保留了圖像的紋理特征,而且鄰域二進(jìn)制編碼的種類(lèi)降到了B+2種,大幅減少了特征總量,本文采用了旋轉(zhuǎn)不變均勻模式LBP算子提取特征值,并對(duì)比了幾種模式下不同分布情況,如圖2所示.可以看出LBP算子在均勻旋轉(zhuǎn)不變模式下的特征維數(shù)相對(duì)較少,同時(shí)保留了圖像信息,效果最佳,
2 算法原理
1995年SChapire和Freund提出的Adaboost算法,相對(duì)于Boosting算法,其自適應(yīng)在于:前一個(gè)分類(lèi)器分錯(cuò)的樣本會(huì)被用來(lái)訓(xùn)練下一個(gè)分類(lèi)器.Asaboost算法訓(xùn)練弱分類(lèi)器的錯(cuò)誤率相對(duì)較大,但是只要它的分類(lèi)效果比隨機(jī)猜測(cè)效果要好即可接受,通過(guò)對(duì)弱分類(lèi)器的線(xiàn)性組合得到最終的強(qiáng)分類(lèi)器.同時(shí),Adaboost算法也是一種迭代算法,它允許在每一輪的訓(xùn)練中加入一個(gè)新的弱分類(lèi)器,直到達(dá)到某個(gè)預(yù)定足夠小的錯(cuò)誤率.每次訓(xùn)練樣本都被賦予一個(gè)權(quán)重,表明它被某個(gè)分類(lèi)器選人訓(xùn)練集的概率,如果某個(gè)樣本特征已經(jīng)被準(zhǔn)確的分類(lèi),那么存構(gòu)造下一個(gè)分類(lèi)器的時(shí)候,它再次被選人訓(xùn)練集的概率會(huì)被降低;相反,若沒(méi)有準(zhǔn)確的分類(lèi),那么他的權(quán)重就會(huì)得到提高,選人下一個(gè)分類(lèi)器訓(xùn)練集的慨率增大.通過(guò)上述迭代過(guò)程,Adaboost算法主要將聚焦那些較“困難”的分類(lèi)樣本上面.