尚 燕,安 濤,李春明
(河北科技大學(xué)信息科學(xué)與工程學(xué)院電子系,河北 石家莊050000)
為實(shí)現(xiàn)基于內(nèi)容的圖像檢索,MPEG-7標(biāo)準(zhǔn)提出了圖像內(nèi)容描述子的概念(如紋理描述子、形狀描述子和顏色描述子等)[1-2]。如果圖像表現(xiàn)出來的是以某一像元進(jìn)行比較規(guī)則的多次重復(fù),則可以看成是一幅較規(guī)則的紋理圖像,因此紋理具有一定的區(qū)域特性。自然界的景物中,例如布匹、木紋等,大部分圖像均可表現(xiàn)出紋理特性,因此,紋理已經(jīng)成為人們用來感知世界的要素之一。紋理分析被廣泛應(yīng)用于圖像識(shí)別、檢索等,已經(jīng)成為機(jī)器視覺系統(tǒng)的重要基礎(chǔ)。最近幾年來,研究學(xué)者們提出了各種分析方法,這些方法取得了較好的分類效果,而抗噪性是算法在實(shí)際用中應(yīng)具備的重要性能,但它們往往忽視了圖像噪聲的影響。另一方面,雖然直接在空域計(jì)算圖像的LBP直方圖特征具有較好的分類效果,但其存在一些弊端,例如不能有效描述基元較大的紋理,且不具有多分辨率和抗噪性,而這些性能在實(shí)際應(yīng)用中是非常重要的。為了克服這些局限,文章提出的算法先在頻域?qū)D像進(jìn)行Curvelet變換,然后在空域計(jì)算其LBP直方圖的方法,算法提取的特征具有多分辨率的特性且更加緊湊,能夠更好地描述圖像的細(xì)節(jié)和基元較大的紋理,彌補(bǔ)了前者的不足。另外,在現(xiàn)實(shí)中,如果圖像混入了噪聲,那么此時(shí)算法仍能夠正確分類,現(xiàn)有的方法沒有考慮圖像噪聲對(duì)紋理分類的影響,本文利用每個(gè)尺度的能量顯著方向子帶進(jìn)行圖像重構(gòu),再提取多分辨率LBP特征,算法具有較強(qiáng)的抗噪性能。
小波理論已經(jīng)被廣泛應(yīng)用于圖像處理領(lǐng)域,小波變換固然表現(xiàn)出了很多優(yōu)點(diǎn),但是其小波基只有水平、垂直和對(duì)角線這3個(gè)方向,對(duì)于圖像的邊緣、輪廓等細(xì)節(jié)特征不能準(zhǔn)確反映。因此,繼小波變換之后,出現(xiàn)了很多新的多尺度幾何變換,例如Ridgelet變換和之后的Curvelet變換。Curvelet變換是近年來圖像處理研究的熱點(diǎn),因?yàn)槠浠瘮?shù)是多方向的,具有高度各向異性,使能量更集中,能對(duì)圖像的細(xì)節(jié)信息進(jìn)行更稀疏表示[3]。
Curvelet變換是直接在二維連續(xù)空間R2中定義的,其基函數(shù)γ的頻域表達(dá)式為
式中:ω=(ω1,ω2)T,k=(k1,k2)T∈Z2,Rj,l為旋轉(zhuǎn)矩陣,其旋轉(zhuǎn)角度θj,l=2πl(wèi)2-j。
式中:δ1=14/3(1+O(2-j)),δ2=10π/9。χ為二維窗函數(shù)
如圖1a所示,Curvelet將整個(gè)頻域分割成不同尺度不同方向的扇形子帶,由低頻子帶到高頻子帶方向數(shù)依次加倍。通過Candes提出的Wrapping算法實(shí)現(xiàn)離散化,如圖1b所示,不同于連續(xù)Curvelet,離散Curvelet變換將頻域劃分為梯形基元[4]。
圖1 Curvelet變換頻帶劃分
令gc,g0,…,gP表示灰度紋理圖像局部鄰域內(nèi)的p個(gè)像素,其中,gc為鄰域中心像素的灰度值,gp,(p=0,…,P-1)表示半徑為R的圓對(duì)稱域內(nèi)圓周上均勻分布的像素點(diǎn)灰度,不同(P,R)坐標(biāo)下的圓對(duì)稱域如圖2所示[5]。
圖2 不同(P,R)坐標(biāo)下的圓對(duì)稱域
描述局部圖像紋理空間結(jié)構(gòu)的LBPP,R參數(shù)定義為
LBPP,R參數(shù)產(chǎn)生2P個(gè)不同的值,圖像旋轉(zhuǎn)時(shí),灰度值gp將沿中心為g0、半徑為R的圓周發(fā)生移動(dòng),導(dǎo)致LBPP,R改變,因此提出一種基于“均勻”模式的LBP算子,該算子具有旋轉(zhuǎn)不變特性。定義均勻參數(shù)U,表示二進(jìn)制0/1變化的次數(shù),當(dāng)U最大取2時(shí),改進(jìn)的LBP算子定義為
用LBP實(shí)現(xiàn)紋理分類,不能有效描述基元較大的紋理,且不具有多分辨率的特性,只通過增加R值來增加像素點(diǎn)達(dá)到改進(jìn)分類效果的措施效果不顯著,反而會(huì)使計(jì)算量增大。另外,LBP算法沒有考慮抗噪性這一在實(shí)際應(yīng)用中很重要的特性。針對(duì)這些問題,本文提出了一種空域和頻域結(jié)合的基于Curvelet顯著方向子帶多分辨率LBP特征實(shí)現(xiàn)旋轉(zhuǎn)不變紋理分類的方法。
Curvelet變換方向子帶豐富,可更準(zhǔn)確描述圖像的細(xì)節(jié)信息,同時(shí)具有高度各向異性,能量更加集中,因此Curvelet變換可以更有效地表征紋理圖像。算法特征提取的步驟如下:
1)設(shè)大小為N×N的紋理圖像像素值f(x,y),將其灰度值歸一化到[0,1],并對(duì)其進(jìn)行(lbN-3)級(jí)Curvelet變換,因此對(duì)128×128像素的待測(cè)圖像進(jìn)行四級(jí)Curvelet變換,第一級(jí)為低頻子帶,第二級(jí)分解為16個(gè)方向子帶,第三、四級(jí)均有32個(gè)子帶。
2)計(jì)算各子帶能量,每一尺度選取能量最大的k個(gè)子帶對(duì)圖像進(jìn)行重構(gòu),得到的4個(gè)重構(gòu)圖像分別具有不同頻率成分的信息,噪聲主要包含在能量較小的子帶中,故用大能量子帶重構(gòu)圖像能消除大量噪聲,使算法有較強(qiáng)的抗噪性,同時(shí)體現(xiàn)了多分辨率特性。設(shè)尺度i方向j子帶的大小為N×N,能量計(jì)算公式為
式中:i=1,2,…,lbN-3;j=1,2,…,pi/2;pi為尺度i的子帶總數(shù),對(duì)于實(shí)值Curvelet,Ⅰi,j與Ⅰi,j+pi/2子帶對(duì)代表同一方向,因此,為降低運(yùn)算量,取這兩個(gè)子帶的模值(|·|)后計(jì)算能量,并用值最大的k個(gè)子帶對(duì)進(jìn)行圖像重構(gòu)。而對(duì)于復(fù)Curvelet變換,子帶各元素值為復(fù)數(shù),實(shí)驗(yàn)分別取|·|和|·|2后計(jì)算能量得到的分類效果,由于復(fù)變換的計(jì)算量較大,而子帶對(duì)Ii,j與Ii,j+pi/2關(guān)于原點(diǎn)對(duì)稱,代表同一方向,因此為減少運(yùn)算每個(gè)尺度只計(jì)算前pi/2個(gè)子帶的能量,之后選能量大的子帶對(duì)重構(gòu)圖像。紋理bubble及其前n(n=1,2,3,4)個(gè)尺度的重構(gòu)圖像以及加噪后的重構(gòu)圖像分別如圖3和圖4所示,由圖3可以看出,隨著尺度的增大,重構(gòu)圖像的頻率成分越豐富且頻率越高,同時(shí)如圖4所示,由于各尺度選取大能量子帶重構(gòu)圖像,因此有效消除了噪聲的干擾。
3)對(duì)重構(gòu)圖像進(jìn)行抽樣,取絕對(duì)值后計(jì)算其LBP直方圖。根據(jù)奈奎斯特采樣定理,抽樣頻率應(yīng)大于或等于2倍信號(hào)的最高頻率,因此對(duì)包含最高頻率成分的重構(gòu)圖像(n=4)不抽樣,而對(duì)n=1,2,3的重構(gòu)圖像,行和列分別按抽樣率1/8,1/4,1/2進(jìn)行抽樣。抽樣后,取絕對(duì)值計(jì)算旋轉(zhuǎn)不變LBP直方圖,由于計(jì)算的是抽樣后圖像的LBP直方圖,因此該LBP算子對(duì)應(yīng)抽樣前原圖像更大尺寸的LBP算子,即可表征更大區(qū)域的圖像信息,彌補(bǔ)傳統(tǒng)LBP算法的不足。
4)將全部重構(gòu)圖像的LBP直方圖組合成為特征向量。通過以上分析,該算法提取的特征更加緊湊且具有旋轉(zhuǎn)不變和抗噪性能。
選用如圖5所示Brodatz紋理圖像進(jìn)行分類實(shí)驗(yàn),該紋理庫共有bark、brick等13類紋理,且每類均有0°,30°,60°,90°,120°,150°,200°這7個(gè)角度。首先將原大小為512×512的圖像分解為16幅128×128像素的子圖,由此每類紋理可產(chǎn)生16×7=112幅子圖。每類紋理的112幅子圖中,從0°和60°的子圖中各選取11幅用于訓(xùn)練,即訓(xùn)練集共包括11×2×13=286幅128×128像素的子圖,其余子圖均用于測(cè)試。按照上述特征提取部分描述的算法提取各子圖的特征向量,將全部訓(xùn)練圖像的特征向量集送入多項(xiàng)式核的支持向量機(jī)(SVM)進(jìn)行訓(xùn)練,最后再用SVM對(duì)待側(cè)圖像進(jìn)行分類。
圖5 實(shí)驗(yàn)紋理圖像
對(duì)紋理圖像進(jìn)行實(shí)值Curvelet變換,分類結(jié)果如表1所示,當(dāng)重構(gòu)子帶數(shù)k=11時(shí)正確分類率達(dá)98.89%,過少或過多的子帶均會(huì)降低分類率(k=2時(shí)為86.67%,k=14時(shí)為98.21%)。復(fù)Curvelet變換得到的分類結(jié)果如表2所示,由表2可知,同樣在k=11時(shí)對(duì)子帶元素取|·|2的分類率最高為96.15%,但相比實(shí)值Curvelet得到的98.89%分類率低2.74%。故實(shí)值Curvelet變換在重構(gòu)子帶數(shù)k=11的情況下,分類結(jié)果最佳,算法具有良好的旋轉(zhuǎn)不變特性。
表1 實(shí)Curvelet平均正確分類率
表2 復(fù)Curvelet時(shí)的平均正確分類率
將此情況下各類紋理的具體分類結(jié)果列于表3中,由此看出,全部紋理圖像均可獲得較高的分類率,均在96%以上,紋理基元較大的brick,bubble等紋理的分類可達(dá)100%。
表3 各類紋理分類統(tǒng)計(jì)結(jié)果
為進(jìn)一步實(shí)驗(yàn)算法的抗噪性,再對(duì)加噪后的紋理庫進(jìn)行分類實(shí)驗(yàn)。對(duì)紋理圖像加不同強(qiáng)度的白噪聲:σ=0.05,0.1,0.15(圖6所示為wood及加噪σ=0.1后的圖像),再用本文算法(實(shí)值Curvelet,k=11條件下)進(jìn)行分類實(shí)驗(yàn),訓(xùn)練和測(cè)試圖像的選取均與實(shí)驗(yàn)1相同,分類結(jié)果如表4所示。從表4可以看出,實(shí)驗(yàn)仍可獲得較高的分類率,在σ=0.15時(shí)分類率仍可達(dá)92.74%,只比加噪前下降了6.15%。
圖6 實(shí)驗(yàn)紋理圖像
表4 本算法抗噪性實(shí)驗(yàn)結(jié)果
用直接在空域計(jì)算圖像旋轉(zhuǎn)不變LBP算子直方圖的方法對(duì)原紋理圖像和實(shí)驗(yàn)Ⅱ中的加噪圖像進(jìn)行分類實(shí)驗(yàn),并采用相同的訓(xùn)練圖像和測(cè)試圖像,實(shí)驗(yàn)結(jié)果如表5所示。對(duì)原紋理圖像,改進(jìn)前的算法分類率為96.15%,對(duì)加噪后的圖像,分類率大幅度下降,在σ=0.1和σ=0.15時(shí)分別降低10.59%和30%,而由表1和表4所示實(shí)驗(yàn)結(jié)果可知,改進(jìn)后算法對(duì)原紋理的分類率為98.89%,分類率顯著提高,而對(duì)加噪后的圖像仍可獲得較高的分類率,誤分類率明顯小于改進(jìn)前算法。因此可驗(yàn)證本文提出改進(jìn)后的算法能夠有效提高分類率并且具有較強(qiáng)的抗噪性能。
表5 改進(jìn)前算法抗噪性實(shí)驗(yàn)結(jié)果
另外,將本算法與文獻(xiàn)[6]用Gabor變換計(jì)算微模型參數(shù)構(gòu)成宏觀特征的方法對(duì)該紋理庫的分類結(jié)果進(jìn)行比較,文獻(xiàn)[6]分類率為96.79%,且特征向量維數(shù)為208,用7個(gè)角度估計(jì)模型參數(shù)。而本算法的分類率比文獻(xiàn)[6]提高了2.1%,并且特征向量維數(shù)為72,僅用0°和60°兩個(gè)角度對(duì)SVM進(jìn)行訓(xùn)練,因此本文改進(jìn)后算法提取的特征更加緊湊有效,可以實(shí)現(xiàn)更優(yōu)的分類效果。
針對(duì)已有直接在空域計(jì)算圖像LBP直方圖的紋理分類算法的不足,提出一種空域和頻域結(jié)合的基于Curvelet大能量方向子帶多分辨率LBP特征的旋轉(zhuǎn)不變和抗噪紋理分類算法。對(duì)圖像進(jìn)行Curvelet變換后用各尺度大能量方向子帶對(duì)圖像進(jìn)行重構(gòu)并重新抽樣,進(jìn)而計(jì)算抽樣后重構(gòu)圖像的LBP直方圖,直接用得到的直方圖作為特征向量并用SVM實(shí)現(xiàn)分類。通過本算法提取的特征向量實(shí)現(xiàn)了多分辨率且更加緊湊,能夠更準(zhǔn)確地表征較大基元的紋理,克服了傳統(tǒng)LBP分類法的不足。另外,本算法還具有較強(qiáng)的抗噪性能,這在實(shí)際應(yīng)用中是非常重要的。同時(shí)結(jié)合基于最優(yōu)分類超平面思想的支持向量機(jī)進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明,算法能夠顯著提高正確分類率,對(duì)實(shí)驗(yàn)紋理庫的平均正確分類率可達(dá)98.89%,而且具有較強(qiáng)的抗噪性能。
[1]MANJUNATH B S,OHM J R,VASUDEVAN V V,et al.Color and texture descriptors[J].IEEE Trans.Circuits and Systems for Video Technology,2001(116):703-715.
[2]BORBER M.MPEG-7 visual shape descriptors[J].IEEE Trans.Circuits and Systems for Video Technology,2001(116):716-719.
[3]CANDES E J,GUO F.New multiscale transforms,minimum total variation synthesis:applications to edge-preserving image reconstruction[J].Signal Processing,2002,82(11):1519-1543.
[4]CANDES E J,DEMANET L,DONOHO D L,et al.Fast discrete curvelet transforms[J].Multiscale Modeling and Simulation,2006,5(3):861-899.
[5]OJALA T,PIETIKAINEN M.Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2002,24(7):971-987.
[6]GEORGE M H,MANJUNATH B S.Rotation-invariant texture classification using a complete space-frequency model[J].IEEE Trans.Image Processing,1999,8(2):255-269.