(河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,河南 焦作 454150)
在圖像分析領(lǐng)域內(nèi),局部二值模式算子(Local Binary Pattern,LBP)[1-2]是具有代表性的是一種紋理描述算子,并且LBP計(jì)算復(fù)雜度低,對圖像旋轉(zhuǎn)、局部灰度小的變化具有較好的魯棒性。但是,LBP算子對噪聲及光照較為敏感,為此,Jabid等人融合局部邊緣信息提出局部方向模式(Local Directional Pattern,LDP)[3-4]。為了增加邊緣梯度信息的方向性,Zhong等人提出了增強(qiáng)局部方向模式(Enhanced LDP,ELDP)[5]。這兩種算子對圖像光照變化和低噪情況等具有更好的魯棒性。
在此基礎(chǔ)上,多種針對LDP的擴(kuò)展方法被提出,Castillo提出了LSDP(Local Sign Directional Pattern)算子[6],該算子采用六位二進(jìn)制碼表示紋理和灰度變化信息,不但可以更好地突出主方向信息,標(biāo)記區(qū)分具有不同強(qiáng)度變化的類似結(jié)構(gòu)模式,而且也可以識別更多微小的像素變化,得到更為詳細(xì)的紋理特征。Rivera等人提出把主方向和前兩個(gè)主要方向的強(qiáng)度差編碼成一個(gè)數(shù),對其主要方向所表示的鄰域的突出紋理信息進(jìn)行編碼,提高了對光照和噪聲的魯棒性[7]。Ryu提出了一種新的編碼方案——局部定向三元模式,消除定向模式在平滑區(qū)域產(chǎn)生的不確定性,利用方向信息描述顯著部位與非顯著部位信息,可以有效描述更多面部特征,整體識別分類性能較好[8]。
然而,上述LDP及其擴(kuò)展方法在進(jìn)行模式劃分時(shí),往往采用剛性劃分方法,為此首先在方向模式的定義中引入模糊邏輯,并定義了模糊局部模式(Fuzzy Local Pattern,F(xiàn)LP),并基于該模式對傳統(tǒng)LDP及其相關(guān)方法進(jìn)行擴(kuò)展;其次,在定義局部方向模式時(shí),為進(jìn)一步消除噪聲影響,將傳統(tǒng)的3×3鄰域進(jìn)行擴(kuò)展,定義了新的局部鄰域拓?fù)浣Y(jié)構(gòu)。在實(shí)驗(yàn)中,選擇在紋理分析領(lǐng)域廣泛應(yīng)用的3個(gè)紋理庫UIUC[9]、Curet[10]和Outex[11]作為實(shí)驗(yàn)數(shù)據(jù)庫,采用LDP和ELDP算子作為實(shí)例,來驗(yàn)證新方法的分類效果。實(shí)驗(yàn)結(jié)果證明了本文方法可以有效提高傳統(tǒng)LDP算子及其擴(kuò)展算子的分類能力。
在局部二值模式的基礎(chǔ)上,Jabid等人融入邊緣特征信息,提出局部方向模式算子(LDP)[3-4],其原理是:將原來圖像的3×3鄰域與Kirsch模板[12]進(jìn)行卷積運(yùn)算(圖1給出了Kirsch的八方向模板),得到邊緣響應(yīng)值,然后將響應(yīng)值中絕對值前k大的值所在的位置設(shè)為1,其他位記為0,組合得到的二進(jìn)制值即為該鄰域的LDP值。其定義如下:
(1)
式中,
mi為與Kirsch模板卷積運(yùn)算后得到的邊緣梯度值;mk為第k大的邊緣梯度值。圖2給出了LDP的計(jì)算實(shí)例。
在LDP的基礎(chǔ)上,Zhong等人提出了增強(qiáng)局部方向模式[5],其基本原理是:首先將3×3鄰域與Kirsch模板卷積,然后取最大和次大邊緣梯度值所對應(yīng)的方向,得到兩位八進(jìn)制數(shù),最后將該八進(jìn)制數(shù)轉(zhuǎn)換為十進(jìn)制數(shù),即為ELDP值。其定義為
ELDP(xc,yc)=8bi+bj
(2)
式中,bi為獲得最大邊緣檢測返回值的鄰域像素點(diǎn)所在方向的編碼;bj為獲得第二大邊緣檢測返回值的鄰域像素點(diǎn)所在方向的編碼。圖3給出了ELDP的計(jì)算實(shí)例。
圖3 ELDP計(jì)算示例
對于LDP及其擴(kuò)展方法在定義方向模式時(shí),往往都采用剛性的劃分方法,某一鄰域僅屬于其中的一種模式,因此局部灰度的微小變化或由于噪聲的影響,會導(dǎo)致相似局部鄰域被劃分到完全不同的模式。為了解決該問題,引入了模糊邏輯理論,該理論已在局部二值模式中得到了應(yīng)用[13-14],并取得了較好的效果。
設(shè)Rm為3×3鄰域局部方向模式的最大值,Rc為鄰域中心像素的局部方向模式值,Ri(i=0,1,2,…,7)為鄰域內(nèi)其他像素的局部方向模式值,集合B與集合S為滿足特定條件的局部方向模式值的集合,t為閾值(t∈[0,Rm])。若Rc+t 模糊集B及其隸屬度關(guān)系可以用以下的序數(shù)對表示: B={Ri,μB(Ri)|Ri∈H} (3) 式中,μB為屬于集合B的隸屬度函數(shù);H為局部鄰域所有模式集合。同理,集合S的隸屬函數(shù)表示為 S={Ri,μS(Ri)|Ri∈H|} (4) 式中,μS為集合S的隸屬函數(shù)。 設(shè)d=Ri-Rc,對于集合B的隸屬函數(shù)μB定義為 (5) 相對應(yīng)地,集合S的隸屬函數(shù)μS定義為 μS=1-μB (6) 基于隸屬函數(shù)μS和μB,可以基于式(7)計(jì)算中心像素隸屬于不同集合的概率。 (7) 圖4 FLDP計(jì)算示例 對于傳統(tǒng)的LDP及其擴(kuò)展算子,其采用的局部拓?fù)浣Y(jié)構(gòu)均為3×3鄰域,進(jìn)一步對原拓?fù)浣Y(jié)構(gòu)進(jìn)行拓展,定義了圖5所示的局部鄰域結(jié)構(gòu),其基本思想是采用8-方向上相鄰的若干個(gè)像素的灰度均值代替原定義中單個(gè)像素的灰度均值。該拓?fù)浣Y(jié)構(gòu)具有兩個(gè)主要優(yōu)點(diǎn):① 采用灰度均值可以進(jìn)一步消除噪聲影響;② 將3×3鄰域擴(kuò)展到更大區(qū)域,可以在更大的尺度下描述局部紋理特征。 設(shè)gp,r分別代表方向p中第r個(gè)像素的灰度值,r=1,2,3,…,s,p=0,1,2,…,7。則相應(yīng)的灰度均值計(jì)算公式為 (8) 圖5給出了當(dāng)s=3時(shí)的計(jì)算示例。 圖5 s=3時(shí)鄰域灰度計(jì)算示例 為了驗(yàn)證所提出算法的有效性,選取LDP與ELDP算子作為實(shí)例,經(jīng)本文方法改進(jìn)后的描述算子記為FLDP、FELDP;同時(shí)選擇UIUC、Curet以及Outex 3個(gè)在紋理分析領(lǐng)域廣泛應(yīng)用的圖像庫作為測試庫。同時(shí),實(shí)驗(yàn)選擇χ2距離計(jì)算特征間的相似性,采用K-近鄰方法進(jìn)行分類。 首先,測試了所述的4種算子針對圖像的描述效果,如圖6所示。從圖6中可以看出,相對于LDP和ELDP,本文的FLDP和FELDP算子可以更好地保留紋理特征信息,更有利于描述圖像的紋理信息。 圖6 不同算子特征示例圖 對于UIUC圖像庫來說,該庫包含25類紋理,每一類有40張640像素×480像素大小互不重疊的圖像,實(shí)驗(yàn)中在每類紋理中隨機(jī)挑選N張圖片作為訓(xùn)練集,N的取值分別為5、10、15和20,剩下的40-N張圖片作為測試集,并且重復(fù)做50次實(shí)驗(yàn)。各種方法分類效果如表1所示。 表1 針對UIUC圖像庫的分類準(zhǔn)確率結(jié)果 單位:% 由表1可以看出,在訓(xùn)練集N取值為5、10、15、20的情況下,F(xiàn)LDP算子的分類準(zhǔn)確率分別比LDP提高了12.31%、13.75%、14.4%、15.84%; FELDP算子的分類準(zhǔn)確率分別比ELDP提高了8.61%、9.8%、10.77%、11.92%。 對于Curet圖像庫來說,該庫包含61類紋理,每一類有92張200像素×200像素大小的圖片,圖像之間存在旋轉(zhuǎn)、光照的變化。實(shí)驗(yàn)中,在每類紋理中隨機(jī)挑選N張圖片作為訓(xùn)練集,N的取值為6、12、23和46,剩下的92-N張圖片作為測試集,并且重復(fù)做50次實(shí)驗(yàn)。表2給出了實(shí)驗(yàn)結(jié)果的對比。在訓(xùn)練集N取6、12、23、46的情況下,F(xiàn)LDP算子的分類準(zhǔn)確率分別比LDP提高了11.2%、10.77%、10.02%、9.04%;FELDP算子的分類準(zhǔn)確率分別比ELDP提高了11.46%、10.54%、8.91%、6.95%。 表2 對Curet圖像庫的實(shí)驗(yàn)結(jié)果 單位:% 對于Outex圖像庫,包含24類紋理,每一類紋理有9個(gè)角度的圖像,旋轉(zhuǎn)角度分別為0°、5°、10°、15°、30°、45°、60°、75°、90°,每個(gè)角度有20張不重疊的圖像,這些圖像是在3種光源下成像,分別是“horizon”、“inca”、“t184”。在此數(shù)據(jù)庫中,有Outex_TC_00010(TC10)和Outex_TC_00012(TC12)兩種測試集,前者是用于測試圖像旋轉(zhuǎn)不變特性,后者用于研究光照和旋轉(zhuǎn)均不變的特性。對于TC10數(shù)據(jù)庫來說,訓(xùn)練樣本中每一類紋理以光照“inca”光源、0°旋轉(zhuǎn)角的20個(gè)圖像為訓(xùn)練集,其他的8個(gè)角度圖像作為測試集,因此本數(shù)據(jù)庫共有480個(gè)訓(xùn)練樣本和3840個(gè)測試樣本。對于TC12數(shù)據(jù)庫,訓(xùn)練樣本和TC10的“inca”光源、0°旋轉(zhuǎn)角的20個(gè)圖像一樣,測試樣本為光源“t184”或“horizon” 下的圖像,因此本數(shù)據(jù)庫有480個(gè)訓(xùn)練樣本和4320個(gè)測試樣本。 表3 針對Outex圖像庫的實(shí)驗(yàn)結(jié)果 單位:% 表3給出不同方法的分類效果,可以明顯看出,在同種條件下,F(xiàn)LDP、FELDP算子的平均分類準(zhǔn)確率分別比LDP和ELDP算法高11.63%、7.38%。 最后,實(shí)驗(yàn)針對TC10圖像庫,比較了4種方法的特征提取的時(shí)間復(fù)雜度。在相同的實(shí)驗(yàn)環(huán)境下,LDP、FLDP、ELDP、FELDP這4種方法特征提取平均時(shí)間分別為0.92 s、1.88 s、0.83 s、1.71 s。本文改進(jìn)算法由于拓?fù)浣Y(jié)構(gòu)及劃分方法的精確性,特征提取時(shí)間復(fù)雜度高于傳統(tǒng)方法,但分類效果得到明顯提升。 從兩個(gè)方面對傳統(tǒng)局部方向模式及其擴(kuò)展方法進(jìn)行了增強(qiáng)處理,首先引入了模糊隸屬度函數(shù),以解決傳統(tǒng)的剛性模式劃分方法;其次,將原始的3×3鄰域擴(kuò)展到了多分辨率的局部鄰域。新方法一方面提高對局部方向模式劃分的準(zhǔn)確性,提高了其分類能力;另一方面,在新定義的拓?fù)浣Y(jié)構(gòu)下,既可以提取局部鄰域的微觀紋理信息,也可提取相對宏觀的紋理信息,提高了對紋理描述的全面性。采用在紋理分類領(lǐng)域廣泛應(yīng)用的UIUC、Curet和Outex紋理圖像庫進(jìn)行試驗(yàn),結(jié)果表明新的方法可以顯著提高紋理圖像的分類效能。3 實(shí)驗(yàn)結(jié)果
4 結(jié)束語