茅瀚云
摘要:人臉識別作為模式識別領(lǐng)域的重要分支之一,以其不易偽裝、識別便捷、較強的用戶體驗等特點逐漸成為近年來的研究熱點,并陸續(xù)應(yīng)用于商業(yè)系統(tǒng)以符合大眾在安防領(lǐng)域的需求。
關(guān)鍵詞:人臉識別;LBP算子;直方圖;識別率
中圖分類號:TP301 文獻標(biāo)識碼:A 文章編號:1009-2374(2013)11-0158-02
1 概述
為了在人臉識別領(lǐng)域得到更好的應(yīng)用,Ahonen等根據(jù)心理學(xué)上的研究將人臉進一步劃分成不同的區(qū)域并賦予不同的權(quán)值加以區(qū)分,最終取得了良好的識別結(jié)果。在這基礎(chǔ)上,后續(xù)的研究和改進不斷出現(xiàn)。文中提出了多尺度區(qū)域LBP(MB-LBP)的概念,該方法通過統(tǒng)計區(qū)域內(nèi)的像素均值而非單個像素值得到LBP模式,從而比原有的LBP方法更精確且考慮了更多的宏觀信息。
在上述研究的基礎(chǔ)上,Tan等人提出了改進的LBP算子的LTP特征。LTP特征的本質(zhì)是將兩單閾值的LBP算子分成雙閾值算子并得到上下兩個特征,這就能使提取的特征對單個像素點干擾更加穩(wěn)定。這對基于LBP紋理的人臉識別起到重要作用。本質(zhì)上,通過不同區(qū)域的劃分(Multi-block)來組成LBP特征的目的也是盡可能地考慮LBP模式間的位置關(guān)系,從而得到更有效的特征。文中提出的Hierarchical Kernel Descriptor的方法通過SIFT、HOG等算子的層級組合得到一組新的特征,即在原有特征層基礎(chǔ)上再次特征提取,從而實現(xiàn)大尺度信息提取。因此,應(yīng)該關(guān)注模式間所組成的幾何位置關(guān)系,即在LBP模式上再提取一層特征,從而以數(shù)量的形式反映模式間的幾何位置信息。
2 CNCS在VM中的應(yīng)用
理論上,LBP算子是用于提取圖像的邊緣和角點信息。顯然,這些模式不僅僅只擁有數(shù)量關(guān)系,其位置的不同也將組合成新的不同的模式或圖案,就如同近處看到的圖案在遠處只能表現(xiàn)為一個像素點,而這些像素點又可以組成新的模式、圖案。另一方面,可以把紋理信息分成若干層,較低層的基元形成的某種模式作為較高描述層的次基元,并在一個更高層的描述層次上形成新的模式。因此,不能僅用單個直方圖來衡量一個區(qū)域的LBP模式。
本文提出了一種新的基于雙層LBP的方法,用于提取更多LBP模式之間所具有的幾何關(guān)系。首先對人臉灰度圖像提取LBP特征并得到由該模式組成的圖像,從而將特征從像素級提升到區(qū)域特征。其次,對LBP模式組成的圖像進一步提取LTP算子,從而得到又一組基于LBP模式的特征,用于描述模式間的幾何位置關(guān)系。通過二者的結(jié)合來達到提升識別率的目的。
3 重定義LTP算子
傳統(tǒng)的LBP特征實現(xiàn)了從像素級到區(qū)域級特征的轉(zhuǎn)變,本文通過雙層LBP特征實現(xiàn)對區(qū)域特征的進一步描述。LBP特征實現(xiàn)了像素層特征的提取,而第二層的目的是實現(xiàn)LBP層的特征提取,以獲得更多的宏觀信息。
可以采用與LBP算子相類似的思想,從f1(x,y)提取不同模式之間的關(guān)系。通過二值化3×3的區(qū)域,可提取出不同模式之間相鄰組合關(guān)系并統(tǒng)計成直方圖。然而,對于灰度值的像素點來說,像素值之間的減法是存在幾何意義的,它表示了不同像素點之間的像素差,對圖像紋理而言具有物理意義,但對于LBP模式來說,數(shù)值只是一種標(biāo)號,每個標(biāo)號之間的簡單相減不存在任何幾何意義。值得注意的是,等號存在一定的物理意義,因此根據(jù)這一特性可以將模式數(shù)值分成兩部分:等于中心點模式和不等于中心點模式。顯然,此時兩個標(biāo)號相等意味著兩個模式屬于同一種模式。但是考慮到像素值可能存在的干擾和誤差最終將會影響LBP特征的準(zhǔn)確性,對于編碼相互接近的LBP模式需要區(qū)別對待。如二進制編號11101111的模式和二進制編號為11111111的模式都應(yīng)該屬于同一種模式,因為有極大的可能是由于第四位的像素干擾所引起的不一致。因此定義運算d(x,y)表示兩個模式標(biāo)號之間的大小關(guān)系,當(dāng)|d(x,y)|≤3時,意味著兩個模式是一致的。由此可以根據(jù)中心點的模式,將周圍模式分為兩類,|d(x,y)|≤3及|d(x,y)|>3。這與文提出的LTP有著相類似的分類方式。據(jù)此本文重新定義了LTP的算子。本文所定義的LTP算子如式(1)所示:
其中d(x,y)表示兩個編碼之間差異。上式中的LTP算子也是同樣提取基于局部區(qū)域的特征,但特征提取的層面不同,體現(xiàn)的是不同模式之間的關(guān)系。對LBP模式而言,擁有相同直方圖的兩幅圖像,其實際模式的排列組成方式卻可能完全不同。因此,通過LTP模式,能夠有效地統(tǒng)計出某一模式周圍其他模式的組成,從而得到更豐富的人臉信息。
4 結(jié)語
經(jīng)典的LBP應(yīng)用都是提取LBP及其他擴展的特征后組成直方圖進行識別。由于單個LBP模式直方圖只能反映不同模式之間的數(shù)量關(guān)系,缺少了幾何位置信息,所以眾多的研究通過多尺度的區(qū)域和LBP特征的方式來實現(xiàn)位置信息的融入。然而,這樣的做法依然忽視了模式與模式之間的幾何信息,模式之上依然可能存在著某些模式。因此,本文提出了一種基于LBP模式的雙層LBP的概念,通過重定義的LTP特征,在由LBP模式組成的圖像上進一步提取其特征模式從而構(gòu)成新的特征,最終提到了識別率。實驗表明,本文所提出的方法對于基于LBP特征的算法有一定的改善,通過重定義的LTP特征,能夠在一定程度上提取模式間的幾何位置關(guān)系,增加人臉識別的有效信息。
參考文獻
[1]A.Pentland. Looking at people: sensing for ubiquitous andwearable computing. IEEE Transaction on Pattern Analysis and Machine Intelligence,2000, 22(1):107-119.
[2]T. Kanade, Picture processing system by computercomplex and recognition of human faces, Ph.D.dissertation, Kyoto University, 1973.
[3]H.Chan, W.W. Bledsoe. A man-machine facial recognition system: some preliminary results. Technical report,Panoramic Research Inc., 1965.
[4]A.J. Goldstein, L.D. Harmon, A.B. Lesk. Identificationof human faces. Proceedings of the IEEE,1971,59(5):748-760.
(責(zé)任編輯:周 瓊)