王常芳,朱賢良
(江蘇科技大學(xué) 計算機科學(xué)與工程學(xué)院,江蘇 鎮(zhèn)江 212003)
隨著科技的發(fā)展,人臉識別在社會上的應(yīng)用越來越廣泛[1]。目前,人臉表情識別方法有:基于活動外觀模型,基于Gabor小波、基于局部二值模式(LBP)和基于流形[2]等。其中LBP方法在人臉表情識別方面對光線就有很好的魯棒性和識別性能好等優(yōu)點[3]。LBP可以快速的從人臉圖像中提取紋理信息,保留了有效的人臉信息,在人臉識別領(lǐng)域有很好的應(yīng)用[4]。Ahonen等[5]提出了基于LBP[6]算子的人臉識別算法在人臉數(shù)據(jù)庫中具有很好的識別性能。
然而,基于LBP算法的人臉識別所得到的LBP直方圖向量維數(shù)過高,計算量大。識別效率不高等問題,本文提出將單幅的人臉圖像規(guī)則的分成為子塊,對每個子塊進行LBP變換,把每個LBP變換的后的子塊分別用2DDCT[7]變換到頻率域,大部分信息保存在低頻部分,取低頻作為人臉的頻率域特征,有效的降低維數(shù),使計算量降低[8]。
局部二值模式 (LBP)是一種灰度范圍內(nèi)的紋理描述方式。最初有Ojala等[9]提出了LBP算子用來描述圖像的局部結(jié)構(gòu)。原始的LBP算子為圖像的每個像素定義了一個以該像素為中心的8個像素的弧度值與其進行對比,若周圍像素值大于中心點的值,則該像素位置被標(biāo)記為1,否者為0。
對于窗口,LBP值的計算公式如下:
其中,gc是窗口中心像素的像素值,gi是8個鄰域像素的灰度值,S(x)是一個二值化函數(shù),其定義如下:
一個窗口的LBP算子的計算過程如圖1所示。
基本的LBP算子是對中心像素的鄰域進行操作的。對整個圖像進行掃描后,我們得到一個LBP紋理圖像,這個圖像的直方圖被稱為LBP特征。
圖1 基本的LBP算子的定義Fig.1 The basic definition of LBP
離散余弦變換可以去除圖像中較多的冗余信息,同時對圖像可以降維,在圖像領(lǐng)域中得到廣泛的應(yīng)用。人臉圖像經(jīng)2DDCT變換后,其低頻分量集中在左上角,包含了圖像的主要信息,中高頻分量集中在右上角,包含極少信息,可以忽略,取左上角塊提取特征,從而達到壓縮目的。對于一幅MN的人臉數(shù)字圖像(f(x,y)),其二維離散余弦變換定義為:
其中:u=1,2,3,…,4M-1;v=0,1,…,N-1
C(u,v)稱為 DCT 系數(shù)。 a(u),a(v)分別定義為:
相應(yīng)的離散余弦反變換(IDCT)定義為:
離散余弦變換的的特點:當(dāng)頻率域變化因子u,v較大時DCT系數(shù)的值很?。欢鴶?shù)值較大的 C(u,v)主要分布在 u,v較小的坐上區(qū)域,這也是有用信息的集中區(qū)域?;?DDCT系數(shù)重建圖像是保留少數(shù)離散余弦變換的低頻分量,而舍去大部分中高頻分量,利用反變換可獲得與原始圖像相近的回復(fù)圖像。
LBP與2DDCT相結(jié)合的人臉識別算法基本思想是:將原圖像規(guī)則的分成8×8子塊,對每一個子塊用LBP算子生成子塊LBP紋理圖像,對生成后的圖像進行2DDCT變換,對左上角塊進行特征提取。使用2DDCT變換到頻率域中,即達到降維的目的,又對光照變化和旋轉(zhuǎn)比以前圖像更具魯棒性,最后利用利用最鄰近分類器進行分類?;静襟E如下:
1)將訓(xùn)練樣本人臉圖像分成規(guī)則的8×8子塊矩陣,如圖2所示。
2)對每個子塊進行LBP變換,生成紋理信息圖像。
3)對每個子塊的紋理信息圖像進行2DDCT變換。取頻率域左上角矩陣塊生成特征向量 Yi=[,, …,](i=1,2,…,N)。
4)對測試樣本進行上述操作,得到樣本Y0特征向量Y0=[,,…,]。
圖2 將圖像分成規(guī)則的8×8子塊矩陣Fig.2 The image is divided into 8×8 sub block matrix rules
5)利用最鄰近分類器進行分類。他們之間的距離定義為:
如果 d(Y0,Yi)=min d,且 Yj∈ck,則 X0∈ck。
本文分別用2DDCT、LBP和LBP+2DDCT相結(jié)合的方法在ORL庫上進行實驗。該人臉庫包含40個人,每個人有10幅圖像,圖像大小維11292,灰度級為256,且人臉的表情與姿態(tài)個不一樣。本文隨機選擇一幅圖像作為訓(xùn)練樣本,在剩余的9幅圖像中隨機選取一幅圖像作為測試樣本。
表1是3種方法識別率的平均值和識別時間的平均值。由表1可以看出LBP+2DDCT相結(jié)合的方法在3種算法中平均識別耗時最少和平均識別率最高。
表1 在ORL人臉庫上平均識別率和平均識別時間Tab.1 The average recognition rate and the average recognition time on ORL face database
圖3比較每個算法在ORL人臉數(shù)據(jù)庫上特征維數(shù)從14到26的識別率變化情況。
圖3 ORL庫中3種算法識別率隨特征維數(shù)的變化Fig.3 Three kinds of algorithms to identify the rate of change with characteristic dimensions
結(jié)合表1和圖3可知,并非特征維數(shù)越高,識別率就越好。在取特征維數(shù)為20的時候,LBP和2DDCT相結(jié)合的方法在3種算法中識別率最好。
本文采用LBP與二維離散余弦變換相結(jié)合的人臉識別算法,把人臉圖像變換到頻率域中,取左上角塊作為圖像的特征向量。即有效的降低光照和旋轉(zhuǎn)等因素的影響,又達到降維的目的,還除去圖像中的冗余信息,縮短了識別的時間,同時又有很好的識別率。
[1]MATTHEW TURK,Alex Pentland,Eigenfaces forrecognition,Cognitive Neurosci.3(1991)71-86.
[2]李睿凡,朱強生,郭燕慧,等.魯棒局部保持投影的表情識別[J].北京郵電大學(xué)學(xué)報,2006,29(Z2):178-182 LI Ri-fan,ZHU Qiang-sheng,GUO Yan-hui,et al.Robust locality preserving projection for facial expression recognition[J].Journal of Beijing University of Posts and Telecommunications,2006,29(Z2):178-182.
[3]孫寧,冀貞海,鄒采榮,等.基于局部二元模式算子的人臉性別分類方法[J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2007,35(1):177-181.SUN Ning,JI Zhen-hai,ZOU Cai-rong,et al.Face gender classification method based on Local Binary Pattern operators[J].Journal of Huazhong University of Science and Technology:Natural Science Edition,2007,35(1):177-181.
[4]張翠平,蘇光大.人臉識別技術(shù)綜述[J].中國圖像學(xué)報,2002,5(11):885-894.ZHANG Cui-ping,SU Guang-da.Summary of the face recognition technology[J].Journal of China Image,2002,5(11):885-894.
[5]Atonen T,Hadida,Pietickainen M.Face descripti-on with local binary patterns:application to face rec-ognition[J].IEEE Trans on PAMI,2006,28(12):2037-2-14.
[6]李樹娟.基于LBP特征的人臉表情分析[D].山東:中國石油大學(xué)(華東),2010.
[7]Xiaoyuan Jing,Hausan Wong,David Zhang, Face recognition based on 2D fisherface approach[J].Pattern Recgnition,2006:707-710.
[8]路沖,劉曉東,劉萬泉.一種2DDCT與壓縮感知結(jié)合的人臉識別[J].電子設(shè)計工程,2011,19(21):186-188.LU Chong,LIU Xiao-dong,LIU Wang-quan.A combination of 2DDCT and compressed sensing face recognition[J].Electronic Design Engineering,2011,19(21):186-188.
[9]Ojala T,Pietikainen M,Harwood D.A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition,1996,29(1):51-59.