陳海霞,崔 茜
(1.通化師范學(xué)院物理學(xué)院,吉林 通化 134002;2.國(guó)家知識(shí)產(chǎn)權(quán)局專利局專利審查協(xié)作天津中心,天津 300304)
基于Gabor小波和PCA的人臉識(shí)別
陳海霞1,崔 茜2
(1.通化師范學(xué)院物理學(xué)院,吉林 通化 134002;2.國(guó)家知識(shí)產(chǎn)權(quán)局專利局專利審查協(xié)作天津中心,天津 300304)
針對(duì)人臉識(shí)別中采集到的圖像由于受光照、表情變化、臉部部分遮擋等因素影響而導(dǎo)致識(shí)別率低的問題,將Gabor小波多尺度、多方向的濾波特性和主成分分析(PCA)的降維特性相結(jié)合,提出一種對(duì)臉部整體特征進(jìn)行提取的GPCA算法.通過將該算法應(yīng)用于ORL人臉庫(kù)、Yale人臉庫(kù)和AR人臉庫(kù)中的人臉識(shí)別,證明了該方法的有效性.
人臉識(shí)別;Gabor小波;PCA;GPCA
人臉識(shí)別作為生物特征識(shí)別技術(shù)(指紋識(shí)別、掌紋識(shí)別、語音識(shí)別、虹膜識(shí)別等)之一,以其可采集性高、易于接受等特點(diǎn)被廣泛應(yīng)用于國(guó)家安防、身份鑒定和人機(jī)交互等系統(tǒng)中[1-2].
20世紀(jì)90年代以來,人臉識(shí)別技術(shù)迅速發(fā)展,涌現(xiàn)了一批人臉識(shí)別代表算法和可供評(píng)測(cè)的標(biāo)準(zhǔn)人臉庫(kù).這些識(shí)別算法大致可分為兩類[1,3]:
(1) 基于幾何特征的識(shí)別方法.其基本思想是提取人臉面部的關(guān)鍵部位如眉毛、眼睛、鼻子、嘴巴等形狀和幾何關(guān)系作為特征進(jìn)行識(shí)別[4].
(2) 基于代數(shù)特征的識(shí)別方法.將人臉看成一個(gè)整體,即一幅灰度圖像可以視為二維模式,通過數(shù)學(xué)上的統(tǒng)計(jì)方法找到最佳匹配.
其中比較典型的算法有基于特征臉的PCA方法、基于Fisher臉的線性判別分析(LDA)方法以及獨(dú)立元分析(ICA)方法等.
PCA方法是人臉識(shí)別中最基本也是最常見的方法,目前很多的人臉識(shí)別算法都是對(duì)這種方法的改進(jìn)或與其他方法的綜合.在人臉識(shí)別過程中,這種方法考慮的是樣本整體特征,通過抽取人臉的主要成分,構(gòu)建特征臉空間,對(duì)比人臉圖像進(jìn)行識(shí)別.由于其降維和特征提取方面的有效性,在人臉識(shí)別領(lǐng)域得到廣泛應(yīng)用.
受采集人臉圖像時(shí)環(huán)境光照等因素影響,傳統(tǒng)的代數(shù)方法很難達(dá)到較高識(shí)別率[4-5].Gabor小波變換呈現(xiàn)為頻率和方向的多尺度變換,并且與人類視覺感受野剖面非常相似[2,6],因此Gabor濾波器被用于提取圖像局部紋理特征或?qū)φw圖像進(jìn)行卷積得到Gabor濾波后的圖像[7-10].將Gabor統(tǒng)計(jì)紋理特征用于人臉識(shí)別,可以很好地消除外界環(huán)境對(duì)識(shí)別正確率的影響,具有更強(qiáng)的魯棒性[4].本文將Gabor小波和PCA方法結(jié)合起來,對(duì)人臉圖像進(jìn)行一組Gabor小波卷積,然后通過PCA降維,完成人臉識(shí)別過程.
1946年,Gabor提出了一維的Gabor函數(shù),此后為了進(jìn)一步描述哺乳動(dòng)物視覺神經(jīng)元感受野,Dogmas于20世紀(jì)80年代提出了一組具有不同參數(shù)的2D Gabor 濾波器[10],這組濾波器從頻率和方向更接近人類視覺感受野[1].Gabor小波能夠很好地解決由于光照強(qiáng)度和人臉表情等變化引起的圖像問題,因此在人臉識(shí)別領(lǐng)域獲得了廣泛的應(yīng)用.
2D Gabor小波定義為
(1)
其中:μ和ν分別表示Gabor濾波器的方向和尺度;z=(x,y)為圖像某一像素點(diǎn)坐標(biāo);‖·‖表示范數(shù)[14];σ為高斯包絡(luò);kμ,ν控制高斯窗的寬度、震蕩部分波長(zhǎng)以及方向,定義為
kμ,ν=kνeiφμ.
(2)
其中:kν=kmax/fυ為濾波器采樣頻率,kmax為最大頻率,fυ為限制頻域中核函數(shù)距離的間隔因子.
在圖像處理中,圖像的Gabor小波表達(dá)方法為某一圖像與公式(1)定義的Gabor核的卷積,表示為
Iμ,ν(z)=I(z)×Ψμ,ν(z).
(3)
其中:Iμ,ν(z)表示卷積后的結(jié)果;I(z)表示原圖像;Ψμ,ν(z)表示Gabor核幅值特性.為了使Gabor變換包含不同頻率、方向的信息,定義Iγ為特征矢量,那么原圖像與Gabor核卷積后的矢量可以表示為
Iγ=((I0,0)T(I0,1)T…(I4,7)T)T.
(4)
對(duì)5個(gè)不同尺度和8個(gè)方向Gabor核幅值變化與圖像分別卷積,得到40個(gè)不同參數(shù)的Gabor小波圖像,將這40個(gè)矢量通過公式(4)組合成新的矢量,然后進(jìn)行PCA降維[8].圖像與Gabor小波幅值特性卷積結(jié)果見圖2.
圖1 Gabor核幅值部分
圖2 原圖像與Gabor小波幅值卷積結(jié)果
PCA方法是統(tǒng)計(jì)學(xué)中一個(gè)重要的分析理論,也是被廣泛使用的人臉識(shí)別方法之一[9].其方法主要是通過對(duì)協(xié)方差矩陣進(jìn)行特征分解[12],以得到數(shù)據(jù)的主成分(即特征向量)與它們的權(quán)值(即特征值).將高維人臉圖像經(jīng)過PCA變換投影到特征子空間,使得數(shù)據(jù)在一個(gè)低維的特征空間里被處理,減少數(shù)據(jù)冗余的同時(shí)保留原始數(shù)據(jù)的絕大部分信息,解決了數(shù)據(jù)空間維數(shù)過高所產(chǎn)生的計(jì)算復(fù)雜度等問題[13].
將原始二維圖像表示為一維矩陣的形式,即M個(gè)N階矩陣(N為原圖像的行乘以列),具體可以表示為:
xi=[p1…pN]T,i=1,…,M.
(5)
其中:M表示圖像個(gè)數(shù),xi表示一維矩陣,pj表示某一像素點(diǎn)的值.運(yùn)用PCA進(jìn)行人臉識(shí)別可以分為訓(xùn)練和識(shí)別過程,訓(xùn)練過程流程圖如圖3所示.圖3中:Ωi=wTdi(i=1,2,…,r),w=(u1,u2,…,ur),r為特征值個(gè)數(shù)(降維后維數(shù));A=(d1,d2,……,dM).
測(cè)試過程中,按照訓(xùn)練步驟將待識(shí)別圖像投影到特征臉空間,并按照歐氏距離判別特征空間中待識(shí)別樣本與訓(xùn)練樣本的相似度.
GPCA人臉識(shí)別算法是將每幅人臉圖像分別進(jìn)行5個(gè)尺度、8個(gè)方向的Gabor小波變換,即假設(shè)人臉圖像可以表示為m×n維矩陣,那么對(duì)于一幅圖像與40個(gè)Gabor幅值卷積的結(jié)果可以表示為一個(gè)m×n行40列的二維矩陣,將得到的矩陣當(dāng)作PCA的輸入,并按照PCA訓(xùn)練識(shí)別過程進(jìn)行識(shí)別.本文選用ORL,Yale和AR 3個(gè)人臉庫(kù)樣本進(jìn)行算法測(cè)試.GPCA算法流程圖如圖4所示.
圖3 PCA訓(xùn)練流程
圖4 GPCA算法流程圖
本文基于OpenCV視覺庫(kù)采用C++編程,對(duì)ORL人臉庫(kù)(光照不變,姿態(tài)表情變化)、Yale人臉庫(kù)(光照、姿態(tài)、表情都變化)和AR人臉庫(kù)(表情、光照、姿態(tài)變化以及有遮擋、有老化)分別進(jìn)行了PCA和GPCA算法的人臉識(shí)別.ORL庫(kù)選用200個(gè)訓(xùn)練樣本和200個(gè)測(cè)試樣本,Yale庫(kù)選用90個(gè)訓(xùn)練樣本和75個(gè)測(cè)試樣本,AR庫(kù)選用280個(gè)訓(xùn)練樣本和280個(gè)測(cè)試樣本分別進(jìn)行識(shí)別.識(shí)別結(jié)果如圖5所示.
圖5 3種方法識(shí)別結(jié)果
從實(shí)驗(yàn)結(jié)果可以看出,GPCA在特征維數(shù)為1的時(shí)候識(shí)別率低于PCA,但是隨著特征維數(shù)增大GPCA的識(shí)別率已經(jīng)明顯好于PCA算法.可見,人臉識(shí)別中GPCA比PCA更有優(yōu)勢(shì).
[1] 崔茜. 基于Gabor小波和主成分分析的人臉識(shí)別算法研究 [D]. 長(zhǎng)春:東北師范大學(xué),2014.
[2] SHEN LINLIN,BAI LI. Gabor feature based face recognition using kernel methods [C]//Proceedings of the Sixth IEEE International Conference on Automatic Face and Gesture Recognition,Seoul Korea:Browse Conference Publications,2004:170-176.
[3] JIAN HUANG LAI,YUEN P C,GUO CAN FENG. Face recognition using holistic fourier invariant features [J]. Pattern Recognition,2001,34:95-109.
[4] 余磊. Gabor小波變換在人臉識(shí)別中的應(yīng)用研究[D]. 重慶:重慶大學(xué),2009.
[5] 曾岳. 人臉識(shí)別方法的研究[D].西安:西安電子科技大學(xué),2011.
[6] LEE T S. Image representation using 2D gabor wavelets [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1996,18(10):959-971.
[7] LADES MARTIN,VORBRUGGEN J C,JOACHIM M BUHMANN,et al. Distortion invariant object recognition in the dynamic link architecture [J]. IEEE Transactions on Computers,1993,42:300-311.
[8] WU HAIYUAN,YOSHIDA YUKIO,SHIOYAMA TADAYOSHI. Optimal gabor filters for high speed face identification [J]. Proc of Int Conf on Pattern Recognition,2002(1):107-110.
[9] NEEHARIKA GUDUR,VIJAYAN ASARI. Gabor wavelet based modular PCA approach for expression and illumination invariant face recognition [C]//35thApplied Imagery and Pattern Recognition Workshop IEEE,USA:Washington DC Publications,2006:11-13.
[10] LIU CHENGJUN,WECHSLER HARRY. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. IEEE Trans. Image Processing,2002,11(4):467-476.
[11] DAUGMAN J G. Two-dimensional spectral analysis of cortical receptive field profile [J]. Vision Research,1980,20:847-856.
[12] ABDI H,WILLIAMS L J. Principal component analysis [J]. Wiley Interdisciplinary Reviews:Computational Statistics,2010,2(4):433-459.
[13] 李文革. 基于主成分分析的人臉識(shí)別[D]. 濟(jì)南:山東大學(xué),2008.
[14] 任芳國(guó),高瑩. 隨機(jī)矩陣的范數(shù)[J]. 東北師大學(xué)報(bào):自然科學(xué)版,2012,44(1):28-29.
(責(zé)任編輯:石紹慶)
Face recognition of the Gabor wavelets and PCA
CHEN Hai-xia1,CUI Qian2
(1.College of Physics,Tonghua Normal University,Tonghua 134000,China;2.Patent Examination Cooperation Tianjin Center of the Patent Office,SIPO,Tianjin 300304,China)
Aiming at the problems that face recognition rate gets low because of the influence of light conditions,facial expression and partial occlusion during face images acquisition,a method (GPCA) combining the multi-scale and multi-direction characteristic of the Gabor wavelet filters with the dimension reduction characteristic of the Principal Component Analysis (PCA) is proposed to extract the global facial features for recognition. The effectiveness of the method is proven by being applied to recognize faces from ORL,Yale and OR databases.
face recognition;Gabor wavelets;PCA;GPCA
1000-1832(2014)04-0077-04
10.11672/dbsdzk2014-04-014
2014-06-18
吉林省科技發(fā)展重點(diǎn)支持項(xiàng)目(20100458).
陳海霞(1974—),女,副教授,主要從事模式識(shí)別與信號(hào)檢測(cè)領(lǐng)域的理論與應(yīng)用研究.
TP 391.1 [學(xué)科代碼] 520·6040
A