侯建華,牟海軍,羅 艷,江小平
(中南民族大學(xué) 電子信息工程學(xué)院,武漢 430074)
隨著科學(xué)技術(shù)的迅猛發(fā)展, 生物特征識別已經(jīng)成為了安全驗證的主要方式,主要是指利用人體的生理特征和行為特征來進行身份的鑒定,包括指紋、人臉、虹膜、筆跡、步態(tài)、語音等[1].而在這些眾多的生物特征識別當(dāng)中,人臉識別一直是生物識別領(lǐng)域的研究熱點,是一種重要的生物特征識別技術(shù),在自動化身份識別中變得越加的重要[2-4].而所謂的人臉識別,即就是通過已有的若干已知身份的人臉數(shù)據(jù)庫,驗證和鑒別給定場景下靜態(tài)圖像或視頻中單個或多個人的身份[5].因其具有使用方便、不易仿冒、操作簡單、不具侵犯性、直接、友好等優(yōu)越性,使其在公司考勤、刑事偵查、出入境關(guān)口管理、機場檢查等領(lǐng)域具有廣泛的應(yīng)用前景.
經(jīng)過數(shù)十年的研究,人臉識別在約束環(huán)境下(如人臉表情及姿態(tài)確定、無遮擋、光照條件適宜等)取得了巨大的成功[6],主要包括線性鑒別分析(LDA)、主成分分析(PCA)、獨立分量分析(ICA)等.線性鑒別分析[7]以樣本可分性為目標使得樣本類間離散度與類內(nèi)離散度比值最大,但在小樣本情況下不足以描述人臉變化;主成分分析[8,9]方法通過線性變換找到在最小均方意義下最能代表原始人臉圖像的正交基,使得圖像數(shù)據(jù)從高維空間降維到低維空間,不僅能夠有效表征原始人臉,而且大大降低了計算復(fù)雜度; 獨立成分分析[10]方法是基于所有階統(tǒng)計意義下的去相關(guān),它的計算復(fù)雜度要高于主成分分析方法,且在識別率上沒有優(yōu)勢.但是在非約束環(huán)境下,由于光照條件、遮擋[11]、表情姿態(tài)、所處環(huán)境等因素的影響,使得人臉圖像特征空間變得更加的復(fù)雜,進而嚴重影響了傳統(tǒng)算法的識別精度,造成識別困難.
傳統(tǒng)的降維方法都是將二維圖像轉(zhuǎn)換為一維向量后再尋找最優(yōu)投影矩陣,然而由于轉(zhuǎn)換后的一維向量維數(shù)很高而樣本數(shù)少,使得求解協(xié)方差矩陣的特征值和特征向量很困難.在傳統(tǒng)算法的基礎(chǔ)上,文獻[12-16]提出了使用2DPCA和2DLDA提取人臉特征,其方法為通過直接對人臉圖像矩陣形式進行處理,得到了較好的識別效果.
W. Zhao等人將通過對靜止圖像進行的人臉識別劃分為基于全局信息、局部特征和綜合方法三種[17].采用全局特征進行人臉識別,是指靜止圖像中整個人臉區(qū)域作為人臉識別系統(tǒng)的初始輸入,采用全局特征進行人臉識別的方法中較為典型的就是特征臉和Fisher臉方法;基于局部特征的識別方法是將顯著器官(如眼睛、鼻子、嘴)提取出來,然后根據(jù)提取出來的局部特征進行幾何分析或統(tǒng)計分析,并將其所得到的結(jié)果作為結(jié)構(gòu)化分類器的輸入;綜合方法的出現(xiàn)是由于基于全局特征的人臉表達對于光照、姿態(tài)、表情等因素的影響較為敏感,以及局部特征反映的是人臉圖像的局部區(qū)域,側(cè)重于提取人臉的細節(jié)特征,對于光照、表情、姿態(tài)和遮擋等變化不敏感,因此結(jié)合全局和局部特征信息[18]來識別人臉被越來越多的應(yīng)用到人臉識別中.通過全局和局部特征的融合,進一步加強了圖像的表征能力,這種方法相比于前兩種方法在人臉識別中具有更加優(yōu)越的性能.
基于以上分析,本文提出一種基于二維小波分解和融合多特征主元分析(MMP-2DPCA)的人臉識別方法.由于本文算法融合了人臉的全局特征和局部特征,使其對于人臉圖像的光照、表情、遮擋等因素不敏感,對于人臉具有更好的表達能力,從而使得識別結(jié)果大大優(yōu)于單獨使用全局特征或局部特征對人臉的識別效果,對人臉具有更好的表達和判別能力,大大的提高了識別率和魯棒性.
本文在ORL(Olivetti Research Laboratory)人臉數(shù)據(jù)庫上實驗,結(jié)果表明本文所提出的算法對于人臉具有更好的表達能力,同時也是一種穩(wěn)定、快速的特征提取和識別方法.
設(shè){Vi}給出了L2(R)的一個多分辨分析,Wi是Vi+1中Vi的補空間,則:
Vi+1=Vi+Wi,
(1)
其中:
(2)
任意給定的f(x,y)∈L2(R2),fN(x,y)是f(x,y)在空間VN中的投影.這時對fk(x,y)∈Vk與gk(x,y)∈Wk,則有:
fk+1(x,y)=fk(x,y)+gk(x,y),
(3)
而gk(x,y)∈Wk還可以進一步分解為:
(4)
(5)
記:
(6)
此時,分解算法為:
(7)
圖1是圖像分解的示意圖,其中的L表示低頻,H表示高頻,下標1,2分別表示一級或二級分解.在一個級別的分解的數(shù)據(jù)傳遞示意圖如圖2所示.
圖1 圖像的小波分解示意圖
圖2 小波分解數(shù)據(jù)流示意圖
小波變換的一個重要性質(zhì)就是它在頻域和時域都具有很好的局部化特征,同時提供了目標信號在各個頻率子段的信息,這種信息對于信號分類是非要有用的.但是如果我們直接對原圖降低數(shù)據(jù)量,僅僅考慮了時域信息,忽略掉了用于有效分類的頻域信息.
由于實驗中的原圖大小是112×96的灰度圖,如果在實驗中直接對原始人臉圖片進行處理,由于原始圖像較多的反映了面部的局部細節(jié)信息,其中包含了較多的光照、遮罩、旋轉(zhuǎn)扭曲和面部表情等局部細節(jié)信息,這些信息體現(xiàn)了模式類內(nèi)的變化,對人臉鑒別來說是不利的,同時如此大的數(shù)據(jù)量往往會耗費很長的處理時間.而二維小波分解具有快速、抗干擾、保持圖像的大量特征信息,同時對人臉面部表情變化的不敏感性.因此,首先使用二維小波分解對原始圖像進行預(yù)處理,既保留了面部的全局形狀信息,同時又淡化了局部細節(jié),也降低所需要處理的數(shù)據(jù)量,從而減少了處理時間.
圖3 二維小波分解
設(shè)u表示n維單位化的列向量,A為m×n的圖像矩陣,A投影到u上,則:
Y=Au,
(8)
即可得到一個m維列投影向量y,稱之為圖像A的投影特征向量,為了獲取到一個最優(yōu)投影軸,可以使用投影向量的總的散布矩陣,即投影特征向量的散布矩陣的跡.所以定義準則函數(shù):
J(u)=tr(Su),
(9)
其中Su是投影特征向量的散布矩陣,記為:
Su=E(y-Ey)(y-EY)T=
E[Au-E(Au)][Au-E(Au)]T=
E[(A-EA)u)][A-EA)u]T,
(10)
(10)式中,表示計算期望,因此有:
Ju=tr(Su)=uT[E(A-EA)]T(A-EA)]u,
(11)
(12)
我們進一步將所有的圖像中心化,則:
(13)
所以J(u)=tr(Su)簡化為:
J(u)=uTGu.
(14)
為使圖像矩陣在u上投影后得到的特征向量的分散程度最大,采用最大化該準則函數(shù)的單位向量,并將其稱之為最優(yōu)投影向量,其中圖像總體散布矩陣G的最大特征所對應(yīng)的單位特征向量對應(yīng)于最優(yōu)投影向量. 我們需要找一組滿足標準正交條件且極大化準則函數(shù)的最優(yōu)投影向量u1,u2,…,up,其中最優(yōu)投影向量組u1,u2,…,up是G的對應(yīng)于前p個最大特征值的正交特征向量. 令U=[u1,u2,…,up],U稱為最優(yōu)投影矩陣. 2DPCA特征提取過程為Y=Au,Y=[y1,y2,…,yp].
鑒于2DPCA在人臉特征提取方面的不足,本文提出一種新的MMP-2DPCA人臉識別方法,融合人臉的全局特征和局部特征來表征人臉,使得對于人臉具有更好的表達能力.但是如果直接對原始人臉采用MMP-2DPCA算法,不僅僅受到光照、姿態(tài)、表情等因素的影響,同時不可避免的需要大量的處理時間,所以在此首先對原始圖像進行二維小波分解,分解后的圖像既保留了面部的全局形狀信息,同時又淡化了局部細節(jié),較原始圖像所要處理的數(shù)據(jù)量也大大降低.
在本文的算法中,我們采用圖4的方法來進行全局特征和局部特征的融合.首先對原圖進行二維小波分解,將分解得到的低頻部分和從原圖中提取的人眼、嘴、鼻子進行預(yù)處理,之后按照如圖4所示的方法進行融合,其中I1為經(jīng)過二維小波分解的人臉部分,I2,I3,I4分別為眼睛、嘴、鼻子.
圖4 全局特征和局部特征的融合
對融合得到的新圖像采用2DPCA進行特征提取,最后采用混合馬氏距離[19]分類器進行分類識別.在酉空間內(nèi),樣本y與第i類的混合馬氏距離定義如下:
(15)
(16)
其中N,Ni,分別表示訓(xùn)練樣本總數(shù)與第i類的訓(xùn)練樣本數(shù),∑表示投影后,訓(xùn)練樣本的總體類內(nèi)協(xié)方差矩陣,δ為參數(shù),本文中當(dāng)δ取值在1/36~1/65之間時,本文算法能夠取得最佳識別率95.5 %.
本文的實驗數(shù)據(jù)取自英國劍橋大學(xué)Olivetti研究所制作的ORL人臉數(shù)據(jù)庫.該數(shù)據(jù)庫由40個不同人、每人10幅、共400幅圖像組成.這些人的圖像是在不同時間、不同視角、不同表情和不同臉節(jié)的條件下拍攝的.每幅原始圖像有256個灰度級,大小為112×96.實驗時,使用每人前5幅圖像作為訓(xùn)練樣本,后5幅圖像作為測試樣本.圖5給出了ORL人臉庫中隨機抽取的一個人的人臉圖像.
圖5 ORL人臉庫
為了驗證本文所提算法的有效性,分下列三種情況進行研究.
(1)基于局部特征的識別——直接對從原始人臉圖像中提取眼睛、鼻子和嘴,將提取的這三個局部特征采用本文所提出的融合方法進行融合,進行基于局部特征的人臉識別.表1給出了各算法的最佳識別率對應(yīng)的處理時間(整個人臉庫上進行訓(xùn)練和分類的時間).
表1 采用局部特征的識別率
(2)基于全局特征的識別——對原始人臉圖像和經(jīng)過二維小波分解后的低頻部分分別采用傳統(tǒng)的PCA、2DPCA方法,表2給出了各算法的最佳識別率對應(yīng)的處理時間(整個人臉庫上進行訓(xùn)練和分類的時間).
表2 未進行小波分解(上)和進行小波分解(下)的識別率
(3)基于本文算法的識別——分別采用原始人臉圖像和經(jīng)過二維小波分解得到的低頻部分作為融合的全局特征,與從原始人臉圖像中提取的眼睛、鼻子、嘴的局部特征進行本文所提算法的融合,表3給出了各算法的最佳識別率對應(yīng)的處理時間(整個人臉庫上進行訓(xùn)練和分類的時間).
表3 未進行小波分解(上)和進行小波分解(下)的識別率
表1為基于局部特征方法采用PCA和2DPCA算法的人臉識別結(jié)果;表2為基于全局特征采用PCA、2DPCA算法的人臉識別結(jié)果;表3為采用本文算法的人臉識別結(jié)果.對比基于局部特征、全局特征和本文算法的實驗結(jié)果可知,采用融合全局特征和局部特征的人臉識別方法,其識別率顯然要高于單獨采用全局特征或局部特征方法的識別率.
從結(jié)果可以看出,直接對原圖采用MMP-2DPCA算法相對于采用PCA和2DPCA算法雖然識別率得到了一定的提高,但是卻大大的增加了處理時間.經(jīng)過二維小波分解后雖然直接采用PCA和2DPCA算法耗時少,但是識別率卻較低.而經(jīng)過二維小波分解后采用MMP-2DPCA算法識別率得到了顯著的提高,同時和直接采用原圖進行MMP-2DPCA算法相比,采用本文提出的算法不僅僅大大的減少了計算時間,同時識別率也得到的顯著的提高.
本文提出了一種MMP-2DPCA人臉識別算法.該算法首先對原始人臉圖像進行二維小波分解,大大降低了原始圖像的數(shù)據(jù)處理量,進而提高了運行速度,然后對分解得到的圖像和從原始圖像中提取得到的眼睛、鼻子、嘴局部特征進行融合,接著采用2DPCA方法對融合圖像進行特征提取,最后采用混合馬氏距離進行分類識別.在ORL人臉庫上的實驗結(jié)果表明,本文所提算法與傳統(tǒng)的2DPCA算法相比,識別率有著顯著的提高的,顯示了本文所提算法的有效性.
本文的算法主要是基于二維圖像的處理,今后的研究會考慮更多維的特征獲取,以提高對于人臉的表達能力,增強魯棒性.同時也會采用更大的人臉庫進行試驗,進而提高系統(tǒng)的推廣性.
[1] Jain A K,Bolle R,Pankanti S. Biometris: personal identification in networked society[M]. Norwell,USA;Kluwer Academic Publishers,1990.
[2] Clarke R.Human identification in information systems:management challenges and public policy issues[J]. Information Technology & People,1994,7(4):6-37.
[3] Davies S G.ouching big brother:how biometric technology will fuse flesh and machine[J].Information Technology & People,1994,7(4):60-69.
[4] Newham E.The biometric report[R].New York:SJB Services,1995.
[5] Li Stan Z,Jain A. Handbook of face recognition[M].Berlin:Springer,2005.
[6] Zhao W,Chellappa R,Rosenfeld A,et al.Face recognition: a literature survey[J].ACM Computing Surveys,2003,35(4):339-485.
[7] Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfaces vs.fisherface: recogniton using class special linear projection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7): 711-720.
[8] Kirby M,Sirovich L. Application of the Karhunen-Loève procedure for the characterization of human faces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(1): 103-108.
[9] Turk M,Pentland A. Eigenfaces for recognition[J]. Journal of Cognitive Neuroscience,1991,3(1): 71-86.
[10] Bartlett M S,Lades H M,Sejnowski T J. Independent component representations for face recognition[J]. Proceedings of SPIE,1998,3299(3): 528-539.
[11] Wang Zhiming,Tao Jianhua.Face occlusion detection and reconstruction[J].Journal of Computer Reserarch and Development,2010,47(1):16-22.
[12] Yang J,Zhang D,F(xiàn)rangi A.Two-dimensional PCA: a new approach to appearance-based face representation and recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004:131-137.
[13] Li M.Yuan B.2d-Lda:a statistical linear discriminant analysis for image matrix[J].Pattern Recognition Letters,2005,26(5):527-532.
[14] Qi Y,Zhang J.(2D)2PCALDA:an efficient approach for face recognition[J].Applied Mathematics and Computation,2009,213(1):l-7.
[15] Cevikalp H,Yavuz H,Cay M,et al.Two-dimensional subspace classifiers for face recognition[J].Neurocomputing,2009,72(4-6):llll-1120.
[16] Du H Sh.Chai X L.Wang F Q,et al.Face recognition using a fusion method based on bidirectional 2DLDA[J].Chinese Journal of Scientific Instrument,2009,30(9):1880-1885.
[17] Zhao W,Chellappa R,Phillips P J,et al. Face recognition: A literature survey[J]. ACM Computing Surveys (CSUR),2003,35(4). 399-458.
[18] Su Guangda,Zhang Cuiping,Ding Rong,et al. MMP-PCA face recognition method [J].Electronics Letters,2002,38 (25):1654-1656.
[19] Lawrence S,Yianilos P,Cox I. Face recognition using mixture-distance and raw images[C]//IEEE.IEEE International Conference Systems,Man and Cybernetics.Orlando:IEEE,1997:2016-2021.