劉麗娜
(山東理工大學電氣與電子工程學院,山東 淄博 255049)
計算機人臉識別是由計算機分析人臉圖像,從人臉圖像中提取出有效的識別信息,用來“辨認”身份的一門技術(shù).通常識別處理后可得到包括人臉的位置、尺度和姿態(tài)基本等信息.利用特征提取技術(shù)還可進一步抽取出更多的生物特征(如:種族、性別、年齡…).人臉識別技術(shù)有著廣泛的應用背景,可以應用于公安系統(tǒng)的罪犯身份識別、駕駛執(zhí)照及護照等證件照片與實際持證人的核對、銀行及海關(guān)的監(jiān)控系統(tǒng)以及一些保密單位的自動門衛(wèi)系統(tǒng)等.
本文在基于PCA的人臉識別方法的基礎(chǔ)上對其進行了改進,采用基于多特征的模糊加權(quán)識別算法進行分類.所謂多特征的模糊加權(quán)識別算法即將Eigenface,Eigenupper,EigenTzone以及二階特征臉法四種方法的初步識別結(jié)果先模糊化,然后用模糊綜合函數(shù)加權(quán)組合后獲取新的距離函數(shù)進行人臉識別.EigenUpper、EigenTzone的采用將能補償Eigenfaces在表情、光照方面的魯棒性,二階特征臉將突出細節(jié)特征在人臉識別中的作用.針對Yale和ORL數(shù)據(jù)庫的實驗結(jié)果證明了該方法明顯優(yōu)于傳統(tǒng)特征臉識別方法,值得重視.
1987年Sirovich和Kirby為減少人臉圖像的表示采用了PCA(Principal Component Analysis)方法,即主成分分析方法.1991年Matthew Turk and Alex Pentland最早將PCA應用于人臉識別[1].PCA(Karhunen-Loeve變換)的主要思想是在原始人臉空間中求得一組正交向量,并以此構(gòu)成新的人臉空間,使所有人臉的均方差最小,達到降維目的.
假設(shè)一幅人臉圖像包含N個象素點,它可以用一個N維向量Γ表示.這樣,訓練樣本庫就可以用{Γi|i=1,…,M}表示.然后求取M幅人臉圖像的平均人臉圖像(即平均臉),進而得到每張人臉圖像 Γi相對平均臉 Ψ的均差Φ,并構(gòu)造訓練樣本集的協(xié)方差矩陣C.協(xié)方差矩陣C的正交特征向量就是組成人臉空間的基向量,即特征臉.把特征向量按特征值從大到小的順序排列,提取前M′個向量形成向量空間,即人臉空間.
對于一新的人臉圖像 Γ,將其投影到人臉空間得向量Ψ;將每個人的圖像Γk投影到人臉空間得到M維投影向量Ψk.求出 Ψ到每一類的距離:
其中Nc為人臉圖像的類別數(shù).
然后,采用最小距離法進行分類.
特征臉方法只考慮了人臉的整體特征,圖像中的每個象素點被賦予了同等重要的地位,因而它忽略了人臉的局部特征(如:眉毛、眼睛、鼻子、口等),識別中識別率不高.將整體特征與局部特征結(jié)合起來是特征臉法的一種改進方法.文獻[2]采用基于多特征組合和支持向量機的實時人臉鑒定方法,取得了較好的效果,文獻[3]提出了一種融合兩種主成分分析的人臉識別方法,在進行融合時用到了模糊的概念效果也不錯.本文將EigenUpper、EigenTzone、Eigenfaces以及二階特征臉法四種方法進行模糊加權(quán)組合.EigenUpper、EigenTzone法詳細請參考文獻[4].在Yale和ORL數(shù)據(jù)庫上的識別實驗結(jié)果表明它比單純使用Eigenfaces效果要好的多.
(1)Eigenfaces 采用文獻[1]的特征臉方法.
(2)EigenUpper 根據(jù)心理學和生理學的研究成果,在識別中人臉的上半部特征比下半部特征起的作用要大.因此實驗時提取人臉的上半部分,嘴所在的下半部分區(qū)域去掉,作PCA分析.實驗中部分EigenUpper如圖1所示.
圖1 實驗中部分EigenUpper
(3)EigenTzone 在人臉檢測中人眼的定位很重要,鼻子在人臉圖像中通常是個亮點.因此將人臉的Tzone分割出來,作特征臉分析.Tzone的分割,采用灰度投影圖方法.首先通過實驗選擇合適的閾值將原始圖像進行二值化;然后得到二值化圖像的水平投影圖和垂直投影圖;如圖2所示,依據(jù)投影圖可以確定眉毛、嘴巴以及人臉左右邊界的粗略位置;最后根據(jù)各特征點的位置確定Tzone.同樣的作PCA分析.實驗中部分EigenTzone如圖3所示.
圖2 二值化圖像的水平投影和垂直投影圖
圖3 實驗中部分EigenTzone
(4)二階特征臉法 特征臉方法在一定條件下可以有效的識別人臉,但是在某些條件下特征臉不能滿足人們對正確識別率的要求.比如:光照變化較大的情況下,特征臉中的主成分(即對應較大特征值的特征臉)主要反映的是人臉圖像中的光照變化.在這種情況下,特征臉不能有效的表示人臉圖像的身份特征信息,這將大大影響這些特征的識別效果.為了解決此問題,Wang和Tang[5]提出了二階特征臉方法,該方法通過丟棄傳統(tǒng)特征臉方法得到的前數(shù)個反應光照信息的特征臉來克服光照干擾的影響.該方法不僅采用原始人臉圖像的特征臉,還采用人臉圖像余像的特征臉——二階特征臉,所謂余像是指原始人臉圖像與基于特征臉的主成分重構(gòu)的人臉圖像的差.人臉余像空間的建立過程,請見文獻[5].
將每個人的余像Γ′i投影到人臉余像空間得M維投影向量Ψ′k.對于一新的人臉圖像 Γ,將其投影到人臉空間和人臉余像空間得向量Ψ和Ψ′.定義新的距離函數(shù)
其中,α1和α2為權(quán)重系數(shù),分別反映了一階和二階特征臉的重要程度.則輸入圖像就可按最小距離法進行分類.
在對測試樣本用上述四種方法進行初步分類后,用Zadeh提出的著名模糊集合論把識別結(jié)果模糊化,本文中的距離函數(shù)反映隸屬度的含義,在上述各種識別中,如果初步把測試樣本判為第k類是正確的話,則修改它們之間的距離為極小值,使測試樣本屬于第k類的隸屬度最大為1.0;如果是錯誤的,則修改它們之間的距離為極大值,使測試樣本屬于第k類的隸屬度最小為0.0.這樣就可以得到四組“模糊”的識別結(jié)果.然后采用模糊綜合函數(shù)將四組“模糊”識別結(jié)果進行融合,模糊綜合函數(shù)取算術(shù)平均值,即
最終依據(jù)融合所得的距離結(jié)果按最小距離法獲取識別結(jié)果.
由于ORL人臉數(shù)據(jù)庫是目前應用最廣泛的人臉識別數(shù)據(jù)庫,其結(jié)果可比性較強.另外,它的顯著特點是無需對人臉圖像進行檢測定位和尺寸歸一化等處理.為了檢驗本文所提出的識別算法的正確性和有效性,選擇ORL數(shù)據(jù)庫中的20人每人5幅作為訓練樣本,該20人的其他100幅圖像作為測試樣本,并將二者的識別結(jié)果進行比較.為了進一步突出模糊加權(quán)識別算法的優(yōu)越性,將其與一般的平均加權(quán)法進行對比.上述實驗的識別結(jié)果見表1.
其中,選取的特征向量數(shù)目為42,該數(shù)據(jù)是通過實驗和相關(guān)經(jīng)驗公式確定的前M′個最大特征向量[6].在二階特征臉法的識別實驗中,α1和α2為權(quán)重系數(shù)選擇為0.6和0.4,亦是通過實驗和相關(guān)經(jīng)驗確定的[6].
表1 正確識別率 %
各種識別方法的識別結(jié)果表明多特征模糊加權(quán)人臉識別算法要明顯優(yōu)于傳統(tǒng)特征臉方法,且比多特征平均加權(quán)人臉識別算法要好一些.
采用的基于多特征的模糊加權(quán)人臉識別算法簡單有效,計算量較小、耗時不多.多特征的識別方法補償了特征臉在表情、光照方面的不足,同時考慮了眼睛、鼻子在識別中的作用,達到了整體與局部特征相結(jié)合的目的.
本文所采用的ORL數(shù)據(jù)庫為小型人臉庫,如能采用更多更大的人臉數(shù)據(jù)庫,增加訓練樣本的數(shù)量,將會進一步體現(xiàn)本文所提出方案的優(yōu)越性.
[1]Matthew A T,Alex P P.Vision and modeling group,the modelinglaborato ry.FaceRecognitionUsingEigenfaces[J].CH2983-5/91/1991 IEEE,586-591.
[2]Kim D H,Lee J Y,Soh J,Chung Y K.Real-time face verification using multiple feature combination and a support vector machine supervisor[J].0-7803-7663-32003 IEEE.145-148.
[3]徐倩,鄧偉.一種融合兩種主成分分析的人臉識別方法[J].計算機工程與應用.2007,43(35):195-197.
[4]劉麗娜,喬誼正.基于多特征的人臉識別[J].中國科學技術(shù)大學學報(自動化專輯).2005,35:131-136.
[5]Wang L,Tan T K.Experimental results of face feature description based on the 2nd 2order eigenface method[R].ISO/IEC/JTC1/SC21/WG11/M6001,Geneva,2000.
[6]劉麗娜.基于特征臉和多特征的人臉識別算法研究[D].濟南:山東大學控制科學與工程學院,2006.