甘俊英,李高尚
摘 要:利用離散小波變換對人臉圖像進行壓縮,提取人臉的低頻分量,有效去除人臉圖像高頻分量的影響;再利用二維主元分析對小波變換后的人臉低頻分量實行提取特征;然后使用核主元分析再次提取特征;最后用最小距離分類器完成人臉識別。基于ORL人臉數據庫的實驗結果表明,該算法能提高人臉識別率,有效減少計算量和降低計算復雜度。
關鍵詞:小波變換;2DPCA算法;KPCA算法;人臉識別
中圖分類號:TP391.41文獻標識碼:B
文章編號:1004-373X(2009)20-051-03
Face Recognition Based on DWT,2DPCA and KPCA
GAN Junying,LI Gaoshang
(School of Information,Wuyi University,Jiangmen,529020,China)
Abstract:In this paper,human face image is compressed and low-frequency component is extracted by way of Discrete Wavelet Transform (DWT).In this way,the influence of high-frequency component of human face image is discarded effectively.Then the features of low-frequency component are extracted by way of two dimensional principal component analysis (2DPCA).In the mean time,Kernel Principal Component Analysis (KPCA) is applied in feature extraction.Finally face recognition is performed by the Nearest Neighbor classifier.Experimental results on Olivetti Research Laboratory(ORL)face database show that face recognition rate is increased,amount of computation and the complexity are reduced.
Keywords:wavelet transform;2DPCA algorithm;KPCA algorithm;face recognition
0 引 言
近年來,人臉識別技術得到了很大發(fā)展,許多優(yōu)秀的方法和算法相繼被提出[1,2]。小波變換(Wavelet Transform,WT)是一種基于多層次函數分解的數學工具[3-5]。人臉圖像經過小波變換后,可分解成近似分量與細節(jié)分量。近似分量代表信號的低頻分量,細節(jié)分量代表信號的高頻分量。近似分量保留圖像的基本信息,噪聲分量或變化比較快的分量,其主要能量一般集中在細節(jié)分量中。Nastar等研究了人臉外觀變化與頻譜變化之間的關系,指出人臉的光照、旋轉扭曲和面部表情只影響圖像中的高頻分量,人臉圖像的低頻分量仍然保持穩(wěn)定。因此,采用小波變換后僅保留近似分量,可有效克服光照、姿態(tài)和表情變化對人臉識別率的影響。
2004年Jian Yang等人提出二維主元分析(Two-dimensional Principal Component Analysis,2DPCA),并將該算法應用于人臉識別[6]。2DPCA算法是以人臉樣本的二維灰度圖像矩陣計算樣本的總體離散度的,所以它有效降低了待識別圖像的維數。Jian Yang等的實驗結果表明,2DPCA算法的識別率和計算時間均優(yōu)于主元分析(Principal Component Analysis,PCA)算法。
核主元分析(Kernel Principal Component Analysis,KPCA)能有效捕捉數據的非線性特征,因此在模式識別、回歸分析等領域均受到廣泛重視。KPCA是基于輸入數據的高階統計,描述了多個像素間的相關性,所以該方法在圖像特征提取上能取得較好的效果。Moghaddam比較了幾種子空間方法,認為KPCA優(yōu)于PCA方法,因為它考慮了圖像的非線性特性[7,8]。
基于以上分析,為了使提取的特征對光照、姿態(tài)、表情變化的人臉圖像有較好的魯棒性,在此提出一種基于小波變換、2DPCA和KPCA相結合的人臉識別方法?;贠RL(Olivetti Research Laboratory)人臉數據庫的實驗結果表明,該算法能提高人臉識別率、減少計算量和降低計算復雜度。
1 人臉識別模型
人臉識別模型如圖1所示。首先,運用小波變換獲得人臉圖像的低頻分量,然后經過2DPCA,將提取的特征通過KPCA,解決人臉非線性特征的可分性問題;最后采用最近鄰分類器來完成識別。下面對該模型進行詳細探討。
圖1 人臉識別算法模型
1.1 小波變換
小波變換是將基本小波的函數做位移后,在不同尺度下與待分析的信號f(x)做內積。在圖像處理中常用的是二值尺度的二維離散小波變換(Discrete Wavelet Transform,DWT)。尺寸為M×N的函數f(x,y),其二維離散小波變換可表示為:
Wφ (j0 ,m,n) = 1MN∑M-1x = 0 ∑N-1y = 0f(x,y)φj0 ,m,n (x,y)
Wiψ (j,m,n) = 1MN∑M-1x = 0 ∑N-1y = 0f(x,y)φj,m,n (x,y)
i = { H,V,D} (1)
式中:Wφ(j0,m,n)代表圖像的低頻子圖像;Wiψ (j,m,n);i={H,V,D}分別代表圖像水平、垂直和對角方向的高頻子圖像;每個子圖像的大小為原始子圖像的1/4。通常,令j0=0,選擇N=M=2J;j=0,1,2,…,J-1;m,n=0,1,2,…,2j-1,如圖2所示。
圖2 小波變換示意圖
1.2 2DPCA算法
2DPCA算法采用二維圖像數據矩陣直接構建一個協方差矩陣,求出此協方差矩陣的特征值和特征向量,并用較大幾個特征值對應的特征向量構建投影坐標系,然后將每個圖像矩陣投影到這個坐標系上,得到該圖像的特征矩陣。
設Ai為n×m維樣本圖像,其中,i=1,2,…,M;M為樣本圖像數,則樣本圖像的總體協方差矩陣為:
G=1M∑Mi=1(Ai-)Τ(Ai-)(2)
式中:G是一個n×n維的正定矩陣;為樣本圖像的均值圖像;=1M∑Mi=1Ai。求G的d(d 1.3 KPCA算法 基于核的主成分分析方法實際上是將核方法應用到主成分分析中,實現輸入空間Rn到特征空間F的映射,即輸入空間的樣本點xi變換為特征空間的樣本點Φ(xi),其中,i=1,2,…,M,KPCA的具體算法步驟如下:
(1) 設M個訓練樣本x1,x2,…,xM,其中,xi是k維列向量,經過非線性變換,分別對應于高維特征空間的Φ(x1),Φ(x2),…,Φ(xM)。
(2) 求協方差矩陣。設Q=[Φ(x1),Φ(x2),…,Φ(xM)],R=QTQ,Ri,j=QTiQj = k(xi,xj)。
(3) 對R中心化,即:
=R-1M?R-R?1M+1M?R?1M(3)
式中:1M=[1]M×M/M,[1]M×M是單位矩陣。
(4) 求的特征值λ1,λ2,…,λk,及其對應的特征向量γ1,γ2,…,γk。
(5) 由特征值和特征向量得:
αj=(1/λj)γj(4)
式中,j=1,2,…,k。
(6)樣本xi在特征空間F的映射是:
i={∑Mj=1α1j[Φ(xj)?Φ(xi)],∑Mj=1α2j[Φ(xj)?Φ(xi)],
…,∑Mj=1αkj[Φ(xj)?Φ(xi)]}T(5)
式中:i=1,2,…,M。
2 應用于人臉識別
2.1 ORL人臉數據庫
ORL(Olivetti Research Laboratory)人臉數據庫由40人,每人10幅圖像組成。其中,有些圖像拍攝于不同時期;人的臉部表情和臉部細節(jié)具有不同程度的變化,比如笑或不笑,眼睛或睜或閉,戴或不戴眼鏡;人臉姿態(tài)也有相當程度的變化,深度旋轉和平面旋轉可達20°;人臉的尺度變化多達10%。這些圖像的分辨率為112×92,灰度級為256,如圖3所示。
圖3 ORL人臉數據庫上的部分人臉圖像
2.2 實驗結果及分析
在ORL人臉數據庫上選取每人的前5幅作為訓練樣本,后5幅作為測試樣本。人臉圖像經一次小波變換后提取的低頻圖像分辨率為63×53,如圖4所示。
圖4 一次小波變換后ORL人臉庫上的部分人臉圖像
DWT-2DPCA-KPCA算法的實驗參數包括訓練樣本數、2DPCA投影維數、KPCA投影維數、以及KPCA核函數。本實驗選用多項式核函數K(x,xi)=[(x,xi)+1]2。實驗結果均在Pentium 4 1.5 GHz,128 MB計算機上運行獲得。
在DWT-2DPCA-KPCA算法實驗中,先選取KPCA的投影維數為40、訓練測試樣本數分別為5,2DPCA維數變化時的實驗結果如表1所示。這里,訓練時間定義為一個訓練樣本的人臉識別程序運行時間;識別時間定義為一個測試樣本的人臉識別程序運行時間;識別率定義為測試樣本中正確識別的樣本數與測試樣本數之比。從表1可知,訓練和測試時間大致隨2DPCA維數的增加而增加;當2DPCA的投影維數為2時,識別率最高為95.5%。
表1 DWT-2DPCA-KPCA算法識別率(一)
2DPCA維數訓練時間 /s識別時間 /s識別率 /%
10.165 3 0.161 5 88.00
20.177 9 0.181 8 95.50
30.177 4 0.174 9 94.50
40.181 9 0.175 9 94.00
50.189 5 0.201 7 93.50
60.233 1 0.217 1 93.00
70.254 6 0.242 3 93.00
80.218 5 0.217 4 92.00
90.245 5 0.251 1 91.50
當2DPCA的投影維數為2,訓練測試樣本數仍分別為5,以及KPCA維數變化時,實驗結果如表2所示。此時,訓練和測試時間大致隨KPCA維數的增加而增加;當KPCA的投影維數為50時,識別率達到最佳識別效果95.5%。
表3是綜合考慮了DWT-KPCA,DWT-KPCA,2DPCA,DWT-2DPCA和DWT-2DPCA-KPCA算法的實驗結果。其中,2DPCA投影維數為2,KPCA投影維數為50,訓練測試樣本數分別為5。在測試時間方面,DWT-2DPCA-KPCA算法比2DPCA算法和DWT-2DPCA算法所用時間長,但比KPCA 算法和DWT-KPCA算法時間短;在識別率方面, KPCA算法、DWT-PCA算法、2DPCA算法和DWT-2DPCA算法分別為86%,92.5%,93%,93.5%;DWT-2DPCA-KPCA算法為95.5%,比前面四種算法識別率均有所提高。
表2 DWT-2DPCA-KPCA算法識別率(二)
KPCA維數訓練時間 /s識別時間 /s識別率 /%
300.153 1 0.153 494.50
400.177 9 0.181 895.00
500.223 2 0.218 795.50
600.260 7 0.262 395.50
700.291 8 0.281 695.50
800.320 9 0.323 895.50
900.324 5 0.318 995.50
表3 ORL人臉數據庫上各算法比較
算法訓練時間 /s識別時間 /s識別率 /%
KPCA1.124 91.106 7 92.00
DWT-KPCA0.402 1 0.372 2 92.50
2DPCA0.094 0 0.093 8 93.00
DWT-2DPCA0.045 9 0.044 3 93.50
DWT-2DPCA-KPCA0.223 2 0.218 7 95.50
圖5表示各算法在不同訓練樣本數時的識別率。當樣本數在總樣本數的中間區(qū)間(4,5,6)時,DWT-2DPCA-KPCA算法比DWT-2DPCA算法、2DPCA算法、DWT-KPCA算法和KPCA算法的識別率高。
圖5 五種算法在不同訓練樣本數下的識別率
綜上所述,在訓練時間、測試時間和識別率方面,DWT-2DPCA-KPCA算法優(yōu)于其他幾種算法。
3 結 語
綜合了離散小波變換、二維主元分析和核主元分析的優(yōu)點,提出了一種利用三者相結合的特征提取方法,然后利用最小距離進行分類識別?;贠RL的人臉數據庫的實驗結果表明,該方法在識別率上高于KPCA,DWT-KPCA,2DPCA以及DWT-2DPCA算法;測試速度大于KPCA和DWT-KPCA。這里只對多項式核函數參數的選取進行了簡單分析和討論,在某一應用中如何選擇核函數與相應的核函數參數有待進一步研究。
參考文獻
[1]Samala,Iyengar P.Automatic Recognition and Analysis of Human Faces and Facial Expressions:A Survey[J].Pattern Recognition,1992,25(1):65-77.
[2]Zhao W,Chellappa R,Phillips P J,et al.Face Recognition:A Literature Survey[J].ACM Computing Surveys,2000,35(4):399-458.
[3]Nastar C,Ayache N.Frequency- based Non-rigid Motion Analysis[J].IEEE Trans.on PAMI,1996,18(11):1067-1 079.
[4]龍飛,莊連生,莊鎮(zhèn)泉.基于小波變換和Fisher判別分析的人臉識別方法[J].模式識別與人工智能,2005,18(2):223-227.
[5]甘俊英,李春芝.基于小波變換的二維獨立元在人臉識別中應用[J].系統仿真學報,2007,19(3):612-615.
[6]Jian Yang,David Zhang.Two-dimensional PCA:A New Approach to Appearance-based Face Representation and Recognition[J].IEEE Trans.on pattern Analysis and Machine Intelligence,2004,26(1):131-137.
[7]Moghaddam B.Principal Manifolds and Probabilistic Ubspaces for Visual Recognition[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2002,24(6):780-788.
[8]Roman Rosipal,Mark Girolami.Kernel PCA for Feature Extraction and De-noising in Non-linear Regression[J].Neural Computing & Applications,2001,10(3):231-243.