摘 要:主成成份分析(PCA)方法是人臉識別技術中常用的一種一維特征抽取方法。傳統(tǒng)PCA方法用于人臉識別常常面臨圖像維數(shù)高,直接計算量的問題。為了解決這2個問題,人們對PCA進行了改進,提出并實現(xiàn)了多種基于PCA的人臉識別。對3種基于PCA的人臉識別方法做了理論上的研究和實驗上的性能比較。實驗結果表明PCA+2DPCA是其中綜合效果最好的一種方法。
關鍵詞:PCA;人臉識別;2DPCA;PCA+2DPCA
中圖分類號:TP391.4 文獻標識碼:A
文章編號:1004-373X(2008)06-077-03
A Comparative Study on Face Recognition Based on PCA
QI Xingmin,LIU Guanmei
(Jiangxi Blue Sky University,Nanchang,330098,China)
Abstract:Principal Component Analysis(PCA) is a common feature extraction method based on 1D vector.But it often meets two problems as high dimensions and big computation quantity when applying to face recognition.In order to solve the two problems,many improved methods are proposed and realized.This paper compares three of them on theory and experimental data.The experimental results show that PCA+2DPCA is the best of them.
Keywords:PCA;face recognition;2DPCA;PCA+2DPCA
1 引 言
近些年來,人臉識別作為一門既有理論價值又有應用價值的研究課題,越來越受到研究者的重視和關注,各種各樣的人臉識別方法層出不窮。主成成份分析[1] (Principal Component Analysis,PCA)方法就是其中的一種。傳統(tǒng)主成成份分析方法的基本原理是[2]:利用K-L變換抽取人臉的主要成分,構成特征臉空間,識別時將測試圖像投影到此空間,得到一組投影系數(shù),通過與各個人臉圖像比較進行識別。這種方法使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力,但是在這種方法在處理人臉圖像時,要將二維圖像矩陣轉換成一維的列向量,使圖像的維數(shù)達到上萬維,計算工作量非常大,特征提取速度慢。
為了克服傳統(tǒng)PCA的不足,研究者們相繼提出了二維PCA(2DPCA)方法[3]、PCA+2DPCA[4]等一些方法。這些方法的提出不僅有效地解決了圖像處理的高維問題,而且大大提高了人臉的識別率。
2 基于PCA的人臉識別方法
2.1 PCA方法
對于一幅M×N的人臉圖像,將其每列相連構成一個大小為D=M×N維的列向量。D就是人臉圖像的維數(shù),也即是圖像空間的維數(shù)。設n是訓練樣本的數(shù)目;[WTHX]x[WTBX]j表示第j幅人臉圖像形成的人臉向量,則所需樣本的協(xié)方差矩陣為:
2.3 PCA+2DPCA方法
由上面的敘述可知,當PCA方法處理圖像時,將原始圖像矩陣轉換成列向量來構造圖像的協(xié)方差矩陣,造成圖像的維數(shù)較高,使得整個特征抽取過程所耗費的計算量[HK]相當大。而2DPCA方法直接利用原始圖像矩陣來構造圖像的協(xié)方差矩陣,在圖像的特征提取上更加直觀,總體的計算量也遠遠小于PCA方法。但是2DPCA方法提取的特征是一個列向量,分類的速度要低于PCA方法,因為PCA方法提取的特征是數(shù)值。
為了充分利用PCA方法和2DPCA方法的優(yōu)點,將二者結合起來使用,先通過2DPCA方法得到投影矩陣,組成樣本的訓練集,再用PCA方法進行二次特征提取來完成識別。這樣不僅提高了特征提取的速度,而且也加快了分類速度。
有了這樣一個新樣本,再利用PCA方法進行二次特征提取,得到一組投影特征向量,作為識別的特征向量,即人臉數(shù)據(jù)庫。
同樣的方法提取每一個測試樣本的人臉特征向量,然后將其與人臉庫比較,從而判斷他是否是庫中的人臉,如果是,是哪一幅人臉。PCA+2DPCA方法的流程圖如圖1所示。
圖1 PCA+2DPCA方法的流程圖
圖1中u表示訓練樣本的每一張人臉與平均人臉的差值;ut表示測試樣本的每一張人臉與平均人臉的差值。
3 實驗結果
本實驗是在ORL人臉庫上進行。ORL人臉數(shù)據(jù)庫有40人,隨機選出每個人的5幅圖像作為訓練圖像,構成一個200幅圖像的訓練集,剩下的200幅圖像構成測試集。實驗采用最近鄰分類器,分別做了2個方面的研究:一是識別率與特征空間維數(shù)的關系,如圖2所示;二是識別率與樣本數(shù)的關系,如圖3所示。
從圖2可以看出:PCA+2DPCA方法的識別率高于2DPCA方法,2DPCA方法的識別率高于PCA方法。當維數(shù)變化到55左右時,三者的識別率都可以達到各自的最高點。再以后,當選擇更多的維數(shù)時,識別率反而有所下降。由此可以看出,較多的維數(shù)并不一定帶來更高的識別率。
圖2 識別率與特征空間維數(shù)關系圖
圖3 識別率與樣本數(shù)關系圖
圖3是將維數(shù)取定為55,然后將每一類人臉圖片的樣本數(shù)從1變化到10,觀察識別率的變化得到的??梢钥闯?,隨著樣本數(shù)目的增加, PCA方法、2DPCA方法和PCA+2DPCA方法的識別率都不斷升高。
4 結 語
分析了PCA、2DPCA和PCA+2DPCA三種人臉識別方法的原理,并通過實驗比較了他們在人臉識別方面的性能。通過實驗發(fā)現(xiàn),從整體識別效果上看PCA+2DPCA方法優(yōu)于2DPCA方法,2DPCA方法優(yōu)于PCA方法。
參考文獻
[1]Turk M,Pentland A.Eigenfaces for Recognition[J].Cognitive Neuroscience,1991,3(1):71-86.
[2]Belhumeur P N,Hespanha J P,Kriegman D J.Fisherfaces:Recognition Using Class Specific Linear Projection[J].IEEE Trans.on PAM I,1997,19 (7):711-720.
[3]Yang J,Zhang D,F(xiàn)rangia F,et al.Two-Dimensional PCA:A New Approach to Appearance-Based Face Representation and Recognition [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26 (1):131-137.
[4]Zhang Daoqiang,Zhou Zhihua,Chen Songcan.Diagonal Principal Component Analysis for Face Recognition\\[J\\].Pattern Recognition,2006,39(1):140-142.
[5]孫即祥.現(xiàn)代模式識別[M].北京:國防科技大學出版社,2002.
作者簡介 齊興敏 女,1981年出生,湖北襄樊人,江西藍天學院瑤湖計算機系教師,碩士。研究方向為人工智能。
劉冠梅 女,1982年出生,江西藍天學院瑤湖計算機系教師,碩士。研究方向為軟件工程。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。