陳勇 林穎
摘要:采用基于PCA(主成分分析)的特征臉人臉識(shí)別方法,判斷一張給定的圖像是否為人臉圖像。該方法通過(guò)計(jì)算訓(xùn)練集的特征向量,得到一個(gè)由特征臉組成的子空間,并將訓(xùn)練集中的人臉圖像投影到該子空間中。檢測(cè)人臉時(shí),將二維的人臉圖像投影到臉空間,并計(jì)算該圖像與臉空間之間的歐幾里得距離,以距離是否小于某一設(shè)定的閥值來(lái)識(shí)別是否人臉圖像,實(shí)驗(yàn)測(cè)試結(jié)果準(zhǔn)確率為97.5%。
關(guān)鍵詞:人臉識(shí)別;特征臉;主成分分析
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A
1引言
人臉檢測(cè)是一種是人臉識(shí)別的重要組成部分,因?yàn)槿四樖菑?fù)雜、多維和表情豐富的。人臉檢測(cè)大多數(shù)是檢測(cè)人臉的正面,多姿態(tài)和復(fù)雜背景下的檢測(cè)目前仍然存在較大的困難。從20時(shí)代50-60年代開始,人們就以開始研究人臉識(shí)別[1-3]。人臉識(shí)別技術(shù)可以分為基于幾何特征的方法[4]、基于模板的方法[5]、基于模型的方法[6]。主成分分析(PCA, Principle Component Analysis),是一種統(tǒng)計(jì)學(xué)方法, 其基本思想是提取出空間原始數(shù)據(jù)中的主要特征, 減少數(shù)據(jù)冗余, 使得數(shù)據(jù)在一個(gè)低維的特征空間被處理, 同時(shí)保持原始數(shù)據(jù)的絕大部分的信息, 從而解決數(shù)據(jù)空間維數(shù)過(guò)高的瓶頸問(wèn)題[7-9]。在眾多特征提取技術(shù)中,子空間分析方法因其實(shí)施性好、有效性高等特點(diǎn),成為人臉圖像特征提取和識(shí)別的主流方法之一。利用特征臉特征,重建識(shí)別人臉,把PCA的子空間方法引入到人臉識(shí)別中,成為一個(gè)人臉識(shí)別方面的重要方向[10]。
2特征臉?lè)椒?/p>
特征臉?lè)椒▽⑷四樧R(shí)別問(wèn)題視為一個(gè)二維的識(shí)別問(wèn)題,是通過(guò)正交變換來(lái)實(shí)現(xiàn)的。特征臉實(shí)際上是由訓(xùn)練圖像的協(xié)方差矩陣計(jì)算得到的特征向量。把這些特征向量還原為圖像,向量定義了一個(gè)人臉圖像的子空間,稱為“臉空間”。訓(xùn)練集中的圖像可以通過(guò)特征臉的線性組合與平均臉之和來(lái)近似地重建。
檢測(cè)圖像是否為人臉圖像的步驟如下:
(1)選取一個(gè)訓(xùn)練集;
(2)由訓(xùn)練集計(jì)算得到個(gè)對(duì)應(yīng)非零特征值的特征向量,M為訓(xùn)練集中圖像的數(shù)量;
(3)選取特征值最大的前K個(gè)特征向量ui,令‖ui‖=1。由這些特征向量構(gòu)造一個(gè)矩陣。這些特征向量將生成一個(gè)臉空間;
(4)將一張新的圖像通過(guò)投影矩陣投影到臉空間,計(jì)算原圖像向量與臉空間的歐幾里得距離。設(shè)定一個(gè)閥值θε,當(dāng)這個(gè)距離小于θε時(shí),即認(rèn)為是人臉圖像。
使用ORL人臉庫(kù),圖像均為112×92的8位灰度圖像??梢酝ㄟ^(guò)把圖像的像素按行或按列排列一個(gè)行或列向量。通常圖像都是N×N個(gè)像素的。假如選取了M張圖像,那么最終將得到一個(gè)N2×M的矩陣。這個(gè)矩陣的每一列代表一張圖像。將圖像從左到右按列排列成一個(gè)10304維的列向量,這些像素都在同一個(gè)數(shù)值范圍內(nèi),不需要進(jìn)行其他的處理。
假設(shè)選取了M張人臉圖像,將這些圖像以列向量Γ1,Γ2,…,ΓM表示,將每張圖像減去平均臉。平均臉定義如式(1)所示。
Ψ=1M∑Mi=1Γi (1)
選取了360張人臉圖像來(lái)計(jì)算平均臉,效果如圖1所示。
3特征值與特征向量
得到訓(xùn)練集之后,就可以計(jì)算特征臉,即計(jì)算協(xié)方差矩陣的特征向量。
設(shè)矩陣A=Φ1,Φ2,…,ΦM,協(xié)方差矩陣為C=AAT。這是一個(gè)高達(dá)10304維的實(shí)對(duì)稱矩陣,如果直接計(jì)算它的特征向量,計(jì)算量將十分巨大。如果選取的樣本數(shù)量M小于圖像向量的維數(shù)N2,那么將只有M-1個(gè)對(duì)應(yīng)非零特征值的特征向量。
對(duì)應(yīng)于零特征值的特征向量會(huì)將樣本投影到零向量,在這些向量的方向上數(shù)據(jù)沒(méi)有任何變化。構(gòu)建臉空間不需要這些特征向量。因此,我們只需要M-1個(gè)特征向量。事實(shí)上,也只需要計(jì)算一個(gè)M×M矩陣的特征向量,而不需要去計(jì)算N×N矩陣的特征向量。
設(shè)ui、vi為矩陣AAT的特征值和特征向量,有:
5結(jié)束語(yǔ)
特征臉?lè)椒ㄌ峁┝艘环N可行的人臉識(shí)別的解決方案。從PCA算法入手,實(shí)現(xiàn)了用特征臉?lè)椒ㄟM(jìn)行人臉識(shí)別,這種方法相對(duì)簡(jiǎn)單,速度快,在背景受約束的條件下表現(xiàn)良好。但是,該算法對(duì)于輸入的圖像要求較高。不同的背景和光照對(duì)于檢測(cè)有較大的影響,實(shí)際應(yīng)用這個(gè)算法,還需要對(duì)圖像進(jìn)行一些預(yù)處理,削弱一些諸如光的強(qiáng)度之類的差異。
參考文獻(xiàn)
[1]ALLEN A L.Personal descriptions, London, Butterworth,1950.
[2]PARKER F I. Computer generated animation of faces[C]. In Proceedings ACM an Conference,1972,1:451-457.
[3]孫羽,董洪斌,張宇華.人臉圖象的模糊識(shí)別方法[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報(bào):1997,1:78-82.
[4]BLEDSOE W.Manmachine facial recognition Panoramic Research Inc[M], Palo Alto, CA ,1966,Rep PRI:22.
[5]LANITIS A,TAYLOR C J,COOTES T F. Automatic interpretation and coding of face images using flexible models[J]. IEEE Trans.on Pattern Analysis and Machine Intelligence,19(7):743-756.
[6]NEFIAN Ara Victor.A hidden markov modelbased approach for face detection and recognition[M],Georgia Institute of Technology Atlanta,GA,USA,1999.
[7]BELHUMEUR P N,HESPANHA J P,KRIENGMAN D J.Eigenfaces vs.Fishefaces: Recognition Using Linear Projection[J]. IEEE Trans. Pattern Analysis and Machine Intelligence,1997, 19(7):711-720.
[8]YANG Jian,ZHANG David F.Alejandro. Twodimensional PCA: A new approach to appearance-based face representation and recognition[J]. IEEE Trans. on Pattern Analysis and Machine Intelligence.2004, 26(1):117-129.
[9]BARTLETT M S,MOVELLAN J R,SEJNOW T J.Face recognition by independent component analysis[J]. IEEE Trans. on Neural Networks. 2002,13(6):1450-1464.
[10]PHILLIPS P J,MOON H,RIZVI S. The feret evaluation methodology for face recognition algorithms[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(10): 1090-1104.