楊玉平,向 華
(1.重慶電子工程職業(yè)學院,重慶 401331;2.重慶師范大學,重慶401331)
對人臉識別特征數(shù)據(jù)降維算法的優(yōu)化
楊玉平1,向 華2
(1.重慶電子工程職業(yè)學院,重慶 401331;2.重慶師范大學,重慶401331)
在模式識別領域,人臉特征數(shù)據(jù)相對龐大,為了提取人臉主要的特征數(shù)據(jù),提高識別系統(tǒng)的運行效率,對特征數(shù)據(jù)的降維是必須的操作。針對現(xiàn)有降維算法對識別率有較大影響的問題,本文總結了各類降維算法,提出了一種優(yōu)化的降維算法。
人臉識別;降維;人臉特征;人臉識別
隨著模式識別技術的發(fā)展,各種識別系統(tǒng)都有了很大的發(fā)展,例如:指紋識別、虹膜識別、人臉識別等。人臉識別以其不易察覺性、自然性等特點得到廣泛的應用。相對于其他的識別方式,人臉識別的特征數(shù)據(jù)量較大,在提取特征數(shù)據(jù)之后要進行降維,這樣可以在一定程度上減少數(shù)據(jù)量,提高識別系統(tǒng)的運行效率。但如果降的維度過大,會造成一些主要特征數(shù)據(jù)丟失,使識別系統(tǒng)的識別率降低而達不到要求?,F(xiàn)在在降低維度的實驗過程中,一般運用多種維度降維,比如提取的特征數(shù)據(jù)的維度從幾十維到上百個維度不等。或者就以實驗的方式來提取經驗數(shù)據(jù),往往在維度降到一定程度之后,如果繼續(xù)降維就會造成整個識別系統(tǒng)的識別率降低。
Karhunen-Loeve變換,簡稱K-L變換,是一種傳統(tǒng)的數(shù)學領域常用的正交變換。簡單來講就是將K維空間的數(shù)據(jù),通過降低數(shù)據(jù)維度,把數(shù)據(jù)變成L維空間的數(shù)據(jù)??梢杂孟旅娴臄?shù)學公式來表示:
假設有矩陣Xm×k,m個行向量表示樣本的個數(shù),k表示每個樣本數(shù)據(jù)的維數(shù)。有另一矩陣Rk×l,稱這個Rk×l為變換矩陣,將這兩個矩陣作如下運算:
可見最終可將m個樣本的k維數(shù)據(jù),降低到l維數(shù)據(jù)了。Karhunen-Loeve變換的實質就是將數(shù)據(jù)從一個坐標系轉換到另一個坐標系中,而前一個坐標系的維度很大,且里面的數(shù)據(jù)帶有許多的冗余信息;而后一個坐標系的維度相對來說很小,只帶有數(shù)據(jù)的主要信息。
在眾多的特征臉方法中,PCA、LDA、SIFT等特征提取過程中,都有降低特征數(shù)據(jù)維度的過程,其一般過程是:預處理人臉圖像;加載人臉庫,提取特征數(shù)據(jù)形成特征空間;形成特征子空間;把樣本人臉圖像和待識別的人臉圖像投影到特征子空間上;選擇一定的距離參數(shù)進行識別。如下圖1:
圖1 圖像處理過程
一張M×N的人臉圖像,在作預處理時,可以看成是一個M×N的行向量或者列向量。例如一張64×64的人臉圖片可認為是4 096維列向量,因此它就是一個4 096維空間中的一點。但一般人臉的都是比較相似的,所以這些人臉中就存在許多的冗余信息,當提取了人臉圖像的特征數(shù)據(jù)后,就可以把這些特征數(shù)據(jù)降到一個低維的空間當中,用一個相應的低維子空間來表示除去冗余信息的主要的特征數(shù)據(jù)。設m是人臉圖像樣本的數(shù)目;xi表示第i幅人臉圖像構成的人臉向量,則樣本的協(xié)方差矩陣為:
根據(jù)SVD定理,設li(i=1,2,……,k)為矩陣W的k個非零特征值,vi為W對應于li的特征向量,則W的正交歸一特征向量ui為:
則特征臉子空間為:w=(u1,u2…… ur,)。其中A=
優(yōu)化的特征數(shù)據(jù)降維算法是建立在原有的特征數(shù)據(jù)降維算法的基礎上,通過在形成特征子空間時預設參數(shù),使降低的維度不至于過低,從而使主要的特征向量丟失,造成識別率下降;降低的維度過少,使過多的冗余信息存留,造成系統(tǒng)運行效率降低。此優(yōu)化算法的流程圖如下圖2:
圖2 優(yōu)化算法流程
具體實現(xiàn)步驟:
(1)運用imread()函數(shù)讀入訓練樣本圖像,把每張樣本圖像的像素以行的方式連接起來,構成一個一維行向量。把每個行向量從上到下連接起來,就構成了一個訓練人臉樣本矩陣。
(2)每一行就是一張圖像,把每一張圖像相對應的像素點求得它們的平均值,最后得到一個平均圖像的行向量。
(3)把每一個行向量與平均圖像行向量作差運算,得到一個差值矩陣A,運用協(xié)方差公式:W=AAT進行計算。并計算出W的特征值和特征向量。
(4)將特征向量按特征值大小以降序排列,設定優(yōu)化參數(shù)值R,此參數(shù)表示取所有特征值中的多少特征值來作為主要特征值,實驗中,取R=0.9110(0 (6)在識別階段,將待識別的人臉圖像先作預處理,提取特征向量,再把其特征向量投影到新坐標系所表示的空間中,最后與特征模板數(shù)據(jù)庫中的數(shù)據(jù)進行比較,進行識別。 本算法在實驗中所用的人臉數(shù)據(jù)庫有ORL和AR。ORL人臉庫中有40個人的人臉圖像,每個人有10幅圖像。選取5人的人臉圖像作為訓練樣本人臉圖像,剩余圖像作為識別時用,圖像大小為64×64,如圖3所示。 圖3 ORL人臉庫 表1 ORL庫識別率及運行時間 本實驗運用Matlab 7.5,并且基于SIFT人臉特征數(shù)據(jù)提取算法。從表1中的數(shù)據(jù)可以看出,人臉特征數(shù)據(jù)從4 096維降到不同的維度特征空間,系統(tǒng)運行的時間不一樣。一般來說,維數(shù)降得越低,處理的特征數(shù)據(jù)越少,系統(tǒng)運行就越快,但因此所得到的識別率也有所降低。本實驗中所用的優(yōu)化參數(shù)值R=0.9110,相應所得到的降維維數(shù)是93維,識別率是0.9972,運行時間是0.4580秒。與表1所得到的分析數(shù)據(jù)對比來看,充分說明了參數(shù)優(yōu)化效果。 在人臉識別的眾多算法中,數(shù)據(jù)的降維是必不可少的操作。本文介紹了早期的K-L變換,總結了PCA、LDA、SIFT等算法中的降維方法,給出了一種優(yōu)化的特征數(shù)據(jù)降維算法。并運用Matlab工具驗證了此算法的可行性。此優(yōu)化降維算法將給以后降維操作帶來方便、快捷,并具有一定的指導意義。 [1]周玲麗,賴劍煌.生物特征數(shù)據(jù)安全保護技術的發(fā)展[J].計算機科學,2008,35(10):33-38 [2]苑瑋琦,柯麗,白云.生物特征識別技術[M].北京:科學出版社,2009:164-165 [3]田印中,董志學,黃建偉.基于PCA的人臉識別算法研究及實現(xiàn)[J].內蒙古經濟與科技,2010,(3). [4]羅昊,孟傳良.基于特征臉和LDA的人臉識別[J].貴州工業(yè)大學學報(自然科學版),2005,(1). [5]H.K.Ekenel and R.Stiefelhagen.Why is facial occlusion a challengingproblem[C].IntemationalConferenceonAdvances in Biometrics,2009:299-308. [6]Roberts C.Biometric technologies-palm and hand[EB/OL].http://www.ccip.govt.nz/newsroom/information-notes/2006/biometrics-technologies-palmhand.pdf,2008-03-22. [7] H.Jia and A.M.Maninez,Support vector machines in face recognitionwithocclusions[C].IEEEConferenceonCompmer Vision and Pattem Recognition,2009:136-141. [8]Nagar A,Nandakumar K,Jain A K.Biometric Template Transformation:ASecureityAnalysis[C].Proc.of SPIE,Electronic Imaging,Media Forensics and Security XII.2010. [9]Feng Y C,Yuen P C,Jain A K.A Hybrid.Approach for Generating Secure and Discriminating Face Template[J].IEEE Transactions on Information Forensics and Security,2010,5(1):103-117. [10]Nagar A,Jain A K.On the Security of Non-invertible FingerprintTemplateTransforms[C].IEEEWorkshopon Information Forensics and Security(WIFS),2009. Optimization of Dimension Reduction Algorithm for Face Recognition Character Data YANG Yuping1,XIANG Hua2 In the field of pattern recognition,facial character data is relatively large,and therefore it is necessary to reduce the dimension of the character data in order to extract the primary facial main data and improve the efficiency of the recognition system.For the existing dimension reduction algorithm has some negative effect on the recognition rate,this article sums up various kinds of dimension reduction algorithms and brings forward a better algorithm. face recognition;dimension reduction;facial character TP39 A 1674-5787(2012)01-0162-03 2011-12-28 楊玉平(1984—),男,重慶市人,重慶電子工程職業(yè)學院,助教、重慶師范大學計算機與信息科學學院計算機軟件與理論專業(yè)2010級碩士研究生,研究方向:數(shù)字圖像處理與模式識別;向華(1984—),女,重慶市人,重慶師范大學外國語學院學科教學(英語)2010級專業(yè)碩士研究生。 責任編輯 王榮輝4 實驗效果與分析
5 結語
(1.Chongqing College of Electronic Engineering Chongqing 401331,China;2.Chongqing Normal University,Chongqing 401331,China)