王偉,寇 贇
(咸陽(yáng)師范學(xué)院信息工程學(xué)院,咸陽(yáng) 71200)
?
基于快速PCA算法的人臉識(shí)別
王偉,寇贇
(咸陽(yáng)師范學(xué)院信息工程學(xué)院,咸陽(yáng)71200)
摘要:對(duì)人臉識(shí)別算法進(jìn)行研究,采用K-L變換計(jì)算訓(xùn)練樣本特征值及特征向量,得到特征臉向量,進(jìn)而計(jì)算測(cè)試樣本投影到特征臉子空間的坐標(biāo)系數(shù),最后使用SVM分類器分類匹配得到識(shí)別結(jié)果。該系統(tǒng)以O(shè)RL人臉庫(kù)中的人臉圖像作為測(cè)試樣本,實(shí)驗(yàn)結(jié)果驗(yàn)證該方法可以有效地進(jìn)行識(shí)別,對(duì)實(shí)際的應(yīng)用具有一定的參考價(jià)值。
關(guān)鍵詞:人臉識(shí)別;ORL數(shù)據(jù)庫(kù);特征子空間;主成分分析;SVM分類器
人臉識(shí)別已成為計(jì)算機(jī)視覺(jué)和模式識(shí)別等領(lǐng)域中的熱門課題,它是以計(jì)算機(jī)為輔助手段,從靜態(tài)圖像或動(dòng)態(tài)圖像中識(shí)別出人臉的過(guò)程。人臉識(shí)別研究一般分為3個(gè)過(guò)程:第一,從復(fù)雜背景的場(chǎng)景中檢測(cè)并分離出人臉?biāo)诘膮^(qū)域;其次,抽取人臉的特征;最后,將抽取的人臉特征與已有的人臉數(shù)據(jù)庫(kù),進(jìn)行匹配,并識(shí)別出人臉。目前,人臉識(shí)別已經(jīng)成為法律部門打擊犯罪的有力工具,例如在毒品跟蹤、反恐怖活動(dòng)等監(jiān)控中有著很大的應(yīng)用價(jià)值;此外,人臉識(shí)別的商用應(yīng)用價(jià)值也在日益增長(zhǎng),例如,信用卡或者自動(dòng)取款機(jī)的個(gè)人身份核對(duì)。
1.1 PCA的基本原理
特征提取是人臉識(shí)別是人臉識(shí)別技術(shù)的關(guān)鍵,其中基于K-L變換的PCA特征提取方法近年來(lái)在人臉識(shí)別領(lǐng)域獲得了廣泛的應(yīng)用,并取得了一定的成功,其基本過(guò)程為:將高維的人臉圖像通過(guò)K-L變換至特征子空間中的一個(gè)點(diǎn),即構(gòu)成特征臉空間;識(shí)別時(shí)將測(cè)試圖像投影到此空間得到一組投影系數(shù),通過(guò)這一組系數(shù)坐標(biāo),與各個(gè)人臉圖像進(jìn)行比較識(shí)別。
主成分分析(PCA)[1-3]通過(guò)特征的線性組合來(lái)實(shí)現(xiàn)數(shù)據(jù)降維,對(duì)于二維空間中的一幅人臉圖像v×m,將其每列相連構(gòu)成一個(gè)n=v×m維的列向量,n表示人臉圖像的維數(shù),如何能將高維空間中的s個(gè)樣本最好地表示在低維空間上。
傳統(tǒng)的PCA算法通過(guò)K-L線性變換將高維空間中的樣本數(shù)據(jù)投影到低維空間中。當(dāng)計(jì)算的維度較大時(shí),如果采用傳統(tǒng)的PCA的方法計(jì)算主成分,通常會(huì)出現(xiàn)內(nèi)存耗盡的錯(cuò)誤,即使有足夠多的內(nèi)存,要得到全部的本征值可能也要花數(shù)小時(shí)時(shí)間。因此本文簡(jiǎn)紹一種PCA加速方法——快速PCA。
快速PCA是在傳統(tǒng)PCA計(jì)算矩陣s非零本征值所對(duì)應(yīng)的本征向量。設(shè)Zn×d為樣本矩陣X中的每個(gè)樣本減去樣本均值m后得到的矩陣,則散布矩陣s為(ZTZ)d×d。矩陣R=(ZZT)n×n與s有著相同的非零本征值。
設(shè)n維列向量v是R的本征向量,則有:
式(3)兩邊同時(shí)左乘ZT,并應(yīng)用矩陣的結(jié)合律得:
式(4)說(shuō)明ZTv→為散布矩陣s=(ZTZ)d×d的特征值。這說(shuō)明可以計(jì)算小矩陣R=(ZZT)n×n,R的本征向量v,而后通過(guò)左乘Z得到散布矩陣S=(ZTZ)d×d的本征向量ZTv→。
1.2 SVM的分類器的設(shè)計(jì)
式(6)中W是RD的一個(gè)元素,逼近使的R(W)到達(dá)最小值:
式(6)中C>0是常量L[y,f(X,W)]是一ε無(wú)窮小函數(shù):
式(7)參數(shù)ε的含義是最佳函數(shù)f(X,W)偏離實(shí)際觀察目標(biāo)y的值。通過(guò)應(yīng)用拉格朗日函數(shù),求解(7)式最小可以歸結(jié)為一個(gè)兩重最優(yōu)化問(wèn)題,這樣就可以解決二次規(guī)劃設(shè)計(jì)問(wèn)題。
實(shí)驗(yàn)過(guò)程中用到的人臉圖像大小為112×92,將人臉圖像按列進(jìn)行存儲(chǔ),通過(guò)快速PCA算法人臉數(shù)據(jù)降至50維,即每個(gè)人臉樣本都可以由一個(gè)50維的特征向量來(lái)表示,采用支持向量機(jī)(SVM)對(duì)其人臉樣本進(jìn)行分類識(shí)別,從而實(shí)現(xiàn)人臉識(shí)別系統(tǒng)。人臉識(shí)別過(guò)程如圖1所示,讀入人臉庫(kù)的相關(guān)數(shù)據(jù),利用快速PCA對(duì)要識(shí)別的人臉進(jìn)行特征降維,將特征人臉?biāo)腿隨VM分類器進(jìn)行分類識(shí)別。
圖1 人臉識(shí)別過(guò)程
為了更好地說(shuō)明算法的有效性,該實(shí)驗(yàn)采用ORL人臉圖像庫(kù),該人臉數(shù)據(jù)庫(kù)是由英國(guó)劍橋大學(xué)識(shí)別實(shí)驗(yàn)創(chuàng)建人所拍攝的一系列人臉圖像組成,共包含40個(gè)不同年齡、不同性別和不同種族的的人臉圖像,每個(gè)人10幅圖像,共計(jì)400幅灰度圖像組成,其中人臉部分表情和細(xì)節(jié)均有不同程度的變化,其中包含有人臉圖像的光照,以及被拍攝人臉的表情、姿態(tài)的差別,圖2所示為ORL部分人臉圖像,他們分別對(duì)應(yīng)的是人臉庫(kù)中第3、5、8、15、19人的臉部圖像。
圖2 ORL人臉數(shù)據(jù)庫(kù)中的部分人臉圖像
通過(guò)快速PCA的降維將人臉數(shù)據(jù)庫(kù)每個(gè)人臉樣本所對(duì)應(yīng)的每一個(gè)特征向量由原來(lái)的10304維降為50維。如圖3所示為降維后的主成分臉。從圖3中我們可以看出,人臉圖像經(jīng)過(guò)快速PCA處理后,在特征維數(shù)大大降低的同時(shí),原圖像中那些差異最大的特征被最大保留。
圖3 主成分臉圖
將人臉數(shù)據(jù)庫(kù)中10幅樣本圖像分為兩組,前5幅圖像用于訓(xùn)練,后5幅圖像用于測(cè)試。通過(guò)FastPCA將人臉數(shù)據(jù)庫(kù)中樣本圖像進(jìn)行降維,得到特征子空間。其次將訓(xùn)練集中的全體樣本進(jìn)行規(guī)格化,對(duì)訓(xùn)練集中的人臉圖像利用SVM進(jìn)行訓(xùn)練,通過(guò)投票決定其最終類別歸屬。即實(shí)現(xiàn)人臉圖像的匹配,實(shí)驗(yàn)結(jié)果如圖4所示。
為了進(jìn)一步的驗(yàn)證系統(tǒng)的魯棒性,我們對(duì)待測(cè)人臉圖像進(jìn)行一些特殊處理,如為人臉圖像進(jìn)行運(yùn)動(dòng)模糊處理、高斯模糊處理及增加亮度處理。然后進(jìn)行識(shí)別測(cè)試。運(yùn)行結(jié)果圖如圖5-7所示。圖5為對(duì)數(shù)據(jù)庫(kù)中第5個(gè)人臉圖像經(jīng)過(guò)運(yùn)動(dòng)模糊處理并識(shí)別,該圖顯示本算法可以對(duì)此圖像進(jìn)行正確識(shí)別;圖6所示為數(shù)據(jù)庫(kù)中第15個(gè)人臉圖像經(jīng)過(guò)高斯模糊處理并識(shí)別,該圖顯示本算法可以對(duì)此圖像進(jìn)行正確識(shí)別;圖7所示為對(duì)數(shù)據(jù)庫(kù)中第19個(gè)人臉圖像經(jīng)過(guò)高亮處理并識(shí)別,該圖顯示本算法可以對(duì)此圖像進(jìn)行正確識(shí)別。
以上測(cè)試結(jié)果表明,本文所開發(fā)的人臉識(shí)別系統(tǒng)識(shí)別率較高,對(duì)外界某些干擾因素具有一定的魯棒性。
圖4 典型的人臉識(shí)別結(jié)果圖 圖5 運(yùn)動(dòng)模糊后圖像的識(shí)別 圖6 高斯模糊后圖像的識(shí)別 圖7 增加亮度圖像的識(shí)別
本文介紹了人臉識(shí)別中常用的主成分分析法,并在MATLAB環(huán)境下驗(yàn)證了該算法,為了說(shuō)明算法的有效性,實(shí)驗(yàn)過(guò)程中采用了ORL人臉數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)庫(kù),實(shí)驗(yàn)結(jié)果表明,算法可以對(duì)不同姿態(tài)、不同光照、運(yùn)動(dòng)模糊及高斯模糊后的圖像進(jìn)行正確識(shí)別,識(shí)別效果較理想。但在識(shí)別過(guò)程中的運(yùn)算速率方面以及系統(tǒng)的構(gòu)建方面還需進(jìn)一步完善。
參考文獻(xiàn):
[1]齊興敏.基于PCA的人臉識(shí)別技術(shù)的研究[D].武漢理工大學(xué),2007.
[2]孫崇璇.基于PCA主成分分析的人臉識(shí)別檢測(cè)實(shí)現(xiàn)與分析[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2010,19(6): 439-443.
[3]李榮健,韓其龍,楊鑫華.改進(jìn)的PCA人臉識(shí)別新算法[J].大連交通大學(xué)學(xué)報(bào),2008,(8): 48-51.
[4]張娜,張永平.模糊核聚類支持向量機(jī)集成模型及應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2010,30:175-177.
[5]殷光.基于SVM的驗(yàn)證碼識(shí)別算法研究[D].合肥:安徽大學(xué),2010.
寇贇(1995-),女,陜西榆林,學(xué)生,研究方向?yàn)闉閳D形圖像處理與模式識(shí)別
Face Recognition Based on Fast PCA Algorithm
WANG Wei,KOU Yun
(School of Information Engineering,Xianyang Normal University,Xianyang 712000)
Abstract:Studies face recognition algorithm, obtains the training sample by the K-L transform, obtains face vector, and calculates the coordinate coefficients of feature subspace. SVM is used to classify and identify the results. ORL face datasets are used in order to test the performance of our proposed method. Experimental results show that proposed method can effectively identify different attitude face. This method has been referenced for practical applications.
Keywords:Face Recognition; ORL Database; Feature Subspace; Principal Component Analysis; SVM
收稿日期:2015-12-31修稿日期:2016-02-25
作者簡(jiǎn)介:王偉(1994-),男,陜西榆林人,學(xué)生,研究方向?yàn)闉閳D形圖像處理與模式識(shí)別
文章編號(hào):1007-1423(2016)10-0039-04
DOI:10.3969/j.issn.1007-1423.2016.10.009
基金項(xiàng)目:2015年陜西省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(No.2100)、2015年咸陽(yáng)師范學(xué)院大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(No. 2015010)