廖延娜,馬超
(1.西安郵電大學(xué)理學(xué)院,陜西西安710121;2.西安郵電大學(xué)電子工程學(xué)院,陜西西安710121)
基于稀疏表示的人臉識別系統(tǒng)設(shè)計與實現(xiàn)
廖延娜1,馬超2
(1.西安郵電大學(xué)理學(xué)院,陜西西安710121;2.西安郵電大學(xué)電子工程學(xué)院,陜西西安710121)
針對人臉識別在實際應(yīng)用中存在光照異常、姿態(tài)變化、遮擋、樣本缺乏等情況,研究了結(jié)合主成分分析的稀疏表示人臉識別分類算法,設(shè)計并實現(xiàn)了人臉識別系統(tǒng)。系統(tǒng)依據(jù)訓(xùn)練字典對實時采集的人臉圖像進行識別,并支持訓(xùn)練字典的實時更新。測試結(jié)果表明,在訓(xùn)練樣本充分的情況下,系統(tǒng)對正面無表情人臉識別率在99%以上,滿足正常人臉識別的使用需求;在訓(xùn)練樣本不充分的情況下,識別率仍可以達到70%以上,可用于安防預(yù)警。
計算機圖像處理;人臉識別;稀疏表示;主成分分析
人臉識別技術(shù)(Face Recognition,F(xiàn)R)[1]涵蓋了生物技術(shù)和計算機技術(shù),涉及到計算機圖像處理、機器學(xué)習(xí)、模式識別、人體生理學(xué)和認(rèn)知科學(xué)等多個技術(shù)領(lǐng)域[2]。人臉識別算法已經(jīng)經(jīng)歷了長時間的研究,在圖像背景簡單、樣本充分的情形下,大部分算法都能夠?qū)ζ溥M行高精度的識別。
在實際應(yīng)用中,由于環(huán)境因素的異同,能否應(yīng)對復(fù)雜情形下的人臉圖像,成為目前檢驗各類算法的難題。基于彈性圖匹配法的人臉識別算法[3]以同類人臉圖像相似的拓?fù)浣Y(jié)構(gòu)為依據(jù)進行識別分類。但其處理過程中計算量較大,識別效率較緩慢[4]。基于3D模型的人臉識別算法[5]可以從單張人臉圖像還原模型參數(shù),并進行匹配識別。但對圖像質(zhì)量要求較高,應(yīng)用范圍較狹窄?;谶z傳算法[6]的人臉識別算法可以高效地選取最優(yōu)判別系數(shù),但其對不同環(huán)境下的人臉特征提取差異較大[7]。因此,采用基于稀疏表示的分類算法(Sparse Representation based Classifier,SRC)[8-9]構(gòu)建人臉識別系統(tǒng)。
1.1算法原理
SRC的基本思想為:假設(shè)識別系統(tǒng)有足夠多的樣本,其中每一類的訓(xùn)練樣本可以通過其自身的線性組合來表示同類的測試樣本。將所有的訓(xùn)練樣本組合在一起形成一個冗余字典,由于測試樣本只可以被同屬一類的訓(xùn)練樣本表示,即只有與測試樣本同類的訓(xùn)練樣本系數(shù)有值,其它類訓(xùn)練樣本的表示系數(shù)為零,因此系數(shù)向量是稀疏的。根據(jù)壓縮感知理論[10],采用稀疏重構(gòu)算法對欠定方程進行求解,得到測試樣本的稀疏表示系數(shù),從而進行歸類判別。
根據(jù)上述描述,可以將稀疏表示表達為y=Ax,其中,y是目標(biāo)信號樣本,A為訓(xùn)練樣本空間,x為系數(shù)向量。x中只有少數(shù)值為非0元素,即是稀疏的,所以求解x可以轉(zhuǎn)化為求x的l0范數(shù),即:
‖x‖0表示x的l0范數(shù),即x中非零元素的個數(shù)。求解l0范數(shù)是一個NP-hard問題,它的解極不穩(wěn)定。在x是足夠稀疏的條件下,可以將方程(1)轉(zhuǎn)化為求解x的l1范數(shù)問題,即:
一般情況下,圖像中有噪聲存在,故需要考慮誤差項,即y=Ax+e。則方程(2)轉(zhuǎn)化為:
式(3)是一個凸優(yōu)化問題,由于噪聲等因素影響,x的非零元素會散布于多類間,使用系數(shù)重構(gòu)誤差的方法進行判斷分類:
其中di是i與第類相關(guān)的系數(shù)。利用式(4)得到的最小誤差,可以確定樣本所屬類別。
在求解y=Ax的過程中,需要對圖像矩陣A進行降維處理,采用主成分分析法實現(xiàn)降維。主成分分析(Principal Component Analysis,PCA)[11-12]是將一個高維向量通過一個特征向量矩陣U,投影到一個低維的向量空間,雖然產(chǎn)生了數(shù)據(jù)的損失,但保留了決定性的主要信息。在人臉識別算法中,假設(shè)有N個訓(xùn)練樣本,每個樣本中所有的像素灰度值列為一個向量ai,從而構(gòu)成訓(xùn)練樣本集{a1,a2,…,aN},其協(xié)方差矩陣為:
協(xié)方差矩陣C的特征向量ui及對應(yīng)特征值λi組成人臉空間的正交基底。圖像的主要信息聚集在特征值較大的特征向量中,將特征值按降序排列,取前d個特征值對應(yīng)的特征向量為主成分,構(gòu)成變換矩陣U=(u1,u2,…,ud),即人臉識別系統(tǒng)的字典,在此基礎(chǔ)上求解稀疏向量。
1.2算法仿真
為測試稀疏表示算法的性能,在YaleB[13],ORL[14]和AR[15]3個人臉數(shù)據(jù)庫上進行了仿真實驗,并記錄測試數(shù)據(jù),如表1所示。
其中YaleB包含數(shù)據(jù)有10類64張人臉圖像;ORL數(shù)據(jù)集包含數(shù)據(jù)有40類10張人臉圖像;AR數(shù)據(jù)包含數(shù)據(jù)有120類14張人臉圖像,因其人臉種類較多,數(shù)據(jù)庫較大,所以也是公認(rèn)度較高的一種數(shù)據(jù)庫。
測試時,在每一類人臉圖像中進行隨機標(biāo)記作為訓(xùn)練樣本,通過設(shè)置不同標(biāo)記率觀察識別算法的性能。
表1 算法在3種數(shù)據(jù)庫上的識別率(%)
由表中數(shù)據(jù)可知,隨著訓(xùn)練樣本的增加,對人臉的識別率也在不斷提升。同時,在標(biāo)記率達到50%后,對各類人臉的識別率都達到90%以上,顯示了其很好的魯棒性。
設(shè)計的系統(tǒng)包括人臉數(shù)據(jù)庫采集訓(xùn)練部分和識別檢測部分,如圖1所示。
圖1 人臉識別系統(tǒng)結(jié)構(gòu)
人臉數(shù)據(jù)庫采集訓(xùn)練部分結(jié)合UI界面,通過攝像頭拍照采集人臉圖像,或從外界資源文件直接導(dǎo)入人臉圖像,建立人臉數(shù)據(jù)庫。訓(xùn)練部分支持人臉數(shù)據(jù)庫的實時擴展和字典數(shù)據(jù)包更新,入庫的人臉圖像首先進行歸一化作用的處理,包括彩色圖像的灰度化,降噪處理。然后對圖像庫進行樣本訓(xùn)練,生成人臉識別分類字典數(shù)據(jù)包。識別檢測部分從監(jiān)測攝像頭返回的視頻流中定位截取人臉圖像,并進行預(yù)處理,然后根據(jù)已生成的人臉識別分類字典進行實時識別。兩部分的軟件流程如圖2所示。
圖2 系統(tǒng)軟件流程
3.1人臉類別對測試結(jié)果的影響
對所設(shè)計的系統(tǒng),采集了多類人臉圖像數(shù)據(jù)作為實驗樣本。
采集樣本時,正常情況下會選擇清晰度較高、面部基本對齊的正臉或小角度側(cè)臉(小于30度)作為優(yōu)質(zhì)訓(xùn)練樣本的原子,如圖3(a)所示。在樣本來源不可控的情況下,也有可能存在訓(xùn)練樣本效果不理想,光線弱、成像模糊、側(cè)臉過多等現(xiàn)象,如圖3(b)所示。
圖3 訓(xùn)練樣本圖片示例
考慮到實際情況的復(fù)雜性,選擇A、B兩類人臉圖像作為測試樣本的原子。A類為多種表情、小部分遮擋(即遮擋面積小于50%)的人臉,如圖4(a)所示;B類為大角度側(cè)面、大面積遮擋、光線昏暗等情況,如圖4(b)所示。
圖4 測試樣本圖片示例
文中將所采集到的多類人臉圖像數(shù)據(jù)分為以下4種情況進行測試:
Test 1:優(yōu)質(zhì)訓(xùn)練樣本+A類測試樣本;
Test 2:優(yōu)質(zhì)訓(xùn)練樣本+B類測試樣本;
Test 3:惡劣訓(xùn)練樣本+A類測試樣本;
Test 4:惡劣訓(xùn)練樣本+B類測試樣本。
當(dāng)每一類取不同的訓(xùn)練樣本數(shù)進行訓(xùn)練得到字典時,識別測試統(tǒng)計結(jié)果如表2所示。
表2 在各類情況下的識別率(%)
由上表數(shù)據(jù)可知,Test 1中,即使在單訓(xùn)練樣本條件下,對A類測試樣本的識別率也高達90%以上;當(dāng)訓(xùn)練樣本數(shù)取到10時,識別率可達到99.64%,完全可以滿足正常情況下的人臉識別要求。
Test 2中,當(dāng)訓(xùn)練樣本數(shù)增多時,對B類測試樣本的識別率得到顯著的提高,表明優(yōu)質(zhì)的訓(xùn)練樣本生成的分類字典,對惡劣測試樣本良好的包容性。
Test 3和Test 4中,惡劣訓(xùn)練樣本使特征提取不明顯,導(dǎo)致對A類和B類測試樣本識別率均較低,不過此時增加訓(xùn)練樣本的數(shù)量,也可以較大程度的提高識別率,當(dāng)訓(xùn)練樣本數(shù)為10時,識別率可達70%以上,這一結(jié)果表明,在訓(xùn)練樣本質(zhì)量較差的特殊需求中,如安防預(yù)警等,該系統(tǒng)有一定使用價值。
3.2訓(xùn)練樣本數(shù)目對測試結(jié)果的影響
為得到最佳訓(xùn)練樣本數(shù)目,在采集建立人臉數(shù)據(jù)庫基礎(chǔ)上,進行了不同個數(shù)的訓(xùn)練樣本對識別率影響的測試,測試結(jié)果如圖5所示。
圖5中,折線1表示不同數(shù)目的優(yōu)質(zhì)訓(xùn)練生成的字典對各類測試樣本的識別率;折線2表示不同數(shù)目的惡劣訓(xùn)練生成的字典對各類測試樣本的識別率。由圖可見,隨著訓(xùn)練樣本數(shù)目的增加,兩種情況的識別率都得到了顯著提高。當(dāng)優(yōu)質(zhì)訓(xùn)練樣本數(shù)目達到10以后,識別率達99%以上;對于劣質(zhì)訓(xùn)練樣本,當(dāng)訓(xùn)練樣本數(shù)小于8時,由于樣本質(zhì)量情況不穩(wěn)定,增幅差異較大,達到9張之后,識別率平穩(wěn)增長。
圖5 不同訓(xùn)練樣本數(shù)對識別率的影響
研究并采用基于稀疏表示的識別算法設(shè)計并實現(xiàn)了人臉識別系統(tǒng),系統(tǒng)可在動態(tài)視頻流中實時截取圖像進行識別。通過實際采集樣本測試,在訓(xùn)練樣本充分時,系統(tǒng)對測試人臉樣本的小角度側(cè)面、多表情、小部分遮擋等情況下的識別率在99%以上,可滿足正常情況下的人臉識別需求,如門禁考勤、身份識別等應(yīng)用場合。同時,系統(tǒng)對于惡劣的訓(xùn)練樣本和測試樣本有較好的包容性,在安防預(yù)警等特殊應(yīng)用場合有一定的使用價值。后續(xù)可引入多人臉定位算法,將應(yīng)用擴大到等更多場合。
[1]張會森,王映輝.人臉識別技術(shù)[J].計算機工程與設(shè)計,2006,27(11):1923-1928.
[2]韓增錕.基于人臉識別技術(shù)的考生身份驗證系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機與數(shù)字工程,2012(1):148-150.
[3]俞燕,李正明.基于特征的彈性圖匹配人臉識別算法改進[J].計算機工程,2011(5):216-218.
[4]孫大瑞,吳樂南.基于特征的彈性圖匹配人臉識別算法[J].應(yīng)用科學(xué)學(xué)報,2002,20(4):377-381.
[5]肖云.基于3D人臉識別研究的探索[J].電腦知識與技術(shù),2011,7(9):2136-2137.
[6]陰亞芳,張婧琪,廖延娜.小生境遺傳算法在多車牌定位中的應(yīng)用[J].西安郵電大學(xué)學(xué)報,2015,20(1):40-43.
[7]倪紅霞,朱啟偉.基于遺傳算法的人臉識別系統(tǒng)設(shè)計[J].杭州電子科技大學(xué)學(xué)報,2010,30(4):45-49.
[8]陰亞芳,李倩,廖延娜.基于低秩矩陣分解和協(xié)作表示的人臉圖像分類[J].西安郵電大學(xué)學(xué)報,2015(1):70-74.
[9]Wright J,Yang Allen,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Transations on Parttern Analysis and Machine Intelligence,2009,31(2): 210-227.
[10]王小剛,田小平,吳成茂.基于壓縮感知的圖像快速重構(gòu)去噪算法[J].西安郵電學(xué)院學(xué)報,2012(4):11-14,20.
[11]余付平,馮有前,范成禮,等.基于主成分分析的字典學(xué)習(xí)[J].控制與決策,2013(7):1109-1112.
[12]陳佩.主成分分析法研究及其在特征提取中的應(yīng)用[D].西安:陜西師范大學(xué),2014.
[13]LEE K C,HO J,Kriegman D.Acquiring linear subspaces for face recognition under variable lighting[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2005,27(5): 684-698.
[14]陳丹,王國胤,龔勛,等.一種適用于人臉檢測的自適應(yīng)光照補償方法[J].計算機工程與應(yīng)用,2012,48(22): 175-178.
[15]Martinez A.Benavente R.The AR face database[R].CVC Tech.Report,1998.
The design and implementation of face recognition system based on sparse representation
LIAO Yan-na1,MA Chao2
(1.School of Science,Xi'an University of Posts and Telecommunications,Xi'an 710121,China;2.School of Electronic Engineering,Xi'an University of Posts and Telecommunications,Xi'an 710121,China)
In order to solve the situations of abnormal light,attitude change,obscured,samples lack in actual application of human face recognition system,the recognition algorithm based on sparse representation combined with principal component analysis is studied.A human face recognition system is designed to realize real time face image recognition in real time according to training dictionary,and the training dictionary can be updated real time.According to the test results,when the training samples are adequate end the face images are expressionless,frontal,the rate of system identification over 99%,meetting the demand of normal use of face recognition.when the training samples are not adequate,the rate over 70%,can be used in the security warning.
computer image processing;sparse representation;face recognition;principal component analysis
TN911.73
A
1674-6236(2016)17-0153-03
2016-01-14稿件編號:201601106
陜西省教育廳專項科研計劃項目(12JK0559);陜西省自然科學(xué)基礎(chǔ)研究計劃項目(2014JM2-6117)
廖延娜(1974—),女,安徽懷遠人,碩士,副教授。研究方向:電路與系統(tǒng)及信號與信息處理研究。