李新濤, 徐汀榮
(蘇州大學(xué)計算機科學(xué)與技術(shù)學(xué)院,江蘇蘇州 215006)
人臉識別技術(shù)是依據(jù)人的臉部特征(如統(tǒng)計或幾何特征)自動進(jìn)行身份鑒別的一種生物識別技術(shù)。該技術(shù)采用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進(jìn)而對檢測到的人臉進(jìn)行辨識。達(dá)到識別不同人身份的目的,其中涉及一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、預(yù)處理、人臉特征提取、記憶存儲和比對辨識,人臉識別技術(shù)在現(xiàn)代生活中具有廣泛的應(yīng)用前景,可用于金融服務(wù)、電子商務(wù)、政府部門、公共管理、國家安全、信息安全、智能家居、人機交互等領(lǐng)域,人臉自動識別近年來已成為模式識別和人工智能領(lǐng)域的研究熱點之一。
Gabor小波變換核函數(shù)具有與人類大腦皮層簡單細(xì)胞的二維反射區(qū)相同的特性,即能夠捕捉到對應(yīng)于空間頻率(尺度)、空間位置及方向選擇性的局部結(jié)構(gòu)信息,Gabor小波的這種特性使得其對于亮度和人臉表情的變化不敏感,被廣泛應(yīng)用于人臉特征提取。文獻(xiàn)[1]中提出的基于相似值的相似性判別在光照比較均勻、無遮擋、人臉局部變形不大的情況下取得了較好的識別率,但是在光照不太均勻如光照過強、有陰影、有遮擋或者有比較大的局部變形,如眼睛閉合等比較常見的情況下效果不很理想。究其原因就是在特定區(qū)域中的特征點與庫中的任何人臉模型上的對應(yīng)特征點都不相似,即特征失效。文獻(xiàn)[2]提出了基于投票的相似性函數(shù)方法,該方法通過對特征失效的特征進(jìn)行剔除,以降低失效特征對人臉識別效果的影響,該方法在環(huán)境較惡劣的條件下取得了較滿意的識別效果。然而,由于利用Gabor變換獲得的特征是圖像的局部特征,因而在圖像不同位置獲得特征的分類能力并不相同。文獻(xiàn)[2]的方法不利于不同特征的分類能力不同作為判據(jù)。因此,本文通過分析人臉不同部位特征點Gabor特征的識別能力,提出了一種結(jié)合加權(quán)相似值和相似性投票的視頻流人臉識別方法。
二維Gabor小波變換[3,4]能夠?qū)⑾噜弲^(qū)域的像素聯(lián)系起來,可以從不同的頻率尺度和方向反映局部范圍內(nèi)圖像像素灰度值的變化,是目前主流的人臉描述方法之一。此外,Gabor小波變換系數(shù)作為人臉特征所完成的人臉識別具有良好的視覺特性和生物學(xué)背景,非常有利于人臉識別。Gabor小波核函數(shù)可用(1)式描述[5]:
其中,x為給定位置的圖像坐標(biāo);kj為濾波器的中心頻率,波矢量k j為:
上述的每個Gabor濾波器都可以對應(yīng)于一個初等視覺皮層簡單細(xì)胞的空間感受野的信號處理過程,對圖像處理而言,Gabor濾波器函數(shù)[6]將在與其振蕩方向垂直的邊緣處產(chǎn)生強烈的響應(yīng),而邊緣對三維物體的識別是至關(guān)重要的。也就是說,Gabor濾波器可以看作一個對方向和尺度敏感的有方向性的顯微鏡,能夠表達(dá)圖像中一些具有相應(yīng)方向尺度信息的、局部的顯著特征,從而可以形成亮度圖像的局部特征圖譜,這些局部特征形成了原始輸入圖像的一種魯棒、緊湊的特征表示。
圖1 5個尺度、8個方向的Gabor濾波器的實部
圖2 5個尺度上Gabor核函數(shù)的幅值
二維Gabor小波變換描述了圖像I上給定一點x0附近區(qū)域的灰度特征,對圖像I的濾波過程可以通過Gabor函數(shù)與圖像的卷積來實現(xiàn),即
二維Gabor小波變換的優(yōu)點為:核函數(shù)中括號的第2項去除直流分量,使得Gabor特征對光強變化具有魯棒性;對比度的變化則由于小波進(jìn)行了規(guī)范化而具有魯棒性是高斯函數(shù),這實際上是通過加窗限制了振蕩函數(shù)的范圍,使其只在局部有效,這樣使得Gabor濾波可以容忍圖象有一定的扭曲情況。
圖3是ν=2、μ=2時人臉圖像的Gabor小波濾波結(jié)果圖。
圖3 人臉的Gabor小波濾波結(jié)果圖
對特征點的Gabor特征J:
特征間的相似度量函數(shù)有如下2種[7]:
(1)不考慮相位,只考慮幅值,比較2個特征的內(nèi)積,稱為角度無關(guān)的相似函數(shù),定義如下:
(2)角度相關(guān)的相似函數(shù),定義如下:
其中
這里:
大量實驗表明,角度相關(guān)的相似函數(shù)具有更好的性能。
實驗[2]表明在采用Gabor特征的條件下,人臉存在能夠獲得良好分類能力的局部區(qū)域,而Gabor特征在人臉不同位置的分類能力則有較大差異。
此外分類能力最大的區(qū)域在眉毛附近,而嘴、鼻子等位置并沒有顯示出突出的分類能力。因此為了降低計算量,加快特征提取和識別速度,本文的特征點只選取在眉毛和眼睛部位,即在人臉的眉毛和眼睛部位,選取5×10的網(wǎng)格(共50個特征點)作為候選特征區(qū)域,其中第2行第3列為右眉毛位置;第2行第8列為左眉毛位置;第3行第3列為右眼所在的位置;第3行第8列定為左眼所在的位置,然后在此基礎(chǔ)上均勻分布其它網(wǎng)格點。
最后形成的網(wǎng)格點如圖4所示。
圖4 人臉特征點提取
設(shè)有L個樣本圖像It,t=1,2,…,L,分別屬于C類,每幅圖像采樣N點(各點隸屬于圖像中物體的某個固定位置),各點的Gabor特征可以表示為w(i)tn={w(i)tn j,j=1,2,…,40},其中,i=1,2,…,C為樣本所屬類別;t=1,2,…,L為樣本標(biāo)號;n=1,2,…,N為特征點標(biāo)號。則樣本特征點的類內(nèi)和類間散布矩陣分別為:
根據(jù)文獻(xiàn)[2]中提出的圖像特征點的相似度投票函數(shù)和文獻(xiàn)[1]中定義的基于相似值的相似性函數(shù),定義新的相似性函數(shù)為:
其中,kn為第n個特征點的權(quán)重,即
從(12)式可以看出,對于圖像和人臉模型中比較相似的特征點,設(shè)置其相似性權(quán)值為Rn,否則設(shè)置其權(quán)值為0,從而體現(xiàn)了不同特征點的分類能力,而且去掉了失效的特征點對識別結(jié)果的影響。識別時,取待測試視頻的每一幀計算相似度,然后對取得最大相似度值的人臉模型投一票,最后統(tǒng)計所有幀對人臉模型的投票,投票最多者為最后識別結(jié)果。
實驗選取測試集為30人,每人2段視頻流,每段100幀,視頻幀均為320×240大小。視頻幀中人臉可以有光照變化、局部形變和遮擋。系統(tǒng)中每個人用從人臉庫的視頻流中手工選取的一張正面、光照均勻、無遮擋、局部形變小的人臉圖片作為人臉模型,并標(biāo)注特征點區(qū)域。在特征點提取階段,用Adaboost算法[8,9]提取人臉,然后對提取的人臉用積分投影方法[10]進(jìn)行人眼和眉毛區(qū)域定位,最后用本文方法進(jìn)行人臉相似性判決。
表1列出單采用基于相似值的相似性函數(shù)和基于投票的相似性函數(shù)以及本文方法的實驗結(jié)果對比。從實驗結(jié)果可以看出,本文采用的方法比單獨使用基于相似值的相似函數(shù)和基于投票的相似函數(shù)有更高的識別率,而且平均識別時間也大大降低。
表1 3種方法實驗結(jié)果對比
本文在前人研究工作的基礎(chǔ)上,通過分析不同特征點Gabor特征的分類能力,提出了一種結(jié)合加權(quán)相似值和相似性投票的視頻流人臉識別方法。通過設(shè)置權(quán)值為類間和類內(nèi)散布矩陣的比值,增加相似度大的特征點的比重,同時去除失效的特征點對分類結(jié)果的影響,然后根據(jù)每一幀視頻的相似度對最終識別結(jié)果進(jìn)行投票。通過在視頻集上實驗,證明該方法提高了識別率,同時縮短了識別時間,具有可行性。
本文初稿首次刊登于《計算機技術(shù)與應(yīng)用進(jìn)展?2010》
[1] Wiskott L.The role of topographical constraints in face recognition[J].Pattern Recognition Letters,1999,20(1): 89-96.
[2] 薛理立,艾海舟.基于彈性圖匹配的實時視頻流人臉識別[J].計算機科學(xué),2003,30(11):65-68.
[3] 葉敬福,詹永照.基于Gabor小波變換的人臉表情特征提取[J].計算機工程,2005,31(15):172-174.
[4] 姜 婷.基于提升技術(shù)的三維小波視頻時域濾波方案設(shè)計[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2009,32(5): 670-673.
[5] 馬小燕,楊國勝,范秋鳳,等.基于Gabor小波和二維主元分析的人臉識別[J].計算機工程與應(yīng)用,2006,42(3): 55-57.
[6] Liu C,W echsles H.Independen t component analysisof Gabor features for face recognition[J].IEEE Transactions on Neu ral Netw orks,2003,14(4):919-928.
[7] 宗君斌.基于Gabor小波系數(shù)融合的人臉識別[D].杭州:浙江工業(yè)大學(xué)信息工程學(xué)院,2009.
[8] 錢志明,徐 丹.一種Adaboost快速訓(xùn)練算法[J].計算機工程,2009,35(20):187-191.
[9] Freund Y,Schapire R E.A decision-theo retic generalization of on-line learning and an application to boosting[J].Jou rnal of Com puter and Sy stem Scien ces,1997,55(1): 119-139.
[10] 章 玲,蔣建國,齊美彬.一種微分與積分投影相結(jié)合的眼睛定位方法[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2006,29 (2):182-185.