摘 要:人臉特征點(diǎn)的定位是自動(dòng)人臉識(shí)別系統(tǒng)和人臉表情識(shí)別的重要組成部分,小波變換是近年發(fā)展起來的一種有效的信號(hào)分析工具。在小波變換基礎(chǔ)上,提出了一種基于多尺度梯度矢量的對(duì)稱變換方法,將此方法應(yīng)用于人臉特征點(diǎn)定位,不僅減少了計(jì)算量,而且提高了定位準(zhǔn)確度,同時(shí)對(duì)光照變化和人臉表情變化也具有很強(qiáng)的魯棒性。
關(guān)鍵詞:小波變換;特征點(diǎn)定位;對(duì)稱變換;融合
中圖分類號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1004-373X(2008)07-154-03
Location of Facial Feature Based on Wavelet Transform and Gradient Vector
CHEN Jie,WANG Dianhong
(Institute of Mechanical and Electronic Engineering,China University of Geosiciences,Wuhan,430074,China)
Abstract:Location of facial feature plays an important part in automatic recognition technology of facial and facial expression,and wavelet transform is a new signal analysis theory developed in recent years.A symmetry transform approach based on multi-scale gradient vector and wavelet transform is proposed.This method applies to location of facial can yield results with higher location accuracy.In addition,the method is also robustness to different illuminant condition and facial expression.
Keywords:wavelet transform;feature points location;symmetry transform;fusion
隨著多媒體技術(shù)的發(fā)展,人臉圖像在人機(jī)交換系統(tǒng)、視頻監(jiān)測(cè)系統(tǒng)、人臉圖像數(shù)據(jù)庫管理系統(tǒng)、人臉檢測(cè)與識(shí)別系統(tǒng)等領(lǐng)域中具有越來越重要的作用。而在這些應(yīng)用系統(tǒng)當(dāng)中,人臉特征定位是重要組成部分之一,是許多其他的人臉圖像研究工作的前提,直接關(guān)系到其他研究工作能否順利地進(jìn)行。目前關(guān)于特征點(diǎn)定位的方法很多,有的研究人員提出了將人臉視為一個(gè)整體模式馬塞克方法[1]和特征臉方法[2]等。還有的提出了基于人臉個(gè)別器官的特征點(diǎn)的定位方法,如:神經(jīng)網(wǎng)絡(luò)方法[3],廣義對(duì)稱方法[4]等。針對(duì)上述算法適用性不夠廣泛,對(duì)圖像要求較高的缺點(diǎn),提出了融合小波信息的對(duì)稱性檢測(cè)方法并應(yīng)用于人臉特征點(diǎn)定位。小波變換因其良好的時(shí)頻局部化特性,能夠提供最為實(shí)質(zhì)的人臉特征、削弱噪聲的干擾、減少計(jì)算量,因此將小波變換應(yīng)用于人臉特征點(diǎn)定位具有良好的發(fā)展前景。
1 基于小波變換的眼睛定位
1.1 圖像信號(hào)的小波分解
在圖像處理中,信號(hào)是一個(gè)能量有限的二維函數(shù) f(x,y)∈L2(R2) ,對(duì)于多分辨率空間{Vj}j∈Z,如果尺度函數(shù)是可分的,即:
φ(x,y)=φ(x)φ(y)[JY](1)
圖像f(x,y)在分辨率2-j下的逼近仍然等于在對(duì)應(yīng)多分辨率空間Vj上的正交投影,可由以下內(nèi)積表征:
Sj=[
而在分辨率2- j+1離散逼近圖像Sj-1和在分辨率2-j下的離散逼近圖像Sj的信息差可由三個(gè)小波基:
類似于一維情況,式(2)和式(4)計(jì)算Sj和Dk,j(k=1,2,3)的內(nèi)積可以用二維卷積來表征。由于3個(gè)小波Ψ1(x,y),Ψ2(x,y)和Ψ3(x,y)完全由可分離的φ(#8226;)和Ψ(#8226;)的乘積給出,所以他們的卷積寫成:式(5)表明,在二維情況,Sj和Dk,j的卷積可以分別沿x軸和y軸對(duì)信號(hào)進(jìn)行濾波來計(jì)算。這樣,對(duì)于任意J>0,離散圖像S0完全由(3J+1)幅離散圖像表示:這組圖像稱為二維正交小波表示,Sj是一幅參考的粗糙圖像,Dk,j給出不同方向和不同分辨率的細(xì)節(jié)圖像,在算法實(shí)現(xiàn)上,二維圖像的小波分解可以用類似于一維分解的樹狀算法來實(shí)現(xiàn)。二維小波變換可以看作是分別沿x軸和y軸的一維小波變換,在每一層分解中,Sj-1被分解成Sj,D1,j,D2,j和D3,j,如圖1所示。
圖1 二維小波分解
由圖2可見,我們首先用Sj-1的行與一維濾波器卷積,并經(jīng)2∶1選抽;再用生成信號(hào)的列與另一維濾波器卷積,也經(jīng)2∶1選抽。
圖2 小波分解示意圖
1.2 眼睛定位算法
[BT4]1.2.1 廣義對(duì)稱變換
圖像上任意一點(diǎn)pk(xk,yk)k=1,…,K,(K為圖像上像素總數(shù))的方向梯度表示為:
pk=xpk,ypk[JY](7)
梯度矢量相角為:
θk=arctanxpk[HT3]/[HT10.SS]ypk[JY](8)
對(duì)于圖像上任意兩點(diǎn)pi,pj,其連線l與水平線的逆時(shí)針夾角記為aij,aij的取值為[0,π],定義鄰域:
Γ(p)=(i,j)pi+pj2=p[JY](9)
他是以p為連線中心點(diǎn)的點(diǎn)對(duì)集。
定義i,j間高斯距離為:
Dσ(i,j)=12πσexp-‖pi-pj‖2σ[JY](10)
其中σ用于控制距離有效范圍,稱為距離控制因子。方向因子記為:
p(i,j)=[-cos(θi+θj-2aij)][-cos(θi-θj)][JY](11)
則點(diǎn)p處廣義對(duì)稱變換的強(qiáng)度定義為:
Mσ(p)=∑(i,j)∈Γ(p)C(i,j)[JY](12)
其中C(i,j)=Dσ(i,j)p(i,j)rirj,rk=log(1+‖pk‖)。
廣義對(duì)稱變換的方向定義為:
φ(p)=Maxφ(p)φ(p)=θi+θj2,(i,j)∈Γ(p)[JY](13)
通過計(jì)算圖像各點(diǎn)的對(duì)稱強(qiáng)度Mσ(p),就可找出局部強(qiáng)對(duì)稱點(diǎn),從而實(shí)現(xiàn)對(duì)稱物體的對(duì)稱中心準(zhǔn)確定位,并可根據(jù)φ(p)來確定其對(duì)稱方向。
1.2.2 小波算法融合
實(shí)驗(yàn)證明,雖然廣義對(duì)稱算法對(duì)特定的人臉圖像有較好的定位效果,但他應(yīng)用成像質(zhì)量較差的人臉圖像,不僅定位準(zhǔn)確率比較低,而且所用時(shí)間長(zhǎng)。而小波的應(yīng)用恰能將圖像的細(xì)節(jié)信息提取出來,利用反對(duì)稱正交小波的微分功能和小波變換的多分辨特性,實(shí)現(xiàn)由粗至精的檢測(cè)過程,這樣不僅減少了工作量,而且提高了定位精度。由于低分辨率圖像只保存了較強(qiáng)的大結(jié)構(gòu)對(duì)象的梯度信息,因而本方法對(duì)噪聲也有很強(qiáng)的抑制作用,降低的分辨率圖像同時(shí)減弱了光線對(duì)定位的影響。
[BT4]1.2.3 待選區(qū)域生成
首先對(duì)圖像進(jìn)行反對(duì)稱雙正交小波分解,得到j的近似aj和三個(gè)方向的細(xì)節(jié)d(1)j,d(2)j,d(3)j;然后利用d(1)j和d(3)j的每一列做一次重構(gòu)便得到了第j+1級(jí)近似圖像的x方向的偏導(dǎo)數(shù)d(x)j+1;同樣利用d(2)j和d(3)j的每一行做一次重構(gòu)便得到了第j+1級(jí)的y方向的偏導(dǎo)數(shù)d(y)j+1;最后可以得到對(duì)于圖像的j+1級(jí)近似的梯度矢量[TX→]j+1=(d(x)j,d(y)j),這樣就在小波分解域中實(shí)現(xiàn)了對(duì)稱變換,此時(shí),距離控制因子也應(yīng)隨著分辨率級(jí)別的變化而變化,即σj=σ02-j。采用小波域?qū)ΨQ變換對(duì)雙眼進(jìn)行定位時(shí),將眼部分為圓形對(duì)稱區(qū)和橢圓行對(duì)稱區(qū),依據(jù)廣義對(duì)稱變換梯度矢量的局部算子,從梯度圖像出發(fā)建立眼睛模型。對(duì)于灰度圖像矩陣采用差分運(yùn)算代替求導(dǎo),梯度方向定義為高灰度到低灰度,方向梯度表示為:
xS[i][j]=0.5(S[i+1][j]-S[i-1][j])[JY](14)
yS[i][j]=0.5(S[i][j-1]-S[i][j+1])[JY](15)
要選擇恰當(dāng)?shù)木嚯x控制因子σ,以便準(zhǔn)確地進(jìn)行人臉定位,對(duì)于以上眼睛梯度簡(jiǎn)化模型。
取距離控制因子σ0為瞳孔半徑,以及σ1=1.5σ0,σ2=3σ0;則高斯距離因子表示為:
[HT5”]
Dσ(i,j)=12π σ0exp-(xj-xi)2+(yi-yj)22σ02
12πσ1σ2 exp-(xj-xi)22σ21exp-(yi-yj)22σ22[JB)][JY][HT10.SS]
(16)
考慮到眼球常常部分被上下眼皮所覆蓋,可以限制|yi-yj|<2(σ0+1)。在圓行區(qū)域內(nèi)部做對(duì)稱變換時(shí),將廣義對(duì)稱方向權(quán)重因子p(i,j)修改為:
p(i,j)=[+cos(θi-aij)cos(θj-aij-π]aij-π2[JY](17)
表達(dá)式因子[+cos(θi-aij)cos(θj-aij-π)]的設(shè)置能增強(qiáng)對(duì)圓形物體檢測(cè),因?yàn)閷?duì)于圓形邊緣上的兩對(duì)稱點(diǎn)i,j,其梯度方向θi,θj與i,j連線成0°或180°。而考慮到眼球可能部分地被上、下眼皮所覆蓋,所以引入了因子|aij-π2|以增大水平方向?qū)ΨQ點(diǎn)權(quán)重,減弱垂直方向的強(qiáng)對(duì)稱性所產(chǎn)生的強(qiáng)對(duì)稱點(diǎn),所以此算法對(duì)眼睛張開程度較小的圖像也具有較好的定位能力。
[BT4]1.2.4 待選點(diǎn)的篩選
從人臉圖像的對(duì)稱強(qiáng)度圖中取出多個(gè)對(duì)稱性最強(qiáng)的點(diǎn),采用模板匹配方法對(duì)這些點(diǎn)進(jìn)行篩選。
模板的生成:為了更加突出人臉的共性,把圖像庫中標(biāo)準(zhǔn)人臉進(jìn)行小波變換后取取其低頻成分,這樣把表示不同人之間的特性差異盡量淡化。通過對(duì)計(jì)算ATT實(shí)驗(yàn)室的ORL人臉庫所選取的150張人臉對(duì)應(yīng)像素的均值生成模板。模板如圖3所示。
圖3 人臉模板
設(shè)模板矩陣為B[i,j],人臉模板與候選區(qū)域的相關(guān)系數(shù)為R,則R表示如下:
R=∑nj=1∑mi=1(A[i,j]-μA)(B[i,j]-μB)[∑nj=1∑mi=1(A[i,j]-μA)2][∑nj=1∑mi=1(B[i,j]-μB)2][JY](18)
式中:μA為候選區(qū)域的均值,μB為模板的均值,R值越大表示模板與候選區(qū)域的匹配程度越高。
[BT4]1.2.5 算法流程
以上對(duì)基于小波的定位方法進(jìn)行了詳細(xì)闡述,其算法流程圖如圖4所示。
圖4 算法流程圖
2 實(shí)驗(yàn)結(jié)果與分析
利用上述方法我們對(duì)人臉圖像眼部的定位進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)的人臉圖片主要來源于網(wǎng)絡(luò)和數(shù)碼相機(jī),包括300個(gè)人臉圖像,這些圖像中包含表情、光照的一定變化,還有些戴眼鏡,有些還有稍微偏轉(zhuǎn)。實(shí)驗(yàn)表明本文所使用的方法準(zhǔn)確率達(dá)到93%以上,對(duì)鏡片反光的干擾有較好的魯棒性。實(shí)驗(yàn)部分的定位結(jié)果如下:
圖5 自拍圖像在j=-1時(shí)用于帶眼鏡時(shí)定位結(jié)果
圖6 自拍圖像在j=-1級(jí)下的定位結(jié)果
表1 定位速度和準(zhǔn)確率的比較實(shí)驗(yàn)結(jié)果
分辨率級(jí)別[]0[]-1[]-2[]人臉特征[]準(zhǔn)確率
相對(duì)耗時(shí)[]0.985[]0.059[]0.007[]眼鏡干擾[]91.5%
準(zhǔn)確率[]82.4%[]94.5%[]88.3%[]眼睛閉合[]89.2%
實(shí)驗(yàn)結(jié)果分析:
在人臉特征點(diǎn)定位中,人臉圖像不能太大,圖像越大,需處理的信息數(shù)據(jù)越多,定位速度就越慢。實(shí)驗(yàn)結(jié)果可得到:
(1) 使用反對(duì)稱雙正交小波對(duì)圖像做小波分解,能使工作量大大節(jié)省。
(2) 在分辨率j=-2時(shí)定位效果最好。
(3) 對(duì)戴眼鏡和眼睛閉合的情況下,與其他方法相比,本文所使用的方法能取得較好的效果。
3 結(jié) 語
本文提出了一種基于小波變換的人臉特征點(diǎn)定位方法,通過計(jì)算小波變換后圖像每一點(diǎn)的方向梯度和對(duì)稱度,選取對(duì)稱強(qiáng)度強(qiáng)的點(diǎn),再結(jié)合小波變換的多分辨特性,即先在低分辨率上實(shí)現(xiàn)快速粗定位,再根據(jù)粗定位的結(jié)果局部地逐級(jí)提高定位精度,最后選取對(duì)稱強(qiáng)度最強(qiáng)的兩個(gè)點(diǎn)作為最后的定位結(jié)果,此方法應(yīng)用與人臉眼睛定位,不僅滿足了高精度定位的要求,而且計(jì)算工作量也有較大的減少,對(duì)光照變換也有一定的魯棒性。
參 考 文 獻(xiàn)
[1]Yang G Z,Huang T S.Human Face Detection in a Complex Background[J].Pattern Recognition,1994,27(1):53-63.
[2]Turk M,Pentland A.Eigenfaces for Recognition[J].Cognitive Neuro-science,1991,3(1):71-79.
[3]Lin S H.Face Recognition/Detection by Probabilistic Decision-based Neural Network[J].IEEE Trans.Neural Networks,1997(8):114-132.
[4]Reisfeld D,Wolfson H,Eshurun Y Y.Context-free Attentional Operators:The Generalizes Symmetry Transform[J].Computer Vision,1995,14:119-130.
[5]彭進(jìn)業(yè),俞卞章,王大凱.多尺度對(duì)稱變換及其應(yīng)用于定位人臉特征點(diǎn)[J].電子學(xué)報(bào),2002,30(3):363-366.
[6]Kawato S,Ohya J.Two-step Approach for Real-time Eye Tracking with a New Filtering Technique[A].IEEE International Conference on Systems,Man Cybernetics,2000.
[7]王忠,胡步發(fā),嚴(yán)世榕.一種改進(jìn)的對(duì)稱變換應(yīng)用于人臉圖像眼睛定位[J].計(jì)算機(jī)應(yīng)用,2004,30(11):119-121.[8]Garcia C,Zikos G,Tziritas G.Face Detection in Color Images Using Wavelet Packet Analysis[EB/OL].http://www.csd.uch.gr/tziritas/papers/ICMCS-99.pdf.2004.
作者簡(jiǎn)介
陳 潔 女,1982年出生,湖北荊門人,碩士研究生。主要從事圖像處理與傳輸,人工智能與模式識(shí)別等方面的研究。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。