張玉明,高 杰,張海燕
(1.蕪湖職業(yè)技術(shù)學院 電氣學院,安徽 蕪湖 241001;2.合肥工業(yè)大學 計算機與信息學院,安徽 合肥 230009)
?
基于矩-傅里葉描述子的不同姿態(tài)三維人臉識別
張玉明1,高杰2,張海燕2
(1.蕪湖職業(yè)技術(shù)學院電氣學院,安徽蕪湖241001;2.合肥工業(yè)大學計算機與信息學院,安徽合肥230009)
摘要:三維人臉相比二維人臉包含更豐富的信息,而且能夠克服姿態(tài),表情,光照因素的影響,更好地表示人臉特征,從而逐漸受到廣泛的關(guān)注和重視。文中對不同姿態(tài)下的三維人臉深度圖,先用微分幾何相關(guān)知識把該圖校正到正中面,然后通過提取人臉面部的等高線特征,將三維人臉變成容易處理的二維曲線,針對如何能夠更好的描述該二維曲線,提出了一種把矩和傅里葉描述子相結(jié)合的新方法,最后利用提取的曲線特征進行人臉識別。實驗結(jié)果表明,該方法具有很好的實時性和更強大的形狀區(qū)分能力,魯棒性高,優(yōu)于傳統(tǒng)傅里葉描述子提取等高線特征的方法。
關(guān)鍵詞:深度圖;矩;傅里葉描述子;人臉識別
人臉識別和手紋識別,指紋識別,聲音識別等一樣,是一種基于生命個體特有的身份認證技術(shù),它通過提取分析人臉視覺特征信息進行身份認證,具有非接觸性,不侵犯隱私等特點,具有非常好的應(yīng)用前景,例如在電子商務(wù),門禁系統(tǒng)中的應(yīng)用等。
最初的人臉識別主要是基于二維人臉特征,在條件適宜的情況下,可取得比較好的識別效果。但在實際應(yīng)用中,二維人臉識別方法無法克服多種因素的影響,識別效果不夠理想。三維人臉含有更加豐富的臉部特征信息,而且基于三維人臉的識別方法相比較二維人臉,對各種因素比如不同的光線或者不同的表情等因素有更強的魯棒性,近些年三維成像技術(shù)也逐漸走向成熟,這有益于人臉識別技術(shù)的研究,國內(nèi)外學者投入很大的精力和興趣在這個領(lǐng)域。
本文中提出的方法是先由三維實時成像系統(tǒng)獲取人臉深度圖,然后對不同特點的深度圖進行校正,最后提取校正后的人臉深度圖的等高線,從而將三維深度圖轉(zhuǎn)變?yōu)橐子谔幚砗头治龅亩S曲線。本文主要研究如何更好更快地描述二維曲線特征,用于后面的人臉識別。傳統(tǒng)的形狀不變矩和傅里葉描述子是兩種經(jīng)典的形狀描述方法,在近幾十年已經(jīng)得到國內(nèi)外學者的深入研究。但是傳統(tǒng)的形狀不變矩方法計算量大而復雜,不適合不同姿態(tài)的三維人臉深度圖,人臉深度圖對實時應(yīng)用要求高。傳統(tǒng)的傅里葉描述法計算量小但穩(wěn)定性不高,魯棒性低。本文提出把矩特征和傅里葉描述子結(jié)合起來來描述人臉的等高線,其計算量小,區(qū)分形狀能力更強,把提取后的特征應(yīng)用在人臉識別后,識別效果更好,識別速度更快。
1不同姿態(tài)下的人臉深度圖校正
深度圖中每一點的像素值代表該點的深度,能體現(xiàn)出人臉在三維空間上內(nèi)在的結(jié)構(gòu)特征[1],在實際拍攝過程中,攝像頭一般不是正對人臉,所以得到的三維深度圖或左或右或上或下有一些偏移,不是標準的“正中面”圖像[2-5]。可利用三維人臉數(shù)據(jù)的幾何不變性對其進行校正以便獲得更好的識別效果。校正后的人臉圖像可以用一種離散曲面表示。該曲面S:z=f(x,y)中任意一點(x,y,f(x,y))的高斯曲率可表示為:
把整個曲面根據(jù)高斯曲率和平均曲率大小分成不同的區(qū)域,若K>0,H<0,則是頂面區(qū)域, 若K<0,H<0則是鞍脊面區(qū)域等等,再找出一些關(guān)鍵點。由微分幾何相關(guān)知識和人的臉部特征可以推出,頂面區(qū)域內(nèi)高斯曲率最大處是鼻尖點,左右眼點也是另一個局部區(qū)域中高斯曲率最大處,而鞍脊點是鞍脊面區(qū)域內(nèi)高斯曲率最小處[6]。找到這些關(guān)鍵點,在關(guān)鍵點定位的基礎(chǔ)上,通過計算鼻尖點、鞍點和左右眼點在空間位置的坐標,可以準確估計人臉的偏轉(zhuǎn)角度。人臉繞橫向(x軸)偏轉(zhuǎn)的角度α表示為鼻尖點與三維坐標原點連線在縱向(y軸)和深度(z軸)平面內(nèi)偏轉(zhuǎn)的角度,體現(xiàn)人臉俯仰情況。人臉繞y軸偏轉(zhuǎn)的角度可表示為鼻尖點繞軸偏轉(zhuǎn)的角度,體現(xiàn)人臉的扭轉(zhuǎn)情況。人臉繞z軸偏轉(zhuǎn)的角度γ表示為左右眼點與水平方向的夾角,體現(xiàn)人臉的偏轉(zhuǎn)情況。α、β 、γ角度的計算公式如下:
結(jié)合計算的三個方向上的旋轉(zhuǎn)角度,將人臉深度圖像校正到“正中面”,旋轉(zhuǎn)后的人臉部分區(qū)域會出現(xiàn)“空洞”,利用相鄰點的數(shù)據(jù)和對稱區(qū)域的相關(guān)數(shù)據(jù)來填補這些“空洞”,從而得到完整的“正中面”的人臉深度圖像。
2矩-傅里葉描述子算法
將三維人臉視為一個曲面,提取校正后的三維人臉深度圖的等高線來描述人臉的幾何特征。每條等高線都是封閉的二維曲線,為了更好的描述曲線特征,提出把不變矩和傅里葉描述子方法結(jié)合起來,即矩-傅里葉描述子法。該算法的基本過程是首先把等高線看成是是由N個離散點組成的,將這些離散點用直線段相連,形成連續(xù)邊界曲線的封閉區(qū)域。計算區(qū)域的質(zhì)心,以質(zhì)心為中心,等角度的向外作N條射線,這N條射線和邊界直線段將區(qū)域分割成N個等角度的扇形區(qū)域,在每個扇形區(qū)域計算同一種矩,用計算出來的一系列矩值反映曲線的形狀特征,最后對這些矩特征值進行離散傅里葉變換并歸一化,得到形狀特征描述子,用來表示人臉曲面的等高線。
圖1 扇形區(qū)域劃分示意圖
2.1確定閉合區(qū)域的質(zhì)心
數(shù)字圖像的(p+q)階的計算公式如下:
其中f(x,y)是圖像的密度函數(shù),一般指的是像素點(i,j)灰度值函數(shù)。
圖像質(zhì)心(Cx,Cy)坐標為:
2.2基于邊界點的矩特征值快速算法
由于等高線是二維的閉合曲線,由N個離散點組成,相鄰的邊界點和質(zhì)心之間用線連接,形成一個三角形,N個邊界點形成N個三角形,整個等高線的矩可以通過這些三角形的矩獲得。三角形劃分示意圖如下圖,分為三個區(qū)域,區(qū)域一是由點(a,b)和(a,0)構(gòu)成的三角形,區(qū)域二是由點(0,0),(a,b)和(c,0)構(gòu)成的梯形,區(qū)域三是由點(0,0),(c,d)和(c,0)構(gòu)成的三角形。下面給出3個區(qū)域的6個低階矩公式:
圖2 三角形示意圖
區(qū)域一:
m00,1=ab/2,m01,1=ab2/6,m10,1=a2b/3,m11,1=a2b2/8,m02,1=ab3/12,m20,1=a3b/4.
區(qū)域二:
m00,2=(c-a)(d+b)/2m10,2=(d-b)(c2+ac+a2)/3+(bc-ad)(c+a)/2
m01,2=(c-a)(d2+db+b2)/6,
m02,2=(c-a)(d3+bd2+b2d+b3)/12
m20,2=(d-b)(c3+ac2+a2c+a3)/4+(bc-ad)(c2+ac+a2)/3
區(qū)域三:
計算公式和區(qū)域一是一樣的,只需要將a換成c,b換成d。
三角形的(p+q)階矩為:
mpq=mpq,1+mpq,2-mpq,3
為了定義一個簡單,運算量小,同時又能夠識別形狀特征,我們選取Hu提出的七個不變矩中的第一個矩來作為扇形區(qū)域的矩特征值:
φ=u20+u02
其中u20,u02由幾何矩mpq根據(jù)下式可得:
以等高線所圍區(qū)域質(zhì)心坐標為中心,向外等角度作出N條射線,該射線與輪廓相交,形成N個等角扇形區(qū)域,根據(jù)上面方法計算每個扇形區(qū)域的矩特征值,按照逆時針旋轉(zhuǎn)方向存放該值φ。
2.3傅里葉描述子及其歸一化
傅里葉描述子是物體形狀邊界曲線的傅里葉變換系數(shù),他是物體形狀邊界曲線的頻域分析的結(jié)果[7]。三維人臉圖像的任何一條等高線可以作為離散點的坐標序列:
z(n)=[x(n),y(n)]n=0,1,…,N-1
該條等高線可以經(jīng)過取樣為N個離散點,這些離散點可以用復數(shù)和二維直角坐標系來表示:
z(n)=x(n)+jy(n)n=0,1,…,N-1
k=0,1,…,N-1
因為傅里葉級數(shù)的能量大多主要集中在低頻分量,往往利用傅里葉描述子的前M個低頻分量可以近似恢復原始等高線的形狀。
上面的傅里葉描述子將邊界曲線等距離離散化,得到N個離散點,本文算法中計算的矩特征值序列已經(jīng)是對整個區(qū)域進行等角度均勻分割后得到的,可以直接對得到的矩值序列作離散傅里葉變換。歸一化的傅里葉描述子定義為:
3相似度計算
取一幅校正后的人臉深度圖,隨意選取曲面中的n條等高線,每條等高線使用前m個的傅里葉描述子,傅里葉描述子使用復數(shù)形式,那么整幅人臉可以由個傅里葉描述子描述其特征,此特征可表示為:Ip(t)=xp(t)+i*yp(t)t=1,2,…,m×n
在人臉識別時,選取不同人臉圖像特征之間最近的距離為識別結(jié)果。不同人臉深度圖特征之間的距離定義為:
4實驗與結(jié)果分析
下面通過一個實驗,與傳統(tǒng)的傅里葉描述子相比較,來證明本文的矩-傅里葉描述子算法有更強的形狀區(qū)分能力。下圖7條魚屬于同一形狀,但是分別具有不同的旋轉(zhuǎn)角度和不同的尺寸。用本算法來計算圖3中同種形狀間的相似度差異,其類內(nèi)平均差異度為0.02217。再計算圖4中所示的不同形狀間的差異度,其類間平均差異度為0.45904。類間的差異度和類內(nèi)的差異度的比值為0.45904/0.02217=20.70545。若用傳統(tǒng)的傅里葉描述子來計算,則類內(nèi)平均差異度為0.02315,類間平均差異度為0.27042,比值為11.68120。實驗表明矩傅里葉描述子比傳統(tǒng)的傅里葉描述子有更強的形狀區(qū)分能力。
圖3 7種同樣的形狀
圖4 7種不同的形狀
5結(jié)論
本文針對不同姿態(tài)的三維人臉識別,提出了一種快速有效的人臉識別方法。該方法利用微分幾何理論將不同姿態(tài)的三維人臉深度圖像校正到“正中面”,然后提取代表人臉曲面幾何性質(zhì)的等高線,把矩和傅里葉描述子結(jié)合起來提取人臉等高線特征,最后把提取的特征分類,應(yīng)用在人臉識別中,獲得了比較高的識別率。
參考文獻:
[1]田文君.基于深度圖像的三維人臉特征提取[D].北京:北京交通大學,2009.
[2]李茜,龔勛,王國胤.基于曲率和紋理信息的三維人臉特征提取[J].重慶郵電大學學報:自然科學版,2008,20(6):729-732, 753.
[3]葉長明,蔣建國,詹曙,等.不同姿態(tài)人臉深度圖識別的研究[J].電子測量與儀器學報,2011,25(10):870-878.
[4]胡珍珍.基于深度數(shù)據(jù)的人臉旋轉(zhuǎn)角度估計及三維人臉識別的研究[D].合肥:合肥工業(yè)大學,2011.
[5]藍楊,王紫霏,吳楊,等. 一種基于等高線的三維人臉識別方法[P].中國,G06K9/00,2010-10-24.
[6]葉長明,蔣建國,詹曙,等.基于曲面等高線特征的不同姿態(tài)三維人臉深度圖識別[J].模式識別與人工智能,2013,26(2):219-224.
[7]李剛,王蒙軍,林凌.視覺驅(qū)動的語音合成系統(tǒng)中唇形輪廓的傅里葉描述[J].儀器儀表學報,2007,28(8):1464-1468.
(責任編輯:李孟良)
收稿日期:2016-01-18
基金項目:國家自然科學基金(61371156);安徽省科技攻關(guān)計劃(140B042019)。
作者簡介:張玉明(1968-),男,安徽省蕪湖市人,碩士,副教授,主要從事圖像處理及保密通信研究。
中圖分類號:TP391
文獻標識碼:A
文章編號:1673-8772(2016)03-0055-05
3 D Face Recognition in Different Poses Based on Moment-Fourier Descriptors
ZHANG Yu-ming1,GAO Jie2,ZHANG Hai-yan2
(1.Department of Electrical Engineering,Wuhu Vocational Institute of Technology,Wuhu 241000,China;2. School of Computer & Information, Hefei University of Technology,Hefei 230009,China)
Abstract:Three-dimensional human face contains richer information compared to 2D face ,but also able to overcome gestures, facial expressions and lighting factors, a better representation of facial feature, which gradually widespreads concern and attention.In this paper, firstly, differential geometry theory correction is used in three-dimensional human face depth maps in different poses to the median plane, and then by extracting the contour characteristics of the human face portion,the three-dimensional human face into a two-dimensional curve is easy to handle , and for how better able to describe the two-dimensional curves, a new method combining the moments and Fourier descriptors is proposed.In the end, face recognition is performed using the extracted curve feature. Experimental results show that this method has good real-time performance and greater ability to distinguish between shapes, while having excellent robustness superior to the traditional Fourier method described in sub-extracting contour features.
Key words:Depth Map,Contour feature; Moment; Fourier descriptor, Face recognition