趙永安,王國權(quán),王榮豫
(1.黑龍江科技學(xué)院計算機與信息工程學(xué)院,哈爾濱150027;2.中國運載火箭技術(shù)研究院,北京100076)
在人臉識別的過程中,首要面對的問題就是如何將人臉從待檢圖像中分離出來。這是人臉識別研究的一個難點和熱點。我們接觸到的人臉圖像,許多具有復(fù)雜背景且有姿態(tài) (角度、表情、尺寸等)、遮罩 (如化妝、景物入侵等)、光照 (光源條件、陰影)等干擾因素,不僅影響人臉定位效果,甚至?xí)斐啥ㄎ诲e誤。同時,在一幅待檢圖片中,不能期望其中只含有一個人臉[1]。而且,有些圖像中人臉與軀干部分是連為一體的,因此如何將其從中提取出來也是一個令人深為困惑的問題[2]。
基于人臉模型的定位方法的主要特點是先建立人臉的模型,形成一定的模板。再通過對模板與待檢圖像的比較與搜索來對人臉進行檢測定位。本文提出基于邊緣頻率加權(quán)的Hausdorff距離人臉檢測定位算法,就屬于其中的一種。
由于進行識別的圖像其基本單位都是像素[3],可將這些像素視作一個個的點。于是,所謂人臉識別本質(zhì)上就是人臉特征集 (點集A)在待檢圖像(點集B)中尋找某個特定區(qū)域的匹配過程。Hausdorff距離(Hausdorff distance,HD)就是用來定義點集間近似程度,同時用特征點集對于待檢圖像中需要找尋的部分進行搜索的一種人臉檢測定位算法。設(shè)有點集A={a1,a2,…,am}與B={b1,b2,…,bn},可構(gòu)造Hausdorff距離為:
式中:
上兩式中,范數(shù)‖·‖形式可以不固定。其中h(A,B)稱做由點集A至點集B的有向Hausdorff距離。它的幾何意義為由點集元素a∈A至點集B內(nèi)任意元素的最大距離。同樣,h(B,A)稱作由點集B至點集A的有向Hausdorff距離。它的幾何意義為由點集元素b∈B至點集A內(nèi)任意元素的最大距離。由于h(A,B)與h(B,A)不對稱,因此取它們中的最大值確定為點集間的Hausdorff距離。Hausdorff距離的幾何意義為:若存在點集A、B,其間的Hausdorff距離為d,則其中一個點集中的點將投射于另一個點集以任意一點為中心、半徑為d的圓形域中。若它們的Hausdorff距離等于0,則其為重合。
由于以上所構(gòu)造的Hausdorff算法缺點是魯棒性差[4],有人將其中的最大距離用平均距離來替換,這就是改進的Hausdorff距離(modified Hausdorff distance,MHD),由式(2)和式(3)得:
其中NA為點集A內(nèi)元素的規(guī)模;NB為點集B內(nèi)元素的規(guī)模。把其代入式 (1)得:
將改進的Hausdorff距離算法用于待檢圖片與模板間比較,其優(yōu)點為不用規(guī)定圖片中特征區(qū)與模板一一對應(yīng),就可以較好地進行識別,系統(tǒng)裕度充足[5];但其最主要的缺點是定位誤差較大[6],識別耗時較多[7]。
1.3.1 基本概念
為解決上述方法的缺陷,采用了邊緣頻率加權(quán)的方法來對上述方法進行改進。在基于模板匹配的人臉檢測定位方法中,需要預(yù)先建立人臉模板與圖像中的人臉區(qū)域進行相關(guān)運算,在這個過程中需要考慮對模板進行坐標(biāo)變換 (平移、旋轉(zhuǎn)或伸縮)。而為了衡量匹配的程度,需要計算坐標(biāo)變換后的人臉模板與圖像中的人臉區(qū)域間的距離。實際使用人臉模板中的人臉邊緣圖像,與待檢圖片中的人臉區(qū)域?qū)?yīng)邊緣點集合間的匹配,匹配的點可用SUSAN算子檢測[8]。
Hausdorff距離在人臉檢測定位中常用作衡量匹配的程度。用Hausdorff距離來計算兩個點集之間距離時,并不需要對兩個點集的點之間建立一對一的對應(yīng)關(guān)系,所以很容易實現(xiàn)。實際中,常對基本的Hausdorff距離進行各種改進[9]。
當(dāng)借助Hausdorff距離來計算兩個點集之間的距離,并與人臉模板進行匹配時,由于人臉區(qū)域中不同位置對匹配的貢獻不同,可考慮對Hausdorff距離中的各項分別進行加權(quán),即可以將式 (4)改為:
式中w (b)為權(quán)值函數(shù),每個點b對應(yīng)一個平面位置(x,y)。
權(quán)值函數(shù)可利用訓(xùn)練集來確定,但選取訓(xùn)練圖像的哪些信息來確定權(quán)值函數(shù)有不同方法。例如,權(quán)值函數(shù)可利用圖像灰度值來確定。此時由于原始的Hausdorff距離是定義在兩個二值點集上的,所以需要先將灰度圖像 (利用取閾值法)轉(zhuǎn)化為二值圖像。不過這種轉(zhuǎn)化常會丟失一些信息,不能完全地反映圖像上各點對人臉匹配的重要性[10]。
另一種方法是通過統(tǒng)計人臉圖像中邊緣信息來確定權(quán)值函數(shù)。例如可用邊緣點出現(xiàn)在每個位置的頻率來確定權(quán)值函數(shù),即在那些邊緣點出現(xiàn)頻率較高的位置,如眼睛、嘴唇和人臉輪廓的邊緣處,賦予較高的權(quán)值。這樣得到的權(quán)值函數(shù)能夠更直接有效地反映人臉的結(jié)構(gòu)信息。
1.3.2 構(gòu)造基于邊緣頻率加權(quán)的Hausdorff距離的人臉檢測定位算法
1.3.2.1 權(quán)值函數(shù)的選取與EFWHD函數(shù)的確定
基于以上論述,可以構(gòu)造用于在待檢圖像中搜索并定位人臉的模板,并構(gòu)造EFWHD函數(shù)。其步驟如下:
1)對訓(xùn)練集內(nèi)人臉圖像做歸一化預(yù)處理 (圖片規(guī)格以及灰度歸一化)。
2)使用SUSAN算子求出訓(xùn)練集內(nèi)人臉圖像的邊緣圖像E(x,y)。
3)對邊緣圖像E (x,y)進行閾值化計算,求出其二值圖像B(x,y)。其中,選擇閾值的標(biāo)準(zhǔn)是能夠讓B(x,y)內(nèi)的值為1的像素點占圖片總面積的20%,讓所得的二值圖像對于識別的作用一致[11]。
4)對B(x,y)能夠構(gòu)造權(quán)值函數(shù)w(b)如下:
式中M表示訓(xùn)練集內(nèi)人臉圖像集規(guī)模;Bi(x,y)為訓(xùn)練集中第i幅圖像求出的二值圖像位于 (x,y)上的對應(yīng)值。
故所構(gòu)造權(quán)值函數(shù)與訓(xùn)練集中各圖像中對應(yīng)位置處找到邊緣點頻率數(shù)成正比關(guān)系。將式 (8)代入式 (7)中,即可求得基于邊緣頻率加權(quán)的Hausdorff距離(edge frequency weighted Hausdorff distance,EFWHD)。
1.3.2.2 定位模板的構(gòu)造
利用所構(gòu)造的EFWHD算法,能夠構(gòu)造人臉檢測定位的模板 (圖1(a))。
1)樣本集的構(gòu)造:在選擇用于構(gòu)造模板的人臉圖片樣本集 (訓(xùn)練集)時,選擇正面人臉做為樣本集中的元素。
圖1 EFWHD人臉邊緣模板獲取過程及人臉模板Fig.1 EFWHD face edge template for process and face template
2)人臉區(qū)域的歸一化:手動標(biāo)定圖片中兩只眼睛和兩側(cè)嘴角的位置,并將人臉圖片尺寸分別歸一為50×50(像素)。
3)灰度歸一化:為了減少光度變化對于模板的影響,在尺寸歸一化后,對圖片的灰度值進行歸一化,使之平均灰度值等于100,標(biāo)準(zhǔn)偏差為50。
4)去噪:利用高斯濾波器對人臉圖像去除噪聲。然后使用直方圖均衡來補償由于照明亮度不同以及拍攝設(shè)備的差異對成像效果造成的差異。
5)對經(jīng)上述1)~4)步處理之后所得的人臉圖像集利用SUSAN算子進行邊緣檢測,得到人臉邊緣區(qū)域圖像集。
6)對5)中所得人臉邊緣區(qū)域圖像集中的圖像進行加權(quán)平均,形成人臉部加權(quán)平均概率灰度圖(圖1(b))。
7)對6)中進行二值化,得到人臉邊緣特征二值圖(圖1(c))。
圖1(b)表示邊緣點在某一位置被找到的概率灰度圖,其中較亮點表示人臉邊緣點在這里被找到的幾率較大。對圖1(b)進行二值化處理可得人臉邊緣特征二值圖 (圖1(c)),其中白色點代表圖像的邊緣點。經(jīng)這樣處理后,得到了用于在待檢圖像中搜索并定位人臉位置的模板 (圖1(c))。
1.3.2.3 在待檢圖像中搜索并定位人臉
對待檢圖像進行歸一化、平滑去噪等預(yù)處理。對預(yù)處理后所得的圖像利用SUSAN算子提取邊緣信息,然后對邊緣圖像進行二值化處理,再利用模板 (圖1(c))在二值圖像中對目標(biāo)區(qū)域進行搜索,定位出人臉區(qū)域 (人臉區(qū)域用白框標(biāo)出,眼睛位置用白色十字線標(biāo)出)。
圖2為將上述算法用于人臉定位實驗的具體流程及結(jié)果。
圖2 人臉定位實驗各步結(jié)果及最終結(jié)果圖Fig.2 Face positioning experiment each step results and final results figure
基于原始Hausdorff距離(HD,見式(2)和式(3))、改進的Hausdorff距離(MHD,見式(4)和式 (5))以及本文提出的基于邊緣頻率加權(quán)的Hausdorff距離(edge frequency weighted Hausdorff distance,EFWHD),分別對人臉圖像的位置進行定位檢測。實驗所用計算機CPU為2.0GHz,內(nèi)存為512MB,實驗平臺為Microsoft Windows XP,編程工具為visual c++6.0/MFC,編程語言為c++/c。比較所用的圖像共有2 007幅,包括BioID庫中所有的1 521幅圖像,加上從Cohn-Kanade庫中選取的具有不同光照的486幅圖像(640×490)。人臉模板隨機從上述圖像中選取了10%的人臉圖像進行構(gòu)建。
由于人臉圖像庫中人眼中心距離位置是不受圖像尺寸大小與人臉邊緣信息影響的,所以采用這一特征作為衡量算法性能的標(biāo)志。在比較各方法的定位精度時采用了對眼睛檢測的相對誤差指標(biāo)。這個相對誤差指標(biāo)定義為:
式中Clt和Crt分別為左右兩個眼睛中心的預(yù)期值(手工標(biāo)定);dl和dr分別為左右兩個眼睛中心的預(yù)期值與檢測值的差[12];Cle和Cre分別為左右兩個眼睛中心的檢測值 (圖3)。
圖3 人眼預(yù)期位置與測量位置間誤差示意圖Fig.3 Real eye position and position error measurement schematic diagram
比較實驗共進行了40次,記錄每一次的誤差與耗時,并對平均誤差以及平均耗時兩個指標(biāo)進行比較,結(jié)果見表1。
表1 利用Hausdorff距離(HD、MHD、EFWHD)進行人臉檢測定位算法的平均誤差及平均耗時對比Table 1 Using Hausdorff distance(HD,MHD,EFWHD)for face detection algorithm the average error and the mean time contrast
由表1可見,EFWHD比MHD誤差要小,而MHD比HD誤差要小,同時EFWHD平均耗時較少。
在本文中,筆者提出使用了一種基于邊緣頻率加權(quán)的Hausdorff距離定位檢測算法,并將其與基于Hausdorff距離的定位算法和其改進算法進行了以人臉定位為目標(biāo)的對比實驗。經(jīng)實驗驗證,文中所提出的基于邊緣頻率加權(quán)的Hausdorff距離人臉定位檢測算法(EFWHD)具有精度較高且耗時較少的優(yōu)點,性能較為優(yōu)良。
[1]劉曉昊,章毓晉,譚華春.基于Hausdorff距離的相似性和對稱性度量及在人臉定位中的應(yīng)用 [J].信號處理,2008,24(1):118-121.
[2]杜宇人,高浩軍.基于車輛輪廓定位匹配的車型識別方法[J].揚州大學(xué)學(xué)報:自然科學(xué)版,2007,10(2):62-65.
[3]劉愛平,周 焰,關(guān)鑫璞.基于Hausdorff距離和改進ASM的人臉跟蹤方法 [J].計算機應(yīng)用研究,2007,24(10):172-175.
[4]冷雪飛,劉建業(yè),熊 智.基于分支特征點的導(dǎo)航用實時圖像匹配算法[J].自動化學(xué)報,2007,33(7):678-682.
[5]陳秀宏,張偉偉,薛寺中,等.基于分塊離散余弦變換和Hausdorff距離的人臉識別[J].計算機應(yīng)用,2010,(2):86-89.
[6]徐 華.基于三維重構(gòu)的人臉識別 [D].成都:成都電子科技大學(xué),2009.
[7]SIM.D.G,PARK.R.H.2Dobject alignment based on the robust oriented Hausdorff similarity measure[J].IEEE Traction on Image Processing,2001,10(3):475-483..
[8]Gao,Y.,Leung,M.K.H.Line segment Hausdorff distance on face matching[J].Pattern Recognition,2002,35(2):361-371.
[9]劉福新.基于視頻驅(qū)動的卡通人臉動畫研究 [D].貴陽:貴州大學(xué),2008.
[10]高 晶,孫繼銀,劉 婧.基于鄰域灰度信息的Hausdorff距離圖像匹配方法 [J].計算機應(yīng)用,2011,(3):741-744.
[11]M.Dubuisson,A.K.Jain.A modified Hausdorff distance for object matching proceedings[J].International Conference on Pattern Recognition A,1994,12:566-568.
[12]O.Josorsky,K.J.Kirchberg,R.W.Frischholz.Robust face detection using the Hausdorff distance[A]Proceedings of Third International Conference on Audio-and Video-based Riometric Person Authentication[C].2001:90-95.