胡曉燕, 張 宇
(成都航空職業(yè)技術學院計算機工程系,四川成都 610021)
人臉檢測是指對于給定的圖像,采用一定的策略對其進行搜索以確定其中是否含有人臉,如果是,則返回人臉的位置與大小。檢測與定位人臉通常是一個完整的人臉識別系統(tǒng)的第1步工作。目前,在人臉檢測領域,研究比較成功的系統(tǒng)有基于形狀的系統(tǒng)[1]、基于臉部特征的系統(tǒng)[2-3]、基于模板匹配的系統(tǒng)[4-5]、基于神經網絡的系統(tǒng)[6-7]和基于顏色的系統(tǒng)[8]等5類,它們各有優(yōu)缺點[9]。
由于人臉在空間分布的復雜性,要建立人臉在高維空間的精確分布模型有相當?shù)碾y度。因此,解決人臉檢測問題切實可行的途徑是多種方法的綜合運用。
檢測系統(tǒng)按照圖像輸入預處理、算法實現(xiàn)、圖像輸出的順序來執(zhí)行,先后經過打開位圖讀取數(shù)據(jù)、尺寸歸一化、光線補償、二值化、開閉運算處理、區(qū)域統(tǒng)計及去除假區(qū)域等步驟,最后標記出人臉區(qū)域。
為使檢測后的人臉識別工作所用的圖像更加規(guī)范化,也為方便圖像的操作,有必要對輸入圖像先進行尺寸歸一化。算法為:用定值m去除以圖像的縱向像素點數(shù)l與橫向像素點數(shù)w的乘積,并對其開算術平方根求得歸一化系數(shù)C,再對圖像按此系數(shù)有比例地縮放。
由于光源和圖像采集設備的原因,可能會造成輸入圖像在整體上發(fā)生色彩偏離。采用光線補償可以解決這類輸入圖像中存在的色彩偏差問題。其算法是將輸入圖像中所有像素以亮度由高到低進行排列,首先取其前面5%的像素,并以其亮度作為“參考白”。然后,將它們的R、G、B色彩分量值均調整到最大值255。再與前5%像素亮度的平均值除以255后就得到了光線補償系數(shù),圖像中其他像素點的亮度值均按此系數(shù)進行線性放大。
實驗證明,光線補償系數(shù)過大時,光線補償可能會造成膚色在色彩分量上發(fā)生過度的偏移,因此,采用自適應的光線補償算法。通過實驗獲取一個門限值(m=1.008),將其與計算出的光線補償系數(shù)相比較,若系數(shù)值不在規(guī)則限定的條件范圍內,則不進行光線補償,這樣有效避免因不恰當?shù)难a償而造成膚色在色彩分量上發(fā)生過度的偏移。
系統(tǒng)選擇了YCbCr色彩空間的高斯膚色模型和RGB色彩空間的膚色模型。優(yōu)點是可將亮度分量分離又可從RGB色彩空間線性變化得到。轉換公式為:
實驗證明,不同膚色的區(qū)別主要表現(xiàn)在亮度的差異上,在色度上差異較小,具有相同的2D Gaussian模型G(m,V2),公式為:
膚色模型建立后,彩色圖像隨之被轉換為灰度圖像,如圖1所示。根據(jù)所有像素點距高斯分布中心的距離可以得到一個和膚色的相似度,相似度計算公式為:
由(6)式可以得到一個基于原始圖像的灰度圖像。
圖1 相似度計算
對圖像進行平滑去噪處理,一般情況下,在空間域內可以用鄰域平均來減少噪聲;在頻率域內,由于噪聲頻譜通常多在高頻段,因此可以采用低通濾波來減少噪聲。
平滑線性空間濾波器(均值濾波器)的輸出(響應)是包含在濾波掩模鄰域內像素的簡單平均值。它用濾波掩模確定的鄰域內像素的平均灰度值代替圖像每個像素點的值,這種處理減小了圖像灰度的“尖銳”變化。由于典型的隨機噪聲由灰度級的尖銳變化組成,因此,平滑處理的目的就是減噪。
對圖像中的任一點(x,y)進行m×n掩模處理得到的響應R可表示為:
其中,w為掩模系數(shù);z為與該系數(shù)對應的灰度值,一個m×n掩模應有等于1/mn的歸一化常數(shù)。
本系統(tǒng)采用3×3掩模的平滑濾波算法,即對灰度圖像中每個像素的灰度值和它鄰近8個像素的灰度值求和,再求平均作為新的圖像中該像素的灰度值,即
采用(8)式和平滑濾波算法,可得濾波前后的對比圖像如圖2所示。
圖2 平滑去噪
二值圖像可由灰度圖像選取適當?shù)拈T限值后進一步轉變而來,其中皮膚和非皮膚區(qū)域分別用0和1表示。算法在二值化時采用了雙門限值。定義:
當Y值在一定范圍內時,則該區(qū)域可能是頭發(fā);該區(qū)域可能為皮膚的條件為:
所以原來的圖像被劃為頭發(fā)、皮膚和背景3種區(qū)域,如果某一區(qū)域的面積足夠大,并且上面是頭發(fā),下面是皮膚,則該區(qū)域可能就是人臉區(qū)域。系統(tǒng)對圖像二值化算法框圖如圖3所示。
原來的圖像進行二值化后的實驗結果如圖4所示。
圖3 二值化算法框圖
圖4 二值化圖像
系統(tǒng)采用四方向膨脹和腐蝕。先腐蝕后膨脹提取骨干信息、平滑去噪,如圖5所示。先膨脹后腐蝕將2個鄰近的目標連接起來,如圖6所示。算法先判斷圖像中是否存在過多的較小區(qū)域,如果存在就執(zhí)行開運算,不存在就執(zhí)行閉運算。
圖5 開運算的圖像
圖6 閉運算的圖像
膚色建??赡馨逊悄槻康哪w色區(qū)域或其他近似膚色的區(qū)域也包含進去,因此,有必要進一步用算法來去除假區(qū)域。系統(tǒng)此處使用了遞歸算法,對執(zhí)行開或閉運算后的二值化圖像進行統(tǒng)計,尋找可能是人臉的區(qū)域,接著對其逐一用多種方法進一步判別真假,如計算區(qū)域的外接矩形的填充率、長寬比、大小以及判斷區(qū)域上方是否存在頭發(fā)等。算法執(zhí)行后的圖像如圖7所示,可以明顯看到已經去除了手臂區(qū)域。
圖7 去除假區(qū)域后的圖像
對輸入圖像中的每個人臉進行標記的算法是:計算區(qū)域中每列含有的白色像素點數(shù),定位最大值所在的列,并以其為中心向兩側分別找尋人臉的左右邊界。進而在左右邊界與區(qū)域邊界劃定的范圍內找尋人臉的上部邊界。最后,根據(jù)人臉長寬比經驗值來確定下部邊界。最后標記的人臉區(qū)域如圖8所示。
圖8 標記人臉區(qū)域
實驗抽取了多幅含有人臉及假區(qū)域的圖像,共89個人臉區(qū)域和386個假區(qū)域,對這些圖像的檢測結果見表1所列。
表1 實驗結果統(tǒng)計表 %
由表1可看出,光線補償和雙門限技術有利于提高檢測率。95%的假區(qū)域通過使用判定因素被排除了,但也存在誤檢現(xiàn)象。
實驗中,抽取了多副包含人臉的圖像,每個圖像中又有多個人臉區(qū)域,以及更多的假區(qū)域,總共89個人臉區(qū)域和近386個假區(qū)域。通過統(tǒng)計這些區(qū)域的空間特性以及排除的假區(qū)域的數(shù)量、比例,得到結果見表2所列。
表2 去除假區(qū)域結果統(tǒng)計表 個
由表2看出,以上各種因素都有誤判存在,所以每種因素都不是判定非人臉區(qū)域的充分條件,而只是在概率上加大或減弱了這種可能性。考慮到這種特性,系統(tǒng)采用多種判斷因素去除假區(qū)域的算法,判斷因素主要有:
(1)區(qū)域填充率。對于二值化后的一個連通區(qū)域,系統(tǒng)中使用該區(qū)域的像素數(shù)與外接矩形的像素數(shù)的比值來表征該區(qū)域的空間屬性。根據(jù)實踐中的觀察結果發(fā)現(xiàn)通過考查該屬性,可有效去除與水平方向成一定角度的長條區(qū)域。
(2)相對尺寸。根據(jù)考察大量含有人臉的圖像發(fā)現(xiàn),人臉區(qū)域和相對尺寸(尺寸歸一化的結果)具有近似正態(tài)分布的統(tǒng)計特征。過小或過大的區(qū)域尺寸都表明該區(qū)域屬于人臉的概率較低。由此可設定尺寸模板把人臉區(qū)域的尺寸特性限定在一定的范圍之內。
(3)長寬比。通過對人臉特征的統(tǒng)計,人臉的長寬比為0.6~1.5??紤]到人臉區(qū)域和脖子區(qū)域大都是連通的,所以實際處理中將比例修正為0.6~2.8。
(4)頭發(fā)的存在性。由于人臉區(qū)域的頂部多存在頭發(fā)區(qū)域,由表2可知,相對于頭發(fā)的存在性去除假區(qū)域的能力是最強的,但其誤判率也是最高的,這些誤判集中在戴帽、染發(fā)等人臉區(qū)域。為了消除影響,算法采取從區(qū)域的頂部兩側一定范圍內搜索頭發(fā)區(qū)域,如果存在就不排除該區(qū)域。
2.3.1 人臉的姿態(tài)
相對于其他人臉檢測方法,基于膚色的算法對人臉姿態(tài)具有強魯棒性。人臉向上旋轉、向平面內的一側旋轉和向平面外的一側旋轉時的人臉標記情況如圖9所示。
圖9 向不同方向旋轉的人臉標記
2.3.2 環(huán)境光特性
任何攝取圖像的設備都要通過接受物體表面的反射光線獲取信息。而物體的反射光線又受環(huán)境光線特性、物體本身的反射特性的影響,所以基于膚色的人臉檢測方法也不可避免地受到環(huán)境光的影響。
系統(tǒng)采用了YCbCr色彩空間與RGB色彩空間2個模型。首先,本算法中RGB模型化參數(shù)取得比較寬松,其次,YCbCr色彩空間將亮度信息獨立出來,而膚色模型又是建立在Cb、Cr的二維空間之上的,跟亮度無關,所以算法對環(huán)境亮度的適應能力比較強。
本文提出的基于膚色的人臉檢測算法,計算量小、抗噪能力強、對姿態(tài)不敏感,但只對彩色圖像有效。由于時間和水平的限制,實驗結果仍有誤檢和漏檢的情況。今后還需在以下幾方面進行更深層次的研究:① 改進圖像分割算法,考慮更多的環(huán)境因素,如光照、背景、裝束等。另外可采用特征定位、模板匹配等方法對檢測為人臉的區(qū)域進行驗證。②進一步改進去除假區(qū)域的算法,比如增加判定規(guī)則并分配權重。③ 引入動態(tài)處理。④ 考慮系統(tǒng)對多人種的適應性。⑤ 進一步研究不同成像設備對膚色色度的影響,從而建立起自適應的膚色模型。
[1] 趙海濤,於東軍,金 忠,等.基于形狀和紋理的人臉自動識別[J].計算機研究與發(fā)展,2003,40(4):538-543.
[2] 李傳林,魯秀青.人臉照片的特征提取與查詢[J].計算機應用研究,2002,19(7):110-111.
[3] 焦 峰,山世光,崔國勤,等.基于局部特征分析的人臉識別方法[J].計算機輔助設計與圖形學報,2003,15(1):53-58.
[4] 丁 嶸,蘇光大,林行剛.使用部件信息改進彈性匹配人臉識別[J].光電子·激光,2002,13(8):831-833.
[5] 朱俊青,王林泉,葛 元.基于模板匹配的快速人臉定位[J].計算機工程,2002,28(9):77-79.
[6] 張宏林.數(shù)字圖像模式識別技術及工程實踐[M].北京:人民郵電出版社,2003:17-40.
[7] 胡 恬.利用幾何分析法和BP神經網絡進行人臉識別研究[J].計算機工程與設計,2002,23(9):18-21.
[8] 周志勇,周激流,劉智明,等.基于彩色和投影的人臉檢測和跟蹤算法[J].貴州工業(yè)大學學報:自然科學版,2003,32(3):46-49.
[9] 王 偉,張佑生,方 芳,等.人臉檢測與識別技術綜述[J].合肥工業(yè)大學學報:自然科學版:2006,29(2):158-163.