趙冬琴
(山西財(cái)經(jīng)大學(xué) 實(shí)驗(yàn)教學(xué)中心,山西 太原 030006)
復(fù)雜背景下的人臉檢測
趙冬琴
(山西財(cái)經(jīng)大學(xué) 實(shí)驗(yàn)教學(xué)中心,山西 太原 030006)
人臉檢測作為人臉識別的關(guān)鍵,檢測的精確度和速度直接影響人臉識別系統(tǒng)的性能。本文在膚色模型二值化、積分投影和分塊計(jì)算LGBP直方圖的基礎(chǔ)上對復(fù)雜背景下的人臉進(jìn)行檢測,結(jié)果表明人臉檢測不受光照、表情和遮擋物等的影響,提高了檢測的正確率和運(yùn)算速度。
人臉檢測;二值化;投影
隨著互聯(lián)網(wǎng)+大數(shù)據(jù)時(shí)代的到來,各種智能終端設(shè)備的普及和應(yīng)用,人臉識別技術(shù)逐漸得到了應(yīng)用。在光照、眼鏡、膚色等因素影響下的人臉識別正確率依然特別低,因此在復(fù)雜環(huán)境下的人臉識別成為了目前的研究熱點(diǎn)和難點(diǎn)。
人臉檢測是人臉識別的關(guān)鍵。人臉檢測就是在輸入的圖像中鑒別出是否存在人臉,以及人臉的大小、位置和姿態(tài)的過程。目前人臉檢測的方法大致有:基于知識的方法[1]、基于模板匹配的方法、基于統(tǒng)計(jì)模型的方法和基于特征的方法。本文對復(fù)雜背景下的圖像進(jìn)行二值化處理、積分投影得到水平和垂直投影圖,然后對投影圖進(jìn)行LGBP分塊檢測,得到復(fù)雜圖像中的人臉區(qū)域。
復(fù)雜背景下的人臉檢測,必須經(jīng)過圖像預(yù)處理才能達(dá)到較好的檢測效果。圖像預(yù)處理包括圖像輸入位置的標(biāo)準(zhǔn)化及大小的正規(guī)化(幾何歸一化)、圖像的灰度變換(灰度歸一化)、二值化、投影。
幾何歸一化,是使在不同輸入的情況下,人臉圖像最后都統(tǒng)一到同樣的大小,并使人臉的關(guān)鍵部位在圖像中的位置盡量保持一致。
灰度歸一化是將圖像的灰度值和方差歸一化到一個(gè)特定的范圍內(nèi),對不同灰度值圖像進(jìn)行統(tǒng)一的處理。它是對圖像進(jìn)行光照補(bǔ)償?shù)忍幚?,以克服光?如高光、陰影等)變化的影響。
二值化的方法就是將圖像上的像素灰度值設(shè)置為0或255,把一幅灰度圖像轉(zhuǎn)換成二值圖像處理。通過設(shè)定閾值把灰度圖像變成僅用兩個(gè)值分別表示圖像目標(biāo)和背景的二值圖像,實(shí)現(xiàn)物體與背景的分割。
投影是把n維坐標(biāo)系中的點(diǎn)變換成小于n維坐標(biāo)系中的點(diǎn)。投影包括垂直投影和水平投影。
膚色作為重要的特征信息,具有較好的魯棒性,不受面部表情、姿態(tài)、復(fù)雜背景等因素的影響。合適準(zhǔn)確的膚色選擇和采集對于人臉檢測的準(zhǔn)確性至關(guān)重要。常用的顏色空間有RGB、YCbCr、HSV空間等。RGB采用紅色、綠色、藍(lán)色三色作為三基色表示圖像,亮度色度混在一起,受光線影響,檢測困難;HSV利用色度、飽和度和亮度建立色彩模型,色度、亮度分開,計(jì)算復(fù)雜度高;YCbCr不僅綜合兩者優(yōu)點(diǎn),而且空間離散,利于實(shí)現(xiàn)聚類。
本文采用YCbCr空間,使用高斯模型[2]進(jìn)行計(jì)算,實(shí)驗(yàn)證明在YCbCr色彩空間的統(tǒng)計(jì)分布中黃種人的皮膚滿足 145≤Cb≤180,145≤Cr≤165的閾值分布,利用實(shí)驗(yàn)得到的上下界限分布值來對膚色進(jìn)行提取,膚色位置賦值為1,標(biāo)記為白色,非皮膚區(qū)域賦值為0,標(biāo)記為黑色,得到二值化圖像(如圖1所示)。
圖1 圖像轉(zhuǎn)換
通過膚色檢測得到了二值化圖像,但是復(fù)雜圖像得到的二值化圖像還包含一些和膚色相近的區(qū)域,如手臂、胳膊、頸部等非人臉區(qū)域。因此需要通過灰度圖像的檢測去除非人臉區(qū)域,進(jìn)而檢測出人臉?;叶葓D像檢測主要通過積和投影進(jìn)行計(jì)算,計(jì)算量比較小。二值圖像在水平和垂直方向的投影如圖2所示,水平投影計(jì)算每行的黑色像素點(diǎn)個(gè)數(shù)。垂直投影計(jì)算每列的黑色像素點(diǎn)個(gè)數(shù),灰度值有高低分布。
圖2 投影圖
3.1 人臉邊界的確定
實(shí)驗(yàn)將二值化圖像積分投影后觀察人臉圖像,不論復(fù)雜圖像還是人臉數(shù)據(jù)庫中的人臉圖片,垂直投影眉心處的灰度值比較高,眼睛處的灰度值較低,水平投影有連續(xù)四個(gè)波谷,分別對應(yīng)眉毛、眼睛、鼻子和嘴。通過積分投影眼睛的位置和特征也已突現(xiàn)出來。本文利用LBP[3]和Gabor濾波相結(jié)合的方法將整個(gè)圖像區(qū)域分割為8×8的像素塊,既降低了計(jì)算速度也節(jié)省了存儲空間。在圖像分割的每個(gè)塊中自左向右搜索眼睛位置。根據(jù)眼睛的弧線張角和余弦公式(如圖3所示)確定眼睛的位置。
圖3 眼睛弧線張角
在垂直投影[4]圖像中人臉的平均灰度明顯不同于背景中的其它物體,人臉內(nèi)部灰度值在眼睛和眉心處有一些有變化,其余地方比較平滑。人臉和復(fù)雜背景的交界會有一定的突變,在分界處的那一點(diǎn)會有一個(gè)大的梯度值,這樣根據(jù)眼睛的位置和LGBP方法通過尋找垂直投影曲線中的較大凹槽或突起,就可以找到人臉的邊界。本方法在自建的復(fù)雜圖像庫中檢測出的人臉圖像如圖4所示。
圖4 復(fù)雜圖像中檢測到的人臉
本文在ORL人臉數(shù)據(jù)庫、Yale人臉數(shù)據(jù)庫和自建的復(fù)雜圖像數(shù)據(jù)庫中進(jìn)行了驗(yàn)證,均得到了很好的檢測率。避免了光照、表情和遮擋物的影響,提高了檢測的正確率和運(yùn)算速度。但是在人臉邊界的確定過程中仍然需要一定的計(jì)算量,希望在以后的研究中能夠更好的實(shí)現(xiàn)降維。
[1] 張彩明.計(jì)算機(jī)圖形學(xué)簡明教程[M].北京:高等教育出版社,2008.
[2] 苑瑋琦,韓春霞.復(fù)雜背景下的多人臉檢測方法[J].計(jì)算機(jī)應(yīng)用,2010(3):635-638.
[3] 周佳敏.復(fù)雜背景下多人臉的檢測與識別算法[D].武漢:武漢理工大學(xué),2015.
[4] 湯連春,李海燕,陳建華.基于局部特征的人臉檢測與提取[J],計(jì)算機(jī)工程,2007(10):210-211,214.
Facial Detection in Complex Background
Zhao Dongqin
(CenterofExperimentalandTeaching,ShanxiUniversityofFinanceandEconomics,TaiyuanShanxi030006,China)
Face detection as the key to face recognition, detection accuracy and speed directly affect the performance of face recognition system. Based on the binarization of the skin color model, the integral projection and the LGBP histogram, the face of the complex background is tested. The results show that the face detection is not affected by the light, the expression and the occlusion. The correct rate and the operation speed are improved.
face detection; binarization; projection
2017-03-04
趙冬琴(1984- ),女,山西陽泉人,助理實(shí)驗(yàn)師,碩士研究生,主要研究方向:數(shù)據(jù)挖掘、人工智能、腦信息學(xué)。
1674- 4578(2017)02- 0027- 02
TP181.09
A