貴州師范大學(xué)物理與電子科學(xué)學(xué)院 蔣淵淵 張劭昀
?
基于膚色檢測(cè)的人臉驗(yàn)證系統(tǒng)的研究
貴州師范大學(xué)物理與電子科學(xué)學(xué)院 蔣淵淵 張劭昀
【摘要】人臉檢測(cè)是指采用一定的算法或策略對(duì)任意的輸入圖像或圖像序列進(jìn)行搜索遍歷,從而判斷其中是否包含人臉,如果包含人臉,則定位出每個(gè)人臉的位置、大小以及姿態(tài)[1]。當(dāng)前,很多的檢測(cè)技術(shù)都是針對(duì)正面的人臉而言的,這就在某種程度上限制了其實(shí)用性。在實(shí)際生活中,視頻中的人臉不一定就是正對(duì)著畫(huà)面讓其提取。為了對(duì)其進(jìn)行改進(jìn),本文從膚色檢測(cè)方面進(jìn)行入手,確定人臉的候選區(qū)再根據(jù)臉部特征實(shí)現(xiàn)人臉的檢測(cè)。本實(shí)驗(yàn)是在VC++6.0環(huán)境下實(shí)現(xiàn)的。
【關(guān)鍵詞】膚色檢測(cè);VC++6.0;人臉檢測(cè);人臉驗(yàn)證
隨著電子世界的發(fā)展,人們對(duì)視頻的應(yīng)用逐漸開(kāi)始廣泛起來(lái)。電話會(huì)議、監(jiān)控以及一系列視頻軟件的應(yīng)用,使得生活中人們每時(shí)每刻的活動(dòng),都被清清楚楚記錄。要在視頻中將人們辨認(rèn),第一步就是要找到視頻中的人臉,再對(duì)其進(jìn)行辨認(rèn)處理,這就要使用到人臉檢測(cè)技術(shù)。人臉檢測(cè)技術(shù)的本質(zhì)就是確定視頻中是否有人臉的存在,如果有,就通過(guò)人臉的一些特征確定出人臉的位置以及人臉的大小,并將其檢測(cè)結(jié)果輸出。本文是通過(guò)膚色檢測(cè)來(lái)最終實(shí)現(xiàn)人臉檢測(cè)的,首先通過(guò)光線補(bǔ)償來(lái)消除圖片中人臉的色度偏差,使得圖像更加容易處理。然后通過(guò)相似度的計(jì)算來(lái)計(jì)算出圖像中與膚色相似的像素點(diǎn),確定出膚色部分,再進(jìn)行二值化分析將膚色區(qū)域和背景區(qū)域分離。將處理得到的通過(guò)形態(tài)學(xué)處理可以消除部分噪聲的影響,最后根據(jù)人臉的一些基本特征排除不可能為人臉的區(qū)域?qū)崿F(xiàn)人臉驗(yàn)證?;谀w色檢測(cè)的人臉檢測(cè)系統(tǒng)具體流程圖如圖1所示:在人臉檢測(cè)系統(tǒng)中,利用膚色來(lái)進(jìn)行人臉識(shí)別主要的過(guò)程就是先確定膚色的區(qū)域,然后再根據(jù)人臉部的一些主要特征,像人臉的位置主要在整個(gè)人的上方以及人臉輪廓的比例大小等等。主要環(huán)節(jié)包括光線補(bǔ)償、相似度計(jì)算、膚色分割以及形態(tài)學(xué)處理這幾個(gè)方面。
圖1 人臉檢測(cè)系統(tǒng)框圖
在采集圖像信息時(shí),由于曝光或者是其他原因使得圖片的色彩偏離了原來(lái)照片的真實(shí)顏色向另外一個(gè)方向移動(dòng),就是我們經(jīng)常所說(shuō)的色彩偏冷、偏暖等。為了解決這些問(wèn)題,首先就要對(duì)圖片進(jìn)行光纖補(bǔ)償來(lái)消除這種影響,以便于后續(xù)的方便處理。光纖補(bǔ)償通常分為亮度補(bǔ)償和色溫補(bǔ)償,也可分為自然適應(yīng)光補(bǔ)償和參考白補(bǔ)償。本文所使用的是參考白補(bǔ)償這種方法。
參考白補(bǔ)償?shù)姆椒ū举|(zhì)上就是調(diào)整圖片像素的RGB值,使得圖片的整體亮度變大。RGB色彩空間的R、G、B三個(gè)分量之間的獨(dú)立性比較明顯,在其基礎(chǔ)上直接建立膚色模型是存在比較大的困難的,R、G、B色彩空間原理可以用三維立體模型來(lái)描述[2],具體來(lái)說(shuō)是將圖像中的像素按由高到低的順序進(jìn)行排列,將前5%的像素都取出來(lái),如果在這5%里面的所有像素的數(shù)目足夠多,我們就可以將它設(shè)置為參考白,同時(shí)把這些像素的色彩的R、G、B值都調(diào)到255。然后用這些像素亮度的平均值除以255得到的就是光補(bǔ)償系數(shù),整個(gè)圖片中的像素的亮度值再都根據(jù)得到的光補(bǔ)償系數(shù)來(lái)進(jìn)行變換。
膚色在人臉檢測(cè)和跟蹤中是一種有效的特征[3],通過(guò)對(duì)圖像中人的膚色的相似度的計(jì)算就可以排除很大一部分與人的膚色不同的區(qū)域,得到一定的候選區(qū)域。然后再對(duì)候選區(qū)的圖像進(jìn)行特征比對(duì),就能將人臉檢測(cè)出來(lái)。具體做法是把輸入的彩色圖像從RGB空間變換到Y(jié)CgCr空間,針對(duì)YCgCr空間的高斯模型,計(jì)算得出每個(gè)像素點(diǎn)與膚色的相似度,并將其結(jié)果輸出。計(jì)算公式為:
二值化是光學(xué)字符識(shí)別(OCR)預(yù)處理階段的關(guān)鍵技術(shù),其處理效果的好壞直接影響光學(xué)字符識(shí)別的識(shí)別率的高低[4]。對(duì)相似度計(jì)算所得的圖片進(jìn)行二值化處理,就可以很清楚的得到膚色部分與非膚色部分,這樣跟利于后續(xù)進(jìn)一步的對(duì)人臉的識(shí)別。具體的做法就是將與膚色相似度很大的那部分設(shè)置成為1代表膚色,對(duì)相似度很小的那部分設(shè)置成為0代表背景。具體過(guò)程可以用公式表示,即:
這種情況下就涉及到閾值T的設(shè)定,如果閾值T設(shè)定的太大,則會(huì)將目標(biāo)像素點(diǎn)設(shè)定為背景;如果將閾值T設(shè)定的太小,又會(huì)將背景誤歸為目標(biāo)。閾值設(shè)定一般包括全局閾值、自適應(yīng)閾值以及最佳閾值等等。
全局閾值就是在整個(gè)處理過(guò)程中都使用同一個(gè)閾值,這種方法在背景和目標(biāo)有明確的區(qū)分時(shí)適用;在很多情況下,一個(gè)圖片中背景和目標(biāo)不是每一處都是一樣的,所以很難用全局閾值來(lái)處理,這種情況下就可以使用自適應(yīng)閾值的方法。所謂自適應(yīng)閾值法就是整個(gè)圖片中,根據(jù)不同的局部特征使用不同的閾值來(lái)分別處理,這種方法雖然解決了全局閾值的缺陷,但是加大了其運(yùn)算量,使其速度變慢。
二值化處理后的效果如圖2所示:
圖2 二值化處理后的效果
形態(tài)學(xué)不進(jìn)可以作為抽取圖像中區(qū)域形狀特征,也經(jīng)常用于圖像的預(yù)處理和后處理[5],在經(jīng)過(guò)二值化處理后得到的二值圖像很容易區(qū)分出膚色區(qū)域和非膚色區(qū)域,但是像圖2(b)的處理結(jié)果一樣,會(huì)有手、胳膊等皮膚區(qū)域也都會(huì)檢測(cè)出來(lái),當(dāng)然還包括噪聲。在這種情況下,怎么樣才能區(qū)分出來(lái)是人臉還是胳膊和其他的皮膚區(qū)域,以及該怎么樣消除噪聲的影響等等,就要用到形態(tài)學(xué)處理。
形態(tài)學(xué)處理主要包括腐蝕和膨脹兩個(gè)部分,通過(guò)腐蝕可以去除掉物體邊界以外的點(diǎn),讓物體在邊界處往里收縮,可以將小于目標(biāo)元素的一些點(diǎn)去除掉;而膨脹剛好相反,膨脹是將目標(biāo)圖像放大,使得一些離得很近的目標(biāo)點(diǎn)能夠聚集在目標(biāo)圖像的一個(gè)集合里,對(duì)圖像中空洞的填補(bǔ)有很大的作用。腐蝕和膨脹處理后的結(jié)果如圖3所示:
圖3 腐蝕和膨脹處理后的結(jié)果
通過(guò)前述的一些處理后,就可以得到一些候選區(qū)域,包括手、胳膊等等所有包含膚色的區(qū)域。接下來(lái)就是要在這些候選區(qū)域里通過(guò)人臉的一些形狀特征來(lái)進(jìn)行人臉的驗(yàn)證,例如按人臉的外接矩形的長(zhǎng)寬比來(lái)確定。人臉的高度和寬度的黃金比例是:
所以按照這個(gè)比例來(lái)確定人臉也是可以的,如果接近這個(gè)比例我們就可以將其判定為人臉部分,否則判定為非人臉區(qū)域。也可以根據(jù)人臉的形狀來(lái)確定,人臉形狀可以看作是近似橢圓的,顯然,一旦能過(guò)通過(guò)檢測(cè)系統(tǒng)獲取了橢圓的上、下、左、右4個(gè)點(diǎn)的坐標(biāo),橢圓的位置(即臉的位置)就會(huì)被發(fā)現(xiàn)[6]。如圖4所示:
圖4 候選區(qū)域分析及過(guò)濾圖
電子世界的迅猛發(fā)展,使得人臉驗(yàn)證的應(yīng)用變得越來(lái)越廣泛。本文是從膚色方面入手,克服了在驗(yàn)證過(guò)程中出現(xiàn)由于不是正臉對(duì)準(zhǔn)從而導(dǎo)致的驗(yàn)證失敗的問(wèn)題。通過(guò)對(duì)圖像中膚色信息的采集以及后續(xù)的光照補(bǔ)償、相似度計(jì)算、二值化分析和形態(tài)學(xué)處理實(shí)現(xiàn)對(duì)圖像中含有膚色的區(qū)域進(jìn)行提取,最后根據(jù)人臉的一些面部特征最終實(shí)現(xiàn)人臉的檢測(cè)。
參考文獻(xiàn)
[1]郭聳.人臉檢測(cè)若干關(guān)鍵技術(shù)研究[D].哈爾濱工程大學(xué),2011.
[2]周虹.YCbCr色彩空間的彩色圖像光線補(bǔ)償方法研究[J].柳州職業(yè)技術(shù)學(xué)院學(xué)報(bào),2014,14(3)::50-53.
[3]朱雙燕.基于膚色的人臉檢測(cè)與識(shí)別方法的研究[D].武漢理工大學(xué),2007
[4]童立靖等.幾種文本圖像二值化方法的對(duì)比分析[J].北方工業(yè)大學(xué)學(xué)報(bào),2001,23(1):28-33.
[5]陽(yáng)天舒等.基于形態(tài)學(xué)的自適應(yīng)閾值分割算法[J].電子設(shè)計(jì)工程,2015,23(13):102-104.
[6]趙媛媛等.基于膚色模型法的人臉定位技術(shù)研究[J].數(shù)學(xué)建模及其應(yīng)用,2014,3(4):21-26.
蔣淵淵(1990—),男,碩士,現(xiàn)就讀于貴州師范大學(xué),研究方向:語(yǔ)音信號(hào)處理。
作者簡(jiǎn)介: