摘 要:人臉的檢測是人臉信息處理領域中的一項關鍵技術,其自動人臉識別系統(tǒng)、基于內(nèi)容的檢索、視覺監(jiān)測、新一代人機交互技術等領域具有廣闊的應用前景。而高斯模型是模型識別研究中經(jīng)常用到的一個模型。建立一種基于YCbCr高斯膚色模型,并對其進行驗證和分析,隨后對二值化圖像進行基于數(shù)學形態(tài)學和連通區(qū)域分析和處理,盡可能地去掉大部分非人臉區(qū)域,對于人臉識別的研究有一定的價值和意義。
關鍵詞:人臉檢測;膚色模型;高斯模型;相似度分割;閾值
中圖分類號:TN9198文獻標識碼:A
文章編號:1004-373X(2008)22-102-04
Research on the Face Detection Based on YcbCr Skin Gaussian Model
WANG Hangyu
(Xi′an Aeronautical Polytechnic Institute,Xi′an,710089,China)
Abstract:The face detection and tracking is key technology in the field of face information processing,it′s widely applied in the fields of automated face recognition system,based on content index,video monitoring and human-machine alternative technology.But Gaussian model is often used in the pattern recognition research.A skin Gaussian model based on the color space of YCbCr is proposed,at the same time,it is validated and analyzed.After analyzing the connected component and using the filter based on mathematical morphology,the candidate facial regions can be obtained,most non-face regions can be wiped off,it has some research and application value in face recognition.
Keywords:face detection;skin model;Gaussian model;similar degree dividing;threshold value
1 引 言
視覺是人類從大自然中獲取信息的最主要的手段。據(jù)統(tǒng)計,在人類獲取的信息中,視覺信息約占60%,聽覺信息約占20%,其他的如味覺信息、觸覺信息等加起來約占20%。由此可見視覺信息對人類的重要性,而對圖像的處理正是人類獲取視覺信息的主要途徑。人臉檢測(face detection)正是針對視覺信息的數(shù)字圖像處理領域的一個重要課題,也是計算機視覺和人機交互領域中的研究熱點。在彩色數(shù)字圖像中,基于膚色信息的人臉檢測方法無論是作為一種初檢測的手段為后續(xù)方法提供更準確的查找范圍,還是作為一種直接使用的核心方法進
行精確的人臉檢測定位,都有重要的研究和應用價值。
2 膚色建模
用數(shù)學表達式明確規(guī)定膚色范圍是一種簡單的膚色建模方法。例如Chair采用YCbCr顏色空間的CbCr平面;如果輸入像素的顏色落入Cr=[133,173]和Cb=[77,127]限定的矩形區(qū)域,就為是屬于膚色像素,有人注意到在不同的亮度分量Y上的矩形區(qū)域(Cr,Cb)不同,因此在Y分量上分段定義膚色矩形區(qū)域。張洪明等在YUV空間中根據(jù)Y范圍和UV平面中的色度范圍進行膚色檢測。這種簡單明確的判斷運行起來快速高效,特別是在實時系統(tǒng)中更具有吸引力。
規(guī)定膚色范圍雖然快捷,但要取得好的效果需要解決2個問題:
(1) 如何選擇合適的顏色空間;
(2) 怎么樣確定規(guī)則中的參數(shù)。選擇顏色空間不僅要考慮膚色樣本在顏色空間中的聚集程度,還要注意在該空間的色域。因為有些顏色空間的色域沒有規(guī)則邊界。
2.1 高斯分布模型
高斯密度函數(shù)估計是一種參數(shù)化建模??梢杂脝畏甯咚鼓P蚐GM或混合高斯模型GMM。
(1) 單峰高斯模型
這種方法是假設膚色分布服從單峰高斯分布。它主要通過統(tǒng)計分析,預測高斯分布的參數(shù),其中參數(shù)確定常用的方法有EM算法,Maximum-Likelihood 或通過統(tǒng)計直接求得色彩空間中每個分量(一般利用的是該色彩空間中的色度分量)的均值與方差。采用這種方法也分為2步:首先選擇方法確定模型的參數(shù)(即均值和方差);其次利用該模型來判別新的像素或區(qū)域是否為膚色。
(2) 混合高斯模型
由于具有不同種族的膚色直方圖并不完全滿足單峰高斯分布,通過研究可以采用多峰的高斯分布來精確表示。因此,提出了混合高斯模型,如式(1)所示:
p(x)=∑mi=1P(wi)p(x|wi)(1)
其中,p(x)為膚色像素在色彩空間中的混合概率密度;p(x|wi)為分量的概率密度;P(wi)為分量的先驗概率;i=1,2,…,m為混合密度的分量個數(shù)。該模型表明膚色的每個像素密度都屬于概率密度的混合體。
2.2 膚色模型的選擇與建立
在色彩空間中不同色調(diào)的物體聚類在各自不同的色帶中,由此可以利用彩色信息在圖像中快速地檢測出相應的目標。在用于人臉檢測的圖像中,臉部所在的膚色區(qū)域通常總是與圖像的其他部分在顏色上存在差異,能從色度信息上很好區(qū)分開進而從圖像中分割出來。
YCbCr格式是從YUV色彩模型衍生出來的,選擇YCbCr彩色空間,其中的Y分量是表示像素的亮度,Cr和Cb稱為色度,Cr分量表示紅色分量,Cb表示藍色分量,具有HSV的特性,能將亮度和色度分離,膚色在該色彩空間中聚集在一個很小的范圍內(nèi)。并且YCbCr空間既能充分表達人臉膚色,又能在很大程度上消除了亮度影響,降低了色彩空間的維數(shù),減少了計算復雜度。將圖像轉(zhuǎn)換到YCbCr空間具有以下優(yōu)點:
(1) YCbCr色彩格式具有與人類視覺感知過程相類似的構成原理;
(2) YCbCr色彩格式被廣泛地應用在電視顯示等領域中,也是許多視頻壓縮編碼,如MPEG,JPEG等標準中普遍采用的顏色表示格式;
(3) 在YCbCr空間中,Y分量給出所有的亮度信息,Cb和Cr分量不受亮度影響,有效地將亮度分量分離出來;
(4) 相比HSV等其他一些色彩格式,YCbCr色彩格式的計算過程和空間坐標表示形式比較簡單,色彩分量Y,Cb,Cr可由3基色R,G,B經(jīng)過線性變換得到,計算效率比較高,同時避免了非線性空間的奇異性;
(5) 在YCbCr色彩空間中膚色的聚類特性比較好。
YCbCr色彩空間的這些特點在人臉檢測的膚色分割中具有較高的使用價值。在本文中,選用YCbCr色彩空間作為膚色分布統(tǒng)計的映射空間,根據(jù)人臉膚色在該空間的統(tǒng)計分布特性提出一種基于相似度的人臉檢測方法。
膚色樣本選擇合適與否將直接決定著人臉檢測的工作效果。為了準確統(tǒng)計出人臉區(qū)域的膚色聚類特征,選取了各種彩色人臉圖片作為人臉膚色樣本的采集源,其中包括了不同光照、性別、年齡和人種(主要以黃種、白種和印第安人為主,如圖1所示)以使統(tǒng)計的膚色分布更具代表性。
圖1 采集的不同人種膚色在CbCr空間的分布
圖1表明:不同亮度的人臉膚色在YCbCr色彩空間中,在忽略亮度分量影響情況下,其色度分量Cb和Cr的分布趨于一致,而且集中在1個較小的區(qū)域里,本文將采樣得到的膚色樣本中的每個膚色像素點的R,G,B值轉(zhuǎn)換到YCbCr色彩空間,得到每個膚色像素點的色度值(Cb,Cr)。并在CbCr空間中對膚色像素進行統(tǒng)計分析。其膚色像素在CbCr區(qū)域分布如圖2所示。
圖2 膚色像素在CbCr區(qū)域的分布
從圖2中可以得出結論:膚色像素在CbCr空間上具有較好的聚類性,并且符合二維高斯分布,采用YCbCr色彩空間可以不用考慮不同的膚色對膚色模型CbCr中的聚合。
由于通過采樣得到的是離散的點,如果直接通過像素Cb,Cr的值來判斷是否是膚色像素是不現(xiàn)實的,故需要通過數(shù)學的方法建立一個模型得到1個函數(shù),輸入為1個像素的Cb,Cr值,輸出為該像素是膚色像素的概率或者直接設置閾值輸出判斷。下面確定二維高斯模型G(m,C)中的未知參數(shù),具體計算公式如下:
m=(Cr,Cb)T(2)
Cr=1N∑Ni=1Cri(3)
Cb=1N∑Ni=1Cbi(4)
C=E[(x-m)(x-m)T]=σ2CrσCb,Cr
σCr,Cbσ2Cb〗(5)
x是每個像素點的色度向量;第一個分量是Cr;第二個分量是Cb;m和C分別是統(tǒng)計出來的均值和方差。經(jīng)過實驗統(tǒng)計,均值和方差分別為:
m=(156.559 9,117.436 1)T(6)
C=299.457 412.1430
12.143 0160.130 1〗(7)
經(jīng)上述參數(shù)擬合的膚色分布高斯模型如圖3所示。
圖3 膚色分布的高斯模型
3 膚色相似度分割
根據(jù)已建立的膚色模型,計算人臉圖像中所有像素點顏色與膚色的可能性大小,即相似度大小,其取值范圍為[0,1],相似度計算公式如式(8)所示:
P(Cr,Cb)=exp[-0.5(x-m)TC-1(x-m)](8)
其中:x=[Cr,Cb]T為像素點在CbCr空間中的向量。
計算完畢后,對所求得的每個P(Cr,Cb)值進行歸一化處理,即將每個P(Cr,Cb)值除以該圖像中最大的P(Cr,Cb)值,這樣就使得各像素的相似度的值在[0,1]之間,并且使膚色區(qū)域亮度更加突出。該值越大,表示屬于膚色的可能性也越大,反之越小。
4 閾值的選取及其二值化
在完成膚色相似度分割之后,接下來進行二值化。二值化閾值的選取非常關鍵,前面的敘述已經(jīng)提到,目前國內(nèi)外學者針對這一課題進行了廣泛深入的研究和大量試驗,提出了各種各樣的閾值處理技術,包括全局閾值、自適應閾值、最佳閾值等。本文主要通過自適應閾值法,將相似度圖像進一步轉(zhuǎn)化為二值圖,其中0,1分別表示非膚色區(qū)域和膚色區(qū)域。
由于真正的膚色像素相比于非膚色像素往往擁有更高的亮度,所以可以設定一個閾值,當該點像素的相似度高于這個閾值則認為該點為膚色像素并置1,反之若低于該閾值則置0。但由于不同的圖片中人的膚色是不相同的,而且不同人種的膚色有一定的差異,如果閾值取得太大,許多皮膚區(qū)域?qū)o法檢出,造成漏檢;若閾值取得太小,膚色的數(shù)量就會增加,并有部分非膚色像素加入,起不到排除非膚色點的作用。故在設定閾值時需要對每一張不同的圖片計算出自適應閾值,該閾值應該能夠最優(yōu)地區(qū)分出膚色與非膚色像素。
從直覺上來說,隨著閾值的下降將會導致分割區(qū)域的增加,然而試驗結果表明當閾值處于某個范圍中,隨著閾值的降低,分割區(qū)域并不會明顯增加(這是因為這個階段的膚色像素已經(jīng)被完全檢測出來,而非膚色像素還沒有被認為是膚色像素)。如果繼續(xù)降低閾值到達某一個特定值后,隨著非膚色區(qū)域被錯認為膚色區(qū)域,則會出現(xiàn)分割區(qū)域面積大幅度增加的情形。故最優(yōu)閾值應該是在隨著閾值增長,類膚色區(qū)域面積增長最小的范圍之內(nèi)。在本文中采用的方法是讓閾值從0.65開始減少,每次減少0.1,直到0.05為止,并記錄下每次閾值變化時屬于膚色像素數(shù)量的變化,然后找出屬于膚色像素數(shù)量變化最小時的那個閾值作為最優(yōu)化閾值,如得到在從0.45減少到0.35區(qū)間時膚色像素數(shù)量增加最少,則優(yōu)化后的閾值為0.40。閾值分割比較結果如圖4所示。
圖4 閾值分割比較
從圖4(c)得到的二值圖中可以看出,由于閾值選取較低,導致除了膚色外,還有大量的其他非膚色區(qū)域也被檢測出來,誤檢率比較高;而在圖4(d)中,由于閾值選取時比最優(yōu)閾值高,致使面部部分膚色沒有被完全檢測出來,導致漏檢率增大。但經(jīng)過自適應閾值分割后的二值(見圖4(e)),能很好的將膚色和背景分離,準確率得到提高。
5 膚色區(qū)域的驗證
在對膚色區(qū)域進行一系列處理后,得到了一系列的候選區(qū)域。由于在背景中可能存在很多和人臉膚色相近或相同的區(qū)域被誤判為人臉區(qū)域,因此需進一步根據(jù)一些先驗知識對這些侯選區(qū)域進行判別優(yōu)化,剔除那些明顯不是人臉的區(qū)域。
通過大量實驗發(fā)現(xiàn),對膚色區(qū)域的形狀、密集度等幾何特征加以考慮,可以得到較為滿意的效果。
具體的判別規(guī)則如下:
(1) 噪聲規(guī)則:若目標區(qū)域的寬度(Facerect_W)小于20,高度(Facerect_H)小于30,則刪除該區(qū)域(一般來說,人臉在圖像中應占有一定比例)。
(2) 形狀規(guī)則:若目標區(qū)域的外接矩形高寬之比ratio不在規(guī)定的閾值范圍(0.8~2.5)內(nèi)時,則刪除該區(qū)域。
一般來說,人臉的高寬比大約為1,考慮到人姿態(tài)各異,為了防止漏選,規(guī)定這個比例的下限為0.8,ratio<0.8的所有待檢區(qū)域?qū)⒈粸V除。另一方面,人臉高寬比也應當規(guī)定一個上限。這是因為在實際中存在一些情況,待檢區(qū)域中含有人臉,但是圖像的高寬比高出了人臉正常高寬比的范圍。如人由于頸部及其以下皮膚區(qū)域有所暴露,在這種情況下通過膚色分割得到的待檢區(qū)域高寬比就超出了正常的范圍。因此必須考慮這種特殊情況,給出一個更寬的高寬比上限2.5。通過形狀規(guī)則的使用,就可以排除一些不規(guī)則但和皮膚顏色接近的物體,同時也可以排除一些人體的其他非人臉區(qū)域,如彎曲的四肢等。
(3) 占有率規(guī)則:若目標區(qū)域的密集度C小于45%,則刪除該區(qū)域(人臉區(qū)域一般近似為橢圓)。
人臉驗證的算法框圖如圖5所示,通過上述判別準則,非人臉區(qū)域得到了過濾,對干擾區(qū)域?qū)崿F(xiàn)了較為滿意的排除,能排除大部分非人臉的候選區(qū)域,進一步提高了檢測的正確率。
如對圖4進行區(qū)域驗證后可得到結果如圖6所示。由圖6可以看出,在通過人臉幾何特征驗證過后,一些膚色區(qū)域但非人臉區(qū)域如人的手臂等得到了較好的排除,減小了一些噪聲對檢測結果的影響。即通過上述判別準則,非人臉區(qū)域得到了一定的過濾,對干擾區(qū)域?qū)崿F(xiàn)了較為滿意的排除。
圖5 人臉驗證框圖
圖6 人臉幾何特征驗證圖
6 結 語
利用YCbCr 色彩空間建立膚色模型更接近人對彩色的認識和理解,進行膚色判斷也更為方便和有效,還可以有效地將亮度和色度進行分離,也非常適合于將膚色區(qū)域從圖像背景中分割出來。
參考文獻
[1]何斌.Visual C++數(shù)字圖像處理[M].北京:人民郵電出版社,2007.
[2]俞海珍.基于差分圖像的人臉檢測與跟蹤研究[D].杭州:浙江工業(yè)大學,2003.
[3]Elettheriadis A.Automatic Face Location Detection and Tracking for Model-assisted Coding of Video Teleconferencing Sequences at Low bit-Rates [J].Signal Processing: Image Communication,2005,7(3):231-248.
[4]張洪明,趙德斌,高文.基于膚色模型、神經(jīng)網(wǎng)絡和人臉結構模型的平面旋轉(zhuǎn)人臉檢測[J].計算機學報,2002,25(11): 1 250-1 256.
[5]李傳林,魯秀青.人臉照片的特征提取與查詢[J].計算機應用研究,2002(7):110-111.
[6]Xiaobo Li,Nichols Roeder.Face Contour Extraction from Front-View Images[J].Pattern Recognition,2006,28(8):1 167-1 179.
[7]湯彥萌,吳樂南.復雜背景下彩色人臉的快速預處理算法[J].現(xiàn)代電子技術,2007,31(24):115-117.
[8]董梁,王忠民.圖像邊緣檢測算法研究.[J].現(xiàn)代電子技術,2007,30(15):179-180.
作者簡介
王航宇 男,1981年出生,陜西臨潼人,助理講師,工學碩士。研究方向為計算機信息技術與智能控制。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文