摘要在基于坐標(biāo)的基礎(chǔ)上提出基于灰度的主元分析算法,應(yīng)用于圖像人臉偏轉(zhuǎn)角度的檢測(cè),實(shí)現(xiàn)了圖像人臉定位過(guò)程中人臉偏轉(zhuǎn)的校正。進(jìn)行實(shí)驗(yàn)比較。
關(guān)鍵詞人臉偏轉(zhuǎn)校正;偏轉(zhuǎn)角度;基于灰度加權(quán)的主元分析
中圖分類(lèi)號(hào)TP391文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)1673-9671-(2009)121-0037-01
人臉檢測(cè)在復(fù)雜環(huán)境下受到多種因素的影響,其中人臉姿態(tài)的隨意性就是造成圖像人臉檢測(cè)困難的一個(gè)重要原因,包括深度旋轉(zhuǎn)、平面旋轉(zhuǎn)、外界物干擾等各種狀況,導(dǎo)致人臉定位不準(zhǔn)確。
人臉定位的方法一般基于眼睛等臉部特征。目前,眼睛定位的主要方法包括基于神經(jīng)網(wǎng)絡(luò)的方法、可變模板匹配方法以及廣義對(duì)稱(chēng)變換方法等。但是這些方法都存在計(jì)算量大、對(duì)大角度旋轉(zhuǎn)的圖像人臉的檢測(cè)效果不佳的缺陷。所以,本文基于灰度加權(quán)對(duì)人臉區(qū)域進(jìn)行主元分析,計(jì)算出人臉偏轉(zhuǎn)角度,從而校正人臉偏轉(zhuǎn),以利于進(jìn)一步的圖像人臉定位。
1主元分析的原理
所謂主元分析,就是對(duì)二值圖像中“1”區(qū)域的各個(gè)像素的坐標(biāo)值進(jìn)行統(tǒng)計(jì),計(jì)算這些坐標(biāo)值的方差和協(xié)方差,求出協(xié)方差矩陣的兩個(gè)特征值和特征向量。大的特征值對(duì)應(yīng)的特征向量代表該區(qū)域的主軸方向,小的特征值對(duì)應(yīng)的特征向量代表該區(qū)域的副軸方向。主軸方向和圖像的垂直軸之間的夾角就是該區(qū)域的偏轉(zhuǎn)角度。
如圖1所示,這是一個(gè)橢圓區(qū)域模型二值圖,圖(a)是逆時(shí)針偏轉(zhuǎn) =30°的模型,圖(b)是無(wú)偏轉(zhuǎn)的模型,圖中紅線分別標(biāo)注主軸和副軸的方向。
一般情況下,人臉區(qū)域呈現(xiàn)橢圓或接近橢圓形狀,其主軸方向經(jīng)過(guò)鼻梁、額頭及下巴中心,人臉以主軸線為中心軸左右對(duì)稱(chēng)。所以說(shuō),主元分析方法適用于圖像人臉區(qū)域。
2基于灰度加權(quán)的主元分析算法
人臉具有非常豐富的灰度信息,而基于坐標(biāo)向量的主元分析方法將各像素點(diǎn)等同對(duì)待。本文認(rèn)為,人臉不僅在形狀上以過(guò)鼻梁、額頭及下巴中心的主軸線左右對(duì)稱(chēng),而且五官的灰度信息也各有不同:眼珠灰度較低,而主軸線附近包括鼻梁、下巴、額頭等灰度較高。如果加大主軸線附近的高灰度像素對(duì)主元分析的影響,那么主元分析得到的主軸線將更靠近這些像素點(diǎn),遠(yuǎn)離低灰度的像素點(diǎn)。這里提出一種基于灰度加權(quán)的主元分析方法。
基于灰度加權(quán)的主元分析的關(guān)鍵在于,對(duì)各像素點(diǎn)的坐標(biāo)值基于相應(yīng)的灰度值的大小進(jìn)行加權(quán)修正。我們可以這樣理解這種方法,即高灰度的坐標(biāo)位置上可能“多于一個(gè)的像素”參與基于坐標(biāo)向量的主元分析,低灰度的坐標(biāo)位置上可能要“少于一個(gè)的像素”參與基于坐標(biāo)向量的主元分析;而主軸線附近區(qū)域高灰度像素點(diǎn)比較豐富,相當(dāng)于主軸線附近更多的像素參與基于坐標(biāo)向量的主元分析。
基于灰度加權(quán)的主元分析算法如下:
1)計(jì)算像素行坐標(biāo)方差 、列坐標(biāo)方差
式中,(i, j)表示人臉區(qū)域的像素行、列坐標(biāo),( ,)為橢圓區(qū)域的像素坐標(biāo)質(zhì)心,g(i,j)為膚色區(qū)域灰度。
2)計(jì)算像素行、列坐標(biāo)協(xié)方差
(公式3)
3)計(jì)算橢圓區(qū)域的偏轉(zhuǎn)角度
(公式4)
3人臉偏轉(zhuǎn)校正
當(dāng)圖像人臉區(qū)域的偏轉(zhuǎn)角度(逆時(shí)針?lè)较驗(yàn)檎?已知時(shí),人臉偏轉(zhuǎn)校正就是要將人臉區(qū)域沿著相反方向旋轉(zhuǎn)角度。本文以圖像中心對(duì)稱(chēng)點(diǎn)為原點(diǎn)進(jìn)行旋轉(zhuǎn),而不是圖像的某個(gè)角點(diǎn),使得圖像中心即可能的人臉中心區(qū)域的偏轉(zhuǎn)校正誤差最小;相對(duì)的,越遠(yuǎn)離中心的區(qū)域誤差越大。
4實(shí)驗(yàn)
選擇偏轉(zhuǎn)(-90o ~ +90o )不同角度的60張人臉圖進(jìn)行人臉偏轉(zhuǎn)角度檢測(cè)試驗(yàn),實(shí)驗(yàn)中主軸方向標(biāo)準(zhǔn)由標(biāo)定的眼睛連線的垂直方向確定。實(shí)驗(yàn)結(jié)果如表1,如圖2。
表1 人臉偏轉(zhuǎn)角度檢測(cè)及比較
檢測(cè)方法誤差+3o 誤差+8o
基于灰度加權(quán)的主元分析86.7%96.7%
基于坐標(biāo)向量的主元分析68.3%93.3%
由表1可以看出,兩種主元分析方法應(yīng)用于人臉偏轉(zhuǎn)角度的檢測(cè)都十分有效,在誤差+8o 范圍內(nèi),兩種方法檢測(cè)率差不多,本文方法檢測(cè)率略高;而在誤差+3o 范圍內(nèi)的檢測(cè)結(jié)果,則說(shuō)明本文方法比基于坐標(biāo)向量的主元分析方法有更高的精確度。
同時(shí),實(shí)驗(yàn)中發(fā)現(xiàn),本文的人臉偏轉(zhuǎn)角度檢測(cè)算法除了繼承主元分析方法良好的,還對(duì)其他因素(如:亮度較低或較高,略微左右深度,偏轉(zhuǎn)佩戴眼鏡,頭發(fā)部分區(qū)域被檢測(cè)為膚色等)具有相當(dāng)好的抗干擾能力。
圖2基于灰度加權(quán)主元分析的人臉偏轉(zhuǎn)校正示例圖
附圖說(shuō)明:每組人臉圖前一張為偏轉(zhuǎn)圖像,后一張為校正后圖像
參考文獻(xiàn)
[1] 梁路宏,艾海舟,何克忠 等.基于仿射模板匹配的多角度單人臉定位[J].計(jì)算機(jī)學(xué)報(bào),2000,23(6):640-645.
[2] Riesfeld D,Wolfson H, Yeshurun Y. Context Free Attentional Operators:the Generalized Symmetry Transform [J]. Computer Vision,1995,14:119-130.
[3]高全學(xué),潘泉,程詠梅 等.基于膚色和獨(dú)立成分的人臉檢測(cè)[J].計(jì)算機(jī)應(yīng)用研究,2004,12:160-162.
作者簡(jiǎn)介:
阮書(shū)敏(1977-),男,福建福州人,碩士、助教,主要研究方向:圖像處理、模式識(shí)別、數(shù)字化偵查。