摘 要:為了提高人臉定位算法的執(zhí)行效率和魯棒性,以傳統(tǒng)的SNoW(Sparse Network of Winnows)算法為理論基礎(chǔ),提出一種新的人臉定位算法。樣本特征提取時(shí)將亮度做了局部二值化映射,訓(xùn)練分類器時(shí)訓(xùn)練了人臉和非人臉2個(gè)網(wǎng)絡(luò),利用這2個(gè)網(wǎng)絡(luò)的輸出結(jié)果之差進(jìn)行分類,使用采樣的方法檢測(cè)不同大小的人臉,使用遮罩避免頭發(fā)和衣領(lǐng)的干擾。實(shí)驗(yàn)結(jié)果表明,新算法比傳統(tǒng)算法節(jié)約計(jì)算資源,提高了執(zhí)行效率,提升了算法對(duì)于表情、遮蓋、光照、姿勢(shì)、大小魯棒性。
關(guān)鍵詞:人臉定位;SNoW;分類器;魯棒性
中圖分類號(hào):TP317.4 文獻(xiàn)標(biāo)識(shí)碼:B 文章編號(hào):1004373X(2008)1814603
An Improved Face Detection Algorithm Based on SNoW
XU Jian1,CHANG Zhiguo2
(1.Xi′an Institute of Post Telecommunications,Xi′an,710121,China;
2.School of Electronic Information and Electrical Engineering,Shanghai Jiaotong University,Shanghai,200240,China)
Abstract:To improve the efficiency and robustness of the face detection algorithm,a novel approach based on traditional SNoW (Sparse Network of Winnows)is proposed.Main innovations consist of the followings: the illumination insensitive feature is mapped into local binary feature,face table and nonface table are trained and the difference between the outputs of two tables is used for classification,sampling is used for detecting faces of various sizes,mask is utilized for avoiding the interference of hair and collar.The experimental results show that the new algorithm saves the computing resource and improves the efficiency and robustness to expression,occlusion,lighting,pose and size.
Keywords:face detection;SNoW;classifier;robustness
1 引 言
人臉定位是確定景物中是否有人臉,有幾個(gè)人臉,并且確定其位置的技術(shù)。人臉定位與識(shí)別系統(tǒng)被廣泛應(yīng)用于監(jiān)控、制造、急救以及基于內(nèi)容的視頻檢索中。近年來,人臉定位技術(shù)獲得較大的發(fā)展,并涌現(xiàn)出了許多研究方向[1,2]。現(xiàn)有的人臉定位研究主要集中在如下的幾個(gè)領(lǐng)域:神經(jīng)網(wǎng)絡(luò)技術(shù)[3]、統(tǒng)計(jì)模型[4]、AdaBoost[5]、SNoW[6]和支持向量機(jī)[7]。與其他技術(shù)相比,SNoW具有算法復(fù)雜度低,執(zhí)行速度快等優(yōu)點(diǎn),所以受到了廣泛關(guān)注。但是傳統(tǒng)的SNoW算法直接使用像素亮度為特征,導(dǎo)致網(wǎng)絡(luò)龐大,占用存儲(chǔ)空間大。且分類算法對(duì)于表情,遮蓋,光照,姿勢(shì),大小等魯棒性較差[6]。
本文以提出一種新的算法對(duì)傳統(tǒng)的SNoW算法做出了大的改進(jìn)。實(shí)驗(yàn)表明,改進(jìn)之后的算法具有良好的效果。
2 算法描述
2.1 SNoW算法
SNoW(Sparse Network of Winnows)學(xué)習(xí)體系的基本思想是利用事先定義好的樣本特征來訓(xùn)練線性稀疏網(wǎng)絡(luò),然后用訓(xùn)練好的網(wǎng)絡(luò)實(shí)現(xiàn)分類。每一個(gè)線性網(wǎng)絡(luò)節(jié)點(diǎn)直接與樣本特征相對(duì)應(yīng)。SNoW用于人臉定位最初由Roth在文獻(xiàn)[6]中提出。
在訓(xùn)練網(wǎng)絡(luò)的過程中,樣本被分為兩類。一類為積極樣本,一類為消極樣本。在人臉定位過程中,訓(xùn)練該網(wǎng)絡(luò)的積極樣本為人臉樣本,消極樣本為非人臉樣本。令A(yù)t={i1,i2,…,im}為積極樣本的特征集合,它們對(duì)應(yīng)網(wǎng)絡(luò)上目標(biāo)節(jié)點(diǎn)t。設(shè)wti為網(wǎng)絡(luò)節(jié)點(diǎn)t的第i個(gè)特征的權(quán)重,θt為判決門限。當(dāng)且僅當(dāng)∑i∈Atwti>θt時(shí),表示網(wǎng)絡(luò)的權(quán)重滿足要求,否則將根據(jù)訓(xùn)練規(guī)則調(diào)整網(wǎng)絡(luò)節(jié)點(diǎn)的權(quán)重wti。
SNoW網(wǎng)絡(luò)的訓(xùn)練規(guī)則主要是通過事先定義的積極和消極樣本升高和降低網(wǎng)絡(luò)節(jié)點(diǎn)的權(quán)重。首先定義門限θt、上升參數(shù)α>1,和下降參數(shù)0<β<1。當(dāng)輸入訓(xùn)練樣本為人臉,但是∑i∈Atwti<θt時(shí),令i∈At:wti←αwti;當(dāng)輸入樣本為非人臉,但是∑i∈Atwti>θt時(shí),令i∈At:wti←βwti。經(jīng)過大量的人臉和非人臉的樣本訓(xùn)練,該線性網(wǎng)絡(luò)具有了分類的功能。當(dāng)輸入一幅未知內(nèi)容的圖像時(shí),該網(wǎng)絡(luò)就可以實(shí)現(xiàn)人臉定位。
傳統(tǒng)的算法主要使用圖像的原始亮度作為特征來訓(xùn)練網(wǎng)絡(luò)。該特征定義如圖1所示[8]:
圖1 亮度特征傳統(tǒng)的算法具有占用資源多、執(zhí)行效率低、魯棒性差等缺點(diǎn)。本文針對(duì)這些缺點(diǎn)從樣本特征定義和分類算法方面對(duì)傳統(tǒng)的算法做出改進(jìn)。
2.2 樣本特征的提取
2.2.1 傳統(tǒng)算法的缺點(diǎn)
傳統(tǒng)算法直接使用亮度作為像素特征具有以下缺點(diǎn):
(1) 占用資源多。由于每個(gè)像素都有256種可能灰度,所以當(dāng)樣本圖像的大小為m×n時(shí),線性網(wǎng)絡(luò)的大小為m×n×256。
(2) 魯棒性差。光照的強(qiáng)弱會(huì)直接導(dǎo)致人臉亮度的大小。所以同樣一張人臉在光照不同的情況下,傳統(tǒng)算法會(huì)得出不同的結(jié)果,導(dǎo)致漏檢或錯(cuò)檢。
2.2.2 新算法的步驟
針對(duì)以上缺點(diǎn),新的算法提出局部二值化映射算法,步驟如下:
(1) 計(jì)算樣本圖像亮度的局部均值E(x,y)。
(2)以局部均值E(x,y)為閾值,對(duì)樣本圖像的亮度I(x,y)進(jìn)行局部閾值的二值化,得到二值化圖像M(x,y)。I(x,y)→E(x,y)M(x,y)(1)
(3) 根據(jù)式(2)將M(x,y)映射為D(x,y)。D(x,y)=M(x,y)+2×M(x+1,y)+
4×M(x,y+1)+8×M(x+1,y+1)(2)
(4) 利用D(x,y)作為像素特征訓(xùn)練樣本。
2.2.3 新算法的優(yōu)點(diǎn)
(1) 由于D(x,y)只有16種可能值,所以當(dāng)樣本圖像的大小為m×n時(shí),線性網(wǎng)絡(luò)的大小為m×n×16。比傳統(tǒng)算法大大節(jié)約資源。
(2) 局部二值化有效的克服光照的強(qiáng)弱對(duì)算法的影響,提高了算法的魯棒性。
2.3 SNoW分類器的訓(xùn)練方法
SNoW算法的關(guān)鍵是如何訓(xùn)練一個(gè)有效的線性網(wǎng)絡(luò)。本文提出的新的分類器如下:θ=∑x∈Whnonfacex(M(x))-∑x∈Whfacex(M(x))(3)其中hnonfacex為非人臉網(wǎng)絡(luò);hfacex為人臉網(wǎng)絡(luò);θ為非人臉網(wǎng)絡(luò)與人臉網(wǎng)絡(luò)計(jì)算結(jié)果之差;定義判決門限為γ,當(dāng)θ<γ時(shí)判決為人臉,當(dāng)θ>γ時(shí)判決為非人臉。
訓(xùn)練人臉網(wǎng)絡(luò)hfacex的方法如下:
(1) 建立一個(gè)m×n×16的矩陣,每個(gè)矩陣元素的值均為1。
(2) 利用標(biāo)準(zhǔn)人臉圖庫進(jìn)行訓(xùn)練。
當(dāng)∑x∈whfacex(Mi(x))≤ε時(shí):hfacex(Mi(x))=αhfacex(Mi(x))其中α>1。
(3) 利用標(biāo)準(zhǔn)非人臉圖庫進(jìn)行訓(xùn)練。
當(dāng):∑x∈whfacex(Mi(x))>ε時(shí):
hfacex(Mi(x))=β hfacex(Mi(x))。
其中0<β<1。
訓(xùn)練非人臉網(wǎng)絡(luò)的方法與上述方法類似,但升高和降低網(wǎng)絡(luò)權(quán)重的規(guī)則正好相反。
2.4 分類器用于人臉定位
當(dāng)訓(xùn)練好的分類器用于人臉定位時(shí),為了避免頭發(fā)和衣領(lǐng)的影響。這里使用一個(gè)遮蓋物將圖像四角遮蓋起來[9]。
圖2 遮罩人臉定位分類器對(duì)于人臉大小的魯棒性問題一直是該領(lǐng)域研究的重點(diǎn)。這里使用采樣的方法獲取一個(gè)圖像的不同大小。例如對(duì)圖像進(jìn)行隔1個(gè)像素采1個(gè)樣,獲取圖像的大小為原圖像的1/2。如果隔1個(gè)像素采2個(gè)像素,采樣得到的圖像為原圖像大小的2/3。
3 實(shí)驗(yàn)結(jié)果
這里使用CMU+MIT[10]標(biāo)準(zhǔn)人臉數(shù)據(jù)庫,其中包含2 429張人臉和4 548張非人臉來訓(xùn)練人臉和非人臉網(wǎng)絡(luò)。接下來將待定位圖像以19×19的大小為單位進(jìn)行局部二值化映射,并將圖像以9/10的比例進(jìn)行逐級(jí)采樣。然后送入人臉定位分類器進(jìn)行分類。為了驗(yàn)證分類器的性能,做了2組實(shí)驗(yàn)。一組使用標(biāo)準(zhǔn)圖庫,這里采用的是ATT的400副圖進(jìn)行實(shí)驗(yàn)。第二組采用20副自然照片進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,該人臉定位算法對(duì)于表情、遮蓋(如眼鏡,胡須等)、光照、姿勢(shì)、大小等均具有較強(qiáng)的魯棒性。
表1 實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)
正確率錯(cuò)誤數(shù)標(biāo)準(zhǔn)圖庫85%6020副自然照片80%7
部分人臉定位的結(jié)果如圖3所示:
圖3 部分人臉定位結(jié)果4 結(jié) 語
本文提出一種基于SNoW的人臉定位算法。樣本特征提取時(shí)將亮度做了局部二值化映射有效地提高了算法對(duì)于光照的魯棒性。訓(xùn)練分類器對(duì)人臉和非人臉模板分別進(jìn)行訓(xùn)練,利用兩個(gè)網(wǎng)絡(luò)的輸出結(jié)果之差進(jìn)行分類,增加了人臉檢測(cè)的準(zhǔn)確率。使用采樣的方法來檢測(cè)不同大小的人臉,提高了算法對(duì)于人臉大小的魯棒性。使用遮罩避免了頭發(fā)和衣領(lǐng)的干擾。
實(shí)驗(yàn)結(jié)果表明,新算法比傳統(tǒng)算法節(jié)約了計(jì)算資源,提高了執(zhí)行效率。結(jié)合其他數(shù)學(xué)模型進(jìn)一步優(yōu)化算法,提高定位精度是下一步工作的重點(diǎn)。
參 考 文 獻(xiàn)
[1]Yang M H,Kriegman D,Ahuja N.Detecting Faces in Images:A Survey[J].IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI),2002,24(1):3458.
[2]Hjelmas E,Low B K.Face Detection:A Survey\\.Computer Vision and Image Understanding,2001,3(3):236274.
[3]Rowley H,Baluja S,Kanade T.Neural Networkbased Face Detection[C].Proceedings of Computer Vision and Pattern Recognition,1996:203208.
[4]Schneiderman H,Kanade T.Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR ′98),1998:4551.
[5]Viola P,Jones M.Rapid Object Detection Using A Boosted Cascade of Simple Features[C].Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR),2001(1):511518.
[6]Roth D,Yang M,Ahuja N.A Snowbased Face Detector[C].Advances in Neural Information Processing Systems 12 (NIPS 12),2000:855861.
[7]Osuna E,F(xiàn)reund R,Girosi F.Training Support Vector Machines:An Application to Face Detection[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR ′97),1997:193199.
[8]Gundimada S,Asari V.An Improved SNoWbased Classification Technique for Headpose Estimation and Face Detection[C].Proceedings of the 34th Applied Imagery and Pattern Recognition Workshop (AIPR′05) ,2005:9499.
[9]Nilsson M,Nordberg J,Claesson C.Face Detection Using Local SMQT Features and Split up SNoW Classifier[C].IEEE International Conference on Acoustics,Speech,and Signal Processing (ICASSP),2007(2):589592.
[10]Dimitri Pissarenko.Face Databases[EB/OL].http://openbio.sourceforge.net/,Jan 18,2008.
作者簡(jiǎn)介 徐 健 女,1981年出生,助教,碩士學(xué)位。研究方向?yàn)槟J阶R(shí)別。
常志國(guó) 男,1976年出生,博士研究生。研究方向?yàn)閳D像處理。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文