汪漪
摘 要:人臉檢測是指對于給定的圖像對其進行查找,判斷圖中有沒有人臉存在,倘若檢測到了人臉,那么就返回該臉的位置、大小和姿態(tài)。隨著社會公共安全的必要性進一步凸顯,智能監(jiān)控在傳統(tǒng)的運動目標檢測、行為分析、智能報警等方面的應用越來越多,對人臉進行識別已逐漸成為公共場所的緊要功能,受到了越來越多的關注。本文首先分析了人臉識別的應用及其發(fā)展歷史。接著,分析了有關人臉檢測的算法,并對他們進行了細致地分析,給出了相應的評價。最后總結了人臉識別目前面對的困難,并提出了展望。
關鍵詞:人臉檢測;模式識別;算法
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1671-2064(2018)23-0037-02
1 引言
人通過感覺來感知外部環(huán)境,視覺是感覺的一個重要組成部分。然而在科技發(fā)展史上的很長一段時間內,計算機就像是一個“盲人”,只能被動的接受鍵盤輸入、文件讀取的信息,并不能像人類的大腦一樣通過眼睛自動從外部世界獲取所需要的信息并進行信息處理。
隨著社會進步和科技發(fā)展,機器勞動將在一定程度上取代人類勞動,這就要求機器具備能夠像人類的感覺器官一樣感知外界的能力。計算機如果能夠將這些“客觀事物的個別屬性”記錄并分辨清楚,那么,就可以實現(xiàn)類似感覺的功能。其中,計算機視覺在科學家們的不斷努力下取得了相當大的發(fā)展。而人臉檢測是計算機視覺、模式識別等領域的重要組成部分,也是人臉識別的第一個環(huán)節(jié),其在安全監(jiān)控等方面的作用不可替代。
人臉檢測[1]是指對于給定的圖像對其進行查找,判斷圖中有沒有人臉存在,倘若檢測到了人臉,那么就返回該臉的位置、大小和姿態(tài)。人臉相較于別的生物特征而言,更加的形象、具體、直觀。因此人臉檢測、識別等技術在越來越多的領域得以運用。例如:
(1)智能監(jiān)控:用于機場、火車站等交通部門,銀行、大型商場、政府涉密機關、國家情報部門等機構,監(jiān)控可疑人物行蹤和可疑事件過程。感知接口:模擬人眼功能,代替?zhèn)鹘y(tǒng)的鍵盤、鼠標輸入和文件讀取,使得機器能夠更加容易地進行交流。(2)虛擬現(xiàn)實:游戲中人物形象模型、行為、關節(jié)、運動機制的建立;視頻會議、虛擬聊天室等虛擬現(xiàn)實情境。(3)視頻搜索:隨著媒體技術的成熟與發(fā)展,視頻內容占網(wǎng)絡內容的比重越來越高,基于人臉的搜索比基于文本的搜索更加的直觀、便捷。(4)電子商務:隨著例如支付寶、微信支付等電子快捷支付應用的迅速發(fā)展,電子商務領域急需高效的自動身份認證技術,人臉識別技術加上密碼保護技術可以保證電子商務的安全性。
2 人臉檢測的發(fā)展
人臉檢測的發(fā)展大致分為三個階段。
(1)第一階段:1964年到1990年。
這是人臉檢測技術發(fā)展的初級和起步階段,采用的主要方法是將人臉的幾何結構作為特征,并且結合了人工神經(jīng)網(wǎng)絡算法的應用。
(2)第二階段:1991年到1997年。
在這一階段短短的七年時間之內,人臉檢測步入了黃金時代,各個科研機構、實驗室的研究人員通過不懈努力研究出了大量的人臉檢測算法。具體成果如:
1)Eigenface算法:Turk和Pentland,兩位來自麻省理工學院媒體實驗室的研究員提出了該算法。2)FERET人臉檢測算法測試:由美國軍方組織進行測試。3)對比模板匹配和結構特征的人臉檢測算法的實驗:由Poggio和Brunelli,兩位來自麻省理工學院人工智能實驗室的研究員于1992年執(zhí)行。該對比實驗證明了模板匹配的人臉檢測算法的優(yōu)越性,為后續(xù)研究提出了方向。4)Fisherface算法:由Belhumeur提出。利用主成分分析(Principal Component Analysis,PCA)和線性判別分析(Linear Discriminant Analysis,LDA)兩大方法。該算法目前仍在使用,并且是主流算法之一。
(3)第三階段:1998年至今。
統(tǒng)計學習理論如支持向量機(Support Vector Machine,SVM)被運用到人臉檢測當中來,并且人臉檢測技術的實際應用得到了進一步的發(fā)展。例如:法國將人臉檢測技術應用于ATM上;德國DOS公司研發(fā)了多重模板識別技術;美國在各大機場率先將人臉監(jiān)控技術用于人群監(jiān)控等。
中國的人臉檢測技術起步比較晚,國內的清華大學、北京工業(yè)大學、微軟亞洲研究院、中國科學院自動化研究所、中國科學院計算機技術研究所等機構從事人臉檢測方面的研究?!度四樧R別系統(tǒng)》作為清華大學主持的國家“十五”項目于2005年1月18日通過了專家鑒定。此外,在人臉檢測技術方面,中國研究人員越來越多在IEEE中的FG\ICIP\ CVPR上發(fā)表優(yōu)秀論文,這標志著中國人臉檢測技術研究的逐步深入。
3 人臉檢測算法
3.1 基于先驗知識的人臉檢測
這是一種在實際使用過程中基于先驗知識的算法。其對有關人臉的一些知識進行編碼。比如一個人臉通常具有一些通用規(guī)則,這些檢測規(guī)則包括:人有兩個對稱的眼睛、兩個對稱的耳朵、一個鼻子、一個嘴巴,這些人體器官之間的位置、相對距離等。這些規(guī)則可以運用來進行檢測,判斷圖片中是否含有人臉。這種方法實現(xiàn)比較困難。如果規(guī)則比較完善,則可能由于光線、噪聲和遮擋等不利因素的影響檢測不出完全符合這些規(guī)則的人臉。如果規(guī)則過于簡單,則可能造成非人臉區(qū)域誤檢。[2-3]
3.2 基于膚色的人臉檢測
一幅彩色圖像,膚色是人臉的一個最為顯著的特征。并且面部膚色在彩色空間里的分布相對而言比較集中。該算法將膚色在顏色空間中聚類成單獨的一類以用于人臉和背景的分割??梢允褂玫念伾臻g有:RGB、HSV、HSI、GLHS等。該算法實現(xiàn)手段簡單,但受光照、攝像頭色偏、背景顏色等因素影響較大。
在用膚色進行人臉檢測時,我們可以采用高斯模型、高斯混合模型或是非參數(shù)估計等方法進行建模。其中,非參數(shù)估計模型方法可以有效地提高了人臉檢測的速度,并且針對面部遮擋和光照影響等問題,可以有效提高其檢測率,具有一定的魯棒性。
3.3 基于特征的人臉檢測
基于特征的方法,是尋找人臉的不變特性用于人臉檢測。人臉具有一些對不同姿勢而言具有魯棒性的特征?;趯@些特征的提取,創(chuàng)建可以描述特征之間關系的統(tǒng)計模型,用以驗證人臉的存在[3]。特征檢測法是把人臉的圖像特征空間看做眾多的一維向量,并且把它們再次變換到相對簡單的特征空間。對于給定的圖像,我們計算其特征值和特征向量,判定是否為人臉。最常見的特征就是Haar-like特征。
人臉具有一些特點,比如:人的眼睛和眉毛比面頰顏色深,嘴唇比四周顏色深,鼻梁比兩側顏色淺等。所以我們可以根據(jù)人臉顏色深淺的不同,選擇一些矩形,來表示人臉的這些特征。如圖1中所顯示的這些特征,我們稱之為Haar-like特征。
該算法適應性能好,是一種常見的檢測算法。但是,基于特征的算法存在的問題是,由于人臉遮擋或是圖片拍攝儀器存在噪聲,人臉圖像的某些特征被嚴重破壞,人臉的特征邊界被弱化。或是由于光照產(chǎn)生陰影,這些陰影可能引起很強的邊緣,使得該算法的準確度降低。
3.4 基于模板匹配的人臉檢測
模板匹配的方法是根據(jù)計算出的標準人臉模板和輸入圖片的相關性,來判斷圖片中是否含有人臉。在這些方法當中,不同姿態(tài)的人臉圖樣被存儲在模板庫中,這些標準模板和輸入圖片的相關性被當做了檢測標準。對于給定的輸入圖像,我們分別計算面部輪廓、鼻子、眼睛、嘴等部位與標準模板之間的相關性。目前,已經(jīng)提出了多尺度、多分辨率和可變形的模板。
3.5 基于人工神經(jīng)網(wǎng)絡的人臉檢測
人工神經(jīng)網(wǎng)絡算法是訓練一個網(wǎng)絡結構,該神經(jīng)網(wǎng)絡的結構、參數(shù)里包含了模式的統(tǒng)計特性。該方法被廣泛地運用。目前得到廣泛應用的該類方法包括Boltzmann機(1985年提出)、多層反饋神經(jīng)網(wǎng)絡(BP算法,1986年提出)和徑向基網(wǎng)絡(RBF網(wǎng)絡方法,1988年提出)。人工神經(jīng)網(wǎng)絡算法的一個缺點是對于訓練樣本數(shù)量要求比較高,否則識別效果比較差。
4 人臉檢測中存在的難點
人臉檢測存在很多不確定性因素,影響了人臉檢測的檢出率,并存在誤檢幾率。人臉檢測當中存在的難點主要有以下幾點:
(1)個體差異性。人臉有很多細節(jié),不同的人面部細節(jié)不同。比如不同的人種膚色不同,不同人的發(fā)型不同,眼睛睜開和閉合等個體差異。(2)人臉的遮擋:實際運用中,眼鏡、頭發(fā)以及各種小飾品會對人臉造成遮擋。同時外部環(huán)境如樹陰、路標等等也會對人臉造成一定的遮擋。(3)人臉角度:實際當中拍攝到的人臉有一定程度的傾斜,側面或是旋轉的人臉和正面人臉的特征有所不同。(4)背景:一些背景與人臉的膚色、形狀相似,難以分辨,造成了一定程度的誤檢。(5)成像條件:光照條件、成像設備等的影響。
5 總結與展望
本文歸納總結了人臉檢測的應用領域,并回顧了人臉檢測的初級和起步階段、黃金階段以及現(xiàn)在相較成熟的階段,總結了人臉檢測的發(fā)展歷史。接著,將人臉檢測算法按照:基于先驗知識的人臉檢測、基于膚色的人臉檢測、基于特征的人臉檢測、基于模板匹配的人臉檢測、基于人工神經(jīng)網(wǎng)絡的人臉檢測六個方面進行分類,詳細分析了各類算法的優(yōu)缺點。最后總結了人臉檢測目前仍然存在的問題。
目前,隨著科技日益發(fā)展,用戶對識別的速度和精度有了越來越高的要求,這就要求人臉檢測系統(tǒng)能夠在相當短的時間之內迅速進行大量的數(shù)據(jù)運算。如今雖然進行人臉檢測研究的機構和和人比較多,但人臉檢測的速度和精度一直是研究人臉檢測算法的問題所在。如何在保證的精度的前提下,有效提高人臉檢測的速度,是大家研究的關鍵目標。由此,對人臉檢測的研究仍然迫在眉睫。
參考文獻
[1]M.Yang, D.J. Kriegman. Detecting faces in images[J]. Pattern Analysis and Machine Intelligence,2002:617-620.
[2]T.K.Leung, M.C.Burl,P.Perona. Finding faces in cluttered scenes using random labeled graph matching. Proc[C]. IEEE International Conference on Computer Vision. IEEE,1995:637-644.
[3]K.C.Yow, R. Cipolla. A probabilistic framework for perceptual grouping of features for human face detection[C]. IEEE International Conference on Automatic Face and Gesture Recognition.IEEE,1996:16-21.
[4]C.Han,M.Liao,K. Yu,L.Chen.Fast face detection via morphology-based pre-processing[C]. IEEE International Conference on Image Analysis and Processing.IEEE,1998:1701-171.