遼寧工業(yè)大學 侯雨靜 孫福明
基于計算機視覺的人臉檢測與識別研究
遼寧工業(yè)大學 侯雨靜 孫福明
本文主要概述了人臉識別技術(shù)發(fā)展的歷程和發(fā)展現(xiàn)狀。從人臉檢測定位、面部特征提取以及人臉確認識別三個方面,歸類和總結(jié)了現(xiàn)有開源的方法和技術(shù),包括:seetaface方法和騰訊優(yōu)圖方法。詳細介紹了這兩種開源方法在各個模塊所涉及到的方法和原理,用開源方法對惡劣天氣、偏移角度等特殊情況進行處理,并在此基礎上指出了各自的優(yōu)缺點。
人臉檢測;特征點定位;識別;對比;深度學習
人類進入21世紀以來,信息安全存在的隱患日益突出,公共安全越來越為人所重視。而傳統(tǒng)的識別方法在飛速發(fā)展的今天已經(jīng)完全不能滿足人類對于信息安全的需求,人家逐漸將目光轉(zhuǎn)移到生物體征這一方面。生物體征由遺傳DNA決定,是人類與生俱來的一向特征,并且具有獨一無二的特點。
人類對于機器人臉識別的研究至今已經(jīng)發(fā)展了將近70年,在一定程度上雖然取得了成果,但是對于人臉識別的整項技術(shù)技術(shù)來說,外部環(huán)境造成的影響,比如光線的明暗、復雜的背景和不同的拍攝角度,又或者是人類自身的面部特征變化,比如表情的變化、面部的遮擋以及不同的姿態(tài),還是對識別的精確度造成了比較大的影響。
Seetaface人臉識別主要分為三個部分,分別為人臉檢測,特征點定位以及特征提取與對比三個模塊。
在人臉檢測模塊中,多個針對不同姿態(tài)的快速LAB級聯(lián)分類器[1]構(gòu)成FuSt級聯(lián)結(jié)構(gòu)的頂部,中間結(jié)構(gòu)的組成部分是若干個基于SURF特征的多層感知機(MLP),結(jié)尾部分處理所有姿態(tài)候選窗口的是一個統(tǒng)一的同樣是基于SURF特征的MLP級聯(lián)結(jié)構(gòu)[2],整個模塊呈現(xiàn)出一個上寬下窄的漏斗型結(jié)構(gòu)[3]。
圖1 人臉檢測模塊FuSt級聯(lián)結(jié)構(gòu)示意圖
特征點定位模塊中的CFAN結(jié)構(gòu)級聯(lián)了多級棧式自編碼器[4]網(wǎng)絡,其中的每一級都刻畫從人臉表觀到人臉形狀的部分非線性映射。具體來說,待圖像在經(jīng)過人臉檢測模塊處理并檢測出人臉區(qū)域后向特征點定位模塊輸入人臉區(qū)域,處于自編碼器網(wǎng)絡的第一級結(jié)構(gòu)直接從該人臉區(qū)域的低分辨率版本中進行快速估計并得到大致的人臉形狀S0。并在此過程中提高分辨率。以此類推,人臉對齊結(jié)果在通過級聯(lián)多個棧式自編碼器網(wǎng)絡后,隨著分辨率的越來越高以實現(xiàn)逐步優(yōu)化。
圖2 自編碼網(wǎng)絡對齊方法
特征提取與對比模塊是基于卷積神經(jīng)網(wǎng)絡[6]的。具體地說,VIPLFaceNet將5x5的卷積核拆分為兩層3x3的卷積核同時,通過引入快速歸一化的理念,加快其收斂速度,模型的泛化能力也在一定程度上得以提升。
圖3 Seetaface人臉識別系統(tǒng)流程
騰訊優(yōu)圖算法是由騰訊旗下專注于機器識別領域的計算機團隊最新開發(fā)的一種算法,在人臉檢測與識別等領域總結(jié)先前的解決方案并深入研究。
騰訊優(yōu)圖算法中的人臉檢測與分析和五官定位均采用了人臉識別經(jīng)典算法中的Boosting算法[7],Boosting算法的主要原理是提高弱分類算法準確度。作為一種框架算法,它在通過對樣本集的操作并獲得樣本子集后,在樣本子集上通過弱分類器算法訓練生成基分類器。在獲得若干個基分類器后,將其加權(quán)融合,產(chǎn)生一個結(jié)果分類器。在人臉識別部分,騰訊優(yōu)圖團隊主要采用了傳統(tǒng)方法與深度學習[8]相結(jié)合的方法實現(xiàn)。
圖4 騰訊優(yōu)圖算法人臉識別流程示意圖
在日常生活中,由于惡劣天氣、偏移角度等外在條件的影響,人臉識別的應用總會遇到各種問題。人臉識別技術(shù)的發(fā)展,就是要在現(xiàn)有正臉識別的技術(shù)上,盡可能地解決將在實際應用中出現(xiàn)的問題。本節(jié)將就上文提出的算法,對出現(xiàn)的幾種問題進行處理。
在最近的幾年中,霧霾不僅對我的身體健康造成了影響,對于人臉識別技術(shù)來說,也是一個不小的挑戰(zhàn)。本文對霧化圖像的處理做出了對比。
圖5 Seetaface和騰訊優(yōu)圖處理結(jié)果
由以上對比結(jié)果可以清晰的看出,騰訊優(yōu)圖算法在處理霧霾天氣的條件中,精確度并不如Seetaface的高。Seetaface到第三級霧霾天氣才出現(xiàn)無法識別的情況。
圖6 Seetaface和騰訊優(yōu)圖處理結(jié)果
騰訊優(yōu)圖對于偏移角度具有預判能力,在偏移角度為90°時,仍能檢測出人臉存在。Seetaface在偏移角度為45°時檢測能力出現(xiàn)問題,90°則無法識別。
人臉識別在日常生活中的應用會遇到各式各樣的問題,霧霾天氣、偏移角度和局部遮擋是其中比較典型的問題,本文中的幾種開源算法亦擁有其各自的優(yōu)點及在實際應用中的問題。
Seetaface算法在處理霧霾環(huán)境及局部遮擋時,基本可以準確的進行人臉識別,并能精準的定位五官位置,但是眼部的遮擋以及當面部存在的一定偏移角度對識別會產(chǎn)生較大的影響。騰訊優(yōu)圖算法在面部存在一定偏移角度時仍能對人臉進行基本準確的檢測,并能對五官位置進行較為準確的預判,使得識別結(jié)果比較準確,局部遮擋對其準確性也不會產(chǎn)生較大的影響。但是當處于霧霾環(huán)境時,騰訊優(yōu)圖算法的準確性不夠高,不能在霧霾時準確的檢測與識別人臉。
人臉識別算法在實現(xiàn)的過程中,一般分為三個方面:人臉檢測、特征點定位與特征的提取與對比。每一套人臉識別系統(tǒng)基本都是由這三個方面組成。人臉識別作為當前模式識別與人工智能的研究熱點之一,是一項十分重要的身份識別與鑒定的重要技術(shù),具有十分廣闊的應用前景。
[1]Shuzhe Wu,Meina Kan,Zhenliang He,Shiguang Shan,and Xilin Chen. Funnel-Structured Cascade for Multi-View Face Detection with Alignment-Awareness.2016.
[2]Jie Zhang,Shiguang Shan,Meina Kan,Xilin Chen.Coarse-to-Fine Auto-Encoder Networks (CFAN) for Real-Time Face Alignment.ECCV 2014.
[3]Xin Liu,Meina Kan,Wanglong Wu,Shiguang Shan,Xilin Chen.VIPLFaceNet:An Open Source Deep Face Recognition SDK.Frontier of Computer Science.
[4]Shengye Yan,Shiguang Shan,Xilin Chen,Wen Gao.Locally Assembled Binary(LAB)Feature for Fast and Accurate Face Detection. IEEE Computer Society International Conference on Computer Vision and Pattern Recognition,CVPR2008,Anchorage,Alaska,U.S.A,Jun.2008.
[5]吳岸城.神經(jīng)網(wǎng)絡與深度學習[M].電子工業(yè)出版社.2016.06:100-102.
[6]周志華.機器學習[M].清華大學出版社.2016.01:97-120.
[7]Shai Shalev Shwartz.Understand Machine Learning:From Theory to Algorithms[M].Cambridge University Press,May.2014:130-140.
[8]張重生.深度學習[M].電子工業(yè)出版社.2016.12:152-160.