遼寧工業(yè)大學(xué) 侯雨靜 孫福明
基于計(jì)算機(jī)視覺(jué)的人臉檢測(cè)與識(shí)別研究
遼寧工業(yè)大學(xué) 侯雨靜 孫福明
本文主要概述了人臉識(shí)別技術(shù)發(fā)展的歷程和發(fā)展現(xiàn)狀。從人臉檢測(cè)定位、面部特征提取以及人臉確認(rèn)識(shí)別三個(gè)方面,歸類(lèi)和總結(jié)了現(xiàn)有開(kāi)源的方法和技術(shù),包括:seetaface方法和騰訊優(yōu)圖方法。詳細(xì)介紹了這兩種開(kāi)源方法在各個(gè)模塊所涉及到的方法和原理,用開(kāi)源方法對(duì)惡劣天氣、偏移角度等特殊情況進(jìn)行處理,并在此基礎(chǔ)上指出了各自的優(yōu)缺點(diǎn)。
人臉檢測(cè);特征點(diǎn)定位;識(shí)別;對(duì)比;深度學(xué)習(xí)
人類(lèi)進(jìn)入21世紀(jì)以來(lái),信息安全存在的隱患日益突出,公共安全越來(lái)越為人所重視。而傳統(tǒng)的識(shí)別方法在飛速發(fā)展的今天已經(jīng)完全不能滿(mǎn)足人類(lèi)對(duì)于信息安全的需求,人家逐漸將目光轉(zhuǎn)移到生物體征這一方面。生物體征由遺傳DNA決定,是人類(lèi)與生俱來(lái)的一向特征,并且具有獨(dú)一無(wú)二的特點(diǎn)。
人類(lèi)對(duì)于機(jī)器人臉識(shí)別的研究至今已經(jīng)發(fā)展了將近70年,在一定程度上雖然取得了成果,但是對(duì)于人臉識(shí)別的整項(xiàng)技術(shù)技術(shù)來(lái)說(shuō),外部環(huán)境造成的影響,比如光線的明暗、復(fù)雜的背景和不同的拍攝角度,又或者是人類(lèi)自身的面部特征變化,比如表情的變化、面部的遮擋以及不同的姿態(tài),還是對(duì)識(shí)別的精確度造成了比較大的影響。
Seetaface人臉識(shí)別主要分為三個(gè)部分,分別為人臉檢測(cè),特征點(diǎn)定位以及特征提取與對(duì)比三個(gè)模塊。
在人臉檢測(cè)模塊中,多個(gè)針對(duì)不同姿態(tài)的快速LAB級(jí)聯(lián)分類(lèi)器[1]構(gòu)成FuSt級(jí)聯(lián)結(jié)構(gòu)的頂部,中間結(jié)構(gòu)的組成部分是若干個(gè)基于SURF特征的多層感知機(jī)(MLP),結(jié)尾部分處理所有姿態(tài)候選窗口的是一個(gè)統(tǒng)一的同樣是基于SURF特征的MLP級(jí)聯(lián)結(jié)構(gòu)[2],整個(gè)模塊呈現(xiàn)出一個(gè)上寬下窄的漏斗型結(jié)構(gòu)[3]。
圖1 人臉檢測(cè)模塊FuSt級(jí)聯(lián)結(jié)構(gòu)示意圖
特征點(diǎn)定位模塊中的CFAN結(jié)構(gòu)級(jí)聯(lián)了多級(jí)棧式自編碼器[4]網(wǎng)絡(luò),其中的每一級(jí)都刻畫(huà)從人臉表觀到人臉形狀的部分非線性映射。具體來(lái)說(shuō),待圖像在經(jīng)過(guò)人臉檢測(cè)模塊處理并檢測(cè)出人臉區(qū)域后向特征點(diǎn)定位模塊輸入人臉區(qū)域,處于自編碼器網(wǎng)絡(luò)的第一級(jí)結(jié)構(gòu)直接從該人臉區(qū)域的低分辨率版本中進(jìn)行快速估計(jì)并得到大致的人臉形狀S0。并在此過(guò)程中提高分辨率。以此類(lèi)推,人臉對(duì)齊結(jié)果在通過(guò)級(jí)聯(lián)多個(gè)棧式自編碼器網(wǎng)絡(luò)后,隨著分辨率的越來(lái)越高以實(shí)現(xiàn)逐步優(yōu)化。
圖2 自編碼網(wǎng)絡(luò)對(duì)齊方法
特征提取與對(duì)比模塊是基于卷積神經(jīng)網(wǎng)絡(luò)[6]的。具體地說(shuō),VIPLFaceNet將5x5的卷積核拆分為兩層3x3的卷積核同時(shí),通過(guò)引入快速歸一化的理念,加快其收斂速度,模型的泛化能力也在一定程度上得以提升。
圖3 Seetaface人臉識(shí)別系統(tǒng)流程
騰訊優(yōu)圖算法是由騰訊旗下專(zhuān)注于機(jī)器識(shí)別領(lǐng)域的計(jì)算機(jī)團(tuán)隊(duì)最新開(kāi)發(fā)的一種算法,在人臉檢測(cè)與識(shí)別等領(lǐng)域總結(jié)先前的解決方案并深入研究。
騰訊優(yōu)圖算法中的人臉檢測(cè)與分析和五官定位均采用了人臉識(shí)別經(jīng)典算法中的Boosting算法[7],Boosting算法的主要原理是提高弱分類(lèi)算法準(zhǔn)確度。作為一種框架算法,它在通過(guò)對(duì)樣本集的操作并獲得樣本子集后,在樣本子集上通過(guò)弱分類(lèi)器算法訓(xùn)練生成基分類(lèi)器。在獲得若干個(gè)基分類(lèi)器后,將其加權(quán)融合,產(chǎn)生一個(gè)結(jié)果分類(lèi)器。在人臉識(shí)別部分,騰訊優(yōu)圖團(tuán)隊(duì)主要采用了傳統(tǒng)方法與深度學(xué)習(xí)[8]相結(jié)合的方法實(shí)現(xiàn)。
圖4 騰訊優(yōu)圖算法人臉識(shí)別流程示意圖
在日常生活中,由于惡劣天氣、偏移角度等外在條件的影響,人臉識(shí)別的應(yīng)用總會(huì)遇到各種問(wèn)題。人臉識(shí)別技術(shù)的發(fā)展,就是要在現(xiàn)有正臉識(shí)別的技術(shù)上,盡可能地解決將在實(shí)際應(yīng)用中出現(xiàn)的問(wèn)題。本節(jié)將就上文提出的算法,對(duì)出現(xiàn)的幾種問(wèn)題進(jìn)行處理。
在最近的幾年中,霧霾不僅對(duì)我的身體健康造成了影響,對(duì)于人臉識(shí)別技術(shù)來(lái)說(shuō),也是一個(gè)不小的挑戰(zhàn)。本文對(duì)霧化圖像的處理做出了對(duì)比。
圖5 Seetaface和騰訊優(yōu)圖處理結(jié)果
由以上對(duì)比結(jié)果可以清晰的看出,騰訊優(yōu)圖算法在處理霧霾天氣的條件中,精確度并不如Seetaface的高。Seetaface到第三級(jí)霧霾天氣才出現(xiàn)無(wú)法識(shí)別的情況。
圖6 Seetaface和騰訊優(yōu)圖處理結(jié)果
騰訊優(yōu)圖對(duì)于偏移角度具有預(yù)判能力,在偏移角度為90°時(shí),仍能檢測(cè)出人臉存在。Seetaface在偏移角度為45°時(shí)檢測(cè)能力出現(xiàn)問(wèn)題,90°則無(wú)法識(shí)別。
人臉識(shí)別在日常生活中的應(yīng)用會(huì)遇到各式各樣的問(wèn)題,霧霾天氣、偏移角度和局部遮擋是其中比較典型的問(wèn)題,本文中的幾種開(kāi)源算法亦擁有其各自的優(yōu)點(diǎn)及在實(shí)際應(yīng)用中的問(wèn)題。
Seetaface算法在處理霧霾環(huán)境及局部遮擋時(shí),基本可以準(zhǔn)確的進(jìn)行人臉識(shí)別,并能精準(zhǔn)的定位五官位置,但是眼部的遮擋以及當(dāng)面部存在的一定偏移角度對(duì)識(shí)別會(huì)產(chǎn)生較大的影響。騰訊優(yōu)圖算法在面部存在一定偏移角度時(shí)仍能對(duì)人臉進(jìn)行基本準(zhǔn)確的檢測(cè),并能對(duì)五官位置進(jìn)行較為準(zhǔn)確的預(yù)判,使得識(shí)別結(jié)果比較準(zhǔn)確,局部遮擋對(duì)其準(zhǔn)確性也不會(huì)產(chǎn)生較大的影響。但是當(dāng)處于霧霾環(huán)境時(shí),騰訊優(yōu)圖算法的準(zhǔn)確性不夠高,不能在霧霾時(shí)準(zhǔn)確的檢測(cè)與識(shí)別人臉。
人臉識(shí)別算法在實(shí)現(xiàn)的過(guò)程中,一般分為三個(gè)方面:人臉檢測(cè)、特征點(diǎn)定位與特征的提取與對(duì)比。每一套人臉識(shí)別系統(tǒng)基本都是由這三個(gè)方面組成。人臉識(shí)別作為當(dāng)前模式識(shí)別與人工智能的研究熱點(diǎn)之一,是一項(xiàng)十分重要的身份識(shí)別與鑒定的重要技術(shù),具有十分廣闊的應(yīng)用前景。
[1]Shuzhe Wu,Meina Kan,Zhenliang He,Shiguang Shan,and Xilin Chen. Funnel-Structured Cascade for Multi-View Face Detection with Alignment-Awareness.2016.
[2]Jie Zhang,Shiguang Shan,Meina Kan,Xilin Chen.Coarse-to-Fine Auto-Encoder Networks (CFAN) for Real-Time Face Alignment.ECCV 2014.
[3]Xin Liu,Meina Kan,Wanglong Wu,Shiguang Shan,Xilin Chen.VIPLFaceNet:An Open Source Deep Face Recognition SDK.Frontier of Computer Science.
[4]Shengye Yan,Shiguang Shan,Xilin Chen,Wen Gao.Locally Assembled Binary(LAB)Feature for Fast and Accurate Face Detection. IEEE Computer Society International Conference on Computer Vision and Pattern Recognition,CVPR2008,Anchorage,Alaska,U.S.A,Jun.2008.
[5]吳岸城.神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)[M].電子工業(yè)出版社.2016.06:100-102.
[6]周志華.機(jī)器學(xué)習(xí)[M].清華大學(xué)出版社.2016.01:97-120.
[7]Shai Shalev Shwartz.Understand Machine Learning:From Theory to Algorithms[M].Cambridge University Press,May.2014:130-140.
[8]張重生.深度學(xué)習(xí)[M].電子工業(yè)出版社.2016.12:152-160.