段佳寧
摘 要:人臉檢測(cè),是從被測(cè)圖像中檢測(cè)出是否含有人臉,若含有人臉,就進(jìn)一步給出人臉的位置、大小等信息的一種技術(shù),是人臉跟蹤、身份識(shí)別等應(yīng)用功能的基礎(chǔ)。本文簡(jiǎn)單介紹了人臉檢測(cè)技術(shù)的發(fā)展現(xiàn)狀與功能特點(diǎn),以及詳細(xì)介紹了人臉檢測(cè)的實(shí)現(xiàn)過(guò)程包括采集樣本、特征提取、建立模型和測(cè)試等幾個(gè)步驟,提出了在人臉檢測(cè)過(guò)程中存在的人臉的相似性、角度和圖像質(zhì)量等一些局限性,并針對(duì)這些局限性總結(jié)了一些改善和解決辦法,例如樣本處理、構(gòu)建立體模型等,最后對(duì)人臉檢測(cè)的發(fā)展和應(yīng)用進(jìn)行了展望。
關(guān)鍵詞:人臉檢測(cè);樣本采集;特征提?。浑S機(jī)森林
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)22-0040-02
人臉識(shí)別技術(shù),已經(jīng)廣泛應(yīng)用于安保、金融、社保、考試、考勤等領(lǐng)域,尤其是從iPhone X手機(jī)的人臉解鎖開始,很多帶攝像頭的智能手機(jī)都增加了人臉解鎖的功能,在使用中大大提高了便利性。隨著人們生活水平的提高和應(yīng)用領(lǐng)域的進(jìn)一步拓展,人們對(duì)人臉識(shí)別技術(shù)的速度、準(zhǔn)確度和安全等方面有了更高的要求。人臉識(shí)別是將靜態(tài)圖像或視頻圖像中檢測(cè)出的人臉圖像與數(shù)據(jù)庫(kù)中的人臉圖像進(jìn)行對(duì)比,從中找出與之匹配的人臉的過(guò)程,以達(dá)到身份識(shí)別與鑒定的目的[1]。人臉檢測(cè)是整個(gè)人臉識(shí)別系統(tǒng)的初始階段和關(guān)鍵環(huán)節(jié),只有快速、準(zhǔn)確地檢測(cè)出人臉,才能對(duì)其進(jìn)行進(jìn)一步的人臉跟蹤和身份識(shí)別等。所以,理解人臉檢測(cè)的實(shí)現(xiàn)過(guò)程和特點(diǎn),提高檢測(cè)速度和準(zhǔn)確度,對(duì)人臉識(shí)別系統(tǒng)的發(fā)展和應(yīng)用有著十分重要的意義。
1 人臉檢測(cè)的發(fā)展與特點(diǎn)
1.1 人臉檢測(cè)的發(fā)展
國(guó)外的人臉檢測(cè)技術(shù)發(fā)展較早,現(xiàn)在也有很多機(jī)構(gòu)從事此方面的研究,比較著名的有MIT、CMU等;國(guó)內(nèi)的清華大學(xué)、中科院計(jì)算所和自動(dòng)化所等一些大學(xué)和研究機(jī)構(gòu)也長(zhǎng)期進(jìn)行著人臉檢測(cè)相關(guān)的研究。隨著人臉檢測(cè)研究的深入,國(guó)際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長(zhǎng),如IEEE的FG、ICIP、CVPR等重要國(guó)際會(huì)議上,每年都有大量關(guān)于人臉檢測(cè)的論文,占有關(guān)人臉研究論文的1/3之多,由此可以看到世界對(duì)人臉檢測(cè)技術(shù)的重視[2]。
1.2 人臉檢測(cè)的特點(diǎn)
(1)非強(qiáng)制性:人臉檢測(cè)不需要被檢測(cè)對(duì)象的配合,即可自動(dòng)完成采集人臉圖像并進(jìn)行分析。(2)并發(fā)性:人臉檢測(cè)可以同時(shí)對(duì)一個(gè)圖像中含有的多個(gè)人臉進(jìn)行分析判斷。(3)非接觸性:人臉檢測(cè)從采集人臉圖像到完成檢測(cè)的整個(gè)過(guò)程中,都不需要與被檢測(cè)對(duì)象發(fā)生接觸,隨著硬件設(shè)備的進(jìn)步,可以在更遠(yuǎn)的距離完成人臉檢測(cè)。
2 人臉檢測(cè)的實(shí)現(xiàn)過(guò)程
人臉檢測(cè)一般分為以下四個(gè)步驟:采集樣本,提取特征,建立模型,測(cè)試模型。人臉檢測(cè)首先要對(duì)圖像進(jìn)行預(yù)處理,主要是利用中值濾波、直方圖均衡等方法對(duì)人臉圖像的對(duì)比度、光線強(qiáng)度、噪聲、方向、距離等進(jìn)行處理,得到大小、質(zhì)量相近的人臉圖像。
2.1 采集樣本
人臉檢測(cè)需要學(xué)習(xí)大量關(guān)于人臉圖像的正、負(fù)樣本,通過(guò)給出的正樣本和負(fù)樣本的集合中歸納產(chǎn)生出接受所有正樣本同時(shí)排除所有負(fù)樣本的規(guī)則,以實(shí)現(xiàn)系統(tǒng)對(duì)人臉圖像的精確判斷以及進(jìn)一步分析處理,如圖1所示。
在人臉檢測(cè)的訓(xùn)練過(guò)程中,正負(fù)樣本的采集同樣重要。采集正樣本,即圖像中包含不同性別、年齡、表情、角度、光照等條件下的不同人臉。采集的正樣本數(shù)量保證在萬(wàn)張級(jí)別,并對(duì)采集到的正樣本進(jìn)行篩選,剔除模糊、面部不完整等不符合要求的樣本。負(fù)樣本的采集簡(jiǎn)單說(shuō)就是采集那些不包含人臉的圖像,采集的負(fù)樣本與正樣本保持同一數(shù)量級(jí)。另外,為了提高訓(xùn)練效率,負(fù)樣本的選取應(yīng)與目標(biāo)場(chǎng)景相關(guān)。例如,如果要進(jìn)行火車候車室這類特定場(chǎng)景的人臉識(shí)別,那么負(fù)樣本就應(yīng)該是與候車室有關(guān)的列車時(shí)刻表、椅子、檢票口、柜臺(tái)等場(chǎng)景圖片。
2.2 提取特征
特征提取是決定人臉檢測(cè)成功率的重要步驟。特征提取的算法好,可以提高檢測(cè)的速度、準(zhǔn)確性和模型的泛化效果。在選擇特征的過(guò)程中要去掉不相關(guān)的特征和避免特征之間的相互依賴。提取人臉特征就是利用人臉的幾何特征、代數(shù)特征等建模的過(guò)程?;诿娌科鞴俚奶卣魈崛》椒?,是根據(jù)人臉器官的形狀和之間的距離等數(shù)據(jù)作為檢測(cè)人臉的特征?;谀0宓奶卣魈崛》椒ǎ窍榷x一個(gè)或者多個(gè)標(biāo)準(zhǔn)人臉模板,然后將采集的數(shù)據(jù)樣品與標(biāo)準(zhǔn)人臉模型進(jìn)行匹配,并利用閾值來(lái)判斷是否存在人臉[3],如圖2所示。
2.3 建立模型
將上述采集到的樣本集以及特征輸入到?jīng)Q策樹中,將生成決策樹的參數(shù),包括每棵決策樹的深度以及決策樹棵數(shù)等。通過(guò)對(duì)樣本多次重采樣的方式,將得到多(n)顆決策樹,即構(gòu)成隨機(jī)森林,由隨機(jī)森林中的每棵決策樹參與投票,之后依據(jù)少數(shù)服從多數(shù)的原則生成隨機(jī)森林的結(jié)果,也就是最終的分類結(jié)果。
2.4 進(jìn)行檢測(cè)
取一部分未知屬性的圖片,輸入到上述訓(xùn)練出來(lái)的模型中,對(duì)得到的結(jié)果進(jìn)行分類。對(duì)于正樣本漏檢的和負(fù)樣本誤檢的圖像,分析采集的樣本與特征以及模型的參數(shù),不斷調(diào)整優(yōu)化,直至正確檢出率達(dá)到設(shè)定值為止。
3 人臉檢測(cè)的不足與改善
3.1 人臉檢測(cè)技術(shù)的局限性
人臉檢測(cè)技術(shù)雖然獲得了較大的發(fā)展,但是還存在一些局限性,影響了檢測(cè)的準(zhǔn)確度及速度。主要有以下幾方面:
(1)人臉的相似性及漸變性:長(zhǎng)相接近的兩人或者隨著年齡增長(zhǎng)臉部特征發(fā)生變化,影響人臉識(shí)別的準(zhǔn)確度。(2)圖像質(zhì)量和遮擋物的干擾:圖像分辨率低或者人臉上的眼鏡、化妝等導(dǎo)致識(shí)別率降低。(3)人臉的角度和光線的變化:人臉的不同角度包含的特征不一樣,包括光線的強(qiáng)弱變化也都會(huì)影響人臉的檢測(cè)效果。(4)隱私問(wèn)題:由于人臉檢測(cè)的非強(qiáng)制性和非接觸性特點(diǎn),被檢測(cè)人往往在不知情的情況下,自己的人臉特征和個(gè)人信息就被第三方采集利用。
3.2 改善人臉檢測(cè)技術(shù)的局限性的方法
3.2.1 樣本處理
在樣本采集之前,針對(duì)應(yīng)用的場(chǎng)景不同,對(duì)樣本的圖像進(jìn)行人工的篩選,確保篩選出的正、負(fù)樣本的數(shù)量基本平衡,減少某一樣本的錯(cuò)誤率,同時(shí)采用合理方法,提升訓(xùn)練效果。
3.2.2 構(gòu)建立體模型
人臉是一個(gè)三維的空間結(jié)構(gòu),利用相關(guān)算法將一個(gè)人不同角度的臉部圖像合成為三維模型結(jié)構(gòu),通過(guò)對(duì)三維結(jié)構(gòu)的比對(duì)可以較大程度地提高準(zhǔn)確度。目前許多新的提取人臉特征的算法比以前的算法有了較大的優(yōu)化,更加的科學(xué)合理,其中最突出的就是結(jié)合3D人臉信息的特征點(diǎn)提取技術(shù)?;诖鷶?shù)特征的識(shí)別方法是目前在實(shí)際應(yīng)用中使用得最多的一類方法,其主要原因是由于代數(shù)特征矢量(即人臉圖像在特征空間的投影結(jié)果)對(duì)角度、表情等因素都具有一定的穩(wěn)定性[4]。
3.2.3 層次分析
如果將人臉圖像的每一幀都進(jìn)行細(xì)致的數(shù)據(jù)處理能夠提高檢測(cè)的準(zhǔn)確度,但是卻大大延長(zhǎng)了檢測(cè)時(shí)間,降低了檢測(cè)效率,使其在檢測(cè)速度方面失去作用。所以,對(duì)檢測(cè)數(shù)據(jù)處理應(yīng)分層次進(jìn)行,首先確定人種、性別、年齡段等大致范圍,再具體到五官特征,最后進(jìn)行具體細(xì)節(jié)的比對(duì)分析,這樣可以兼顧人臉檢測(cè)的速度和準(zhǔn)確度。
3.2.4 清除無(wú)關(guān)因素
人臉檢測(cè)采集的人臉圖像四周不可避免會(huì)出現(xiàn)檢測(cè)對(duì)象所處環(huán)境等背景因素,在進(jìn)行檢測(cè)比對(duì)之前應(yīng)首先消除這些因素的影響,將其忽略,這樣則可以進(jìn)一步提高檢測(cè)速度。對(duì)于圖像的預(yù)處理就是通過(guò)人工干預(yù),提高采樣和建立模型的效率,降低光照和姿態(tài)等對(duì)人臉檢測(cè)的影響。
4 總結(jié)與展望
人臉檢測(cè)技術(shù)的準(zhǔn)確率和可靠性在某些領(lǐng)域暫時(shí)還達(dá)不到要求,現(xiàn)階段的應(yīng)用主要是利用機(jī)器的優(yōu)勢(shì)替代人做一些人臉檢測(cè)方面的簡(jiǎn)單重復(fù)性工作,用以提高工作效率,降低勞動(dòng)強(qiáng)度。
人臉檢測(cè)不同于其他傳統(tǒng)識(shí)別模式,人臉圖像較為復(fù)雜,包含的層次信息豐富,數(shù)據(jù)維數(shù)高。目前人臉檢測(cè)的算法很多,通過(guò)優(yōu)化算法,在不減少提取的數(shù)據(jù)量的情況下提高檢測(cè)速度,可以通過(guò)隨機(jī)森林、深度學(xué)習(xí)的方法,不斷提升其判斷的準(zhǔn)確率、容錯(cuò)性等。隨著人工智能、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)等軟硬件技術(shù)的不斷發(fā)展,人臉檢測(cè)系統(tǒng)必將滿足并且超過(guò)人類的需求,逐漸擴(kuò)展到其他更多的應(yīng)用領(lǐng)域,實(shí)現(xiàn)更大的社會(huì)價(jià)值和經(jīng)濟(jì)效益。
參考文獻(xiàn)
[1]吳巾一,周德龍.人臉識(shí)別方法綜述[J],計(jì)算機(jī)應(yīng)用研究,2009,26(9):3205-3209.
[2]余孟杰.基于小波變換圖像融合算法的人看檢測(cè)[D].浙江工業(yè)大學(xué),2009.
[3]徐曉艷.人臉識(shí)別技術(shù)綜述[J].電子測(cè)試,2015,(5X):885-894.
[4]孔祥棟.基于膚色和AdaBoost算法人臉檢測(cè)的研究[D].燕山大學(xué),2010.