文/毛亮 李立琛
隨著科技的發(fā)展和人們生活水平的提高,社會(huì)信息安全問題備受關(guān)注。如公安部門要從街道行人中迅速辨別犯罪嫌疑人,銀行需對(duì)存取款客戶進(jìn)行身份認(rèn)證,海關(guān)要對(duì)每天成千上萬(wàn)出入關(guān)人員進(jìn)行身份確認(rèn)。另如911恐怖事件的發(fā)生使世界各國(guó)對(duì)如何讓政府機(jī)構(gòu)、軍事設(shè)施、金融系統(tǒng)以及機(jī)場(chǎng)等重要安全區(qū)域免受恐怖分子的襲擊給予了高度重視。目前,基于密碼、磁卡和鑰匙等傳統(tǒng)的安全措施其安全性能較低,為確保國(guó)家及社會(huì)的和諧穩(wěn)定,就得找到一種更加可靠有效的身份識(shí)別技術(shù)來滿足安全領(lǐng)域的需要。在這種背景下,人們把目光投向了一種生物特征識(shí)別技術(shù)——人臉識(shí)別。
人臉識(shí)別是指利用計(jì)算機(jī)并借助相關(guān)算法對(duì)人臉進(jìn)行分析和身份辨認(rèn)的一門技術(shù),其使用通用的攝像機(jī)作為識(shí)別信息獲取裝置,并以非接觸的方式在對(duì)象未察覺的情況下根據(jù)人臉面部圖像完成識(shí)別過程。由于人臉特征直觀、友好、方便,且具有很強(qiáng)的自身穩(wěn)定性和個(gè)體差異性,因而是身份驗(yàn)證最理想的依據(jù)。
本文將圍繞人臉識(shí)別的發(fā)展歷程、關(guān)鍵技術(shù)、應(yīng)用現(xiàn)狀、存在問題以及發(fā)展趨勢(shì)進(jìn)行討論和研究。
人臉識(shí)別的工程應(yīng)用始于20世紀(jì)60年代,經(jīng)過50多年的研究,大致可以分為以下三個(gè)階段:
第一階段是主要針對(duì)人臉識(shí)別所需要的面部特征。研究者利用計(jì)算機(jī)實(shí)現(xiàn)較高質(zhì)量的人臉灰度圖模型,該階段的特點(diǎn)是識(shí)別過程全部依賴于操作人員,存在過多主動(dòng)因素的干預(yù),顯然無(wú)法實(shí)現(xiàn)自動(dòng)人臉識(shí)別系統(tǒng)。
第二階段是人機(jī)交互式識(shí)別階段。將人臉圖像中的耳朵、眼睛、鼻子長(zhǎng)度等主要幾何特征描述出來,并通過歐氏距離進(jìn)行相似性度量。Harmon和Lesk利用多維特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識(shí)別系統(tǒng)。幾何特征計(jì)算簡(jiǎn)單、速度快,在當(dāng)時(shí)硬件受限制的情況下是比較合理的選擇。但是,該方法依賴于操作員的先驗(yàn)知識(shí),仍無(wú)法擺脫人的干預(yù)。
第三階段是真正的機(jī)器自動(dòng)識(shí)別階段。該階段人臉識(shí)別技術(shù)有了重大突破,很多經(jīng)典算法相繼出現(xiàn),如特征臉、子空間方法、彈性圖匹配法、基于統(tǒng)計(jì)外觀模型和神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別等。同時(shí),也出現(xiàn)很多用于算法性能測(cè)試的公開人臉庫(kù),如ORL人臉庫(kù)、YaleB人臉庫(kù)、FERET人臉庫(kù)等。美國(guó)國(guó)防部反毒品技術(shù)發(fā)展計(jì)劃辦公室資助的FERET人臉庫(kù)促進(jìn)了現(xiàn)存算法的改進(jìn)和應(yīng)用化,并表明光照、年齡、姿態(tài)、表情等的變化對(duì)人臉識(shí)別算法性能影響最大,推動(dòng)了非理想采集條件下人臉識(shí)別研究。
隨著高性能計(jì)算機(jī)的發(fā)展,國(guó)內(nèi)外已經(jīng)有許多機(jī)器全自動(dòng)識(shí)別系統(tǒng)相繼問世,促使人臉識(shí)別技術(shù)進(jìn)入了實(shí)用化階段。國(guó)外比較成功的商用人臉識(shí)別系統(tǒng)有Identix公司研發(fā)的FaceIt、AcSys公司的AcSysFRS、EyeMatic公司的EPL等。國(guó)內(nèi)比較有名的人臉識(shí)別系統(tǒng)有深圳漢王人臉考勤機(jī)、浩順人臉識(shí)別考勤機(jī)、飛瑞斯人臉識(shí)別考勤機(jī)等。
人臉識(shí)別技術(shù)主要從圖像序列或視頻流中將特定人臉判別出來,一個(gè)全自動(dòng)人臉識(shí)別系統(tǒng)一般包括三個(gè)關(guān)鍵技術(shù):人臉檢測(cè)、特征提取和人臉識(shí)別。
人臉檢測(cè)是從復(fù)雜的背景中提取我們感興趣的人臉圖像區(qū)域。臉部毛發(fā)、化妝品、光照、噪聲、面部?jī)A斜和人臉大小變化以及各種各樣遮擋等因素都會(huì)使人臉檢測(cè)問題變得更為復(fù)雜。人臉檢測(cè)的主要目的是在輸入的整幅圖像上尋找人臉區(qū)域,從而為后續(xù)的人臉識(shí)別作準(zhǔn)備。人臉檢測(cè)的核心技術(shù)包括如下三個(gè)方面:
·基于特征的人臉檢測(cè)技術(shù)。可采用顏色特征、輪廓特征、紋理特征、結(jié)構(gòu)特征、直方圖特征等進(jìn)行人臉檢測(cè)。
·基于模板匹配的人臉檢測(cè)技術(shù)。事先設(shè)定好一定的候選人臉模板庫(kù),接著采取一定的模板匹配策略,用模板庫(kù)中的模板對(duì)圖片進(jìn)行匹配,通過相關(guān)性的高低和所匹配的模板大小確定人臉大小以及位置信息。
·基于統(tǒng)計(jì)的人臉檢測(cè)技術(shù)。搜集大量的“人臉”和“非人臉”圖片以構(gòu)成人臉正、負(fù)樣本庫(kù),并采用統(tǒng)計(jì)方法進(jìn)行強(qiáng)化訓(xùn)練,從而實(shí)現(xiàn)對(duì)人臉和非人臉的模式進(jìn)行檢測(cè)和分類。比較經(jīng)典的有Adaboost方法、人工神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)方法等。
特征提取主要是從人臉圖像中提取具有判別性的特征,它是人臉識(shí)別的核心部分。特征提取的優(yōu)劣會(huì)在很大程度上影響人臉識(shí)別效果,現(xiàn)有的方法主要包括如下四個(gè)方面:
·幾何特征。以面部特征點(diǎn)之間的距離和比率作為特征,其識(shí)別速度快,對(duì)內(nèi)存要求較小,對(duì)光照不太敏感。
·基于模型的特征提取方法。隱馬爾科夫模型是一種常用的模型,根據(jù)不同特征狀態(tài)所具有的概率不同而提取人臉圖像特征。
·基于統(tǒng)計(jì)的特征提取方法。將人臉圖像視為隨機(jī)向量,并用統(tǒng)計(jì)方法辨別不同人臉特征模式,比較典型的有特征臉、獨(dú)立成分分析、奇異值分解等。
·基于神經(jīng)網(wǎng)絡(luò)的特征提取方法。利用大量神經(jīng)單元對(duì)人臉圖像特征進(jìn)行聯(lián)想存儲(chǔ)和記憶,根據(jù)不同神經(jīng)單元狀態(tài)的概率實(shí)現(xiàn)對(duì)人臉圖像準(zhǔn)確識(shí)別。
人臉識(shí)別是根據(jù)所提取的人臉圖像特征采用相關(guān)識(shí)別算法進(jìn)行人臉確認(rèn)或辨別。即將已檢測(cè)到的待識(shí)別人臉與數(shù)據(jù)庫(kù)中已知人臉進(jìn)行比較匹配,得出相關(guān)信息,該過程的關(guān)鍵是選擇適當(dāng)?shù)娜四槺碚鞣绞脚c匹配策略,系統(tǒng)的構(gòu)造與人臉的表征方式密切相關(guān)。一般根據(jù)所提特征而選擇不同識(shí)別算法進(jìn)行度量,常用的包括距離度量、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、k均值聚類等。
人臉識(shí)別技術(shù)是一種高精度、易于使用、穩(wěn)定性高、難仿冒、性價(jià)比高的生物特征識(shí)別技術(shù),使用者無(wú)任何心理障礙,且易于被用戶接受。當(dāng)前的人臉識(shí)別技術(shù)主要被應(yīng)用到如下幾個(gè)方面:
公安破案。刑偵破案中公安部門在檔案系統(tǒng)里存儲(chǔ)有嫌疑犯的照片,當(dāng)作案現(xiàn)場(chǎng)或通過其他途徑獲得該嫌疑犯的照片或其面部特征的描述后,可從數(shù)據(jù)庫(kù)中迅速查找確認(rèn),大大提高了刑偵破案的準(zhǔn)確性和效率。
視頻監(jiān)控。通過對(duì)公司、銀行、公共場(chǎng)所等進(jìn)行24小時(shí)視頻監(jiān)控,當(dāng)有異常情況或陌生人闖入時(shí),利用人臉識(shí)別技術(shù)可以對(duì)異常情況進(jìn)行監(jiān)控、識(shí)別和報(bào)警,以及對(duì)陌生人進(jìn)行實(shí)時(shí)跟蹤。
證件驗(yàn)證。證件驗(yàn)證是檢驗(yàn)?zāi)橙松矸莸囊环N常用手段,利用人臉識(shí)別技術(shù),可以讓機(jī)器自動(dòng)完成驗(yàn)證識(shí)別工作,實(shí)現(xiàn)自動(dòng)化智能管理。如2008北京奧運(yùn)會(huì)實(shí)名制票證系統(tǒng)認(rèn)證、重要機(jī)構(gòu)重要人員身份認(rèn)證、銀行押運(yùn)員身份驗(yàn)證等。
出入口控制。對(duì)樓宇、住宅、公司等出入口的安全檢查,包括在進(jìn)入計(jì)算機(jī)系統(tǒng)前的身份驗(yàn)證。飛瑞斯科技“辨臉通”人臉識(shí)別考勤系統(tǒng),精確提取人臉特征作為身份識(shí)別的依據(jù),從而提供準(zhǔn)確的考勤記錄,完全取代市場(chǎng)上指紋、打卡考勤機(jī)。
隨著生物特征識(shí)別技術(shù)的發(fā)展,指紋、虹膜、語(yǔ)音等生物等征的局限性日益顯現(xiàn),而人臉特征相對(duì)其他生物特征具有非侵入性、采集成本低、操作簡(jiǎn)單等優(yōu)勢(shì),基于人臉特征的生物特征身份認(rèn)證技術(shù)受到了社會(huì)的高度重視。
人臉識(shí)別技術(shù)經(jīng)過幾十年的發(fā)展,已經(jīng)取得了很大進(jìn)展,但由于人臉識(shí)別問題的復(fù)雜性,目前還沒有一個(gè)通用的人臉識(shí)別系統(tǒng)可以滿足所有要求。具體而言,一個(gè)魯棒的人臉識(shí)別系統(tǒng)研究主要存在以下幾個(gè)難點(diǎn):
光照變化。光照是隨地點(diǎn)和時(shí)間變化而動(dòng)態(tài)變化的,偏光、側(cè)光會(huì)導(dǎo)致二維人臉圖像中產(chǎn)生過亮、過暗、陰影及帶來灰度分布變化和顏色空間變化,從而影響人臉識(shí)別,導(dǎo)致系統(tǒng)性能下降。
姿態(tài)變化。由于行為意識(shí)的控制使人臉發(fā)生偏轉(zhuǎn)或俯仰,以及成像投影時(shí)由于形變而引起臉部特征的拉伸和壓縮以及臉部特征不同程度的遮擋,導(dǎo)致提取的人臉圖像特征差異性很大。
表情變化。人臉是非剛性的,心情變化會(huì)引發(fā)的表情變化,如微笑、驚訝、生氣等,都將引起人臉特征幾何形狀的變化,從而攝像過程中從三維到二維的投影將隨之發(fā)生變化,降低了人臉圖像識(shí)別性能。
遮擋、發(fā)型、飾物、化妝等偽裝條件,及年齡、身體狀態(tài)、圖像質(zhì)量等。遮擋(眼鏡、圍巾等)、發(fā)型、飾物、化妝等都可以將臉部的主要特征覆蓋,導(dǎo)致圖像中主要特征的缺失。而年齡、身體狀態(tài)等會(huì)影響人的膚色,也會(huì)讓人臉發(fā)生改變,如年齡變大產(chǎn)生皺紋等新特征,身體不好使臉變瘦及膚色變黃變暗,這些差異均會(huì)給人臉識(shí)別帶來很大的影響。
目前,人臉識(shí)別技術(shù)只能解決特定環(huán)境下的應(yīng)用,如特定光照、限制遮擋等。而實(shí)際中外界環(huán)境是不可控的,如復(fù)雜條件下的人臉識(shí)別、模糊照片的人臉識(shí)別、遠(yuǎn)距離的人臉識(shí)別、快速行進(jìn)中的人臉識(shí)別,這些都亟需人臉識(shí)別技術(shù)來解決。有效的變化補(bǔ)償、特征描述的合理以及更準(zhǔn)確的分類識(shí)別都將是人臉識(shí)別技術(shù)成功應(yīng)用的關(guān)鍵。在未來,如何更好地提取和組合局部與整體特征來提高特征表達(dá)的魯棒性、如何實(shí)現(xiàn)多分類器的有效融合來提高分類正確率以及如何提高人臉識(shí)別的識(shí)別率和識(shí)別速度等,這都是人臉識(shí)別技術(shù)在發(fā)展中要解決的問題。
人臉識(shí)別技術(shù)是一項(xiàng)非常具有挑戰(zhàn)性的研究課題,對(duì)其進(jìn)行研究具有很高的理論意義和實(shí)用價(jià)值。盡管人臉識(shí)別的研究已經(jīng)取得很大進(jìn)展,不少人臉識(shí)別系統(tǒng)已投入商用,但在人類尚未真正識(shí)別人臉機(jī)理以及任意復(fù)雜環(huán)境中的人臉識(shí)別系統(tǒng)尚未成熟的情況下,人臉識(shí)別技術(shù)的研究還有很長(zhǎng)的路要走。