楊劍鵬 江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司南京分公司
人臉識(shí)別是生物特性鑒別技術(shù)的一個(gè)主要方向,它涉及圖像處理,模式識(shí)別,計(jì)算機(jī)視覺(jué)等多個(gè)研究領(lǐng)域,具有十分廣泛的應(yīng)用前景,多年來(lái)一直是一個(gè)研究熱點(diǎn)。相對(duì)于其它人體生物特征識(shí)別技術(shù),如指紋識(shí)別、虹膜識(shí)別、掌紋識(shí)別,人臉識(shí)別技術(shù)是最直接、最自然、最容易被人接受的。與其它技術(shù)相比,它具有侵犯性小、較少需要或不需要用戶的主動(dòng)配合、樣本采集方便、應(yīng)用場(chǎng)合廣泛、潛在的數(shù)據(jù)資源豐富、設(shè)備成本低等優(yōu)點(diǎn)。人臉識(shí)別系統(tǒng)具備操作及流程簡(jiǎn)單、適用面廣、支持一對(duì)一或一對(duì)多比對(duì)、支持多點(diǎn)同時(shí)采集比對(duì)、帶有數(shù)據(jù)庫(kù)支持記錄及查詢功能,對(duì)采集現(xiàn)場(chǎng)環(huán)境要求較低,可在極短的時(shí)間里判斷出進(jìn)出者的身份是否合法,杜絕使用他人鑰匙、密碼、磁卡等非法進(jìn)入。人臉識(shí)別技術(shù)的安全性、可靠性較高,且擁有廣泛的市場(chǎng)需求,它可以應(yīng)用于公安部門的犯人檔案管理、犯人辨認(rèn)查找、刑偵破案、安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、醫(yī)學(xué)、檔案管理、視頻會(huì)議、人機(jī)交互系統(tǒng)、證件核對(duì)、保安監(jiān)視、門禁控制及至自動(dòng)柜員機(jī)(ATM)等多種場(chǎng)合。
人臉識(shí)別對(duì)人類來(lái)說(shuō)是件自然而然的事情,但對(duì)計(jì)算機(jī)而言,人臉識(shí)別卻遠(yuǎn)非一個(gè)已解決的課題。所有的人臉都具有相似的結(jié)構(gòu),在紋理上也十分相近。另外圖像受光照、成像角度及成像距離等外界條件影響,具有“一人千面”的特點(diǎn),欲建立一種具有各種不變性的描述模型還是比較困難的。此外,人臉識(shí)別技術(shù)研究與相關(guān)科學(xué)的發(fā)展及人腦的認(rèn)識(shí)程度緊密相關(guān)。諸多因素都使人臉識(shí)別研究成為一項(xiàng)極富挑戰(zhàn)性的課題。一方面信息化進(jìn)程的日益加快,電子商務(wù)、重要場(chǎng)所的安全認(rèn)證、智能化環(huán)境等許多應(yīng)用領(lǐng)域?qū)εc人臉有關(guān)的信息處理提出了迫切要求;另一方面,硬件和軟件技術(shù)的發(fā)展,為滿足實(shí)際應(yīng)用系統(tǒng)對(duì)人臉檢測(cè)、跟蹤及識(shí)別技術(shù)的實(shí)時(shí)化要求提供了可能性。
所以,人臉識(shí)別的研究不僅涉及心理學(xué)、生理學(xué)、人工智能、模式識(shí)別、計(jì)算機(jī)視覺(jué)、圖像分析與處理等多個(gè)學(xué)科領(lǐng)域,更是模式識(shí)別、人工智能和計(jì)算機(jī)視覺(jué)的典型案例之一。對(duì)這一問(wèn)題的研究和解決,有助于對(duì)其他對(duì)象識(shí)別問(wèn)題的研究分析和解決,人臉識(shí)別也因此成為這些基礎(chǔ)研究領(lǐng)域的重要課題之一,具有重要的理論研究?jī)r(jià)值。
隨著安全入口控制和金融貿(mào)易方面應(yīng)用需要的快速增長(zhǎng),生物統(tǒng)計(jì)識(shí)別技術(shù)得到了新的重視。目前,微電子和視覺(jué)系統(tǒng)方面取得的新進(jìn)展,使該領(lǐng)域中高性能自動(dòng)識(shí)別技術(shù)的實(shí)現(xiàn)代價(jià)降低到了可以接受的程度。而人臉識(shí)別是所有的生物識(shí)別方法中應(yīng)用最廣泛的技術(shù)之一,最近幾年倍受重視。
人臉識(shí)別技術(shù)(Face Recognition Technology)是機(jī)器視覺(jué)和模式識(shí)別領(lǐng)域最富有挑戰(zhàn)性的課題之一,同時(shí)也具有較為廣泛的應(yīng)用意義。在諸如證件檢驗(yàn)、銀行系統(tǒng)、軍隊(duì)安全、安全檢查方面都具有相當(dāng)大的應(yīng)用前景。這方面的研究最早始于二十世紀(jì)七十年代初期,由于當(dāng)時(shí)計(jì)算機(jī)技術(shù)發(fā)展水平等因素的限制,此項(xiàng)研究并沒(méi)有受到廣泛的重視,甚至一度處于相對(duì)停滯狀態(tài)。進(jìn)入二十世紀(jì)九十年代以來(lái),計(jì)算機(jī)人臉識(shí)別的研究重新成為人們所關(guān)注的熱點(diǎn)。在心理學(xué)、“神經(jīng)網(wǎng)絡(luò)”、“工程學(xué)”、“圖像處理及分析”、“數(shù)字圖像處理”、“計(jì)算機(jī)視覺(jué)”等方面發(fā)表了大量的關(guān)于人臉識(shí)別的論文,僅從1995年至2001年之間,EI檢索到的相關(guān)文獻(xiàn)就多達(dá)數(shù)千篇。由于人臉表情豐富,并且受光照、成像角度及成像距離等因素的影響,還涉及模式識(shí)別和神經(jīng)網(wǎng)絡(luò)等學(xué)科,同時(shí)也和對(duì)人臉的認(rèn)識(shí)程度密切相關(guān),這諸多因素使得人臉識(shí)別成為一項(xiàng)極富挑戰(zhàn)性的研究課題。
人類在日常的社交活動(dòng)中經(jīng)常需要“認(rèn)人”,這主要是通過(guò)識(shí)別人身上最獨(dú)特、最重要的特征——人臉,人類識(shí)別人臉的能力非常強(qiáng),是目前所有用計(jì)算機(jī)實(shí)現(xiàn)的自動(dòng)人臉識(shí)別系統(tǒng)所無(wú)法比擬的。
人像識(shí)別技術(shù)的研究范圍包括:
(1)人像采樣 : 識(shí)別的基礎(chǔ)是樣本空間需要足夠大。整個(gè)樣本空間不僅需要包括基本的人臉特征,還需要大量的基礎(chǔ)環(huán)境特征。光線,服飾,發(fā)型等各類因素會(huì)使人像檢測(cè)問(wèn)題變得很復(fù)雜。
(2)人像檢測(cè):主要目的是把一個(gè)圖像或者場(chǎng)景分為人像區(qū)和非人像區(qū),為后續(xù)處理做好準(zhǔn)備。
(3) 人像表征 : 人像量化和編碼,采樣的數(shù)據(jù)如何稱之為人像,需要通過(guò)特定的標(biāo)識(shí)。通常的表示法包括幾何特征(如歐氏距離、曲率、角度) 、代數(shù)特征(如矩陣特征矢量) 、固定特征模板、特征臉等。
(4) 人像匹配: 采集的待識(shí)別的人像與數(shù)據(jù)庫(kù)中的人像元素進(jìn)行匹配,得出相關(guān)信息,這一過(guò)程是選擇適當(dāng)?shù)娜讼癖碚鞣绞脚c匹配算法,系統(tǒng)的構(gòu)造與人像的表征方式密切相關(guān)。通?;蚴沁x擇全局的方法或是選擇基于特征的方法進(jìn)行匹配。
(5) 表情分析: 即對(duì)待識(shí)別人像的表情信息(快樂(lè)、悲傷、恐懼、驚奇等) 進(jìn)行分析,并對(duì)其加以歸類。
(6) 生理分類: 即對(duì)待識(shí)別人像的生理特征進(jìn)行分析,得出其種族、年齡、性別、職業(yè)等相關(guān)信息。這些信息,可以在某個(gè)特定的場(chǎng)景下進(jìn)行描述。如人口普查,機(jī)場(chǎng)安檢等。人像識(shí)別的原理如圖1 所示:
人像識(shí)別的技術(shù)優(yōu)點(diǎn)如下:
(1) 非接觸式感知
在一般環(huán)境下普通攝像頭即可采集人像,以非接觸的方式在識(shí)別對(duì)象未察覺(jué)的情況下完成識(shí)別過(guò)程。
(2) 直觀
基本的人物辨別以相貌為主。人像識(shí)別方便人工確認(rèn),降低了復(fù)核的難度。
(3) 使用通用性設(shè)備
隨著硬件的提升,普通的攝像頭加上普通PC即可滿足識(shí)別要求。
(4) 采樣方便
現(xiàn)場(chǎng)采樣、或利用標(biāo)準(zhǔn)證件照掃描,很容易獲取基礎(chǔ)信息。
整個(gè)系統(tǒng)架構(gòu)如圖2所示。攝像頭采集到人像圖像后提交到人像比對(duì)服務(wù)器上,與各類特殊人群數(shù)據(jù)庫(kù)進(jìn)行比對(duì)。比對(duì)的結(jié)果將實(shí)時(shí)顯示在監(jiān)控顯示器上,一旦有人員命中,系統(tǒng)將觸發(fā)監(jiān)控室的語(yǔ)音提示系統(tǒng)。
圖1 人像識(shí)別原理
圖2 人臉識(shí)別系統(tǒng)架構(gòu)圖
系統(tǒng)對(duì)傳輸過(guò)來(lái)的人像圖像首先要進(jìn)行光照補(bǔ)償、人像定位、矯正有旋轉(zhuǎn)角度的人像圖像等預(yù)處理操作。
2.1 光照補(bǔ)償
人像顏色會(huì)隨光照強(qiáng)度的改變而改變,光照變化是影響人像識(shí)別性能的關(guān)鍵因素之一,對(duì)該問(wèn)題的解決影響到人像識(shí)別系統(tǒng)的成敗??刹捎萌缦碌淖赃m應(yīng)光照亮度補(bǔ)償算法:
(1) 選擇光照均勻的標(biāo)準(zhǔn)圖像,并計(jì)算出圖像中各象素點(diǎn)的亮度平均值;
(2) 計(jì)算待檢測(cè)圖像中各象素點(diǎn)的亮度平均值;
(3) 若標(biāo)準(zhǔn)圖像象素點(diǎn)的亮度平均值減去待檢測(cè)圖像的亮度平均值大于7 則對(duì)該象素點(diǎn)進(jìn)行亮度補(bǔ)償。
公式(1)中: r′, g′, b′分別為待檢測(cè)圖像中需要進(jìn)行光照補(bǔ)償象素點(diǎn)的R , G,B 分量;r , g , b 分別為標(biāo)準(zhǔn)圖像象素點(diǎn)的R ,G,B 分量; mr , mg , mb 分別為標(biāo)準(zhǔn)圖像各象素點(diǎn)的R , G,B分量的平均值;mr′, mg′, mb′分別為待檢測(cè)圖像各象素點(diǎn)的R ,G,B 分量的平均值;sr , sg , sb 分別為標(biāo)準(zhǔn)圖像各象素點(diǎn)的R ,G,B 分量的方差;sr′, sg′, sb′分別為待檢測(cè)圖像各象素點(diǎn)的R ,G,B 分量的方差。
2.2 用輻射模板計(jì)算人像旋轉(zhuǎn)角度并轉(zhuǎn)換成正面人像圖像
對(duì)人像進(jìn)行特征提取之前首先利用輻射模板法計(jì)算人像的偏轉(zhuǎn)角度,然后利用坐標(biāo)變換將其恢復(fù)成正臉圖像。本文重點(diǎn)介紹輻射模板法。輻射模板是一個(gè)被均分為若干個(gè)扇形的圓形模板。自頂開(kāi)始按照逆時(shí)針?lè)较蚋魃刃我来尉幪?hào)0~15 。令人像面部中心與輻射模板中心重合,分別計(jì)算落入每一個(gè)扇形中的邊緣象素點(diǎn)的個(gè)數(shù),由此得到一個(gè)輻射模板直方圖。
2.3 人像特征的提取
(1) 眼睛特征的提取
眼睛的典型特征包括左、右眼睛的坐標(biāo),左、右眼睛的高和寬,以及眼距等。眼睛的4 個(gè)邊緣點(diǎn)及中心坐標(biāo)容易得到,眼睛的高等于下邊緣點(diǎn)的縱坐標(biāo)減去上邊緣點(diǎn)的縱坐標(biāo),眼睛的寬等于右邊緣點(diǎn)的橫坐標(biāo)減去左邊緣點(diǎn)的橫坐標(biāo),眼距等于右眼的左邊緣點(diǎn)的橫坐標(biāo)減去左眼的右邊緣點(diǎn)的橫坐標(biāo)。
(2) 鼻子特征的提取
鼻子的特征值包括鼻子的寬、高以及鼻子的最左邊緣點(diǎn)和最右邊緣點(diǎn)的橫坐標(biāo)。眼睛所在區(qū)域下面的第一個(gè)投影區(qū)即為鼻子所在的區(qū)域。求出該區(qū)域水平投影的最大值即為鼻尖的縱坐標(biāo),由此以一定步長(zhǎng)向下搜索,直到投影值為0 ,得到鼻子最下端的縱坐標(biāo)。根據(jù)搜索路徑易得鼻心的坐標(biāo)和鼻子的高。在鼻子所在的區(qū)域內(nèi)從鼻心開(kāi)始向左、向右各取一定的偏移量求其垂直投影,投影的最左、最右的第一個(gè)不為0 的點(diǎn)就是鼻子的左、右邊緣點(diǎn),鼻子的寬即為鼻子左、右邊緣點(diǎn)的差。
(3) 眉毛特征的提取
眉毛的特征值包括眉毛的高、寬以及眉距。首先求出眉毛所在區(qū)域的水平投影的最大值y 及左、右眉毛的垂直投影的最大值x1 , x2 ,則( x1 , y) , ( x2 , y) 分別是左、右眉毛的一個(gè)內(nèi)點(diǎn)?,F(xiàn)以左眉毛特征的提取為例。從( x1, y ) 開(kāi)始向上、下以一定步長(zhǎng)進(jìn)行水平投影, 直到投影值為0 得到左眉毛最上邊緣點(diǎn)和最下邊緣點(diǎn)的縱坐標(biāo), 兩個(gè)縱坐標(biāo)的差即左眉毛的高。以( x1 , y) 開(kāi)始向左、右以一定步長(zhǎng)進(jìn)行垂直投影,直到投影值為零得到左眉毛最左邊緣點(diǎn)和最右邊緣點(diǎn)的橫坐標(biāo),兩個(gè)橫坐標(biāo)的差即左眉毛的寬。眉距:右眉毛的最左邊緣點(diǎn)的橫坐標(biāo)與左眉毛的最右邊緣點(diǎn)的橫坐標(biāo)的差。
(4) 嘴巴特征的提取
嘴巴的特征值包括嘴巴的寬、高、最左邊緣點(diǎn)和最右邊緣點(diǎn)的橫坐標(biāo)。首先求嘴巴所在區(qū)域的水平投影的最大值y 及垂直投影的最大值x ,則( x , y) 為嘴巴的一個(gè)內(nèi)點(diǎn)。按照前面求鼻子左、右邊緣點(diǎn)的方法求出嘴巴的最左邊緣點(diǎn)和最右邊緣點(diǎn),嘴巴的寬度等于所求得的左、右邊緣點(diǎn)的橫坐標(biāo)差。由于拍攝到的嘴巴可能張著, 也可能閉著, 故嘴巴高度的求解要分情況處理。根據(jù)先驗(yàn)知識(shí),上面求得的y 要么在上嘴唇要么在嘴的中央而不可能在下嘴唇,因此從( x , y) 點(diǎn)向上以一定步長(zhǎng)進(jìn)行水平投影, 直到投影值為0 得到嘴巴的上邊緣點(diǎn)。二值化后的嘴巴可能有空洞,因此在求嘴巴的下邊緣點(diǎn)時(shí)從( x , y) 向下取一個(gè)偏移量, 新位置記為( x , yy) , ( x , yy)只能取在嘴巴的下方或下嘴唇上,而不能取在上下嘴唇的中間。求坐標(biāo)( x ,yy) 所在區(qū)域的水平投影,若投影值為0 ,表明( x , yy) 取在了下嘴唇的下方, 則繼續(xù)向上搜索, 直到投影值不為0 ,得到嘴巴的下邊緣點(diǎn), 若投影值不為0 , 表明( x , yy) 取在下嘴唇上,則繼續(xù)向下搜索, 直到投影值為0 得到嘴的下邊緣點(diǎn),嘴的高度等于所得到的上嘴唇和下嘴唇的差。
2.4 特征臉譜
對(duì)于任何模式識(shí)別問(wèn)題, 首先要用各種可能的手段,對(duì)識(shí)別對(duì)象的性質(zhì)作各種測(cè)量,并將這些測(cè)量值作為分類用的特征。通??梢蕴崛?lái)源描述特征, 也可以提取差異特征。在傳統(tǒng)的人像識(shí)別中, 大多是尋找描述性特征, 確定眼睛、鼻子、嘴等人臉成員形狀、位置及其相互關(guān)系來(lái)描述人臉樣本, 以作為分類的依據(jù)。但人臉形狀極不規(guī)則,要精確描述人臉, 其特征量是很大的。受信息論思想的啟發(fā), 我們需要盡可能地提取人臉圖象中有用的信息, 并盡可能高效地對(duì)它進(jìn)行編碼, 以供識(shí)別使用??紤]到人臉圖象之間具有很大的相似性, 因此, 拋棄具體的細(xì)節(jié)特征抽取人臉圖象整體上的差異信息, 既不會(huì)損失人臉圖象中包含的有用信息, 又簡(jiǎn)單直接便于編碼比較。我們可利用主分量分析, 消除模式特征之間的相關(guān)性, 突出其差異性。鑒于一組特征向量可以刻畫協(xié)方差矩陣中的差異, 我們考慮用組“ 特征臉譜” 來(lái)描述人臉圖象的差異信息。從一組原始的人臉圖象集合出發(fā), 我們可考慮用一組“ 特征臉譜” 來(lái)描述人臉圖象的差異信息。從一組原始的人臉圖象集合出發(fā), 尋找可用于確定所有人臉圖象的一個(gè)最佳的坐標(biāo)系統(tǒng)。任何人臉圖象均可以映射到這一坐標(biāo)系統(tǒng), 每個(gè)坐標(biāo)向量在確定一幅人臉圖象中或多或少地起著作用。這些坐標(biāo)向量也是N2維的, 它們描述的NxN的圖象類似于人臉圖象, 故可形象地稱它們?yōu)椤?特征臉譜” , 這樣,我們可以用特征臉譜的線性組合來(lái)比較準(zhǔn)確地刻畫人臉圖象間的差異信息。對(duì)任何一幅人臉圖象, 我們僅需保留一組它的差值圖象對(duì)應(yīng)于各個(gè)特征臉譜的權(quán)值作為分類特征。
任何一幅NxN圖象均可以看作一個(gè)N2維的向量,則任何圖象都可以映射到N2維空間中的一點(diǎn)。既然所有人臉圖象在總體結(jié)構(gòu)上具有很大的相似性, 故而它們不會(huì)在如此巨大的圖象空間上自由分布, 我們可以用一個(gè)維數(shù)較低的子空間描述它們。特征臉譜作為最基本的圖象集合,任何一幅人臉差值圖象都可以唯一表示為它們的線性組合, 也就是尋找那些最能說(shuō)明人臉差值圖象在空間中分布的坐標(biāo)向量的過(guò)程, 這些坐標(biāo)向量所描述的NxN的圖象均是各個(gè)人臉差值圖象的線性組合, 它們定義了人臉圖象所聚集的人臉差空間, 可以刻畫出人臉圖象間的差別。
人像識(shí)別技術(shù)的最主要的功能就是通過(guò)攝像頭,計(jì)算機(jī)智能識(shí)別人像交通違章監(jiān)控,重要公共場(chǎng)所治安監(jiān)控,利用人像識(shí)別技術(shù),可以大大降低人工判斷所耗費(fèi)的時(shí)間以及存在的誤差。
通過(guò)員工現(xiàn)場(chǎng)采集,或者提供有效身份證件照片來(lái)建立員工人像庫(kù),依次來(lái)進(jìn)行考勤管理,相對(duì)于傳統(tǒng)的指紋、考勤卡方式,更加靈活便利,可信度高。
1.1 系統(tǒng)結(jié)構(gòu)
基于人像識(shí)別技術(shù)的考勤系統(tǒng)包括高清紅外攝像頭,視頻存儲(chǔ),人像識(shí)別、考勤應(yīng)用服務(wù)器,監(jiān)控平臺(tái)。如辦公地點(diǎn)分散,可利用局域網(wǎng)技術(shù)建立B/S架構(gòu),形成統(tǒng)一的考勤體系。
1.2 系統(tǒng)特點(diǎn)
可進(jìn)行準(zhǔn)確快速的身份識(shí)別,節(jié)約打卡時(shí)間,避免代打考勤現(xiàn)象的出現(xiàn)。
1.3 應(yīng)用場(chǎng)景
通過(guò)現(xiàn)場(chǎng)采集或職員身份證照片,建立員工人像庫(kù)。通過(guò)合適的算法,精確地進(jìn)行身份識(shí)別。對(duì)于中大型生產(chǎn)型企業(yè),可以提高考勤效率。
在居民小區(qū)、社區(qū)公共場(chǎng)所,交通樞紐等場(chǎng)所,利用網(wǎng)絡(luò)攝像頭,建立起高精度的海量人像識(shí)別系統(tǒng)??捎糜谌藛T進(jìn)出,治安巡邏,安檢進(jìn)站,可以從原先的人眼識(shí)別,轉(zhuǎn)變?yōu)橛?jì)算機(jī)智能識(shí)別,更加有效地快速的核實(shí)人員身份。
2.1 系統(tǒng)結(jié)構(gòu)
圖3 基于人像識(shí)別技術(shù)的考勤系統(tǒng)
基于人像識(shí)別技術(shù)的安防系統(tǒng)包括高清紅外攝像頭,視頻存儲(chǔ),人像識(shí)別應(yīng)用服務(wù)器,監(jiān)控平臺(tái)??衫没ヂ?lián)網(wǎng)技術(shù)擴(kuò)展到B/S架構(gòu),實(shí)現(xiàn)小區(qū)、社區(qū)、街道直至縣市區(qū)域級(jí)別的安防系統(tǒng)。
2.2 系統(tǒng)特點(diǎn)
能準(zhǔn)確快速的身份識(shí)別,避免繁瑣的人工處理工作。
2.3 應(yīng)用場(chǎng)景
在高端住宅小區(qū)通過(guò)非接觸式的身份識(shí)別,可避免矛盾,提升物業(yè)服務(wù)品質(zhì)。酒店賓館,便于管理者方便的識(shí)別客戶。機(jī)場(chǎng)車站街道,可有效的提升治安水平,提升城市安全度。
本文所簡(jiǎn)述人像識(shí)別算法在一定程度上解決了采集人像圖像時(shí)光照的不均勻性問(wèn)題和采集的人像圖像存在旋轉(zhuǎn)角度的問(wèn)題等。同時(shí),通過(guò)本文的闡述可以發(fā)現(xiàn),基于人像識(shí)別技術(shù)的智能視頻監(jiān)控系統(tǒng)可以有效地解決目前數(shù)字監(jiān)控系統(tǒng)存在的某些難題,如確定監(jiān)控場(chǎng)景中是否有人、對(duì)監(jiān)控對(duì)象難以跟蹤、確定當(dāng)前監(jiān)控對(duì)象的身份等問(wèn)題。因此可以看出,基于人像識(shí)別的智能化視頻監(jiān)控系統(tǒng)作為安防行業(yè)的高中端產(chǎn)品,具有十分廣泛的應(yīng)用前景。
圖4 基于人像識(shí)別技術(shù)的安防系統(tǒng)
[1]岡薩雷斯,數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2003:120-308.
[2]楊帆等,數(shù)字圖像處理與分析[M].北京:北京航空航天大學(xué)出版社,2007:35-87.