高浚哲
(徐州市第一中學(xué)合作民辦校,江蘇徐州,221000)
人臉識(shí)別技術(shù)值得是通過比較人臉的視覺特征信息從而進(jìn)行身份鑒別的技術(shù)[1],是生物特征識(shí)別的典型代表。人臉識(shí)別技術(shù)從廣義上而言,還包括了人臉檢測(cè)、人臉跟蹤、人臉比對(duì)等一系列相關(guān)技術(shù)。
人臉識(shí)別具有非強(qiáng)制性、非接觸性的特點(diǎn),可以在用戶無意識(shí)的狀態(tài)下直接獲取人臉圖像,不需要用戶專門配合人臉采集設(shè)備,也不需要如采集指紋般需要用戶和設(shè)備直接接觸以獲取人臉圖像。除此之外,人臉識(shí)別還具有操作簡(jiǎn)單、結(jié)果直觀、隱蔽性好等特點(diǎn)。總而言之,相對(duì)于其他生物特征識(shí)別技術(shù),人臉識(shí)別技術(shù)具有普遍性更高、可采集性更高、可接受性更高的優(yōu)點(diǎn)。近幾年來,人臉識(shí)別技術(shù)成為計(jì)算機(jī)視覺領(lǐng)域的一大熱點(diǎn)。
人臉識(shí)別技術(shù)良好的特性使得人臉識(shí)別引起了越來越多研究者的重視,有人將人臉識(shí)別技術(shù)稱為“早上八九點(diǎn)鐘的太陽”,足以說明人臉識(shí)別技術(shù)的巨大發(fā)展?jié)摿?。人臉識(shí)別技術(shù)在金融、公安及其他需要安全認(rèn)證的行業(yè)和部門大放異彩,也被廣泛應(yīng)用于人員考勤、電子商務(wù)、身份鑒定、信息安全等領(lǐng)域。目前,我國(guó)從事人臉識(shí)別技術(shù)研究的單位有很多,使得生物特征識(shí)別技術(shù)形成了一定市場(chǎng)規(guī)模。2008年,以清華大學(xué)和中科院自動(dòng)化研究所為代表研發(fā)的北京奧運(yùn)會(huì)實(shí)名制票證系統(tǒng)將人臉識(shí)別技術(shù)推向新的高潮,為人臉識(shí)別技術(shù)的應(yīng)用打下了堅(jiān)實(shí)的基礎(chǔ)[2]。2012年4月13日京滬高鐵安檢區(qū)域人臉識(shí)別系統(tǒng)工程開始招標(biāo),上海虹橋站、天津西站和濟(jì)南西站三個(gè)車站安檢區(qū)域?qū)惭b用于身份識(shí)別的高科技安檢系統(tǒng)—人臉識(shí)別系統(tǒng),以協(xié)助公安部門抓捕在逃案犯,為人臉識(shí)別技術(shù)在犯罪調(diào)查的領(lǐng)域添加了濃墨重彩的一筆。
由于反恐、國(guó)土安全和社會(huì)安全的需要,世界上各個(gè)國(guó)家都對(duì)安防領(lǐng)域加大了投入,其中人臉識(shí)別技術(shù)正是安防的一個(gè)核心領(lǐng)域[3]。在十幾年的發(fā)展中,人臉識(shí)別技術(shù)已經(jīng)成為全球性的生物識(shí)別共識(shí)之一,相關(guān)的研究已經(jīng)取得很大的進(jìn)展。生物識(shí)別技術(shù)的熱潮,也為人臉識(shí)別技術(shù)帶來更加廣闊的發(fā)展前景。
傳統(tǒng)的簽到方式不外乎紙質(zhì)簽到、點(diǎn)名簽到及刷卡簽到的方式。
紙質(zhì)簽到方式需要提前打印相關(guān)信息,不僅浪費(fèi)紙張,而且在簽到過程中費(fèi)時(shí)費(fèi)力;點(diǎn)名簽到方式在用戶較少的情況下相對(duì)可行性高,但是當(dāng)用戶人員劇增,比如大學(xué)校園中課堂人數(shù)可能過百,一一進(jìn)行點(diǎn)名的方法明顯不可?。凰⒖ê灥降姆绞礁纳屏思堎|(zhì)簽到與點(diǎn)名簽到的很多弊端,但是也存在其不足,其中最明顯的一點(diǎn)就是為了簽到,每個(gè)人必須攜帶相關(guān)的身份卡,一旦該卡遺失,就會(huì)造成很多不必要的麻煩。
與上述幾種傳統(tǒng)的簽到方式相比,本系統(tǒng)采用全自動(dòng)簽到的模式。用戶只需走過面部采集的攝像頭,就能實(shí)現(xiàn)簽到,更加高效便捷,也更人性化。
圖1 系統(tǒng)示意圖
在采用本系統(tǒng)實(shí)現(xiàn)簽到功能之前首先需要采集用戶的基本信息與人臉信息,并保存到相應(yīng)的數(shù)據(jù)庫中;在系統(tǒng)運(yùn)行過程中,必須借助一些硬件進(jìn)行針對(duì)人臉圖像的收集,將獲得的當(dāng)前數(shù)據(jù)與數(shù)據(jù)庫數(shù)據(jù)進(jìn)行對(duì)比分析,從而得到簽到結(jié)果。因此,從整體上而言,我們將本系統(tǒng)大致分為三個(gè)部分,并分別命名為硬件部分、數(shù)據(jù)庫部分及識(shí)別部分。
圖2 用戶信息
硬件部分主要包含兩個(gè)設(shè)備:攝像頭和顯示屏。
攝像頭主要用于采集用戶的頭像信息,是人臉檢測(cè)與識(shí)別過程的基礎(chǔ)。為了提高檢測(cè)的準(zhǔn)確性,我們要求攝像頭能夠拍攝高清的圖像信息。在信息錄入與識(shí)別的過程中,均需要用到攝像頭。
顯示屏主要用于輸出當(dāng)前的簽到結(jié)果,在我們的設(shè)計(jì)中只實(shí)現(xiàn)簡(jiǎn)單的文字輸出。如顯示“張三簽到成功”、“未檢測(cè)到人臉”、“無法識(shí)別此人”等,給出相關(guān)的提示信息,從而判斷當(dāng)前用戶是否簽到成功。
對(duì)于本系統(tǒng)而言,需要建立一個(gè)存放用戶數(shù)據(jù)的數(shù)據(jù)庫。在系統(tǒng)用于識(shí)別之前,采集需要進(jìn)行簽到的全體用戶信息。用戶信息主要包含三個(gè)部分的內(nèi)容,即身份信息、圖像信息和簽到信息,便于系統(tǒng)對(duì)這些數(shù)據(jù)進(jìn)行處理和調(diào)用。身份信息代表的是用戶的基本身份數(shù)據(jù),包括身份證號(hào)、性別、住址等;圖像信息則代表用戶的人臉圖像數(shù)據(jù),包括人臉樣本信息、人臉樣本圖像特征信息等;簽到信息代表用戶的簽到情況,包括簽到時(shí)間、簽到地點(diǎn)等。這些用戶信息結(jié)合在一起,形成一個(gè)完整的用戶實(shí)體。
本系統(tǒng)主要采用E-R模型法設(shè)計(jì)數(shù)據(jù)庫。以用戶為實(shí)體,其E-R圖大致如圖3所示。
圖 3 用戶 E—R 圖示意
針對(duì)不同的應(yīng)用環(huán)境,實(shí)體屬性可以進(jìn)行相應(yīng)的增刪。比如說,如果該系統(tǒng)應(yīng)用于校園中,以學(xué)生為用戶,則其屬性可以添加學(xué)號(hào)、導(dǎo)師姓名等,其主碼也可進(jìn)行靈活調(diào)整。
識(shí)別部分是系統(tǒng)的核心,是實(shí)現(xiàn)人臉檢測(cè)與識(shí)別的軟件部分。
對(duì)于系統(tǒng)的識(shí)別過程,描述如下:當(dāng)用戶進(jìn)入到攝像頭采集信息的范圍后,攝像頭會(huì)自動(dòng)拍攝圖像;對(duì)于獲得的圖像信息,首先進(jìn)行人臉檢測(cè),判斷圖像中是否存在人臉,若存在,系統(tǒng)才能繼續(xù)進(jìn)行下一步工作;當(dāng)檢測(cè)到人臉后,計(jì)算機(jī)自動(dòng)比對(duì)所得人臉與數(shù)據(jù)庫中的用戶圖像信息,當(dāng)該用戶存在于數(shù)據(jù)庫中時(shí),即可根據(jù)其相應(yīng)的身份信息得知用戶身份,從而實(shí)現(xiàn)簽到。
必須說明的是,人臉檢測(cè)與人臉識(shí)別存在一定的區(qū)別。人臉檢測(cè)指的是判斷當(dāng)前獲取的圖像中是否確實(shí)含有人臉部分,并將人臉圖像信息從背景中提取出來;人臉識(shí)別則需要比對(duì)已經(jīng)提取的人臉信息,與數(shù)據(jù)庫進(jìn)行比對(duì)分析,判斷該人臉代表的身份信息??梢哉f,人臉檢測(cè)是人臉識(shí)別過程的前提與基礎(chǔ),人臉識(shí)別過程則是人臉檢測(cè)的目標(biāo)與結(jié)果。
圖4 簽到過程流程圖
人臉識(shí)別技術(shù)發(fā)展至今,已經(jīng)產(chǎn)生了各種各樣的方法,如基于子空間分析的人臉識(shí)別、基于隱馬爾可夫模型的人臉識(shí)別、基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別等[4]。本系統(tǒng)主要采用的是基于模式識(shí)別的人臉識(shí)別技術(shù)。所謂模式。就是把通過對(duì)具體的個(gè)別事物進(jìn)行觀測(cè)所得到的具有時(shí)間和空間分布的信息[5]。簡(jiǎn)單來說,當(dāng)人類能夠一眼認(rèn)出一個(gè)蘋果,是因?yàn)樵谌粘I钪校覀兊乃季S被不斷訓(xùn)練,從而提煉出關(guān)于“蘋果”的樣本信息,如大小、形狀、顏色等。這一樣本就是蘋果的模式。當(dāng)再一次看到蘋果時(shí),人腦會(huì)自動(dòng)進(jìn)行模式匹配,最終得出當(dāng)前物體是否為蘋果的結(jié)論。這與“物以類聚”的說法有一定的相似之處。
在模式識(shí)別系統(tǒng)中,通過大量樣本訓(xùn)練,主要獲得人臉模式,將這些模式存儲(chǔ)在數(shù)據(jù)庫中,為本系統(tǒng)的人臉檢測(cè)與識(shí)別提供便利。
受到廣泛肯定的模式識(shí)別系統(tǒng)分為數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、特征提取和分類決策四個(gè)部分[4]。如圖5所示。
圖5 模式識(shí)別系統(tǒng)
獲取的數(shù)據(jù)要求是用計(jì)算機(jī)可以運(yùn)算的符號(hào)來表示所研究的對(duì)象。我們將一幅圖像進(jìn)行數(shù)字化后進(jìn)行存儲(chǔ)分析。圖像數(shù)字化的過程就是在計(jì)算機(jī)內(nèi)生成一個(gè)二維矩陣的過程。舉例如圖6所示。
圖6 圖像量化實(shí)例
本系統(tǒng)的數(shù)據(jù)主要是通過高清攝像頭采集的人臉圖像信息。注意這些人臉圖像僅僅用作獲取樣本數(shù)據(jù),可以不是最終數(shù)據(jù)庫中存儲(chǔ)的用戶。
圖像的預(yù)處理主要指圖像去噪的過程。在圖像信息中,各種阻礙信息獲取的因素稱之為噪聲。去噪的目的就是為了排除不相干信息的干擾,如衣領(lǐng)、背景、光線等,只留下與人臉信息相關(guān)的內(nèi)容,如人臉的長(zhǎng)寬比例、膚色等。
特征提取的過程就是對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征。簡(jiǎn)單的說,特征提取即在當(dāng)前獲得的數(shù)據(jù)中尋找對(duì)結(jié)果影響最大的有效信息。特征提取在模式識(shí)別過程中是關(guān)鍵的一步。特征的選取十分慎重,其數(shù)量并不是越多越好。
分類決策的過程就是在特征空間中用模式識(shí)別方法把識(shí)別對(duì)象進(jìn)行歸類?;镜淖龇ㄊ窃跇颖居?xùn)練集基礎(chǔ)上確定某個(gè)決策,使得按這種規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類所造成的誤差或損失最小。
簡(jiǎn)而言之,在本系統(tǒng)中,假設(shè)最終通過臉型對(duì)樣本進(jìn)行分類,就需要通過給定計(jì)算的方法,使得最終結(jié)果能將圓臉、鵝蛋臉、瓜子臉等臉型進(jìn)行有效分類。
本系統(tǒng)摒棄了傳統(tǒng)冗長(zhǎng)費(fèi)力的簽到方式,采用基于模式識(shí)別的人臉識(shí)別技術(shù),使得簽到過程不再成為用戶的負(fù)擔(dān)。隨著研究的深入,我們也意識(shí)到人臉識(shí)別技術(shù)存在一定的難題,比如人臉的姿態(tài)、光照、表情[3]等的變化都會(huì)對(duì)識(shí)別的準(zhǔn)確度造成影響。隨著技術(shù)的逐步完善,人臉識(shí)別技術(shù)還有很大的發(fā)展空間。相信在人臉識(shí)別技術(shù)的下一階段發(fā)展過程中,會(huì)誕生更多諸如簽到系統(tǒng)的實(shí)用性應(yīng)用,為人們的生活帶來更多便利。
* [1]徐曉艷.人臉識(shí)別技術(shù)綜述[J].電子測(cè)試,2015,(10):30—35+45.
* [2]賈川.淺談人臉識(shí)別技術(shù)應(yīng)用及發(fā)展趨勢(shì)[J].中國(guó)安防 ,2010,(03):83—86.
* [3]董琳,趙懷勛.人臉識(shí)別技術(shù)的研究現(xiàn)狀與展望[J].安防科技 ,2011,(10):22—26.
* [4]薛冰,郭曉松,蒲鵬程.人臉識(shí)別技術(shù)綜述[J].四川兵工學(xué)報(bào) ,2010,(07):119—121+130.
* [5]范會(huì)敏,王浩.模式識(shí)別方法概述[J].電子設(shè)計(jì)工程 ,2012,(19):48—51.