孟 輝 高德施 李 穎 譚鑫宇 付相天
(1 中國刑事警察學(xué)院聲像資料檢驗技術(shù)系 遼寧 沈陽 110035;2 青島市公安局嶗山分局 山東 青島 266000)
隨著信息技術(shù)的迅速發(fā)展及公安信息化建設(shè)進(jìn)程的不斷深入,人臉識別技術(shù)在犯罪嫌疑人的身份認(rèn)定、戶籍信息管理、追逃工作及重點(diǎn)場所布控等反恐安防領(lǐng)域發(fā)揮著越來越重要的作用[1]。人臉識別作為生物特征識別的一個分支,是模式識別和計算機(jī)視覺中一個非?;钴S的研究領(lǐng)域。相較于其他的生物識別方式,人臉識別具有識別方式友好、識別結(jié)果直觀、識別過程隱蔽等優(yōu)勢,這些特點(diǎn)的存在使得人臉識別技術(shù)在公安工作中的應(yīng)用具備了天然的優(yōu)勢。
人臉識別技術(shù)的實現(xiàn)可以通過3個技術(shù)流程,分別為人臉檢測、特征提取及人臉比對。
(1)人臉檢測:在輸入圖像中檢測人臉并定位出人臉的具體位置,通常用人臉的最小外接矩形表示人臉大小、位置。
(2)特征提?。簩Σ襟E(1)中定位出的各個人臉,通過空間變換、降維、機(jī)器學(xué)習(xí)等方法對其人臉特征進(jìn)行提取,并使用特征向量的形式表示人臉特征,即一張人臉圖像唯一的對應(yīng)一個特征向量,而該特征向量通過變換唯一的對應(yīng)原始的人臉圖像,通過該步驟可以建立人臉圖像和其特征向量的對應(yīng)關(guān)系。
(3)人臉比對:將待比對人臉的特征向量與庫內(nèi)人臉的特征向量進(jìn)行比對,可以利用向量的空間距離、向量的范數(shù)等作為衡量特征向量之間相似程度的度量,選擇向量相似程度最高的人臉圖像為人臉比對結(jié)果,進(jìn)而獲取待比對人臉的詳細(xì)身份信息。
相較于指紋識別、虹膜識別等傳統(tǒng)的生物識別技術(shù),人臉識別在公安應(yīng)用過程中的優(yōu)點(diǎn):
(1)比對操作具有隱蔽性:通過攝像頭獲取的人臉圖像可以在犯罪嫌疑人沒有察覺的情況下,在后臺服務(wù)器上運(yùn)行比對程序,進(jìn)而獲取其詳細(xì)身份信息,由于比對過程的隱蔽性,因此人臉識別技術(shù)特別適用于犯罪嫌疑人布控與抓逃過程。
(2)非接觸式的信息采集:人臉識別不同于指紋及虹膜識別,其采集過程可以通過攝像頭遠(yuǎn)程完成,即不需要被采集人與設(shè)備接觸即可采集相關(guān)信息,信息采集過程沒有侵犯性,更容易讓人接受。
(3)符合人臉識別習(xí)慣:人臉識別與人類本身識別人的識別過程類似,并且其識別結(jié)果可以通過人眼觀察即可驗證,因此人臉識別相較于指紋、虹膜識別等其他生物識別方法更符合人的生物習(xí)慣,且具有更強(qiáng)的交互性和可操作性。
(4)設(shè)備適應(yīng)性較強(qiáng):人臉識別系統(tǒng)建立之后,通過任意攝像頭拍攝的人臉圖像均可作為人臉識別系統(tǒng)的輸入,不需要專門的設(shè)備拍攝人臉,因此該技術(shù)設(shè)備適應(yīng)性較強(qiáng)。
目前,人臉識別技術(shù)在公安工作中的應(yīng)用領(lǐng)域大致可以分為以下幾個方面:
(1)重點(diǎn)場所安防:人臉識別設(shè)備可以作為安防卡口布設(shè)在需要重點(diǎn)安防的政府機(jī)關(guān)、大型集會等場所的出入口處,記錄進(jìn)出人員的身份信息,一經(jīng)發(fā)現(xiàn)異常人員,可以及時通知現(xiàn)場工作人員對其進(jìn)行合理處置,以此確保重點(diǎn)場所內(nèi)部安全。
(2)司法鑒定:通過科學(xué)合理的技術(shù)手段完成檢材人臉圖像與樣本人臉圖像及檢材人臉圖像與犯罪嫌疑人之間的相似程度計算,通過相似程度的計算結(jié)果完成犯罪嫌疑人的同一認(rèn)定,同時,相似程度的計算結(jié)果可以作為證據(jù)量化的參考結(jié)果,為司法審判過程提供更加精確的證據(jù)數(shù)據(jù)。
(3)布控排查:在人流密集、人員組成復(fù)雜的機(jī)場、車站、港口、地鐵站、大型集會及展會現(xiàn)場出入口布設(shè)人臉識別設(shè)備,可以通過人臉識別結(jié)果對進(jìn)出人員的身份進(jìn)行排查,迅速、準(zhǔn)確地在大量人流中過濾出犯罪嫌疑人員,極大地減少了公安基層偵查人員的工作量。
(4)戶籍管理:由于人臉特征具備唯一性,因此,可以通過戶籍系統(tǒng)中的人臉圖像比對排查甄別多重戶口現(xiàn)場,準(zhǔn)確獲取雙重、多重戶口的人員信息,進(jìn)而對其多余信息進(jìn)行注銷,避免其利用戶口信息實施犯罪。
(5)特殊人群身份確認(rèn):可以通過人臉識別技術(shù)對無名尸體、聾啞人、低齡兒童等特殊人群進(jìn)行身份確認(rèn),為公安基層工作人員提供便利,最大限度地發(fā)揮人臉識別技術(shù)在公安工作中的應(yīng)用。
除了實戰(zhàn)應(yīng)用較多之外,公安人臉識別研究還在人像檢驗中的人臉特征分類和人臉表情識別等領(lǐng)域有著較為廣闊的研究及應(yīng)用前景[2-3]。
目前,主流的人臉識別方法可以大致分為基于幾何特征匹配的方法、基于特征臉的方法、基于束圖匹配的方法、基于神經(jīng)網(wǎng)絡(luò)的方法、基于支持向量機(jī)的方法和基于隱馬爾科夫模型(HMM)的方法?;趲缀翁卣髌ヅ涞姆椒ㄍㄟ^提取人臉圖像中的幾何特征進(jìn)行人臉識別[4],由于其計算量大、識別準(zhǔn)確率低等缺點(diǎn),并沒有大規(guī)模應(yīng)用。特征臉方法利用主成分分析將人臉圖像映射到低維空間實現(xiàn)降維的目的。文獻(xiàn)[5]中,提高算法準(zhǔn)確率的同時降低了運(yùn)算復(fù)雜度,但是該方法對人臉圖像光照和角度變化的魯棒性較差,基于特征臉的人臉識別方法在ORL數(shù)據(jù)庫上獲得了90.5%的準(zhǔn)確率。近年來,基于隱馬爾科夫模型的方法成為人臉識別領(lǐng)域的研究熱點(diǎn)。文獻(xiàn)[6]中,Samaria等人提出使用人臉圖像灰度信息作為特征向量的HMM人臉識別方法,該方法在ORL數(shù)據(jù)庫上的識別準(zhǔn)確率達(dá)到87%。文獻(xiàn)[7][8]分別以DCT系數(shù)和小波變換系數(shù)作為特征向量,使用HMM建立人臉模型的方法都取得了較高的人臉識別準(zhǔn)確率。
本文在基于隱馬爾科夫模型的人臉識別方法基礎(chǔ)上,對人臉圖像采用了中值濾波器進(jìn)行預(yù)處理,以消除人臉圖像拍攝過程中閃光燈、環(huán)境光等對造成人臉圖像中某些高光亮斑對人臉識別結(jié)果的影響,一定程度上提升了人臉識別準(zhǔn)確率。
隱馬爾科夫模型是用來描述一個含有隱含未知參數(shù),即狀態(tài)的馬爾科夫過程。其難點(diǎn)是從已觀察的數(shù)據(jù)中確定該過程的隱含參數(shù),然后利用這些參數(shù)來作進(jìn)一步的分析與挖掘。對于如圖1所示的一張垂直方向正面人臉圖像來講,可以把其上的每一個像素點(diǎn)的像素值作為隱馬爾科夫模型中已獲取的觀察值,而把其垂直方向上的面部器官排列,即額頭、眼睛、鼻子、嘴巴和下巴作為其隱含狀態(tài),其狀態(tài)轉(zhuǎn)移圖如圖2所示。對于任意一張人臉圖像而言,其像素值是可觀測狀態(tài),即觀察值,而其隱含狀態(tài)是不能根據(jù)像素值觀察得到的,因此需要一個隨機(jī)過程去描述隱含的狀態(tài),即“隱馬爾科夫模型”。
圖1 正面人臉示意圖
圖2 人臉馬爾科夫狀態(tài)轉(zhuǎn)移示意圖
基于隱馬爾科夫模型的人臉識別實際上就是通過人臉圖像的像素值,即觀察值估計其隱含狀態(tài)的參數(shù),其隱含狀態(tài)的參數(shù)就是基于隱馬爾科夫的人臉模型,通過觀察值估算其隱含參數(shù)的過程就是建立人臉模型的過程。
隱馬爾科夫模型隱含狀態(tài)的參數(shù)可以用5種參數(shù)進(jìn)行描述:
(1)N:隱馬爾科夫模型中的狀態(tài)數(shù)。
在隱馬爾科夫模型中,可以用π,A表述一個隨機(jī)過程,其輸出為狀態(tài)序列,用B表述另一個隨機(jī)過程,即狀態(tài)序列到觀察序列的隨機(jī)過程,序列長度可以用字母T表示。隱馬爾科夫模型的組成如圖3所示。
要想使用隱馬爾科夫模型解決人臉識別的問題,需要解決的是對于一個給定的觀察值序列即給定的一張人臉圖像,如何調(diào)整隱馬爾科夫模型參數(shù)從而使最大。
為了在參數(shù)估計問題中得到更準(zhǔn)確的結(jié)果,本文采用Baum-Welch算法估計參數(shù)。Baum-Welch算法引入輔助變量,并通過迭代的思想對模型參數(shù)進(jìn)行更新,從而求取的局部最大值,最終實現(xiàn)模型參數(shù)估計的目的。Baum-Welch算法的使用過程中,需要定義兩個輔助變量
圖3 隱馬爾科夫模型的組成
使用前向向量α
和后向向量β
可以得到:
Baum-Welch算法的計算流程為:
在人臉識別過程中,只需要找到與待識別人臉圖像的隱馬爾科夫模型參數(shù)相似度最高的人臉模型,以及可判斷出該人臉屬于哪一個樣本人。在識別過程中,給定模型參數(shù)和觀察序列后,估算觀察序列對應(yīng)的最優(yōu)狀態(tài)序列。可以使用Viterbi算法解決最優(yōu)狀態(tài)序列:對于給定的HMM模型和觀察序列O=O1O2…,OT,如何確定一個最優(yōu)的狀態(tài)序列狀態(tài)序列估計問題中,最優(yōu)的狀態(tài)序列為能使概率最大的狀態(tài)序列。
本文采用Viterbi算法解決最優(yōu)狀態(tài)序列的問題。Viterbi算法原理是將定義為時刻t沿一條路徑的概率的最大值:
(2) 進(jìn)行遞歸運(yùn)算:
(3) 結(jié)束:
(4) 求取最優(yōu)狀態(tài)序列:
Viterbi算法也是一種格型結(jié)構(gòu),在進(jìn)行運(yùn)算的過程中得到的作為副產(chǎn)品可以作為前向后向算法的結(jié)果。
在基于圖像的人臉識別過程中,人臉圖像的成像效果會隨現(xiàn)場環(huán)境光線的強(qiáng)弱、環(huán)境光線的角度、鏡頭角度及人臉角度等因素的變化而變化,這種變化會造成人臉各器官之間的相對位置及像素值大小發(fā)生改變,從而對基于隱馬爾科夫模型的人臉識別結(jié)果造成影響。在不同人臉角度條件下拍攝的人臉圖像如圖4所示。
圖4 不同人臉角度下的人臉圖像
為了降低由于拍攝條件變化導(dǎo)致的隱馬爾科夫模型參數(shù)變化,也為了消除人臉隱狀態(tài)(即五官)內(nèi)部像素的像素值突變造成的狀態(tài)轉(zhuǎn)移參數(shù)變化,本文在建立人臉圖像的隱馬爾科夫模型之前,引入了人臉圖像預(yù)處理操作。即利用中值濾波器對人臉圖像進(jìn)行預(yù)處理之后,將預(yù)處理結(jié)果作為觀察值估算隱馬爾科夫模型參數(shù)。在采用3×3大小的中值濾波器之后,圖4人臉圖像變?yōu)槿鐖D5所示效果。
從圖5中可以看到,人臉隱狀態(tài)內(nèi)部像素的像素值趨于一致,同時人臉角度變化,在人臉圖像中造成的陰影和五官變形也在一定程度被均值濾波器抵消了。因此,在隱馬爾科夫模型建立之前,對人臉圖像的均值濾波處理能夠提升人臉模型的精度。
在人臉圖像預(yù)處理后,還需要獲取人臉圖像的觀察值序列,才能夠?qū)崿F(xiàn)隱馬爾科夫模型參數(shù)的估算。為了能夠在降低觀察值序列維數(shù)的同時獲取更高的識別精度,本文采取奇異值分解的方法獲取觀察值序列。使用寬度為W像素,高度為L像素的滑動窗自上而下遍歷整個人臉圖像,相鄰兩個滑動窗之間重疊高度為P像素,如圖6所示。對每個滑動窗區(qū)域的圖像進(jìn)行奇異值分解,分解后得到3個矩陣(U,Σ,V),取Σ11、Σ22、U11作為該滑動窗區(qū)域圖像的觀察值,所有滑動窗經(jīng)過的圖像部分的觀察值,即組成該幅人臉圖像的觀察值蓄序列。
圖6 滑動窗示意圖
上述計算過程完成后,即可進(jìn)行人臉隱馬爾科夫模型的建立。所謂建模,就是通過數(shù)據(jù)庫中的人臉圖像獲取該人臉的隱馬爾科夫模型參數(shù)的過程。本文采用ORL人臉數(shù)據(jù)庫驗證改進(jìn)方法的有效性,該數(shù)據(jù)庫中共包含對40個樣本采集到的400張人臉圖像,每個樣本采集10張不同角度、表情的人臉圖像。隨機(jī)選取每個樣本10張圖像中的5張作為訓(xùn)練集,訓(xùn)練過程如下:
(1)對濾波后圖像進(jìn)行滑動窗分割,并計算每個窗口的觀察值。
(2)初始化隱馬爾科夫模型參數(shù)。
(3)用Baum-Welch算法迭代計算最優(yōu)的隱馬爾科夫模型參數(shù),即獲取人臉隱馬爾科夫模型。
人臉識別過程:隱馬爾科夫模型的識別過程,即為通過輸入人臉圖像計算其屬于每個人臉隱馬爾科夫模型的概率,概率最大的隱馬爾科夫模型即為識別結(jié)果:
(1)對濾波后圖像進(jìn)行滑動窗分割,并計算每個窗口的觀察值。
(2)用(1)中獲取的觀察值用Viterbi算法計算與每一個隱馬爾科夫模型的匹配程度。
(3)選取概率最大的隱馬爾科夫模型作為識別結(jié)果。
選取除訓(xùn)練數(shù)據(jù)外的人臉圖像作為測試集測試算法有效性,實驗顯示,本文提出的方法人臉識別率能夠達(dá)到95.7%,而未經(jīng)過圖像預(yù)處理的馬爾科夫模型方法識別準(zhǔn)確率僅為88%。
本文基于隱馬爾科夫模型建立人臉統(tǒng)計模型,并就模型訓(xùn)練、識別過程中的人臉狀態(tài)劃分、人臉圖像預(yù)處理、觀察向量計算方式等過程進(jìn)行研究,并提出了基于中值濾波器的人臉圖像預(yù)處理方法。在ORL數(shù)據(jù)庫上的實驗結(jié)果也驗證了該圖像預(yù)處理方法的有效性,能夠滿足當(dāng)前公安工作需求。