(蕪湖職業(yè)技術(shù)學(xué)院,安徽 蕪湖 241000)
隨著信息技術(shù)的發(fā)展,為了減少銀行前臺工作人員的工作量,現(xiàn)大量的存取現(xiàn)金的操作都在ATM 機上操作。目前全國有大量的ATM機在使用。ATM機無人值守的現(xiàn)象給不法分子提供了可乘之機,很多起蓄意破壞ATM機的,或在ATM 機上安裝讀卡器盜刷信用卡的案件層出不窮?,F(xiàn)ATM機上都安裝攝像頭,自動監(jiān)控接近ATM機人員的行為,以預(yù)防和減少犯罪。如發(fā)生不法行為,通過攝像頭捕捉人臉特征,利用人臉識別技術(shù),進行人臉識別和人臉認證,以幫助發(fā)現(xiàn)可疑人物。 然而ATM機視頻的人臉識別受光照、姿態(tài)變化、攝像頭低分辨率的影響,造成很大的計算負擔和系統(tǒng)損耗[1]。這就使得人臉識別技術(shù)本身也面對著一定難題[2]。
人臉識別技術(shù)是利用人臉的特征信息,根據(jù)已知的人臉數(shù)據(jù)庫,對輸入的人臉信息進行識別、驗證。基于視頻的人臉識別不同于基于靜態(tài)圖像的人臉識別技術(shù),它利用視頻中的動態(tài)信息進行識別。目前基于視頻的人臉識別方法主要有:基于特征信息的人臉識別方法、基于統(tǒng)計模型的人臉識別方法和基于混合線索的人臉識別方法?;谝曨l的人臉識別技術(shù)難點主要是:
(1) 光照影響
人臉識別受光線影響,特別是從視頻中提取動態(tài)信息更受光照影響[3]。針對這一問題,很多學(xué)者都提出自己的觀點。有學(xué)者提出才有主成分分析方法進行識別,丟棄由光線對人臉識別的干擾。有學(xué)者提出局部二元模式,并將其改進,克服光照變化。
(2) 姿態(tài)變化的影響
人臉識別復(fù)雜性因素之一是姿態(tài)變化,由于該技術(shù)比較固定,基于視頻的人臉識別技術(shù)獲取的是視頻中的動態(tài)信息,在視頻中人臉不斷在變化,姿態(tài)不斷改變,導(dǎo)致人臉信息的不確定性[4]。有文獻介紹基于多視角的人臉識別系統(tǒng),采用驗證曲面捕捉視頻動態(tài)信息;有文獻提出了改進的AAM(主動外觀模型),處理視頻中的姿態(tài)和表情變化。此外,視頻中動態(tài)的人臉信息與現(xiàn)有的人臉數(shù)據(jù)庫會存在差異,也導(dǎo)致匹配的不一致性。
(3) 低分辨率的影響
ATM的視頻像素分辨率較低,視頻質(zhì)量不高,影響人臉識別。解決這一現(xiàn)象的方法目前常用的有:超分辨方法SR和多分辨率臉方法MRF。SR方法能通過低分辨率的圖像估計出高分辨的圖像。MRF方法具有計算復(fù)雜和存儲空間高的要求。
由于ATM 機視頻中待識別者姿態(tài)變化比較大,現(xiàn)采用快速稀疏描述方法實現(xiàn)多圖像匹配得分層融合的方案。首先利用Viola 提出的運用人臉Haar-like[5]特征并基于AdaBoost[6]訓(xùn)練的級聯(lián)人臉檢測方法完成人臉檢測的基礎(chǔ)上,我們把檢測出的圖像即待識別的人臉圖像歸一化為與訓(xùn)練樣本同尺寸(70*100)的灰度圖像。然后利用快速稀疏描述方法處理從視頻中隔幀提取圖像,最后利用融合算法將同一用戶的多張圖像處理結(jié)果融合的方法,實現(xiàn)基于視頻的人臉識別。
采用的技術(shù)方案如圖1所示。
圖1 技術(shù)方案流程圖
為了減少視頻圖像中動態(tài)不穩(wěn)定性,采用廣泛認可的AdaBoost 算法,提取圖像中穩(wěn)定特征。采用快速稀疏描述方法,將對單張圖像進行人臉識別[7]。最后實現(xiàn)對同一用戶的不同人臉圖像的識別結(jié)果進行匹配分層融合。具體步驟如下所述:
遞歸計算s(x,y)=s(x,y-I),ii(x,y)=ii(x-I,y),其中s(x,-I)=0,ii(-I,y)=0。
每個分類器都只使用一種特征進行訓(xùn)練。那么對于該特征的誤
差ei可以這么衡量:ei=∑iwi|hj(xi)-yi|(j表示的是某個特征的索引,而i表示的是所有的所有的窗口) 。選擇擁有最低誤差的那個分類器記為ht。
Step4:采用快速稀疏描述方法實現(xiàn)人臉檢測。快速稀疏算法的核心思想是將整體樣本通過K近鄰確定訓(xùn)練樣本數(shù)量;線性組合K近鄰確定的訓(xùn)練樣本進而分類測試。假設(shè)xip表示第i個用戶的第p幀圖,apk表示訓(xùn)練樣本yk在描述測試樣本xip的線性組合中的相應(yīng)系數(shù)。假設(shè)第i個用戶的p個測試樣本的所有訓(xùn)練樣本的線性組合分別為:
(1)
(2)
為了更好地測試基于視頻的人臉識別算法的性能,本實驗采用兩個圖像庫一個靜態(tài)人臉圖像庫,另一個是視頻人臉數(shù)據(jù)庫即動態(tài)人臉庫。靜態(tài)人臉圖像庫從ATM監(jiān)控視頻中得到。從視頻中檢測出人臉后,將其歸一化為同樣的尺寸。人臉視頻庫是從真實視頻中截取的若干視頻片斷的集合,模擬實際環(huán)境。圖2是靜態(tài)圖像庫的部分截圖。
圖2 靜態(tài)圖像庫樣例
(1)靜態(tài)圖像庫測試。為測試技術(shù)方案中人臉識別算法的性能,使用靜態(tài)圖像庫進行單張測試。統(tǒng)計識別結(jié)果,獲取識別出的圖像數(shù)量,統(tǒng)計出識別的正確率和錯誤率。分析技術(shù)方案中人臉識別算法的識別率。
測試庫和訓(xùn)練庫的構(gòu)造。選取不同年齡、不同性別和不同光照情況,不同的姿態(tài)、表情和動作等圖片作為實驗對象。從靜態(tài)圖像庫中抽取圖像數(shù)量大于或等于10 的人作為實驗對象。從每個待識別對象的全部圖像中隨機抽取了20~30 張人臉圖像作為訓(xùn)練樣本,又從剩下的圖像中任取4張作為測試樣本。
測試結(jié)果統(tǒng)計。測試結(jié)果統(tǒng)計如表1所示。
表1 測試結(jié)果統(tǒng)計
其中:
通過對實驗結(jié)果分析,技術(shù)方案的人臉識別算法具有不錯的識別率。不同的樣本識別率不同。
(2)視頻庫仿真實驗
通過模擬應(yīng)用環(huán)境,測試技術(shù)方案的綜合性能。從ATM視頻中選取多張圖像,構(gòu)造圖像序列模擬視頻,進行識別以及結(jié)果融合等處理。最后通過統(tǒng)計實驗結(jié)果分析技術(shù)方案的性能。
測試庫和訓(xùn)練庫的構(gòu)造。從視頻庫中截取部分視頻,提取相鄰幀的圖像,經(jīng)過處理,選取20~60個待識別對象的圖像數(shù)量,把待識別對象一半的圖像作為測試樣本,后一半的圖像作為訓(xùn)練樣本,再從每個待識別對象的測試樣本中選擇6 張不同的圖像進行測試。
測試結(jié)果統(tǒng)計。測試結(jié)果統(tǒng)計如表2所示。
表2 測試結(jié)果統(tǒng)計
其中:
在實驗過程中,實驗過程閾值定為0.75,如果最優(yōu)的人得分大于等于0.75,被認為錯誤識別,表示當前測試圖像中沒有該人,反之,如果最優(yōu)的人得分小于0.75,被認為正確識別,表示當前測試圖像為該人,提高了識別率。
人臉識別是ATM機上監(jiān)控系統(tǒng)的關(guān)鍵技術(shù),采用人臉識別算法,將快速稀疏描述方法和人臉檢測算法AdaBoost 算法結(jié)合,在一定程度上解決了人臉識別過程中受光照影響、姿態(tài)變化影響和ATM機上攝像頭低分辨率的影響等問題。結(jié)果表明文中采用的技術(shù)方案人臉識別算法具有不錯的識別率。