陳史政
(福建廣播電視大學(xué)漳州分校,福建 漳州 363000)
不論在什么考試中,身份認(rèn)證都是一件非常關(guān)鍵的事情,這直接關(guān)系到考試本身是否公平、有效.目前最常見的考生身份認(rèn)證方法是使用證件進(jìn)行驗(yàn)證,這種方法在實(shí)際應(yīng)用中較容易被替考者蒙蔽,特別是當(dāng)監(jiān)考人員不認(rèn)識(shí)考生時(shí),如果證件照片被篡改,則發(fā)現(xiàn)替考的難度就會(huì)增大.通過(guò)構(gòu)造網(wǎng)絡(luò)型考試身份驗(yàn)證與監(jiān)督體系,將考生信息放在數(shù)據(jù)庫(kù)上,在考生入場(chǎng)身份驗(yàn)證時(shí)記錄考生人臉圖像信息并與數(shù)據(jù)庫(kù)中考生圖像進(jìn)行比對(duì),可以更好地防范這類身份驗(yàn)證問(wèn)題的發(fā)生,并保有考后對(duì)替考者責(zé)任的追究能力,對(duì)有替考舞弊傾向的考生產(chǎn)生較強(qiáng)的心理威懾作用.現(xiàn)在有一些考試已經(jīng)開始記錄考生人臉圖像信息,如全國(guó)計(jì)算機(jī)應(yīng)用能力考試、會(huì)計(jì)從業(yè)資格考試等,不過(guò)在這些考試的身份驗(yàn)證過(guò)程中考生圖像信息僅被手動(dòng)拍攝并提交到服務(wù)器,缺少進(jìn)一步的處理.這時(shí)就可以在考試身份驗(yàn)證中引入人臉識(shí)別技術(shù),以求更快、更好地完成身份驗(yàn)證的過(guò)程.
人臉識(shí)別技術(shù),就是以信息技術(shù)為基礎(chǔ),利用計(jì)算機(jī)自動(dòng)對(duì)人的臉部圖像進(jìn)行數(shù)據(jù)處理與分析,并以此來(lái)實(shí)現(xiàn)人的身份識(shí)別的方法.由于在現(xiàn)實(shí)生活中身份識(shí)別應(yīng)用的普遍性,人臉識(shí)別技術(shù)的研究具有很重要的意義,在許多領(lǐng)域都擁有顯而易見的應(yīng)用價(jià)值,是計(jì)算機(jī)科學(xué)技術(shù)研究中的一個(gè)熱點(diǎn).但是現(xiàn)在人臉識(shí)別技術(shù)還存在許多尚未解決的難點(diǎn),也還沒(méi)有通用的實(shí)現(xiàn)方法,不過(guò)經(jīng)過(guò)這些年的發(fā)展,已經(jīng)出現(xiàn)了一些應(yīng)用實(shí)例.本文將采用一種基于改良LBP算法的人臉識(shí)別技術(shù),對(duì)其在考試身份驗(yàn)證系統(tǒng)中的應(yīng)用進(jìn)行研究.
人臉識(shí)別技術(shù)要應(yīng)用在考試身份驗(yàn)證中至少需要幾個(gè)必備的基礎(chǔ)條件,那就是網(wǎng)絡(luò)、服務(wù)器與數(shù)據(jù)庫(kù)、監(jiān)考客戶端、攝像頭,其整體結(jié)構(gòu)如圖1所示.隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展、計(jì)算機(jī)設(shè)備成本的不斷下降、小型攝像器材的大面積普及,如果僅從硬件方面考慮,在許多考試機(jī)構(gòu)已經(jīng)可以輕松實(shí)現(xiàn)圖1所示的系統(tǒng)平臺(tái).所以能否應(yīng)用人臉識(shí)別技術(shù)來(lái)更快、更好地完成身份驗(yàn)證的關(guān)鍵在于如何求取一個(gè)切實(shí)可行的人臉識(shí)別算法上.
圖1 系統(tǒng)結(jié)構(gòu)圖
由于現(xiàn)實(shí)操作過(guò)程中無(wú)法要求每位考生在報(bào)考時(shí)提供多幅像片,通常情況下服務(wù)器里的考生數(shù)據(jù)庫(kù)僅存有相應(yīng)考生的一幅圖像,即樣本集里每個(gè)人都只有一個(gè)樣本,這樣問(wèn)題的核心就轉(zhuǎn)化為如何較好地解決單樣本人臉識(shí)別.相比一般情況,由于考場(chǎng)拍攝環(huán)境較為固定、可以安排純色背景、拍攝時(shí)都是正面,所以處理的基本上都是簡(jiǎn)單背景正面人臉圖像.其傾斜角度較小,而且受到光照干擾的影響幅度也相對(duì)較小,有利于人臉識(shí)別.目前的人臉識(shí)別算法通常需要一定數(shù)量的訓(xùn)練樣本才能取得良好識(shí)別效果,單樣本人臉識(shí)別算法的識(shí)別率還比較低,所以應(yīng)用在考試身份驗(yàn)證時(shí)無(wú)法達(dá)到全自動(dòng)完成的程度,需要監(jiān)考人員的介入操作才能較好完成.
圖2 考試身份驗(yàn)證流程圖
從監(jiān)考客戶端采集考生圖像數(shù)據(jù)需要在考生入場(chǎng)時(shí)間段進(jìn)行.通過(guò)調(diào)研發(fā)現(xiàn),考生主體入場(chǎng)時(shí)間會(huì)比較集中,通常小于10分鐘,如果每個(gè)考生采集圖像時(shí)都需要由監(jiān)考人員搜索對(duì)應(yīng)考生信息再拍攝保存,在時(shí)間上會(huì)比較緊張,同時(shí)對(duì)監(jiān)考人員操作能力要求較高.此時(shí)可以改為先采集人臉圖像,由系統(tǒng)在未入場(chǎng)考生信息中進(jìn)行人臉識(shí)別比對(duì)后,給出最匹配項(xiàng)和兩個(gè)次佳備用學(xué)生項(xiàng)供監(jiān)考人員點(diǎn)選錄入.增加的兩個(gè)后備項(xiàng)可以在首選識(shí)別失敗時(shí)保持較快的圖像采集速度.最后,上傳數(shù)據(jù)并對(duì)數(shù)據(jù)庫(kù)圖像與現(xiàn)場(chǎng)圖像相似度異常的考生進(jìn)行標(biāo)記示警.
通過(guò)以上的分析發(fā)現(xiàn)現(xiàn)階段人臉識(shí)別技術(shù)實(shí)際應(yīng)用于考試身份驗(yàn)證中,除了可以盡可能提高正確識(shí)別率外,主要還應(yīng)考慮實(shí)現(xiàn)以下兩個(gè)方面的功能,一是降低圖像采集操作復(fù)雜度,搜索匹配考生輔助完成身份驗(yàn)證;二是對(duì)相似度異常的考生進(jìn)行標(biāo)記示警,供監(jiān)考人員與巡查監(jiān)督人員核查.在本文中選用LBP算法,主要原因有兩個(gè):一個(gè)是LBP算法能夠保證在單樣本人臉識(shí)別上達(dá)到一定的應(yīng)用效果;另一方面則是相對(duì)其它算法來(lái)說(shuō),LBP算法的實(shí)現(xiàn)簡(jiǎn)單、速度較快,符合現(xiàn)場(chǎng)實(shí)時(shí)操作的時(shí)間要求.
在人臉識(shí)別時(shí)為了減少運(yùn)算量,需要將其轉(zhuǎn)為灰度圖像,這一過(guò)程會(huì)使不少圖像信息丟失,所以在轉(zhuǎn)化過(guò)程中需要盡量讓灰度圖像攜帶較多的有效特征信息.同時(shí)為了減少光照變化所再來(lái)的影響,提高識(shí)別率,這里采用幾種方法相結(jié)合的方式對(duì)灰度圖像進(jìn)行預(yù)處理:
(1)對(duì)數(shù)變換,這個(gè)變換對(duì)每個(gè)象素的灰度值進(jìn)行重新計(jì)算,擴(kuò)展低值灰度、壓縮高值灰度,處理后可以使得圖像中的灰度取值更均勻,細(xì)節(jié)更清晰.公式如下:
其中f(x,y)是相應(yīng)點(diǎn)的灰度值,根據(jù)圖像變換需要,設(shè)置參數(shù) a=0、b=1、c=e.
(2)使用二維高斯濾波實(shí)現(xiàn)圖像平滑,減少因?yàn)閳D像噪聲對(duì)人臉識(shí)別所帶來(lái)的干擾.
(3)直方圖均衡化.由于設(shè)備或環(huán)境影響,在圖像采集時(shí),可能會(huì)出現(xiàn)一些區(qū)域?qū)Ρ榷炔蛔?,這時(shí)會(huì)隱藏原圖像中的有用特征信息.這種情況可以通過(guò)直方圖均衡化方法使圖像的灰度分布范圍變大,增大反差、增強(qiáng)圖像的對(duì)比度.
目前在人臉識(shí)別領(lǐng)域已經(jīng)有許多研究成果表明LBP算子可以較好地應(yīng)用于這一領(lǐng)域.原始的LBP算子是對(duì)圖像中的某個(gè)像素,取其灰度值按順序與其周圍8個(gè)像素的灰度比較大小,用1和0表示大于或小于,得到一個(gè)8位二進(jìn)制數(shù),轉(zhuǎn)換成10進(jìn)制得到LBP編碼,圖3為求取過(guò)程示例.
圖3 LBP編碼求取
這樣的LBP編碼會(huì)有256種取值,對(duì)圖中每個(gè)像素都進(jìn)行計(jì)算后,求256種取值的統(tǒng)計(jì)直方圖即可描述其紋理特征.
在LBP算子中判斷當(dāng)前像素灰度與其周圍8個(gè)像素灰度的大小時(shí),并沒(méi)有考慮其中灰度差的大小,但是這個(gè)對(duì)比度的大小本身也是很有用的紋理特征.對(duì)于單樣本人臉識(shí)別,由于識(shí)別準(zhǔn)確度較低,所以可以考慮進(jìn)一步利用這些被原本被丟棄的圖像信息.在進(jìn)行灰度比較時(shí),先設(shè)置一個(gè)閾值W,大于W為明顯變化,小于W為輕微變化,其中閾值W可以設(shè)為灰度差平均值.
由于灰度差有變大或變小兩種可能,所以每個(gè)點(diǎn)可以通過(guò)閾值得到四種LBP編碼.
將四個(gè)LBP編碼連結(jié)得到特征編碼.
為了取得更好的識(shí)別效果,可以先采用均分區(qū)域的方式將目標(biāo)圖像均分成N*N塊,分別對(duì)四種LBP編碼求取編碼統(tǒng)計(jì)直方圖,然后連接直方圖得到分塊特征直方圖,再連結(jié)分塊特征直方圖獲得圖像特征直方圖.這個(gè)特征直方圖的維度很高,需要降維,可以將出現(xiàn)較少的編碼種類統(tǒng)一歸到一類,實(shí)現(xiàn)降維.最后判別目標(biāo)與樣本間對(duì)應(yīng)關(guān)系,計(jì)算兩個(gè)圖像的加權(quán)距離,公式如下:
其中ωi為子圖區(qū)塊加權(quán)系數(shù)采用人工指定方式,人臉中的眉毛、眼睛、嘴巴等區(qū)域設(shè)置的加權(quán)系數(shù)較高,θj為灰度變化等級(jí).目標(biāo)圖像對(duì)所有樣本計(jì)算出L并從小到大排列,取第1個(gè)樣本為匹配項(xiàng),第2、3個(gè)為備選項(xiàng).如果配對(duì)確定后所取的L值大于警示閾值,則進(jìn)行標(biāo)記示警.
實(shí)驗(yàn)所用的數(shù)據(jù)庫(kù)有兩個(gè),一個(gè)是ORL人臉數(shù)據(jù)庫(kù),另一個(gè)是考生數(shù)據(jù)庫(kù).實(shí)驗(yàn)分別對(duì)這兩個(gè)數(shù)據(jù)庫(kù)采用上述的人臉識(shí)別算法進(jìn)行測(cè)試識(shí)別與近似識(shí)別.近似識(shí)別是針對(duì)目前無(wú)法實(shí)現(xiàn)人臉識(shí)別100%正確率,必須進(jìn)行人工干預(yù)的現(xiàn)狀下,只要能讓對(duì)應(yīng)圖像出現(xiàn)在前三個(gè)候選項(xiàng)里,實(shí)現(xiàn)近似識(shí)別也能在很大程度上改善考試身份驗(yàn)證過(guò)程.
取ORL人臉數(shù)據(jù)庫(kù)中每個(gè)人的一張正常表情圖像作為樣本庫(kù),抽取40人,余下圖像用于測(cè)試.測(cè)試結(jié)果如表1所示:
表1 在ORL數(shù)據(jù)庫(kù)上的識(shí)別率(N=7)
考生數(shù)據(jù)庫(kù)為實(shí)際在用的考試系統(tǒng)中考生報(bào)考圖像及入場(chǎng)時(shí)拍攝的現(xiàn)場(chǎng)圖像,共有3926幅.從中隨機(jī)抽取30人的報(bào)考圖像作為未入場(chǎng)考生樣本集,以這30人入場(chǎng)圖像為測(cè)試集,替換3人入場(chǎng)圖像模擬替考,并按隨機(jī)順序進(jìn)行仿真人臉識(shí)別.由于考生入場(chǎng)信息由監(jiān)考人員審查確定,如果識(shí)別錯(cuò)誤會(huì)被手工修改為對(duì)應(yīng)項(xiàng),所以樣本集的未入場(chǎng)考生樣本數(shù)量隨考生入場(chǎng)一直遞減,識(shí)別難度逐步降低.經(jīng)過(guò)大量模擬實(shí)驗(yàn),取得首張識(shí)別率S、首張近似識(shí)別率S'、平均識(shí)別率T、平均近似識(shí)別率T'、標(biāo)識(shí)區(qū)替考覆蓋率Q如表2所示:
表2 在考試數(shù)據(jù)庫(kù)上的識(shí)別率對(duì)比(N=7)
通過(guò)實(shí)驗(yàn)表明,采用這一人臉識(shí)別算法可以較好地降低考生入場(chǎng)時(shí)進(jìn)行圖像采集的難度,并能夠較好地通過(guò)相似性閾值將異??忌鷺?biāo)記出來(lái),這樣監(jiān)考與巡查人員可以通過(guò)對(duì)小范圍標(biāo)記考生的重點(diǎn)核查,加大發(fā)現(xiàn)替考的可能性.
人臉識(shí)別技術(shù)發(fā)展很快,但是單樣本人臉識(shí)別的準(zhǔn)確率相對(duì)較低,因此在考試身份驗(yàn)證中還做不到完全自動(dòng)化.本文提出一種基于LBP的人臉識(shí)別算法,其在考試身份驗(yàn)證中能夠協(xié)助完成圖像采集、縮小替考排查范圍,增加查出替考舞弊的可能性,在考試身份驗(yàn)證工作中能夠起到很好的輔助作用.
〔1〕張翠平,蘇光大.人臉識(shí)別技術(shù)綜述[J].中國(guó)圖象圖形學(xué)報(bào),2000(11):885-888.
〔2〕AhonenT,HadidA,PietikainenM.Face recognition w ith local binarypatterns[C].In:Proceedings of Eighth European Conf Computer Vision,2004:469-481.
〔3〕陶亮,莊鎮(zhèn)泉.一種基于個(gè)人身份認(rèn)證的正面人臉識(shí)別算法[J].中國(guó)圖象圖形學(xué)報(bào),2003(8):860-865.
〔4〕張建明,劉霄,樊莉靜.基于三層虛擬圖像生成的單樣本人臉識(shí)別[J].計(jì)算機(jī)工程,2010(9):187-189.
〔5〕OjalaT,PietikainenM,MaenpaaT.Multiresolutiongrayscaleand rotation invariant texture classification w ith local binary patterns[J].IEEE Trans Pattern Anal M ach Intell,2002,24(7):971-986.
〔6〕焦峰,山世光,崔國(guó)勤,高文,李錦濤.基于局部特征分析的人臉識(shí)別方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003(1):53-58.