束 鑫 唐 慧 楊習貝 宋曉寧 吳小俊
1(江蘇科技大學計算機學院 江蘇鎮(zhèn)江 212003)2(江南大學物聯(lián)網(wǎng)工程學院 江蘇無錫 214122)
目前人臉識別技術(shù)在生活中的應(yīng)用十分廣泛,大到機場車站的安檢系統(tǒng),小到隨處可見的移動終端上的身份驗證功能.人臉識別技術(shù)不僅大大提高了身份信息驗證的效率,還給用戶帶來快捷方便的生活體驗.但是,當有人偽造客戶人臉并試圖通過人臉識別系統(tǒng)的驗證時就會出現(xiàn)欺詐攻擊.目前,大部分基于臉部識別的反欺詐操作都需要人機交互.比如,客戶需要根據(jù)系統(tǒng)提示進行組合動作操作完成銀行系統(tǒng)的實名驗證過程、用戶需要眨眼完成支付寶的身份信息驗證等,這些交互過程極大降低了客戶體驗的滿意程度.一些公司或者社區(qū)使用人臉識別門禁系統(tǒng)時,還需要雇傭一些安保人員參與其中以實現(xiàn)“雙保險”.因此,在進行人臉識別前增加非人機交互的人臉欺詐檢測以解決人臉識別系統(tǒng)中存在的風險與漏洞是一項非常有意義的工作.
人臉欺詐攻擊一般可分為3種方式:打印攻擊、重放攻擊和3D模型攻擊.打印攻擊也稱為照片攻擊,是指將合法用戶的照片打印出來或呈現(xiàn)在電子設(shè)備屏幕上,然后顯示在人臉識別系統(tǒng)的鏡頭前,或是攻擊者將用戶人臉照片的眼部區(qū)域剪裁后放在自己的面部模擬用戶眨眼來響應(yīng)系統(tǒng)指令.重放攻擊也指視頻攻擊,是指在人臉識別系統(tǒng)的鏡頭前重復(fù)播放錄制好的用戶臉部視頻以試圖通過系統(tǒng)驗證.3D模型攻擊是指利用特殊材料構(gòu)造3D模型來模擬用戶頭部,當欺詐檢測系統(tǒng)提示用戶做出相應(yīng)動作時,攻擊者用手左右轉(zhuǎn)動模型來模擬用戶的頭部運動.打印攻擊和重放攻擊相對于3D模型攻擊所用的欺詐材料易獲取,欺詐樣本的制作也更為簡單,因此前兩者欺詐方式在人臉識別系統(tǒng)中存在的風險系數(shù)較高,針對打印攻擊和視頻攻擊提出的反欺詐方法也比較廣泛.
近年來,特征提取成為人臉反欺詐檢測的熱點研究內(nèi)容[1-6].如Boulkenafet等人[1,6]使用局部二值模式(local binary pattern, LBP)提取顏色紋理特征,這種方法簡單有效而且在經(jīng)典的人臉欺詐數(shù)據(jù)庫上都表現(xiàn)出了很強的泛化能力.但是,LBP只反映了圖片局部區(qū)域中心點與鄰近點像素值間的大小關(guān)系而忽略了重要的紋理細節(jié)信息.針對傳統(tǒng)LBP的這一不足,本文提出了差分量化局部二進制模式(difference quantization local binary pattern, DQ_LBP),即利用圖像局部中心點與周圍點之間的差值來細化局部二值模式的紋理信息.除此之外,本文將DQ_LBP與空間金字塔算法[7](spatial pyramid, SP)結(jié)合大大提升了該算法的分類性能.
本文的主要貢獻在于4個方面:
1) 提出的DQ_LBP與傳統(tǒng)的LBP相比,不僅能夠反映中心點與鄰近點之間像素值的大小關(guān)系,更能將像素之間的差值量化并利用量化結(jié)果描述人臉局部紋理的細節(jié)特征.DQ_LBP保持了LBP構(gòu)造簡單的優(yōu)點,且得到的DQ_LBP特征不會因為增加額外的紋理信息而增加特征的維度.
2) 使用空間金字塔算法一方面可以細致地表示人臉的空間結(jié)構(gòu)信息,另一方面可以將不同尺寸的人臉圖片轉(zhuǎn)化成統(tǒng)一維度的特征向量.DQ_LBP和空間金字塔算法相結(jié)合既提取了圖片的紋理和空間結(jié)構(gòu)信息,又反映了圖片局部和全局的特征信息.
3) 通過分析該算法在不同顏色空間中的性能說明彩色紋理對欺詐檢測的作用,并將不同的顏色空間融合以增強算法的魯棒性.
4) 僅需提取視頻中的一幀圖片就可以對該樣本進行分類,從而有效節(jié)約了算法的運算時間.
近年來,隨著公共人臉欺詐數(shù)據(jù)庫的增加,人臉反欺詐的研究得到了快速的發(fā)展.現(xiàn)有的人臉欺詐檢測方法主要分為基于局部特征、基于3D深度信息分析和基于人體運動信息分析的方法.除此之外,將以上方法與深度學習相結(jié)合在該領(lǐng)域的應(yīng)用也越來越廣泛.
基于局部特征提取的方法[2-3]是利用圖片再造過程中產(chǎn)生的紋理差異(包括打印瑕疵、視頻偽影、顯示設(shè)備的噪聲信號和云紋效果等)辨別鏡頭前人臉的真假.文獻[8]為了提取更強的邊緣紋理特征,提出GS-LBP(guided scale based local binary pattern)淡化圖像紋理的冗余度.Pereira等人[4]和Maatta等人[5]分別提出LBP-TOP(local binary pattern from three orthogonal planes)算子和基于不同模式的LBP組合的特征提取方法.前者通過LBP-TOP算子將時間和空間信息組合,大大提高了欺詐識別精度;后者通過實驗證明了LBP相比局部相位量化(local phase quantization, LPQ)和Gabor算子在人臉欺詐識別上具有更好的鑒別能力.Chingovska等人[9]首次將LBP應(yīng)用到欺詐檢測領(lǐng)域,并通過實驗證明LBP對于不同數(shù)據(jù)庫中不同的攻擊類型的檢測都有一定的適用性.Wen等人[10]將鏡面反射、模糊、顏色矩和色彩差異信息結(jié)合進行圖像失真分析,并提出基于顏色質(zhì)量的特征提取方法并表明重新獲得的面部圖像不僅顏色退化還缺乏顏色多樣性.隨后Boulkenafet等人[1]提出一種基于顏色紋理分析的人臉反欺詐方法,證明在未知條件下面部顏色紋理的表現(xiàn)比灰度表示的表現(xiàn)更加穩(wěn)定,該方法簡單有效而且在跨數(shù)據(jù)庫間具有很強的泛化能力.文獻[11]提出使用彩色共生局部二值模式(chromatic co-occurrence of local binary pattern, CCoLBP),該算法在臉部實時應(yīng)用設(shè)備上具有很大的潛力.
真實人臉是一個3D的面部結(jié)構(gòu),而打印攻擊和視頻攻擊所產(chǎn)生的假臉在形成過程中會丟失部分臉部3D結(jié)構(gòu)信息.基于3D深度信息分析[12]主要是利用2D圖像和3D物體之間深度信息的差異來辨別真臉和假臉.例如文獻[12-13]分別通過使用卷積神經(jīng)網(wǎng)絡(luò)輸出深度圖譜和在深度學習框架下從對齊的人臉圖像和所有視頻幀中獲取深度紋理特征.
基于人體運動信息的欺詐檢測主要研究人體的生理反應(yīng)或運動反應(yīng),如眨眼[14-15]、人體運動[14]和頭部旋轉(zhuǎn)[16].Frischholz等人[17]提出使用3種不同的特征——臉部、聲音和嘴唇動作進行活體檢測,這種方法比僅使用單特征提取方法具有更高的識別精度.由于基于人體運動信息的檢測方法需要提取多幀信息,因此容易受到重放視頻的攻擊;Patel等人[12]提出了一種融合深度紋理特征和面部運動線索(如眨眼)的魯棒表示方法以應(yīng)對圖片和回放等攻擊.
隨著設(shè)備和技術(shù)的逐漸完善,將以上方法與深度學習結(jié)合后應(yīng)用到人臉反欺詐領(lǐng)域取得了顯著的效果.如Feng等人[18]利用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造出一種層次性可擴展的框架,該框架能夠融合圖像的質(zhì)量和運動等信息,因此在跨數(shù)據(jù)庫之間具有很強的泛化能力;Atoum等人[13]將圖片分為若干小塊,利用卷及神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)計算每個小塊的欺詐分數(shù)及其平均值,再根據(jù)基于全局深度信息的CNN判別臉部是否具有深度,最后將二者結(jié)合判別樣本真假.實驗表明,該方法在高分辨率樣本上也取得較好的結(jié)果,而且因使用切片代替以往使用全局圖片的方法使得該算法具有魯棒性.以上2種方法需要大量的欺詐樣本才能通過CNN訓(xùn)練出較好的模型,但欺詐樣本收集卻是個難題.Li等人[19]在卷積特征圖中提取彩色LBP特征,并用已有的VGG-Face模型對其進行微調(diào)來減少過擬合影響,該算法在CASIA FASD,Replay-Attack數(shù)據(jù)庫上都取得了穩(wěn)定的性能.
以上方法在人臉反欺詐領(lǐng)域都表現(xiàn)出顯著的分類效果,但也存在不足之處.例如在獲取樣本運動信息時往往要計算大量的視頻幀,在提取樣本深度信息時易受到欺詐照片卷曲影響而錯誤分類.使用卷積神經(jīng)網(wǎng)絡(luò)雖為目前較為先進的方法,但是容易受到欺詐樣本限制而且模型訓(xùn)練的時間較長.對于局部特征紋理提取的方法,文獻[1]雖然詳細闡明了顏色通道對于欺詐識別分類的作用,但使用的特征提取方法不能充分反映圖片的局部紋理信息.針對該問題,本文提出基于DQ_LBP的人臉反欺詐算法.該算法將DQ_LBP和空間金字塔算法結(jié)合,一方面DQ_LBP能夠獲取更細微的紋理特征,另一方面空間金字塔算法能夠?qū)⒉煌叨鹊哪槻考y理圖片轉(zhuǎn)變成統(tǒng)一維度的特征向量,并且能更加準確地反映圖片的空間結(jié)構(gòu)信息.此外,為說明彩色空間對辨別真臉和假臉的作用,本文分別在Gray,RGB,HSV,YCbCr彩色空間進行了大量實驗,并將互補的彩色空間進行融合來提高算法的識別性能.該方法簡單高效而且節(jié)省大量時間,僅需提取視頻中的一幀就可在CASIA FASD,Replay-Attack,Replay-Mobile上達到很好的檢測效果.
針對打印攻擊和重放攻擊,本文提出了一種DQ_LBP特征提取算法,并在顏色空間中將其與空間金字塔算法結(jié)合進行人臉欺詐檢測.該算法的總體框架如圖1所示,主要包含5個步驟:
Step1. 為提高人臉的識別效率,從每一個視頻中僅提取一幀作為圖片樣本,然后進行臉部定位,確定臉部位置之后對原始圖片進行剪裁形成新的人臉圖片數(shù)據(jù)庫;
Step2. 原始圖片的彩色空間為RGB形式,為探究本文算法在不同顏色空間表示之間的差異,分別將原始圖片轉(zhuǎn)換為HSV、YCbCr和灰度圖形式;
Step3. 分別在灰度圖、RGB、HSV和YCbCr顏色空間內(nèi)提取人臉圖片的DQ_LBP特征;
Step4. 利用空間金字塔算法提取顏色空間中各通道的全局和局部紋理特征,然后將各通道特征級聯(lián)形成表示人臉的特征向量;
Step5. 利用支持向量機(support vector machine, SVM)算法進行真假人臉的檢測與分類.
Fig. 1 Framework of proposed face anti-spoofing algorithm based on DQ_LBP圖1 基于DQ_LBP的人臉反欺詐算法的框架圖
Fig. 2 Comparison of EER and HTER in the six datasets圖2 EER和HTER 在6個數(shù)據(jù)庫中比較
首先利用級聯(lián)目標檢測器[20]獲取臉部位置信息,在該過程中由于用戶頭部旋轉(zhuǎn)可能會造成當前幀的臉部位置獲取異常,此時將會對下一幀圖片進行檢測.適當?shù)谋尘靶畔⒛軌驇椭墼p檢測系統(tǒng)有效地鑒別真臉和假臉,本文把檢測到的人臉區(qū)域擴充到原來的1.5倍后再進行剪裁.不同于文獻[1,6]中需要把剪裁后的臉部圖片標準化為64×64像素,為了避免圖片標準化后使得紋理信息丟失,本文不對剪裁后的人臉圖片進行任何處理,并用空間金字塔算法解決圖片多尺度問題.將CASIA FASD數(shù)據(jù)庫中提取的人臉圖像進行剪裁和擴充,形成32×32,64×64,128×128,150×150,200×200像素的標準人臉圖片庫和一個未經(jīng)處理的人臉圖片庫.圖2為在HSV空間中使用DQ_LBP結(jié)合空間金字塔算法提取的特征在以上6個人臉庫中的等錯誤率(equal error rate, EER)和半總錯誤率(half total error rate, HTER).可以看出算法在未經(jīng)標準化處理的人臉庫中表現(xiàn)的性能最好.
Fig. 3 Representation of real and fake faces at low and high resolution in the CASIA FASD database圖3 CASIA FASD中低分辨率和高分辨率下真臉和假臉
人臉在重造過程中會產(chǎn)生許多紋理差異,這種差異在彩色通道上的表現(xiàn)更為明顯.圖3(a)行1和行2分別是低分辨率下真臉和假臉在RGB、灰度圖和HSV空間中的表示.圖3(b)是高分辨率圖片示例,從上到下分別表示真臉、卷曲照片、剪切照片和重放攻擊圖片.cosθ表示對應(yīng)假臉圖片和真臉圖片的余弦相似度:
(1)
其中,x1k,x2k(k=1,2,…,n)分別表示第1幅圖片和第2幅圖片的第k個特征點.
如圖3所示,自然狀態(tài)下的圖片是以RGB形式呈現(xiàn)在人眼中.低分辨率真臉和假臉圖片在RGB和S通道中的差異比灰度表示下的差異更為明顯.但對于高分辨率的圖片,在彩色空間或通道內(nèi)也很難直觀地辨別真臉和假臉.通過比較S通道和灰度圖的值可知,真臉和假臉在彩色空間中的差異更大.
紋理反映了圖像灰度的性質(zhì)及其空間拓撲關(guān)系.其中,LBP因其簡單高效和灰度不變性等優(yōu)點被廣泛應(yīng)用到人臉欺詐識別領(lǐng)域,但是傳統(tǒng)LBP只考慮中心像素值與其鄰近像素值之間大小關(guān)系,而沒能將它們之間的差值信息進行量化,針對傳統(tǒng)LBP的這一不足,本文提出一種新穎的LBP改進方法.
2.3.1 LBP
局部二進制模式的原理是利用局部區(qū)域中心像素點與周圍點的大小關(guān)系形成二進制編碼,該二進制編碼的十進制表示則為中心像素點的LBP值,具體定義:
(2)
(3)
其中,rc和rn(n=1,2,…,P)分別表示中心點(x,y)的像素值和位于半徑為R(R>0)的圓上的P個鄰域的像素值.
2.3.2 DQ_LBP
傳統(tǒng)LBP忽略了局部中心點與相鄰點像素之間的差異信息,如圖4①和圖4②這2個3×3窗口的中心像素點和周邊像素點的差值雖然不同,但經(jīng)過計算之后其LBP序列完全相同.針對該問題,DQ_LBP借鑒了LBP的構(gòu)造過程來量化局部相鄰像素之間的差值,即將量化的差值附加在以2為底的指數(shù)中,使DQ_LBP在進行編碼時把差值信息融合進去.因此DQ_LBP的特征維度與LBP一致且包含更豐富的紋理信息.這種增加LBP差值信息的紋理提取方法能夠有效地表示真臉和假臉之間的差異,在人臉欺詐檢測方面具有較好的表現(xiàn).
Fig. 4 Examples of LBP evaluation圖4 LBP求值示例
如式(2)所示,LBP的計算過程類似于冪指函數(shù)求和運算.由于中心點像素與其相鄰像素差值的范圍為[0,255],如果本文直接將差值作為指數(shù)進行運算,將會使得當前位的二值權(quán)重激增,因此在運算前需要將差值進行歸一化.本文構(gòu)造有關(guān)差值和中心點像素值歸一化為:
(4)
其中,rn和rc分別表示圖像相鄰點和中心點的像素值,差值大小為rn>rc.從式(4)可以看出,A值隨差值和中心點像素值的變化而變化.max表示該DQ_LBPP,R所能表示的最大值,其大小取決于周圍點選取的個數(shù),與max關(guān)系可用max=2P-1表示,如果P=8,則max=255.在式(2)中,LBP值隨n呈指數(shù)關(guān)系遞增.在細化LBP紋理時,為了不增加DQ_LBP的特征維度,本文借鑒LBP構(gòu)造過程將A(A∈(0,1])作為附加信息添加到指數(shù)中,構(gòu)造的DQ_LBP:
(5)
(6)
式(6)與式(3)不同,其中x>0(即rn>rc)一方面可避免式(4)的分母,另一方面約束了DQ_LBPP,R的大小.式(5)中,DQ_LBPP,R的值會隨著n的增加以2(1+A)的倍數(shù)遞增,當n=P時A值對DQ_LBPP,R的影響最大,當n=1時DQ_LBPP,R值將不受A的限制.假設(shè)n=(p+1)2時A對DQ_LBP值的影響最大,那么DQ_LBPP,R算法不會因為n較小而過多改變當前位LBP信息,也不會因為n太大使DQ_LBPP,R值遠遠超出max范圍.鑒于上述假設(shè),本文構(gòu)造二次函數(shù):
y=(p-n)(n-1),
(7)
為了約束DQ_LBPP,R的大小,需要對y進行歸一化.求y關(guān)于n的導(dǎo)數(shù)為
(8)
當?y/?n=0時,n=(p+1)/2,此時y的最大值y=((p+1)/2)2,得到值域為[0,1]的約束函數(shù)C:
(9)
最終得到的DQ_LBP:
(10)
當圖像分辨率越高時,圖片局部像素間的差異越小.圖5表示高分辨率樣本的灰度圖,任取其局部紋理可知中心點與周圍點像素值的差不超過5.事實上,通過統(tǒng)計CASIA FASD和Replay-Attack數(shù)據(jù)庫中每張圖片的差值得知,像素之間的差值多數(shù)分布在0~25之間,差值的最大值不超過50.由式(10)知,當周圍點與鄰近點差值越小,DQ_LBPP,R值就越小.因此,對于像素值變化較為平緩的中、高分辨率人臉圖像,其DQ_LBPP,R值一般不會超過最大值max,如果DQ_LBPP,R>max,則設(shè)置DQ_LBPP,R=max.
Fig. 5 Local texture of the high resolution sample 圖5 高分辨率樣本的局部紋理
本文提出的DQ_LBP是綜合考慮實際圖片的差值分布和傳統(tǒng)LBP的構(gòu)造過程而設(shè)計的一種特征提取方式.因此DQ_LBP在細化原始LBP特征時不會增加其特征維度.圖6(a)給出了當中心點像素值不變時LBP和DQ_LBP隨差值變化的曲線.從中可以出,DQ_LBP會隨著差值增大而增大,而LBP始終保持不變.圖6(b)是衡量LBP,DQ_LBP特征值和中心點像素值關(guān)系的曲線圖.其中DQ_LBP是隨中心點像素值的變化而變化的,而且這種變化的差異較小.總之,DQ_LBP增加了紋理差值信息的同時在一定程度上保留了LBP的灰度尺度不變性.值得注意的是,當中心點像素值為0~150時,DQ_LBP值比LBP值要小,這是因為式(6)對特征值的增加具有約束作用.3.3.1節(jié)介紹了DQ_LBP和其他常用的特征提取方式以及3種LBP改進方法的實驗比較,進一步說明了DQ_LBP的優(yōu)越性.
Fig. 6 LBP and DQ_LBP with difference value and center pixel圖6 差值和中心點像素值對LBP和DQ_LBP的影響
在計算機視覺應(yīng)用中,空間金字塔算法經(jīng)常被用來解決圖片多尺度問題[21].文獻[22]提出基于序的空間金字塔池化算法,該算法不僅能夠處理多尺度的子圖像塊,還解決了傳統(tǒng)池化方法容易損失大量重要信息和易過擬合的問題.基于上述原因,本文將DQ_LBP紋理與經(jīng)典的空間金字塔算法結(jié)合,其過程如圖7所示.首先將一張紋理特征圖片分為L層,對于第l(l∈{0,1,…,L-1})層的圖片則會被劃分為2l×2l個均勻大小的方塊;然后統(tǒng)計每個方塊中的特征直方圖并將其按照順序級聯(lián);最后將每一層的直方圖級聯(lián)一起形成表示樣本圖片的一維向量.空間金字塔算法實際上是對圖片進行粒度劃分,當層數(shù)越高就意味對圖片的劃分越精細,因此更能詳細地反映圖片的空間結(jié)構(gòu)和局部紋理信息.表示在S彩色空間i通道內(nèi)獲取的特征向量:
(11)
將S彩色空間內(nèi)各個通道的特征向量級聯(lián)形成表示該圖片的特征向量:
HS=(HS1,HS2,…,HSI).
(12)
其中I為S彩色空間內(nèi)的通道個數(shù).
Fig. 7 Spatial pyramid layer number setting and its cascade圖7 空間金字塔層數(shù)設(shè)置及其級聯(lián)方式
Fig. 8 Cropped and standardized faces in CASIA FASD圖8 CASIA FASD中裁剪和標準化的示例人臉
空間金字塔算法的使用可以大幅度提高算法的識別精度,但是也會使其數(shù)據(jù)維度擴增,因此研究人員在使用金字塔算法時通常將其設(shè)置為3層.考慮到人臉欺詐識別是一種二分類問題,過于細化特征圖片的結(jié)構(gòu)信息會存在數(shù)據(jù)干擾,于是本文使用空間金字塔的第1層和第3層,其主要優(yōu)點是將特征維度降低為原來的(1+16)(1+4+16).
為了評估本文所提出算法的有效性,本文在CASIA FASD,Replay-Attack,Replay-Mobile三個權(quán)威的人臉反欺詐數(shù)據(jù)庫進行實驗.主要工作:
1) 通過在不同顏色空間中比較DQ_LBP,DQ_LBP結(jié)合空間金字塔算法(DQ_LBP+SP)和其他常用的6種特征提取方法的性能來說明DQ_LBP及其DQ_LBP+SP算法的優(yōu)越性;
2) 將不同的顏色空間融合以增強算法的泛化能力;
3) 根據(jù)實驗數(shù)據(jù)分析該算法的檢測性能;
4) 將本文算法和前沿的人臉反欺詐算法進行比較.
3.1.1 CASIA FASD數(shù)據(jù)庫
在CASIA FASD臉部反欺詐數(shù)據(jù)庫[23]中,研究人員對50名實驗者的真實面部進行了記錄并設(shè)計了3種欺詐攻擊:卷曲照片攻擊、剪切照片攻擊(攝影掩模)和視頻攻擊.真實的訪問和攻擊嘗試都使用低、正常和高3種成像質(zhì)量來記錄.50名受試者被分成2個不相交子集進行訓(xùn)練和測試,其中訓(xùn)練集為20個類,測試集為30個類.圖8是來自文獻[1]中CASIA FASD數(shù)據(jù)庫的示例人臉圖像,從上到下為:低質(zhì)量、正常質(zhì)量和高質(zhì)量的人臉圖像.從左到右為:真實臉部照片和相應(yīng)的卷曲照片、剪切照片和視頻回放攻擊.
3.1.2 Replay-Attack數(shù)據(jù)庫
Replay-Attack數(shù)據(jù)庫[9]中設(shè)計了打印攻擊、手機攻擊和高清攻擊3種攻擊類型.根據(jù)在攝像機前展示假臉的設(shè)備時所使用的支撐物不同定義了手持和固定支持攻擊.50名受試者被分為3個獨立的小組進行訓(xùn)練、驗證和測試.圖9是來自文獻[1]中Replay-Attack數(shù)據(jù)庫的示例人臉圖像,行1顯示來自受控場景的圖像,而行2對應(yīng)于來自非控制場景的圖像.從左到右為:真實人臉圖片和相應(yīng)的高清攻擊、手機攻擊和打印攻擊.
Fig. 9 Cropped and standardized faces in Replay-Attack圖9 Replay-Attack中裁剪和標準化的示例人臉圖像
Fig. 10 Face samples in Replay-Mobile圖10 Replay-Mobile中的示例人臉
3.1.3 Replay-Mobile數(shù)據(jù)庫
Replay-Mobile數(shù)據(jù)庫是近年提出的一種新型的人臉欺詐檢測數(shù)據(jù)庫,相比于Replay-Attack,該數(shù)據(jù)庫使用更高分辨率的設(shè)備進行樣本錄制,和CASIA FASD相比,前者增加了移動場景的測試.Replay-Mobile數(shù)據(jù)庫[24]收集了40個研究對象的1 030個視頻.包含了打印照片攻擊、平板照片攻擊和移動視頻攻擊;檢測環(huán)境包括受控場景、非受控場景、直接場景、橫向場景和擴散場景;攻擊設(shè)備類型包括基于手持的設(shè)備和固定支持設(shè)備.該數(shù)據(jù)庫分為訓(xùn)練集、測試集和驗證集3個非重疊的子集,分別包含12,16,12個類.Replay-Mobile數(shù)據(jù)庫的人臉示例如圖10所示:行1表示智能手機上捕獲的攻擊訪問樣本,行2表示平板電腦上采集的樣本.從左到右的列分別顯示了光照條件下啞光屏幕、無光照條件下啞光屏幕、光照條件下打印和非光照打印的人臉示例.
本文采用線性核的支持向量機(SVM)分類器進行二值分類.以EER和HTER為評價指標.其中HTER為FAR與FRR的均值,F(xiàn)AR(false accep-tance rate)為錯誤接受率,F(xiàn)RR(false rejection rate)為錯誤拒絕率.EER為FAR,FRR的2條曲線的相交點對應(yīng)的值.為了將本文算法和其他算法進行公平比較,本文在Replay-Mobile中增加了APCER(attack presentation classification error rate),BPCER(bona fide presentation classification error rate),ACER(average classification error rate)三個指標,其中APCER和BPCER類似上述FAR和FRR,區(qū)別在于前2個指標為了考慮每種攻擊類型的攻擊潛力和成功概率,最終的APCER,BPCER用所有攻擊類型中性能表現(xiàn)最差的值進行評估,而且ACER為APCER與BPCER的均值.所有指標值越小表示該算法的整體性能越好.
3.3.1 與其他特征提取方法的比較
Table 1 EER Comparison Between the Proposed Algorithm and Other Feature Extraction Methods in the CASIA FASD Database
Table 2 EER and HTER Comparison Between the Proposed Algorithm and Other Feature Extraction Methods in the Replay-Attack Database
Fig. 11 ROC graphs of LBP,DQ_LBP,DQ_LBP+SP(0,1,2), and DQ_LBP+SP(0,2)圖11 LBP,DQ_LBP,DQ_LBP+SP(0,1,2)和DQ_LBP+SP(0,2)的ROC曲線
3.3.2 彩色紋理融合
彩色空間相比灰度圖可以提高欺詐檢測的性能,但由于使用的數(shù)據(jù)庫不同,算法在何種彩色空間中表現(xiàn)的性能最好具有不確定性,為了提高算法整體的泛化能力,本文將不同彩色空間進行融合.表3給出了彩色紋理融合方式及其實驗結(jié)果,其中HSV和YCbCr空間結(jié)合增加了算法在CASIA FASD和Replay-Mobile數(shù)據(jù)庫中的性能,本文算法的最終結(jié)果將統(tǒng)一以在HSV+YCbCr中得到的實驗數(shù)據(jù)為準.
Table 3 Fusion Performance of Color Texture in Replay-Attack,CASIA FASD, and Replay-Mobile Databases
3.3.3 檢測性能分析
為了解本文算法在不同成像質(zhì)量和不同欺詐攻擊樣本中的性能表現(xiàn),表4~6分別給出算法在Replay-Mobile,CASIA FASD,Replay-Attack中的實驗結(jié)果.在上述3種數(shù)據(jù)庫中,本文算法分別在視頻圖片攻擊、數(shù)碼圖片攻擊和移動設(shè)備攻擊下具有更高的檢測精度.值得注意的是,本文算法能夠完美地檢測出Replay-Attack數(shù)據(jù)庫中的數(shù)碼圖片攻擊.
Table 4 Performance of Our Algorithm Under Different Protocols in Replay-Mobile Database
Table 5 Performance of Our Algorithm Under Different Protocols in CASIA FASD Database
Table 6 Performance of Our Algorithm Under Different Protocols in Replay-Attack Database
3.3.4 與現(xiàn)有算法比較
Table 7 Comparison Between Our Algorithm and Other Frontier Algorithms in Replay-Attack and CASIA FASD Database
結(jié)合多層離散余弦變量的算法和本文算法都在Replay-Attack數(shù)據(jù)庫中達到了完美檢測,但是本文算法在CASIA FASD中的EER值比LBP+DCT降低了97.79%.近年來,卷積神經(jīng)網(wǎng)絡(luò)因其強大的分類性能被廣泛應(yīng)用于活體檢測領(lǐng)域.從表7可以看出結(jié)合CNN的算法在整體上比傳統(tǒng)方法表現(xiàn)的性能更佳,比如文獻[28]中提出的適合時空輸入的3D卷積神經(jīng)網(wǎng)絡(luò)在Replay-Attack,CASIA FASD中都具有較為突出的性能.但是欺詐樣本獲取相對困難從而使網(wǎng)絡(luò)模型的訓(xùn)練受到限制,而且模型在訓(xùn)練時也耗費較多的時間.綜合來看,本文算法的性能明顯優(yōu)于其他傳統(tǒng)算法,而且與大部分卷積神經(jīng)網(wǎng)絡(luò)算法相比,其泛化能力也更勝一籌.在表8所示的Replay-Mobile數(shù)據(jù)庫中,本文方法的ACER值比IQM(image quality measure),Gabor分別降低了92.38%,89.08%.和LBP+GS-LBP,CCoLBP,LBP+CCoLBP這3種改進的LBP算法相比,本文算法也具有更好的性能表現(xiàn).
Table 8 The Comparison Between this Algorithm and Other Frontier Algorithms in Replay-Mobile Database表8 算法和其他前沿算法在Replay-Mobile數(shù)據(jù)庫中的比較 %
本文針對打印攻擊和視頻攻擊提出一種基于DQ_LBP的人臉反欺詐算法.通過將DQ_LBP紋理與空間金字塔算法結(jié)合使得該算法在CASIA FASD,Replay-Attack,Replay-Mobile數(shù)據(jù)庫中都表現(xiàn)了較為優(yōu)異的性能.DQ_LBP是經(jīng)過分析數(shù)據(jù)庫差值分布和借鑒LBP構(gòu)造過程形成的一種紋理特征提取方式,該算子能夠?qū)⑾袼刂g的差值量化來增加原始LBP的紋理信息.將DQ_LBP結(jié)合空間金字塔算法一方面解決圖片多尺度問題,另一方面提取樣本的結(jié)構(gòu)信息.為了降低數(shù)據(jù)維度,本文還對空間金字塔層數(shù)的設(shè)置進行討論.在實驗中發(fā)現(xiàn),對于不同的數(shù)據(jù)集,性能表現(xiàn)最好的顏色空間無法確定,本文將通過將不同的彩色空間進行結(jié)合提升本文算法的泛化能力.
本文算法的優(yōu)點是結(jié)合了彩色紋理信息和空間結(jié)構(gòu)信息,能夠更加詳細地反映樣本的紋理特征.DQ_LBP+SP算法和其他傳統(tǒng)的算法相比具有更精確的識別性能,和結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的算法相比,前者訓(xùn)練時間短而且表現(xiàn)出的性能也具有魯棒性.本文因為細化了圖片紋理信息使得算法的跨數(shù)據(jù)庫檢測性能不是很好,在后期工作中,我們將會把本文特征提取方法與卷積神經(jīng)網(wǎng)絡(luò)結(jié)合來嘗試提高算法在跨庫實驗中的性能.