陳月 吳戀 周華麗 熊琴 代芳穗 田芳
摘 要:針對(duì)替考現(xiàn)象屢禁不止的現(xiàn)狀,提出了基于Deep ID人臉檢測(cè)身份技術(shù)來(lái)辨別考生的真實(shí)性。臉部是每個(gè)人最具代表性的特征,每個(gè)人的臉部紋路都具有唯一性,且更易提取,所以人臉識(shí)別將是考場(chǎng)驗(yàn)證的首選。隨著深度學(xué)習(xí)的提出,人臉識(shí)別的使用頻率不斷提高,其準(zhǔn)確率也不斷提升。人臉識(shí)別運(yùn)用于多個(gè)領(lǐng)域,并取得了重大突破,根據(jù)最新的研究,建議使用、人臉識(shí)別算法Deep ID技術(shù)驗(yàn)證考生身份。文中闡述了人臉識(shí)別用于檢測(cè)考生身份一致性的可行性,可有效防止考生替考作弊等情況出現(xiàn)。
關(guān)鍵詞:深度學(xué)習(xí);身份驗(yàn)證;卷積神經(jīng)網(wǎng)絡(luò);Deep ID
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-1302(2018)07-00-03
0 引 言
通過(guò)數(shù)據(jù)分析可知,替考現(xiàn)象屢禁不止,由于人眼識(shí)別的準(zhǔn)確率較低,不論大型還是小型考試都存在不公平現(xiàn)象。如今,深度學(xué)習(xí)技術(shù)已滲入各領(lǐng)域,Deep ID更掀起了一股學(xué)習(xí)新潮,因此將Deep ID人臉識(shí)別技術(shù)運(yùn)用到考生認(rèn)證中,提高考生的考前認(rèn)證效率與準(zhǔn)確率,避免替考,實(shí)現(xiàn)考試的公平公正。
1 人臉識(shí)別的研究發(fā)展
中國(guó)研究人臉識(shí)別技術(shù)時(shí),側(cè)重人臉識(shí)別及多種模式的人機(jī)交互技術(shù)[1],其中Deep ID算法所應(yīng)用的人臉識(shí)別技術(shù)已被應(yīng)用到諸多領(lǐng)域。現(xiàn)階段,人臉識(shí)別已逐漸延伸到多種實(shí)際生活場(chǎng)景中。人臉檢測(cè)技術(shù)已由圖片的簡(jiǎn)單處理發(fā)展到圖像的實(shí)時(shí)處理,已從傳統(tǒng)技術(shù)轉(zhuǎn)變?yōu)樯疃葘W(xué)習(xí)技術(shù)[2]。
2 常用人臉識(shí)別技術(shù)簡(jiǎn)介
2.1 TENCENT-BESTIMAGE
早先,相冊(cè)產(chǎn)品中出現(xiàn)了優(yōu)圖人臉檢測(cè)器[3]。之后,優(yōu)圖人臉檢測(cè)器相繼應(yīng)用于諸多APP移動(dòng)產(chǎn)品中。2014年,優(yōu)圖為保證高準(zhǔn)確率,挑選出十萬(wàn)張沒(méi)有人臉的照片作為負(fù)樣本進(jìn)行訓(xùn)練,奪得FDDB桂冠。
優(yōu)圖不斷優(yōu)化技術(shù),在Viola與Jones提出瀑布式檢測(cè)框架后[4],利用不一樣的特征提取方式,增加了系統(tǒng)的表達(dá)能力;采用光照分離技術(shù),進(jìn)行多次技術(shù)改進(jìn)與算法迭代后[5],技術(shù)發(fā)生了革命性變化,利用AUC技術(shù)提高設(shè)備分類能力,使用Vector Boosting等技術(shù)將不同特征的人臉歸屬到一個(gè)框架。
2.2 FaceNet
FaceNet人臉檢測(cè)算法[6]將CNN和Triplet Mining相結(jié)合,在LFW數(shù)據(jù)集上測(cè)試,其準(zhǔn)確度高達(dá)99.63%,在YouTube人臉數(shù)據(jù)集上進(jìn)行測(cè)試[7],其準(zhǔn)確度也達(dá)到95.12%,相比之前的準(zhǔn)確度提高了近30%。通過(guò)卷積神經(jīng)網(wǎng)絡(luò)技術(shù)將人臉圖像映射到特定的特征向量中,可由此計(jì)算出不同的人臉特征距離。
判斷兩張人臉照片是否屬于同一個(gè)體可通過(guò)計(jì)算照片的人臉特征[8],距離閾值等方法。谷歌通過(guò)CNN技術(shù)把圖像映射到特定的歐幾里得空間內(nèi)[9]。圖片相似度與空間距離成正相關(guān),該映射確定下來(lái)后,人臉識(shí)別任務(wù)將變得簡(jiǎn)單。
2.3 Face++
Face++是曠視科技公司研發(fā)的人臉識(shí)別云服務(wù)平臺(tái)[10]。近年,他們推出一款游戲,曾位居APP Store國(guó)內(nèi)區(qū)排行榜前五,可由于游戲開(kāi)發(fā)經(jīng)驗(yàn)不足及基礎(chǔ)知識(shí)掌握不夠,他們隨即將精力轉(zhuǎn)移到人臉識(shí)別檢測(cè)的基層技術(shù)完善方面。
Face++應(yīng)用的人臉識(shí)別技術(shù)中有兩個(gè)特殊例子。其中一個(gè)例子是世紀(jì)佳緣網(wǎng)站,客戶可根據(jù)自己對(duì)另一半的要求,輸入另一半長(zhǎng)相的特征點(diǎn),搜索相似外貌的異性用戶,這個(gè)搜索在數(shù)據(jù)庫(kù)中進(jìn)行,當(dāng)下該數(shù)據(jù)庫(kù)是世紀(jì)佳緣網(wǎng)站的內(nèi)部數(shù)據(jù)庫(kù),日后可成為各大社交網(wǎng)絡(luò)上的人臉數(shù)據(jù)庫(kù)。第二個(gè)例子是與360搜索引擎合作,在360搜索的圖片搜索中利用識(shí)別檢測(cè)技術(shù)對(duì)圖片進(jìn)行檢索。
如今Face++已發(fā)展到能夠穩(wěn)定應(yīng)對(duì)不同人臉姿態(tài)并對(duì)其處理的地步,且其技術(shù)已更新為深度學(xué)習(xí)算法,此外,F(xiàn)ace++還通過(guò)自己獨(dú)特的算法可將每張人臉壓縮到僅有幾個(gè)字節(jié)的長(zhǎng)度。
3 基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)
3.1 深度學(xué)習(xí)技術(shù)
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
近些年,人臉識(shí)別領(lǐng)域一直密切關(guān)注CNN的相關(guān)技術(shù)。特別是CNNs在FRUE上取得的令人印象深刻的成果。20世紀(jì)60年代,Hubel與Wiesel在研究貓腦皮層時(shí)發(fā)現(xiàn)了獨(dú)特的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并由此進(jìn)行相關(guān)研究。CNN是一種前饋神經(jīng)網(wǎng)絡(luò),是圖像處理領(lǐng)域的一種應(yīng)用,其中人工神經(jīng)元可以對(duì)應(yīng)周?chē)膯卧?,進(jìn)行大型圖像處理。CNN含有兩層,第一層為提取層,神經(jīng)元輸入時(shí)跟上一層接受域相連;第二層為映射層,每個(gè)特征映射為一個(gè)平面,全部神經(jīng)元權(quán)值相等。卷積神經(jīng)網(wǎng)絡(luò)的每個(gè)卷積層都有一個(gè)分計(jì)算層,用來(lái)計(jì)算局部平均二次提取值,減少分辨率。卷積神經(jīng)網(wǎng)絡(luò)主要用于識(shí)別扭曲不變的二維圖像,其特點(diǎn)局部權(quán)值共享在圖像處理方面具有優(yōu)越性,利用梯度下降+鏈?zhǔn)角髮?dǎo)法則對(duì)節(jié)點(diǎn)進(jìn)行求導(dǎo),能從不同種類的值組成的集合中學(xué)習(xí)得到需要的函數(shù)。
圖像中的對(duì)象并不完全一致,但在訓(xùn)練CNN之前臉部圖像效果較好。它在Deep Face中聲明,一個(gè)池層在本地轉(zhuǎn)換健壯性和保存紋理細(xì)節(jié)之間需要很好的平衡。Deep Face的另一個(gè)貢獻(xiàn)是3D人臉對(duì)齊。傳統(tǒng)方法中,人臉圖像在輸入之前可以使用二維相似變換來(lái)對(duì)齊。然而,該2D對(duì)齊無(wú)法處理平面旋轉(zhuǎn)。為克服這一局限性,DeepFace提出了一種利用仿射攝像機(jī)模型的三維對(duì)準(zhǔn)方法。
3.1.2 Deep ID
孫祎是香港中文大學(xué)的博士,是Deep ID人臉?biāo)惴ǖ陌l(fā)明者。Deep ID算法充分利用卷積神經(jīng)網(wǎng)絡(luò),能夠表征1 000多種分類的特征,且分類精度較好,不會(huì)因數(shù)據(jù)集過(guò)小而產(chǎn)生擬合,在人臉識(shí)別數(shù)據(jù)集LFW上測(cè)試的準(zhǔn)確度高達(dá)97.45%。
Deep ID技術(shù)中卷積神經(jīng)網(wǎng)絡(luò)起到了學(xué)習(xí)特征的作用,輸入圖片后,Deep ID將得到一個(gè)160維的向量,之后在該160維向量上使用現(xiàn)有的貝葉斯學(xué)習(xí)組合進(jìn)行分類,得出結(jié)論。卷積神經(jīng)網(wǎng)絡(luò)計(jì)算的特征值區(qū)分度大且緊湊,因此得到的效果將會(huì)更好。其數(shù)據(jù)集對(duì)于Deep ID或任何卷積神經(jīng)網(wǎng)絡(luò)都較為重要,數(shù)據(jù)集將會(huì)使卷積神經(jīng)網(wǎng)絡(luò)得到充分訓(xùn)練,Deep ID將增加新的數(shù)據(jù)[11]與更多圖片。其次是裁剪圖片,多角度裁剪,然后使用PCA降維計(jì)算好的向量組合。
Deep ID與Deep Face存在截然不同的地方,Deep Face在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前會(huì)使用對(duì)齊方法。我們認(rèn)為一旦經(jīng)過(guò)人臉對(duì)齊,人臉的面部特征就會(huì)固定在部分像素中,就可利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行特征學(xué)習(xí)。針對(duì)同樣的問(wèn)題,Deep ID并未采用對(duì)齊方法,而是將一個(gè)人臉劃分成很多部分,每個(gè)部分都會(huì)訓(xùn)練一個(gè)模型,然后將模型聚合。
Deep ID2在Deep ID上改進(jìn)了CNN的結(jié)構(gòu),采用圖像識(shí)別方面的最新網(wǎng)絡(luò)結(jié)構(gòu),且層數(shù)加深。Deep ID2與Deep ID的不同之處在于新的網(wǎng)絡(luò)結(jié)構(gòu)以47×55的圖片為輸入,并添加了驗(yàn)證信號(hào),網(wǎng)絡(luò)結(jié)構(gòu)也得到了修改,提取到的特征維度也得到了增加。利用前向-后向貪心算法選擇小的圖像塊[12]。Deep ID2+在Deep ID2的基礎(chǔ)上修改了網(wǎng)絡(luò)架構(gòu),接著對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分析和研究,將向量從160維提升到512維,結(jié)合CeLeFaces+與WDRef數(shù)據(jù)集組成訓(xùn)練集,第一層和第二層max-pooling層都分別連接到Deep ID層。
Deep ID3在LFW上的測(cè)試準(zhǔn)確率為99.53%,相比Deep ID2+性能大幅提升,更加精確。
3.2 驗(yàn)證身份技術(shù)
3.2.1 人臉檢測(cè)
技術(shù)部門(mén)可通過(guò)攝像頭采集不同的人臉圖像,當(dāng)客戶處于拍攝范圍內(nèi)時(shí),攝像頭將通過(guò)界面控制按鍵實(shí)時(shí)拍攝客戶的人臉,可實(shí)時(shí)、準(zhǔn)確地找出人臉的特征位置點(diǎn)。
3.2.2 人臉特征提取
人臉特征提取過(guò)程中,攝像頭首先感應(yīng)到人臉的5個(gè)特征點(diǎn),即兩個(gè)眼睛、鼻子邊界點(diǎn)和嘴巴的邊界點(diǎn),基于兩眼和嘴巴對(duì)齊。將人臉劃分為60個(gè)部分,其中包括10個(gè)子區(qū)域、3個(gè)尺度和顏色通道等。
3.2.3 人臉驗(yàn)證
選中向量后利用PCA降維,對(duì)于輸出后的向量可以使用聯(lián)合貝葉斯模型進(jìn)行分類。利用得出的數(shù)值來(lái)衡量身份證和真人是否為同一個(gè)人[13]。在訓(xùn)練集上可以得到一個(gè)相似值,當(dāng)相似度值大于固定值時(shí),為同一個(gè)人;當(dāng)相似度小于固定值時(shí),非同一個(gè)人。在進(jìn)行確認(rèn)分析中即可得出結(jié)論。
4 驗(yàn)證身份真實(shí)性的人臉識(shí)別系統(tǒng)市場(chǎng)意義
作弊是一種欺騙行為,為了自己的利益而忽視了對(duì)他人的公平使考試的功能沒(méi)有得到正常發(fā)揮,因此研究防作弊的科技手段十分必要。
如今,各個(gè)行業(yè)都離不開(kāi)科技的支撐,教育界亦然。近幾年較熱門(mén)的技術(shù)就是人臉識(shí)別研究,并且隨著人臉識(shí)別技術(shù)的不斷突破,學(xué)者們的研究熱情高漲。
人臉識(shí)別已不是一個(gè)新詞,但是它的研究卻從未停下,在當(dāng)今科技發(fā)展的時(shí)代,我們也與時(shí)俱進(jìn)使用最新的算法——Deep ID,盡可能達(dá)到驗(yàn)證的準(zhǔn)確率和高效率。證件的照片與真人比對(duì),顯示兩者相似度,機(jī)器識(shí)別代替人眼,有效杜絕替考。
5 結(jié) 語(yǔ)
實(shí)驗(yàn)結(jié)果證明,將身份證人臉識(shí)別系統(tǒng)運(yùn)用在考生驗(yàn)證上效果明顯,準(zhǔn)確率高,還可對(duì)意在作弊的考生起到震懾作用。與傳統(tǒng)驗(yàn)證方法相比,該方法可明顯降低核對(duì)時(shí)間,減輕監(jiān)考老師任務(wù),更加有利地降低考生作弊的頻率。
參考文獻(xiàn)
[1] SUN Y,LIANG D,WANG X,et al. Deepid3:Face recognition with very deep neural networks[Z]. Computer Science,2015.
[2] ZHU Z,LUO P,WANG X,et al.Recover canonical-view faces in the wild with deep neural networks[Z].Eprint Arxiv,2014.
[3] SCHROFF F,KALENICHENKO D,PHILBINJ. Face Net:a unified embedding for face recognition and clustering[Z].Computer Vision & Pattern Recognition,2015:815-823.
[4] TRAN A T,HASSNERT,MASI I,et al.Regressing robust and discriminative 3D norph able models with a very deep neural network[C].IEEE Conference on Computer Vision & Pattern Recognition,2017:1493-1502.
[5] CHOI H C,KIM S Y,OH S H,et al.Pose invariant face recognition with 3D morph able model and neural network[J]. IEEE International Joint Conference on Neural Networks,2008,48(1):4131-4136.
[6] HE K,SUN J.Convolutional neural networks at constrained time Cost[C].IEEE Conference on Computer Vision & Pattern Recognition,2015.
[7] TAIGMAN Y,YANG M,RANZATO M A,et al. Deep face:Closingthe gap to human-level performance in face verification[C]//Comput-er Vision and Pattern Recognition,IEEE Conferenceon. IEEE,2014:1701-1708.
[8] MOHADDAM B,PENTLAND A. Probabilistic visual learning for object recognition[J].IEEE Trans.,Pattern Analysisand Machine Intelligence,1997,19(7):696-710.
[9] HUANG T S,YANG G Z.Human face detection in a complex background[J].Pattern Recognition,1994,27(1):53-63.
[10] SAMAL A,IYENGAR P A.Automatic recognition and analysis of human faces and facial expressions:A Survey[J].Elsevier Science,1992,25(1):65-77.
[11] GOLDSTION R J,HARMON L D,LESK A B. Man-machine interaction in human face identification[J]. Bell Syst Tech Journal,2014,51(2):399-427.
[12] PARKER F.Computer Generated Animation of Faces[C].In Proceedings ACM ANN Conference. New York,1972,1:451-457.
[13] ALLEN A L.Personal descriptions[M].Lodon:Butterworth,1950.
[14] GUO S H,YONG X Y. When face recognition meets with deep learning:an evaluation of convolutional neural networks for face recognition[Z].