游清清,諶海云
( 西南石油大學(xué),四川 成都 610500 )
職業(yè)教育培訓(xùn)和學(xué)業(yè)能力考試是企業(yè)和社會(huì)選拔人才的重要手段和主要途徑,培訓(xùn)和考試的種類(lèi)復(fù)雜多樣,難度也越來(lái)越大。隨著社會(huì)競(jìng)爭(zhēng)愈加激烈,學(xué)生或考生為了取得好成績(jī),在相關(guān)考試中使用各種各樣的作弊手段,極大影響考試的公平性。如何保證考試的公平公正,是亟待解決的主要問(wèn)題??荚囎鞅资侄沃谐R?jiàn)的夾帶、抄襲、利用電子高科技等作弊方式目前已有較好的解決方法,但是考生替考現(xiàn)象目前僅能通過(guò)傳統(tǒng)的監(jiān)考人員人工驗(yàn)證來(lái)防范。人工驗(yàn)證由于存在驗(yàn)證時(shí)間短、驗(yàn)證人數(shù)多、證件易修改、人為影響等諸多不利因素,無(wú)法完全達(dá)到防作弊效果。隨著計(jì)算機(jī)視覺(jué)的逐步發(fā)展,生物識(shí)別技術(shù)(指紋識(shí)別、虹膜識(shí)別、人臉識(shí)別等)被廣泛應(yīng)用到各個(gè)領(lǐng)域當(dāng)中,其中就包括了身份驗(yàn)證領(lǐng)域?;诖?,本文提出基于人臉識(shí)別的身份驗(yàn)證工具,以加強(qiáng)考試身份驗(yàn)證管理,杜絕替考現(xiàn)象發(fā)生。
目前對(duì)于人臉識(shí)別研究大多是在多訓(xùn)練樣本數(shù)據(jù)集的基礎(chǔ)上進(jìn)行識(shí)別,對(duì)于一些場(chǎng)景,例如信用卡、駕照、個(gè)人身份驗(yàn)證(包括本文涉及到的身份驗(yàn)證情況)等場(chǎng)所,人在注冊(cè)時(shí)只能獲得一幅圖像,在人臉驗(yàn)證時(shí)只有一張訓(xùn)練樣本,從而產(chǎn)生了小樣本問(wèn)題。由于小樣本問(wèn)題僅有單一的訓(xùn)練樣本,無(wú)法從中獲取樣本的類(lèi)內(nèi)信息,傳統(tǒng)的人臉識(shí)別算法識(shí)別效果大大下降,甚至不能使用。
研究表明,不同的人臉具有相似形狀和輪廓,并且由于姿態(tài)、光照、表情等因素導(dǎo)致每個(gè)人人臉圖像的變化也具有較強(qiáng)的相似性,所以區(qū)分每個(gè)類(lèi)的鑒別特征可以從其他類(lèi)學(xué)習(xí)得到?;诖耍墨I(xiàn)[2]中提出通用學(xué)習(xí)框架法來(lái)解決小樣本問(wèn)題,該方法利用通用框架庫(kù)學(xué)習(xí)特征空間,將訓(xùn)練庫(kù)與待測(cè)試樣本投影至該特征空間中,采用距離度量,投影在該特征空間的訓(xùn)練庫(kù)中與待測(cè)試庫(kù)中距離最近的樣本類(lèi)別即待測(cè)試樣本的類(lèi)別。文獻(xiàn)[3]中提出了擴(kuò)展稀疏表示算法(ESRC),利用類(lèi)內(nèi)圖像相減,即用訓(xùn)練庫(kù)中的圖像減去對(duì)應(yīng)的均值圖像,得到擴(kuò)展的訓(xùn)練樣本庫(kù)稱(chēng)作誤差圖像,將誤差圖像與訓(xùn)練樣本組成字典,得到測(cè)試庫(kù)中圖像的稀疏表示,從而對(duì)待檢測(cè)圖像進(jìn)行識(shí)別。該方法雖然提高了識(shí)別率,但是研究發(fā)現(xiàn),ESRC 中使用的字典為固定字典,并不能夠?qū)θ四樳M(jìn)行準(zhǔn)確的描述。因此本文提出使用稀疏變化字典學(xué)習(xí)(SVDL)算法重構(gòu)人臉圖像,通過(guò)多次更新系數(shù)學(xué)習(xí)最稀疏的字典,得到人臉圖像的最優(yōu)表示,從而完成對(duì)待檢測(cè)樣本的識(shí)別,該方法在人臉表情、姿態(tài)光照等發(fā)生變化時(shí)仍具有較好的識(shí)別效果。
稀疏表示(Sparse Represent)最初是為了壓縮重建高維信號(hào)。稀疏表示高維信號(hào)主要是利用一組矩陣(字典)對(duì)原始信息用進(jìn)行線性表示,用較少的數(shù)據(jù)對(duì)原始信息進(jìn)行傳輸、處理存儲(chǔ)等。稀疏表示利用了信號(hào)的稀疏性對(duì)其進(jìn)行數(shù)學(xué)建模,通過(guò)含有少量非零元素的稀疏矩陣反映信號(hào)的性質(zhì)與結(jié)構(gòu),該方法簡(jiǎn)潔高效地表示了信號(hào),較大程度降低了信號(hào)處理過(guò)程中的復(fù)雜度。
給定一個(gè)字典其中M << N,該字典的原子可以張成N維歐式空間,稱(chēng)該字典為過(guò)完備字典。設(shè)向量x為人臉圖像X的向量表示形式,長(zhǎng)度為M。該人臉圖像可由上述過(guò)完備字典線性展開(kāi),即:
其中為系數(shù)向量。
由于過(guò)完備字典Ψ列數(shù)大于行數(shù),因此在上述方程求解過(guò)程中,未知數(shù)大于方程數(shù),即式(1)為欠定的,存在無(wú)窮解。圖像的稀疏表示求解是為了使得系數(shù)向量α盡可能稀疏,即系數(shù)向量中非零元素盡可能少。向量的0-范數(shù)是指向量中非零元素的個(gè)數(shù),由此將圖像的稀疏表示求解問(wèn)題轉(zhuǎn)換為求解下式優(yōu)化問(wèn)題:
假設(shè)系數(shù)向量α為k稀疏的,即向量中非零元素有k個(gè)。這里的x和α為人臉圖像x在時(shí)域空間與Ψ域空間的不同表示,此時(shí)的k≤N,表明該圖像x是可以被壓縮表示的。
在實(shí)際應(yīng)用中,式(2)還可以表示為:
上式指在小于k個(gè)原子的條件下,使得表示誤差盡可能小。
在式(2)求解過(guò)程中,當(dāng)字典Ψ為正交基矩陣時(shí),其解較易得到,但是對(duì)于一個(gè)過(guò)完備字典來(lái)說(shuō),稀疏表示求解問(wèn)題變成了一個(gè)NP難題,且很難對(duì)其進(jìn)行稀疏逼近。一些學(xué)者們通過(guò)數(shù)學(xué)推導(dǎo)發(fā)現(xiàn),在約束等距性條件下,0-范數(shù)與1-范數(shù)求解值相同。因此在滿足約束等距性條件下,一般選擇l1范數(shù)逼近l0范數(shù)。約束等距性是指投影前信息中各元素的距離在投影后各元素之間的保持不變,數(shù)學(xué)描述為對(duì)于一個(gè)整數(shù)s=1,2,…,定義矩陣A的等距常數(shù)δs為滿足下式的值:
在滿足約束等距性條件下,式(4)可轉(zhuǎn)換為式(5)所示。
求解模型(5)得到的系數(shù)向量,可較好反映出圖像信息。在求得系數(shù)向量之后,可根據(jù)過(guò)完備字典Ψ,重構(gòu)出原始圖像,最后通過(guò)比較原始圖像與重構(gòu)圖像之間的表示殘差對(duì)圖像完成最終分類(lèi),殘差r如式(6)所示。
針對(duì)小樣本識(shí)別問(wèn)題,在稀疏表示的基礎(chǔ)上進(jìn)行擴(kuò)展延伸,提出通用框架庫(kù)法,該方法從其他類(lèi)別的數(shù)據(jù)庫(kù)中學(xué)習(xí)到可區(qū)分待檢測(cè)類(lèi)的類(lèi)內(nèi)特征,根據(jù)訓(xùn)練樣本重構(gòu)出測(cè)試圖像,對(duì)其進(jìn)行識(shí)別驗(yàn)證。通用框架庫(kù)法有很多,本文主要采用Yang Meng等人于2013年提出的稀疏變化字典學(xué)習(xí)算法完成小樣本人臉識(shí)別。
稀疏變化字典學(xué)習(xí)的基本原理是將訓(xùn)練庫(kù)中的人臉圖像自適應(yīng)投影在參考子集中,從變化子集中學(xué)習(xí)稀疏變化字典,重構(gòu)出待檢測(cè)人臉可能出現(xiàn)的變化,最后根據(jù)得到的自適應(yīng)投影項(xiàng)與變化字典學(xué)習(xí)項(xiàng)得到人臉圖像的最終表示,并完成人臉的識(shí)別驗(yàn)證。
稀疏變化字典學(xué)習(xí)算法模型如式(7)所示,包含自適應(yīng)投影項(xiàng)和變化字典學(xué)習(xí)項(xiàng)。
其中,D為待學(xué)習(xí)的字典,γi為gi的稀疏表示,為自適應(yīng)投影項(xiàng),為變化字典學(xué)習(xí)項(xiàng)。在變化字典學(xué)習(xí)項(xiàng)中,通過(guò)稀疏向量γi將變化矩陣Xi投影到字典D上得到訓(xùn)練庫(kù)的變化矩陣。
自適應(yīng)投影項(xiàng)主要是將訓(xùn)練庫(kù)中的圖像自適應(yīng)在投影參考子集中,訓(xùn)練圖庫(kù)中的第i個(gè)人臉可由參考子集近似得到,即因此自適應(yīng)投影項(xiàng)可定義為:
訓(xùn)練庫(kù)對(duì)應(yīng)的具有其他變化的圖像定義為Yi(即為待測(cè)試圖像),可近似表示為:
由于待測(cè)試人臉圖像的變化較多且未知,使得變化矩陣維數(shù)過(guò)大且冗余,因此使用一個(gè)較為簡(jiǎn)潔緊湊的字典D來(lái)表示待測(cè)試圖像。字典其中dj為字典D的原子。變化字典學(xué)習(xí)項(xiàng)為:
其中為的稀疏表示,為常數(shù)。分別表示系數(shù)矩陣項(xiàng)和字典原子基礎(chǔ)項(xiàng)。
由此可得SVDL算法的整體模型如式(11)所示。
為了求得SVDL模型的最小值,可對(duì)式(11)分成兩部分求解:自適應(yīng)投影項(xiàng)與變化字典學(xué)習(xí)項(xiàng)。
在進(jìn)行替代優(yōu)化前,初始化γi值。
將初始化后的γi值帶入式(10)中,為了描述方便,使得得 :
采用變量交替優(yōu)化的策略求上式解。固定字典D,使用BP算法求解為每個(gè)樣本得到相應(yīng)的Bi,以Bi為初值更新字典D,可將式(13)寫(xiě)為:
使用基于逐列更新策略的KSVD算法更新字典D,更新第i列元素時(shí),其他列元素保持不變,令di表示字典D的第i列元素,Bi表達(dá)稀疏矩陣B的第i行元素,則式(14)可重寫(xiě)為:
式中是固定的,使用K_SVD算法對(duì)上式最小化。根據(jù)以上反復(fù)迭代求得字典D和樣本集Y的稀疏表示矩陣B。
確定字典D和稀疏表示矩陣B之后,式(11)變?yōu)椋?/p>
對(duì)該式求導(dǎo)得最小值,即:
為驗(yàn)證算法的有效性,在不同的數(shù)據(jù)庫(kù)上進(jìn)行對(duì)比,同時(shí)也與目前流行的算法(PCA、SVM、SRC、CRC、ESRC等)進(jìn)行了比較,結(jié)果如下所述。
1)AR數(shù)據(jù)庫(kù)測(cè)試
進(jìn)行實(shí)驗(yàn)時(shí),將AR數(shù)據(jù)庫(kù)分為s1和s2,兩個(gè)庫(kù)包含了光照、表情、遮擋等變化,分別進(jìn)行實(shí)驗(yàn)后結(jié)果如表1和表2所示。
2)CMU-PIE數(shù)據(jù)庫(kù)測(cè)試
將CMU-PIE數(shù)據(jù)庫(kù)分為四個(gè)部分(s1、s2、s3),其中s1為不同光照下的人臉,s2為不同表情的人臉、s3為不同姿態(tài)的人臉,結(jié)果如表3所示。
3)Extended YaleB數(shù)據(jù)庫(kù)測(cè)試
Extended YaleB數(shù)據(jù)庫(kù)包含了38個(gè)志愿者在9種姿態(tài)、64種光照下采集的人臉圖像,每人64張,實(shí)驗(yàn)結(jié)果如表4所示。
表1 AR數(shù)據(jù)庫(kù)對(duì)比實(shí)驗(yàn)(s1)
表2 AR數(shù)據(jù)庫(kù)對(duì)比實(shí)驗(yàn)(s2)
表3 CMU-PIE-database
表4 Extended YaleB
(4)自建庫(kù)測(cè)試
為選擇合適的通用數(shù)據(jù)庫(kù)應(yīng)用在實(shí)踐中,在自建庫(kù)中進(jìn)行實(shí)驗(yàn)。分別選擇AR數(shù)據(jù)庫(kù)、CMU-PIE數(shù)據(jù)庫(kù)、ORL數(shù)據(jù)、FERET數(shù)據(jù)庫(kù)、Extended YaleB數(shù)據(jù)庫(kù)作為通用數(shù)據(jù)庫(kù),自建庫(kù)中每類(lèi)人臉的第二張圖像為訓(xùn)練圖像,其余為測(cè)試圖像,實(shí)驗(yàn)結(jié)果如表5所示。
表5 FERET-database
從稀疏變化字典學(xué)習(xí)算法在不同的人臉數(shù)據(jù)庫(kù)上進(jìn)行的實(shí)驗(yàn)可以看出,該算法通過(guò)使用通用框架庫(kù),提取了樣本的類(lèi)內(nèi)信息,解決了小樣本問(wèn)題,并增強(qiáng)了算法對(duì)光照表情變化的魯棒性,與傳統(tǒng)的識(shí)別算法相比,一定程度上提高了識(shí)別效果。
根據(jù)系統(tǒng)功能,設(shè)計(jì)了驗(yàn)證系統(tǒng),其整體框架見(jiàn)圖1。系統(tǒng)主要包括三大功能模塊,分別是信息管理模塊、身份驗(yàn)證模塊和數(shù)據(jù)通訊模塊。信息管理模塊主要負(fù)責(zé)存儲(chǔ)管理從終端下載到的信息,實(shí)時(shí)人臉圖像采集和學(xué)員考生信息讀取。身份驗(yàn)證模塊主要功能是負(fù)責(zé)身份驗(yàn)證,數(shù)據(jù)通訊模塊主要用于數(shù)據(jù)傳輸、與后臺(tái)數(shù)據(jù)庫(kù)信息交互。
圖1 系統(tǒng)框架
針對(duì)上述系統(tǒng)總體框架及流程,對(duì)系統(tǒng)進(jìn)行仿真實(shí)現(xiàn)??荚囬_(kāi)始時(shí),考生手持相應(yīng)證件經(jīng)過(guò)身份驗(yàn)證系統(tǒng),讀寫(xiě)器讀取相關(guān)信息,檢索該考生所處考場(chǎng),通過(guò)對(duì)比信息判斷是否為本考場(chǎng)考生,如不是,給出相應(yīng)提示,見(jiàn)圖2。
圖2 不屬于本考場(chǎng)界面
考場(chǎng)確認(rèn)無(wú)誤后進(jìn)行人臉驗(yàn)證,系統(tǒng)獲取人臉圖像之后,對(duì)圖像進(jìn)行處理,與庫(kù)中模擬人臉進(jìn)行比較,選擇誤差最小的作為擬身份,將考生信息與擬身份進(jìn)行比較,相一致則匹配成功并顯示考生基本信息,若無(wú)法匹配則提醒監(jiān)考人員采取人工復(fù)核,避免系統(tǒng)誤檢,見(jiàn)圖3和圖4。
圖3 識(shí)別成功
圖4 誤檢提示
本文采用稀疏變化字典學(xué)習(xí)算法,利用通用框架庫(kù)的思想,解決了小樣本問(wèn)題中難以獲取樣本類(lèi)內(nèi)信息的問(wèn)題,同時(shí)對(duì)光照、表情、姿態(tài)等變化有好的魯棒性,得到更高的人臉識(shí)別精度,在此基礎(chǔ)上建立了身份驗(yàn)證系統(tǒng),具有實(shí)時(shí)有效特性。
[1]王科俊,段勝利,馮偉興.單訓(xùn)練樣本人臉識(shí)別技術(shù)綜述[J].模式識(shí)別與人工智能,2008,21(5).
[2]Wang J,Plataniotis K N,LuJ,etal.On solving the face recognition problem with one training sample per subject[J].Pattern recognition, 2006,39(9):1746-1762.
[3]Deng W,HuJ,GuoJ.ExtendedSRC:undersampledface recognition via intraclass variant dictionary[J].IEEE transactions on pattern analysis &machine intelligen ce,2012,34(9):1864-1870.