吳 杰,段 錦,,董鎖芹,李英超
1.長(zhǎng)春理工大學(xué) 電子信息工程學(xué)院,長(zhǎng)春130022
2.長(zhǎng)春理工大學(xué) 空間光電技術(shù)研究所 基礎(chǔ)技術(shù)實(shí)驗(yàn)室,長(zhǎng)春130022
跨年齡的人臉識(shí)別,即將目標(biāo)年齡人臉與數(shù)據(jù)庫(kù)中存儲(chǔ)的面部圖像進(jìn)行對(duì)比,分析其相似的程度[1]。FRVT 2002[2]表明,面部年齡每增加3年,與數(shù)據(jù)庫(kù)中的樣本識(shí)別率平均下降20%。通過(guò)國(guó)內(nèi)外對(duì)跨年齡人臉識(shí)別研究,將方法分為兩類(lèi):一是利用特征學(xué)習(xí)進(jìn)行跨年齡人臉識(shí)別[3-6],主要獲得變化的特征,從而達(dá)到跨年齡認(rèn)同的目的,當(dāng)臉部年齡較大時(shí),此方法的實(shí)驗(yàn)結(jié)果較差[6]。另一種方法是使用面部年齡模擬執(zhí)行跨年齡面部識(shí)別[7],該方法的實(shí)驗(yàn)效果略好,但是模擬的人臉圖像細(xì)節(jié)較差,對(duì)識(shí)別存在一定影響[8]。
針對(duì)上述問(wèn)題,并結(jié)合近幾年來(lái)生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)在圖像處理和機(jī)器視覺(jué)領(lǐng)域中良好的實(shí)驗(yàn)效果[9],本文對(duì)生成對(duì)抗網(wǎng)絡(luò)技術(shù)展開(kāi)深入研究,提出了一種基于生成對(duì)抗網(wǎng)絡(luò)技術(shù)的人臉跨年齡段識(shí)別方法DFΜ-GAN(Depth Feature Μigration GAN)。該方法結(jié)合條件性對(duì)抗自動(dòng)編碼器和深度特征遷移,模擬生成待檢人員在不同年齡段的面部圖像,利用生成圖像與數(shù)據(jù)庫(kù)中所保存的圖像進(jìn)行相似性比對(duì)。通過(guò)深度特征遷移進(jìn)一步減少隨著年齡增大而帶來(lái)的人臉細(xì)節(jié)差異,提高存在年齡差的人臉識(shí)別率[10]。同時(shí)為了解決生成人臉圖像邊緣不清晰的問(wèn)題,首先對(duì)樣本數(shù)據(jù)集做高斯邊緣模糊處理,使真實(shí)人臉圖像的邊緣風(fēng)格在生成器中起主導(dǎo)作用,并引入邊緣提升的對(duì)抗損失函數(shù),最后使用局部顏色直方圖匹配,增加人臉圖像真實(shí)感。本文設(shè)計(jì)了單樣本不同年齡人臉識(shí)別實(shí)驗(yàn)與特定年齡段的多樣本人臉識(shí)別實(shí)驗(yàn),由實(shí)驗(yàn)結(jié)果可知,本文所提出方法在一定年齡區(qū)間內(nèi)經(jīng)DFΜ-GAN生成的模擬人臉圖像在用于跨年齡識(shí)別時(shí),其識(shí)別準(zhǔn)確率明顯高于未經(jīng)DFΜ-GAN處理的跨年齡人臉圖像。
深度遷移學(xué)習(xí)引入了類(lèi)似于生成對(duì)抗網(wǎng)絡(luò)的技術(shù),發(fā)現(xiàn)了適合源域和目標(biāo)域的深度遷移特征,并為機(jī)器學(xué)習(xí)目標(biāo)提供了合理的判斷以實(shí)現(xiàn)有效遷移[11]。圖1顯示了基于對(duì)抗的深度遷移學(xué)習(xí)的示意圖。
圖1 深度特征遷移原理
由圖1可知,網(wǎng)絡(luò)的前層在源域數(shù)據(jù)集的訓(xùn)練過(guò)程中被視為特征提取器,提取源域和目標(biāo)域中特征并將它們輸入到對(duì)抗層,對(duì)抗層用以區(qū)分特征的來(lái)源,如果對(duì)抗網(wǎng)絡(luò)的表現(xiàn)很差,則意味著兩種類(lèi)型的特征之間存在差別,可遷移性更好[12]?;趯?duì)抗的深度遷移學(xué)習(xí)由于其良好的效果和較強(qiáng)的實(shí)用性,近年來(lái)取得了快速發(fā)展。在以下GAN網(wǎng)絡(luò)中,將引入深度特征遷移模塊,使網(wǎng)絡(luò)發(fā)現(xiàn)更多具有可遷移性的通用特征,加強(qiáng)人臉特征學(xué)習(xí)。
GAN是一種無(wú)監(jiān)督的學(xué)習(xí)方法,它巧妙地利用“對(duì)抗”的思想來(lái)學(xué)習(xí)數(shù)據(jù)并生成全新的樣本。GAN 主要由生成器G(Generater)和鑒別器D(Discriminator)兩部分組成。
生成器G 負(fù)責(zé)生成圖片,它通過(guò)接收到的一個(gè)隨機(jī)噪聲z 來(lái)生成圖片,記為G(z)。G 目標(biāo)函數(shù)采用最小化對(duì)數(shù)似然函數(shù),使G(z)的數(shù)據(jù)分布逼近于訓(xùn)練樣本數(shù)據(jù)x 的數(shù)據(jù)分布Pdata(x)。鑒別器D 負(fù)責(zé)判別輸入圖片與G(z)相比真實(shí)性的概率,在訓(xùn)練過(guò)程中生成網(wǎng)絡(luò)G 的目標(biāo)是盡量生成與真實(shí)相近的顏色和紋理的圖片去欺騙判別網(wǎng)絡(luò)D,而D 的目標(biāo)是盡量把G 生成的圖片和真實(shí)的圖片區(qū)分開(kāi)來(lái)[13]?;窘Y(jié)構(gòu)與計(jì)算流程如圖2所示。目標(biāo)函數(shù)如式(1)所示:
其中,z 表示服從某個(gè)分布P(z)隨機(jī)采樣的向量,訓(xùn)練數(shù)據(jù)Pdata(x)。D(x)用于判斷樣本x 是否是從真實(shí)的數(shù)據(jù)分布中采樣的樣本。GAN用于訓(xùn)練人臉的問(wèn)題一是人臉細(xì)節(jié)上豐富度較低,紋理膚色上的豐富度與數(shù)據(jù)庫(kù)樣本偏差較大,問(wèn)題二是對(duì)抗損失在引導(dǎo)生成器生成人臉圖像的過(guò)程中邊緣信息容易損失,給識(shí)別造成難度。
圖2 GAN基本結(jié)構(gòu)與計(jì)算流程
本文結(jié)合GAN網(wǎng)絡(luò)與深度特征遷移模塊[14]提出一種跨年齡人臉生成方法DFΜ-GAN,通過(guò)對(duì)人臉紋理信息屬性在特征空間上的線性插值,增加人臉細(xì)節(jié)信息的豐富度,從而提高生成人臉的真實(shí)性。根據(jù)跨年齡人臉模擬需求設(shè)計(jì)的DFΜ-GAN 的網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。輸入和輸出面部圖像x ∈R128×128×3,編碼器采用的是卷積神經(jīng)網(wǎng)絡(luò)。由于跨步卷積是完全可微的,并且允許網(wǎng)絡(luò)學(xué)習(xí)自己的空間向下采樣,因此采用步幅2 的4 個(gè)卷積層提取人臉特征。生成一個(gè)具有特定特征的人臉,該人臉被包含在z 中,因此引入了一個(gè)編碼器E(Encoder)來(lái)避免z 的隨機(jī)采樣,圖3中實(shí)線框所示。輸入人臉圖像為x,編碼器E 將輸入面x 映射到特征向量。人臉圖像生成器主要是將編碼器產(chǎn)生的z,與一個(gè)標(biāo)簽向量l 拼接,傳入一個(gè)解碼器中映射成高維圖像,使生成的人臉圖像的數(shù)據(jù)分布逼近于訓(xùn)練樣本數(shù)據(jù)x 的數(shù)據(jù)分布Pdata(x)。
圖3 DFΜ-GAN網(wǎng)絡(luò)結(jié)構(gòu)圖
其中,n 是面部特征的維數(shù)。輸出保留了輸入面x 的高級(jí)個(gè)人特征。然后引入深度特征遷移模塊,利用6個(gè)殘差模塊實(shí)現(xiàn)人臉模擬圖像的降維、特征遷移和升維,在生成器輸出端獲取真實(shí)人臉語(yǔ)義信息的特征,使得模擬生成的圖像更加逼真。
在保證生成器網(wǎng)絡(luò)深度不變的情況下,將生成器的下采樣卷積層與殘差模塊中的前三個(gè)作為編碼器,后三個(gè)殘差模塊與上采樣卷積層作為解碼器,中間三個(gè)殘差模塊作為特征遷移模塊。其中殘差模塊如圖4所示。
圖4 殘差模塊結(jié)構(gòu)圖
由圖4可知,通過(guò)快捷鍵的連接實(shí)現(xiàn)殘差元任意層之間的關(guān)聯(lián),圖中x 為殘差元輸入信號(hào),映射F(x)表達(dá)式如式(3)所示:
式中,W2、W2分別是權(quán)重層的權(quán)重,σ 是激勵(lì)函數(shù)relu。這樣在前向傳播的過(guò)程中,殘差網(wǎng)絡(luò)的映射實(shí)際上是連加運(yùn)算。將標(biāo)簽l 與z 連接,生成器G 接受新向量[z,l]的反饋。以l 獨(dú)熱編碼年齡標(biāo)簽為條件,通過(guò)三個(gè)反卷積上采樣恢復(fù)圖片尺寸,生成輸出人臉圖像為:
訓(xùn)練中輸入和輸出人臉的損失函數(shù)如下:
其中,L(x,G(E(x),l))表示L2范數(shù)。編碼器E 和生成器G 都是根據(jù)輸入和輸出面之間的損失函數(shù)L2進(jìn)行更新。同時(shí),通過(guò)Dz判斷器在z 上施加均勻分布。同樣,在條件l 下,面部判斷器和生成器可以通過(guò)式(6)訓(xùn)練。
由于加入了深度特征遷移模塊,自編碼器需要在低維空間域?qū)θ四樳M(jìn)行重建,因此模型優(yōu)化目標(biāo)中,增加一項(xiàng)最小化圖像重構(gòu)誤差的損失函數(shù),最終內(nèi)容損失函數(shù)如下:
其中,TV(?)表示有效去除重影偽影的總變差,系數(shù)λ和γ 平衡了平滑度和高分辨率,Lrec為重建損失。內(nèi)容損失函數(shù)負(fù)責(zé)引導(dǎo)生成器輸出人臉圖像,判斷器Dz在z 上施加均勻分布,并且判斷使輸出給定的年齡標(biāo)簽的人臉圖像更加真實(shí)。
對(duì)抗性損失依賴(lài)于生成網(wǎng)絡(luò)G 和鑒別網(wǎng)絡(luò)D,它影響了生成網(wǎng)絡(luò)G 中的圖像變換過(guò)程,它的值表示輸出圖像與輸入圖像的相似程度。只通過(guò)訓(xùn)練鑒別器D分離真實(shí)樣本的圖像并生成遷移圖像是不夠的,這是因?yàn)閿?shù)據(jù)庫(kù)樣本的人臉輪廓干擾生成圖像產(chǎn)生陰影,甚至過(guò)擬合[15]。清晰邊緣的圖像呈現(xiàn)有助于人臉圖像變換后的識(shí)別,但這些邊緣的比例在整個(gè)圖像中通常非常小,因此,如果一個(gè)輸出圖像沒(méi)有明確的重建邊緣,但是它擁有正確的邊緣陰影,可能會(huì)使受過(guò)訓(xùn)練的鑒別者產(chǎn)生錯(cuò)誤的判決,從而使生成的圖像邊緣模糊化。參考文獻(xiàn)[16]提出的將圖片轉(zhuǎn)化成漫畫(huà)的風(fēng)格遷移方法,改進(jìn)了本次實(shí)驗(yàn)的圖像集,將圖像集通過(guò)canny算子檢測(cè)出輸入圖像的主要輪廓,然后引入新的對(duì)抗損失函數(shù)。具體過(guò)程為使用式(8)作為一對(duì)卷積陣列,使用式(9)計(jì)算梯度幅值和方向:
然后進(jìn)行邊緣膨脹,最后通過(guò)高斯濾波器將高頻區(qū)域的邊緣濾除,使其變得模糊。具體目的是為了通過(guò)新生成的樣本數(shù)據(jù)集使鑒別器學(xué)習(xí)分辨弱邊緣圖像的能力,邊緣提升對(duì)抗損失函數(shù)定義如式(10)所示:
其中,P(c)表示跨年齡圖像分布,P(e)表示弱化邊緣的樣本圖像分布。根據(jù)生成器的設(shè)定,G(x)是一張跨年齡人臉圖片,目標(biāo)是使訓(xùn)練判別器D 概率最大化將正確的標(biāo)簽分配給G(x),以便生成器通過(guò)將輸入轉(zhuǎn)換為G 可以正確引導(dǎo)的人臉圖像,達(dá)到弱化風(fēng)格圖像邊緣,保留真實(shí)圖像邊緣的效果。
基于DFΜ-GAN生成后的圖像顏色存在一定退化,圖片的色調(diào)變成了暗黃色,失去了原來(lái)色彩豐富、對(duì)比明顯的特點(diǎn),影響現(xiàn)實(shí)感。因此,本文使用局部顏色直方圖匹配的方法來(lái)解決這一類(lèi)的問(wèn)題,對(duì)生成后的圖片進(jìn)行進(jìn)一步增強(qiáng)。局部顏色直方圖匹配,是指在全局顏色直方圖匹配的基礎(chǔ)上,將圖片劃分為面積相等的m×n塊。如圖5所示,將源圖像S 劃分為m×n 個(gè)小塊:
將目標(biāo)圖像C 劃分為m×n 個(gè)小塊:
分別對(duì)每個(gè)對(duì)應(yīng)塊進(jìn)行直方圖匹配,得到每個(gè)塊的源圖像S 和目標(biāo)圖像C 概率分布函數(shù):
再分別求得每個(gè)對(duì)應(yīng)分塊的逆映射:
圖5 局部顏色直方圖匹配原理圖
將經(jīng)過(guò)匹配的每個(gè)小塊ti(i=1,2,…,m×n)按編號(hào)順序拼合,則可得到經(jīng)過(guò)匹配的圖像T :
跨年齡人臉識(shí)別在尋找被拐兒童、不同年齡人臉辨別、辨認(rèn)多年前的罪犯、預(yù)測(cè)兒童長(zhǎng)相變化等方面起到重要的作用。用于對(duì)本文所提系統(tǒng)進(jìn)行訓(xùn)練和測(cè)試的跨人臉年齡數(shù)據(jù)庫(kù)是ΜORPH Album2[17]和UTΚface 數(shù)據(jù) 庫(kù)[18]。Album 2 包含了約10 000 個(gè) 人 的55 134 張圖像,數(shù)據(jù)庫(kù)中人的年齡從16歲到77歲,平均每個(gè)人有6張人臉圖片。
(1)年齡分組
實(shí)際上,年齡是一個(gè)連續(xù)變量,但是考慮到相鄰年齡的面部圖像差異很小,例如20 歲的面部特征和21 歲的面部特征幾乎沒(méi)有差異,但是20 歲的面孔特征與30歲的面孔特征之間的區(qū)別仍然很明顯。因此,設(shè)計(jì)中的年齡分為10類(lèi),0~5,6~10,11~15,16~20,21~30,31~40,41~50,51~60,61~70 和71~80,使用10 個(gè)元素的獨(dú)熱編碼來(lái)指示訓(xùn)練期間每個(gè)面部的年齡。
(2)測(cè)試數(shù)據(jù)集
在跨年齡人臉識(shí)別實(shí)驗(yàn)中,樣本庫(kù)主要分為兩類(lèi):沒(méi)有指定年齡的跨年齡人臉圖像樣本和相同年齡組的跨年齡人臉圖像樣本。
本類(lèi)樣本獲取9 000 組,每組兩張人臉圖片,總計(jì)18 000張人臉樣本。部分樣本如圖6(a)所示。
與沒(méi)有指定年齡的跨年齡人臉圖像樣本相比,同一個(gè)人指定的相同年齡的跨年齡人臉圖像樣本的數(shù)量相對(duì)較少。此類(lèi)樣本是從2 500組中獲得的,每組中有5個(gè)樣本,總共有12 500 個(gè)面部樣本圖像,其中一些樣本如圖6(b)所示。從左到右,它代表一個(gè)人的15、20、30、40、50歲年齡段的面部圖像。
圖6 人臉數(shù)據(jù)庫(kù)部分樣本
本文使用的方法是模擬特定年齡的人臉圖像生成新的人臉圖像,減少類(lèi)別中樣本的變異性和年齡變化對(duì)面部特征信息的影響。因此,本文采用人臉相似度和人臉距離兩個(gè)指標(biāo)進(jìn)行實(shí)驗(yàn)研究。在Eyekey平臺(tái)上分別由數(shù)據(jù)庫(kù)樣本對(duì)經(jīng)DFΜ-GAN 生成圖像樣本和真實(shí)樣本兩者進(jìn)行人臉相似性實(shí)驗(yàn),數(shù)據(jù)庫(kù)人臉識(shí)別率與相似度成正比。并通過(guò)Openface 進(jìn)行人臉距離實(shí)驗(yàn),通過(guò)HOG 算法給數(shù)據(jù)庫(kù)測(cè)試樣本圖片編碼,找到面部主要特征點(diǎn),通過(guò)測(cè)量經(jīng)DFΜ-GAN生成圖像樣本與真實(shí)樣本的特征點(diǎn),計(jì)算兩者與數(shù)據(jù)庫(kù)樣本特征點(diǎn)的距離值,數(shù)據(jù)庫(kù)人臉識(shí)別率與人臉距成反比[19]。綜上所述,相似度越高,人臉距離越小,人臉識(shí)別率越高。
本節(jié)的實(shí)驗(yàn)主要是跨年齡的人臉驗(yàn)證實(shí)驗(yàn)。即給定一對(duì)具有年齡跨度的面部圖像,確定這兩個(gè)圖像是否屬于同一個(gè)人[20]。在訓(xùn)練過(guò)程中,損失函數(shù)取不同的λ、γ 值,對(duì)實(shí)驗(yàn)效果進(jìn)行比較,本文所采用的訓(xùn)練模型λ=100,γ=10,學(xué)習(xí)率為0.000 2。訓(xùn)練過(guò)程中分為50 epoch,每個(gè)epoch 分為236 個(gè)batch。實(shí)驗(yàn)配置為Intel Core i7-6700 CPU 處理器、GeForce GTX 2060 顯卡的服務(wù)器;網(wǎng)絡(luò)的程序設(shè)計(jì)語(yǔ)言為Python 2.7,采用的是Tensor-Flow-1.13.0 版本的深度學(xué)習(xí)框架。網(wǎng)絡(luò)模型數(shù)據(jù)庫(kù)部分樣本人臉圖像如圖7所示。
圖7 數(shù)據(jù)庫(kù)部分樣本
以圖7(a)為例,第一行真實(shí)樣本作為輸入圖像,經(jīng)DFΜ-GAN網(wǎng)絡(luò)生成指定年齡段的生成圖像,將真實(shí)樣本和生成圖像分別與第二行數(shù)據(jù)庫(kù)樣本圖像進(jìn)行人臉相似度與人臉距測(cè)量實(shí)驗(yàn),結(jié)合兩個(gè)指標(biāo)進(jìn)行實(shí)驗(yàn)研究。本實(shí)驗(yàn)主要設(shè)計(jì)了兩組實(shí)驗(yàn):一是單樣本不同年齡實(shí)驗(yàn),即指定圖7測(cè)試樣本中的某一個(gè)樣本與其在不同年齡階段的真實(shí)樣本,分別對(duì)不同年齡的人臉圖像進(jìn)行DFΜ-GAN算法變換,用生成后的新圖像與真實(shí)樣本分別與測(cè)試樣本進(jìn)行人臉相似度和人臉距實(shí)驗(yàn)。二是指定年齡多樣本實(shí)驗(yàn),即從圖7測(cè)試樣本選擇多個(gè)人臉圖像,并在指定年齡段中找到其對(duì)應(yīng)的真實(shí)樣本,分別對(duì)不同人在指定年齡的真實(shí)樣本進(jìn)行DFΜ-GAN 算法變換,用生成后的新圖像與真實(shí)樣本分別與測(cè)試樣本進(jìn)行人臉相似度和人臉距實(shí)驗(yàn)。
首先,以15 歲左右人臉圖像作為數(shù)據(jù)庫(kù)樣本,20、30、40、50 年齡段真實(shí)樣本人臉圖像作為輸入圖像,經(jīng)DFΜ-GAN算法生成相應(yīng)年齡段的生成人臉圖像,實(shí)驗(yàn)效果以圖8為例。
圖8 各年齡段真實(shí)樣本圖像與生成圖像
最后,真實(shí)樣本和生成圖像分別與數(shù)據(jù)庫(kù)樣本進(jìn)行人臉相似度與人臉距實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)曲線圖如圖9所示。
圖9 樣本實(shí)驗(yàn)數(shù)據(jù)曲線圖
由圖9 可知,在20 年齡段時(shí),相比較DFΜ-GAN 生成圖像真實(shí)樣本的相似度高而人臉距低,即人臉識(shí)別率高,與在30 年齡段兩者基本持平,而在40、50 年齡段,DFΜ-GAN 生成人臉圖像的識(shí)別率高于真實(shí)樣本。為避免樣本偶然性,進(jìn)行多組樣本的實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)取其平均值,數(shù)據(jù)如表1所示。
表1 實(shí)驗(yàn)樣本平均數(shù)據(jù)表
由于每個(gè)人的外貌受遺傳和生活條件影響所反映的規(guī)律不相同,但通過(guò)平均數(shù)據(jù)可以看出,20歲年齡組真實(shí)樣本的人臉識(shí)別率高于它的生成圖像,主要是15歲的人臉距和20歲的人臉距具有較小的時(shí)間跨度和較小的面部特征變化。30歲真實(shí)樣本的面部識(shí)別率與生成的圖像基本相同;但在40、50 年齡段其DFΜ-GAN 生成圖像的人臉識(shí)別率高于真實(shí)樣本圖像,其中平均相似度提高了3.52 個(gè)百分點(diǎn)、4.96 個(gè)百分點(diǎn),人臉距縮小了0.207、0.282。隨著年齡的增長(zhǎng),人臉特征變化越來(lái)越大,DFΜ-GAN生成圖像的人臉識(shí)別率越高于真實(shí)樣本。
為了進(jìn)一步驗(yàn)證DFΜ-GAN 算法生成的人臉圖像相比于真實(shí)圖像對(duì)數(shù)據(jù)庫(kù)樣本有更高的識(shí)別率,以15~20 年齡段人臉作為數(shù)據(jù)庫(kù),指定年齡段為21~30,31~40,41~50,51~60,61~70,71~80 的真實(shí)樣本和真實(shí)樣本經(jīng)過(guò)DFΜ-GAN算法的生成圖像作為測(cè)試樣本,分別與數(shù)據(jù)庫(kù)樣本進(jìn)行相似度和人臉距的實(shí)驗(yàn)驗(yàn)證,進(jìn)行多樣本實(shí)驗(yàn),部分?jǐn)?shù)據(jù)結(jié)果如圖10所示。
圖10 中通過(guò)部分實(shí)驗(yàn)圖像可以看出,輸入的真實(shí)樣本圖像與數(shù)據(jù)庫(kù)測(cè)試圖像的相似度明顯低于DFΜGAN生成圖像,人臉距也高于DFΜ-GAN生成圖像,且經(jīng)過(guò)DFΜ-GAN生成后的圖像沒(méi)有發(fā)生人臉輪廓變化、器官位置移動(dòng)和膚色對(duì)比度失真等問(wèn)題,說(shuō)明改進(jìn)后的網(wǎng)絡(luò)在一定程度上克服了生成式對(duì)抗網(wǎng)絡(luò)自身的模式崩塌問(wèn)題。其中年齡段為40~50 的部分實(shí)驗(yàn)數(shù)據(jù)曲線如圖11所示。
實(shí)驗(yàn)數(shù)據(jù)集進(jìn)行如圖11 的實(shí)驗(yàn)測(cè)量,結(jié)果顯示,DFΜ-GAN 生成圖像的相似度遠(yuǎn)高于真實(shí)樣本的相似度,DFΜ-GAN生成圖像的人臉距遠(yuǎn)低于真實(shí)樣本的人臉距。DFΜ-GAN生成圖像的相似度最大提升21.22個(gè)百分點(diǎn),平均提高了19.24個(gè)百分點(diǎn),DFΜ-GAN生成圖像的人臉距離最大減少了0.615,平均減少了0.451。結(jié)合以上實(shí)驗(yàn)數(shù)據(jù)的結(jié)果,進(jìn)行人臉驗(yàn)證識(shí)別率統(tǒng)計(jì),采用不同的人臉驗(yàn)證識(shí)別閾值,統(tǒng)計(jì)不同閾值對(duì)應(yīng)的驗(yàn)證識(shí)別率,統(tǒng)計(jì)實(shí)驗(yàn)結(jié)果如圖12所示。
圖10 年齡跨度較大的人臉識(shí)別率實(shí)驗(yàn)結(jié)果與數(shù)據(jù)圖
圖12 人臉識(shí)別率對(duì)比圖
圖12 首先印證了實(shí)驗(yàn)評(píng)價(jià)指標(biāo)中人臉相似度、人臉距和識(shí)別率之間關(guān)系的準(zhǔn)確性。在不同相似度閾值和人臉距閾值下,真實(shí)樣本經(jīng)過(guò)DFΜ-GAN算法后生成的人臉圖像對(duì)于數(shù)據(jù)庫(kù)樣本有著更高的識(shí)別率,當(dāng)相似度達(dá)到75%時(shí),真實(shí)樣本的識(shí)別率不足50%,而本文算法可以到達(dá)65%以上。當(dāng)人臉距高于0.45時(shí),真實(shí)樣本的識(shí)別率不足50%,而本文算法人臉識(shí)別率高于62%,說(shuō)明在跨年齡人臉識(shí)別上可行性較大。
實(shí)驗(yàn)說(shuō)明在跨年齡人臉識(shí)別方面,將不同年齡段真實(shí)樣本經(jīng)過(guò)DFΜ-GAN算法處理生成新的人臉圖像,相比于真實(shí)樣本對(duì)數(shù)據(jù)庫(kù)樣本有著更高的重合度,即對(duì)同類(lèi)樣本的人臉識(shí)別率更高。
為了驗(yàn)證其他相關(guān)算法對(duì)跨年齡人臉識(shí)別率的影響,分別使用GAN、pixtopix、CycleGAN 和CAAE 四種算法,對(duì)相同訓(xùn)練樣本,按照上述實(shí)驗(yàn)設(shè)計(jì)在相同實(shí)驗(yàn)環(huán)境下做同等實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果使用Eyekey 平臺(tái)進(jìn)行人臉相似度實(shí)驗(yàn),在Openface 下進(jìn)行人臉距實(shí)驗(yàn),對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行統(tǒng)計(jì),并與DFΜ-GAN算法在不同年齡段的人臉進(jìn)行識(shí)別率比較,得到表2。
由表2 可知,在跨年齡人臉識(shí)別中,真實(shí)樣本經(jīng)過(guò)GAN、CycleGAN、pixtopix 和CAAE 四種算法均可以一定程度上提高人臉的識(shí)別率。GAN網(wǎng)絡(luò)自身存在訓(xùn)練難的問(wèn)題,識(shí)別率相對(duì)真實(shí)樣本提高最少,相似度相比較真實(shí)樣本提高1.85 個(gè)百分點(diǎn),人臉距減少了0.034;pixtopix 和CycleGAN 是GAN 的改進(jìn)版本,通過(guò)改進(jìn)損失函數(shù)實(shí)現(xiàn)數(shù)據(jù)庫(kù)之間的圖像風(fēng)格轉(zhuǎn)換,相似度相比較真實(shí)樣本提高4.9個(gè)百分點(diǎn)、5.51個(gè)百分點(diǎn),人臉距減少了0.046、0.145;CAAE 在GAN 網(wǎng)絡(luò)模型基礎(chǔ)加了兩個(gè)判別器,使得人臉差距進(jìn)一步減少,相似度相比較真實(shí)樣本提高12.9 個(gè)百分點(diǎn),人臉距減少了0.151。而加入了深度特征遷移的DFΜ-GAN 算法減少了同樣本之間的差異性,并引入邊緣提升對(duì)抗損失函數(shù),將引導(dǎo)生成器生成的人臉在相似度與人臉距方面都高于其他算法,相似度相比較真實(shí)樣本提高19.42 個(gè)百分點(diǎn),人臉距減少了0.175,在實(shí)驗(yàn)上取得識(shí)別率最高的效果。
表2 幾種算法在不同年齡段的平均人臉識(shí)別率比較
與真實(shí)樣本圖像相比,DFΜ-GAN生成的圖像的平均相似度提高了19.42 個(gè)百分點(diǎn),平均人臉距減小了0.175,這減少了類(lèi)樣本之間的差異,說(shuō)明經(jīng)過(guò)一定圖像變換,有利于提高跨年齡人臉識(shí)別率,引入的深度特征遷移有利于生成對(duì)抗網(wǎng)絡(luò)對(duì)人臉信息的進(jìn)一步提取和模擬,邊緣提升對(duì)抗損失函數(shù)也在一定程度上解決了生成器人臉邊緣不清晰的問(wèn)題。本文受個(gè)人研究時(shí)間、硬件條件等因素影響,仍有一些研究?jī)?nèi)容需要進(jìn)一步完善,具體如下:
(1)對(duì)跨年齡人臉識(shí)別人臉庫(kù)有一定的要求,例如正臉的效果優(yōu)于有傾斜角度人臉的效果,尤其在傾斜角度較大情況下,模擬出的人臉會(huì)出現(xiàn)失真的現(xiàn)象,網(wǎng)絡(luò)輸入的圖像需要事先矯正、歸一化。
(2)在網(wǎng)絡(luò)上DFΜ-GAN 同樣存在訓(xùn)練不穩(wěn)定、梯度消失等不足,未來(lái)可以參考文獻(xiàn)[21]改進(jìn)損失函數(shù)并優(yōu)化判別網(wǎng)絡(luò),從而使網(wǎng)絡(luò)訓(xùn)練穩(wěn)定,生成特征點(diǎn)更加豐富的人臉圖像來(lái)提高識(shí)別率,使本文方法在現(xiàn)實(shí)生活中得到更好、更全面的實(shí)際應(yīng)用。