秦曉倩 劉大琨
1(淮陰師范學(xué)院城市與環(huán)境學(xué)院 江蘇 淮安 223300) 2(鹽城工學(xué)院機(jī)械工程學(xué)院 江蘇 鹽城 224051)
親屬關(guān)系驗(yàn)證的目標(biāo)是通過(guò)學(xué)習(xí)得到一個(gè)分類模型,以判斷給定的人臉圖像是否具有父子(FS)、父女(FD)、母子(MS)和母女(MD)等直接血親關(guān)系。分類模型所獲知的對(duì)象間的關(guān)系信息可被應(yīng)用于人臉識(shí)別、社會(huì)媒體分析、人臉標(biāo)注和圖像追蹤等[1]。已有的親屬關(guān)系驗(yàn)證方法可大致分為基于特征的和基于相似性學(xué)習(xí)的。Fang等[2]率先提出利用一些包括器官顏色、人臉的結(jié)構(gòu)和紋理信息等特征來(lái)刻畫親屬關(guān)系人臉圖像。此后,研究者提出了其他多種不同的特征[3-7]以及屬性[8]。還有一些工作提出融合多種特征[9-12]來(lái)刻畫親屬關(guān)系人臉圖像。基于相似性學(xué)習(xí)的方法學(xué)習(xí)一個(gè)特征轉(zhuǎn)換空間,以達(dá)到更好地刻畫親屬關(guān)系樣本間相似性的目的。其中,文獻(xiàn)[13-16]使用遷移學(xué)習(xí)來(lái)減少年老父母與子女間的臉部外觀差異。度量學(xué)習(xí)方法是該類別中另一有效的驗(yàn)證方法,其主要目標(biāo)是學(xué)習(xí)某個(gè)相似性度量,以使得親屬關(guān)系樣本間相似性大于非親屬關(guān)系樣本。已有的度量學(xué)習(xí)方法又可以進(jìn)一步根據(jù)所要學(xué)習(xí)的特征轉(zhuǎn)換矩陣的個(gè)數(shù),繼續(xù)劃分為僅學(xué)習(xí)一個(gè)轉(zhuǎn)換矩陣的單度量學(xué)習(xí)[9,17]和學(xué)習(xí)多個(gè)轉(zhuǎn)換矩陣的多度量學(xué)習(xí)[10-11,18-23]兩種類型。Zhao等[24]和Liang等[25]則結(jié)合了度量學(xué)習(xí)與核方法,學(xué)習(xí)一個(gè)非線性的特征轉(zhuǎn)換矩陣。近期,深度學(xué)習(xí)亦被引入到親屬關(guān)系驗(yàn)證任務(wù)中[18,26],但卻無(wú)法避免親屬關(guān)系人臉圖像的數(shù)據(jù)量較少這一問(wèn)題。Yan等[27]則使用基于人臉圖像的親屬關(guān)系驗(yàn)證工作中主流的幾種度量學(xué)習(xí)方法來(lái)對(duì)視頻中的親屬關(guān)系進(jìn)行判斷,但仍只是簡(jiǎn)單地將視頻中所有幀的均值作為某主體對(duì)象的最終的特征表示,從本質(zhì)上來(lái)看,仍然是基于圖像的。
盡管已經(jīng)有許多用于親屬關(guān)系驗(yàn)證的度量學(xué)習(xí)方法,但已有方法中的大多數(shù)都是直接在每種親屬關(guān)系訓(xùn)練樣本上統(tǒng)一學(xué)習(xí),而鮮有討論年齡跨度對(duì)學(xué)習(xí)模型的影響。但是,隨著人的年齡增長(zhǎng),人臉外觀會(huì)在形狀和紋理上發(fā)生顯著變化,這都將增加親屬關(guān)系驗(yàn)證的難度。另外,Xia等[13]的實(shí)驗(yàn)結(jié)果也表明,主體對(duì)象的年齡跨度越大,外觀相似性越低,如圖1所示,圖1(a)是孩子和其父/母在年輕時(shí)的人臉圖像對(duì),圖1(b)是該孩子和其父/母在年老時(shí)的人臉圖像對(duì),觀察發(fā)現(xiàn),圖1(a)中對(duì)象間的相似程度更高。對(duì)分類模型來(lái)講,這些具有不同相似程度的樣本對(duì)模型的影響程度截然不同。
圖1 不同年齡跨度的親屬關(guān)系圖像對(duì)
本文提出一種年齡跨度感知的多任務(wù)學(xué)習(xí)方法,通過(guò)在具有不同年齡跨度的親屬關(guān)系樣本間共享判別信息的方法,達(dá)到利用更多判別信息的目的。所提出的方法在學(xué)習(xí)時(shí)區(qū)別對(duì)待由年齡跨度不同所引起的在相似程度上存在差異的樣本對(duì),而不是簡(jiǎn)單地統(tǒng)一學(xué)習(xí),解決了年齡跨度對(duì)親屬關(guān)系驗(yàn)證的影響問(wèn)題。
本文的主要工作如下:
(1) 在多任務(wù)學(xué)習(xí)框架下,將具有不同年齡跨度的親屬關(guān)系驗(yàn)證問(wèn)題分別看作一個(gè)學(xué)習(xí)任務(wù),聯(lián)合學(xué)習(xí)兩類特征轉(zhuǎn)換矩陣,其中一類由所有學(xué)習(xí)任務(wù)共享,另一類則由每個(gè)學(xué)習(xí)任務(wù)獨(dú)享,以利用具有不同相似程度的樣本所蘊(yùn)含的判別信息。
(2) 為了充分利用父母-孩子對(duì)象在不同人臉局部區(qū)域中所表現(xiàn)的遺傳相似性,借助金字塔多層結(jié)構(gòu)進(jìn)行親屬關(guān)系人臉圖像特征的表示學(xué)習(xí)。
(3) 在親屬關(guān)系人臉數(shù)據(jù)庫(kù)KinFaceW和UBKinFace上與現(xiàn)有的度量學(xué)習(xí)方法進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了本文方法的有效性,并獲得了較高的驗(yàn)證性能。
本文提出的年齡跨度感知的多任務(wù)親屬關(guān)系驗(yàn)證方法整體框架如圖2所示,首先將訓(xùn)練樣本劃分為具有不同年齡跨度的樣本簇,再借助金字塔多層(Pyramid Multi-Level, PML)結(jié)構(gòu)進(jìn)行人臉圖像特征的表示學(xué)習(xí),然后在多任務(wù)學(xué)習(xí)框架下學(xué)習(xí)特征轉(zhuǎn)換矩陣,最后使用SVM進(jìn)行親屬關(guān)系人臉圖像的驗(yàn)證。
圖2 年齡跨度感知的多任務(wù)學(xué)習(xí) 親屬關(guān)系驗(yàn)證算法框架
在日常生活中,我們經(jīng)常會(huì)聽到類似“小明的鼻子那兒和他媽媽真像”這樣的語(yǔ)句,因此,我們猜想,親屬關(guān)系對(duì)象間的遺傳相似性往往隱藏在臉部局部區(qū)域?;诖?,我們借助金字塔多層結(jié)構(gòu),將父母-孩子人臉圖像分別劃分為不同尺度的多個(gè)局部塊,如圖3所示,我們?cè)贚=4個(gè)尺度上分別對(duì)人臉圖像進(jìn)行劃分,其中,在第l個(gè)尺度上,人臉被劃分為l2個(gè)局部人臉塊,從每個(gè)局部塊上,抽取維度為m的特征向量,再將所有特征向量按序置于二維矩陣的列上,最終,得到兩個(gè)大小為m×B的矩陣Xp和Xc,其中B為所有尺度上的全部局部塊的個(gè)數(shù),即B=L(L+1)(2L+1)/6。
圖3 基于金字塔多層結(jié)構(gòu)的人臉劃分(Xpc)
(1)
(2)
(3)
式中:轉(zhuǎn)換矩陣W0用于刻畫具有某種親屬關(guān)系樣本所共享的遺傳特性;Wt則被每個(gè)任務(wù)獨(dú)享,用于刻畫具有某種年齡跨度的親屬關(guān)系樣本的遺傳特性。
為了學(xué)習(xí)這兩種轉(zhuǎn)換矩陣,我們構(gòu)建下面的優(yōu)化問(wèn)題:
(4)
目標(biāo)函數(shù)G(W0,Wt,λ,η)關(guān)于W0和{Wt}是凸的,為了獲得W0和{Wt},使用隨機(jī)梯度下降法求解式(4)。具體地,W0和{Wt}的梯度使用式(5)計(jì)算:
W0=W0L(·,·)+ηW0
Wt=WtL(·,·)+λWt
(5)
(6)
式中:μ是一個(gè)范圍在0到1之間的參數(shù)。
我們采取交替迭代優(yōu)化的策略進(jìn)行學(xué)習(xí)。具體地,首先固定W0,優(yōu)化{Wt},再固定{Wt},優(yōu)化W0。該過(guò)程一直重復(fù)直至到達(dá)預(yù)設(shè)的某種收斂條件,如迭代次數(shù)或相鄰兩輪經(jīng)驗(yàn)損失函數(shù)的差值變化小于某誤差等。
算法的具體過(guò)程整理如下:
算法1年齡跨度感知的多任務(wù)學(xué)習(xí)方法(AS-MTL)
參數(shù):λ,η,迭代次數(shù)Nu,誤差τ。
輸出: 轉(zhuǎn)換矩陣W0和{Wt}。
Step1 初始化
1 隨機(jī)T+1個(gè)d×d的矩陣作為W0和{Wt}的初始值;
2 計(jì)算損失函數(shù)的值L0(·,·);
Step2 優(yōu)化
Forr=1,2,…,Nu
固定W0,使用式(5)-式(6)更新{Wt};
固定{Wt},使用式(5)-式(6)更新W0;
計(jì)算Lr(·,·);
若r>2且Lr-Lr-1∨τ,轉(zhuǎn)到Step3;
Step3 輸出
輸出轉(zhuǎn)換矩陣W0和{Wt}
當(dāng)從訓(xùn)練樣本中學(xué)習(xí)獲得轉(zhuǎn)換矩陣W0和{Wt}后,意味著已經(jīng)探尋到了所有親屬關(guān)系樣本所共有的投影轉(zhuǎn)換判別空間,以及具有不同年齡跨度的樣本簇各自獨(dú)享的判別空間。接下來(lái),借助SVM訓(xùn)練一個(gè)分類器做最后的決策。
具體做法如下:
首先,對(duì)每個(gè)訓(xùn)練樣本簇中的每對(duì)訓(xùn)練樣本圖像數(shù)據(jù),根據(jù)其所對(duì)應(yīng)的學(xué)習(xí)任務(wù)t,借助雙線性函數(shù)計(jì)算每幅圖像對(duì)主體間的相似度,即:
SW0,Wt(xp,xc)=(xp)T(W0+Wt)xc
(7)
接著,基于所有圖像對(duì)的相似度及其標(biāo)號(hào),訓(xùn)練一個(gè)線性SVM分類器。
當(dāng)有待驗(yàn)證圖像對(duì)出現(xiàn)時(shí),首先將待驗(yàn)證圖像對(duì)劃分到某個(gè)對(duì)應(yīng)的樣本簇t,再根據(jù)該樣本簇對(duì)應(yīng)的轉(zhuǎn)換矩陣Wt和共有轉(zhuǎn)換矩陣W0,借助式(7)計(jì)算該圖像對(duì)的相似度,最后使用訓(xùn)練好的SVM分類器進(jìn)行預(yù)測(cè)。
2.1.1數(shù)據(jù)庫(kù)和實(shí)驗(yàn)設(shè)置
KinFaceW-I[9]和KinFaceW-II[9]是目前流行的親屬關(guān)系人臉圖像數(shù)據(jù)庫(kù)。這兩個(gè)數(shù)據(jù)庫(kù)最大的不同是前者中的每對(duì)人臉圖像來(lái)自于不同照片,而后者中的每對(duì)人臉則來(lái)自同一幅照片??紤]到我們的目標(biāo),即討論年齡跨度差異在親屬關(guān)系驗(yàn)證問(wèn)題中的影響,而KinFaceW-II中的父母—孩子年齡跨度情況較為單一,因此,我們?cè)贙inFaceW-I上驗(yàn)證本文算法的性能。圖4展示了KinFaceW-I數(shù)據(jù)庫(kù)中的四對(duì)圖像,其中每列的兩幅人臉圖像依次具有父子、父女、母子和母女關(guān)系。
圖4 KinFaceW-I數(shù)據(jù)庫(kù)圖像對(duì)樣本
KinFaceW-I[9]共包含156對(duì)父子、134對(duì)父女、116對(duì)母子和127對(duì)母女關(guān)系人臉圖像。但KinFaceW-I并未給出每幅人臉圖像上的主體對(duì)象的年齡信息,導(dǎo)致我們無(wú)法直接在其上驗(yàn)證本文算法。為此,我們采取人工標(biāo)注的方法,將該數(shù)據(jù)庫(kù)中的所有人臉對(duì)按照年齡跨度小于20歲和大于20歲這兩種情形進(jìn)行歸類處理,這直接使得式(4)中的參數(shù)T=2。當(dāng)然,也可以使用年齡分類器對(duì)人臉圖像進(jìn)行自動(dòng)年齡標(biāo)注,但這里為了使得圖像樣本對(duì)的年齡跨度更為精準(zhǔn),使用了人工標(biāo)注的方法。實(shí)驗(yàn)遵循文獻(xiàn)[9]中的評(píng)估協(xié)議。
對(duì)本文方法中的參數(shù),即λ、η、Nu和τ,使用4折交叉驗(yàn)證方法設(shè)置它們的值,具體地,對(duì)λ,其候選值的值域?yàn)閧0.001,0.01},對(duì)η,則根據(jù)λ的值確定其值的變化范圍,分別是{1×10-4:10:1×103}或{1×10-3:10:1×104}。分別設(shè)置Nu=200,τ=0.1。
2.1.2結(jié)果和分析
1) 基準(zhǔn)實(shí)驗(yàn)。首先,我們?cè)O(shè)計(jì)了基準(zhǔn)方法Base_1以討論在學(xué)習(xí)過(guò)程中考慮年齡跨度影響的有效性。具體地,將式(4)中的T設(shè)置為1。其次,為了討論特征選擇方法的有效性,我們執(zhí)行了本文方法的無(wú)特征選擇版本Base_2。
對(duì)這兩組基準(zhǔn)實(shí)驗(yàn),我們?yōu)槊糠四槇D像抽取和數(shù)據(jù)庫(kù)發(fā)布者[9]所使用的相同的兩種特征:(1) SIFT:從相互之間有8個(gè)像素重疊的大小為16×16的塊中抽取SIFT特征。接著,將這些特征拼接為一個(gè)維度為6 272的特征向量。(2) LBP:將圖像分為4×4個(gè)相互之間無(wú)重疊像素的塊,每個(gè)塊的大小為16×16。接著,從每個(gè)塊中抽取256維的LBP特征,并拼接為4 096維特征向量。使用PCA將提取的兩種特征向量分別降到100維以去除噪聲。
表1是實(shí)驗(yàn)結(jié)果。通過(guò)觀察,得到以下結(jié)論:
表1 基準(zhǔn)方法和本文方法在KinFaceW-I
(1) 由于考慮了年齡跨度的影響,Base_2在所有親屬關(guān)系上可以獲得比Base_1更高的性能,且平均來(lái)看,兩種特征可分別獲得12.0百分點(diǎn)和12.5百分點(diǎn)的提高,說(shuō)明在學(xué)習(xí)時(shí)考慮不同年齡跨度的影響是十分有效的。
(2) 所提的AS-MTL可以在Base_2的基礎(chǔ)上進(jìn)一步提升性能,說(shuō)明特征選擇的有效性。實(shí)驗(yàn)中每種親屬關(guān)系上選擇出的人臉區(qū)域如圖5所示,其中被黑色塊覆蓋的部分是未被選擇的局部區(qū)域。觀察發(fā)現(xiàn),所選的人臉塊大多位于人臉上的關(guān)鍵器官區(qū)域,這與我們?nèi)粘I钪械慕?jīng)驗(yàn)相一致。另外,我們也發(fā)現(xiàn),在不同種類的親屬關(guān)系人臉圖像數(shù)據(jù)上選出的局部區(qū)域有所不同,這也暗示了性別對(duì)親屬關(guān)系驗(yàn)證的影響。
圖5 KinFaceW-I數(shù)據(jù)庫(kù)親屬關(guān)系圖像選出的人臉區(qū)域
(3) SIFT特征在所使用的兩種特征中可以獲得更好的性能,在后面,我們將使用該特征與其他算法進(jìn)行比較。
為了進(jìn)一步展示本文方法的有效性,我們將KinFaceW-I數(shù)據(jù)庫(kù)中500對(duì)隨機(jī)的親屬關(guān)系對(duì)和非親屬關(guān)系對(duì)在Base_1和Base_2方法下的相似度分布進(jìn)行了可視化處理,結(jié)果如圖6所示,其中:圖6(a)是Base_1方法所獲得的相似度分布;圖6(b)是Base_2方法的相似度分布。通過(guò)觀察可以發(fā)現(xiàn),親屬關(guān)系對(duì)和非親屬關(guān)系對(duì)的相似度分布在Base_1方法所獲轉(zhuǎn)換空間中存在較為嚴(yán)重的重疊現(xiàn)象,而它們?cè)贐ase_2方法所獲得的轉(zhuǎn)換空間中則變得更可分,再一次說(shuō)明本文方法的有效性。
圖6 KinFaceW-I數(shù)據(jù)庫(kù)中500對(duì)親屬關(guān)系對(duì)和 500對(duì)非親屬關(guān)系對(duì)的相似度分布
2) 與其他度量學(xué)習(xí)方法的對(duì)比。由于本文方法需要學(xué)習(xí)特征轉(zhuǎn)換矩陣,這與已有的度量學(xué)習(xí)方法NRML[9]和NRCML[17]的學(xué)習(xí)目標(biāo)一致,為此,我們還將本文方法與這兩個(gè)度量學(xué)習(xí)方法進(jìn)行了比較。其中,NRML方法在學(xué)習(xí)時(shí)利用不同非親屬關(guān)系樣本對(duì)度量學(xué)習(xí)的不同影響,提出尋求一個(gè)特征轉(zhuǎn)換矩陣,以使得所有親屬關(guān)系樣本對(duì)的距離盡可能小而所有非親屬關(guān)系樣本對(duì)之間的距離盡可能大。而NRCML則在NRML的基礎(chǔ)上引入了相關(guān)性度量。
由于兩個(gè)對(duì)比方法僅在前述人臉特征上進(jìn)行了特征轉(zhuǎn)換矩陣的學(xué)習(xí),而沒(méi)有進(jìn)行特征學(xué)習(xí),因此,我們還將本文方法的無(wú)特征選擇版本Base_2與對(duì)比方法進(jìn)行了比較。除此之外,我們還將本文方法與兩個(gè)多視圖度量學(xué)習(xí)方法S3L[22]和MHDL3-V[19]進(jìn)行了比較。這兩種方法旨在利用多種特征相互間能提供互補(bǔ)性判別信息的能力來(lái)學(xué)習(xí)多個(gè)特征轉(zhuǎn)換矩陣。其中:S3L[22]使用了SIFT、HOG和LBP特征;而MHDL3-V[19]則使用了FV、Color和LPQ三種特征。所有對(duì)比方法的性能均來(lái)自對(duì)應(yīng)文獻(xiàn)。表2比較了Base_2、AS-MTL和四個(gè)對(duì)比度量學(xué)習(xí)方法在KinFaceW-I上的結(jié)果。我們有以下幾點(diǎn)觀察:(1) 與單度量學(xué)習(xí)方法NRML[9]和NRCML[17]相比,由于NRCML[17]方法是NRML[9]方法的改進(jìn),因此可以獲得較高的平均性能。相較于NRCML[17]方法,Base_2在KinFaceW-I上平均獲得9.3百分點(diǎn)的提高,再一次說(shuō)明在學(xué)習(xí)時(shí)考慮年齡跨度影響的有效性,而所提AS-MTL則可進(jìn)一步平均獲得4.0百分點(diǎn)的提高,說(shuō)明本文方法的有效性。(2) 與多度量學(xué)習(xí)方法S3L[22]和MHDL3-V[19]相比,由于S3L[22]和MHDL3-V[19]使用了多種特征,因此可以獲得比僅使用一個(gè)特征的NRML[9]和NRCML[17]方法更高的性能。而MHDL3-V[19]方法除了利用多種特征的互補(bǔ)性外,還學(xué)習(xí)了對(duì)稱和非對(duì)稱的多種度量,因此可以獲得最高的驗(yàn)證性能。所提的AS-MTL方法也僅使用了一種特征,但在經(jīng)過(guò)特征選擇后可以獲得與MHDL3-V[19]方法相當(dāng)?shù)钠骄?yàn)證性能,說(shuō)明本文方法的有效性。
3)與其他多任務(wù)學(xué)習(xí)方法的對(duì)比。由于本文方法構(gòu)建在多任務(wù)學(xué)習(xí)框架下,因此,我們還將本文方法與No-group MTL[28]和GO-MTL[29]這兩個(gè)子空間正則化多任務(wù)學(xué)習(xí)方法進(jìn)行了比較。其中:No-group MTL方法假設(shè)所有的學(xué)習(xí)任務(wù)是相關(guān)的,并通過(guò)對(duì)學(xué)習(xí)參數(shù)施加Lq,1正則化范數(shù)的方法來(lái)約束學(xué)習(xí)任務(wù)處于某個(gè)低維子空間;而GO-MTL方法則假設(shè)每個(gè)學(xué)習(xí)任務(wù)的參數(shù)向量是一些潛在的基任務(wù)的線性組合。
圖7比較了Base_1、Base_2、AS-MTL和兩個(gè)對(duì)比多任務(wù)學(xué)習(xí)方法在KinFaceW-I上的平均驗(yàn)證精度。觀察發(fā)現(xiàn),所有多任務(wù)學(xué)習(xí)方法都可以獲得比Base_1方法更高的性能,說(shuō)明在進(jìn)行親屬關(guān)系驗(yàn)證時(shí),考慮年齡跨度影響,并同時(shí)學(xué)習(xí)具有不同年齡跨度的樣本間的參數(shù),可以有效提高泛化性能。
圖7 不同方法在KinFaceW-I庫(kù)上的平均驗(yàn)證精度比較
其中,GO-MTL通過(guò)引入重疊組結(jié)構(gòu),在No-group MTL的基礎(chǔ)上獲得了3.1百分點(diǎn)的提高,說(shuō)明具有不同年齡跨度的樣本簇相互間具有一定的結(jié)構(gòu)。而Base_2方法則可在其基礎(chǔ)上進(jìn)一步提高2.7百分點(diǎn)。原因是,相較于GO-MTL方法所假設(shè)的學(xué)習(xí)任務(wù)間存在的重疊組結(jié)構(gòu),Base_2方法僅通過(guò)在任務(wù)間共享一個(gè)共有轉(zhuǎn)換矩陣的形式在學(xué)習(xí)任務(wù)間共享判別信息,是一種相對(duì)松弛的學(xué)習(xí)方法,因此有機(jī)會(huì)獲得更高的驗(yàn)證性能。
4) 參數(shù)的影響。我們還討論了參數(shù)u=λ/η的大小對(duì)算法性能的影響,具體地,通過(guò)固定參數(shù)λ的值,變化參數(shù)η大小的方式進(jìn)行查看。另外需要說(shuō)明的是,為了更純粹地討論年齡跨度對(duì)驗(yàn)證結(jié)果的影響,需要將特征選擇過(guò)程剝離,因此,我們?cè)诒疚姆椒ǖ臒o(wú)特征選擇版本Base_2上進(jìn)行具體的分析。圖8展示了在u取不同值時(shí),Base_2方法的平均驗(yàn)證性能。觀察發(fā)現(xiàn),當(dāng)u較大時(shí),算法性能相對(duì)較低,表明具有不同年齡跨度的親屬關(guān)系樣本不能被無(wú)差別地統(tǒng)一處理。
圖8 參數(shù)u=λ/η對(duì)驗(yàn)證性能的影響
2.2.1數(shù)據(jù)庫(kù)和實(shí)驗(yàn)設(shè)置
UBKinFace數(shù)據(jù)庫(kù)[13]包含200組親屬關(guān)系人臉圖像,每組人臉圖像由年老父母圖像、年輕父母圖像和孩子圖像組成,圖9展示了數(shù)據(jù)庫(kù)中的四組人臉圖像,其中每列的三幅人臉圖像依次是年老父母、年輕父母和孩子的圖像。
圖9 UBKinFace數(shù)據(jù)庫(kù)圖像組樣本
已有的親屬關(guān)系驗(yàn)證算法都遵循文獻(xiàn)[13]中的協(xié)議,即構(gòu)建兩個(gè)子集:“孩子—年輕父母”和“孩子—年老父母”,并分別在這兩個(gè)子集上驗(yàn)證算法的性能。而我們的目標(biāo),是要討論年齡跨度差異在親屬關(guān)系驗(yàn)證問(wèn)題中的影響,因此,我們?cè)谧裱墨I(xiàn)[13]中的5折交叉驗(yàn)證協(xié)議的基礎(chǔ)上,采取將這兩個(gè)子集合并且按照兩種不同年齡跨度情形進(jìn)行歸類處理的策略來(lái)驗(yàn)證本文算法的性能。
對(duì)本文方法中的參數(shù),即λ、η、Nu和τ,采用與前述KinFaceW親屬關(guān)系人臉數(shù)據(jù)庫(kù)上相同的策略來(lái)設(shè)置它們的值。
2.2.2結(jié)果和分析
1) 基準(zhǔn)實(shí)驗(yàn)。我們執(zhí)行了本文方法AS-MTL及其無(wú)特征選擇版本Base_2,在實(shí)驗(yàn)中,我們?yōu)槊糠四槇D像抽取與KinFaceW數(shù)據(jù)庫(kù)所使用的相同的SIFT特征,表3是實(shí)驗(yàn)結(jié)果。通過(guò)觀察,可以發(fā)現(xiàn),所提的AS-MTL可以在Base_2的基礎(chǔ)上提升2.5百分點(diǎn)的驗(yàn)證性能,說(shuō)明方法的有效性。
表3 基準(zhǔn)方法和本文方法在UBKinFace
2) 與其他最好學(xué)習(xí)方法的對(duì)比。我們將本文方法和包括基于遷移學(xué)習(xí)的文獻(xiàn)[13]的方法、基于單度量學(xué)習(xí)的NRML[9]、非線性多度量學(xué)習(xí)的NMML[21]和基于深度神經(jīng)網(wǎng)絡(luò)的KML[26]等在內(nèi)的四個(gè)方法在UBKinFace數(shù)據(jù)庫(kù)上進(jìn)行了比較。但由于已有的方法都是分別在子集1“孩子—年輕父母”和子集2“孩子—年老父母”上驗(yàn)證算法的性能,因此我們?nèi)∵@些對(duì)比算法在兩個(gè)子集上的驗(yàn)證精度的均值作對(duì)比。
表4是實(shí)驗(yàn)結(jié)果,其中所有對(duì)比算法的最后一列的精度值是其在兩個(gè)子集上精度的均值。我們有以下幾點(diǎn)觀察:(1) 與單度量學(xué)習(xí)方法NRML[9]和多度量學(xué)習(xí)方法NMML[21]相比,本文方法的無(wú)特征選擇版本Base_2可以獲得與NMML[21]相當(dāng)?shù)尿?yàn)證精度,說(shuō)明在進(jìn)行親屬關(guān)系驗(yàn)證時(shí)考慮年齡跨度影響是十分有效的,而AS-MTL可以獲得比其高2.7百分點(diǎn)的平均驗(yàn)證精度,說(shuō)明所提特征選擇策略的有效性。(2) 與基于深度神經(jīng)網(wǎng)絡(luò)的KML[26]相比,所提AS-MTL可以獲得0.9百分點(diǎn)的平均驗(yàn)證精度的提高,再次說(shuō)明本文方法的有效性。同時(shí)也說(shuō)明,在樣本數(shù)量較少的親屬關(guān)系數(shù)據(jù)上直接使用深度學(xué)習(xí)未必是最好的選擇。
表4 不同方法在UBKinFace庫(kù)上的驗(yàn)證精度比較(%)
為了討論親屬關(guān)系驗(yàn)證問(wèn)題中具有不同年齡跨度的樣本對(duì)相似性學(xué)習(xí)具有不同影響的問(wèn)題,提出一種年齡跨度感知的多任務(wù)學(xué)習(xí)方法。實(shí)驗(yàn)表明,由于在多任務(wù)學(xué)習(xí)框架下同時(shí)學(xué)習(xí)具有不同年齡跨度的親屬關(guān)系樣本所蘊(yùn)含的共有的、獨(dú)有的空間結(jié)構(gòu)信息,因此,可以利用更多的判別信息,進(jìn)而獲得較高的驗(yàn)證性能。探討年齡跨度對(duì)親屬關(guān)系驗(yàn)證的影響是利用人臉圖像進(jìn)行親屬關(guān)系驗(yàn)證的第一次嘗試,在今后的工作中,我們將考慮用自動(dòng)化的方式獲取年齡跨度,再在此基礎(chǔ)上,構(gòu)建一個(gè)年齡分類和親屬關(guān)系驗(yàn)證的統(tǒng)一學(xué)習(xí)模型。