苗春玉,閆德勤
(遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連116029)
人臉識(shí)別特指利用分析比較人臉視覺特征星系進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù),是一項(xiàng)熱門的計(jì)算機(jī)技術(shù)研究,它屬于生物特征識(shí)別技術(shù),是人工智能與模式識(shí)別領(lǐng)域以及計(jì)算機(jī)視覺領(lǐng)域最富挑戰(zhàn)性的研究課題之一。特征提取是人臉識(shí)別中極其關(guān)鍵的一步。線性判別分析(LDA)也叫做 Fisher線性判別(FLD),是模式識(shí)別的經(jīng)典算法,其基本思想是將高維的樣本投影到低維最佳鑒別矢量空間,投影后保證樣本在該空間中有最佳的可分離性。但LDA算法過度強(qiáng)調(diào)了邊緣類與其他類的類間距離大小,導(dǎo)致在投影空間中近鄰類樣本的重疊。LDA算法在人臉識(shí)別應(yīng)用中常遇到兩個(gè)問題:(1)SSS小樣本問題(Small Sample Size)[1];(2)邊緣類的存在造成投影空間中近鄰樣本重疊的問題。而一種改進(jìn)的LDA算法——最大邊際近鄰元判別分析方法(LMNLDA)可以有效地克服樣本類間數(shù)據(jù)重疊,增加了樣本間的相似度來描述數(shù)據(jù)之間關(guān)系,于是重新定義散度矩陣,從而得到該判別準(zhǔn)則。
如圖1所示,考慮一個(gè)M維的樣本模型投影到一維空間,假定有一個(gè)邊緣類4與類1、類2、類3相隔較遠(yuǎn),則根據(jù)傳統(tǒng)LDA算法得到的最佳投影方向A夸大了與其他3個(gè)類的類間距離較大的、可分性很好的類4,但卻造成了類間距離本來就小的類1、類2、類3的彼此重疊。因此,就分類性而言,基于Fisher準(zhǔn)則得到的鑒別方向并不是最優(yōu)的,最大邊際近鄰元判別分析方法同樣沒有對(duì)這類問題進(jìn)行解決。
假設(shè)訓(xùn)練數(shù)據(jù)集 X={x1,x2,…,xc},其中 xk,k=1,2,…c是第k類數(shù)據(jù)集。LDA的目的是從高維特征空間里找出最有分類信息的低維特征,即尋找一個(gè)變換矩陣G,使得類內(nèi)盡可能緊湊,類間盡可能分離。通常用離散度來刻畫樣本的分布,于是得到Fisher準(zhǔn)則:
最大邊際近鄰元判別分析方法(LMNLDA)是一種改進(jìn)的LDA算法。假設(shè){(xi,yi)}ni=1表示一個(gè)樣本輸入集,其中 xi∈RD,yi表示每一類的類別。 用二進(jìn)制矩陣 yij∈{0,1}來表示類別yi和 yj是否匹配,并且矩陣yij是固定的,用變換L來決定樣本之間的度量[3]。首先對(duì)于每一個(gè)輸入樣本xi∈RD,根據(jù)k近鄰原則,采用歐式距離來進(jìn)行距離度量,定義如下的懲罰函數(shù):
此函數(shù)包括兩部分,即在新的線性空間內(nèi),“引力”部分迫使拉近目標(biāo)近鄰點(diǎn)的距離使之盡量緊湊在一起,“斥力”部分迫使不同于輸入樣本類別的其他點(diǎn)盡量離得遠(yuǎn)一些。兩部分相互對(duì)立、相互制約。最后,利用交替投影算法對(duì)式(3)進(jìn)行優(yōu)化取得最小值,進(jìn)而求得最優(yōu)變換矩陣L。
于是,在新的變換空間中,獲得的新的類內(nèi)、類間和總體散布矩陣為:
該方法能夠克服樣本類間數(shù)據(jù)重疊并且增加了一種描述數(shù)據(jù)之間關(guān)系的樣本間相似度,但并未解決邊緣類對(duì)選擇投影方向的影響及矩陣Sneww的奇異問題。
在計(jì)算等式SbG=SwG∧時(shí)的一個(gè)普遍問題是求Sw的逆,例如利用零空間方法,也就是忽略了零空間之后的列空間。但是Chen等[4].曾經(jīng)驗(yàn)證了Sw包含了重要的判別信息,如果去掉零空間,則會(huì)丟失掉一部分有價(jià)值的信息,因此這里通過因數(shù)分解保持了信息的完整性,將等式(2)轉(zhuǎn)化為:
為了測試優(yōu)化的LMNLDA算法的識(shí)別性能,本文采用Yale人臉數(shù)據(jù)庫、ORL人臉數(shù)據(jù)庫和PIE人臉數(shù)據(jù)庫進(jìn)行了識(shí)別對(duì)比實(shí)驗(yàn)。
采用國際通用的Yale人臉數(shù)據(jù)庫,該數(shù)據(jù)庫由15人,每人11幅,共165幅人臉正面256級(jí)灰度圖像組成,每幅圖像大小為243 mm×320 mm。其中有些圖像是拍攝于不同時(shí)期的,人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,人臉姿態(tài)也有相當(dāng)程度的變化。圖2所示為預(yù)處理后的同一個(gè)人的人臉圖像,共選擇105個(gè)圖像為訓(xùn)練集,其余的60個(gè)圖像為測試集。
ORL人臉數(shù)據(jù)庫由劍橋大學(xué)實(shí)驗(yàn)室1992年4月到1994年4月拍攝的一系列人臉圖像組成,具體為40個(gè)人,每個(gè)人由不同表情或不同視點(diǎn)的10幅圖像構(gòu)成,傾斜角度不超過20°。人臉庫中某一人的10幅圖像如圖3所示,一共選擇了280個(gè)圖像為訓(xùn)練集,其余的120個(gè)圖像為測試集。
PIE人臉數(shù)據(jù)庫擁有68人,有不同的姿勢,不同的燈光條件,以及不同的明暗表情等差別,其中包括了每個(gè)人的 13種姿態(tài)條件,43種光照條件和4種表情下的照片。如圖4所示的一部分圖像,一共選擇340個(gè)圖像為訓(xùn)練集,其余的11 214個(gè)圖像為測試集。
表1 在Yale人臉庫的識(shí)別結(jié)果比較
表2 在ORL人臉庫的識(shí)別結(jié)果比較
表3 在PIE人臉庫的識(shí)別結(jié)果比較
如表1、表 2、表3表示5種方法在取相同特征維數(shù)的情況下的識(shí)別率比較,通過對(duì)3種人臉數(shù)據(jù)庫的實(shí)驗(yàn)結(jié)果對(duì)比可以看出,本文所提出的優(yōu)化的LMNLDA算法的識(shí)別率比其余4種方法的識(shí)別率都要高,5種算法呈現(xiàn)一個(gè)大體的趨勢,就是在一個(gè)確定的維數(shù)即本征維數(shù)上識(shí)別率最高,維數(shù)越大,識(shí)別率越趨于平衡。從以上的實(shí)驗(yàn)結(jié)果可以看出,在相同特征維數(shù)的情況下OLMNLDA優(yōu)于其余4種算法,克服了邊緣類對(duì)選擇最佳投影方向的影響,進(jìn)而能得到較為滿意的效果。實(shí)驗(yàn)結(jié)果充分證明了本文算法的有效性。
[1]BELHUMEUR P N,HESPANHA J P,KRIEGMAN D J,et al.Fisherfaces:Recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[2]張賢達(dá).矩陣分析與應(yīng)用[M].北京:清華大學(xué)出版社,2004.
[3]KILIAN Q,WEINBERGER L K,SAUL.Distance metric distance metric learning for large margin nearest neighbor classifiers[J].Journal of Machine Learning Research,2009(10):207-244.
[4]CHEN L,LIAO H,KO M,et al.A new lda-basedface recognition system which can solve the small sample size problem[J].Pattern Recognition,2000,33(10):1713-1726.
[5]MARTINEZ A M,ZHU M.Where are linear featureextraction methods applicable[J].IEEE Trans.On Pattern Analysis and Machine Intelligence,2005,27(1):1934-1944.
[6]LIU K,CHENG Y Q,YANG J Y,et al.An efficient algo rithm for Foley-Sammon optimal set of discriminant vectors by algebraic method[J].Int.J.Pattern Recog.Artif.Intell,1992,6(5):817-829.
網(wǎng)絡(luò)安全與數(shù)據(jù)管理2011年12期