孫偉強(qiáng)
(遼寧廣播電視大學(xué),遼寧沈陽(yáng)110034)
自適應(yīng)通用學(xué)習(xí)框架改進(jìn)FLDA的人臉識(shí)別
孫偉強(qiáng)
(遼寧廣播電視大學(xué),遼寧沈陽(yáng)110034)
針對(duì)傳統(tǒng)的Fisher線性判別分析(FLDA)算法在處理單訓(xùn)練樣本人臉識(shí)別時(shí)由于類內(nèi)散布矩陣為零而不能進(jìn)行特征提取的問(wèn)題,提出了一種基于自適應(yīng)通用學(xué)習(xí)框架改進(jìn)FLDA的人臉識(shí)別算法。首先選取一個(gè)合適的通用訓(xùn)練樣本集,計(jì)算其類內(nèi)散布矩陣和樣本平均向量;然后,利用雙線性表示算法預(yù)測(cè)單訓(xùn)練樣本的類內(nèi)、類間散布矩陣,巧妙地解決了單訓(xùn)練樣本類內(nèi)散布矩陣為零的問(wèn)題;最后,利用Fisher線性判別分析進(jìn)行特征提取,同時(shí)借助于最近鄰分類器完成人臉的識(shí)別。在Yale及FERET兩大通用人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)驗(yàn)證了所提算法的有效性及可靠性,實(shí)驗(yàn)結(jié)果表明,相比其他幾種較為先進(jìn)的單樣本人臉識(shí)別算法,所提算法取得了更好的識(shí)別效果。
人臉識(shí)別;單訓(xùn)練樣本;通用學(xué)習(xí)框架;Fisher線性判別分析;最近鄰分類器
目前,已經(jīng)存在許多人臉識(shí)別算法,如主成分分析(PCA)[1-2]、獨(dú)立成分分析(ICA)[3]及線性判別分析(LDA)[4-5]都可以成功地完成人臉識(shí)別。此外,無(wú)監(jiān)督特征提取融合監(jiān)督分類的算法也被引入到分類中,即核PCA加LDA(KPCA+LDA)[6]。大多數(shù)人臉識(shí)別算法在每個(gè)人有多個(gè)訓(xùn)練樣本的情況下均能取得很好的識(shí)別效果,但是當(dāng)每個(gè)人只有一個(gè)訓(xùn)練樣本(即單訓(xùn)練樣本)時(shí),識(shí)別效果卻不理想,因此,有效地解決單訓(xùn)練樣本人臉識(shí)別問(wèn)題成為了一大挑戰(zhàn)[7]。
針對(duì)單樣本人臉識(shí)別問(wèn)題,學(xué)者們提出了各種各樣有效的識(shí)別算法,大致可以分為三類:無(wú)監(jiān)督學(xué)習(xí)、虛擬樣本擴(kuò)張法、通用學(xué)習(xí)框架法[8]。例如,文獻(xiàn)[9]通過(guò)將每個(gè)單訓(xùn)練樣本劃分成若干個(gè)大小相等且互不重疊的局部小塊,以每個(gè)類的各個(gè)小塊作為多訓(xùn)練樣本,再利用FLDA進(jìn)行特征提取,使得FLDA在單樣本人臉識(shí)別問(wèn)題中可用。后來(lái),文獻(xiàn)[10]提出了一種基于虛擬樣本擴(kuò)展的人臉識(shí)別算法,借助于相鄰像素值差別很小的概念,將每個(gè)單訓(xùn)練樣本抽取成多個(gè)低像素的人臉圖像,每張人臉圖像都與原圖像非常相似,并利用傳統(tǒng)的特征提取算法進(jìn)行降維。文獻(xiàn)[11]提出了一種通用學(xué)習(xí)框架,并且給出了幾種基于面部的算法從通用訓(xùn)練樣本集中提取判別特征。文獻(xiàn)[12]通過(guò)引用一個(gè)通用訓(xùn)練集學(xué)習(xí)判別特征,解決了單訓(xùn)練樣本人臉識(shí)別中姿勢(shì)變化的問(wèn)題。上述各算法均在一定程度上解決了單訓(xùn)練樣本人臉識(shí)別問(wèn)題,然而,識(shí)別效果并不理想,虛擬樣本擴(kuò)展法生成的虛擬樣本往往失真比較嚴(yán)重,而通用學(xué)習(xí)框架算法又過(guò)分依賴于通用訓(xùn)練樣本集的選取。
基于上述分析,為了更好地解決單訓(xùn)練樣本人臉識(shí)別問(wèn)題,提出了一種自適應(yīng)通用學(xué)習(xí)框架改進(jìn)FLDA的人臉識(shí)別算法,與前人算法不同的是,它不是直接將判別信息應(yīng)用到單訓(xùn)練樣本中,而是通過(guò)多訓(xùn)練樣本集來(lái)預(yù)測(cè)類內(nèi)散步矩陣及類間散步矩陣,再利用經(jīng)典的FLDA算法進(jìn)行特征提取,最后利用最近鄰原則實(shí)現(xiàn)人臉的識(shí)別。實(shí)驗(yàn)結(jié)果驗(yàn)證了所提算法的有效性及可靠性。
傳統(tǒng)的FLDA中,通常使用類內(nèi)散步矩陣(SW)與類間散步矩陣(SB)來(lái)衡量類與類的分離性,如下所示
式中:C為類數(shù);Si為第i類的類間散步矩陣;Ni為類Xi的樣本數(shù);mi為類Xi的平均向量;m為所有樣本的平均向量。FLDA解決問(wèn)題一般是通過(guò)下式
式中:若SW為非零矩陣,當(dāng)投影矩陣W為矩陣的本征向量時(shí),可分離性最大。
但是,在單樣本人臉識(shí)別中,每個(gè)人只有1個(gè)訓(xùn)練樣本,以Xg=:k=1,2,…,M}表示單訓(xùn)練樣本集表示第k個(gè)人的人臉圖像,此時(shí)SW為零矩陣,所以,F(xiàn)LDA算法將不能正常使用,而本文提出的自適應(yīng)通用學(xué)習(xí)算法中借助于通用訓(xùn)練樣本集Xt={:i=1,2,…,C;j=1,2,…,Ni}來(lái)預(yù)測(cè)了單樣本的類間散步矩陣SB與類內(nèi)散步矩陣SW,使得FLDA算法得到有效地應(yīng)用,其中表示通用訓(xùn)練樣本集中的第i個(gè)人的第j張人臉圖像,Ni表示第i個(gè)人的樣本數(shù)。
為了解決上面的問(wèn)題,提出了自適應(yīng)通用學(xué)習(xí)框架,基本的思想如圖1所示,沒(méi)有直接將通用訓(xùn)練樣本中的類間散步矩陣與類內(nèi)散步矩陣應(yīng)用到單訓(xùn)練樣本,而是通過(guò)自適應(yīng)的方式去預(yù)測(cè)單訓(xùn)練樣本的類間散步矩陣與類內(nèi)散步矩陣。
前面也提到過(guò),通用訓(xùn)練集里的每個(gè)類都有一對(duì)相關(guān)的類內(nèi)散步矩陣及其類平均向量(例如,的為(,)),那么,C個(gè)類就有C對(duì)相關(guān)的數(shù)據(jù)以及一個(gè)訓(xùn)練樣本,那么,怎樣來(lái)估計(jì)這個(gè)人的類內(nèi)散步矩陣與類平均向量是一個(gè)典型的預(yù)測(cè)問(wèn)題,目前有很多技術(shù)可以解決這個(gè)問(wèn)題,本文采用了一種簡(jiǎn)單高效的算法——雙線性表示算法。首先介紹一個(gè)雙線性表示算法,接著介紹它的實(shí)現(xiàn)方案。式(10)表明,mg可以直接由xg估計(jì)出,因?yàn)樵趩斡?xùn)練樣本中,xg是Xg的唯一代表樣本。
實(shí)驗(yàn)使用MATLAB7.0在PC上實(shí)現(xiàn),PC配置為:Windows XP操作系統(tǒng)、酷睿2處理器、2.53 GHz主頻、4 Gbyte RAM。在2 個(gè)公開(kāi)的數(shù)據(jù)庫(kù) Yale[13]和 FERET[14]上對(duì)提出的方法作了評(píng)估,也把所提方法與其他文獻(xiàn)中提出的方法作了比較。
Yale人臉庫(kù)[13]包含了15個(gè)人的165張人臉,每人11張,包括了不同光照條件,不同場(chǎng)景的,如圖2所示為Yale人臉庫(kù)中一個(gè)人的11幅具有不同特征的人臉圖像。
圖2 Yale人臉庫(kù)中某人的11幅人臉圖像
表1 不同的類內(nèi)矩、類間矩作用在Yale上的單樣本人臉識(shí)別率%
從表1中可以看到,當(dāng)取通用訓(xùn)練樣本集的類間矩、類內(nèi)矩時(shí),識(shí)別率比其中一個(gè)取通用的,另一個(gè)取自適應(yīng)的識(shí)別率高,當(dāng)兩個(gè)都取自自適應(yīng)的時(shí)候,識(shí)別率最高,為77.67%,那是因?yàn)橥ㄓ糜?xùn)練樣本集的類內(nèi)類間矩只是由通用訓(xùn)練樣本確定的,無(wú)論單訓(xùn)練樣本的情況如何,它都是固定不變的,代表的是共性的東西,而自適應(yīng)的類內(nèi)類間矩會(huì)因?yàn)閱斡?xùn)練樣本的不同而改變,這也體現(xiàn)了本文提出的自適應(yīng)學(xué)習(xí)框架的優(yōu)越性與靈活性。
FERET 人臉庫(kù)[14]包括 ba,bb,bc,bd,be,bf,bg,共有200個(gè)人,每人7幅人臉圖像,它們是在不同的表情、視角、光照強(qiáng)度下拍攝的,如圖3所示,為其中一個(gè)人臉的7幅圖像,按照先行后列的順序,對(duì)應(yīng)為ba~bg中的一張人臉圖像,選擇ba作為訓(xùn)練樣本,包括不同視角、不同表情、不同光照強(qiáng)度的bb~bg作為測(cè)試樣本。
圖3 FERET庫(kù)中某人的7張人臉圖像
表2為使用不同的類內(nèi)矩、類間矩作用在FERET人臉庫(kù)上的單樣本人臉識(shí)別率。
從表2中同樣可以看出,無(wú)論是從各個(gè)樣本庫(kù)出發(fā),還是從整體的平均識(shí)別率來(lái)看,當(dāng)取自適應(yīng)類內(nèi)矩、類間矩時(shí),均取得了最高的識(shí)別率。
表2 不同的類內(nèi)矩、類間矩作用在FERET上的單樣本人臉識(shí)別率 %
這部分,將所提算法與幾種較為先進(jìn)算法的單訓(xùn)練樣本識(shí)別率進(jìn)行了比較,包括 GLF-PCA[2],EGF-FLDA[4],VSE - FLDA[10],Block - FLD[9],以 及 Generic -FLD[12],即使用通用訓(xùn)練樣本集的類內(nèi)、類間散布矩陣進(jìn)行FLDA分類。
針對(duì)上面提到的幾種比較算法進(jìn)行實(shí)驗(yàn)。GLF-PCA算法中,取95%的能量來(lái)確定主成分?jǐn)?shù);EGF-FLDA算法中只有1個(gè)自由參數(shù)α,是人臉圖像的投影組合權(quán)重,文獻(xiàn)[4]中提到,當(dāng)α的值在0.1~0.5之間時(shí),EGF-FLDA的性能對(duì)α不敏感,因此,在實(shí)驗(yàn)中,取值0.3;Block-FLD算法中最重要的參數(shù)是分塊數(shù),采用了4種不同的分塊方式(10×10,10×25,20×10,20×25),實(shí)驗(yàn)列表中選取了最佳的實(shí)驗(yàn)結(jié)果(10×25);類似地,在VSE-FLDA中,人臉圖像的分塊對(duì)性能的影響很大,在實(shí)驗(yàn)中,采用了4種不同的分塊數(shù)(16,32,40,72),選取了最佳的實(shí)驗(yàn)結(jié)果(72);Generic-FLD算法中,先求出通用訓(xùn)練樣本集的類內(nèi)矩及類間矩,然后利用FLDA進(jìn)行分類,最近鄰?fù)瓿扇四樀淖R(shí)別。幾種算法在Yale和FERET上的實(shí)驗(yàn)結(jié)果如表3所示。
表3 各算法的單樣本人臉識(shí)別率的比較 %
通過(guò)表3,可以清晰地看到,在Yale和FERET人臉庫(kù)上,所提算法的識(shí)別率明顯高于文獻(xiàn)其他算法。其中,在Yale上,所提算法比GLF-PCA,EGF-FLDA,Block-FLD 算法的優(yōu)勢(shì)很明顯,相比 VSE-FLDA算法,卻僅高出1.67%,這不能體現(xiàn)出識(shí)別率的明顯提高。但是,在FERET人臉庫(kù)上,不論是看各個(gè)人臉庫(kù),還是看各個(gè)人臉庫(kù)的平均識(shí)別率,所提算法都顯得很優(yōu)越,高出經(jīng)典的VSEFLDA算法5%,甚至高出GLF-PCA算法10%。
本文對(duì)基于單樣本的人臉識(shí)別問(wèn)題進(jìn)行研究,采用自適應(yīng)通用學(xué)習(xí)框架的算法,借助于通用訓(xùn)練樣本集來(lái)預(yù)測(cè)單訓(xùn)練樣本的類內(nèi)散布矩陣與類間散布矩陣,使得FLDA算法得到有效地應(yīng)用,在Yale和FERET兩大人臉數(shù)據(jù)庫(kù)上進(jìn)行了實(shí)驗(yàn),證明了本文所提算法的優(yōu)越性。
自適應(yīng)通用學(xué)習(xí)算法的引用,提高了單樣本的識(shí)別率,但在一定程度上增加了額外的計(jì)算開(kāi)銷,所以如何在提高識(shí)別率的同時(shí)改進(jìn)算法的效率,將是進(jìn)一步研究的重點(diǎn)。
[1]徐明,喬寧博,文振焜,等.基于特征識(shí)別的三維人臉動(dòng)畫模型自動(dòng)構(gòu)造[J].中國(guó)圖象圖形學(xué)報(bào),2012,17(12):1540-1547.
[2]蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識(shí)別[J].軟件學(xué)報(bào),2010,21(8):1849-1862.
[3]柴智,劉正光.應(yīng)用復(fù)小波和獨(dú)立成分分析的人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用,2010,30(7):1863-1866.
[4]鄒建法,王國(guó)胤,龔勛.基于增強(qiáng)Gabor特征和直接分步線性判別分析的人臉識(shí)別[J].模式識(shí)別與人工智能,2010(4):477-482.
[5]李曉莉,達(dá)飛鵬.基于排除算法的快速三維人臉識(shí)別算法[J].自動(dòng)化學(xué)報(bào),2010,36(1):153-158.
[6]王科俊,鄒國(guó)鋒.基于子模式的Gabor特征融合的單樣本人臉識(shí)別[J].模式識(shí)別與人工智能,2013,26(1):50-56.
[7]胡峰松,張茂軍,鄒北驥,等.基于HMM的單樣本可變光照,姿態(tài)人臉識(shí)別[J].計(jì)算機(jī)學(xué)報(bào),2009,32(7):1424-1433.
[8]楊軍,高志升,袁紅照,等.基于LBP特征和貝葉斯模型的單樣本人臉識(shí)別[J].光電子·激光,2011,22(5):763-765.
[9]CHEN S,LIU J,ZHOU Z H.Making FLDA applicable to face recognition with one sample per Rerson[J].Pattern Recognition,2004,37(7):1553-1555.
[10]趙雅英,譚延琪,馬小虎.基于樣本擴(kuò)充和改進(jìn)2DPCA的單樣本人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用,2011,31(10):2728-2730.
[11]馬俊容.單訓(xùn)練樣本條件下人臉識(shí)別技術(shù)研究[D].長(zhǎng)沙:湖南大學(xué),2009.
[12]HAFIZ F,SHAFIE A A,MUSTAFAH Y M.Face recognition from single sample per person by learning of generic discriminant vectors[J].Procedia Engineering,2012,41(3):465-472.
[13]楊軍,高志升,袁紅照,等.基于LBP特征和貝葉斯模型的單樣本人臉識(shí)別[J].光電子·激光,2011,22(5):763-765.
[14]高濤,何明一.改進(jìn)投影梯度非負(fù)矩陣分解的單訓(xùn)練樣本特征提取研究[J].電子與信息學(xué)報(bào),2010,32(5):1121-1125.
FLDA Improved by Adaptive Generic Learning Framework for Face Recognition
SUN Weiqiang
(Liaoning Radio and Television University,Shenyang 110034,China)
For the issue that traditional Fisher linear discriminative analysis algorithm could not extract features due to its scattering matrix within class is zero in face recognition with single training sample per person,a face recognition algorithm based on FLDA improved by adaptive generic learning framework is proposed.Firstly,a suitable generic training sample set is selected and its scattering matrix within class and mean vectors are computed.Then,scattering matrix within-class and between classes are predicted by bilinear representation algorithm,which has settled the problem of its scattering matrix within class is zero.Finally,F(xiàn)LDA is used to extract features and nearest neighbour classifier is used to finish face recognition.The effectiveness of proposed algorithm is verified by experiments on the two common databases Yale and FERET.Experimental results show that proposed algorithm has better recognition efficiency than several advanced single training sample face recognition algorithms.
face recognition;single training sample;generic learning framework;Fisher linear discriminative analysis;nearest neighbour classifier
TP391
A
【本文獻(xiàn)信息】孫偉強(qiáng).自適應(yīng)通用學(xué)習(xí)框架改進(jìn)FLDA的人臉識(shí)別[J].電視技術(shù),2014,38(7).
孫偉強(qiáng)(1975— ),碩士,講師,主要研究領(lǐng)域?yàn)槟J阶R(shí)別、圖像處理。
責(zé)任編輯:任健男
2013-09-29