王利龍,吳 斌
(西南科技大學(xué)信息工程學(xué)院,四川 綿陽(yáng) 621010)
作為模式識(shí)別與人工智能領(lǐng)域中的熱門(mén)研究課題,人臉識(shí)別[1]的研究工作取得了突破性進(jìn)展。但圖像特征提取過(guò)程會(huì)受到不同干擾因素限制[2],如光照強(qiáng)度和遮擋變化、人臉姿態(tài)和表情變化等外在、內(nèi)在因素,會(huì)使人臉識(shí)別算法的性能面臨較大的挑戰(zhàn)[2-11]。
為保證少樣本條件下特征提取的完備性,進(jìn)一步增強(qiáng)人臉特征的表示和提取,提出了Gaborface多通道優(yōu)化與二維線性降維的特征提取算法。①多通道Gaborface表征模型對(duì)樣本集進(jìn)行預(yù)處理,提取不同通道下的人臉Gabor幅值特征,并選取較優(yōu)的通道特征融合方式組合成新人臉特征表示。②引入類內(nèi)、類間鑒別信息改進(jìn)二維局部保持投影(two dimentional locality preserving projection,2DLPP)提取行方向特征,同時(shí)在列方向上采用二維主成分分析算法(two dimentional principal component analysis,2DPCA)對(duì)新人臉進(jìn)行特征提取與降維。③通過(guò)最近鄰分類器得到分類結(jié)果,用于描述人臉識(shí)別性能。
人臉圖像本質(zhì)上為高維流形,非線性降維[4]能夠很好地保留圖像結(jié)構(gòu),但計(jì)算量大。因而,HE[5]提出了局部保持投影(locality preserving projections,LPP)共享非線性降維算法特性,較主成分分析(principal component analysis,PCA)得到更優(yōu)的人臉表示。進(jìn)一步直接獲取二維圖像矩陣的最優(yōu)特征,可更好地保證算法有效性,如2DPCA[12]、2DLPP[13]等。二維雙向降維算法能增強(qiáng)人臉識(shí)別算法的魯棒性,QI提出了一種結(jié)合2DLPP與2DPCA的人臉識(shí)別方法[14-15]。該算法對(duì)圖像行和列方向上最優(yōu)特征求解,但缺乏對(duì)圖像樣本間鑒別信息的考量,對(duì)于人臉姿態(tài)、光照變化仍較為敏感。
Gabor濾波算法[6-11]能夠很好地表示空間局部性和方向選擇性。多通道Gaborface表征(multi channel gabor face representation,MGFR)可以提供多通道間的信息補(bǔ)償。HUO[15]提出了多通道Gabor小波與2DFLD相融合的算法。該算法能夠提取人臉特征的空間局部和方向信息,并對(duì)人臉的光照變化不敏感,具有很好的魯棒性。
為有效保留圖像的全局和局部特征,在多通道Gaborface組合表征的行、列方向上,分別采用引入類別權(quán)重的二維局部保持投影和二維主成分分析算法。改進(jìn)算法流程如圖1所示。
圖1 改進(jìn)算法流程圖Fig.1 Processing of improved algorithm
二維Gabor人臉特征的提取過(guò)程為:采用不同屬性的Gabor濾波器對(duì)人臉圖像進(jìn)行核卷積處理,獲得的特征矢量與Gabor濾波器的方向、尺度相對(duì)應(yīng)。經(jīng)給定參數(shù)的核卷積運(yùn)算后,不同通道Gabor人臉特征Gμ,v(x,y)為:
(1)
式中:Ψμ,v為Gabor濾波器;kμ,v為波向量,μ∈{0,1,…,7}和v∈{0,1,…,4}分別為其方向和尺度參數(shù);z=(x,y);σ=2π;I(x,y)為單張人臉;‖·‖為歐式范數(shù)算子。
文獻(xiàn)[6]引入串接方式來(lái)組合多通道Gabor特征矢量,且不同尺度和方向上的組合表征在分類性能上表現(xiàn)出了較強(qiáng)的差異性。受特征表示不同鑒別屬性的啟發(fā),選取四種通道組合形成Gabor特征人臉表示。
①求和全部通道。
(2)
②方向通道相加后串接。
(3)
③尺度通道相加后串接。
(4)
④串接全部通道。
(5)
式中:C為串接符[6];∑為求和符。
對(duì)于任意單張圖像,經(jīng)過(guò)Gabor濾波器卷積并組合通道操作后,新特征矩陣維數(shù)隨不同通道組合形式的變化而不同。多通道組合處理結(jié)果如圖2所示。
圖2表示選取四種通道組合下的人臉表征。其中,圖2(d)可直觀表現(xiàn)出全部通道下人臉圖像的局部和方向描述,且四種矢量組合效果存在較為明顯的差異。雖然該特征提取過(guò)程能獲取單張圖像更為豐富的特征表示,但其高維屬性影響算法的實(shí)效性。針對(duì)該算法不足,提出改進(jìn)雙向二維線性降維方法進(jìn)行優(yōu)化。
圖像降維過(guò)程往往會(huì)丟失數(shù)據(jù)原有結(jié)構(gòu)信息,且一維向量較二維矩陣對(duì)數(shù)據(jù)破壞性更大。而行、列方向上分別獲取最優(yōu)投影,可得到樣本圖像最小維數(shù)的特征表示。
圖2 多通道組合處理結(jié)果Fig.2 Processing results of multi-channel combination
2.2.1 列方向2DPCA特征提取
(1)求取樣本均值:
(6)
(2)求取協(xié)方差矩陣:
Ψ=E[g-Eg]T[g-Eg]=
(7)
(3)求取投影后總散度矩陣:
J(Z)=tr{E[u-Eu]T[u-Eu]}=
tr{E[gZ-EgZ]T[gZ-EgZ]}
(8)
則將式(6)、式(7)代入式(8),可以得到:
J(Z)=ZTΨZ
(9)
最后求解式(9)并保留前p個(gè)最大的廣義特征值,取其對(duì)應(yīng)的特征向量組成樣本列方向上的投影矩陣Zopt=[z1,z2,...,zp]。
2.2.2 行方向2DLPP特征提取
通過(guò)列方向2DPCA特征提取得到圖像全局結(jié)構(gòu),現(xiàn)采用改進(jìn)權(quán)重的2DLPP保留圖像行方向上的局部信息[10]。算法實(shí)現(xiàn)如下。
①構(gòu)建有向鄰接圖。
利用包含M個(gè)樣本的數(shù)據(jù)集構(gòu)建有向鄰接圖,且圖中包含M個(gè)結(jié)點(diǎn),結(jié)點(diǎn)間的近鄰關(guān)系通過(guò)K近鄰準(zhǔn)則確定。
②權(quán)重選擇及優(yōu)化。
在全局鄰域的基礎(chǔ)上引入類間、類內(nèi)信息,通過(guò)增大樣本類間差異,縮小類內(nèi)差異來(lái)更好描述數(shù)據(jù)間的近鄰關(guān)系。其優(yōu)化后的權(quán)重為:
(10)
③求取投影矩陣。
首先取標(biāo)準(zhǔn)列正交矩陣A∈Rm×q,n≥q將矩陣gi行方向映射到A上,有變換后矩陣yi=ATgi,yi∈Rq×n,i=1,2,...,M。經(jīng)權(quán)重改進(jìn)后,2DLPP的目標(biāo)函數(shù)為:
且需同時(shí)滿足:
AgT(D?In)gAT=1
(11)
式中:D為對(duì)角陣;L為拉普拉斯矩陣;?為克羅內(nèi)克積;In為單位陣。聯(lián)立公式,進(jìn)一步得到:
gT(L?In)gAT=λgT(D?In)gAT
(12)
最終,求解式(12)并保留前q個(gè)最大的廣義特征值,取其對(duì)應(yīng)的特征向量組成樣本行方向上的投影矩陣Aopt。
基于行、列方向上的最優(yōu)投影矩陣Aopt和Zopt,對(duì)于任意單張人臉圖像,均可得維數(shù)為q×p的矩陣Fopt:
(13)
(14)
為比較訓(xùn)練樣本和測(cè)試樣本間的相似性,采用最近鄰分類,通過(guò)計(jì)算特征矩陣間的歐式距離d,可快速驗(yàn)證算法的有效性。
(15)
試驗(yàn)選取AR人臉數(shù)據(jù)集,驗(yàn)證不同Gabor通道組合的有效性,選取YALE和ORL兩人臉數(shù)據(jù)庫(kù),分別驗(yàn)證不同算法與改進(jìn)算法的性能對(duì)比。試驗(yàn)平臺(tái)為WIN7系統(tǒng);Pentinum(R) Dual-Core CPU 2.80 GHz;算法編程環(huán)境為Matlab R2017a。
AR人臉數(shù)據(jù)庫(kù)是由美國(guó)俄亥俄州立大學(xué)提供的公開(kāi)數(shù)據(jù)庫(kù),包含了超過(guò)4 000張彩色人臉照片,包括不同角度、不同表情、不同光照和遮擋條件,所有圖像均為165×120。
YALE庫(kù)中包含15個(gè)人的165張照片,每個(gè)人11張照片,圖像像素大小為100×100。
ORL人臉數(shù)據(jù)集是由劍橋大學(xué)試驗(yàn)室提供的公開(kāi)數(shù)據(jù)集。其包含40個(gè)人的人臉圖像,每類人臉圖像均有10張,不但包含了一些人臉俯仰達(dá)20°的傾斜和旋轉(zhuǎn)圖像,而且包含了達(dá)10%的尺度變化。所有圖像均為灰度圖,像素大小為112×92。
由上文可知,Gabor濾波的方向和尺度屬性對(duì)人臉表示影響較大。因此,選擇四種表征能力較強(qiáng)的通道組合方式,再對(duì)其融合改進(jìn)雙向線性降維來(lái)對(duì)比算法性能差異,且試驗(yàn)在AR人臉集上驗(yàn)證。 優(yōu)化Gaborface通道組合的算法性能曲線如圖3所示。
圖3 優(yōu)化Gaborface通道組合的算法性能曲線Fig.3 Algorithmic performance curves of optimizing Gaborface channel combination
每類樣本訓(xùn)練數(shù)為3和4,且維數(shù)取d=1,2,…,30時(shí)的算法性能對(duì)比。其中,全部通道求和、方向通道相加后串接、尺度通道相加后串接、全部通道串接分別用組合方式表示。結(jié)果表明,方向通道相加后串接總體表現(xiàn)較佳。
選取方向通道相加后串接方式生成人臉特征表示。此時(shí),需驗(yàn)證不同數(shù)據(jù)集上不同維數(shù)對(duì)改進(jìn)算法性能的影響。不同特征維數(shù)下識(shí)別率曲線如圖4所示。
圖4 不同特征維數(shù)下識(shí)別率曲線Fig.4 Recognition rate curves under different feature dimensions
值得注意的是,2DPCA和2DLPP得到的特征矩陣維數(shù)為m×d,而雙向降維算法得到的則為d×d。圖4表明,在AR、ORL、YALE數(shù)據(jù)集上,五種算法的性能都在特征維數(shù)增大的情況下得到提高,且初始位數(shù)較低的情形下,雙向降維算法的識(shí)別率較低;當(dāng)維數(shù)d≥5時(shí),其性能表現(xiàn)更優(yōu)。同時(shí),改進(jìn)算法表現(xiàn)出了更高的識(shí)別率,其算法有效性得到了驗(yàn)證。
針對(duì)小樣本集問(wèn)題,試驗(yàn)在ORL和YALE兩數(shù)據(jù)集上選取每類樣本的不同訓(xùn)練個(gè)數(shù)來(lái)比較不同算法的識(shí)別性能。ORL、YALE上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比如表1、表2所示。
表1 ORL上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比Tab.1 Comparisons of algorithm performance under different training samples on ORL
表2 YALE上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比Tab.2 Comparisons of algorithm performance under different training samples on YALE
試驗(yàn)選取ORL和YALE兩樣本數(shù)較少的數(shù)據(jù)集。通過(guò)表1和表2可以看出,改進(jìn)算法總體性能表現(xiàn)較好。由于較低維數(shù)下算法識(shí)別性能較差,故通過(guò)求取均值獲取到的識(shí)別率偏差較大。
前述算法對(duì)比過(guò)程僅在改進(jìn)工作中引入了優(yōu)化后的多通道Gabor組合特征表示。為考量通道組合后特征對(duì)其他算法的性能影響,試驗(yàn)在數(shù)據(jù)集AR、ORL和YALE的每類樣本上分別選取訓(xùn)練個(gè)數(shù)為7、5、5。
AR、ORL、YALE數(shù)據(jù)集上識(shí)別性能對(duì)比如表3~表5所示。
表3 AR數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.3 Comparisons of recognition performance on AR dataset
表4 ORL數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.4 Comparisons of recognition performance on ORL dataset
表5 YALE數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.5 Comparisons of recognition performance on YALE dataset
對(duì)比結(jié)果表明: ①多通道Gaborface的組合表征對(duì)每種算法均有識(shí)別率上的提升,但同時(shí)增加了訓(xùn)練耗時(shí)和分類耗時(shí);②總體上,改進(jìn)算法的訓(xùn)練時(shí)間較久[16-17],且分類性能表現(xiàn)較優(yōu)。
針對(duì)人臉姿態(tài)變化、光照變化等因素對(duì)人臉識(shí)別性能的影響,通過(guò)選取多通道Gaborface優(yōu)化組合和引入樣本類別信息提升線性降維鑒別性能的方式,提出了一種Gaborface多通道優(yōu)化與二維線性降維的特征提取算法,用于描述人臉識(shí)別性能。
試驗(yàn)結(jié)果表明,在選取的人臉數(shù)據(jù)庫(kù)上,提出的改進(jìn)算法能夠增強(qiáng)人臉特征的表示和提取。采用多通道Gaborface表征組合更好地保留了人臉特征的局部性和方向性,并進(jìn)一步提升了雙向降維算法的識(shí)別性能,驗(yàn)證了改進(jìn)算法在人臉識(shí)別性能上的有效性。