亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

結(jié)合優(yōu)化MGFR與二維線性降維的特征提取算法

2020-03-31 11:43:14王利龍

自動(dòng)化儀表 2020年3期

王利龍,吳斌

(西南科技大學(xué)信息工程學(xué)院，四川綿陽(yáng) 621010)

0 引言

作為模式識(shí)別與人工智能領(lǐng)域中的熱門(mén)研究課題，人臉識(shí)別[1]的研究工作取得了突破性進(jìn)展。但圖像特征提取過(guò)程會(huì)受到不同干擾因素限制[2]，如光照強(qiáng)度和遮擋變化、人臉姿態(tài)和表情變化等外在、內(nèi)在因素，會(huì)使人臉識(shí)別算法的性能面臨較大的挑戰(zhàn)[2-11]。

為保證少樣本條件下特征提取的完備性，進(jìn)一步增強(qiáng)人臉特征的表示和提取，提出了Gaborface多通道優(yōu)化與二維線性降維的特征提取算法。①多通道Gaborface表征模型對(duì)樣本集進(jìn)行預(yù)處理，提取不同通道下的人臉Gabor幅值特征，并選取較優(yōu)的通道特征融合方式組合成新人臉特征表示。②引入類內(nèi)、類間鑒別信息改進(jìn)二維局部保持投影(two dimentional locality preserving projection,2DLPP)提取行方向特征，同時(shí)在列方向上采用二維主成分分析算法(two dimentional principal component analysis,2DPCA)對(duì)新人臉進(jìn)行特征提取與降維。③通過(guò)最近鄰分類器得到分類結(jié)果，用于描述人臉識(shí)別性能。

1 相關(guān)工作

人臉圖像本質(zhì)上為高維流形，非線性降維[4]能夠很好地保留圖像結(jié)構(gòu)，但計(jì)算量大。因而，HE[5]提出了局部保持投影(locality preserving projections,LPP)共享非線性降維算法特性，較主成分分析(principal component analysis,PCA)得到更優(yōu)的人臉表示。進(jìn)一步直接獲取二維圖像矩陣的最優(yōu)特征，可更好地保證算法有效性，如2DPCA[12]、2DLPP[13]等。二維雙向降維算法能增強(qiáng)人臉識(shí)別算法的魯棒性，QI提出了一種結(jié)合2DLPP與2DPCA的人臉識(shí)別方法[14-15]。該算法對(duì)圖像行和列方向上最優(yōu)特征求解，但缺乏對(duì)圖像樣本間鑒別信息的考量，對(duì)于人臉姿態(tài)、光照變化仍較為敏感。

Gabor濾波算法[6-11]能夠很好地表示空間局部性和方向選擇性。多通道Gaborface表征(multi channel gabor face representation，MGFR)可以提供多通道間的信息補(bǔ)償。HUO[15]提出了多通道Gabor小波與2DFLD相融合的算法。該算法能夠提取人臉特征的空間局部和方向信息，并對(duì)人臉的光照變化不敏感，具有很好的魯棒性。

2 改進(jìn)算法框架

為有效保留圖像的全局和局部特征，在多通道Gaborface組合表征的行、列方向上，分別采用引入類別權(quán)重的二維局部保持投影和二維主成分分析算法。改進(jìn)算法流程如圖1所示。

圖1 改進(jìn)算法流程圖Fig.1 Processing of improved algorithm

2.1 二維多通道 Gabor人臉特征

二維Gabor人臉特征的提取過(guò)程為：采用不同屬性的Gabor濾波器對(duì)人臉圖像進(jìn)行核卷積處理，獲得的特征矢量與Gabor濾波器的方向、尺度相對(duì)應(yīng)。經(jīng)給定參數(shù)的核卷積運(yùn)算后，不同通道Gabor人臉特征Gμ,v(x,y)為：

(1)

式中：Ψμ,v為Gabor濾波器;kμ,v為波向量,μ∈{0,1,…,7}和v∈{0,1,…,4}分別為其方向和尺度參數(shù);z=(x,y)；σ=2π；I(x,y)為單張人臉；‖·‖為歐式范數(shù)算子。

文獻(xiàn)[6]引入串接方式來(lái)組合多通道Gabor特征矢量，且不同尺度和方向上的組合表征在分類性能上表現(xiàn)出了較強(qiáng)的差異性。受特征表示不同鑒別屬性的啟發(fā)，選取四種通道組合形成Gabor特征人臉表示。

①求和全部通道。

(2)

②方向通道相加后串接。

(3)

③尺度通道相加后串接。

(4)

④串接全部通道。

(5)

式中：C為串接符[6];∑為求和符。

對(duì)于任意單張圖像，經(jīng)過(guò)Gabor濾波器卷積并組合通道操作后，新特征矩陣維數(shù)隨不同通道組合形式的變化而不同。多通道組合處理結(jié)果如圖2所示。

圖2表示選取四種通道組合下的人臉表征。其中，圖2(d)可直觀表現(xiàn)出全部通道下人臉圖像的局部和方向描述，且四種矢量組合效果存在較為明顯的差異。雖然該特征提取過(guò)程能獲取單張圖像更為豐富的特征表示，但其高維屬性影響算法的實(shí)效性。針對(duì)該算法不足，提出改進(jìn)雙向二維線性降維方法進(jìn)行優(yōu)化。

2.2 改進(jìn)雙向降維算法

圖像降維過(guò)程往往會(huì)丟失數(shù)據(jù)原有結(jié)構(gòu)信息，且一維向量較二維矩陣對(duì)數(shù)據(jù)破壞性更大。而行、列方向上分別獲取最優(yōu)投影，可得到樣本圖像最小維數(shù)的特征表示。

圖2 多通道組合處理結(jié)果Fig.2 Processing results of multi-channel combination

2.2.1 列方向2DPCA特征提取

(1)求取樣本均值：

(6)

(2)求取協(xié)方差矩陣：

Ψ=E[g-Eg]T[g-Eg]=

(7)

(3)求取投影后總散度矩陣：

J(Z)=tr{E[u-Eu]T[u-Eu]}=

tr{E[gZ-EgZ]T[gZ-EgZ]}

(8)

則將式(6)、式(7)代入式(8)，可以得到：

J(Z)=ZTΨZ

(9)

最后求解式(9)并保留前p個(gè)最大的廣義特征值，取其對(duì)應(yīng)的特征向量組成樣本列方向上的投影矩陣Zopt=[z1,z2,...,zp]。

2.2.2 行方向2DLPP特征提取

通過(guò)列方向2DPCA特征提取得到圖像全局結(jié)構(gòu)，現(xiàn)采用改進(jìn)權(quán)重的2DLPP保留圖像行方向上的局部信息[10]。算法實(shí)現(xiàn)如下。

①構(gòu)建有向鄰接圖。

利用包含M個(gè)樣本的數(shù)據(jù)集構(gòu)建有向鄰接圖，且圖中包含M個(gè)結(jié)點(diǎn)，結(jié)點(diǎn)間的近鄰關(guān)系通過(guò)K近鄰準(zhǔn)則確定。

②權(quán)重選擇及優(yōu)化。

在全局鄰域的基礎(chǔ)上引入類間、類內(nèi)信息，通過(guò)增大樣本類間差異，縮小類內(nèi)差異來(lái)更好描述數(shù)據(jù)間的近鄰關(guān)系。其優(yōu)化后的權(quán)重為：

(10)

③求取投影矩陣。

首先取標(biāo)準(zhǔn)列正交矩陣A∈Rm×q，n≥q將矩陣gi行方向映射到A上，有變換后矩陣yi=ATgi，yi∈Rq×n，i=1,2,...,M。經(jīng)權(quán)重改進(jìn)后，2DLPP的目標(biāo)函數(shù)為：

且需同時(shí)滿足：

AgT(D?In)gAT=1

(11)

式中：D為對(duì)角陣；L為拉普拉斯矩陣；?為克羅內(nèi)克積；In為單位陣。聯(lián)立公式，進(jìn)一步得到：

gT(L?In)gAT=λgT(D?In)gAT

(12)

最終，求解式(12)并保留前q個(gè)最大的廣義特征值，取其對(duì)應(yīng)的特征向量組成樣本行方向上的投影矩陣Aopt。

2.3 分類

基于行、列方向上的最優(yōu)投影矩陣Aopt和Zopt，對(duì)于任意單張人臉圖像，均可得維數(shù)為q×p的矩陣Fopt：

(13)

(14)

為比較訓(xùn)練樣本和測(cè)試樣本間的相似性，采用最近鄰分類，通過(guò)計(jì)算特征矩陣間的歐式距離d，可快速驗(yàn)證算法的有效性。

(15)

3 試驗(yàn)結(jié)果

試驗(yàn)選取AR人臉數(shù)據(jù)集，驗(yàn)證不同Gabor通道組合的有效性，選取YALE和ORL兩人臉數(shù)據(jù)庫(kù)，分別驗(yàn)證不同算法與改進(jìn)算法的性能對(duì)比。試驗(yàn)平臺(tái)為WIN7系統(tǒng)；Pentinum(R) Dual-Core CPU 2.80 GHz；算法編程環(huán)境為Matlab R2017a。

3.1 數(shù)據(jù)集介紹

AR人臉數(shù)據(jù)庫(kù)是由美國(guó)俄亥俄州立大學(xué)提供的公開(kāi)數(shù)據(jù)庫(kù)，包含了超過(guò)4 000張彩色人臉照片，包括不同角度、不同表情、不同光照和遮擋條件，所有圖像均為165×120。

YALE庫(kù)中包含15個(gè)人的165張照片，每個(gè)人11張照片，圖像像素大小為100×100。

ORL人臉數(shù)據(jù)集是由劍橋大學(xué)試驗(yàn)室提供的公開(kāi)數(shù)據(jù)集。其包含40個(gè)人的人臉圖像，每類人臉圖像均有10張，不但包含了一些人臉俯仰達(dá)20°的傾斜和旋轉(zhuǎn)圖像，而且包含了達(dá)10%的尺度變化。所有圖像均為灰度圖，像素大小為112×92。

3.2 確定Gaborface優(yōu)化組合

由上文可知，Gabor濾波的方向和尺度屬性對(duì)人臉表示影響較大。因此，選擇四種表征能力較強(qiáng)的通道組合方式，再對(duì)其融合改進(jìn)雙向線性降維來(lái)對(duì)比算法性能差異，且試驗(yàn)在AR人臉集上驗(yàn)證。優(yōu)化Gaborface通道組合的算法性能曲線如圖3所示。

圖3 優(yōu)化Gaborface通道組合的算法性能曲線Fig.3 Algorithmic performance curves of optimizing Gaborface channel combination

每類樣本訓(xùn)練數(shù)為3和4，且維數(shù)取d=1,2,…,30時(shí)的算法性能對(duì)比。其中，全部通道求和、方向通道相加后串接、尺度通道相加后串接、全部通道串接分別用組合方式表示。結(jié)果表明，方向通道相加后串接總體表現(xiàn)較佳。

3.3 特征維數(shù)對(duì)算法性能影響

選取方向通道相加后串接方式生成人臉特征表示。此時(shí)，需驗(yàn)證不同數(shù)據(jù)集上不同維數(shù)對(duì)改進(jìn)算法性能的影響。不同特征維數(shù)下識(shí)別率曲線如圖4所示。

圖4 不同特征維數(shù)下識(shí)別率曲線Fig.4 Recognition rate curves under different feature dimensions

值得注意的是，2DPCA和2DLPP得到的特征矩陣維數(shù)為m×d，而雙向降維算法得到的則為d×d。圖4表明，在AR、ORL、YALE數(shù)據(jù)集上，五種算法的性能都在特征維數(shù)增大的情況下得到提高，且初始位數(shù)較低的情形下，雙向降維算法的識(shí)別率較低；當(dāng)維數(shù)d≥5時(shí)，其性能表現(xiàn)更優(yōu)。同時(shí)，改進(jìn)算法表現(xiàn)出了更高的識(shí)別率，其算法有效性得到了驗(yàn)證。

3.4 樣本訓(xùn)練個(gè)數(shù)對(duì)算法性能影響

針對(duì)小樣本集問(wèn)題，試驗(yàn)在ORL和YALE兩數(shù)據(jù)集上選取每類樣本的不同訓(xùn)練個(gè)數(shù)來(lái)比較不同算法的識(shí)別性能。ORL、YALE上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比如表1、表2所示。

表1 ORL上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比Tab.1 Comparisons of algorithm performance under different training samples on ORL

表2 YALE上不同訓(xùn)練樣本數(shù)下算法性能對(duì)比Tab.2 Comparisons of algorithm performance under different training samples on YALE

試驗(yàn)選取ORL和YALE兩樣本數(shù)較少的數(shù)據(jù)集。通過(guò)表1和表2可以看出，改進(jìn)算法總體性能表現(xiàn)較好。由于較低維數(shù)下算法識(shí)別性能較差，故通過(guò)求取均值獲取到的識(shí)別率偏差較大。

3.5 算法性能綜合評(píng)價(jià)

前述算法對(duì)比過(guò)程僅在改進(jìn)工作中引入了優(yōu)化后的多通道Gabor組合特征表示。為考量通道組合后特征對(duì)其他算法的性能影響，試驗(yàn)在數(shù)據(jù)集AR、ORL和YALE的每類樣本上分別選取訓(xùn)練個(gè)數(shù)為7、5、5。

AR、ORL、YALE數(shù)據(jù)集上識(shí)別性能對(duì)比如表3～表5所示。

表3 AR數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.3 Comparisons of recognition performance on AR dataset

表4 ORL數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.4 Comparisons of recognition performance on ORL dataset

表5 YALE數(shù)據(jù)集上識(shí)別性能對(duì)比Tab.5 Comparisons of recognition performance on YALE dataset

對(duì)比結(jié)果表明： ①多通道Gaborface的組合表征對(duì)每種算法均有識(shí)別率上的提升，但同時(shí)增加了訓(xùn)練耗時(shí)和分類耗時(shí)；②總體上，改進(jìn)算法的訓(xùn)練時(shí)間較久[16-17]，且分類性能表現(xiàn)較優(yōu)。

4 結(jié)論

針對(duì)人臉姿態(tài)變化、光照變化等因素對(duì)人臉識(shí)別性能的影響，通過(guò)選取多通道Gaborface優(yōu)化組合和引入樣本類別信息提升線性降維鑒別性能的方式，提出了一種Gaborface多通道優(yōu)化與二維線性降維的特征提取算法，用于描述人臉識(shí)別性能。

試驗(yàn)結(jié)果表明，在選取的人臉數(shù)據(jù)庫(kù)上，提出的改進(jìn)算法能夠增強(qiáng)人臉特征的表示和提取。采用多通道Gaborface表征組合更好地保留了人臉特征的局部性和方向性，并進(jìn)一步提升了雙向降維算法的識(shí)別性能，驗(yàn)證了改進(jìn)算法在人臉識(shí)別性能上的有效性。