史鈺潮,譚立輝
(廣東工業(yè)大學(xué)應(yīng)用數(shù)學(xué)學(xué)院,廣東廣州510520)
在人臉識(shí)別(FR)領(lǐng)域,基于矢量的模型是最受歡迎的。在這種模型范例下,原始的二維(2D)圖像通常被轉(zhuǎn)換為一維(1D)向量,這樣圖像就可以被表示為高維空間中的一點(diǎn)[1-3]。作為眾所周知的特征抽取和數(shù)據(jù)表示技術(shù),主成分分析法(PCA)[2-3]和線性判別分析法(LDA)[4-5]被廣泛用于模式識(shí)別領(lǐng)域。其中,PCA方法被用于尋找最能代表最小二乘意義上的數(shù)據(jù)的子空間,因此PCA提取的特征被認(rèn)為是最具表現(xiàn)力的特征[6]?;赑CA的算法非常受歡迎,因?yàn)樗子趯?shí)現(xiàn)且性能合理[7-8]。但是,在大尺寸和小樣本情況下,該方法很難精準(zhǔn)地對(duì)協(xié)方差進(jìn)行求解。而LDA是一種用于處理分類問題的監(jiān)督技術(shù),它通過最大化類間離散度與類內(nèi)離散度的比值,可以獲得具有最多辨別信息的子空間,它提取的特征被稱為最具辨別性的特征[6]。但是,LDA容易遇到“小樣本量”(3S)問題,這種現(xiàn)象在人臉識(shí)別任務(wù)中廣泛存在,即訓(xùn)練樣本的數(shù)量遠(yuǎn)小于樣本的維數(shù)[4,9-10]。此外,將2D圖像轉(zhuǎn)化為1D矢量將導(dǎo)致非常高維的圖像矢量,這導(dǎo)致LDA方法中使用的離散度矩陣由于大尺寸而難以被評(píng)估,并且通常其的類內(nèi)離散度矩陣也是奇異的。
針對(duì)一維PCA和LDA方法中存在的問題,Yang和Li等[11-12]分別提出了二維PCA(2D PCA)算法和二維線性鑒別分析(2D LDA)算法。與矢量化的PCA相比,2D PCA能更加精準(zhǔn)地求解出協(xié)方差矩陣,而且能提升特征抽取的速度,獲得更好的識(shí)別性能。而2D LDA算法不需要把人臉矩陣?yán)扇四槇D像向量,而是利用人臉矩陣直接計(jì)算類內(nèi)離散度矩陣及類間離散度矩陣。這樣,不僅可以避免“小樣本”問題,而且得到的離散度矩陣是非奇異的,識(shí)別性能上比矢量化的LDA方法精確。
2D PCA及2D LDA提取的特征向量維數(shù)一般比較高,與一維PCA或者一維LDA相比,擁有更多的特征系數(shù)用于圖像的呈現(xiàn),但也需要更多的存儲(chǔ)器來存儲(chǔ)這些特征。因此,Zhang等[13]提出了雙向2D PCA算法((2D)2PCA),(2D)2PCA對(duì)圖像的行方向和列方向同時(shí)進(jìn)行特征抽取,大大減少了特征向量的維數(shù)。相應(yīng)的,文獻(xiàn)[14]提出了雙向二維線性鑒別分析((2D)2LDA),即對(duì)圖像的行方向和列方向同時(shí)進(jìn)行二維線性鑒別分析,從而減少了特征向量的維數(shù)。進(jìn)一步,文獻(xiàn)[15-16]提出了基于子模式雙向二維PCA方法(Sp-(2D)2PCA)和基于子模式雙向二維LDA方法(Sp-(2D)2LDA),該方法保留了子塊之間的空間位置關(guān)系,能較好地提取原圖像的局部信息,減少了光照變化和表情所產(chǎn)生的影響[17]。
但是,對(duì)于(2D)2PCA,該方法考慮了行上的判別信息,卻忽略了部分垂直信息[18]。(2D)2PCA實(shí)質(zhì)是執(zhí)行兩次2D PCA:第1次是從行方向進(jìn)行,將原始圖像投影到行最優(yōu)投影軸上;然后在列方向進(jìn)行,將已經(jīng)投影的圖像矩陣再投影到列最佳投影軸上。人臉圖像的結(jié)構(gòu)決定了第1次投影的有效性[19],但是第2次投影時(shí),人臉圖像的列結(jié)構(gòu)已經(jīng)發(fā)生了變化,因此,垂直方向上的2D PCA的后續(xù)步驟不能利用圖像可用的整個(gè)垂直判別信息。也就是說,(2D)2PCA不同等地使用水平和垂直信息,而是強(qiáng)調(diào)提取水平判別特征。為此,本文提出了一個(gè)基于子模式的二維PCA融合復(fù)判別分析(CLDA)的特征提取框架。首先把圖像矩陣劃分為多個(gè)子塊,將原始圖像中對(duì)應(yīng)位置的子塊分別組成子模式訓(xùn)練集,基于子模式的方法有效地提取了人臉圖像的局部特征信息。對(duì)子模式訓(xùn)練集分別在水平和垂直方向上執(zhí)行2D PCA;然后把這兩個(gè)實(shí)特征矩陣融合到復(fù)的特征矩陣中,引入復(fù)的2D LDA來進(jìn)一步抽取該復(fù)的特征矩陣的信息,這樣不僅利用了圖像的協(xié)方差信息,也有效利用了類內(nèi)類間的鑒別信息。最后,把提取到的各個(gè)部分子復(fù)特征矩陣按照原始位置關(guān)系重新拼成全局特征矩陣;比較測試集樣本與訓(xùn)練集樣本復(fù)特征矩陣之間的間距,利用最近鄰分類器進(jìn)行圖像分類。標(biāo)準(zhǔn)ORL人臉庫上的實(shí)驗(yàn)表明,本文算法在識(shí)別準(zhǔn)確率上有明顯的優(yōu)勢。
2D PCA算法不需要把人臉矩陣?yán)扇四槇D像向量,直接對(duì)圖像投影分析,與一維PCA算法相比,計(jì)算過程中協(xié)方差矩陣規(guī)模顯著減小,計(jì)算精度也明顯提高。具體算法如下:
假設(shè)A是大小為m×n的圖像矩陣,訓(xùn)練的樣本總數(shù)為N,Ak(k=1,2,…,N)表示第k幅訓(xùn)練樣本圖像,總樣本的均值圖像為
圖像的協(xié)方差矩陣Gt為
取Gt的前d個(gè)較大特征值對(duì)應(yīng)的正交特征矢量為最優(yōu)投影矩陣,即Xopt=[X1,…,Xd]。
2D LDA算法也是基于經(jīng)典一維LDA算法二維化的一種擴(kuò)展,同樣是使類間離散度與類內(nèi)離散度的比率最大化。與一維LDA算法相比,2D LDA算法不會(huì)有“小樣本”問題,而且得到的離散度矩陣不會(huì)是奇異的,分類性能更優(yōu)。具體算法如下:
假設(shè)A是大小為m×n的圖像矩陣,訓(xùn)練的樣本總數(shù)為N,模式類數(shù)為C,Ni表示第i類的樣本數(shù),Ai,(kk=1,2,…,N)i表示第i類中第k個(gè)樣本,分別表示總的樣本平均值及第i類樣本的平均值。那么,人臉圖像的類間離散度矩陣Gb及類內(nèi)離散度矩陣Gw可表示為
因?yàn)轭悆?nèi)離散度矩陣Gw一般情況下是非奇異的[20],所以求解最優(yōu)投影矩陣可轉(zhuǎn)化為求GbGw-1的特征值和特征向量,其中前d個(gè)較大特征值對(duì)應(yīng)的特征向量就是所求的最佳投影矩陣,即Yopt=[Y1,…,Yd]。
國內(nèi)學(xué)者在城市地理因子對(duì)入室盜竊案件發(fā)案數(shù)量影響的研究中提到,城市中街道寬度、房屋樓層、房屋入住率、綠化程度、安保情況、商場學(xué)校的密度、路燈的設(shè)置、道路建筑拐角的監(jiān)控等都與入室盜竊案件的發(fā)生成正相關(guān)。合理的規(guī)劃建設(shè)將對(duì)入室盜竊案件的發(fā)生數(shù)量產(chǎn)生抑制作用。作為公共安全治理的主體,公安機(jī)關(guān)也應(yīng)積極參與城市的規(guī)劃工作,為建設(shè)更加安全的城市貢獻(xiàn)力量。
PCA和LDA都是特征提取的經(jīng)典算法,PCA提取的特征被認(rèn)為是最具表現(xiàn)力的特征,而LDA提取的特征被稱為最具辨別性的特征。本文結(jié)合2D PCA和2D LDA的優(yōu)點(diǎn)對(duì)圖像進(jìn)行特征提取,同時(shí)又考慮子模式的思想。
首先把人臉矩陣A進(jìn)行模塊化處理,分為s×c個(gè)子圖像矩陣,s,c分別為行方向、列方向的子塊數(shù)目。該分塊矩陣為
設(shè)共有N幅訓(xùn)練樣本圖像,Ak(k=1,2,…,N)表示第k幅訓(xùn)練樣本圖像,將原樣本圖像中,相同位置的子圖像(Ak)ij(i=1,…,s;j=1,…,c)構(gòu)成相應(yīng)的子模式訓(xùn)練集Kij。如果將子圖像組成的子模式訓(xùn)練集進(jìn)行訓(xùn)練,而不是將所有的子圖像組合成一個(gè)訓(xùn)練集進(jìn)行訓(xùn)練,這將有利于保持各個(gè)子塊的空間位置關(guān)系,突顯局部特征,有助于提高識(shí)別率。
在每一子模式訓(xùn)練集上施行行方向的2D PCA和列方向的2D PCA。具體做法如下:
在子圖像的行方向上,對(duì)于子模式訓(xùn)練集Kij的協(xié)方差矩陣為
接著,?。℅t)'ij的前d個(gè)較大特征值對(duì)應(yīng)的正交特征矢量,構(gòu)成最佳投影矩陣Zij。
上述通過2D PCA提取到的特征矩陣融合到復(fù)的特征矩陣后,引入復(fù)的2D LDA來提取該特征矩陣,這樣不僅利用了圖像的協(xié)方差信息,也有效利用了類內(nèi)類間的鑒別信息,結(jié)合了兩種算法的優(yōu)勢。具體做法如下:
計(jì)算各個(gè)位置類間離散度矩陣Gb及類內(nèi)離散度矩陣Gw,即
最后用最近鄰分類器進(jìn)行圖像分類,其中兩個(gè)復(fù)矩陣Φ1和Φ2之間的歐式距離定義為
實(shí)驗(yàn)針對(duì)標(biāo)準(zhǔn)的ORL人臉數(shù)據(jù)庫,將本文算法與PCA、2DPCA、(2D)2PCA、2DPCA+C2DLDA進(jìn)行比較。實(shí)驗(yàn)平臺(tái)為Inter Core,3.30 GHz CPU,8.00 GB,Windows 7操作系統(tǒng),編程語言為PYTHON,安裝OpenCV2.3.1版本。
ORL人臉庫包含400個(gè)人臉圖像,分為40類不同年齡、不同種族及不同性別的人臉,其中每類包含10幅不同方向、光照、面部細(xì)節(jié)變化的圖像,圖像分辨率均為112×92。圖1為標(biāo)準(zhǔn)ORL人臉庫中某一個(gè)人的5幅圖像。
圖1 ORL人臉庫中某個(gè)人的5幅圖像
本實(shí)驗(yàn)比較相關(guān)算法在不同的訓(xùn)練樣本數(shù)目下的分類準(zhǔn)確率,實(shí)驗(yàn)中每類人臉圖像的前幾張作為訓(xùn)練樣本,剩下的為測試樣本,訓(xùn)練樣本數(shù)為S=2~8,實(shí)驗(yàn)前,將每個(gè)圖像進(jìn)行了歸一化處理。分塊算法采用2×2的分塊情形。
由圖2可以看出,分類的精度隨著訓(xùn)練樣本數(shù)的增加而提高,從融合復(fù)判別分析算法與2DPCA,(2D)2PCA這幾組數(shù)據(jù)比較來看,融合的算法識(shí)別率高一些,因?yàn)槿诤系乃惴ú粌H考慮了行上的判別信息,也考慮了垂直信息,避免了(2D)2PCA等算法不同等地使用水平和垂直信息的缺點(diǎn)。而基于模塊化的算法識(shí)別準(zhǔn)確率要比非模塊化算法識(shí)別率高,畢竟對(duì)圖像分塊能有效地抽取人臉圖像的局部信息,保持子塊之間的空間關(guān)系,減少光照變化和表情所產(chǎn)生的影響,因此具有更好的識(shí)別性能。
圖2 各種算法在不同訓(xùn)練樣本數(shù)目的識(shí)別準(zhǔn)確率
圖3為本文算法在不同分塊情形下的識(shí)別率,其中取 N=1(1×1)、2(2×1)、4(2×2)、8(4×2)。若訓(xùn)練樣本數(shù)目增加,分類準(zhǔn)確率總體上升。本文算法在分塊數(shù)為1,2,4時(shí)識(shí)別效果較好,其中分塊數(shù)為4(2×2)時(shí)取得最好的識(shí)別性能。而分塊數(shù)為8(4×2)時(shí)準(zhǔn)確率有所下降,識(shí)別效果反而較差,這是因?yàn)檫^多的分塊會(huì)使人臉圖像的整體信息被忽略,分塊數(shù)目并非越多越好。
圖3 本文算法不同分塊在各種訓(xùn)練樣本數(shù)目下的識(shí)別率
本文提出了基于子模式的二維主成分分析融合復(fù)判別分析的特征提取算法,并應(yīng)用于人臉圖像識(shí)別。該方法首先對(duì)原始圖像進(jìn)行分塊,有效地提取人臉圖像的局部信息,保持了子塊之間的空間位置關(guān)系。然后對(duì)各個(gè)子塊抽取到的行和列的特征信息進(jìn)行有效地融合,同等地使用水平和垂直信息。接著對(duì)復(fù)特征矩陣用CLDA方法進(jìn)一步做特征抽取,最后將抽取到的局部子特征按照原來的空間位置組合成全局特征,有效地降低了特征的維數(shù)。相比2DPCA和(2D)2PCA方法,此方法識(shí)別率有相應(yīng)的提高。