簡(jiǎn)彩仁,莊凌宇,林智鵬
(廈門大學(xué)嘉庚學(xué)院,福建 漳州 363105)
人臉識(shí)別是基于人臉的面部特征辨識(shí)身份的生物識(shí)別技術(shù)。人臉識(shí)別最主要的用途是確定人的身份。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,人們獲取人臉圖像數(shù)據(jù)變得異常容易,因此人臉識(shí)別的發(fā)展和應(yīng)用更是不斷深入和普及。人臉識(shí)別技術(shù)已經(jīng)廣泛應(yīng)用在軍隊(duì)、醫(yī)療、銀行、公安、電子商務(wù)等行業(yè)。由于當(dāng)前人臉識(shí)別的應(yīng)用場(chǎng)景得到的高維數(shù)據(jù)愈發(fā)龐大,因此研究基于降維的人臉識(shí)別方法具有重要的意義。
人臉識(shí)別研究是當(dāng)前研究的熱點(diǎn)問題。許多降維方法被應(yīng)用于人臉識(shí)別研究?;诰€性降維方法的人臉識(shí)別研究代表性方法是線性判別分析(LDA)[1],該方法使降維數(shù)據(jù)類內(nèi)距離小,類間距離大,但是對(duì)小樣本數(shù)據(jù)容易產(chǎn)生非奇異解。基于流形學(xué)習(xí)的降維方法,如等距映射(ISOMAP)[2]、局部線性嵌入(LLE)[3]等,旨在保持局部結(jié)構(gòu)實(shí)現(xiàn)降維,更適合非線性數(shù)據(jù)的降維,但是這些方法嚴(yán)重依賴于近鄰關(guān)系,當(dāng)存在較小誤差時(shí),可能會(huì)對(duì)全局估計(jì)產(chǎn)生較大的影響。基于稀疏表示的降維方法在人臉識(shí)別中也有重要的應(yīng)用,該方法的優(yōu)點(diǎn)是可以避免過擬合問題,但是運(yùn)算效率不高[4-5]。
本文從降維的角度研究人臉識(shí)別。通過線性降維方法主成分分析和非線性降維方法核主成分分析對(duì)人臉圖像數(shù)據(jù)進(jìn)行降維研究。降維方法可以有效剔除人臉圖像數(shù)據(jù)的冗余特征,從而提高識(shí)別準(zhǔn)確率。通過實(shí)驗(yàn)比較降維人臉圖像數(shù)據(jù)與原始人臉圖像數(shù)據(jù)的識(shí)別準(zhǔn)確率。
主成分分析(Principal Component Analysis,PCA)方法將一組可能存在相關(guān)性的變量通過正交變換轉(zhuǎn)換為一組線性不相關(guān)的變量,使其成為統(tǒng)計(jì)的依據(jù),轉(zhuǎn)換后的這組變量叫主成分。主成分分析的主要思想是投影樣本點(diǎn)的方差最大化。從最大可分性的角度可以對(duì)主成分分析進(jìn)行另一種解釋。通過投影矩陣W將樣本點(diǎn)xi投影到新空間的超平面上,投影得到WTxi。可以通過最大化投影樣本點(diǎn)的方差達(dá)到盡可能區(qū)分投影樣本點(diǎn)的目的。
s.t.WTW=I
(1)
通過拉格朗日乘子法,式(1)可以通過特征值問題XXTW=λW求解。
主成分分析是一種經(jīng)典的線性降維方法,但不利于發(fā)現(xiàn)高維小樣本數(shù)據(jù)的本質(zhì)特征。針對(duì)這一不足,核主成分分析基于核理論對(duì)主成分分析進(jìn)行“核化”,擴(kuò)展成適合非線性降維的方法。
給定非線性特征空間映射Φ:Rm→M,其中Rm為高維樣本空間,M是低維流形空間,因此原始高維數(shù)據(jù)X的低維流形表示為Φ(X)。對(duì)高維空間樣本Φ(X)進(jìn)行主成分分析得到核主成分分析問題的優(yōu)化目標(biāo)函數(shù)為:
s.t.WTW=I
(2)
直接定義非線性映射Φ(X)是困難的,核表示理論給出了一種不需要定義非線性映射的技術(shù)[6-7]。設(shè)K∈Rn×n是一個(gè)半正定核矩陣,它們的元素定義為:
[K]ij=[(Φ(X),Φ(X))M]ij=Φ(xi)TΦ(xj)=k(xi,xj)
因此核主成分分析的目標(biāo)函數(shù)(2)可以轉(zhuǎn)化為:
s.t.WTW=I
(3)
通過拉格朗日乘子法,式(3)可以通過特征值問題KW=λW求解。
人臉圖像數(shù)據(jù)具有高維數(shù)的特點(diǎn),因此人臉圖像數(shù)據(jù)存在大量的冗余,通過降維可以得到更適合人臉識(shí)別的數(shù)據(jù)集。本節(jié)利用主成分分析和核主成分分析研究基于降維的人臉識(shí)別方法。
首先利用主成分分析或核主成分分析對(duì)數(shù)據(jù)集進(jìn)行降維,再對(duì)降維后的數(shù)據(jù)集進(jìn)行識(shí)別研究。結(jié)合第1節(jié)的理論,將基于降維的人臉識(shí)別方法的實(shí)現(xiàn)步驟總結(jié)成如下算法:
算法:基于降維的人臉識(shí)別方法輸入:人臉圖像數(shù)據(jù)集X,主成分保留比率pcaratio輸出:識(shí)別準(zhǔn)確率acc(1)標(biāo)準(zhǔn)化訓(xùn)練人臉圖像數(shù)據(jù)集X,使每個(gè)樣本具有單位L2范數(shù);(2)利用式(1)或式(3)求投影矩陣W;(3)對(duì)投影數(shù)據(jù)WTX用K最近鄰分類法進(jìn)行分類。
本節(jié)通過實(shí)驗(yàn)驗(yàn)證主成分分析和核主成分分析兩種降維方法對(duì)人臉識(shí)別的影響。
實(shí)驗(yàn)數(shù)據(jù)集為兩個(gè)常用的人臉識(shí)別數(shù)據(jù)集Yale和ORL。
Yale人臉數(shù)據(jù)集總共采集了15個(gè)人的人臉圖像,該數(shù)據(jù)集共15個(gè)類別,165個(gè)樣本,特征數(shù)量為1 024個(gè)。在這15個(gè)對(duì)象中,每一個(gè)對(duì)象都具有11張各不相同的人臉。在這些圖像中,包含各種阻擋因素,例如角度因素、光照強(qiáng)度因素、相關(guān)環(huán)境變化因素以及遮擋物的影響和不同表情的變化等。圖1為部分Yale人臉圖像。
圖1 Yale人臉圖像示意圖
ORL人臉數(shù)據(jù)集共有40個(gè)對(duì)象,每一個(gè)對(duì)象都具有10張人臉,總數(shù)量達(dá)到400張灰度圖像人臉,特征數(shù)量為1 024個(gè)。每一個(gè)對(duì)象的人臉通過觀察存在肉眼可見的變化,包括遮擋物的變化、表情的變化等,在此基礎(chǔ)之上每個(gè)人臉的每一張圖片的大小都是按照一定的規(guī)律進(jìn)行漸次變化,并且每個(gè)人臉之間存在20°的水平以及垂直的旋轉(zhuǎn)變化。圖2為部分ORL人臉圖像。
圖2 ORL人臉數(shù)據(jù)示意圖
實(shí)驗(yàn)環(huán)境為Windows 7系統(tǒng),安裝內(nèi)存8.00 GB(3.42 GB可用),用MATLAB R2011b編程實(shí)現(xiàn)。利用交叉驗(yàn)證對(duì)比各種方法下的識(shí)別準(zhǔn)確率。對(duì)兩個(gè)數(shù)據(jù)集通過主成分分析(PCA)和核主成分分析(KPCA)進(jìn)行降維后與原始數(shù)據(jù)集進(jìn)行對(duì)比,選用K最近鄰分類法進(jìn)行分類對(duì)比分類準(zhǔn)確率和運(yùn)行時(shí)間。實(shí)驗(yàn)參數(shù)設(shè)置如下:主成分保留比率為90%,K最近鄰分類法的最近鄰參數(shù)選為1,交叉驗(yàn)證折數(shù)設(shè)置為{4,5,6,7,8,9,10}。比較方法為原始數(shù)據(jù)用K最近鄰分類(KNN)、主成分分析降維數(shù)據(jù)用K最近鄰分類(PCA-KNN)、核主成分分析降維數(shù)據(jù)用K最近鄰分類(KPCA-KNN)。
實(shí)驗(yàn)1:Yale人臉圖像數(shù)據(jù)集識(shí)別實(shí)驗(yàn)。該實(shí)驗(yàn)利用KNN、PCA-KNN、KPCA-KNN 3種方法研究Yale人臉圖像數(shù)據(jù)集的識(shí)別準(zhǔn)確率。在不同交叉驗(yàn)證折數(shù)下的識(shí)別準(zhǔn)確率如表1所示,圖3也直觀顯示了不同方法的識(shí)別準(zhǔn)確率。
表1 Yale人臉圖像數(shù)據(jù)識(shí)別準(zhǔn)確率對(duì)比 (%)
圖3 Yale人臉圖像數(shù)據(jù)集識(shí)別準(zhǔn)確率對(duì)比圖
從表1和圖3的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),降維后的數(shù)據(jù)集具有更好的識(shí)別準(zhǔn)確率。因此降維方法可以有效地緩解人臉圖像數(shù)據(jù)的冗余問題。再對(duì)比核主成分分析和主成分分析兩種降維方法,發(fā)現(xiàn)KPCA-KNN方法顯著優(yōu)于PCA-KNN,這反映了核主成分分析這種非線性降維方法更適應(yīng)人臉圖像的非線性性質(zhì),從而取得更好的識(shí)別準(zhǔn)確率。
此外,表2給出了不同方法對(duì)Yale人臉圖像數(shù)據(jù)集進(jìn)行識(shí)別的運(yùn)行時(shí)間。
表2 Yale人臉圖像數(shù)據(jù)集識(shí)別時(shí)間對(duì)比 (s)
從表2可以發(fā)現(xiàn),降維后可以明顯提高識(shí)別的效率。而且,非線性降維方法KPCA比線性降維方法PCA更有效率。
實(shí)驗(yàn)2:ORL人臉圖像數(shù)據(jù)集識(shí)別實(shí)驗(yàn)。該實(shí)驗(yàn)利用KNN、PCA-KNN、KPCA-KNN 3種方法研究ORL人臉圖像數(shù)據(jù)集的識(shí)別準(zhǔn)確率。在不同交叉驗(yàn)證折數(shù)下的識(shí)別準(zhǔn)確率如表3所示,圖4直觀顯示了不同方法的識(shí)別準(zhǔn)確率。
表3 ORL人臉圖像數(shù)據(jù)識(shí)別準(zhǔn)確率對(duì)比 (%)
圖4 ORL人臉圖像數(shù)據(jù)集識(shí)別準(zhǔn)確率對(duì)比圖
從表3和圖4的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),ORL人臉圖像數(shù)據(jù)集的識(shí)別實(shí)驗(yàn)結(jié)果與Yale人臉圖像數(shù)據(jù)集的識(shí)別實(shí)驗(yàn)結(jié)果類似:降維有利于人臉圖像的識(shí)別,并且核主成分分析這種非線性降維方法更適應(yīng)人臉圖像的非線性性質(zhì),有更好的識(shí)別準(zhǔn)確率。
表4給出了ORL人臉圖像數(shù)據(jù)集在不同交叉折數(shù)下進(jìn)行識(shí)別的運(yùn)行時(shí)間。
表4 ORL人臉圖像數(shù)據(jù)集識(shí)別時(shí)間對(duì)比 (s)
從表4的運(yùn)行時(shí)間對(duì)比可以發(fā)現(xiàn),降維可以明顯提高識(shí)別的效率。非線性降維方法KPCA比線性降維方法PCA更有效率。不僅如此,當(dāng)樣本的個(gè)數(shù)更多時(shí),KPCA的運(yùn)行效率比PCA有明顯的改善。
通過以上兩個(gè)人臉圖像識(shí)別實(shí)驗(yàn)的識(shí)別準(zhǔn)確率和運(yùn)行時(shí)間對(duì)比分析,可以明顯地發(fā)現(xiàn)經(jīng)過主成分分析和核主成分分析的降維,無論是識(shí)別準(zhǔn)確率還是識(shí)別效率對(duì)比無降維數(shù)據(jù),都具有顯而易見的優(yōu)勢(shì)。其中,核主成分分析作為主成分分析的改進(jìn),比主成分分析有更加精確的識(shí)別準(zhǔn)確率以及更好的識(shí)別效率。
本文利用主成分分析和核主成分分析對(duì)基于降維的人臉識(shí)別方法進(jìn)行了研究。實(shí)驗(yàn)結(jié)果表明降維可以有效地提高人臉識(shí)別準(zhǔn)確率,而非線性降維方法更適合人臉圖像數(shù)據(jù)的降維。不僅如此,降維后的數(shù)據(jù)可以明顯提高識(shí)別效率。因此,本文的研究具有一定的實(shí)用價(jià)值。