池義勇
(日東高速公路 臨沂管理處,山東 臨沂273400)
責(zé)任編輯:任健男
最近在模式識(shí)別領(lǐng)域,研究人員提出了一個(gè)有前景的圖像識(shí)別方法,即所謂的稀疏表示法[1],該方法沒(méi)有利用傳統(tǒng)的方式進(jìn)行圖像分類(lèi),而是首先使用訓(xùn)練樣本子集的線性組合來(lái)表示測(cè)試樣本,然后基于表達(dá)式的結(jié)果,對(duì)測(cè)試樣本進(jìn)行分類(lèi)。這種方法已經(jīng)獲得了非常不錯(cuò)的性能,并且被一致認(rèn)為是人臉識(shí)別研究的一個(gè)突破[2]。然而,稀疏表示法有非常高的計(jì)算開(kāi)銷(xiāo),主要是因?yàn)樗蕾嚨惴▉?lái)實(shí)現(xiàn)解決方案。稀疏表示法也可用于乳腺癌的識(shí)別分類(lèi)、信號(hào)處理及圖像分解等[3]。
以前的人臉識(shí)別方法通常由特征提取、分類(lèi)器的選擇及分類(lèi)這三個(gè)階段組成。通常,特征提取階段由變換方法實(shí)現(xiàn),如基于獨(dú)立成分分析方法[4]、主成分分析方法[5]和判別分析方法[6]。然而,稀疏表示法采用了引人注目的新的方法來(lái)解決人臉識(shí)別問(wèn)題,它不包含特征提取和分類(lèi)器選擇階段,相反它嘗試用測(cè)試樣本表示為訓(xùn)練集的稀疏線性組合。術(shù)語(yǔ)“訓(xùn)練樣本的稀疏線性組合”意味著如果測(cè)試樣本可表示為所有訓(xùn)練樣本的線性組合,那么大部分成分的組合都是零[6]。如此看來(lái),稀疏表示法試圖尋求不同訓(xùn)練樣本在“構(gòu)建”測(cè)試樣本時(shí)潛在的影響,并打算將測(cè)試樣本分類(lèi),它的訓(xùn)練樣本具有最大的效果。換句話說(shuō),這種方法假定,測(cè)試樣本可使用不同類(lèi)的訓(xùn)練樣本效果的總和近似表示,并且具有最大效果的類(lèi)與測(cè)試樣本最相似[7-8]。
本文提出了一個(gè)簡(jiǎn)單并且快速的人臉識(shí)別方法,該方法與稀疏表示法部分相似,然而它在計(jì)算上卻更加有效,并且有一個(gè)獨(dú)特的特征,其解決方案可以很容易地實(shí)現(xiàn)。首先,所提方法從每個(gè)類(lèi)中為每個(gè)測(cè)試樣本,只選擇一個(gè)鄰居樣本,然后把測(cè)試樣本表示為所有選定鄰居樣本的線性組合,最后,基于表達(dá)式結(jié)果,該方法構(gòu)造一個(gè)分類(lèi)過(guò)程。所提方法在人臉識(shí)別應(yīng)用中表現(xiàn)出了很好的性能。
由于所提方法僅使用了L個(gè)訓(xùn)練樣本來(lái)表示及分類(lèi)測(cè)試樣本(L是所有的類(lèi)的數(shù)目),也是一種稀疏表示法,且能夠繼承該方法的優(yōu)點(diǎn)。分析表明,使用本文方法來(lái)選擇及使用訓(xùn)練樣本是最合適的,因?yàn)榭僧a(chǎn)生最小的分類(lèi)錯(cuò)誤。也就是說(shuō),如果使用其他L個(gè)訓(xùn)練樣本來(lái)表示和分類(lèi)測(cè)試樣本,將獲得更高的分類(lèi)錯(cuò)誤。實(shí)驗(yàn)結(jié)果表明,本文方法比最近鄰方法(Nearest Neighbor Classication Methods,NNCM)更好。最近鄰方法的確是一種特殊形式的K近鄰分類(lèi)器[9],最近鄰方法首先要確定的是與測(cè)試樣本最近的訓(xùn)練樣本,然后把測(cè)試樣本分到訓(xùn)練樣本的類(lèi)中。本文的方法由歐氏度量決定,通過(guò)修改測(cè)試樣本和訓(xùn)練樣本之間的鄰居關(guān)系,以達(dá)到更好的性能。而且,雖然本文方法執(zhí)行分類(lèi)時(shí),依賴的訓(xùn)練樣本比NFS[10]方法少得多,但它能獲得更好的性能。
本節(jié)開(kāi)始描述了所提的基于表示的簡(jiǎn)單快速方法(Simple and Fast Face Recognition,RSF),該方法包含兩個(gè)步驟:第一步,從每個(gè)類(lèi)中選擇與測(cè)試樣本最近的訓(xùn)練樣本。假設(shè)有L個(gè)類(lèi),先獲得測(cè)試樣本的L個(gè)最近的訓(xùn)練樣本(NTS),每個(gè)都各來(lái)自一個(gè)類(lèi);第二步,把測(cè)試樣本表示為所有選擇的L個(gè)NTSs的線性組合,并利用所確定的線性組合來(lái)對(duì)測(cè)試樣本分類(lèi)。此外,假設(shè)每個(gè)訓(xùn)練樣本和測(cè)試樣本均為列向量。
RSF的第二步工作為:假設(shè)測(cè)試樣本y可近似表示為所有NTSk,k=1,2,…,L的線性組合,即假定下面的等式滿足
式(2)可改寫(xiě)成
式中:β=(β1,β2,…,βL)T。如果STS是非奇異的,則可以用β=(STS)-1STY來(lái)得到式(3)的最小二乘解。如果STS幾乎奇異,則利用β=(STS+μⅠ)-1STY來(lái)求解β,其中μ是一個(gè)正常量,Ⅰ是標(biāo)識(shí)。利用這個(gè)方法作為RSF的正規(guī)化解決方案。得到β之后,再利用表示Sβ,即=Sβ,為RSF的表達(dá)式結(jié)果。
等式(2)表明,每個(gè)NTS對(duì)表示測(cè)試樣本有著自己的貢獻(xiàn),第i個(gè)NTS做的貢獻(xiàn)為βiNTSi。此外,第i個(gè)NTS表示的測(cè)試樣本的能力可由βiNTSi與Y之間的偏差來(lái)評(píng)估。把偏差定義為ei=‖Y-βiNTSi‖2。RSF認(rèn)為,ei越小,第i個(gè)NTS表示測(cè)試樣本的能力就越強(qiáng)。第二步標(biāo)識(shí)了NTS,其在測(cè)試樣本中具有最小偏差,并把測(cè)試樣本分到標(biāo)識(shí)的NTS的類(lèi)中。應(yīng)當(dāng)指出的是,每個(gè)類(lèi)只有一個(gè)NTS和第i個(gè)NTS對(duì)應(yīng)的第i個(gè)類(lèi)。如果et=minei,那么,測(cè)試樣本被分到第t類(lèi)中,參考第t類(lèi)的最近鄰,可以把它當(dāng)作是RSF所確定的最近鄰。
RSF方法與稀疏表示法[2]不同,它有一個(gè)非常簡(jiǎn)單的解決方案,然而,稀疏表示法的迭代解決方案計(jì)算不是很高效;此外,RSF方法可以看作是一種特殊的稀疏表示法。其實(shí),如果RSF中的線性組合強(qiáng)制改寫(xiě)為所有訓(xùn)練樣本的線性組合,那么,除了NTS,所有訓(xùn)練樣本的線性組合的系數(shù)都應(yīng)該為零。
雖然RSF和文獻(xiàn)[2]中的方法都為稀疏表示法,但是它們使用了兩種不同的方式來(lái)得到稀疏性。RSF使用第一步來(lái)產(chǎn)生稀疏性,系數(shù)很稀疏(即有多少零系數(shù)),且它的系數(shù)均為零。然而稀疏表示法通過(guò)迭代算法得到稀疏性,并不知道線性組合的哪些系數(shù)等于或近似等0。把所以,也可以把RSF方法稱作“硬”稀疏表示法,文獻(xiàn)[2]中的方法稱為“軟”稀疏表示法。
RSF方法有兩個(gè)優(yōu)勢(shì)。第一,它僅利用較少數(shù)目的訓(xùn)練樣本來(lái)表示和分類(lèi)測(cè)試樣本。其結(jié)果是,RSF方法可以有效地解決式(3)中的計(jì)算,當(dāng)解決式(3)中的線性系統(tǒng)時(shí),它需要的時(shí)間復(fù)雜度為O(L2M+L3+LM),其中,M是樣本向量的維數(shù)。NFS方法解決線性系統(tǒng),所需要的時(shí)間復(fù)雜度為O(n2M+n3+nM)=O(nNM+Nn2+NM),其中,n和N分別是每個(gè)類(lèi)訓(xùn)練樣本的數(shù)目和所有訓(xùn)練樣本的數(shù)目。RSF的第二個(gè)好處是,雖然簡(jiǎn)單并且與NNCM部分相似,但是,它比NNCM的性能更好,NNCM可以描述成這樣一種方法,它利用每個(gè)類(lèi)的最近鄰來(lái)對(duì)測(cè)試樣本進(jìn)行分類(lèi)。NNCM過(guò)程如下:首先,NNCM從每個(gè)類(lèi)中為測(cè)試樣本選擇最近鄰。NNCM標(biāo)識(shí)的樣本是,在L個(gè)選擇的最近鄰(NTS)中與測(cè)試樣本最近的那個(gè),并且假設(shè)測(cè)試樣本來(lái)自于同一個(gè)類(lèi)中,L是所有類(lèi)的數(shù)目。RSF優(yōu)于NNCM的主要原因是修改了由歐氏度量決定的測(cè)試樣本和訓(xùn)練樣本之間的鄰居關(guān)系。如第1.1節(jié)所述,在RSF方法中的測(cè)試樣本與訓(xùn)練樣本之間的鄰居關(guān)系,最終由測(cè)試樣本與表示NTS測(cè)試樣本的貢獻(xiàn)之間的偏差決定。
RSF的過(guò)程如下:第一步,使用歐氏度量來(lái)為測(cè)試樣本從每個(gè)類(lèi)中選擇鄰居樣本;第二步,使用在前面定義的偏差來(lái)對(duì)測(cè)試樣本和鄰居樣本之間的鄰居關(guān)系重新排序,其中鄰居樣本由第一步?jīng)Q定。即第二步使用的測(cè)試樣本與表示NTS測(cè)試樣本的貢獻(xiàn)之間的偏差作為度量標(biāo)準(zhǔn)。第二步使用了這個(gè)度量,決定了“最后的近鄰”,并且把測(cè)試樣本分到“最后的近鄰”屬于的類(lèi)中。圖1顯示了所提出的RSF方法的流程圖,從圖1可以清楚地看到,RSF方法標(biāo)識(shí)的RTS具有最小偏差,假定測(cè)試樣本來(lái)自RTS標(biāo)識(shí)的類(lèi)中,則RSF方法中的分類(lèi)等價(jià)于基于偏差度量的最近鄰分類(lèi)。
圖1 RSF方法的流程圖
當(dāng)RSF嘗試使用L個(gè)訓(xùn)練樣本來(lái)表示測(cè)試樣本時(shí),它需要使用最合適并且最重要的L個(gè)樣本。即在所有訓(xùn)練樣本中,就表示測(cè)試樣本的能力而言,L個(gè)最近鄰(NTSs)是最重要的L個(gè)訓(xùn)練樣本。但其實(shí),如果使用其他的L個(gè)樣本來(lái)表示和對(duì)測(cè)試樣本進(jìn)行分類(lèi),分類(lèi)的性能可能會(huì)很差。
實(shí)驗(yàn)使用了ORL和Yale兩大通用人臉數(shù)據(jù)庫(kù)來(lái)測(cè)試所提出的RSF方法。所有的實(shí)驗(yàn)均在4 Gbyte內(nèi)存的Intel Core 2.93 GHz Windows XP計(jì)算機(jī)上完成,編程環(huán)境為MATLAB 7.0。ORL數(shù)據(jù)庫(kù)包含40個(gè)人的400張人臉圖像,每人10張,包含不同的面部表情的變化(笑/不笑,睜/閉眼)和面部細(xì)節(jié)。對(duì)象處于直立正面的位置且具有高達(dá)200的傾斜和旋轉(zhuǎn),每張人臉圖像為112×92像素,圖2為ORL上某人的10張不同的人臉圖像。
圖2 ORL上某人的10張人臉圖像
Yale數(shù)據(jù)庫(kù)包含15個(gè)人的165張人臉圖像,每人11張,具有許多表情,如正常的、悲傷的、快樂(lè)的、困乏的、驚訝的、眨眼的等,且都是在不同的光照條件下獲得的,還有一些人臉是帶著眼鏡的,Yale上某人的11張人臉圖像如圖3所示。
圖3 Yale上某人的11張人臉圖像
為了更好地體現(xiàn)出所提方法的優(yōu)越性,將所提方法與NNCM[9]、NFS[10]、最遠(yuǎn)鄰方法[4]、使用第一個(gè)樣本方法[6]、使用最后一個(gè)樣本方法[6]的錯(cuò)誤分類(lèi)率進(jìn)行了對(duì)比。而且,對(duì)于測(cè)試樣本,通過(guò)為每個(gè)測(cè)試樣本選擇每個(gè)類(lèi)的第一個(gè)或最后一個(gè)訓(xùn)練樣本,來(lái)修改RSF方法,通過(guò)選擇的第一個(gè)或最后一個(gè)訓(xùn)練樣本來(lái)表示和分類(lèi)測(cè)試樣本。前面提到的使用了第一個(gè)和最后一個(gè)訓(xùn)練樣本的方法,分別可視為使用第一個(gè)樣本的方法和使用最后一個(gè)樣本的方法。從每個(gè)類(lèi)中對(duì)測(cè)試樣本選擇最遠(yuǎn)的鄰居來(lái)修改所提的RSF方法,利用它們來(lái)表示和分類(lèi)測(cè)試樣本,引用此方法是因?yàn)樵摲椒ㄊ褂昧俗钸h(yuǎn)的鄰居。
實(shí)驗(yàn)選用了ORL及Yale的前l(fā)(l=1,2,3,4)張圖像作為訓(xùn)練樣本,剩下的圖像作為測(cè)試樣本。實(shí)現(xiàn)所有的方法之前,先把每個(gè)樣本向量轉(zhuǎn)換成長(zhǎng)度為1的單位向量。使用正則法來(lái)獲得RSF的解決辦法,并設(shè)置μ為0.01。參考各方法的所在文獻(xiàn),為各個(gè)方法設(shè)置不同的參數(shù),進(jìn)行了大量的實(shí)驗(yàn),并取最佳的實(shí)驗(yàn)結(jié)果,如表1、表2所示。
表1 各方法在Yale上的平均分類(lèi)錯(cuò)誤率
表2 各方法在ORL上的平均分類(lèi)錯(cuò)誤率
從表1、表2可以看出,所提的RSF方法比NNCM、NFS、最遠(yuǎn)鄰的方法、使用第一個(gè)樣本方法、使用最后一個(gè)樣本方法分類(lèi)都精確。RSF的錯(cuò)誤率比NNCM、RSF、最遠(yuǎn)鄰方法、使用第一個(gè)樣本方法、使用最后一個(gè)樣本方法分別低了0.91%,0.49%,22.26%,8.93%,9.62%。
ORL數(shù)據(jù)庫(kù)中RSF的錯(cuò)誤率比NNCM、RSF、最遠(yuǎn)鄰方法、使用第一個(gè)樣本方法、使用最后一個(gè)樣本方法分別低了1.50%,0.74%,35.72%,22.43%,25.38%。雖然這些方法都使用相同數(shù)目的訓(xùn)練樣本來(lái)表達(dá)和分類(lèi)測(cè)試樣本,但是RSF使用了最適合的訓(xùn)練樣本,所以,無(wú)論是在ORL還是Yale數(shù)據(jù)庫(kù),也無(wú)論訓(xùn)練樣本數(shù)為多少,RSF的分類(lèi)性能總是比其他各個(gè)方法更優(yōu)。
RSF通過(guò)利用抑制訓(xùn)練樣本中的測(cè)試樣本的能力,而不僅僅是一個(gè)簡(jiǎn)單的距離來(lái)分類(lèi)測(cè)試樣本,已被驗(yàn)證是一個(gè)用來(lái)產(chǎn)生較高分類(lèi)精度的好方法。分析表明,對(duì)于RSF方法,使用的L個(gè)最近鄰是最合適的訓(xùn)練樣本,用其表示和分類(lèi)測(cè)試樣本。而且,盡管RSF比NFS方法要更稀疏,但它可能會(huì)獲得更好的性能。
本文提出了一種基于表示的簡(jiǎn)單快速的人臉識(shí)別方法(RSF),使用了每個(gè)類(lèi)中的最近鄰來(lái)表示測(cè)試樣本并對(duì)其進(jìn)行分類(lèi)。RSF方法比NNCM獲得更低的錯(cuò)誤率,這兩種方法之間準(zhǔn)確度的最大差值可能大于10%。除了方法設(shè)計(jì)和實(shí)驗(yàn)分析,本文也直觀地描述了RSF的基本原理和特點(diǎn)。
[1]廖海斌,郝寧波,陳慶虎.基于奇異值與稀疏表示的穩(wěn)健性人臉識(shí)別[J].計(jì)算機(jī)科學(xué),2010,34(7):99-103.
[2]蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識(shí)別[J].軟件學(xué)報(bào),2010,21(8):1849-1862.
[3]朱杰,楊萬(wàn)扣,唐振民.基于字典學(xué)習(xí)的核稀疏表示人臉識(shí)別方法[J].模式識(shí)別與人工智能,2012,25(5):859-864.
[4]柴智,劉正光.應(yīng)用復(fù)小波和獨(dú)立成分分析的人臉識(shí)別[J].計(jì)算機(jī)應(yīng)用,2010,30(7):1863-1866.
[5]嚴(yán)慧,金忠,楊靜宇.非負(fù)二維主成分分析及在人臉識(shí)別中的應(yīng)用[J].模式識(shí)別與人工智能,2009,22(6):809-814.
[6]周春光,孫明芳,王甦菁,等.基于稀疏張量的人臉圖像特征提取[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2012,42(6):1521-1526.
[7]崔鵬,張汝波.半監(jiān)督系數(shù)選擇法的人臉識(shí)別[J].哈爾濱工程大學(xué)學(xué)報(bào),2012,33(7):855-861.
[8]蘇超,肖南峰.基于集成BP網(wǎng)絡(luò)的人臉識(shí)別研究[J].計(jì)算機(jī)應(yīng)用研究,2012,29(11):4334-4337.
[9]張強(qiáng),戚春,蔡云澤.基于判別改進(jìn)局部切空間排列特征融合的人臉識(shí)別方法[J].電子與信息學(xué)報(bào),2012,34(10):2396-2401.
[10]王娜,李霞,劉國(guó)勝.基于特征子空間鄰域的局部保持流形學(xué)習(xí)算法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(4):1318-1321.