徐志京,葉 麗(上海海事大學(xué) 信息工程學(xué)院,上?!?01306)
基于壓縮感知的單樣本人臉識別*
徐志京,葉麗
(上海海事大學(xué)信息工程學(xué)院,上海201306)
提出一種基于壓縮感知的單樣本人臉識別方法,通過局部鄰域嵌入非線性降維和稀疏系數(shù)的方法產(chǎn)生冗余樣本,則新樣本包含了多種姿態(tài)和多種表情。將所有的新樣本作為訓(xùn)練樣本,運用改進后的稀疏表征分類算法進行人臉圖像的識別。在單樣本情況下,基于ORL人臉庫和FERET人臉庫的實驗證明,該方法比原稀疏表征方法在識別率上分別提高了15.53%和7.67%。與RSRC、SSRC、DMMA、I-DMMA等方法相比,該方法同樣具有良好的識別性能。
人臉識別;單樣本;稀疏表征分類;局部鄰域嵌入非線性降維
人臉識別技術(shù)是一種通過分析比較人臉視覺特征信息進行身份鑒別的計算機技術(shù)[1]。人臉識別受表情、姿態(tài)等多因素影響,其仍是生物特征識別領(lǐng)域最困難的研究課題之一。同時,因樣本采集成本大、存儲空間受限等造成了單訓(xùn)練樣本問題,這使得人臉內(nèi)在特征的提取變得更加困難[2]。在人臉訓(xùn)練數(shù)據(jù)庫中每人僅有一幅圖像的情況下,多數(shù)傳統(tǒng)方法的識別性能將嚴重下降。壓縮感知[3](Compressed Sensing,CS)是近年來新興的信號處理方法。利用壓縮感知理論,WRIGHT J等人[3]提出了一種稀疏表示人臉識別算法(Sparse Representation-based Classification,SRC)。SRC方法在局部遮擋、噪聲等問題上具有相當?shù)聂敯粜?。針對單樣本問題,本文提出了一種基于壓縮感知的單樣本人臉識別方法。該方法首先利用局部鄰域嵌入非線性降維和稀疏系數(shù)將一幅人臉圖像擴展為姿態(tài)表情各不同的圖像,將所有新的樣本作為訓(xùn)練樣本,最后采用改進的稀疏表征方法進行識別分類。
1.1壓縮感知(CS)
CS作為一個新的理論框架,它能以遠低于奈奎斯特頻率對信號進行采樣。
壓縮感知理論主要包括三個方面的內(nèi)容:
(1)信號x∈Rn的稀疏表示問題:x=Ψα。
(2)信號低速采樣問題:y=Φx。Φ是M×N維的觀測矩陣,與稀疏基Ψ的乘積要滿足有限等距性質(zhì)。確保在降低維數(shù)的同時原始信號的信息損失也最小。
(3)信號重構(gòu)問題。從線性觀測y=Aα中無失真地恢復(fù)信號(其中A稱為CS信息算子,A=ΦΨ),它基于如下嚴格的數(shù)學(xué)最優(yōu)化(Optimization)問題:
在信號足夠稀疏下,基于L0和L1最小化等價的理論,可將L0范數(shù)轉(zhuǎn)換成L1范數(shù):
1.2SRC算法
SRC的基本思想是:將不同類別的樣本組合成一個超完備字典,測試樣本可由同一類的訓(xùn)練樣本的線性組合來表示。算法可通過測試樣本相對于超完備字典的稀疏表示系數(shù)區(qū)分出測試樣本中所屬類別。
Ψ=[A1,A2,…,Ac]
則x可線性表示為:
理想條件下α=[0,0,…,0,αiT,0,0,…,0]T,該系數(shù)向量中除了與第i類有關(guān)的系數(shù)之外,其他元素都為0。
1.3基于SRC的改進算法
本文提出的算法采用了非常稀疏投影矩陣作為觀測矩陣Φ,降低圖像維度。參考文獻[4]已證明非常稀疏投影矩陣不僅滿足CS測量矩陣的必要條件,而且比高斯矩陣有更好的測量效果。在L1最小化問題上,利用對偶增廣拉格朗日乘子算法尋求最優(yōu)稀疏解。其原理是先將L1范數(shù)最小化問題式(2)轉(zhuǎn)化為對偶問題:
其中B1∞={α∈Rn∶‖α‖∞≤1},對應(yīng)的拉格朗日函數(shù)為:
其中α是拉格朗日乘子,通過交替迭代α、t、z,求(4)式的極值,即保證了重構(gòu)的精確度又降低了算法的運算度。最后為了更加精確地分類,利用加權(quán)殘余確定類別。
算法步驟如下:
(1)輸入C類N個訓(xùn)練樣本,構(gòu)成字典矩陣Ψ∈Rn×N。
(3)給定一個測試圖像 x∈Rn。
(4)計算Yi=ΦA(chǔ)i,i=1,…,C,并計算測量矩陣Y=[Y1,Y2,…,Yc]=ΦΨ,其中Y∈Rn×N。
(5)計算新的投影樣本y=Φx,并采用對偶增廣拉格朗日乘子求得稀疏向量α?,使得Yα=y。
(7)若k=argmini(ei),則x屬于第k類。
單樣本問題的難點是每個對象只有一個樣本,這使得考慮類內(nèi)差異的一些成熟算法識別率低。解決單樣本問題的一個有效途徑是增加與現(xiàn)實相符合的冗余樣本。這種擴充訓(xùn)練樣本個數(shù)的方法充分利用了一幅訓(xùn)練樣本中的有用信息,便于進一步的識別分類。
2.1多姿態(tài)樣本的生成
生成多姿態(tài)樣本的方法是基于局部鄰域嵌入非線性降維理論[5]的。具體方案步驟是:
(1)將所有人臉圖像先進行小波變換,再表示為列向量形式。
(2)設(shè)輸入的某姿態(tài)人臉圖像為Ii,將其視為高維空間中的一點,而相同姿態(tài)訓(xùn)練集人臉圖像Tin(包括N個圖像)作為Io點的鄰近點,再根據(jù)局部鄰域嵌入非線性降維理論求解近鄰點的權(quán)值。
“互聯(lián)網(wǎng)+教育”可以使具有碎片式、復(fù)雜化特點的教育源配置達到最大優(yōu)化和公開化,提升教育資源的共享程度,促進教育公平?!盎ヂ?lián)網(wǎng) + 教育”可以將已有的優(yōu)質(zhì)教育資源的價值和作用發(fā)揮到最大化。通過互聯(lián)網(wǎng)技術(shù),一位優(yōu)秀教師可以教授成千上萬名學(xué)生,因此建立公辦高校與民辦高校教育資源共享平臺,可以使民辦高校與其他公辦院校及優(yōu)秀教師跨地區(qū)、跨時間的合作交流,不僅可以豐富資源的內(nèi)容,減少成本,還可以縮小甚至消除民辦高校與公辦院校師資力量的差距,減小教育資源鴻溝。
(3)設(shè)目標姿態(tài)的訓(xùn)練集人臉圖像Ton(包括N個圖像),而待合成的目標姿態(tài)人臉圖像為Io,然后利用步驟(2)中解出的權(quán)值反算出一個高維空間的點,即為目標角度人臉圖像向量。
(3)將目標姿態(tài)人臉圖像向量表示為矩陣形式,再進行小波逆變換。
這種方法能快速地生成多姿態(tài)樣本,且克服現(xiàn)有的同類方法復(fù)雜、效果不佳的問題。圖1是原人臉圖像及其生成的多姿態(tài)樣本,其中(a)為輸入圖像,(b)分別為生成的不同姿態(tài)圖像,而(c)為真實圖像。
圖1 原人臉圖像及其生成的多姿態(tài)樣本
2.2多表情樣本的生成
生成多表情樣本的方法是基于稀疏表征的。保證所有圖像大小統(tǒng)一,圖像中眼睛、鼻子、嘴巴在各自圖像中的同一個固定位置。在訓(xùn)練集中選取與訓(xùn)練樣本具有相同表情的人臉圖像作為變換基,使該變換基能近似地線性表示測試圖像,求解出稀疏表示系數(shù)。同時選取包含目標表情的人臉圖像組成數(shù)組。最后利用該數(shù)組和稀疏表示系數(shù)重構(gòu)出目標表情人臉。
該方法因為沒有復(fù)雜的提取人臉特征的步驟,從而算法的復(fù)雜度也相對降低了。圖2是同一張人臉生成的多表情的人臉圖像,其中(a)為輸入的高興的人臉測試圖像,(b)~(f)分別為生成的生氣、厭惡、害怕、傷心、驚訝的人臉圖像,而(g)為真實圖像。
圖2 原人臉圖像及其生成的新樣本
本文實驗是基于ORL、FERET人臉數(shù)據(jù)庫的。選取每個人的一幅圖像作為訓(xùn)練樣本,剩余的人臉圖像作為測試樣本。實驗前統(tǒng)一將圖像數(shù)據(jù)的大小修改為48×48。在單樣本情況下,本文首先分別基于姿態(tài)庫和表情庫對單幅訓(xùn)練樣本采取上文的方法擴充樣本個數(shù),以生成多姿態(tài)多表情的新圖像,然后將原訓(xùn)練樣本和新樣本作為訓(xùn)練集,最后采用改進的稀疏表征算法進行識別分類。
3.1ORL人臉庫
ORL人臉庫是由40個人的灰度圖像構(gòu)成的,共有400張圖片。圖3描繪了使用不同個數(shù)冗余樣本下的識別率。
圖3 不同個數(shù)冗余樣本下的識別率
從圖3中可以看出,冗余樣本的個數(shù)不夠多時,識別率也偏低。隨著冗余樣本個數(shù)的增加,識別率大幅度增高,但當冗余樣本達到8個時,識別率增長緩慢,幾乎平緩。原因是訓(xùn)練樣本太少時,樣本的內(nèi)蘊特征太少,此時冗余樣本個數(shù)是影響識別效果的主要原因。但隨著冗余樣本個數(shù)的不斷增加,造成大量的冗余信息,而冗余樣本集與原始數(shù)據(jù)集的數(shù)據(jù)分布有不一致的地方,此時增加冗樣本的個數(shù)對識別率作用不大。
將本文的算法與SRC算法、參考文獻[6]、[7]中的方法進行比較,表1為比較結(jié)果。從表1可以看出,本文所提出的方法識別率高于原SRC方法15.53%,也比參考文獻[6]、[7]中的算法具有更好的識別性能。
表1 單樣本情況下本文方法與原SRC等方法的識別率比較
3.2FERET人臉庫
FERET人臉庫的1 400幅圖像共有200個人,每人7幅人臉圖像。圖4描繪了基于FERET人臉庫使用不同個數(shù)冗余樣本下的識別率。
圖4 不同個數(shù)冗余樣本下的識別率
[7-9]就單樣本人臉識別問題也做了大量的研究。通過表2可以看出,本文方法應(yīng)用在FERET人臉庫上的單樣本人臉識別率比原SRC方法提高7.63%,也比DMMA等算法具有更好的識別性能。表2為本文方法應(yīng)用在FERET人臉庫上的單樣本人臉識別率。
表2 單樣本情況下本文方法與原SRC等方法的識別率比較
針對人臉識別研究的單樣本問題,本文提出了一種基于CS的單樣本人臉識別算法。經(jīng)對比實驗表明,該方法不僅充分利用單個樣本的特征信息,生成新的圖像,而且很大程度上提高了單樣本情況下的識別率,為單樣本人臉識別技術(shù)提供了新的方法。
參考文獻
[1]王明軍.基于壓縮感知的人臉識別算法研究[D].西安:西安電子科技大學(xué),2012.
[2]Wang Jie,PLATANIOTIS K N,Lu Juwei,et al.On solv-ing the face recognition problem with one training sample per subject[J].Pattern Recognition,2006,39(9):1746-1762.
[3]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysisand Machine Intelligence,2009,31(2):210-227.
[4]方紅,章權(quán)兵,韋穗.基于非常稀疏隨機投影的圖像重建方法[J].計算機工程與應(yīng)用,2007,43(22):25-27.
[5]馬瑞,宋亦旭.基于局部線性嵌入非線性降維的多流行學(xué)習[J].清華大學(xué)學(xué)報(自然科學(xué)版),2008,48(4):583-586.
[6]Chang Xueping,Zheng Zhonglong,Duan Xiaohui,et al. Sparse representation-based face recognition for one training image per person[A].Advanced Intelligent Computing Theories and Applications[C].Berlin Heidelberg:Springer,2010:407-414.
[7]單桂軍.基于虛擬樣本擴張法的單樣本人臉識別算法研究[J].科學(xué)技術(shù)與工程,2013,13(14):3908-3911.
[8]Lu Jiwen,Tan Yap-peng,Wang Gang.Discriminative multimanifold analysis for face recognition from a single training sample per person[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):39-51.
[9]NABIPOURM,AGHAGOLZADEHA,MOTAMENIH. Multimanifold analysis with adaptive neighborhood in DCT domain for face recognition using single sample per person[C]. 2014 22nd Iranian Conference on Electrical Engineering(ICEE),IEEE,2014:925-930.
Compressive sensing-based face recognition for single sample
Xu Zhijing,Ye Li
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306,China)
This paper proposes a kind of face recognition method with one training image per person,which is based on compressed sensing.There are two methods——nonlinear dimensionality reduction by locally linear embedding and sparse coefficients,by witch redundant samples can generate.These new samples with multi-expressive and multi-gesture can be treated as training samples.Finally,the improved SRC algorithm can be applied to face recognition.Experiments on the well-known ORL face database and FERET face database show that the proposed method is respectively about 15.53%and 7.67%,more accurate than original SRC method in the context of single sample face recognition problem.In addition,extensive experimentation reported in this paper suggests that the proposed method achieves higher recognition rate than RSRC,SSRC,DMMA,and I-DMMA.
face recognition;single sample;sparse representation-based classification(SRC);nonlinear dimensionality reduction
TP391.41
A
1674-7720(2015)12-0035-03
2015-01-26)
徐志京(1972-)男,工學(xué)博士,副教授,主要研究方向:航運信息采集與處理、水聲信號處理與通信、壓縮感知理論及應(yīng)用。
國家自然科學(xué)基金(61404083);航空科學(xué)基金( 2013ZC15005 ) ;上海海事大學(xué)?;穑?20120108 )
葉麗(1991-)女,碩士研究生,主要研究方向:圖像分析與視頻處理。