龔 飛,金 煒,符冉迪,劉 箴,李 綱
?
融合小波包細(xì)節(jié)子圖及稀疏表示的人臉識(shí)別
龔 飛,金 煒,符冉迪,劉 箴,李 綱
( 寧波大學(xué) 信息科學(xué)與工程學(xué)院,浙江 寧波 315211 )
針對(duì)現(xiàn)有人臉識(shí)別方法在光照變化、表情變化及噪聲干擾等情況下識(shí)別率下降的問題,本文將主成分分析(PCA),圖像的小波包分解(WPD)和稀疏表示分類(SRC)等算法結(jié)合起來進(jìn)行研究分析,提出了一種融合小波包細(xì)節(jié)子圖及稀疏表示(FW-SRC)的人臉識(shí)別方法。該方法首先將圖像小波包分解以后的子圖像進(jìn)行加權(quán)融合,對(duì)融合后的圖像進(jìn)行特征提取并構(gòu)造特征空間,然后用樣本在特征空間上的投影集構(gòu)造稀疏字典,最后通過對(duì)人臉圖像的稀疏表示實(shí)現(xiàn)分類識(shí)別。采用Yale B、AR和CMU PIE人臉庫分別進(jìn)行了光照、表情及噪聲魯棒性的測(cè)試,實(shí)驗(yàn)結(jié)果表明本文方法不僅提高了人臉識(shí)別率,而且在光照強(qiáng)度變化、表情變化以及噪聲干擾的情況下具有良好的識(shí)別性能。
人臉識(shí)別;小波包分解;稀疏表示;FW-SRC;魯棒性
0 引 言
人臉識(shí)別是生物特征識(shí)別技術(shù)領(lǐng)域中最具影響力和吸引力的研究熱門之一,目前人臉識(shí)別技術(shù)已經(jīng)取得了很大的成就,但是對(duì)于研究具有高效魯棒性的人臉識(shí)別算法,仍具有很多挑戰(zhàn),比如在光照變化、表情變化及噪聲干擾等情況下,現(xiàn)有許多人臉識(shí)別方法的識(shí)別率會(huì)急劇下降。以基于子空間分析的Eigenface、Fisherface等為代表的經(jīng)典人臉識(shí)別算法通常都是通過將人臉圖像投影到低維空間中,然后計(jì)算測(cè)試樣本與訓(xùn)練樣本的距離來進(jìn)行識(shí)別分類,這些算法對(duì)光照、姿態(tài)、表情等變化較為敏感,魯棒性較差;基于支持向量機(jī)SVM分類器的人臉識(shí)別算法只適合于小樣本的識(shí)別問題,而且訓(xùn)練時(shí)間長,計(jì)算復(fù)雜度較高。Wright等人[1]提出了一種基于稀疏表示分類(Sparse Representation-based Classification, SRC)的人臉識(shí)別算法,該算法采用過完備基函數(shù)代替了傳統(tǒng)的正交基函數(shù)(正交空間),為研究人臉識(shí)別問題提供了一種新思路,基于稀疏分類的人臉識(shí)別成為近年來的研究熱點(diǎn)。張勇等[2]考慮到線性判別分析能夠更好地對(duì)樣本進(jìn)行分類,提出一種采用線性判別分析(Linear Discriminant Analysis, LDA)進(jìn)行特征提取的稀疏分類人臉識(shí)別算法(LDA-SRC),雖然該算法在一定程度上提高了人臉識(shí)別率,但并沒有驗(yàn)證其光照、表情和抗噪聲等魯棒性能;Yang等[3]人提出了一種基于Gabor特征的稀疏表示分類(GSRC)方法,在一定程度上提高了人臉識(shí)別率,具有一定的表情和抗噪聲魯棒性,但其識(shí)別時(shí)間較長;Zhang等[4]驗(yàn)證了SRC模型中并不是稀疏性約束而是協(xié)作表示機(jī)制在人臉分類時(shí)起到了重要作用;在此啟示下,為加強(qiáng)樣本間的協(xié)作表示能力以及減弱稀疏分解時(shí)的強(qiáng)約束,劉梓等[5]提出了一種基于稀疏表示和貪婪搜索(Greedy Search, GS)的人臉分類方法(SRC-GS),該方法在人臉遮擋情況下的識(shí)別率較為理想,但其沒有考慮到算法其它方面的魯棒性能,且計(jì)算復(fù)雜度較高,近年來其它一系列基于SRC的改進(jìn)算法[6-7]也不斷被提出。
為解決上述人臉識(shí)別方法中存在的光照、表情和抗噪聲等魯棒性較差的問題,本文在傳統(tǒng)小波變換人臉識(shí)別方法和其它改進(jìn)稀疏表示人臉分類方法的基礎(chǔ)上,提出了一種融合小波包子圖(Fusion of Wavelet Packet Sub-images, FW)和稀疏表示分類(SRC)的人臉識(shí)別方法FW-SRC(Fusion of Wavelet Packet Sub-images and Sparse Representation-based Classification, FW-SRC),該方法將小波包分解后的子圖像進(jìn)行加權(quán)融合,然后對(duì)融合圖像進(jìn)行特征提取,并構(gòu)造人臉特征空間,最后用人臉樣本在特征空間上的投影集構(gòu)造稀疏字典進(jìn)行稀疏表示人臉分類識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法提高了人臉識(shí)別率,減小了光照強(qiáng)度變化、表情變化以及噪聲干擾對(duì)人臉識(shí)別的影響,具有較強(qiáng)的魯棒性。
1 小波包細(xì)節(jié)子圖的融合及人臉特征表達(dá)
圖像的小波包分析(Wavelet Packet Analysis, WPA)是圖像小波分析(Wavelet Analysis, WA)的一種改進(jìn),它為我們研究圖像信息提供了一種更精確的方法,不同于小波變換的是,小波包變換對(duì)每層低頻圖像進(jìn)行分解的同時(shí)對(duì)其它細(xì)節(jié)圖像也進(jìn)行分解。一個(gè)完整的全小波包分解的四叉樹如圖1所示,圖中1為原圖像,為分解的低頻部分,包含了原圖像的全局信息,和原圖像相近;為圖像的水平細(xì)節(jié),包含了人臉圖像的眉毛、眼睛和嘴巴等水平特征;為圖像的垂直細(xì)節(jié),包含了人臉的輪廓和鼻子等垂直細(xì)節(jié);為圖像的對(duì)角細(xì)節(jié),不僅包含了部分水平和垂直細(xì)節(jié),還是受噪聲、光照和表情等影響最大的子圖像。
圖1 小波包全分解四叉樹
小波包四叉樹第一層四幅子圖像如圖2所示,人臉識(shí)別過程中,三幅高頻子圖像所包含的信息同樣不可忽視。本文將圖像小波包第一層分解后的四個(gè)子圖進(jìn)行加權(quán)融合,再對(duì)融合圖像進(jìn)行特征提取,融合方法如下:設(shè)有四個(gè)不同的小波包子圖像,分別用、、、表示,令它們加權(quán)后的圖像為,則:
圖3 小波樹子圖像融合示例
在人臉特征提取和降維過程中,主要分量分析(Principal Component Analysis,PCA)是常用的一種技術(shù),其主要作用是將信號(hào)轉(zhuǎn)換為一組不相關(guān)的表示系數(shù),通過系數(shù)與子空間的組合來表示原圖像。PCA特征提
征臉,則特征臉空間定義為
式中為特征臉的個(gè)數(shù)。根據(jù)上述方法,圖4展示了Yale B人臉庫上融合小波包子圖的部分特征臉。
圖4 不同權(quán)值融合情況下的部分特征人臉
從圖4可以看出,高頻權(quán)值較大時(shí),融合圖像的特征臉偏重于人臉表面器官的細(xì)節(jié)表達(dá),高頻細(xì)節(jié)信息能夠很好地體現(xiàn)出人臉面部器官的差異,通常這些細(xì)節(jié)在人臉識(shí)別過程中有不可替代的作用;而低頻特征臉則偏重于整個(gè)人臉輪廓的表達(dá),包含了人臉的主要信息,也能體現(xiàn)出人臉面部不同光照的差異。本文提出的人臉識(shí)別方法充分利用了人臉特征在頻域的這些分布特性,既考慮了人臉圖像的低頻特征,又發(fā)揮了人臉高頻細(xì)節(jié)特征在人臉識(shí)別過程中的作用,取得了不錯(cuò)的識(shí)別性能。
2 人臉識(shí)別稀疏分類器的構(gòu)造
2.1 稀疏分類器理論模型
稀疏表示理論在近二十年一直備受關(guān)注,近年來隨著壓縮感知理論的成熟,稀疏表示在目標(biāo)分類[1-7]、圖像壓縮[8]、圖像去噪[9]、衛(wèi)星云圖處理[10]等方面都得到了廣泛應(yīng)用。簡(jiǎn)單來說稀疏表示的目的就是在過完備字典中,將信號(hào)表示成盡可能少數(shù)原子的線性組合,以一種更為簡(jiǎn)潔的方式來表示信號(hào)。稀疏表示理論可描述為
2.2 采用稀疏分類器的人臉識(shí)別算法
在人臉識(shí)別問題中,選用含有類目標(biāo)的訓(xùn)練樣本,用以判斷測(cè)試人臉樣本所屬的類。將第類的訓(xùn)
練樣本逐個(gè)提取像素值形成一個(gè)一維向量,并組成字典集,表示第類樣本的訓(xùn)練
數(shù)目,=1,2,…,,包含所有類訓(xùn)練樣本的字典矩陣定義如下:
那么其中屬于第類樣本的測(cè)試樣本可以用字典原子的線性組合來表示:
3 融合小波包細(xì)節(jié)子圖及稀疏表示的人臉識(shí)別方法
本文提出的人臉識(shí)別方法主要分為樣本的訓(xùn)練階段和測(cè)試階段,首先在訓(xùn)練階段,選擇合適的小波基,對(duì)人臉訓(xùn)練樣本圖像進(jìn)行一層小波包全分解,將得到的四幅小波包子圖進(jìn)行加權(quán)融合,然后對(duì)人臉融合圖像進(jìn)行特征提取并構(gòu)造特征空間,將訓(xùn)練樣本在此特征空間上進(jìn)行投影,用訓(xùn)練樣本的特征投影集構(gòu)造字典,圖5為生成的字典的示例。在測(cè)試階段,選擇與訓(xùn)練階段相同的小波基和融合權(quán)值對(duì)測(cè)試樣本進(jìn)行同樣的小波包分解和加權(quán)融合,然后將得到的測(cè)試人臉融合圖像在特征空間上進(jìn)行投影,得到測(cè)試樣本的特征投影集,最后計(jì)算測(cè)試樣本投影特征與稀疏表示后人臉訓(xùn)練樣本投影特征的最小殘差,并通過該最小殘差來實(shí)現(xiàn)人臉的分類。
圖5 字典A
綜上所述,本文提出的FW-SRC算法步驟如下:
4 實(shí)驗(yàn)結(jié)果與分析
下面通過數(shù)值實(shí)驗(yàn)來驗(yàn)證本文所提出的人臉識(shí)別方法的有效性,并與SRC、GSRC、LDA-SRC方法進(jìn)行比較。實(shí)驗(yàn)基于Yale B、AR和CMU PIE三個(gè)標(biāo)準(zhǔn)人臉庫,在3.30 GHz,4G內(nèi)存,32位Win7的計(jì)算機(jī)系統(tǒng)下進(jìn)行,實(shí)驗(yàn)中的小波包分解采用db 1和db 2小波基。
4.1 光照魯棒的人臉識(shí)別實(shí)驗(yàn)
Yale B人臉數(shù)據(jù)庫[11]中包含10類人的640張人臉圖像(每人64張),根據(jù)光照角度與攝像光軸的角度,可將人臉圖像分為5個(gè)子集,子集1(),子集2(),子集3(),子集4(),子集5()。由于光照角度與攝像光軸角度的差異,進(jìn)入成像系統(tǒng)的反射光線強(qiáng)度不同,從而使得不同子集的人臉圖像表現(xiàn)出不同的成像感光特性,這與不同光照強(qiáng)度下的人臉圖像具有相同的特點(diǎn),如圖6所示,本文利用該數(shù)據(jù)庫進(jìn)行光照魯棒性的測(cè)試。
圖6 Yale B人臉庫中部分人臉圖像
實(shí)驗(yàn)前,將圖像的分辨力大小統(tǒng)一縮放為100×114。實(shí)驗(yàn)時(shí),將子集1和子集2中的全部人臉樣本及子集3中部分人臉樣本(共40張)用來訓(xùn)練,每人剩下的24張人臉圖像用來測(cè)試。本次實(shí)驗(yàn)在低頻融合權(quán)值較大情況下進(jìn)行,其中FW-SRC算法的融合權(quán)值系數(shù)為:,,,。選取不同數(shù)目的人臉特征作為變量來構(gòu)造特征空間,最后的識(shí)別率結(jié)果如圖7。
圖7 Yale B人臉庫上四種方法光照魯棒的識(shí)別率比較
從圖7中可以看出,與其它三種算法相比,在光照變化強(qiáng)度很大的Yale B人臉庫上,本文FW-SRC的識(shí)別率明顯較為優(yōu)越。從識(shí)別時(shí)間上來看,當(dāng)取10~240個(gè)特征進(jìn)行人臉識(shí)別時(shí),SRC、GSRC、LDA-SRC和FW-SRC四種算法的識(shí)別時(shí)間范圍如表1所示,從表中可以看出本文提出的算法在Yale B人臉庫上的識(shí)別時(shí)間效率上也較為優(yōu)越,與其它三種算法相比,本文提出的算法在時(shí)間效率上分別提高了近2~3倍。