摘 要 為進(jìn)一步有效提升稀疏表示人臉識(shí)別系統(tǒng)的識(shí)別率和可靠性,在分析人臉圖像稀疏表示系數(shù)分類能力的基礎(chǔ)上,提出了一種快速正交匹配追蹤的臉識(shí)別新方法??焖僬黄ヅ渥粉櫵惴ㄍㄟ^(guò)在基本的正交匹配追蹤算法中對(duì)冗余字典采用Cholesky分解,提高了算法的整體效率。
【關(guān)鍵詞】正交匹配 稀疏表示 人臉?biāo)惴?/p>
1 稀疏表示
1.1 稀疏表示的意義
香農(nóng)定理表明,模擬信號(hào)可以用一定采樣頻率的周期函數(shù)來(lái)表示。然而,這種表示方法對(duì)信號(hào)的分析帶來(lái)了一些不便。對(duì)于壓縮問題,希望用較少的系數(shù)表示較多的信息;對(duì)于識(shí)別問題,希望信號(hào)的主要特征突出;對(duì)于去噪問題,希望將有用信號(hào)與噪聲進(jìn)行有效分離。這些應(yīng)用都有一個(gè)共同的特點(diǎn),就是簡(jiǎn)化信號(hào)的表示(稀疏化)。稀疏表示是壓縮感知中的關(guān)鍵理論,數(shù)據(jù)的稀疏表示,可以從本質(zhì)上降低數(shù)據(jù)處理的所需成本,有效提高壓縮效率。 目前,稀疏表示已經(jīng)被廣泛地用于人臉識(shí)別算法中。與傳統(tǒng)的算法相比較,基于稀疏表示的人臉識(shí)別算法具有識(shí)別率高、魯棒性強(qiáng)的突出特點(diǎn)。
1.2 稀疏表示的概念
研究人員發(fā)現(xiàn),通過(guò)使用原子庫(kù)(過(guò)完備冗余函數(shù)體系)取代傳統(tǒng)完備正交函數(shù)集,可有效從原子庫(kù)中找到具有最佳線性組合的n項(xiàng)原子信號(hào)來(lái)表示一個(gè)給定信號(hào),而這些組合的系數(shù)大部分為0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非線性逼近原理。對(duì)于一個(gè)給定集合S={ui;i=1,2,...,I},其元素ui是整個(gè)Hilert空間H=RM的單位矢量, I≥M。集合S稱為原子庫(kù),元素稱為原子。對(duì)于任意給定的信號(hào)f∈H,預(yù)想在S中自適應(yīng)的選取n個(gè)原子對(duì)信號(hào)做n項(xiàng)逼近:
fn= crur (1)
其中kn是ur的下標(biāo)集,card(Kn) =n,則 B=span(ur,r∈Kn)就是由n個(gè)原子在原子庫(kù)S中張成的最佳子集。我們定義逼近誤差為:
σn(f,s) = pf?fnP(2)
由于n遠(yuǎn)小于空間的維數(shù)M,所以這種逼近也被稱作稀疏逼近。由于原子庫(kù)存在定的冗余性,知上式存在多組解。稀疏表示的目的就是從中選取解的系數(shù)最為稀疏的或使n取值最小的解。這個(gè)問題等同于下述問題:
Min imize p?p0 subject to f = ckuk(3)
稀疏表示的最初目的是為了以低于香農(nóng)定理的采樣頻率表示和壓縮信號(hào),事實(shí)上,在去噪方面,小波變換和平以不變小波也開發(fā)出許多有效算法;稀疏表示已成功應(yīng)用與圖像動(dòng)態(tài)范圍的壓縮、圖像卡通和紋理成分的分離等。在這些應(yīng)用中,算法的性能取決于表示的稀疏性是否忠實(shí)于原始信號(hào)。
2 基于稀疏表示的人臉識(shí)別
訓(xùn)練集圖像如圖1所示。
稀疏表示人臉識(shí)別算法主要建立在壓縮感知理論的基礎(chǔ)之上。假設(shè)每個(gè)用戶的注冊(cè)圖像都可以在圖像空間中劃分出一個(gè)相對(duì)獨(dú)立的子空間,且任意一張人臉圖像都可以由同一用戶自身的注冊(cè)圖像集的線性組合來(lái)表示,通過(guò)計(jì)算計(jì)算待檢測(cè)圖像相對(duì)于所有注冊(cè)圖像集的稀疏表示系數(shù)來(lái)揭示該待測(cè)試圖像所屬的用戶類別。
設(shè)給定的注冊(cè)圖像集A中有i類已標(biāo)記好的注冊(cè)用戶,其中第k類中含有個(gè)樣本。則屬于第k類的圖像集合可以用矩陣Ak=[ak1,ak2,…, ]∈ 來(lái)表示,且每個(gè)圖像對(duì)應(yīng)于矩陣的一個(gè)列向量,m為人臉圖像的維數(shù)。為了提高效率,現(xiàn)假定每個(gè)注冊(cè)用戶的矩陣對(duì)應(yīng)于用于稀疏表示的訓(xùn)練字典。對(duì)于任意給定的測(cè)試圖像y,若其屬于某一注冊(cè)圖像集所包含的類別,那么便可以用的線性組合來(lái)表示。
為便于理解,現(xiàn)假設(shè)第k類中有足夠多的訓(xùn)練圖像構(gòu)成矩陣,且待測(cè)試圖像y1屬于第k類,則可以用具有相同類別屬性的第k類訓(xùn)練圖像的線性組合近似表示待測(cè)試圖像y1,即
y1=xk1ak1+xk2ak2+…+ ,
其中xkj∈R,j=1,2,…,nk(4)
3 實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證本文所提算法的有效性,本文選擇目前比較常用的擴(kuò)展的Yale B人臉數(shù)據(jù)庫(kù)ORL人臉數(shù)據(jù)庫(kù)作為實(shí)驗(yàn)數(shù)據(jù)集分別進(jìn)行識(shí)別精度與時(shí)間的測(cè)試。我們主要關(guān)心在不同的光照和不同的表情兩種主要因素下的測(cè)試結(jié)果。ORL人臉數(shù)據(jù)庫(kù)含有40個(gè)不同人的臉,每個(gè)人臉有10張不同表情的圖像,總共400張圖像。擴(kuò)展的Yale B是一個(gè)比較大的人臉數(shù)據(jù)庫(kù),含有16128張人臉圖像,包含了38個(gè)不同人臉的64種光照條件下的不同圖像。本實(shí)驗(yàn)僅從中選取了一個(gè)小的子集,但已足夠測(cè)試本文算法對(duì)光照條件的敏感性。
4 結(jié)語(yǔ)
本文研究了稀疏表示理論并且應(yīng)用矩陣Cholesky分解實(shí)現(xiàn)正交匹配追蹤快速算法,該算法簡(jiǎn)化了迭代過(guò)程中逆矩陣的計(jì)算,提高了識(shí)別的速度,并在具有表情變化和光照變化的條件下取得了很好的識(shí)別率。人臉識(shí)別的困難主要在于遮擋、單樣本、魯棒性等的問題。稀疏表示在這些限制下的識(shí)別中仍具有很大的發(fā)展?jié)摿?,有待于進(jìn)一步研究,這也是目前一個(gè)比較熱門的研究方向。
參考文獻(xiàn)
[1]張國(guó)琰.基于稀疏表示的人臉識(shí)別[D].河北:河北工業(yè)大學(xué)工學(xué)碩士學(xué)位論文,2012.1-25.
[2]李映,張艷寧,許星.基于信號(hào)稀疏表示的形態(tài)成分分析:進(jìn)展和展望[J].電子學(xué)報(bào),2009(01):146-151.
[3]平強(qiáng),莊連生,愈能海.姿態(tài)魯棒的分塊稀疏表示人臉識(shí)別算法[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),2011,41(11):975-981.
作者簡(jiǎn)介
楊衛(wèi)中(1987-),男,安徽省安慶市人。碩士研究生學(xué)歷。現(xiàn)供職于安徽師范大學(xué)物理與電子信息學(xué)院。主要研究方向?yàn)閿?shù)字圖像處理。
作者單位
安徽師范大學(xué)物理與電子信息學(xué)院 安徽省蕪湖市 241000