孫萬春,張建勛,鄭集元,陳虹伶,朱佳寶
(重慶理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,重慶 400054)
目前,低分辨率人臉識(shí)別方法主要分為兩個(gè)方向:①頻域方法,計(jì)算簡便、理論通俗易懂、快速進(jìn)行并行處理。②空域方法,對(duì)圖像進(jìn)行模型分類。針對(duì)不同的類型運(yùn)用不同算法進(jìn)行處理,主要包括基于學(xué)習(xí)和模式識(shí)別、最大后驗(yàn)概率法(MAP)等?;陬l域的方法,受限于平移運(yùn)動(dòng)和線性空間不變化約束,限制了其靈活性和應(yīng)用范疇?;诳沼虻姆椒╗1]能夠?qū)ζ渫ㄟ^先驗(yàn)知識(shí)的方法,具有一定的靈活性和運(yùn)用場景,是目前研究熱點(diǎn)方向。
李嘉頔等[2]對(duì)低分辨率圖像進(jìn)行分塊后提取局部特征,利用加權(quán)PCA融合特征方法來提高人臉識(shí)別率,該方法并沒有對(duì)圖像中的重要特征進(jìn)行單獨(dú)提取,在低分辨率圖像處理上識(shí)別率并不理想。文獻(xiàn)[3]提出了一種基于圖像進(jìn)行超分辨率極限學(xué)習(xí)機(jī)的識(shí)別方法,通過構(gòu)建超分辨率圖像,并利用極限學(xué)習(xí)機(jī)的模型進(jìn)行類別判斷。楊威等[4]提出一種改進(jìn)的稀疏表達(dá)分類方法,該方法僅僅針對(duì)低分辨率圖像進(jìn)行相適應(yīng)的匹配系數(shù)關(guān)系調(diào)整,并不適用于任何場景。
本文提出了一種基于非下采樣Contourlet變換(nonsubsampled Contourlet,NSCT)和CS-LBP(center-symmetric local binary pattern)的低分辨率人臉識(shí)別方法[5]。對(duì)采樣到的低分辨率圖像,首先通過NSCT對(duì)其進(jìn)行濾波分解,借助CS-LBP在光照變換時(shí)受影響較小的優(yōu)點(diǎn)[6],分塊去提取經(jīng)過已經(jīng)得到的高低頻圖像信息,將得到的特征直方圖級(jí)聯(lián)起來,以獲取較為完整的能表達(dá)人臉的向量直方圖。針對(duì)最后分解得到圖像維度過高的問題,使用主成分分析法(principal component analysis,PCA)進(jìn)行降維,提高實(shí)時(shí)性。
圖1 NSCT分解
經(jīng)由NSCT分解輸出的低頻子帶部分蘊(yùn)含著圖像中較多的能量信息,主要包含較多的大尺度背景圖像內(nèi)容,因此低頻部分能對(duì)于目標(biāo)背景對(duì)比有著很重要的參考性。而高頻部分[10]則在細(xì)節(jié)上表現(xiàn)力較為出色,能用分解出來的系數(shù)較大的值表示圖像中諸如輪廓和邊緣界限這樣的明顯信息。如圖2所示,展示了在二層條件分解下NSCT輸出各階段結(jié)果。
圖2 NSCT分解框架
LBP[11]提取圖像特性算法是以度量紋理進(jìn)行的,即局部二值模式,尤其對(duì)于發(fā)生旋轉(zhuǎn)和灰度變換時(shí)對(duì)圖像仍然具有穩(wěn)定識(shí)別性。具體原理是以9個(gè)像素組成的九宮格來表示,依據(jù)中心像素及臨近點(diǎn)來進(jìn)行取值,其定義如式(1)所示
(1)
對(duì)于圖像中心點(diǎn)其像素表示為MXc,Yc,其像素點(diǎn)亮度值為ic;CS-LBP[12]分塊中心對(duì)稱局部二進(jìn)制模式表示如式(2)和式(3)所示,對(duì)于公式中的量化函數(shù)sx
(2)
(3)
對(duì)每一個(gè)鄰域給定一個(gè)權(quán)值2p到sip-ic以得到其LBP值,此編碼值是可以表達(dá)諸如幅度變化等局部模式信息的。對(duì)于MXc,Yc的8位鄰域,共計(jì)28種表示,中心對(duì)稱局部則只需計(jì)算59種。圖3展示了MXc,Yc的CS-LBP局部特征提取的編碼過程。
圖3 CS-LBP編碼
CS-LBP編碼的特殊結(jié)構(gòu),使得其在對(duì)外界光照變換下能夠具有較高的魯棒性。利用CS-LBP這一特性可對(duì)NSCT分解出來的人臉特征進(jìn)行直方圖構(gòu)造,其表示如下
(4)
設(shè)圖3(b)代表它的3×3矩陣,以中心對(duì)稱的局部采樣參考,n=59。利用式(5)~式(7)可計(jì)算出59維度的向量Fi,j,圖像采樣的特征可表達(dá)為
Rk=r0,r1,…,rh
(5)
(6)
p=0,1,…,n-1
(7)
以Rk=r0,r1,…,rh表示低分辨率下圖像按矩陣分割的子塊定義特征信息,用LBP提取后級(jí)聯(lián),最后以Fi,j展示其結(jié)果向量,以級(jí)聯(lián)每一個(gè)直方圖向量得到完整的人臉特征直方圖。而NSCT分解來的低頻子帶人臉特征,用圖4表達(dá)其提取過程。
圖4 低頻子帶圖像級(jí)聯(lián)提取
人臉進(jìn)行分塊提取特征[13],其特征直方圖維數(shù)較高,特征的矢量矩陣運(yùn)算復(fù)雜,實(shí)時(shí)監(jiān)測性能較差。通過實(shí)驗(yàn)發(fā)現(xiàn)可以利用PCA降維來解決。PCA是經(jīng)典矩陣降維方法,其原理是使用KL(karhunen-loeve)變換,將人臉特征從原來的多維通過映射到一個(gè)低維度上,保留特征不變情況下降低了運(yùn)算量。將原來維度上的特征指標(biāo)通過矩陣映射到一個(gè)較低維度上,達(dá)到降維。對(duì)于給定的一個(gè)特征直方圖F(m,n)=X1,X2,…,Xm,其定義如下
(8)
以上公式中,Xi是特征矩陣,特征向量征集合F(m,n)中第i幅圖像特征。Xi,j為Xi中的第j行向量。對(duì)于樣本圖像X1,X2,…,Xm,灰度圖像的均列向量是
(9)
(10)
(11)
利用式(11)可表示任意維度下的特征級(jí)聯(lián)直方圖。
傳統(tǒng)的PCA降維[14,15]最終得到的最佳重構(gòu)矩陣,其實(shí)并不能夠有效地區(qū)別出鑒別出人臉的矩陣特征。文獻(xiàn)[16]通過實(shí)驗(yàn)論證人臉特征向量與外界的干擾因素有著密切聯(lián)系。另外文獻(xiàn)[17]提到,PCA分量的值受到外界光線亮度、人臉本身的表情,容貌改變等客觀條件影響,特別是PCA中較大的特征值的變化最顯著。
為了達(dá)到有效識(shí)別基礎(chǔ)上提高識(shí)別率,本文對(duì)維矩陣加權(quán)了前3個(gè)分量
Z=[ω1Z1,ω2Z2,ω3Z3,…,Zi]
(12)
結(jié)合1.1節(jié)、1.2節(jié)、1.3節(jié)所述,如圖5所示,對(duì)本文方法流程進(jìn)行簡要概述。
圖5 本文方法流程
低分辨率人臉特征提取方法如下:
(1)對(duì)低分辨率圖像利用NSCT分解出人臉的高低頻子帶特征信息。
(2)本實(shí)驗(yàn)中,對(duì)圖像數(shù)據(jù)分成8塊,通過CS-LBP來提取這幅圖的局部特征信息。
(3)對(duì)于級(jí)聯(lián)直方圖,通過加權(quán)PCA的方式對(duì)其進(jìn)行降維。
為了方便實(shí)驗(yàn)數(shù)據(jù)的對(duì)比,本實(shí)驗(yàn)利用最近鄰分類器來進(jìn)行數(shù)據(jù)的對(duì)比工作。
NSCT對(duì)于圖像的高低頻子帶信息分解過程的優(yōu)劣主要依靠閾值參數(shù)λ的選擇,因此如何選擇λ,對(duì)本文的實(shí)驗(yàn)結(jié)果有非常大的影響。為了能夠更好的對(duì)λ性能進(jìn)行測試,本文采用公開的ORL數(shù)據(jù)集,對(duì)于不同的閾值參數(shù)選擇其結(jié)果如圖6所示。從圖6中可知,閾值參數(shù)在一定范圍內(nèi),其對(duì)識(shí)別率的影響呈現(xiàn)一定的低態(tài)走勢。為了能夠分解出較為理想的紋理特征,達(dá)到較好的實(shí)驗(yàn)效果,λ取值為0.019 97。
圖6 NSCT閾值參數(shù)選取與識(shí)別率關(guān)系
為了驗(yàn)證本文基于NSCT的CS-LBP特征對(duì)低分辨率人臉識(shí)別的有效性,本實(shí)驗(yàn)采用了ORL數(shù)據(jù)集,并與(CS-LBP+PCA)[2]、(DTCWT+LBP)[18]兩種不同的識(shí)別方法進(jìn)行比較。
本實(shí)驗(yàn)中,基于ORL人臉數(shù)據(jù)集。分辨率大小均為92×112像素,由60個(gè)人、每個(gè)人9幅圖,共計(jì)540幅圖像構(gòu)成。按照不同的姿態(tài)、光照、拍攝角度等干擾的優(yōu)劣對(duì)每個(gè)人的9幅圖分成3組測試集。
實(shí)驗(yàn)過程中,參考文獻(xiàn)[19]的數(shù)據(jù)集標(biāo)定方法,預(yù)先通過雙眼標(biāo)定,對(duì)每個(gè)訓(xùn)練集的人臉庫分別進(jìn)行平滑下采樣至46×56像素和23×28像素。為了方便NSCT運(yùn)算,將處理后的圖像均上采樣到原始分辨率92×112。表1~表3分別表示不同的數(shù)據(jù)集環(huán)境測試的實(shí)驗(yàn)結(jié)果。每組測試集均包含了每個(gè)人83種不同條件下的圖像。實(shí)驗(yàn)數(shù)據(jù)結(jié)果見表1~表3。
表1 ORL 測試集1識(shí)別率/%
表2 ORL 測試集2識(shí)別率/%
表3 ORL 測試集3識(shí)別率/%
通過實(shí)驗(yàn)對(duì)比,本文算法的識(shí)別率均高于CS-LBP+PCA、DTCWT+LBP,對(duì)于文獻(xiàn)[2]算法,僅僅對(duì)低分辨率圖像進(jìn)行了分塊處理的方式來提取局部人臉的細(xì)節(jié)特征,在算法上并沒有進(jìn)行針對(duì)性優(yōu)化。而文獻(xiàn)[18]算法同本文算法相比均提取了高低頻的圖像特征信息,對(duì)邊緣和輪廓提取的特征較好,所以在識(shí)別率相對(duì)于前者更加健壯。DTCWT通過利用傳統(tǒng)小波變換的方式,能提取不同頻率中的局部特性,更清晰的描述邊緣特征等細(xì)節(jié)信息,而NSCT則通過分解不同尺度的高低頻子帶信息,分解系數(shù)中包含著更多的能量信息,并且對(duì)高維信息具有更好的稀疏表達(dá)能力。從表1~表3可以看出,隨著姿態(tài)、光照干擾越來越大,本文算法相比文獻(xiàn)[18]算法能夠在細(xì)節(jié)特征上更具有魯棒性,在更復(fù)雜的干擾條件下識(shí)別率更具有優(yōu)勢。
針對(duì)目前低分辨率人臉識(shí)別率較低,提出了一種基于NSCT和CS-LBP相結(jié)合的識(shí)別方法。在低分辨率人臉識(shí)別領(lǐng)域上采用NSCT的濾波分解來提取人臉高低頻子帶信息;其次鑒于對(duì)于光照條件下考慮到CS-LBP在局部特征表現(xiàn)上具有較好的魯棒性,利用該特性進(jìn)行人臉高低頻子帶信息提取工作,從而得到其級(jí)聯(lián)特征;由于CS-LBP對(duì)于局部特征算子處理過程中會(huì)產(chǎn)生較高的特征維度問題,本實(shí)驗(yàn)通過采用PCA對(duì)其進(jìn)行降維處理來解決實(shí)際效率問題。通過本文方法發(fā)現(xiàn)其應(yīng)用在對(duì)低分辨率圖像人臉識(shí)別率上具有較好的效果。此外,今后希望能夠通過深度學(xué)習(xí)等方法進(jìn)一步提高本文的識(shí)別率。