曹 潔, 朱晶晶, 李 偉, 王進花
(1.蘭州理工大學(xué) 計算機與通信學(xué)院,甘肅 蘭州 730050;2.蘭州理工大學(xué) 電氣工程與信息工程學(xué)院,甘肅 蘭州 730050)
近年來,人臉識別因其友好性、非接觸性成為最受人們關(guān)注的生物特征識別技術(shù)之一,在軍事、經(jīng)濟、生活等領(lǐng)域發(fā)揮了重要的作用。由于環(huán)境的復(fù)雜多變,人臉識別系統(tǒng)受到各種自然及人為因素的影響,包括光照變化、姿態(tài)、表情及遮擋等。在諸多的干擾中,光照變化對人臉識別的影響尤為顯著,為了解決光照問題,研究學(xué)者提出了諸多處理方法,大致可以分為三類[1]:光照歸一化法、光照建模法以及光照不變特征提取法。光照歸一化利用基本圖像處理和信號處理技術(shù)對光照圖像預(yù)處理,如直方圖均衡化(histogram equalization,HE)[2],伽馬校正,同態(tài)濾波等。盡管此類方法可以消除一定程度的光照影響,但當光照較為復(fù)雜時,處理效果難以令人滿意。光照建模法通過不同光照下的人臉圖像建立一個低維子空間來描述人臉,由于需要完備的訓(xùn)練樣本集以及計算復(fù)雜度較高,限制了該類方法的應(yīng)用。光照不變特征提取是指從圖像中提取出受光照影響較小的特征表述人臉。目前光照人臉識別中的特征主要分為兩類:一類著重研究魯棒的視覺特征描述方法,如Gabor小波變換和LBP;另一類基于Retinex模型,將人臉圖像視作光照分量和反射分量的乘積,通過去除處于低頻的光照成分來獲取人臉的內(nèi)在本質(zhì),單尺度Retinex[3](single scale retinex,SSR)、多尺度Retinex(multi-scale retinex,MSR)、LTV(logarithmic total variation)[4]等均是基于此模型的。
自商圖像(self quotient image,SQI)[5]法通過將原圖像與平滑后的圖像作商來消除人臉圖像中的光照分量,因其簡單及有效性成為光照人臉識別中的熱點,基于此方法的改進也很多。文獻[6]提出了一種動態(tài)形態(tài)學(xué)商圖像方法,采用數(shù)學(xué)形態(tài)學(xué)操作來平滑原始圖像以此估計光照亮度。但商圖像對訓(xùn)練樣本集的依賴很大,當訓(xùn)練樣本較少時,識別性能隨之下降。文獻[7]將反銳化掩膜濾波與自商圖像結(jié)合,先將原圖像經(jīng)過反銳化濾波處理,然后用SQI分離反射系數(shù)和光照分量。文獻[8]通過多尺度下采樣方式生成SQI,在提取邊緣和細節(jié)的同時,降低計算復(fù)雜度。文獻[9]將離散小波變換與SQI結(jié)合,先使用小波分析將人臉圖像分成4個子帶,增強垂直、水平和對角線邊緣,然后利用直方圖截斷技術(shù)去除非常亮和非常暗的區(qū)域,提取SQI特征。文獻[10]利用SQI對人臉圖像進行處理,提取多區(qū)域LBP特征進行融合作為光照不變特征,來提高特征的魯棒性。文獻[11]設(shè)計了邊緣弱化引導(dǎo)濾波器,利用邊緣感知系數(shù)感知圖像的邊緣將圖像自適應(yīng)平滑,保留盡可能多的面部信息。上述所提到的方法均能在一定程度上去除光照影響,然而這些基于商圖像的方法,都以去除光照分量以提取光照不變特征為目的,忽略了對特征進行選擇,無法提高類別之間的鑒別性。
本文用SQI對圖像進行預(yù)處理,利用線性判別分析構(gòu)建初始樣本空間,通過隨機投影將樣本投影至多個不同的子空間,以此豐富樣本特征的完備性和鑒別性,通過最近鄰分類器對樣本進行分類,從而實現(xiàn)在光照變化情況下更加穩(wěn)定和魯棒的人臉識別。
Retinex模型將一幅圖像I分為光照分量L和反射分量R兩個部分,三者之間的關(guān)系可以表示為:I=L×R。其中,R對應(yīng)高頻分量(如邊緣和紋理),為圖像的本質(zhì)特征,取決于物體的固有反射率和表面法向量;L對應(yīng)低頻分量,受外界環(huán)境影響。文獻[5]通過式(1)得到的自商圖像
(1)
圖1為不同光照下的人臉圖像與其對應(yīng)的自商圖像,對比可以發(fā)現(xiàn),經(jīng)過SQI處理后,光照對人臉圖像的影響顯著消除,人臉圖像在不同光照下呈現(xiàn)出一定的穩(wěn)定性,但處理后的圖像整體亮度更加均勻。在去除光照分量時,SQI保留了相似度較高的陰影邊緣,導(dǎo)致處理后的圖像之間的相似度較高。
圖1 SQI處理前后的圖像
通過數(shù)據(jù)分析SQI方法處理后的不同個體圖像及其相似度,可以發(fā)現(xiàn),不同類樣本之間的相似度較高,均大于90 %?;赟QI的方法能夠很好地去除人臉圖像中的光照分量,與此同時也增加了圖像之間的相似性,這導(dǎo)致不同類別之間的鑒別性減少,在一定程度上,給圖像的正確分類帶來了不利影響。
作為分類前的預(yù)處理,特征選擇不僅可以去除對識別作用不大的冗余信息,降低數(shù)據(jù)的維數(shù),提高運算效率,還能夠增加不同類別間的鑒別性,從而實現(xiàn)更好的分類。線性判別分析(linear discriminat analysis,LDA)[12]作為特征選擇的一種方法,通過最大化類間散度和類內(nèi)散度的比值來尋找最優(yōu)的投影平面,使得樣本在該空間具有更好的鑒別性和可分離性。LDA通過Fisher準則找到最優(yōu)投影,F(xiàn)isher準則函數(shù)為
(2)
式中Sb和Sw分別為類間散度矩陣和類內(nèi)散度矩陣
(3)
(4)
利用特征分解來求解最佳投影矩陣Wopt,當類內(nèi)散度矩陣Sw為非奇異時,Wopt滿足下式的解
SbWi=λiSwWi
(5)
因此,本文選擇利用LDA對自商圖像進行特征選擇,通過尋找最優(yōu)投影矩陣,最大化類間散度和類內(nèi)散度之比,來構(gòu)建初始樣本空間。
經(jīng)過上述處理之后,得到的訓(xùn)練樣本特征用Xopt表示,Xopt=[X1,X2,…,Xc]∈Rp×l,其中,Xi=[xi,1,xi,2,…,xi,n]∈Rp×n為第ci類樣本的特征,ci=1,2,…c,p為特征維數(shù),訓(xùn)練樣本總數(shù)為l=c×n。
為了充分挖掘樣本特征的潛在信息,采用迭代隨機投影的方法來生成不同的樣本子空間,并用最近鄰分類器進行分類。隨機投影(random projection,RP)[13]在降低數(shù)據(jù)維數(shù)的同時,能夠保持數(shù)據(jù)的結(jié)構(gòu)特性,而且投影矩陣隨機產(chǎn)生,獨立于原始數(shù)據(jù)樣本,是降維和特征提取的有效手段。隨機投影的理論基礎(chǔ)為JL(Johnson-Lindenstrauss)引理。
JL引理表示任意n的維樣本集可以通過隨機矩陣R∈Rd×n,映射至d維子空間。文獻[14]指出如果R是標準正交化矩陣,經(jīng)隨機投影變換后的數(shù)據(jù)可以保留原始數(shù)據(jù)的統(tǒng)計特性。將訓(xùn)練樣本特征投影到各個投影空間,由于隨機投影后的樣本能夠保持原始樣本間的關(guān)系,所以,仍然以歐氏距離作為分類的標準。本文利用文獻[14]的方法構(gòu)造隨機投影矩陣。設(shè)置迭代次數(shù)的最大值為Tm,Tm≥2,定義第T次投影的隨機矩陣為RT,訓(xùn)練樣本Xopt經(jīng)RT投影后對應(yīng)的特征為XT
XT=RTXopt=[1,2,…,c]
(6)
YT=RTYopt
(7)
計算測試樣本和訓(xùn)練樣本之間的歐氏距離,最小歐式距離對應(yīng)的類別即為測試樣本所屬的類。如兩次投影后,測試樣本所屬為同一類,即判定測試樣本為此類;否則將測試樣本劃分為與其歐氏距離最小的樣本所屬的類。
1)采用SQI對人臉圖像進行光照歸一化處理,得到訓(xùn)練樣本X和測試樣本Y;
2)訓(xùn)練樣X本和測試樣本Y均由LDA最優(yōu)化得到Xopt和Yopt;
3)設(shè)置最大迭代次數(shù)Tm,初始迭代值T=1,類別C0=0;
4)構(gòu)造隨機矩陣RT,訓(xùn)練樣本集和測試樣本集分別由式(6)和式(7)得到XT和YT;
5)定義第T次迭代投影時,測試樣本和訓(xùn)練樣本之間的歐氏距離為Di(YT,i)=‖YT-i‖2,i=1,2,…,c,定義DT為歐氏距離最小的值,為最小距離DT對應(yīng)的訓(xùn)練樣本的類別;
6)如果CT=CT-1或者T=Tm,迭代結(jié)束,輸出樣本Y的類別為CT;否則,T=T+1,返回步驟(4),進行下一次隨機投影。
Yale B[15]人臉庫包含10個人臉的圖像,每個人有9種不同的姿勢,每個姿勢下有64種不同的光照條件。根據(jù)光照和相機之間的角度θ,這些圖像可分為5個子集:子集1(0°<θ<12°),子集2(13°<θ<25°),子集3(26°<θ<50°),子集4(51°<θ<77°),子集5(78°<θ<90°)。在實驗中選取正面人臉圖像作為實驗集,每人64張包含光照變化的圖像,每張人臉圖像都被裁剪為192像素×168像素大小。
AR[16]人臉庫包含126個人,包含表情變化、光照變化以及遮擋等共4 000余張圖像。在實驗中選取部分圖像作為實驗集,共有100個人,每人14張包含表情及光照變化的圖像,每張人臉圖像都被裁剪為120像素×165像素大小。
實驗中設(shè)置的最大迭代次數(shù)Tm=5。為了評估算法的性能,本文實驗對比了基于Retinex理論的方法(SSR[3],LTV[4])以及基于商圖像的方法(SQI[5],MQI[6])。為了更好地評估算法性能,實驗對比了兩種常見的光照處理方法(HE[2]和LT[17]),以下實驗均選擇以歐氏距離為分類標準的最近鄰分類器進行分類。所有實驗均在Intel Core I5,2.6 GHz CPU,4G RAM,Windows 7操作系統(tǒng)的計算機上進行,采用MATLAB R2014a實現(xiàn)仿真測試。
實驗中選取子集1作為訓(xùn)練樣本集,其余的幾個子集作為測試集。圖2為不同光照條件下的原始圖像與采用不同方法處理之后的圖像,從圖中可以看出,HE和LT在非極端光照下可以取得較好的效果,當光照條件較為惡劣時,處理效果不佳;SSR和LTV可以處理極端光照,但處理后的圖片損失了很多細節(jié)信息;MQI,SQI對人臉細節(jié)信息保留較好,但處理后的圖片包含較多的陰影,容易對識別的準確性產(chǎn)生不良的影響。
圖2 原始圖像及不同方法處理后結(jié)果
表1為不同算法在Yale B人臉庫中不同子集的識別率。在子集2中,由于光照相對均勻的,光照變化對人臉識別的影響不是很大,各個算法的識別率均很高。隨著光照惡劣程度的加劇,不同算法處理光照的能力顯示出差別,其中,HE和LT的識別率下降明顯高于其他幾種算法。
表1 Yale B庫上的識別率 %
基于商圖像的方法在極端光照下,識別準確率能夠保持在90 %以上。本文算法結(jié)合LDA和SQI構(gòu)造初始樣本空間,將類間散度和類內(nèi)散度之比最大化,使樣本間的鑒別性增加,具有良好的可分離性,更易分類。即使在光照最為惡劣的子集5中,本文算法的識別率高于SQI算法6.6 %,因此,在不同光照的子集下識別率均高于其他算法。
AR庫上,隨機選取每人2~7張圖片作為訓(xùn)練樣本,剩余圖片作為測試樣本進行實驗。AR人臉庫中樣本的類數(shù)相對較多,如果特征之間的鑒別性不夠強,那么產(chǎn)生錯誤分類的概率會增大,這種情況下,選取具有鑒別性的特征對分類的準確性來說尤為重要。
圖3為不同算法在AR子集上的識別率。本文方法通過LDA和隨機投影,樣本的鑒別性增加,從而使樣本分類的準確性提高。因此,在相同訓(xùn)練樣本數(shù)的前提下,本文算法的識別率高于其他對比算法。
在樣本分類前,提取到完備的樣本特征對分類的準確率有重要的作用。隨著訓(xùn)練樣本數(shù)的增加,特征的完備性增加,各個算法的識別率均有上升的趨勢。在訓(xùn)練樣本較少時,由于不能充分提取具有足夠鑒別性的樣本特征,對比的幾種算法識別率均不高。而本文算法采用多次隨機投影,挖掘出樣本的潛在本質(zhì)特征,因此,當訓(xùn)練樣本較少時,本文算法依然能取得較高的識別率。
圖3 AR人臉庫上的識別率
自商圖像算法能夠很好地處理光照,但處理后的圖像間相似性較高。本文采用自商圖像和隨機投影相結(jié)合的方法,利用多次隨機投影將特征樣本投影到各個不同的子空間,充分挖掘樣本的潛在信息,在提取光照不變量的用時,增加了樣本之間的鑒別性。實驗結(jié)果表明:與其他經(jīng)典光照處理方法相比,本文方法在不同的人臉庫上均能取得不錯的識別率。即使在訓(xùn)練樣本較少的情況下,經(jīng)過多次隨機投影,依然能選擇出具有鑒別性的特征,從而取得更高的識別率。