王軼冰,胡邦君
WANG Yibing1,HU Bangjun2
1.安徽大學 計算機教學部,合肥 236061
2.安徽省生物研究所,合肥 230088
1.Center of Computer Teaching,Anhui University,Hefei 236061,China
2.Institute for Biological Studies in Anhui Province,Hefei 230088,China
人臉識別是最為常用的生物特征自動識別技術之一[1],具有方便、非接觸式采集和采集成本低等優(yōu)勢,因此在人機交互、自動監(jiān)控、身份識別等領域具有很大的發(fā)展?jié)摿2]。經(jīng)過數(shù)十年的深入研究,人臉識別已經(jīng)取得長足的發(fā)展,在約束環(huán)境下的正面人臉識別率已達到90%以上。但是,當人臉圖像采集受外界條件影響(如光照、姿勢、表情、遮擋)時,將大大降低識別性能[3]。因此,如何消除光照、姿勢、表情等因素對人臉識別的影響,成為亟待解決的問題。
為了解決光照、表情、姿態(tài)變化引起的人臉識別率下降的問題,學者們提出了許多不同的人臉識別算法。例如,文獻[4]提出使用無監(jiān)督學習方法對每個人臉圖像的微觀結構進行編碼。針對在劇烈光照變化情況下無法獲得足夠的特征描述信息的問題,基于梯度幅值自相似性,文獻[5]提出了稱為梯度邊緣幅值模式(Pattern of Edge Gradient,POEM)的判別性特征描述符,取得了很好的識別效果,但是,一定程度上增加了計算開銷。有的學者提出利用DCT變換,將特征臉方法與DCT變換或其他變換相結合。例如,文獻[6]提出將特征臉與DCT變換和人眼視覺特性加以結合;文獻[7]探討了在不同DCT變換下的特征值與特征向量;文獻[8]證明了PCA和LDA可被直接用于DCT變換域上;文獻[9]表明,重新變換離散余弦變換(Discrete Cosine Transform,DCT)的低頻系數(shù)在所有其他光度規(guī)范化技術中能得到的性能最佳。文獻[10]結合了人臉鏡像對稱性和核主成分分析,提出了基于對稱核主成分分析的人臉識別方法;文獻[11]表明,使用核函數(shù)可有效地計算高維特征空間的主成分以獲取重要的圖像信息。
基于上述分析,為了更好地解決魯棒人臉識別問題,提出了基于限制對比度自適應直方圖均衡化(Contrast Limiting Adaptive Histogram Equalization,CLAHE)的DCT系數(shù)重變換算法,通過縮減DCT系數(shù)補償光照變化,使用核主成分分析(Kernel Principal Component Analysis,KPCA)提取高維特征向量,最后利用最近鄰分類器完成人臉的識別。實驗結果表明所提算法在光照變化人臉識別中的有效性及魯棒性。
為了提高光照變化人臉識別系統(tǒng)的識別精度,提出的人臉識別算法架構如圖1所示,其步驟如下:
(1)對訓練圖像和測試圖像通過使用CLAHE和DCT對圖像進行規(guī)范化,CLAHE用于局部對比拉伸,DCT變換后,低頻系數(shù)通過因子降維以消除光照的影響。
(2)得到規(guī)范化圖像后,使用能夠提取高階統(tǒng)計的KPCA提取圖像特征,其中核函數(shù)使用多項式核與高斯核。
(3)使用K-最近鄰分類器對提取的特征進行分類以完成最終識別。
圖1 所提算法的大致架構
圖像的直方圖描述了一幅圖像的灰度級內容。它是圖像處理中一種十分重要的圖像分析工具。直方圖均衡化以概率理論為基礎,運用灰度點運算來實現(xiàn)直方圖的變換,能夠給出增強的規(guī)范化圖像,從而達到圖像增強的目的。普通的直方圖均衡算法對于整幅圖像的像素使用相同的直方圖變換,這對于那些像素值分布比較均衡的圖像來說,算法的效果很好。然而,如果圖像中包括明顯比圖像其他區(qū)域暗或者亮的部分,這部分的對比度將得不到有效的增強。
自適應直方圖均衡化(AHE)是一種用來提升圖像對比度的技術。和普通的直方圖均衡化算法不同,AHE通過計算圖像的局部直方圖,然后重新分布亮度來改變圖像對比度。因此,該算法更適合于改進圖像的局部對比度以及獲得更多的圖像細節(jié),即圖像內感興趣的特征需要局部加強。但是,AHE有過度放大圖像中相同區(qū)域的噪聲問題,因此采用限制對比度直方圖均衡(CLAHE)[12]算法能有限地限制這種不利的放大。
CLAHE同普通的自適應直方圖均衡算法不同的地方主要是其對比度限制。CLAHE首先將圖像劃分成若干個小區(qū)域,其次增強每個小區(qū)域的對比度,然后,使用雙線性插值合并相鄰小區(qū)域,以消除人為產(chǎn)生的邊界線。另外,通過選擇直方圖的限幅電平減少未考慮的噪聲放大。采用HE和CLAHE后的圖像如圖2所示。圖2中,(a)為原始圖像,(b)所示為(a)采用普通直方圖均衡化后的圖像,(c)所示為采用限制對比度自適應直方圖均衡化后的圖像。很明顯,CLAHE有效地抑制了噪聲的增強。
圖2 采用HE和CLAHE后的圖像對比
離散余弦變換(DCT)是一種優(yōu)良的數(shù)據(jù)壓縮方法,它具有以下兩個特點:
(1)DCT是一種正交變換,各種正交變換都能在一定程度上減少隨機向量的相關性,且信號經(jīng)過大多數(shù)正交變換后,能量會集中在少數(shù)的變換系數(shù)上。去掉對信號貢獻較小的系數(shù),僅利用保留下來的信號恢復信號,不會引起明顯的失真。而圖像具有低頻特性,即圖像的信息主要集中在低頻區(qū)域,通過DCT變換,圖像的大部分能量都集中在DCT系數(shù)圖像左上角的一小塊區(qū)域。
(2)DCT壓縮能力僅次于K-L變換,但是K-L變換的基向量依賴于信號向量的協(xié)方差矩陣,特征值和特征向量的計算十分困難,而DCT具有快速實現(xiàn)算法(FFT),具有極大的速度優(yōu)勢。以上特點使得DCT得以越來越廣泛的應用。
對于一幅 M×N的圖像 f(x,y)矩陣,其離散余弦變換定義如下:
其中,C(u,v)稱為矩陣 f(x,y)的DCT系數(shù)。u=0,1,…,M-1,v=0,1,…,N-1,a(u)、a(v)分別定義為:
圖3 重變換系數(shù)不同時的圖像對比
經(jīng)過DCT變換后,圖像的二維DCT系數(shù)構成一個與原始圖像大小相同的矩陣,其低頻系數(shù)集中在矩陣的左上角,是圖像中變化較慢的成分,而高頻系數(shù)集中在矩陣的右下角,是圖像的細節(jié)和邊緣成分。DCT可以將圖像從空域轉換到頻域,而光照變化主要影響的就是低頻部分,這樣通過丟棄一定的低頻DCT系數(shù)就可以有效地實現(xiàn)光照補償。文獻[13]已經(jīng)在實驗上驗證了該方法對光照變化具有很好的魯棒性。圖3所示為不同數(shù)目的低頻DCT系數(shù)重新變換的DCT規(guī)范化結果。由圖3可以看出,重變換DCT系數(shù)數(shù)目為29時,性能最佳。
特征提取是人臉識別系統(tǒng)的主要步驟,因為它能降低臉部圖像的維度,最流行的特征提取技術是主成分分析(PCA)。通過主成分分析來進行人臉識別,所提取的特征能較好地反映出人臉的分布信息。但是,PCA在本質上是依據(jù)特征向量方差最大的原則提取特征,只利用了圖像的二階特征,未能利用圖像數(shù)據(jù)中的高階特征,而一幅圖像的高階統(tǒng)計往往包含了圖像邊緣或曲線的多個像素間的非線性關系,這些信息對圖像識別非常有利。為此,學者們將PCA方法推廣到高維特征空間,提出了核主成分分析(KPCA)方法。本文算法使用KPCA提取高階統(tǒng)計,算法過程描述如下:
假設 x1,x2,…,xM為給定的樣本集,用{xi}表示輸入空間。KPCA的基本思想是通過某種方式將輸入空間映射到某個高維空間,并且在該高維空間中實現(xiàn)PCA。假設相應的映射為Φ,其定義如下:
核函數(shù)通過映射Φ將隱式地實現(xiàn)點x到F的映射,并且由此映射而得的特征空間中數(shù)據(jù)滿足中心化的條件,即
則特征空間中的協(xié)方差矩陣為:
現(xiàn)求C的特征值λ≥0和特征向量:
即有:
考慮到所有的特征向量可表示為Φ(x1),Φ(x2),…,Φ(xM)的線性組合,即
則有:
其中,ν=1,2,…,M 。定義 M×N維矩陣K:
因此,式(10)可以簡化為:
顯然滿足:
求解式(13)就可以得到特征值和特征向量。對于測試樣本在特征向量空間Vk的投影為:
將內積用核函數(shù)替換,則有:
當式(5)不成立時,即特征空間數(shù)據(jù)不滿足均值為0的條件時,則需要進行調整:
因此,核矩陣可以修正為:
常見的核函數(shù)有以下幾種形式:
(1)線性核函數(shù):
(2)d階多項式核函數(shù):
(3)高斯核函數(shù):
根據(jù)以上分析,使用核函數(shù)就能提取非線性主成分,選取式(19)的多項式核函數(shù)和式(20)的高斯核函數(shù),因為它們在許多模式分類應用中具有優(yōu)越的性能。
分類在任何一種人臉識別系統(tǒng)中都是非常關鍵的一步,K-最近鄰分類器是最簡單、使用最廣泛的非參數(shù)化分類器,基于特征空間最接近訓練實例對對象進行分類。特征提取完成后,分別對訓練特征和測試特征進行規(guī)一化操作,使其具有零均值和單位方差,然后利用最近鄰分類器完成最終的分類、識別。即計算測試樣本特征與每個訓練樣本特征之間的歐氏距離,當測試樣本和N種訓練樣本其中一種的歐氏距離最短時,則測試樣本被判斷為這種訓練樣本的類別。
實驗數(shù)據(jù)主要來自三個人臉數(shù)據(jù)庫,即ORL標準人臉庫、擴展的YaleB和AR人臉庫。ORL人臉庫共有40個人,其中包含了每個人在不同時間、不同光照條件下的10幅不同的人臉圖像。每幅圖像灰度級為256,尺寸為112×92。實驗中,將每幅圖像統(tǒng)一裁剪為80×100。擴展的YaleB數(shù)據(jù)庫由38個人,每人64幅在不同光照下的256級灰度圖像組成。也將每幅圖像預處理為80×100大小。以上兩個庫均包括了光照、臉部表情和姿勢的各種變化。其中人的臉部表情和臉部細節(jié)有著不同程度的變化,如笑或不笑,眼睛睜或閉,戴或不戴眼鏡等;人臉姿態(tài)也有相當程度的變化,深度旋轉和平面旋轉可達20o;人臉的尺度也有多達10%的變化。AR人臉庫是由西班牙巴塞羅那計算機視覺中心建立的,包含了126人(男性70,女性56)的近4000幅圖像,該人臉庫每個人的表情均不相同,膚色分布較廣,部分圖片有眼鏡、圍巾等飾物遮擋。且所有圖像采集環(huán)境中的攝像機參數(shù)、光照環(huán)境、攝像機距離等都是嚴格控制的。
實驗使用MATLAB7.0在個人計算機上實現(xiàn),計算機配置為:Windows 7操作系統(tǒng)、迅馳酷睿2處理器、2.10 GHz主頻、16 GB RAM。
以ORL人臉庫為例,首先考察了不同的DCT系數(shù)數(shù)量對所提算法性能的影響,包括識別的精度和整個算法所耗時間,重變換DCT系數(shù)數(shù)目分別取7、13、20、29、35、40。圖4給出了不同的系數(shù)數(shù)目對識別精度和識別速度的影響曲線。由圖4可以看出,隨著DCT系數(shù)數(shù)量的增加,識別精度呈增長趨勢,但是當系數(shù)數(shù)目增加到一定程度時,系數(shù)數(shù)目的變化對識別率的影響很小,說明刪除的系數(shù)對圖像重建和人臉識別的影響已經(jīng)微乎其微了。而增加系數(shù)會大大增加系統(tǒng)的識別時間,系統(tǒng)開銷就會增加。因此,以下實驗中,重變換DCT系數(shù)數(shù)目取為29。
其次,實驗比較了在DCT系數(shù)取值相同的情況下,不同的核函數(shù)對識別率的影響。核函數(shù)分別選擇多項式核函數(shù)和高斯核函數(shù),表1給出了不同的參數(shù)對識別率的影響。由表1可以看出,高斯核函數(shù)的識別率明顯高于采用多項式核函數(shù)的識別率,因此,以下實驗中,σ取10。
表1 不同的核函數(shù)對識別率的影響(%)
2.3.1 ORL數(shù)據(jù)庫
在ORL數(shù)據(jù)庫上,首先將該庫分為訓練庫和識別庫,其中訓練庫和識別庫分別由200幅人臉圖像組成。實驗中用到的部分訓練圖像如圖5所示。然后采用幾種較為先進的算法,如基于LMP融合KPCA算法[14]、LBP+RB2DLDA算法[15]、對稱核主成分分析算法與所提算法進行比較。
圖5 ORL數(shù)據(jù)集中的部分訓練樣本
當訓練樣本取不同數(shù)目時,各算法的平均識別精度是不同的。實驗中,隨機抽取每個人的k幅圖像作為訓練樣本,k的取值范圍為[2,9]。對每個k進行多次實驗然后取平均值,實驗結果如表2所示。
表2 各算法在ORL數(shù)據(jù)集上的平均識別率比較(%)
從表2中可以看出,隨著k的增加,各算法的識別率逐漸上升,當k=9時,各算法的識別率都在95%以上,雖然所提算法的識別率高于其他算法,但不能充分體現(xiàn)所提算法的優(yōu)越性。下面將各算法應用于擴展YaleB庫和AR人臉庫進行分析比較。
2.3.2 擴展的YaleB數(shù)據(jù)庫
為了和其他算法進行比較,實驗選用擴展YaleB庫中正面姿態(tài)的2432幅圖像,并根據(jù)不同光照情況,將樣本集劃分為5個子集:子集A、子集B、子集C、子集D、子集E,用于實驗的部分圖片如圖6所示。
圖6 實驗選用的部分圖像
第一組實驗僅選用擴展YaleB子集中理想光照下的人臉圖像,即子集A進行訓練,而采用其他不同光照條件下的人臉圖像,即子集B~子集E進行測試。實驗結果如表3所示。由表3中可以看出,所提算法始終能夠獲得比其他幾種方法更高的識別率,尤其是在光照條件差的子集D和子集E中,充分說明其具有較強的魯棒性。
從表3可以看出,在所有的子集上,所提算法的識別率均高于其他所有比較算法,各算法在子集B、C上的識別率都較為理想,因此不能明顯體現(xiàn)出所提算法的優(yōu)越性,但是在光照條件非常差的子集D、E上,所提算法的識別率仍然保持在較高水平,而其他幾種比較算法的識別率卻明顯下降,由此可以體現(xiàn)出所提的算法在識別率方面的可靠性以及對光照變化的魯棒性。
表3 擴展YaleB人臉庫用子集A訓練時的識別率 (%)
2.3.3 AR人臉庫
實驗中,從AR人臉庫中選擇100人(男性50,女性50),每人14張圖像。對于每個對象,分別從中選擇正常、微笑、生氣、左側光照、右側光照、眼鏡遮擋、圍巾遮擋的圖像。部分實驗樣本如圖7所示。實驗包括兩部分:(1)考查訓練樣本集數(shù)目與每類訓練樣本數(shù)均取不同值時,對識別率的影響;(2)將所提算法與其他算法作比較以分析其識別性能。
圖7 AR人臉庫部分實驗樣本
首先從100人中隨機抽取k個人進行實驗,訓練樣本集數(shù)目k的取值范圍是[3,10],每類訓練樣本數(shù)取2、3時,所提算法的識別率如圖8所示。
圖8 不同k、訓練樣本數(shù)對識別率的影響
由圖8可見,隨著訓練樣本集數(shù)目的增加,識別率基本呈上升趨勢,同時,隨著訓練樣本數(shù)的增加,算法的識別率有較大的提高。
為了體現(xiàn)所提算法的優(yōu)越性,實驗中每個人的前7幅圖像作為訓練樣本,后7幅圖像作為測試樣本,將所提算法的識別率與其他幾種較為先進的算法進行了比較,實驗結果如表4所示。由表4可以看出,所提算法能獲得與這些算法相當甚至是更好的識別率,尤其在有太陽鏡、圍巾等遮擋物的情況下,所提算法仍能獲得明顯高于其他算法的識別率,這充分說明本文算法具有良好的魯棒性。
表4 各算法的識別率比較 (%)
為了改善魯棒人臉識別系統(tǒng)的識別率,提出了基于CLAHE的低頻DCT系數(shù)重變換算法。該算法使用CLAHE技術代替AHE對局部進行對比拉伸,即用在每個小區(qū)域上操作來代替在整個人臉圖像上操作。然后通過縮減適當數(shù)目的低頻DCT系數(shù)來消除光照變化,使用核PCA來提取圖像的高階統(tǒng)計以獲得更多圖像細節(jié),并利用最近鄰分類器進行分類以完成最終的人臉識別。與其他幾種較為先進算法的比較表明了所提算法的有效性和優(yōu)越性。特別是在對AR人臉圖像庫的實驗及對比結果表明,所提算法對人臉遮擋、光照以及表情變化具有較好的魯棒性。
[1]蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識別[J].軟件學報,2010,21(8):1849-1862.
[2]Atkins W.Industry squares up to multiple opportunities[J].Biometric Technology Today,2007,15(1):8-11.
[3]Ma Hui,Hu Fengsong.The study of human face recognition based curvelet transform and 2DPCA[J].ICISE,2010,12(4/6):5512-5515.
[4]皋軍,孫長銀,王士同.具有模糊聚類功能的雙向二維無監(jiān)督特征提取方法[J].自動化學報,2012,38(4):549-562.
[5]楊利平,葉洪偉.人臉識別的相對梯度方向邊緣幅值模式[J].中國科技論文在線精品論文,2014,7(4).
[6]Ramasubramanian D,Venkatesh Y V.Encoding and recognition of faces based on the human visual model and DCT[J].Pattern Recognition,2001,34(12):2447-2458.
[7]Tseng C C.Eigenvalues and eigenvectors of generalized DFT,generalized DHT,DCT-IV and DST-IV matrices[J].IEEE Trans on SP,2002,SP-50(4):866-877.
[8]Chen Weilong,Er M J,Wu Shiqian.PCA and LDA in DCT domain[J].Pattern Recognition Letters,2005,26:2474-2482.
[9]Vishwakarma P,Pandey S,Gupta M N.An illumination invariant accurate face recognition with down scaling of DCT coefficients[J].Journal of Computing and Information Technology,2010,18(1):53-67.
[10]劉嵩,羅敏,張國平.基于對稱核主成分分析的人臉識別[J].計算機工程,2012,32(5):1404-1406.
[11]盧桂馥,林忠,金忠.基于核化圖嵌入的最佳鑒別分析與人臉識別[J].軟件學報,2011,22(7):1561-1570.
[12]Celik T,Tjahjadi T.Automatic image equalization and contrast enhancement using Gaussian mixture modeling[J].IEEE Transactions on Image Processing,2012,21(1):145-156.
[13]Chen Weilong,Meng Joo Er,Wu Shiqian.Illumination compensation and normalization for robust face recognition using discrete cosine transform in logarithm domain[J].IEEE Transactions on Systems,Man,and Cybernetics,PartB:Cybernetics,2006,36(2):458-466.
[14]郭飛,王成.基于LMP和KPCA的人臉識別[J].計算機工程,2010,36(24):183-186.
[15]蘇立明,王瑩.基于局部二元模式和重采樣雙向2DLDA的人臉識別算法[J].吉林大學學報:理學版,2013,51(3):459-464.