李靖平
(黎明職業(yè)大學(xué)信息與電子工程學(xué)院,福建泉州 362000)
基于分塊的2DPCA人臉識別方法
李靖平
(黎明職業(yè)大學(xué)信息與電子工程學(xué)院,福建泉州 362000)
將分塊理論與2DPCA方法相結(jié)合,研究分塊二維主成分分析法(M-2DPCA)在人臉識別中的應(yīng)用。對人臉圖像矩陣進行分塊,用形成的子圖像矩陣直接構(gòu)造總體散布矩陣并求解對應(yīng)的特征向量,利用提取的特征向量對圖像進行特征的提取與分析,進行人臉識別。基于Yale人臉數(shù)據(jù)庫的實驗顯示,在相同訓(xùn)練樣本和特征向量條件下,M-2DPCA比2DPCA算法具有更高的識別率.M-2DPCA充分利用了圖像的協(xié)方差信息,在人臉識別方面具有較高的識別率和魯棒性方面,對進一步研究人臉識別具有重要的意義。
二維主成分分析;分塊二維主成分分析法;特征提取;人臉識別
人臉識別技術(shù)是圖像分解與分類的一個典型應(yīng)用,它是數(shù)字圖像處理、概率統(tǒng)計、機器視覺等多個學(xué)科的綜合應(yīng)用.尤其是隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)安全需要高效的身份認證技術(shù),更進一步促進了人臉識別技術(shù)的發(fā)展.人臉識別技術(shù)通常是指,通過計算機技術(shù)提取面部特征,并結(jié)合存儲的若干已知身份的人臉圖像信息,識別出場景圖像中的單個或者多個人的身份.它是數(shù)字圖像處理、模式識別、機器視覺等多個學(xué)科的一個典型應(yīng)用.人臉識別技術(shù)具有操作簡單、結(jié)果直觀、隱蔽性好的優(yōu)越性[1].因此,人臉識別在智能視頻監(jiān)控、信用卡持卡人身份認證、社會保險人身份驗證、刑事偵破、出入口控制等領(lǐng)域具有廣泛的應(yīng)用前景[2-3].人臉識別的關(guān)鍵是特征提取,圖像矢量的維數(shù)很高,導(dǎo)致特征提取面臨顯著的困難,如何從大規(guī)模的數(shù)據(jù)中選擇有用的數(shù)據(jù)顯得尤其重要.主成分分析法(PCA)通過一個低維的線性子空間描述所給大規(guī)模數(shù)據(jù)的有效信息,是一種常見的人臉數(shù)據(jù)降維途徑[4].PCA需要將圖像的二維信息矩陣轉(zhuǎn)換為行向量,這極大地增加了圖像的維數(shù),加劇計算復(fù)雜度.Liu等人利用數(shù)字圖像直接構(gòu)造圖像散步矩陣,進行分析處理;Yang從統(tǒng)計不相關(guān)性角度出發(fā),改進了Liu的方法,形成一種具有統(tǒng)計不相關(guān)性的圖像投影鑒別新方法,即二維主成分分析法(2DPCA)[5-6].此方法直接從原始圖像二維矩陣中提取特征,并對特征進行分解以求其特征空間,省略了將圖像轉(zhuǎn)化為一維向量的過程,降低了計算的復(fù)雜度,減少了訓(xùn)練和特征提取的時間.另外,該方法直接將原始圖像映射到特征空間,提取出的特征信息損失小,其識別率明顯高于PCA,但當樣本數(shù)量較大時實時性仍然不足.Li研究了分塊思想在人臉識別中的應(yīng)用,首先將圖像矩陣進行分塊,并將分塊得到的子圖像矩陣用于鑒別分析[7].將二維子圖像矩陣用于特征識別,可以有效降低原始特征的維數(shù).在特征提取過程中不需要使用矩陣的奇異值分解,簡化了求解方法.本文在前人研究的基礎(chǔ)上,將分塊思想與二維主成分分析方法相結(jié)合,繼續(xù)探究其在人臉識別中的應(yīng)用,通過具體的實驗研究其識別性能的魯棒性.
2DPCA直接對圖像投影分析,可認為是主成分分析法(PCA)的發(fā)展與推廣.在2DPCA技術(shù)中,圖像協(xié)方差矩陣直接根據(jù)原始圖像進行構(gòu)造,不需要轉(zhuǎn)換為一維向量,比PCA的協(xié)方差矩陣規(guī)模顯著減小,計算精度高;提取2DPCA特征向量消耗時間短.
記X為n×d投影矩陣,對應(yīng)的列向量為標準正交向量,且滿足n≥d,A∈Rm×n為圖像矩陣.則在2DPCA中,存在如下關(guān)系:
Y=AX.
(1)
將矩陣A借助于矩陣X進行轉(zhuǎn)換,得到m×d矩陣Y,其中矩陣Y的每列都是圖像矩陣A的投影特征向量.X的質(zhì)量可以通過(2)來度量.
(2)式中,Sx表示訓(xùn)練樣本的投影特征向量的協(xié)方差矩陣,tr(Sx)是Sx的跡.令
G=E[(A-EA)T(A-EA)]∈Rn×n.
(3)
矩陣G是一個非負定矩陣,通常被稱為圖像的協(xié)方差矩陣.
若存在M張訓(xùn)練圖像,分別記為Ai∈Rn×n(i=1,2,…,M),則所有訓(xùn)練樣本的平均圖像記作
(4)
矩陣G近似表示為:
(5)
設(shè)x1,x2,…,xd為G的最大d個特征值對應(yīng)的標準正交特征向量.其最優(yōu)投影矩陣為
Xopt=[x1,x2,…,xd].
(6)
通過該投影矩陣進行臉圖像的特征提取,即對于給定的圖像矩陣A,令
yk=Axk,k=1,2,…,d.
(7)
稱作采樣圖像A的主成分向量.
由所有的主成分向量組成圖像A的特征矩陣B,其中B是一個m×d維矩陣,即B=[Y1,Y2,…,Yd].
(8)
記訓(xùn)練樣本為A1,A2,…,AN,且每個樣本都對應(yīng)確定的類別ωk(k=1,2,…,c),其特征矩陣為B1,B2,…,BN.對于特定的一個測試樣本A′,相應(yīng)的特征矩陣為B′,則人臉識別的目的就是根據(jù)這些特征矩陣利用分類器對測試樣本進行分類.最小距離的方法根據(jù)測試樣本投影矩陣與所有訓(xùn)練樣本投影特征矩陣之間的最近鄰法來判斷測試樣本所述的類別.最終的識別結(jié)果為:
d(B′,Bl)=minjd(B′,Bj) .
(9)
Bl∈ωk,故可以判斷A′∈ωk,即待判別的人臉是第k類人臉圖像.
2DPCA算法的協(xié)方差矩陣簡單,計算復(fù)雜度小,人臉的識別準確度高.然而2DPCA忽視了一部分圖像的協(xié)方差信息,這些丟失的信息對應(yīng)于圖像的局部結(jié)構(gòu),影響人臉識別的準確性;另外,在2DPCA中,表示一幅人臉需要相對較多的系數(shù).
將一幅分辨率為m×n的人臉灰度圖像A,分成p×q塊圖像矩陣,即
(10)
其中,每個子圖像矩陣Akl(k=1,2,…,p;l=1,2,…,q)是m1×n1子矩陣,且滿足pm1=m及qn1=n.將所有訓(xùn)練圖像的子圖像矩陣當作新的訓(xùn)練圖像樣本,進行2DPCA算法分析.
(11)
所有訓(xùn)練樣本子圖像矩陣的均值矩陣B為
(12)
其中,M=Npq是訓(xùn)練樣本子圖像矩陣的總數(shù)量.訓(xùn)練樣本的子圖像矩陣的總體散布矩陣Gt可以表示為
(13)
此時,Gt為m1×m1的非負定矩陣.
在樣本類別數(shù)量比較大(c較大)時,單一的最優(yōu)投影方向是不夠的,需要求解一組滿足標準正交條件的最優(yōu)投影向量組Z1,Z2,…,Zr.最優(yōu)投影向量組Z1,Z2,…,Zr可取為Gt的前r個最大特征值所對應(yīng)的標準正交的特征向量.令Q=[Z1,Z2,…,Zr],Q為最優(yōu)投影矩陣.用Q進行特征提取,則Ai的特征矩陣表示為
(14)
每幅原始人臉圖像Ai唯一地對應(yīng)一個特征矩陣Bi,然后利用最小距離分類器進行測試人臉圖像的分類.記
(15)
(16)
對作為測試樣本的人臉圖像A,同樣可計算其模塊圖像矩陣,A的特征矩陣記為B.
(17)
(18)
M-2DPCA是先對原始人臉圖像樣本進行分塊,而后在所有子圖像矩陣上施行2DPCA分析.在M-2DPCA分析方法中,若分塊時參數(shù)p和q的取值都為1,即模塊矩陣是1×1形式,這時的M-2DPCA就等同于2DPCA.因此故可以認為2DPCA是M-2DPCA的特例,M-2DPCA是2DPCA算法的拓展與推廣.
本實驗所用的圖像來源于具有典型代表性并被廣泛應(yīng)用的Yale人臉數(shù)據(jù)庫.在vc6.0環(huán)境下,借助于opencv圖像庫編寫相關(guān)軟件,進行實驗,所編寫的軟件界面如圖1所示.Yale人臉數(shù)據(jù)庫是由耶魯大學(xué)創(chuàng)建,由15位志愿者的165張照片構(gòu)成.分別在不同時刻不同光照條件下拍攝,包含有不同表情和姿態(tài)的變化,單幅人臉圖像分辨率為320*243[8].圖2是Yale數(shù)據(jù)庫中部分人臉圖像.從Yale人臉數(shù)據(jù)庫中隨機選擇10個人的圖像進行實驗,每人6幅圖像作為訓(xùn)練樣本,將剩下的5幅人臉作為測試樣本.
圖1 人臉識別軟件界面
圖2 Yale人臉數(shù)據(jù)庫中的部分人臉圖像
3.1 識別率與訓(xùn)練樣本數(shù)量關(guān)系
利用所編寫的人臉識別軟件,可以實現(xiàn)人臉的匹配與識別,并且具有較高的識別率.為了比較2DPCA和M-2DPCA算法在訓(xùn)練樣本數(shù)目不同時的識別精度,從每個人選擇一張人臉圖片訓(xùn)練樣本數(shù)以1的形式遞增,一直增加到每個人選擇10張人臉圖片,仿真結(jié)果如圖3所示:
圖3 識別率隨訓(xùn)練樣本數(shù)量變化趨勢
從圖3中可以看出,隨著訓(xùn)練樣本數(shù)的增加,2DPCA和M-2DPCA的識別率均呈遞增形式,且M-2DPCA的識別率明顯高于2DPCA.尤其是當訓(xùn)練樣本數(shù)目大于等于5時,M-2DPCA的識別率達到90%以上,并且隨著訓(xùn)練樣本的增加,識別率仍有增加趨勢.隨著訓(xùn)練樣本的增加,2DPCA方法的識別率也呈現(xiàn)出遞增趨勢,但是其總體識別精度明顯低于M-2DPCA,當訓(xùn)練樣本數(shù)目大于等于4時,其識別率在0.8附近波動.綜合考慮2DPCA和M-2DPCA算法,當訓(xùn)練樣本數(shù)目大于或等于6時,其識別率都基本趨向于穩(wěn)定狀態(tài),可以認為6是能夠準確反映這兩種算法識別率的分界點,且這個分界點正好是訓(xùn)練樣本數(shù)超過測試樣本數(shù)的一個分界線,故在下文的分析中取訓(xùn)練樣本數(shù)目為6.
3.2 特征向量數(shù)目對識別率的影響
在訓(xùn)練樣本數(shù)目為6時,研究特征向量個數(shù)的不同對2DPCA和M-2DPCA識別精度的影響.重點研究特征向量數(shù)量從26開始逐次以1遞增直至55時兩種方法的識別率,其結(jié)果如圖4所示.
圖4 識別率隨特征向量數(shù)量變化趨勢
從圖4可以看出,當特征向量數(shù)目大于等26時,M-2DPCA識別率明顯高于2DPCA.尤其是M-2DPCA識別率的穩(wěn)定性較2DPCA好,隨特征向量數(shù)目的增加波動不明顯.
本文針對2DPCA技術(shù),忽視了部分能夠反應(yīng)圖像的局部結(jié)構(gòu)的圖像的協(xié)方差信息,在一定程度上降低識別率的問題,進一步研究將分塊思想與2DPCA相結(jié)合形成的M-2DPCA理論,研究其在人臉鑒定方面的識別率.將原始圖像二維矩陣分塊后的子圖像矩陣用于特征識別,降低了原始特征的維數(shù),簡化了求解算法,同時充分利用了圖像的協(xié)方差信息,提高了識別率.通過實驗表明本文研究的M-2DPCA較2DPCA在人臉識別的識別率和魯棒性方面,具有顯著的優(yōu)勢.
[1]王映輝.人臉識別——原理、方法與技術(shù)[M].北京:科學(xué)出版社,2010.
[2]段錦.人臉自動及其識別[M].北京:科學(xué)出版社,2009.
[3]Tan X Y.Enhanced local texture feature sets for face recognition under difficult lighting conditions [J]. Image Processing,2010,19(6):1635_1650.
[4]李勇,梁志貞.基于Lp范數(shù)的2DPCA的人臉識別方法[J].計算機工程與應(yīng)用,2013,49(11):183-227.
[5]Zhao Zhiqiang, Zhang Yi, Hu Jianming. Comparative Study of PCA and ICA Based Traffic Flow Conpression[J]. Journal of Highway and Transporttation Research and Development,2008,25(11):109-113.
[6]Yang Jian,Zhang D,Frangi A F,et al.Two-dimensional PCA:a new approach to appearance-based fase representation and recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2004,26(1):131-137.
[7]李靖.基于改進的主成分分析類算法的人臉識別[D].天津:天津大學(xué),2012.
[8]He X F,Ysn S, Hu Y, et al. Face recognition using Laplacian faces[J]. IEEE Trans on Pattern Analysis and Machine Intelligence,2005,27(3):328-340.
A M-2DPCA Face Recognition Method
LI Jing-ping
(Liming Vocational University, Quanzhou Fujian 362000,China)
The block theory and two-dimensional principal component analysis (2DPCA) were combined, and the modular two-dimensional principal component analysis (M-2DPCA) was studied in face recognition. The original image matrix was divided into modular image matrixes, and the image covariance matrix was formed directly by using sub-image matrixes, and its eigenvectors were derived. The eigenvectors were used to extract and analyze image feature for face recognition. The experiments based on the Yale face database showed that it had a higher recognition rate of M-2DPCA than 2DPCA under the same training specimens and eigenvectors. The information of image covariance matrix was fully utilized in M-2DPCA method, which had an admirable recognition rate and robustness on face recognition, and it was important to further research on face recognition.
Two-Dimensional Principal Component Analysis (2DPCA); M-2DPCA; Feature Extraction;Face Recognition
2013-11-14
福建省教育廳B類科技研究項目(JB12487S);泉州市技術(shù)研究與開發(fā)項目高校協(xié)同創(chuàng)新科技項目(2012Z131);泉州市科技局科技資助項目(2008G16)。
李靖平(1981- ),男,福建泉州人,黎明職業(yè)大學(xué)信息與電子工程學(xué)院講師,碩士研究生,從事電子技術(shù)研究。
TP391.41
A
1008-178X(2014)01-0040-05