摘要:主要研究基于人臉局部形狀特征分類的方法,首先利用AAM的人臉形狀特征點定位算法,提取出有用的人臉特征點,構(gòu)成人臉下顎形狀、眉毛、眼睛、鼻子和嘴巴的局部形狀特征;然后采用基于形態(tài)面指數(shù)和下顎寬指數(shù)的ISODATA方法進行自動聚類,實現(xiàn)了百萬量級人臉照片庫的自動分類,有助于進一步提高人臉識別查詢的速度和精度。
關(guān)鍵詞:人臉分類;主動表觀模型(AAM);聚類
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9599 (2012) 15-0000-02
本文以全國碩士研究生現(xiàn)場確認環(huán)節(jié)中采集的百萬量級考生人臉照片為研究樣本,基于人類視知覺特性知識,利用人臉局部形狀特征確定出有效的人臉分類,并將大型人臉庫中的人臉進行類別劃分。從而縮小用于人臉識別匹配的人臉庫以及降低人臉識別的數(shù)據(jù)量,有助于進一步提高大庫中人臉識別查詢的速度和精度。
1 人臉特征提取及關(guān)鍵特征點定位
本節(jié)將著重針對現(xiàn)場確認采集的人臉照片進行特征提取算法訓(xùn)練,并對實驗結(jié)果進行驗證和分析。
1.1 特征點定位步驟
本文選擇AAM算法。特征點的定位以及提取步驟如下:
第一步:從本文應(yīng)用的百萬量級人臉庫中選取n張人臉照片進行特征點標定;第二步:使用標定好的人臉照片對AAM算法進行訓(xùn)練;第三步:使用訓(xùn)練后的結(jié)果在百萬量級人臉庫中選取另外m張人臉照片進行實驗;第四步:使用不同n張人工標定人臉照片訓(xùn)練的分類器,驗證m張待測人臉,根據(jù)實驗結(jié)果選擇合適的分類器。
1.2 基于AAM算法的特征點提取
(1)對人臉照片進行標定。本文采用的關(guān)鍵特征點分別為鼻梁上端左右兩個點、下唇中心、臉頰左右頂點、下顎左右拐點及下顎頂點,共8個特征點,如圖 1中紅圈中的點,在這里為了進一步的人臉識別工作,增加部分關(guān)鍵特征點。選取58個標記點,標定后的人臉照片如圖 1所示。
(2)特征點定位實驗。在本實驗中,依次選取20、50、80、100、150、180張圖片進行標定并訓(xùn)練,并使用訓(xùn)練結(jié)果在200張待測人臉照片中進行測試。
實驗結(jié)果表明,當訓(xùn)練圖片達到150張時,模型建立較好,得到的測試結(jié)果令人滿意,并且隨著訓(xùn)練圖片增多正確率保持在74%左右變化不大。因此,我們將基于150張訓(xùn)練圖片得到的模型作為待測模型。
1.3 實驗結(jié)果分析
從上節(jié)的實驗結(jié)果可以看出,人臉照片中,人臉的遮擋物以及光照對特征提取有很大的影響,人臉遮擋物如發(fā)型,而眼鏡的遮擋反而對特征提取影響不是很大。
作為訓(xùn)練算法所使用的人工標定好的人臉照片數(shù)量,經(jīng)實驗表明,并不一定是數(shù)量越多越好,采用更多的人工標定的人臉照片進行訓(xùn)練不會對正確率有顯著提升。
本文采用準確率較高的鼻子、嘴巴和下顎輪廓的部份特征點進行人臉照片的分類。
2 人臉分類方法的研究
本文的人臉分類方法以人體測量學(xué)的分類方法為基礎(chǔ)。
本文選取形態(tài)面指數(shù)和下顎寬指數(shù)這兩個面型指數(shù)作為臉型分類的參考。然后選取ISODATA動態(tài)聚類算法,對形態(tài)面指數(shù)和下顎寬指數(shù)采用自動聚類的方法來進行分類研究。
2.1 人臉照片分類數(shù)據(jù)預(yù)處理
本文根據(jù)下顎左右兩個頂點,鼻根點、下唇下中點,左右下顎角以及顎下點,進而得到面寬、下顎間寬、形態(tài)面高、嘴高這四個測量參數(shù),圖2分別給出了各個監(jiān)測點以及測量參數(shù)。
得到上述面型參數(shù)后,形態(tài)面指數(shù)和下顎寬指數(shù)可由下面公式得到。
由以上公式可以看出,兩個指數(shù)均為比值,這樣就避免了由于人臉照片大小差別引起的計算誤差,可以避免人臉歸一化的過程。
2.2 基于人臉測量學(xué)的自動分類方法
本文的ISODATA聚類方法是基于形態(tài)面指數(shù)和下顎寬指數(shù),根據(jù)這些特征點位置利用式2.1和式2.2得出形態(tài)面指數(shù)x和下顎寬指數(shù)y,最后利用ISODATA算法基于人臉照片的形態(tài)面指數(shù)和下顎寬指數(shù)形成的二維數(shù)組 進行自動聚類。
在本文實驗過程中,分類過程中設(shè)定類內(nèi)照片數(shù)量閥值n,當某類中人臉照片數(shù)量超過n,則針對這類照片利用ISODATA進行二次分類,直到每類人臉照片數(shù)量小于n。
本文作為實驗研究,將n設(shè)置為400。
2.3 實驗結(jié)果及分析
我們主要探討正面人臉照片的自動聚類結(jié)果,選取1090張人臉照片作為待分類人臉庫。根據(jù)AAM特征點提取的結(jié)果,應(yīng)用ISODATA算法,平均耗時50ms左右(含AAM特征提取以及關(guān)鍵特征點定位時間)。
(1)單循環(huán)分類結(jié)果。根據(jù)ISODATA方法自動聚類的結(jié)果,將二維數(shù)組分為3類,分類分類情況如下表 1所示。
從單循環(huán)分類結(jié)果可以看出,第二類class[1]的人臉照片數(shù)量較大,與期望的分類分布均勻有較大差距,為了獲得分類較均勻的結(jié)果,在單循環(huán)基礎(chǔ)上做多循環(huán)ISODATA自動聚類處理。
(2)多循環(huán)分類結(jié)果。根據(jù)單次循環(huán)分類的結(jié)果,發(fā)現(xiàn)第二類class[1]人臉照片較多,本文針對第二類class[1]繼續(xù)進行分類。從二次循環(huán)結(jié)果看,class[11]類仍然數(shù)量較多,在二次循環(huán)的基礎(chǔ)上進行三次循環(huán)分類。三次循環(huán)分類情況匯總?cè)缦卤?2所示,散點圖如圖3所示。
(3)實驗結(jié)果分析。從本文試驗結(jié)果來看,在多次循環(huán)后,部份類內(nèi)照片數(shù)量遠低于閥值,即出現(xiàn)每類照片數(shù)量分布不均勻現(xiàn)象,但從散點圖看在y軸方向類間區(qū)分還是較明顯。針對不同人臉庫的規(guī)模,仍需根據(jù)人臉識別的正確率和效率設(shè)置每類人臉規(guī)模的閥值。
3 人臉照片分類方法的應(yīng)用
本文基于局部形狀特征提取的人臉照片分類的研究,應(yīng)用于碩士研究生全國統(tǒng)一入學(xué)考試現(xiàn)場確認階段采集的百萬量級人臉照片,人臉照片分類主要分為兩個階段進行,第一階段是客戶端進行人臉特征點定位并記錄特征點位置,第二階段為根據(jù)匯總后的百萬量級人臉照片特征點生成二維數(shù)組,使用本文基于ISODATA自動聚類的方法將人臉照片庫進行分類。
4 結(jié)束語
本文通過采用AAM的人臉形狀特征點定位算法來獲得有用的人臉形狀特征點并構(gòu)成形狀特征信息,這些形狀特征可以很好地描述人臉。然后,利用基于形態(tài)面指數(shù)x和下顎寬指數(shù)y組成的二維數(shù)組,使用ISODATA自動聚類算法對二維數(shù)組進行分類,使人臉分類更加合理并適合于實際應(yīng)用。本文的研究能夠減少人臉識別工作的對比量。
參考文獻
[1]山世光,高文,陳熙霖.基于紋理分布和變形模板的面部特征提取[J].軟件學(xué)報,2001,12(4):580-587
[2]凌旭峰,楊杰,楊勇.基于輪廓線曲率特征的人臉分類及識別[J].紅外與激光工程,1999,28(4):37-39
[3]王俊艷,蘇光大.基于下頜輪廓線的人臉分類方法[J].紅外與激光工程,2004,33(2):159-163
[4]王俊艷,蘇光大,林行剛.用于人臉識別的下頜輪廓線分類方法[J].光電子·激光,2005,16(11):1368-1372
[5]陳熙,趙曉萍,范松青.人體面部測量與分析[J].南華大學(xué)學(xué)報·醫(yī)學(xué),2007,35(4):518-520