卜宇,劉俊霞,唐學(xué)軍
局部二值模式結(jié)合多類(lèi)組LASSO算法的人臉識(shí)別方法
卜宇,劉俊霞,唐學(xué)軍
針對(duì)視頻序列中的人臉識(shí)別問(wèn)題,提出一種基于局部二值模式(LBP)和多類(lèi)組LASSO算法的人臉識(shí)別方法。首先,將臉部區(qū)域分成若干個(gè)塊區(qū)域,對(duì)每個(gè)塊區(qū)域計(jì)算其超完備局部二值模式直方圖。然后,對(duì)傳統(tǒng)最小絕對(duì)收縮和選擇算子(LASSO)進(jìn)行改進(jìn),形成多類(lèi)組LASSO算法,使其能夠從LBP直方圖中選擇出一個(gè)能夠同時(shí)辨別所有類(lèi)的稀疏表示的特征組。最后,通過(guò)支持向量機(jī)(SVM)進(jìn)行人臉識(shí)別。實(shí)驗(yàn)結(jié)果表明,提出的方法能夠?qū)o(wú)約束性視頻序列中人臉進(jìn)行準(zhǔn)確識(shí)別。
人臉識(shí)別;多類(lèi)組LASSO;局部二值模式 ;稀疏表示
人臉因其在侵?jǐn)_性、精度、成本和易于感知方面超越其他生物特征,從而成為一種廣泛接受的有效生物特征指標(biāo)。隨著生物識(shí)別技術(shù)的飛速發(fā)展,人臉識(shí)別(Face Recognition, FR)及其在生物特征識(shí)別、模式識(shí)別和計(jì)算機(jī)視覺(jué)上的應(yīng)用成為研究的熱點(diǎn)[1]。盡管許多人臉識(shí)別算法能在約束環(huán)境下取得良好的識(shí)別效果,但在實(shí)際應(yīng)用中,人臉圖像的不同光照條件、面部表情、頭部姿態(tài)對(duì)識(shí)別性能具有顯著的影響[2]。其中,無(wú)約束姿態(tài)變化人臉識(shí)別是最具挑戰(zhàn)性的任務(wù)。目前,大量研究者對(duì)可控條件下的特殊人臉識(shí)別進(jìn)行了研究,但是,在亮度和表情變化的情況下,進(jìn)行姿態(tài)變化的人臉識(shí)別十分困難[3]。
近期,學(xué)者已經(jīng)提出了一些用于姿態(tài)變化的人臉識(shí)別方法,文獻(xiàn)[4]提出一種基于尺度不變特征融合(FSIF)的識(shí)別方法,利用尺度不變特征轉(zhuǎn)換算法提取尺度不變特征,一定程度能夠解決姿態(tài)變化的影響。文獻(xiàn)[5]提出一種基于局部二元模式(ocal binary pattern,LBP)與統(tǒng)計(jì)學(xué)習(xí)算法的人臉識(shí)別方法,其首先將圖像分成64個(gè)8×8的塊,然后為每個(gè)塊計(jì)算LBP,最后通過(guò)線性判別分析來(lái)減少特征維度。然而,該方法的誤差率容易受LBP高靈敏度的噪聲和次要姿勢(shì)變化的影響。文獻(xiàn)[6]提出一種基于稀疏字典矩陣(SDM)框架的姿態(tài)不變?nèi)四樧R(shí)別方法,采用了局部二值模式(LBP)和稀疏表示分類(lèi)算法。該方法具有較高的姿態(tài)變化人臉識(shí)別率,但是其在構(gòu)建稀疏字典矩陣時(shí)不能獲得有限且穩(wěn)定的最稀疏解。
最小絕對(duì)收縮和選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO)[7]算法能夠從表情圖像中獲得基函數(shù)集特征子空間的稀疏表示,但傳統(tǒng)LASSO無(wú)法解決多類(lèi)特征選擇問(wèn)題。為此,本文對(duì)傳統(tǒng)LASSO進(jìn)行改進(jìn),提出了多類(lèi)組LASSO算法,并以此提出一種基于局部二值模式和多類(lèi)組LASSO算法的人臉識(shí)別方案。實(shí)驗(yàn)結(jié)果表明,本文方案在不同的視頻數(shù)據(jù)集中都具有較高的正確識(shí)別率。
1.1 正則化稀疏編碼
稀疏編碼模型認(rèn)為,某種類(lèi)別中的每幅圖像都可以看成是多個(gè)基函數(shù)的線性組合,當(dāng)把該圖像投影到由這些基函數(shù)形成的特征子空間上時(shí),只在一小部分基函數(shù)上的投影權(quán)值較大,在大部分基函數(shù)上投影值很小或?yàn)榱悖瑥亩纬蓪?duì)該圖像的稀疏表示。
公式(2)中,第一項(xiàng)為一個(gè)數(shù)值保真項(xiàng),第二項(xiàng)為懲罰項(xiàng)。
1.2 多類(lèi)組LASSO算法
最小絕對(duì)收縮和選擇算子(LASSO)算法能夠促使被選擇出來(lái)的特征盡可能稀疏,以保證結(jié)果穩(wěn)定性和提高數(shù)據(jù)處理過(guò)程的可解釋性。由此,出現(xiàn)了不少以LASSO 為基礎(chǔ)的特征選擇算法,并應(yīng)用于人臉識(shí)別中。
本文中,Tikhonov懲罰項(xiàng)保證了一個(gè)穩(wěn)定的解β*,在這個(gè)解里,所有的組項(xiàng)都不等于零。反之,如果L1懲罰點(diǎn)被包含在公式內(nèi),那么就能獲得一種稀疏解,以此提供最有效的特征選擇如公式(3):
這兩種懲罰項(xiàng)的結(jié)合被稱(chēng)為彈性網(wǎng)絡(luò)。稀疏項(xiàng)由參數(shù)τ控制,能計(jì)算出與非零稀疏相關(guān)的特征數(shù)。而L1恢復(fù)函數(shù)的凸性用來(lái)保證一個(gè)唯一的解。在這個(gè)案例中,關(guān)聯(lián)的特征組全都出現(xiàn)在解里。最特別的一點(diǎn)是當(dāng)μ=0(所謂的LASSO估計(jì))時(shí),并不能提供一個(gè)嚴(yán)謹(jǐn)?shù)耐购瘮?shù)。而且會(huì)產(chǎn)生不同的解。在實(shí)際運(yùn)用中,一個(gè)純L1范數(shù)保證了稀疏解的可能性。因此如果需要一個(gè)壓縮表示,則應(yīng)選擇上述方法。
傳統(tǒng)LASSO方法對(duì)所有特征逐一進(jìn)行選擇,忽略了特征之間相關(guān)性。為此,產(chǎn)生了組LASSO(Group LASSO)算法。這是一種彈性網(wǎng)絡(luò)在選擇特征組方面的延伸,使得組間盡可能稀疏,而組內(nèi)保持盡可能小的損失誤差。其優(yōu)化了輸入數(shù)據(jù)結(jié)構(gòu),在特征選擇的步驟中可插入了這個(gè)過(guò)程。這種算法可以表達(dá)成正則最小化問(wèn)題,如如公式(4):
上式中,g=1,...,G為一個(gè)特征組的指數(shù),而Ig?[1...p]為輸入數(shù)據(jù)中特征組g的位置集合。在這里,利用懲罰項(xiàng)在群組中選擇特征。然后,將規(guī)則化參數(shù)τ調(diào)整為不同稀疏度的解。
為了解決多類(lèi)特征選擇問(wèn)題,本文提出一種新的LASSO表達(dá)式,即多類(lèi)組LASSO(Multi-Class Group LASSO, MC-Group LASSO)算法,改進(jìn)公式(4)來(lái)為一個(gè)多分類(lèi)問(wèn)題同時(shí)選擇特征組。對(duì)于N個(gè)二值問(wèn)題與上面問(wèn)題相似的是:φ為位數(shù)n×p的特征矩陣,為輸出向量,為c的權(quán)重向量。因此MC-Group LASSO方法的公式為公式(5):
1.3 特征選擇
為了找到公式(5)優(yōu)化問(wèn)題的解,本文運(yùn)用一種迭代方法來(lái)計(jì)算多類(lèi)問(wèn)題,公式如公式(6):
公式(6)中,σ為迭代步驟數(shù),用來(lái)按比例設(shè)置矩陣φΤφ的最大特征值,從而使公式(5)解具有最優(yōu)收斂性。S為對(duì)所有特征組上的軟閾值如公式(7):
迭代過(guò)程還可以用一個(gè)空矩陣B0進(jìn)行初始化,一旦有一個(gè)解B,則選擇相關(guān)行中沒(méi)有0值的域,用這種方法能夠在所有N類(lèi)中選擇有效特征。
2.1 臉部特征選擇
本文首先采用LBP描述相符的過(guò)完備字典來(lái)提取臉部特征??紤]到重疊區(qū)域具有不同比例和寬高比,所以將圖像都重新調(diào)整到40×40像素。然后提取統(tǒng)一的8比特LBP,并量化這些值到59級(jí)直方圖,如圖1所示:
圖1 本文方法的人臉圖像處理流程
圖1描述了在簡(jiǎn)單場(chǎng)景(沒(méi)有重疊范圍)下獲得一個(gè)特征向量的過(guò)程。最終,過(guò)完備字典描述由841個(gè)局部二值模式組成。所以,每個(gè)訓(xùn)練圖像Xi由841×59=49 619個(gè)特征描述(特征矩陣φ的個(gè)數(shù))。由于數(shù)值矩陣φ需要進(jìn)行標(biāo)準(zhǔn)化,因此,每一列都有空值和一致的方差。
2.2 人臉識(shí)別
一旦發(fā)現(xiàn)多類(lèi)問(wèn)題的一個(gè)有效稀疏表示,本文將提取的特征作為輸入,基于支持向量機(jī)(SVM)和贏家通吃策略來(lái)訓(xùn)練一個(gè)多類(lèi)分類(lèi)器。注意,可以直接通過(guò) MC-Group LASSO的解來(lái)分類(lèi)數(shù)據(jù)。但由SVM獲得的性能通常較高,因此,本文訓(xùn)練N個(gè)一對(duì)多的二進(jìn)制SVM分類(lèi)器,其中所有Xi圖像都通過(guò)映射到所選擇的子集來(lái)表示,映射公式為
3.1 數(shù)據(jù)集
在3個(gè)不同的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),分別為兩個(gè)室外數(shù)據(jù)集:MOBO和Choke Point,一個(gè)室內(nèi)數(shù)據(jù)集:R309。MOBO數(shù)據(jù)集由20個(gè)目標(biāo)的低分辨率視頻組成,主要包含4個(gè)不同動(dòng)作。MOBO數(shù)據(jù)集具有微小的照明和個(gè)體姿勢(shì)的變化。Choke Point數(shù)據(jù)集為一個(gè)具有更高可變圖像質(zhì)量和外觀的視頻集,其包含了兩個(gè)門(mén)間行走的29個(gè)目標(biāo)視頻,這些視頻由一排3個(gè)照相機(jī)獲得。R309數(shù)據(jù)集是一個(gè)不同照明和室內(nèi)環(huán)境下獲得的視頻集。其中,目標(biāo)的動(dòng)作和行為完全不受限制且非常自然,如圖2所示:
圖2 R309數(shù)據(jù)集中不同姿態(tài)和光照的人臉圖像
R309包含了12個(gè)人,平均每人有1 200張相片。
將每個(gè)數(shù)據(jù)集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集三個(gè)部分。驗(yàn)證集用來(lái)調(diào)整正則化參數(shù)。
3.2 人臉識(shí)別實(shí)驗(yàn)
在MOBO數(shù)據(jù)集中,從5個(gè)視頻里提取1 000張圖像,每個(gè)人50張,構(gòu)成訓(xùn)練集。同樣,每個(gè)人提取200張圖像作為測(cè)試集,即測(cè)試集大小為4 000。
將局部二值模式(LBP)與各種LASSO特征提取算法相結(jié)合,提取圖像特征進(jìn)行人臉識(shí)別所獲得的性能,如表2所示:
表1 在MOBO數(shù)據(jù)集上的對(duì)比分析
其中設(shè)定2個(gè)性能指標(biāo),真陽(yáng)性率(TPR)和假陽(yáng)性率(FPR)。可能觀察到本文MC-Group LASSO+LBP所需的特征維數(shù)最少,卻獲得了最好的性能,正確識(shí)別率接近97%。
在R309數(shù)據(jù)中,LBP+各種LASSO算法的性能,如表2所示:
表2 在R309數(shù)據(jù)集上的對(duì)比分析
同樣,本文MC-Group LASSO+LBP算法獲得了最優(yōu)性能。另外,由于R309數(shù)據(jù)集中的圖像存在較復(fù)雜的光照和環(huán)境變化,所以識(shí)別率比MOBO數(shù)據(jù)集要低,但本文算法識(shí)別率依然達(dá)到了82%以上。
在Choke Point數(shù)據(jù)集中,將本文算法與文獻(xiàn)[6]算法進(jìn)行比較,結(jié)果如表3所示:
表3 在Choke Point數(shù)據(jù)集上的對(duì)比分析。
結(jié)果表明,本文算法獲得了最優(yōu)性能,盡管Choke Point數(shù)據(jù)集圖像具有外觀和關(guān)照變化,但本文算法能夠很好的壓縮表示47個(gè)特征,并獲得了92%的識(shí)別率。
針對(duì)傳統(tǒng)LASSO算法不能很好應(yīng)用于人臉識(shí)別,提出了一種改進(jìn)型LASSO算法:多類(lèi)組LASSO,使其能夠在多類(lèi)情況下進(jìn)行特征選擇。本文首先利用 LBP將人臉圖像構(gòu)建成一個(gè)完備字典,然后利用提出的多類(lèi)組LASSO提取特征組,最終實(shí)現(xiàn)人臉識(shí)別。在不同的數(shù)據(jù)集中進(jìn)行實(shí)驗(yàn),并與其它LASSO算法、現(xiàn)有文獻(xiàn)算法進(jìn)行對(duì)比,結(jié)果表明,本文方案具有最高的識(shí)別率。
[1] 王芳, 盛衛(wèi)星, 馬曉峰,等. 基于Gabor幅值特征和相位特征相融合的 ISAR像目標(biāo)識(shí)別[J]. 電子與信息學(xué)報(bào), 2013, 35(8):1813-1819.
[2] 周旭東, 陳曉紅, 陳松燦. 半配對(duì)半監(jiān)督場(chǎng)景下的低分辨率人臉識(shí)別[J]. 計(jì)算機(jī)研究與發(fā)展, 2012, 49(11): 2328-2333
[3] 周凱汀, 鄭力新. 基于改進(jìn)ORB特征的多姿態(tài)人臉識(shí)別[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2015, 27(2):287-295.
[4] 李根, 李文輝. 基于尺度不變特征變換的平面旋轉(zhuǎn)人臉檢測(cè)[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2013, 43(1):186-191.
[5] Cao X, Shen W, Yu L G, et al. Illumination invariant extraction for face recognition using neighboring wavelet coefficients[J]. Pattern Recognition, 2012, 45(4):1299-1305.
[6] Moeini A, Moeini H, Faez K. Unrestricted Pose-Invariant Face Recognition by Sparse Dictionary Matrix[J]. Image & Vision Computing, 2015, 36(7):9-22.
[7] 楊律, 丁守鴻, 謝志峰,等. Lasso整臉形狀回歸的人臉配準(zhǔn)算法[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào), 2015, 27(7):1313-1319.
[8] Zeng J. An Improved Sparse Representation Face Recognition Algorithm for Variations of Illumination and Pose[J]. Journal of Information & Computational Science, 2015, 12(16):5987-5994.
[9] John W, Yang A Y, Arvind G, et al. Robust Face Recognition via Adaptive Sparse Representation[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 44(12):2368-2378.
[10] 商俊國(guó), 焦斌亮. 多幀圖像的 Tikhonov正則化重建算法研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2011, 28(2): 785-787.
Face Recognition Method Based on Local Binary Pattern and Multi-Class Group LASSO Algorithm
Bu Yu1, Liu Junxia2, Tang Xuejun1
(1. Department of Computer Engineering, Xinjiang Institute of Engineering, Urumqi 830052, China; 2. Department of Electrical and Information, Xinjiang Institute of Engineering, Urumqi 830023, China)
For the issues of the face recognition problem in video sequences, a face recognition scheme based on local binary pattern (LBP) and multi-class group LASSO algorithm is proposed. Firstly, the face region is divided into several regions, and each region is calculated by its super complete local binary pattern histogram. Secondly, the traditional least absolute shrinkage and selection operator (LASSO) is improved to form a multi-class group LASSO algorithm, so that it can select feature group which can identify all classes from the LBP histogram. Finally, face recognition is performed by support vector machine (SVM). Experimental results show that the proposed scheme can accurately identify the human face in an unconstrained video sequence.
Face Recognition; Multi-class Group Lasso; Local Binary Pattern; Sparse Representation
TP311
A
1007-757X(2016)09-0015-03
2016.01.12)
新疆維吾爾自治區(qū)高??蒲杏?jì)劃青年教師科研啟動(dòng)基金項(xiàng)目(No.XJEDU2014S074)
卜宇(1981-),女(漢),新疆人,新疆工程學(xué)院,計(jì)算機(jī)工程系,講師,碩士,研究方向:圖像處理、模式識(shí)別等,烏魯木齊 830052劉俊霞(1980-),女(漢),新疆人,新疆工程學(xué)院,電氣與信息工程系,講師,碩士,研究方向:圖像處理、通信網(wǎng)絡(luò)規(guī)劃與建模等,烏魯木齊 830023唐學(xué)軍(1969-),女(漢),湖南人,新疆工程學(xué)院,計(jì)算機(jī)工程系,高級(jí)實(shí)驗(yàn)師,本科,研究方向:圖像處理、智能算法等,烏魯木齊 830052