黃 超,薄 華
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)合SVM的人臉識別研究
黃 超,薄 華
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
提出了卷積神經(jīng)網(wǎng)絡(luò)與支持向量機結(jié)合的方法運用于遮擋人臉識別。通過卷積神經(jīng)網(wǎng)絡(luò)的卷積、下采樣和Softmax的特征提取處理,由支持向量機完成后續(xù)的訓(xùn)練和識別。利用AR人臉庫進(jìn)行實驗,并和傳統(tǒng)的人臉識別方法進(jìn)行比較分析,實驗結(jié)果表明本文的方法有更高的識別率。
卷積神經(jīng)網(wǎng)絡(luò);支持向量機;人臉識別
隨著科學(xué)技術(shù)的發(fā)展,機器人的應(yīng)用越來越廣泛,人機交互也變得十分重要。人臉識別作為生物特征識別(虹膜識別、指紋識別、掌紋識別等)技術(shù)之一,由于具有成本低、用戶易接受、可靠性高等優(yōu)點,在身份認(rèn)證、安防監(jiān)控、人機交互等領(lǐng)域具有廣泛的應(yīng)用前景。目前對于人臉識別的技術(shù)已經(jīng)展開了很多研究工作[1]。
過去許多年來,研究者們提出了很多人臉識別的算法,主要是提取人臉特征,特征提取在人臉識別中起到了關(guān)鍵的作用,影響著系統(tǒng)識別人臉的識別率。人臉識別方法有幾何特征的方法、相關(guān)匹配的方法、子空間方法和統(tǒng)計識別的方法等[2]。近幾年來應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別非常流行,尤其是卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)對圖像識別有很強的優(yōu)勢,支持向量機有很好的分類效果,在人臉識別中也被廣泛的運用[3]。
本文方法結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和支持向量機對人臉進(jìn)行識別。首先,對人臉圖像進(jìn)行卷積和下采樣處理,處理后由支持向量機分類識別,最后使用AR人臉數(shù)據(jù)庫進(jìn)行驗證,識別出200張有遮擋的人臉圖片。
卷積神經(jīng)網(wǎng)絡(luò)是一類特殊的多層神經(jīng)網(wǎng)絡(luò),與其他的神經(jīng)網(wǎng)絡(luò)一樣是用BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行訓(xùn)練,只是用在卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)有點不同。卷積神經(jīng)網(wǎng)絡(luò)可以直接識別視覺圖像,它進(jìn)行像素圖像的預(yù)處理,并具有魯棒性和簡單的幾何變換。卷積網(wǎng)絡(luò)識別圖像的傳統(tǒng)步驟如圖1所示。通過將圖像輸入CNN網(wǎng)絡(luò),訓(xùn)練后,再分類識別得出結(jié)果。
圖1 CNN識別圖像的傳統(tǒng)步驟
卷積神經(jīng)網(wǎng)絡(luò)經(jīng)典結(jié)構(gòu)是LeNet-5。如圖2所示。LeNet-5是LeCun提出的一個應(yīng)用在手寫數(shù)字識別的神經(jīng)網(wǎng)絡(luò)。如圖,其中處理層包含卷積層C1和C3,中間靠兩個下采樣層S2和S4連接,最后是輸出層。
圖2 LeNet-5經(jīng)典結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)
卷積層的每一個特征圖是之前的特征圖通過卷積核與濾波卷積和的結(jié)果,再增加偏置項應(yīng)用于非線性函數(shù)。輸入的特征圖的值如式(1)所示,通過訓(xùn)練調(diào)整k和b的值,找到最好的,再用已經(jīng)訓(xùn)練好的特征圖來識別其他的圖片[4]。
(1)
其中,f(·)為激活函數(shù),一般為sigmoid或者tanh;b為偏置項。上一層圖的大小為m×m,卷積核為n×n,卷積后的圖大小為(m-n+1)×(m-n+1)。
下采樣是為了達(dá)到空間不變性,通過采用減少特征圖的方法來對上一層特征圖降維,下采樣的形式如式(2)[5]:
(2)
其中down(·)為下采樣函數(shù),類似于卷積;β為乘性偏置;b為加性偏置。特征圖像在維度上進(jìn)行了縮小,用n×n大小的窗口進(jìn)行采樣,最后縮小的圖像為(m/n)×(m/n)。
支持向量機是AT&TBell 實驗室的V.Vapnik等人在1995年提出的算法。支持向量機用于二分類尋找特征空間上的間隔最大的線性分類器。其原理示意如圖3所示[6]。
圖3 SVM原理示意圖
本文使用的SVM是臺灣林智仁(Lin Chih-Jen)教授開發(fā)設(shè)計的MATLAB版LIBSVM 3.22。LibSVM[7]大規(guī)模線性分類器,包含了單類支持向量機和用支持向量機實現(xiàn)多類分類的功能,還包含交叉驗證、用網(wǎng)格試算方法選擇核函數(shù)參數(shù)的功能[8]。
圖5 卷積神經(jīng)網(wǎng)絡(luò)加LibSVM工作流程
本文使用卷積神經(jīng)網(wǎng)絡(luò)和SVM結(jié)合的算法,如圖4所示。這樣的算法相比傳統(tǒng)的遮擋人臉識別算法在識別率上有所提高,在后面的實驗中將會驗證。本文算法其中包含有卷積神經(jīng)網(wǎng)絡(luò)的卷積層、池化層、全連接層和Softmax。本文使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類似于LeNet-5結(jié)構(gòu),其中分別有2個卷積層、2個下采樣層和1個全連接層,整個網(wǎng)絡(luò)中的卷積層和下采樣層交替運行,最后一個下采樣層與全連接層相連,全連接層再通過Softmax分類器到LibSVM,最后進(jìn)行訓(xùn)練和測試并輸出結(jié)果,具體結(jié)構(gòu)如圖5所示。
圖4 CNN結(jié)合LibSVM
本文的工作流程如下:
(1)樣本輸入卷積后生成卷積層1;
(2)卷積層1的圖片下采樣生成池化層1;
(3)重復(fù)上述過程生成卷積層2和池化層2;
(4)把池化層2的二維數(shù)據(jù)轉(zhuǎn)變?yōu)橐痪S,這一維為全連接層;
(5)全連接層數(shù)據(jù)傳給Softmax;
(6)最后由LibSVM訓(xùn)練以及分類識別測試圖像。
4.1 實驗設(shè)定
實驗使用的是AR人臉數(shù)據(jù)庫,如圖6所示為數(shù)據(jù)庫中的1個人的26張不同狀態(tài)的人臉。人臉庫中有100個不同的人臉,有分男和女,有遮擋眼睛和嘴巴,有不同光照角度等不同狀態(tài)。每個人臉有26張不同狀態(tài)的圖,總共2 600張,本文把每個人臉中的24張為訓(xùn)練圖和2張為測試圖,總共有2 400張訓(xùn)練圖和200張測試圖,其中2張測試圖為隨機1張眼睛遮擋和1張嘴巴遮擋。本文主要測試人臉遮擋情況下的人臉識別率。
圖6 AR人臉數(shù)據(jù)庫
實驗操作步驟:
(1)每張圖原圖為165×120,用MATLAB命令imresize設(shè)置圖片大小為28×28,然后歸一化處理。
(2)卷積神經(jīng)網(wǎng)絡(luò)的卷積核設(shè)置為5×5,采樣大小為2×2(平均值下采樣),經(jīng)過2次卷積和2次下采樣,最后輸出4×4的特征圖。然后使其為16×1的全連接輸入給Softmax。Softmax輸出結(jié)果輸入給LibSVM。
(3)LibSVM算法分類識別測試圖像,直接識別出200張人臉遮擋圖片分別為某人。
(4)進(jìn)行十折交叉驗證,6張眼睛遮擋和6張嘴巴遮擋每個挑選一個做測試樣本,剩下的都作為訓(xùn)練樣本,一共是6次。在無遮擋中挑選4次,總共進(jìn)行10次上述步驟,最后求出平均識別率。
卷積時使用的卷積核是卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練好k值和b值后的卷積核,其中不同的迭代次數(shù)有不同的k和b值,識別率也不同,本文用0.12的學(xué)習(xí)率,分別迭代80次、100次、200次、500次、1 000次和2 000次。
4.2 實驗結(jié)果
實驗結(jié)果如表1、表2所示。
表1 算法識別率比較
表2 CNN+SVM算法與其他算法識別率比較
4.3 實驗結(jié)論
本文提出用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合LibSVM來分類識別AR人臉數(shù)據(jù)庫的人臉,由表1結(jié)果可知,當(dāng)?shù)鷶?shù)增加,識別率也相應(yīng)地提高,當(dāng)?shù)螖?shù)增加到一定數(shù)值時,識別率提高效果不明顯。由表2比較其他算法卷積神經(jīng)網(wǎng)絡(luò)結(jié)合支持向量機在AR人臉識別率上也有一定的優(yōu)勢。對測試結(jié)果進(jìn)行分析可知,CNN結(jié)合LibSVM的算法對分類識別遮擋人臉有良好的效果,提高了一定的識別率,為遮擋人臉識別提供了一種新的方法。
人臉識別一直被廣泛的關(guān)注,主要在于它有著廣泛的應(yīng)用。從原來的特征提取結(jié)合SVM到現(xiàn)在的卷積神經(jīng)網(wǎng)絡(luò),其識別率一直在不斷地提高。后續(xù)可以通過對網(wǎng)絡(luò)的算法和訓(xùn)練的算法進(jìn)行改進(jìn),進(jìn)而增強人臉的識別。
[1] 陳海霞,崔茜.基于Gabor小波和PCA的人臉識別[J].東北師范大學(xué)報(自然科學(xué)版),2014,46(4):77-80.
[2] 祝秀萍,吳學(xué)毅,劉文峰. 人臉識別綜述與展望[J]. 計算機與信息技術(shù),2008(4):53-56.
[3] 舒雙寶,羅家融,徐從東,等. 一種基于支持向量機的人臉識別新方法[J]. 計算機仿真,2011,28(2):280-283.
[4] SYAFEEZA A R, KHALIL-HANI M, LIEW S S, et al. Convolutional neural network for face recognition with pose and illumination variation[J]. International Journal of Engineering & Technology,2014,6(1):44-57.
[5] LECUN Y, KAVUKCUOGLU K, FARABET C. Convolutional networks and applications in vision[C]. In Proceedings of the IEEE International Symposium on Circuits and Systems, Paris, France, 2010: 253-256.
[6] 王書舟,傘冶. 支持向量機的訓(xùn)練算法綜述[J]. 智能系統(tǒng)學(xué)報,2008,3(6):467-475.
[7] FAN R E, CHEN P H, LIN C J. Working set selection using second order information for training SVM[J]. Journal of Machine Learning Research, 2005,6(4):1889-1918.
[8] 張學(xué)工. 模式識別(第三版)[M]. 北京:清華大學(xué)出版社,2010.
[9] 張建明,周威,吳宏林. 基于Gabor特征和支持向量引導(dǎo)字典學(xué)習(xí)的人臉識別[J]. 計算機工程與應(yīng)用,2016,52(13): 177-182.
[10] YANG J, ZHANG D,FRANGI A F, et al. Two-dimensional PCA: a new approach to appearance-based face representation and recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004,26(1):131-137.
Study on face recognition based on CNN and SVM
Huang Chao, Bo Hua
(College of Information Engineering, Shanghai Maritime University, Shanghai 201306, China)
In this paper, a method combining convolution neural network and support vector machine is proposed for occluded face recognition. Through the convolution, deconvolution and Softmax feature extraction of convolution neural network, the training and recognition are completed by support vector machine. Experiments are carried out using AR face database and compared with traditional face recognition methods. Experimental results show that the proposed method has higher recognition rate.
convolution neural network; support vector machine; face recognition
TP391
A
10.19358/j.issn.1674- 7720.2017.15.016
黃超,薄華.基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)合SVM的人臉識別研究[J].微型機與應(yīng)用,2017,36(15):56-58,72.
2017-02-07)
黃超(1987-) ,男,碩士研究生,主要研究方向: 圖像處理與機器學(xué)習(xí)。
薄華(1971-) ,女,博士,碩士生導(dǎo)師,主要研究方向:遙感圖像處理、模式識別、人工智能。