謝奕樊 山東師范大學(xué)附屬中學(xué)(幸福柳)
19世紀80年代末,在《Nature》上Galton第一次系統(tǒng)介紹了人臉識別,是已知的最早的關(guān)于人臉識別的文章。然而,人臉識別技術(shù)經(jīng)過100多年的發(fā)展,在20世紀80年代后進入才初級應(yīng)用階段。隨后,特別是近十幾年,人臉識別技術(shù)進入蓬勃發(fā)展期,目前在身份識別、門禁、偵查等方面有著廣泛而重要的應(yīng)用。
圖1 Web of science人臉識別每年發(fā)表文章
在Web of science上,對人臉識別進行文獻檢索,檢索結(jié)果如圖1所示,可以看到計算機領(lǐng)域人臉識別每年發(fā)表的文章數(shù)目逐年遞增,有越來越多的人進行相關(guān)研究,是研究的熱門領(lǐng)域。
圖2 據(jù)根據(jù)IBG發(fā)布的全球生物識別市場規(guī)模推算資料(IBG前瞻產(chǎn)業(yè)研究院整理)
人臉識別的市場:根據(jù)公開文獻資料,2009-2016年全球人臉識別行業(yè)市場規(guī)模發(fā)展趨勢(單位:百萬美元) 如圖2所示,可以看到人臉識別市場份額由2009年390億增長到2016年2653億,增長為原來6倍之多,市場份額越來愈大,具有很大的應(yīng)用前景。
圖3是人臉的識別的過程,包含圖像獲取,預(yù)處理,特征提取,分類識別等四步。
圖3 人臉識別的過程
此類方法,將一張臉像表達為一個像素矩陣,這個矩陣通常被轉(zhuǎn)換成像素矢量。盡管這些方法很容易實現(xiàn),但是它們對變化(姿勢、燈光、面部表情和方向)很敏感,影響識別的準確率。將該類技術(shù)可以進一步劃分為線性和非線性的技術(shù)。
3.1.1 線性技術(shù)
這些方法將輸入的一個大空間圖像數(shù)據(jù)線性投影到一個區(qū)域相對較小的空間(子空間)。然而,該方法對臉部/非臉部形態(tài)進行分類時,并不是很有效。
特征臉算法:這是一種非常流行的面部識別方法,是基于PCA的技術(shù)(主成分分析)。給定一組樣本圖像,本質(zhì)上是找到這些面孔的主要組成部分,確定協(xié)方差矩陣的特征向量,然后將其描述為特征向量的線性組合。
2D PCA:為了避免將圖像轉(zhuǎn)換為向量時丟失信息,二維PCA接受的是輸入圖像而不是矢量。
獨立元分析法(ICA):這是一種主要用于信號處理的方法。
多維標度法(MDS):該方法在投影中并不保存數(shù)據(jù)的方差,而是保存所有數(shù)據(jù)之間的距離,進而通過特征值分解尋找一個最小化的線性變換。
非負矩陣分解法(NMF):非負矩陣分解是一種不使用類概念表示面的方法。NMF在基向量組合權(quán)重中不允許包含負元素。
線性判別分析法(LDA):LDA,也叫做“Fisher線性判別”,是最廣泛使用的人臉識別方法之一。包括兩步:PCA減小原始空間和得到最終投影空間的向量。
獨立高強Gabor小波法:從正面圖像的Gabor小波變換中提取出高強度特征向量以提高人臉識別精度。Gabor小波被認為是最好的人臉識別方法之一。
3.1.2 非線性技術(shù)
當(dāng)輸入數(shù)據(jù)結(jié)構(gòu)是線性時,線性方法可以得到數(shù)據(jù)稀疏的真實表達。然而,當(dāng)數(shù)據(jù)是非線性的,需使用核函數(shù)的來構(gòu)建一個大的空間,在這個空間中,將問題變成線性的。在此背景下,提出了幾種非線性方法:
核主成分分析(KPCA):KPCA是使用核函數(shù)對經(jīng)典的線性技術(shù)PCA進行非線性重構(gòu)。由于KPCA技術(shù)是基于“內(nèi)核”的,內(nèi)核矩陣的大小與樣本數(shù)量的平方成正比,因此訓(xùn)練樣本困難。
支持向量機(SVM):該方法在不需要更多知識的情況下,具有高泛化性能識別的學(xué)習(xí)技術(shù),可以更好地減少圖像的大小。然而,盡管該方法經(jīng)常在某些特定的測試中提高識別率,但是卻無法像線性方法一樣保持足夠的可靠性。
該方法首先提取特定的幾何特征,比如頭部的寬度,眼睛之間的距離等等。然后,這些數(shù)據(jù)將成為“分類器”識別個體的入口。
彈性圖匹配法(EBGM):這是DLA方法的擴展,其圖像節(jié)點位于臉部的一些選定點上。
幾何特征向量法:該技術(shù)使用訓(xùn)練集來檢測眼睛的位置,首先計算待測圖像和訓(xùn)練集之間的相關(guān)系數(shù),然后搜索得到最大值。
人臉統(tǒng)計模型法:該方法使用許多特定檢測器去檢測人臉各部分特征,如眼睛,鼻子,嘴巴等。
該類技術(shù),在局部區(qū)域定義好后,對于人臉識別系統(tǒng)的性能是至關(guān)重要的就是找到代表該區(qū)域信息的最佳方式。常用的方法有:Gabor系數(shù)法,哈兒小波法,傅里葉變換法,尺度不變特征變換法(SIFT),局部二值模式法(LBP),局部相位量化法(LPQ),韋伯定律描述符(WLD)等。
與全局方法相比,局部方法具有一定的優(yōu)勢。一是可以提供基于局部區(qū)域的附加信息,二是對于每種類型的局部特征,可以選擇最合適的分類器。
該方法同時使用全局和局部統(tǒng)計以結(jié)合二者的優(yōu)勢。
隱馬爾可夫模型(HMM):在人臉識別中,該方法對于重要的面部區(qū)域(頭發(fā)、前額、眉毛、眼睛、鼻子、嘴和下巴),會從上到下排列成自然的順序。
基于偽隱馬爾可夫模型的Gabor變換(GWT-PHMM):該方法可以結(jié)合Gabor小波變換(GWT)的多分辨率能力和偽隱藏馬爾科夫模型的局部交互二者的優(yōu)勢。
在HMM使用PCA和離散余弦變換(DCT)的識別系統(tǒng):不使用DCT,直接使用PCA降低維度。
HMM-LBP:這是一種被稱為HMM-LBP的混合方法,允許通過使用LBP工具對人臉圖像進行來進行特征提取。
此外,還有GARG(高斯分布黎曼流形判別分析),HMMSVM-SVD,SIFT-2D-PCA,小波變換和定向LBP等方法可以實現(xiàn)人臉識別。
盡管在人臉識別領(lǐng)域取得了很高的成功率,但仍然存在兩個主要的未解決的問題,即照明和姿勢的變化。為了克服這兩個問題,提供更精確的面部形狀信息,出現(xiàn)了更多新技術(shù),例如3D人臉識別,深層神經(jīng)網(wǎng)絡(luò)(DNNs),紅外(IR)成像等都取得了重大成功。在未來,人臉識別的難點,諸如數(shù)據(jù)采集免干擾、遠距離識別、3D細節(jié)構(gòu)建、環(huán)境設(shè)別光照、多姿態(tài)人臉識別、表情變化、人的老化、飾物或者遮擋、膚色變化等也必然被進一步克服。