霍春寶,楊 闖,佟智波,楊紅喆,王丹丹
(1.遼寧工業(yè)大學 電氣工程學院,遼寧 錦州 121001;2.錦州石化公司 礦區(qū)事業(yè)部,遼寧 錦州 121001;3.國網(wǎng)錦州供電公司 電力調(diào)度控制中心,遼寧 錦州 121001;4.上海應用技術(shù)大學 計算機科學與信息工程學院,上海 200235)
人臉識別技術(shù)與其他生物特征識別技術(shù)相比,具有不易偽造、不易竊取、不會遺忘、不會侵犯,易分辨等優(yōu)勢[1],因而人臉識別技術(shù)在各個領域中被廣泛采用,如銀行、醫(yī)院、機場等.近些年來,隨著智能技術(shù)的快速發(fā)展,人臉識別技術(shù)開始與其他技術(shù)結(jié)合,實現(xiàn)更強大功能,例如,與活體檢測相結(jié)合實現(xiàn)刷臉支付,與汽車的主控制系統(tǒng)相結(jié)合實現(xiàn)刷臉車啟動,為用戶提供全新智能體驗.
人臉識別系統(tǒng)[2]可以分為:檢測與定位,對圖像中是否存在人臉進行判斷并標記;圖像預處理,對圖像因外界因素影響導致的變化進行校正;特征提取,從高維圖像中提取可以很好表征人臉特征的低維度特征向量;匹配識別,通過某種分類策略判斷待識別人臉所屬類別.
本文依據(jù)光學字符識別(Optical Character Recognition,OCR)技術(shù)中特征提取算法所具有的優(yōu)勢,將傳統(tǒng)SIFT 人臉識別算法與LTP 算法結(jié)合,并進行改進,不僅增加特征對旋轉(zhuǎn)、光照、噪聲干擾等影響因素的魯棒性,還降低了計算的復雜度.
通過對OCR 技術(shù)的結(jié)構(gòu)特征研究分析,發(fā)現(xiàn)此類特征都是在字符關鍵點基礎上得到,常見的字符關鍵特征點包括拐點、交叉點、端點、局部曲率最大的點等.結(jié)構(gòu)特征不僅對相似字符有較好的識別能力,而且可以最大程度減少無識別作用的信息,以達到提高識別速度和識別率目的.
根據(jù)OCR 技術(shù)中結(jié)構(gòu)特征優(yōu)勢思想,采用尺度不變特征變換(Scale Invariant Feature Transform,SIFT)算法進行關鍵點定位.SIFT 算法是一種基于尺度空間的特征提取方法[3-4],提取出的關鍵點具有尺度、方向和大小,因此在偏移、旋轉(zhuǎn)、部分仿射變換的情況下,也能較好地進行識別,傳統(tǒng)SIFT算法工作流程見圖1.
圖1 SIFT 算法工作流程Fig.1 Workflow of SIFT algorithm
SIFT 算法的高斯金字塔[4-6]處理圖像,不僅能夠較好地描述物體的細節(jié)特征,還能保留整體的特征.
利用尺度可變高斯函數(shù)對原始圖像進行卷積運算,通過改變空間尺度參數(shù)可獲得不同模糊程度的圖像,公式為
式中,x,y為像素點,pixel;σ為模糊尺度;金字塔每組包含S層,若第1 層的尺度用σ0表示,則第n層的尺度為
式中,k為放大比例系數(shù),s為常數(shù)3.金字塔模型的整體呈塔狀,見圖2.
圖2 高斯金字塔結(jié)構(gòu)Fig.2 structure of Gauss pyramid
尺度規(guī)范化LoG(Laplacion of Gaussiom)算子具有尺度不變性,但運算復雜度高,所以采用高斯差分(Difference of Gaussian,DoG)算子進行近似.LoG 算子與尺度可變高斯函數(shù)之間的關系式為
DoG 算子的計算公式為
由式(6)可知,DoG 金字塔只需利用高斯金字塔中的圖像進行簡單相減即可得到.尋找某層的DoG 局部極值點,需要利用周圍的26 個像素點進行比較.
圖3 DoG 金字塔極值點檢測Fig.3 DoG pyramid extreme point detection
去除對比度較低和邊緣較敏感的極值點,只保留穩(wěn)定性較高的極值點作為關鍵點.邊緣敏感度利用了Hessian 矩陣進行判斷,對比度利用DoG 算子的二階Taylor 展開式
式中,γ越大表示主曲率越大,邊緣的可能性越大,若式(10)成立,則表示此點穩(wěn)定.
OCR 技術(shù)的網(wǎng)格特征[7-9]具有良好的抗干擾能力,其主要思想是將子區(qū)域中所有特征值累計求和,通過這種方式可以在一定程度上降低或消除局部噪聲和微小畸變對識別結(jié)果的影響.
依據(jù)網(wǎng)格特征的思想選擇采用旋轉(zhuǎn)無關的等價模式的LTP 特征,這是一種能夠描述局部紋理的特征,對灰度變化、旋轉(zhuǎn)和噪聲都具有良好的魯棒性,且計算速度快.本文特征在關鍵點為中心的9×9 區(qū)域中提取,見圖4.
圖4 LTP 的特征提取區(qū)域Fig.4 feature extraction area of LTP
局部三值模式(Local Ternary Pattern,LTP)算法[10-11]是在局部二值(Local Binary Pattern,LBP)算法的基礎上提出,在繼承LBP 特征優(yōu)點的同時,還改善了對噪聲的敏感度,提取更加豐富的局部紋理信息.三值量化函數(shù)為
式中,x i和xc分別為鄰域像素點和中心像素點的灰度值.LTP 的編碼公式為
式中,P為鄰域像素點的個數(shù);R為采樣區(qū)域的半徑.將三值圖像分解為ULTP 和LLTP 這2 個LBP 圖像,分別計算特征值,計算過程見圖5.
圖5 LTP 特征值的計算過程Fig.5 calculation process of LTP eigenvalue
LTP 特征值的種類會隨著采樣點的增加而增多,易出現(xiàn)維數(shù)災難.為降低特征維數(shù)并提高旋轉(zhuǎn)無關性,需要進行旋轉(zhuǎn)無關和等價模式處理.旋轉(zhuǎn)不變處理的主要思想是首先將編碼不斷地按位進行旋轉(zhuǎn),得到一組大小不同的數(shù)值,并從中選擇最小的值作為該點特征值,見圖6.
圖6 LTP 特征值的計算過程Fig.6 calculation process of LTP eigenvalue
旋轉(zhuǎn)無關的計算公式為
式中,P和R分別為采樣點的個數(shù)和采樣區(qū)域的半徑.等價模式是將小于等于2 次跳變的編碼歸為等價模式中的一類,其余的歸為另一類.經(jīng)過等價模式處理的特征能夠在保留原始圖像主要信息的同時,實現(xiàn)有效地降維.等價模式的計算公式為
式中,g0,gc分別中心像素點和鄰域像素點.經(jīng)過旋轉(zhuǎn)無關和等價模式處理的特征值從256 種減少為9種.并在3×3 的子區(qū)域中統(tǒng)計LTP 特征值,可得到3×3×9 的特征,表示為
式中,hi(i=1,2,…,9)為子區(qū)域的LTP 特征向量.
本文提取的旋轉(zhuǎn)無關和等價模式下的LTP 特征在SIFT 關鍵點的基礎上得到,能較好處理識別中的臉部變化問題.人臉識別算法整體結(jié)構(gòu)見圖7.
圖7 人臉識別算法整體結(jié)構(gòu)Fig.7 overall structure of the face recognition algorithm
傳統(tǒng)的SIFT 人臉識別算法使用的交叉匹配方式,不僅運算量大,而且會出現(xiàn)無關特征之間的匹配,對識別結(jié)果造成不利的影響.為了實現(xiàn)對應匹配,并弱化易受影響區(qū)域?qū)φw識別率的影響,本文采用非均勻網(wǎng)格的方式對圖像進行劃分.
通過研究可知大多數(shù)關鍵點分布在五官區(qū)域,見圖8.
圖8 SIFT 關鍵點的分布Fig.8 distribution of sift key points
采用以雙眼的內(nèi)眼角作為垂直方向劃分的依據(jù),以“三庭五眼”先驗知識作為水平方向劃分的依據(jù),將圖像劃分為3×3,見圖9.
圖9 非均勻網(wǎng)格Fig.9 non-uniform grid
根據(jù)特征所屬的網(wǎng)格進行對應的匹配,并賦予不同的權(quán)值,通過加權(quán)方式計算整體相似度,弱化易受影響區(qū)域?qū)ψR別準確性的影響.整體相似度的計算公式為
式中,si為第i個子網(wǎng)格識別率,%;wi為第i個子網(wǎng)格權(quán)重.
人臉數(shù)據(jù)庫中包含姿態(tài)、光照、偏轉(zhuǎn)等影響因素下的人臉圖像,保證實驗結(jié)果的穩(wěn)定性和客觀性.研究分析可知額頭區(qū)域存在的關鍵點較少,識別能力較弱,所以將標號為0、1、2 的子網(wǎng)格看作一個整體進行識別實驗,其他子網(wǎng)格則按照劃分的情況進行實驗,結(jié)果見表1.
表1 人臉子區(qū)域的置信度與權(quán)重Tab.1 confidence and weight of face sub-regions
人臉庫中選取4 種典型的姿態(tài)變化圖像,包括左右偏轉(zhuǎn)、上揚頭、下低頭和部分遮擋,部分測試樣本見圖10(a),同時選取不同光照情況下的人臉圖像,部分圖像見圖10(b),驗證本文人臉識別算法對姿態(tài)變化、部分遮擋和光照變化情況的魯棒性.本次實驗的識別率結(jié)果見表2.
表2 非理環(huán)境下的人臉識別率Tab.2 face recognition rates in unreasonable environment
圖10 人臉庫部分測試樣本Fig.10 some test samples of face library
為保證實驗的客觀性,本次對比實驗從人臉庫中隨機地選取200 張圖像用于算法的識別率驗證,每組重復10 次實驗,取平均值作為識別結(jié)果,對比見表3.
表3 人臉識別算法的對比實驗結(jié)果Tab.3 comparative experimental results of face recognition algorithms
由表2 和表3 中的實驗結(jié)果可知,本文改進的SIFT 識別算法不僅提高了識別率,還較大程度地降低了識別過程所消耗的時間,同時對于姿態(tài)變化、部分遮擋和光照變化等非理想的人臉圖像也有較好的識別率.
實驗結(jié)果表明,改進的人臉識別算法具有較好的識別率和識別速度:
(1)降低基于SIFT 關鍵點的人臉特征維數(shù);
(2)減少不同子區(qū)域間交叉匹配的復雜度;
(3)通過LTP 算法對人臉特征進行描述,增加了特征對姿態(tài)變化、噪聲干擾以及光照變化的穩(wěn)定性.