唐邦杰, 封 筠
(石家莊鐵道大學(xué)信息科學(xué)與技術(shù)學(xué)院,河北石家莊050043)
作為一種被逐漸關(guān)注的生物識別特征體,人耳具有穩(wěn)定性,獨特性和較高的用戶可接受性等優(yōu)點。人耳識別技術(shù)的研究與探索,將對生物特征識別技術(shù)的發(fā)展起到推動和促進作用,具有很高的理論研究與應(yīng)用價值。在人耳特征提取的研究中,Victor等將在人臉識別中較流行的標準主分量分析(Principal Component Analysis,PCA)方法應(yīng)用于人耳識別,得到特征耳,并將人耳識別性能與人臉識別性能進行對比[1];Burge和Burger提出了使用Voronoi圖表的鄰接圖匹配方法[2];Hurley等模仿自然界的電磁力場過程,提出了一種基于力場轉(zhuǎn)換理論方法的人耳識別[3];Michal提出了一種幾何學(xué)的提取人耳輪廓質(zhì)心特征點的人耳識別方法[4];穆志純等提出了基于長軸的形狀特征提取方法[5];封筠等提出了一種基于局部二值模式與核Fisher判別分析的人耳識別方案[6];梁曉霞等提出了一種基于Gabor變換和灰度梯度共生矩陣的人耳身份識別方法[7];Hui Chen等使用距離傳感器直接獲取人耳3D圖像數(shù)據(jù),提出基于3D人耳檢測識別方法[8]。
Kirby M等人早在1990年就將主分量分析應(yīng)用于人臉識別[9],Turk M和Pentland A在Kirby的基礎(chǔ)上將主分量分析發(fā)展成特征臉(Eigenface)算法用于人臉識別[10]。傳統(tǒng)的PCA方法雖然能夠?qū)?shù)據(jù)特征降維,但是需要將每個圖像樣本按像素轉(zhuǎn)化為一維向量。對尺寸為的圖像,其協(xié)方差矩陣的維數(shù)為,隨著圖像尺寸的增大,所需要的計算量飛速增加。如果訓(xùn)練樣本數(shù)目很少,導(dǎo)致計算所得的特征向量不夠準確和穩(wěn)定。因此,為了更穩(wěn)定地提取特征并減少運算量,Yang J,Zhang D等人對傳統(tǒng)PCA方法進行推廣,提出了2-D主分量分析(2D principal component analysis,2D-PCA)[11]的方法。本文將基于二維圖像矩陣的2D-PCA方法應(yīng)用于人耳識別,直接對2D圖像矩陣進行特征提取,避免了龐大的計算量。
主分量分析(又稱K-L變換),是一種基于目標二階統(tǒng)計特征的最佳正交變換,因為經(jīng)過變換后產(chǎn)生的新的分量相互正交且不相關(guān),且用部分新的分量對原樣本重構(gòu)以后與原樣本的均方誤差最小。這些都決定了它在特征提取和數(shù)據(jù)壓縮方面的重要地位??梢宰C明,在數(shù)學(xué)上,PCA可以通過求解特征值問題來求得用于樣本的投影向量。
設(shè)x是一個n維隨機向量,對一組數(shù)據(jù){xi|i=1,2,…,N},將其表達為矩陣形式X=[x1,…,xn]對X的所有列取平均得到
式中,N表示樣本的總個數(shù);μ是所有樣本的均值。
令ˉX=[μ,μ,…,μ]。數(shù)據(jù)X對應(yīng)的協(xié)方差矩陣
設(shè)St的秩為m,而λ1,λ2,…,λm是矩陣St的特征值,特征值按從大到小排序:λ1>λ2>…>λm。ωi,i=1,2,…,m是對應(yīng)特征向量。則λi與ωi滿足
令λi代表第i個特征值,則第i個主元素的貢獻率為
前r個主分量的累計貢獻率為
貢獻率表示所定義的主分量在整個數(shù)據(jù)分析中所占比重,取前r個主分量來代替全部變量,累計貢獻率的大小反映了其可靠性。令W=[ω1,ω2,…,ωr],在主分量分析中,ωi為這組數(shù)據(jù)的主分量,W為這組數(shù)據(jù)的主分量矩陣。
二維主分量分析(Two Dimensional Principal Component Analysis,2D-PCA)方法利用2D圖像矩陣直接構(gòu)造協(xié)方差矩陣,進而求出協(xié)方差矩陣的主分量特征向量,然后將測試2D圖像直接向最優(yōu)投影方向上投影以獲得圖像的特征表示。2D-PCA不同于PCA,可以直接在2-D圖像矩陣上進行處理,而不需要先將圖像矩陣轉(zhuǎn)化為一維向量,避免了龐大的求取特征值的計算。
設(shè)x表示n維列向量,圖像A看作m×n的矩陣,通過如下線性變換
將圖像A投影到向量x上,得到一個m維的列向量y,成為圖像A的投影特征向量。向量x稱為投影向量。
使用投影后訓(xùn)練樣本總體散度作為準則函數(shù)J(x)來衡量投影向量x的優(yōu)劣。
式中,Sx表示投影特征向量的協(xié)方差矩陣,tr Sx表示Sx的跡。
定義圖像散度矩陣
易知Gt是一個n×n的非負定矩陣,可以用訓(xùn)練樣本圖像直接估計。設(shè)總共K幅訓(xùn)練樣本圖像,第i幅圖像用m×n的矩陣Ai(i=1,2,…,K)來表示,訓(xùn)練樣本均值圖像為
估計圖像協(xié)方差矩陣
通過最大化準則函數(shù)J(x)來尋找一個最優(yōu)的投影方向x,使得所有訓(xùn)練樣本投影后,達到總體散度最大化的效果。選擇相互正交且極大化準則函數(shù)的一組投影向量
這里投影向量x1,x2,…,xL就是圖像協(xié)方差矩陣的前L個最大特征值λ1,λ2,…,λL所對應(yīng)的特征向量(λ1≥λ2≥…≥λL>0)。
實驗數(shù)據(jù)來自北京科技大學(xué)USTB人耳圖像庫1、庫2和庫3[12]。
庫1中包括59人,每人3幅右耳圖像,分別是正面一幅、輕微變化角度一幅、光照變化一幅,連續(xù)3幅為同一人的人耳圖像,依次排列。
庫2中包括77人,每人4幅右耳圖像,分別是正面1張、角度變化2張、光照變化1張,第一幅圖像與第四幅圖像均為人耳的正面圖像,但光照條件變化較大,第二幅圖像和第三幅圖像與第一幅圖像光照條件相同,但分別相對于第一幅圖像旋轉(zhuǎn)+30°和-30°,連續(xù)4幅為同一人的人耳圖像,依次排列。
人生是一段不斷追求和完善的旅程,無數(shù)智者不停地付出,為的是擁有一個完美的人生,但完美難求。正是因為完美難求,才有了拼搏與奮斗的心境,才能夠在永不懈怠的付出中,讓人生一步一步跨越障礙,走向迢遙,走向輝煌。
庫3中包括79人,每人10幅正常人耳圖像,分別拍攝正側(cè)面,向右轉(zhuǎn)5°,10°,15°,20°共5種角度,每種角度2幅圖像。連續(xù)10幅為同一人的人耳圖像,依次排列。人耳庫部分圖像示例由圖1所示,每幅子圖取3人為例,每一行為同一人的不同變化時人耳圖像。
人耳識別屬于典型的模式識別問題,本識別方案主要由三部分構(gòu)成,即人耳圖像預(yù)處理,人耳圖像特征提取,最近鄰分類器(Nearest Neighbor Classifier,NNC)。系統(tǒng)結(jié)構(gòu)如圖2所示。
實驗針對人耳圖像先使用維納濾波進行去噪和修復(fù),然后通過直方圖均衡化方法進行圖像對比度增強,并減少不同圖像之間的光照差異,最后采用雙三次插值法將人耳圖像歸一化為62×40像素。
實驗分別針對USTB人耳圖像庫1、庫2和庫3采用PCA、2D-PCA方法提取圖像特征,在不同相似性測度下,研究了不同方法中特征維數(shù)或貢獻率變化時,對識別性能的影響。實驗采用最近鄰分類器對測試樣本進行分類,其基本原則是取未知樣本x的最近鄰,其屬于哪一類就將x歸為哪一類。由于不同的相似性測度具有其各自的適用范圍及優(yōu)缺點,實驗中主要比較了如下三種相似性測度,以便找出更適用于人耳識別的測度。
(1)歐氏距離
(2)明氏距離
(3)馬氏距離
式中,S為樣本的協(xié)方差矩陣。
實驗中首先分析了采用不同特征提取方法時識別性能與特征維數(shù)的關(guān)系,交叉驗證的具體方案如下:
圖1 USTB人耳庫部分圖像示例
圖2 人耳識別系統(tǒng)流程
(1)對庫1中人耳圖像采用3折交叉驗證,即取每人2幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得3種不同組合的平均識別率。
(2)對庫2中人耳圖像采用4折交叉驗證,即取每人3幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得4種不同組合的平均識別率。
(3)對庫3中人耳圖像采用10折交叉驗證,即取每人9幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得10種不同組合的平均識別率。
圖3顯示了在三種相似性測度下,不同人耳圖像庫中PCA方法的識別率隨貢獻率變化的關(guān)系曲線。在貢獻率取90%~100%時取得了最好的識別效果。
圖3 采用PCA方法時識別率隨貢獻率變化的關(guān)系曲線
圖4分別顯示了分別在歐氏距離與明氏距離測度下,不同人耳圖像庫中2D-PCA方法的識別率隨特征維數(shù)變化的關(guān)系曲線。在各個相似性測度下,識別率走向大體相同,且對不同的圖像庫在特征維數(shù)取4維或5維時取得了最好的識別性能。
通過上面實驗可獲得針對不同方法達到最高識別率時的特征維數(shù)。下面重點選取歐氏距離測度,研究分析了PCA與2D-PCA兩種特征提取方法在不同折數(shù)的交叉驗證中的性能比較。具體交叉驗證方案如下:
(1)對庫1中人耳圖像采用3折交叉驗證(取每人2幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得3種不同組合的平均識別率)。
(2)對庫2中人耳圖像分別采用4折交叉驗證(取每人3幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得4種不同組合的平均識別率)和2折交叉驗證(取每人2幅圖像作為訓(xùn)練樣本,其余2幅為測試樣本,求得6種不同組合的平均識別率)。
(3)對庫3中人耳圖像分別采用2折交叉驗證(取每人5幅圖像作為訓(xùn)練樣本,其余5幅為測試樣本,求得252種不同組合的平均識別率)、5折交叉驗證(取每人8幅圖像作為訓(xùn)練樣本,其余2幅為測試樣本,求得45種不同組合的平均識別率)和10折交叉驗證(取每人9幅圖像作為訓(xùn)練樣本,其余1幅為測試樣本,求得10種不同組合的平均識別率)。實驗數(shù)據(jù)如表1所示。
(1)圖3與圖4結(jié)果比較分析。由圖3與圖4可知,兩種特征提取方法獲得最高識別率時的具體數(shù)據(jù)為:
圖4 采用2D-PCA方法時識別率隨特征維數(shù)變化的關(guān)系曲線
表1 歐氏距離測度下的人耳識別數(shù)據(jù)
庫1中,PCA方法在明氏距離測度下,貢獻率取100%時,識別率為94.92%;2D-PCA方法在歐氏距離測度下,特征維數(shù)取5維時,識別率為94.92%。
庫2中,PCA方法在明氏距離與馬氏距離測度下,貢獻率取95%時,識別率為79.87%;2D-PCA方法在明氏距離測度下,特征維數(shù)取5維時,識別率為83.44%。
庫3中,PCA方法在馬氏距離測度下,貢獻率取90%時,識別率為99.62%;2D-PCA方法在明氏距離測度下,特征維數(shù)取4維時,識別率為99.62%。
通過對比圖3與圖4可知,無論在何種相似性測度下,2D-PCA方法的識別率均不低于PCA方法的識別率。除此之外,在PCA方法的起始貢獻率為50%的情況下,三個庫中2D-PCA的最低識別率均高出PCA的最低識別率約9%~28%。
綜合三個人耳圖像庫的識別率曲線走向,PCA方法中,識別率隨著貢獻率的增加呈現(xiàn)升高的趨勢。但隨著貢獻率的變化,識別率波動較明顯,最低識別率與最高識別率之間的差異較大。所有相似性測度下,在貢獻率取90%~100%時取得了最好的識別效果。2D-PCA方法中,庫1和庫2的所有相似性測度下以及庫3的明氏距離測度下,識別率在特征維數(shù)選取4維或5維時,取得了最好的識別效果。隨著特征維數(shù)的繼續(xù)增加,識別率逐漸降低。庫3在歐氏距離測度下,特征維數(shù)取15維時,識別率最高。2D-PCA方法在所有特征維數(shù)下識別率始終保持在較高水平上,且波動相對較小。由此可見,基于2D圖像的方法相較于一維圖像的方法更具有穩(wěn)定性和魯棒性。
(2)表1數(shù)據(jù)結(jié)果分析。由表1不難發(fā)現(xiàn),隨著交叉驗證折數(shù)的增大,每個圖像庫的整體識別率都有增加的趨勢。同時,庫3的識別效果顯著高于庫1和庫2,庫2的識別效果相對較差。庫1中,兩種方法最低識別率為92.66%,最高為94.92%;庫2中,兩種方法最低識別率為68.61%,最高為82.79%;庫3中,兩種方法的識別率介于97.88%到99.62%之間。在每個庫的不同交叉驗證中,2D-PCA的平均識別率均不低于PCA,在庫1和庫2上識別率差異體現(xiàn)較明顯,在庫3的五折和十折交叉驗證中,2D-PCA和PCA的識別率均達到了99.48%以上。這驗證了這兩種特征提取方法在人耳識別研究中的有效性。
訓(xùn)練時間上,由于2D-PCA克服了將二維圖像矩陣轉(zhuǎn)換成一維圖像向量后造成高維運算的缺點,所以單張圖片PCA的訓(xùn)練時間約是2D-PCA的1.55到2.34倍。
(3)綜合圖3、圖4和表1中的數(shù)據(jù),2D-PCA方法的訓(xùn)練時間更低,識別率更高,且在特征維數(shù)較少時,2D-PCA方法仍然能夠獲得較好識別效果,總體波動相對較小。因此,無論從時間復(fù)雜度,還是從識別效果上看,都可以得出基于圖像矩陣的2D-PCA方法優(yōu)于基于一維圖像向量的PCA方法的結(jié)論。
將基于二維圖像的2D-PCA方法用于人耳識別,與傳統(tǒng)的一維線性子空間PCA方法在不同相似性測度、不同特征維數(shù)下進行對比仿真交叉驗證實驗,采用最近鄰分類器對特征進行分類。綜合時間復(fù)雜度和識別效果來看,針對三個不同人耳圖像庫的實驗結(jié)果驗證了基于圖像矩陣的2D-PCA方法優(yōu)于基于一維圖像向量的PCA方法,是一種執(zhí)行效率更高,魯棒性更強的有效人耳識別方法。本文工作進一步表明2D-PCA方法不僅可成功應(yīng)用于人臉識別等領(lǐng)域,而且在人耳圖像特征提取中同樣具有深入的研究價值。
[1]Victor B,Bowyer K W,Sarkar S.An evaluation of face and ear biometrics[C]//Proceedings of International,Conference on Pattern Recognition.Quebec:IEEE Press,2003:429-432.
[2]Burge M,Burger W.Ear biometrics in computer vision[C]//Proceedings of the 15th International Conference of Pattern Recognition.Barcelona:IEEE Press,2000:822-826.
[3]Hurley D J,Nixon M S,Carter J N.Force field energy functionals for ear biometrics[J].Computer Vision and Image Understanding,2005,98(3):491-512.
[4]Michal,Choras.Ear biometrics based on geometrical feature extraction[J].Electronic Letters on Computer Vision and Image A-nalysis,2005,12(5):84-95.
[5]Mu Zhichun,Yuan Li,Xu Zhengguang.Shape and structural feature based ear recognition[C]//Proceedings of the 5th Chinese Conference on Biometric Recognition,SINOBIOMETRICS.Guangzhou:Springer Press,2004:633-670.
[6]Feng Jun,Mu Zhichun,Duan Shufeng,et al.Ear recognition based on local binary pattern and kernel Fisher discriminant analysis[J].Journal of Information and Computational Science,2008,5(2):887-894.
[7]梁曉霞,封筠.基于Gabor變換和灰度梯度共生矩陣的人耳識別研究[J].石家莊鐵道大學(xué)學(xué)報:自然科學(xué)版,2011,24(1):78-83.
[8]Hui Chen,Bhanu B.Contour matching for 3D ear recognition[C]//Seventh IEEE Workshops on Application on Computer Vision.Breckenridge,CO:IEEE Press,2005:123-128.
[9]Kirby M,SIrovich L.Application of the Karhunen-Loeve procedure for the characterization of human faces[J].IEEETrans.PAMI,1990,12(1):120-108.
[10]Turk M,Pentland A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[11]Yang J,Zhang D,F(xiàn)rangi A F,et al.Two-dimensional PCA:A new approach to appearance-based face representation and recognition[J].IEEE Trans.PAMI,2004,26(1):131-137.
[12]穆志純.北京科技大學(xué)人耳識別實驗室——開放式人耳圖像庫[EB/OL].(2009-01-18)[2011-11-1].http://www.ustb.edu.cn/resb/subject/subject.htm.