摘 要:針對(duì)人耳識(shí)別問題,提出一種二維主分量分析(2DPCA)的人耳識(shí)別方法,該方法不需要預(yù)先將圖像轉(zhuǎn)換為一維向量,而是基于圖像矩陣,直接計(jì)算圖像協(xié)方差矩陣的特征向量作為人耳特征提取,大大加快特征提取的速度,從根本上克服了傳統(tǒng)PCA在進(jìn)行圖像特征提取時(shí)耗時(shí)過多的缺點(diǎn)。并通過BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別。實(shí)驗(yàn)結(jié)果表明,應(yīng)用2DPCA方法提取人耳圖像特征,可以大大提高識(shí)別效果。
關(guān)鍵詞:人耳識(shí)別;主分量分析;二維主分量分析;BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):O235,TP391文獻(xiàn)標(biāo)識(shí)碼:B文章編號(hào):1004373X(2008)2015102
A New Kind of Ear Recognition Based on 2DPCA
CHEN Chunlan,ZENG Huanglin
(Sichuan University of Scicnce Engineering,Zigong,643000,China)
Abstract:Based on ear recognition,2DPCA method is given.This method doesn′t need transform image into ID vector,but image-based matrix,which computs the image covariance matrix directly for image feature extraction,it overcomes time-consuming of traditional PCA in image feature extraction.BP network is used for classification.Simulation shows that using 2DPCA to extract ear image feature can achieve satisfactory results.
Keywords:ear recognition;PCA;2-dimensional PCA(2DPCA);BP network
隨著科技的發(fā)展、社會(huì)的進(jìn)步,身份驗(yàn)證的要求也日益迫切,包括指紋識(shí)別、人臉識(shí)別、虹膜識(shí)別等。人臉識(shí)別已經(jīng)取得了可喜的研究成果,但在實(shí)際應(yīng)用中存在很多的困難:人臉是非剛體,存在表情變化會(huì)對(duì)人臉識(shí)別造成影響。
人耳特征與其他的生物特征一樣是每個(gè)人與生俱來的,為人的內(nèi)在屬性,具有較高的穩(wěn)定性及個(gè)體差異性。而人耳特征與其他生物特征不同的是,他具有普遍性、可采集性和不可偽造性等特點(diǎn)。人耳有著可靠、穩(wěn)定和豐富的生理特征,并且人耳作為一種生物特征,具有獨(dú)特的優(yōu)點(diǎn):人耳不受表情、化妝的影響;不易受傷,不受耳環(huán)、眼鏡架等的影響;比人臉具有更一致的顏色分布;人耳表面更小,信息存儲(chǔ)和處理量更少[1,2]。人耳識(shí)別作為一種新的人體特征識(shí)別技術(shù)正引起人們的關(guān)注。
目前人耳識(shí)別提取的特征主要分為2類:一類是基于幾何特征的方法[2],這種方法通過尋找人耳輪廓和內(nèi)部結(jié)構(gòu)上的關(guān)鍵點(diǎn),形成幾何特征;另一類是基于代數(shù)特征的方法,如主元分析法[3]。
主元分析法(PCA)在處理圖像識(shí)別問題時(shí)是基于向量的,且沒有充分利用訓(xùn)練樣本的類別信息。本文提出了一種直接基于圖像矩陣的2DPCA方法,與傳統(tǒng)的PCA相比,不需要預(yù)先將圖像轉(zhuǎn)換為一維向量,其是基于圖像矩陣,直接計(jì)算圖像協(xié)方差矩陣的特征向量,最突出的優(yōu)點(diǎn)是加快了特征提取的速度,提高了人耳的識(shí)別率。
1 二維主分量分析(2DPCA)
考慮一個(gè)大小為m×n的圖像A,令投影矩陣X∈Rn×d(n≥d),將圖像矩陣A投影到X,將產(chǎn)生一個(gè)m×d的矩陣Y=AX。在2DPCA方法中,用投影后向量的總離散度作為準(zhǔn)則函數(shù)J(X)來衡量投影矩陣X的優(yōu)劣:
J(X)=trace{E[(Y-EY)(Y-EY)T]}
=trace{E[(AX-E(AX))(AX-E(AX))T]}(1)
=trace{XTE[(A-EA)T(A-EA)]X}
定義圖像協(xié)方差矩陣:
G=E[(A-EA)T(A-EA)]
G是一個(gè)n×n的非負(fù)正定矩陣。假設(shè)有M幅m×n的測(cè)試樣本人耳圖像Ak(k=1,2,…,M),其平均圖像矩陣為=1M∑Mk=1Ak,則G可以被估計(jì)為:
G=1M∑Mk=1(Ak-)T(Ak-)(2)
所以式(1)可以寫成:
J(X)=tr(XTGX)
可以證明,準(zhǔn)則函數(shù)J(X)最大的X中每列向量是由協(xié)方差矩陣G的r個(gè)非零特征值對(duì)應(yīng)的前面最大的d個(gè)特征向量組成:
X=(X1,X2,…,Xd)=arg max[J(X)]
滿足XTiXj =0,i≠j;i,j=1,2,…,d。在獲得投影矩陣X=(X1,X2,…,Xd)后,可以對(duì)人耳圖像進(jìn)行特征提取和分類,給定一幅人耳圖像A,令:
Yk=AXkk=1,2,…,d
于是可以得到一組投影后的特征向量Y1,Y2,…,Yd,稱作樣本A的特征矩陣。與傳統(tǒng)PCA方法不同,在2DPCA方法中,不需要預(yù)先將圖像轉(zhuǎn)換為一維向量,是基于圖像矩陣,直接計(jì)算圖像協(xié)方差矩陣的特征向量方法。
2 基于2DPCA和BP神經(jīng)網(wǎng)絡(luò)的人耳識(shí)別
2.1 BP網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)
人工神經(jīng)網(wǎng)絡(luò)具有并行處理和大規(guī)模平行計(jì)算能力,能高度地逼近非線性系統(tǒng)并對(duì)不確定問題具有自適應(yīng)能力,而BP網(wǎng)絡(luò)是目前實(shí)際應(yīng)用中使用最為廣泛的網(wǎng)絡(luò)模型,但是由于該網(wǎng)絡(luò)容易陷入局部極小點(diǎn),收斂速度慢,所設(shè)計(jì)的網(wǎng)絡(luò)泛化能力不能保證等缺點(diǎn)。本文采用改進(jìn)的三層結(jié)構(gòu)網(wǎng)絡(luò)來實(shí)現(xiàn)2DPCA特征提取后的人耳分類。輸入由提取的特征數(shù)來決定,隱層為28個(gè)神經(jīng)元,輸出采用n取1的方法,為了提高算法的收斂速度,采用動(dòng)量法和學(xué)習(xí)速率自適應(yīng)調(diào)整的方法[4],降低了網(wǎng)絡(luò)對(duì)于誤差曲面局部細(xì)節(jié)的敏感性,有效地抑制了網(wǎng)絡(luò)陷入局部極,提高了算法的收斂性和可靠性。
2.2 實(shí)驗(yàn)方法和結(jié)果
2DPCA和BP網(wǎng)絡(luò)人耳識(shí)別算法結(jié)構(gòu),如圖1所示。
圖1 2DPCA人耳識(shí)別算法結(jié)構(gòu)框圖
在實(shí)驗(yàn)中采用Carreira-Perpinan建立的人耳庫(kù)[5],該圖像庫(kù)包括17人,每人6幅,共102幅人耳圖像,每幅圖像為64×40大小。部分人耳圖像如圖2所示。
在人耳圖像庫(kù)中,取每人的前3組人耳圖像作為訓(xùn)練樣本,共51幅;取每人的后3組作為測(cè)試樣本,共51幅。分別采用2DPCA方法和PCA方法進(jìn)行特征提取,三層BP網(wǎng)絡(luò)進(jìn)行分類識(shí)別,在Matlab 7.0環(huán)境下進(jìn)行,結(jié)果見表1。
表1 實(shí)驗(yàn)結(jié)果
人耳圖像庫(kù)特征數(shù)
訓(xùn)練時(shí)間/s識(shí)別率
2DPCAPCA2DPCAPCA
Carreira-Perpinan 1330.35372.5100%100%
圖像庫(kù)1739.735213.8100%100%
2650.52101.56100%100%
圖2 部分人耳圖像
該實(shí)驗(yàn)結(jié)果表明,在相同的人耳庫(kù)上,基于2DPCA方法的和PCA方法雖然識(shí)別率相同,但是2DPCA加速了圖像的特征提取。這是因?yàn)槊糠?4×40大小的圖像,用傳統(tǒng)的PCA方法,需要處理64×40=2 560階的矩陣,盡管用奇異值分解定理可以加速特征提取的速度,但是計(jì)算量仍然很大,而利用2DPCA方法,只需要處理40階的矩陣即可。
3 結(jié) 語
本文提出一種2DPCA方法用于人耳識(shí)別,該方法直接基于圖像矩陣。他的突出優(yōu)點(diǎn)是大大加快了特征提取的速度,從根本上克服傳統(tǒng)PCA在進(jìn)行圖像特征提取時(shí)耗時(shí)過多的缺點(diǎn)。
參考文獻(xiàn)
[1]Hanna-Kaisa Lammi.Ear Biometrics[EB/OL]http://www.it.lut.fi/kurssit/03-04/010970000/seminars/Lammi.pdf.
[2]Burge M J,Burger W.Using Ear Biometrics for Passive Identification [A].Proceedings of 14th,International Information Security Conference [C].Vienna,Austria:Kluwer Academic,1998:139-148.
[3]張海軍,穆志純,張克君,等.基于主元分析的人耳圖像識(shí)別方法\\.北京工商大學(xué)學(xué)報(bào),2005,23(6):28-30.
[4]魏海坤.神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的理論與方法\\.北京:國(guó)防工業(yè)出版社,2005.
[5]Carreira-Perpinan M A.Compression Neural Networks for Feature Extraction:Application to Human Recognition from Ear Images [D].Spain:Technical University of Madrid,1995.
[6]Wang Liwei.Is Two-dimensional PCA a New Technique.Act Automatica Sinica,2005,5(31):782-787.
[7]Yang J,Yang J Y.From Image Vector to Matrix:A Straight Forward Image Projection Technique-IMPCA.vs.PCA[J].Pattern Recognition,2002,35(9):1 997-1 999.
[8]張海軍,穆志純,危克.人耳識(shí)別技術(shù)研究進(jìn)展綜述[J].計(jì)算機(jī)工程與應(yīng)用,2004(33):5-9.
[9]祝振宇.基于主成分分析的人耳識(shí)別系統(tǒng)研究[J].科技廣場(chǎng),2007(7):33-36.
[10]王秀琴,趙金憲,王忠禮.人耳識(shí)別的應(yīng)用研究與實(shí)現(xiàn)[J].黑龍江科技學(xué)院學(xué)報(bào),2004,14(4):241-244.
作者簡(jiǎn)介 陳春蘭 女,1983年出生,碩士研究生。主要研究方向?yàn)槿斯ど窠?jīng)網(wǎng)絡(luò)、模式識(shí)別。
曾黃麟 男,1955年出生,博士,教授。主要研究方向?yàn)榇旨碚?、神?jīng)網(wǎng)絡(luò)、智能信息處理等。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文