摘 要:由于人耳圖像自身的特點,基于外觀形狀特征如利用邊緣或耳廓壓痕的識別方法存在很大的缺陷,嘗試采用了基于主成元(PCA)的分析方法提取人耳特征,然后運用BP神經網絡進行識別。他完全克服了在以往應用外觀形狀特征進行識別時存在的錯誤率過高和特征提取預處理要求過于苛刻的問題。實驗結果表明該方法實用、有效,可使識別率達到99%以上,有著廣泛的研究價值和應用前景。
關鍵詞:人耳識別;主成元分析;神經網絡;形狀特征
中圖分類號:TP18 文獻標識碼:A
文章編號:1004-373X(2008)09-130-02
Ear Recognition Based on Principal Component Analysis
WANG Yang,YANG Fan
(Institute of Information,Hebei University of Technology,Tianjin,300130,China)
Abstract:Because of characteristics of the ear image,it has many shortages of recognition method based on shape features.The paper introduces the application of ear recognition based on Principal Component Analysis(PCA),this methods use the PCA and BP neural network analysis algorithm to extract the ear ofhuman,finish the recognition.It gets a good experiment result of 100% classing and 99% accuracy,proves that the principal component analysis is available in the ear recognition.
Keywords:ear recognition;principal component analysis;neural network;shape features
1 引 言
人耳的自動識別是模式識別領域中的一個新興課題,他可以作為傳統(tǒng)模式識別方法的有利補充,有著廣泛的應用前景。
人耳識別可以作為傳統(tǒng)識別方法的補充是由其自身特有的特點所決定的。人耳具有獨特的生理特征和觀測角度的優(yōu)勢。人耳識別是一種“不打擾”、“非接觸”式的識別,可以避免帶給觀測者和被觀測者諸多的麻煩?,F(xiàn)階段人耳識別的研究可分為基于整體的全局特征識別研究方法和基于外形幾何特征分析的研究方法。前者考慮了模式的整體屬性,主要方法包括:特征耳法、英國的南安普敦大學的力場轉換理論以及神經網絡等方法,后者將人耳基準點的相對比率或其他描述人耳輪廓特征的形狀參數(shù)或類別參數(shù)等一起構成識別特征向量,主要方法包括:Burge 和Burger的人耳自動識別技術、Moreno的外耳特征點識別、基于傅里葉系數(shù)的外耳邊緣的識別方法等。目前,國內外對人耳基于外觀幾何特征分析的研究比較深入,相關的研究文獻也比較多,但基于外觀特征形狀的研究識別方法弊端十分的明顯,本文提出了基于主元分析和神經網絡相結合的人耳識別方法,從人耳的整體出發(fā)進行研究識別,取得了令人滿意的識別效果。
2 主成元分析法(PCA)
主成元(Principal Component Anolysis,PCA)分析法是模式識別中的一種行之有效的特征提取方法,他是基于目標二階統(tǒng)計特性的最佳正交變換,是模式識別判別分析中最常用的一種線性映射方法,該方法是根據樣本點在空間中變化最大方向,即方差最大的方向,作為判別矢量來實現(xiàn)數(shù)據的特征提取,減少數(shù)據冗余,使得數(shù)據在一個低維的特征空間被處理,同時保持原始數(shù)據的絕大部分的信息。
由于人耳結構的相似性,當把人耳圖像進行歸一化之后,這些圖像在高維空間中不是隨機分布的,而是存在某種規(guī)律性。因此,可用主元分析法將人耳圖像進行壓縮后,用一個低維子空間描述人耳圖像,同時又能保留所需識別的信息。將一幅N×N大小的人耳圖像按列展成一個N2維的列向量,他可被視為N2維空間中的一個點, 以歸一化后的人耳圖像作為訓練樣本集,以該樣本集的總體散布矩陣作為產生矩陣,則有:
式(6)中α為小于1 的數(shù),他表示樣本集在前k個軸上的能量占整個能量的百分比。通常根據經驗取α=90%,即可在滿足所需必要信息的同時,盡可能地降低維數(shù)。
任何一幅人耳圖像都可以向由“特征耳”張成的子空間投影,以獲得一組坐標系數(shù)。這組系數(shù)表明了該圖像在子空間的位置,從而作為識別的依據。
3 BP神經網絡設計
BP誤差反向傳播算法 (Back-Propagation Algorithm),簡稱BP算法。采用BP算法的多層神經網絡模型一般稱為BP網絡,他是目前人工神經網絡中研究最深入、應用最廣泛的一類網絡。網絡由輸入層、中間層和輸出層組成,中間層也就是隱含層可以是一層或多層。本文采用的是三層網絡,即隱含層只有一層。
目前,關于BP網絡結構的設計還沒有標準的公式,基本上依據經驗和猜測。 針對PCA 提取的特征和目標,設計了具有一個三層BP 神經網絡,輸入由提取的特征數(shù)決定,隱層為100個神經元,其中隱層神經元采用高斯函數(shù)f(x)=exp(-x2)作為傳遞函數(shù)。輸出采用被稱為n取1(1-of-n) 輸出編碼,即每個目標向量含有30個元素,向量代表某一類。則其對應位置的元素值為1,而其他位置的元素值為0。網絡采用動量法和學習速率自適應調整兩種策略,動量法降低了網絡對于誤差曲面局部細節(jié)的敏感性,抑制了網絡陷于局部極小,提高了算法的收斂性和可靠性;自適應調整學習速率,有利于縮短學習時間。
4 實驗結果及分析
在實驗中,從人耳圖像庫中抽取30 個人共300幅耳部圖像,其中每個人有10 幅不同的人耳圖像,包括光照和人耳表情、狀態(tài)各不相同,歸一化處理后的圖像大小為:32 ×32 的灰度圖像。對于每一個人的10 幅圖像選取7 幅作為訓練樣本,其余3 幅作為測試樣本,另外對測試樣本再人為的加入高斯噪聲,構成新的測試樣本。對于每一幅人耳圖像按列展成1 024維的向量。
求出總體散布矩陣[WTHX]S[WTBZ]0 ,然后利用主元分析法求出他的特征值和特征向量。為了有效減少運算量,同時又要保證主要識別信息不丟失,取前62個最大的特征值對應的特征向量(根據α大于90%原則),由這些特征向量構成人耳子空間,然后就可以把人耳圖像投影到人耳子空間中,也就將1 024維的向量壓縮至62維,從而實現(xiàn)了維數(shù)壓縮的目的,最后將壓縮后的向量歸一化到[-1,1]之間。
將歸一化之后的訓練樣本輸入BP神經網絡進行學習,其輸入層神經元的個數(shù)為輸入向量的維數(shù)60,隱層神經元的最大個數(shù)定為100,輸出層神經元的個數(shù)為人耳的類別數(shù)30,對每一個人耳類別樣本賦予惟一的標號,例如第一個人耳類別樣本對應的第一個輸出神經元的教師信號為1,其余輸出神經元的教師信號為0。 若人耳類別增加,則可增加輸出層神經元的個數(shù)。 網絡訓練結束后,就可以對測試樣本進行識別了。對原始人耳測試圖像和加入不同高斯噪聲的人耳測試圖像經過主元分析和歸一化后形成的樣本。我們將分別采用形狀特征和主元BP神經網絡識別的結果進行對比。
表1 采用形狀特征和主元BP神經網絡識別的結果進行對比
實驗結果表明,依據外觀特征進行識別的傳統(tǒng)方法錯誤率很高,同時,在提取特征時也有很苛刻的要求(通常要尋找一個絕對特征點),提取特征時往往速度慢,而且十分困難,不利于計算機自動識別;采用基于主成元特征和BP神經網絡進行識別的方法較之傳統(tǒng)的基于形狀特征的識別方法,不僅克服了以上的缺點,而且有很好的抗噪性,可以克服諸多因素(光照、修飾、拍攝角度)的影響,具有良好的魯棒性,取得非常好的識別效果。這對于提高人耳識別的識別率具有重要的意義。
表2 不同主元比例條件下的識別效果
5 結 語
本文對基于PCA判別分析方法在人耳識別當中應用進行了研究,此理論簡單易行,克服了傳統(tǒng)人耳識別方法諸多的弊端,判別速度快,識別結果準確。此方法不僅適用于人耳識別,也可適用于其他的圖像識別問題。
參 考 文 獻
[1]Burge MJ,Burger W.Using Ear biometrics for Passive Identification\\[C\\].14th International Information Security Conference,Vienna,1998.
[2]Bartlett M S.Face Image Analysis by Unsupervised Learning and Redundancy Reduction[D].San Diego:University of California,1998.
作者簡介 王 楊 男,河北省邯鄲市人,河北工業(yè)大學信息工程學院,碩士研究生。主要從事智能信息處理研究。
楊 帆 男,河北工業(yè)大學信息工程學院,博士。主要從事智能信息處理研究。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。