創(chuàng)新者:王子豪 關(guān) 瑜 唐婉冰 李 琛
基于支持向量機(jī)的人耳識(shí)別研究
創(chuàng)新者:王子豪 關(guān) 瑜 唐婉冰 李 琛
本文著重研究了基于支持向量機(jī)方法對(duì)人耳特征識(shí)別正確率的影響。通過(guò)局部二值模式(LBP)和主成分分析法(PCA)兩種不同的特征提取算法分別結(jié)合SVM分類器進(jìn)行識(shí)別,研究更優(yōu)的特征提取和分類方法的結(jié)合方式。為了進(jìn)行充分的比較并說(shuō)明算法的有效性,同樣以LBP和PCA分別結(jié)合歐氏距離分類器進(jìn)行識(shí)別作為比較,進(jìn)一步驗(yàn)證了基于支持向量機(jī)(SVM)進(jìn)行識(shí)別的有效性。實(shí)驗(yàn)結(jié)果表明,在同等條件下訓(xùn)練集占比越大,所得識(shí)別率越高。對(duì)于訓(xùn)練集個(gè)數(shù)較多的圖像庫(kù)來(lái)說(shuō),通過(guò)PCA和SVM結(jié)合的方法可以得到更高識(shí)別率。
隨著科學(xué)技術(shù)的發(fā)展,信息安全和公共安全等社會(huì)安全問(wèn)題在當(dāng)今社會(huì)的重要性日益加強(qiáng),生物特征識(shí)別技術(shù)已逐步深入人們的工作和生活中。近年來(lái),人們?cè)趯ふ腋奖?、?zhǔn)確、魯棒的身份識(shí)別方式,發(fā)現(xiàn)人耳識(shí)別在遠(yuǎn)距離、非打擾式的環(huán)境下具有許多優(yōu)點(diǎn):人耳特征相對(duì)穩(wěn)定,不受表情、年齡、化妝等因素的影響;人耳數(shù)據(jù)可以從視頻或照片中獲取,易實(shí)現(xiàn)遠(yuǎn)距離、非打擾式的識(shí)別;人耳與指紋、人臉、手背血管、虹膜等生物特征類似,不僅具有唯一性和相對(duì)穩(wěn)定性等特點(diǎn),并且圖像的獲取具有非接觸性,易獲取性,無(wú)傷害性,操作簡(jiǎn)單等特點(diǎn)。人耳識(shí)別的研究和發(fā)展對(duì)完善社會(huì)安全識(shí)別系統(tǒng),增加識(shí)別的高效性與準(zhǔn)確性具有重要意義。
在模式識(shí)別中,特征提取是分類的前提,具有決定性作用,人耳識(shí)別中常用的人耳特征提取方法有主成分分析(PCA)、局部二值模式(LBP)、獨(dú)立成分分析(ICA)等。當(dāng)前主要的分類識(shí)別方法有支持向量機(jī)(SVM)分類識(shí)別,歐式距離(ED)分類識(shí)別,神經(jīng)網(wǎng)絡(luò)分類器(ANN)識(shí)別等??紤]到SVM分類器在處理小樣本問(wèn)題和泛化能力強(qiáng)等方面的優(yōu)勢(shì),本文研究了基于SVM分類器的人耳識(shí)別,經(jīng)過(guò)充分的實(shí)驗(yàn)證明,該方法可以得到更高的人耳識(shí)別率。
基于主成分分析(PCA)的特征提取方法思想來(lái)源于Kahunen-Loeve變換,即把人耳圖像作為一個(gè)整體處理,通過(guò)線性變換提取主元,獲得其正交的n維KL基底,以對(duì)應(yīng)前m(m<n)個(gè)最大的特征值的基底構(gòu)成的子空間為特征向量,識(shí)別時(shí)將測(cè)試的人耳圖像投影到此空間,得到一組投影系數(shù),用于表達(dá)人耳。在提取全局特征方面有很好的效果。步驟如下:
(2)計(jì)算圖像的協(xié)方差矩陣:
其中A為差值耳矩陣:
(4)將訓(xùn)練樣本投影到特征向量構(gòu)成的子空間上,可得M個(gè)投影向量,這M個(gè)投影向量即構(gòu)成實(shí)驗(yàn)樣本的PCA特征。
局部二值模式(LBP)是通過(guò)比較圖像中每個(gè)像素與其領(lǐng)域內(nèi)的像素灰度值的大小,然后利用二進(jìn)制模式來(lái)描述圖像的紋理。LBP理論對(duì)目標(biāo)灰度變化不敏感且計(jì)算迅速簡(jiǎn)單、分類能力強(qiáng),在提取局部紋理細(xì)節(jié)方面有顯著優(yōu)勢(shì)。
LBP算子的基本思想是將中心像素點(diǎn)的灰度值設(shè)為閾值,其圓形鄰域內(nèi)的像素點(diǎn)與之作比較得到二進(jìn)制碼用來(lái)表述局部紋理特點(diǎn)。LBP算子通常由參數(shù)(P,R)來(lái)表示,其中P表示鄰域內(nèi)包含的像素個(gè)數(shù),R表示鄰域半徑。對(duì)于不同的(P,R)值對(duì)LBP算子也不相同。
歐氏距離(Euclidian Distance):也稱為泛數(shù),是一個(gè)常用的距離定義,可表示為在K維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。也常被用于度量向量間的距離:
圖1 三種不同的LBP算子
圖2 最優(yōu)分類面
歐氏距離分類器是一種簡(jiǎn)單的基于向量空間模型的分類算法,其基本思想是利用試驗(yàn)訓(xùn)練集生成一個(gè)可表示該類別的中心向量Uf(f=1,2,...,n;n是類別數(shù)),對(duì)于每個(gè)待分類的元素組X ,計(jì)算其與的距離根據(jù)計(jì)算的距離,把X歸入到與之距離最近的類。
采用歐氏距離分類器由于不用計(jì)算屬性的方差和協(xié)方差,使得其分類速度較快,分類時(shí)間較短。
支持向量機(jī)(SVM)是近年來(lái)Vapnik等人基于統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)提出的一種結(jié)構(gòu)風(fēng)險(xiǎn)最小化的統(tǒng)計(jì)學(xué)習(xí)方法。具有良好的泛化能力和直觀的幾何解釋,通常用來(lái)進(jìn)行模式識(shí)別、分類以及回歸分析。
如圖2所示,矩形點(diǎn)和圓形點(diǎn)代表兩類樣本。H為分類線,Y1,Y2分別為過(guò)各類中離分界線最近的樣本點(diǎn)且平行于分類線的直線,它們的間距稱作分類間隔。其上距離分類線最近的訓(xùn)練樣本點(diǎn)也就是所謂的支持向量。支持向量機(jī)的目標(biāo)是要找的一個(gè)最優(yōu)的分割超平面,此超平面能最大程度地把兩類訓(xùn)練樣本正確分開,同時(shí)使分類間隔盡可能地大。
可設(shè)最優(yōu)分割超平面為
利用拉格朗日乘子法可轉(zhuǎn)化其為對(duì)偶問(wèn)題并得到上述的最優(yōu)分類函數(shù):
對(duì)線性可分問(wèn)題來(lái)說(shuō),核函數(shù)就是點(diǎn)積運(yùn)算。而對(duì)于非線性問(wèn)題來(lái)說(shuō),只要一種核函數(shù)滿足Mercer條件,它就對(duì)應(yīng)某一變換空間的內(nèi)積。與線性可分問(wèn)題相比,求解時(shí)只需用代替向量?jī)?nèi)積即可。此時(shí),最優(yōu)分類函數(shù)也變?yōu)椋?/p>
上述即為支持向量機(jī)算法。
支持向量機(jī)為了解決多類問(wèn)題,通常有兩種策略:一種是一對(duì)多的分類方法,另一種是一對(duì)一的分類方法。對(duì)于一對(duì)多的分類方法來(lái)說(shuō),把某類樣本與其他所有類看成不同的兩類來(lái)劃分,這樣對(duì)N類問(wèn)題需要訓(xùn)練N個(gè)支持向量機(jī),對(duì)于一對(duì)一的分類,則把N類樣本分別兩兩組合作為兩類問(wèn)題進(jìn)行分類,即需訓(xùn)練(N-1)*N/2個(gè)支持向量機(jī)。
第一次訓(xùn)練階段,選擇每個(gè)個(gè)體(共79人)的第一張圖片作為訓(xùn)練集,余下三張為測(cè)試集,經(jīng)特征提取后送入SVM網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到79個(gè)兩分類支持向量機(jī);測(cè)試時(shí)使用每個(gè)個(gè)體剩余的三個(gè)樣本作為測(cè)試樣本進(jìn)行選取識(shí)別,分別用79個(gè)支持向量機(jī)進(jìn)行判斷。
第二次訓(xùn)練階段選擇每個(gè)個(gè)體的前兩張圖片作為訓(xùn)練集,余下兩張為測(cè)試集,重復(fù)上述操作并記錄所得結(jié)果。
第三次訓(xùn)練階段選擇每個(gè)個(gè)體的三張圖片作為訓(xùn)練集,剩余一張為測(cè)試集進(jìn)行測(cè)試,并重復(fù)上述操作,記錄結(jié)果。
實(shí)驗(yàn)流程圖如圖3。
本文采用北京科技大學(xué)USTB人耳圖像庫(kù)(3)作為實(shí)驗(yàn)對(duì)象,包含有79個(gè)人的395張人耳側(cè)面圖像,圖像采集顯示分辨率為768*576,正側(cè)面光照恒定。為了進(jìn)行充分的比較并說(shuō)明算法的有效性,本文在實(shí)驗(yàn)設(shè)計(jì)時(shí),分別以三種不同的比例構(gòu)造了對(duì)應(yīng)的三組測(cè)試集和訓(xùn)練集。在特征提取部分,采用了LBP和PCA兩種算法,分別結(jié)合SVM分類器進(jìn)行識(shí)別。為了說(shuō)明SVM方法的有效性,同樣以LBP和PCA分別結(jié)合歐氏距離分類器進(jìn)行識(shí)別作為比較。
下面分別給出對(duì)于三組測(cè)試集和訓(xùn)練集,四種識(shí)別思路的識(shí)別效果,如圖4所示。
圖4為訓(xùn)練集與測(cè)試集之比為1:3時(shí),四種不同結(jié)合方法所得識(shí)別率柱形圖,本次實(shí)驗(yàn)的人耳庫(kù)為USTB79人人耳庫(kù),在識(shí)別過(guò)程中使用每個(gè)人的第一張人耳圖像作為訓(xùn)練集,第二、三、四張作為測(cè)試集。
圖5為訓(xùn)練集與測(cè)試集之比為2:2時(shí),四種不同結(jié)合方法所得識(shí)別率柱形圖,本次實(shí)驗(yàn)的人耳庫(kù)為USTB79人人耳庫(kù),在識(shí)別過(guò)程中使用每個(gè)人的第一、二張人耳圖像作為訓(xùn)練集,第三、四張作為測(cè)試集。
圖6為訓(xùn)練集與測(cè)試集之比為3:1時(shí),四種不同結(jié)合方法所得識(shí)別率柱形圖,本次實(shí)驗(yàn)的人耳庫(kù)為USTB79人人耳庫(kù),在識(shí)別過(guò)程中使用每個(gè)人的第一、二、三張人耳圖像作為訓(xùn)練集,第四張作為測(cè)試集。
圖3 實(shí)驗(yàn)流程
圖4 訓(xùn)練集:測(cè)試集=1:3
圖5 訓(xùn)練集:測(cè)試集=2:2
圖6 訓(xùn)練集:測(cè)試集=3:1
圖7 不同識(shí)別算法相應(yīng)識(shí)別率
由圖4、圖5、圖6可得出各種算法識(shí)別結(jié)果的差別。無(wú)論以何種比例構(gòu)造測(cè)試集和訓(xùn)練集,本文研究的支持向量機(jī)(SVM)識(shí)別算法結(jié)合主成分分析(PCA)法得到的識(shí)別率始終高于基于局部二值模式(LBP)算法所得,而兩種特征提取算法分別結(jié)合歐氏距離(ED)識(shí)別方法得到的識(shí)別率均低于采用SVM算法所得,進(jìn)一步驗(yàn)證了基于支持向量機(jī)識(shí)別的有效性。同時(shí)我們發(fā)現(xiàn),訓(xùn)練集所占比例越大,得到的識(shí)別率越高,最高可達(dá)到95.5%??梢娫趯?shí)際運(yùn)用中,對(duì)于圖像測(cè)試集較少的人耳庫(kù)來(lái)說(shuō),通過(guò)PCA和SVM結(jié)合的方法可以得到更高識(shí)別率。
本文著重研究了基于支持向量機(jī)的人耳識(shí)別。在特征提取部分,采用了LBP和PCA兩種算法,分別結(jié)合SVM分類器進(jìn)行識(shí)別,研究更優(yōu)的特征提取和分類方法的結(jié)合方式。為了進(jìn)行充分的比較并說(shuō)明算法的有效性,同樣以LBP和PCA分別結(jié)合歐氏距離分類器進(jìn)行識(shí)別作為比較;此外,本文還以三種不同的比例構(gòu)造了對(duì)應(yīng)的三組測(cè)試集和訓(xùn)練集,用以驗(yàn)證對(duì)于不同的特征提取和識(shí)別方法,測(cè)試集和訓(xùn)練集圖像個(gè)數(shù)對(duì)算法的具體影響。
實(shí)驗(yàn)結(jié)果表明,不同測(cè)試集和訓(xùn)練集之比會(huì)對(duì)同一算法所得出的識(shí)別結(jié)果產(chǎn)生較大影響,訓(xùn)練集的比例越大,所得識(shí)別率越高。在同等條件下,采用PCA與SVM 相結(jié)合的方法得到的識(shí)別率要高于LBP與SVM結(jié)合方法所得。而通過(guò)采用歐氏距離算法對(duì)實(shí)驗(yàn)進(jìn)一步比較驗(yàn)證可以得出,當(dāng)訓(xùn)練集在特征空間沒有良好聚類時(shí),支持向量機(jī)算法分類性能較好,穩(wěn)定性較高。尤其是對(duì)于訓(xùn)練集個(gè)數(shù)較多的圖像庫(kù)來(lái)說(shuō),通過(guò)PCA和SVM結(jié)合的方法可以得到更高識(shí)別率。
10.3969/j.issn.1001-8972.2015.24.039