何振紅
(甘肅民族師范學(xué)院計(jì)算機(jī)科學(xué)系,甘肅 合作 747000)
基于廣義高斯分布FDCT_Wrap和FSVM的虹膜識(shí)別
何振紅
(甘肅民族師范學(xué)院計(jì)算機(jī)科學(xué)系,甘肅 合作 747000)
為了提高虹膜識(shí)別的準(zhǔn)確率,提出了一種改進(jìn)曲波變換的虹膜識(shí)別算法。首先對(duì)預(yù)處理后的虹膜圖像進(jìn)行Wrapping算法的快速離散曲波變換,提取不同尺度和不同方向的曲波子帶系數(shù)矩陣的均值、方差和能量,然后利用廣義高斯分布估算各子帶的權(quán)值,為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。最后采用模糊支持向量機(jī)和二叉決策樹(shù)相結(jié)合的分類器進(jìn)行匹配識(shí)別。采用UBIRIS和CASIA虹膜數(shù)據(jù)庫(kù)對(duì)算法性能進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,該算法能更好地提高虹膜識(shí)別準(zhǔn)確率和效率,具有可行性。
廣義高斯分布;虹膜識(shí)別;曲波變換;模糊支持向量機(jī);二叉決策樹(shù)
近年來(lái),隨著小波技術(shù)的發(fā)展,采用小波變換進(jìn)行虹膜特征提取取得了良好的效果[1-7]。但是小波變換具有各向同性,在表示線奇異的二維圖像時(shí),不滿足空間各向異性的要求,從而影響虹膜識(shí)別的準(zhǔn)確性。curvelet(曲波)變換能有效彌補(bǔ)小波變換的不足,以邊緣曲線為基本元素,體現(xiàn)出多方向性和各向異性,能更好地表示虹膜圖像的邊緣信息。因此利用curvelet變換提取虹膜特征比小波變換更實(shí)際有效。Rahulkar等人[5]提出了一種基于快速離散curvelet變換的虹膜特征提取算法。該算法將歸一化的虹膜圖像劃分為6個(gè)子圖像,對(duì)每個(gè)子圖像進(jìn)行curvelet變換,提取curvelet系數(shù)的定向能量作為子圖像的特征向量。在UBIRIS V1和CASIA-Iris V2.0數(shù)據(jù)庫(kù)中進(jìn)行實(shí)驗(yàn),分別獲得97.73%和97.81%的識(shí)別準(zhǔn)確率,比Gabor小波算法和Haar小波算法的識(shí)別效果好。但該方法在眼瞼和睫毛遮擋較嚴(yán)重的情況下表現(xiàn)一般。
為了更好地消除采集到的虹膜圖像中不感興趣信息因素對(duì)虹膜特征提取的影響,本文提出一種基于廣義高斯分布Wrapping算法的快速離散curvelet變換虹膜識(shí)別算法。首先對(duì)預(yù)處理后的虹膜圖像進(jìn)行Wrapping算法的快速離散curvelet變換,提取不同尺度和不同方向的curvelet子帶系數(shù)矩陣的均值、方差和能量,然后利用廣義高斯分布(generalized Gaussian distribution,GGD)估算各子帶的權(quán)值,為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,構(gòu)成虹膜圖像的特征向量。最后采用模糊支持向量機(jī)(fuzzy support vector machine,F(xiàn)SVM)和二叉決策樹(shù)相結(jié)合的分類器進(jìn)行分類識(shí)別。采用UBIRIS和CASIA虹膜數(shù)據(jù)庫(kù)對(duì)算法進(jìn)行性能測(cè)試,實(shí)驗(yàn)結(jié)果表明,該方法提取的特征向量維數(shù)較少,相比小波變換具有較高的識(shí)別率和良好的頑健性。
一個(gè)典型的虹膜識(shí)別系統(tǒng)由虹膜圖像采集、虹膜預(yù)處理、虹膜特征提取、匹配識(shí)別4個(gè)主要部分組成,其中,特征提取是虹膜識(shí)別的關(guān)鍵環(huán)節(jié),決定了識(shí)別系統(tǒng)的性能。因此,本文重點(diǎn)闡述虹膜識(shí)別中的特征提取和匹配識(shí)別。
虹膜圖像在采集的過(guò)程中,由于受光照、眼瞼、睫毛等因素的影響,采集到的圖像會(huì)含有不同程度的噪聲,為了準(zhǔn)確地將虹膜紋理區(qū)域從采集到的虹膜圖像中分割,消除不利因素對(duì)虹膜特征提取及匹配識(shí)別的影響,要先進(jìn)行虹膜預(yù)處理。虹膜預(yù)處理包括圖像灰度化、虹膜定位、歸一化和圖像增強(qiáng)。整個(gè)虹膜的預(yù)處理過(guò)程如圖1所示。
2.2.1 Wrapping算法的快速離散curvelet變換
Candès和 Donoho在脊波(ridgelet)變換基礎(chǔ)上提出了曲波變換,之后又提出快速離散曲波變換 (fast discrete curvelet transform,F(xiàn)DCT)。FDCT采用新框架結(jié)構(gòu),減少了參數(shù),實(shí)現(xiàn)起來(lái)更加快速、簡(jiǎn)單。根據(jù)實(shí)現(xiàn)方法的不同,可分為基于Wrapping算法的快速離散曲波變換 (FDCT_Wrap)和基于非均勻空間抽樣二維FFT算法的快速離散曲波變換(FDCT_USFFT)。本文采用FDCT_Wrap方法[8],實(shí)現(xiàn)過(guò)程如下:
· 在給定笛卡爾坐標(biāo)下對(duì)圖像 F[t1,t2]∈L2(R)(0≤t1,t2<ω,ω 為頻域參量)進(jìn)行二維 Fourier(傅里葉)變換,得到二維頻率函數(shù) F[n1,n2],-n/2≤n1,n2<n/2(n 為矩陣行數(shù));
· 在頻域中對(duì)每一對(duì)尺度方向(j,l)組合重采樣,得到新的采樣函數(shù) F[n1,n2-n1tan θl],-π/4≤θl≤π/4;
· 計(jì)算 fj,l[n1,n2]=F[n1,n2-n1tan θl]×Uj[n1,n2],其中,Uj(n1,n2)為窗函數(shù);
·圍繞原點(diǎn)使用Wrapping算法做局部化處理;
·對(duì)每一個(gè)fj,l進(jìn)行二維逆Fourier變換,得到離散curvelet系數(shù) cD(j,l,k),D 代表discrete。
其中,j、l、k分別為尺度參量、方向參量、位移參量。
2.2.2 特征提取
圖1 虹膜圖像預(yù)處理過(guò)程
對(duì)預(yù)處理的虹膜圖像進(jìn)行Wrapping算法的快速離散curvelet變換,得到不同尺度和不同方向的curvelet子帶,圖2為curvelet變換各層系數(shù)重構(gòu)結(jié)果。虹膜圖像經(jīng)curvelet變換后,被劃分為5個(gè)尺度層。第1層為coarse尺度層,由低頻系數(shù)組成,包含虹膜圖像的基本信息,反映虹膜圖像概貌;第2、3、4層為detail尺度層,每層系數(shù)被分解為4個(gè)方向,由中、高頻系數(shù)組成,體現(xiàn)虹膜圖像的細(xì)節(jié)信息和邊緣特征;第5層為fine尺度層,由高頻系數(shù)組成,反映虹膜的斑點(diǎn)、收縮褶、細(xì)絲等紋理特征的分布情況及邊緣特征。分別計(jì)算每層系數(shù)矩陣的均值、方差和能量,計(jì)算式分別為式(1)~式(3)。
其中,c(k1+i,k2+j)為對(duì)應(yīng)圖像在第i層j方向子帶的系數(shù)矩陣,m×n為子帶系數(shù)矩陣的大小。
curvelet變換各層系數(shù)重構(gòu)結(jié)果如圖2所示。
圖2 curvelet變換各層系數(shù)重構(gòu)結(jié)果
對(duì)虹膜圖像進(jìn)行FDCT_Wrap獲取虹膜圖像局部特征后,針對(duì)圖像不同子帶系數(shù)矩陣分類能力的不同,利用廣義高斯分布估算各子帶的權(quán)值,為分類能力較強(qiáng)的特征向量賦予較大權(quán)值,為分類能力較弱的特征向量賦予較小權(quán)值。通過(guò)特征加權(quán),將利用FDCT_Wrap提取的不同子帶信息的重要性反映到虹膜圖像最終特征向量中。
GGD概率分布函數(shù)為:為Γ函數(shù),ξ為尺度參數(shù),σ為形狀參數(shù)。
構(gòu)造δ函數(shù):
則:
ξ估計(jì)值為:
利用尺度參數(shù)ξ,求得特征加權(quán)數(shù)值為:
經(jīng)特征加權(quán)后的不同尺度和方向的curvelet子帶系數(shù)矩陣的均值、方差和能量分別為。,融合每層特征向量vi為用于匹配識(shí)別的特征向量由此獲得每層特征向量(k為通道數(shù)量)。
2.3.1 模糊支持向量機(jī)原理
Vapnik等人[9]提出的統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(support vector machine,SVM),通過(guò)引入結(jié)構(gòu)風(fēng)險(xiǎn),在尋找最優(yōu)分類超平面作為決策函數(shù)的前提下,將分類問(wèn)題轉(zhuǎn)化為線性約束的凸二次規(guī)劃。針對(duì)小樣本問(wèn)題,支持向量機(jī)已成為當(dāng)前模式識(shí)別領(lǐng)域中的優(yōu)選分類器,實(shí)現(xiàn)對(duì)假設(shè)函數(shù)集的控制,使學(xué)習(xí)機(jī)在經(jīng)驗(yàn)風(fēng)險(xiǎn)和過(guò)擬合之間取折中,獲得較好的推廣能力。但在虹膜圖像的分類識(shí)別過(guò)程中,如果訓(xùn)練樣本中含有噪聲點(diǎn)等“異?!毙畔?,SVM分類過(guò)程就容易出現(xiàn)過(guò)學(xué)習(xí)或者欠學(xué)習(xí)現(xiàn)象,因而不能獲取真正最優(yōu)分類面。針對(duì)此情況,Lin等人[10]提出了模糊支持向量機(jī),引入模糊集理論,依據(jù)不同的訓(xùn)練樣本在分類中對(duì)SVM的貢獻(xiàn)不同,賦予不同的模糊隸屬度[10],來(lái)削弱噪聲點(diǎn)對(duì)分類的不利影響,以區(qū)分噪聲等異常信息與有效樣本。
設(shè)n個(gè)獨(dú)立同分布訓(xùn)練樣本集X={(xi,yi,)|xi∈Rn,yi=±1,∈[ε,1],i=1,…,n}和核函數(shù) K(xi,xj),根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論,求解FSVM最優(yōu)分類面可歸結(jié)為如下二次規(guī)劃:
其中,C為懲罰因子且 C>0,b取類中心點(diǎn)的值,ξi為松弛因子且 ξi≥0。
利用Lagrange(拉格朗日)函數(shù),上述規(guī)劃的Wolfe對(duì)偶規(guī)劃為:
這樣模糊支持向量機(jī)的決策函數(shù)為:
2.3.2 FSVM與二叉決策樹(shù)相結(jié)合的分類算法
當(dāng)訓(xùn)練樣本數(shù)和類別數(shù)較多時(shí),F(xiàn)SVM算法的時(shí)間復(fù)雜度較大,因而采用與二叉決策樹(shù)相結(jié)合的方法來(lái)降低算法時(shí)間復(fù)雜度。
設(shè)訓(xùn)練樣本集為X,總類別集為M。
步驟1 定義一個(gè)二叉決策樹(shù)Bdt={node(i)}。變量node(i)包含4個(gè)域:node(i).C存放當(dāng)前節(jié)點(diǎn)所包含的類別號(hào);node(i).P+和node(i).P-分別存放當(dāng)前節(jié)點(diǎn)指向的正子節(jié)點(diǎn)和負(fù)子節(jié)點(diǎn)的指針;node(i).S表示訓(xùn)練的順序。令node(i).C={1,2,…,M}(M 為類別數(shù)),node(i).P+=node(i).P-=0,node(i).S=0,終節(jié)點(diǎn)數(shù)Endnode=0。當(dāng)前節(jié)點(diǎn)指針i=1,新生成節(jié)點(diǎn)指針j=1,訓(xùn)練次數(shù)s=1。
步驟2 在節(jié)點(diǎn)i上,判斷node(i).C中的元素個(gè)數(shù)是否為1。如果是,節(jié)點(diǎn)i是終節(jié)點(diǎn),轉(zhuǎn)向步驟4;否則繼續(xù)。
步驟3 用聚類算法將node(i).C中的類別號(hào)分成兩組,同時(shí)生成兩個(gè)子結(jié)點(diǎn)node(j+1)和node(j-1)。令node(i).P+=j+1,node(i).P-=j-1,node(i).S=s,node(j+1).P±=node(j-1).P±=0,node(j+1).S=node(j-1).S=0。
在node(j+1).C中存放正樣本組類別號(hào),在node(j-1).C中存放負(fù)樣本組類別號(hào)。此時(shí)訓(xùn)練樣本集X等于node(i).C所含類別的所有樣本,對(duì)應(yīng)的輸出為Y=其中,class(xi)表示樣本xi的所屬類別。用FSVM訓(xùn)練,得到Lagrange乘子和閾值{as,bs}。令 i=i+1,j=j+1,s=s+1,轉(zhuǎn)向步驟 2。
步驟4 令Endnode=Endnode+1,判斷終節(jié)點(diǎn)個(gè)數(shù)Endnode是否等于類別數(shù)M。如果是Bdt,保存Bdt,算法結(jié)束;否則i=i+1,轉(zhuǎn)向步驟 2。
為了對(duì)本文提出的虹膜識(shí)別算法性能進(jìn)行分析評(píng)價(jià),采用UBIRIS V1[11]和CASIA-Iris V2.0[12]虹膜數(shù)據(jù)庫(kù)進(jìn)行仿真實(shí)驗(yàn)。其數(shù)據(jù)庫(kù)中的部分虹膜圖像如圖3和圖4所示。
圖3 UBIRIS虹膜數(shù)據(jù)庫(kù)中的部分虹膜圖像
圖4 CASIA虹膜數(shù)據(jù)庫(kù)中的部分虹膜圖像
為了驗(yàn)證本文提出的基于廣義高斯分布Wrapping算法的快速離散curvelet變換分解后,低頻均值、方差和高頻能量組成的特征向量是虹膜圖像的最優(yōu)特征表示,利用FDCT_Wrap分別對(duì)兩個(gè)數(shù)據(jù)庫(kù)中的虹膜圖像進(jìn)行分解,提取出低頻分量和高頻分量,并將低頻分量、高頻分量以及它們的組合分別輸入同一分類器中進(jìn)行分類識(shí)別,通過(guò)正確識(shí)別率 (correct recognition rate,CRR)和錯(cuò)誤識(shí)別率(error recognition rate,ERR)進(jìn)行比較,實(shí)驗(yàn)結(jié)果見(jiàn)表1、表2。
由表1和表2可看出,特征加權(quán)能進(jìn)一步提高虹膜圖像識(shí)別率。在UBIRIS虹膜數(shù)據(jù)庫(kù)中進(jìn)行仿真實(shí)驗(yàn),選用廣義高斯分布FDCT_Wrap提取的低頻子帶系數(shù)矩陣的均值、方差作為特征向量,識(shí)別準(zhǔn)確率為93.23%;選用高頻子帶能量作為特征向量,識(shí)別準(zhǔn)確率僅為83.48%;將低頻均值、方差和高頻能量組合作為特征向量,識(shí)別準(zhǔn)確率達(dá)到98.16%。在CASIA虹膜數(shù)據(jù)庫(kù)中進(jìn)行仿真實(shí)驗(yàn),選用廣義高斯分布FDCT_Wrap提取的低頻子帶系數(shù)矩陣的均值、方差作為特征向量,識(shí)別準(zhǔn)確率為93.86%;選用高頻子帶能量作為特征向量,識(shí)別準(zhǔn)確率僅為84.57%;將低頻均值、方差和高頻能量組合作為特征向量,識(shí)別準(zhǔn)確率達(dá)到98.83%。由此可見(jiàn)使用廣義高斯分布FDCT_Wrap分解后的低頻子帶系數(shù)矩陣的均值、方差能較好地表征虹膜紋理的基本特征,將其與高頻子帶能量組成特征向量組進(jìn)行識(shí)別,提高了識(shí)別準(zhǔn)確率,是用于虹膜識(shí)別的較佳特征組合。
表1 UBIRIS庫(kù)測(cè)試結(jié)果
表2 CASIA庫(kù)測(cè)試結(jié)果
表3 不同方法的UBIRIS庫(kù)性能比較
表4 不同方法的CASIA庫(kù)性能比較
為了驗(yàn)證本文算法的效果和性能,將該算法與基于小波變換的虹膜識(shí)別算法進(jìn)行對(duì)比實(shí)驗(yàn)。實(shí)驗(yàn)采用識(shí)別準(zhǔn)確率較高且變化速度較快的Gabor小波和Haar小波,對(duì)虹膜圖像進(jìn)行分解,提取虹膜紋理特征,分別采用漢明距離(hamming distance,HD)、SVM、二叉決策樹(shù)FSVM進(jìn)行匹配識(shí)別。對(duì)錯(cuò)誤接受率 (false acceptance rate,F(xiàn)AR)、 錯(cuò)誤拒絕率(false rejection rate,F(xiàn)RR)和正確識(shí)別率 (correct recognition rate,CRR)3個(gè)指標(biāo)進(jìn)行比較,實(shí)驗(yàn)結(jié)果見(jiàn)表3、表4。
通過(guò)對(duì)表3和表4的分析可知,對(duì)于不同的特征提取方法和不同的匹配識(shí)別方法,本文提出的改進(jìn)curvelet變換的虹膜識(shí)別準(zhǔn)確率比其他方法高,識(shí)別錯(cuò)誤率相應(yīng)降低,說(shuō)明采用廣義高斯分布FDCT_Wrap和二叉決策樹(shù)FSVM的虹膜特征提取與識(shí)別算法的性能更優(yōu),能有效提高虹膜識(shí)別效果,具有較好的穩(wěn)定性和較強(qiáng)的頑健性。
為了更好地評(píng)價(jià)算法的優(yōu)劣,采用ROC曲線表示。ROC曲線越接近坐標(biāo)軸,說(shuō)明匹配識(shí)別性能越好。對(duì) UBIRIS和CASIA虹膜數(shù)據(jù)庫(kù),分別采用Farouk[2]算法、Rajbhoj[3]算法、Rahulkar[5]算法以及本文提出算法的ROC曲線對(duì)比如圖5、圖6所示。從圖5可知,本文提出的算法在相同F(xiàn)AR下FRR更小,這表示本文提出的算法提取虹膜紋理特征性能更好,識(shí)別準(zhǔn)確率更高。
圖5 UBIRIS虹膜數(shù)據(jù)庫(kù)不同算法的ROC曲線
圖6 CASIA虹膜數(shù)據(jù)庫(kù)不同算法的ROC曲線
本文提出的基于廣義高斯分布Wrapping算法的快速離散curvelet變換和二叉決策樹(shù)模糊支持向量機(jī)的虹膜特征提取與識(shí)別算法的識(shí)別性能有較明顯的改進(jìn)。該方法適合應(yīng)用在對(duì)安全性要求較高的實(shí)時(shí)性身份認(rèn)證系統(tǒng)中。利用廣義高斯分布Wrapping算法的快速離散curvelet變換提取虹膜特征向量,有效地避免了小波變換不具有空間各向異性的缺陷,結(jié)合二叉決策樹(shù)FSVM算法,獲得了較理想的識(shí)別效果。
[1]孫冬,周俊,魏勇.基于Haar小波的虹膜特征提取算法[J].科學(xué)技術(shù)與工程,2014,1(14):81-85.SUN D,ZHOU J,WEI Y.Iris feature extraction based on Haar wavelet[J].Science Technology and Engineering,2014,1(14):81-85.
[2]FAROUK R M.Iris recognition based on elastic graph matching and Gabor wavelets[J].Computer Vision and Image Understanding,2011,115(8):1239-1244.
[3]RAJBHOJ S M,MANE P B.Haar wavelet approach of iris textureextraction forpersonalrecognition[J].International Journal of Innovative Technology and Exploring Engineering,2013,3(2):22-25.
[4]KARTHIKEYAN V.Novel algorithm for iris biometrics using fast wavelet transforms[J].International Journal of Engineering Sciences and Research Technology,2014,3(3):1481-1484.
[5]RAHULKAR A D,JADHAV D V,HOLAMBE R S.Fast discrete curvelet transform based anisotropic iris coding and recognition using k-out-of-n:a fused post-classifier[J].Machine Vision and Applications,2012,23(6):1115-1127.
[6]DHAGEA S S,HEGDEA S S,MANIKANTANA K,et al.DWT-based feature extraction and radon transform based contrast enhancement for improved iris recognition[J].Procedia Computer Science,2015,1(45):256-265.
[7]ABDULLAH H N,ABDULLAH A A.Iris recognition using wavelet transform and artificial neural networks[J].Engineering&Technology Journal,2015,33(6):877-888.
[8]CANDES E J,DEMANET L,DONOHO D L,et al.Fast discrete curvelet transforms[J].Multiscale Modeling&Simulation,2006,5(3):861-899.
[9]VAPNIKV N.An overview of statistical learning theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[10]LIN C F,WANG S D.Fuzzy support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):464-471.
[11]PROENCA H,ALEXANDRE LA.UBIRIS:a noisy iris image database[J].Lecture Notes in Computer Science,2005(3617):970-977.
[12]CASIA-Iris V2[EB/OL].(2007-12-20)[2015-12-14].http://www.cbsr.ia.ac.cn/Iris Database.htm.
Iris recognition based on generalized Gaussian distribution FDCT_Wrap and FSVM
HE Zhenhong
Department of Computer Science,Gansu Normal University for Nationalities,Hezuo 747000,China
In order to improve the accuracy rate of iris recognition,an improved curvelet transform algorithm for iris recognition was proposed.Firstly,the iris image was decomposed with fast discrete curvelet transform by wrapping algorithm.Mean variance and energy of curvelet sub-band coefficients in different scales and different orientations were extracted.The weights of sub-bands were estimated by generalized Gaussian distribution.The feature vectors with stronger classification ability had large weight,which were calculated to constitute feature vectors of iris image.Finally,feature vectors were matched and recognized by classifier combined with fuzzy support vector machine and binary decision tree.The algorithm performances were tested with UBIRIS and CASIA iris database.Simulation results show that the proposed algorithm has higher recognition accuracy rate and efficiency.It is feasibility.
generalized Gaussian distribution,iris recognition,curvelet transform,fuzzy support vector machine,binary decision tree
Scientific Research Project in Gansu Provincial Colleges and Universities(No.2015B-119)
TP391
A
10.11959/j.issn.1000-0801.2016200
2015-12-24;
2016-07-12
甘肅省高等學(xué)??蒲许?xiàng)目(No.2015B-119)
何 振 紅 (1979-), 女 , 甘 肅 民 族 師 范 學(xué) 院 講師,主要研究方向?yàn)閳D像處理、模式識(shí)別。