吳祖慷, 朱曉冬, 劉元寧, 王超群, 周智勇
(1. 吉林大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 長春 130012; 2. 吉林大學(xué) 符號計(jì)算與知識工程教育部重點(diǎn)實(shí)驗(yàn)室, 長春 130012; 3. 吉林大學(xué) 軟件學(xué)院, 長春 130012)
近年來, 人們對信息安全的需求日益增加, 生物信息識別技術(shù)憑借高精度等突出優(yōu)勢正逐步取代傳統(tǒng)身份認(rèn)證方法, 虹膜識別技術(shù)更是由于高識別率和可靠性而得到廣泛關(guān)注. 虹膜識別過程主要包括圖像采集、 預(yù)處理、 特征提取和特征識別4個(gè)模塊. 獲取圖像的質(zhì)量優(yōu)劣直接影響系統(tǒng)的識別效果, 所以在處理虹膜圖像前設(shè)置虹膜圖像的質(zhì)量評價(jià)步驟十分必要[1].
Daugman[2]通過計(jì)算整幅圖像的二維Fourier頻譜中的高頻能量判斷虹膜圖像的清晰度; Wildes[3]利用虹膜外邊緣處的灰度變化值評價(jià)圖像粗糙程度; 陳戟等[4]使用基于小波包分解的方法評判虹膜圖像紋理質(zhì)量. 在評價(jià)指標(biāo)融合方面, Aditya等[5]采用累加計(jì)算評估因素的方法進(jìn)行圖像多方位質(zhì)量測評; Gao[6]提出了粗-精評價(jià)指標(biāo)相結(jié)合的方法, 并利用支持向量機(jī)(support vector machine, SVM)對指標(biāo)進(jìn)行融合得到分類結(jié)果; 晁靜靜等[7]利用GA-BP(genetic algorithm-back proagation)神經(jīng)網(wǎng)對多指標(biāo)進(jìn)行融合完成對虹膜圖像的綜合評價(jià).
為提高虹膜圖像質(zhì)量評價(jià)方法的準(zhǔn)確性, 本文結(jié)合ISO/IEC 27974-6: 2015[8]國際虹膜圖像質(zhì)量評價(jià)參考指標(biāo), 首先提出基于圖像處理的虹膜圖像活性檢測方法, 然后利用清晰度評價(jià)指標(biāo)對虹膜圖像進(jìn)行初步篩選, 最后利用離心度、 瞳孔放縮度、 瞳孔有效區(qū)域、 虹膜圓環(huán)區(qū)域清晰度4個(gè)評價(jià)指標(biāo), 結(jié)合SVM對指標(biāo)進(jìn)行有效融合, 并利用遺傳算法(GA)對模型進(jìn)行參數(shù)優(yōu)化. 通過GA-SVM模型對圖像的質(zhì)量評價(jià)結(jié)果進(jìn)行訓(xùn)練, 預(yù)測虹膜圖像的綜合評估分?jǐn)?shù), 本文方法的框架如圖1所示.
圖1 本文方法框架Fig.1 Framework of proposed method
為杜絕偽造和盜取他人的生物信息用于身份識別, 在質(zhì)量評價(jià)前, 通常需要判定輸入的虹膜圖像是否具有活性. 目前的經(jīng)典方法有利用瞳孔收縮反應(yīng)[9]、 基于神經(jīng)網(wǎng)絡(luò)二分類、 透鏡接觸方法、 動(dòng)作指令檢測、 光場成像[10]等. 本文利用圖像處理中圖像減法運(yùn)算完成對序列虹膜圖像的動(dòng)態(tài)檢測, 對序列相鄰兩幅圖像灰度值分量相減, 得到目標(biāo)的動(dòng)態(tài)表達(dá). 選取某類虹膜序列圖像8張, 若相鄰圖像間發(fā)生動(dòng)態(tài)變化, 則同一人在不同波段的圖像便會(huì)呈現(xiàn)圖像間的差別, 如圖2前7張序列相鄰圖像的動(dòng)態(tài)表達(dá); 相反, 通過偽造等不具有活性的虹膜圖像通常不會(huì)呈現(xiàn)圖像的動(dòng)態(tài)性, 如圖2最后一張圖片. 表1列出了序列圖像瞳孔參數(shù)的變化, 由表1瞳孔坐標(biāo)(x,y)和半徑參數(shù)r的變化可知, 序列圖像是活性動(dòng)態(tài)的.
表1 序列圖像瞳孔參數(shù)的變化
圖2 序列相鄰圖像的動(dòng)態(tài)表達(dá)Fig.2 Dynamic expression of sequential adjacent images
首先對虹膜圖像進(jìn)行清晰度評價(jià), 本文采用Laplace梯度法[11]. 設(shè)虹膜圖像為M×N維, 利用二階Laplace算子對原始虹膜圖像進(jìn)行卷積, 分別提取水平和豎直方向的梯度, 計(jì)算平均灰度值, 作為清晰度指標(biāo)值Q1.圖像越清晰,Q1值越大, 并對Q1值小于設(shè)定閾值W1的圖像進(jìn)行篩除, 根據(jù)不同類別數(shù)據(jù)分別選取閾值W1.清晰度評價(jià)指標(biāo)計(jì)算公式為
(1)
其中Gx(x,y)和Gy(x,y)分別表示虹膜圖像像素點(diǎn)f(x,y)和卷積模板作用的結(jié)果.本文同時(shí)利用DefRto失焦檢測對Laplace梯度法進(jìn)行補(bǔ)充, 得到失焦檢測值DR, DR值越小表示圖像失焦越嚴(yán)重, 對虹膜圖像清晰度的評價(jià)結(jié)果如圖3所示.
圖3 同類不同樣本虹膜圖像的清晰度Fig.3 Definition of iris images of different samples in same class
首先對圖像進(jìn)行開閉運(yùn)算、 二值化、 Canny邊緣檢測等預(yù)處理, 得到一張?jiān)肼曒^少的虹膜圖像; 再采用Hough圓檢測方法完成對虹膜圖像的定位分割, 并得到瞳孔圓心坐標(biāo)、 半徑和虹膜半徑等參數(shù); 最后通過橡皮圈模型對分割圖像進(jìn)行歸一化處理, 調(diào)整歸一化圖像尺寸為512×64, 選取右上側(cè)睫毛眼瞼遮擋程度較小, 尺寸為256×32的ROI區(qū)域, 進(jìn)行直方圖均衡化[12]處理以增強(qiáng)圖像紋理特征, 效果如圖4所示.
在拍攝虹膜圖像時(shí), 會(huì)得到一些瞳孔偏移、 眼球翻轉(zhuǎn)程度較大和超邊界的圖像, 這些圖像通常會(huì)導(dǎo)致定位偏差和虹膜區(qū)域圖像不完整. 本文采用一種離心度評價(jià)指標(biāo), 即計(jì)算瞳孔圓心到圖像中心距離和圖像半對角線長度的比值大小, 離心度值越大表明圖像偏移程度越嚴(yán)重, 進(jìn)而對有上述問題的虹膜圖像進(jìn)行篩選. 設(shè)離心度評價(jià)指標(biāo)為L1, 計(jì)算公式為
(2)
其中Δd表示瞳孔中心到圖像中心的距離,d表示圖像對角半徑, (x1,y1)表示圖像中心點(diǎn)坐標(biāo), (xpupil,ypupil)表示瞳孔中心坐標(biāo).對虹膜圖像的離心度評價(jià)結(jié)果如5所示.
圖4 虹膜圖像的定位、 分割、 歸一化、 增強(qiáng)結(jié)果Fig.4 Localization, segmentation, normalization and enhancement results of iris images
圖5 虹膜圖像偏移度測試結(jié)果Fig.5 Results of deviation test of iris images
1.4.1 瞳孔放縮檢測
人眼瞳孔受到光強(qiáng)影響會(huì)產(chǎn)生縮放現(xiàn)象, 當(dāng)瞳孔擴(kuò)放程度較大時(shí), 會(huì)減少虹膜的有效紋理信息量, 難以提取更多的虹膜特征.本文通過瞳孔放縮評價(jià)指標(biāo), 對瞳孔過分?jǐn)U張的虹膜進(jìn)行篩查.通過對虹膜圖像進(jìn)行定位處理, 得到瞳孔區(qū)域的半徑值和虹膜外圓的半徑值, 設(shè)瞳孔放縮評價(jià)指標(biāo)為T1, 計(jì)算公式為
(3)
其中Spupil表示瞳孔區(qū)域面積,Siris表示虹膜區(qū)域面積,T1表示虹膜有效可用區(qū)域占比.T1值越大, 虹膜圖像包含的特征信息越多, 越有利于特征提取和識別.對虹膜圖像瞳孔放縮的評價(jià)結(jié)果如圖6所示.
圖6 虹膜圖像瞳孔擴(kuò)張、 收縮檢測結(jié)果Fig.6 Pupil dilation and contraction detection results of iris images
1.4.2 瞳孔有效區(qū)域
本文采用的虹膜定位方法為同心圓檢測, 因而瞳孔被睫毛、 眼瞼遮擋程度會(huì)反應(yīng)出虹膜圖像的遮擋程度和有效區(qū)域面積.在定位階段, 若瞳孔可見區(qū)域較小, 則Hough圓無法檢測出瞳孔圓, 由此可篩除閉眼程度較大的虹膜圖像. 對于其余閉眼情形, 本文提出一種瞳孔有效區(qū)域評價(jià)指標(biāo), 利用對虹膜圖像瞳孔黑色素個(gè)數(shù)和瞳孔內(nèi)圓面積的占比, 反映瞳孔的有效區(qū)域面積, 從而側(cè)面反映虹膜有效區(qū)域占比程度, 篩除包含紋理特征較少的虹膜圖像. 設(shè)瞳孔有效區(qū)域評價(jià)指標(biāo)為T2, 計(jì)算公式為
(4)
其中Spupil表示表示瞳孔區(qū)域面積,Bpupil表示瞳孔區(qū)域黑色像素點(diǎn)個(gè)數(shù), 得到評價(jià)結(jié)果如圖7所示.
圖7 虹膜圖像瞳孔有效區(qū)域檢測結(jié)果Fig.7 Pupil effective area detection results of iris images
虹膜圖像的清晰評價(jià)是針對整幅虹膜圖像進(jìn)行的, 篩除的多數(shù)為由于移動(dòng)和眨眼導(dǎo)致的運(yùn)動(dòng)模糊圖像, 不能有效評判人眼部分離焦模糊.實(shí)際上, 對虹膜圖像定位分割后得到的虹膜圓環(huán)區(qū)域紋理的清晰度更能表達(dá)虹膜圖像質(zhì)量的優(yōu)劣.因此, 本文提出一種基于歸一化虹膜區(qū)域圖像和ROI區(qū)域的清晰度評價(jià)方法, 評價(jià)指標(biāo)記為Qnor和Qroi, 評價(jià)方法同樣利用Laplace梯度方法, 對歸一化后的虹膜區(qū)域進(jìn)行清晰度質(zhì)量評價(jià). 設(shè)虹膜圓環(huán)區(qū)域清晰度評價(jià)指標(biāo)為
Q2=ω1×Qnor+ω2×Qroi,
其中ω1和ω2為Qnor和Qroi對應(yīng)的權(quán)值, 評價(jià)結(jié)果如圖8所示.
圖8 虹膜圓環(huán)區(qū)域清晰度評價(jià)結(jié)果Fig.8 Evaluation results of definition of iris cirrus region
對圖像質(zhì)量特征進(jìn)行融合, 就是構(gòu)造一個(gè)關(guān)于特征和圖像質(zhì)量的映射模型[13].目前已有很多融合的分類方法, 如Bayes概率方法、 神經(jīng)網(wǎng)絡(luò)方法等, 但上述方法均存在參數(shù)較多、 易陷入局部最優(yōu)等問題[14]. 而SVM具有小樣本、 處理非線性能力強(qiáng)、 精度高等特點(diǎn), 所以本文選用SVM作為指標(biāo)融合分類器. SVM利用核函數(shù)將低維的輸入空間數(shù)據(jù)通過非線性映射函數(shù)映射到高維特征空間, 將輸入空間中線性不可分問題轉(zhuǎn)化為特征空間中的線性可分問題; 輸入要分類樣本的特征向量矩陣, 同樣本標(biāo)簽一起放入模型中訓(xùn)練, 輸出分類結(jié)果. 但SVM仍存在許多問題, 如: 由于樣本集數(shù)量對訓(xùn)練模型的泛型及適用性會(huì)產(chǎn)生影響, 因此如何選取合適的樣本集; 如何選擇適用樣本特點(diǎn)的核函數(shù); 如何確定最優(yōu)的核函數(shù)參數(shù)以及平衡系數(shù)等. 為提高SVM分類精度及對參數(shù)進(jìn)行有效優(yōu)化, 本文選取具有全局擇優(yōu)能力強(qiáng)、 不易陷入局部最優(yōu)解及自適應(yīng)和自學(xué)習(xí)等優(yōu)點(diǎn)的GA作為參數(shù)優(yōu)化方法.
SVM分類器設(shè)計(jì)的關(guān)鍵是確定核函數(shù). 高斯核通過比較樣本間的相似度, 在一個(gè)刻畫相似度的空間中, 使同類樣本更好地聚集, 進(jìn)而線性可分. 徑向基核(radial basis function, RBF)作為高斯核最常用的一種, 在處理大部分問題時(shí)效果都不會(huì)出現(xiàn)較大偏差, 且RBF需要確定的參數(shù)比其他核函數(shù)少, 函數(shù)復(fù)雜程度更低, 因此本文選用RBF核函數(shù).
優(yōu)化SVM分類器的關(guān)鍵是確定懲罰系數(shù)C和核參數(shù)γ.懲罰系數(shù)C值越大, 對誤分類的懲罰越大, 對訓(xùn)練集測試準(zhǔn)確率高, 但泛化能力較弱;C值越小, 對誤分類懲罰越小, 允許容錯(cuò), 將其作為噪聲點(diǎn), 泛化能力較強(qiáng).本文采用GA對SVM進(jìn)行優(yōu)化的算法流程如圖9所示.
GA對SVM進(jìn)行優(yōu)化的算法主要步驟如下.
1) 數(shù)據(jù)標(biāo)準(zhǔn)化: 對訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理, 消除量綱差異.
2) 編碼和種群初始化: 對懲罰系數(shù)C和核參數(shù)γ編碼, 隨機(jī)生成初始化種群.
3) GA停止優(yōu)化判斷: 計(jì)算個(gè)體適應(yīng)度, 并對種群進(jìn)行選擇、 交叉、 變異, 直至滿足GA終止條件, 得到優(yōu)化參數(shù).
4) SVM分類精度判斷: 將得到的優(yōu)化參數(shù)應(yīng)用到SVM分類器中進(jìn)行實(shí)驗(yàn)測試, 判斷是否符合期望精度, 若未達(dá)到, 則轉(zhuǎn)步驟3).
5) 測試分類: 利用訓(xùn)練好的GA-SVM模型對測試集進(jìn)行分類, 得到分類結(jié)果.
圖9 基于GA選取最優(yōu)參數(shù)流程Fig.9 Process of selecting optimal parameters based on GA
本文實(shí)驗(yàn)環(huán)境為CPU主頻2.20 GHz, 內(nèi)存4 GB, Win10操作系統(tǒng), 編程工具為VS2010和Python 3.9.0. 實(shí)驗(yàn)選用吉林大學(xué)生物信息識別實(shí)驗(yàn)室自主采集的JLU-6.0虹膜庫(http://www.jlucomputer.com/index/irislibrary/irislibrary.html)作為實(shí)驗(yàn)虹膜庫, 包含103類圖像, 左右雙眼, 每類400張圖像, 共計(jì)82 400張圖像; 本文選取JLU-6.0虹膜庫中50類圖像, 每類包含100張圖像, 共計(jì)5 000張虹膜圖像. 其中通過清晰度指標(biāo)初步篩除203張模糊圖像, 將剩余的4 797張圖像構(gòu)成實(shí)驗(yàn)數(shù)據(jù)集IrisData, 并根據(jù)匹配結(jié)果對每個(gè)樣本進(jìn)行標(biāo)記. 然后將IrisData按質(zhì)量優(yōu)劣分成三部分, 其中質(zhì)量較好部分包含1 535張圖像, 質(zhì)量合格部分包含2 734張圖像, 質(zhì)量不合格部分包含528張圖像. 質(zhì)量較好是指通過計(jì)算綜合質(zhì)量分?jǐn)?shù)評分較高且針對任何方法都能進(jìn)行匹配的樣本數(shù)據(jù), 故本文重點(diǎn)研究剩余的兩類圖像. 通過對隨機(jī)3類數(shù)據(jù)的測試, 將樣本數(shù)據(jù)的訓(xùn)練集和測試集劃分為(1/2)∶(1/2),(2/3)∶(1/3)和(3/4)∶(1/4), 利用分類器訓(xùn)練優(yōu)化得到的平均分類準(zhǔn)確率分別為94.594 6%,94.898 0%,93.243 2%. 表2列出了不同比例訓(xùn)練集和測試集的分類準(zhǔn)確性. 參數(shù)測試如圖10所示. 考慮到既要滿足較高的準(zhǔn)確性, 又要兼顧有足夠的訓(xùn)練數(shù)據(jù)泛化模型, 因此本文從剩余3 262張質(zhì)量合格和不合格圖像中每部分隨機(jī)挑選出2/3共2 175張圖像作為訓(xùn)練集IrisData_Train, 剩余的1/3共1 087張圖像作為測試集IrisData_Test.
圖10 測試集∶訓(xùn)練集=(1/3)∶(2/3)時(shí)的參數(shù)測試結(jié)果Fig.10 Test results of parameters with a ratio of 1/3 test set to 2/3 training set
表2 不同比例訓(xùn)練集和測試集的分類準(zhǔn)確性
將離心度L1、 瞳孔放縮度T1、 瞳孔有效區(qū)域T2、 虹膜圓環(huán)區(qū)域清晰度Q2這4個(gè)測度評價(jià)指標(biāo)經(jīng)標(biāo)準(zhǔn)化處理, 將指標(biāo)數(shù)據(jù)轉(zhuǎn)化為[0,1]內(nèi)的數(shù), 以消除數(shù)量級差異較大導(dǎo)致的誤差, 加速網(wǎng)絡(luò)訓(xùn)練的收斂.數(shù)據(jù)標(biāo)準(zhǔn)化方法采用min-max法[15], 其函數(shù)形式為
w=(w-wmin)/(wmax-wmin),
(5)
其中wmax和wmin分別表示每類數(shù)據(jù)中得分最大和最小的指標(biāo)值.將標(biāo)準(zhǔn)化后的評價(jià)指標(biāo)分別作為樣本向量的分量, 樣本向量的表達(dá)式為
(6)
目前針對虹膜質(zhì)量評價(jià)算法性能的優(yōu)劣尚未統(tǒng)一標(biāo)準(zhǔn), 但評價(jià)方法需達(dá)到一定的準(zhǔn)確性[16-17].因此本文從評價(jià)指標(biāo)的準(zhǔn)確性和模型的分類準(zhǔn)確性兩方面進(jìn)行測試.
3.2.1 與主觀一致性的指標(biāo)有效性分析
為驗(yàn)證本文提出指標(biāo)的有效性, 針對上述指標(biāo), 從同一類400張虹膜圖像中選取8張質(zhì)量由低到高依次變化的樣本, 編號為1~8, 根據(jù)多測度指標(biāo)對相應(yīng)虹膜圖像樣本進(jìn)行評分.得到虹膜圖像不同質(zhì)量狀態(tài)和各評價(jià)指標(biāo)的關(guān)系如圖11所示.由圖11可見: 隨著虹膜圖像質(zhì)量狀態(tài)越來越好, 清晰度Q1、 虹膜圓環(huán)區(qū)域清晰度Q2指標(biāo)值呈增長趨勢, 且基于虹膜圓環(huán)區(qū)域評價(jià)相比于針對整幅圖像評價(jià)更能反映虹膜圖像清晰度的好壞程度, 如圖11(A)所示. 瞳孔有效區(qū)域T2指標(biāo)值越來越大, 離心度L1、 瞳孔放縮度T1值越來越小, 如圖11(B)所示.因此, 實(shí)驗(yàn)結(jié)果與本文所述的各指標(biāo)屬性基本一致, 本文提出的各評價(jià)指標(biāo)和主觀評價(jià)具有一致性, 即本文提出的各評價(jià)指標(biāo)是有效且準(zhǔn)確的.
圖11 與主觀一致性的指標(biāo)有效性分析結(jié)果Fig.11 Analysis results of effectiveness of indicators consistent with subjectivity
3.2.2 計(jì)算指標(biāo)順序?qū)|(zhì)量評價(jià)效率的影響
為降低評價(jià)因子的計(jì)算量, 在對虹膜圖像計(jì)算評價(jià)指標(biāo)值時(shí), 考慮到指標(biāo)值的計(jì)算依據(jù)對虹膜圖像的定位等操作, 本文對各指標(biāo)進(jìn)行了因果關(guān)系分析和順序調(diào)整, 分析結(jié)果如下.
1) 活體檢測: 無前提, 直接對圖像進(jìn)行形態(tài)學(xué)處理.
2) 清晰度: 無前提, 直接對圖像進(jìn)行函數(shù)運(yùn)算.
3) 離心度: 瞳孔定位, 得到瞳孔坐標(biāo)和半徑.
4) 瞳孔放縮度: 瞳孔定位, 虹膜定位, 得到瞳孔半徑和虹膜半徑.
5) 瞳孔有效區(qū)域: 瞳孔定位, 得到瞳孔半徑.
6) 虹膜圓環(huán)區(qū)域清晰度: 瞳孔定位, 虹膜定位, 歸一化, 截取圖像.
通過上述指標(biāo)依據(jù)的前提條件, 得到各指標(biāo)的關(guān)系順序: 1)→2)→5)→3)→4)→6), 對指標(biāo)順序進(jìn)行調(diào)整, 得到調(diào)整前后(單張圖像平均)的指標(biāo)計(jì)算時(shí)間列于表3.由表3可見, 合理對評價(jià)因子的計(jì)算順序進(jìn)行調(diào)整可縮短評價(jià)時(shí)間, 并提高評價(jià)效率.
表3 調(diào)整前后指標(biāo)計(jì)算時(shí)間的對比
3.2.3 GA-SVM模型分類準(zhǔn)確性分析
通過訓(xùn)練集IrisData_Train對GA-SVM進(jìn)行訓(xùn)練得到最優(yōu)參數(shù), 本文得C=1.87,γ=8.0; 根據(jù)GA-SVM訓(xùn)練模型對測試集IrisData_Test進(jìn)行分類, 正確率達(dá)98.804 0%, 因此, 本文提出的GA-SVM質(zhì)量評估分類模型能達(dá)到較好的正確分類率.
本文同時(shí)驗(yàn)證了SVM,BP,GA-BP方法對圖像質(zhì)量分類的準(zhǔn)確性, 對比結(jié)果列于表4.
表4 不同方法對圖像質(zhì)量分類準(zhǔn)確性的比較
3.2.4 質(zhì)量評價(jià)模型對虹膜圖像識別的影響
驗(yàn)證虹膜的識別率是檢驗(yàn)圖像質(zhì)量評價(jià)對虹膜識別是否有效的唯一判別方法. 本文對通過各方法模型篩選出的圖像進(jìn)行識別, 驗(yàn)證本文評價(jià)模型篩選的圖像更適用匹配認(rèn)證. 對虹膜圖像進(jìn)行預(yù)處理, 本文采用Gabor算法對增強(qiáng)處理后的ROI區(qū)域進(jìn)行特征提取, 并對比樣本特征圖像間的Hamming距離判斷虹膜是否匹配, 結(jié)果如圖12所示. 采用正確識別率(CRR)、 等錯(cuò)率(EER)指標(biāo)對各方法進(jìn)行測試, 結(jié)果列于表5.
圖12 Hamming距離計(jì)算虹膜圖像匹配Fig.12 Calculation of iris image matching based on Hamming distance
表5 不同方法對虹膜圖像識別的正確率和等錯(cuò)率
綜上所述, 為提高虹膜圖像質(zhì)量評價(jià)的準(zhǔn)確性, 本文提出了一種基于GA-SVM模型的多測度虹膜圖像質(zhì)量評價(jià)方法, 針對虹膜圖像質(zhì)量評價(jià)中普遍存在的問題給出了較全面的解決方案. 實(shí)驗(yàn)結(jié)果表明, 該方法在主觀評價(jià)一致性和與其他模型對比測試方面, 均得到了較準(zhǔn)確的分類效果.