李俊杰,高翠芳,黃 芳
(江南大學(xué)理學(xué)院,江蘇 無(wú)錫 214122)
指紋作為一類(lèi)常用的生物識(shí)別特征[1],與面孔、發(fā)音、虹膜、骨形等其他生物識(shí)別特征一樣,具有唯一性、穩(wěn)定性等特點(diǎn).相比于面孔、發(fā)音等易采集的生物識(shí)別特征,指紋具有一定的私密性,同時(shí)相比于虹膜、骨形等較復(fù)雜的生物識(shí)別特征,指紋又便于采集.綜合上述特點(diǎn),指紋識(shí)別技術(shù)被廣泛應(yīng)用在基于身份驗(yàn)證的支付、安防等相關(guān)鄰域.[2-3]近年來(lái),隨著智能移動(dòng)終端的快速發(fā)展,指紋識(shí)別技術(shù)已被大量應(yīng)用到智能移動(dòng)終端上[4],被快速商業(yè)化應(yīng)用.
在指紋識(shí)別過(guò)程中,一個(gè)關(guān)鍵步驟就是將從傳感器上采集來(lái)的指紋圖像進(jìn)行二值化處理[5].經(jīng)二值化后的指紋圖像僅留下前景指紋和背景部分,去除了原圖中的灰度噪聲,極大方便了后續(xù)的識(shí)別配對(duì).現(xiàn)有的指紋二值化處理大多采用基于指紋紋理的方向場(chǎng)技術(shù)[6-7],少部分基于濾波算法來(lái)實(shí)現(xiàn)[8].采用方向向量將含有灰度信息的指紋圖像轉(zhuǎn)化為二值圖像,基于方向技術(shù)的指紋圖像二值化算法可以同時(shí)完成指紋圖像的二值化處理以及細(xì)化處理.但方向場(chǎng)技術(shù)在計(jì)算過(guò)程中需要計(jì)算每個(gè)像素的方向向量,算法復(fù)雜度高,計(jì)算時(shí)間長(zhǎng),在實(shí)際應(yīng)用中存在一定的局限性.
考慮現(xiàn)有指紋二值化處理中存在的問(wèn)題,本文提出基于支持向量機(jī)(SVM)的指紋二值化處理方法.SVM[9]是一種有監(jiān)督的小樣本分類(lèi)方法,可利用先驗(yàn)知識(shí),通過(guò)小樣本快速完成分類(lèi).指紋二值化處理中,前景和背景在分類(lèi)前具有一定的先驗(yàn)知識(shí),灰度值較小的通常是前景,灰度值較大的通常是背景,憑此可運(yùn)用SVM進(jìn)行指紋二值化處理.
在SVM分類(lèi)過(guò)程中,如果只采用像素值一個(gè)特征量,可能會(huì)降低分類(lèi)精確度,尤其是在指紋圖像邊緣處.因此,本文又提出了一種4-鄰域均值模板來(lái)處理指紋圖像邊緣,并以此作為另一個(gè)特征量.同時(shí)利用灰度直方圖搜索算法,提取統(tǒng)計(jì)值較高的像素點(diǎn)作為訓(xùn)練集,通過(guò)4-鄰域均值模板以及直方圖搜索優(yōu)化訓(xùn)練集來(lái)提高分類(lèi)精度.
對(duì)于數(shù)據(jù)集T={[x1,y1],[x2,y2],…,[xN,yN]},{x1,x2,…,xN}∈RN為數(shù)據(jù)集的輸入空間,同時(shí)每一維x都有N個(gè)特征組成;{y1,y2,…,yN}∈{-1,1}為數(shù)據(jù)集中每一維輸入空間對(duì)應(yīng)的類(lèi)屬標(biāo)簽.SVM的目的是利用輸入空間以及標(biāo)簽集對(duì)數(shù)據(jù)集T進(jìn)行分類(lèi).
SVM作為一種有監(jiān)督式的學(xué)習(xí)算法,在一定程度上依賴(lài)于標(biāo)簽集的分類(lèi),因此在處理不確定標(biāo)簽問(wèn)題時(shí)存在一定的局限性,例如指紋灰度圖像中指紋圖形的邊緣像素點(diǎn)既可看作前景類(lèi),也可看作背景類(lèi).不同的標(biāo)簽類(lèi)會(huì)影響分類(lèi)結(jié)果,對(duì)訓(xùn)練造成影響.針對(duì)這一問(wèn)題,本文在原有指紋圖像像素值的基礎(chǔ)上引入新特征量來(lái)擴(kuò)充SVM中的訓(xùn)練集.同時(shí)采用出現(xiàn)頻率高的像素點(diǎn)作為樣本點(diǎn),使分類(lèi)精度進(jìn)一步提高.
指紋通過(guò)傳感器采集得到灰度圖像,灰度圖像用灰度值存儲(chǔ)為矩陣形式[5],不同的灰度值代表了圖像中不同的灰度,因此像素點(diǎn)灰度值可作為SVM學(xué)習(xí)過(guò)程中一個(gè)重要的特征.但是只有一維特征的情況下會(huì)導(dǎo)致分類(lèi)結(jié)果出現(xiàn)偏差,尤其是在圖形邊緣的像素點(diǎn),因此本文定義4-鄰域均值模板來(lái)處理圖形邊緣,并以其計(jì)算值作為另一維特征.
在樣本點(diǎn)的采樣過(guò)程中,為提高計(jì)算速度,本文采用等距采樣,同時(shí)為了提高分類(lèi)精度,在等距采樣的基礎(chǔ)上加入基于灰度直方圖的優(yōu)化算法,將等距采樣后樣本點(diǎn)周?chē)狈綀D統(tǒng)計(jì)量較多的像素點(diǎn)作為樣本點(diǎn),進(jìn)一步提高了分類(lèi)精度.
在指紋灰度圖像的前景和背景分類(lèi)問(wèn)題中,指紋紋理與紋理過(guò)度部分存在圖像邊緣的問(wèn)題[10],邊緣像素點(diǎn)判定會(huì)影響到后續(xù)的匹配識(shí)別,本文設(shè)計(jì)了4-鄰域均值模板,來(lái)提高算法在邊緣點(diǎn)分類(lèi)上的精確度.
設(shè)計(jì)的4-鄰域均值模板是在邊緣檢測(cè)算子的基礎(chǔ)上演變而來(lái)的.參考Prewitt算子[11]設(shè)計(jì)4-鄰域均值模板,Prewitt算子表達(dá)式為
(1)
在傳統(tǒng)的Prewitt算子中分別對(duì)列Gx和行Gy進(jìn)行計(jì)算,共計(jì)算中心像素點(diǎn)周?chē)?個(gè)像素點(diǎn)的值.為方便計(jì)算,考慮將行列融合,并且只計(jì)算上下左右4個(gè)方向的像素,通過(guò)模板中心像素點(diǎn)灰度值與4個(gè)方向像素點(diǎn)灰度值的差值絕對(duì)值的平均來(lái)構(gòu)造4-鄰域模板:
(2)
由(2)式可知,4-鄰域均值模板D計(jì)算了中間像素點(diǎn)Ii,j與上方像素點(diǎn)Ii-1,j、下方像素點(diǎn)Ii+1,j、左側(cè)像素點(diǎn)Ii,j-1、右側(cè)像素點(diǎn)Ii,j+1之間的差值的絕對(duì)值,通過(guò)相加這4個(gè)方向的差值,得到
∑D=(|Ii,j-Ii-1,j|+|Ii,j-Ii+1,j|+|Ii,j-Ii,j-1|+|Ii,j-Ii,j+1|).
(3)
4-鄰域均值模板相比于邊緣檢測(cè)中的Prewitt算子對(duì)模板中心像素點(diǎn)的權(quán)值更大,更能突出模板中心點(diǎn)像素值的重要性,同時(shí)通過(guò)一個(gè)模板計(jì)算4個(gè)方向,不需要2個(gè)模板計(jì)算,提高了計(jì)算速度.
在對(duì)生物圖像、醫(yī)學(xué)圖像等客觀圖像處理時(shí),需要保證圖像的原有特性[5],應(yīng)避免非線(xiàn)性變換,本文所構(gòu)造的4-鄰域均值模板就可以較好地滿(mǎn)足這一點(diǎn).以指紋圖像的灰度直方圖為例,計(jì)算結(jié)果如圖1所示.
(a)原始指紋圖像
(b)4-鄰域均值模板處理圖像
(a)原始指紋圖像灰度直方圖
(b)4-鄰域均值模板處理圖像灰度直方圖
圖1中白色背景都占據(jù)了絕大部分比例,為顯示圖像的特點(diǎn),本文手動(dòng)去除了直方圖中灰度值為255的點(diǎn).通過(guò)比較發(fā)現(xiàn),兩者圖像走勢(shì)基本相同,因此4-鄰域均值模板能較好地保存原圖像特征.
在原有的特征量基礎(chǔ)上,加入4-鄰域均值模板計(jì)算結(jié)果作為特征量,能在一定程度上提高SVM在圖像邊緣點(diǎn)判斷的準(zhǔn)確性.
在灰度圖像中,灰度直方圖是刻畫(huà)像素灰度值統(tǒng)計(jì)量的一個(gè)重要工具,在SVM訓(xùn)練樣本點(diǎn)的選取中,為了使分類(lèi)更加精確,需要更為準(zhǔn)確的先驗(yàn)知識(shí),因此選擇統(tǒng)計(jì)值較大的像素點(diǎn)作為SVM的訓(xùn)練樣本.但是為提高計(jì)算效率,保證樣本多樣性,本文采用局部統(tǒng)計(jì)值最大的像素點(diǎn)作為訓(xùn)練樣本點(diǎn),尋找樣本點(diǎn)的方法就是本文的直方圖搜索算法.
直方圖搜索算法分為2個(gè)部分,第一部分是對(duì)整個(gè)樣本空間進(jìn)行等距采樣,即采用相等的間距對(duì)255個(gè)灰度值進(jìn)行采樣,等距采樣公式為
Ii=Num255n-1?i(i=2,3,…,n-1).
(4)
其中:I為樣本點(diǎn),且I1=0,In=255;n為采樣個(gè)數(shù);Num255為將二維圖像矩陣展開(kāi)成一維向量,并從0到255進(jìn)行排序后,255像素第一次出現(xiàn)所對(duì)應(yīng)的值,本文對(duì)Num255之前的像素進(jìn)行等距采樣,并進(jìn)行直方圖搜索;i為樣本點(diǎn)標(biāo)號(hào),由于樣本點(diǎn)首尾固定,所以i從2標(biāo)到n-1;符號(hào)└┘為向下取整,保證樣本點(diǎn)標(biāo)號(hào)為整數(shù).
基于等距采樣的樣本點(diǎn)無(wú)法保證每個(gè)樣本點(diǎn)都有較大像素統(tǒng)計(jì)量,因此第二部分是在等距采樣的基礎(chǔ)上進(jìn)一步提出了直方圖搜索算法,在當(dāng)前樣本點(diǎn)的基礎(chǔ)上搜索它的前一個(gè)像素值以及后一個(gè)像素值,用最大的那個(gè)作為樣本點(diǎn),以此來(lái)保證樣本點(diǎn)在局部范圍內(nèi)有一個(gè)較大的像素統(tǒng)計(jì)量.算法1的直方圖搜索算法偽代碼為:
01 Begin02 輸入I_i //獲取當(dāng)前采樣點(diǎn)03 輸入H_i //獲取當(dāng)前像素值04 輸入I_i-1 //獲取前一個(gè)采樣點(diǎn)05 輸入H_i-1 //獲取前一個(gè)像素值06 if H_i>H_i-1 then07 H_i≥H_new08 I_i≥I_new09 else10 H_i-1≥H_new11 I_i-1≥I_new12 輸入I_i+1 //獲取后一個(gè)采樣點(diǎn)13 輸入H_i+1 //獲取后一個(gè)像素值14 if H_i+1 算法1中I_i存儲(chǔ)了所選取的樣本點(diǎn),H_i存儲(chǔ)了樣本點(diǎn)對(duì)應(yīng)的像素統(tǒng)計(jì)值,本文對(duì)等距采樣的結(jié)果進(jìn)行直方圖搜索更新.通過(guò)算法1可以實(shí)現(xiàn)樣本點(diǎn)的像素統(tǒng)計(jì)值在局部范圍內(nèi)達(dá)到一個(gè)極大值,由此來(lái)提高SVM的優(yōu)化精度.直方圖搜索算法的結(jié)果如圖3所示. 圖3 直方圖搜索算法的結(jié)果 在圖3中黑色圓點(diǎn)表示等距采樣的結(jié)果圖,黑色圓圈表示在等距采樣的基礎(chǔ)上經(jīng)過(guò)直方圖搜索算法優(yōu)化的結(jié)果,從圖3中可以看出,經(jīng)過(guò)優(yōu)化后樣本點(diǎn)的像素統(tǒng)計(jì)值均到達(dá)局部極值點(diǎn). 在實(shí)際測(cè)試中,本文采用FVC2004數(shù)據(jù)庫(kù)中的指紋圖像作為實(shí)驗(yàn)數(shù)據(jù)[12].該數(shù)據(jù)庫(kù)中包含有4種類(lèi)型傳感器收集來(lái)的數(shù)據(jù).對(duì)于產(chǎn)生如圖1(a)的指紋傳感器,從圖1中可以看出圖像構(gòu)成只包含前景和背景兩類(lèi),且指紋圖像不存在復(fù)雜區(qū)域,構(gòu)成簡(jiǎn)單,因此對(duì)二值化算法的要求較低,各算法二值化結(jié)果相近. 本文考慮處理較為復(fù)雜的一類(lèi)傳感器所得圖像.此類(lèi)傳感器收集的指紋圖像大小為328像素×364像素.由于傳感器因素,圖像形成了一個(gè)類(lèi)似透視效果的形變,因此在圖像中產(chǎn)生了2個(gè)背景,一個(gè)為白色背景,一個(gè)為深灰色背景.同時(shí)由于傳感器原因,使得指紋圖像中間產(chǎn)生了一個(gè)深色復(fù)雜區(qū)域.具體指紋圖像見(jiàn)圖4(a). 在本文算法實(shí)際處理時(shí),采用SVM進(jìn)行二值化處理.SVM訓(xùn)練集選取直方圖搜索算法,所得樣本點(diǎn)的灰度值以及對(duì)應(yīng)4-鄰域均值模板的計(jì)算值為特征量,直方圖搜索算法選擇30個(gè)像素樣本點(diǎn).以此訓(xùn)練結(jié)果對(duì)全部像素點(diǎn)進(jìn)行前景和背景分類(lèi).同時(shí)將本文算法與未經(jīng)過(guò)優(yōu)化采樣的原始SVM算法及模糊聚類(lèi)算法進(jìn)行了對(duì)比. 對(duì)于經(jīng)過(guò)透視變換導(dǎo)致形變的指紋圖像,本文算法二值化結(jié)果、原始SVM的二值化結(jié)果如圖4所示. (a)形變后指紋圖像 (b)本文算法結(jié)果 (c)原始支持向量機(jī)結(jié)果 本文算法二值化結(jié)果與原始SVM二值化結(jié)果的數(shù)值統(tǒng)計(jì)見(jiàn)表1. 表1 形變后指紋圖像二值化處理對(duì)比數(shù)據(jù) 兩種算法對(duì)深灰色背景、白色背景都進(jìn)行了有效地處理,在背景上只留下少許噪聲點(diǎn).從統(tǒng)計(jì)數(shù)值中可以看出,本文算法在背景上的殘留噪聲點(diǎn)在背景像素點(diǎn)中的占比為4.53×10-4,原始SVM占比為5.05×10-4.對(duì)比背景殘留噪聲點(diǎn),本文算法對(duì)誤判降低了10.21%.但由于兩種算法所得圖像的背景殘留噪聲點(diǎn)的占比都較小,均不影響后續(xù)處理. 對(duì)于指紋中間的被污染的深色復(fù)雜區(qū)域,從直觀結(jié)果中可看出,本文算法的二值化結(jié)果要優(yōu)于原始SVM二值化結(jié)果.本文選擇100像素×3 100像素的區(qū)域?qū)υ贾讣y圖像中的深色復(fù)雜區(qū)域進(jìn)行放大,兩者的細(xì)節(jié)對(duì)比如圖5所示. (a)形變后指紋對(duì)比區(qū)域 (b)本文算法結(jié)果 (c)原始SVM結(jié)果 通過(guò)統(tǒng)計(jì)結(jié)果可知,本文算法二值化后誤判的像素在放大區(qū)域中的占比為0.005 3,原始SVM占比為0.009 5,本文算法有效降低了45.92%的誤判.同時(shí)從直觀結(jié)果中可見(jiàn),原始SVM二值化處結(jié)果中存在明顯的黑色塊,且遮擋了一個(gè)指紋的分叉點(diǎn),而本文算法也存在誤判,但占用像素少,沒(méi)有形成明顯的黑色塊,沒(méi)有遮擋指紋中的重要結(jié)構(gòu). 通過(guò)上述對(duì)比可以看出,本文算法在處理指紋圖像的邊緣細(xì)節(jié)以及復(fù)雜區(qū)域較為準(zhǔn)確,所提出的4-鄰域均值模板和直方圖搜索算法可有效提高SVM在指紋二值化處理中的分類(lèi)精度. 將本文算法與模糊聚類(lèi)算法(FCM)[13]相比較.FCM是一種無(wú)監(jiān)督的分類(lèi)算法,被廣泛運(yùn)用于各個(gè)鄰域.在相同計(jì)算環(huán)境下,采用本文算法和FCM對(duì)形變后指紋圖像進(jìn)行二值化處理,結(jié)果如圖6所示. (a)形變后指紋對(duì)比區(qū)域 (b)本文算法結(jié)果 (c)FCM算法結(jié)果 從圖6可見(jiàn),本文算法結(jié)果遠(yuǎn)好于FCM,尤其是在圖6(c)中,結(jié)果圖像中存在幾處的黑色塊,且背景上的黑色塊也較多,會(huì)大大影響后續(xù)識(shí)別的效果.兩種結(jié)果的數(shù)據(jù)對(duì)比見(jiàn)表2. 表2 本文算法與FCM實(shí)驗(yàn)結(jié)果對(duì)比 通過(guò)表2數(shù)據(jù)看出,在相同的計(jì)算環(huán)境下,本文算法的計(jì)算處理速度遠(yuǎn)快于FCM.同時(shí)由統(tǒng)計(jì)可知,對(duì)于背景的處理FCM二值化后背景殘留噪聲點(diǎn)在背景像素點(diǎn)中的占比為5.772×10-3,而本文算法為4.53×10-4.相比FCM本文算法降低了92.15%的誤判. 對(duì)于復(fù)雜區(qū)域,從直觀可見(jiàn),F(xiàn)CM算法將復(fù)雜區(qū)域二值化為整個(gè)黑色塊,幾乎失去了全部細(xì)節(jié),而本文算法則保留了較好的細(xì)節(jié)部分.本文算法在不丟失主要細(xì)節(jié)的前提下,圖像占比更小,將更有利于后續(xù)的識(shí)別算法. 基于本文提出的優(yōu)化采樣算法,利用SVM對(duì)指紋圖像進(jìn)行二值化處理的方法可有效地解決SVM在指紋圖像邊緣以及復(fù)雜區(qū)域分類(lèi)精度低的問(wèn)題,能較好地保存指紋細(xì)節(jié),配合其他模式識(shí)別算法,可有效地完成指紋識(shí)別工作. 本文在SVM的基礎(chǔ)上,加入了基于4-鄰域均值模板和直方圖搜索算法的優(yōu)化采樣方法,進(jìn)一步提高了識(shí)別精度,對(duì)算法做出了有益的改進(jìn).本文算法相比于同為分類(lèi)算法FCM算法,計(jì)算精度較高,計(jì)算量較小,實(shí)驗(yàn)結(jié)果也說(shuō)明了本文算法是有效可行的.3 指紋圖像二值化處理與比較結(jié)果
3.1 對(duì)比原始SVM算法結(jié)果
3.2 對(duì)比模糊聚類(lèi)算法結(jié)果
4 結(jié)論