馬云鵬,李慶武,2,劉艷,曹美
1 河海大學 物聯(lián)網(wǎng)工程學院,江蘇 常州,213022
2 常州市傳感網(wǎng)與環(huán)境感知重點實驗室,江蘇 常州,213022
?
基于圖像特征融合識別的中文簽名鑒偽方法
馬云鵬1,李慶武1,2,劉艷1,曹美1
1 河海大學 物聯(lián)網(wǎng)工程學院,江蘇 常州,213022
2 常州市傳感網(wǎng)與環(huán)境感知重點實驗室,江蘇 常州,213022
摘要:針對現(xiàn)存的簽名鑒偽方法有效性低、魯棒性差的問題,提出一種基于圖像特征自適應融合識別的簽名鑒偽方法。該方法首先對簽名圖像進行預處理并提取簽名常規(guī)性特征和簽名魯棒性特征,然后對簽名字符書寫形態(tài)、單方向筆畫重量分布、字符像素點分布、圖像字符傾斜角度等圖像信息進行檢測,通過分析檢測結(jié)果自適應地改變各特征的權(quán)重系數(shù)進行特征融合。利用待鑒偽簽名融合特征與數(shù)據(jù)庫融合特征的向量夾角相似性度量結(jié)果對鑒偽樣本做出判斷。實驗結(jié)果表明該方法在簽名鑒偽中具有良好的有效性、魯棒性。
關(guān)鍵詞:簽名鑒偽;特征提?。粓D像信息檢測;自適應特征融合;夾角相似性
李慶武(1964-),男,教授,博士生導師.
與指紋和虹膜等穩(wěn)定的人體物理特征相比,手寫簽名是人體的一種比較穩(wěn)定的行為特征,利用手寫簽名進行個人身份的認證具有非侵犯性(或非觸性)、易于獲取、對簽名者的非約束性等特點,是一種重要的個人身份的表示手段。簽名鑒偽按實際操作方式的不同可分為聯(lián)機和脫機兩種,兩者都有很廣的應用背景,可在諸如金融、保險、公安司法部門的刑事調(diào)查和法庭審判等領(lǐng)域發(fā)揮重要作用。目前,聯(lián)機手寫簽名的鑒偽技術(shù)已經(jīng)十分成熟并已進入實用化階段,而脫機簽名因無法像聯(lián)機簽名獲取到簽名者書寫時的筆畫順序、書寫速度、運筆壓力等動態(tài)信息,以致其鑒定真?zhèn)蔚碾y度較大,相應的鑒定技術(shù)尚不成熟,諸多學者正在開展相關(guān)技術(shù)的研究。
現(xiàn)存的簽名鑒偽方法,如黃海龍?zhí)岢龅囊环N基于數(shù)學形態(tài)學的簽名真?zhèn)舞b別方法[1],利用數(shù)學形態(tài)學提取簽名筆畫特征,根據(jù)筆畫形態(tài)提取不同方位的簽名圖像特征來完成鑒偽工作,該方法提取的單一簽名圖像特征不能適應實際簽名圖像的多樣性,鑒偽有效率較低。田偉提出了基于投影特征和離散小波變換(Discrete wavelet transform,DWT)的二次特征提取脫機中文簽名鑒定方法[2],利用投影特征和離散小波變換提取二次特征,訓練神經(jīng)網(wǎng)絡分配特征權(quán)重系數(shù),完成鑒偽工作,但在實際操作過程中如遇到錄入簽名圖像傾斜、不同簽名圖像紋理變化規(guī)律相近等問題時,鑒偽有效率會大幅下降。朱皓悅提出了基于拉格朗日支撐矢量積(Lagrangian Support Vector Machine,LSVM)分類鑒定器的脫機簽名鑒定研究[3],用靜態(tài)形狀特征和偽動態(tài)特征相結(jié)合的方法,提出一種新的高灰度穩(wěn)定區(qū)特征,采用算法速度更快的LSVM算法作為分類鑒定的方法完成了簽名鑒偽的工作。但是在實際生活中遇到圖像信息、圖像環(huán)境突變等問題時,鑒偽速度和有效率會大幅下降。
1簽名圖像特征提取與融合
文中的簽名圖像均為黑色簽字筆在白紙上書寫的隨機字符,由500萬自對焦高拍儀錄入至計算機,圖像類型為彩色圖像,格式為Jpeg。基于圖像特征自適應融合識別的簽名鑒偽方法包含的主要步驟為簽名圖像預處理、圖像特征提取、特征自適應權(quán)值融合、相似性度量。文中提出的方法流程如圖1所示。
圖1 簽名鑒偽流程
1.1簽名骨架圖像提取
文中簽名特征數(shù)據(jù)庫的簽名樣本為10幅不同時間、不同環(huán)境下相同內(nèi)容的簽名圖像。實時待鑒偽的簽名圖像由高拍儀實時采集,直接錄入簽名鑒偽系統(tǒng)進行鑒偽。
首先對于彩色筆跡圖像2(a)進行灰度化處理,再運用最大類間方差法(Otsu法)進行二值化處理,為了消除簽名用筆粗細帶來的影響,利用快速細化算法[4]將筆跡樣本進行細化處理,該算法是基于數(shù)學形態(tài)學對目標進行模板匹配,快速提取簽名圖像骨架。為了消除簽名尺寸大小對簽名圖像特征的影響,掃描去除簽名骨架圖像多余的邊框后,將名骨架圖像尺寸進行標準化處理,大小統(tǒng)一為600*300。
圖2 簽名預處理圖像
1.2 簽名圖像特征提取
針對完成尺寸標準化處理的簽名骨架圖像圖2(b),從簽名圖像不同的特征點提取簽名特征,包括從簽名比例、紋理等特征方向提取簽名常規(guī)性特征,同時考慮實際情況中傾斜、像素分布等問題提取簽名魯棒性特征,從而使簽名圖像融合特征具有良好的敏銳性和魯棒性。文中提出的特征融合方法首先對簽名字符書寫形態(tài)、單方向筆畫重量分布、字符像素點分布、圖像字符傾斜角度等圖片信息進行檢測,根據(jù)檢測結(jié)果自適應的改變特征融合過程中各特征的權(quán)重系數(shù)。下面對特征提取及特征有效性影響因素進行分析。
1.2.1簽名常規(guī)性特征提取與分析
1)比例特征與書寫形態(tài)
比例特征是可以反映個體書寫習慣的直接表現(xiàn),其主要為字符長度、位置、邊框的比例關(guān)系。首先將二值圖像2(b)中字符像素值的和提取出來記為字長L,再確定字符骨架的左右邊框投影在橫坐標的交點,記錄這些交點所在的橫坐標分別為d1、d2。再預設兩個標志變量b1=0和b2=0,對每行中每個字符通過由上而下的順序查詢。第一次搜索到黑色像素置b1=1,此時可根據(jù)該黑色像素點確定上邊框所在的行即縱坐標d4。然后通過由下而上的順序查詢,第一次搜索黑色像素點并置b2=1,得到下邊框所在的行即縱坐標d3,從而定義比例特性:
經(jīng)過大量的比例特性實驗后發(fā)現(xiàn),除兩字簽名圖像與三字簽名圖像比例特征的分布中心不同,大部分的簽名字符的形態(tài)極其相似。當簽名字符書寫形態(tài)在相似范圍內(nèi),也就是比例特征數(shù)值的在數(shù)據(jù)聚攏區(qū)范圍內(nèi)時,運用其比例特征進行相似性度量時,并不能反映出明確的差異性。這時如果仍然使用該特征作為相似性度量的決策特征,會造成特征權(quán)重的浪費和結(jié)果的誤差。
2)紋理特征與筆畫重量分布
Gabor變換[5]在分析簽名圖像中局部區(qū)域的頻率和方向信息方面具有優(yōu)異的性能。由于簽名筆畫具有一定的筆畫寬度和方向,從簽名圖像的統(tǒng)計信息入手,每幅筆跡樣本圖像經(jīng)每一通道濾波即提取筆跡紋理的特征,在樣本圖像f(x,y)中抽取樣點(X,Y),則在該點處提取的特征為
式中:w為濾波器窗口的大小,h(x,y,f0,θk,σx,σy)為去除直流分量后濾波器核心函數(shù):
式中:f0與θk分別為波函數(shù)的頻率和方向參數(shù),σx和σy分別為高斯包絡在x方向和y方向上的標準差,e為自然常數(shù)。在f(x,y)抽取足夠多的樣點,則所有樣點可以用由式T2=(X,Y,f0,θk,σx,σy)提取特征。
Gabor變換在分析簽名圖像中簽名的筆畫寬度和筆畫方向信息方面具有優(yōu)異的性能。筆畫的方向性的變化越大,Gabor提取的紋理特征也越明顯。但是實驗數(shù)據(jù)顯示當筆畫復雜程度在筆畫重量值聚攏區(qū)內(nèi)時,Gabor濾波器提取的特征會喪失特征敏銳性。文中通過數(shù)學形態(tài)學分別提取橫、豎、撇、捺等單方向筆畫,并且對筆畫方向做定量分析,從而確定Gabor特征權(quán)重系數(shù)。
1.2.2簽名魯棒性特征提取與分析
1)灰度信息熵與字符像素分布
在實驗過程中發(fā)現(xiàn),存在簽名圖像的紋理、比例極其相似,但是簽名的內(nèi)容卻截然不同的現(xiàn)象。出現(xiàn)上述狀況的原因為,處理靜態(tài)脫機簽名的切入點往往是簽名者書寫字符的紋理特征、方位特征等,即書寫者的書寫習慣。這時就會出現(xiàn)同一書寫者不同的書寫內(nèi)容會出現(xiàn)誤識的現(xiàn)象,為了避免此類現(xiàn)象的產(chǎn)生,文中提出的方法引入了灰度信息熵作為識別的特征。
灰度共生矩陣[6]反映的是圖像灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息。為了能更直觀地以灰度共生矩陣描述紋理狀況,在灰度共生矩陣的基礎上獲取二次統(tǒng)計量。在二值簽名圖像中,灰度共生矩陣中所有元素只有最大像素值與最小像素值,其作用可以統(tǒng)計像素點分布規(guī)律,從而分辨出字符不同的內(nèi)容。
運用灰度共生矩陣的熵作為特征值時,不僅可以區(qū)分書寫字符的內(nèi)容,并且可以記錄表示簽名圖像中紋理的非均勻程度,其定義為
式中:Pd(i,j)代表圖像位置關(guān)系為d、 2個像素灰度分別為i和j的情況出現(xiàn)的次數(shù)。
2)幾何不變特征與圖像傾斜角度
在實際生活和工作過程中,圖像錄入并不能做到精確平正,往往輕微的傾斜角度是必然存在的,文中提出引入Hu不變矩作為簽名圖像特征,可在減輕了簽名圖像傾斜帶來的誤差的同時記錄簽名圖像紋理特征。文中根據(jù)中文簽名的“橫平豎直”的書寫習慣,先對簽名字符的橫、豎筆畫進行檢測,取兩個方向筆畫傾斜角的平均值作為簽名圖像傾斜角,再根據(jù)傾斜角確定Hu不變矩特征權(quán)重系數(shù)。
通過實驗可以得到,對于簽名圖像的平移旋轉(zhuǎn)問題,Hu不變矩的二階中心矩在保持旋轉(zhuǎn)不變性的同時,亦能將圖像的紋理特征記錄下來,其定義為
式中:
p,q=0,1,2,…
1.3 圖像信息檢測與特征融合
針對神經(jīng)網(wǎng)絡特征融合方法對于圖片環(huán)境信息突變適應性差的問題,文中提出基于圖像信息檢測的圖像特征自適應融合方法。圖像信息檢測主要根據(jù)對簽名字符書寫形態(tài)、單方向筆畫重量的檢測結(jié)果確定簽名常規(guī)性特征的權(quán)重系數(shù),根據(jù)字符像素點分布、圖像字符傾斜角度的檢測結(jié)果確定簽名魯棒性特征的權(quán)重系數(shù)。
對簽名圖像的以上的4個圖像信息進行檢測,根據(jù)各特征的權(quán)重系數(shù)分配結(jié)果,進行自適應權(quán)值的特征融合,其融合方法如圖3所示。
圖3 自適應權(quán)值的特征融合流程
圖3中根據(jù)檢測結(jié)果,可以相應確定特征參數(shù)C1~C4的值,取C1~C4的值為0或1。以C1為例,當比例特征數(shù)值的在特征數(shù)據(jù)聚攏區(qū)內(nèi)時,表示比例特征的特征有效性大幅下降,將C1的值變?yōu)?,則將比例特征T1的權(quán)重系數(shù)均勻的分配給參數(shù)C等于0的特征,若C1的值為0,則表示比例特征的特征有效性較好,接收其他特征分配出來的比例權(quán)重系數(shù),依次對C2、C3、C4做同樣的處理。則融合特征T定義為
2實驗方法及結(jié)果分析
2.1相似性度量方法選取
實驗數(shù)據(jù)庫中保存的簽名特征值G是平均權(quán)值的情況下得到的簽名圖像特征值,且數(shù)據(jù)庫特征值是收集個體簽名者不同時段的隨機簽名,取其特征值的平均值作為數(shù)據(jù)庫特征值。得到待測簽名樣本融合特征值T后,按照T的融合規(guī)則對G做同樣的融合處理。由于每個待測樣本圖像的信息不同,所以會衍生出各種不同的特征融合規(guī)則,不同特征的數(shù)據(jù)大小范圍差異性比較大,為了避免由于融合規(guī)則造成的誤差,文中選取夾角余弦相似性度量作為度量方法。
夾角余弦相似性度量可以用在任何維度的向量比較中,尤其在高維空間中的利用尤為頻繁。其主要優(yōu)點為可以將多個特征值組成特征組向量,在高維空間中快速計算向量之間相似度,并且可根據(jù)實際情況,改變向量元素的權(quán)重系數(shù),得到更加準確的相似度,適合特征矩陣的相似性判別。
選取夾角相似性度量作為衡量待鑒偽簽名圖像相似度的決策算法,特征根據(jù)圖像信息進行自適應融合時,高低維的變換并不會給相似性度量結(jié)果帶來影響,從而使得鑒偽結(jié)果更加客觀明顯。
2.2實驗結(jié)果分析
文中提取了100人的1000幅簽名圖像的特征錄入至數(shù)據(jù)庫,其中每個人在不同時段、不同環(huán)境下的簽名圖像10幅。在數(shù)據(jù)庫中隨機抽取簽名做測試實驗,根據(jù)數(shù)據(jù)庫取得的簽名樣本,再去尋找一定比例的真實簽名和虛假簽名作為待測樣本,共進行了4組實驗,測試結(jié)果如表1所示。
表1 實驗測試結(jié)果統(tǒng)計表
由表1反映出隨機進行簽名鑒偽測試時,文中提出的方法可以有效解決簽名鑒偽問題,可以實時的對真實簽名和虛假簽名做出判斷,并且鑒偽成功率較高。
選取在文本依存的簽名鑒偽領(lǐng)域中現(xiàn)存的3種方法與文中提出的方法,進行簽名鑒偽實驗,4種方法的實驗樣本字符都是由文中數(shù)據(jù)庫提供,測試環(huán)境相同,測試及要求均符合原作者提出要求,實驗結(jié)果如表2所示。
表2 多方法簽名鑒偽結(jié)果統(tǒng)計表
3結(jié)束語
文中提出的基于圖像特征自適應融合識別的簽名鑒偽方法是針對簽名鑒偽問題,從簽名圖像不同的特征點提取了簽名圖像的4個特征,包括比例特征、紋理特征、灰度信息特征、幾何不變特征,每個特征都從不同的角度對手寫簽名進行認知和記錄。實驗表明,當圖像的信息,包括簽名字符書寫形態(tài)、單方向筆畫重量分布、字符像素點分布、圖像字符傾斜角度的理論數(shù)據(jù)在特定的范圍內(nèi)時,對應特征的有效性會大幅下降。針對這一現(xiàn)象,提出先對圖像的信息進行檢測,根據(jù)檢測結(jié)果,自適應的改變特征融合時的權(quán)重系數(shù),從而保證了特征融合后的有效性,同時特征的融合也提高了該鑒偽方法的通用性和魯棒性。
參考文獻:
[1]黃海龍, 王宏, 李微. 一種基于數(shù)學形態(tài)學的簽名真?zhèn)舞b別方法[J]. 東北大學學報:自然科學版, 2011, 32(6): 854-858.
[2]田偉, 喬誼正, 馬志強. 基于DWT的二次特征提取脫機中文簽名鑒定[J]. 山東大學學報:工學版, 2007, 37(3): 55-59.
[3]朱皓悅, 耿國華, 周明全, 等. 基于LSVM分類鑒定器的脫機簽名鑒定研究[J]. 計算機應用與軟件, 2009, 26(7): 219-221.
[4]梅園, 孫懷江, 夏德深. 一種基于改進后模板的圖像快速細化算法[J]. 中國圖形圖像學報, 2006, 11(9): 1306-1310.
[5]李瑩. 漢字筆跡鑒別的算法研究[D]. 濟南: 山東大學, 2007: 29-55.
[6]高程程, 惠曉威. 基于灰度共生矩陣的紋理特征提取[J]. 計算機系統(tǒng)應用, 2010, 19(6): 195-198.
[7]鄢煜塵. 基于信息融合的中文筆跡鑒別研究[D]. 武漢: 武漢大學, 2009: 29-60.
[8]李昕, 丁曉青. 基于改進微結(jié)構(gòu)特征的筆跡鑒別[J]. 清華大學學報(自然科學版), 2010, 50(4): 595- 600.
[9]ZAMORA-MARTINEZ F, FRINKEN V, ESPAA-BOQUERA S, et al. Neural network language models for off-line handwriting recognition[J]. Pattern Recognition, 2014, 47(4): 1642-1652.
[10] DREUW P, DOETSCH P, PLAHL C, et al. Hierarchical hybrid MLP/HMM or rather MLP features for a discriminatively trained Gaussian HMM: a comparison for offline handwriting recognition[C]//Proceedings of the 2011 18th IEEE International Conference on Image Processing. Brussels, Belgium, 2011: 3541-3544.
網(wǎng)絡出版地址:http://www.cnki.net/kcms/detail/23.1191.U.20151206.1001.004.html
Authenticity identification method for Chinese signature
based on image feature fusion recognition
MA Yunpeng1,LI Qingwu1,2,LIU Yan1,CAO Mei1
1 College of Internet of Things Engineering, Hohai University, Changzhou 213022, China
2 Changzhou Key Laboratory of Sensor Networks and Environmental Sensing, Changzhou 213022, China
Abstract:In view of the low validity and poor robustness of the existing authenticity identification method for signature, this paper proposes a method to indentify the authenticity of signature, based on self-adaptive fusion of image features. First, a signature image is pretreated, and normal features and robustness of the image are taken. Then, the writing form of characters, weight distribution of unidirectional strokes, pixel dot distribution of characters, inclination angle of image characters and other image information are inspected. By analyzing the inspection results, this method automatically changes the weight coefficient of each feature and fuses the features. Then this method judges the measurement results of the vector angle similarity between the fused features of signature to be identified and fused features of the data base. Result of the experiment shows this method has good validity and robustness in identifying the authenticity of signatures.
Keywords:authenticity identification of signature; feature extraction; image detection; self-adaptive features fusion; vector angle similarity
通信作者:李慶武,E-mail:liqw@hhuc.edu.cn.
作者簡介:馬云鵬(1993-),男,碩士研究生;
基金項目:國家自然科學基金資助項目(41301448);江蘇省產(chǎn)學研前瞻性聯(lián)合研究資助項目(BY2014041);常州市科技支撐(社會發(fā)展)資助項目(CE20145038).
收稿日期:2015-04-09.網(wǎng)絡出版日期:2015-12-06.
中圖分類號:TP394.1
文獻標志碼:A
文章編號:1009-671X(2015)06-010-05