王澤勵(lì) 于彤 屈音璇 趙建森
【摘 要】研究了筆跡圖像預(yù)處理的常規(guī)步驟和方法,簡(jiǎn)述了灰度參數(shù)值的選擇,二值化的處理方法以及歸一化的基本原理,以期為紋理筆跡圖像處理提供借鑒參考。
【關(guān)鍵詞】圖像處理;去噪;歸一化方法
中圖分類號(hào): TP391.1 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 2095-2457(2017)26-0085-002
Summary of handwriting texture image preprocessing
WANG Ze-li1 YU Tong2 QU Yin-xuan2 ZHAO Jian-sen1
(1.Shanghai Maritime University,Shanghai 201306,China;2.China Criminal Police College,Shenyang 110000,China)
【Abstract】The routine steps and methods of handwriting image preprocessing are studied. The selection of grayscale parameter value, the binarization method and the normalization principle are briefly described in order to provide reference for the texture handwriting image processing.
【Key words】Image processing;Denoising;Normalization method
1 灰度化和二值化處理
常見(jiàn)的色彩模式有有很多種,如HSB,RGB,CMYK等,此處采用RGB色彩模式,一方面適應(yīng)人體視錐系統(tǒng),另外一方面也是便于掃描儀位圖圖像生成中,有效信息特征的存留和保證計(jì)算機(jī)對(duì)于一定精度條件下的數(shù)據(jù)處理能力和速度。
1.1 灰度化處理
灰度化是指把彩色圖像表示為只有亮度表示的灰度圖像的方式,指以線性相關(guān)度表示認(rèn)知色彩的顏色空間理論的三基色(RGB)色覺(jué)認(rèn)知原理C=rR+gG+bB出發(fā)的降維度處理方式。其中C為人眼感知系統(tǒng)可認(rèn)知的色彩,R紅,G綠,B藍(lán)為三原色,r,g,b為對(duì)應(yīng)色彩相關(guān)度。常見(jiàn)的灰度化處理方式如下:
1.1.1 最大值法
將三基分量中的最大亮度值作為灰度參數(shù)值,產(chǎn)生的圖像多高亮。
R=G=B=MAX(R,G,B)
1.1.2 加權(quán)平均法
結(jié)合人眼的敏感度,對(duì)三基色分量進(jìn)行權(quán)重處理。一般情況下,人眼對(duì)綠色敏感度最為高,藍(lán)色最低,產(chǎn)生圖像多柔和。即:Vgray=0.299R+0.587G+0.114B
1.1.3 平均值法
將RGB三個(gè)分量的平均亮度值作為灰度參數(shù)值。
R=G=B=Average(R,G,B)
1.2 二值化處理
二值化的處理問(wèn)題主要就是閾值的選擇問(wèn)題,在筆跡鑒定的過(guò)程中一般采用認(rèn)值S.Watanabe的灰度直方圖法決定閾值。
P=M(i,j)-N(i+k1,j+k1)>0
if_P>0
D(i,j)=PS(i,j,M)= (D(i+k1,j+k1))
else灰度差S
D(i,j)=0
輸出閾值N定義為圖像中灰度級(jí)疊加的最大值N=MAX(C(m)=∑S(i,j,M))
2 去噪處理
圖像的去噪處理方法有很多,比如中值濾波,鄰域平均,邊緣保持濾波器等方法。考慮到筆跡鑒定的細(xì)節(jié)特征保留和椒鹽噪聲的去除,一般采用閾值鄰域平均法。給定像素點(diǎn)灰度值f(x,y)和窗口大小M*N,既定閾值T,關(guān)系如下:
f(x,y)= f(u,v)像素點(diǎn)灰度值
if_|f(x,y)-f(x,y)|>T
g(x,y)=f(x,y)該方法在平滑的同時(shí)減少了邊緣模糊
else
g(x,y)=f(x,y)
3 單字符歸一化
受限于書寫載體,書寫工具,書寫時(shí)間,書寫人習(xí)慣等因素,書寫特征字的大小一般是不盡相同的,為了減少特征字符大小和位置變化對(duì)于鑒定的相關(guān)影響,同時(shí)還要保留書寫者固有的筆跡風(fēng)格,常采用歸一化的方法。歸一化就是將原始的點(diǎn)陣信息轉(zhuǎn)化為固定維數(shù)的點(diǎn)陣信息的維度處理方法。
3.1 線性歸一化方法
線性歸一化分重心—中心線線性歸一化和直接線性歸一化方法,二中主要區(qū)別在于映射方式的不同,前者采用重心映射,后者采用像素映射。
3.1.1 重心—中心線性歸一化
if_i m= i n= j 1<=m<=W; else else 1<=n<=H; m=W- (i-M)n=H- (j-M) 其中W,H為特征字圖像高度和寬度,G為重心G=G(Gi,Gj),M為歸一化后的高度和寬度,設(shè)歸一化后像素點(diǎn)(i,j)處對(duì)應(yīng)原始(m,n)處,則有上述關(guān)系。 3.1.2 直接線性歸一化 m= i,1 n= j,1<=n<=W;1<=j<=M 其中W,H為特征字圖像高度和寬度,M為歸一化后的高度和寬度,歸一化后像素點(diǎn)(i,j)處對(duì)應(yīng)原始(m,n)處,則有上述關(guān)系。 此方法重心位置不固定,幾何位置不重合。
3.2 非線性歸一化方法
該歸一化原理就是給定像素點(diǎn)密度值,歸一化后筆畫密度均勻分布特征字圖像空間。這樣分布緊密的筆畫會(huì)分開(kāi),分布稀疏的會(huì)靠近。
定義d(m,n)為原始特征字圖像中點(diǎn)(m,n)密度函數(shù),H(m)和H(v)為水平和數(shù)值方向密度投影,為已知密度函數(shù)。歸一化映射前后(m,n)和(i,j)關(guān)系如下:
i= Hk
H(m)= [d(m,n)+aH(m,n)],1<=m<=W
V(n)= [d(m,n)+aV(m,n)],1<=n<=H
j= V(l)
1<=m<=W;1<=n<=H;1<=i,j<=M
本方法可以改變筆畫相對(duì)位置,減少傾斜,扭曲。重心重心保持不變,書寫風(fēng)格有所改變。
4 總結(jié)
以上簡(jiǎn)單闡述了筆跡圖像的預(yù)處理方式方法,其基本原則還是最大限度保留有效的圖像特征信息,減少特征損耗,同時(shí)滿足類似壓縮編碼的過(guò)程中,實(shí)現(xiàn)信息數(shù)據(jù)量的減少,以適應(yīng)計(jì)算機(jī)的處理過(guò)程。在灰度化,二值化,降噪,歸一化的過(guò)程中,難免會(huì)出現(xiàn)特征損失的現(xiàn)象,導(dǎo)致有效特征信息失真,邊緣特征模糊等常見(jiàn)的現(xiàn)象,因此,在具體的圖像處理過(guò)程中,明確映射的卷積關(guān)系,也就是我們常說(shuō)的模糊核,可以適當(dāng)?shù)姆淳矸e,進(jìn)行圖像復(fù)原,還原有效的識(shí)別特征,對(duì)有爭(zhēng)議的筆跡圖像進(jìn)行進(jìn)一步的處理。
【參考文獻(xiàn)】
[1]曹華軍.圖像二值化處理在筆跡樣本中應(yīng)用分析[J].信息技術(shù)與信息化,2016(06):67-68.
[2]朱若曦.基于模糊支持向量機(jī)的筆跡驗(yàn)證研究[D].河北工程大學(xué),2014.
[3]于明,張彥云,薛翠紅,孫林娟.筆跡圖像中的單個(gè)漢字字符分割[J].計(jì)算機(jī)工程與應(yīng)用,2010(09):180-182+245.
[4]范緒成.基于紋理特征提取的離線文字筆跡鑒別技術(shù)的研究[D].浙江工業(yè)大學(xué),2009.
[5]師寶山,張貴州.筆跡鑒別預(yù)處理算法的設(shè)計(jì)與實(shí)現(xiàn)[J].電子器件,2008(04):1357-1360.
[6]張韻.基于紋理的文本獨(dú)立離線筆跡鑒別[D].河北工業(yè)大學(xué),2007.
[7]李瑩.漢字筆跡鑒別的算法研究[D].山東大學(xué),2007.
[8]梁亮.圖像處理技術(shù)在筆跡鑒定系統(tǒng)開(kāi)發(fā)過(guò)程中的應(yīng)用與研究[D].沈陽(yáng)工業(yè)大學(xué),2007.
[9]王鳳嶺,劉連芳,蔣宗禮,韋智勇.基于紋理分析的筆跡圖像預(yù)處理子系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J].南寧職業(yè)技術(shù)學(xué)院學(xué)報(bào),2005(04):84-89.
[10]楊亞莉.基于紋理分析的筆跡鑒別方法研究[D].武漢理工大學(xué),2004.
[11]鄭建彬,楊亞莉.基于整數(shù)小波系數(shù)的筆跡圖像鑒別方法研究[J].武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版),2004,(01):110-113.endprint