摘 要:脫機(jī)手寫漢字識(shí)別是我們面臨的最困難、最具挑戰(zhàn)性的課題,而無論是在辦公自動(dòng)化方面,還是在機(jī)器翻譯方面,脫機(jī)手寫漢字識(shí)別的應(yīng)用前景都非常廣泛,因此,有必要立足細(xì)化處理,對(duì)脫機(jī)手寫漢字識(shí)別進(jìn)行深入研究,使其在各個(gè)領(lǐng)域中發(fā)揮更大應(yīng)用價(jià)值。
關(guān)鍵詞:細(xì)化處理;脫機(jī)手寫漢字;預(yù)處理;特征提取
中圖分類號(hào):TP391.43
隨著電子計(jì)算機(jī)網(wǎng)絡(luò)的迅速普及,人們對(duì)信息的獲取和記錄開始運(yùn)用計(jì)算機(jī)去代替那些機(jī)械、重復(fù)的勞動(dòng),通過計(jì)算機(jī)對(duì)信息、文字以及數(shù)據(jù)進(jìn)行編輯、處理、保存,從而滿足人們的不同需要,因此,研究手寫漢字識(shí)別對(duì)于解決信息的高速、自動(dòng)地輸入具有重要現(xiàn)實(shí)意義。手寫漢字識(shí)別中的脫機(jī)手寫漢字識(shí)別已成為文字識(shí)別領(lǐng)域中最困難、最具挑戰(zhàn)性的課題。下面簡要論述手寫漢字識(shí)別特點(diǎn),并對(duì)基于細(xì)化處理的脫機(jī)手寫漢字識(shí)別過程做出解析。
1 手寫漢字識(shí)別特點(diǎn)
從漢字識(shí)別角度分析,手寫漢字字體具有類別多、字體結(jié)構(gòu)復(fù)雜、字形變化多、相似字多等特點(diǎn),這也就決定了手寫漢字識(shí)別過程比較復(fù)雜。首先,在基本筆畫方面,印刷體漢字筆畫基本上是橫平豎直,折筆拐角大多是尖銳的鈍角、銳角或直角,而手寫漢字筆畫卻不具備上述特征,折筆拐角通常為圓弧,比如在寫“品”字時(shí),將三個(gè)“口”變?yōu)槿齻€(gè)圓;將較短的筆畫變?yōu)辄c(diǎn);在起筆或折筆拐角處額外增加筆鋒。其次,書寫者的手寫習(xí)慣不同,很多筆畫表現(xiàn)的比較混亂,連筆、斷筆現(xiàn)象較為嚴(yán)重,而且筆畫與筆畫之間、部件與部件之間的相對(duì)位置發(fā)生變化,這也就使?jié)h字筆畫交叉位置錯(cuò)誤,部件大小不一致。另外,我們不難發(fā)現(xiàn),在手寫稿中普遍存在涂改、添加甚至將段落更改的情況,這就給脫機(jī)手寫漢字識(shí)別過程中的預(yù)處理、加工整理等帶來了困難。綜上,有必要做出規(guī)定對(duì)構(gòu)成漢字的筆畫以及筆畫之間的相互關(guān)系進(jìn)行限制,書寫者不能隨意書寫,特別是字體不能太寬,這樣才能提高識(shí)別系統(tǒng)的辨識(shí)率,當(dāng)然,規(guī)定限制應(yīng)適中,使書寫者能夠在較短時(shí)間內(nèi)適應(yīng),也使手寫漢字識(shí)別系統(tǒng)得到更廣泛的推廣和應(yīng)用。
2 基于細(xì)化處理的脫機(jī)手寫漢字識(shí)別過程
2.1 手寫漢字的預(yù)處理
脫機(jī)手寫漢字識(shí)別過程中,首先就要進(jìn)行原始圖像的預(yù)處理,去粗取精、去偽存真,保證預(yù)處理質(zhì)量,達(dá)到優(yōu)化圖像、消除干擾的目的,為整個(gè)漢字識(shí)別系統(tǒng)性能的發(fā)揮提供保障。預(yù)處理流程為掃描輸入圖像——平滑去噪——二值化——傾斜校正——漢字切分——?dú)w一化。
平滑去噪的主要目的就是按特定需要突出一副圖像中的有用信息,并消除輸入漢字時(shí)混入的噪聲,在處理過程中不應(yīng)破壞原始圖像的邊緣輪廓和線條,保證圖像清晰。平滑去噪方法主要有線形濾波器、統(tǒng)計(jì)排序?yàn)V波器、平滑頻率域?yàn)V波器。以統(tǒng)計(jì)排序?yàn)V波器為主,該方法其實(shí)是利用3×3的矩陣,P為待處理點(diǎn),通過對(duì)P點(diǎn)的八鄰域進(jìn)行分析來確定P點(diǎn)平滑后的像素值。
圖像二值化是將圖像中存在的不必要的信息去掉,提高系統(tǒng)辨識(shí)速度,通常采用256級(jí)灰度圖或二值圖進(jìn)行處理,但是在處理過程中會(huì)造成大量信息的丟失,必須研究出使二值圖像能夠保持原始圖像的重要特征或細(xì)節(jié)的二值化方法。圖像二值化大部分是基于閾值的分割法,包括迭代最佳分割閾值算法、雙重閾值設(shè)定算法,漢字書寫紙張不同,應(yīng)選擇不同的二值化方法,在處理過程中還應(yīng)注意紙張的顏色、文字灰度等。
2.2 手寫漢字的細(xì)化處理
手寫漢字細(xì)化是通過一定的處理手段將漢字圖像中重要的像素點(diǎn)保留下來,剔除不重要的像素點(diǎn),這在脫機(jī)手寫漢字識(shí)別中非常重要。在漢字細(xì)化過程中,要保證原有筆畫的連續(xù)性,將筆畫寬度細(xì)化為單個(gè)像素寬度,經(jīng)過細(xì)化后得到的漢字骨架應(yīng)是原始漢字筆畫的中心線,同時(shí)保持原有漢字的幾何特征和拓?fù)洹<?xì)化算法發(fā)展到現(xiàn)在可分為以像素迭代刪除為基礎(chǔ)以及不以像素迭代刪除為基礎(chǔ)的算法,比如Hilditch細(xì)化算法、FPA細(xì)化算法、SPTA細(xì)化算法等,其中SPTA算法的改進(jìn)細(xì)化算法的細(xì)化效果非常好,但是處理過程中必然也會(huì)出現(xiàn)一些細(xì)微誤差,這就需要我們在處理過程中對(duì)特殊點(diǎn)進(jìn)行修復(fù),將其對(duì)提取交叉點(diǎn)或端點(diǎn)的影響消除。
2.3 手寫漢字的特征提取
通過特征提取將原始圖像信息轉(zhuǎn)換成若干個(gè)能將漢字結(jié)構(gòu)反映出來的特征,從而進(jìn)一步壓縮漢字原始圖像數(shù)據(jù),提高漢字辨識(shí)精確度和速度,另外,對(duì)于提取的特征還必須具有代表性,信息沒有較大的冗余度。特征提取有全局統(tǒng)計(jì)特征法、局部統(tǒng)計(jì)特征法,這些方法是主要是基于漢字的幾何拓?fù)湫再|(zhì)上的特征比如特征點(diǎn)、筆畫特征、筆畫序列、部件等進(jìn)行處理的,抗干擾能力強(qiáng),受字體整體和局部變化的影響小,能夠很好將相似字區(qū)分出來。特征提取完成后采用彈性網(wǎng)格特征、方向線素特征、Gabor特征、矩特征進(jìn)行特征統(tǒng)計(jì),處理過程中,要將漢字結(jié)構(gòu)特征和統(tǒng)計(jì)特征等多種特征結(jié)合起來,這樣能夠有效實(shí)現(xiàn)各種特征的優(yōu)勢互補(bǔ),從而將漢字特征全面反映出來。
2.4 手寫漢字的分類識(shí)別方法
脫機(jī)手寫漢字識(shí)別屬于大規(guī)模的模式識(shí)別問題,特征空間非常復(fù)雜且特征向量維數(shù)很高。用于脫機(jī)手寫漢字識(shí)別的分類器有單分類器和多分類器兩種,其中多分類器是當(dāng)前的主流識(shí)別技術(shù),也是未來漢字識(shí)別領(lǐng)域的發(fā)展趨勢。常用分類器有基于距離的分類器、人工神經(jīng)網(wǎng)絡(luò)分類器和支持向量機(jī)分類器,其中基于距離分類識(shí)別法中距離函數(shù)的選擇對(duì)分類效果具有很大影響,應(yīng)根據(jù)漢字特征選擇最為合適的方法以提高統(tǒng)計(jì)特征的穩(wěn)定性和準(zhǔn)確性;支持向量機(jī)結(jié)構(gòu)簡單,性能良好,學(xué)習(xí)速度快,分類識(shí)別方法在處理小樣本的機(jī)器學(xué)習(xí)、高維的大規(guī)模模式識(shí)別以及非線性問題上具有一定優(yōu)勢;人工神經(jīng)網(wǎng)絡(luò)分類識(shí)別法能夠處理一些環(huán)境信息復(fù)雜、背景知識(shí)不清晰、推理規(guī)則不明確的問題,當(dāng)前人工神經(jīng)網(wǎng)絡(luò)中的BP神經(jīng)網(wǎng)絡(luò)、ART升降網(wǎng)絡(luò)的應(yīng)用都比較廣泛。
3 結(jié)束語
脫機(jī)手寫漢字識(shí)別是模式識(shí)別的重要分支,同時(shí)也是文字識(shí)別領(lǐng)域中我們面臨的最困難、最具挑戰(zhàn)性的課題。近年來,脫機(jī)手寫漢字識(shí)別技術(shù)得到了新的發(fā)展,特定場合的脫機(jī)手寫漢字識(shí)別系統(tǒng)研究也逐步走向使用,本文對(duì)基于細(xì)化處理的脫機(jī)手寫漢字識(shí)別過程進(jìn)行了分析,概述預(yù)處理、細(xì)化處理、特征處理、分類識(shí)別等關(guān)鍵技術(shù)和主流方法,未來,我們應(yīng)當(dāng)進(jìn)一步對(duì)圖像預(yù)處理技術(shù)和分類識(shí)別方法進(jìn)行改進(jìn),簡化處理步驟,優(yōu)化漢字?jǐn)?shù)據(jù)集,加大對(duì)無分割脫機(jī)手寫漢字識(shí)別技術(shù)的研究,為該領(lǐng)域的發(fā)展指明方向。
參考文獻(xiàn):
[1]王玉娜.基于數(shù)學(xué)形態(tài)學(xué)脫機(jī)手寫漢字細(xì)化的研究[D].天津師范大學(xué),2010.
[2]張欣.基于四角結(jié)構(gòu)特征的脫機(jī)手寫漢字識(shí)別[D].河北大學(xué),2010.
[3]趙繼印,鄭蕊蕊,吳寶春,李敏.脫機(jī)手寫體漢字識(shí)別綜述[J].電子學(xué)報(bào),2010,38(2):405-411.
[4]賈新彪.基于筆畫結(jié)構(gòu)特征的脫機(jī)手寫漢字識(shí)別[D].河北大學(xué),2010-06.
[5]邱瑾.一種具有統(tǒng)計(jì)廣義特征反饋的智能脫機(jī)手寫體漢字識(shí)別系統(tǒng)的研究[D].合肥工業(yè)大學(xué),2012-04.
作者單位:懷化學(xué)院 計(jì)算機(jī)工程系,湖南懷化 418000