戴 靜,胡釗政,白建川
(河北工業(yè)大學(xué)信息工程學(xué)院,天津300401)
一種基于交點(diǎn)特征的印刷體數(shù)字識(shí)別方法
戴 靜,胡釗政,白建川
(河北工業(yè)大學(xué)信息工程學(xué)院,天津300401)
為了進(jìn)一步提高印刷體的數(shù)字識(shí)別準(zhǔn)確率,提出了一種基于交點(diǎn)特征和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別方法。首先利用交點(diǎn)特征對(duì)數(shù)字進(jìn)行特征提取,即提取某一數(shù)字的劃水平線得到的交點(diǎn)數(shù)作為水平特征分量,提取劃垂直線得到的交點(diǎn)數(shù)作為垂直特征分量,將水平特征向量與垂直特征向量組合成數(shù)字的交點(diǎn)特征向量;然后利用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同模式類別中的學(xué)習(xí)樣本,學(xué)習(xí)過(guò)程完成后,利用此網(wǎng)絡(luò)對(duì)樣本進(jìn)行識(shí)別。實(shí)驗(yàn)結(jié)果表明,該數(shù)字識(shí)別方法在印刷體數(shù)字識(shí)別中正確率可達(dá)到100%,處理效果良好。
印刷體數(shù)字識(shí)別;交點(diǎn)特征;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
模式識(shí)別是對(duì)表征事物的各種形式的信息進(jìn)行分析和處理,以對(duì)事物進(jìn)行描述、辨認(rèn)、分類的過(guò)程[1]。印刷體數(shù)字識(shí)別是模式識(shí)別的一個(gè)分支,是指對(duì)0~9這10個(gè)印刷體數(shù)字進(jìn)行識(shí)別的過(guò)程,它在信息處理、機(jī)器翻譯、身份證識(shí)別、車牌識(shí)別等高技術(shù)領(lǐng)域有著廣闊的應(yīng)用前景。在實(shí)際應(yīng)用的過(guò)程中,對(duì)印刷體數(shù)字的單字識(shí)別正確率的要求很高。此外,在對(duì)大批量數(shù)據(jù)進(jìn)行識(shí)別處理時(shí),還必須要考慮到對(duì)系統(tǒng)速度的要求[2]。因此,研究低錯(cuò)誤率、高性能的數(shù)字識(shí)別算法是一個(gè)很有實(shí)際意義的研究任務(wù)。
傳統(tǒng)的印刷體數(shù)字識(shí)別方法存在識(shí)別正確率低、識(shí)別速度慢等缺點(diǎn),因?yàn)閭鹘y(tǒng)的特征提取方法需要對(duì)數(shù)字所包含的線段、弧、銳角、圈等進(jìn)行大量的形狀分析與筆畫擬合,系統(tǒng)運(yùn)行效率與準(zhǔn)確率低[3]。由于印刷體數(shù)字具有結(jié)構(gòu)簡(jiǎn)單、字符集小等特點(diǎn),為此本文提出基于交點(diǎn)特征的特征提取方法——僅對(duì)待識(shí)別的對(duì)象進(jìn)行水平與垂直方向的若干次切分即可,快速且準(zhǔn)確。另外,徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)速度快且能避免局部極小問(wèn)題等優(yōu)點(diǎn)[4],本文則采用RBF神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)數(shù)字進(jìn)行訓(xùn)練與識(shí)別。
一個(gè)完整的數(shù)字識(shí)別系統(tǒng)分為原始數(shù)字圖像采集、預(yù)處理、特征提取、模式識(shí)別與結(jié)果輸出5個(gè)模塊[5],如圖1所示。
圖1 數(shù)字識(shí)別過(guò)程模型
本課題研究對(duì)印刷體數(shù)字的識(shí)別,圖像采集的過(guò)程中所采集的數(shù)字圖片、位置、字體、顏色有所不同。
通過(guò)對(duì)圖像進(jìn)行灰度化、二值化、邊緣檢測(cè)、歸一化等預(yù)處理過(guò)程,為接下來(lái)的特征提取做了充足的準(zhǔn)備。
模式識(shí)別是使用特征來(lái)區(qū)分不同類別[6],為了能有效地實(shí)現(xiàn)分類識(shí)別,就要對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征[7]。對(duì)于數(shù)字的特征提取應(yīng)既突出每個(gè)數(shù)字的形狀特點(diǎn),又減少冗余信息量[8]。
對(duì)此,本文提出了一種新的特征提取方法——基于交點(diǎn)的特征提取方法,其中交點(diǎn)特征包括劃水平線得到的交點(diǎn)數(shù)和劃垂直線得到的交點(diǎn)數(shù)特征。采用此方法特征向量便于提取,算法比較簡(jiǎn)便,運(yùn)算速度較快。
該提取方法的具體步驟如下:
步驟1,讀取經(jīng)過(guò)預(yù)處理的圖像文件的高度h和寬度w。
步驟2,定義一維數(shù)組水平特征分量hsum[10]、垂直特征分量wsum[10]、交點(diǎn)特征向量sum[20]并初始化。
步驟3,從上到下對(duì)數(shù)字進(jìn)行逐行掃描,將水平掃描線切分黑像素區(qū)域形成的發(fā)生像素從0~1或者從1~0改變的交點(diǎn)個(gè)數(shù)保存在數(shù)組hsum[10]中。
步驟4,從左到右對(duì)數(shù)字進(jìn)行逐列掃描,將垂直掃描線切分黑像素區(qū)域形成的發(fā)生像素從0~1或者從1~0改變的交點(diǎn)個(gè)數(shù)保存在數(shù)組wsum[10]中。
步驟5,將水平方向提取的特征分量hsum[10]和垂直方向提取的特征分量wsum[10]合成數(shù)字的交點(diǎn)特征向量sum[20]。
經(jīng)過(guò)以上步驟形成的交點(diǎn)特征向量sum[20]即為將要作為神經(jīng)網(wǎng)絡(luò)輸入的數(shù)字的特征向量。
例如對(duì)數(shù)字“0”的特征提取,其水平交點(diǎn)特征如圖2所示,垂直交點(diǎn)特征如圖3所示。通過(guò)求單個(gè)水平方向或垂直方向上的過(guò)線交點(diǎn)數(shù),很難區(qū)分開(kāi)數(shù)字。因?yàn)樵诓煌愋偷挠∷Ⅲw數(shù)字中單一方向的交點(diǎn)數(shù)有可能相等,因此需要將其兩個(gè)特征結(jié)合起來(lái)使用,這樣可以較好地識(shí)別數(shù)字。對(duì)于數(shù)字“0”的提取特征示意圖如圖4所示。
圖2 水平交點(diǎn)特征圖
圖3 垂直交點(diǎn)特征圖
圖4 數(shù)字“0”特征提取示意圖
此特征的提取方法為:用MATLAB編程使得10條水平線和10條垂直線分別均勻穿過(guò)數(shù)字圖像,求得水平方向和垂直方向的分割線和數(shù)字交點(diǎn)的個(gè)數(shù),所求得的20個(gè)交點(diǎn)個(gè)數(shù)即為反映數(shù)字特征的特征向量。數(shù)字“0”的特征向量如圖5所示。
圖5 數(shù)字“0”的特征向量
為了體現(xiàn)出對(duì)于不同數(shù)字所提取出來(lái)的特征向量各有不同,下面將對(duì)數(shù)字“1”進(jìn)行特征提取的詳細(xì)過(guò)程列出,如圖6所示。
圖6 數(shù)字“1”的特征提取過(guò)程
對(duì)數(shù)字“1”進(jìn)行特征提取后,所得的特征向量如圖7所示。
圖7 數(shù)字“1”的特征向量
對(duì)比圖5和圖7可知,對(duì)于不同數(shù)字以相同的方法進(jìn)行特征提取后,所得的特征向量不同,而對(duì)于同一個(gè)數(shù)字進(jìn)行特性提取后,所得的特征向量是相同的或極其相似的,則通過(guò)此種特征向量的提取方法可以很好地將數(shù)字0~9區(qū)分開(kāi)來(lái)。
對(duì)于訓(xùn)練樣本的其中一組圖片0~9進(jìn)行特征提取后,提取的特征向量如表1所示。
表1 不同數(shù)字的特征向量表示
RBF網(wǎng)絡(luò)是一種三層前饋神經(jīng)網(wǎng)絡(luò)。第一層為輸入層,它由信號(hào)源節(jié)點(diǎn)組成,用來(lái)連接網(wǎng)絡(luò)與外界環(huán)境;第二層為隱含層,隱單元的變換函數(shù)是對(duì)中心點(diǎn)徑向?qū)ΨQ非負(fù)非線性的衰減函數(shù);第三層為輸出層,網(wǎng)絡(luò)的輸出是隱單元輸出的線性加權(quán)[9]。從輸入空間到隱含層空間的變換是非線性的,從隱含層空間到輸出層空間的變換是線性的[10]。圖8為RBF神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)圖,它具有n個(gè)輸入結(jié)點(diǎn)、h個(gè)隱層結(jié)點(diǎn)、m個(gè)輸出結(jié)點(diǎn)。
圖8 RBF神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖
本文所使用的網(wǎng)絡(luò)是20個(gè)輸入、10個(gè)輸出,則輸入模式記為X,X=[x1,x2,…,x20]T,輸出模式記為Y,Y=[y0,y1,…,y9]T,本文取徑向基函數(shù)為Gauss函數(shù),則隱單元輸出為
式中:φj(x)為隱含層第j個(gè)神經(jīng)元的輸出值;cj為隱含層第j個(gè)神經(jīng)元的中心;δj為隱含層第j個(gè)神經(jīng)元的半徑;‖x-cj‖為歐氏范數(shù)。
輸出層神經(jīng)元的輸入輸出關(guān)系表達(dá)式為
式中:yk為輸出層第j個(gè)神經(jīng)元的輸出值;Wkj為輸出層第k個(gè)神經(jīng)元與隱含層第j個(gè)神經(jīng)元之間的權(quán)值。
由于對(duì)于數(shù)字識(shí)別問(wèn)題可以預(yù)先知道期望輸出值的所有情況,故可利用提取的特征向量數(shù)據(jù)和期望輸出數(shù)據(jù)組成樣本空間,網(wǎng)絡(luò)的輸入是一個(gè)20×1的列向量,對(duì)應(yīng)的期望輸出是一個(gè)10×1的列向量。對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練后能夠得出合適的網(wǎng)絡(luò)權(quán)值,然后將實(shí)際檢測(cè)的用于識(shí)別的數(shù)字特征向量輸入訓(xùn)練好的RBF網(wǎng)絡(luò)進(jìn)行識(shí)別,得出識(shí)別結(jié)果。
學(xué)習(xí)樣本個(gè)數(shù)定為200,每個(gè)數(shù)字選取1 000個(gè)樣本進(jìn)行測(cè)試,比較不同的特征向量維數(shù)對(duì)識(shí)別結(jié)果的影響如表2所示。
表2 不同的特征向量維數(shù)對(duì)識(shí)別結(jié)果的影響 %
由表2知,當(dāng)選取數(shù)字的特征向量維數(shù)增多時(shí),識(shí)別結(jié)果的正確率增高了。實(shí)際測(cè)試過(guò)程中發(fā)現(xiàn)若特征向量維數(shù)過(guò)高,會(huì)增加機(jī)器開(kāi)銷,降低運(yùn)算速度。測(cè)試結(jié)果表明,當(dāng)特征向量維數(shù)選定為20,學(xué)習(xí)樣本個(gè)數(shù)選定為200時(shí),識(shí)別速度較快,對(duì)1 000×10個(gè)樣本進(jìn)行測(cè)試,對(duì)于大多數(shù)數(shù)字的識(shí)別準(zhǔn)確率可以達(dá)到100%。對(duì)于數(shù)字“4”和“9”的識(shí)別率有待提高。
隨著信息化技術(shù)的不斷發(fā)展,數(shù)字識(shí)別技術(shù)也得到了很大的提高。本文所提出的基于交點(diǎn)特征和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的印刷體數(shù)字識(shí)別方法有著較高的識(shí)別率,較短的識(shí)別時(shí)間,能夠?qū)?shù)字進(jìn)行正確高效的識(shí)別。
[1]陳展東,白寶興,韓成,等.數(shù)字識(shí)別算法研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào),2010,33(1):147-151.
[2]楊志華.利用Radon變換實(shí)現(xiàn)手寫數(shù)字識(shí)別的新方法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(30):13-15.
[3]孔月萍,曾平,李智杰,等.基于組合特征的高效數(shù)字識(shí)別算法[J].計(jì)算機(jī)應(yīng)用研究,2006(10):172-173.
[4]GONZALEZ-CAMACHO J,CAMPOS G,PEREZ P.Genome-enabled prediction of genetic values using radial basis function neural networks[J].Theoretical and Applied Genetics,2012,125(4):759-771.
[5]張陽(yáng).基于DSP的人民幣序列號(hào)識(shí)別系統(tǒng)的研究[J].電視技術(shù),2012,36(15):140-143.
[6]夏國(guó)恩,金煒東,張葛祥.基于組合特征的手寫體數(shù)字識(shí)別方法[J].計(jì)算機(jī)應(yīng)用研究,2006(6):170-172.
[7]雙小川,張克.基于統(tǒng)計(jì)和結(jié)構(gòu)特征的手寫數(shù)字識(shí)別研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(4):1533-1537.
[8]閆雅楠,夏定元.結(jié)合邊緣檢測(cè)和區(qū)域分割的形狀特征提?。跩].電視技術(shù),2007,31(3):12-15.
[9]LINA J,CHENB B,SZEA K.A new radial basis function for helmholtz problems[J].Engineering Analysis with Boundary Elements,2012,36 (12):1923-1930.
[10]王曄,吳小俊,王士同,等.基于改進(jìn)人工魚群算法的RBF網(wǎng)絡(luò)及其在人臉表情識(shí)別中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2008,25(9): 2643-2646.
Approach to Printed Digital Recognition w ith Intersection Features
DAIJing,HU Zhaozheng,BAIJianchuan
(School of Information Engineering,Hebei University of Technology,Tianjin 300401,China)
In order to further improve the accuracy rate of printed digital recognition,a new digital recognition approach which combined intersection features and Radial Basis Function(RBF)neuralnetwork is proposed.Firstly,the intersection features ofnumbers are extracted.Namely,the numbers of the intersection points of the number with some dividing lines in horizontal direction are extracted as the horizontal features and the numbers of the intersection points of the number with some dividing lines in vertical direction are extracted as the vertical features.And all of the horizontal features and the vertical features of the number are combined as the intersection features.Secondly,the samples in differentmodesare trained in the RBF neuralnetwork. After training,the samples are recognized in the RBF neural network.The results of experiment show that the recognition rate of printed numbers can achieve 100%.The treatment effect of this approach is good.
printed digital recognition;intersection features;RBF neural network
TN391.4
A
戴 靜(1988—),女,主研電子與通信技術(shù);
?? 雯
2013-08-18
【本文獻(xiàn)信息】戴靜,胡釗政,白建川.一種基于交點(diǎn)特征的印刷體數(shù)字識(shí)別方法[J].電視技術(shù),2014,38(13).
國(guó)家自然科學(xué)基金項(xiàng)目(60972106;51208168);天津市自然科學(xué)基金項(xiàng)目(11JCYBJC00900;13JCYBJC37700);河北省自然科學(xué)基金項(xiàng)目(F2013202254;F2013202102);河北省引進(jìn)留學(xué)人員基金項(xiàng)目(C2012003038)
胡釗政,教授,博士生導(dǎo)師,主研電子與通信技術(shù);
白建川,博士生,主研智能信息處理。