亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于神經(jīng)網(wǎng)絡(luò)的手寫體漢字識別實驗系統(tǒng)

        2015-04-16 01:29:54鄭少蘭
        電腦與電信 2015年5期
        關(guān)鍵詞:手寫體手寫筆畫

        鄭少蘭

        (福建水利電力職業(yè)技術(shù)學院,福建 永安 366000)

        1 引言

        基于神經(jīng)網(wǎng)絡(luò)的手寫漢字識別在眾多領(lǐng)域中應(yīng)用廣泛,比如在信息處理領(lǐng)域,通過手寫漢字識別系統(tǒng)的應(yīng)用就能夠使紙質(zhì)文檔的電子化效率得到大大提高。若將漢字識別的速度與準確度都提高到比人工手動輸入更高的層次,這樣在提高效率時又節(jié)省了大量的人力資源。因此,研究基于神經(jīng)網(wǎng)絡(luò)的手寫漢字識別試驗系統(tǒng)能夠有效實現(xiàn)漢字信息的高速輸入,進而能夠更加方便快捷地加工和處理信息。

        2 手寫體漢字識別實驗系統(tǒng)的設(shè)計目標

        本次設(shè)計要實現(xiàn)的目標就是建立一個圖像處理識別的平臺,使手寫的漢字以圖像文件格式(BMP)的形式輸入FPGA,提取出其特征向量,通過分類識別,轉(zhuǎn)換為漢字文本。我們需要設(shè)計和實現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的手寫漢字識別系統(tǒng),主要實現(xiàn)樣本采集、預(yù)處理、特征提取、分類與識別五個方面。系統(tǒng)的具體目標有以下幾個方面:

        首先就是使用FPGA對字庫圖像文件進行前期處理,包括字符分割平滑去噪、二值化處理、歸一化、細化等;其次就是使用處理后的標準字符圖像對分類模型進行訓練,使其成為具有字形識別功能的分類器。通過包括神經(jīng)網(wǎng)絡(luò)、筆畫密度、字型特征、四角特征等多種分類器的測試,綜合考慮每種分類器的并行化可能性、漢字特征針對性等,選出合適的分類器分別進行粗分類和細識別,以利用FPGA的并行運算特性大幅度提高識別的效率和準確度;最后就是對多個手寫樣本圖像文件進行并行化的采集和預(yù)處理,提出具有價值的字形特征。采用適當?shù)姆诸惼鲗ζ溥M行分類識別,得到漢字國標碼,從而實現(xiàn)手寫體漢字從圖片到文本的轉(zhuǎn)換。

        3 手寫體漢字的預(yù)處理及其原理

        3.1 行、字切分

        從實際出發(fā),一個完整的脫機手寫體漢字識別系統(tǒng)必須能對輸入的整個手寫體漢字圖像進行一些必要的處理,并從中正確切分出一個個手寫體漢字,形成單個漢字的圖像陣列,以便對其進行方便的單字識別處理。一般的做法是自上而下逐行地對漢字圖像進行掃描,同時對各個掃描行的像素進行計算,得到圖像水平的投影,利用文字每行之間存在的空白間隔,對其進行分割,然后再利用字和字之間空白間隔的投影空隙把單個的漢字圖像切分出來。

        如下圖1所示,我們從一個漢字上、下、左、右四個對角線方向,用一種假想的網(wǎng)線對手寫漢字進行掃描和切分,某條網(wǎng)線穿過筆劃的次數(shù)就是該筆畫的密度特征。

        圖1 漢字切分

        設(shè)Ii是水平方向上第i條網(wǎng)線,則沿這條掃描線得到的手寫漢字加權(quán)筆劃密度特征的公式為:

        3.2 平滑去噪處理

        一幅漢字圖像往往會存在許多噪聲,對圖像中噪聲成分的處理就叫圖像平滑化,平滑化的目的共有兩個:第一就是按照特定的要求將一幅圖像中較為有用的信息凸顯出來,從而使?jié)h字圖像更加地清晰,達到更好地視覺效果;另外一種就是為了更好地適應(yīng)計算機處理的需要,避免漢字再輸入數(shù)字化的過程中混入噪聲。目前較為常用的平滑去噪算法有Unger平滑算法、中值濾波以及鄰域平均法等。

        3.3 二值化

        二值化也就是將手寫漢字圖像灰度數(shù)字信號處理為只含1與O兩個級灰度的圖像。將灰度圖像進行二值化處理能夠有效地減小數(shù)據(jù)存儲的容量,這樣在后續(xù)處理的過程中其復(fù)雜度就會有所降低。二值化最基本的要求就是字筆劃中不可以存在空白,并且原來的文字特征也要得到有完整的保存。最簡單的二值化通過設(shè)定固定灰度閾值完成,其關(guān)鍵在于閾值的選擇。常用的方法有動態(tài)閾值法、整體閾值法以及局部閾值法三種。但是動態(tài)閾值與局部閾值比較浪費時間,而且在選擇算法的過程中還會在圖像整體的選擇上產(chǎn)生失真,因此,在對文字進行識別時,通常選用整體閾值的方法。

        3.4 歸一化

        單個漢字圖像或者點陣,都要歸一化處理,目的是消除漢字在大小與位置上的變化。大小歸一化與位置歸一化是歸一化處理的兩個必要的部分。對漢字點陣進行歸一化處理是非常重要的,這是因為對漢字進行識別的原理就是在漢字圖形結(jié)構(gòu)的基礎(chǔ)上進行的,若無法把漢字點陣在大小與位置上保持一致,就無法正確進行漢字的相似性比較。

        3.4.1 位置歸一化

        若對位置歸一化進行細分,還可以分為兩種:一種是重心的歸一化處理,另一種就是外框的歸一化處理。重心計算的抗干擾性要強于邊框搜索,由于大部分漢字的筆劃分布較為均勻,其重心大多等同于漢字字形的中心,但若對少數(shù)分布不均勻的漢字進行識別的話,重心歸一會導(dǎo)致字形移動,最后造成字形失真。

        3.4.2 大小歸一化

        在對一些大小不統(tǒng)一的漢字識別時,就一定要進行大小歸一處理。最常用的方法就是按照漢字點陣外圍的邊框來處理的,首先對漢字點陣各個方向上的外圍邊框進行判斷,然后再根據(jù)比例把漢字進行線性縮小或者放大,從而形成規(guī)范的點陣。

        3.5 細化

        細化之后漢字的骨架存儲量與原來漢字的二值化點陣相比要少很多,在減少處理工作量的同時又會保留以前漢字的大多數(shù)特征,這樣方便抽取特征,從而可以確保識別的正確性和高效性。但是在細化的過程中通常會產(chǎn)生新的畸變,這就大大增加了識別手寫漢字的困難與干擾。進行細化的算法有許多,大體分類如下:

        (1)按細化后圖形的連續(xù)性分,有四鄰連接算法,八鄰連接算法和混合連接算法。四鄰接連指的是水平垂直四個方向上的連接,八鄰連接則加上正反斜向共八個方向。

        (2)按細化處理過程分,有串行、并行和串并行處理法。FPGA適合并行計算,故我們采用并行處理法,即對邊緣點全部檢測完畢后,再同時改變所有可刪除點的值。

        (3)按處理方式分,有單方向,雙方向和四方向細化法。愈是方向多的細化處理方式,細化的速度愈快。

        如圖2所示,我們可以從手寫漢字上下左右四個方向的八個等距邊緣點處對所要識別漢字的一階和二階外圍特征進行檢測,通過四方向法的處理,可以使細化速度更快,加權(quán)和也就更加容易算出。

        圖2 一階、二階外圍特征檢測

        4 手寫漢字的特征提取

        由于漢字字量大、字體多、結(jié)構(gòu)復(fù)雜,我們采用分級分類的方法進行識別,而每級分類應(yīng)采用最合適的特征提取算法。同時,考慮到FPGA的并行計算特點,應(yīng)優(yōu)先選用并行性好的算法。基于以上兩點,我們在對BP神經(jīng)網(wǎng)絡(luò)、字型特征、筆畫密度特征、彈性網(wǎng)格特征、筆畫結(jié)構(gòu)特征、四角特征等能夠提取特征的算法進行了理論分析。

        4.1 基于分類識別的選擇

        BP神經(jīng)網(wǎng)絡(luò)具有自適應(yīng)性,通過反復(fù)訓練不斷修正連接權(quán)值以進行特征提取。該方法具有較高的普適性,并且可以通過調(diào)整學習方法得到一種較優(yōu)的網(wǎng)絡(luò)。但該方法并未利用漢字的特征,適用于子類中單字識別。通過對水平和垂直方向上投影得出的直方圖的分析,可得出一個漢字的字型統(tǒng)計特征(左右、上下等),適于粗分類。從水平,垂直方向等間隔取多根掃描線,取穿過筆畫數(shù)的最大值,形成2維特征向量,適于粗分類。在彈性網(wǎng)格特征上,根據(jù)筆畫位置將單個漢字分割為幾個網(wǎng)格,通過計算每個網(wǎng)格內(nèi)筆畫的矢量特征進行特征提取,特征向量較多,適用于子類中單字識別。在筆畫結(jié)構(gòu)特征上,通過尋找交叉點和拐點將漢字分為筆段,然后將筆段按傾斜度和連通性合并成筆畫,提取筆畫的矢量特性作為特征向量,向量數(shù)較多,適用于子類中單字識別。但該方法同時可以統(tǒng)計出筆畫總數(shù)和交叉點總數(shù),可用于粗分類。在四角特征上,通過提取四角的筆畫結(jié)構(gòu)特征進行分類,向量中包含四個元素,可結(jié)合筆畫結(jié)構(gòu)特征進行粗分類。通過MATLAB對以上算法進行實驗,以確定最優(yōu)的分類和子分類中單字識別的算法。

        4.2 基于并行化運算的選擇

        在BP神經(jīng)網(wǎng)絡(luò)上,由于神經(jīng)網(wǎng)絡(luò)由神經(jīng)元構(gòu)成,每個神經(jīng)元的計算以及權(quán)值調(diào)整計算都為乘法和加法,以上特征使之很適合并行化和流水線計算。在字型特征上,投影運算為串并行結(jié)合加法運算,最大值計算為串行運算,字型判斷部分為較復(fù)雜串并行結(jié)合邏輯運算。在筆畫密度特征上,水平和垂直掃描運算為串行,多根掃描線并行,取最大值運算為串行。在彈性網(wǎng)格特征上,分格后可對每格進行并行化運算,但其中的向量計算包含大量除法,其實現(xiàn)效率有待驗證。在筆畫結(jié)構(gòu)特征上,交叉點尋找為并行,傾斜度計算為并行,提取矢量特性為并行,但以上步驟的結(jié)果入庫過程為串行掃描。在四角特征上,四角可并行運算。在進行MATLAB進行算法實驗的同時,使用System Generator進一步對算法的并行化及流水線計算可能性進行評估實驗,并結(jié)合基于分類識別的選擇進行總體效率評估。

        5 統(tǒng)計方法的選擇

        常見的統(tǒng)計方法有基于事例學習以及最近鄰歸類等,這些方法其實就是在某種距離的基礎(chǔ)上通過相應(yīng)的變換,然后得到一些具有其它類別參數(shù)公式。統(tǒng)計學上常見的距離公式主要有明斯基距離、絕對值距離以及歐氏距離等。最小距離分類器是一種非常有效直觀的分類方法,廣泛應(yīng)用于實際的手寫漢字識別系統(tǒng)中,特別是對于一些高維多模式來說,采取類聚等分類的方法有著計算量巨大以及很難確保算法的收斂等問題,這樣距離函數(shù)分類器就會充分發(fā)揮其優(yōu)勢。

        6 結(jié)語

        如果能采用FPGA進行高速并行計算,使上述困難能得到最大程度的化解,從而使基于神經(jīng)網(wǎng)絡(luò)的手寫體漢字識別系統(tǒng)達到實用階段,則在實際應(yīng)用方面和理論研究方面均有重大意義。由于漢字模式類別多,是大類別(或者稱為超多類)模式識別問題,因此其識別涉及到模式識別、圖像處理、數(shù)字信號處理、人工智能、模糊數(shù)學等多個學科,是一門綜合性技術(shù),有著重要的價值和意義。

        [1]袁丁,傅一平,李志能.基于小波變換的字符識別快速算法[J].浙江大學學報(工學版),2004,(03):62-66.

        [2]郭招球,趙躍龍,高敬欣.基于小波和神經(jīng)網(wǎng)絡(luò)的車牌字符識別新方法[J].計算機測量與控制,2006,(09):1257-1259.

        [3]黃戈祥,陳繼榮.ART2神經(jīng)網(wǎng)絡(luò)在手寫體漢字識別中的應(yīng)用[J].計算機仿真.2006,(7):153-156.

        猜你喜歡
        手寫體手寫筆畫
        手寫比敲鍵盤更有助于學習和記憶
        哐當(外一首)
        哐當(外一首)
        我手寫我心
        筆畫相同 長短各異
        ——識記“己”“已”“巳”
        有趣的一筆畫
        學生天地(2020年14期)2020-08-25 09:21:06
        抓住身邊事吾手寫吾心
        基于大數(shù)據(jù)下的手寫體識別的設(shè)計與研發(fā)
        科技風(2020年3期)2020-02-24 06:52:46
        披著書法外衣的手寫體
        中國篆刻(2019年6期)2019-12-08 15:56:23
        基于集成學習的MINIST手寫數(shù)字識別
        電子制作(2018年18期)2018-11-14 01:48:08
        亚洲综合久久精品少妇av| av在线播放免费网站| 亚洲成a∨人片在线观看无码 | 亚洲女同性恋第二区av| 亚洲色偷偷综合亚洲avyp| 性生交大片免费看淑女出招| 天天躁日日操狠狠操欧美老妇| 伊人狼人影院在线视频| 97人妻精品一区二区三区男同| 中文字幕乱码熟女人妻水蜜桃| 97超在线视频免费| 免费观看在线一区二区| 99久久精品在线视频| 99久久精品日本一区二区免费| 在线观看视频亚洲| 一区二区三区在线日本| а天堂中文地址在线| 久久久精品人妻久久影视| 久久国产成人午夜av影院| 成年男女免费视频网站点播| 亚洲av无码无线在线观看| 亚洲精品网站在线观看你懂的| 丁香六月久久| 成人久久精品人妻一区二区三区| 亚洲欧美一区二区成人片| 人妻在卧室被老板疯狂进入国产 | 午夜无码片在线观看影院y| 熟妇人妻精品一区二区视频| 色视频综合无码一区二区三区| 亚洲丁香婷婷久久一区二区| 永久免费观看国产裸体美女| 天天插视频| 国产一区三区二区视频在线观看| 欧美激情一区二区三区| 18无码粉嫩小泬无套在线观看| 国产av乳头久久一区| 国产一区亚洲二区三区| 在线亚洲午夜理论av大片| 国产精品国产午夜免费看福利| 久久国产影视免费精品| 久久成人永久婷婷99精品|