亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于BP網(wǎng)絡(luò)的字符識別算法

        2021-10-18 08:13:34王汝心馬維華
        現(xiàn)代計算機(jī) 2021年24期

        王汝心,馬維華

        (南京航空航天大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,南京210016)

        0 引言

        字符識別應(yīng)用于多個領(lǐng)域。常用的字符識別方法包括基于模板匹配[1-2]、基于特征分析匹配[3]和基于機(jī)器學(xué)習(xí)[4-6]。字符特征有網(wǎng)格像素統(tǒng)計、正交投影法、骨架特征等方法,但這些特征提取方法各有側(cè)重,具有局限性,當(dāng)字符相似時識別效果較差。隨著機(jī)器學(xué)習(xí)算法的研究進(jìn)展,機(jī)器學(xué)習(xí)算法被越來越多的應(yīng)用到字符識別領(lǐng)域。孫國棟、江亞杰等使用訓(xùn)練好的BP(Back Propagation,反向傳播)網(wǎng)絡(luò)對圖像全局閾值進(jìn)行預(yù)測并二值化,達(dá)到分離重影的目的,并采用改進(jìn)LeNet-5網(wǎng)絡(luò)完成字符識別[4]。咼潤華、蘇婷婷等通過總體密度、分塊密度等特征表達(dá)不同字符的差別,以減少后續(xù)工作的計算量,將模板匹配方法嵌入到收斂的BP神經(jīng)網(wǎng)絡(luò)中,在提高系統(tǒng)的計算效率、縮短運(yùn)行時間的同時提高了字符識別效率[6]。

        本文將骨架提取與BP網(wǎng)絡(luò)相結(jié)合,在細(xì)化圖片、保留原字符特征的同時引入字符圖片中更多的特征,優(yōu)化BP網(wǎng)絡(luò),以提高對尺寸偏小的圖片的識別準(zhǔn)確度和精確度。

        1 特征提取

        1.1 骨架提取

        骨架提取(image skeletonization)是實現(xiàn)二值圖像細(xì)化(image thinning)的運(yùn)算方法之一。當(dāng)圖像本身尺寸偏小、或者當(dāng)字符圖案在圖片整體中所占區(qū)域過小時,進(jìn)行字符分割后獲得的字符圖片往往像素點(diǎn)偏少,導(dǎo)致提取特征時能夠提取的特征向量個數(shù)也會隨之減少,因而會對字符識別結(jié)果造成影響。對圖片中的字符筆畫進(jìn)行細(xì)化,提取字符的骨架,從而在不改變字符的輪廓特征的同時,突出字符與字符之間的細(xì)微區(qū)別

        對一個二值圖像而言,骨架可以理解為圖像的中軸,它是一種細(xì)化結(jié)構(gòu),描述了目標(biāo)的拓?fù)浣Y(jié)構(gòu)。細(xì)化過程就是將圖像中的像素點(diǎn)剝離,圖像有規(guī)律地縮小,在保持原圖案形狀的基礎(chǔ)上,逐步刪除原圖像中的部分像素點(diǎn),直到獲得圖像的骨架。

        保證圖案形狀不變,應(yīng)保證圖像的連通性質(zhì)不變,減少線條相交處的畸變,在細(xì)化過程中,應(yīng)判斷一個點(diǎn)p1是否能去掉時,應(yīng)參考該點(diǎn)的相鄰8個點(diǎn)的情況。在這9個點(diǎn)中,只有當(dāng)p1不是內(nèi)部點(diǎn)、且不是端點(diǎn)、且不是固定點(diǎn)、且是邊界點(diǎn)、且去掉p1后,如果連通分量不增加時才可刪除p1點(diǎn)。

        如圖1所示,當(dāng)p1周圍的8個點(diǎn)滿足圖1(b)、(c)、(d)中任意一種情況時,p1點(diǎn)都不能刪除。

        根據(jù)以上條件可以推導(dǎo)出,對于圖像中的任意像素點(diǎn)p1,只有同時滿足以下4個條件時才能將p1點(diǎn)刪除:

        (1)f(p)=p2+p3+p4+p5+p6+p7+p8+p9,則f(p)應(yīng)滿足2≤f(p)≤6。

        結(jié)合圖1可知,當(dāng)p1為孤立點(diǎn)時,f(p)的值為0;當(dāng)p1為端點(diǎn)時,f(p)的值為1;當(dāng)p1為內(nèi)部點(diǎn)時,f(p)的值為7或8。由此得出,當(dāng)2≤f(p)≤6時,排除了p1點(diǎn)是端點(diǎn)、孤立點(diǎn)或內(nèi)部點(diǎn)的可能性。

        (2)在序列{p2,p3,p3,p4,p4,p5,p5,p6,p6,p7,p7,p8,p8,p9,p9,p2}中,0,1的數(shù)量為1,以保證圖片的連通性不發(fā)生改變。

        (3)p2*p4*p8=0或者A(p2)≠0,其中A(p2)表示p2周圍8鄰域的0,1的數(shù)量,以保證2個像素寬的垂直區(qū)域不完全被腐蝕掉。

        (4)為了保證2個像素寬的水平區(qū)域不完全被腐蝕掉,應(yīng)滿足條件p2*p4*p6=0或者A(p4)≠0,其中A(p4)表示p4周圍8鄰域的0,1的數(shù)量。

        圖1細(xì)化條件

        1.2 HOG提取

        為了減少計算復(fù)雜度、時間消耗和空間消耗,對分割好的字符圖片進(jìn)行分析,從大量數(shù)據(jù)中提取中關(guān)鍵信息轉(zhuǎn)換為若干特征。本文通過提取字符的HOG特征,在描述目標(biāo)特征的同時獲取分布向量。

        提取HOG特征共分5步:

        (1)分割圖像為2×2像素的連通區(qū)域;

        (2)采集連通區(qū)域內(nèi)的像素點(diǎn),通過垂直梯度算子[- 1,0,1]T,水平梯度算子[- 1,0,1]提取像素點(diǎn)的水平和垂直梯度。

        (3)計算水平和垂直方向的合梯度,包括幅值和方向。

        (4)以2×2個連通區(qū)域為一個block,將block中的HOG向量拼接并歸一化。

        (5)滑動步長設(shè)定為1個像素,計算圖像整體的HOG特征向量。

        2 BP分類器

        2.1 BP網(wǎng)絡(luò)構(gòu)建

        BP神經(jīng)網(wǎng)絡(luò)分為兩個過程:將輸入信息正向傳遞,完成一次訓(xùn)練過程;將實際結(jié)果和預(yù)測結(jié)果的誤差反向傳播,修正各層的權(quán)重。Robert Hecht-Nielsen曾提出萬能逼近定理,證明了包含一個隱藏層的BP網(wǎng)絡(luò)可以用于擬合任意閉區(qū)間內(nèi)的連續(xù)函數(shù)。換言之,假設(shè)單個樣本具有m個樣本特征、n個輸出向量,一個包含輸入層(I)、隱含層(H)、輸出層(O)的三層的BP網(wǎng)絡(luò)就可以完成任意的維到維的映射。當(dāng)m=3、n=3時,BP網(wǎng)絡(luò)如圖2所示。

        圖2 BP網(wǎng)絡(luò)

        假設(shè)有a個訓(xùn)練樣本,那么對于第p個輸入,輸入向量為Ip=(ip1,…,ipm)T,目標(biāo)輸出向量Tp=(tp1,…,tpm)T,最終輸出向量表示為Op=(op1,…,opm)T。以wij表示輸入向量第j(j=1,2,…,m)個分量到輸出向量的第i(i=1,2,…,n)個分量的權(quán)重。則第p個輸入下輸出方差為:

        其中,p=1,2,…,a。則網(wǎng)絡(luò)總誤差如公式(2)所表示:

        根據(jù)梯度下降法和Widrow-Hoff規(guī)則,連續(xù)調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,wij應(yīng)沿著相對誤差平方和方向,權(quán)值矢量的修正值和當(dāng)前位置上的E的梯度成正比,則對于第j個輸出節(jié)點(diǎn),有:

        重復(fù)上述過程,以修正各層神經(jīng)元之間的連接權(quán)重,使得期望輸出值在誤差閾值的允許范圍內(nèi)。

        2.2 BP網(wǎng)絡(luò)優(yōu)化

        由于BP網(wǎng)絡(luò)中的極小值較多,易于陷入局部極小值,而無法獲得全局最優(yōu)值。所以通過以下方法優(yōu)化BP網(wǎng)絡(luò)。

        (1)多次隨機(jī)訓(xùn)練,選擇使訓(xùn)練后效果最好的初始值。在依據(jù)誤差函數(shù)進(jìn)行BP網(wǎng)絡(luò)訓(xùn)練以得到最小誤差的過程中,需要以初始值為基礎(chǔ)和起點(diǎn),所以初始值決定了BP網(wǎng)絡(luò)的收斂方向。并采用退火思想允許E按照一定概率上升,從而減少BP網(wǎng)絡(luò)陷入局部最小值的可能性。

        (2)增加動量項∝。通過增加動量項,增大搜索步長,從而加速算法收斂,同時可以降低BP網(wǎng)絡(luò)對誤差曲面局部區(qū)域的敏感性。根據(jù)BP網(wǎng)絡(luò)的思想,第n-1次的迭代結(jié)果影響力第n次迭代中,神經(jīng)元之間的權(quán)值更新,所以在迭代過程中采用公式(4),其中動量因子∝一般選擇0.1~0.8。

        (3)自適應(yīng)調(diào)節(jié)學(xué)習(xí)率。學(xué)習(xí)率的大小影響了BP網(wǎng)絡(luò)的收斂快慢和訓(xùn)練成果。當(dāng)學(xué)習(xí)率取值較小時,訓(xùn)練更容易穩(wěn)定收斂,但取值過小會導(dǎo)致BP網(wǎng)絡(luò)訓(xùn)練時間變成、運(yùn)行速度降低等問題;當(dāng)學(xué)習(xí)率取值較大時,可以加速收斂,訓(xùn)練結(jié)果可能震蕩發(fā)散。因此,為了選擇合適的學(xué)習(xí)率,應(yīng)采用自適應(yīng)方法調(diào)節(jié)取值大小。

        (4)通過優(yōu)化隱含層數(shù)和隱含節(jié)點(diǎn)數(shù)目完成網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化。若隱含節(jié)點(diǎn)過少,可能導(dǎo)致精度降低;若隱含節(jié)點(diǎn)過多,雖然能提高精度,但由于網(wǎng)絡(luò)結(jié)構(gòu)過大導(dǎo)致BP網(wǎng)絡(luò)性能下降。艷霞、李禹生等曾就隱藏節(jié)點(diǎn)數(shù)目與BP網(wǎng)絡(luò)性能之間的關(guān)系進(jìn)行實驗,結(jié)果表明,當(dāng)隱藏節(jié)點(diǎn)數(shù)目為取20~40時BP網(wǎng)絡(luò)性能更好[7]。

        3 性能評估

        隱藏層選擇Sigmoid型函數(shù)作為變換函數(shù),隱藏層節(jié)點(diǎn)設(shè)置為30個,采用自適應(yīng)學(xué)習(xí)算法,目標(biāo)誤差設(shè)置為0.001,或執(zhí)行30次迭代訓(xùn)練。將樣本數(shù)據(jù)集進(jìn)行骨架提取,所得結(jié)果圖片作為BP網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)集。獲得迭代次數(shù)和識別正確率的數(shù)據(jù)后,將隱藏層節(jié)點(diǎn)設(shè)置為40個和50個。在圖3中,展示了迭代次數(shù)、識別正確率、節(jié)點(diǎn)個數(shù)三者之間的關(guān)系。

        從圖3可以看出,第一次學(xué)習(xí)迭代的識別正確率普遍較低,在第10次迭代之前,正確率的波動較大。在第10次迭代之后,正確率趨于穩(wěn)定。在多次迭代、正確率穩(wěn)定后,當(dāng)隱藏層節(jié)點(diǎn)設(shè)置為30個時,平均正確率為93.88%,最大正確率為94.36%;隱藏層節(jié)點(diǎn)設(shè)置為40個時,平均正確率為94.23%,最大正確率為95.06%;隱藏層節(jié)點(diǎn)設(shè)置為50個時,平均正確率為95.20%,最大正確率為95.60%。

        綜合考慮迭代次數(shù)的多少、隱藏層節(jié)點(diǎn)數(shù)目和網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度等因素對訓(xùn)練結(jié)果、訓(xùn)練時間的長短的影響,設(shè)置隱藏層的神經(jīng)元個數(shù)為50個,令BP網(wǎng)絡(luò)迭代訓(xùn)練30次。

        圖3迭代次數(shù)與正確率之間的關(guān)系

        將測試樣本數(shù)據(jù)集進(jìn)行骨架提取,將所得結(jié)果圖片作為BP網(wǎng)絡(luò)的輸入,得到字符識別結(jié)果,并對識別結(jié)果進(jìn)行統(tǒng)計,以測驗BP網(wǎng)絡(luò)對低像素圖片的識別效果,得到BP神經(jīng)網(wǎng)絡(luò)對骨架提取后的字符圖片進(jìn)行識別,正確率為95.55%。將識別錯誤的圖片經(jīng)過圖像細(xì)化、HOG特征提取后,通過BP網(wǎng)絡(luò)進(jìn)行識別,正確率為95.65%。

        4 結(jié)語

        本文通過分析低像素圖片的特征,將二值圖片的骨架提取與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合。通過骨架提取細(xì)化圖片中的字符圖案,判斷像素點(diǎn)是否應(yīng)刪除的依據(jù),并進(jìn)行HOG特征提取。構(gòu)建BP網(wǎng)絡(luò),并對BP網(wǎng)絡(luò)進(jìn)行優(yōu)化,完成對低像素圖片識別算法。對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,對隱藏層節(jié)點(diǎn)個數(shù)、迭代次數(shù)和識別正確率進(jìn)行統(tǒng)計和分析,迭代次數(shù)為30次,隱藏層節(jié)點(diǎn)個數(shù)為50個。將測試樣本數(shù)據(jù)進(jìn)行圖片細(xì)化,通過BP網(wǎng)絡(luò)進(jìn)行識別,正確率為95.55%。

        国产91成人自拍视频| 77777亚洲午夜久久多人| 国产av成人精品播放| 丰满人妻无奈张开双腿av| 中文字幕av熟女中文av| 中文字幕乱码熟妇五十中出| 亚洲av成人综合网| 亚洲精品乱码久久久久99| 精品老熟女一区二区三区在线| 伊人久久精品无码二区麻豆| 精品久久人人爽天天玩人人妻| 国产av一区二区三区区别| 国产亚洲精品免费专线视频| 亚洲av午夜成人片精品电影| 性高朝久久久久久久| 人妻有码中文字幕在线不卡| 蜜桃久久综合一区二区| 一本色道久久综合狠狠躁篇| 蜜臀av一区二区| 人妻少妇精品一区二区三区| 一区二区三区午夜视频在线| 亚洲裸男gv网站| 欧美在线日韩| 黄色大片国产精品久久| 无套熟女av呻吟在线观看| 中文字幕爆乳julia女教师| 99亚洲乱人伦精品| 中文字幕一区二区av | 国产xxxxx在线观看| 国产成人久久精品区一区二区 | 国产成人av综合色| 亚洲国产欧美在线成人| 大香蕉久久精品一区二区字幕| 在线播放av不卡国产日韩| av无码天堂一区二区三区| 99re6久精品国产首页| 久久伊人精品色婷婷国产| 国产精品爽爽v在线观看无码| 手机看片1024精品国产| 国产亚洲精品综合一区二区| 小说区激情另类春色|