亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的手寫漢字識(shí)別研究

        2020-06-24 03:06:44張慧宇
        中國新通信 2020年2期
        關(guān)鍵詞:識(shí)別卷積神經(jīng)網(wǎng)絡(luò)漢字

        張慧宇

        摘要:神經(jīng)網(wǎng)絡(luò)仿照生物神經(jīng)元的工作原理,本質(zhì)上是輸入與輸出之間的一種映射,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享機(jī)制與連接的稀疏性,其對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu)中層的功能和形式做了部分變化,通過局部連接的方式,形成了一種特殊的結(jié)構(gòu)化多層前饋神經(jīng)網(wǎng)絡(luò),具有較強(qiáng)的魯棒性與泛化性能?;诖耍跃矸e神經(jīng)網(wǎng)絡(luò)為模型,構(gòu)建出漢字識(shí)別網(wǎng)絡(luò),進(jìn)行漢字樣本特征提取和分類輸出。

        關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);漢字;識(shí)別

        目前,手寫漢字識(shí)別可分為聯(lián)機(jī)與脫機(jī)兩種形式,其中聯(lián)機(jī)手寫體漢字識(shí)別主要處理書寫者依托物理設(shè)備即時(shí)輸入的文字信號(hào),而脫機(jī)手寫體漢字識(shí)別主要處理圖像設(shè)備采集到的圖像形式文字信息。一般來說,脫機(jī)手寫文字識(shí)別比聯(lián)機(jī)手寫文字識(shí)別更加困難。漢字識(shí)別屬于人工智能范疇,目前是個(gè)研究熱點(diǎn),且具有挑戰(zhàn)性,繁雜的漢字字符、隨意性無約束性的手寫字體等因素會(huì)增加漢字識(shí)別難度,造成識(shí)別錯(cuò)誤、無法識(shí)別等問題。因此,需要尋找更加有效的方法,以推動(dòng)漢字識(shí)別的發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)是基于深度學(xué)習(xí)的前饋型的神經(jīng)網(wǎng)絡(luò),非常適用于處理大型圖像,將其運(yùn)用于漢字識(shí)別工作中,有利于簡化漢字識(shí)別流程,產(chǎn)生更好的識(shí)別效果。

        一、卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)與結(jié)構(gòu)

        (一)卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)。神經(jīng)網(wǎng)絡(luò)仿照生物神經(jīng)元的工作原理,本質(zhì)上是輸入與輸出之間的一種映射,卷積神經(jīng)網(wǎng)絡(luò)具有參數(shù)共享機(jī)制與連接的稀疏性,其對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu)中層的功能和形式做了部分變化,通過局部連接的方式,形成了一種特殊的結(jié)構(gòu)化多層前饋神經(jīng)網(wǎng)絡(luò),核心在于它的kernel,特點(diǎn)是頭重腳輕,實(shí)現(xiàn)了參數(shù)共享,避免BP神經(jīng)網(wǎng)絡(luò)反向傳播梯度損失過快的問題。[1]運(yùn)用卷積運(yùn)算取代一般的矩陣乘法運(yùn)算,避免了顯式特征抽取,提升了神經(jīng)網(wǎng)絡(luò)模型的泛化能力與魯棒性,開啟了神經(jīng)網(wǎng)絡(luò)新時(shí)代。在實(shí)際應(yīng)用領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)是一種高效的識(shí)別算法,也是一種多層感知器與特征提取器,通過卷積方式來提取圖像數(shù)據(jù)特征,能夠?qū)iT處理具有網(wǎng)格狀拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù),被廣泛應(yīng)用于人臉識(shí)別、圖像識(shí)別、語音分析等計(jì)算機(jī)視覺應(yīng)用領(lǐng)域。在卷積神經(jīng)網(wǎng)絡(luò)中,首先對(duì)于圖片中的每一個(gè)特征進(jìn)行局部感知,然后更高層次對(duì)局部進(jìn)行綜合操作,從而得到全局信息;每個(gè)卷積濾波器共享權(quán)值,同一特征映射面具有相同神經(jīng)元權(quán)值,無需考慮圖像局部特征坐標(biāo)位置,使得對(duì)高維數(shù)據(jù)處理無壓力,減少了特征提取與分類數(shù)據(jù)重建難度;無需手動(dòng)選取特征,利于特征圖的精確提取與分類識(shí)別。

        (二)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)組成可分為五部分,依次為數(shù)據(jù)輸入層、卷積計(jì)算層、池化層、全連接層、輸出層。輸入層是整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入,在處理圖像的卷積神經(jīng)網(wǎng)絡(luò)中,它一般代表了一張圖片的像素矩陣,卷積神經(jīng)網(wǎng)絡(luò)的輸入層可以處理多維數(shù)據(jù);卷積層是一個(gè)卷積神經(jīng)網(wǎng)絡(luò)中最重要的部分,由濾波器和激活函數(shù)構(gòu)成,進(jìn)行局部關(guān)聯(lián)與窗口聯(lián)動(dòng)操作,能夠提取數(shù)據(jù)圖像的特征,將神經(jīng)網(wǎng)絡(luò)中的每一個(gè)小塊進(jìn)行更加深入的分析從而得到抽象程度更高的特征;池化層又叫下采樣層,用于壓縮數(shù)據(jù)和參數(shù)的量、降低數(shù)據(jù)維度,對(duì)樣本數(shù)據(jù)進(jìn)行子抽樣操作,具有保持信息尺度不變性特征,可以去除冗余信息,抽取重要特征,防止神經(jīng)網(wǎng)絡(luò)的過擬合;全連接層是一排神經(jīng)元,用于連接扁平化多維數(shù)據(jù),在卷積神經(jīng)網(wǎng)絡(luò)的最后部分,是對(duì)提取的特征進(jìn)行非線性組合以得到輸出,用來完成分類任務(wù)。輸出層的結(jié)構(gòu)和工作原理與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)中的輸出層相同,對(duì)于圖像分類問題,輸出層使用邏輯函數(shù)或歸一化指數(shù)函數(shù)(softmax function)輸出分類標(biāo)簽[2]。

        二、基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識(shí)別

        在傳統(tǒng)的漢字識(shí)別方法中,常用彈性網(wǎng)格特征、方向線素特征以及Gabor特征方法,來提取漢字特征,例如,方向線素特征是根據(jù)漢字的八方向線素特征與路徑簽名特征,來提取圖像中漢字內(nèi)在特征;提取特征之后,用模板匹配法、決策樹算法、Adaboost算法等來對(duì)漢字圖像進(jìn)行分類。傳統(tǒng)的方法需要人工干預(yù),需要做出大量的工作,且識(shí)別的效果有限。

        隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)據(jù)信息技術(shù)與智能技術(shù)為漢字識(shí)別提供了新的實(shí)踐與理論模式,使得漢字識(shí)別數(shù)字化與智能化成為可能。深度學(xué)習(xí)技術(shù)的發(fā)展,滿足了手寫漢字識(shí)別革新需求,使得聯(lián)機(jī)和脫機(jī)手寫漢字的識(shí)別率都大為提升,同傳統(tǒng)的方法相比進(jìn)步非常明顯。利用深度學(xué)習(xí)的方法進(jìn)行手寫漢字識(shí)別,不需要人工提取漢字特征,深度神經(jīng)網(wǎng)絡(luò)會(huì)自動(dòng)完成漢字圖像特征的提取和分類。目前,在漢字識(shí)別領(lǐng)域,具有代表性的神經(jīng)網(wǎng)絡(luò)為CNN和RNN,CNN主要用于對(duì)漢字單字的識(shí)別,RNN主要用于文本行的識(shí)別。下面主要對(duì)基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識(shí)別進(jìn)行介紹。

        (一)基于卷積神經(jīng)網(wǎng)絡(luò)的漢字識(shí)別流程。在傳統(tǒng)的漢字識(shí)別流程中,可分為預(yù)處理、特征提取與降維、分類器分類與識(shí)別以及輸出結(jié)果等幾個(gè)模塊,其識(shí)別性能較為不穩(wěn)定、識(shí)別速率不高,耗時(shí)費(fèi)力。對(duì)于卷積神經(jīng)網(wǎng)絡(luò),想要完成漢字識(shí)別,首先必須準(zhǔn)備大量的手寫漢字樣本,一般情況下,手寫漢字的識(shí)別流程為:收集漢字樣本集和測(cè)試集、利用樣本訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)、調(diào)參、利用測(cè)試集進(jìn)行測(cè)試、輸出測(cè)試結(jié)果。[3]對(duì)于卷積神經(jīng)網(wǎng)絡(luò)而言,由于網(wǎng)絡(luò)良好的特性,能夠從不同的樣本圖像中提取出最能表達(dá)漢字本質(zhì)的數(shù)據(jù)特征,實(shí)現(xiàn)對(duì)大規(guī)模漢字樣本集的訓(xùn)練,大大提高了漢字識(shí)別率與正確率。

        (二)漢字識(shí)別流程主要步驟介紹。首先,要從網(wǎng)絡(luò)上搜集漢字樣本,手寫漢字樣本可以利用中科院自動(dòng)化研究所模式識(shí)別國家重點(diǎn)實(shí)驗(yàn)室的CASIA-HWDB 數(shù)據(jù)集,這里有充足的手寫漢字樣本,只有利用多樣的樣本來構(gòu)建充足的訓(xùn)練數(shù)據(jù)集,才能防止出現(xiàn)過擬合,為訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)做好數(shù)據(jù)準(zhǔn)備,進(jìn)而提升識(shí)別性能。此外,可根據(jù)自身需求,對(duì)樣本進(jìn)行預(yù)處理,運(yùn)用數(shù)字圖像處理技術(shù)增強(qiáng)漢字對(duì)比度,[4]對(duì)圖像進(jìn)行平滑去噪處理,進(jìn)行隨機(jī)形變、隨機(jī)噪聲,減少因?yàn)椴痪鶆蚬?、噪聲干擾等因素造成的筆畫模糊、斷裂、缺失等問題。利用縮放大小、水平或垂直拉升、角度變化等變換方法處理漢字圖像樣本。其次,選取合適的卷積神經(jīng)網(wǎng)絡(luò)模型,越深的網(wǎng)絡(luò)模型,通常參數(shù)調(diào)整難度較大,訓(xùn)練過程極為耗時(shí),因此在選擇神經(jīng)網(wǎng)絡(luò)時(shí),應(yīng)該根據(jù)各種網(wǎng)絡(luò)模型的特性,選擇合適的網(wǎng)絡(luò)。經(jīng)典的CNN模型有LeNet5、AlexNet、VGG、GoogleNet、ResNets等,各自有自己的特色,其中LeNet5最早用于手寫字符的識(shí)別,后面幾種模型都是近些年提出的,逐漸變得層數(shù)更多,且都有自己的創(chuàng)新點(diǎn)。當(dāng)然,除此之外,我們還可以在前人的基礎(chǔ)上,構(gòu)造自己的卷積神經(jīng)網(wǎng)絡(luò),通過不斷調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和權(quán)值參數(shù),來構(gòu)造出最合適的網(wǎng)絡(luò)模型。最后,利用設(shè)計(jì)好的卷積神經(jīng)網(wǎng)絡(luò)模型,逐層提取手寫漢字圖片特征,然后對(duì)提取的特征進(jìn)行非線性組合以得到輸出。

        三、結(jié)語

        隨著人工智能的蓬勃發(fā)展,現(xiàn)代社會(huì)中信息量空前擴(kuò)大,人機(jī)交互與信息處理成為了信息技術(shù)發(fā)展的重要課題之一,漢字識(shí)別已成為研究熱點(diǎn)。一方面,人工智能、信息技術(shù)等新興技術(shù)發(fā)展為漢字識(shí)別提供了全新的工具與思路,另一方面,漢字識(shí)別的發(fā)展需求也推動(dòng)著各學(xué)科生產(chǎn)變革。從現(xiàn)階段下漢字識(shí)別發(fā)展情況而言,盡管當(dāng)前漢字識(shí)別已經(jīng)取得較大進(jìn)展,能滿足人機(jī)快速交互需求,但是也存在著很大部分的發(fā)展空間。得益于大型的計(jì)算集群、數(shù)據(jù)存儲(chǔ)技術(shù)巨大進(jìn)步,卷積神經(jīng)網(wǎng)絡(luò)在處理計(jì)算機(jī)視覺數(shù)據(jù)方面突顯出很大的優(yōu)勢(shì),能夠輔助漢字識(shí)別工作,對(duì)漢字準(zhǔn)確識(shí)別有重要意義。

        參考文獻(xiàn):

        [1] 李斯凡,高法欽. 基于卷積神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識(shí)別[J]. 浙江理工大學(xué)學(xué)報(bào),2017,37(3):438-443.

        [2]Ng,A.,Kian,K.and Younes, B. Convolutional Neural Networks, Deep learning.

        [3] 常歡 . 基于卷積神經(jīng)網(wǎng)絡(luò)的孤立手寫體漢字識(shí)別研究 [D]. 安徽大學(xué) ,2015.

        [4] 宋光慧 . 基于遷移學(xué)習(xí)與深度卷積特征的圖像標(biāo)注方法研究 [D]. 浙江大學(xué) ,2016.

        猜你喜歡
        識(shí)別卷積神經(jīng)網(wǎng)絡(luò)漢字
        漢字這樣記
        漢字這樣記
        基于深度卷積神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        淺談哈密瓜病蟲害的防治措施
        基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實(shí)現(xiàn)
        軟件工程(2016年8期)2016-10-25 15:47:34
        蘋果樹常見病蟲害防治技術(shù)
        青島市中山公園園林樹木易混淆品種識(shí)別
        基于卷積神經(jīng)網(wǎng)絡(luò)的樹葉識(shí)別的算法的研究
        論犯罪危險(xiǎn)人格的識(shí)別
        亚洲大胆美女人体一二三区| 大胆欧美熟妇xxbbwwbw高潮了| 中国国语毛片免费观看视频| 精品亚洲成a人7777在线观看 | 无码av永久免费大全| 自拍偷区亚洲综合激情| 日本一区二区在线高清| 国产成人综合久久久久久| 亚洲精品~无码抽插| 琪琪的色原网站| 日本三级欧美三级人妇视频 | 日本久久高清一区二区三区毛片| 久久久精品人妻一区二区三区四| 亚洲国际无码中文字幕| 国产乱子伦精品免费女| 国产精品亚洲专区无码不卡| 丝袜美腿制服诱惑一区二区| 国产放荡对白视频在线观看| 黑人大荫道bbwbbb高潮潮喷| 亚洲 欧美 激情 小说 另类| 国产精品成人久久一区二区| 风韵犹存丰满熟妇大屁股啪啪| 一色桃子中文字幕人妻熟女作品 | 亚洲综合成人婷婷五月网址| 国产极品久久久久极品| 丝袜 亚洲 另类 欧美| 亚洲国产精品成人av在线不卡| 又色又爽又黄还免费毛片96下载| 久久这里只精品国产免费10| 久久精品国产亚洲AV高清y w| 中文字幕乱码日本亚洲一区二区| 极品老师腿张开粉嫩小泬| 国产女人高潮叫床视频| 青春草国产视频| 国产精品一区二区三区不卡| 99久久国内精品成人免费| 亚洲国产天堂一区二区三区| 伊人久久一区二区三区无码| 一区二区三区在线乱码| 亚洲av无码国产综合专区| 久久久精品免费观看国产 |