亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于神經(jīng)網(wǎng)絡(luò)的場景文字書寫識別探討
        ——評《文字書寫系統(tǒng)的計算理論》

        2020-08-14 12:36:34郭建華
        科技管理研究 2020年13期
        關(guān)鍵詞:矩形框卷積書寫

        書名:《文字書寫系統(tǒng)的計算理論》

        作者:史伯樂(Richard Sproat)

        出版社:北京大學出版社

        ISBN:978-7-301-17155-4/H·2496

        出版時間:2010年8月

        定價:34元

        21 世紀是一個符號化的信息時代,文字和符號日益成為記載和傳遞信息的重要載體。因此,文字日漸廣泛存在于各種場景中的各類物體之上,如路標、車牌、食品包裝等。如今,人工智能發(fā)展迅速,并漸漸被廣泛應(yīng)用到各個領(lǐng)域中。人工智能在未來的社會中將發(fā)揮著不可替代的作用,然而人工智能離不開場景文字書寫識別。

        由史伯樂(Richard Sproat)著,北京大學出版社2010 年8 月出版發(fā)行的《文字書寫系統(tǒng)的計算理論》一書以文字書寫系統(tǒng)為研究對象,深入剖析其計算理論。該書圍繞兩大論點展開論述:(一)詞形與書寫規(guī)則的映射是一種正則關(guān)系;(二)一個特定的語言書寫系統(tǒng)與其表達的語言學信息具有一致性。作者首先提出論點,接著以實例的形式從不同角度加以論證。具體內(nèi)容涵蓋書寫系統(tǒng)的正則性、特定文字語言學信息表達及其一致性問題、常用的文字體系等多方面知識。該書結(jié)構(gòu)層次清晰,中心明確,條理性、理論性、實用性較強,對場景文字書寫識別研究者探究神經(jīng)網(wǎng)絡(luò)環(huán)境下場景文字書寫識別具有一定積極意義,可供其參閱。

        場景文字書寫識別要通過計算機視覺進行識別、轉(zhuǎn)換,理解圖片上的文字,是計算機視覺技術(shù)中的重要組成部分。人們通常將識別圖片文字的技術(shù)稱為光學字符識別,簡稱OCR。傳統(tǒng)OCR 主要以掃描文檔圖片為主,成像過程容易受限,識別方法主要依靠二值化等技術(shù)。場景文字識別是對傳統(tǒng)OCR 的繼承與發(fā)展。較傳統(tǒng)OCR 而言,場景文字的排布、背景、字體、顏色等都更為復雜,因而在識別方面也更具挑戰(zhàn)性。近年來,在神經(jīng)網(wǎng)絡(luò)的興起下,計算機視覺行業(yè)中的許多問題因此得到了有效解決。神經(jīng)網(wǎng)絡(luò)是一種以模擬人腦神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的機器學習技術(shù)。它的結(jié)構(gòu)靈活,特征學習能力強,可進行端到端的訓練,因而成為場景文字識別的得力助手,在場景文字書寫識別過程中具有不可忽視的作用。在國家社會科學基金項目(16XYY009)資助下,通過對場景文字書寫識別進行探究,加深人們對網(wǎng)絡(luò)神經(jīng)背景下場景文字書寫識別的了解,以期促使人們能合理利用網(wǎng)絡(luò)神經(jīng)對場景文字進行識別。

        文字檢測是場景文字書寫識別的第一步。片段鏈接是快速進行文字檢測的一種方法,其核心是對文字進行拆解,將其分為片段和鏈接兩大元素。片段是一個局部包圍盒,用于覆蓋一小部分單詞或者文本行,常用一個帶有角度的矩形框進行表示。矩形框與文字的高度差不多,但每個矩形框的長度只占整體長度中的一部分。如crocs 這個單詞可拆解為五個片段,每個片段包含一個字母。由于每個字母的長度不同,故其矩形框長度也有所不同,c 的長度比r 長,因此其矩形框也比r 長。鏈接是指將兩個相鄰的片段連接起來,通過片段連接組成一個完整的文字,能相連的片段表示是同一個部分的,不能相連的片段則表示不同部分。如c、r、o、c、s 這五個片段能連接起來組成crocs 這個完整而有意義的單詞,這表示c、r、o、c、s 屬于同一個部分。在進行文字檢測時,算法通過全面檢測片段,將兩個相連片段連接起來,并以幾何規(guī)則為依據(jù)將相連片段整合為一個整詞的包圍盒,從而獲取檢測結(jié)果。該種方法最大的優(yōu)勢是它可以對長文本或非水平長詞進行檢測。

        經(jīng)過文字檢測后,接下來就是對文字進行識別。CRNN 是能進行端到端訓練的一種文字識別技術(shù)。它最大的優(yōu)勢是無需逐一對單個字符進行標注,能直接對文本與相應(yīng)的標簽進行訓練。CRNN主要由卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和翻譯層組成。卷積神經(jīng)網(wǎng)絡(luò)主要對卷積特征圖進行分析、整理,并提取特征序列。循環(huán)神經(jīng)網(wǎng)絡(luò)負責檢測卷積神經(jīng)網(wǎng)絡(luò)提取的特征序列,并輸出檢測結(jié)果。翻譯層則負責對檢測結(jié)果進行翻譯。這樣就完成了對場景文字的識別,從而為場景文字書寫奠定良好基礎(chǔ)。然而場景文字書寫識別探索之路漫漫,需要研究者不斷探究,通過不斷學習,掌握相關(guān)知識,增強自身專業(yè)素養(yǎng),從而更好地運用神經(jīng)網(wǎng)絡(luò)推動場景文字的書寫識別。

        猜你喜歡
        矩形框卷積書寫
        Unwritten 尚未書寫
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        用什么書寫呢?
        多模態(tài)卷積神經(jīng)網(wǎng)絡(luò)的物體抓取檢測
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        一種汽車式起重機防傾翻方法的研究
        離婚起訴書寫好之后
        基于傅里葉域卷積表示的目標跟蹤算法
        書寫春天的“草”
        PowerPoint 2013圖片裁剪技巧兩則
        久久久99精品成人片中文字幕 | 亚洲成色www久久网站夜月| 欧美成人a在线网站| 青青草免费在线手机视频| 麻豆国产精品一区二区三区 | 日韩精品久久久久久久电影蜜臀| 国产人澡人澡澡澡人碰视频| 2021精品综合久久久久| 日本一区二区三区在线视频播放| 综合亚洲伊人午夜网| 日韩高清在线观看永久| 久久99国产亚洲高清| 日本一区二区啪啪视频| 人禽杂交18禁网站免费| 亚洲aⅴ天堂av天堂无码麻豆| 本道无码一区二区久久激情| 日本一二三区在线视频观看| 成人影片麻豆国产影片免费观看| 性激烈的欧美三级视频| 青草网在线观看| 亚洲国产精品天堂久久久| 国产精品国产亚洲精品看不卡| 无套内射蜜桃小视频| 真实国产网爆门事件在线观看| 日韩精品国产精品亚洲毛片| 日韩av无码中文无码电影| 小宝极品内射国产在线| 在线人妻无码一区二区 | 中文字幕亚洲永久精品| 婷婷四虎东京热无码群交双飞视频| 少妇脱了内裤让我添| 三级全黄的视频在线观看| 免费啪啪av人妻一区二区 | 白白视频在线免费观看| 日本一区二区三区视频免费在线| 免费人妻精品一区二区三区| 亚州少妇无套内射激情视频| 一区二区三区国产美女在线播放| 男女激情视频网站免费在线| 99精品国产一区二区三区不卡 | 精品国产97av一区二区三区|