亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于神經(jīng)網(wǎng)絡(luò)的場景文字書寫識別探討
        ——評《文字書寫系統(tǒng)的計算理論》

        2020-08-14 12:36:34郭建華
        科技管理研究 2020年13期
        關(guān)鍵詞:矩形框卷積書寫

        書名:《文字書寫系統(tǒng)的計算理論》

        作者:史伯樂(Richard Sproat)

        出版社:北京大學出版社

        ISBN:978-7-301-17155-4/H·2496

        出版時間:2010年8月

        定價:34元

        21 世紀是一個符號化的信息時代,文字和符號日益成為記載和傳遞信息的重要載體。因此,文字日漸廣泛存在于各種場景中的各類物體之上,如路標、車牌、食品包裝等。如今,人工智能發(fā)展迅速,并漸漸被廣泛應(yīng)用到各個領(lǐng)域中。人工智能在未來的社會中將發(fā)揮著不可替代的作用,然而人工智能離不開場景文字書寫識別。

        由史伯樂(Richard Sproat)著,北京大學出版社2010 年8 月出版發(fā)行的《文字書寫系統(tǒng)的計算理論》一書以文字書寫系統(tǒng)為研究對象,深入剖析其計算理論。該書圍繞兩大論點展開論述:(一)詞形與書寫規(guī)則的映射是一種正則關(guān)系;(二)一個特定的語言書寫系統(tǒng)與其表達的語言學信息具有一致性。作者首先提出論點,接著以實例的形式從不同角度加以論證。具體內(nèi)容涵蓋書寫系統(tǒng)的正則性、特定文字語言學信息表達及其一致性問題、常用的文字體系等多方面知識。該書結(jié)構(gòu)層次清晰,中心明確,條理性、理論性、實用性較強,對場景文字書寫識別研究者探究神經(jīng)網(wǎng)絡(luò)環(huán)境下場景文字書寫識別具有一定積極意義,可供其參閱。

        場景文字書寫識別要通過計算機視覺進行識別、轉(zhuǎn)換,理解圖片上的文字,是計算機視覺技術(shù)中的重要組成部分。人們通常將識別圖片文字的技術(shù)稱為光學字符識別,簡稱OCR。傳統(tǒng)OCR 主要以掃描文檔圖片為主,成像過程容易受限,識別方法主要依靠二值化等技術(shù)。場景文字識別是對傳統(tǒng)OCR 的繼承與發(fā)展。較傳統(tǒng)OCR 而言,場景文字的排布、背景、字體、顏色等都更為復雜,因而在識別方面也更具挑戰(zhàn)性。近年來,在神經(jīng)網(wǎng)絡(luò)的興起下,計算機視覺行業(yè)中的許多問題因此得到了有效解決。神經(jīng)網(wǎng)絡(luò)是一種以模擬人腦神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的機器學習技術(shù)。它的結(jié)構(gòu)靈活,特征學習能力強,可進行端到端的訓練,因而成為場景文字識別的得力助手,在場景文字書寫識別過程中具有不可忽視的作用。在國家社會科學基金項目(16XYY009)資助下,通過對場景文字書寫識別進行探究,加深人們對網(wǎng)絡(luò)神經(jīng)背景下場景文字書寫識別的了解,以期促使人們能合理利用網(wǎng)絡(luò)神經(jīng)對場景文字進行識別。

        文字檢測是場景文字書寫識別的第一步。片段鏈接是快速進行文字檢測的一種方法,其核心是對文字進行拆解,將其分為片段和鏈接兩大元素。片段是一個局部包圍盒,用于覆蓋一小部分單詞或者文本行,常用一個帶有角度的矩形框進行表示。矩形框與文字的高度差不多,但每個矩形框的長度只占整體長度中的一部分。如crocs 這個單詞可拆解為五個片段,每個片段包含一個字母。由于每個字母的長度不同,故其矩形框長度也有所不同,c 的長度比r 長,因此其矩形框也比r 長。鏈接是指將兩個相鄰的片段連接起來,通過片段連接組成一個完整的文字,能相連的片段表示是同一個部分的,不能相連的片段則表示不同部分。如c、r、o、c、s 這五個片段能連接起來組成crocs 這個完整而有意義的單詞,這表示c、r、o、c、s 屬于同一個部分。在進行文字檢測時,算法通過全面檢測片段,將兩個相連片段連接起來,并以幾何規(guī)則為依據(jù)將相連片段整合為一個整詞的包圍盒,從而獲取檢測結(jié)果。該種方法最大的優(yōu)勢是它可以對長文本或非水平長詞進行檢測。

        經(jīng)過文字檢測后,接下來就是對文字進行識別。CRNN 是能進行端到端訓練的一種文字識別技術(shù)。它最大的優(yōu)勢是無需逐一對單個字符進行標注,能直接對文本與相應(yīng)的標簽進行訓練。CRNN主要由卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和翻譯層組成。卷積神經(jīng)網(wǎng)絡(luò)主要對卷積特征圖進行分析、整理,并提取特征序列。循環(huán)神經(jīng)網(wǎng)絡(luò)負責檢測卷積神經(jīng)網(wǎng)絡(luò)提取的特征序列,并輸出檢測結(jié)果。翻譯層則負責對檢測結(jié)果進行翻譯。這樣就完成了對場景文字的識別,從而為場景文字書寫奠定良好基礎(chǔ)。然而場景文字書寫識別探索之路漫漫,需要研究者不斷探究,通過不斷學習,掌握相關(guān)知識,增強自身專業(yè)素養(yǎng),從而更好地運用神經(jīng)網(wǎng)絡(luò)推動場景文字的書寫識別。

        猜你喜歡
        矩形框卷積書寫
        Unwritten 尚未書寫
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        用什么書寫呢?
        多模態(tài)卷積神經(jīng)網(wǎng)絡(luò)的物體抓取檢測
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        一種汽車式起重機防傾翻方法的研究
        離婚起訴書寫好之后
        基于傅里葉域卷積表示的目標跟蹤算法
        書寫春天的“草”
        PowerPoint 2013圖片裁剪技巧兩則
        色www亚洲| 久久99精品久久久久麻豆| 成熟人妻换xxxx| 欧美日韩精品久久久久| 久久精品国产久精国产| 女人大荫蒂毛茸茸视频| 日韩免费一区二区三区在线| 国产精品久久久亚洲第一牛牛| 日韩精品一区二区三区在线观看的| 国产自拍精品在线视频| 99国产精品久久一区二区三区| 亚洲熟女精品中文字幕| 美女av一区二区三区| 天堂一区人妻无码| 欧美亚洲国产另类在线观看| 免费 无码 国产精品| 18禁成人免费av大片一区| 顶级高清嫩模一区二区| 无码av天天av天天爽| 中国丰满人妻videoshd| 亚洲永久无码7777kkk| 五月中文字幕| 亚洲无码观看a| 网址视频在线成人亚洲| 最新国产熟女资源自拍| 国产精品 亚洲 无码 在线| 亚洲欧洲∨国产一区二区三区| 亚洲狠狠网站色噜噜| 亚洲欧美国产精品久久久| 好看的国内自拍三级网站| 日本熟女精品一区二区三区| 日本丰满熟妇videossexhd| 国产麻豆精品久久一二三| 欧美专区在线| 99久久国语露脸国产精品| 麻豆国产精品伦理视频| 中文字幕亚洲熟女av| 日韩一区国产二区欧美三区 | 免费看欧美日韩一区二区三区| 日韩人妻系列在线视频| 久久精品国产熟女亚洲av麻豆|