亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        OCR:不可忽視的智能基礎(chǔ)

        2017-02-17 15:39:49佚名
        中國(guó)信息化周報(bào) 2017年1期
        關(guān)鍵詞:字符識(shí)別字符極值

        佚名

        如今在紛繁復(fù)雜的金融領(lǐng)域,利用各種證件的OCR技術(shù)結(jié)合數(shù)據(jù)分析,對(duì)于提升金融行業(yè)尤其是互聯(lián)網(wǎng)金融整體業(yè)務(wù)流程的效率,降低客戶的人力成本,收效顯著。

        什么是OCR?如何利用?等一系列問題隨之浮出水面。如今我們不得不正視這樣一個(gè)事實(shí):人們每天都被文字包圍,像辦公文件、上課板書、商品介紹等都是由文字組成的,并且這些文字在某一程度上也是語(yǔ)音交互的基礎(chǔ),而這其中關(guān)乎一個(gè)關(guān)鍵技術(shù)——OCR (Optical Character Recognition),光學(xué)字符識(shí)別。

        什么是OCR

        OCR是指光學(xué)設(shè)備(掃描儀、數(shù)碼相機(jī)等)檢查紙上打印的字符,通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程,其本質(zhì)就是利用光學(xué)設(shè)備去捕獲圖像并識(shí)別文字,將人眼的能力延伸到機(jī)器上。此概念是在1929年由德國(guó)科學(xué)家Tausheck最先提出來的,后來美國(guó)科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。

        在20世紀(jì)50年代,IBM就開始利用OCR技術(shù)實(shí)現(xiàn)各類文檔的數(shù)字化;到了80年代,平板掃描儀的誕生更是讓OCR進(jìn)入了商用階段。但不管是哪個(gè)階段,那時(shí)的OCR設(shè)備對(duì)于文字背景的要求非常之高,也需要很好的成像質(zhì)量。

        OCR的工作原理

        一般來講,OCR的工作原理包括四個(gè)部分,分別是:影像輸入,通過光學(xué)設(shè)備將圖片轉(zhuǎn)入計(jì)算機(jī)后,系統(tǒng)會(huì)對(duì)圖片進(jìn)行一些處理,包括字符格式的分離、二值化處理、圖像降噪、傾斜校正、文字特征抽取等,以提升圖片的精確度;對(duì)比識(shí)別,根據(jù)字符的不同特征,將之與數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,并利用對(duì)比后的識(shí)別文字與其可能的相似候選字,根據(jù)前后的識(shí)別文字找出最合乎邏輯的詞,再作出更正,以加強(qiáng)比對(duì)的正確性;人工校正,目前為止還沒有一款軟件的文字識(shí)別是百分之百的,所以還需要用戶親自校正,確保輸出的準(zhǔn)確性;影像輸出到txt、doc、exl等格式。

        現(xiàn)實(shí)中,OCR的發(fā)展其實(shí)已經(jīng)相當(dāng)完善,不過隨著人們需求的變更,此種OCR已經(jīng)不能滿足人們的要求,而在當(dāng)前自然環(huán)境OCR是人們最為關(guān)注的新點(diǎn)。

        自然環(huán)境OCR進(jìn)展

        相比于傳統(tǒng)的OCR,自然環(huán)境OCR最難的部分在于文本檢測(cè)(將文字從圖片中提取出來),因?yàn)樗哂袠O大的多樣性和明顯的不確定性。例如文字中包含多種語(yǔ)言,每種語(yǔ)言含有多種字母,每個(gè)字母又可以有不同的大小、字體、顏色、亮度、對(duì)比度、排列和對(duì)齊方式等;因拍攝圖像的隨意性,文字區(qū)域還可能會(huì)產(chǎn)生變形、模糊斷裂等現(xiàn)象。

        另外,背景也是一大干擾因素,例如文字區(qū)域附近有非常復(fù)雜的紋理;非文字區(qū)域有著跟文字區(qū)域非常相似的紋理,比如窗戶、樹葉、柵欄、磚墻等。

        文本檢測(cè)首先要從圖像中切割出可能存在的文字,即候選連通區(qū)域,目前被采取最多的方法是MSER(最大平穩(wěn)極值區(qū)域)。

        當(dāng)然也有團(tuán)隊(duì)在此基礎(chǔ)上開發(fā)出了自己的一套算法,例如微軟研究院在傳統(tǒng)檢測(cè)方法ER(極值區(qū)域)和MSER基礎(chǔ)之上采用了對(duì)比極值區(qū)域CER(Contrasting Extremal Region),CER是與周圍的背景有一定對(duì)比度的極值區(qū)域,在低對(duì)比度的圖像上比MSER效果更好,而且獲得的候選連通區(qū)域數(shù)量遠(yuǎn)小于ER,提高了算法的效率。并且,為了提高所獲得連通區(qū)域的質(zhì)量,微軟又增加一個(gè)算法環(huán)節(jié)去增強(qiáng)CER。最后采取了一套基于淺層神經(jīng)網(wǎng)絡(luò)的文字/非文字分類算法,進(jìn)一步提高了對(duì)于連通區(qū)域字符的辨認(rèn)率。

        OCR的應(yīng)用前景

        不管是傳統(tǒng)OCR,還是自然環(huán)境OCR,其參與者還是不少的。在國(guó)內(nèi),涉足OCR的企業(yè)主要有漢王、文通、百度等,國(guó)外的像ABBYY、IRIS、Google、微軟等。此外,市面上也有不少OCR產(chǎn)品,傳統(tǒng)的OCR產(chǎn)品有尚書、漢王等,自然環(huán)境OCR的有百度翻譯、Google翻譯,實(shí)用性相當(dāng)不錯(cuò)。

        論起OCR的應(yīng)用前景,僅看其隸屬于計(jì)算機(jī)視覺領(lǐng)域的一個(gè)分支,再聯(lián)系到當(dāng)前人工智能的發(fā)展,其前景可想而知。除了翻譯、智能購(gòu)物以外,OCR未來最大的發(fā)展?jié)摿υ谟谌藱C(jī)交互。

        眾所周知,人機(jī)交互一直是研究者追求的東西,但是目前也僅僅做到了語(yǔ)音交互和肢體交互。文字代表了人類的所有智慧與思想,如果機(jī)器人能夠進(jìn)行文字識(shí)別,那將能夠進(jìn)一步獲取知識(shí)、學(xué)習(xí)人類,進(jìn)而與人類進(jìn)行更為自然的交互,或是協(xié)助人類工作,提高效率。

        猜你喜歡
        字符識(shí)別字符極值
        尋找更強(qiáng)的字符映射管理器
        極值點(diǎn)帶你去“漂移”
        極值點(diǎn)偏移攔路,三法可取
        字符代表幾
        一種USB接口字符液晶控制器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:50
        一類“極值點(diǎn)偏移”問題的解法與反思
        消失的殖民村莊和神秘字符
        一種改進(jìn)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的英文字符識(shí)別
        儀表字符識(shí)別中的圖像處理算法研究
        基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識(shí)別
        久久免费看的少妇一级特黄片| 久久亚洲精品ab无码播放| 丰满熟妇人妻av无码区 | 男人的天堂一区二av| 真实国产精品vr专区| 97久久精品午夜一区二区| 精品国产一区二区三区久久狼| 成 人 网 站 在线 看 免费| 日韩极品免费在线观看| 高清不卡日本v二区在线| 精品亚洲a∨无码一区二区三区| 人妻有码中文字幕| 亚洲一区二区三区偷拍女厕| 亚洲av激情久久精品人| 日韩精品中文字幕第二页| 精品国产天堂综合一区在线| 中文字幕在线亚洲日韩6页| 国产男女猛烈视频在线观看| 国产激情视频在线观看首页| 久久久精品国产亚洲av网| 日本一级二级三级不卡| 一本色道久久综合狠狠躁篇| 蜜臀av无码精品人妻色欲| 最新在线观看精品国产福利片| 日本一道本加勒比东京热| 天堂一区二区三区在线观看视频 | 扒开双腿疯狂进出爽爽爽视频| 国产成人久久精品激情91| 国产成人一区二区三区| 欧美又大粗又爽又黄大片视频| 欧美精品v国产精品v日韩精品| 国产91色在线|亚洲| 在线亚洲免费精品视频| 精品国产亚洲av高清日韩专区| 亚洲av片无码久久五月| 欧美精品videossex少妇| 成人午夜无人区一区二区| 国产av大片久久中文字幕| 我和丰满妇女激情视频| 亚洲成av人片在线观看ww| 91亚洲精品福利在线播放|