亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        淺析Android平臺(tái)下OCR研究與實(shí)現(xiàn)

        2015-10-21 17:50:51張芮陳萱瑋李桐
        工業(yè)設(shè)計(jì) 2015年4期

        張芮 陳萱瑋 李桐

        摘要:丟隨著硬件性能的提升和Android平臺(tái)的不斷普及,“計(jì)算設(shè)備移動(dòng)化”的時(shí)代已經(jīng)到來(lái),同時(shí)出現(xiàn)了一些在Android平臺(tái)上的圖像處理應(yīng)用。本文主要介紹了OCR文字處理和識(shí)別的工作原理以及TTS技術(shù),開發(fā)了一款基于Android的應(yīng)用軟件。該軟件采用了開源識(shí)別引擎Tesseract-OCR,主要分為兩大模塊:文字識(shí)別模塊和文字應(yīng)用模塊。文字識(shí)別模塊完成了通過(guò)手機(jī)攝像頭拍攝文字圖片,Tesseract-OCR識(shí)別文字,將圖片文字識(shí)別為文本文字;文字應(yīng)用模塊完成TTS文本朗讀以及社會(huì)化分享功能。結(jié)果表明,軟件對(duì)文字圖片有很好的識(shí)別率并且能夠完成文本朗讀及社會(huì)化分享功能。

        關(guān)鍵詞:Android;OCR;TTS;社會(huì)化分享

        1 系統(tǒng)相關(guān)技術(shù)分析

        1.1 Android系統(tǒng)

        Android是運(yùn)行于Linux kernel之上,但并不是GNU/Linux,廣泛應(yīng)用于移動(dòng)設(shè)備上。Android的系統(tǒng)架構(gòu)是采用五層架構(gòu),自頂向下分別為:應(yīng)用程序、應(yīng)用程序框架、庫(kù)、AndroidRuntime以及Linux內(nèi)核。

        1.2 OCR技術(shù)與Tesseract

        1.2.1 OCR技術(shù)原理

        OCR(Optical Character Recognition。光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程。OCR的目的是利用計(jì)算機(jī)識(shí)別文本圖片。讓人從中解放出來(lái),提高生產(chǎn)力。OCR核心過(guò)程分為四步:

        (1)圖像預(yù)處理:對(duì)文本圖片進(jìn)行預(yù)處理,濾去干擾、噪聲。主要目的是消除圖像中無(wú)關(guān)信息,恢復(fù)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測(cè)性和最大程度地簡(jiǎn)化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識(shí)別的可靠性。而預(yù)處理過(guò)程一般有數(shù)字化、幾何變化、歸一化、增強(qiáng)和平滑等步驟。

        (2)文字分割:對(duì)文本圖像進(jìn)行分割,以定位和分離出帶識(shí)別的文字。

        (3)特征抽?。涸谖淖址指畹幕A(chǔ)上,提取需要的特征,并對(duì)某些參數(shù)進(jìn)行計(jì)算,輸出特征信息。

        (4)文字識(shí)別:根據(jù)特征信息,加上模式識(shí)別的方法確定其文字內(nèi)容。

        1.2.2 Tesse ract

        Tesse ract-OCR是開源的識(shí)別引擎,最先有HP實(shí)驗(yàn)室于1985年開始研發(fā),但不久就放棄了OCR業(yè)務(wù)。幾年后,HP將其貢獻(xiàn)給開源軟件業(yè)。讓其重新發(fā)揮作用。Tesseract算法分為下列幾個(gè)步驟:

        (1)輪廓分析:文本圖像中含有許多字符,在OCR識(shí)別前,首先需要給每個(gè)字符標(biāo)記有效邊界,即:輪廓。它采用了一種嵌套的輪廓搜索算法,不僅搜索輪廓本身,還搜索嵌套輪廓的輪廓。最后將分析所得的輪廓組合成文本塊。

        (2)文本塊被行劃分:顧名思義將圖像劃分成若干行,將文本行分割成字符。

        (3)特征提取,進(jìn)行第一次識(shí)別,再次識(shí)別上次認(rèn)錯(cuò)的字符,當(dāng)識(shí)別率達(dá)到設(shè)定的閾值時(shí)進(jìn)入下一步。

        (4)語(yǔ)言分析:利用詞義、詞頻、語(yǔ)法規(guī)則或語(yǔ)料庫(kù)等語(yǔ)言先驗(yàn)知識(shí)識(shí)別結(jié)果進(jìn)行校正,提高識(shí)別率。

        2 系統(tǒng)實(shí)現(xiàn)

        2.1 圖片采集

        圖片采集有兩種方式:一種是使用移動(dòng)設(shè)備攝像頭進(jìn)行拍照,另一種是直接從相冊(cè)中選取圖片。

        2.1.1 拍攝功能實(shí)現(xiàn)

        首先我們介紹第一種方式,在Android系統(tǒng)可以在拍照按鈕設(shè)置監(jiān)聽(tīng)器調(diào)用攝像頭如下:21 2相冊(cè)中選取

        接下來(lái)是第二種方式,同樣在相應(yīng)按鈕設(shè)置監(jiān)聽(tīng)器,方法如下:

        2.2 圖片處理

        系統(tǒng)使用的是開源識(shí)別引擎Tesseract-OCR,所以在建立工程的時(shí)候,需要將其配置進(jìn)去。這樣我們就可以直接調(diào)用Tesseract-OCR提供給我們的類TessBaseAPI,對(duì)我們選取的圖片區(qū)域進(jìn)行識(shí)別,返回識(shí)別文本信息。

        Android平臺(tái)具體演示流程如下:

        2.3 TTS文本朗讀功能實(shí)現(xiàn)

        TTS(TextToSpeech)是將指定的文本轉(zhuǎn)換成不同語(yǔ)言音頻輸出的技術(shù),TTS引擎依托于當(dāng)前的Android平臺(tái)所支持的幾種語(yǔ)言。由于不是所有的設(shè)備都加載了資源。為此,開發(fā)時(shí)引入了檢測(cè)模塊,讓利用這項(xiàng)技術(shù)的開發(fā)人員可以檢測(cè)資源是否存在,下邊給出一個(gè)標(biāo)準(zhǔn)的檢測(cè)方法:

        Intent checkIntent=new Intent():

        checkIntent.setAction(TextToSpeech.Engine.ACTlON_CHECK_TTs_DATA):

        startActivityForResult(chekIntent,REQ_TTS_STATUS_CHECK);

        如果當(dāng)前系統(tǒng)允許創(chuàng)建一個(gè)“And roid speech TTSTextToSpeech”的對(duì)象,說(shuō)明已經(jīng)提供TTS功能的支持。將檢測(cè)返回結(jié)果中給出“CHECK VOICE DATA PASS”的標(biāo)記。根據(jù)上邊的介紹,基本實(shí)現(xiàn)了TextToSpeech的初始化和參數(shù)配置。下面是TTS利用Speak()方法可以直接在應(yīng)用程序中發(fā)揮強(qiáng)大的語(yǔ)音功能。

        2.4 社會(huì)化分享功能實(shí)現(xiàn)

        系統(tǒng)在Android移動(dòng)設(shè)備上進(jìn)行分享是將文本圖片識(shí)別的文本進(jìn)行發(fā)布到各個(gè)社交平臺(tái)(比如:微信,新浪微博等),該功能主要依托于百度社會(huì)化服務(wù)。百度社會(huì)化服務(wù)為開發(fā)者提供了接入新浪微博、QQ登錄、騰訊微博、開心網(wǎng)等第三方社會(huì)化平臺(tái)的服務(wù)。為開發(fā)者提供了社會(huì)化登錄組件及社會(huì)化分享組件管理控制臺(tái),與此同時(shí)還開放了社會(huì)化服務(wù)REST API及多平臺(tái)的SDK供開發(fā)者開發(fā)使用。系統(tǒng)中使用的是Frontia Android版,采用的是2.0.3版本。

        Android平臺(tái)具體演示流程如下:

        3 結(jié)語(yǔ)

        本文主要闡述了基于Android平臺(tái)的OCR相機(jī)的實(shí)現(xiàn),并且淺析了涉及到的相關(guān)技術(shù)原理。軟件基本滿足了用戶的日常使用。并且還可以進(jìn)一步擴(kuò)展,比如可以添加在線翻譯、日程提醒等功能,有一定的市場(chǎng)價(jià)值。軟件圖像處理方法仍存在部分缺陷,如處理速度不夠快、識(shí)別率有待提高等。因此,繼續(xù)完善系統(tǒng)功能、提高文字的識(shí)別率及機(jī)器自學(xué)習(xí)是下一步的研究工作重點(diǎn)。

        久久综合九色综合欧美狠狠| 精品国产一区二区三区九一色| 综合激情五月三开心五月| 男女18禁啪啪无遮挡激烈网站| 啪啪无码人妻丰满熟妇| 欧美综合区| 亚洲天堂一二三四区在线| 青青青伊人色综合久久亚洲综合 | 一区二区三区在线观看视频| 久久精品一区午夜视频| 午夜福利试看120秒体验区| 亚洲美女影院| 亚洲麻豆av一区二区| 国产一区二区三区视频网| 亚洲欧美激情精品一区二区| 日韩精品国产自在欧美| 亚洲天堂av路线一免费观看| 亚洲精品乱码久久久久久不卡 | 伊人久久精品无码二区麻豆| 久久久av波多野一区二区 | 巨人精品福利官方导航| 巨大欧美黑人xxxxbbbb| av永久天堂一区二区三区蜜桃| 白白色发布免费手机在线视频观看| 国内成+人 亚洲+欧美+综合在线| 亚洲视频在线看| 人妻少妇无乱码中文字幕| 日韩熟女系列中文字幕| 污污内射在线观看一区二区少妇| av天堂精品久久久久| 精品中文字幕精品中文字幕| 午夜三级a三级三点在线观看| 99久久免费精品高清特色大片| 国产在线高清无码不卡| 亚洲无人区乱码中文字幕能看| 又黄又爽又色视频| 中文字幕av一区中文字幕天堂| 在线a人片免费观看国产| 可以直接在线看国产在线片网址| 成人aaa片一区国产精品 | 成年性生交大片免费看|