亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        漢語言難檢字讀音查詢app研究與開發(fā)

        2020-03-19 07:41:46吳博世田英愛王浩翔
        科學(xué)咨詢 2020年53期
        關(guān)鍵詞:數(shù)據(jù)庫文本信息

        吳博世 田英愛 王浩翔

        (北京信息科技大學(xué)計(jì)算機(jī)學(xué)院 北京 100000)

        近期,越來越多的人了解并喜歡上了國學(xué)文化,人們紛紛投入對國學(xué)文化學(xué)習(xí)的行列,掀起了一陣國學(xué)文化的學(xué)習(xí)熱潮。隨著人們對國學(xué)文化的逐步學(xué)習(xí),我們發(fā)現(xiàn)人們?nèi)鄙賹W(xué)習(xí)國學(xué)文化的工具。調(diào)查了解到,人們學(xué)習(xí)國學(xué)文化的一大阻礙就是有很多生僻字不認(rèn)識、不會(huì)讀、不了解是什么意思。為了有效推動(dòng)國學(xué)文化的學(xué)習(xí),我們經(jīng)過組內(nèi)討論決定利用OCR技術(shù),以及相關(guān)的Android頁面設(shè)計(jì),還有相關(guān)的難檢字識別算法,如attention,設(shè)計(jì)一款有助于學(xué)習(xí)國學(xué)文化的app,解決漢語言難檢字讀音的困難。

        一、實(shí)現(xiàn)app的過程

        在項(xiàng)目開始時(shí),我們先規(guī)劃了本app大概要實(shí)現(xiàn)的功能,理清了設(shè)計(jì)思路。我們要實(shí)現(xiàn)通過圖像識別技術(shù)、手寫輸入技術(shù),將要識別的字轉(zhuǎn)化為文本信息,再基于《山海經(jīng)》中的生僻字創(chuàng)建一個(gè)數(shù)據(jù)庫,最后通過連接數(shù)據(jù)庫將文本信息和數(shù)據(jù)庫中的字進(jìn)行匹配,然后調(diào)用數(shù)據(jù)庫中的信息,從而實(shí)現(xiàn)本app所既定的功能。我們的設(shè)計(jì)思路是通過Andorid Studio來構(gòu)建這個(gè)手機(jī)app的框架,然后再通過接口連接到一些其他技術(shù),最后連接Andorid Studio內(nèi)部的數(shù)據(jù)庫[1]將收集到的字的信息導(dǎo)入其中,最終完成一個(gè)功能豐富的app。

        (一)應(yīng)用OCR技術(shù)

        我們首要學(xué)習(xí)的技術(shù)就是OCR技術(shù),OCR技術(shù)是光學(xué)字符識別(Optical Character Recognition, OCR)[2],是指對文本資料的圖像文件進(jìn)行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進(jìn)行識別,并以文本的形式返回。

        我們將OCR技術(shù)應(yīng)用到我們的項(xiàng)目過程中遇到了較大的困難,在文字檢測部分的困難是要定位字的位置。在給定的一張圖像中,我們需要找出這張圖里文字出現(xiàn)的位置,這就需要用到attention技術(shù)。為了區(qū)分出是不是字,除了從整體對圖片進(jìn)行把握,更關(guān)注的是局部信息,也就是字的特點(diǎn),包括筆畫,字形,結(jié)構(gòu)等內(nèi)容。至于圖像中其他無關(guān)緊要的信息,對于字的識別并不能起作用,所以,注意力機(jī)制就是一個(gè)關(guān)鍵的技術(shù),讓深度學(xué)習(xí)模型更關(guān)注某個(gè)局部的信息。

        (二)應(yīng)用RA-CNN技術(shù)

        在文本識別部分的困難是首先是用戶將想要識別的字拍照上傳,由于用戶拍照的過程比較隨意,圖像的場景不固定,文字布局多樣,導(dǎo)致上傳了各式各樣的圖像,圖像歪斜、模糊,文本布局扭曲、褶皺、換向都是不可避免的,也會(huì)遇到低亮度、低對比度、光照不均、透視變形和殘缺遮擋等問題,這就需要進(jìn)行校正,通過幾何變換、畸變校正、去除模糊、圖像增強(qiáng)和光線校正等文字檢測對用戶上傳圖像中的文字進(jìn)行處理[3]。其次是對文本內(nèi)容進(jìn)行識別,將圖像中的文本信息轉(zhuǎn)化為文本信息,要識別得出每個(gè)文字是什么,然后根據(jù)識別出來的文字匹配我們數(shù)據(jù)庫中的文字,將數(shù)據(jù)庫中與之匹配的文字信息調(diào)用出來。將圖像中的文本信息轉(zhuǎn)化為文本信息是重中之重,它也需要attention技術(shù)的支持才能實(shí)現(xiàn),我們借鑒了一個(gè)基于CNN的注意力機(jī)制,叫做Recurrent attention convolutional neural network (RA-CNN)[4],該模型遞歸地分析局部信息,從局部信息中提取必要的特征,讓整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)不僅關(guān)注整體信息,還關(guān)注局部信息,拿“木”字舉例,之前通過文字檢測的attention技術(shù)來定位到“木”這個(gè)字的位置,然后根據(jù)RA-CNN技術(shù)遞歸地將“木”字放大成一個(gè)個(gè)局部的筆畫,比如一撇,一捺,一橫,一豎,然后再通過Attention Proposal Sub-Network (APN)技術(shù),迭代地生成子區(qū)域,并對這些子區(qū)域進(jìn)行必要的預(yù)測,將這些子區(qū)域所得到的預(yù)測結(jié)果進(jìn)行必要的整合,從而得到整個(gè)字的預(yù)測概率。

        總體來說,Attention機(jī)制就是從整個(gè)圖像出發(fā),判斷出字分布的位置,然后輸出一個(gè)坐標(biāo)值和尺寸大小,在這個(gè)基礎(chǔ)上,下一個(gè)子圖就是從上一個(gè)判斷出的圖像中出發(fā),再輸出一個(gè)坐標(biāo)值和尺寸大?。蝗缓笤俚掷m(xù)放大圖片,從而不停地聚集在圖片中的某些關(guān)鍵位置,不同尺寸的圖片都能輸出不同的信息,再將其進(jìn)行必要的融合,最終得出整個(gè)圖像中識別出來的字。

        (OCR的技術(shù)路線)

        (三)Android Studio中的接口調(diào)用

        要想使用OCR技術(shù),就必須使用接口調(diào)用。我們通過Android Studio來實(shí)現(xiàn)接口調(diào)用,要實(shí)現(xiàn)的功能是用手機(jī)拍照,然后將照片信息傳遞給服務(wù)器,參數(shù)以POST的形式發(fā)送,按照百度OCRapi的要求[5],需要加上@FormUrlEncode注釋,我們使用@Field的方式將參數(shù)加入請求體,Observable中的是RecognitionResultBean類型,我們可以從里面拿到服務(wù)器返回的文字識別信息。調(diào)用此方法,便可以把圖片類型轉(zhuǎn)化成字符串類型,之后的操作便是對網(wǎng)絡(luò)接口調(diào)用之后的回調(diào)方法進(jìn)行定義,我們在調(diào)用成功后的onNext操作中,拿到了RecognitionResultBean類型參數(shù),這個(gè)參數(shù)里含有圖片所包含文字的信息,我們將所有的文字一一取出,用StringBuilder連接成一個(gè)字符串,返回給View層,調(diào)用View層的updateUI進(jìn)行UI界面的更新,對于這個(gè)字符串我們在之后還可以進(jìn)行進(jìn)一步的分析操作。

        要使用相機(jī)功能調(diào)用,就需要請求權(quán)限。分別是網(wǎng)絡(luò)請求權(quán)限,數(shù)據(jù)的讀存取權(quán)限,以及相機(jī)權(quán)限。在Android 6.0 之前應(yīng)用的權(quán)限在安裝時(shí)全部授予,也就是說只要在AndroidManifest中申請過的權(quán)限,都會(huì)給予。而在Android 6.0 或更高版本之后,對權(quán)限的管理作出了改變,對某些涉及用戶隱私的權(quán)限可在運(yùn)行時(shí)根據(jù)用戶的需要?jiǎng)討B(tài)授予,也就是說,在AndroidManifest中申請的權(quán)限,在用戶使用的過程中還得詢問用戶是否給予,用戶給予權(quán)限了,應(yīng)用才能進(jìn)行相關(guān)的權(quán)限操作。如果拍照成功,我們就把照片作為參數(shù)傳遞給之前定義好的接口方法,調(diào)用進(jìn)行圖片文字識別??梢钥吹?,我還把照片放入imageview中方便與識別結(jié)果進(jìn)行對比。等服務(wù)器成功返回識別結(jié)構(gòu)之后,就會(huì)調(diào)用VIew層的updateUI,更新textview顯示識別結(jié)果。

        在測試階段,我們先就《山海經(jīng)》一書來選取難檢字進(jìn)行數(shù)據(jù)處理,錄入安卓的數(shù)據(jù)庫,進(jìn)行測試,其中印刷體字的識別準(zhǔn)確率還是比較高的,幾乎達(dá)到了100%,手寫體識別,因?yàn)槿藶橐蛩剌^大,識別率不盡人意,但是還是可以識別出來大部分。目前在山海經(jīng)中收錄難檢字300余字,以后會(huì)添加入《詩經(jīng)》等生澀難懂的書目的難檢字,或找到相關(guān)難檢字庫。

        二、結(jié)束語

        此項(xiàng)目在歷經(jīng)一年之后,我們終于完成了對本app的研究,并完成了真機(jī)的試驗(yàn),還得到了很不錯(cuò)的識別率,真的很不錯(cuò),我們覺得這是一款對于國學(xué)愛好者很友好的軟件,后續(xù)我們還會(huì)增加字庫,研發(fā)更加方便的識別模式,美化成更精致簡潔的頁面,使用戶的體驗(yàn)達(dá)到最佳。

        猜你喜歡
        數(shù)據(jù)庫文本信息
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        展會(huì)信息
        如何快速走進(jìn)文本
        語文知識(2014年1期)2014-02-28 21:59:13
        国产69精品久久久久999小说| 国产成人亚洲精品91专区高清| 蜜桃av在线免费网站| 中国女人做爰视频| 一本大道香蕉最新在线视频| 国产高清一区在线观看| 韩国日本一区二区在线 | 中文字幕一区乱码在线观看| 国产午夜片无码区在线播放| 青青草原精品99久久精品66| 国产精品福利小视频| 亚洲福利视频一区二区三区| 中国免费看的片| 国产精品久久久| 国产精品中文第一字幕| 中文字幕中文字幕三区| 国产 精品 自在 线免费| 日本护士吞精囗交gif| 被欺辱的高贵人妻被中出| 男女性生活视频免费网站| 欧美嫩交一区二区三区| 亚洲熟女乱色一区二区三区| 无码AV午夜福利一区| 水蜜桃一二二视频在线观看免费 | 中文字幕有码在线视频| 激情五月天在线观看视频| 久久精品国产精品青草| 欧美亚洲日韩国产区| 日韩精品夜色二区91久久久| 国产一区二区三区在线观看完整版 | 国产91久久精品成人看网站| 久久理论片午夜琪琪电影网| 97影院在线午夜| 亚洲av熟女天堂系列| 在线观看日本一区二区三区四区| 无码不卡av东京热毛片| 国产乱子伦精品免费女| aa日韩免费精品视频一| 中文无码伦av中文字幕| 亚洲乱码视频在线观看| 日美韩精品一区二区三区|