亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Python的圖片文本識(shí)別系統(tǒng)的研究

        2019-10-21 10:06:01韓琳
        科學(xué)與財(cái)富 2019年20期
        關(guān)鍵詞:特征

        韓琳

        近年來隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,Optical Character Recognition(光學(xué)字符識(shí)別,簡(jiǎn)稱“OCR”)應(yīng)用的領(lǐng)域更加的廣泛,而圖片文字識(shí)別就是其中重要的一個(gè)。目前圖片文字識(shí)別的準(zhǔn)確率并沒有達(dá)到100%,這也成為了圖片文字識(shí)別發(fā)展領(lǐng)域的一大瓶頸,因此要去探索一個(gè)好的圖片文字識(shí)別算法是非常有意義的。

        圖片文字識(shí)別系統(tǒng)的基本流程為:獲得圖片、去噪處理、二值化處理、矯正圖片、行查找、文字定位、細(xì)化處理、文字特征掃描、查詢顯示文字。OpenCv提供了圖片處理的基本函數(shù),例如數(shù)據(jù)矩陣的遍歷,圖片的存儲(chǔ)等,去噪處理中的平滑處理、二值化處理等。矯正圖片就是將圖片按照文字的行擺正,該步驟是比較的關(guān)鍵一步,后面的行定位等都是依賴于圖片矯正。文字的行定位和文字定位即確定文字的區(qū)域,方便文字特征掃描,細(xì)化處理是將文字細(xì)化為一個(gè)像素,而不破壞連通性。細(xì)化處理是方便特征掃描而做的處理使數(shù)據(jù)庫(kù)中存儲(chǔ)文字特征碼和UTF-8編碼對(duì)應(yīng)起來。涉及到的相關(guān)技術(shù)主要如下。

        1. OpenCv

        OpenCv是一個(gè)基于BSD許可發(fā)行的可以跨平臺(tái)的計(jì)算機(jī)視覺庫(kù)。它可以運(yùn)行在Windows和Linux等操作系統(tǒng)之上,它是由一系列的C函數(shù)和少許的C++類構(gòu)成,同時(shí)還提供了Python、Matlab等語言的接口,實(shí)現(xiàn)了計(jì)算機(jī)視覺和圖像處理等方面的很多通用算法。

        包含的五個(gè)基本模塊,功能非常的強(qiáng)大??梢栽谠O(shè)計(jì)中使用的是圖形處理模塊,結(jié)構(gòu)圖如下所示:

        2. UTF-8編碼

        UTF-8是一種針對(duì)Unicode的可變長(zhǎng)度字符編碼,又稱萬國(guó)碼,由Ken Thompson于1992年創(chuàng)建。UTF-8用1到6個(gè)字節(jié)編碼Unicode字符。在計(jì)算機(jī)內(nèi)存中,統(tǒng)一使用Unicode編碼,當(dāng)我們用記事本編輯的時(shí)候,從文件中讀取的UTF-8字符被轉(zhuǎn)換為Unicode字符到內(nèi)存里,編輯完成后,保存的時(shí)候再把Unicode轉(zhuǎn)換為UTF-8保存到文件。

        3.Flask框架

        在大多數(shù)的標(biāo)準(zhǔn)當(dāng)中,F(xiàn)lask是一個(gè)小型的框架,小到可以稱之為“微框架”。 Flask有3個(gè)主要依賴,分別為調(diào)試和Web服務(wù)器網(wǎng)關(guān)接口以及路由。子系統(tǒng)是由Werkzeug提供,模板系統(tǒng)是由Jinja2提供,命令行集成是由Click提供。這些依賴全部都是由Flask的開發(fā)者Armin Ronacher開發(fā)的。

        Flask 本身是并不支持?jǐn)?shù)據(jù)庫(kù)的訪問、用戶身份驗(yàn)證和 Web 表單驗(yàn)證等高級(jí)功能的。這些功能以及大多數(shù)Web應(yīng)用需要的核心服務(wù)都以擴(kuò)展的形式實(shí)現(xiàn),然后再與核心包集成。

        4.圖像處理相關(guān)技術(shù)

        4.1圖像的灰度處理

        在我們的生活中常見的圖片大多數(shù)都是24位真彩色圖像。8位的灰度圖片就能夠包含其基本信息。所以,在處理圖片的過程中為了更快捷的對(duì)圖片信息進(jìn)行相應(yīng)的處理,首先需要對(duì)圖片進(jìn)行灰度化處理操作,灰度圖像就包含了圖像處理中所需要的圖像形態(tài)特征。在24位的真彩色圖像中,每個(gè)像素都是要用3個(gè)字節(jié)來保存,它們分別用來描述R,G,B,三種不同的顏色分量。每一種顏色的分量范圍都是從0-255,顏色的分量值越大,其對(duì)應(yīng)的顏色分量高度值就會(huì)越高,因引用255來表示最亮,用0來表示最暗。在將一個(gè)真正色彩像素點(diǎn)轉(zhuǎn)換為灰度圖時(shí),其亮度值通常按常理取三個(gè)分量的平均值。

        4.2圖像的二值化處理

        在圖片中的每個(gè)像素點(diǎn)的灰度值低于某個(gè)闕值則把它置于0,高于某個(gè)闕值把它置于255,從而使整個(gè)圖片呈現(xiàn)出一種“非白即黑”的效果,這就是圖片的二值化處理。二值化后的圖片仍然能夠反映出整個(gè)圖片的局部特征。為了能夠得到便于處理的二值化圖片,采用區(qū)域的要求是連通且封閉的并且邊界不能夠重疊?;叶戎档扔诨蛘呤歉哂谥付I值的像素點(diǎn)為目標(biāo)像素,其灰度值是255,其他的像素點(diǎn)就會(huì)被排除在物體的區(qū)域之外,其灰度值定為0。

        對(duì)于不一樣的圖片效果,可以選擇使用不同的闕值選擇方法。在空間的角度來看,分為全局闕值法和局部闕值法。全局闕值法對(duì)于具有明顯雙峰直方圖的圖像有更為顯著的效果,但是,當(dāng)圖片的光照不均勻的時(shí)候,效果就會(huì)不那么明顯。局部闕值法適用于圖片特征比較復(fù)雜的圖片,但是有一個(gè)缺陷是忽略了圖片的邊緣特征,因此會(huì)造成偽影的現(xiàn)象。

        4.3圖像的剪裁處理

        在一張含有文字信息的圖片中,非文字的部分往往占據(jù)了這張圖片的一定比例,如果不對(duì)這張圖片進(jìn)行相應(yīng)的剪裁處理,在圖片文字識(shí)別的過程中就會(huì)對(duì)這張照片的整個(gè)區(qū)域進(jìn)行掃描識(shí)別,這往往會(huì)增加了項(xiàng)目的額外開銷,與此同時(shí)也大大降低了圖片文字識(shí)別的速率。為此,在為了提高圖片文字識(shí)別的速率,對(duì)圖 片文字進(jìn)行光學(xué)字符識(shí)別之前往往是需要進(jìn)行剪裁的,剪裁之后僅保留包涵文字信息的部份,將非文字的部份區(qū)域剪裁掉。在本次設(shè)計(jì)中,圖片文字剪裁是由用戶自己手動(dòng)進(jìn)行剪裁,具體過程是:由用戶自己選擇要進(jìn)行識(shí)別的圖片,在圖片上就會(huì)出現(xiàn)一個(gè)小小的方塊,用戶自己可以根據(jù)需求隨意進(jìn)行拖動(dòng)剪裁,最終方塊內(nèi)部留下來的部份就是要識(shí)別的內(nèi)容,然后系統(tǒng)會(huì)對(duì)這一部份進(jìn)行識(shí)別處理。

        4.4文字的特征碼掃描

        本文所研究的圖片文字識(shí)別是根據(jù)所有文字的幾何特征進(jìn)行編碼,然后輸入一個(gè)能夠代表所識(shí)別文字的特征碼,文字的特征碼和文字的UTF-8編碼一起關(guān)聯(lián)存放到數(shù)據(jù)庫(kù)中。一個(gè)文字可以有很多個(gè)特征碼,然而它只能對(duì)應(yīng)一個(gè)UTF-8編碼。這樣的設(shè)計(jì)是因?yàn)榭梢詽M足不同的圖片文字特征。只有更一步的進(jìn)入文字的點(diǎn)和筆畫的關(guān)系才能夠更加具體的編出具有唯一性的特征編碼,那么接下來的每一個(gè)步驟都將會(huì)向更可靠的圖片文字識(shí)別方法靠近。

        5系統(tǒng)開發(fā)環(huán)境的搭建

        主要涉及到PyCharm的安裝, Python的安裝,虛擬環(huán)境的搭建。搭建虛擬環(huán)境有兩個(gè)目的,一是為了真實(shí)環(huán)境不被破壞。二是為了開發(fā)時(shí)的版本號(hào)不沖突,在Python3中,虛擬環(huán)境由Python標(biāo)準(zhǔn)庫(kù)中的venv包原生支持。

        綜上所述,本文獨(dú)立自主的去探索一種基于文字幾何特征去深入文字內(nèi)部來獲取文字特征編碼。這樣的編碼的唯一性非常高。并且可重入性也非常高。雖然該方法復(fù)雜,但是卻類似人類來識(shí)別文字的過程。

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機(jī)變量的分布列與數(shù)字特征
        具有兩個(gè)P’維非線性不可約特征標(biāo)的非可解群
        月震特征及與地震的對(duì)比
        如何表達(dá)“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠(chéng)的四個(gè)特征
        詈語的文化蘊(yùn)含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        国产普通话对白视频二区| 久久天天躁狠狠躁夜夜av浪潮| 天天摸夜夜摸摸到高潮| 国产精品麻花传媒二三区别 | 2020年国产精品| 免费99视频| 亚洲天堂一区二区精品| 午夜免费观看日韩一级视频| 亚洲av无码久久精品狠狠爱浪潮| 国产福利免费看| 国产免费视频一区二区| 日韩在线精品视频一区| 日韩人妻无码精品久久久不卡| 亚洲国产精品自拍一区| 国产三级三级三级看三级日本| 老熟女富婆激情刺激对白| 亚洲精品国产美女久久久| 国产啪精品视频网站丝袜| 亚洲视频中文字幕更新| 一个少妇的淫片免费看| 天堂aⅴ无码一区二区三区 | 中文字幕日韩精品美一区二区三区 | 国产精品 精品国内自产拍| 亚洲激情视频在线观看a五月| 人妻体内射精一区二区三区| 韩国19禁无遮挡啪啪无码网站| 久久精品国产屋| 国产成人亚洲精品91专区高清 | 国产无遮挡又黄又爽免费网站| 欧美成aⅴ人高清免费| 一区二区三区精彩视频在线观看| 国产一品二品三品精品在线| 色八区人妻在线视频免费| 揄拍成人国产精品视频肥熟女| 亚洲免费精品一区二区| 中文字幕亚洲综合久久菠萝蜜| 少妇高潮惨叫喷水在线观看| 国产高跟丝袜在线诱惑| 在线观看亚洲第一黄片| 成人激情五月天| 国产自精品在线|