亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機hough變換的文字圖像傾斜檢測

        2017-04-18 18:37:44程燕群
        科技視界 2017年2期

        程燕群

        【摘 要】復(fù)雜多變的采集環(huán)境和不確定的人工采集質(zhì)量給后期的文字圖像識別帶來困難。通過總結(jié)前人的經(jīng)驗,本文提出的方法,首先在圖像中提取出純文本區(qū)域,并對隨機hough變換的點選擇進行位置限定,在保留原有圖像特征的同時大大縮減了檢測的數(shù)據(jù)量,通過仿真結(jié)果可知,該算法具有很好的檢測準(zhǔn)確度和速度。

        【關(guān)鍵詞】文字圖像;傾斜校正;hough變換;文字區(qū)域提?。浑S機hough變換

        0 前言

        在信息時代,圖像已經(jīng)成為一種重要的信息載體,圖像文字識別的發(fā)展已經(jīng)經(jīng)歷了幾十年的過程。在實際生活中,圖像文字識別技術(shù)廣泛應(yīng)用于如車牌識別、文字掃描、地圖中的文字識別等。但是,在文字圖像識別中,圖像的傾斜對于系統(tǒng)始終是一個敏感因素,因此,如何能夠快速而準(zhǔn)確的檢測出圖像的傾斜角度一直是該領(lǐng)域研究的課題。

        文本圖像的傾斜校正可分為傾角檢測、旋轉(zhuǎn)校正兩個問題。目前存在的比較常用的傾角檢測算法主要有基于投影的方法、基于Hough變換的方法以及基于K-最近鄰簇法?;贖ough變換的方法由于其高精確度一直廣受關(guān)注,但在應(yīng)用中卻一直面臨著高時間成本和高內(nèi)存消耗的問題。針對該問題,文獻[2]通過投影法預(yù)先篩選出文字子區(qū)域,再結(jié)合連通域搜索法提取出文本直線來計算傾斜角度,但其文字子區(qū)域篩選區(qū)域面積大,且當(dāng)文字圖像中存在頁面寬的圖像時,無法提取出文字子區(qū)域,連通域搜索法在傾斜角度大于20度時就無法使用;文獻[3]提出兩級hough變換法,相對傳統(tǒng)hough變換速度是有提高,但仍需要消耗大量的時間;陳軍等[4]提出的隨機Hough變換,將傳統(tǒng)的“一對多”的hough變換轉(zhuǎn)化成“多對一”的映射,大大降低了內(nèi)存需求和計算時間;文獻[5]在此基礎(chǔ)上,運用變分辨率金字塔策略,分別對低、高分辨率圖層進行兩級隨機 Hough變換,算法取得了不錯的效果。

        本文在總結(jié)前人研究的基礎(chǔ)上,首先利用投影法篩選出純文本區(qū)域,再運用隨機hough變換方法,并限定變換兩點的選擇區(qū)域,然后計算出文本圖像傾斜角度。該方法在保留文本傾斜的特征的基礎(chǔ)上,通過三個步驟大大減少了變換的數(shù)據(jù)量。

        1 純文本區(qū)域提取

        圖像投影時,不同的內(nèi)容會形成不同的投影特征。在選取篩選區(qū)域時,考慮一般的頁面特征,從上到下貫穿整個版面的圖像概率較小,而由于段落的原因,版面右側(cè)出現(xiàn)行不完整情況的概率較大,這樣會對純文本的投影特征造成一定的影響。再綜合考慮拍照傾斜時可能帶入的頁面邊界,在文字圖像中的行1/4處,列1/4、2/4、3/4處分別取m*n像素大小的區(qū)域,作為候選區(qū)進行水平投影。

        其中,a、b、c、d、e、f是位于Vproj取值范圍[0,m]之間的相鄰點,Vproj是該行的黑色像素點數(shù)。

        當(dāng)a與b, b與c,c與d組成的線段滿足相應(yīng)的長度限制時,則認為存在滿足條件的波峰與波谷,如圖所示,[b,c]和[d,e]所在區(qū)域為波峰,[a,b]和[c,d]所在區(qū)域為波谷。

        利用以上算法對選擇的區(qū)域進行篩選,找出有效的純文本區(qū)。

        2 隨機hough變換

        Hough變換方法是利用圖像空間和參數(shù)空間中點與線的關(guān)聯(lián)對偶性,將原始圖像空間的給定曲線通過適當(dāng)表達式運算變換為參數(shù)空間的一個對應(yīng)點。文本圖像一行中通常會存在較多的字,這條文本行可以看成是由許多中間有隔斷的直線組成,這條直線代表著文本行的走向。

        例如,直線在二維空間的參數(shù)表示形式為:

        其中ρ為極半徑,θ為極角。則圖像中某條直線就會與參數(shù)空間中的一點(ρ,θ)相對應(yīng),圖像中某點對應(yīng)參數(shù)空間中的一條正弦曲線。因此,原圖中直線上的任意兩點(xi,yi) 、(xj,yj)對應(yīng)參數(shù)空間中的兩條正弦曲線理論上相交于共同的一點(ρ,θ)。再通過投票累加找出局部最大值,即為對應(yīng)直線的參數(shù)。但若對圖像中的每一點都做hough變換,則計算量會相當(dāng)大,因此本文采用隨機hough變換。

        隨機hough變換是在hough變換的基礎(chǔ)上運用統(tǒng)計學(xué)知識,并不對所有點進行變換,只隨機取兩點作直線,取得一個參數(shù)(ρ′,θ′),對結(jié)果進行投票累加。當(dāng)?shù)_到一定的閾值后,投票累加最高的結(jié)果就對應(yīng)著圖像上的直線。將圖像空間中的兩個點映射到參數(shù)空間中的一個點 ,是一個 “多對一 ”的映射,避免了傳統(tǒng) Hough變換 “一對多 ”映射的龐大計算量。

        為了進一步減小計算量,本文在運用隨機hough變換法時,在純文本區(qū)域豎直方向選取一個窄長的區(qū)域D,并根據(jù)實際精度要求選擇區(qū)域E。分別在區(qū)間D和E中隨機各選擇一個黑點 d1、d2,hough變換后,求得參數(shù) (ρ′,θ′),對累加器數(shù)組 P[ρ,θ]中相應(yīng)結(jié)果投票加一 。

        當(dāng)區(qū)域D的高度和區(qū)域E的高度選取合適時,可以進行大幅度的傾斜角檢測。

        通過實驗得知,本文中手機采集的2448*3264的照片通過該算法處理檢測出傾斜角度的時間為1.02s,檢測結(jié)果相對傳統(tǒng)hough變換的標(biāo)準(zhǔn)偏差為0.047,可見其在保證準(zhǔn)確度的同時大大提高了檢測速度。

        3 小結(jié)

        本文提出的算法是在前人的基礎(chǔ)上所做的改進。子區(qū)域具有與頁面相同的傾斜角度,通過提取純文本區(qū)域,減少背景和頁面中圖像的干擾;采用隨機hough變換,保證hough變換準(zhǔn)確度;同時對于隨機hough變換中的兩個點采取限定區(qū)域的方式,三個階段均對變換數(shù)據(jù)量有大幅減少。通過實驗可知,通過該算法對文本圖像傾斜角度的檢測角度具有較高的準(zhǔn)確度和速度。對內(nèi)含表格、背景或版面較復(fù)雜的文本圖片來說,只要通過合適的方法篩選出純文本區(qū)域后,同樣適用,具有較高的應(yīng)用價值。

        【參考文獻】

        [1]吳飛飛.文本圖像傾斜校正算法的研究與應(yīng)用[D].北京:北方工業(yè)大學(xué),2014.

        [2]周冠瑋,平西建,程娟.基于改進Hough變換的文本圖像傾斜校正方法[J].計算機應(yīng)用,2007,27(7):52-57.

        [3]陳軍,徐友春,趙明,等.基于隨機hough變換的道路邊界識別算法研究[J].中國圖象圖形學(xué)報,2009,14(5):905-911.

        [責(zé)任編輯:田吉捷]

        日本无遮挡真人祼交视频| 久久精品国产乱子伦多人| 亚洲麻豆av一区二区| 老熟女老女人国产老太| 色噜噜狠狠综曰曰曰| 男人无码视频在线观看| 漂亮的小少妇诱惑内射系列| 最新69国产精品视频| 亚洲人成影院在线无码按摩店| 久久精品国内一区二区三区| 国产福利97精品一区二区| 国产韩国一区二区三区| 乱中年女人伦| 久久久无码一区二区三区| 无码流畅无码福利午夜| 美女脱了内裤洗澡视频| 亚洲精品久久区二区三区蜜桃臀| 国内露脸中年夫妇交换| 婷婷成人亚洲综合国产| 男人的天堂手机版av| 免费国产黄网站在线观看可以下载 | 少妇中文字幕乱码亚洲影视| 精品国产成人亚洲午夜福利| 中文字幕五月久久婷热| 在线观看 国产一区二区三区| 区二区三区玖玖玖| 亚洲成AⅤ人在线观看无码| 日本在线观看一区二区视频| 蜜桃视频一区二区在线观看| 久久99精品国产99久久6男男| 99精品国产自产在线观看| 亚洲乱码一区二区av高潮偷拍的| 无码人妻人妻经典| 99久久综合精品五月天| 91亚洲精品久久久中文字幕| 国产精品免费无遮挡无码永久视频| 亚洲av中文无码字幕色三| 精品人妻一区二区三区蜜桃| 中文字幕女优av在线| 精品人妻va出轨中文字幕| 99re国产电影精品|