亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文字筆畫結(jié)構(gòu)的文本圖像校正處理

        2014-06-20 21:19:40曾凡鋒付亞南
        無線互聯(lián)科技 2014年2期
        關(guān)鍵詞:特征分析

        曾凡鋒 付亞南

        摘 要:針對(duì)文本圖像拍攝質(zhì)量低下,而導(dǎo)致OCR系統(tǒng)識(shí)別率不穩(wěn)定的問題,本文提出了一種基于文字筆畫結(jié)構(gòu)的文本圖像校正算法,主要是在圖像的預(yù)處理中對(duì)待處理像素點(diǎn)進(jìn)行基于文字筆畫結(jié)構(gòu)的特征分析,實(shí)現(xiàn)目標(biāo)和背景像素的校正,再結(jié)合局部二值化算法進(jìn)行處理,分析其噪音分布特點(diǎn)采用鄰域去噪進(jìn)一步優(yōu)化處理結(jié)果。實(shí)驗(yàn)表明,本文算法能夠很好的適用于處理質(zhì)量低下的文本圖像,處理效果從視覺圖像和識(shí)別率上都能滿足應(yīng)用需求。

        關(guān)鍵詞:文字筆畫結(jié)構(gòu);特征分析;鄰域去噪;低質(zhì)文本圖像

        A text image correction algorithms base on the structure of text strokes

        ZENG Fan-feng1 FU Ya-nan

        (College of Information Engineering,North China University of Technology,Beijing 100144,China)

        Abstract:Given the facts that OCR system recognition is unstable because of the low quality text image, this paper put forward a text image correction algorithms base on the structure of text strokes. The algorithm is mainly to analysis the characteristics of the processing pixel based on the text strokes structure, in order to correct the goals pixel and background pixel. Then, combined with local binary processing algorithm for processing, and using neighborhood de-noising method to further optimized image de-noising , The experimental results show that the method can be applied to deal with poor quality text images, and the visual effects and image recognition rate can meet the application.

        Key words:structure of text strokes;analysis the characteristics;neighborhood de-noising;poor quality text images

        文字是人類用來記錄語言的符號(hào),是信息的載體,是人們用來交流和表達(dá)思想的工具。紙質(zhì)媒介是記錄文字的傳統(tǒng)介質(zhì),然而隨著信息技術(shù)的快速發(fā)展,人們逐漸利用計(jì)算機(jī)、網(wǎng)絡(luò)、通訊等信息處理技術(shù)存放與處理文字。OCR(Optical Character Recognition)識(shí)別技術(shù)就是將紙質(zhì)上的打印字符轉(zhuǎn)化成計(jì)算機(jī)文字最常見的方法。OCR系統(tǒng)一般包括圖像獲取、預(yù)處理、特征抽取、識(shí)別分類、后處理以及識(shí)別結(jié)果6個(gè)模塊。由于紙質(zhì)本身、拍攝設(shè)備、拍攝環(huán)境等各種因素的影響,使獲取的圖像質(zhì)量低下,不能直接用于識(shí)別。預(yù)處理即對(duì)圖像的存在的問題進(jìn)行校正處理,是OCR識(shí)別的關(guān)鍵步驟,校正內(nèi)容主要包括灰度化、增強(qiáng)、二值化、去噪、傾斜校正等,其中增強(qiáng)[1]、二值化[2]、去噪[3]的作用是提高圖像質(zhì)量,改善圖像清晰度,將目標(biāo)和背景分離開,也是本文算法要研究的內(nèi)容。每種校正方法從基本作用和現(xiàn)有處理方法總結(jié)如下:增強(qiáng)是將目標(biāo)點(diǎn)和背景點(diǎn)差異拉大,凸顯目標(biāo)點(diǎn),抑制非關(guān)注的特征,使之改善圖像質(zhì)量,豐富信息量,從作用域可分為空間域增強(qiáng)和頻率域增強(qiáng),其中空間域增強(qiáng)又包括線性增強(qiáng)、分段線性增強(qiáng)、非線性增強(qiáng);頻率域[4]增強(qiáng)包括低通濾波、高通濾波和同臺(tái)濾波。圖像二值化是使目標(biāo)和背景差異達(dá)到最大,產(chǎn)生非黑即白的二色圖像,現(xiàn)有的二值化算法非常多見,從處理范圍上主要分全局二值化處理和局部二值化算法處理,相結(jié)合的二值化算法處理。全局二值化算法有大津算法[5]、梯度算法、最優(yōu)閾值法等,這類方法是為處理區(qū)域選取一個(gè)閾值,然后進(jìn)行處理,優(yōu)點(diǎn)是處理速度快,缺點(diǎn)對(duì)圖像質(zhì)量要求比較高,對(duì)噪音敏感,不適用于處理光照不均文本圖像;局部二值化算法主要有Niblack算法[6]、Sauvola算法[7]、White算法、模糊聚類算法等,該類算法[8]主要是針對(duì)待處理像素點(diǎn),結(jié)合其較小鄰域內(nèi)像素值求得閾值,對(duì)待處理像素點(diǎn)進(jìn)行校正,算法優(yōu)點(diǎn)抗敏性強(qiáng),對(duì)圖像質(zhì)量要求不高,缺點(diǎn)處理速度較全局處理慢,且容易產(chǎn)生偽影和斷筆的現(xiàn)象。圖像去噪是糾正圖像中被誤判為目標(biāo)點(diǎn)的背景點(diǎn),進(jìn)一步提高圖像質(zhì)量,目前常用的方法[9]

        主要有均值濾波、中值濾波、小波去噪等。

        本文算法以提高OCR識(shí)別率為目標(biāo),以提高圖像質(zhì)量,以便很好的分離目標(biāo)點(diǎn)和背景點(diǎn)為算法思路,通過圖像增強(qiáng)(像素校正)、二值化、去噪這三個(gè)具體的步驟實(shí)現(xiàn)。

        1 Niblack算法與Sauvola算法分析比較

        由于文本圖像拍攝質(zhì)量低下是一種很常見而且不可避免的問題,本文選用局部二值化處理,以提高算法的使用性。

        Niblack方法的基本思想是根據(jù)局部像素點(diǎn)的均值和標(biāo)準(zhǔn)偏差來決定中心像素點(diǎn)的閾值,其局部閾值由以下公式求得:

        其中,m(x,y)和σ(x,y)分別表示一個(gè)以(x,y)為中心的局部窗口尺寸為r×r的各像素點(diǎn)的平均灰度值和標(biāo)準(zhǔn)偏差,k為調(diào)整系數(shù),一般取-0.2。

        Sauvola方法實(shí)際上是對(duì)Niblack方法的一個(gè)改進(jìn),它引入?yún)?shù)r來降低Niblack方法中對(duì)參數(shù)k的依賴,具體的閾值計(jì)算公式如下:

        其中,R是常數(shù),一般取128,k為調(diào)整系數(shù),一般取0.5。

        從公式(1)和(2)可知,圖像f(x,y)在坐標(biāo)(x,y)處像素點(diǎn)的閾值由以(x,y)為中心的局部窗口內(nèi)像素點(diǎn)的均值m(x,y)和標(biāo)準(zhǔn)偏差σ(x,y)決定。因此,該方法對(duì)光照不均勻或者背景復(fù)雜的文檔圖像具有比較好的處理效果。但它同時(shí)也具有局限性,主要表現(xiàn)如下:第一,運(yùn)算速度和窗口尺寸的大小有關(guān),這使得和全局閾值法相比時(shí),其運(yùn)算速度較慢;第二,處理一些退化的文本圖像時(shí)會(huì)產(chǎn)生一定的噪聲,容易產(chǎn)生斷筆和偽影現(xiàn)象。本算法中選用公式2進(jìn)行二值化處理,針對(duì)該類算法斷筆和偽影的現(xiàn)象本文采用二值化前后利用增強(qiáng)加以彌補(bǔ),利用去噪進(jìn)一步完善。

        2 文字筆畫結(jié)構(gòu)分析

        宋體是一種通行的印刷體,一般用于正文部分,但由于人們?yōu)榱俗非笠曈X效果,給人煥然一新的感覺,“黑體”“華文楷體”“華文隸書”等多種字體也會(huì)出現(xiàn)在印刷版面上,這些字體之間存在著一定的差異,但總體結(jié)構(gòu)[10]還是滿足“橫豎撇捺”的筆畫構(gòu)成,如圖1所示。

        對(duì)于白紙黑字的文本文檔,以文字的“橫”筆畫為例(圖2),分析筆畫附近像素點(diǎn)分布,當(dāng)光照分布均勻時(shí),筆畫區(qū)域的垂直上方“Part1”和垂直下方“Part2”像素值均大于筆畫區(qū)域內(nèi)的像素值,而筆畫區(qū)域內(nèi)的像素值相等。由于光照不均的影響可能會(huì)照成背景點(diǎn)和目標(biāo)點(diǎn)像素值十分接近,筆畫區(qū)域內(nèi)的像素值存在一定的差異,但文字筆畫區(qū)域之外一定垂直區(qū)域范圍內(nèi)平均灰度還是滿足小于文字筆畫區(qū)域內(nèi)平均像素值。

        3 基于文字筆畫結(jié)構(gòu)的文本圖像校正算法

        3.1 算法流程

        基于對(duì)拍攝圖像的質(zhì)量分析,以及現(xiàn)有二值化算法的適用范圍和文字筆畫結(jié)構(gòu)的分析,提出本文算法的基本思路:首先對(duì)于采集圖像進(jìn)行灰度化,然后利用采點(diǎn)法計(jì)算筆畫的平均高度,對(duì)于待處理點(diǎn)進(jìn)行基于文字筆畫結(jié)構(gòu)的校正,在利用Sauvola算法將目標(biāo)和背景分離開,分析文本圖像噪音特點(diǎn),采用鄰域去噪法進(jìn)一步校正誤判像素點(diǎn)。

        3.2 統(tǒng)計(jì)筆畫的平均高度

        因?yàn)閷?duì)于印刷文字筆畫的高度并不是占一個(gè)像素點(diǎn),統(tǒng)計(jì)筆畫的平均高度能更準(zhǔn)確的確定每一個(gè)待處理像素點(diǎn)校正時(shí)需要探測(cè)的范圍,這樣可使算法的自適用性更強(qiáng)。步驟如下:

        Step1 隨機(jī)采集一個(gè)目標(biāo)點(diǎn)f(x,y),如果 ( 為常數(shù),一般取128,以此來判斷該點(diǎn)為文字筆畫像素,以減少誤差)則進(jìn)行Step2,否則繼續(xù)采點(diǎn)。

        Step2在目標(biāo)點(diǎn)的垂直方向分別向上和向下各探測(cè) 個(gè)像素,如果滿足(3)或(4)

        其中

        則認(rèn)為筆畫高度h[j]=n2-n1+1(j?=0&&j?N,N為設(shè)置最大采點(diǎn)個(gè)數(shù));否則進(jìn)行Step3進(jìn)行水平檢測(cè)。

        Step3 在在目標(biāo)點(diǎn)的垂直方向分別向左和向右各探測(cè)n個(gè)像素,如果滿足(5)或(6)

        其中

        則認(rèn)為筆畫高度h[j]=n2-n1+1(j?=0&&j?N,N為設(shè)置最大采點(diǎn)個(gè)數(shù));否則進(jìn)行Step1采集新的目標(biāo)點(diǎn)。

        Step4 如果j=N,則令筆畫的平均高度

        3.3 基于文字筆畫結(jié)構(gòu)的校正

        基于上文對(duì)文字筆畫結(jié)構(gòu)的分析,提出筆畫區(qū)域相關(guān)定義

        定義1 以圖像坐標(biāo)方向?yàn)檎较?,?duì)于一個(gè)待研究像素點(diǎn),如果在以其為中心的360度范圍內(nèi) ( )滿足

        則該點(diǎn)為筆畫區(qū)域內(nèi)的像素點(diǎn)。

        定義2 文字中某一筆畫區(qū)域最大長(zhǎng)度方向,即為該筆畫延伸方向。

        針對(duì)文字筆畫方向不確定性,因此選擇以 為角度增量進(jìn)行探測(cè)所研究的像素點(diǎn)是否為筆畫區(qū)域內(nèi)像素點(diǎn)。光照不均現(xiàn)象也是拍攝文本圖像常有的現(xiàn)象,該現(xiàn)象可能使得文字和背景的像素值十分的接近,這樣一來單純的分析一個(gè)像素點(diǎn)并不能達(dá)到滿意的效果,所以需要考慮待處理像素點(diǎn)某一鄰域內(nèi)的像素分布。為了避免像素點(diǎn)的重復(fù)處理,本算法對(duì)已處理的像素點(diǎn)進(jìn)行標(biāo)記處理。設(shè)min為遍歷區(qū)域內(nèi)像素最小值,max為遍歷區(qū)域內(nèi)像素最大值。具體處理步驟如下:

        Step1 為圖像的每個(gè)像素點(diǎn)進(jìn)行標(biāo)記,初始標(biāo)記為0,表示未處理。

        Step2針對(duì)待處理圖像,利用從左到右,從下到上的方向,選擇待處理像素點(diǎn),若標(biāo)記為1表示已處理,跳過,選取下一個(gè)像素點(diǎn)。

        Step3 對(duì)于待處理像素點(diǎn)以Δθ為角度增量,利用公式1判斷該點(diǎn)是否為筆畫像素,若是,將該點(diǎn)置為min,同時(shí)標(biāo)記該點(diǎn)為1,繼續(xù)進(jìn)行step2,

        Step4 若否,對(duì)其鄰域的點(diǎn)按照step2進(jìn)行檢測(cè),如果鄰域內(nèi)出現(xiàn)筆畫像素點(diǎn)個(gè)數(shù)不小于2,則將該點(diǎn)置為min,若否,該點(diǎn)置為同時(shí)為max,為該點(diǎn)做標(biāo)記1。

        對(duì)于中文文檔本算法取Δθ=900,考慮到部分中文文字筆畫比較緊湊,如果選擇的鄰域過大可能造成筆畫的粘連,因此在Step4中選擇四鄰域,圖4(a)為未校正直接二值化和去噪效果圖,(b)為通過本文方法校正后再二值化和去噪的效果圖??梢钥吹矫黠@的減少了文字筆畫的丟失。

        3.4 去噪處理

        考慮到Sauvola算法后噪點(diǎn)分布多為字間和字內(nèi)椒鹽噪點(diǎn),各噪點(diǎn)間孤立存在,本文選用四鄰域內(nèi)去噪。對(duì)于二值化后坐標(biāo)為(x,y)灰度值為f(x,y)的像素點(diǎn),當(dāng)f(x,y)=0時(shí),如果以其為中心的四鄰域內(nèi)統(tǒng)計(jì)灰度值等于0的點(diǎn)的個(gè)數(shù)count1和灰度值等于255點(diǎn)的個(gè)數(shù)count2,若count1≥count2,則判斷該點(diǎn)為目標(biāo)點(diǎn),否則認(rèn)為該點(diǎn)為噪點(diǎn),令f(x,y)=255。該方法簡(jiǎn)捷有效,處理效果比較見圖5(a)和(b).

        4 算法測(cè)試及分析

        本算法測(cè)試硬件環(huán)境:操作系統(tǒng)Windows XP,Inter(R)Core 2 Duo CPU,內(nèi)存2G;軟件環(huán)境:VC++6.0;實(shí)現(xiàn)方法:C++;測(cè)試對(duì)象:500萬像素文本圖像。對(duì)于本算法的有效性最終分別從視覺效果圖,時(shí)效性和識(shí)別率三方面進(jìn)行分析。

        ⑴視覺效果圖,見圖9

        對(duì)于光照不均的文本圖像(a)如果直接采用全局處理(全局大津算法)效果見圖(b),大量的背景點(diǎn)被誤判成目標(biāo)點(diǎn),形成陰影區(qū)。圖(c)為采用8*8分塊對(duì)圖像進(jìn)行分塊處理,由于光照不均的問題,當(dāng)局部分塊內(nèi)背景點(diǎn)像素值變化較大時(shí),形成局部分塊陰影區(qū)。圖(d)為一種Niblack和模糊算法相結(jié)合的處理方法,并不能避免偽影的出現(xiàn)且處理速度較慢(見表1),并不適用。本文算法處理效果圖見圖(e),在斷筆和偽影的問題上有明顯的改進(jìn)。

        ⑵采用隨機(jī)采樣法(樣張為亮背景和暗目標(biāo)點(diǎn))進(jìn)行測(cè)試,采樣數(shù)為20。樣本測(cè)試結(jié)果平均值與全局大津算法,分塊大津算法和Niblack與模糊算法相結(jié)合四種方法平均值進(jìn)行比較,見表1。

        表1 算法平均識(shí)別率和平均耗時(shí)

        方法 識(shí)別率(%) 平均耗時(shí)(毫秒)

        本文算法 95.5 1748

        全局大津算法 84.2 344

        分塊大津 86.9 1160

        Niblack +FCM 96 34281

        從識(shí)別率上看,本文算法對(duì)測(cè)試樣張的平均識(shí)別率在95.5%,能過滿足一般應(yīng)用的需求,處理速度之所以不是最優(yōu),原因本文算法統(tǒng)計(jì)了校正、二值化、去噪整個(gè)處理過程的時(shí)間。全局大津算法和分塊大津算法盡管顯示的平均識(shí)別率達(dá)到84.2%和86.9%,但由于陰影的存在,會(huì)丟失部分文字。Niblack和模糊算法相結(jié)合的算法,經(jīng)過去噪后平均識(shí)別率達(dá)到96%,但處理速度較慢,不適合應(yīng)用于圖像的實(shí)時(shí)處理。

        5 結(jié)束語

        考慮到采集文本圖像質(zhì)量低下(即背景和文字像素點(diǎn)接近難以區(qū)分)的問題的普遍存在,本文充分分析文字的筆畫結(jié)構(gòu),以及文字筆畫附近像素點(diǎn)的分布規(guī)律,提出了本文算法。圖像校正處理其實(shí)就是提高圖像的質(zhì)量,主要用途除了利用OCR識(shí)別系統(tǒng)將文字存儲(chǔ)介質(zhì)由紙質(zhì)轉(zhuǎn)化成電子文檔,還有就是直接用于人們的閱讀,目前市場(chǎng)上已經(jīng)有很多此類產(chǎn)品,像盲人輔助閱讀器。本文算法的實(shí)驗(yàn)結(jié)果表明:從視覺效果上和識(shí)別效果上,該算法都能滿足一般用戶的需求。目前存在的問題就是處理速度不是最優(yōu),因此還需要進(jìn)一步改進(jìn)。

        [參考文獻(xiàn)]

        [1]YU Jing,LI Da-Peng,Liao Qing-Min.Color constancy-based visibility enhancement of color images in low-light conditions.Acta Automatica Sinica,2011,37(8):923-931.

        [2]YUAN Lu,LI Ren-fa,An improved Binarization for Character Image.Microcomputer Information,2012,25(3),140-142.

        [3]ZENG Fan-feng,GAO Yan-yun,F(xiàn)U Xiao-ling.Application of denosing algorithm based on document image[J].Computer Engineering and Design,2012,2001-2005.

        [4]YIN Li-min,LIU Yan-ying,GU Rei, LEI Kai. A controllable his togram equalization arithmetic[J].Microcomputer Information, 2005(26),147-149.

        [5]N.Otsu.A threshold selection method from gray-level histograms[J].IEEE Transactions on Systems,1979,9(1):62-66.

        [6]W.Niblack.An Introduction to Digital Image Processing[M]. Denmark:StrandbergPublishing Company,1985.

        [7]J.Sauvola and M.Pietikainen.Adaptive document image Binarization[J].Pattern Recognization,2000,vol.33:225-236.

        [8]童立靖,張艷,占國(guó)亮,等.幾種文本圖像二值化方法的對(duì)比和分析[J]. 北方工業(yè)大學(xué)學(xué)報(bào),2011,23(1):25-33.

        [9]謝鳳英.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2008.125-129.

        [10]石蒙蒙,李少滋,曹冬林,陳淑媛.基于結(jié)構(gòu)化局部邊緣模式的文檔圖像分類[J].廈門大學(xué)學(xué)報(bào),2013,52(3):349-355.

        猜你喜歡
        特征分析
        1822號(hào)臺(tái)風(fēng)“山竹”演變特征分析
        64排CT在腦梗死早期診斷中的應(yīng)用及影像學(xué)特征分析
        穆夏藝術(shù)特征分析
        泡罩包裝揮發(fā)性有機(jī)物排放特征分析
        2016年14號(hào)臺(tái)風(fēng)“莫蘭蒂”特征分析
        2012 年南海夏季風(fēng)特征分析
        涼山州閃電活動(dòng)特征分析
        近35年云貴高原暴雨特征分析
        聽神經(jīng)瘤患者的遠(yuǎn)紅外熱像特征分析
        腎康注射液不良反應(yīng)特征分析
        国产激情久久久久影院老熟女| 日本国产一区二区在线观看| 日本久久精品视频免费| 久久久亚洲欧洲日产国码aⅴ| 香蕉久久福利院| 无码日日模日日碰夜夜爽| 国产精品成人黄色大片| 国产一级一片内射视频播放| 国产成人精品午夜二三区波多野| 丝袜足控一区二区三区| 国产三级视频在线观看视主播| 日韩av在线手机免费观看| 十八禁无遮挡99精品国产| 国产精品jizz在线观看老狼| 人妻av一区二区三区av免费| 日本91一区二区不卡| 午夜精品久久久久久久久| 色婷婷久久综合中文久久蜜桃av | 无码人妻一区二区三区免费手机| 亚洲黄片av在线免费观看| 免费久久99精品国产| 男女啪啪无遮挡免费网站| 国产艳妇av在线出轨| 色综合中文字幕综合网| 色综合久久久久综合体桃花网| 一本一道av无码中文字幕| 日日爽日日操| 亚洲国产av高清一区二区三区| 国产对白国语对白| 老少交欧美另类| 91综合久久婷婷久久| 91一区二区三区在线观看视频 | 伊人网综合在线视频| 日本国主产一区二区三区在线观看| 精品亚洲一区二区三区四区五| 在线视频观看免费视频18| 免费无码又爽又刺激高潮的视频网站| 羞涩色进入亚洲一区二区av| 亚洲午夜av久久久精品影院色戒| 精品国产一区二区三区久久狼 | 免费观看91色国产熟女|