亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        卡片文本傾角提取的聚類方法

        2019-06-18 05:52:48王玉晗孫維廣
        沈陽理工大學(xué)學(xué)報 2019年2期
        關(guān)鍵詞:文本方法

        劉 昶,王玉晗,孫維廣

        (沈陽理工大學(xué) 信息科學(xué)與工程學(xué)院,沈陽 110159)

        利用光電技術(shù)對卡片打印質(zhì)量進行檢測時,由于客觀條件的限制和人為因素的影響,所拍攝的卡片圖像一般會存在一定程度的傾斜,因此需要事先提取圖像的傾斜角度,將圖像校正后再用于質(zhì)量檢測。

        目前文本傾斜角度提取方法有很多,主要包括投影法[1]、Hough變換法[2-5]、基于Fourier變換的方法[6]、最近鄰連通域的方法[7-10]和基于Radon變換的方法[10]等。其中投影法是通過改變投影角度,將圖像中的文字向不同的方向投影,根據(jù)投影圖像的統(tǒng)計特征求得文本的傾斜角度。由于投影法需要向不同方向投影,所以通常計算量較大,時間復(fù)雜度較高[1]。Hough變換是最常用的文本傾斜角度檢測方法,通過對文本在0度到180度之間的所有角度進行Hough變換,用一種啟發(fā)式方法測量每一個角度累加器數(shù)值的變化率,將最大變化率對應(yīng)的角度作為圖像的傾斜角度[3]。文獻[4]在Hough變換的基礎(chǔ)上加了Canny邊緣檢測,降低了Hough變換算法的時間復(fù)雜度,但該方法需要先計算出圖像傾斜的大致范圍?;贔ourier變換的方法是對文本圖像上所有像素點作Fourier變換,利用Fourier變換空間密度最大的特性求得傾斜角度,該方法計算量較大[6]。最近鄰連通域的方法是通過N個連通區(qū)域中心的K個最近鄰點,統(tǒng)計矢量方向的直方圖,以直方圖的峰值作為圖像的傾斜角;但當(dāng)數(shù)據(jù)分布不均勻時,最近鄰點會偏向數(shù)據(jù)密度較大的方向,從而影響聚類結(jié)果[8]。文獻[9]對連通域方法做了改進,利用圖像的紋理特征對投影圖像進行分析,用自適應(yīng)的方法選出只含有文本的區(qū)域,求出區(qū)域中心坐標(biāo),定位文本行后擬合直線求出傾斜角度;該方法檢測速度快,且克服了圖像背景復(fù)雜的影響。文獻[10]先找出圖像子區(qū)域,將子區(qū)域中連通域底邊的中心作為特征點,利用特征點和文本行基線的關(guān)系,將特征點利用最小二乘法擬合出基線的方向,即為圖像傾斜方向;該方法提取傾斜角度速度快、準(zhǔn)確度高?;赗adon變換的方法[11]是利用Radon變換計算文本圖像沿指定方向的投影,把投影看作是二維函數(shù)在某一方向上的線積分,當(dāng)一個角度變化時,得到不同的投影值,計算最大值并得出文本圖像的角度;但該方法精度不高,不適用于對精度要求較高的場合。

        卡片中的文本與普通文本相比,一般分為若干個字塊,且每個字塊的長度較短,字塊內(nèi)部密度較高。針對卡片文本的特點,本文提出一種基于DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類的傾斜角度提取方法,該方法將圖像中的文本像素點根據(jù)密度進行聚類,然后通過最小二乘擬合直線求出圖像的傾斜角度,將本文方法應(yīng)用于卡片打印質(zhì)量缺陷檢測問題中取得了滿意的結(jié)果。

        1 聚類算法

        1.1 DBSCAN聚類算法

        聚類是按照數(shù)據(jù)集中數(shù)據(jù)間的相似性進行區(qū)分和分類的過程,其分類原則是使同一簇中的數(shù)據(jù)具有盡可能大的相似性,不同簇中的數(shù)據(jù)具有盡可能大的相異性[12],數(shù)據(jù)集可以通過聚類劃分成一系列的子集。假設(shè)文本中的文字為橫版排列,一般情況下字塊間距和行間距均大于字間距,可通過聚類的方法對卡片中的字塊進行聚類。本文提出用DBSCAN聚類方法對灰度圖像中文字像素點聚類。

        卡片圖像中文字和背景的灰度值有較大的差異,因此可以設(shè)置閾值將文字和背景區(qū)分開,文字為黑色,背景為白色??梢缘玫綀D像中文字區(qū)域像素點的坐標(biāo)集合P={(x,y)|I(x,y)≤T1},I(x,y)為像素點(x,y)的灰度值,將集合P作為數(shù)據(jù)集。DBSCAN法是一種密度聚類算法[13],該算法將簇定義為密度相連點的最大集合,把具有足夠高密度的區(qū)域劃分為簇;該算法輸入的參數(shù)為數(shù)據(jù)集P、鄰域半徑R和鄰域內(nèi)密度閾值參數(shù)MinPts。DBSCAN算法中距給定數(shù)據(jù)的距離小于R的區(qū)域稱為該數(shù)據(jù)的R鄰域;若R鄰域內(nèi)的數(shù)據(jù)樣本點數(shù)大于等于MinPts,則稱該數(shù)據(jù)為核心;對于數(shù)據(jù)P集中數(shù)據(jù)點pi和pj,若pi在pj的R鄰域內(nèi),并且pi為核心,那么稱pi與pj直接密度可達;給定數(shù)據(jù)集P中一組數(shù)據(jù){p1,p2,…,pn},若pi(i=1,2,…,n-1)到pi+1直接密度可達,則稱p1到pn密度可達。本文應(yīng)用DBSCAN思想對卡片二值圖中的字塊進行聚類,其基本流程如下。

        Step1:取數(shù)據(jù)集中一個未被標(biāo)記過的點,查看該點鄰域內(nèi)數(shù)據(jù)點的數(shù)量,若大于等于MinPts,則標(biāo)記該點為核心并形成一個新類,否則標(biāo)記為噪聲;

        Step2:查找核心點密度可達的數(shù)據(jù)并合并為一類;

        Step3:若數(shù)據(jù)集中所有數(shù)據(jù)均被標(biāo)記且沒有新數(shù)據(jù)加入任何類,則算法結(jié)束;否則轉(zhuǎn)到Step1。

        1.2 結(jié)合降采樣的聚類算法

        當(dāng)聚類的數(shù)據(jù)集較大時,上述聚類算法的計算時間較長,由于文字在圖像上會形成點簇,因此本文使用降采樣的方法來減少聚類算法的處理時間,降采樣原理如圖1所示。

        圖1 降采樣原理圖

        設(shè)置每塊的像素尺寸為XW×YW,對原始圖像進行分塊,設(shè)置塊中黑色像素點個數(shù)閾值T2,對降采樣圖像進行二值化;若原始圖像的塊中黑色像素點的個數(shù)大于T2,則將對應(yīng)降采樣圖像中的像素點置“0”為黑色,否則將對應(yīng)降采樣圖像中的像素點置“1”為白色。若原始圖像尺寸為U×V,記降采樣后的圖像尺寸為Sx×Sy,其中,Sx=「U/XW?,Sy=「V/YW?(「·?表示向上取整),降采樣聚類算法流程如下。

        Step1:根據(jù)上述原理對圖像做降采樣處理,獲得降采樣圖像;

        Step2:利用1.1節(jié)中的聚類算法對降采樣圖像進行聚類,將數(shù)據(jù)分為P1、P2、…、PK,共K類,對應(yīng)的類別記為H1、H2、…、HK;

        Step3:根據(jù)聚類結(jié)果對原始圖像進行處理,對于降采樣圖像中的每個像素點(i,j),若其所屬的類別為Hk,則將與該點對應(yīng)的原始圖像塊中的所有黑色像素點的類別也標(biāo)記為Hk。

        采用以上方法可提高聚類算法的速度。圖2顯示了應(yīng)用降采樣方法進行聚類的效果。圖2a為原始圖像的二值圖,尺寸為970×355,設(shè)置塊的尺寸為80×4,閾值T2為5。圖2b為橫縱均放大4倍后的降采樣圖。圖2c為針對降采樣圖像進行聚類的結(jié)果,本文算法將數(shù)據(jù)點分成2類,深色和淺色分別表示聚類得到的兩類數(shù)據(jù)。圖2d為最終原始圖像的聚類結(jié)果??梢钥闯霰疚姆椒傻玫綕M意的聚類結(jié)果。

        圖2 聚類效果圖

        2 傾斜角度計算

        通過上述聚類方法得到的每一類數(shù)據(jù)Pk對應(yīng)卡片文本上的一個字塊,考慮到字塊的長度大于寬度,可將字塊近似看成一條直線,于是字塊中的黑色像素點可看作是該直線的采樣,對于任意一點(xi,yi)∈Pk有

        yi=ckxi+bk+εi

        (1)

        式中:ck和bk分別為對應(yīng)直線的斜率和截距;εi為采樣誤差??紤]到卡片上的字塊是相互平行的,有c1=c2=…=cK,因此公式(1)可改寫為

        yi=cxi+bk+εi

        (2)

        式中c代表所有直線的斜率,可用最小二乘法求得。為減少計算時間,將所有類別按所包含的數(shù)據(jù)點個數(shù)由多到少排序,取前K*個數(shù)據(jù)點較多的類別(對應(yīng)較長的字塊),再求出每一類中列坐標(biāo)相同的數(shù)據(jù)的重心作為對應(yīng)直線的樣本點,以減少樣本點數(shù)量,將重心點代入公式(2)并寫成矩陣形式為

        AX=B+ε

        (3)

        式中X=(cb1…bK*)T,可以求出

        X=(ATA)-1(ATB)

        (4)

        從而獲得c值,對應(yīng)的傾角為卡片上文本的傾角。

        3 實驗結(jié)果分析

        3.1 DBSCAN聚類算法

        為驗證本文提出的卡片圖像傾角提取的聚類算法,選用尺寸為2350×1250的10幅卡片文本圖像,將這10幅圖像利用OpenCV在10度以內(nèi)每間隔一度做一次旋轉(zhuǎn),共生成100幅測試圖像,取數(shù)據(jù)點最多的前3類數(shù)據(jù)求傾斜角度;用C++語言在Visual Studio 2010 環(huán)境下實現(xiàn),測試環(huán)境為:Intel(R)Core(TM)i5 CPU;內(nèi)存6GB;操作系統(tǒng)為Windows7,與文獻[1]中的投影法和文獻[5]中的Hough變換方法作對比,求出每個角度下10幅圖像的平均提取誤差,誤差對比如圖3所示,提取時間和最大誤差的對比結(jié)果如表1所示。

        圖3 平均誤差對比圖

        傾斜角度檢測方法平均處理時間/秒最大誤差/度本文方法0.710.05投影法29.030.02Hough變換方法0.720.35

        從圖3與表1可看出,本文方法和投影法的最大誤差均在0.05度以內(nèi),Hough變換方法雖然可以對文本做傾斜校正,但算法精度不高,而投影法檢測文本傾斜角度精度與本文相近,但耗時較長。綜合評價算法精度與耗時,本文算法取得滿意的結(jié)果。

        文獻[4]的方法是目前針對文本傾角提取最快的方法之一,其原理是首先對圖像做邊緣檢測,然后通過邊緣估算出圖像大致的傾斜角度,再在一個較小的角度范圍內(nèi)進行Hough變換求傾角以節(jié)省時間,但該方法不完全適用于卡片文本的傾角提取,因為卡片上每個字塊的橫向文本可能較少,在進行傾角估算時很可能出現(xiàn)嚴(yán)重的偏差而導(dǎo)致傾角提取錯誤。圖4為本文方法與文獻[4]求得直線對比。文獻[4]得到的直線如圖4a所示,為近似垂直方向,顯然是錯誤的;本文得到的直線如圖4b所示,結(jié)果正確,說明本文方法魯棒性較好。

        3.2 實際應(yīng)用

        將本文方法應(yīng)用于某卡片打印質(zhì)量缺陷檢測

        圖4 本文方法與文獻[4]求得直線對比

        系統(tǒng)中,在缺陷檢測之前首先需要對待檢測圖像做文本傾斜校正。系統(tǒng)中圖像采集選用Basler acA1600-20gm工業(yè)相機,配12mm定焦鏡頭,拍照時圖像尺寸設(shè)置為1628×1236像素,缺陷檢測步驟如下。

        (1)對待檢測卡片拍照獲得待檢測圖像,并進行畸變校正;

        (2)應(yīng)用本文方法對畸變校正后的圖像進行傾角提取,根據(jù)提取結(jié)果用雙三次插值方法[14]做旋轉(zhuǎn)校正處理,再對校正后的圖像做二值化處理;

        (3)從與卡片對應(yīng)的Excel數(shù)據(jù)文件導(dǎo)出字符尺寸相同的圖像作為標(biāo)準(zhǔn)模板;

        (4)用模板匹配的方法將模板圖像與校正后的二值圖像最大程度對齊,然后通過圖像差分的方法找到圖像中的缺陷。

        圖5為校正后圖像與結(jié)果圖像。圖5a為相機畸變校正后的圖像,其中每個文字的尺寸為50×50像素,字間距為5個像素,行間距為27個像素,可以看出校正后圖像存在一定傾斜。

        設(shè)置區(qū)分文字與背景的閾值T1為40,降采樣塊的尺寸為80×4,降采樣圖像二值化閾值T2為5,降采樣圖像聚類鄰域半徑R為1,鄰域內(nèi)密度閾值參數(shù)MinPts為2,用于計算類別的數(shù)量K*為3。求出傾斜角度后,以圖像中心為旋轉(zhuǎn)中心對圖像做旋轉(zhuǎn),傾斜校正后的二值圖像如圖5b所示,已將圖像中的文字方向校正成水平。從Excel導(dǎo)出的模板圖像如圖5c所示。傾斜校正后的二值圖像與模板圖像的差分圖像如圖5d所示。將圖5d中圖像作局部放大,效果如圖6所示??梢钥闯?,由于本文算法對原始卡片的傾角進行了高精度提取,使得后續(xù)的傾斜校正與差分過程取得理想的結(jié)果。從圖6c的差分圖像可以看出,黑色像素在無缺陷區(qū)域分布稀疏,在有缺陷區(qū)域分布密集,后續(xù)可以通過統(tǒng)計黑色像素點的密度有效識別出缺陷區(qū)域。

        圖5 校正后圖像與結(jié)果圖像

        圖6 實驗結(jié)果局部放大圖

        4 結(jié)論

        提出一種基于DBSCAN聚類的卡片文本圖像傾角提取方法,將足夠長的文字近似看成一條直線,利用文本行間距大于字間距的性質(zhì)對字塊聚類;通過降采樣方法提高算法處理速度,對同一類別數(shù)據(jù)在列方向求重心,將重心看成對應(yīng)直線的樣本點,通過最小二乘法擬合直線求出卡片圖像的傾斜角度。實驗證明該方法精度較高,適用于卡片打印質(zhì)量缺陷檢測等應(yīng)用中的文本傾斜角度提取。

        猜你喜歡
        文本方法
        初中群文閱讀的文本選擇及組織
        甘肅教育(2020年8期)2020-06-11 06:10:02
        在808DA上文本顯示的改善
        學(xué)習(xí)方法
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        論《柳毅傳》對前代文本的繼承與轉(zhuǎn)化
        人間(2015年20期)2016-01-04 12:47:10
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        亚洲欧美另类激情综合区| 日本一区二区免费高清| 久久婷婷国产综合精品| 人妻少妇久久中文字幕一区二区| 久草视频福利| 日本一区二区国产高清在线播放| 人妻精品久久一区二区三区| 久久精品国产精品亚洲| 欧美丰满大屁股ass| 无码中文字幕av免费放| 蜜桃网站入口可看18禁| 久久精品国产亚洲av麻豆长发| 狠狠色综合网站久久久久久久| 娇柔白嫩呻吟人妻尤物| 久久免费精品日本久久中文字幕| 亚洲午夜成人精品无码色欲| 亚洲精品无码久久久久sm| 尤物AV无码色AV无码麻豆| 国产日产亚洲系列首页| 国产精品久久久久精品一区二区| 法国啄木乌av片在线播放| 最新福利姬在线视频国产观看| 国产不卡视频在线观看| 国产va免费精品高清在线观看| 日本一区二区精品88| 玩弄极品少妇被弄到高潮| 精品福利一区二区三区蜜桃| 国产在线一区二区三区av| 精品久久综合一区二区| 蜜桃噜噜一区二区三区| 亚洲最大av网站在线观看| 91日本精品国产免| 亚洲国产精品成人一区| 少妇真人直播免费视频| 女女女女bbbbbb毛片在线| 国产韩国精品一区二区三区| 中国黄色一区二区三区四区| 国语对白做受xxxxx在线| 婷婷色综合成人成人网小说| 亚洲av资源网站手机在线| 久久久久国产精品|