張潔玉
(中國(guó)藥科大學(xué) 理學(xué)院,南京 211198) (*通信作者電子郵箱zhjy_xx@126.com)
基于圖像分塊的局部閾值二值化方法
張潔玉*
(中國(guó)藥科大學(xué) 理學(xué)院,南京 211198) (*通信作者電子郵箱zhjy_xx@126.com)
針對(duì)目前局部閾值二值化結(jié)果存在目標(biāo)虛假或斷裂的缺陷,提出了一種基于圖像分塊的局部閾值二值化方法。首先,將圖像分成若干子塊并分析每個(gè)子塊像素灰度變化情況;接著,取一定大小的局部窗口在圖像中移動(dòng),比較該局部窗口內(nèi)與包含窗口自身且比窗口更大區(qū)域內(nèi)的像素灰度變化情況,更大區(qū)域由窗口模板當(dāng)前覆蓋的所有子塊組成,以此判斷窗口內(nèi)是否為灰度變化平坦(或劇烈)區(qū)域;最后,根據(jù)不同的區(qū)域,給出具體的二值化方案。利用7種不同算法對(duì)4種不同類型的4組圖像進(jìn)行了二值化實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明該算法在屏蔽背景噪聲和保留目標(biāo)細(xì)節(jié)方面表現(xiàn)最優(yōu),特別地通過(guò)對(duì)車牌圖像的二值化結(jié)果進(jìn)行定量分析后發(fā)現(xiàn)該算法能夠得到最高召回率和準(zhǔn)確率。
圖像二值化;圖像分塊;灰度變化程度;局部閾值
圖像二值化是圖像處理中一項(xiàng)非常重要的基本方法,一般可作為眾多圖像處理方法的預(yù)處理技術(shù),如邊緣提取、目標(biāo)識(shí)別、形狀處理、圖像分割及光學(xué)字符識(shí)別等都可以先將圖像進(jìn)行二值化后再進(jìn)行后續(xù)處理[1-5]。二值化方法大多都為基于閾值的方法,即尋找一個(gè)合適的閾值將原圖像的像素灰度分為大于閾值和小于閾值的兩類,從而得到二值化的結(jié)果,因此,閾值的選取對(duì)二值化的結(jié)果起著決定性的作用。目前,基于閾值的二值化方法可以分為兩類,即全局閾值法和局部閾值法[6-8]。
全局閾值法[9]對(duì)整個(gè)圖像采用單一的閾值,將圖像中每個(gè)像素灰度值與閾值進(jìn)行比較,再依據(jù)比較結(jié)果將其分為背景或目標(biāo)對(duì)象。該類方法對(duì)于目標(biāo)和背景的像素灰度明顯分離的圖像效果較好,但對(duì)于背景復(fù)雜或光照不均勻的圖像則無(wú)法得到滿意的效果。為了克服全局閾值法的缺點(diǎn),一些學(xué)者提出了一類局部閾值方法,這類方法不再選用統(tǒng)一的閾值,而是將每個(gè)點(diǎn)與其局部鄰域的其他像素點(diǎn)進(jìn)行比較,根據(jù)局部鄰域像素灰度分布特性自適應(yīng)調(diào)節(jié)閾值,每個(gè)像素點(diǎn)依據(jù)局部閾值再進(jìn)行二值化?,F(xiàn)今,典型的局部閾值法有Bernsen法[10-11]、Niblack法[12-13]等。大量學(xué)者經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),對(duì)于光照不均勻或?qū)Ρ榷炔畹膱D像,使用局部閾值法可以得到更好的二值化效果,但是該類方法仍然存在缺陷,不可避免地導(dǎo)致二值化結(jié)果中部分區(qū)域存在虛假目標(biāo)或目標(biāo)對(duì)象斷裂等問題。針對(duì)此種情況,Madhuri等[14]先將原始圖像進(jìn)行高斯濾波,再利用Bernsen方法對(duì)原圖和高斯濾波后的圖像分別求出閾值,然后對(duì)這兩個(gè)閾值進(jìn)行加權(quán)處理得到最終的閾值進(jìn)行二值化,該方法能夠在一定程度上消除噪聲干擾,但是仍然沒有解決Bernsen算法進(jìn)行強(qiáng)制二值化的問題。由此,不少學(xué)者提出了一些其他的改進(jìn)方法,這些方法主要針對(duì)圖像細(xì)節(jié)對(duì)算法的各種參數(shù)進(jìn)行調(diào)控,以求在復(fù)雜光照下能夠得到較為完整地保留細(xì)節(jié)的二值化結(jié)果[11,15]。這類改進(jìn)方法常用的手段是:首先獲得一個(gè)全局閾值,再將每個(gè)像素與該閾值相比較,若差別非常大,則直接判定該像素為背景或目標(biāo);若差別較小且在一定范圍內(nèi),則一般先用Bernsen算法或Niblack算法求得一個(gè)閾值,再將該閾值與整幅圖像的全局閾值進(jìn)行加權(quán)后求得一個(gè)最終的新閾值,利用新閾值再將像素判定為背景或目標(biāo)。經(jīng)過(guò)這類方法的處理,圖像二值化結(jié)果存在的目標(biāo)虛假或目標(biāo)斷裂的問題可以得到一定的緩解,但有些情況下獲得的結(jié)果仍然不能滿足需要。
針對(duì)上述情況,本文提出了一種基于圖像分塊思想的二值化方法。該方法不再是簡(jiǎn)單地將整幅圖像的全局閾值和局部窗口閾值相結(jié)合,而是首先將一幅圖像分為若干子塊,通過(guò)計(jì)算每個(gè)子塊內(nèi)所有像素的平均絕對(duì)偏差來(lái)考察其像素灰度變化情況。接著利用一定大小的局部窗口在整幅圖像中滑動(dòng),計(jì)算不同子塊在局部窗口中所占的面積比例并求得對(duì)應(yīng)的比例因子,將該因子作為加權(quán)系數(shù)將不同子塊的平均絕對(duì)偏差進(jìn)行加權(quán)求和之后得到新閾值,利用該閾值判斷局部窗口內(nèi)像素灰度變化是否為平坦(或劇烈)區(qū)域,再針對(duì)不同的區(qū)域設(shè)計(jì)了局部窗口中心像素點(diǎn)的二值化具體方案。
Niblack算法是一種典型的局部閾值二值化方法,圖像每個(gè)像素點(diǎn)與通過(guò)局部鄰域計(jì)算得到的閾值相比較進(jìn)行二值化。局部閾值的計(jì)算方法為:設(shè)f(x,y)是圖像某一點(diǎn)(x,y)的灰度值,則該點(diǎn)的局部閾值是在以其為中心的一個(gè)w×w大小的窗口內(nèi)計(jì)算得到的,計(jì)算公式如下:
T(x,y)=m(x,y)+k*σ(x,y)
(1)
其中:m(x,y)和σ(x,y)分別是窗口內(nèi)所有像素點(diǎn)的平均灰度和均方差;k是偏差系數(shù),其值由經(jīng)驗(yàn)預(yù)先設(shè)定,一般取值范圍為0.1~0.5。
Bernsen算法是另一種流行的局部閾值二值化方法,局部閾值的計(jì)算公式如下:
T(i,j)=0.5*(maxI(i+m,j+n)+ minI(i+m,j+n))
(2)
其中:I(i,j)是灰度圖像的某個(gè)像素點(diǎn),m∈[-w,w],n∈[-w,w],w為窗口寬度的一半。
Niblack算法和Bernsen算法的閾值均由考察點(diǎn)的局部鄰域像素灰度決定,該閾值可以隨著局部區(qū)域的變化而動(dòng)態(tài)調(diào)整,因此比全局閾值二值化有更好的自適應(yīng)能力,但這種局部閾值思想會(huì)導(dǎo)致新的問題出現(xiàn)。若某個(gè)局部窗口中的像素絕大部分甚至全部是目標(biāo)(或背景)像素,而由于光照等因素使得目標(biāo)(或背景)像素的灰度值分布不均勻時(shí),會(huì)造成該窗口內(nèi)本應(yīng)屬于同一類的像素被強(qiáng)行二值化為不同類,從而產(chǎn)生虛假目標(biāo)或使得目標(biāo)斷裂。因此,如何在可以動(dòng)態(tài)計(jì)算局部閾值的同時(shí),又能夠盡量減少?gòu)?qiáng)行二值化,是需要進(jìn)一步研究的問題。
以往針對(duì)傳統(tǒng)局部閾值二值化算法進(jìn)行改進(jìn)的大部分方法中,都是先對(duì)整幅圖像計(jì)算一個(gè)閾值T1,T1通常由計(jì)算整個(gè)圖像的平均值、方差或像素灰度的最大值與最小值的均值而得到。然后對(duì)局部窗口內(nèi)的像素再次計(jì)算一個(gè)閾值T2,T2往往通過(guò)計(jì)算該局部窗口內(nèi)像素的平均值與方差的偏差或窗口內(nèi)像素灰度最大值與最小值的均值得到。最后,再將T1和T2進(jìn)行加權(quán)求和得到最終的閾值,該閾值就是進(jìn)行圖像二值化的依據(jù)。
本文提出的基于圖像分塊的二值化方法,最大的不同之處在于將圖像進(jìn)行了分塊,將圖像分塊后,能夠得到更加細(xì)致的圖像不同部分的子塊中像素灰度變化情況。當(dāng)一定大小的局部窗口在圖像中滑動(dòng)時(shí),綜合分析該窗口內(nèi)像素分布狀態(tài)μ1及窗口模板覆蓋的所有子塊內(nèi)的像素分布狀態(tài)μ2,將μ1與μ2進(jìn)行比較后,判斷局部窗口內(nèi)像素灰度分布是否為平坦(或劇烈)區(qū)域,再根據(jù)不同區(qū)域給出具體的二值化方案。在新方法中,不再將μ1和整幅圖像的像素分布情況進(jìn)行比較,而是將μ1和包含自身但比自身更大區(qū)域的μ2比較, 這樣是為了能夠更加準(zhǔn)確地分析出局部窗口內(nèi)像素灰度的變化情況。首先判斷局部窗口內(nèi)區(qū)域是否屬于像素灰度變化平坦(或劇烈)區(qū)域,再根據(jù)不同的區(qū)域給出不同的二值化方法,可以提高后續(xù)二值化的準(zhǔn)確度。
2.1 圖像分塊
在新算法中,圖像首先被分成若干子塊,具體分塊方法如圖1所示。外矩形框代表整幅圖像,內(nèi)部細(xì)線虛線矩形框代表圖像分成的若干子塊,粗線矩形框代表局部滑動(dòng)窗口,粗線虛線矩形框代表局部窗口模板下覆蓋的所有子塊組成的圖像區(qū)域。實(shí)驗(yàn)發(fā)現(xiàn),每個(gè)子塊如果選取太大,運(yùn)算成本則會(huì)大幅增加,并且發(fā)現(xiàn)如若每個(gè)子塊選取大于3×3的圖像塊時(shí),得到的二值化結(jié)果與選取3×3的圖像塊的結(jié)果相比并沒有明顯提升,因此本文每個(gè)子塊選擇為3×3的圖像塊(如圖1中左上角子塊1的劃分方法),共選取同樣大小的9個(gè)子塊。
圖1 圖像分塊示意圖
新算法依次考察圖像被分成的若干子塊區(qū)域內(nèi)像素灰度的變化情況,考察的方法是計(jì)算子塊區(qū)域內(nèi)所有像素的平均絕對(duì)偏差T1。一塊圖像區(qū)域的平均絕對(duì)偏差代表單個(gè)像素灰度值與所有像素灰度平均值的偏離水平,能夠反映該區(qū)域內(nèi)像素值的灰度變化偏向平坦還是劇烈。
2.2 像素灰度變化平坦(或劇烈)區(qū)域的二值化
2.2.1 判斷灰度變化平坦(或劇烈)區(qū)域的方法
判斷局部滑動(dòng)窗口內(nèi)的像素灰度變化情況時(shí),以往的方法常常是同時(shí)計(jì)算整幅圖像與局部窗口內(nèi)的像素灰度平均值或標(biāo)準(zhǔn)差,然后將這兩種平均值或標(biāo)準(zhǔn)差進(jìn)行比較。但在一幅圖像中,往往不同區(qū)域的像素灰度變化情況是不同的,有的區(qū)域灰度變化較小,而有的區(qū)域則變化較為劇烈。若以整幅圖像的像素灰度平均值或標(biāo)準(zhǔn)差的大小作為依據(jù),考察某個(gè)局部窗口內(nèi)的像素灰度變化情況是不準(zhǔn)確的。
本文提出的算法中取出局部窗口周邊的比該窗口自身更大一些的區(qū)域,通過(guò)比較該區(qū)域與局部窗口內(nèi)的像素灰度變化情況,判斷局部窗口內(nèi)像素灰度變化是否屬于平坦(或劇烈)區(qū)域。如圖1中,局部窗口模板所覆蓋的圖像子塊有9個(gè),考察局部窗口內(nèi)像素灰度變化程度時(shí),要首先分析被覆蓋的9個(gè)子塊中的像素情況,具體算法如下:
當(dāng)局部窗口在整幅圖像中滑動(dòng)時(shí),計(jì)算局部窗口中不同圖像子塊落入的面積比例,將每個(gè)子塊對(duì)應(yīng)的T1通過(guò)該比例進(jìn)行加權(quán)求和后可得到閾值T2,計(jì)算公式為:
(3)
其中:n代表圖像子塊落入局部窗口中的個(gè)數(shù),i代表圖像子塊標(biāo)號(hào)。T1i為第i個(gè)子塊對(duì)應(yīng)的平均絕對(duì)偏差。ki為第i個(gè)子塊落入滑動(dòng)窗口中所占的面積比例因子,該因子可由下式求得:
ki=sumi/sum
(4)
其中:sumi為第i個(gè)子塊落入滑動(dòng)窗口中的像素?cái)?shù),sum為滑動(dòng)窗口中的像素總數(shù)。
接著,再計(jì)算局部滑動(dòng)窗口內(nèi)像素的平均絕對(duì)偏差σ,通過(guò)比較σ和T2來(lái)判斷局部窗口區(qū)域內(nèi)像素灰度變化情況,具體比較方法如下所示:
(5)
其中:α為比較系數(shù),通過(guò)大量實(shí)驗(yàn)發(fā)現(xiàn),該系數(shù)取值為0.5時(shí),效果最佳。
2.2.2 灰度變化平坦區(qū)域二值化方法
在圖像分成若干子塊時(shí),利用OTSU算法同時(shí)計(jì)算每個(gè)子塊的二值化閾值,再統(tǒng)計(jì)不同子塊落入局部窗口中的面積比例并得到比例因子,最后由各個(gè)子塊對(duì)應(yīng)的閾值乘以各自比例因子加權(quán)求和計(jì)算出局部窗口的最終閾值。具體計(jì)算方法如式(6):
(6)
其中:O1i為第i個(gè)子塊對(duì)應(yīng)的OTSU閾值。當(dāng)窗口內(nèi)為灰度變化平坦區(qū)域時(shí),直接判斷局部窗口中心像素灰度值與式(6)計(jì)算得到的閾值O的大小,并進(jìn)行二值化。如式(7)所示:
(7)
其中,img(x,y)和imgBW(x,y)分別為圖像在(x,y)像素點(diǎn)處的原灰度值和二值化后的值。
2.2.3 灰度變化劇烈區(qū)域二值化方法
當(dāng)局部窗口內(nèi)像素灰度變化較為劇烈時(shí),像素灰度值分布范圍較廣,且很可能包含一定數(shù)量的灰度值與局部窗口閾值O非常接近的像素,因此,本文算法將像素分為兩類后再進(jìn)行處理,即灰度值遠(yuǎn)離閾值O的像素和灰度值靠近閾值O的像素。當(dāng)局部窗口中心像素灰度值遠(yuǎn)小于(或遠(yuǎn)大于)閾值O時(shí),直接將該像素置為0(或1),如式(8)所示:
(8)
其中:參數(shù)β控制局部窗口中心像素灰度值與閾值O的距離,β越大距離越遠(yuǎn),本文算法中取0.5。
當(dāng)局部窗口中心像素灰度值與閾值O接近時(shí),二值化方法如式(9)所示:
(9)
其中:Mean和σ分別代表局部窗口像素灰度平均值和平均絕對(duì)偏差。
3.1 實(shí)驗(yàn)結(jié)果
為了充分驗(yàn)證本文算法的有效性,采用了4種不同類型的圖像進(jìn)行了實(shí)驗(yàn)。4種圖像類型分別為X光圖像(圖2)、紅外圖像(圖3)、自然光照?qǐng)D像(圖4)及車牌圖像(圖5)。
圖2 X光人體骨架二值化結(jié)果
圖3 艦船紅外圖像二值化結(jié)果
圖4 自然光照?qǐng)D像二值化結(jié)果
圖5 車牌圖像二值化結(jié)果
3.2 實(shí)驗(yàn)分析
本文分別利用OTSU、Bernsen、Niblack、文獻(xiàn)、文獻(xiàn)〖10〗、文獻(xiàn)〖11〗以及文中提出的方法等7種算法,對(duì)4個(gè)種類的4組圖像進(jìn)行二值化實(shí)驗(yàn)。實(shí)驗(yàn)中,除了OTSU為全局閾值方法以外,其余6種都屬于局部閾值二值化方法。
從所有實(shí)驗(yàn)結(jié)果可以看出,OTSU算法只用唯一的全局閾值將整幅圖像進(jìn)行二值化,對(duì)于光照不均勻或背景和目標(biāo)區(qū)域灰度值區(qū)分不明顯的圖像,利用OTSU算法并不能準(zhǔn)確地將目標(biāo)分離出來(lái)。局部閾值二值化方法考察了每個(gè)像素點(diǎn)局部鄰域內(nèi)的灰度情況,實(shí)現(xiàn)了二值化閾值隨區(qū)域變化而動(dòng)態(tài)調(diào)整,因此一般情況下二值化效果比OTSU好,但是,局部閾值方法在窗口內(nèi)計(jì)算閾值時(shí),若窗口內(nèi)全部為背景(或目標(biāo))并且背景(或目標(biāo))區(qū)域像素灰度分布不均勻時(shí),該窗口內(nèi)勢(shì)必會(huì)強(qiáng)行二值化,使得本該屬于同一背景(或目標(biāo))區(qū)域的像素而錯(cuò)誤分成不同類。如在Bernsen算法和Niblack算法的二值化結(jié)果中,往往將圖像中的微弱背景強(qiáng)化成目標(biāo),從而導(dǎo)致存在大量的虛假目標(biāo),如圖2中的(c)和(d)。仔細(xì)查看原始圖像(a)可以發(fā)現(xiàn),由于灰度分布不均勻,在骨架背景區(qū)域有非常微弱的環(huán)狀條紋,Bernsen算法和Niblack算法進(jìn)行二值化時(shí),錯(cuò)誤地將背景條紋作為目標(biāo)分離了出來(lái)。
文獻(xiàn)首先計(jì)算了局部窗口內(nèi)灰度最大值和最小值的均值,然后利用高斯濾波器平滑后再次計(jì)算窗口內(nèi)灰度最大值和最小值的均值,最后將前后兩次均值進(jìn)行加權(quán)求和得到新的閾值,若局部窗口中心像素點(diǎn)的灰度值與新閾值的差距足夠大則認(rèn)為是背景,否則認(rèn)為是目標(biāo)。通過(guò)分析發(fā)現(xiàn),在灰度大面積相似的背景區(qū)域,局部窗口中心像素點(diǎn)的灰度值與新閾值非常接近,因此背景大部分區(qū)域都被變成了目標(biāo)(即白色,如圖2(g))。文獻(xiàn)〖11〗中首先計(jì)算整幅圖像的均值及局部窗口的Bernsen閾值,再將該均值和Bernsen閾值加權(quán)求和后得到最終閾值,最后利用該閾值進(jìn)行二值化。該方法是在原有Bernsen算法上的改進(jìn),在二值化時(shí)綜合考慮了Bernsen閾值和整幅圖像的均值,但事實(shí)上整幅圖像的均值在衡量局部窗口內(nèi)像素的灰度變化情況時(shí)貢獻(xiàn)不大,因此,利用文獻(xiàn)〖11〗中的方法得到的二值化結(jié)果并不理想。文獻(xiàn)〖10〗首先將局部窗口中灰度的最大值和最小值進(jìn)行加權(quán)求和得到一個(gè)閾值,再利用均值濾波器濾波后再次計(jì)算該局部窗口的灰度最大值和最小值加權(quán)求和得到另一個(gè)閾值,將前后兩個(gè)閾值乘以各自比例因子后求和得到最終的閾值,最后依據(jù)此閾值進(jìn)行二值化。由于采用了均值濾波,圖像丟失了一定的細(xì)節(jié),因此得到的二值化結(jié)果中目標(biāo)出現(xiàn)斷裂的情況,并沒有被完整提取出來(lái)。圖2中,本文算法的二值化結(jié)果為圖2(h),由于采用了圖像分塊策略,在考察局部窗口像素灰度變化時(shí)參考了包含窗口自身且更大區(qū)域的像素灰度情況,可以較為準(zhǔn)確地判斷局部窗口的灰度變化情況,針對(duì)不同情況進(jìn)行合適的處理。通過(guò)本文算法得到的二值化結(jié)果中多余背景幾乎全部被屏蔽,提取出來(lái)的目標(biāo)細(xì)節(jié)保留良好(如圖2(h)中實(shí)線矩形區(qū)域部分),圖像較為清晰。
圖3是對(duì)艦船紅外圖像的二值化結(jié)果。在所有結(jié)果中,文獻(xiàn)和本文算法結(jié)果較為滿意,但是文獻(xiàn)的結(jié)果中多了一些本該屬于背景而不屬于艦船本身的部分(如圖3(c)、(e)中的虛線矩形區(qū)域),另外在目標(biāo)艦船的細(xì)節(jié)保留方面,本文算法的結(jié)果更勝一籌,如艦船桅桿的最高部等部分(如圖3(h)中的實(shí)線矩形區(qū)域)。
圖4是對(duì)自然光照?qǐng)D像的二值化結(jié)果。圖4中的目標(biāo)是銅質(zhì)雕像人物,從結(jié)果中同樣可以看到,本文的二值化最優(yōu)。文獻(xiàn)〖11〗的結(jié)果與本文算法結(jié)果最為接近,但是文獻(xiàn)〖11〗的結(jié)果中背景仍然存在部分噪聲(如圖4(g)中的虛線矩形區(qū)域),并且提取得到的目標(biāo)中部分細(xì)節(jié)保留不及本文算法的結(jié)果,如人物所執(zhí)手杖的最上部以及人物身后翅膀的紋理(如圖4(h)中的實(shí)線矩形區(qū)域)。
圖5是對(duì)分割出來(lái)的車牌的二值化結(jié)果。在所有結(jié)果中,本文二值化效果最為滿意。文獻(xiàn)、文獻(xiàn)〖10〗和文獻(xiàn)〖11〗的結(jié)果可以提取得到目標(biāo),但是背景處理不佳,均存在不同程度的偽目標(biāo)。另外,采用Gatos提出的方法[16],對(duì)車牌圖像不同算法二值化結(jié)果進(jìn)行定量分析。該方法具體如式(10)和式(11)所示:
(10)
(11)
其中:CTP代表各算法得到的分割結(jié)果與正確分割結(jié)果相符的像素點(diǎn)個(gè)數(shù);CFN代表本該為目標(biāo)物體的像素而被錯(cuò)分割為背景部分的像素點(diǎn)個(gè)數(shù);CFP代表本該為背景部分而被錯(cuò)分割為目標(biāo)物體的像素點(diǎn)個(gè)數(shù)。經(jīng)過(guò)定量計(jì)算,對(duì)于圖5中各算法的比較結(jié)果如表1所示。
表1 圖5中各算法二值化結(jié)果比較
從定量分析的結(jié)果可以看到,本文算法的二值化結(jié)果最優(yōu)。
本文針對(duì)目前的局部閾值二值化方法存在的問題,提出了一種基于圖像分塊思想的局部閾值二值化方法。該方法將圖像分解成了若干子塊,當(dāng)局部窗口在圖像中滑動(dòng)時(shí),分析以窗口模板覆蓋的若干子塊組成的更大區(qū)域中像素灰度的變化情況,以此來(lái)判斷局部窗口內(nèi)像素灰度分布是否為平坦(或劇烈)區(qū)域。若為平坦區(qū)域,則根據(jù)每個(gè)子塊加權(quán)后的OTSU閾值直接二值化;若為劇烈區(qū)域,則再將像素灰度詳細(xì)劃分為遠(yuǎn)離閾值和靠近閾值兩部分,分別給出具體二值化方案。為了能夠充分驗(yàn)證算法的性能,本文利用7種算法對(duì)X光圖像、紅外圖像、自然光照?qǐng)D像及車牌圖像等4種類型的4組圖像進(jìn)行了實(shí)驗(yàn)。通過(guò)對(duì)比實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),本文算法能夠屏蔽絕大部分背景噪聲并且同時(shí)保留更多的目標(biāo)細(xì)節(jié)。
)
[1]WENY,LUY,YANJ,etal.Analgorithmforlicenseplaterecognitionappliedtointelligenttransportationsystem[J].IEEETransactionsonIntelligentTransportationSystems, 2011, 12(3): 830-845.
[2]SUQ,HUANGZ,HUZ,etal.Binarizationalgorithmbasedondifferentialevolutionalgorithmforgrayimages[C]//Proceedingsofthe2012 9thInternationalConferenceonFuzzySystemsandKnowledgeDiscovery.Piscataway,NJ:IEEE, 2012: 2611-2615.
[3]ZHENGL,HEX,SAMALIB,etal.Analgorithmforaccuracyenhancementoflicenseplaterecognition[J].JournalofComputerandSystemSciences, 2013, 79(2): 245-255.
[4] 張健.復(fù)雜圖像文本提取關(guān)鍵技術(shù)與應(yīng)用研究[D].天津:南開大學(xué),2014:34-61.(ZHANGJ.Researchonthetextdetectionandextractionfromcompleximages[D].Tianjin:NaikaiUniversity, 2014: 34-61.)
[5] 吳銳,黃劍華,唐降龍,等.基于灰度直方圖和譜聚類的文本圖像二值化方法[J].電子與信息學(xué)報(bào),2009,31(10):2460-2464.(WUR,HUANGJH,TANGXL,etal.Methodoftextimagebinarizationprocessingusinghistogramandspectralclustering[J].JournalofElectronicsandInformationTechnology, 2009, 31(10): 2460-2464.)
[6] 張龍,喬鐵柱.一種紅外圖像的二值化分割算法研究[J].紅外技術(shù),2014,36(8):649-651.(ZHANGL,QIAOTZ.Anbinarysegmentationalgorithmforinfraredimage[J].InfraredTechnology, 2014, 36(8): 649-651.)
[7] 孟立娜,韓其睿.一種全局和局部相結(jié)合的二值化方法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,22(11):116-119.(MENGLN,HANQR.Animprovedbinarizationmethodcombinedglobalthresholdingwithlocalthresholding[J].ComputerTechnologyandDevelopment, 2012, 22(11): 116-119.)
[8] 郭佳,劉曉玉,吳冰,等.一種光照不均勻圖像的二值化方法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(3):183-186.(GUOJ,LIUXY,WUB,etal.Binarizationmethodforimagesacquiredundernon-uniformillumination[J].ComputerApplicationsandSoftware, 2014, 31(3): 183-186.)
[9]OTSUN.Athresholdselectionmethodfromgray-levelhistograms[J].IEEETransactionsonSystems,Man,andCybernetics, 1979, 9(1): 62-66.
[10]TALABAMA,HUANGZ,WANGJ.AnenhancedBernsenalgorithmapproachesforvehiclelogodetection[J].InternationalJournalofSignalProcessing,ImageProcessingandPatternRecognition, 2014, 7(4): 203-210.
[11] 王駿飛,黃樟燦,TALABAMA.一種針對(duì)圖像細(xì)節(jié)優(yōu)化的BM二值化方法[J].武漢理工大學(xué)學(xué)報(bào),2014,36(8):127-132.(WANGJF,HUANGZC,TALABAMA.NewbinarizationmethodcalledBMaimtooptimizedetailofimage[J].JournalofWuhanUniversityofTechnology, 2014, 36(8): 127-132. )
[12] 魯周迅,張彬彬.一種新的手背靜脈分割方法[J].微電子學(xué)與計(jì)算機(jī),2014,31(8):25-28.(LUZX,ZHANGBB.Anewsegmentationmethodofhanddorsalveinimage[J].MicroelectronicsandComputer, 2014, 31(8): 25-28.)
[13] 申森,李艾華,姚良,等.基于小波包和Niblack法的槍號(hào)圖像二值化算法[J].光子學(xué)報(bào),2013,42(3):354-358.(SHENS,LIAH,YAOL,etal.GuncodebinaryimagealgorithmbasedonwaveletpacketandNiblackmethod[J].ActaPhotonicaSinica, 2013, 42(3): 354-358.)
[14]MADHURILG,CHAKRAVARTHYG.AnimprovedBernsenalgorithmapproachesforlicenseplaterecognition[J].JournalofElectronicsandCommunicationEngineering, 2012, 3(4): 1-5.
[15] 王珺,彭進(jìn)業(yè),吳俊,等.復(fù)雜光照下的車牌圖像二值化新方法[J].電子設(shè)計(jì)工程,2011,19(22):147-150.(WANGJ,PENGJY,WUJ,etal.Binarizationoflicenseplateimagesundercomplexillumination[J].ElectronicDesignEngineering, 2011, 19(22): 147-150.)
[16]GATOSB,NTIROGIANNISK,PRATIKAKISI.ICDAR2009:DocumentImageBinarizationContest(DIBCO2009) [C]//Proceedingsofthe2009 10thInternationalConferenceonDocumentAnalysisandRecognition.Washington,DC:IEEEComputerSociety, 2009: 1375-1382.
ThisworkissupportedbytheNationalNaturalScienceFoundationofChina(61501522).
ZHANG Jieyu, born in 1980, Ph.D., lecturer. Her research interests include image processing, pattern recognition.
Binarization method with local threshold based on image blocks
ZHANG Jieyu*
(SchoolofScience,ChinaPharmaceuticalUniversity,NanjingJiangsu211198,China)
Aiming at the defects of local threshold binarization methods resulting in false or broken targets, a local threshold binarization method based on image blocks was proposed. Firstly, the image was divided into several sub-blocks and the distribution of gray-value in each block was analyzed. Then, a local window of a certain size was moved within the image and the gray-value variation of the pixels in this local window was compared with that in a larger area including aforementioned local window. The larger area consists of all the sub-blocks currently covered by the window template to determine whether the window is gray-value flat (or violent). Finally, a specific binarization scheme was given according to different regions. Seven different algorithms were used to binarize four different types of four sets of images. The experimental results show that the proposed algorithm has the best performance in masking the background noise and preserving the target details. In particular, the algorithm can get the highest recall rate and accuracy rate through quantitative analysis of the license plate image binarization results.
image binarization; image blocking; gray level change; local threshold
2016- 09- 07;
2016- 11- 07。 基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61501522)。
張潔玉(1980—),女,山西大同人,講師,博士,主要研究方向:圖像處理、模式識(shí)別。
1001- 9081(2017)03- 0827- 05
10.11772/j.issn.1001- 9081.2017.03.827
TP
A