摘要:提出一種圖像掃描技術(shù),解決書(shū)籍掃描時(shí)圖像背景灰度不均勻,并呈現(xiàn)非線性畸變情況。這個(gè)方法不依賴掃描儀的參數(shù)。通過(guò)對(duì)圖像的預(yù)處理,選取適當(dāng)?shù)牟蓸哟翱?,用函?shù)曲線逼近擬合背景灰度因子分布,來(lái)消除跳變誤差,或重新定義背景灰度采樣窗口和背景灰度估計(jì)。
關(guān)鍵詞:圖像處理;非線性畸變;灰度校正
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 18-0000-02
用于普通掃描儀器掃描的書(shū)籍的時(shí)候由于裝訂線部分的部分無(wú)法與玻璃板緊貼,從而會(huì)使得掃描圖像失真,不僅不利于閱讀,也不利于光學(xué)識(shí)別(orc)。為了解決這個(gè)問(wèn)題必須對(duì)這個(gè)圖像進(jìn)行校正。
基于以上分析,本文提出了一種圖像校正方法,解決了包括背景灰度不均勻非線性畸變的校正方法,效果良好。
1 背景灰度非線性畸變校正
因?yàn)闀?shū)籍的書(shū)脊部分遠(yuǎn)離掃描平面,并且有一定的傾斜角度,所以無(wú)法完全反射掃描儀發(fā)出的光,會(huì)出現(xiàn)掃描圖像對(duì)應(yīng)部分亮度下降的問(wèn)題,造成靠近書(shū)脊裝訂線的部分頁(yè)面出現(xiàn)黑影,并且明暗不均。越靠近中間書(shū)脊線的部分,越暗,灰度值越低,整個(gè)灰度值變化呈水平方向變化。
1.1 背景灰度畸變校正相關(guān)算法
目前主要的背景灰度畸變校正算法是采用背景灰度直方圖估計(jì)法,來(lái)修正背景灰度值的分布。
背景灰度直方圖估計(jì)法的原理:
首先估計(jì)出原始圖像背景灰度分布,根據(jù)與標(biāo)準(zhǔn)圖像背景灰度分布的比較,計(jì)算對(duì)比因子。然后根據(jù)灰度對(duì)比因子,恢復(fù)原始圖像的背景灰度值至標(biāo)準(zhǔn)圖像背景灰度。
對(duì)于原始圖像背景灰度分布估計(jì)主要有兩種方法:
(1)通過(guò)采樣法,估計(jì)灰度分布。圖像背景灰度不均勻分布,越靠近裝訂線背景越暗,灰度越小。在水平方向某一位置上,由于垂直方向上頁(yè)面離開(kāi)玻璃平板的距離基本一致,所以垂直方向上圖像背景灰度也基本一致,所以空變的背景灰度只是在水平方向變化的一個(gè)函數(shù)。我們?nèi)∫粋€(gè)采樣窗口,以窗口內(nèi)像素灰度直方圖計(jì)算該處的背景灰度,采樣窗口的設(shè)置需要符合兩個(gè)標(biāo)準(zhǔn):(1)每個(gè)區(qū)域內(nèi)的像素點(diǎn)足夠多,以使統(tǒng)計(jì)直方圖有意義。(2)區(qū)域不要太大,區(qū)域內(nèi)明暗應(yīng)是基本均勻的。對(duì)于給定的采樣窗口,背景是窗口中出現(xiàn)頻率大的灰度區(qū)域,為此選取采樣窗口內(nèi)像素的灰度直方圖中頻率最大的15個(gè)灰度值,并由此計(jì)算這些灰度值上的像素平均灰度。此值為該處的背景灰度。隨著采樣窗口沿水平方向移動(dòng),可以得到一系列直方圖,從而算出不同列上的背景灰度,為了把暗的背景校正為正常的背景灰度,定義背景灰度因子: , 為第n列的背景灰度, 為書(shū)頁(yè)緊貼玻璃平板處的各列圖像背景灰度的平均值,即為標(biāo)準(zhǔn)圖像的背景灰度。那么根據(jù)掃描結(jié)果得出的空間變化的背景灰度因子 ,就可以使用這個(gè)公式 進(jìn)行校正恢復(fù)。其中f(m,n)為原始畸變樣圖灰度值,g(m,n)為校正后的圖像灰度值。
(2)通過(guò)投影法,估計(jì)灰度分布。根據(jù)圖像分布的特點(diǎn),第一步為去除圖像四周的黑色區(qū)域。這里采用垂直和水平投影(即在水平或者垂直方向上求出像素的累加和)的方式,通過(guò)LoG算子找到突變區(qū)域?yàn)楹诎追纸缇€的位置。第二步為估計(jì)圖像照度分布。由于掃描圖像的對(duì)稱性特點(diǎn),照度的變化主要體現(xiàn)在水平方向的變化上。所以對(duì)圖像做垂直投影,得到圖像在水平方向的亮度變化曲線。對(duì)曲線進(jìn)行高斯平滑,濾除字符和噪聲等的干擾,再將曲線歸一化到0~255的范圍內(nèi)(即根據(jù)最大值和255的比值對(duì)曲線進(jìn)行縮放),再擴(kuò)展為圖像大小的矩陣,使矩陣的每一行等于剛才求得的曲線,即得到照度圖像。根據(jù)照度圖像對(duì)原始圖像進(jìn)行照度歸一化(即,照度不足的區(qū)域使其變亮,照度充足的區(qū)域不變),即可達(dá)到消除陰影的目的。
2 背景灰度畸變校正的改進(jìn)算法
基于對(duì)上述兩種主要背景灰度畸變校正算法的研究,針對(duì)其不足之處,本文作出了一些改進(jìn),使其效果更好,效率更高。改進(jìn)算法具體描述如下:
(1)提取背景灰度因子分布;
(2)對(duì)窗口采樣法和投影法分析研究;
(3)采樣法校正后會(huì)在部分頁(yè)面出現(xiàn)灰度不連貫的塊狀條紋。
投影法校正后會(huì)使得部分頁(yè)面區(qū)域灰度過(guò)白,過(guò)亮,特別是在書(shū)籍文字內(nèi)容區(qū)域。
從比較中可以知道,造成圖像校正效果誤差的原因主要是來(lái)自背景灰度估計(jì)的不連續(xù)性。從圖中的小波峰,小波谷,和鋸齒跳變可以看到因?yàn)闀?shū)籍文字內(nèi)容的分布不均勻,造成背景灰度采樣和投影的估計(jì)會(huì)出現(xiàn)跳變和誤差。
采樣法主要通過(guò)設(shè)置采樣窗口,然后統(tǒng)計(jì)窗口內(nèi)像素灰度直方圖,選取采樣窗口內(nèi)像素的灰度直方圖中頻率最大的15個(gè)灰度值,并由此計(jì)算這些灰度值上的像素平均灰度。此值為該處的背景灰度,水平移動(dòng)得到整個(gè)圖像的背景灰度分布。因?yàn)樵谶h(yuǎn)離書(shū)脊中線的兩邊部分頁(yè)面是緊貼掃描平板的,所以定義遠(yuǎn)離書(shū)脊中線的部分頁(yè)面背景灰度像素值為標(biāo)準(zhǔn)背景灰度值。通過(guò)整個(gè)圖像背景灰度和標(biāo)準(zhǔn)背景灰度值做比較,得到背景灰度因子分布圖。
所以關(guān)鍵之處是在于背景灰度因子的估計(jì),而背景灰度因子的估計(jì)主要取決于采樣窗口的灰度直方圖。
我們可以分析到,在采樣窗口內(nèi)由于部分文字內(nèi)容的灰度像素值也會(huì)出現(xiàn)較大的頻率,而我們選取了采樣窗口內(nèi)像素的灰度直方圖中頻率最大的15個(gè)灰度值,所以很大程度會(huì)對(duì)背景灰度的估計(jì)產(chǎn)生誤差,這也是部分頁(yè)面出現(xiàn)塊狀條紋的主要原因。這也是我們改進(jìn)的主要部分。
投影法主要是通過(guò)對(duì)每列像素值進(jìn)行投影累加,然后選取投影累加后像素和最大的為標(biāo)準(zhǔn)背景灰度,再用每列的投影累加后的像素和去和定義的標(biāo)準(zhǔn)背景灰度去對(duì)比,得到照度分布。也是由于書(shū)籍中部分文字內(nèi)容分布不均,有黑體字,所以造成部分列的投影出現(xiàn)偏差,得到的照度就會(huì)出現(xiàn)跳變,造成校正的效果有部分頁(yè)面出現(xiàn)過(guò)亮現(xiàn)象,部分文字模糊.而投影法定義的對(duì)每列投影累加,使得改進(jìn)的地方很少,所以選取采樣窗口法對(duì)非線性灰度畸變進(jìn)行校正。
在走勢(shì)和變化上,可以看到除開(kāi)兩邊由于黑邊的灰度值造成的分布曲線急劇下降的部分,其中間主要變化分布曲線,是和倒立的正態(tài)分布函數(shù)曲線十分相似,我們有理由相信可以用變換后的正態(tài)分布函數(shù)曲線去逼近擬合背景灰度因子分布。并且黑邊部分的灰度因子也用正態(tài)分布函數(shù)曲線的延伸部分去代替,因?yàn)楹谶叺幕叶认袼刂凳?,灰度因子取多少都對(duì)像素值為0的黑邊沒(méi)影響。
正態(tài)分布函數(shù):
計(jì)算機(jī)光盤(pán)軟件與應(yīng)用2012年18期