摘要:從原裝訂本上掃描文件頁面往往會(huì)導(dǎo)致掃描圖像扭曲的情況。該文簡要先介紹了SFS方法及分類。然后提出從技術(shù)的角度看利用SFS重構(gòu)掃描圖像這一問題。在現(xiàn)實(shí)環(huán)境中掃描圖像有如下特征:1)一個(gè)靠近的移動(dòng)光源;2)Lambertian式光反射;3)文件偏斜。然后利用基于去除灰度和去除變形模式的方法來恢復(fù)掃描文件圖像。用以重構(gòu)書曲面的圖像,恢復(fù)掃描圖像。
關(guān)鍵詞:SFS;圖像恢復(fù);圖像變形;圖像扭曲
中圖分類號(hào):TN957文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2008)28-0184-03
Restoration of Scanned Document Image based on SFS Method
LI Jun1,2,GONG Sheng-rong1
(1.School of Computer Science Technology,Soochow University,Suzhou 215021,China;2.Wenzhou University Office Equipment,Wenzhou 325000,China)
Abstract:Scanning a document image from a bound volume often results in distortions in the scanned image.With a brief introduction of Shape from Shading (SFS method) and its classifications, this paper firstly discusses restoration of document image through SFS method from a technical point of view. Scanning document image in real-world environment is characterized by 1) a proximal and moving light source, 2) Lambertian reflection, 3) document skew. Then restore the scanned document image using a shpe based on deshaping and dewarping models.
Key words: SFS (Shape from Shading); image restoration; image warping; image distortion
1 引言
從原裝訂本上掃描文件頁面往往會(huì)導(dǎo)致掃描圖像扭曲的情況。這種變形給檔案文件圖像恢復(fù)以及用于電子圖書館文件恢復(fù)的文字辨認(rèn)帶來種種問題。鑒于這些問題以及有大量書本需要掃描。本文提出了一種基于SFS的有效的方法,從掃描文件圖像的灰度信息中發(fā)現(xiàn)書本面3D 陰影。糾正以上變形來恢復(fù)文件圖像。 該領(lǐng)域一直以來存在著種種相互關(guān)聯(lián)的技術(shù),我們將之歸為兩類:1)基于2D文件圖片處理的恢復(fù)方法; 2)基于3D文件陰影發(fā)現(xiàn)的恢復(fù)方法。
2 SFS方法原理[2-3]及分類
明暗恢復(fù)形狀也稱基于灰度(Shape from Shading)的方法,即從圖像的灰度信息出發(fā),利用明暗(即灰度)信息恢復(fù)物體的三維形狀,簡稱SFS技術(shù)[1]。他是一種根據(jù)物體圖像灰度的變化來求解物體表面三維形狀的方法,該方法利用光照型對(duì)圖像輻照度方程進(jìn)行逆向求解,所以只需要單幅圖像就可以解決表面重構(gòu)問題。一般情況下,物體表面的灰度分布主要與以下幾個(gè)因素有關(guān):物體表面的幾何形狀、光源的方向和強(qiáng)度、觀察者的位置以及被光線照射的物體表面的反射特性等。
現(xiàn)有的SFS方法可以劃分為四種類型:最小化法、傳播方法、局部方法和線性方法。以下做個(gè)簡單的介紹。
2.1 最小化法
最小化法通過對(duì)圖像的能量函數(shù)進(jìn)行最小化求解來獲得物體表面的梯度方向,如果單純用梯度方向表述曲面形狀,則曲面上任一點(diǎn)會(huì)有兩個(gè)未知量,方程具有病態(tài)特性,可以存在無窮多組解,因此,必須提供其它的一些約束條件來使之轉(zhuǎn)化為良性問題,這種方法稱為正則化方法。約束條件包括光強(qiáng)約束[4]、表面光滑約束、表面可積性約束、梯度約束和單位法向量約束等條件。
2.2 傳播方法
傳播方法一般從一個(gè)參考點(diǎn)或一些己知或可以求取高度的點(diǎn)開始計(jì)算,然后通過明暗信息對(duì)表面梯度方向進(jìn)行傳播重構(gòu)。例如,表面梯度方向表達(dá)為:
■
式中Lx ,Ly和LZ為光源入射方向。
2.3 局部方法
常用的局部形狀假設(shè)為球形表面[5],顯然這種假設(shè)所確定的物體表面是光滑的。因?yàn)樗惴]有迭代過程,且確定形狀時(shí),計(jì)算被局限在局部范圍內(nèi),因此,局部方法的時(shí)間復(fù)雜度較小,效率較高。首先在光源坐標(biāo)系中計(jì)算表面的傾角和仰角,再轉(zhuǎn)化到觀察坐標(biāo)系中,表面點(diǎn)方向的仰角V為:
■
其中Ex ,Ey ,為圖象灰度沿x, y方向上的導(dǎo)數(shù),α和β分別為光源方向s0的傾角和仰角。
2.4 線性化方法
線性化方法的思路是通過將反射圖線性化,將非線性問題轉(zhuǎn)化為線性問題。這個(gè)思路基于這樣的假設(shè),反射圖中的低階項(xiàng)起主要作用。保證了求解結(jié)果的收斂性,并降低了計(jì)算復(fù)雜度。我們以Pnetlnad的方法為例,來介紹這種線性化方法。
Penilnad使用了反射圖的線性逼近。反射圖可以寫為:
■
3 文件圖像的掃描及相關(guān)問題
3.1 掃描圖像的理想狀態(tài)
圖1顯示了圖像掃描儀的結(jié)構(gòu)和書的坐標(biāo)系。[6]
掃描儀包括一個(gè)光源L,一個(gè)線性CCD感應(yīng)器C,一個(gè)鏡子M,一個(gè)透鏡E。感應(yīng)器C沿著掃描線S接到1D圖像 (0≤i≤圖像長度I),并隨著L,M,和E移動(dòng)。這樣一連串的P(i)圖像形成了一個(gè)2D圖像P(i,j)(0≤j≤圖像長度J )。原點(diǎn)O位于掃描平面的一個(gè)點(diǎn),也就是2D圖像的P(0,0)上。
1) X軸位于掃描平面且與書脊平行。
2) Y軸位于掃描平面上且與書邊(橫向)平行,上有掃描儀采集到的書表面的數(shù)值。
3) Z軸與x-y 平面垂直,上面標(biāo)有書表面的正數(shù)值。
3.2.1理想的3D視覺模式
假設(shè)一:文中討論的方法是建立在全面的圓筒形書本表面的基礎(chǔ)上。所謂圓筒形,意思是書脊邊沿的高度是一致的,而所謂全面,指的是一個(gè)平滑的橫截面陰影,有圓形的,橢圓的,雙曲線的,拋物線的。
假設(shè)二:書表面Lambert式的,也就是說,在所有的方向都沒有反射映像,反射光線的亮度也是相同的。
首先來考慮一個(gè)理想的SFS問題,滿足以下條件:
1) 一個(gè)遠(yuǎn)的固定光源。這意味著整個(gè)掃描目標(biāo)表面上的光照強(qiáng)度和光源方向是衡量。
2) Lambert式反射。
3) 無文件偏斜:書脊平行于掃描儀的線性定向光源,也就是說,ε =0
在此理想狀態(tài)下的SFS問題可以公式化為:
Io(p)=Is*k*cos?漬(p)
Io(p)表示在p點(diǎn)觀測(cè)到的反射光強(qiáng)度,p點(diǎn)是掃描圖像中的一個(gè)2D點(diǎn)。Is表示照明強(qiáng)度,k是表面的漫反射系數(shù),?(p)表示光源方向和書本表面與p相對(duì)應(yīng)的3D點(diǎn)的表面法線的夾角。
3.3 實(shí)際掃描狀態(tài)的3D視覺模式
針對(duì)的現(xiàn)實(shí)掃描狀態(tài),通過考慮如下三個(gè)因素,將SFS問題公式化:
因素1:就近的移動(dòng)的光源。掃描儀的線性定向光源在掃描過程中移動(dòng),并位于離書表面很近的地方。這意味著光照強(qiáng)度會(huì)隨著書表面的位置變化而變化。
因素2:Lambert式反射,書表面是Lambert式的,也就是說CCD感應(yīng)器所觀測(cè)到的反射光強(qiáng)度只與入射角的余弦成比例。
因素3:文件偏斜 。需要掃描的書本并沒有必要與線性定向光源平行排列。
3.3.1 就近的移動(dòng)的光源(因素1)
有了一個(gè)就近的移動(dòng)光源,掃描目標(biāo)表面上的照明強(qiáng)度就不再是衡量,現(xiàn)在點(diǎn)p上的照明強(qiáng)度是p所在位置和與p相對(duì)應(yīng)的光源的函數(shù),用公式表示如下:
I0(p)=Is(s(p),l(p))·k·cos?漬(p)
s(p)和l(p)分別表示書本表面的3D點(diǎn)和與p相對(duì)應(yīng)的光源的位置。
3.3.2 Lambert式反射和不規(guī)則的漫反射系數(shù)分布(因素2)
通過將Lambert式反射和不規(guī)則的漫反射系數(shù)分布特點(diǎn)合并在一起,可以將問題用公式化為:
I0(p)=Is(s(p),l(p))·k(s(p))·cos?漬(p)
其中k(s(p))表示在s(p)上的漫反射,而cos?漬(p) 表示反射系數(shù)參數(shù)。
3.3.3 文件傾斜(因素3)
最后,我們考慮文件傾斜角度ε。圖像強(qiáng)度p(i,j)(像素值)和反射光強(qiáng)度的關(guān)系可以表示如下:
p(i,j)= α·I0(i,j)+ β=α·Is(z(y(i,j))) ·k(x(i,j),y(i,j)) ·cos?漬( y(i,j)) + β
1) p(i,j):被掃描圖像上(i,j)處的圖像強(qiáng)度
2) α,β:分別表示掃描儀中的光電轉(zhuǎn)換的增益和偏置。
3) x(i,j),y(i,j):分別表示與p(i,j)相對(duì)應(yīng)的3D點(diǎn)的x和y坐標(biāo)。
4) z(y(i,j)):在被掃描圖像中與p(i,j)相對(duì)應(yīng)的書本表面上的3D點(diǎn)的坐標(biāo)。根據(jù)假設(shè)一,z值在x軸上是穩(wěn)定不變的。z(y(i,j))表示掃描平面與書本表面的距離。
4 文件圖像恢復(fù)
4.1 去除陰影模式
如果在掃描時(shí),文件頁面是平的,所有的Z值都為0,也就是說z(y(i,j))=0,頁面表面的法線是垂直的,也就是?漬(y(i,j))=Ψ,點(diǎn)(x(i,j),y(i,j),0)的光學(xué)圖像灰暗度P*(i,j)為:
P*(i,j)= α·k(x(i,j),y(i,j))·Is(0) cosΨ+ β
其中,k(x(i,j),y(i,j)) Is(0)由前面計(jì)算出,α,β和Ψ是已知的常量。因此,恢復(fù)系統(tǒng)通過重新計(jì)算每個(gè)像素的圖像強(qiáng)度。
4.2 恢復(fù)變形模式
將去除陰影模式所生成的圖像作為輸入,接下來要建立的是恢復(fù)變形模式。去掉變形是建立在書本表面聚合的shape∈Z(yn)的基礎(chǔ)上的,注意,沿y軸的變形是由直交投影造成的。沿x軸的透視變形,是由透視投影造成的。因此,恢復(fù)變形模式包含了三部分:1)沿x軸的恢復(fù),2)沿y軸的恢復(fù)。
4.2.1 沿x軸的恢復(fù)
圖2顯示了在x-z平面在yn(y0≤yn≤yN)處的一個(gè)切片,其中P1P2表示書本表面垂直于X軸的一條線,P'1P'2表示CCD感應(yīng)器感測(cè)到的掃描平面上與P1P2相對(duì)應(yīng)的一條線。
yn上的每個(gè)像素重新生成圖像灰暗度P**(i,j),從而恢復(fù)x軸的變形(將P'1P'2延伸到P1P2的長度,從透視方程式可知,這種延伸對(duì)于每個(gè)yn都是一樣的,且與z(yn)成比例)。
■
其中
1) P*(i(xr,y(i,j)),j(xr,y(i,j))):由新生成的像素值,與3D點(diǎn)(xr,y(i,j)),z(y(i,j))相對(duì)應(yīng)。
2) xr: P'1P'2上的x(i,j)對(duì)應(yīng)的P1P2上的x值。xr的計(jì)算公式如下:
■
其中x(i,j),y(i,j)可計(jì)算得出,f是已知常量。
1) floor(xr):返回小于或等于xr的最大整數(shù)。
2) ceil(xr):返回大于或等于xr的最小整數(shù)。
4.2.2 沿y軸的恢復(fù)
沿y軸的變形只是由直交投影造成的,相鄰的y值yn-1和yn之間的true寬度為■。因此,沿y軸的恢復(fù)由以下兩個(gè)步驟來完成:首先,將計(jì)算出的估計(jì)true寬度w加起來,然后使用上一部分所討論到的相似方法,沿y軸將掃描圖象拉長到true寬度。
■
5 結(jié)論
本文通過分析實(shí)際掃描狀態(tài)的一些問題,通過建立實(shí)際模式用以重構(gòu)書曲面的3D模式,然后利用基于去除灰度和去除變形模式的方法來恢復(fù)掃描文件圖像。最后,通過比較與原圖像的差異,結(jié)果表明這些圖像和光度測(cè)定的變形基本被去除,該方法大大加快了速度,而且恢復(fù)結(jié)果很好。
參考文獻(xiàn):
[1] Horn B K P. Shape from shading: a method for obtaining the shape of a smooth opaque object from one view: (PhD thesis). Massachusetts: MIT,1970.
[2] 郝平.基于圖像灰度的自由曲面重構(gòu)算法研究[D].大連理工大學(xué),2005.
[3] 滿臣 基于圖像灰度的三維重構(gòu)遞推算法的研究[D].大連理工大學(xué),2005.
[4] Pentland A P.Local shading analysis.IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6(2):170-187.
[5] Pentland A P.Local shading analysis.IEEE Transactions on Pattern Analysis and Machine Intelligence,1984,6(2):170-187.