詹 毅,李 夢
(1. 重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院, 重慶 南岸 400067; 2. 重慶文理學(xué)院群與圖的理論及應(yīng)用重點實驗室, 重慶 永川 402160)
?
泰勒展開圖像插值的一個改進算法
詹毅1,李夢2
(1. 重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院, 重慶南岸400067; 2. 重慶文理學(xué)院群與圖的理論及應(yīng)用重點實驗室, 重慶 永川402160)
待插像素鄰域內(nèi)像素點處泰勒展開式的算術(shù)平均會模糊插值圖像邊緣.文章提出一個改進算法,采用展開式與其灰度值之差絕對值最小的泰勒展開式近似待插像素的灰度值.這種方法充分考慮待插像素與其鄰域的圖像信息,獲得清晰的插值圖像邊緣.數(shù)值實驗證明:這種算法簡單有效且易于實現(xiàn).
圖像插值;圖像縮放;泰勒展開式
圖像插值是由低分辨率圖像通過計算機算法獲得具有較高分辨率圖像的技術(shù).這種技術(shù)廣泛應(yīng)用于生產(chǎn)生活實際中,比如戶外廣告需要在放大數(shù)字照片的同時保持圖像清晰度,圖像的壓縮與解壓過程中分辨率的轉(zhuǎn)化也需要圖像插值技術(shù),等等.如何獲得光滑的圖像輪廓產(chǎn)生清晰的圖像畫質(zhì),以及減少算法帶來的虛像是過去幾十年來圖像插值技術(shù)所要解決的問題.
近年來,眾多的學(xué)者提出了各種各樣的算法來解決插值圖像中產(chǎn)生的各種虛像[1-6],比如鋸齒現(xiàn)象、模糊以及振鈴現(xiàn)象等.傳統(tǒng)的雙線性、雙三次方法的插值函數(shù)僅僅與距離有關(guān),不能刻畫圖像的局部特征信息,從而容易在圖像邊緣處形成模糊或鋸齒現(xiàn)象.Hwang等人在線性模型中通過引入逆梯度權(quán)系數(shù)來增強圖像邊緣,以此獲得清晰的圖像邊緣[1].但是,這種方法在插值倍數(shù)較大時會形成鋸齒狀邊緣.NEDI算法基于低分辨協(xié)方差與高分辨率協(xié)方差的幾何對偶獲得高分辨圖像插值[2].用小波多分辨率分析方法,Reeth等[3]運用圖像邊緣頻率特性的無偏估計改善線性插值的效果.單方向的泰勒展開式圖像插值方法是一種簡單、快速的圖像插值方法[4].張崢嶸等[5]運用非參數(shù)回歸模型建立了一種邊緣保持核回歸圖像插值方法,使插值圖像的邊緣信息得到一定的保持,但高階導(dǎo)數(shù)的計算是一個比較困難的問題,這直接影響了插值圖像的視覺效果. 施云惠等[6]利用再生核的數(shù)學(xué)模型特點建立了基于再生核的圖像插值方法.這種方法將圖像沿3個方向再生后按再生核數(shù)值積分方法導(dǎo)出圖像插值算法來保持圖像的邊界信息和光滑性.計算復(fù)雜度高是這種方法的缺陷,另外,按塊插值也會降低跨域兩個塊的圖像邊緣的光滑性.現(xiàn)代科技的發(fā)展需要插值算法簡單、運算速度快,插值圖像的邊緣需要更清晰、更光滑.以上這些算法在實際應(yīng)用中都存在各自的劣勢.
本文對文獻[4]的二元函數(shù)泰勒展開式模型提出一個改進算法.這種算法克服了沿各個方向泰勒展開的算法平均產(chǎn)生的模糊,從而產(chǎn)生視覺效果良好的插值圖像.
文獻[4]用泰勒展開式近似數(shù)字圖像的類斜面邊緣減小斜坡坡度,從而抑制圖像邊緣的模糊程度.圖1 (a) 顯示了一維原始圖像,現(xiàn)在需要在像素位置A和B之間插入 C和D 兩個像素.用像素B的灰度值近似像素 D 的灰度值,像素A的灰度值近似像素C的灰度值是插值算法最理想的結(jié)果,如圖1 (b)實線所示.文獻[4]的基本思想是在邊緣中心同側(cè),用已知像素(如像素點B)的泰勒展開式近似表示待插值像素(如像素點 D):
(1)
其中,h是像素D到像素B的距離.這種方法通過減小插值圖像邊緣的寬度、增加邊緣斜坡坡度,從而獲得清晰的插值圖像邊緣.展開式中二階偏導(dǎo)數(shù)包含了圖像更多的特征信息,有利于進一步抑制插值圖像的邊緣鋸齒現(xiàn)象.
(a)
(b)
圖2顯示了二維數(shù)字圖像插值網(wǎng)格,實心點表示待插值像素g,空心點表示原有像素.
圖2 插值網(wǎng)格
在文獻[4]中,待插值像素的灰度值g分別在像素點gi,j,gi,j+1,gi+1,j,gi+1,j+1處運用二元函數(shù)的Tayler展開式獲得,如用gi,j表示如下:
g(x,y)≈g(i,j)+gx(i,j)k+gy(i,j)l+
gyy(i,j)l2)
(2)
其中:gx(i, j),gy(i, j)是g在(i, j) 處的一階導(dǎo)數(shù);gxx(i, j),gxy(i, j),gyy(i, j)是g在(i, j)處的二階偏導(dǎo)數(shù).類似地,可以得到在像素(i, j+1),(i+1, j),(i+1,j+1)處的Tayler展開表達式gi,j+1(x, y),gi+1,j(x, y),gi+1,j+1(x, y).文獻[4]對這4個不同的表達結(jié)果進行雙線性加權(quán),得到最終插值表達式
g(x,y)=(1-l)((1-k)gi,j(x,y)+
kgi+1,j(x,y))+
l((1-k)gi,j+1(x,y)+
kgi+1,j+1(x,y))
(3)
然而, (3)式的線性加權(quán)是仍會在一個程度上模糊圖像邊緣.如圖1(b)所示,按照(3)式,D點的像素值是用B點和A點的泰勒展開再線性加權(quán),會與真實值之間存在誤差,如圖中虛線所示.
我們改進(3)式中待查像素灰度g(x, y)與它在像素(i, j+1),(i+1, j),(i+1, j+1)處的Tayler展開表達式gi,j+1(x, y),gi+1,j(x, y),gi+1,j+1(x, y)之間的表達式.從圖1(b)可以看出,待插像素D用像素點B處的泰勒展開式比用像素點A處的泰勒展開式要更合理一些.事實上,從圖中可以看出,D用B處的泰勒展開式得到的灰度近似值與B點的像素灰度值之差的絕對值要比A點處的情況小.基于此,待查像素的灰度值用某點處的泰勒展開近似處理,如果這點的泰勒展開近似與這點的灰度值之差的絕對值最小,即
g(x,y)=gi+k0,j+l0
(4)
其中:gi,j,gi,j+1,gi+1,j,gi+1,j+1是待插像素在像素(i, j), (i, j+1), (i+1, j), (i+1, j+1)處的Tayler展開表達式;gi,j,gi,j+1,gi+1,j,gi+1,j+1是在(i, j), (i, j+1), (i+1, j), (i+1, j+1)處的灰度值.
我們對全彩色boat、parrots、eye、flower圖像用公式(4)進行插值,對實驗結(jié)果從主觀視覺和客觀指標(biāo)來說明提出算法的有效性.本節(jié)從主觀視覺效果和客觀數(shù)據(jù)指標(biāo)(峰值信噪比,PSNR)來說明本文算法的有效性.
圖3顯示了3種算法對boat原始圖像插值放大2.6×2.6倍后的結(jié)果.從圖中可以看出,文獻[1,4]方法產(chǎn)生的圖像具有明顯的鋸齒現(xiàn)象以及模糊的邊緣,而本文方法產(chǎn)生的插值圖像具有較清晰的邊緣.圖4顯示了3種算法對eye圖像3×3插值的結(jié)果.從插值圖像可以看出,文獻[1]中方法產(chǎn)生鋸齒現(xiàn)象,文獻[4]雖然對抑制鋸齒現(xiàn)象有一定效果,但邊緣的模糊也是存在的.本文算法能夠有效減輕圖像邊緣的模糊.從圖5中的flower圖像插值結(jié)果也可看出,在花枝的莖、梗和包裹花蕾的部分,本文算法有較好的視覺效果.表1是3種算法的峰值信噪比(psnr)的比較.從表中可以看出,本文插值算法具有較高的峰值信噪比.這與實驗結(jié)果反應(yīng)的視覺效果是一致的.
文獻[1]算法 文獻[4]算法 本文算法
文獻[1]算法 文獻[4]算法 本文算法
文獻[1]算法 文獻[4]算法 本文算法
峰值信噪比psnrBoatParrotsEyeFlower文[1]算法32.5734.1735.7934.47文[4]算法32.8435.2636.1434.52本文算法33.0335.1636.9134.60
本文對各個方向同側(cè)像素的泰勒展開式的最終表示進行了改進,克服了同側(cè)泰勒展開式與異側(cè)泰勒展開式的算法平均,獲得了一個實現(xiàn)簡單的插值方法.這種算法在抑制圖像邊緣的鋸齒現(xiàn)象,獲得清晰的圖像邊緣方面具有較好的效果.這種算法復(fù)雜度低、運算速度快,具有較好的主觀視覺效果,能夠很好運用于工程實踐中.
[1]HWANG J W, LEE H S.Adaptive image interpolation based on local gradient features[J]. IEEE Signal Processing Letters, 2004,11(3):359-362.
[2]LI X, ORCHARD M T.New edge directed interpolation[J]. IEEE Transactions on Image Processing, 2000, 10(10):311-314.
[3]REETH E V,BERTOLINO P, NICOLAS M.Image interpolation based on a multi-resolution directional map[J]. Proceedings of the SPIE, 2011, 7870:78700M-78700M-12.
[4]詹毅.基于泰勒展開式的圖像插值方法[J].計算機工程, 2012, 38(13):202-204.
[5]張崢嶸, 劉紅毅, 韋志輝. 邊緣保持的核回歸圖像插值方法[J].計算機工程, 2011, 37(19):194-197.
[6]施云惠, 李鋅, 尹寶才.基于再生核W空間的圖像插值算法[J]. 計算機仿真, 2007, 24(3):219-222.
(責(zé)任編輯穆剛)
An improved algorithm for image interpolation with taylor expansion
ZHAN Yi1,LI Meng2
(1. Math and Statistics College, Chongqing Technology and Business University, Nan’an Chongqing 400067, China; 2. Key Laboratory of Group & Graph Theories and Applications, Chongqing University of Arts and Sciences, Yongchuan Chongqing 402160, China)
The interpolated image edges was blurred by the arithmetical average of Taylor expansion in the neighborhood of interpolated pixel. An improved algorithm is proposed. The interpolated value is the Taylor expansion which has minimum absolute of the difference with the pixel in neighborhood. This method considers image information of interpolated pixel and its neighborhood, which produce scrip edges. The numerical simulation shows that this method is simple and easy to be implemented with better visual effects.
image interpolation; image zooming; Taylor expansion
2015-09-07
國家自然科學(xué)基金項目(61202349); 重慶市基礎(chǔ)與前沿研究計劃一般項目(cstc2013jcyjA40058, cstc2015jcyjA0142).
詹毅(1971—),男,重慶萬州人,副教授,博士,主要從事偏微分方程圖像處理方面的研究.
TP391
A
1673-8004(2016)05-0008-04