侯翠翠,干宗良
(南京郵電大學(xué)通信與信息工程學(xué)院,江蘇南京 210003)
圖像插值是利用已知鄰近像素點(diǎn)的灰度值來(lái)產(chǎn)生未知像素點(diǎn)的灰度值,從而再生出具有更高分辨率的圖像。圖像插值能夠有效地提高圖像的分辨率,它已經(jīng)成為圖像領(lǐng)域中的一項(xiàng)熱門課題,被廣泛地應(yīng)用到軍事、航空、醫(yī)學(xué)、通訊、氣象、遙感、動(dòng)畫制作、電影合成等領(lǐng)域。目前提出了很多圖像插值的方法。傳統(tǒng)的插值技術(shù)[1,2],如線性插值、雙立方插值、樣條插值。雖然復(fù)雜度低,計(jì)算速度快,但易產(chǎn)生鋸齒、模糊以及振鈴效應(yīng)等?;谶吘壍牟逯导夹g(shù)[3],可提高圖像的邊緣清晰度,但存在邊緣偏離的現(xiàn)象,放大倍數(shù)越大,偏離越嚴(yán)重?;趨^(qū)域的插值技術(shù)[4],在主觀和客觀上,都能獲得較好的圖像質(zhì)量。
在眾多的插值算法中,SAI算法[5]獲得了比較好的插值效果,它采用最小二乘法優(yōu)化PAR模型參數(shù)。本文提出了一種新的PAR模型參數(shù)優(yōu)化方法:基于EM算法的PAR模型參數(shù)優(yōu)化。本文算法的核心思想:E步用已知的像素值和估計(jì)出的PAR模型參數(shù)估計(jì)插入值;M步用已知的像素值和E步估計(jì)出的插值對(duì)PAR模型參數(shù)估計(jì)值修正。相比SAI算法,本文算法獲得了更好的圖像邊緣以及較高的峰值信噪比。
SAI算法的關(guān)鍵是解決3個(gè)最優(yōu)化問(wèn)題,即PAR模型參數(shù)矢量 a=(a1,a2,a3,a4),b=(b1,b2,b3,b4)的最優(yōu)化以及圖像插入值的最優(yōu)化。
PAR模型參數(shù)a、b采用最小二乘法優(yōu)化,即:
其中,W是正八角形的窗。
然后,通過(guò)最小化式J(λ)估計(jì)出圖像插入值。即:
其中,λ一般取0.5。式(1)-(3)中,符號(hào)表示的意義如圖1所示。
圖1 PAR模型參數(shù)a,b及像素位置的配置
EM算法是一種基于數(shù)據(jù)添加思想的迭代算法,是Demmpeter等人1977年提出求參數(shù)極大似然估計(jì)的一種方法,它可以從非完整數(shù)據(jù)中計(jì)算出參數(shù)的最大似然估計(jì)。它廣泛地應(yīng)用于處理缺損數(shù)據(jù),截尾數(shù)據(jù),帶有討厭資料等的非完整數(shù)據(jù)。
EM算法的每次迭代過(guò)程執(zhí)行兩步:E步(Expectation step,期望步),在給定觀測(cè)數(shù)據(jù)和前一次迭代參數(shù)估計(jì)的情況下,極大化缺失數(shù)據(jù)對(duì)應(yīng)的對(duì)數(shù)似然函數(shù)的條件期望,從而估計(jì)出缺失數(shù)據(jù);M步(Maximization step,最大化步),在給定觀測(cè)數(shù)據(jù)和E步缺失數(shù)據(jù)估計(jì)的情況下,通過(guò)極大化對(duì)數(shù)似然函數(shù)以確定參數(shù)的值,并用于下一次的迭代。算法在E步和M步間反復(fù)進(jìn)行,直到算法收斂。
由式(1)可知,SAI算法中,模型參數(shù)b是由 xi和它的4個(gè)相鄰像素估計(jì)所得,它和式(3)中的模型參數(shù)b是同方向且等距離的,如圖2(a)所示。但由于圖像采樣后的協(xié)方差可能改變,所以直接將式(1)估計(jì)出的b用于式(3)可能導(dǎo)致數(shù)據(jù)的過(guò)擬合,使插值圖像產(chǎn)生錯(cuò)誤的邊緣。因此,本文將用估計(jì)出的圖像插入值yi和它的4個(gè)相鄰像素對(duì)式(1)中的模型參數(shù)估計(jì)值進(jìn)行修正。則此時(shí)模型參數(shù)b的估計(jì)可表示為:
圖2 式(1)和式(3)中模型參數(shù)a,b的比較
同理,式(2)中模型參數(shù)估計(jì)也可用圖像的插入值yi和它的4個(gè)相鄰像素來(lái)修正。同時(shí),式(2)的模型參數(shù)a的估計(jì)還存在一個(gè)問(wèn)題:式(2)中xi和它的相鄰像素的距離是式(3)中yi和它的相鄰像素距離的2倍,如圖2(b)所示。由于不同間隔距離的像素之間的相關(guān)性不一定相一致,所以將式(2)的估計(jì)值用于式(3)中插入值的估計(jì),估計(jì)出的插入值難免存在誤差。針對(duì)上述問(wèn)題,本文將用估計(jì)出的圖像插入值yi和再次對(duì)式(2)中的估計(jì)值進(jìn)行修正。則此時(shí)模型參數(shù)a的估計(jì)可表示為:
式(3)-式(5)中,低分辨率圖像像素 xi已知,插入的像素yi和PAR模型參數(shù)a,b均未知,該問(wèn)題可用EM算法解決。在統(tǒng)計(jì)模型中,把插入的像素值yi看作是缺失數(shù)據(jù),則yi和xi可組成完整數(shù)據(jù),模型參數(shù)a和b可作為未知參數(shù),希望在丟失數(shù)據(jù)yi的情況下得到模型參數(shù)a和b的最大似然估計(jì)。則EM的主要思想如下:
(3)M步驟:E步驟獲得的插入值yi和低分辨率圖像像素xi,通過(guò)計(jì)算式(4)和式(5)獲得模型參數(shù)估計(jì)值
(4)重復(fù)E和M步驟,直至超過(guò)設(shè)定的迭代次數(shù)(一般取3次),輸出圖像插入值yi。
取W是正八角形窗,則式(3)可以寫成矩陣的形式:
其中,矩陣C、D在SAI算法中已經(jīng)給出,向量y是窗中要插入的像素,僅取窗內(nèi)最里面的像素。向量x是窗中的已知像素。
同樣,式(4)和式(5)也可以表示為矩陣形式:
其中,矩陣B的第i(i=1,2,…,21)行是 xi的4個(gè)四方向的相鄰像素和第i(i=22,23,…,33)行是 yi的4個(gè)四方向的相鄰像素。向量v是窗中的已知像素 x1,x2,…,x21和y1,y2,…,y12.
其中,矩陣A的第i(i=1,2,…,21)行是 xi的4個(gè)八方向的相鄰像素和第 i(i=22,23,…,33)行是 yi(i=1,2,…,12)的4個(gè)八方向的相鄰像素 xi和第i(i=34,35,…,45)行是yi(i=1,2,…,12)的4個(gè)八方向的相鄰像素 yi。向量 v是窗中的像素 x1,x2,…,x21和 y1,y2,…,y12。
如2.2所述,采用EM算法解式(6)-(8)。
上述僅介紹了第一步的插值過(guò)程,第二步插值與第一步插值唯一的不同處是,第二步的插入像素采用它的4個(gè)四方向的相鄰xi像素或第一步插入的像素yi來(lái)估計(jì)。
本文采用圖像 lena、boy、fish、mrit、flower作為測(cè)試圖像,如圖3所示。以雙立方插值算法,SAI算法以及本文所提出的算法進(jìn)行2倍插值實(shí)驗(yàn)對(duì)比。
圖3 本文用到的測(cè)試圖像
為觀察圖像放大后的細(xì)節(jié),在lena、boy、fish測(cè)試圖像中分別取尺寸為200×200的子圖像作為觀測(cè)圖像,先對(duì)子圖像進(jìn)行2×2的下采樣,然后分別用3種算法對(duì)下采樣圖像進(jìn)行2×2插值,結(jié)果如圖4所示。以lena的局部放大圖像為例,雙立方插值算法中l(wèi)ena的肩膀處存在嚴(yán)重的模糊及沿邊緣方向的鋸齒;相比于雙立方插值,SAI算法能有效地減少圖像邊緣的模糊及沿邊緣方向的鋸齒,但仔細(xì)觀察會(huì)發(fā)現(xiàn),lena圖像的肩膀邊緣仍有模糊和細(xì)小的鋸齒;相比于SAI算法,本文算法進(jìn)一步減少了圖像的模糊和鋸齒效應(yīng),獲得了更好的視覺(jué)效果。
圖4 幾幅圖像的局部放大效果
為了測(cè)試算法的全局性能,計(jì)算插值圖像的峰值信噪比,結(jié)果見(jiàn)表1,差值是本文算法比其它兩種算法高出的峰值信噪比。從中可以看出,本文算法的峰值信噪比比雙立方插值算法高0.17dB~1.89dB,比 SAI算法的峰值信躁比高0.10dB~0.37dB。這與實(shí)驗(yàn)結(jié)果所表現(xiàn)出的視覺(jué)效果是一致的。
表1 3種插值算法的峰值信噪比
本文提出了一種基于EM算法的PAR模型參數(shù)優(yōu)化算法。在E步利用估計(jì)出的PAR模型參數(shù)和已知的像素值估計(jì)出圖像插入值,在M步利用E步估計(jì)的插入值和已知的像素值估計(jì)出模型參數(shù)。仿真結(jié)果表明,本文所提出算法獲得了良好視覺(jué)效果和客觀質(zhì)量。
[1]Keys R G.Cubic Convolution Interpolation for Digital Image Processing[J].IEEE Trans-actions on Acoustics,Speech and Signal Processing,1981,29(6):1153-1160.
[2]Hou H S,Andrews H C.Cubic Splines for Image Interpolation and Digital Filtering[J].IEEE Transactions on A-coustics,Speech and Signal Processing,1978,26(6):508-517.
[3]Li X,Orchard M T.New Edge-Directed Interpolation[J].IEEE Transactions on Image Processing,2001,10(10):1521-1527.
[4]王會(huì)鵬,周利莉,張杰.一種基于區(qū)域的雙三次圖像插值算法[J].計(jì)算機(jī)工程,2010,36(19):216-218.
[5]Zhang X,Wu X.Image Interpolation by Adaptive 2-D Autoregressive Modeling and Soft Decision Estimation[J].IEEE Transactions on Image Processing,2008,17(6):887-896.
[6]Wu X,Barthel E U,Zhang W.Piecewise 2D Autoregression for Predictive Image Codings[C].Proceedings of IEEE InternationalConferenceon ImageProcessing,1998,3:901-904.