范 夢,熊淑華,陳洪剛,吳小強,何小海
(四川大學 電子信息學院,四川 成都 610065)
由于圖像及視頻的數(shù)據(jù)量較大,受存儲容量和傳輸帶寬的限制,實際應用中人們通常都是存儲和傳輸壓縮圖像。常用的圖像及視頻壓縮標準有JPEG﹑JPEG2000﹑H.264﹑HEVC等。其中,JPEG由于簡單高效而經(jīng)常被用于靜止圖像的壓縮。JPEG采用的核心壓縮算法為基于分塊的離散余弦變換(Block Discrete Cosine Transform,BDCT)編碼方法。BDCT編碼方法簡單﹑易于實現(xiàn)且壓縮效率高。然而,BDCT是針對圖像塊進行量化和編碼的,沒有考慮圖像塊間像素值的連續(xù)性,在高壓縮比情況下,采用較大的量化步長時,JPEG壓縮圖像會產(chǎn)生嚴重的塊效應。塊效應不僅嚴重影響圖像的視覺效果,也不利于圖像的進一步處理。所以,有必要對JPEG壓縮圖像去除塊效應,而后處理就是一種有效的方法。后處理可以在不改變現(xiàn)有壓縮標準的情況下去除塊效應,以提高圖像質(zhì)量。因此,本文提出了一種基于自適應高斯混合模型的JPEG壓縮圖像去塊效應算法。該算法利用外部圖像庫訓練得到的高斯混合模型,并結(jié)合加權(quán)的稀疏表示模型對JPEG壓縮圖像進行去塊效應,得到初始去塊效應圖像;然后,結(jié)合初始去塊效應圖像,將高斯混合模型作為引導,引導訓練出針對該圖像的自適應高斯混合模型,并將訓練得到的自適應高斯混合模型對初始去塊效應圖進一步去塊效應,以提升圖像質(zhì)量。本文算法取得了較好的去塊效應效果,且優(yōu)于一些圖像去塊效應和圖像去噪算法。
高斯混合模型(Gaussian Mixture Model,GMM)是用高斯概率密度函數(shù)較為精確地量化事物,是將一個事物分解為若干的基于高斯概率密度函數(shù)形成的模型,且相對簡單。因此,它可以以相對較少的高斯模型的加權(quán)和來表示圖像的統(tǒng)計特性。首先,選用Berkeley Segmentation Database中的訓練圖像來訓練GMM。先將圖像庫中每幅圖像分成8×8大小的圖像塊,且對每個圖像塊減去圖像塊均值,然后隨機提取足夠多的圖像塊進行GMM訓練,其中,GMM包含K個高斯分量{N(μk,∑k)}。對于第i個圖像塊定義為pi,則其來源于訓練所得的GMM的概率可計算為:
對于待去塊效應的壓縮圖像y,與高斯混合模型訓練過程相對應,首先將其分成大小為8×8的圖像塊,對每一個圖像塊yi計算塊均值μyi,減去其
對每一個圖像塊y—i,從訓練得到的GMM中選擇與其最匹配的高斯分量,假定圖像的壓縮噪聲方差為σ2,采用文獻[8]的方法計算噪聲方差,則對于第k個高斯分量的協(xié)方差矩陣可表示為Σk+σ2I,其中I是一個與協(xié)方差矩陣相同大小的單位矩陣。于是,每一個圖像塊從高斯混合模型中選取最匹配的高斯混合分量可以通過計算最大后驗概率求得:
對式(3)取對數(shù),得:
其中,C表示的是公式(3)中的分母,對每個圖像塊計算結(jié)果相同。對于每個高斯分量,圖像塊屬于該高斯分量的概率計算是一致的,最后可以選取出對應概率最大的高斯分量。實際上,GMM中不同高斯分量的協(xié)方差可以理解為其代表了不同的圖像結(jié)構(gòu)特征。于是,對協(xié)方差矩陣Σk進行奇異值分解(Singular Value Decomposition,SVD),即:
其中,矩陣D是由Σk的特征向量構(gòu)成的正交矩陣,矩陣Λ是由Σk的特征值構(gòu)成的對角矩陣??梢詫包含的特征向量理解為代表圖像的不同結(jié)構(gòu)特征,則Λ包含的特征值代表對應特征向量表征圖像不同結(jié)構(gòu)特征的貢獻程度。特征值越大,對應特征向量的貢獻程度越大。因此,可以將矩陣D當作字典。對圖像塊在字典D上做稀疏分解得到:
其中,α為稀疏分解系數(shù)向量,v為壓縮噪聲。注意,D中的第i個特征向量對應的特征值Λi越大,表明該特征向量表征圖像特征的貢獻程度越大??衫忙胍粋€加權(quán)向量去加權(quán)稀疏表示系數(shù)α,則可引入加權(quán)的稀疏表示模型去求解稀疏表示系數(shù),即:
根據(jù)最大后驗概率,可得:
其中,σ表示高斯噪聲的標準差。
對于稀疏表示系數(shù)向量中的每個分量αi,即圖像塊在字典D中的第i個特征向量上稀疏表示對應的系數(shù)。假定稀疏分解系數(shù)服從拉普拉斯分布,
將式(9)和式(10)代入式(8),可得:
對比式(10)和式(6),可以得到:
其中ε代表一個較小的正數(shù),以避免分母為0。因此,可以推導出:
求解出稀疏分解系數(shù),則可恢復出的圖像塊為:
對所有圖像塊重復以上過程,再還原到圖像中原始位置,即可得到去除塊效應后的圖像。
學習到的高斯混合模型由外部圖像庫通過標準EM算法訓練得到,因此該高斯混合模型學習到的統(tǒng)計特性只能表征一般自然圖像的結(jié)構(gòu)特征,可以稱其為一般性圖像先驗。對于特定圖像,由外部圖像庫訓練所得的圖像先驗并不具有針對性。因此,考慮由學習到一般性的圖像先驗作為引導去學習特定圖像的先驗,從而使學習到的圖像先驗更加具有針對性,即針對不同圖像獲得自適應的GMM。受文獻[10]的啟發(fā),結(jié)合獲得的初始去塊效應圖像和用外部圖像庫訓練得到的GMM,訓練針對該圖像的GMM。
可以定義一個中間變量nk,進一步地,需要更新初始去除塊效應圖像中的噪聲協(xié)方差。假定它仍然服從高斯分布,即(x?-x)~N(0,σ~2I ),其中σ~2為估計的均方誤差。參照文獻[10]中采用的Stein無偏風險估計對其進行估計,則:
在M階段,重新定義每個高斯分量的參數(shù)計算方式,將用外部圖像庫訓練獲得的一般性圖像先驗作為引導去更新參數(shù)(πi,μi,Σi),其中均值更新為:
得到更新后的高斯混合模型參數(shù)后,采用同樣的方法對初始去塊效應圖像進一步去除塊效應,提升圖像質(zhì)量。
為了驗證本文算法的有效性,本文采用5張標準的測試圖像Lena﹑house﹑foreman﹑Boat﹑Peppers分別在兩個不同質(zhì)量因子(Quality Factor,QF)下用JPEG進行壓縮。兩個質(zhì)量因子分別為QF=5和QF=10,其中QF越小,表示壓縮比越高,圖像的塊效應越嚴重。由于塊效應在一定程度上可以看作是一種噪聲,本文也將部分去噪算法引入作為對比算法。本文選取三個去塊效應算法,即Sun[3]算法﹑Zhang算法[4]﹑Chang算法[6]和三個去噪算法K-SVD算法[1]﹑BM3D算法[2]﹑本文算法進行比較,以驗證本文算法的有效性。
為了從主觀視覺上對本文算法的性能進行評價,本文對選取的五張測試圖像進行模擬實驗。首先對圖像進行JPEG編解碼,質(zhì)量因子為QF=5和QF=10,然后分別采用本文算法和對比算法對解碼圖像進行后處理。圖1為本文算法和對比算法在QF=5時的去塊效應結(jié)果圖。通過視覺效果的對比分析可知,JPEG壓縮圖像在高壓縮比時會出現(xiàn)嚴重塊效應,嚴重影響圖像的視覺效果;K-SVD方法可以有效去除塊效應,但會使圖像邊緣過于平滑;Sun方法和Chang方法去除塊效應不夠理想;BM3D方法和Zhang方法則能在有效去除塊效應的同時較好地保持圖像細節(jié);而本文算法不僅能有效去除塊效應,相比于其他算法也能更好地保持圖像細節(jié)。因此,在主觀評價標準上,本文算法優(yōu)勢更加明顯。
為了在客觀上評價本文算法去除塊效應的有效性,本文采用常用的圖像質(zhì)量評價參數(shù)峰值信噪比(Peak Signal to Noise Ratio,PSNR)作為評價指標。不同算法的PSNR值如表1所示。
從表1可以看出,本文算法重建圖像的PSNR均高于對比算法,驗證了本文算法的有效性。通過主觀和客觀評價,可見本文算法能較好地去除JPEG壓縮圖像的塊效應,同時能夠較好地保持圖像細節(jié)。
圖1 QF=5時,不同算法對house圖像去塊效應視覺效果比較
表1 QF=5和10時不同算法的PSNR結(jié)果比較(單位:dB)
本文提出了一種有效的JPEG壓縮圖像去塊效應算法,旨在將訓練得到的一般性圖像先驗映射到針對特定圖像的圖像先驗,并利用高斯混合模型表征圖像的圖像先驗,然后利用得到的自適應高斯混合模型對JPEG壓縮圖像去塊效應。通過對高斯混合模型的參數(shù)方差進行SVD分解,將獲得的特征向量矩陣作為字典,并利用加權(quán)的稀疏表示方法求解壓縮圖像去塊效應過程,從而獲得最終的去塊效應圖像。結(jié)果表明,本文提出的去塊效應算法獲得了較好的主客觀效果,且優(yōu)于一些圖像去塊效應和圖像去噪算法。
[1] Aharon M,Elad M,Bruckstein A.K-SVD:An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation[J].IEEE Transactions on Signal Processi ng,2006,54(11):4311-4322.
[2] Dabov K,Foi A,Katkovnik V,et al.Image Denoising by Sparse 3-D Transform-domain Collaborative Filtering[J].IEEE Transactions on Image Processing,A Publication of the IEEE Signal Processing Society,2007,16(08):2080-2095.
[3] Sun D,Cham W.Post-processing of Low Bit-rate Block DCT Coded Images based on a Fields of Experts Prior[J].IEEE Transactions on Image Processi ng,2007,16(11):2743-2751.
[4] Zhang X,Xiong R,Fan X,et al.Compression Artifact Reduction by Overlapped-block Transform Coefficient Estimation with Block Similarity[J].IEEE Transactions on Image Processing,2013,22(12):4613-4626.
[5] Yoo S,Choi K,Ra J.Post-processing for Blocking Artifact Reduction based on Inter-block Correlation[J].IEEE Transactions on Multimedia,2014,16(06):1536-1548.
[6] Chang H,Ng M,Zeng T.Reducing Artifacts in JPEG Decompression Via a Learned Dictionary[J].IEEE Transactions on Signal Processing,2014,62(03):718-728.
[7] 劉杰,陳懷新.彩色圖像有效壓縮及聯(lián)合重建的研究[J].通信技術(shù),2012,45(01):59-62.LIU Jie,CHEN Huai-Xin.Effective Compression and Joint Reconstruction of Color Image[J].Communications Technology,2012,45(01):59-62.
[8] Zhang J,Xiong R,Chen Z,et al.CONCOLOR:Constrained Non-convex Low-rank Model for Image Deblocking[J].IEEE Transactions on Image Processing,2016,25(03):1246-1259.
[9] Xu J,Zhang L,Zuo W,et al.Patch Group Based on Nonlocal Self-similarity Prior Learning for Image Denoising[C].IEEE International Conference on Computer Vision,2016:244-252.
[10] Luo E,Chan S,Nguyen T.Adaptive Image Denoising by Mixture Adaption[J].IEEE Transactions on Image Processing,A Publication of the Signal Processing Society,2015,25(10):4489-4503.
[11] 朱海英.H.264視頻編解碼器中去方塊濾波的實現(xiàn)[J].通信技術(shù),2010,43(06):216-218.ZHU Hai-ying.Implementation of Block Filtering in H.264 Video Coder/Decoder[J].Communcations Technology,2010,43(06):216-218.