王宇慶
(中國科學院長春光學精密機械與物理研究所,吉林長春130033)
評價各種圖像處理裝置或算法性能的途徑之一是評價其輸出圖像的質量,已有的圖像質量評價方法可以分為主觀評價方法和客觀評價方法[1]。前者通過人眼的主觀觀測給出圖像質量的評價結果,雖然與人眼視覺特性的一致性較好,但是存在過程復雜、耗時長,可移植性差,測試結果不穩(wěn)定等缺點。后者依據(jù)模型或者算法給出量化的評價結果,是目前圖像質量評價領域的研究重點。均方誤差(Mean Square Error,MSE)和峰值信噪比(Peak Signal to Noise,PSNR)是2種常用方法,由于沒有考慮人眼視覺特性,這2種方法在實際應用中經(jīng)常出現(xiàn)評價結果與人的主觀感覺不一致的情況。因此,大量新的評價方法相繼出現(xiàn),Wang等人提出的結構相似度(Structure Similarity,SSIM) 方法[2-3],以及模擬人類視覺系統(tǒng)(Human Visual System,HVS)特性的方法[4-11],和基于小波變換的圖像質量評價方法[12]等均得到了廣泛應用,但這些方法雖然以不同方式在不同程度上克服了傳統(tǒng)MSE和PSNR方法的不足,卻仍普遍存在著評價結果與人的主觀感知不一致的問題。
本文將灰度圖像的局部方差分布(QLS)作為表征圖像結構信息的一個重要特征,對局部方差分布矩陣進行奇異值分解,通過計算降質圖像與原參考圖像局部方差矩陣奇異值特征向量的夾角來度量兩圖像結構的相似度,從而實現(xiàn)了對降質圖像的質量評價。實驗證明,所提出的QLS方法優(yōu)于傳統(tǒng)方法。
人眼對圖像的高頻分量比較敏感,圖像的細節(jié)也主要由高頻分量決定,圖像的局部方差能夠較好地描述圖像的細節(jié)信息,所以可以將圖像的局部方差作為分析圖像內(nèi)容信息的一種方法,或者也可以認為圖像的局部方差分布包含了圖像的某些重要結構信息[13-14]。文獻[13]研究了圖像的局部方差分布,采用SSIM方法,通過對圖像局部方差分布的統(tǒng)計實現(xiàn)了對2幅圖像結構相似性的度量,該方法對模糊失真的敏感程度極高,克服了傳統(tǒng)方法對模糊失真敏感程度低的缺點。
用Var(Ix,y)表示圖像I(灰度圖像)的局部方差,即以圖像點(x,y)為中心的局部區(qū)域方差。對于彩色圖像,需要將其轉換為YUV空間,用Y分量計算其局部方差。采用滑動窗口對圖像進行互不重疊的分塊,得到其中每一分塊的方差,也就是圖像的局部方差。對于包含L個像素的圖像分塊Ix,y,用ηp表示其內(nèi)部像素,局部方差可以表示為:
由于分塊方式對圖像結構會產(chǎn)生一定影響,對于包含在分塊Ix,y內(nèi)的像素 ηp,采用文獻[3]中提到的高斯加權方法計算每一分塊內(nèi)像素的均值和方差:
由以上方法可以得到對應于1幅灰度圖像I的局部方差分布矩陣,該矩陣表征了圖像的某些HVS敏感的重要結構特征。局部方差分布對于模糊失真的敏感程度較高,但是并不能突出表征其余失真類型對圖像質量的影響。矩陣奇異值特征向量能夠描述矩陣的主要能量特征,雖然不能直接描述圖像的結構特征,但是由于局部方差的分布突出表征了圖像的細節(jié)信息,對于細節(jié)信息分布的能量特征描述可以作為度量圖像結構相似度的一種指標。因此,通過對2個局部方差矩陣結構相似程度的度量就可以實現(xiàn)對2幅圖像結構相似度的度量,繼而得到對于待測圖像的質量評價結果。矩陣的奇異值特征向量表征了矩陣的能量特征,可以用特征向量的相似性度量2個矩陣
式中:“?”表示共軛轉置;Σr=diag(σ1,σ2,…,σr),A的奇異值 σi(1≤i≤r)為實數(shù),U,V分別稱為矩陣A的左、右奇異值矩陣。U∈HN×M,V∈HM×M。矩陣A的奇異值特征向量x=(σ1,σ2,…,σr,0,…,0)T。這樣,1 幅N×M的圖像的結構特征就可以用相應的局部方差矩陣表示。矩陣奇異值分解得到的奇異值特征向量表示了其能量特征。對于2幅圖像的奇異值特征向量x和x^,其夾角可以用來描述了2個向量的相關程度,夾角越小,說明相關程度越高,也是對2個向量張成的空間的相關程度的度量[15]。采用類似于文獻[15]的方法度量2幅圖像的結構相似程度,從而實現(xiàn)了對待測圖像的質量評價。對于參考圖像I和待測圖像I^,評價指標QLS可以表示為:的結構相似程度。
對于任意一個秩為r的矩陣A∈RN×M,則存在2個酉矩陣U,V,使得:
式中,σi,σ^i為2幅圖像局部方差分布矩陣奇異值特征向量中的元素。QLS的取值范圍為[0,π/2],數(shù)值越小,說明降質圖像與參考圖像的結構越相似。
為了驗證本文所提方法的有效性,實驗中采用了2組測試圖像:圖1(a)~(f)為第1組,圖1(a')~(f')為第2組。圖1(a)和圖1(a')為原圖像,采用JPEG2000壓縮,噪聲污染,模糊,以及與常數(shù)相加等方法分別得到了5幅降質圖像,具體參數(shù)為:圖1(b)和(b')采用文獻[16]的方法得到,壓縮率為 0.383 08 bit/pixel,圖1(b')為0.949 12 bit;圖1(c)和(c')為在參考圖像中添加密度為0.3的高斯白噪聲所得到的噪聲污染圖像;圖1(d)和(d')為采用23×23的窗口對原圖像均值濾波得到的模糊圖像;圖1(e)和(e')為采用9×9的窗口對原圖像均值濾波得到的模糊圖像;圖1(f)和(f')為原圖像與常數(shù)8相加得到的圖像。
采用 MSE、PSNR、SSIM、直接評價圖像矩陣的SVD方法[15],以及QLS方法分別評價圖像質量,評價結果如表1所示。
表1 采用多種評價方法對圖1中各降質圖像的評價結果Tab.1 Comparison of distorted images in Fig.1 by different methods
圖1 多種失真類型的降質圖像Fig.1 Distorted images with several types of distortion
嚴重模糊會導致圖像細節(jié)的大量損失,對圖像質量造成嚴重影響,根據(jù)人的主觀觀察,圖1(d)和(e)的像質明顯差于其余圖像。根據(jù)表1的評價結果,在列舉的各種評價方法中,QLS方法對圖1(d)和(e)給出了較差的評價結果,其中圖1(e)的質量要略好于圖1(d),QLS對圖1(e)的與常數(shù)相加的像質明顯偏低。顯然,本文所提出的QLS方法與人眼的主觀觀測完全一致。
本文將局部方差分布作為表征圖像結構信息的一種載體,通過對2幅圖像局部方差分布矩陣進行奇異值分解,計算奇異值特征向量夾角的大小實現(xiàn)了對2者結構相似程度的度量,從而實現(xiàn)了對降質圖像的質量評價。多種失真類型的降質圖像測試實驗表明:本文所提的QLS方法比傳統(tǒng)的MSE、PSNR、SSIM以及直接評價圖像像素分布的SVD方法更加符合人的主觀感知效果。
[1]ESKICIOGLU A M,F(xiàn)ISHER P S.A survey of image quality measures for gray scale image compression[C].Proceeding of 1993 Space and Earth Science Data Compression Workshop,San Diego,USA,1993.
[2]WANG ZH,BOVIK A C.A universal image quality index[J].IEEE Signal Proc.Let.,2002,9(3):181-184
[3]WANG ZH,BOVIK A C,SHEIKH H R,et al..Image quality assessment:from error visibility to structural similarity[J].IEEE T.Image Process.,2004,13(4):600-612
[4]LEE Y H,PARK S Y.A study of convex concave edges and edge-enhancing operators based on the Laplacian[J].IEEE T.Circuits Syst.,1990,37(7):940-946.
[5]RAMPONI G.A cubic unsharp masking technique for contrast enhancement[J].Signal Process.,1998,67(2):211-222
[6]袁曉松,王秀壇,王希勤.基于人眼視覺特性的自適應的圖像增強算法的研究[J].電子學報,1999,27(4):63-65.YUAN X S,WANG X T,WANG X Q.An adaptive image enhancement algorithm based on human visual properities[J].Acta Electronica Sinica,1999,27(4):63-65.(in Chinese)
[7]SEZAN M I,YIP K-L,DALY S J.Uniform perceptual quantization:application to digital radiography[J].IEEE T.Syst.,Man Cyb.,1987,17(4):622-634.
[8]JING XING.An image processing model of contrast perception and discrimination of the human visual system[C].2002 International Symposium Society for Information Display,Boston,Massachusetts,USA,May 2002.
[9]BARNI M,BARTOLIN I F,ROSA A De.HVS modelling for quality evaluation of art images[C].IEEE 14th International Conference on Digital Signal Processing,Santorini,Greece,July 2002.
[10]WESTEN S J P,LAGENDIJK R L,BIEMOND J.Perceptual image quality based on a multiple channel HVS model[C].IEEE 1995 International Conference on Acoustics,Speech,and Signal Processing,Detroit,MI,USA,1995.
[11]FERNANDEZ-MALOIGNE C,LARABI M-C,BRINGIER B,et al..Spatio-temporal characteristics of the human color perception for digital quality assessment[C].IEEE Signals,Circuits and Systems ISSCS 2005 International Symposium,New York,USA,14-15 July 2005.
[12]BEGHDADI A,PESQUEST-POPESCU B.A new image distortion measure based on wavelet decomposition[C].IEEE 1995 International Conference on Acoustics,Speech,and Signal Processing,Paris,F(xiàn)rance,2003.
[13]AJA-FERNANDEZ S,ESTEPAR R S J,ALBEROLA-LOPEZ C,et al..Image quality assessment based on local variance[C].Proceedings of 28th IEEE EMBS Annual International Conference.New York,USA,2006.
[14]GONZALEZ R C,WOODS R E.Digital Image Processing[M].New York:Addison-Wesley,1992.
[15]騫森,朱劍英.基于奇異值分解的圖像質量評價[J].東南大學學報(自然科學版),2006,36(4):643-646.QIAN S,ZHU J Y.Image quality measure using singular value decomposition[J].J.Southeast University(Natural Sci-評價結果也好于圖1(d),這與人的主觀感覺相一致。而SSIM方法因為對于模糊失真的敏感程度較低,因此沒有正確評價不同模糊程度的圖1(d)和(e),對于圖1(e)的評價結果好于圖1(b),這顯然與人的主觀感覺不符。傳統(tǒng)的MSE和PSNR方法對于圖1(d)和(e)的評價結果要好于(c),對于圖1(d)所給出的評價結果要好于(e),這同樣與人的主觀感覺不一致。而QLS方法對于上述降質圖像的質量則給出了正確的排序,即像質排序由好到差為:圖1(f),(b),(c),(e),(d)。同樣,另一組測試圖像的質量排序為:圖1(f'),(b'),(c'),(e'),(d'),而 MSE 和 PSNR 方法對該組圖像的評價結果并不準確。SVD方法評價ence Edition),2006,36(4):643-646.(in Chinese)
[16]TAUBMAN D S,MARCELLIN M W.JPEG2000:Image Compression Fundamentals,Standards,and Practice[M].Norwell:Kluwer,2001.