李紅芳
摘要:數(shù)字圖像在實(shí)際的應(yīng)用中會(huì)引入各種各樣的失真,識(shí)別接受圖像的是人的眼,所以圖像質(zhì)量的評(píng)價(jià)結(jié)果必須要與人眼的視覺效果相吻合。隨著對(duì)人眼視覺系統(tǒng)的研究的不斷深入與提高,研究人員根據(jù)HVS的特性建立圖像質(zhì)量評(píng)價(jià)模型來,這種模型大大的提高了圖像質(zhì)量主觀評(píng)價(jià)和客觀評(píng)價(jià)的一致性。文章詳細(xì)地介紹了PSNR、SSIM、MSSIM、IFC、VIF、FSlM等幾種典型的全參考圖像質(zhì)量評(píng)價(jià)方法分析探討圖像質(zhì)量評(píng)價(jià)研究的發(fā)展趨勢(shì)。關(guān)鍵詞:結(jié)構(gòu)相似度(SSIM);梯度加權(quán);視覺掩蓋效應(yīng)
1引言
隨著通信技術(shù)的飛速發(fā)展,“數(shù)字”逐漸成為時(shí)代“寵兒”,在今后的發(fā)展中,數(shù)字化必將成為一種常態(tài)化技術(shù),其應(yīng)用也將更加廣泛。長期以來,人類依托圖像獲取有價(jià)值信息,圖像信息技術(shù)得以廣泛應(yīng)用,然而,圖像在一系列處理過程中,極易因方式方法的不完備,造成圖像失真或降質(zhì),這些失真或降質(zhì)影射在人類視觀上就是圖像質(zhì)量的改變。列舉一個(gè)簡(jiǎn)單的例子,比如公司的指紋識(shí)別系統(tǒng),假如之前錄入系統(tǒng)的指紋是清晰的,在下次打卡的時(shí)候假如手指上沾染了墨漬之類的模糊物品,那么指紋識(shí)別系統(tǒng)是否還能再與原錄入指紋對(duì)比的情況下識(shí)別該指紋?類似于這樣的問題在人們的生活中有很多,等待著全參考圖像質(zhì)量的評(píng)價(jià)方法去解決并將之應(yīng)用于實(shí)踐中。因此,圖像質(zhì)量的合理評(píng)估具有非常重要的應(yīng)用價(jià)值。
圖像質(zhì)量評(píng)價(jià)應(yīng)用極為廣泛:(1)對(duì)圖像質(zhì)量的狀況進(jìn)行動(dòng)態(tài)檢測(cè)和調(diào)整。比如,圖像視頻時(shí),利用評(píng)價(jià)模型獲得圖像質(zhì)量,反映當(dāng)前視頻的質(zhì)量效果,進(jìn)而進(jìn)行合理調(diào)節(jié),獲取最佳視頻效果。(2)對(duì)圖像處理技術(shù)性能進(jìn)行快速評(píng)估,也可適用于不同方案的圖像處理技術(shù)性能比較。
就圖像系統(tǒng)來說,對(duì)圖像失真程度的定量描述(即對(duì)圖像質(zhì)量的評(píng)價(jià))至關(guān)重要,它可以直接管理、控制和提高圖像質(zhì)量。深入研究圖像質(zhì)量評(píng)價(jià)方法,能為圖像后期處理提供更加準(zhǔn)確的技術(shù)支持,對(duì)圖像處理技術(shù)的發(fā)展和應(yīng)用來說意義重大。
2全參考圖像質(zhì)量評(píng)價(jià)方法發(fā)展
現(xiàn)代應(yīng)用中,利用原始圖像的全部信息,計(jì)算失真圖像與原始圖像間的誤差,并通過綜合誤差進(jìn)而獲取對(duì)失真圖像質(zhì)量綜合評(píng)價(jià)的方法,稱之為全參考型圖像質(zhì)量評(píng)價(jià)方法。全參考型評(píng)價(jià)方法是當(dāng)前最值得信任的質(zhì)量評(píng)價(jià)方法。
全參考圖像質(zhì)量評(píng)價(jià)需要原始圖像,經(jīng)過數(shù)十年的發(fā)展已經(jīng)形成了較為完整的理論體系和成熟的評(píng)價(jià)框架。將待評(píng)價(jià)的圖像信號(hào)的質(zhì)量可以通過與原圖像的信號(hào)做對(duì)比之后所獲取的誤差信號(hào)來分析,圖像質(zhì)量的下降與誤差信號(hào)的強(qiáng)弱有關(guān)。
最原始的圖像質(zhì)量評(píng)價(jià)方法就是峰值信噪比(PSNR)和均方差(MSE)。MSE和PSNR這2種方法易于計(jì)算,容易實(shí)現(xiàn),但是MSE沒有利用圖像像素之間的相關(guān)性,和人眼感知到的數(shù)值相差較大。因而,人們基于HVS提出了很多客觀質(zhì)量評(píng)價(jià)方法來提高和主觀評(píng)價(jià)的一致性。其中典型代表有Sarnoff提出的JND(Just Noticeable Difference)模型以及Stefan Winkler提出的PDM(Perceptual DistortionMetric)模型,這些模型很好的將人眼視覺合并為一個(gè)簡(jiǎn)單的算法,由于當(dāng)時(shí)的技術(shù)發(fā)展的局限性,HVS系統(tǒng)的一些理論尚未成熟。目前新的主流的全參考圖像質(zhì)量評(píng)價(jià)方法在2002年由Zhou Wang等人提出——結(jié)構(gòu)相似度(SSIM),它有效模擬了人眼提取視覺場(chǎng)景中結(jié)構(gòu)信息的能力,大量實(shí)驗(yàn)證明SSIM的評(píng)價(jià)性能優(yōu)于PSNR及MSE,引領(lǐng)圖像質(zhì)量的評(píng)價(jià)走進(jìn)了新的領(lǐng)域。SSIM現(xiàn)在已經(jīng)成為了應(yīng)用最廣泛的評(píng)價(jià)方法,但是這個(gè)方法對(duì)于模糊圖像的質(zhì)量評(píng)價(jià)存在缺陷,這極大的限制了它的實(shí)際應(yīng)用。近年來國內(nèi)外很多研究人員對(duì)SSIM算法進(jìn)行了改進(jìn),例如葉盛楠等人做出對(duì)結(jié)構(gòu)信息的新解釋,提出了基于結(jié)構(gòu)信息提取(structural InformationExtraction)的評(píng)價(jià)方法;Santiago Aja-Fernandez等人在SSIM的基礎(chǔ)上提出了基于局部對(duì)比度的質(zhì)量評(píng)價(jià)方法(QILV),圖1為SSIM結(jié)構(gòu)相似度模型的系統(tǒng)框圖。
2006年,Hamid Sheikh~I(xiàn)FC的基礎(chǔ)上,提出了一種新的模型VIF(Visual Information Fidelity Fidelity),他從信息通信和共享的角度來解決圖像質(zhì)量評(píng)估問題。
對(duì)比所有算法,VIF算法無疑表現(xiàn)最好,它在評(píng)價(jià)快速蛻變、高斯模糊、高斯白噪聲、JPEG失真、JPEG2000失真以及其他失真的表現(xiàn)上都要好于其他算法,但是,VIF算法也是目前的所有算法中復(fù)雜度最高的,因此,實(shí)用性就不如SSIM強(qiáng)。
3結(jié)語
全參考圖像質(zhì)量評(píng)價(jià)方法的優(yōu)點(diǎn)是:準(zhǔn)確性高、最可靠、最可行;缺點(diǎn)是:在實(shí)際應(yīng)用中,對(duì)原始圖像的依賴程度太高,而原始圖像大多數(shù)情況下不容易獲取,而且存儲(chǔ)和傳輸過程中的數(shù)據(jù)量較大,這就限制了其在許多領(lǐng)域中的應(yīng)用。