曾擁華, 馬均瑤, 黃朝燕, 冒智慧, 武婷婷
(1. 陸軍工程大學(xué)野戰(zhàn)工程學(xué)院, 江蘇 南京 210007; 2. 南京郵電大學(xué)通信與信息工程學(xué)院,江蘇 南京 210023; 3. 南京郵電大學(xué)理學(xué)院, 江蘇 南京 210023)
圖像在數(shù)字化和傳輸過程中容易受到成像設(shè)備和外部環(huán)境噪聲干擾的影響,導(dǎo)致圖像在采集和傳輸?shù)倪^程中產(chǎn)生退化。噪聲干擾造成圖像退化不可避免,但在實(shí)際的生活中,人們期望獲取具有高分辨率的逼真原圖像,產(chǎn)生了圖像去噪問題。圖像去噪是圖像處理的基本任務(wù)之一[1],在諸多領(lǐng)域都有著廣泛的應(yīng)用,如大多數(shù)智能手機(jī)照相功能都運(yùn)用了一些去噪算法[2]。
經(jīng)典的加性零均值高斯白噪聲干擾彩色圖像的問題可以描述為一個(gè)干凈的圖像受到加性零均值高斯白噪聲的干擾。圖像去噪的任務(wù)主要是設(shè)計(jì)一個(gè)有效的算法以便于移除噪聲圖像中的高斯白噪聲,得到與干凈圖像盡可能相似的圖像。
圖像去噪是一個(gè)經(jīng)典的反問題,研究者基于稀疏代表元先后采用稀疏自適應(yīng)濾波器[3-5]、偏微分方程法[6-8]、統(tǒng)計(jì)估計(jì)法[9-11]等方法對(duì)圖像去噪問題進(jìn)行了研究,證明了疏代表元(也稱字典學(xué)習(xí))理論對(duì)于圖像去噪稀的可行性。傳統(tǒng)的稀疏圖像模型[12]對(duì)圖像RGB通道用3個(gè)實(shí)向量分別表示或?qū)?個(gè)實(shí)向量進(jìn)行結(jié)合表示。文獻(xiàn)[13]構(gòu)建了一些應(yīng)用于灰度圖像的稀疏模型并取得了相當(dāng)不錯(cuò)的成果。文獻(xiàn)[10]將所有圖像用隨機(jī)字典的一些元素線性表示,建立了稀疏模型。文獻(xiàn)[14]用四元數(shù)矩陣對(duì)彩色圖像進(jìn)行了表示,建立了相應(yīng)的四元數(shù)模型。
傳統(tǒng)的圖像去噪方法,將彩色圖像視為矢量或單色圖像的組合,并完全忽略固有的顏色結(jié)構(gòu),使得復(fù)原圖像中含有一定的彩色偏移點(diǎn),降低復(fù)原圖像質(zhì)量。在本文提出的用四元數(shù)矩陣仿真彩色圖像模型中,彩色圖像中每個(gè)像素都能編碼成單一的四元數(shù)單元,而不是將RGB通道單獨(dú)編碼。在四元數(shù)的特殊計(jì)算規(guī)則下,該方法相比于傳統(tǒng)去噪方法能很好地保存彩色圖像RGB通道之間的內(nèi)部聯(lián)系。此外,字典學(xué)習(xí)模型可以更有效地逼近噪聲圖像,通過對(duì)圖像進(jìn)行降維,在保留圖像中主要信息的同時(shí)降低噪聲干擾。使用圖像塊更新字典的方法可以在最大程度上除去圖像中含有的高斯白噪聲。鑒于兩者的優(yōu)勢(shì),本文聯(lián)合四元數(shù)和字典學(xué)習(xí)模型對(duì)彩色圖像去噪問題展開研究。
四元數(shù)[15]一般表示為如下形式:
(1)
式中:a0,a1,a2,a3都是實(shí)數(shù);i,j,k是基本四元數(shù)單元。i,j,k滿足四元數(shù)法則:
i2=j2=k2=ijk=-1
(2)
然而四元數(shù)不滿足交換律,因?yàn)樵谒脑獢?shù)中ij=k, 而ji=-k。
(3)
則
(4)
(5)
(6)
四元數(shù)向量和矩陣的范數(shù)定義如下。
四元數(shù)矩陣奇異值分解(quaternion matrix singular value decomposition, QSVD)由文獻(xiàn)[16]首次提出,定義如下。
圖像去噪有許多方法,其中是基于字典學(xué)習(xí)和稀疏編碼的方法較為流行[17-18]。許多圖像都有如下性質(zhì)[19]:圖像Y∈Rm×n在字典D∈Rm×k上是稀疏的,并且可以找到稀疏系數(shù)矩陣A∈Rk×n使得Y=DA(或者Y≈DA)。假設(shè)在字典D能稀疏表示Y,當(dāng)D復(fù)原后,就能通過解決如下式子來復(fù)原圖像:
(7)
式中:ε≥0是一個(gè)有關(guān)于噪聲水平的參數(shù)。運(yùn)用式(7)解出稀疏系數(shù)矩陣A后,可由DA復(fù)原圖像。常用的字典主要有完備小波[20]、離散余弦變換[21]等。然而,上述字典均為固定字典,不能準(zhǔn)確表示彩色圖像,可學(xué)習(xí)的字典可以更好地表示彩色圖像,更有利于提高圖像復(fù)原質(zhì)量[22]。常見的學(xué)習(xí)字典主要有K均值聚類奇異值分解(K-means clustering singular value decomposition, K-SVD)[23],最優(yōu)方向法(method of optimal direction, MOD)[24]和在線字典學(xué)習(xí)法(online dictionary learning method, OLM)[25]。綜合考慮模型的簡(jiǎn)單性和修復(fù)圖像的質(zhì)量,K-SVD算法是非常有效的[26]。K-SVD算法可由如下模型表示:
(8)
通過對(duì)查字典得出的結(jié)果與原始樣本之間的差進(jìn)行最小化處理,從而盡可能的還原出原始樣本。可由QOMP(quaternion orthogonal matching pursuit)[27]和Lasso[28](least absolute shrinkage and selection operation) 算法解決這一問題。字典學(xué)習(xí)的研究對(duì)應(yīng)的典型算法主要有3個(gè)方面[29]: ① 概率學(xué)習(xí)方法;② 基于矢量化或聚類的學(xué)習(xí)方法;③ 特殊結(jié)構(gòu)的字典學(xué)習(xí)。這種結(jié)構(gòu)通常由數(shù)據(jù)結(jié)構(gòu)的先驗(yàn)驅(qū)動(dòng),或者由訓(xùn)練的字典目標(biāo)驅(qū)動(dòng)。通過字典和相應(yīng)的稀疏編碼可有效修復(fù)彩色噪聲圖像。
(9)
(10)
字典學(xué)習(xí)法:
(11)
(12)
將式(12)分為兩個(gè)子問題進(jìn)行求解得出
(13)
結(jié)合式(11)~式(13),算法具體步驟如下。
重復(fù)步驟1~步驟3直到達(dá)到指定的迭代步數(shù)或者收斂到指定的誤差。
為驗(yàn)證本文利用基于純四元數(shù)字典學(xué)習(xí)的彩色圖像去噪模型的有效性,使用數(shù)據(jù)集Kodak提供的圖像進(jìn)行數(shù)值實(shí)驗(yàn),并將本文提出的模型純四元數(shù)稀疏代表元(pure quaternion with sparse representation, pQS)與K-SVD[23]和K-QSVD[14]兩種現(xiàn)有的模型進(jìn)行比較。
首先對(duì)圖1所展示出來的10張彩色圖像進(jìn)行處理,每張圖的左下角為圖像編號(hào)。圖像1~圖像8是512×768的彩色圖像,圖像9和圖像10是768×512的彩色圖像。實(shí)驗(yàn)中使用的圖像如圖1所示。
本文采用的噪聲方式是高斯加性白噪聲。使用本文提出的模型對(duì)加噪聲后產(chǎn)生的噪聲圖像去噪。為了說明本文提出的模型的有效性,將本文實(shí)驗(yàn)與文獻(xiàn)[23]和文獻(xiàn)[14]實(shí)驗(yàn)進(jìn)行對(duì)比,結(jié)果如圖2所示。
圖2 原始圖像3及其在3種模型下去噪的局部放大圖對(duì)比(σ=25)Fig.2 Comparison of the original image 3 and its local enlarged images for denoising in three models (σ=25)
圖2(a)是清晰的圖像,圖2(b)是局部放大圖像,圖2(c)是加高斯噪聲后的圖像,其中σ=25,圖2(d)是K-SVD模型修復(fù)的噪聲圖像,圖2(e)是K-QSVD模型修復(fù)的噪聲圖像,圖2(f)是本文提出的pQS模型修復(fù)圖像的結(jié)果。結(jié)果表明:本文提出的模型相比于K-SVD模型和K-QSVD模型能更好地抑制噪聲和保存圖像結(jié)構(gòu)信息。
在圖3和圖4中,圖3(a)和圖4(a)是清晰的圖像,圖3(b)和圖4(b)是局部放大圖像,圖3(c)和圖4(c)是加高斯噪聲后的圖像,其中σ=35,圖3(d)和圖4(d)是K-SVD模型修復(fù)的噪聲圖像,圖3(e)和圖4(e)是K-QSVD模型修復(fù)的噪聲圖像,圖3(f)和圖4(f)是本文提出的pQS模型修復(fù)圖像的結(jié)果,通過對(duì)比局部放大部位。結(jié)果表明:本文得到的去噪圖像具有更加清晰的圖像紋理,一定程度上改善了去噪圖像的細(xì)節(jié)。
圖3 原始圖像5及其在3種模型下去噪的局部放大圖對(duì)比(σ=35)Fig.3 Comparison of the original image 5 and its local enlarged images for denoising in three models (σ=35)
圖4 原始圖像10及其在3種模型下去噪的局部放大圖對(duì)比(σ=35)Fig.4 Comparison of the original image 10 and its local enlarged images for denoising in three models (σ=35)
圖5(a)是清晰的圖像,圖5(b)是局部放大圖像,圖5(c)是加高斯噪聲后的圖像,其中σ=50,圖5(d)是K-SVD模型修復(fù)的噪聲圖像,圖5(e)是K-QSVD模型修復(fù)的噪聲圖像,圖5(f)是本文提出的pQS模型修復(fù)圖像的結(jié)果。結(jié)果表明:本文提出的模型相比于K-SVD模型和K-QSVD模型不僅能夠更好地抑制噪聲,而且能更好地體現(xiàn)圖像細(xì)節(jié)。
圖5 原始圖像6及其在3種模型下去噪的局部放大圖對(duì)比(σ=50)Fig.5 Comparison of the original image 6 and its local enlarged images for denoising in three models (σ=50)
為了客觀的對(duì)去噪結(jié)果進(jìn)行比較,本文選擇以下量化評(píng)價(jià)指標(biāo)對(duì)其進(jìn)行評(píng)價(jià)[30]:結(jié)構(gòu)相似度 (structural simila-rity index measure, SSIM)和峰值信噪比(peak signal to noise ratio, PSNR),定義如下:
由表1~表3可以看出,在噪聲水平分別為σ=25、σ=35、σ=50的情況下,利用本文模型的去噪圖像的PSNR比K-SVD模型和K-QSVD模型修復(fù)的圖像高,相對(duì)誤差也有一定的優(yōu)勢(shì),因此可以從數(shù)值的角度證明本文所提出的模型可以得到更好的復(fù)原圖像?;趫D2~圖5以及表1~表3的分析,證明了本文提出的pQS模型能更好地?cái)M合圖像,同時(shí)有效提高了修復(fù)圖像的質(zhì)量。
表1 σ=25時(shí)不同模型的SSIM和PSNR值
表2 σ=35時(shí)不同模型的SSIM和PSNR值
續(xù)表2
表3 σ=50時(shí)不同模型的SSIM和PSNR值
本文用四元數(shù)矩陣表示彩色圖像,即用四元數(shù)矩陣的3個(gè)虛部表示彩色圖像的RGB 3個(gè)通道,可以更好地將彩色圖像與提出的模型擬合。利用稀疏表示的字典學(xué)習(xí)法模型對(duì)模糊的圖像進(jìn)行逼近,使用圖像塊更新字典的方法,在最大程度上除去圖像中含有的高斯白噪聲。同時(shí),本文利用K-QSVD算法高效快速地解出所提出模型的解。數(shù)值實(shí)驗(yàn)表明了本文模型及算法的有效性,本文所提出的模型不僅有效地解決了含噪聲彩色圖像的去噪問題,還很好地?cái)M合了彩色圖像,提高了復(fù)原圖像的質(zhì)量。