錢 沖,常冬霞
1.北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044
2.北京交通大學(xué) 信息科學(xué)研究所,北京 100044
圖像去噪是計(jì)算機(jī)視覺中的經(jīng)典問題之一,眾多學(xué)者針對(duì)該問題已經(jīng)展開了廣泛研究。在現(xiàn)實(shí)生活中,圖像在采集和傳輸過程中不可避免地會(huì)產(chǎn)生噪聲,在進(jìn)行各種圖像處理前去除圖像噪聲是必不可少的步驟。稀疏作為自然圖像的最重要特征之一[1],被成功應(yīng)用于圖像去噪[2]問題。
傳統(tǒng)的基于稀疏表示的圖像處理,往往采用一個(gè)過完備字典將圖像塊編碼為該字典的稀疏線性組合,并采用稀疏編碼和字典學(xué)習(xí)交替進(jìn)行[3-4]?;贙奇異值分解(K-singular value decomposition,K-SVD)的去噪方法[5]是一個(gè)經(jīng)典的基于稀疏表示的圖像去噪算法,具有較好的去噪效果。然而在K-SVD中,字典學(xué)習(xí)是一個(gè)大規(guī)模的非凸問題,具有較高的計(jì)算復(fù)雜度。此外,稀疏編碼過程往往采用非線性估計(jì),往往具有不穩(wěn)定、不精確等問題[6]。因此,為了改善其性能,文獻(xiàn)[7]提出了基于稀疏變換學(xué)習(xí)的圖像去噪算法。稀疏變換學(xué)習(xí)[8-9]使用一個(gè)變換矩陣將圖像信號(hào)近似稀疏化,大大減少了字典學(xué)習(xí)的計(jì)算量并獲得了較為精確的稀疏編碼。
除稀疏表示外,其他方法也能很好地進(jìn)行圖像去噪。非局部自相似性是自然圖像的顯著特征之一,它認(rèn)為圖像的紋理和結(jié)構(gòu)在一定區(qū)域內(nèi)是重復(fù)出現(xiàn)的。非局部均值算法[10]首次利用圖像的非局部自相似性來去除圖像噪聲,在去噪的同時(shí)盡可能保留圖像的細(xì)節(jié)。然而,該算法存在參數(shù)非自適應(yīng)且去噪后邊緣易模糊的缺點(diǎn),針對(duì)這些問題提出了一系列基于非局部自相似性的圖像恢復(fù)算法[11-13]。其中,塊匹配3D濾波(block-matching and 3D filtering,BM3D)去噪算法[14]由于其出色的去噪性能,成為目前最先進(jìn)的方法之一。此外,為了在去噪的同時(shí)更好地保持圖像的幾何結(jié)構(gòu),很多學(xué)者提出了基于圖的去噪算法[15]?;诤讼嗨贫群蛨D拉普拉斯矩陣,KSID(kernel similarity-based image denoising)算法[16]設(shè)計(jì)了一個(gè)新的損失函數(shù),在圖像去噪和去模糊上都取得了較好的結(jié)果。而文獻(xiàn)[17]將圖拉普拉斯矩陣的特征向量作為一組基函數(shù)來重建圖像。為了從理論上對(duì)基于圖的去噪算法進(jìn)行解釋分析,OGLR(optimal graph laplacian regularization)算法[18]將圖拉普拉斯正則化解釋為連續(xù)域的各向異性擴(kuò)散格式,并推導(dǎo)出最優(yōu)的度量空間,進(jìn)而計(jì)算出最優(yōu)的邊緣權(quán)值,從而得到離散域去噪的最優(yōu)圖拉普拉斯正則化器?;诖耍墨I(xiàn)[19]提出了將最優(yōu)圖拉普拉斯正則化器與稀疏學(xué)習(xí)相結(jié)合的去噪算法,但其計(jì)算復(fù)雜度高且并未考慮圖像的非局部信息。
近年來,很多學(xué)者提出了將圖像的稀疏性和非局部自相似性結(jié)合的圖像去噪算法[20-21]。文獻(xiàn)[22]提出相似的圖像塊在稀疏分解中具有相似的稀疏編碼,但是該算法過于強(qiáng)調(diào)稀疏系數(shù)沿行方向?qū)R,使得相似圖像塊向量組成的矩陣行空間和列空間稀疏度不一致。為了恢復(fù)行與列空間之間稀疏度的對(duì)稱性,文獻(xiàn)[23]通過引入一個(gè)右乘矩陣,將lp,q范數(shù)約束下的聯(lián)合稀疏問題轉(zhuǎn)化為具有核范數(shù)約束的低秩問題,簡(jiǎn)化了優(yōu)化過程,但是時(shí)間和空間復(fù)雜度較高。由于稀疏變換學(xué)習(xí)計(jì)算量小且能獲得較為準(zhǔn)確的稀疏編碼,因此文獻(xiàn)[24]提出了一種基于稀疏變換學(xué)習(xí)和非局部低秩的圖像去噪算法STROLLR(sparsifying transform learning and low-rank),該算法求解步驟簡(jiǎn)單且去噪性能良好。然而,該算法將圖像劃分成相互重疊的圖像塊并為其添加低秩和稀疏約束,大大破壞了圖像的結(jié)構(gòu)特征。
針對(duì)STROLLR模型沒有考慮圖像空間幾何信息的問題,通過引入圖拉普拉斯正則化,提出了一個(gè)圖拉普拉斯正則化稀疏變換學(xué)習(xí)圖像去噪算法GLRSTL(graph Laplacian regularized sparse transform learning)。采用圖拉普拉斯矩陣對(duì)圖像的底層結(jié)構(gòu)進(jìn)行編碼,在去噪的同時(shí)保護(hù)圖像的結(jié)構(gòu)細(xì)節(jié)不被破壞。此外,由于STROLLR模型在進(jìn)行低秩估計(jì)時(shí),需要通過塊匹配操作來獲得相似的圖像塊組,并為其添加低秩約束,而在有噪聲情況下,只使用歐式距離來度量圖像塊之間的相似度是不準(zhǔn)確的。為了獲得更準(zhǔn)確的相似圖像塊,在塊匹配操作中引入優(yōu)化的稀疏編碼來度量圖像塊間的相似性。實(shí)驗(yàn)結(jié)果表明,所提算法在改善視覺效果的同時(shí),獲得了較高的峰值信噪比(peak signal to noise ratio,PSNR)和結(jié)構(gòu)相似指數(shù)(structural similarity index,SSIM)。
圖拉普拉斯矩陣將圖像表示為一個(gè)定義在離散加權(quán)圖上的函數(shù),頂點(diǎn)為圖像的像素值,每個(gè)像素通過加權(quán)邊與其他像素連接,邊權(quán)重反映了像素點(diǎn)間的相關(guān)性。因此,邊權(quán)重的定義是構(gòu)造圖拉普拉斯矩陣的關(guān)鍵步驟。傳統(tǒng)的圖拉普拉斯矩陣根據(jù)像素值確定邊權(quán)重,然而在噪聲圖像中,噪聲的存在會(huì)使其魯棒性較差。文獻(xiàn)[18]提出了一種基于最優(yōu)度量空間的權(quán)值定義方法。該方法利用非局部自相似像素塊的梯度、像素值以及像素的二維坐標(biāo)為像素定義了一個(gè)新的特征描述,根據(jù)此特征獲得魯棒性更強(qiáng)的邊權(quán)重。鑒于該特征描述的優(yōu)越性,在提出的GLRSTL算法中采用該特征描述來計(jì)算邊權(quán)重。接下來對(duì)圖拉普拉斯矩陣的構(gòu)造過程進(jìn)行詳細(xì)介紹。
其中,ε和r的設(shè)置參考文獻(xiàn)[18]。因此,鄰接矩陣N(i,j)=wij,度矩陣圖拉普拉斯矩陣為:
圖像中的每個(gè)圖像塊都有對(duì)應(yīng)的圖拉普拉斯矩陣。這種圖拉普拉斯矩陣構(gòu)造方法考慮了像素值的相似和空間上的相近,前者保證了圖像的局部光滑,后者保證了圖像的空間結(jié)構(gòu)。
令y=x+e表示噪聲圖像,其中e表示均值為0,方差為σn的加性高斯白噪聲。圖像去噪的目的就是從噪聲圖y中盡可能準(zhǔn)確地恢復(fù)干凈圖像x。針對(duì)STROLLR模型在去噪時(shí)沒有考慮圖像的局部幾何結(jié)構(gòu)的問題,提出了一種圖拉普拉斯正則化稀疏變換學(xué)習(xí)圖像去噪算法GLRSTL。通過引入圖拉普拉斯建立像素點(diǎn)和像素點(diǎn)間的關(guān)系,保護(hù)圖像的局部結(jié)構(gòu)。此外,為了更有效地利用圖像的非局部信息,在距離度量中結(jié)合了優(yōu)化后的稀疏編碼,獲得較好的塊匹配結(jié)果。
對(duì)于噪聲圖像y,其圖像塊向量表示為Y∈Rb×n,即Y=[y1,y2,…,yn]。與傳統(tǒng)的稀疏表示算法不同,在稀疏變換學(xué)習(xí)中,Y在稀疏變換矩陣W∈Rb×b的作用下可以近似稀疏,即WY=A+E,其中A∈Rb×n表示稀疏編碼矩陣,E∈Rb×n表示建模誤差。假設(shè)噪聲信號(hào)Y待恢復(fù)的信號(hào)為X∈Rb×n,即X=[x1,x2,…,xn],那么可以通過最小化||WX-A||2F來獲得去噪信號(hào)X。稀疏變換學(xué)習(xí)利用局部圖像塊的稀疏先驗(yàn)來進(jìn)行圖像去噪,而除了局部結(jié)構(gòu)外,自然圖像還包含自相似性形式的非局部結(jié)構(gòu)。對(duì)于每個(gè)圖像塊向量yi,通過塊匹配操作可以找到K個(gè)與其相似圖像塊向量并構(gòu)成一個(gè)組Vi∈Rb×K,Vi具有低秩特性,這就是基于圖像非局部結(jié)構(gòu)的低秩先驗(yàn)。STROLLR算法充分利用自然圖像的局部稀疏性和非局部自相似性,結(jié)合稀疏變換學(xué)習(xí)和非局部低秩先驗(yàn),獲得了良好的去噪性能。但其忽略了自然圖像的空間結(jié)構(gòu)特性,因此,為了保護(hù)圖像的內(nèi)在結(jié)構(gòu)信息,提出了GLRSTL算法,通過引入圖拉普拉斯正則項(xiàng)來對(duì)鄰域關(guān)系進(jìn)行約束,從而保護(hù)圖像的局部結(jié)構(gòu)關(guān)系。算法模型如下:
其中,γs、γl、γf、θ和λ表示正則化參數(shù),rank(·)表示矩陣的秩,Pi∈Rb×K表示組Vi的低秩估計(jì),xi∈Rb表示待恢復(fù)的干凈圖像塊,xTi表示xi的轉(zhuǎn)置矩陣,Li∈Rb×b表示圖像塊yi的歸一化圖拉普拉斯矩陣。
在構(gòu)建組Vi時(shí),進(jìn)行塊匹配操時(shí)通常采用歐氏距離度量圖像塊之間的相似性,然而由于隨機(jī)噪聲的存在,該度量方法容易產(chǎn)生偏差,進(jìn)而影響去噪效果。因此,提出了一種新的度量方法。相似的圖像塊通常具有相似的稀疏編碼,而優(yōu)化后的稀疏編碼由于去除了部分噪聲的影響可以更加準(zhǔn)確地反映圖像塊間的相似性。去噪前的圖像雖然含有噪聲,但是含有大量圖像細(xì)節(jié)。因此,采用優(yōu)化后的稀疏編碼和像素值的歐氏距離相結(jié)合的方法來度量圖像塊間的相似性:
采用簡(jiǎn)單的塊坐標(biāo)下降法[25]對(duì)算法進(jìn)行求解,每次沿一個(gè)方向優(yōu)化獲取最小值,因此目標(biāo)函數(shù)式(7)的優(yōu)化可以轉(zhuǎn)化為求解以下四個(gè)子問題:
具體求解上述四個(gè)子問題的方法如下:(1)W^—子問題求解
式(9)是優(yōu)化稀疏變換矩陣W的目標(biāo)函數(shù)式,它是一個(gè)有正交約束的lF范數(shù)優(yōu)化問題。在求解的過程中,固定A和X。式(9)可以變換為:
令Z=GTWS,可知Z是一個(gè)正交矩陣,因此|Zij|≤1,?i,j且可以推斷出:
式(16)中等號(hào)成立的條件為:
因此,式(17)為稀疏變換矩陣W最終的優(yōu)化結(jié)果。
(2)—子問題求解
式(10)是稀疏編碼矩陣A的目標(biāo)函數(shù)式,這是一個(gè)標(biāo)準(zhǔn)的稀疏編碼問題,可以采用硬閾值方法求解。根據(jù)文獻(xiàn)[26],可得式(10)的解為:
(3)—子問題求解
式(11)為低秩估計(jì)矩陣Pi的目標(biāo)函數(shù)式。根據(jù)文獻(xiàn)[13],可以得到最優(yōu)解為:
(4)—子問題求解
式(12)為圖像塊向量恢復(fù)的目標(biāo)函數(shù)式,xi所對(duì)應(yīng)的稀疏編碼為ai。在對(duì)稀疏編碼矩陣A、稀疏變換矩陣W和組低秩估計(jì)矩陣Pi進(jìn)行更新后,可以對(duì)每個(gè)圖像塊向量進(jìn)行重構(gòu)。將式(12)對(duì)xi求導(dǎo),并令其為0可得:
綜上,所提GLRSTL算法如下所示。
為了驗(yàn)證所提算法的有效性,通過實(shí)驗(yàn)對(duì)所提GLRSTL與K-SVD[5]、BM3D[14]、KSID[16]、OGLR[18]和STROLLR[24]進(jìn)行對(duì)比。實(shí)驗(yàn)中采用圖1所示的五幅大小為256×256的灰度圖像作為測(cè)試圖像,并采用PSNR和SSIM作為去噪質(zhì)量的評(píng)價(jià)指標(biāo)。實(shí)驗(yàn)中,圖像塊大小b=8,搜索窗大小S=40,每個(gè)組圖像塊個(gè)數(shù)K=60。參考文獻(xiàn)[24],γf=1/σn,γs=2.5σn。由于所提算法采用式(8)度量圖像塊間的相似性以獲得更好的低秩估計(jì),因此,對(duì)于與低秩估計(jì)有關(guān)的參數(shù)γl,和θ,通過遍歷尋優(yōu)的方法進(jìn)行選取,最終確定γl=3.5σn,θ=2σn。正則化參數(shù)λ,則采用偏差準(zhǔn)則[27]來確定。
圖1 測(cè)試圖像Fig.1 Test images
首先對(duì)圖1所示的5幅測(cè)試圖像的去噪結(jié)果進(jìn)行比較。對(duì)測(cè)試圖像分別添加均值為0,方差為5、10、15、20、25、30的高斯白噪聲。表1和表2分別給出了不同噪聲水平下所有算法去噪后的PSNR值和SSIM值,表中粗體字體表示最優(yōu)值。由表1至表2的結(jié)果可知,GLRSTL算法性能優(yōu)于K-SVD、BM3D、KSID、STROLLR和OGLR算法,對(duì)測(cè)試圖像獲得了較高的PSNR和SSIM值。
表1 不同去噪方法對(duì)5幅測(cè)試圖像去噪的PSNR值Table 1 PSNR value of 5 test images with different denoising methods dB
表2 不同去噪方法對(duì)5幅測(cè)試圖像去噪的SSIM值Table 2 SSIM value of 5 test images with different denoising methods
為了從視覺效果上對(duì)五種算法進(jìn)行比較,圖2和圖3給出了對(duì)Lax和Satellite圖像去噪結(jié)果的細(xì)節(jié)對(duì)比。從圖中所示結(jié)果可見,相比其他算法,所提GLRSTL算法可以更好地保持圖像細(xì)節(jié)的特征,同時(shí)保證原始結(jié)構(gòu)不被破壞,得到清晰的邊緣和細(xì)節(jié),使去噪后的圖像獲得良好的視覺效果。具體來說,由圖2和圖3可見,對(duì)Lax圖像,GLRSTL算法恢復(fù)的圖像能夠較好地保護(hù)紋理細(xì)節(jié),特別是對(duì)右側(cè)黑色方塊結(jié)構(gòu)的恢復(fù)明顯優(yōu)于其他算法。而對(duì)于Satellite圖像,GLRSTL算法則較好地保留了馬路上的紋理,同時(shí)對(duì)房頂房檐等部分的恢復(fù)效果也較好。
圖2 不同方法對(duì)圖像Lax的去噪結(jié)果(σn=15)Fig.2 Denoising results of different methods on image Lax(σn=15)
圖3 不同方法對(duì)圖像Satellite的去噪結(jié)果(σn=20)Fig.3 Denoising results of different methods on image Satellite(σn=20)
為了進(jìn)一步驗(yàn)證所提GLRSTL相比STROLLR性能的改善,采用圖4(a)和(d)所示的圖像對(duì)兩個(gè)算法進(jìn)行對(duì)比。從圖4可以看出,STROLLR恢復(fù)出來的圖像在平滑區(qū)域含有大量偽影,在邊緣區(qū)域會(huì)變形,在紋理區(qū)域也會(huì)出現(xiàn)模糊現(xiàn)象。而GLRSTL由于考慮了圖像的空間幾何信息,對(duì)平滑區(qū)域的噪聲去除得更干凈,且能更好地保護(hù)邊緣結(jié)構(gòu),獲得更加清晰的紋理細(xì)節(jié)。
圖4 不同方法對(duì)測(cè)試圖像A、B的去噪結(jié)果Fig.4 Denoising results of different methods on test images A,B
前面采用五張測(cè)試圖像對(duì)算法的去噪性能進(jìn)行了定量和視覺效果對(duì)比,為了進(jìn)一步驗(yàn)證所提算法的性能,將上述五種算法對(duì)BSD68、BSD100和BSD300三個(gè)數(shù)據(jù)集進(jìn)行去噪,表3給出了各算法在三個(gè)數(shù)據(jù)集上的平均PSNR值,其中最佳結(jié)果用粗體標(biāo)記??梢钥闯觯诙鄰垐D片組成的數(shù)據(jù)集中,GLRSTL算法獲得了較好的性能。
表3 不同去噪方法對(duì)數(shù)據(jù)集去噪的PSNR值Table 3 PSNR value of datasets with different denoising methods dB
為了對(duì)比算法的運(yùn)行效率,表4給出了不同去噪算法在5張測(cè)試圖像上運(yùn)行時(shí)間的平均值,與STROLLR算法相比,GLRSTL由于需要構(gòu)建圖拉普拉斯矩陣,因此時(shí)間復(fù)雜度略有提高。由表4可見運(yùn)行時(shí)間增加并不顯著,而由去噪性能對(duì)比可見,GLRSTL算法的圖像局部結(jié)構(gòu)保持和去噪性能均優(yōu)于STROLLR算法。
表4 運(yùn)行時(shí)間對(duì)比Table 4 Comparison of running time
為了在圖像去噪的同時(shí)保護(hù)圖像的結(jié)構(gòu)信息不被破壞,維護(hù)相鄰像素點(diǎn)間的相似性關(guān)系,通過引入圖拉普拉斯正則,提出了一種圖拉普拉斯正則化稀疏變換學(xué)習(xí)的圖像去噪算法。此外,在度量圖像塊間相似度時(shí),不僅考慮了像素值的歐式距離,同時(shí)也考慮了優(yōu)化后的稀疏編碼,進(jìn)而可以找到更加準(zhǔn)確的組。在實(shí)驗(yàn)中,針對(duì)給定圖像數(shù)據(jù)在不同噪聲水平下驗(yàn)證了所提算法具有較好的去噪性能,獲得了較高的PSNR和SSIM值,并通過去噪后的圖像細(xì)節(jié)圖可見恢復(fù)后的圖像更好地保持了圖像的紋理細(xì)節(jié)及邊緣結(jié)構(gòu)特征,提高了圖像恢復(fù)的質(zhì)量。
然而,在噪聲較大時(shí)圖像細(xì)節(jié)破壞嚴(yán)重,往往無法獲得較優(yōu)的先驗(yàn)信息來構(gòu)造圖拉普拉斯矩陣,此時(shí),所提算法的性能還需要進(jìn)一步改善。因此,如何在強(qiáng)噪聲下獲得較好的圖像去噪效果是未來研究的重點(diǎn)。