胡占強,耿龍
(西華大學無線電管理技術(shù)研究中心,成都 610039)
基于相似圖像檢索與字典學習的圖像去噪算法
胡占強,耿龍
(西華大學無線電管理技術(shù)研究中心,成都610039)
圖像受到噪聲污染后常常影響我們對圖像所包含信息的理解,因此對圖像進行去噪處理是必不可少的步驟。噪聲的產(chǎn)生有很多種原因,而且噪聲的影響也多種多樣,事實上噪聲是沒辦法完全去除的,只能無限逼近原始圖像。根據(jù)噪聲的性質(zhì)和來源,一般可以分為加性噪聲、乘性噪聲、量化噪聲、椒鹽噪聲等。而圖像去噪方法的研究方向,一般跟處理方式的不同分為空間域去噪和變換域去噪[1-2]。
在空間域?qū)D像進行去噪方法是最常用的也是最直接的方法,此類方法大多是以像素值為基本運算單元進行處理的,處理的方法就是利用數(shù)學公式直接對像素值進行數(shù)學運算。例如,均值濾波、中值濾波和維納濾波[1]等。
變換域圖像去噪,也稱作頻率域圖像去噪。這一類方法的核心思想是,通過某種特定的變換后,把處理圖像從空間域變換到特定的變換域,然后對變換域中進行處理,最后對處理圖像的變換域進行“逆變換”,將其從現(xiàn)在所處的變換域重新還原到原來的空間域,從而達到圖像去噪的目的。該類方法比較多,效果也比空間域圖像去噪的方法好,是圖像去噪領(lǐng)域的研究熱點。例如,基于二維離散傅立葉變換的、基于小波變換的圖像去噪,以及其他一些方法[3-4]。
近年來除了空間域去噪和變換域去噪外,利用圖像的稀疏性去噪也成為了最近研究的熱點[5-6],例如Michael Elad和Michal Aharon提出的基于稀疏重建和字典學習的方法[7]。稀疏表示理論認為,含噪圖像信號由有效信號和噪聲兩部分組成。有效信號具有內(nèi)部的結(jié)構(gòu)特征而噪聲則表現(xiàn)為隨機性,不可預(yù)知性等,沒有穩(wěn)定的結(jié)構(gòu)特征。在對圖像噪聲的處理過程中過完備稀疏表示有著很好的穩(wěn)定性。因此,過完備稀疏表示被應(yīng)用到在圖像處理領(lǐng)域后得到了飛速發(fā)展,并在許多方面表現(xiàn)出了其獨特的優(yōu)勢。
我們主要在稀疏表示理論的基礎(chǔ)上,開展關(guān)于圖像稀疏去噪的研究,在第一節(jié)中我們介紹了與我們研究有關(guān)的稀疏表達的基本理論,SIFT特征,以及我們的圖像去噪算法。第二節(jié)為我們算法的實驗結(jié)果。
圖1 基于相似圖像檢索與字典學習的圖像去噪算法框架
1.1圖像的稀疏去噪與字典學習
稀疏表示問題可以簡單描述為,對于發(fā)送端的稀疏信號x進行稀疏編碼(稀疏分解)后得到測量值y然后在信道中傳送,在接收端收到測量值y信號后進行解碼(重構(gòu))得到信號x。
設(shè)x為稀疏信號,它包含N個元素,其非零元素的個數(shù)k定義為信號的稀疏度,定義Ψ為M×N的二維測量矩陣(M<N),y定義為長度是M的一維測量值。在欠定方程組y=Ψx的約束條件下已知測量值y和測量矩陣Ψ求解得到原始信號x,這個過程稱之為重構(gòu)。從數(shù)學角度上講壓縮感知問題就是,需要求解如下最優(yōu)化問題:其中的||x||0表示0范數(shù),指的就是向量x中元素的個數(shù)
信號的稀疏表示的本質(zhì)就是信號的某種變換,在某一特定空間下的某種基上用新的表示形式來表示信號,從而以一種更直接、更簡便的形式進行分析處理。信號變換的本質(zhì)就是通過不同視角,以不同方法去觀察、分析、認識某個信號。信號的稀疏表示就是在更加冗余的函數(shù)庫(過完備字典)中自適應(yīng)的選擇合適的基函數(shù)來表示信號。
圖像的超完備信號稀疏表示理論最早是1993年由Mallat所提出,在1996年,Bruno Olshausen等人指出自然圖像存在著稀疏的表示。由于壓縮感知模型(1)給出了信號x的稀疏表示的精確求解形式。然而在現(xiàn)實應(yīng)用中由于噪聲的存在,精確的稀疏表示往往并不能解決實際問題。對于加性噪聲一般用公式(2)表示,為此,引入了公式(3)逼近形式的稀疏表示:
α表示高斯白噪聲,ξ≧0表示容許的噪聲誤差。
對于y=Dx+α如何得到D(過完備字典)是稀疏表示理論的核心問題,不僅關(guān)系到圖像稀疏表示的有效性,同時也影響各種稀疏表示求解算法的性能,目前,學習方式大致分成兩類:一類是基于數(shù)學模型的構(gòu)造方式,另一類是基于樣本學習的構(gòu)造方式。該優(yōu)化的求解可以采用諸如匹配追蹤MP[8]、正交匹配追蹤OMP[10]、基追蹤BP[9]、梯度投影法GPSR[11]等算法。
1.2稀疏去噪模型
稀疏去噪過程分為過完備字典獲取和重構(gòu)兩部分,我們使用KSVD[12]算法通過學習獲取字典,使用OMP算法進行重構(gòu)。其具體的算法如下,自適應(yīng)字典的學習,使用噪聲圖像自身作為學習樣本,樣本小,字典學習速度快,獲取的字典對其他噪聲圖像去噪有時效果不理想,普適性差。
全局字典的學習,使用與噪聲圖像無關(guān)的自然圖像作為學習樣本進行輸入,樣本量大,學習時間長,雖然提高了普適性,但字典學習過程中沒有充分利用圖像的局部相關(guān)信息。
在自適應(yīng)字典學習的圖像去噪和全局字典學習的圖像去噪的基礎(chǔ)上我們通過添加圖像檢索匹配環(huán)節(jié)將噪聲圖像的局部信息加以利用,提出了自己的算法處理框架。
1.3使用SIFT進行圖像檢索
(1)尺度不變特征
在圖像檢索部分使用尺度不變特征轉(zhuǎn)換 (Scale-Invariant Feature Transform或SIFT)特征[13]是一種在多空間尺度中尋找極值點,并在極值點處提取出位置、尺度、旋轉(zhuǎn)不變量等信息并生成一個128維的特征描述算子,此算法由 David Lowe在1999年所發(fā)表,2004年完善總結(jié)。SIFT特征描述了圖像的局部特征,信息量豐富,即使圖像發(fā)生了旋轉(zhuǎn)縮放平移、拍攝角度不同、光照明暗不同、依然可以在海量特征數(shù)據(jù)庫中也能實現(xiàn)快速、準確的匹配,即使物體個數(shù)很少也可以產(chǎn)生大量的SIFT特征向量,并保持其特征的穩(wěn)定性獨特性,對于優(yōu)化的SIFT特征提取匹配算法可以達到實時處理的要求,此外SIFT特征與其他形式的特征向量組合在一起使用也很方便,而且很有效。因此被廣泛的應(yīng)用在各個領(lǐng)域,其中包括物體檢測與識別、手勢動作辨識、行人目標追蹤、3D建模、機器視覺,影像縫合等領(lǐng)域。
我們假設(shè)使用FI表示圖像I的SIFT特征,F(xiàn)I中的第i個特征元
vi是128位的特征描述符,xi=I(i,j)表示關(guān)鍵點的位置,si,oi分別表示尺度和方向。用Pi表示圖像I在fi處8×8的圖像塊,我們使用文獻[14]中的方法進行檢索。檢索得到N幅圖像集合Φ,把這N幅圖像應(yīng)用KSVD算法字典學習得到字典D,然后使用字典D和OMP算法進行最終的重構(gòu)去噪得到結(jié)果,即使用全局字典的學習方法進行去噪。
(2)使用DSIFT進行圖像塊檢索
如果固定SIFT的尺度和方向,對每個像素點計算其SIFT描述算子,于是我們得到了DSIFT(Dense SIFT)描述符:
s,o分別表示尺度和方向都固定不變,xi表示fdi的中心坐標。
DSIFT匹配算法,在圖像集合Φ對每一幅圖像進行滑動取塊并計算每個圖像塊的DSIFT特征,對預(yù)去噪得到的圖像進行類似的滑塊操作,我們使用歐氏距離里選取距離最小匹配度最高的圖像塊進行高頻補償。假設(shè)是一個DSIFT匹配對,則高頻補償后的圖像塊
Gn、Gs分別表示坐標調(diào)整和灰度值歸一化。
為了證明本文算法的有效性,我們以PSNR為衡量指標,衛(wèi)星灰度圖像為實驗圖像,分別添加方差為10、20、30的加性二維高斯白噪聲。如圖2(b)、圖3(b)、圖4(b)所示,隨著噪聲強度的增加圖像越來越模糊,信噪比PSNR也都有所下降,表1給出了幾種去噪方法對相同圖像的去噪結(jié)果。從中可以看出,本文的去噪算法在評價指標PSNR上好于其他算法,圖2是實驗結(jié)果,可以看出,從人眼的視覺效果的角度來看,我們的算法也表現(xiàn)出了較好的效果。
表1各個方法的去噪結(jié)果
圖2?。╝)不含噪聲的原始圖像,(b)人為添加噪聲后的圖像(sigma=10),(c)方法1(BLS-GSM)去噪后的結(jié)果,(d)方法2 (NonLocalMeans)去噪后的結(jié)果,(e)方法3(KSVD自適應(yīng)字典)去噪后的結(jié)果,(f)本文算法去噪后的結(jié)果。
圖3?。╝)不含噪聲的原始圖像,(b)人為添加噪聲后的圖像(sigma=20),(c)方法1(BLS-GSM)去噪后的結(jié)果,(d)方法2(NonLocalMeans)去噪后的結(jié)果,(e)方法 3(KSVD自適應(yīng)字典)去噪后的結(jié)果,(f)本文算法去噪后的結(jié)果。
圖4 (a)不含噪聲的原始圖像,(b)人為添加噪聲后的圖像(sigma= 30),(c)方法 1(BLS-GSM)去噪后的結(jié)果,(d)方法 2(NonLocalMeans)去噪后的結(jié)果,(e)方法3(KSVD自適應(yīng)字典)去噪后的結(jié)果,(f)本文算法去噪后的結(jié)果。
[1]何東健.數(shù)字圖像處理[M].電子科技大學出版社,2003.
[2]朱秀昌,劉峰,胡棟.數(shù)字圖像處理與圖像通信.北京郵電大學出版社,2002.
[3]Mallat S,Hwang W L.Singularity Detection and Processing with Wavelets[J].IEEE Transactions on Theory,1992,38(2):617-643.
[4]Gabor D.Theory of communication.Inst.Electr.Eng,1946,93(3):429-457.
[5]Rubinstein R,Peleg T,Elad M.Analysis K-SVD:a Dictionary-Learning Algorithm for the Analysis Sparse Model[J].Signal Processing,IEEE Transactions on,2013,61(3):661-677.
[6]張曉陽.基于K-SVD和殘差比的稀疏表示圖像去噪研究[D].重慶大學,2012.
[7]M.Aharon,M.Elad,A.Bruckstein.K-SVD:An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation[J].IEEE Trans.Signal Process.2006,54(11):4311-4322.
[8]MALLAT S,ZHANG Z.Matching Pursuit in a Time-Frequency Dictionary[J].IEEE Trans Signal Proc,1992,41:3397-3415.
[9]CHEN S S,DONOHO D L,SAUNDERS M A.Atomic Decomposition by Basis Pursuit[J].Soc Ind Appl Math Rev,2001,43(1):129-159.
[10]PATI Y C,REZAIIFAR R,KRISHNAPRASAD P S.Orthogonal Matching Pursuit:Recursive Function Approximation with Applications to Wavelet Decomposition Presented at the 27th Annu[M].Asilomar Conf Signals,Systems,and Computers,1993.
[11]FIQUEIREDO M A T,NOWAK R D,WRIGHT S.1.Gradient Projection for Sparse Reconstruction:Application to Compressed Sensing and Other Inverse Problem[J].IEEE J Selected Topic Signal Proc,2007,1(4):586-598.
[12]]M.Aharon,M.Elad,A.Bruckstein.K-SVD:An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation[J].IEEE Trans.Signal Process.2006,54(11):4311-4322
[13]D.Lowe.Distinctive Image Features from Scale-Invariant Keypoints[J].International Journal of Computer Vision,2004,60(2):91-110
[14]Z.Wu,Q.F.Ke,M.Isard,J.Sun.Bundling Features for Large Scale Partial-Duplicate Web Image Search[C].Proc.of IEEE Conference on Computer Vision and Pattern Recognition,2009:25-32
SIFT;Sparse De-Noising;Dictionary Learning
A Image Denoising Method Based on Similar Image Retrieval and Dictionary Learning
HU Zhan-qiang1,GENG Long1
(Center for Radio Administration&Technology Development,Xihua University,Chengdu 610039)
1007-1423(2016)03-0049-05
10.3969/j.issn.1007-1423.2016.03.012
胡占強(1989-),男,河南許昌人,碩士,在讀碩士研究生,研究方向為圖像處理與模式識別耿龍(1988-),男,山東梁山人,碩士,在讀碩士研究生,研究方向為圖像處理與模式識別
2015-11-26
2016-01-10
為了更好地分析與理解圖像,需對圖像進行去噪。提出一種基于相似圖像檢索與字典學習的圖像去噪方法。首先,為了提高圖像檢索的準確度,對噪聲圖像進行初始去噪提高信噪比;然后使用初始去噪圖像在圖片庫里進行基于SIFT特征的圖像檢索,使用匹配到的相似圖像作為字典學習的樣本,提高字典與噪聲圖像的相關(guān)性;最后進行高頻補償。衛(wèi)星圖像被用于去噪實驗證明所提算法的優(yōu)越性。與傳統(tǒng)去噪方法相比,所提出的方法不僅獲得較好的去噪效果,而且在一定程度上有效地抑制去噪帶來的高頻信息丟失。
SIFT;稀疏去噪;字典學習
四川省教育廳重點項目(No.14ZA0118)
In order to analyze and understand the image effectively,it's necessary to conduct denoising for image.Proposes a denoising method based on similar image retrieval and dictionary learning.Firstly,to have the better accuracy of image retrieval by improving noise signal ratio,denoising initially is executed for noise image;secondly,carry on image retrieval based on SIFT feature by using the initial noise image in the picture library and regard the similar image as a dictionary learning samples matched to improve correlation of dictionary and noise image;finally,the compensation of high frequency is needed.Satellite images are used to demonstrate the superiority of the proposed algorithm.Compared with the traditional denoising methods,the proposed method obtains better denoising effect,furthermore,it can effectively suppress the loss of high frequency information caused by the denoising procession.