劉明明
(四川大學(xué)電子信息學(xué)院,成都610065)
圖像分解的目的是分離圖像中的不同特征。在醫(yī)學(xué)圖像處理、遙感、生物計(jì)量學(xué)等許多實(shí)際應(yīng)用中具有重要的應(yīng)用價(jià)值。圖像可以分解為卡通(分段平滑)和紋理結(jié)構(gòu)的疊加。圖像可以分解為卡通(分段平滑)和紋理結(jié)構(gòu)的疊加。模型化為f=u1+u2,其中f為觀測(cè)圖像,u1為卡通部分,由分段光滑的結(jié)構(gòu)和清晰邊緣信息構(gòu)成。u2為紋理結(jié)構(gòu)信息,由圖像的紋理信息或者高斯噪聲構(gòu)成。例如,在遙感中,合成孔徑雷達(dá)圖像可以建模為地面反射率場(chǎng)(卡通)與多重反射散斑(紋理)的疊加。
近些年來,基于稀疏表示的方法在圖像處理中得到有效的應(yīng)用。特別地,Starck 等人[1]提出了一種稱為形態(tài)成分分析(MCA)的方法,該算法在假定不同的形態(tài)學(xué)成分是完全不同的,在特定的解析字典下的表示是稀疏的,同時(shí)這些字典是毫不相干的,即每個(gè)特定字典可將其對(duì)應(yīng)的形態(tài)學(xué)成分稀疏表示,而對(duì)其他形態(tài)學(xué)成分的表示是不稀疏的,通過最小化能量泛函使得結(jié)構(gòu)字典表示卡通結(jié)構(gòu)成分,紋理字典表示紋理成分,最終達(dá)到卡通和紋理分離的目的。因此MCA 的性能取決于特定字典的選擇。在實(shí)踐中,離散余弦變換(DCT)或離散正弦變換(DST)對(duì)應(yīng)的字典被用來表示紋理成分。由于小波變換、曲線變換和輪廓變換等都能很好地表現(xiàn)出邊緣等幾何特征,因此可以用來表示分段光滑分量。然而,由于這些字典不能自適應(yīng)地隨圖像的內(nèi)容和結(jié)構(gòu)而改變,圖像恢復(fù)和分解的質(zhì)量依賴于這些稀疏域的選擇或字典的構(gòu)造。
直接從訓(xùn)練中學(xué)習(xí)字典,而不是使用預(yù)先確定的字典(例如DCT 或小波),在許多圖像處理和分類問題中,通常能得到更好的表示,從而提供更好的結(jié)果[2-3]。另外,多數(shù)字典學(xué)習(xí)方法都是基于圖像塊進(jìn)行學(xué)習(xí)的,這就導(dǎo)致這些方法有相同的移位特性,而卷積稀疏編碼(Convolutional Sparse Coding,CSC)方法,可以直接在目標(biāo)中對(duì)平移不變性進(jìn)行建模[4-5]。CSC 已經(jīng)被證明在廣泛的計(jì)算機(jī)視覺和圖像處理問題上有重要的應(yīng)用[6-7]。
總變差[8](TV 模型),因?yàn)樗芎玫乜坍嬃丝ㄍㄐ蜗蟮姆侄纹交哉?。然而,TV 模型基于梯度定義的,因此對(duì)于紋理部分不能很好地刻畫,易產(chǎn)生“階梯效應(yīng)”與細(xì)節(jié)模糊等問題。為了解決這一問題,人們提出了許多TV 的變體,比如;自適應(yīng)二階廣義總變分模型[9](TGV 模型),分?jǐn)?shù)階變分模型[10-11](FTV 模型)等。目前,F(xiàn)TV 已被用于圖像紋理細(xì)節(jié)的提取和增強(qiáng)方面取得了較好的成果[11-12],這些工作也表明了分?jǐn)?shù)階變分模型能更好地處理紋理等細(xì)節(jié)信息。為了取得更好的分離效果,本文中用TV 處理圖像分離中的卡通部分(低頻部分),用FTV 處理圖像分離中的紋理部分(高頻部分)。
CSC 假設(shè)圖像可以表示為一組濾波器及其相應(yīng)的特征映射之間的卷積的和。
這里y表示輸入圖像,*表示卷積算子。表示一組濾波器,表示與濾波器相對(duì)應(yīng)的特征圖。λ表示正則化參數(shù)。文獻(xiàn)[13]提出引入了一種基于傅里葉域交替方向乘法器(ADMM)[14]框架來解決CSC 的優(yōu)化問題。文獻(xiàn)[15]提出了一個(gè)能處理適當(dāng)邊界條件的柔性框架來解決CSC 優(yōu)化問題。另外,文獻(xiàn)[16]提出一種另一種高效的方法,在空間和傅里葉域中處理CSC 的優(yōu)化問題。在本文中,我們采用了文獻(xiàn)[16]中提出的學(xué)習(xí)卷積濾波器的方法,該方法簡單有效。
TV 模型是的經(jīng)典圖像算法[8],也稱ROF 模型,TV的最小能量泛函可以表示為:
min 表示對(duì)此模型求最小解,第一項(xiàng)為正則項(xiàng),作用是在D?U區(qū)域內(nèi)的圖像總變分求取最優(yōu),第二項(xiàng)為保真項(xiàng),作用是平滑修復(fù)區(qū)域。u為包含噪聲的圖像,u0為原始圖像。λΩ數(shù)據(jù)保真項(xiàng),當(dāng)有噪聲存在時(shí)用來保持邊緣信息。
(3)式能量泛函的歐拉-拉格朗日方程可以表示為:
其中 |?u|-1為擴(kuò)散系數(shù),其作用是修復(fù)圖像時(shí)平衡圖像在不同的像素梯度下的擴(kuò)散強(qiáng)弱,以此來避免圖像修復(fù)后破損區(qū)域與其鄰域之間過度的平滑。TV 模型通過梯度值來確定邊緣和噪聲,僅在圖像的梯度正交方向上進(jìn)行擴(kuò)散,從而有效地保留邊緣結(jié)構(gòu)。但在圖像的平滑區(qū)域,TV 模型能有效地逼近分段常數(shù)函數(shù),容易將噪聲誤判為邊緣保留,最終產(chǎn)生分段區(qū)域的“階梯效應(yīng)”。
分?jǐn)?shù)階微分實(shí)質(zhì)上是整數(shù)階微分的一種推廣形式,研究表明分?jǐn)?shù)階導(dǎo)數(shù)比整數(shù)階導(dǎo)數(shù)更適合于對(duì)于圖像紋理等細(xì)節(jié)信息的處理,能有效的抑制圖像的“階梯效應(yīng)”將文中TV 模型的正則項(xiàng)由一階微分拓展到分?jǐn)?shù)階微分。這樣就得到了FTV 模型:
通過引入一個(gè)人為的時(shí)間變量,求解方程(5),得到了梯度流:
其中的參數(shù)含義與TV 模型的參數(shù)含義相同。
蒲[12]等人通過Gru¨nwald-Letnikov(G-L)定義構(gòu)造八個(gè)方向的分?jǐn)?shù)階微分掩模。
s(x)是定義在[a,x] 的連續(xù)信號(hào),α是任意的實(shí)數(shù),在區(qū)間[a,x] 上的離散采樣信號(hào)。為了簡單起見,我們只介紹四個(gè)方向的分?jǐn)?shù)階掩碼,包括正的x軸和y軸,負(fù)的x軸和y軸用于處理對(duì)應(yīng)的四個(gè)方向,由圖1 表示。其中的子圖分別表示4 個(gè)方向的分?jǐn)?shù)階微分掩模。
圖1 四個(gè)方向上的分?jǐn)?shù)階掩模
圖1 中分?jǐn)?shù)階微分掩模的系數(shù)如下:
y為輸入大小為N2的圖片,可以分離為分段光滑的可用卡通圖片yc和紋理圖片yt。假設(shè)我們已經(jīng)分別解決了動(dòng)畫和紋理組件的CSC 問題,學(xué)習(xí)了對(duì)應(yīng)于yc和yt的卷積濾波器,用學(xué)習(xí)得到的得到,基于CSC 優(yōu)化框架來優(yōu)化uc,i和ut,i來估計(jì)yc和yt。
其中λc,λt是稀疏系數(shù),β,γ是平衡系數(shù)。對(duì)于卡通部分uc,用刻畫。對(duì)于紋理部分,用刻畫,則(9)式又可以表示為:
為了簡化計(jì)算,我們可以在這里先討論除了TV 和FTV 的部分,得到的結(jié)果可以在uc,k和ut,k上進(jìn)行迭代求解。首先更新uc,k,我們假設(shè)初始ut,k是固定的,因此,需要解決以下的優(yōu)化問題:
這里假設(shè)dc,k,dt,k和ut,k是確定的,(10)式本質(zhì)上是一個(gè)稀疏編碼問題,可以使用[17]中提出的基于DFT的ADMM 的算法來解決。
其次更新ut,k,這里我們假設(shè)uc,k事先確定,然后解決如下優(yōu)化問題:
同樣的,(11)式可以基于DFT 的ADMM 的算法來解決。
圖像分解的本文算法:
這里的λc,λt,β是正則化參數(shù),K是總的迭代次數(shù),y為待分離的圖像為處理后的圖像分離卡通和紋理圖像。
這一部分,用我們提出的新的圖像分離算法與基于卷積稀疏編碼的分離算法[18](CSCD)、經(jīng)典的形態(tài)成分分析(MCA)的方法[1]以及一種最新的基于塊的核范數(shù)的圖像分離算法[19](BNN)。在這些實(shí)驗(yàn)當(dāng)中,我們用峰值信噪比來衡量各自的性能。對(duì)于MCA 算法,用小波變換和局部DCT 字典分別表示卡通和紋理成分。為了更好的說明本算法的實(shí)驗(yàn)效果,本文采用與CSCD算法相同的卷積濾波器,采用文獻(xiàn)[20]CSC 算法模型分別進(jìn)行處理,得到相應(yīng)的學(xué)習(xí)濾波器如圖2 所示。
圖2
從圖2(a)可以看出,這些過濾器本質(zhì)上是振蕩的,它們?cè)诓东@訓(xùn)練紋理的模式方面做得很好。類似地,從圖2(b)中,我們觀察到所學(xué)的過濾器與在Gabor 字典中發(fā)現(xiàn)的過濾器相似。此外,它們還可以捕獲在卡通類型圖像(如邊緣)中發(fā)現(xiàn)的特定于域的信息。
在第一組實(shí)驗(yàn)中,我們提出了一種從隱藏的指紋中提取潛在指紋的方法。潛指紋是最有價(jià)值和最常見的物證類型之一,從犯罪現(xiàn)場(chǎng)提取的潛指紋可作為法醫(yī)鑒定的重要依據(jù)。參數(shù)的選取經(jīng)常是根據(jù)經(jīng)驗(yàn)確定的,在該實(shí)驗(yàn)中取λc=max(0.5-0.05?i,0.05)和λt=max(0.55-0.05?i,0.15),在第i 次的迭代當(dāng)中分?jǐn)?shù)階的模板大小為N=7,分?jǐn)?shù)階的階次V=0.6。本文所提出的方法從隱藏指紋中提取潛在指紋。圖3 給出了本文算法的分離結(jié)果。同時(shí)與CSCD、BNN、MCA 等算法簡單的對(duì)比。
圖3 本文算法與CSCD,BNN,MCA在隱藏指紋圖像上分離效果的對(duì)比
在第二組實(shí)驗(yàn)中我們采用貓+籠子圖像原始圖像,為了增加本文算法的說服性,本文選取與CSCD 相同的 參 數(shù)。 取λc=max(0.55-0.05?i,0.005)和λt=max(0.55-0.05?i,0.005)在的第i次迭代中。分?jǐn)?shù)階模板大小為N=7,分?jǐn)?shù)階的階次V=0.8。在這兩個(gè)圖中,第一列顯示了原始的測(cè)試圖像卡通形象和原始紋理形象,第二列顯示本文的圖像分離算法。第三、第四和第五列顯示的結(jié)果對(duì)應(yīng)的分別采用CSCD 算法、BNN 算法、MCA 算法。采用峰值信噪比(PNSR)來比較不同算法的效果。
與其他方法相比,我們的方法能夠較好地從給定的圖像中分離出形態(tài)成分。貓+籠子圖像的實(shí)驗(yàn)可以看出,如圖4 所示,本文算法分離出來的卡通圖像的PNSR 為29.33,與之相對(duì)應(yīng)CSCD 算法,BNN 算法,MCA 算法的PNSR 分別為28.43,28.12,26.82。相應(yīng)的分離出來的紋理圖像的PNSR 為28.97,與之相對(duì)應(yīng)CSCD 算法,BNN 算法,MCA 算法的PNSR 分別為28.21,26.32,26.47??偟膩碚f,本文的方法在兩種分離后成分相結(jié)合的情況下,得到了38.43dB 的PSNR,略低于CSCD 算法的PSNR,明顯高于BNN 和MCA 的PSNR。
圖4 本文算法與CSCD,BNN,MCA在貓+籠子圖像上分離結(jié)果的對(duì)比
本文提出了一種新穎的圖像分離方法,將給定的圖像分解為紋理和卡通部分。我們的方法是直接訓(xùn)練卡通和紋理過濾器。利用這些學(xué)習(xí)濾波器,然后基于一個(gè)稀疏的圖像分離優(yōu)化框架。通過對(duì)一幅圖像進(jìn)行分解使得其分解為卡通和紋理兩個(gè)部分,然后分別對(duì)這兩部分進(jìn)行處理,即卡通對(duì)應(yīng)著目標(biāo)圖像的低、中頻部分,用變分模型進(jìn)行處理,而紋理則對(duì)應(yīng)其高頻部分,因此利用對(duì)細(xì)節(jié)部分有增強(qiáng)效果的分?jǐn)?shù)階變分模型對(duì)其進(jìn)行處理。實(shí)驗(yàn)結(jié)果表明,由于引入了分?jǐn)?shù)階變分模型,本文算法成功地將結(jié)構(gòu)、紋理,更好地實(shí)現(xiàn)了圖像的分解。