楊媛媛,謝 濤,陳 偉
(1.武漢理工大學(xué) 信息工程學(xué)院,湖北 武漢430070;2.南京信息工程大學(xué) 海洋科學(xué)學(xué)院,江蘇 南京210044)
隨著多媒體技術(shù)及通信技術(shù)的迅猛發(fā)展,大量圖像數(shù)據(jù)需要傳輸和處理。傳統(tǒng)壓縮都是基于奈奎斯特準(zhǔn)則對(duì)圖像進(jìn)行采樣的,因此受到了信號(hào)帶寬的限制。
2006 年,由美國(guó)科學(xué)院院士DONOHO 等提出的壓縮感知(compressed sensing,CS)理論[1-2]為數(shù)據(jù)壓縮開(kāi)辟了新的道路,近幾年CS 也越來(lái)越多地用于圖像壓縮研究。在圖像壓縮感知中常用小波變換做稀疏表示,但由于其子帶分布特性,其稀疏度在列間分布不均勻,致使測(cè)量矩陣尺寸、壓縮比和恢復(fù)時(shí)間都受到制約。筆者對(duì)壓縮感知中基于小波變換的圖像信號(hào)稀疏表示方法進(jìn)行了改進(jìn),提出了基于低頻子帶列均衡的圖像稀疏表示算法,并進(jìn)行了實(shí)驗(yàn)仿真。
壓縮感知技術(shù)對(duì)信號(hào)的測(cè)量是在信號(hào)進(jìn)行稀疏表示后進(jìn)行的,如圖1 所示,因此可以遠(yuǎn)低于奈奎斯特準(zhǔn)則的理論采樣率來(lái)進(jìn)行采樣。壓縮感知理論最大的貢獻(xiàn)在于,將數(shù)據(jù)的采集和壓縮過(guò)程合二為一,避免了傳統(tǒng)理論下采集大量數(shù)據(jù),在壓縮過(guò)程中又丟棄大量冗余數(shù)據(jù)所造成的資源浪費(fèi),大大減少了信號(hào)采集、壓縮、存儲(chǔ)和處理的時(shí)間和復(fù)雜度。
很多時(shí)候,待處理數(shù)據(jù)本身并不是稀疏的,因此需要對(duì)其進(jìn)行稀疏表示。假設(shè)一維信號(hào)x∈RN×1,可將其用一組稀疏基Ψ={Ψ1,Ψ2,…,ΨN}進(jìn)行表示,其表示形式為:
圖1 壓縮感知理論下信號(hào)處理流程
式中,αi為向量x在由Ψ 所表示的稀疏域上的投影稀疏,是N×1 的向量。若α 的取值中,非零值有k個(gè),或者較大系數(shù)值有k個(gè),則稱α 為k稀疏的。常用的稀疏基有小波基、DCT 基、Gabor基和冗余字典等。在測(cè)量時(shí),用向量積對(duì)信號(hào)x進(jìn)行M次測(cè)量。為保證精確重構(gòu),M取值應(yīng)大于k而小于N。測(cè)量過(guò)程如下:式中,θ 為M×N矩陣,所得測(cè)量值y為1 ×M向量。
測(cè)量矩陣若滿足約束等距性準(zhǔn)則(restricted isometry property,RIP)或測(cè)量矩陣和稀疏矩陣不相關(guān),則可通過(guò)L1優(yōu)化問(wèn)題求解:
目前典型恢復(fù)算法為匹配追蹤算法(matching pursuit,MP)[3],正交匹配追蹤算法(orthogonal matching pursuit,OMP)[4],正則正交匹配追蹤算法(regularized orthogonal matching pursuit,ROMP)[5]和壓縮采樣匹配追蹤算法(compressive sampling matching pursuit,CoSaMP)[6]等。
一直以來(lái)在圖像壓縮領(lǐng)域中,各標(biāo)準(zhǔn)多采用離散余弦變換(discrete cosine transform,DCT)。其主要問(wèn)題在于必須對(duì)圖像進(jìn)行分塊處理,這會(huì)引起“方塊效應(yīng)”[7]。近10 年來(lái),小波變換作為一種新興的變換技術(shù)得到了迅速發(fā)展,在圖像壓縮領(lǐng)域,離散小波變換(discrete wavelet transform,DWT)已成為主流變換方法之一。
DWT 對(duì)圖像進(jìn)行處理,實(shí)際是對(duì)圖像在小波域進(jìn)行分解。首先構(gòu)造尺度函數(shù)和小波函數(shù),它們分別具有低通和高通濾波作用,由其組成的正交鏡像濾波器可將圖像分解為高頻子帶和低頻子帶。早期DWT 變換只局限在一層,即先在水平方向進(jìn)行低通濾波,再在垂直方向進(jìn)行高通濾波,然后按濾波結(jié)果將信號(hào)元素重新排列,圖2 所示為一層小波變換后的子帶分布情況。
圖2 一層小波分解子帶分布圖
其中,LL 子帶包含更多圖像中的低頻信號(hào),HL 子帶包含更多垂直方向的高頻信息,LH 子帶包含更多水平方向的高頻信息,HH 包含更多對(duì)角線方向的高頻信息?;谛〔ㄗ儞Q的圖像壓縮感知原理框圖如圖3 所示。
圖3 基于小波變換的圖像壓縮感知原理框圖
首先采用DWT 對(duì)圖像進(jìn)行小波分解,然后將其分解系數(shù)進(jìn)行CS 壓縮,解壓部分用重構(gòu)算法恢復(fù)出小波域系數(shù)后,再進(jìn)行小波合成,即可恢復(fù)出原圖像。
如果對(duì)一層小波分解后的系數(shù)進(jìn)行CS 壓縮,幾乎恢復(fù)不出原圖像,這是因?yàn)閷L 子帶系數(shù)一起壓縮,破壞了LL 系數(shù)的相關(guān)性。因此有學(xué)者提出只對(duì)LH、HL 和HH 子帶進(jìn)行CS 壓縮,LL 則用原數(shù)據(jù)進(jìn)行傳輸?shù)姆椒ǎ?-9]。但該方法對(duì)數(shù)據(jù)的壓縮比不高。
考慮到LL 部分仍存在稀疏性,可將LL 部分進(jìn)一步做小波分解。圖4 所示為四層小波分解子帶分布圖,進(jìn)一步將低頻信號(hào)往左上角搬移,保證LL 子帶系數(shù)盡可能不稀疏,并且經(jīng)過(guò)四層小波分解后,LL 子帶系數(shù)間的相關(guān)性變?nèi)?,因此可?duì)所有子帶系數(shù)統(tǒng)一進(jìn)行CS 壓縮,重構(gòu)后仍能得到理想效果。
圖4 四層小波分解子帶分布圖
通過(guò)壓縮感知,可以從M個(gè)測(cè)量值中還原出原始數(shù)據(jù)的N個(gè)值(M<N),這種壓縮的前提條件是這N個(gè)值本身是可壓縮的,或者說(shuō)是稀疏的。假設(shè)x的稀疏度為k,為了恢復(fù)出這k個(gè)數(shù)據(jù),M的值應(yīng)該大于k,且如果k增大,M值也必須增大,k減小,M值也相應(yīng)減小。以四層小波變換為例,在極限情況下,假設(shè)所有非零系數(shù)都集中在LL4,則其所在的前N/24列的稀疏度為N/24,后N-N/24列的稀疏度為0。則M應(yīng)大于N/24,壓縮比小于24:1。M值對(duì)應(yīng)的是測(cè)量矩陣的行數(shù),故測(cè)量矩陣應(yīng)有N/24行。但實(shí)際上后N-N/24列稀疏度很低,不需要這么多行的測(cè)量矩陣對(duì)其進(jìn)行測(cè)量,因此限制了壓縮比的提升。并且在重構(gòu)數(shù)據(jù)時(shí),以O(shè)MP 算法為例,它是對(duì)測(cè)量后得到的矩陣進(jìn)行逐列恢復(fù),由于前幾列k值較大,所需迭代次數(shù)較多,每次迭代,選擇的原子就多一列,矩陣變大。即在恢復(fù)前幾列時(shí)矩陣就已經(jīng)很大了,而每次迭代都要進(jìn)行矩陣的最小二乘法運(yùn)算,這樣即使后面列的k很小,所需迭代次數(shù)很少,但矩陣已經(jīng)很大了,因此總體運(yùn)算量很大。
筆者提出一種改進(jìn)算法,對(duì)低頻子帶進(jìn)行列均衡,將LL4 中的大值系數(shù)均分到每一列的頂端,而各層HL 和HH 子帶保持不變。由于經(jīng)過(guò)四層小波分解后,降低了低頻子帶系數(shù)間的相關(guān)性,因此在將該部分系數(shù)均分到每一列后,再對(duì)全部小波系數(shù)進(jìn)行壓縮感知,也可獲得較高的壓縮比和較好的重構(gòu)質(zhì)量。由于優(yōu)化后降低了前面LL4 子塊對(duì)應(yīng)列的稀疏度,因此在測(cè)量時(shí),可以將測(cè)量矩陣的M值設(shè)置得更小,以獲取更高的壓縮比,在同等壓縮比的基礎(chǔ)上,獲得更高的圖像質(zhì)量。由于OMP 恢復(fù)算法是逐列重構(gòu)數(shù)據(jù),故可減少LL4 子塊對(duì)應(yīng)列重構(gòu)時(shí)的迭代次數(shù),減小恢復(fù)這些列所產(chǎn)生的恢復(fù)矩陣的大小,抑制計(jì)算量的激增,減少運(yùn)算時(shí)間。
假設(shè)待處理圖像為N×N大小,則經(jīng)過(guò)四層小波分解后,LL4子帶大小為假設(shè)LL4子帶是完全不稀疏的,將其均分到每一列,則在這種理想情況下每一列的稀疏度都變?yōu)椋?/p>
在非理想情況下,LL4 子帶也有一定稀疏性,但相對(duì)于各層LH 子帶來(lái)說(shuō),其稀疏度明顯要高出很多。通過(guò)優(yōu)化,同樣可使LL4 對(duì)應(yīng)列的稀疏度變低,其具體均衡方法如圖5 所示,其中陰影部分表示大值系數(shù)。
圖5 四層小波變換低頻子帶列均衡原理圖
具體操作步驟如下:
(1)將LL4 的低頻分量進(jìn)行上下分塊,將其下半部分?jǐn)?shù)據(jù)與LH4 的上半部分?jǐn)?shù)據(jù)對(duì)調(diào),形成新的低頻子帶,大小為
(2)將步驟(1)得到的低頻子帶再進(jìn)行上下分塊,將其下半部分?jǐn)?shù)據(jù)與LH3 的上半部分?jǐn)?shù)據(jù)對(duì)調(diào),形成新的低頻子帶,大小為
(3)將步驟(2)得到的低頻子帶再進(jìn)行上下分塊,將其下半部分?jǐn)?shù)據(jù)與LH2 的上半部分?jǐn)?shù)據(jù)對(duì)調(diào),形成新的低頻子帶,大小為
(4)將步驟(3)得到的低頻子帶再進(jìn)行上下分塊,將其下半部分?jǐn)?shù)據(jù)與LH1 的上半部分?jǐn)?shù)據(jù)對(duì)調(diào),形成新的低頻子帶,大小為即均勻分布到每一列。
上述方法既實(shí)現(xiàn)了低頻子帶列均衡,也方便了之后對(duì)全部小波系數(shù)進(jìn)行CS 壓縮和OMP 重構(gòu)。重構(gòu)后的數(shù)據(jù)按照之前的均衡步驟進(jìn)行反變換,再進(jìn)行小波合成,即可還原出原始圖像。將該方法用于圖像壓縮感知時(shí)的具體流程如圖6 所示。
圖6 基于低頻子帶列均衡的圖像壓縮感知原理框圖
通過(guò)優(yōu)化,在設(shè)計(jì)測(cè)量矩陣時(shí)即可將M取更小的值且獲得更大的壓縮比。在同樣的壓縮比下,由于M遠(yuǎn)大于每列的k值,因此可獲得更好的恢復(fù)效果。由于每列的k值很平均且很小,在恢復(fù)算法中,前幾列的迭代次數(shù)較少,矩陣擴(kuò)大的速度較低,因此整體運(yùn)算量會(huì)顯著下降。
采用256 ×256 大小的Lena 圖像作為原始圖像,對(duì)圖像進(jìn)行四層小波變換,測(cè)量矩陣采用高斯隨機(jī)矩陣,用OMP 算法進(jìn)行圖像重構(gòu),對(duì)傳統(tǒng)四層小波變換圖像壓縮感知和小波域低頻均衡圖像壓縮感知進(jìn)行了仿真和結(jié)果對(duì)比。
分別取M值為32、64、96、128 和164,比較兩種算法的峰值信噪比(peak signal to noise ratio,PSNR),結(jié)果如表1 所示。
表1 傳統(tǒng)算法與優(yōu)化算法PSNR 對(duì)比
由仿真數(shù)據(jù)可知,優(yōu)化算法明顯比傳統(tǒng)算法的PSNR要高,特別是在采樣率較低的情況下,傳統(tǒng)算法性能會(huì)出現(xiàn)嚴(yán)重惡化,而優(yōu)化算法在這種情況下可大幅提高PSNR,這與之前理論分析是相符的。
分別取M值為32、64、96、128 和164,比較兩種算法的重構(gòu)時(shí)間,其結(jié)果如圖7 所示。
圖7 兩種算法重構(gòu)時(shí)間對(duì)比圖
由圖7 可見(jiàn),隨著采樣率的增大,改進(jìn)算法的運(yùn)行速度相比原始算法越來(lái)越快。采樣率低時(shí),迭代次數(shù)很少,區(qū)別不大。隨著采樣率增加,低頻均衡效果越來(lái)越明顯,其前面列向量的恢復(fù)所需迭代次數(shù)明顯少于傳統(tǒng)算法,矩陣擴(kuò)充速度減緩,因此整體運(yùn)算速度大大加快。
經(jīng)過(guò)四層小波分解,得到小波域圖像。其左上角有一亮塊,對(duì)應(yīng)LL4 中密集的低頻分量。經(jīng)優(yōu)化處理后,該部分低頻分量在列方向上的分布趨于均勻,在小波域圖像中表現(xiàn)為亮塊消失,分散于各列頂端。
對(duì)比M=64 時(shí)兩種算法所得空域圖像,如圖8 所示。此時(shí)壓縮比已經(jīng)達(dá)到了4:1,圖8(b)經(jīng)過(guò)優(yōu)化算法可以恢復(fù)出大致圖像,而圖8(a)采用傳統(tǒng)算法,幾乎不能恢復(fù)。這說(shuō)明在處理大幅圖像信息時(shí),可采用該算法,以較高的采樣率獲得較好的恢復(fù)效果。
筆者介紹了壓縮感知和稀疏表示的基本理論,對(duì)于現(xiàn)有的小波域圖像稀疏表示及其在壓縮感知中的應(yīng)用和存在問(wèn)題進(jìn)行了分析。根據(jù)小波分解系數(shù)的分布特點(diǎn),提出了小波域低頻均衡的圖像稀疏表示改進(jìn)算法,通過(guò)將低頻子帶均分到每一列,降低前面列的稀疏度。將其應(yīng)用于壓縮感知,則可減小測(cè)量矩陣大小,提高壓縮比,降低恢復(fù)時(shí)間,或在同樣的壓縮比下提高圖像恢復(fù)質(zhì)量。在不同壓縮比下對(duì)傳統(tǒng)算法和優(yōu)化算法進(jìn)行了仿真對(duì)比,結(jié)果顯示該算法與傳統(tǒng)基于小波變換的壓縮感知算法相比,在恢復(fù)效果和節(jié)省運(yùn)算時(shí)間上均有一定程度的改善。
圖8 M=64 時(shí)恢復(fù)空域圖像對(duì)比
[1]DONOHO D. Compressed sensing[J]. IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[2]CANDES E. Compressive sampling[C]∥Proceedings of the International Congress of Mathematicians. Madrid:[s.n.],2006:1433 -1452.
[3]MALLAT S,ZHANG Z. Matching pursuit in a time -frequency dictionary[J]. IEEE Trans Signal Processing,1993,41(12):3397 -3415.
[4]TROPP J,GILBERT A. Signal recovery from random measurements via orthogonal matching pursuit [J].IEEE Trans Inform Theory,2007,53(12):4655-4666.
[5]NEEDELL D,VERSHYNIN R. Uniform uncertainty principle and signal recovery via regularized orthogonal matching pursuit[J]. Found Comput Math,2009,9(3):317-334.
[6]NEEDELL D,TROPP J A. CoSaMP:iterative signal recovery from incomplete and inaccurate samples[J].Applied and Computational Harmonic Analysis,2008,26(3):301 -321.
[7]CHEN J L,YANG J. Improved image coding algorithm based on embeded zerotree wavelet[J]. Image and Signal Processing,2009,9(2):1 -4.
[8]張礪佳. 基于小波變換的圖像壓縮編碼研究[D].北京:中國(guó)科學(xué)院研究生院,2007.
[9]CEN Y G,CHEN X F,CEN L H,et al. Compressed sensing based on the single layer wavelet transform for image processing[J]. Journal on Communications,2010,31(8A):52 -55.
武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版)2015年1期