張卓
摘要:圖像處理的核心任務(wù)是視覺信息的有效表示,圖像多分辨率表示方法具有多尺度、多方向特性,能有效捕捉圖像紋理、邊緣等重要圖像結(jié)構(gòu)信息。本文對國內(nèi)外研究狀況進行了闡述,提出存在的問題,探討了圖像多分辨率表示的發(fā)展方向。
關(guān)鍵詞:圖像表示;多分辨率;圖像處理
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2018)02-0207-01
1 引言
圖像處理的核心任務(wù)是視覺信息的有效表示,好的圖像表示能用較少的描述捕獲重要的目標(biāo)信息。M.N.Do給出了圖像有效表示的目標(biāo)為:多分辨率、局部性、臨界采樣、方向性和各向異性[1],而多分辨率是符合人眼視覺的重要要求。
圖像多分辨率表示起源于圖像金字塔分解,故在第2部分首先介紹圖像金字塔的組織結(jié)構(gòu)和特點,然后介紹基于金字塔結(jié)構(gòu)發(fā)展而來的方向多分辨率圖像表示方法。在第3部分先給出四叉樹分解結(jié)構(gòu)的變分辨率特征,然后介紹了復(fù)合多分辨率圖像表示方法。
2 方向多分辨率圖像表示
2.1 圖像金字塔
圖像金字塔是圖像多分辨率表示理論的最早應(yīng)用。對一幅圖像進行金字塔分解,首先將其在兩個方向上進行1:2的亞采樣,然后經(jīng)過濾波處理得到原始圖像的縮略圖。重復(fù)此過程,就可得到不同尺度的縮略圖。
圖像金字塔作為一種圖像多分辨率表示方法,僅能產(chǎn)生較粗的頻率分解,沒有方向分解,所有在同一個倍頻程的頻率,都包含在金字塔同一層中,因而應(yīng)用領(lǐng)域受限。
2.2 方向多分辨率圖像表示的發(fā)展
圖像金字塔表示的方向匱乏問題使其應(yīng)用受限,如何將圖像多分辨率表示與多方向性結(jié)合起來,是重要的發(fā)展方向。
Stephance G.Mallat于1989年將小波分析應(yīng)用于圖像領(lǐng)域,圖像的小波分析不僅能對圖像進行不同尺度分解,而且二維小波基具有多方向性,能一定程度的表達(dá)圖像幾何正則性。但在二維小波逼近奇異曲線過程中,出現(xiàn)的大量不可忽略的系數(shù)使其無法“稀疏”表達(dá)原函數(shù)。為解決圖像等多維數(shù)據(jù)有效表達(dá)的問題,需尋找更優(yōu)的方向多分辨率圖像表示方法。
1998年E.J.Candes和D.L.Donoho提出Ridgelet變換。此變換是針對直線奇異的多變量函數(shù)的最優(yōu)逼近,為非自適應(yīng)高維函數(shù)表示。變換過程首先運用radon變換,把線狀奇異性變換成點狀奇異性,再用小波變換進行處理。因此,Ridgelet變換具備了一定的方向辨識能力,對具有方向性的直線特征可有效表達(dá)。
Ridgelet變換雖能最優(yōu)逼近含直線奇異的多變量函數(shù),但對圖像中的曲線卻無能為例。1999年E.J.Candes又提出單尺度Ridgelet變換,用直線逼近曲線,能較好處理圖像曲線的奇異特征。較之小波變換,其針對含曲線奇異的多變量函數(shù)的逼近能力有所提升,但在計算復(fù)雜度上有所犧牲。
1999年E.J.Candes和D.L.Donoho提出第一代Curvelet變換。有別于單尺度Ridgelet變換只在某一尺度進行Ridgelet變換,Curvelet變換在所有尺度上完成Ridgelet變換。這種變換綜合了Ridgelet變換擅長表示直線和小波適合表示點奇異性目標(biāo)的優(yōu)點,但存在加窗效應(yīng),又因使用的仍為Ridgelet變換,復(fù)雜度高。
2005年E.J.Candes和D.L.Donoho對算法進行改進,提出第二代Curvelet變換。該方法不再使用Ridgelet變換,而是通過在頻域進行劃分,直接給出了具體的變換形式。第二代Curvelet變換在方向性、時頻域局部性和非線性逼近等方面有更好的表現(xiàn),但仍沒有解決冗余度和加窗效應(yīng)的問題。
M.N.Do和M.Vetterli于2001年提出Contourlet變換。該變換在離散頻域中直接定義,避免了復(fù)雜的離散化操作,比Curvelet變換的冗余度和計算復(fù)雜度低。但對于多數(shù)角度濾波器,該變換無法在頻域迅速局域化,造成圖像邊緣線的偽振蕩。另外,Contourlet變換缺乏完整、系統(tǒng)的逼近理論和算子理論,基礎(chǔ)理論還有待完善。
2007年K.Guo和D.Labate等人在合成膨脹的仿射變換基礎(chǔ)上提出Shearlet變換。該變換允許每個尺度上有不同數(shù)目的方向分解,其基支撐區(qū)間具有長寬比隨尺度而變的“各向異性”特點,能實現(xiàn)對圖像的稀疏表示。相比其它圖像多分辨率表示,Shearlet變換理論性強,算法實現(xiàn)簡單,計算復(fù)雜度低,在圖像處理方面應(yīng)用廣泛。
3 復(fù)合多分辨率圖像表示
3.1 四叉樹
四叉樹表達(dá)法利用金字塔式的數(shù)據(jù)結(jié)構(gòu)對圖像進行表達(dá),樹根對應(yīng)整幅圖像,樹葉對應(yīng)單個像素或相同特征像素組成的方陣。
復(fù)合多分辨率圖像表示是一類結(jié)構(gòu)較復(fù)雜的圖像多分辨率表示,基于四叉樹分裂結(jié)構(gòu)的隱型模型。不同于金字塔多分辨率的分解形式,復(fù)合多分辨率表示是在四叉樹分裂結(jié)構(gòu)的基礎(chǔ)上,根據(jù)預(yù)先已知的圖像幾何正則性,對圖像進行自適應(yīng)二進剖分。
3.2 復(fù)合多分辨率圖像表示的發(fā)展
復(fù)合多分辨率圖像表示采用四叉樹分裂結(jié)構(gòu),對分塊進行恰當(dāng)?shù)拿枋鰜肀平鼒D像的幾何結(jié)構(gòu)和邊緣信息。根據(jù)不同圖像內(nèi)容,分塊大小隨之調(diào)整,體現(xiàn)多分辨率特性。
1999年D.L.Donoho提出Wedgelet變換。Wedgelet基是定義域為正方形區(qū)域的分片二值函數(shù),Wedgelet字典由不同尺寸、不同方向的一組Wedgelet基構(gòu)成,用以描述圖像邊緣。Wedgelet變換為水平模型的物體提供了一種近似最優(yōu)的表示,主要用于檢測有噪圖像的線性奇異性信息,但由于Wedgelet逼近自底向上,計算時間較長。
2000年D.L.Donoho和霍小明提出Beamlet變換。Beamlet字典由在不同位置、方向和尺度上進行二進結(jié)構(gòu)剖分的線段組成,可對全部線段實現(xiàn)多尺度逼近,能有效分析線段奇異性。相較于小波分析對光滑函數(shù)進行了最優(yōu)稀疏表示,Beamlet變換最優(yōu)稀疏表示了圖像中的光滑曲線。
Pennce和Mallat在2000年提出第一代Bandelet變換。這種變換能夠自適應(yīng)跟蹤圖像幾何正則方向,為基于邊緣的多分辨率表示。變換首先將圖像的幾何特征轉(zhuǎn)換為矢量場,把灰度變化的局部正則方向用矢量來表示,然后在矢量線方向進行小波變換,用光滑的曲線描述不連續(xù)重要的小波系數(shù)。Pennce和Mallat給出了Bandelet變換的最優(yōu)基快速尋找算法,在去噪和壓縮方面體現(xiàn)出一定優(yōu)勢。
2005年P(guān)eyreg和Mallat改進算法,提出第二代Bandelet變換。該變換避免了重采樣和彎曲等在第一代Bandelet變換中造成算法實現(xiàn)復(fù)雜的操作,通過二維小波變換實現(xiàn)多分辨率分析,通過正交方向的一維小波變換實現(xiàn)幾何方向分析,二者共同實現(xiàn)了圖像表示。第二代Bandelet變換具有簡單、正交及沒有邊界效應(yīng)等特點,在圖像處理領(lǐng)域應(yīng)用更為廣泛。
4 結(jié)語
本文從兩條主線粗略探討了圖像多分辨率表示的發(fā)展概況,闡明了它們產(chǎn)生的背景和發(fā)展歷程,并指出其優(yōu)缺點和發(fā)展方向。雖然圖像多分辨率表示已發(fā)展多年,但其重要價值才嶄露頭角,如何能更加有效地研究和利用圖像多分辨率表示方法,對未來圖像智能信息處理至關(guān)重要。
參考文獻(xiàn)
[1]M.N.Do, M.Vetterli. The contourlet transform: an efficient directional multiresolution image representation, IEEE Transactions Image on Processing.2005,14(12):2091-2106.