魏玉芬,野金花,丁艷清
(黑龍江八一農(nóng)墾大學(xué)文理學(xué)院,黑龍江 大慶 163319)
嵌入式零樹小波編碼(Embedded Zerotree Wavelets Encoding,EZW)是基于比特連續(xù)逼近的圖像編碼方法:按位平面分層進(jìn)行孤立系數(shù)和零樹的判決和熵編碼,而判決閾值則逐層折半遞減,又稱之為多層(或位平面)零樹編碼方法,這種編碼方法十分有效。近年來,在EZW算法的基礎(chǔ)上,出現(xiàn)了許多新的改進(jìn)算法,如集合分裂嵌入塊編碼、可逆嵌入小波壓縮算法、最優(yōu)截斷嵌入式塊編碼等,其中最優(yōu)截斷嵌入式塊編碼算法,更是成為新圖像編碼標(biāo)準(zhǔn)JPEG2000中所采用的算法[1~3]。
EZW算法簡單,無需任何訓(xùn)練,支持多碼率,具有較高的信噪比和較好的圖像復(fù)原品質(zhì)。然而實驗結(jié)果表明,該算法由于不能完全利用小波系數(shù)的特點和充分考慮人眼視覺特性(HSV),導(dǎo)致編碼時間過長,編碼效率低,影響圖像復(fù)原品質(zhì)。本文提出視覺加權(quán)小波零樹編碼方法,通過對高頻子帶進(jìn)行視覺加權(quán),修改高頻子帶系數(shù)掃描策略和量化閾值等方法進(jìn)行編碼,對低頻子帶采用無損預(yù)測編碼方法,進(jìn)一步提高圖像復(fù)原的品質(zhì)和編碼效率。
EZW算法利用小波系數(shù)的特點,較好地實現(xiàn)了圖像編碼的嵌入功能,主要包括以下3個過程:零樹預(yù)測,掃描方法,逐次逼近量化[4]。
1.1 零樹預(yù)測
在變換編碼中,變換系數(shù)矩陣經(jīng)過量化后,產(chǎn)生大量零符號。編碼的后續(xù)過程,就是有效地表示那些非零符號,包括非零符號的位置和大小。表示量化后非零值位置的過程,也就是表示有效值位置的過程,稱為有效值映射(significance map)。
為了構(gòu)成一個完整的有效值映射,除了定義零樹根(ZTR)外,還需定義其他3個符號:
(1)孤零(IZ),表示當(dāng)前系數(shù)值是無效值,但它的子孫系數(shù)中至少有一個是有效值;
(2)正有效值(POS),表示當(dāng)前系數(shù)是一個正的有效值;
(3)負(fù)有效值(NEG),表示當(dāng)前系數(shù)是一個負(fù)的有效值。小波樹結(jié)構(gòu)示意圖如圖1所示。
1.2 掃描方法
EZW算法對小波系數(shù)進(jìn)行編碼的次序叫做掃描。有了上述4個符號,可以按一定的順序掃描小波變換系數(shù)矩陣,從而形成一個符號表,它就是要得到的有效值映射。掃描過程中,各子帶按圖2所示的次序掃描。
圖1 三級小波分解和樹結(jié)構(gòu)示意
圖2 子帶掃描順序
1.3逐次逼近量化
為了使零樹表示構(gòu)成一個有效的嵌入式碼流,結(jié)合逐次逼近量化技術(shù),來依次確定有效值和有效值映射,門限值之間滿足依次減半。
通過對人眼某些視覺現(xiàn)象的觀察,并結(jié)合視覺生理、心理學(xué)等方面的研究,發(fā)現(xiàn)恢復(fù)圖像的視覺失真,不僅取決于整體均方誤差,而且還取決于這個失真空間頻率上的分布。由于人眼具有視覺閾值效應(yīng)和掩蓋效應(yīng),因此人的視覺分辨率力有限,可以容忍一定的圖像失真,但是人眼對不同頻率視覺信號的敏感度是不一樣的:
(1)人眼對圖像邊緣區(qū)信息的失真很敏感;
(2)人眼對圖像平滑區(qū)信息的失真比較感敏;
(3)人對圖像紋理區(qū)信息的失真不敏感。
長期以來,人們試圖建立人類視覺系統(tǒng)的數(shù)學(xué)模型,本文采用Ngan[5]提出的模型,即
其中,
a,b,c為常數(shù);
f為視頻率,單位為周/像素(cycle per pixel,簡稱CPD)。
根據(jù)Ngan的研究,人眼對3~6 CPD的空間頻率分量最為敏感。利用上述視覺模型對小波系數(shù)進(jìn)行加權(quán),可把空間頻率f的單位變換為小波系數(shù)域(付氏域)的單位周/像素(cycle per pixel)。表1給出三級小波高頻系數(shù)的視覺加權(quán)值。
如圖3所示編碼流程圖,是將最低頻子圖和其他子圖分開處理的方法,用無損預(yù)測編碼對最低頻子圖單獨編碼,而對高頻圖像的編碼采用如下的改進(jìn)方法:
(1)小波分解高頻系數(shù)進(jìn)行視覺加權(quán),對傳統(tǒng)的掃描順序進(jìn)行改變,掃描不是從最后一級低頻系數(shù)開始,而是從最后一級高頻系數(shù)最大值開始,且按先水平方向高頻、垂直方向低頻,然后水平方向低頻、垂直方向高頻,再對角線方向高頻;
(2)選擇閾值的時候,是先在LHi最后一級分解的高頻系數(shù)中選擇,然后在LHi最后一級的高頻系數(shù)中選擇,最后是HHi中選擇;依然按照2的整數(shù)冪從高到低排列量化閾值。根據(jù)閾值選取的子帶順序不同,產(chǎn)生的零樹編碼碼流分別采用自適應(yīng)算術(shù)編碼、Huffman編碼。
(3)如果第j層(三級小波變換,2≤j≤3)高頻子帶中的一個系數(shù)及其所有后代為零,定義該節(jié)點為j-1級ZTR(零樹根),然后依此類推。如果同一關(guān)系樹中有數(shù)個ZTR,則只對最高級ZTR進(jìn)行編碼。解碼時,根據(jù)ZTR的級數(shù),確定開始補零的層以及具體的起點;
(4)根據(jù)給定的閾值T做出一輪掃描后,將高頻子帶系數(shù)分成了3類:非零點、ZTR(零樹根))、IZ(孤立零)。顯然,要表現(xiàn)這3種情況都需要消耗額外的比特數(shù),由于IZ的產(chǎn)生是因為第j層子帶的一個系數(shù)無意義,但其后代中有非零點。將IZ的量化值重新恢復(fù)進(jìn)來,與非零點一并進(jìn)行編碼,這時所有的高頻子帶系數(shù)就只有兩類了:非零點、ZTR(零樹根)。這樣在有效減小圖像失真的同時,提高了編碼效率。
(5)對除LL3子帶外的每一個高頻子帶,都建立一個編碼信息表,用來表明對應(yīng)系數(shù)的分類情況。如果值為1,則表示對應(yīng)系數(shù)為非零點,參與量化編碼;如果值為0,則表示對應(yīng)系數(shù)為ZTR,不需要參與量化編碼。
圖3 HVEZW編碼流程圖
為了驗證上述算法的正確性,對MPEG-4標(biāo)準(zhǔn)測試序列圖像Claire第15幀灰度圖像進(jìn)行EZW編碼壓縮和HVEZW編碼壓縮。如表1得出在不同的壓縮比下,得到的重構(gòu)圖像的PSNR及MSE。
表1 EZW和改DFEZW對Claire圖像編碼結(jié)果
通過對比能夠得出下面的結(jié)論:在相同的壓縮比下,應(yīng)用HVEZW算法,能夠提高重構(gòu)圖像的PSNR、降低圖像的MSE,明顯地提高了圖像編碼的效率,即在較低碼率的情況下仍能很好的恢復(fù)圖像。這主要是因為HVEZW算法在進(jìn)行零樹量化之前,對最低頻子帶進(jìn)行單獨處理,對高頻子帶進(jìn)行視覺加權(quán),這樣在不影響圖像整體壓縮比的情況下,提高了編碼效率和恢復(fù)圖像的品質(zhì)。如圖4,從視覺效果上來講,采用HVEZW算法重構(gòu)圖像的視覺效果,要比采用EZW算法的重構(gòu)圖像效果稍好。
圖4EZW編碼與DFEZW編碼結(jié)果比較
基于視覺特性的小波零樹圖像編碼壓縮方法,充分利用了小波系數(shù)的特點和人眼視覺特性,重建圖像的主觀效果比較好,達(dá)到了壓縮比高而失真度減少的目的。
[1]張旭東,盧國棟,馮 健.圖像編碼基礎(chǔ)和壓縮技術(shù)-原理、算法和標(biāo)準(zhǔn)[M].北京:清華大學(xué)出版社,2004.
[2]沃焱,韓國強,張 波.基于視覺特性的靜態(tài)圖象壓縮編碼[J].中國圖象圖形學(xué)報,2003,10(10):248-302.
[3]王 娜,賈傳熒.一種改進(jìn)的無表零樹編碼的圖像壓縮方法[J].電子學(xué)報,2003,31(6):879-881.
[4]沈蘭蓀,卓 力,田 棟,汪孔橋.視頻編碼與低速率傳輸[M].北京:電子工業(yè)出版社,2001.
[5]Kunt M,Kocher M.Second generation image coding techniques[J].Proceedings of the IEEE,1985,73(4):549-575.