王 鳳, 萬智萍
(中山大學新華學院,廣東 廣州 510520)
隨著信息技術的發(fā)展,數(shù)字圖像的處理技術被運用到生活中的方方面面;但隨著人們對圖像數(shù)據量與分辨率的要求提高,給數(shù)據的存儲與傳輸帶來了很大的不便;如在日常生活中,圖像壓縮問題隨處可見,如將一張1280×1024的圖像,按每個像素24比特率將其存儲,那么其數(shù)據量將超過30兆等;因此,對圖像的如何有效的進行壓縮顯得尤為重要,也是當前社會的一大研究熱點。圖像的壓縮算法能夠對原本較大的圖像信號進行壓縮,使其方便于數(shù)據的傳輸與交換;從最初的傅里葉變換在現(xiàn)如今的小波變換[1-5],諸多研究學者提出了許多創(chuàng)新的算法,其中具有代表性的有二維離散小波變換[6]、EZW算法[7]和SPIHT算法[8];但通過對算法的研究發(fā)現(xiàn),EZW 算法雖然實現(xiàn)簡單,卻存在編碼效率低的問題;而SPITH算法雖然能夠有效的提高了編碼效率,卻由于算法過程復雜而不利于硬件實現(xiàn);因此,本文采用離散二維小波變換函數(shù),該函數(shù)通過建多尺度分析思想,最后形成了統(tǒng)一的小波函數(shù)構造理論,繼承了短時傅立葉變換局部化的思想,同時又克服了窗口大小不隨頻率變化等缺點,被很好的運用于圖像處理領域。
通過對離散二維小波變換的研究,并根據其具有的局部化特性,本文對圖像進行分頻處理,其中圖像的最低低頻子帶,本文通過利用人眼的視覺敏感特性,將其分為敏感區(qū)與非敏感區(qū),并結合其敏感度計算公式,提出小波系數(shù)的閾值保留算法,將圖像的非敏感區(qū)小波系數(shù)置零,來減少圖像的數(shù)據冗余;而對于圖像的高頻子帶,則是根據小波變換后各子帶的方向性,通過結合各子帶中幅角的不同對其各方向的高頻子帶進行邊緣閾值判斷處理,來提高算法的編碼效率,從而實現(xiàn)算法的最優(yōu)化,使算法更加適用于圖像的實時傳輸。
離散二維小波變換的一般表達式為:
對于可分離情況,尺度函數(shù):
通過結合公式尺度函數(shù))(xφ與小波函數(shù))(xψ
最終得到小波的分解函數(shù)為:
為了更為清晰的了解各子帶的情況,本文采用MATLAB 7.10.0軟件對圖像進行仿真,其仿真的圖像為 256×256像素的 8bit灰度測試圖像flower,經過仿真,得圖1為小波變換的仿真分解圖。
圖1 小波變換的仿真分解圖
小波算法分析:根據圖1的小波變換仿真分解圖,我們可以看出圖像的主要信息集中與圖像的最低頻子帶LL3中,而體現(xiàn)的細節(jié)信號主要分布于其他高頻子帶中;在傳統(tǒng)的小波算法的壓縮與處理的過程中,通常只考慮到對其高頻子帶進行處理;為了保證圖像的質量,而放棄了對其最低頻子帶的處理,而忽略了最低頻子帶中也含有一些不必要的圖像信號;而研究發(fā)現(xiàn),在圖像的最低低頻子帶中存儲著圖像的大體信息,如果能夠有效對其進行處理,將有利于保證圖像的提高算法的壓縮效率。
為了有效的對圖像進行壓縮,本文根據人眼的視覺敏感度[9],對圖像的最低低頻子帶進行壓縮,其中人眼的視覺敏感度公式如下所示;
Al=0.81((1+0.7)/l)-0.2;Pmax為視覺敏感度的絕對峰值。通過仿真驗證可以得到。
通過采用人眼的視覺敏感度公式,經過仿真得圖2,由圖2我們可以清楚的看到,圖像信號的敏感度比較集中在中頻區(qū)域,而在圖像的高頻區(qū)域呈指數(shù)遞減的狀態(tài);由此可知,人眼的視覺敏感特性在圖像的高頻信號的敏感度不高;而對圖像中的低頻、中頻區(qū)域比較敏感并且其敏感度比較集中。
圖2 人眼對各頻率的敏感度
為了更加精確的到達圖像信號的分類,本文通過插入一個適當?shù)拈撝担x為閾值1λ,來對圖像信號進行分類,將各子帶中的頻率分為視覺的敏感區(qū)域與非敏感區(qū)域,并對其進行分類處理,來實現(xiàn)算法的最優(yōu)化;即:
其中sV表示的是人眼視覺敏感度的大小。
針對以上現(xiàn)象,本文通過結合人眼的固有特性的敏感度性質,對圖像的最低頻子帶LL3采用閾值保留壓縮算法;由于人眼對高頻區(qū)域具有較低的視覺敏感度,而對低頻、中頻區(qū)域具有較高的敏感度;因此,本文通過引入閾值保留法,對最低低頻子帶的視覺不敏感區(qū)域進行閾值處理;在保證圖像視覺效果的同時將圖像中的最低低頻子帶中的小波系數(shù)置零,從而減少算法的編碼數(shù)量,有效的提高算法的壓縮效率。其閾值保留算法公式如下所示。
其中i jω,為小波系數(shù),sV為人眼的視覺敏感度。
通過采用該方法來保證傳輸視覺上的敏感信號,為算法的壓縮提供了一個良好的條件;由于算法閾值λ1定了壓縮質量的好壞,當閾值選取過大時,會使壓縮質量下降;而當閾值選取過小時,又會造成壓縮效果不佳;為此,本文對閾值進行定義,通過多次的試驗;通過仿真得到出:當圖像為高頻、中頻以及低頻圖像時,其所得圖像的最佳閾值分別為 0.117、0.125和 0.126;為了使算法適應于各個頻率的圖像,本文取其平均值,則令閾值λ1的取值為0.124。
波變換的分析,可知圖像的細節(jié)信號主要存儲于圖像的高頻子帶中,而圖像的高頻子帶被分3個方向的頻率子帶,分別為水平方向、垂直方向以及對角線方向上的高頻子帶;為了更快的搜索出各子帶中的最小波變換系數(shù)模的局部極大值點,本文通過分析傳統(tǒng)的邊緣檢測算法;發(fā)現(xiàn)在傳統(tǒng)的邊緣檢測算法中[10],大多采用的是對其目標的進行搜索,并對其目標點周圍進行各方向的搜索,這樣雖然能夠得到較為精確的模級值,卻無法快速有效的進行邊緣優(yōu)化,也沒能有效的利用小波變換后的各子帶的方向特性;因此,本文根據高頻再帶中的方向特性,將高頻子帶分為3類,分別進行模的局部極大值點搜索,即分為水平、垂直以及對角線這3個方向進行搜索,圖3為各梯度方向上的模取局部極大值類型圖,如圖3所示。
圖3 各梯度方向上的模取局部極大值類型
已知小波變換可以得到f(t)的小波變換:
則有可知其偏微分為:
則可以證明ψ(1x,y)、ψ(2x,y)可以作為二維小波變換的基函數(shù),即:
定義二維圖像信號f(x,y)的二進小波變換的函數(shù)表達式為:
則可以得到在尺度 2j時函數(shù)f(x,y)小波變換的模與幅角表達函數(shù)分別如下所示:
通過研究發(fā)現(xiàn),平滑后的函數(shù)突變點在相應的A2jf(x,y)上M2jf(x,y)的局部極大值點上,由此在搜索局部極大值的時候,只需沿著A2jf(x,y)檢測M2jf(x,y)就能夠得到函數(shù)的突變點。這樣有效的減少算法的搜索時間與計算量。因此,本文對其A2jf(x,y)進行分類,并在其上進行模的極值點進行判斷,其判斷過程如下所示:
步驟4將獲得的模的極值采用閾值判斷公式:
在候選邊緣點中,判斷是否為邊緣點,并將非邊緣信號置零,進而判斷出模的局部極大值點。
通過采用A2jf(x,y)來獲得小波變換模的級值,從而減少算法的計算量,而通過M2jf(x,y)來獲得圖像的邊緣信號。通過邊緣的判斷定理,來將邊緣信號有效的表達出來。
步驟 1開始;
步驟 2小波變換,對圖像進行3級小波分解,從而得到不同級別不同序號的子帶 LL3、HL3、LH3、HH3……HL1、LH1、HH1;
步驟 3對 LL1子帶單獨進行基于人眼視覺敏感特性的閾值保留算法;
步驟 5將獲得的各方向上的模值,并采用閾值的判斷公式(20);將獲得的小波模值M2jf(x,y)與閾值λ2進行比較,最終獲得各個方向子帶的圖像邊緣信號,則轉入下一步;
步驟 6首先恢復低頻子圖的圖像,然后再恢復不同方向上的高頻子帶圖像,通過結合最新獲取的小波系數(shù),對其進行逆小波變換得到重建圖像最后完全恢復圖像;
步驟 7結束。
為了驗證改進后的小波變換圖像壓縮算法的壓縮效果、壓縮效率等特性,本文選取的測試工具是 MATLAB,并與傳統(tǒng)的壓縮算法進行對比,證明改進的算法的優(yōu)越性。
1) 實驗環(huán)境簡介
在多次實驗中,發(fā)現(xiàn)小波變換在圖像分解與恢復的過程中分解為3層,其圖像的壓縮效果最好與圖像的編碼計算量最為適中,故這里用小波對256×256像素的8bit灰度測試圖像cat,F(xiàn)lower以及beans分別進行3級小波分解。小波系數(shù)的編碼采用的是SPIHT模型,實驗用計算機處理器為core i5、軟件為Matlab7.10.0;分解過程中對第二級小波分解的低頻子帶直接進行視覺閥值保留算法,塊匹配分形預測編碼從第三級3個高頻子帶開始。快速子帶算法匹配塊的大小根據子帶分辨率的不同從低到高分別為:4×4, 8×8,12×12。經過多次分析與總結,得到閾值λ1的取值為0.124。
2) PSNR測試與分析
峰值信噪比 PSNR 是最普遍,最廣泛使用的評鑒畫質的客觀量測法;經過算法圖像壓縮后,輸出的圖像通常都會與原始圖像有某種程度不一樣。為了衡量經過處理后的圖像的品質,采用PSNR 值對其進行評價,其中PSNR的單位為dB;因此,它的值越大,代表圖像的失真越少。
仿真中對具有高頻、中頻、低頻成分組成的cat,F(xiàn)lower,beans這3種灰度圖像進行實驗,通過對比這 3種不同組成頻率,來驗證算法中對不同頻率圖像的壓縮效果,進而對算法性能進行分析,經仿真,得圖4為cat圖像的壓縮效果圖,圖5為flower圖像的壓縮效果圖,圖6為beans圖像的壓縮效果圖,如圖4、圖5、圖6所示。
圖4 Cat圖像的壓縮效果圖
圖5 Flower圖像的壓縮效果圖
通過觀察圖發(fā)現(xiàn),圖像cat主要由高頻信號組成,而本文采用的是視覺敏感度壓縮方法,在圖像的最低低頻子帶中采用圖像的閾值保留算法,使得圖像的視覺不敏感區(qū)系數(shù)置零,進而對其進行壓縮,因此,從仿真圖4我們可以看出,本文的圖像壓縮效果與EZW與SPIHT相比,盡管圖4中本文算法有些區(qū)域不自然,但總體效果優(yōu)于EZW;而通過觀察圖5和圖6,由于本文算法對圖像的敏感區(qū)域有著保護作用,即對圖像的低、中頻信號進行了保護;而圖像Flower與beans其主要成分分別為中頻、低頻信號,因此在對這兩個仿真圖像進行壓縮時,能夠有效的發(fā)揮了本文算法的優(yōu)越性,最終由仿真圖5與圖6我們可以清楚的看到,經過壓縮后的圖像,本文算法的壓縮質量優(yōu)越EZW與SPIHT。
比較上述3種算法的壓縮效率,本文是通過減少圖像的冗余信息來,來減少算法的計算量,從而實現(xiàn)算法的實時壓縮的;經實驗,有效的證明了本文在壓縮圖像方面上的低耗時優(yōu)勢,其實驗數(shù)據圖7為各算法壓縮時間對比圖,其中壓縮時間單位為秒,如圖7所示。
圖7 各算法的壓縮時間對比圖
為了更為清晰的證明本文算法在圖像壓縮方面的優(yōu)越性,對其PSNR值進行仿真,得圖8為cat數(shù)據PSNR曲線圖、圖9為Flower數(shù)據PSNR曲線圖、圖10為beans數(shù)據PSNR曲線圖,如圖8、圖9、圖10所示。
圖8 Cat數(shù)據PSNR曲線圖
圖9 Flower數(shù)據PSNR曲線圖
圖10 Beans數(shù)據PSNR曲線圖
通過觀察各算法的PSNR曲線圖可以看到,當圖像的主要由高頻信號組成的時候本文算法的壓縮效果弱于SPIHT與EZW,但其效果與這兩種效果相差無幾;而當圖像的主要組成成份為中頻、低頻時,其圖像的壓縮效果優(yōu)于SPIHT與EZW,其PSNR值比SPIHT平均高2dB,尤其當圖像主要由低頻信號組成時,本文算法的壓縮效果最佳,從PSNR曲線圖可以看到,本文算法始終保持在SPIHT與EZW曲線上方,其中PSNR值平均高3.5dB左右,而相比EZW算法的PSNR值最高高達5.8dB。
本文通過在小波變換中增加閾值的形式,來減少圖像中的數(shù)據冗余,通過結合人眼的視覺敏感度,根據圖像的頻率大小,對圖像的最低子帶其進行分類,并對非敏感區(qū)小波系數(shù)置零;高頻子帶則是結合小波變換的方向性,根據各子帶中幅角的不同對其分類,最終實現(xiàn)算法的邊緣保留,來減少算法中不必要的計算;實驗結果表明,本文算法在高頻圖像中的效果一般,而對于低頻、中頻圖像具有較好的壓縮效果,其中對低頻圖像的壓縮效果最佳;并且具有低耗時的圖像壓縮優(yōu)勢,與預期的效果相符,具有一定的實用價值。
[1]Vijaya C, Bhat J S. Signal compression using discrete fractional Fourier transform and set partitioning in hierarchical tree [J]. Elsevier. 2006, 86(8):1976-1983.
[2]Ye J C, Bresler Y, Moulin P. A Self-Referencing Level-Set Method for Image Reconstruction from Sparse Fourier Samples [J]. Kluwer Academic Publishers, 2002, 50(3): 253-270.
[3]Lisowska A. Extended wedgelets: geometrical wavelets in efficient image coding [J]. Polish Academy of Sciences, 2004, 13(3): 261-273.
[4]Ates H F, Orchard M T. Spherical coding algorithm for wavelet image compression [J]. Institute of Electrical and Electronics Engineers, 2009, 18(5):1015-1024.
[5]Pan Hong, Jin Lizuo, Yuan Xiaohui, Xia Siyu, Xia Liangzheng. Context-based embedded image compression using binary wavelet transform [J].Butterworth-Heinemann, 2010, 28(6): 991-1002.
[6]Lefebvre A, Corpetti T, Moy L H. Estimation of the orientation of textured patterns via wavelet analysis [J].Elsevier Science, 2011, 32(2): 190-196.
[7]Tohumoglu G, Sezgin K E. ECG signal compression by multi-iteration EZW coding for different wavelets and thresholds [J]. Pergamon Press, 2007, 37(2):173-182.
[8]Pan Hong, Siu W C, Law N F. A fast and low memory image coding algorithm based on lifting wavelet transform and modified SPIHT [J]. Elsevier Science Inc, 2008, 23(3): 146-161.
[9]Fang Yuming, Lin Weisi, Lee B S, Lau C T, Chen Z Z,Lin C W. Bottom-Up saliency detection model based on human visual sensitivity and amplitude spectrum [J]. IEEE Press, 2012, 14(1): 187-198.
[10]Zhang Zhen, Ma Siliang, Liu Hui, Gong Yuexin. An edge detection approach based on directional wavelet transform [J]. Pergamon Press, 2009, 57(8):1265-1271.