傅建明,王冬慶
(1. 江西科技學院,江西 南昌 330098;2. 江西師范大學計算機信息工程學院,江西 南昌 330224)
現(xiàn)階段,多媒體領域對圖像信息的存儲和傳輸提出了更高的要求,也為現(xiàn)有的有限帶寬帶來了嚴峻的考驗。高質量的數(shù)字視覺圖像占用硬盤容量大,嚴重影響其存儲和傳輸,圖像壓縮過程是解決此問題的關鍵性技術。因此圖像壓縮技術受到了越來越多的關注[1]。在此背景下,機器視覺技術[2,3]在圖像中應用逐漸廣泛,機器視覺圖像壓縮就是用最少的代碼或符號表示出圖像的主要信息和內容。但是在圖像的壓縮過程其質量會受到影響,導致圖像細節(jié)信息丟失或特征模糊。
針對此問題,目前相關專家對圖像壓縮開展相應研究。鄭鐵[4]等人首先在單邊高斯預測器的幫助下預測圖像像素點以此消除圖像的空間相關性,其次運用格型濾波器選取出各個譜帶中的最優(yōu)濾波器,從而生成預測誤差,最終依據(jù)格型濾波器自身特性簡化濾波器篩選經(jīng)過,以此簡化圖像編碼,完成圖像壓縮,實現(xiàn)機器視覺圖像壓縮。趙輝[5]等人首先構建正則化約束項構建優(yōu)化模型,其次通過分裂Bregman迭代將圖像壓縮問題劃分成多個子問題,獲取每個子問題答案,并將所有問題答案結合生成最終的壓縮結果,實現(xiàn)機器視覺圖像壓縮。
以上兩種方法在圖像壓縮過程中忽略了對圖像的分塊預處理,導致圖像的公共位圖得出的結果不準確,極可能忽略部分像素點,存在壓縮效果差以及峰值信噪比低的問題。為了解決上述方法中存在的問題,提出基于煙花算法的機器視覺圖像分塊壓縮方法。
本文機器視覺圖像壓縮的前提是對圖像分塊壓縮,為了確保壓縮效果,利用圖像的自適應方法進行分塊[6,7]。
為了完美表示出機器視覺圖像的紋理以及邊緣等特征結構,同時也能很好地調控分塊的復雜度,需要在圖像稀疏變換[8]前計算出圖像像素的灰度差值,并將其視為圖像分塊的依據(jù),則圖像像素灰度差的平均值計算公式為
(1)
自適應分塊算法[9,10]是通過四叉樹算法實現(xiàn)的,即通過機器視覺圖像的紋理變化將圖像劃分成等大的圖像塊,高效完成平坦區(qū)域和復雜區(qū)域的劃分,從而得出機器視覺圖像的自適應分塊,圖像分塊流程圖如圖1所示。
圖1 機器視覺圖像自適應分塊流程
根據(jù)圖像分塊流程圖可知,分塊過程中需要計算出分塊閾值,將分塊閾值標記為P,由于P是由機器視覺圖像中鄰近像素點之間灰度差平均值得出的,則表達式為
(2)
基于圖1的流程,結合式(1)和式(2)完成圖像的自適應分塊。
利用BTC方法處理分塊圖像的R、G、B通道,生成位圖Ro、Go和Bo,則機器視覺分塊圖像中位于點(i,j)的初始公位圖元素點的表達式為
(3)
將初始公共位圖AM的元素β集合生成向量S,其表達式為
S=(β1,β2,…,βN)
(4)
根據(jù)式(3)和式(4)即可計算出初始公共位圖AM,為了生成最優(yōu)公共位圖,需要提前對向量S進行初始化處理[11],為保證初始化后的向量S不會對其余元素產(chǎn)生影響,只能選用W-plane算法完成初向量S的初始化處理,通過對子圖像的預處理得出最優(yōu)公共位圖以此加強最終的壓縮效果。
經(jīng)過分塊處理后的子圖像每個像素點均存在對應的散射點,因此對分塊機器視覺圖像的壓縮就即為對像素點的壓縮,而位圖就是由單個像素組成的,因此分塊圖像壓縮實質上就是對位相的壓縮。
對分塊圖像預處理并生成初始化的向量S后,使用煙花算法優(yōu)化向量S,進而獲取相應的位圖以及量化值,在煙花算法[12,13]中通過均方誤差[14]得出所需評價函數(shù),進而求解出煙花算法的適應度值,其計算公式為
H(Xi)=
(5)
式中,U和J均代表公共位圖元素的位置標記,Xi代表煙花個體,Eij代表煙花個體相應的位圖在點(i.j)的值,bRJ、bGJ、bGJ、bRU、bGU和bBU均代表煙花個體相應的量化值,Rij代表分塊圖像權重與通道R在點(i.j)處的灰度值,Gij代表分塊圖像權重與通道G在點(i.j)處的灰度值,Bij代表分塊圖像權重與通道B在點(i.j)處的灰度值。
煙花算法在開始計算前需要將煙花種群進行初始化處理,則初始化后的煙花種群表達式為
(6)
式中,t(1,l)代表維度為l的二進制向量,e代表初始化的煙花數(shù)量。
經(jīng)過初始化處理后的煙花種群即可將煙花根據(jù)行數(shù)進行排列得出完整的位圖Eh,進而求解出各個煙花相應的量化值,其表達式為
(7)
式中,w代表位圖Eh值為1的元素數(shù)量。
根據(jù)式(5)計算出的適應度值,求解出各個煙花的爆炸火花個數(shù)以及爆炸半徑,其計算公式分別為:
(8)
式中,I代表固定常數(shù),χ代表機器視覺的最小量,Ymax代表適應度的最大值,Ymin代表適應度的最小值。
煙花算法中對于每個煙花來說其爆炸范圍的數(shù)量以及爆炸半徑任意生成的,從而得出爆炸范圍的火花元素計算公式為
(9)
其中,h代表煙花算法的爆炸范圍,ri代表爆炸火花點在點i處的元素,Li代表煙花個體在點i處的元素。
根據(jù)式(9)即可獲取爆炸范圍內的爆炸火花。
高斯變異火花的獲取也必須提前計算出每個煙花中高斯變異火花各處的元素值,其計算公式為
qi=|Li-1|
(10)
式中,qi代表高斯變異火花點i的元素值。
根據(jù)式(9)和(10)得出爆炸火花以及高斯變異火花,在煙花以及上述兩種火花中選取出適應度最小的火花視為新生代煙花種群。
不斷重復上述步驟,直到完成迭代,將適應度最小的煙花視為向量S的最優(yōu)值,在最優(yōu)向量S上得出與之對應的完整位圖以及6個量化值,進而得出效果最佳的壓縮圖像。
經(jīng)過煙花算法的機器視覺圖像壓縮僅僅是針對位圖的壓縮[15],因此還需要將分塊圖像進行重構[16,17],在完整位圖以及6個量化值的幫助下得出子圖像塊的重構公式為
(11)
通過以上步驟完成機器視覺圖像的分塊像素點壓縮。
為了驗證基于煙花算法的機器視覺圖像分塊壓縮方法整體的應用性能,采用提出方法、文獻[4]提出的基于格型遞歸最小二乘濾波器組的高光譜圖像壓縮方法以及文獻[5]提出的基于結構組全變分模型的圖像壓縮方法設計對比實驗,完成壓縮效果以及峰值信噪比的仿真測試,測試結果如下所示。
機器視覺圖像壓縮可以在保證圖像數(shù)據(jù)完整的基礎上占用最小的系統(tǒng)空間,所以經(jīng)過壓縮后的圖像較原圖像對比其圖像清晰度較低,但壓縮過強會導致圖像數(shù)據(jù)不完整,根據(jù)這一標準,隨機選取一幅機器視覺圖像,利用提出方法、文獻[4]提出的基于格型遞歸最小二乘濾波器組的高光譜圖像壓縮方法以及文獻[5]提出的基于結構組全變分模型的圖像壓縮方法對實驗圖像實現(xiàn)壓縮方法,現(xiàn)已知三種圖像的壓縮比例一致,將三種方法的壓縮結果進行比較,清晰度越高即內容數(shù)據(jù)越完整,即壓縮效果最好,實驗結果如圖2所示。
圖2 不同方法的圖像壓縮效果對比
根據(jù)圖2的不同方法處理結果可知,提出方法壓縮后的圖像清晰度沒有發(fā)生改變,這主要是因為該方法在圖像壓縮過程中對圖像實現(xiàn)了預處理,保證公共位圖的計算精度,進而確保壓縮過程中不會遺漏任何像素點,從而保證圖像的信息完整,以此優(yōu)化了圖像壓縮效果。文獻方法經(jīng)過壓縮后的圖像清晰度均有所降低,這是因為圖像經(jīng)過重新編碼和重構將多余數(shù)據(jù)和色彩等無用排除,僅僅留下必要數(shù)據(jù)導致的。
峰值信噪比RPSN是衡量圖像壓縮性能最有效的指標之一,壓縮圖像的峰值信噪比可直接反映出壓縮圖像的逼真度,進而高效評價出圖像質量,峰值信噪比的公式如下所示
(12)
式中,κ代表壓縮圖像的行向像素點數(shù)量,λ代表代表壓縮圖像的列向像素點數(shù)量,F(xiàn)(i,j)代表原始圖像在點(i,j)的分辨率值,F(xiàn)′(i,j)代表壓縮圖像在點(i,j)的分辨率值。
由于部分壓縮后的圖像無法用人眼識別圖像壓縮的好壞,此時可用峰值信噪比RPSN進行評價,峰值信噪比RPSN實質上是在客觀的角度,衡量原始圖像以及壓縮后圖像的逼真程度,通常情況下逼真度較好時峰值信噪比RPSN均大于30dB,當壓縮后的圖像RPSN越大,則說明圖像清晰度越高,即保證壓縮要求的情況下與原始圖像越相似。在同一實驗環(huán)境下利用三種方法對多組圖像進行壓縮,且每張圖像的質量和像素點均不相同,通過式(12)計算出每種方法壓縮結果的峰值信噪比,從而得出最佳壓縮方法,實驗結果如表1所示。
表1 三種壓縮圖像方法應用下的峰值信噪比/dB
根據(jù)實驗結果可知,提出方法下的每組實驗圖像其峰值信噪比均遠遠大于30dB,說明提出方法壓縮后的圖像清晰度較高,本文壓縮圖像信噪比與其余兩種方法相比均高出許多,而結構組全變分模型的圖像壓縮方法只有部分壓縮圖像的峰值信噪比大于30dB,說明該方法壓縮效果不穩(wěn)定,最終呈現(xiàn)的圖像逼真度較低,從而證明了提出方法壓縮性能強。
圖像壓縮可大大降低圖像所需存儲空間,但部分圖像壓縮后的會出現(xiàn)圖像數(shù)據(jù)不完整等問題,為此,提出基于煙花算法的機器視覺圖像分塊壓縮方法,對機器視覺圖像分塊預處理,在此基礎上利用煙花算法對圖像實時壓縮處理,實現(xiàn)機器視覺圖像分塊壓縮,解決了壓縮效果差以及峰值信噪比低的問題,最大程度保留了圖像信息。