趙國(guó)鋒,康戈文,孟繼成
摘 要:為了改進(jìn)視頻編碼的比特率,提出基于小波變換的位平面模型和廣義有限自動(dòng)機(jī)(GFA)的視頻壓縮。該算法是把一個(gè)連續(xù)畫面中(GOP)的視頻序列作為整體做小波變換,然后對(duì)小波系數(shù)的自適應(yīng)量化及位平面模型。幀間,頻帶間,位平面間都類似成為相同位平面模型。這樣可以更好地使用廣義有限自動(dòng)機(jī)(GFA)來壓縮位平面。最后用熵編碼方式編碼GFA描述的節(jié)點(diǎn)信息為可分級(jí)的比量流,它是一個(gè)高效可分級(jí)視頻編碼方案。以前多數(shù)不切實(shí)際的多媒體通信應(yīng)用將可能實(shí)現(xiàn)。
關(guān)鍵詞:視頻壓縮;廣義有限自動(dòng)機(jī);小波變換;位平面
中圖分類號(hào):TN91981文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X(2009)20-063-03
Video Coding Based on Wavelet Transform and GFA Modeling
ZHAO Guofeng,KANG Gewen,MENG Jicheng
(University of Electronic Science and Technology of China,Chengdu,610054,China)
Abstract:In order to improve the video coding in bitrates,a video coding scheme based on the statistical bitplane modeling and the Generalized Finite Automata (GFA) representation of video sequences in wavelet domain is presented.In the proposed scheme,a video sequence Group of Pictures (GOP) is represented as an overall binary image by bitplane modeling the coefficients of the video sequence within subbands using a generalized Gaussian quantizer,adaptive to the coefficient statistics of the video sequence.The inter-frame (motion),interband (frequency) and inter-bitplane (spectrum) similarities are optimally explored in the bitplane model,to form a compact GFA representation of the video sequence.Finally,all the transitions (edges) and the leaf nodes in the GFA representation are entropy encoded into a scalable bitstream.It is an effective scalable video coding scheme.Numerous multimedia communication applications,previously unpractical,should be envisaged with the low bitrates.
Keywords:video compression;generalized finite automata;wavelet transform;bitplane
0 引 言
隨著互聯(lián)網(wǎng)的飛速發(fā)展,消費(fèi)類電子、通信、影視及廣播、計(jì)算機(jī)技術(shù)日益緊密地結(jié)合起來,使得基于互聯(lián)網(wǎng)的多媒體產(chǎn)業(yè)成為本世紀(jì)初發(fā)展最快、規(guī)模最大的產(chǎn)業(yè)之一。在通信網(wǎng)絡(luò)上傳輸,數(shù)字視頻數(shù)據(jù)量的大小成為多媒體技術(shù)中非常重要的問題[1]。因此數(shù)據(jù)壓縮成為電子信息領(lǐng)域的重要技術(shù),數(shù)據(jù)壓縮意味著減少表示某信息(如一幅圖像) 所需的數(shù)據(jù)量,即減少容納給定信息集合或數(shù)據(jù)采樣集合的空間;這樣一種處理技術(shù)的應(yīng)用,可以有效地節(jié)省數(shù)據(jù)的存儲(chǔ)空間,并在一定程度上緩解因信道帶寬和容量不足給電子信息技術(shù)進(jìn)步帶來的問題。
H.264/AVC標(biāo)準(zhǔn)是當(dāng)前國(guó)際上最新的圖像編碼標(biāo)準(zhǔn)。它主導(dǎo)思想是基于塊的混合編碼方法。主要的技術(shù)有:4×4的整數(shù)變換與量化,基于空域的幀內(nèi)預(yù)測(cè),熵編碼采用CAVLC或CABAC,去塊效應(yīng)濾波器等[2]。
圖1 基于小波變換和GFA的
視頻壓縮編碼的系統(tǒng)框圖
1 小波變換
在此以小波變換和廣義有限自動(dòng)機(jī)編碼(GFA)的視頻壓縮算法[3],不像傳統(tǒng)的視頻壓縮算法用到I幀,P幀,B幀等概念,而是以視頻序列GoP(Group of Pictures)為單位做小波變換、量化、位平面、GFA(Generalized Finite Automata)、算術(shù)編碼。算法編碼示意圖如圖1所示。
小波變換是自1986年以來,迅速發(fā)展起來的一門新興學(xué)科。研究平穩(wěn)信號(hào)的理想工具是傅里葉分析,而非平穩(wěn)信號(hào)可以分解為小波的線性組合。小波分析在時(shí)域和頻域同時(shí)具有良好的局部化性質(zhì),能將圖像信號(hào)分解為與人類視覺特性相匹配的不同分辨率、不同方向特性的子帶,并使能量集中到某些子帶,為圖像的壓縮提供一個(gè)有效的手段[4]。
一維小波變換公式為:
當(dāng)f(x)∈L2(R)時(shí),
時(shí)域:
cwt(s,b)=1s∫f(x)ψx-bsdx
頻域:
CWT(s,w)=sF(w)Φ(sw)
二維小波變換公式為:
當(dāng)f(x)∈L2(R)時(shí),
時(shí)域:
cwt(s,a,b)=1s雈(x,y)ψx-as,y-bsdxdy
頻域:
CWT(s,w1,w2)=sF(w1,w2)Φ(sw1,sw2)
對(duì)于一維信號(hào)的正交小波分解和重構(gòu)均可通過子帶濾波的形式實(shí)現(xiàn),分別如圖2所示。
圖2 一維離散小波變換
對(duì)于二維圖像,以圖2分別在水平和垂直方向進(jìn)行濾波的方法實(shí)現(xiàn)二維圖像小波多辨率分解[5]。圖3為經(jīng)二維小波分解的頻帶劃分示意圖。
圖3 二維小波分解頻帶示意圖
小波變換本身并不直接引起比特率的減少,只是為減少比特率提供條件,還必須與量化技術(shù)結(jié)合才能達(dá)到壓縮目的。量化是通過降低整數(shù)的精度來減少存儲(chǔ)整數(shù)值所需位數(shù)的過程。通常對(duì)所得到的子帶,根據(jù)人類的視覺生理和心理特點(diǎn)分別做不同策略的量化處理,其中低頻子帶用小步長(zhǎng)量化,高頻子帶可以用大步長(zhǎng)進(jìn)行量化,以達(dá)到更好的壓縮效果。
經(jīng)過小波分解后,得到低頻子帶圖像依然保持原始圖像的概貌,但由于經(jīng)過多重低頻濾波后,能量高度集中,系數(shù)之間的相關(guān)性很強(qiáng)。各面高頻子帶包含原圖像在水平、垂直和對(duì)角線方向的高頻分量,因而其中大部分區(qū)域變化幅度不大,且能量低。所以低頻子帶用較多層位平面表示,高頻子帶用較少層位平面表示。
所謂位平面,是這樣的一個(gè)平面概念:在這個(gè)平面上的是圖像的某個(gè)數(shù)據(jù)位上的所有比特。比如對(duì)于24位真彩圖像,它的單個(gè)像素的紅色成分用一個(gè)字節(jié)來表示,則整幅圖像的紅色成分可以用8 個(gè)位平面來表示,從高位到低位依次是第7,第6,…,第1,第0位平面,每個(gè)位平面上包含了紅色成分字節(jié)中相應(yīng)數(shù)據(jù)位的比特值[6]。