胡育濤,錢 慧,余 輪
(福州大學(xué) 物理與信息工程學(xué)院,福建 福州350002)
傳統(tǒng)視頻編解碼算法(MPEG,H.26x)的復(fù)雜度集中在編碼端,編碼端的復(fù)雜度是解碼端的5~10倍,適合一些編碼端有較強(qiáng)運(yùn)算能力的場(chǎng)合。但是這種編碼器因其編碼端的高復(fù)雜度很難適用于無線傳感器網(wǎng)絡(luò),如移動(dòng)視頻攝像等使用小型、低功耗的便攜設(shè)備中。分布式視頻編碼(DVC)[1]技術(shù)是為了適應(yīng)低復(fù)雜的編碼而出現(xiàn)的視頻編碼框架,它利用視頻信號(hào)的時(shí)間、空間相關(guān)性,結(jié)合Slepian-Wolf[2]無損編碼理論和Wyner-Ziv[3]有損編碼理論,把復(fù)雜的運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償技術(shù)從編碼端轉(zhuǎn)移到解碼端。
然而,目前大多數(shù)的DVC采用DCT變換編碼的方法壓縮信息。該種方法通常對(duì)非關(guān)鍵幀進(jìn)行DCT變換,然后利用邊信息和非關(guān)鍵幀之間的相關(guān)關(guān)系壓縮視頻信號(hào)的DCT系數(shù)。該種處理方法在對(duì)視頻信號(hào)進(jìn)行變換后再拋棄冗余數(shù)據(jù),因此DCT變換環(huán)節(jié)存在大量的信號(hào)處理冗余。
近幾年來,以“邊變換邊壓縮”為思想的壓縮感知(Compressive Sensing,CS)[4-5]理論越來越受到人們的關(guān)注,是當(dāng)前信號(hào)處理領(lǐng)域的一個(gè)研究熱點(diǎn)。壓縮感知理論認(rèn)為[6]:只要信號(hào)是可壓縮的或是在某個(gè)變換域是稀疏的,此時(shí)可以利用測(cè)量矩陣將此高維信號(hào)投影到低維空間上,然后利用這些少量的投影值使用求解算法重構(gòu)出原始信號(hào)。壓縮感知的顯著特點(diǎn)是把變換與壓縮有效地結(jié)合起來,從而降低編碼端的復(fù)雜度,提高編碼效率。
2009年Baron等人提出了分布式壓縮感知的概念(DCS)[7],它把壓縮感知理論擴(kuò)展到分布式相關(guān)信源編碼中。分布式壓縮感知與傳統(tǒng)壓縮感知不同,它是建立在信號(hào)集“聯(lián)合稀疏(Joint Sparity Model,JSM)”的假設(shè)之上,利用信號(hào)間的相關(guān)性進(jìn)行編解碼。在視頻序列中,同一場(chǎng)景的視頻圖像之間具有較強(qiáng)的相關(guān)性,可以把它們看作是一種特殊的相關(guān)信源,Thong T.Do提出的DISCOS[8]和Kang提出的DCVS都屬于分布式視頻壓縮感知(Distributed Compressive Video Sensing)[9],所不同的是Thong T.Do對(duì)關(guān)鍵幀采用幀內(nèi)編碼,非關(guān)鍵幀采用CS編碼,而Kang則是兩種幀都采用了CS編碼。同時(shí),使用當(dāng)前幀與參考幀差值的稀疏性進(jìn)行殘差重構(gòu)[10],也可以使重構(gòu)質(zhì)量有所提高。
假設(shè)長(zhǎng)度為N的信號(hào)x∈RN,在某個(gè)正交基Ψ(如小波基、DCT基)下是稀疏或是可壓縮的,則x可表示為x=ΨTθ,其中θ是信號(hào)x在正交基下的變換系數(shù),如果θ大于0的個(gè)數(shù)為K,若K≤N,則稱θ為K稀疏。如果存在一個(gè)與Ψ不相關(guān)的測(cè)量矩陣Φ(M×N),那么根據(jù)式(1)可得到x的測(cè)量值y。編碼見式(1)
解碼見式(2)
式中:y是1個(gè)M×1的向量(M?N),可定義測(cè)量率MR=M/N。
解碼端根據(jù)接收到的測(cè)量值y,根據(jù)式(2)解l0范數(shù)優(yōu)化問題得到重構(gòu)系數(shù)θ,其中求解l0范數(shù)優(yōu)化問題的本質(zhì)是一個(gè)NP難的問題,計(jì)算復(fù)雜,求解較難,因此Donoho[4]將此問題用l1范數(shù)進(jìn)行求解,求解方法有貪婪追蹤法(OMP[11])、梯度投影法(GPRS[12])等,然后根據(jù)求得的θ反變換后得到原始信號(hào)X。同時(shí)S.Mun等使用平滑投影LandWeber算法(Smoothed Projected LandWeber,SPL)[13]取得較好的效果。
分布式壓縮感知(DCS)理論建立在信號(hào)群的“聯(lián)合稀疏”的概念上,其主要思想是在編碼端利用聯(lián)合稀疏模型對(duì)每個(gè)信號(hào)進(jìn)行獨(dú)立觀測(cè)和編碼,取得較少的觀測(cè)數(shù)量,而在解碼端利用各個(gè)信號(hào)間的相關(guān)性進(jìn)行聯(lián)合解碼。Baron在DCS中定義了3種不同的聯(lián)合稀疏模型[7],分別適用于3種不同場(chǎng)合,其中JSM-3更適合視頻信號(hào)。
針對(duì)JSM-3的描述如下
式中:zC=ΨθC代表公共部分;zUj=ΨθUj代表了每個(gè)信號(hào)的特有部分。在這里,信號(hào)的公共部分不一定在基Ψ上稀疏,而特有部分在基Ψ上稀疏的,因此,在解碼時(shí)需要利用它們之間的共有公共部分壓縮信息,然后進(jìn)行聯(lián)合解碼,如果兩個(gè)信號(hào)之間的相關(guān)性越強(qiáng),那么聯(lián)合重構(gòu)出的效果也會(huì)越好。本文通過構(gòu)建兩個(gè)相關(guān)性很強(qiáng)的視頻信號(hào)用以重構(gòu)原始的視頻信號(hào)。
邊信息產(chǎn)生方法有直接平均值、前向運(yùn)動(dòng)估計(jì)、后向運(yùn)動(dòng)估計(jì),雙向運(yùn)動(dòng)估計(jì)等。本文產(chǎn)生邊信息的方法是運(yùn)動(dòng)補(bǔ)償內(nèi)插法[14],它在內(nèi)插過程中,利用前后相鄰(Xi-1,Xi+1)已解碼圖像,通過一系列的操作使運(yùn)動(dòng)矢量盡可能接近運(yùn)動(dòng)目標(biāo)的真實(shí)運(yùn)動(dòng)軌跡,使產(chǎn)生的邊信息(Yi)更接近目標(biāo)幀。
本文對(duì)視頻信號(hào)采用基于塊的CS測(cè)量,塊大小為32×32,采用獨(dú)立同分布的高斯隨機(jī)矩陣ΦB作為測(cè)量矩陣,分別用前一幀、后一幀、平均值、運(yùn)動(dòng)補(bǔ)償內(nèi)插[14]作為邊信息得到各個(gè)塊的殘差重構(gòu),其重構(gòu)信號(hào)的PSNR如圖1所示。雖然運(yùn)動(dòng)補(bǔ)償內(nèi)插法生成的邊信息與原始視頻信號(hào)相似性更高,但從圖中可以看出此方法的邊信息重構(gòu)的效果在有些塊上會(huì)比其他方法的邊信息重構(gòu)的效果差,為此在編碼端利用簡(jiǎn)單的“塊相似性判斷”決定每個(gè)塊使用哪種方法生成邊信息,從而提高重構(gòu)質(zhì)量。通過對(duì)運(yùn)動(dòng)補(bǔ)償內(nèi)插產(chǎn)生的邊信息進(jìn)行優(yōu)化,這樣能使優(yōu)化后的邊信息與原始視頻幀的相關(guān)性更強(qiáng),使它們之間的差值更加稀疏,從而使重構(gòu)的效果更好。
圖1 foreman.cif的第2幀,CS塊采樣率MR=50%,不同方法的邊信息得到各個(gè)塊的重構(gòu)效果比較
通過上面的分析,本文提出一種新的基于邊信息的分布式視頻壓縮感知的殘差重構(gòu)方案,如圖2所示。
2.3.1 編碼端
依據(jù)DVC的基本思想,對(duì)關(guān)鍵幀采用傳統(tǒng)的幀內(nèi)編碼,而非關(guān)鍵幀采用基于塊的CS測(cè)量得到測(cè)量值yj。其中在“塊相似性判斷”部分,對(duì)相鄰視頻塊間進(jìn)行簡(jiǎn)單的相似性判斷,即對(duì)當(dāng)前非關(guān)鍵的第i幀的第j塊(xi,j)與前(xi-1,j)、后(xi+1,j)幀的相應(yīng)塊及其平均值((xi-1,j+xi+1,j)/2)分別進(jìn)行差值運(yùn)算,設(shè)定一個(gè)閾值T,根據(jù)3個(gè)差值中是否存在最小值小于T,發(fā)送一個(gè)標(biāo)志位作為解碼端邊信息的優(yōu)化,在本文中定義標(biāo)志位flag的值為[0,1,2,3 ]分別表示與xi,j最相似的塊不存在或者是xi-1,j,xi+1,j,(xi-1,j+xi+1,j)/2。
圖2 基于邊信息的分布式視頻壓縮感知的殘差重構(gòu)框架
2.3.2 解碼端
根據(jù)收到的標(biāo)志位(flag)對(duì)運(yùn)動(dòng)補(bǔ)償內(nèi)插法產(chǎn)生的邊信息進(jìn)行優(yōu)化,優(yōu)化方法為
式中:x'i-1,j,x'i+1,j分別表示當(dāng)前預(yù)測(cè)幀塊通過幀內(nèi)解碼的前、后幀塊,這樣就得到了優(yōu)化后的預(yù)測(cè)幀,它與原始幀有更好的相關(guān)性。
對(duì)優(yōu)化后的邊信息進(jìn)行基于塊的測(cè)量,對(duì)于第i幀的第j塊有測(cè)量值,因此,可以得到隨機(jī)投影域的殘差yri,j,即
式中:xri,j表示原始視頻幀塊xi,j與預(yù)測(cè)塊之間的差值;yi,j為所接收到的測(cè)量值,但是在這里xi,j是未知的。最后利用SPL算法得到重構(gòu)的預(yù)測(cè)差值xri,這樣就得到了對(duì)原始幀的估計(jì),即
具體的解碼算法步驟為:
1)根據(jù)已解碼的關(guān)鍵幀,利用運(yùn)動(dòng)補(bǔ)償內(nèi)插法生成初始邊信息;
2)利用式(4)進(jìn)行邊信息優(yōu)化;
3)對(duì)每個(gè)塊j有
5)利用SPL算法得到重構(gòu)的預(yù)測(cè)差值xr;
為了驗(yàn)證本文所提出的壓縮編碼方法對(duì)邊信息的處理能力,本文選取視頻測(cè)試序列運(yùn)動(dòng)細(xì)節(jié)較多的foreman.cif和運(yùn)動(dòng)細(xì)節(jié)較少的coastguard.cif各100幀,視頻圖像組GOP=2,其中關(guān)鍵幀為奇幀,非關(guān)鍵幀為偶幀,選擇塊的大小為32×32,對(duì)于測(cè)量矩陣采用獨(dú)立同分布的高斯隨機(jī)矩陣ΦB,使用DCT作為CS的變換基,CS的重構(gòu)方法為SPL算法,使用峰值信噪比(PSNR)來衡量重構(gòu)的視頻質(zhì)量。圖3顯示了本文方法與DISCOS[8]和DCVS[9]的方法得出的不同觀測(cè)率下恢復(fù)的非關(guān)鍵幀性能的比較,從圖中可以看出本文提出的方法在運(yùn)動(dòng)細(xì)節(jié)較為豐富的foreman.cif中較之DISCOS重構(gòu)質(zhì)量有所下降但對(duì)于DCVS方法卻有很大的提高,在運(yùn)動(dòng)細(xì)節(jié)較少的coastguard.cif上性能比DISCOS的質(zhì)量提高了4~6 dB,這是因?yàn)樵趂oreman.cif中得到的邊信息與非關(guān)鍵幀的相關(guān)性較低,而coastguard.cif中它們之間的相關(guān)性較高。
圖3 本文方法與DISCOS,DCVS的方法進(jìn)行性能對(duì)比
本文提出了一種基于邊信息的分布式視頻壓縮感知的殘差重構(gòu)方案,利用邊信息與原始幀之間殘差值的稀疏性來降低采樣率,并使用一種簡(jiǎn)單、有效的殘差重構(gòu)方法。實(shí)驗(yàn)證明該方法對(duì)運(yùn)動(dòng)細(xì)節(jié)較少的視頻有較大的提高。在后面的研究中,如何進(jìn)行觀測(cè)值的量化和編碼將是重點(diǎn)。
[1]GRIOD B,ARON A,RANE S.Distributed video coding[J].Proceedings of the IEEE,2005,93(1):71-83.
[2]SLEPIAN J D,WOLF J K.Noiseless coding of correlated information sources[J].IEEE Trans.Information Theory,1973,19(4):471-480.
[3]WYNER A D.Recent results in the shannon theory[J].IEEE Trans.Information Theory,1974,20(1):2-10.
[4]DONOHO D L.Compressive sensing[J].IEEE Trans.Information Theory,2006,52(4):1289-1306.
[5]CANDES E,ROMBERG J,TAO T.Robust uncertainty principles:exact signal reconstruction from highly incomplete frequency information[J].IEEE Trans.Information Theory,2006,52(2):489-509.
[6]石光明,劉丹華,高大化,等.壓縮感知理論及研究進(jìn)展[J].電子學(xué)報(bào),2009,37(5):1070-1081.
[7]BARON D,WAKIN M B,DUARTE M,et al.Distributed compressed sensing[EB/OL].[2012-10-02].http://dsp.rice.edu/publications/distributed-compressed-sensing.
[8]DO T T,CHEN Y,NGUYEN D T,et al.Distributed compressed video sensing[C]//Proc.CISS 2009.[S.l.]:IEEE Press,2009:1393-1396.
[9]KANG L W,LU C S.Distributed compressive video sensing[C]//Proc.ICASSP 2009.Washington DC:IEEE Computer Society,2009:1169-1172.
[10]朱向軍,馮志林,王潔,等.運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)殘差稀疏重構(gòu)的壓縮視頻傳感[J].電視技術(shù),2012,36(9):7-9.
[11]TROPP J,GILBERT A.Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Trans.Information Theory,2007,53(12):4655-4666.
[12]FIQUEIREDO M A T,NOWAK R D.Gradient projection for sparse reconstruction:application to compressed sensing and other inverse problems[J].IEEE Journal of Selected Topics in Signal Processing,2007,1(4):586-597.
[13]MUN S,F(xiàn)OWLER J E.Block compressed sensing of images using directional transforms[C]//Proc.DCC 2010.[S.l.]:IEEE Press,2009:3021-3024.
[14]ASCENSO J,BRITES C,PEREIRA F.Improving frame interpolation with spatial motion smoothing for pixel domain distributed video coding[C]//Proc.5th EURASIP Conference on Speech and Image Processing,Multimedia Communications and Services.[S.l.]:Slovak Republic,2005:21-26.