亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        DCVS系統(tǒng)中基于雙稀疏冗余字典的高性能解碼方法

        2015-06-05 15:31:24趙睿思吳紹華王海旭張欽宇
        關(guān)鍵詞:關(guān)鍵幀字典解碼

        趙睿思,吳紹華,王海旭,張欽宇

        (哈爾濱工業(yè)大學(xué)深圳研究生院,廣東深圳518055)

        DCVS系統(tǒng)中基于雙稀疏冗余字典的高性能解碼方法

        趙睿思,吳紹華,王海旭,張欽宇

        (哈爾濱工業(yè)大學(xué)深圳研究生院,廣東深圳518055)

        為改善分布式壓縮視頻感知(distributed compressive video sensing,DCVS)系統(tǒng)的視頻幀圖像重構(gòu)質(zhì)量,以實(shí)時(shí)視頻傳輸為應(yīng)用場(chǎng)景,提出了一種基于雙重稀疏模型的圖像解碼算法。解碼端由相鄰的已重構(gòu)關(guān)鍵幀產(chǎn)生邊信息(side information,SI);根據(jù)雙重稀疏模型思想,分離樣本圖像小波域下不同尺度的子帶,分別使用K均值奇異值分解(K-means singular value decomposition,K-SVD)算法得到具有多尺度特性的冗余字典,結(jié)合梯度投影稀疏重建(gradient pursuit for sparse reconstruction,GPSR)算法,完成對(duì)非關(guān)鍵幀的重構(gòu)。仿真結(jié)果表明,在相同壓縮率下,相比傳統(tǒng)K-SVD字典訓(xùn)練方法,本文所提出的方法對(duì)應(yīng)的視頻幀圖像重構(gòu)峰值信噪比(peak signal to noise ratio,PSNR)可獲得0.5~1.5 dB以上的增益。

        壓縮感知;分布式視頻編碼;K-SVD算法;雙稀疏字典表示模型;小波變換

        0 引 言

        實(shí)時(shí)視頻傳輸在無(wú)線安防監(jiān)控、空天圖傳等領(lǐng)域有著巨大需求,但由于視頻數(shù)據(jù)量龐大,給傳送設(shè)備的存儲(chǔ)與運(yùn)算帶來(lái)巨大壓力,同時(shí)也對(duì)信道帶寬提出了高要求。傳統(tǒng)的視頻壓縮與傳輸技術(shù)難以突破遠(yuǎn)端傳送設(shè)備載荷資源受限的制約。高效率壓縮、高質(zhì)量解壓縮、低編碼復(fù)雜度、解壓漸近可伸縮,是實(shí)時(shí)視頻傳輸技術(shù)發(fā)展的必然趨勢(shì)。

        壓縮感知(compressed sensing,CS)于2004年被Candès E J等人提出。該理論利用信號(hào)的稀疏特性,在遠(yuǎn)小于Nyquist采樣率的條件下,隨機(jī)采樣獲取信號(hào)的離散樣本,然后通過(guò)非線性算法完美地重建信號(hào)[1]。其核心思想是若信號(hào)在某個(gè)變換基Ψ上是稀疏的,采用與Ψ非相關(guān)的壓縮矩陣Φ將高維信號(hào)投影到低維空間,再通過(guò)求解最優(yōu)化問(wèn)題即可從少量投影中精確重構(gòu)原始信號(hào)[12]。

        分布式視頻編碼(distributed video coding,DVC)可將視頻序列的幀間相關(guān)性用于解碼端,實(shí)現(xiàn)用邊信息(side information,SI)或差值補(bǔ)償?shù)人惴ń獯a,而編碼端僅需實(shí)現(xiàn)分布式幀內(nèi)編碼,從而大大降低編碼端復(fù)雜度[3]。它區(qū)別于傳統(tǒng)方法主要體現(xiàn)在:傳統(tǒng)標(biāo)準(zhǔn)通常都會(huì)在編碼時(shí)計(jì)算獲取信源的冗余數(shù)據(jù),編碼有很高的復(fù)雜性;而DVC則有編碼復(fù)雜度較低、編碼耗電低、容錯(cuò)性能優(yōu)越等優(yōu)勢(shì)。

        將CS理論與DVC技術(shù)相結(jié)合形成的分布式壓縮視頻感知(distributed compressive video sensing,DCVS)系統(tǒng),由Prades-Nebot J.Kang L W等人在2009年提出[34]。該系統(tǒng)具有較低壓縮率、編碼復(fù)雜度低、解碼質(zhì)量高等特點(diǎn),充分滿足了未來(lái)實(shí)時(shí)視頻傳輸技術(shù)的設(shè)計(jì)要求[45]。

        在DCVS系統(tǒng)中,視頻幀組的關(guān)鍵幀和非關(guān)鍵幀,均采用CS方法壓縮,解碼端由關(guān)鍵幀為非關(guān)鍵幀提供SI估計(jì)。已有DCVS系統(tǒng)中非關(guān)鍵幀的重構(gòu),通常采用固定的稀疏變換基,雖然大多情況下信號(hào)可由其稀疏表示,但由于它獨(dú)立于壓縮信號(hào),信號(hào)表示系數(shù)并不具備最優(yōu)的稀疏性,對(duì)重構(gòu)質(zhì)量也造成了影響[5]。近來(lái)提出的一種結(jié)合字典訓(xùn)練實(shí)現(xiàn)的非關(guān)鍵幀重構(gòu)方法,利用了圖像自身特征,通過(guò)K均值奇異值分解(K-means singular value decomposition,K-SVD)算法訓(xùn)練出適應(yīng)于圖像的稀疏字典。但這種方法自由度很高,運(yùn)算量也相對(duì)較大,因此字典規(guī)模將受到一定程度上的限制;另一缺點(diǎn)是這樣的訓(xùn)練方法只適用于低維信號(hào)。

        針對(duì)上述問(wèn)題,本文結(jié)合一種雙稀疏字典表示模型,解析地將第3節(jié)中所描述的訓(xùn)練字典進(jìn)一步的稀疏化,對(duì)經(jīng)過(guò)小波分解的視頻幀圖像的子帶逐個(gè)進(jìn)行字典訓(xùn)練。這種方法可突破因字典規(guī)模受到的制約,也可以更好地適應(yīng)高維圖像,并且因具備了小波多尺度分析的特性,對(duì)系統(tǒng)性能也有較好的提升。文中通過(guò)仿真驗(yàn)證了該方法較傳統(tǒng)DCVS系統(tǒng)的非關(guān)鍵幀重構(gòu)性能,峰值信噪比(peak signal to noise ratio,PSNR)可獲得0.5~1.5 dB以上的增益。

        本文首先介紹CS理論和DVC技術(shù)等相關(guān)背景知識(shí);然后分別從編碼端和解碼端兩個(gè)角度介紹DCVS系統(tǒng)以及現(xiàn)有較好性能的算法;再介紹雙稀疏字典表示模型,以及基于此模型的小波域下多尺度字典訓(xùn)練算法;最后給出通過(guò)仿真得到的實(shí)驗(yàn)結(jié)果,并與已有研究做出對(duì)比。

        1 系統(tǒng)理論模型背景

        1.1 CS理論

        CS理論可簡(jiǎn)要概述為:假設(shè)某個(gè)一維離散實(shí)值信號(hào)x∈RN×1是K稀疏的信號(hào)或其在某表達(dá)基ΨN×N下有K稀疏(K<N)的表示形式

        式中,s(n)表示第n個(gè)被抽取的基向量對(duì)應(yīng)的系數(shù)。該式矩陣形式為x=Ψs,其中s是N×1的向量,有K個(gè)非零元素。將x在M×N(K<M≤N)的壓縮矩陣Φ上投影,得到由M個(gè)壓縮結(jié)果組成的M×1向量y:y=Φx=ΦΨs,那么該信號(hào)可被精確地重構(gòu)出來(lái)[2]。重構(gòu)過(guò)程通過(guò)求解下面的組合優(yōu)化問(wèn)題完成:

        最優(yōu)化稀疏表示理論表明當(dāng)矩陣A滿足σ(A)≥2K時(shí),以上l0范數(shù)優(yōu)化問(wèn)題可唯一重構(gòu),其中σ(A)為A中最小線性相關(guān)組的列數(shù)[6]。該問(wèn)題是一個(gè)NP問(wèn)題,計(jì)算復(fù)雜度較高。但研究表明,如果矩陣ΦΨ滿足更強(qiáng)的條件,即具有約束等距性質(zhì)(restricted isometry property,RIP)時(shí)[2],上述問(wèn)題可由l0轉(zhuǎn)化為l1約束的凸優(yōu)化問(wèn)題:

        文獻(xiàn)指出若壓縮矩陣Φ與稀疏基Ψ非相干,則矩陣A將以很大概率滿足RIP性質(zhì)。當(dāng)Φ是隨機(jī)生成的矩陣,且M≥c K lg(N/K)時(shí),其與任意Ψ之間高概率非相干[7]。例如,當(dāng)Φ為一高斯矩陣或?yàn)閬y序哈德瑪集(scrambled block Hadamard ensemble,SBHE)矩陣時(shí),與大部分Ψ都不相干。

        基于CS理論的視頻壓縮方法,可以有效地避免傳統(tǒng)壓縮中先采樣再壓縮而造成的大量數(shù)據(jù)的浪費(fèi);其低復(fù)雜度的線性壓縮原理,也更有利于資源嚴(yán)重不對(duì)稱、編碼端計(jì)算能力有限的通信環(huán)境。

        1.2 DVC理論

        DVC基于Slepian-Wolf理論和Wyner-Ziv理論,對(duì)多個(gè)具有相關(guān)性的視頻源進(jìn)行編碼,再將碼流發(fā)送至解碼端,解碼過(guò)程將利用各信號(hào)之間的關(guān)聯(lián)性完成。關(guān)鍵幀解碼以后,利用內(nèi)插、外推等技術(shù)生成WZ幀的SI預(yù)測(cè)幀;對(duì)于WZ幀,利用接收到的WZ幀碼流結(jié)合對(duì)其預(yù)測(cè)的SI幀進(jìn)行解碼。相鄰幀間的預(yù)測(cè)操作是在解碼端進(jìn)行的,這樣即實(shí)現(xiàn)了運(yùn)算復(fù)雜度從編碼端向解碼端的轉(zhuǎn)移[3],其基本原理如圖1所示。

        圖1 分布式視頻編碼端原理圖

        DVC編碼方式有以下幾個(gè)主要特點(diǎn):①低復(fù)雜度編碼、高復(fù)雜度解碼;②具有較高的壓縮效率;③編碼端易實(shí)現(xiàn)可分級(jí)的編碼;④具有一定的糾錯(cuò)功能。因此,DVC非常適用于需要編碼復(fù)雜度低的視頻場(chǎng)合[3]。

        2 DCVS視頻編解碼系統(tǒng)

        2.1 DCVS系統(tǒng)編碼端

        DCVS系統(tǒng)結(jié)合了CS壓縮方法與DVC分布式編碼思想,視頻序列被分成若干幀組(group of pictures,GOP),各幀組由一個(gè)關(guān)鍵幀和若干非關(guān)鍵幀組成[5],每一幀均采用CS方法線性壓縮。關(guān)鍵幀作為參考幀,計(jì)算生成SI幀,對(duì)相鄰非關(guān)鍵幀做出估計(jì)。如圖2所示,與傳統(tǒng)視頻編碼方式不同,DCVS系統(tǒng)編碼端沒(méi)有運(yùn)動(dòng)估計(jì)過(guò)程,也無(wú)需幀間相關(guān)性的任何先驗(yàn)信息,即沒(méi)有除對(duì)原始數(shù)據(jù)壓縮之外的其他任務(wù)。xt幀(關(guān)鍵幀或非關(guān)鍵幀)的壓縮過(guò)程如下:

        式中,yt是Mt×1維的壓縮結(jié)果;Φ是Mt×N的壓縮矩陣。這里關(guān)鍵幀壓縮率(measurement rate,MR)MRk大于或等于非關(guān)鍵幀的壓縮率MRcs(MRk≥MRcs)。其中xt的壓縮率MR被定義為MRt=Mt/N[5]。

        圖2 DCVS編碼端

        本文采用了SBHE矩陣作為壓縮矩陣Φ

        式中,WB表示B×B的哈德瑪矩陣;PN表示對(duì)W的列向量進(jìn)行隨機(jī)排序[8];QM表示隨機(jī)抽取WPN中的M行。矩陣W的哈德瑪塊對(duì)角結(jié)構(gòu)能保證計(jì)算復(fù)雜度降低,計(jì)算簡(jiǎn)單快速,很好地提高了感知效率,并且其存儲(chǔ)空間較少,該矩陣由哈德瑪集構(gòu)成,元素僅為±1、0,因此更易于硬件實(shí)現(xiàn)。且由于其隨機(jī)抽取的操作使其具備普適性,即對(duì)于自然圖像其與所有的變換基都非相干,這點(diǎn)充分滿足了壓縮矩陣設(shè)計(jì)的準(zhǔn)則要求。

        2.2 DCVS系統(tǒng)解碼端

        在解碼端,關(guān)鍵幀與非關(guān)鍵幀的解壓算法有所不同,本文中關(guān)鍵幀通過(guò)梯度投影稀疏重建(gradient pursuit for sparse reconstruction,GPSR)算法進(jìn)行重構(gòu),非關(guān)鍵幀則需融入SI幀以提升解壓重構(gòu)效果。

        2.2.1 GPSR重構(gòu)算法

        CS理論重構(gòu)算法的關(guān)鍵是如何從M維壓縮結(jié)果中精確地恢復(fù)N維數(shù)據(jù),重建算法中凸優(yōu)化算法優(yōu)點(diǎn)是重建準(zhǔn)確度高、誤差小,但計(jì)算量大、時(shí)間復(fù)雜度高;貪婪算法計(jì)算量較小、重建效果較好且容易實(shí)現(xiàn),使其成為稀疏信號(hào)重建算法中運(yùn)用較廣泛的算法。但這種算法在還原效果上較凸優(yōu)化算法略遜色。本文將從保障解碼性能的角度出發(fā)選取凸優(yōu)化GPSR算法重構(gòu)信號(hào)[9]。

        GPSR算法基于最小l1范數(shù)進(jìn)行求解,將不帶約束條件的l1范數(shù)問(wèn)題轉(zhuǎn)化為邊界約束的二次優(yōu)化問(wèn)題[10],即式(4)所示的信號(hào)恢復(fù)過(guò)程可轉(zhuǎn)變?yōu)橛屑s束問(wèn)題:

        式中,r是非負(fù)實(shí)數(shù)。這是一個(gè)典型的二次規(guī)劃問(wèn)題(quadratic program,QP)。對(duì)式(6)使用拉格朗日乘法可等價(jià)變形為

        式中,τ是正值的拉格朗日算子。式(7)是轉(zhuǎn)變的無(wú)約束凸優(yōu)化問(wèn)題。主要策略是從可行性點(diǎn)出發(fā),沿梯度下降的方向搜索,搜尋可使目標(biāo)函數(shù)值下降的新可行點(diǎn)。當(dāng)?shù)跏荚诳尚行杂虻膬?nèi)部以梯度的負(fù)方向進(jìn)行搜索且出發(fā)點(diǎn)位于約束條件邊界上,則將其投影至矩陣的零空間。意即用凸函數(shù)的梯度來(lái)約束最優(yōu)化解的尋找方向,快速地找到最優(yōu)化的方程解。DCVS系統(tǒng)中的關(guān)鍵幀壓縮結(jié)果傳至解碼端,即通過(guò)上述過(guò)程完成解碼。

        2.2.2 SI生成法

        SI幀在提升解碼質(zhì)量上具有重要作用。它用來(lái)輔助重構(gòu)非關(guān)鍵幀,一方面能夠降低編碼端非關(guān)鍵幀的壓縮率,另一方面也能提高解碼端解碼質(zhì)量,其產(chǎn)生方法可分為以下兩類。

        第一類利用解碼端數(shù)據(jù)低復(fù)雜度產(chǎn)生SI幀。例如直接以前一解碼的關(guān)鍵幀作為對(duì)當(dāng)前非關(guān)鍵幀的預(yù)測(cè),或利用均值內(nèi)插,被預(yù)測(cè)非關(guān)鍵幀中的像素即為該幀相鄰前后兩關(guān)鍵幀相同位置處像素的均值。但它們都未考慮序列的運(yùn)動(dòng)情況,當(dāng)視頻變化幅度過(guò)高時(shí),SI精確程度不高。

        第二類借鑒了傳統(tǒng)視頻壓縮中運(yùn)動(dòng)估計(jì)的預(yù)測(cè)方法獲得SI幀。傳統(tǒng)視頻壓縮中,運(yùn)動(dòng)矢量由編碼端獲得,直接將被預(yù)測(cè)幀與參考幀比較即可得到;而DVCS中,運(yùn)動(dòng)矢量由解碼端完成計(jì)算。由于解碼端無(wú)法先得到被預(yù)測(cè)幀,因此該過(guò)程需借助于已重構(gòu)的參考幀。

        如圖3所示,將視頻幀圖像分成若干塊,檢測(cè)每塊在前后幀中對(duì)應(yīng)的位置,并計(jì)算對(duì)應(yīng)塊的位置偏移量(運(yùn)動(dòng)矢量)。根據(jù)該偏移量,找到當(dāng)前像素塊從前后幀的哪個(gè)位置移動(dòng)過(guò)來(lái),即可得到當(dāng)前像素值的預(yù)測(cè)值[11]。DCVS中,以GOP=2為例,具體產(chǎn)生過(guò)程為:設(shè)第t幀為非關(guān)鍵幀,第t-1幀和第t+1幀為已重構(gòu)關(guān)鍵幀。Mn為非關(guān)鍵幀中的某一像塊,Mn-1和Mn+1分別為關(guān)鍵t-1幀和關(guān)鍵t+1幀的相同位置像塊。首先以關(guān)鍵t+1為參考幀,搜索與Mn-1最佳匹配塊,得到運(yùn)動(dòng)矢量(i,j)。然后以(i/2,j/2)作為Mn的運(yùn)動(dòng)矢量,對(duì)Mn進(jìn)行前向運(yùn)動(dòng)補(bǔ)償,得到預(yù)測(cè)結(jié)果Xn;同理,再以關(guān)鍵t-1幀為參考幀,搜索與Mn+1最佳匹配塊,得到運(yùn)動(dòng)矢量(i′,j′)。然后以(i′/2,j′/2)作為Mn的運(yùn)動(dòng)矢量,以關(guān)鍵t-1幀為參考幀,對(duì)Mn進(jìn)行后向運(yùn)動(dòng)補(bǔ)償,得到Y(jié)n。最后將Xn和Yn進(jìn)行平均,就得到了Mn的運(yùn)動(dòng)補(bǔ)償內(nèi)插值。當(dāng)遍歷所有的宏塊后,可以得到兩個(gè)雙向的預(yù)測(cè)結(jié)果Xt與Yt,進(jìn)行求均值的操作,即可得到當(dāng)前幀的SIt。

        圖3 運(yùn)動(dòng)估計(jì)生產(chǎn)SI原理圖

        2.2.3 DCVS中的非關(guān)鍵幀解碼算法

        傳統(tǒng)DCVS中非關(guān)鍵幀的解碼算法由GPSR算法融入SI幀完成,常見(jiàn)方法有基于差值補(bǔ)償?shù)娜谌敕椒ǎ蛞罁?jù)非關(guān)鍵幀與SI幀的統(tǒng)計(jì)相關(guān)性解碼等,共同點(diǎn)是均采用了固定的稀疏基。

        在固定稀疏基 (DWT等)下信號(hào)雖然可以被稀疏表示,但其缺點(diǎn)是適應(yīng)能力差。為了充分利用已獲得的估計(jì)信息,可在系統(tǒng)解碼端加入過(guò)完備冗余字典訓(xùn)練模塊,獲取稀疏字典。在字典下圖像信號(hào)存在更為稀疏的表示形式,加入字典訓(xùn)練的解碼端,如圖4所示。

        圖4 加入冗余字典訓(xùn)練的DCVS解碼端

        字典訓(xùn)練過(guò)程需利用前后已重構(gòu)的關(guān)鍵幀與SI幀完成:首先將從各幀中提取Q個(gè)像塊ui(i=1,2,…,Q),每幀被分成了若干不重疊的塊,將ui展開(kāi)成列向量并依次排列最終形成訓(xùn)練集Y[12]。初始化原始字典,對(duì)Y使用K-SVD算法訓(xùn)練,更新字典的每一個(gè)原子。K-SVD算法依據(jù)誤差最小原則,對(duì)誤差項(xiàng)進(jìn)行SVD分解,選擇誤差最小的分解項(xiàng)作為新的字典原子,同時(shí)更新對(duì)應(yīng)的稀疏表示系數(shù),不斷迭代得到優(yōu)化解:

        式中,T0是稀疏表示系數(shù)中非零分量數(shù)目的上限[13];Y為訓(xùn)練集;D為過(guò)完備字典;X為系數(shù)矩陣;xi是X中的列。X與Y按列對(duì)應(yīng),表示D中各項(xiàng)按X系數(shù)線性組合即為Y。DCVS通過(guò)求解以下優(yōu)化問(wèn)題實(shí)現(xiàn)對(duì)非關(guān)鍵幀的解碼:

        上述字典訓(xùn)練方法利用了歷史先驗(yàn)信息,針對(duì)性強(qiáng),自適應(yīng)能力遠(yuǎn)強(qiáng)于固定基,能更好地完成不同圖像的重構(gòu)任務(wù)。一般情況下基于字典訓(xùn)練的模型能夠得到更好的稀疏表示。

        3 雙稀疏的小波域多尺度字典訓(xùn)練

        3.1 雙重稀疏字典模型

        上述字典更切合當(dāng)前場(chǎng)景的圖像信息,因而有更好的稀疏表示效果,但其計(jì)算量大,自由度過(guò)高,字典規(guī)模會(huì)受到一定程度上的限制,且它并沒(méi)有充分挖掘信號(hào)的特征。針對(duì)這些缺陷,Rubinstein R等人提出了雙重稀疏字典表示模型,尋找固定的稀疏字典作為核心字典,再將該字典原子進(jìn)行線性稀疏表示作為新字典的原子[14]。假設(shè)字典D的每個(gè)原子都可由一個(gè)核心字典Ω稀疏表示,即D=ΩZ,Z為稀疏表示矩陣。則式(8)描述的字典問(wèn)題等價(jià)為

        式中,A表示稀疏表示矩陣[14];αi表示A中列向量;K表示稀疏度。稀疏字典以核心字典與新字典結(jié)合的形式構(gòu)成,該核心字典本身具有一定的稀疏性,而新字典在其基礎(chǔ)上又有進(jìn)一步的稀疏表示,所以稱為“雙重稀疏”。核心字典Ω對(duì)該模型在性能上有很大影響,通常會(huì)選擇有良好性能的固定字典。

        下面將在第3.1節(jié)的基礎(chǔ)上,對(duì)DCVS中的非關(guān)鍵幀解碼算法做基于雙稀疏模型的改進(jìn)。

        3.2 雙稀疏模型下的小波域多尺度字典訓(xùn)練

        小波變換對(duì)圖像信號(hào)的稀疏表示是一種多尺度分析方法,可以保留圖像的能量細(xì)節(jié)信息;多級(jí)分解后形成不同尺度方向的子帶信號(hào),也可以極大地減小圖像不同特征之間的相關(guān)性。若對(duì)每個(gè)子帶作為訓(xùn)練集進(jìn)行字典訓(xùn)練,減小不同尺度方向的冗余,則可以產(chǎn)生更加稀疏的圖像表示;同時(shí),由于子帶尺寸較源圖像是逐層降低的,每級(jí)系數(shù)圖像的尺寸僅為上一級(jí)的1/4,對(duì)尺寸較小的子帶圖像進(jìn)行字典訓(xùn)練,也可以解決K-SVD算法在處理圖像信號(hào)過(guò)程中信號(hào)維度受限的問(wèn)題[12]。

        式(10)中若Y是訓(xùn)練集,矩陣Ω用E代表,表示小波變換算子或等同于小波變換,即以小波字典作為核心字典,那么雙重稀疏字典訓(xùn)練的數(shù)學(xué)模型可以表述為如下最優(yōu)化問(wèn)題:

        式中,E代表小波字典(小波逆變換)。若小波變換滿足完全重構(gòu)條件,即E可逆,式(11)等價(jià)于

        式中,Ea代表小波變換。式(12)說(shuō)明,字典的訓(xùn)練過(guò)程不僅可以在原始域中進(jìn)行,也可以在小波域中進(jìn)行。若對(duì)小波變換后各個(gè)子帶獨(dú)自地進(jìn)行字典訓(xùn)練,將小波域看作稀疏系數(shù)“圖像”或其分解子帶的集合,將數(shù)據(jù)能夠表示成原子的稀疏聯(lián)合,而這些原子本身又來(lái)自某個(gè)特定的多尺度稀疏基。利用小波變換得到的系數(shù)子帶訓(xùn)練字典,可以較好地保持圖像的方向特征和多尺度細(xì)節(jié)信息。圖5是DCVS系統(tǒng)加入小波域雙稀疏字典訓(xùn)練模塊的系統(tǒng)解碼原理圖。

        圖5 小波域多尺度字典訓(xùn)練解碼原理圖

        首先對(duì)關(guān)鍵t-1幀、關(guān)鍵t+1幀與SI幀做小波變換,提取變換后的各系數(shù)子帶,對(duì)這些子帶進(jìn)行K-SVD字典訓(xùn)練,得到各子帶訓(xùn)練后的稀疏字典和系數(shù)矩陣,通過(guò)重組和逆變換步驟得到完整的字典,最后由GPSR算法完成重構(gòu),下面給出了詳細(xì)的算法步驟。

        輸入待訓(xùn)練圖像集,小波變換類型及濾波器系數(shù),小波變換級(jí)數(shù)s,字典原子大小db。

        輸出子帶字典Db(b=1,2,…,3s+1),多尺度字典^D。

        具體函數(shù)過(guò)程如下:

        步驟1 對(duì)訓(xùn)練集圖像做s級(jí)的小波變換,提取b=3s+1個(gè)子帶,不同子帶集合形成各自的子字典訓(xùn)練樣本集;

        步驟2 從各系數(shù)子帶中提取Qb個(gè)塊,展開(kāi)成列向量依次排列,形成各自的訓(xùn)練集Yb;

        步驟3 初始化所有子字典Db,對(duì)初始信號(hào)Y使用正交匹配追蹤算法(orthogonal matching pursuit,OMP),計(jì)算稀疏表示矩陣Ab

        步驟4對(duì)各子帶訓(xùn)練集使用K-SVD算法,滿足

        訓(xùn)練各自子帶方向的字典,該過(guò)程同時(shí)更新對(duì)應(yīng)的系數(shù)矩陣;

        步驟5 各子帶字典^Db和系數(shù)矩陣^Ab,依據(jù)小波變換的原始系數(shù)矩陣排布結(jié)構(gòu),重新排列形成訓(xùn)練后的字典Ds和系數(shù)矩陣As;

        4 仿真實(shí)驗(yàn)與結(jié)果對(duì)比

        本節(jié)對(duì)傳統(tǒng)CS(稀疏基DWT,GPSR重構(gòu)算法),傳統(tǒng)K-SVD字典訓(xùn)練方法和本文字典訓(xùn)練方法進(jìn)行仿真實(shí)驗(yàn),對(duì)比了這幾種方法的解碼效果。實(shí)驗(yàn)中,DCVS系統(tǒng)仿真的序列采用標(biāo)準(zhǔn)CIF視頻開(kāi)發(fā)序列foreman序列和coastguard序列(前30幀,規(guī)格352像素×288像素,8位灰度圖像);幀組GOP=2,每組第一幀為關(guān)鍵幀,第二幀為非關(guān)鍵幀。

        3種方法的關(guān)鍵幀均采用GPSR算法解碼;關(guān)于非關(guān)鍵幀,傳統(tǒng)CS方法采用差值補(bǔ)償?shù)腟I融入GPSR算法進(jìn)行解碼,本文方法中小波濾波器采用CDF 9/7雙正交小波,小波分解級(jí)數(shù)s設(shè)定為3,即進(jìn)行雙稀疏訓(xùn)練的小波子帶個(gè)數(shù)為10。圖6(a)、圖6(b)分別為兩組序列的解碼幀平均PSNR和平均MR的關(guān)系曲線。

        圖6 本文算法與傳統(tǒng)方法仿真對(duì)比圖

        從圖6中可看出,foreman序列和coastguard序列在幾種算法下的解碼性能有明顯的差異,本文算法性能最為優(yōu)越,其次為傳統(tǒng)K-SVD算法。相同壓縮率下,本文算法相比傳統(tǒng)KSVD字典訓(xùn)練方法PSNR可獲得0.5~1.5 dB以上的增益。圖7為部分小波子帶訓(xùn)練出的子字典,可以看出各子帶方向字典原子中的信息基本保持了原圖像各方向的細(xì)節(jié)信息。

        圖8為MRk=0.7,MRcs=0.4條件下3種方法解碼的非關(guān)鍵幀圖像。其中對(duì)coastguard序列(見(jiàn)圖8(a)~圖8(c)),本文方法較K-SVD算法PSNR高1.27 dB;對(duì)foreman序列(見(jiàn)圖8(d)~圖8(f)),本文方法較K-SVD算法PSNR高1.43 dB。從主觀視覺(jué)角度觀察,也可以看出本文方法在細(xì)節(jié)上解碼更加清晰。

        綜合以上實(shí)驗(yàn)結(jié)果,本文提出的算法在客觀評(píng)價(jià)指標(biāo)以及主觀視覺(jué)效果上都較傳統(tǒng)方法有一定的優(yōu)勢(shì)。結(jié)果充分驗(yàn)證了結(jié)合小波域雙稀疏多尺度字典訓(xùn)練方法的DCVS系統(tǒng)是有效的,得到了比傳統(tǒng)方法更好的性能。說(shuō)明由于小波分析的多尺度特性,結(jié)合雙稀疏模型的表示方法,可以更全面地挖掘視頻幀圖像的特征信息,可以更大程度地使字典具有更稀疏的表示特性,從而提高了非關(guān)鍵幀的解碼質(zhì)量,進(jìn)而提升了系統(tǒng)的整體性能。

        圖7 部分子帶訓(xùn)練出的小波域雙稀疏字典

        圖8 MRk=0.7,MRcs=0.4條件下重構(gòu)非關(guān)鍵幀圖像

        5 結(jié) 論

        本文針對(duì)傳統(tǒng)DCVS系統(tǒng)解碼質(zhì)量不高的問(wèn)題,基于雙稀疏字典表示模型,提出了該模型下小波域多尺度冗余字典訓(xùn)練方法的解碼算法。有效性得到了仿真數(shù)據(jù)的驗(yàn)證,在相同條件下,本文算法較傳統(tǒng)方法PSNR可獲得0.5~1.5 dB以上的增益。這種方法在系統(tǒng)解碼非關(guān)鍵幀時(shí)充分利用先驗(yàn)的歷史估計(jì)信息,能更全面地挖掘視頻幀圖像的特征,構(gòu)造出的字典有更好稀疏表示圖像信息的能力,從而提高非關(guān)鍵幀的解碼質(zhì)量,進(jìn)而提升系統(tǒng)整體性能。今后工作中將嘗試在DCVS中加入反饋機(jī)制,在不影響編碼復(fù)雜度的前提下,對(duì)提升系統(tǒng)性能進(jìn)行進(jìn)一步研究。

        [1]Donoho D L.Compressed sensing[J].IEEE Trans.on Information Theory,2006,52(4):1289- 1306.

        [2]Girod B,Aaron A M,Rane S,et al.Distributed video coding[J].Proceedings of the IEEE,2005,93(1):71- 83.

        [3]Prades-Nebot J,Ma Y,Huang T.Distributed video coding using compressive sampling[C]∥Proc.of the IEEE Picture Coding Symposium,2009:1- 4.

        [4]Kang L W,Lu C S.Distributed compressive video sensing[C]∥Proc.of the International Conference on Acoustics,Speech and Signal,2009:1169- 1172.

        [5]Donoho D L,Elad M.Optimally sparse representation in general dictionaries via l1minimization[J].Proceedings of the National Academy of Sciences,2003,100(5):2197- 2202.

        [6]Candes E J.The restricted isometry property and its implications for compressed sensing[J].Comptes Rendus Mathematique,2008,346(9):589- 592.

        [7]Candès E J,Wakin M B.An introduction to compressive sampling[J].IEEE Trans.on Signal Processing Magazine,2008,25(2):21- 30.

        [8]Gan L,Do T,Tran T D.Fast compressive imaging using scrambled block Hadamard ensemble[C]∥Proc.of the IEEE 16th European Signal Processing Conference,2008:1- 5.

        [9]Karp B,Kung H T.GPSR greedy perimeter stateless routing for wireless networks[C]∥Proc.of the ACM 6th Annual International Conference on Mobile Computing and Networking,2000:243- 254.

        [10]Li R,Zeng B,Liou M L.A new three-step search algorithm for block motion estimation[J].IEEE Trans.on Circuits and Systems for Video Technology,1994,4(4):438- 442.

        [11]Lin Y,Wu S H.Separate-combine recovery for compressed sensing of large images[C]∥Proc.of the Signal Processing for Communications Symposium,2014:4601- 4606.

        [12]Chen H W,Kang L W,Lu C S.Dictionary learning-based distributed compressive video sensing[C]∥Proc.of the IEEE Picture Coding Symposium,2010:210- 213.

        [13]Rubinstein R,Zibulevsky M,Elad M.Efficient implementation of the K-SVD algorithm using batch orthogonal matching pursuit[J].CS Technion,2008,40(8):1- 5.

        [14]Rubinstein R,Zibulevsky M,Elad M.Double sparsity:learning sparse dictionaries for sparse signal approximation[J].IEEE Trans.on Signal Processing,2010,58(3):1553- 1564.

        趙睿思(198-9- ),男,碩士研究生,主要研究方向?yàn)閴嚎s感知理論、視頻圖像編解碼處理。

        E-mail:rsiigle@gmail.com

        吳紹華(1980- ),通信作者,男,副教授,博士,主要研究方向?yàn)樯羁招旁淳幋a和信道編碼、下一代移動(dòng)通信超高速編解碼技術(shù)、短距離無(wú)線定位技術(shù)。

        E-mail:hitwush@hit.edu.cn

        王海旭(198-8- ),男,碩士研究生,主要研究方向?yàn)閴嚎s感知理論、視頻圖像編解碼處理。

        E-mail:haixuwang@126.com

        張欽宇(1972- ),男,教授,博士,主要研究方向?yàn)樯羁胀ㄐ?、下一代移?dòng)通信關(guān)鍵技術(shù)。

        E-mail:zqy@hit.edu.cn

        High-performance decoding method based on double sparse dictionary in DCVSsystem

        ZHAO Rui-si,WU Shao-hua,WANG Hai-xu,ZHANG Qin-yu
        (Shenzhen Graduate School,Harbin Institute of Technology,Shenzhen 518055,China)

        To improve the quality of video frame image-reconstruction in the distributed compressive video sen-sing(DCVS)system,the continuous real-time video transmission is used as scenarios,an decoding algorithm based on the double sparse dictionary is proposed.Side information(SI)is generated by the adjacent keyframe.Separate sub-bands with different scales of the sample images under wavelet domain,then use the KSVD algorithm to get different redundant dictionaries with multi-scale properties.Finally,these dictionaries and gradient pursuit for sparse reconstruction(GPSR)algorithm are combined to reconstruct the non-key frames.Simulation results show that at the same compression ratio,the peak signal to noise ratio(PSNR)of the proposed method can obtain more than 0.5~1.5 dB gain than traditional methods.

        compressed sensing(CS);distributed video coding(DVC);K-SVD algorithm;double sparse dictionary;wavelet transform

        TN 919

        A

        10.3969/j.issn.1001-506X.2015.11.32

        1001-506X(2015)11-2634-06

        2014- 09- 09;

        2015- 01- 28;網(wǎng)絡(luò)優(yōu)先出版日期:2015- 07- 06。

        網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150706.1606.001.html

        國(guó)家自然科學(xué)基金(61001092,61371102)資助課題

        猜你喜歡
        關(guān)鍵幀字典解碼
        開(kāi)心字典
        家教世界(2023年28期)2023-11-14 10:13:50
        開(kāi)心字典
        家教世界(2023年25期)2023-10-09 02:11:56
        《解碼萬(wàn)噸站》
        解碼eUCP2.0
        NAD C368解碼/放大器一體機(jī)
        Quad(國(guó)都)Vena解碼/放大器一體機(jī)
        基于改進(jìn)關(guān)鍵幀選擇的RGB-D SLAM算法
        我是小字典
        正版字典
        讀者(2016年14期)2016-06-29 17:25:50
        基于相關(guān)系數(shù)的道路監(jiān)控視頻關(guān)鍵幀提取算法
        人妻无码中文人妻有码| 日日噜噜夜夜狠狠久久丁香五月| 亚洲av无码专区亚洲av伊甸园| 国产精品一区二区 尿失禁| 久久久久久国产福利网站| 日本乱熟人妻中文字幕乱码69| 久久婷婷五月综合色欧美| 日韩欧美在线综合网| 国产亚洲精品日韩香蕉网| 亚洲精品中文字幕一二三四| 欧美丰满熟妇性xxxx| av大片在线无码免费| 日本一区二区亚洲三区| 国产av一级片在线观看| 免费毛片a线观看| 日韩二三区| 蜜桃视频一区二区三区在线观看| 色999欧美日韩| 人妖系列在线免费观看| 国产精品婷婷久久爽一下| 久久精品女人天堂av| 国产性一交一乱一伦一色一情| av成人综合在线资源站| 欧美日韩精品久久久久| 亚洲熟妇少妇任你躁在线观看 | 日产精品久久久久久久蜜臀| 无码伊人久久大蕉中文无码| 国产精品日韩av一区二区| 中文字幕日韩一区二区不卡| 亚洲精品第一国产麻豆| 国产盗摄一区二区三区av| 国产女人18毛片水真多18精品| 国产精品va在线观看无码| 国语憿情少妇无码av| 91麻豆精品国产91久久麻豆| av无码精品一区二区三区宅噜噜| 亚洲自拍另类欧美综合| 日本久久视频在线观看| 国产综合久久久久久鬼色| 最新国产三级| 久久精品国产亚洲av夜夜|