摘要:運(yùn)動(dòng)估計(jì)技術(shù)作為影響整體壓縮速度的關(guān)鍵過(guò)程,一直是視頻研究的重點(diǎn)。文章通過(guò)相鄰宏塊間運(yùn)動(dòng)向量的相關(guān)性與殘差值的相似性,采用不同的搜索模板,在大幅度減少運(yùn)算時(shí)間的情況下保持了與高精度搜索算法相同的搜索精度。關(guān)鍵詞:視頻壓縮;運(yùn)動(dòng)估計(jì);搜索模板;殘差值
0引言
評(píng)價(jià)視頻壓縮技術(shù)的最關(guān)鍵指標(biāo)就是清晰度、壓縮率和計(jì)算的復(fù)雜度。對(duì)于新一代的數(shù)字電視,也稱作高清數(shù)字電視,圖像的質(zhì)量是第一重要的。另外,現(xiàn)在電視頻道和電視節(jié)目的數(shù)量都大幅度地增長(zhǎng),自然大大加重廣播網(wǎng)絡(luò)的負(fù)載,如何提高壓縮率減少帶寬就成了另一個(gè)需要重點(diǎn)考慮的問(wèn)題。此外,為了節(jié)省電視節(jié)目的制作成本,視頻的壓縮設(shè)備都會(huì)盡量采用低廉的硬件,所以壓縮算法也要盡量簡(jiǎn)單。
在視頻壓縮中,采用運(yùn)動(dòng)估計(jì)的方法提取時(shí)域上的冗余度對(duì)壓縮率的貢獻(xiàn)最為重要,但同時(shí)運(yùn)動(dòng)估計(jì)也是計(jì)算量需求最大的部分,因此出現(xiàn)了許多優(yōu)秀的快速運(yùn)動(dòng)估計(jì)算法,也叫運(yùn)動(dòng)搜索算法。它們大致可以分為兩類:一類是簡(jiǎn)單預(yù)測(cè)點(diǎn)方法。因?yàn)檫@類算法實(shí)現(xiàn)比較簡(jiǎn)單,需要的硬件配置要求不高,所以都應(yīng)用在視頻會(huì)議,可視電話等領(lǐng)域。另一類是高精度的搜索方法。主要適用于高碼率和高清晰的廣播領(lǐng)域,如高清電視,DVD等。這類應(yīng)用對(duì)圖像的質(zhì)量要求十分嚴(yán)格,因此相應(yīng)的算法在簡(jiǎn)單預(yù)測(cè)點(diǎn)方法的基礎(chǔ)上增加了許多不同的搜索模板,用以減少搜索中止在局部最優(yōu)位置的可能性。
1基于殘差值的運(yùn)動(dòng)估計(jì)策略
簡(jiǎn)單的快速算法屬于基于預(yù)測(cè)點(diǎn)的搜索算法。這類算法是在搜索區(qū)域中,有條件地選定幾個(gè)位置作為初始的搜索位置,這些被選中的初始搜索位置也叫作預(yù)測(cè)點(diǎn),然后在這些預(yù)測(cè)點(diǎn)上應(yīng)用一些簡(jiǎn)單的搜索模板,如鉆石型,方型和六角型進(jìn)行搜索。圖1就是這類算法的一個(gè)示例。
這類算法搜索成敗的關(guān)鍵就是預(yù)測(cè)點(diǎn)的選擇。當(dāng)前最常使用的預(yù)測(cè)點(diǎn)分兩類。一類利用運(yùn)動(dòng)向量空間相鄰性,把左、左上、上和右上宏塊的運(yùn)動(dòng)向量以及它們的中值運(yùn)動(dòng)向量作為預(yù)測(cè)點(diǎn)。另一類利用了運(yùn)動(dòng)向量的時(shí)間相鄰性,把前后相鄰幀的運(yùn)動(dòng)向量作為預(yù)測(cè)點(diǎn)。這種基于預(yù)測(cè)點(diǎn)的搜索方法執(zhí)行速度是十分快的,可以把每個(gè)運(yùn)動(dòng)向量的搜索位置控制在10左右。
但有三種情況大大地影響這種簡(jiǎn)單搜索方法的精度。首先,如果當(dāng)前的運(yùn)動(dòng)向量與相鄰的運(yùn)動(dòng)向量都沒(méi)有關(guān)聯(lián),而預(yù)測(cè)點(diǎn)與實(shí)際的運(yùn)動(dòng)向量相差甚遠(yuǎn),簡(jiǎn)單的搜索方法很容易就會(huì)中止在某一個(gè)局部最優(yōu)的位置上。這種情況經(jīng)常發(fā)生在視頻場(chǎng)景切換的時(shí)候。其次,采用基于預(yù)測(cè)點(diǎn)的搜索方法,位于圖像邊緣的運(yùn)動(dòng)向量在極大程度上會(huì)影響所有運(yùn)動(dòng)向量的搜索。因?yàn)橐曨l編碼通常是采用光柵掃描的順序,由上自下逐行掃描,頂行的運(yùn)動(dòng)向量和最左列的運(yùn)動(dòng)向量都直接或間接地成為其余運(yùn)動(dòng)向量的預(yù)測(cè)點(diǎn),這些基本預(yù)測(cè)點(diǎn)的精度同時(shí)也影響了其余運(yùn)動(dòng)向量的精度。第三,對(duì)特征不明顯的宏塊進(jìn)行搜索,例如一堵墻或一塊布,不同位置所得到的殘差值都是十分接近的,所以在這些位置上搜索出來(lái)的運(yùn)動(dòng)向量有一定的混亂性,利用它們作為其他運(yùn)動(dòng)向量的預(yù)測(cè)點(diǎn)是非常不適當(dāng)?shù)摹?/p>
為了解決上述三個(gè)問(wèn)題,本文提出一種自適應(yīng)搜索模板的運(yùn)動(dòng)估計(jì)算法。雖然簡(jiǎn)單快速算法利用了時(shí)間和空間上相鄰運(yùn)動(dòng)向量之間的相關(guān)性,但通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),相鄰宏塊之間的殘差值也有很強(qiáng)的相關(guān)性,同時(shí),宏塊間的運(yùn)動(dòng)向量越接近,宏塊與宏塊間的殘差值也會(huì)越相近。根據(jù)這個(gè)特性,在運(yùn)動(dòng)估計(jì)的過(guò)程中,可以通過(guò)比較當(dāng)前位置的殘差值與相鄰宏塊的殘差值來(lái)判斷當(dāng)前運(yùn)動(dòng)向量是否是最終的運(yùn)動(dòng)向量。另外,通過(guò)殘差值的相關(guān)性還可以決定當(dāng)前使用的搜索模板,當(dāng)殘差相關(guān)性低的時(shí)候,就采用復(fù)雜的搜索模板,反之,當(dāng)殘差相關(guān)性高的時(shí)候就采用較為簡(jiǎn)單的搜索模板。這樣就可以防止在使用小模板搜索時(shí)最終的運(yùn)動(dòng)向量落在局部最優(yōu)的位置上。
2實(shí)驗(yàn)結(jié)果
本文使用的測(cè)試平臺(tái)是H.264的參考模型(JM)10.2,其中除了第一幀為I幀外,余下的都作為P幀。幀內(nèi)的運(yùn)動(dòng)預(yù)測(cè)使用了JM中提供的快速算法。運(yùn)動(dòng)預(yù)測(cè)范圍是±8像素,不使用哈達(dá)瑪變換,并且應(yīng)用了快速的率失真優(yōu)化的快速選項(xiàng)。參考幀的數(shù)目為JM中可以選擇的最大數(shù)目——5幀,幀間的運(yùn)動(dòng)預(yù)測(cè)只使用16×16的模式。編碼方式采用上下文自適應(yīng)算術(shù)編碼方式,運(yùn)動(dòng)向量的精度為1/4像素。表l提供了本文算法與H.264 JM中三種運(yùn)動(dòng)估計(jì)算法:Full Search,UMHexagonS,EPZS比較的結(jié)果。
從表l的數(shù)據(jù)可以看出,本文的算法在信噪比和碼率基本不變的情況下,速度比JM提供的標(biāo)準(zhǔn)算法有很大的提高。
3結(jié)束語(yǔ)
本文通過(guò)分析簡(jiǎn)單搜索算法的不足之處,提出了一種自適應(yīng)搜索模板的運(yùn)動(dòng)估計(jì)策略。這種方法通過(guò)結(jié)合運(yùn)動(dòng)向量與殘差值之間的相關(guān)性,根據(jù)視頻的內(nèi)容自動(dòng)調(diào)整搜索所需要模板的復(fù)雜度,克服了單一采用固定方式進(jìn)行運(yùn)動(dòng)估計(jì)的缺點(diǎn),在準(zhǔn)確度上接近于高精度算法,而在運(yùn)算速度上接近于簡(jiǎn)單算法。實(shí)驗(yàn)表明,本文提出的基于殘差值的運(yùn)動(dòng)估計(jì)方法,在相同碼率和相同質(zhì)量的情況下,能比其它算法大大節(jié)省搜索時(shí)間。
(注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。)