AVS2視頻編碼標準技術(shù)特色及應(yīng)用

2017-09-03 09:21:13馬思偉羅法蕾黃鐵軍

電信科學(xué) 2017年8期

關(guān)鍵詞：編碼標準濾波像素

馬思偉，羅法蕾，黃鐵軍

（1. 北京大學(xué)信息科學(xué)技術(shù)學(xué)院，北京 100871；2. 中國科學(xué)院計算技術(shù)研究所，北京 100081）

專題：視頻技術(shù)的理論與實踐

AVS2視頻編碼標準技術(shù)特色及應(yīng)用

馬思偉1，羅法蕾2，黃鐵軍1

（1. 北京大學(xué)信息科學(xué)技術(shù)學(xué)院，北京 100871；2. 中國科學(xué)院計算技術(shù)研究所，北京 100081）

圍繞視頻編碼核心技術(shù)，簡單介紹AVS視頻編碼標準發(fā)展歷程，詳細介紹了最新一代AVS視頻編碼標準——AVS2（GB/T 33475.2-2016）的核心創(chuàng)新技術(shù)，主要包括：靈活的預(yù)測劃分方式、多假設(shè)幀間預(yù)測、優(yōu)化的層次變換設(shè)計和自適應(yīng)環(huán)路濾波處理技術(shù)以及面向場景視頻應(yīng)用 AVS2提出的基于場景建模的高效預(yù)測編碼技術(shù)。和第一代AVS視頻編碼標準相比，AVS2編碼效率提升一倍以上；和同期HEVC/H.265國際標準相比，AVS2在場景視頻編碼方面有顯著優(yōu)勢。另外簡單介紹了AVS標準在數(shù)字電視廣播等行業(yè)中的應(yīng)用情況。

AVS；變換；預(yù)測；熵編碼；環(huán)路濾波

1 引言

1948 年香農(nóng)發(fā)表的《通信中的數(shù)學(xué)理論》開啟了編碼理論研究之門，至今即將邁入第70個年頭，其中提出的信源編碼、信道編碼理論對發(fā)展高效的通信系統(tǒng)已產(chǎn)生巨大的影響。就信源編碼來講，主要是研究文本、語音、音頻、圖像和視頻等各種媒體信息的編碼，最近幾年又出現(xiàn)了深度數(shù)據(jù)、點云數(shù)據(jù)和基因數(shù)據(jù)等新型數(shù)據(jù)類型的壓縮，但由于視頻數(shù)據(jù)量之大最為突出，長期以來視頻編碼一直是信源編碼領(lǐng)域的研究熱點。以監(jiān)控視頻為例，北京市部署的監(jiān)控攝像頭數(shù)量達50萬個之多，每小時產(chǎn)生的視頻時長就相當于中央電視臺建臺以來的所有庫存視頻。因此，從傳輸和存儲成本考慮，都需要研究壓縮效率更高的視頻編碼技術(shù)。

由于視頻壓縮的重要性，幾十年來學(xué)術(shù)界和工業(yè)界都對視頻編碼技術(shù)進行了長期而又深入的研究。國際上也一直有專門的標準組織制定視頻編碼標準，即 ISO/IEC MPEG工作組和ITU-T VCEG 工作組，制定了廣為人知的MPEG-1/MPEG-2/MPEG-4、H.261/H.263/H.264等系列標準[1,2]以及最新的HEVC/H.265標準。我國在圖像和視頻編碼技術(shù)方面有多年的研究歷史，但早期在國際標準制定中的參與度不高，標準技術(shù)幾乎全部為國外若干公司所壟斷，國內(nèi)企業(yè)面臨巨大的專利風險。2002年，DVD專利收費事件發(fā)生時舉國震動，大批企業(yè)的主要利潤紛紛外流，給我國視聽產(chǎn)業(yè)造成很大壓力。在經(jīng)濟全球化的大背景下，若沒有掌握核心技術(shù)與標準，我國數(shù)字媒體產(chǎn)業(yè)的健康發(fā)展以及國家利益都得不到充分保證。

正是在這種背景下，2002年，原信息產(chǎn)業(yè)部組織成立了數(shù)字音視頻編解碼技術(shù)標準（Audio Video coding Standard，AVS）工作組，目的是面向我國的信息產(chǎn)業(yè)需求，聯(lián)合國內(nèi)企業(yè)和科研機構(gòu)，制定數(shù)字音視頻的編解碼標準，為數(shù)字音視頻產(chǎn)業(yè)提供高效的編解碼技術(shù)，服務(wù)于數(shù)字電視廣播、無線寬帶多媒體通信、互聯(lián)網(wǎng)寬帶流媒體等重大信息產(chǎn)業(yè)應(yīng)用。至今已成功制定AVS1/AVS+/AVS2等系列標準并獲得成功應(yīng)用[3]。特別是 2016年底頒布的被列為國家標準的AVS2，其性能已優(yōu)于同期 H.265/HEVC國際標準。尤其是對于場景視頻編碼，AVS2標準具有顯著優(yōu)勢，能夠比HEVC/H.265節(jié)省40%左右的碼率。

本文首先回顧視頻編碼的關(guān)鍵技術(shù)演變過程，然后介紹AVS視頻編碼標準的發(fā)展歷程，并就AVS2視頻編碼標準（GB/T 33475.2-2016）介紹AVS在視頻編碼關(guān)鍵技術(shù)方面的特色創(chuàng)新。最后介紹AVS標準在數(shù)字電視廣播等行業(yè)中的應(yīng)用情況。

2 視頻編碼關(guān)鍵技術(shù)

視頻能夠進行壓縮的原因在于數(shù)字化后的視頻信號存在很多冗余，一般可將這些冗余歸納為空域冗余、時域冗余、統(tǒng)計冗余和感知冗余?？沼蛉哂嗪蜁r域冗余分別是指圖像在空間和時間上存在很大相關(guān)性，如重復(fù)或非常接近的相鄰像素值。統(tǒng)計冗余是指視頻數(shù)據(jù)信息存在統(tǒng)計上的不均勻性。視覺感知冗余是指人眼對圖像中的一些復(fù)雜細節(jié)信息感受不到，丟棄這些信息不會影響視覺感受質(zhì)量。視頻編碼即要降低或消除這些冗余信息，對此研究者提出了一系列的編碼方法，主要可以分為預(yù)測編碼、變換編碼和統(tǒng)計編碼（熵編碼）三大類。

早期的視頻壓縮技術(shù)由于在硬件上受到計算和存儲資源的限制，主要是通過統(tǒng)計編碼的辦法降低數(shù)據(jù)的統(tǒng)計冗余，比如哈夫曼碼、哥倫布碼等編碼方法。后來隨著計算和存儲資源的提升開始提出更復(fù)雜也更有效的預(yù)測、變換編碼方法。預(yù)測編碼的基本思想來源于1952年貝爾實驗室 Culter等人[4]提出的差分脈沖編碼調(diào)制系統(tǒng)，即用前一信號對當前信號進行預(yù)測，然后對預(yù)測差值進行編碼傳送。經(jīng)過預(yù)測后，殘差信號的能量比源信號的能量要低，從而降低了待編碼信號的碼率。同年Oliver和Harrison[5,6]將差分脈沖編碼技術(shù)應(yīng)用到視頻編碼中，對空域相鄰像素進行差分預(yù)測編碼，后來提出基于塊的運動補償預(yù)測技術(shù)使得預(yù)測編碼性能獲得極大的提升[7,8]。

經(jīng)過預(yù)測后的圖像像素數(shù)據(jù)之間依然存在較強的相關(guān)性，通過變換編碼進行正交變換分解去相關(guān)可以達到進一步降低空間冗余的目的。變換編碼于 20世紀 60年代后期被引入視頻編碼領(lǐng)域，早期的變換技術(shù)包括傅立葉變換、哈達碼變換等。70年代初期提出了離散余弦變換（discrete cosine transform，DCT）[9]，并證明對空域相關(guān)性很高的圖像信號離散余弦變換是最優(yōu)的變換。由于DCT具有復(fù)雜度低、去相關(guān)性能好的優(yōu)點，在視頻編碼中得到廣泛應(yīng)用，現(xiàn)今多采用從其演化出的類 DCT整數(shù)變換[10]。在最近的變換編碼研究方面，對于隨著預(yù)測距離增加相關(guān)性逐漸降低的幀內(nèi)預(yù)測殘差信號，離散正弦變換（discrete sine transform，DST）比DCT更有效[11]。

70年代中期，預(yù)測編碼開始與變換編碼結(jié)合起來使用[12]，到 80年代已形成了經(jīng)典的預(yù)測/變換混合編碼框架[13]。基于預(yù)測/變換的視頻編碼框架如圖1所示，首先通過對圖像進行塊劃分，進行基于塊的幀內(nèi)預(yù)測或幀間預(yù)測降低空時域冗余，然后通過變換進行正交分解，在消除數(shù)據(jù)相關(guān)性的同時進行能量集中，可以用一部分變換系數(shù)來近似表示原來的能量信息，隨后的量化過程即可達到這一個目的，量化將使部分高頻系數(shù)量化為零，然后進行熵編碼，從而達到壓縮的目的。由于預(yù)測、變換都是基于塊進行的，在低碼率端會出現(xiàn)明顯的塊效應(yīng)，對重構(gòu)圖像進行一些去塊濾波處理不僅能提升主觀質(zhì)量，還能進一步提升編碼效率。這一編碼框架后來廣泛應(yīng)用于大家所熟知的MPEG、H.26x、AVS系列編碼標準，直至今天最新一代的HEVC/H.265、AVS2標準也都是基于這一框架。此外，在這一編碼框架中環(huán)路濾波也是非常重要的模塊之一，它起源于早先主要用于提高主觀質(zhì)量的后處理濾波，自 H.263+開始用于編碼標準，從 H.264/AVC開始廣為應(yīng)用。環(huán)路濾波不僅能提升主觀質(zhì)量，濾波后的圖像作為參考還能提升客觀編碼性能。在HEVC/H.265、AVS2標準的制定過程中，環(huán)路濾波技術(shù)進一步發(fā)展，除了去塊效應(yīng)濾波還增加了樣值偏移補償（sample adaptive offset，SAO）、自適應(yīng)修正濾波（adaptive leveling filter，ALF）等濾波技術(shù)[14]。

圖1 基于預(yù)測/變換的視頻編碼框架

3 AVS標準發(fā)展歷程及技術(shù)特色

2002—2017年的15年間AVS工作組一直致力于制定具有自主知識產(chǎn)權(quán)的視頻編碼標準，至今已成功地制定了面向高清數(shù)字電視、移動視頻、監(jiān)控視頻等應(yīng)用的高效視頻編碼標準。2012年，為了加快推進AVS在廣播電視行業(yè)中的應(yīng)用，國家廣播電影電視總局科技司與工業(yè)和信息化部電子信息司聯(lián)合發(fā)文共同成立“AVS技術(shù)應(yīng)用聯(lián)合推進工作組”（以下簡稱為AVS推進組），從此AVS標準發(fā)展進入快車道，并于2012年7月成功制定AVS+行業(yè)標準，如今AVS+已在數(shù)字電視廣播等應(yīng)用中取得重要進展。2011年底AVS啟動了面向超高清應(yīng)用的新一代視頻編碼標準 AVS2的制定工作，2015年底標準技術(shù)制定完成，2016年5月獲批為廣電行業(yè)標準 GY/T 299.1-2016，2016年12月正式獲批為國家標準 GB/T 33475.2-2016。AVS主要標準的制定發(fā)展過程見表1。

表1 AVS視頻編碼標準制定歷程

15年來AVS吸引了上百家科研院所、企業(yè)公司的參與，在視頻編碼制定過程中實現(xiàn)了視頻編碼核心技術(shù)的創(chuàng)新，比如最新一代的 AVS2標準已經(jīng)在性能上優(yōu)于HEVC/H.265國際標準，甚至在場景視頻編碼方面實現(xiàn)了大幅度超越。下面簡要介紹 AVS2標準的主要特色技術(shù)，包括靈活的預(yù)測塊劃分、多假設(shè)幀間預(yù)測、優(yōu)化的層次變換、基于上下文的熵編碼、自適應(yīng)環(huán)路濾波和基于背景建模的場景編碼。最后就AVS2與HEVC的性能加以比較。

3.1 靈活的預(yù)測塊劃分

從20世紀90年代的第一代MPEG-1、H.261標準，到以 H.264/AVC、AVS1/AVS+為代表的第二代編碼標準，都采用基于塊的預(yù)測變換編碼技術(shù)，即以 16×16像素的宏塊（macroblock）為基本的數(shù)據(jù)組織編碼單位，然后對宏塊進行劃分預(yù)測（如16×8像素、8×16像素或8×8像素塊等），最后進行基于塊的變換（一般是 8×8像素塊變換），由此可見劃分的形式約束較多。而最新的H.265/HEVC、AVS2標準采用了基于四叉樹遞歸劃分的編碼架構(gòu)，即一幀圖像首先劃分成連續(xù)不重疊的最大編碼單元（largest coding unit，LCU），最大編碼單元按照四叉樹遞歸劃分的方式劃分成更小的編碼單元（coding unit，CU），如圖2所示。在AVS2中，最大編碼單元大小為64×64像素，最小可劃分成8×8像素的編碼單元。編碼單元的最終劃分模式一般通過率失真優(yōu)化編碼決策選擇。編碼單元大小確定后，又進一步劃分成預(yù)測單元進行幀內(nèi)預(yù)測或幀間預(yù)測，最后對預(yù)測殘差進行變換編碼。在AVS2中，變換編碼采用了類似編碼單元劃分的層次變換劃分以選擇最優(yōu)的變換。

圖2 AVS2編碼單元（CU）四叉數(shù)劃分示例（最小塊為8×8像素）

對于預(yù)測單元劃分的形狀，AVS2也更加靈活。AVS2的幀間預(yù)測劃分方式如圖3所示，包括對稱劃分和非對稱劃分（asymmetric motion partition，AMP），其中非對稱劃分方式適用于16×16像素及以上CU大小。對于幀內(nèi)預(yù)測，AVS2有方形和非方形兩種預(yù)測劃分模式，如圖4所示。相比于方形劃分，非方形劃分可以進一步縮短預(yù)測距離，從而提高預(yù)測的準確度[15]?？紤]到復(fù)雜度和性能之間的折中，非方形劃分僅適用于32×32像素和16×16像素的幀內(nèi)預(yù)測編碼單元。

圖3 AVS2預(yù)測單元（PU）幀間預(yù)測劃分模式

圖4 AVS2預(yù)測單元（PU）幀內(nèi)預(yù)測劃分模式

3.2 多假設(shè)幀間預(yù)測

幀間預(yù)測編碼是一種有效降低時間冗余的預(yù)測方式，從MPEG-1引入的前向P幀、雙向B幀預(yù)測開始，后來的幀間預(yù)測技術(shù)陸續(xù)又有多參考幀預(yù)測、層次參考幀預(yù)測[16]以及針對靜止運動或一致性運動的跳過模式、直接模式，用于提高運動預(yù)測精度的 1/4像素精度預(yù)測，用于提高運動矢量預(yù)測編碼效率的中值預(yù)測、多運動矢量預(yù)測等編碼技術(shù)。

類似B幀有兩個方向的預(yù)測，AVS2中新增加了一種支持前向雙假設(shè)預(yù)測的圖像，稱為F幀。按照雙假設(shè)預(yù)測的來源可以分為時域雙假設(shè)和空域雙假設(shè)兩類[17,18]。時域雙假設(shè)如圖 5所示，當前塊可以利用兩個前向預(yù)測塊的加權(quán)平均作為當前塊的預(yù)測，其中只編碼運動矢量1，運動矢量2由運動矢量1根據(jù)時間距離導(dǎo)出?？沼螂p假設(shè)采用預(yù)定方向上的兩個預(yù)測子的平均結(jié)果作為預(yù)測值，如圖6所示，中心位置為初始預(yù)測子，選擇連線經(jīng)過初始預(yù)測子的4種模式進行計算，其中1/2像素距離和1/4像素距離位置的4種模式分別計算，再加上初始預(yù)測值，共有9種模式供選擇。

圖5 時域前向雙假設(shè)預(yù)測模式示意

圖6 空域雙假設(shè)預(yù)測模式示意

3.3 優(yōu)化的層次變換

類似編碼單元對圖像原始數(shù)據(jù)的劃分組織方式，AVS2對于殘差數(shù)據(jù)采用基于變換單元的層次變換編碼。AVS2支持4×4像素～32×32像素大小的方形進行DCT，并且對除了2N×2N和N×N幀內(nèi)預(yù)測以外的其他預(yù)測殘差使用基于四叉樹的非方形 DCT（non-square quadtree transform，NSQT）[19]。與完全的方形變換相比，非方形變換可以避免因跨預(yù)測塊邊界變換而增加高頻系數(shù)，提高了熵編碼性能。為了降低變換復(fù)雜度，AVS2中采用了一套簡化的NSQT方案，只允許亮度殘差選擇方形或非方形劃分。如圖7（a）和圖7（b）所示，分別是水平和垂直劃分成4個非方形塊的變換結(jié)構(gòu)。此外，對于8×8像素塊大小以上的亮度幀內(nèi)預(yù)測殘差，AVS2對其DCT低頻變換系數(shù)再多進行一次4點的二次變換，如圖8所示。二次變換使得系數(shù)分布更為集中，從而提高幀內(nèi)預(yù)測殘差的壓縮效率[20]。

圖7 NSQT示意

圖8 二次變換示意

3.4 基于上下文的熵編碼

前面提到早期的編碼標準主要采用哈夫曼碼對編碼系數(shù)進行熵編碼，優(yōu)點是復(fù)雜度較低，缺點是哈夫曼碼對任何一個信源符號均需至少分配1 bit的碼字，特別是當實際信源概率分布跟預(yù)先設(shè)計的哈夫曼碼概率分布不一致時會降低編碼效率。算術(shù)編碼通過聯(lián)合編碼信源符號，理論上可以為每一個信源符號分配逼近信源概率分布的碼字，但由于復(fù)雜度高一直在視頻編碼中未被應(yīng)用[21]。在H.264/AVC標準制定過程，提出的基于上下文的二值算術(shù)編碼很好地解決了算術(shù)編碼復(fù)雜度問題[22]。首先通過二值化實現(xiàn)信源符號的統(tǒng)一算術(shù)編碼過程，即將不同的信源符號轉(zhuǎn)換成0或1的二進制串，對不同信源符號的編碼轉(zhuǎn)換成僅對不同0或1的概率分布編碼，通過上下文選擇不同的概率進行編碼提高了信源符號編碼效率，同時通過查表實現(xiàn)算術(shù)編碼過程中復(fù)雜的概率更新計算過程。

在AVS2中，對高層語法如序列頭、圖像頭、條帶頭采用變長編碼（variable length coding，VLC），而對編碼樹（coding unit tree）級的其他語法元素采用高級熵編碼（advanced entropy coding，AEC）。無論是VLC還是AEC，首先都需要將各語法元素的值進行二值化，得到二進制串。對于二值化，AVS2有3種二值化方法：一元碼（unary code）、截斷一元碼（truncated unary code）和指數(shù)哥倫布碼（exp-Golomb code），可以將不同取值范圍的信源符號高效地轉(zhuǎn)換成二進制串進行編碼。

圖9 8×8像素變換塊中的Zig-Zag掃描順序以及其劃分的4個子塊CG中的系數(shù)的掃描順序

進一步，AVS2對變換系數(shù)編碼采用兩層組織編碼機制，即每個TU進一步劃分成若干個4×4像素塊系數(shù)組（coefficient group，CG）進行編碼[23]。圖9描述了一個8×8像素的塊編碼過程，即首先劃分成4個CG，然后每個CG內(nèi)的系數(shù)按照Zig-Zag掃描方式進行編碼?；贑G的編碼方式有兩個優(yōu)點：實現(xiàn)模塊化編碼，也就是不同變換塊大小的包含的子塊都可以使用的統(tǒng)一的方式進行編碼；與掃描整個變換塊相比，在軟件和硬件實施方面，都降低了計算復(fù)雜度。同樣，對于 16×16像素的TU劃分成16個子塊，32×32像素的TU劃分成64個子塊，如圖10所示。

圖10 兩層變換系數(shù)掃描方式

3.5 環(huán)路濾波

環(huán)路濾波是視頻編碼器的重要模塊之一。早期的濾波處理主要是作為一種視頻編碼后處理手段，處理后的圖像即送給顯示模塊進行顯示，環(huán)路濾波即體現(xiàn)在這些濾波處理處在編碼環(huán)路中。AV2中的環(huán)路濾波包括3個模塊，即去塊效應(yīng)濾波、樣值偏移補償[24]和自適應(yīng)修正濾波[25]，分別用于濾波處理編碼帶來的不同類型的失真。去塊效應(yīng)濾波主要是用于去除由于基于塊的編碼在快邊界所產(chǎn)生的塊效應(yīng)失真，通過濾波平滑處理可以有效提升主觀質(zhì)量。樣值偏移補償是指在去塊效應(yīng)濾波之后基于像素進行的非線性濾波操作，基于量化失真的統(tǒng)計特性，進行基于區(qū)間或邊緣模式的失真補償操作。區(qū)間模式是指將0～255的像素值劃分成若干連續(xù)的區(qū)間，根據(jù)失真統(tǒng)計情況為相應(yīng)區(qū)間的像素分配一個濾波偏置值，將這個偏移值疊加到相應(yīng)像素位置進行濾波。邊緣模式分為水平、垂直和兩種對角模式4種，如圖 11所示。根據(jù)當前濾波后樣本的值與其相鄰的濾波后樣本的值的關(guān)系查表得到偏置值，對當前像素進行濾波。

圖11 樣值偏移補償?shù)倪吘壞Ｊ较聵颖竞拖噜彉颖镜奈恢藐P(guān)系

自適應(yīng)修正濾波對樣值偏置濾波后的重建圖像進行類似維納濾波的處理，以進一步減小編碼失真，提高參考圖像質(zhì)量。樣本補償濾波器形狀如圖12所示，為7×7十字加3×3方形的中心對稱濾波器，濾波器系數(shù)C0～C7的為取值范圍是[?64，63]，濾波器系數(shù)C8的取值范圍是[0，127]。對于亮度分量，將圖像按照LCU對齊的規(guī)則均勻劃分為16個區(qū)域并訓(xùn)練對應(yīng)的16套濾波器系數(shù)，而對于色度分量（Cb/Cr）分別只訓(xùn)練一套濾波器系數(shù)。對于亮度分量的16套濾波器系數(shù)，編碼端根據(jù)率失真性能進行自適應(yīng)合并，得到最優(yōu)的濾波器數(shù)目。亮度和色度分量通過幀級標志和最大編碼單元級標志來分別控制濾波器是否被使用。

圖12 樣本補償濾波器形狀

3.6 場景編碼

在諸如視頻監(jiān)控、視頻會議等應(yīng)用中，視頻內(nèi)容有其自身的特性，即背景內(nèi)容通常保持不變，稱此類視頻為場景視頻。和傳統(tǒng)影視視頻相比，場景視頻的數(shù)據(jù)冗余還可以被進一步挖掘，比如可以通過建立高效的背景視頻模型降低背景信息冗余。為此AVS提出了基于背景建模的視頻編碼方法[26]，針對監(jiān)控視頻、視頻會議等場景視頻內(nèi)容實現(xiàn)編碼效率比同期國際標準提升約一倍左右。

AVS提出的基于背景建模的監(jiān)控視頻編碼流程如圖13所示，首先經(jīng)過背景建模、背景編碼、背景解碼后，生成高質(zhì)量的重建背景圖像；然后，編碼器使用該重建背景完成對每幅圖像進行背景預(yù)測以降低背景部分的編碼代價，進而得到更優(yōu)的編碼效率；最后，背景圖像碼流和視頻序列碼流都傳輸給解碼過程用于解碼。

圖13 基于背景建模的監(jiān)控視頻編碼框架

3.7 性能比較

使用AVS2參考軟件RD12.0的編碼性能與第一代標準 AVS1對比結(jié)果見表 2。在隨機訪問（random access，RA）、低時延（low delay，LD）和全幀內(nèi)（all intra，AI）編碼3種配置下，AVS2分別獲得了52.9%、51.0%和31.2%的亮度性能增益。與HEVC參考軟件（HM16.6）的性能對比見表3，在隨機訪問和全幀內(nèi)編碼配置下，AVS2相比HEVC有0.9%和0.1%的性能提升；在低時延配置下，AVS2相比HEVC有2.1%的性能損失。

針對監(jiān)控類視頻，AVS2與HEVC的性能對比見表4，在隨機訪問和低時延配置下，基于背景建模的場景編碼能分別提升39.1%和31.3%的編碼性能。

表2 AVS2與AVS1對比性能測試

表3 AVS2與HEVC對比性能測試

表4 AVS2基于背景建模的編碼與HEVC對比性能測試

由上述結(jié)果可以看出，第二代標準 AVS2比第一代標準 AVS1有突出的性能提升，與同期國際標準HEVC相比已在場景編碼方面大幅領(lǐng)先。

使用 AVS2快速編碼器 CAVS2的性能與HEVC開源編碼器x265對比見表 5和表6，和HEVC參考軟件的性能對比見表 7。測試中使用HEVC通測條件[27]中的5個1080P高清序列，其中x265使用2.4版本。CAVS2使用的量化參數(shù)QP設(shè)置為27、32、38、45，與AVS2通測條件保持一致，為保持兩者碼率和質(zhì)量接近，HEVC測試使用的QP為24、28、33、38，對應(yīng)x265使用的QP為27、31、36、41，均使用單線程進行編碼。此外，在RA配置下，相鄰的P幀之間的B幀數(shù)量為7個，其中x265的超快速檔次下的數(shù)量為3個。

表5 RA配置下AVS2快速編碼器CAVS2與x265性能對比

可以看到在超快速～平和5個檔次下，CAVS2在速度與 x265接近的情況下都具有明顯性能優(yōu)勢，其中 LD配置下平均增益分別為?16.54%、?4.70%、?10.43%、?8.71%、?9.90%，RA配置下平均增益分別為?3.65%、?9.51%、?15.94%、?5.80%、?8.83%。

和HM16.6相比，在超快速～平和5個檔次下，CAVS2在 LD配置下平均性能損失分別為：107.97%、51.97%、29.20%、17.55%、11.00%，在 RA配置下平均性能損失分別為 87.51%、39.76%、18.11%、12.60%、5.31%。其中序列Cactus的RD曲線如圖14所示，5個序列的平均性能損失與編碼速度曲線如圖15所示。

4 AVS標準應(yīng)用

AVS的出發(fā)點是實現(xiàn)知識產(chǎn)權(quán)的自主可控，讓標準回歸為產(chǎn)業(yè)發(fā)展服務(wù)的本位，支撐我國數(shù)字視音頻產(chǎn)業(yè)的健康發(fā)展。為有效推進AVS標準的發(fā)展和應(yīng)用，2002年、2004年和2005年分別成立了負責組織研究制定技術(shù)標準的“AVS工作組”、負責知識產(chǎn)權(quán)事務(wù)管理的“AVS專利池管理委員會”和負責推動AVS產(chǎn)業(yè)應(yīng)用的“AVS產(chǎn)業(yè)聯(lián)盟”，也被形象地稱為“AVS三駕馬車”。AVS的制定和推廣有賴于3個組織的協(xié)同工作。

表6 LD配置下AVS2快速編碼器CAVS2與x265性能對比

表7 AVS2快速編碼器CAVS2與HM性能對比

圖14 AVS2快速編碼器CAVS2與x265性能對比

圖15 AVS2快速編碼器CAVS2與x265速度對比

AVS 標準已成為我國自主創(chuàng)新實施的一個典型案例，推動了我國自主技術(shù)創(chuàng)新與民族產(chǎn)業(yè)的發(fā)展。2006年第一代AVS標準頒布為國家標準，2012年7月AVS+頒布為廣電行業(yè)標準并實施，進一步加快了自主創(chuàng)新AVS國家標準在廣播電視領(lǐng)域的應(yīng)用進程。目前中央電視臺14套高清頻道已全部采用AVS+標準播出，各省衛(wèi)視也已經(jīng)全部切換到 AVS+標準，AVS已成為支撐我國數(shù)字視聽產(chǎn)業(yè)鏈“由大變強”的基礎(chǔ)標準。2014年11月，財政部批復(fù)《中央廣播電視節(jié)目無線覆蓋工程》，投入近50億對全國2 562個發(fā)射臺站進行數(shù)字化改造和全覆蓋，明確規(guī)定全國范圍內(nèi)地面電視節(jié)目編碼方式采用 AVS+編碼。在海外，AVS在柬埔寨、老撾、斯里蘭卡、古巴、吉爾吉斯斯坦等國的數(shù)字電視領(lǐng)域得到廣泛應(yīng)用。

2016年5 月，AVS2廣電行業(yè)標準的正式發(fā)布將更進一步推動我國數(shù)字視頻產(chǎn)業(yè)的蓬勃發(fā)展，特別是超高清數(shù)字電視廣播在國內(nèi)的應(yīng)用。目前我國已有計劃在2018年進行4K超高清試轉(zhuǎn)播世界杯賽事節(jié)目，在2019年正式開通4K頻道。AVS標準為我國的廣播電影電視行業(yè)創(chuàng)造了巨大的產(chǎn)業(yè)機會，推動了我國數(shù)字視頻產(chǎn)業(yè)的持續(xù)蓬勃發(fā)展。

5 結(jié)束語

本文簡單介紹了AVS視頻編碼標準發(fā)展歷程以及最新一代 AVS2標準的核心創(chuàng)新技術(shù)。和AVS1視頻編碼標準相比，AVS2編碼效率提升一倍以上，和同期HEVC/H.265國際標準相比，AVS2在場景視頻編碼方面有顯著優(yōu)勢。AVS作為我國技術(shù)創(chuàng)新的典型已獲得廣泛應(yīng)用，形成了完善的AVS產(chǎn)業(yè)群體，在支撐我國數(shù)字音視頻產(chǎn)業(yè)實現(xiàn)“中國制造”到“中國創(chuàng)造”的戰(zhàn)略轉(zhuǎn)型中做出了歷史性貢獻。

[1]朱秀昌. 視頻編碼新標準——H.264[J]. 電信科學(xué), 2002, 18(12): 26-29. ZHU X C. A new video coding recommendation——H.264[J]. Telecommunications Science, 2002, 18(12): 26-29.

[2]解偉, 郭曉強, 全子一. IPTV中的視頻壓縮技術(shù)研究[J]. 電信科學(xué), 2006, 22(3): 39-42. XIE W, GUO X Q, QUAN Z Y. Research on video compression in IPTV application[J]. Telecommunications Science, 2006, 22(3): 39-42.

[3]郭春輝, 周經(jīng)野, 劉華東, 等. AVS1-P7與H.264關(guān)鍵技術(shù)及性能比較[J]. 電信科學(xué), 2006, 22(1): 47-50. GUO C H, ZHOU J Y, LIU H D, et al. Key technologies and performance comparison of AVS1-P7 with H.264[J]. Telecommunications Science, 2006, 22(1): 47-50.

[4]CUTLER C. Differential quantization of communication signals: US patent 2605631[S]. 1952.

[5]OLIVER B. Efficient coding[J]. The Bell System Technical Journal, 1952(31): 724-750.

[6]HARRISON C. Experiments with linear prediction in television[J]. The Bell System Technical Journal, 1952, 31(7): 764-783.

[7]CANDY J, FRANKE M, HASKELL B, et al. Transmitting television as clusters of frame-to-frame differences[J]. The Bell System Technical Journal, 1971, 50(7): 1889-1917.

[8]NETRAVALI A, ROBBINS J. Motion-compensated television coding: part 1[J]. The Bell System Technical Journal, 1979, 58(3): 631-670.

[9]AHMED N, NATARAJAN T, RAO K R. Discrete cosine transform[J]. IEEE Transactions on Computers, 1974, C(32): 90-93.

[10]MALVAR H, HALLAPURO A, KARCZEWICZ M, et al. Low-complexity transform and quantization in H.264/AVC[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2003, 13(7): 598-603.

[11]NARROSCHKE M. Coding efficiency of the DCT and DST in hybrid video coding[J]. IEEE Journal of Selected Topics in Signal Processing, 2013, 7(6): 1062-1071.

[12]TESCHER A G, COX R V. An adaptive transform coding algorithm[C]//1976 IEEE International Conference on Communications, June 14-16, 1976, Philadelphia, USA. New Jersey: IEEE Press,1976.

[13]KOGA T, IINUMA K, HIRANO A, et al. Motion-compensated inter-frame coding for video conferencing: NTCG5.3.1-G 5.3.5[R]. 1981.

[14]馬思偉. AVS視頻編碼標準技術(shù)回顧及最新進展[J]. 計算機研究與發(fā)展, 2015, 52(1): 27-37. MA S W. History and recent developments of AVS video coding standards[J]. Journal of Computer Research and Development, 2015, 52(1): 27-37.

[15]余全合, 曹瀟然, 李蔚然, 等. 短距離幀內(nèi)預(yù)測技術(shù): AVS_M3171[S]. 2013. YU Q H, CAO X R, LI W R, et al. Short range intra prediction technique: AVS_M3171[S]. 2013.

[16]FLIERL M, WIEGAND T, GIROD B. Rate-constrained multi-hypothesis prediction for motion compensated video compression[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2002, 12(11): 957-969.

[17]凌勇, 虞露. F幀CE：一種前向雙假設(shè)預(yù)測圖像塊編碼技術(shù): AVS_M3326[S]. 2014. LING Y, YU L. F frame CE: a block image coding technique based on forward two hypothesis prediction: AVS_M3326[S]. 2014.

[18]KIM I K, LEE S, PIAO Y J, et al. Directional multi-hypothesis prediction (DMH) for AVS2: AVS_M3094[S]. 2013.

[19]李蔚然, 袁媛, 曹瀟然, 等.非平方的四叉樹變換: AVS_M3153[S]. 2013. LI W R, YUAN Y, CAO X R, et al. Non-square quad-tree transform: AVS_M3153[S]. 2013.

[20]林和源, 童怡新, 王頌文. 幀內(nèi)編碼二次轉(zhuǎn)換改進提案: AVS_M3296[S]. 2014. LIN H Y, TONG Y X, WANG S W. Improvement proposal of the second time transform of intraframe coding: AVS_M3296[S]. 2014.

[21]RISSANEN J. Generalized draft inequality and arithmetic coding[J]. IBM Journal of Research and Development, 1976(20): 198-203.

[22]MARPE D, SCHWARZ H, WIEGAND T. Context-based adaptive binary arithmetic coding in the H.264/AVC video compression standard[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2003, 13(7): 620-636.

[23]WANG J, WANG X, JI T, et al. Two-level transform coefficient coding:AVS_M3035[S]. 2012.

[24]LEE J S, KIM C, FU C, et al. Sample adaptive offset for AVS2:AVS_M3197[S]. 2013.

[25]ZHANG X, SI J, WANG S, et al. Adaptive loop filter for AVS2:AVS_M3292[S].2014.

[26]ZHANG X, HUANG T, TIAN Y, et al. Low-complexity and high-efficiency background modeling for surveillance video coding[C]//2012 Visual Communications and Image Processing (VCIP 2012), Nov 27-30, 2012, San Diego, USA. New Jersey: IEEE Press, 2012.

[27]BOSSEN F. Common HM test conditions and software reference con-figurations: ITU-T SG16 ContributionJCTVC-L1100[S]. 2013.

Kernel technologies and applications of AVS2 video coding standard

MA Siwei1, LUO Falei2, HUANG Tiejun1
1. School of Electronics Engineering and Computer Science, Peking University, Beijing 100871, China 2. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100081, China

A brief introduction was given to the development history of AVS video coding standards. Then an overview of the key technologies adopted in AVS2 video coding standard (GB/T 33475.2-2016) was provided, including flexible prediction partition, multiple hypothesis prediction, optimized two-level transform, adaptive loop filter and background picture model based prediction coding for scene video. Compared to the AVS1, AVS2 can achieve more than 50% bits saving. And compared to HEVC/H.265, AVS2 can achieve significant coding efficiency improvement for scene video coding. Moreover, the applications of AVS standard in digital TV broadcasting was introduced briefly.

AVS, transform, prediction, entropy coding, loop filter

TN919.81

10.11959/j.issn.1000?0801.2017245

馬思偉（1979?），男，北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授，主要研究方向為視頻處理與編碼。

羅法蕾（1991?），男，中國科學(xué)院計算技術(shù)研究所博士生，主要研究方向為視頻編碼。

黃鐵軍（1970?），男，北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、計算機科學(xué)技術(shù)系主任，主要研究方向為視覺信息處理與神經(jīng)形態(tài)計算。

2017?07?10；

2017?08?08

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

AVS2視頻編碼標準技術(shù)特色及應(yīng)用

1 引言

2 視頻編碼關(guān)鍵技術(shù)

3 AVS標準發(fā)展歷程及技術(shù)特色

4 AVS標準應(yīng)用

5 結(jié)束語