朱曉蓉
[摘要]首先對(duì)圖像編碼標(biāo)準(zhǔn)的發(fā)展作了分析;然后介紹圖像編碼原理;最后簡(jiǎn)單地介紹圖像編碼新標(biāo)準(zhǔn)。
[關(guān)鍵詞]圖像編碼標(biāo)準(zhǔn) ISO/IEC ITU MPEG H.264 H.265 AVS
中圖分類號(hào):TP3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1671-7597(2009)0220018-03
1948年,信息論提出,奠定了圖像數(shù)據(jù)壓縮技術(shù)的基礎(chǔ)。直至今日,圖像編碼已走過了整60年的歷程。
一、制定圖像編碼標(biāo)準(zhǔn)的國(guó)際組織
(一)ISO/IEC
國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardizati
on,簡(jiǎn)稱ISO)是目前世界上最大、最具權(quán)威性的國(guó)際標(biāo)準(zhǔn)化專門機(jī)構(gòu)。國(guó)際電工委員會(huì)(International Electrotechnical Commission,簡(jiǎn)稱IEC)是世界上最早的國(guó)際性電工標(biāo)準(zhǔn)化機(jī)構(gòu)。負(fù)責(zé)制定MPEG系列編碼壓縮標(biāo)準(zhǔn)。
(二)ITU
國(guó)際電信聯(lián)盟(International Telecommunication Union,簡(jiǎn)稱ITU),是國(guó)際電信界最權(quán)威的標(biāo)準(zhǔn)修訂組織。1972年12月起,電信標(biāo)準(zhǔn)化部、無線電通信部和電信發(fā)展部承擔(dān)著ITU的實(shí)質(zhì)性標(biāo)準(zhǔn)制訂工作。其中,電信標(biāo)準(zhǔn)化部門由原來的國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)和國(guó)際無線電咨詢委員會(huì)(CCIR)的標(biāo)準(zhǔn)化部門合并而成。負(fù)責(zé)制定H系列編碼壓縮標(biāo)準(zhǔn)。ISO/IEC與ITU有時(shí)又聯(lián)合一起制定編碼壓縮標(biāo)準(zhǔn)。這可從圖1中看出。
二、圖像編碼標(biāo)準(zhǔn)及所采用的技術(shù)
(一)MPEG系列標(biāo)準(zhǔn)
ISO/IEC制定了MPEG-1、MPEG-2、MPEG-4(2)以及MPEG4(10)標(biāo)準(zhǔn)。主要用于電視廣播和消費(fèi)類電子產(chǎn)品。
(二)H系列標(biāo)準(zhǔn)
ITU制定了H.261、H.262、H.263、H.263+、H.263++、H.264標(biāo)準(zhǔn)。主要用于通信類電子產(chǎn)品。
(三)兩個(gè)系列標(biāo)準(zhǔn)的對(duì)應(yīng)關(guān)系
表1示出了視頻編碼標(biāo)準(zhǔn)發(fā)展歷程,分別由ISO/IEC與ITU制定的編碼壓縮標(biāo)準(zhǔn),以及由ISO/IEC與ITU聯(lián)合制定的編碼壓縮標(biāo)準(zhǔn)。
由表1可見,圖像壓縮標(biāo)準(zhǔn)可分為兩大系列:MPEG-X;H.26X。它們?cè)跀?shù)據(jù)壓縮技術(shù)和輸出碼率之間有如表2所示的對(duì)應(yīng)關(guān)系。
(四)中國(guó)的AVS標(biāo)準(zhǔn)
我國(guó)是ISO/IEC組織的正式成員國(guó),國(guó)家信標(biāo)委下屬的多媒體分委員會(huì)與ISO/IEC JTC1/SC29直接對(duì)口。從2000年5月開始,我國(guó)開始跟蹤并參與JVT標(biāo)準(zhǔn)的制定工作,目前已有多項(xiàng)技術(shù)提案遞交到JVT標(biāo)準(zhǔn),有些技術(shù)已經(jīng)被JVT標(biāo)準(zhǔn)所接收。
基于我國(guó)專家多年參與MPEG國(guó)際標(biāo)準(zhǔn)制定的經(jīng)驗(yàn),2002年6月成立的“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組”聯(lián)合國(guó)內(nèi)從事數(shù)字音視頻編解碼技術(shù)研發(fā)的科研機(jī)構(gòu)和企業(yè),提出了我國(guó)自主的數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)AVS(Audio Video coding Standard)。于2003年年底完成的AVS 1.0標(biāo)準(zhǔn)具有四個(gè)特點(diǎn):①性能高,與H.264基本相同;②算法的復(fù)雜度比H.264低;③軟件和硬件實(shí)現(xiàn)成本都比H.264低;④專利授權(quán)費(fèi)用低。
(五)目前業(yè)界最看好的二三種主要標(biāo)準(zhǔn)的對(duì)比
1.3種編碼標(biāo)準(zhǔn)的基本功能
3種編碼標(biāo)準(zhǔn)的基本功能對(duì)比如表3。
這三種主要編碼技術(shù)各有優(yōu)缺點(diǎn),MPEG-4(2)發(fā)布較早,產(chǎn)業(yè)化程度較高,產(chǎn)品相對(duì)成熟,價(jià)格也較低,同時(shí)算法復(fù)雜度較低,但是編碼效率也相對(duì)較低,速率較高,對(duì)網(wǎng)絡(luò)要求較高。對(duì)于H.264標(biāo)準(zhǔn),已經(jīng)有多家廠商提供H.264芯片和機(jī)頂盒,產(chǎn)品成熟,而且因?yàn)椴捎昧硕囗?xiàng)提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,在不影響視頻效果的情況下能夠比MPEG-4(2)節(jié)約39%的碼率。例如要達(dá)到標(biāo)清質(zhì)量,MPEG-4(2)編碼需要1.5~2Mbit/s的碼率,而H.264只需要1.2~1.5Mbit/s碼率即可;對(duì)于高清圖像質(zhì)量,MPEG-4(2)編碼的視頻碼率需要6~8Mbit/s,而H.264只需要4~6Mbit/s。因此在信道總?cè)萘肯嗤那闆r下能夠覆蓋更多的用戶。同時(shí),由于H.264是由ITU-T和ISO/IEC聯(lián)合制定的,所以對(duì)解碼兼容性有著明確的定義,具有較強(qiáng)的抗誤碼能力,容易獲得穩(wěn)定的圖像,適用于丟包率高、干擾嚴(yán)重的信道傳輸。不過H.264的算法復(fù)雜度較高,系統(tǒng)開銷也比較大。
AVS是近幾年才提出的視頻標(biāo)準(zhǔn),產(chǎn)業(yè)化進(jìn)程落后于H.264。但是AVS的編碼效率與H.264相當(dāng),而算法復(fù)雜度比H.264明顯低,其編碼復(fù)雜度相當(dāng)于H.264的30%;解碼復(fù)雜度相當(dāng)于H.264的70%,軟硬件實(shí)現(xiàn)成本都低于H.264;由于具有自主知識(shí)產(chǎn)權(quán),專利費(fèi)用低,可以預(yù)期AVS標(biāo)準(zhǔn)將會(huì)是支撐國(guó)家數(shù)字音視頻產(chǎn)業(yè)發(fā)展的重要標(biāo)準(zhǔn)。
2.專利費(fèi)用對(duì)比
3種標(biāo)準(zhǔn)對(duì)應(yīng)的專利費(fèi)用如表4所示。
可以看出在專利費(fèi)方面AVS占有絕對(duì)的優(yōu)勢(shì)。MPEG-4和H.264不僅要收軟硬件的專利費(fèi),而且還要收取節(jié)目點(diǎn)播費(fèi)用等,中國(guó)龐大用戶群將給運(yùn)營(yíng)商帶來每年數(shù)以億計(jì)的巨大專利費(fèi)負(fù)擔(dān);而AVS只收取1元人民幣的象征性費(fèi)用,對(duì)于運(yùn)營(yíng)商來講非常具有吸引力。
3.應(yīng)用情況對(duì)比
從目前情況看,MPEG-4和H.264在中國(guó)市場(chǎng)應(yīng)用較普遍,兩者已應(yīng)用在中國(guó)電信和中國(guó)網(wǎng)通開展的手機(jī)電視試驗(yàn)及商用網(wǎng)中。由于AVS推出較晚,還處于上下游產(chǎn)業(yè)鏈的完善階段,在市場(chǎng)的推廣和開拓方面還有待加強(qiáng),真正商用有待驗(yàn)證其圖像質(zhì)量、是否滿足商用要求和產(chǎn)業(yè)鏈的逐漸成熟。目前3種標(biāo)準(zhǔn)常見的應(yīng)用場(chǎng)景列舉如表5。
(六)截至目前為止圖像壓縮編碼所采用的技術(shù)
截至2008年國(guó)內(nèi)外所有圖像信源壓縮標(biāo)準(zhǔn)都是采用混合編碼壓縮方法。它包括內(nèi)插法、預(yù)測(cè)編碼、變換編碼和熵編碼等技術(shù),統(tǒng)稱為混合編碼壓縮方法。所有標(biāo)準(zhǔn)都可用圖1所示的“混合型”編碼方案的框圖描述。從圖1可以看出,在編碼器的虛線框內(nèi)實(shí)際上就是解碼器,所以說編碼器中包括了解碼器。
之所以有新舊標(biāo)準(zhǔn)的差異,是因?yàn)槊總€(gè)框圖中所采用的技術(shù)不同,較早提出的標(biāo)準(zhǔn)技術(shù)較簡(jiǎn)單,新標(biāo)準(zhǔn)的技術(shù)較精細(xì),帶來壓縮倍數(shù)的不斷提高。該方案中用運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)去除圖像在時(shí)間域的冗余度,然后用變換變換編碼去除空間域的冗余度,最后再用熵編碼去除經(jīng)量化后的變換系數(shù)中所含的統(tǒng)計(jì)冗余度。變換系數(shù)的量化利用了人眼的視覺特性,量化器的精度還受到輸出緩存器狀態(tài)的控制。輸出緩存器是為了適應(yīng)恒定碼率信道的要求,平滑變字長(zhǎng)編碼器輸出的不均勻碼流而設(shè)置的。當(dāng)緩存器接近上溢和下溢時(shí),通過反饋控制量化器的精度調(diào)整緩存器的輸入碼流,保持輸出數(shù)碼率的恒定。但現(xiàn)在很多標(biāo)準(zhǔn)編碼器都不加緩存器,采用變速率輸出,有利于統(tǒng)計(jì)復(fù)用,提高圖像質(zhì)量。圖1的信源編碼方案,是積60年圖像編碼經(jīng)驗(yàn)之總結(jié)。
三、圖像數(shù)據(jù)格式
(一)幾種典型數(shù)字電視設(shè)備數(shù)據(jù)格式
表6列出了幾種典型的數(shù)字電視設(shè)備的數(shù)據(jù)格式。
注:QCIF:Quarter Common Intermediate Format(四分之一公用中間隔式);CIF:Common Intermediate Format(公用中間隔式);SIF:Source Input Format(源輸入格式);VCD:Video Compact Disk(視頻光盤);DVD:Digital Video Disk(數(shù)字視頻光盤);HDTV:High Definition Television(高清晰度電視);D:Definition(分辨率)。H.264標(biāo)準(zhǔn)由于采用4×4整數(shù)變換,上表應(yīng)采用(4×4)數(shù)據(jù)格式。
(二)極高清晰度成像(HRI)格式
ITU-R BT.1201建議書提出了極高清晰度成像(HRI)格式和規(guī)范。該建議的提出主要考慮到超高清晰度圖像能夠在諸如計(jì)算機(jī)圖形、印刷、醫(yī)療、數(shù)碼相機(jī)和電視電影等領(lǐng)域的圖像系統(tǒng)中使用。HRI典型空間分辨率的級(jí)別的建議如表7所示。
四、圖像編碼的未來
(一)圖像編碼壓縮遵循的規(guī)律
圖像編碼壓縮算法的壓縮比由下式?jīng)Q定。
壓縮技術(shù)層出不窮,圖像數(shù)據(jù)壓縮比不斷提高。著名圖像專家德國(guó)Musmann教授2006年在北京主持了“圖象編碼的過去與未來”專題討論會(huì),并首先發(fā)言,對(duì)圖像編碼壓縮技術(shù)的過去幾十年工作作了總結(jié),認(rèn)為:達(dá)到廣播質(zhì)量的視頻編碼的壓縮比大約每5年翻一番,并畫出了圖3曲線。后來被公認(rèn)稱為Musmann定律。
(三)未來的圖像編碼標(biāo)準(zhǔn)
1.新標(biāo)準(zhǔn)H.265
據(jù)報(bào)導(dǎo),約于2012年推出的H.265新標(biāo)準(zhǔn)也是采用“混合型”編碼方案,也可用圖2框圖來描述。壓縮比是H.264的兩倍。其技術(shù)主要在對(duì)H.264的改進(jìn)和增強(qiáng)??筛攀鋈缦拢?/p>
(1)提高壓縮效率;具有魯棒性,提高錯(cuò)誤恢復(fù)能力(如用于手機(jī)通信);
(2)減少時(shí)延(實(shí)時(shí)時(shí)延、信道獲取時(shí)間、隨機(jī)接入時(shí)延);
(3)減少?gòu)?fù)雜度等。
采用的主要算法有:
(1)自適應(yīng)插值濾波器,編碼增益約提高1dB;
(2)1/8像素精度運(yùn)動(dòng)補(bǔ)償預(yù)測(cè),可使比特率減少3~14%;
(3)運(yùn)動(dòng)矢量競(jìng)爭(zhēng)機(jī)制,將預(yù)測(cè)塊的集合由原來的空間域擴(kuò)展到了時(shí)間域及空時(shí)混合域??傻玫狡骄鶠?.1%的壓縮增益(對(duì)復(fù)雜運(yùn)動(dòng)這一增益可達(dá)20%);
(4)迭取自適應(yīng)量化矩陣,對(duì)于每個(gè)宏塊基于率失真函數(shù)選擇最優(yōu)的量化矩陣;
(5)空域和頻域自適應(yīng)預(yù)測(cè)殘差編碼,采用這一方法,與H.264相比,在相同比特率時(shí),PSNR可提高到0.02~1dB。
2.暢談未來
從上述可知,即使推出H.265新標(biāo)準(zhǔn),其壓縮比也不會(huì)超過400。筆者認(rèn)為,如果繼續(xù)采用圖2所示“混合型”編碼方案,壓縮比再要得到大幅度提高,很難了。必須改換一種思維、改換一種方案來考慮。幸而,已有不少學(xué)者在探討壓縮比高達(dá)1000~10000的技術(shù),只不過目前還不能實(shí)時(shí)實(shí)現(xiàn)。隨著技術(shù)的進(jìn)步,圖像數(shù)據(jù)壓縮編碼方法方興未艾。
參考文獻(xiàn):
[1]ITU-T Rec.H.264.
[2]ITU-T VCEG H.265.
[3]余兆明等,圖像編碼標(biāo)準(zhǔn)H.264技術(shù),人民郵電出版社.