在我們討論如MPEG-2和H.264這樣的視頻壓縮時(shí),我們往往考慮的是視頻方面,對音頻考慮不多。音頻的確很重要,但現(xiàn)實(shí)就是這樣。
由于對超越現(xiàn)用于藍(lán)光盤和許多攝錄一體機(jī)的MPEG4/H.264壓縮有很強(qiáng)烈的推力,我們應(yīng)花一點(diǎn)時(shí)間考慮下一代視頻編碼的音頻特性。最可能廣泛采用的下一代編解碼是HEVC(高效率視頻編碼),或H.265。記住這是一種視頻編解碼,不是音頻編解碼。將配套HEVC的音頻編碼正由不同于HEVC/H.265的工作團(tuán)隊(duì)開發(fā)。
谷歌也開發(fā)了一個(gè)競爭的壓縮標(biāo)準(zhǔn)VP9,它將內(nèi)建于許多網(wǎng)絡(luò)瀏覽器內(nèi)。VP無特許權(quán)使用費(fèi),谷歌對VP9的愿景是比HEVC/H.265,它在編碼效率和圖像質(zhì)量方面有更好的性能。盡管如此,H.265看來在未來數(shù)年將是專業(yè)和廣播視頻選擇的編碼標(biāo)準(zhǔn),盡管它有相關(guān)的特許權(quán)使用費(fèi)。
還有另一種下一代視頻編解碼即將浮現(xiàn),它稱為Daala,正由Xiph.Org基金會(huì)和Mozilla公司開發(fā)。Xiph.Org的創(chuàng)立者表示Daala性能應(yīng)超越HEVC和VP9-代,但2015年預(yù)計(jì)不會(huì)發(fā)布。有趣的是,Xiph.Org基金會(huì)是FLAC(自由無損音頻編解碼)的創(chuàng)造者。FLAC因其音頻性能頗受好評。
兩倍效率
從視頻觀點(diǎn)來看,H.265效率是H.264的兩倍,而H.264效率是MPEG2的兩倍左右。換句話說,用MPEG2編碼視頻流要求20M b/s,用H.264和H.265只需IOMb/和5M b/s左右。這有點(diǎn)過于簡單化,但為一個(gè)有用的經(jīng)驗(yàn)法則。
MPEG2引導(dǎo)我們的大多數(shù)認(rèn)識了MP3音頻編碼。與MPEG-1壓縮一起在上世紀(jì)90年代推出,MP3代表MPEG音頻第三層。它成為了一個(gè)流行的音頻壓縮標(biāo)準(zhǔn),但同時(shí)使用的還有很多。與母視頻壓縮標(biāo)準(zhǔn)一樣,MP3為一種有損壓縮,意味著為達(dá)到其壓縮,它改變音頻,并且它們一旦被壓縮,這些改變無法恢復(fù)。
MP3具有廣泛的影響最終音頻質(zhì)量的設(shè)置,包括取樣率和碼率。主流MP3可在32、44.1和48kHz取樣,并能以56384kb/s碼率編碼。在128kb/s和44. lkHz取樣,一個(gè)MP3文件大小是一個(gè)不壓縮CD錄音的9.1%左右。在320kb/s碼率編碼MP3文件,產(chǎn)生的碼流大小是一個(gè)不壓縮CD錄音的23%。
高級音頻編碼(AAC)在MP3后開發(fā),并利用了從該格式吸收的東西。AAC在相同碼率普遍提供更好的音質(zhì)。AAC還有一個(gè)成為高效率高級音頻編碼(HEAAC)的分支,它被用于如DVBH和ATS C-M/H等的移動(dòng)電視標(biāo)準(zhǔn)。與MP3類似,AAC也是一直有損壓縮格式,并且有一系列類似于MP3的設(shè)置。
杜比數(shù)字和AC-3是同一音頻處理格式的兩個(gè)名稱。AC3由杜比實(shí)驗(yàn)室開發(fā),有時(shí)被稱為“音頻編解碼三”或“高級編解碼三”。所有形式的AC-3都支持環(huán)繞聲,最初版本傳載5.1聲道,后來的杜比數(shù)字+處理7.1聲道。杜比數(shù)字+增強(qiáng)版EA C-3能夠傳載最多13.1聲道。更高編碼效率的EA C-3意味著它在一個(gè)256kb/s碼流中能夠提供不錯(cuò)的5.1聲道音頻。
下一代音頻格式
與HEVC/H.265有關(guān)的主要音頻編碼格式是MPEGH和AC-3,也可能包括之后的其它編解碼。MPEGH可認(rèn)為是“增強(qiáng)版AAC”,去年ATSC宣布MPEGH 3D音頻為提議用于ATSC 3.0音頻系統(tǒng)的三種標(biāo)準(zhǔn)之一。在其最簡單的形式,MPEGH將支持8聲道音頻。它有其它許多特性,包括提供響度元數(shù)據(jù)的能力。
Dolby A C-4同樣是從AC-3演變而來的非常高級的編解碼。相比AC-3,A C-4提高廣播節(jié)目的壓縮效率約50%。A C-4已由歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)標(biāo)準(zhǔn)化且被英國標(biāo)準(zhǔn)組織DVB項(xiàng)目采用。此標(biāo)準(zhǔn)具有對對白增強(qiáng)、智能響度和高級動(dòng)態(tài)范圍控制的原生支持,以及對多語種和描述范圍的更有效支持。
這些音頻編解碼與HEVC的相互作用依然在發(fā)展中,并將成為美國最終的ATSC標(biāo)準(zhǔn)的一部分。在最近的ATSC訓(xùn)練營,NBC的Jim Starzynski演示了MPEGH的現(xiàn)狀以及未來的預(yù)期。
與視頻編解碼一樣,音頻編解碼在把音頻壓縮為較小碼流時(shí)正更高效。這將使未來的廣播節(jié)目編解碼提供更多音頻聲道,并且為廣播機(jī)構(gòu)提供數(shù)量與質(zhì)量達(dá)成折衷的更多選擇。