侯書婷,楊宇,徐品
(中國傳媒大學(xué)信息工程學(xué)院,北京100024)
AES/EBU數(shù)字音頻傳輸標(biāo)準(zhǔn)的研究初衷是為了滿足專業(yè)級(jí)設(shè)備與家用設(shè)備的連接。AES/EBU數(shù)字音頻傳輸標(biāo)準(zhǔn)是聲頻工程協(xié)會(huì) (Audio Engineering Society)和歐洲廣播聯(lián)盟 (European Broadcasting Union)一起開發(fā)的一個(gè)數(shù)字音頻傳輸標(biāo)準(zhǔn),即AES/EBU標(biāo)準(zhǔn)(AES3-1992、ANSI S4.40-1992、IEC-958或AES3-2003)。它是傳輸和接收數(shù)字音頻信號(hào)的數(shù)字設(shè)備接口協(xié)議。我國的廣播電影電視相關(guān)標(biāo)準(zhǔn)為GY/T158-2000。
AES/EBU數(shù)字音頻信號(hào)編碼流程圖如圖1所示[1],該標(biāo)準(zhǔn)允許使用平衡或非平衡方式通過電纜傳輸,亦支持光纜傳輸。在進(jìn)行A/D轉(zhuǎn)換之前,為避免混疊失真,保證取樣頻率fs大于等于畫面最高頻率的二倍,先要將模擬信號(hào)進(jìn)行低通濾波,使聲音信號(hào)的最高頻率下降至取樣頻率的一半以下。A/D轉(zhuǎn)換器將模擬音頻信號(hào)進(jìn)行取樣,量化,編碼。AES/EBU系統(tǒng)取樣頻率支持32kHz至192kHz,量化比特?cái)?shù)為16到24bit,當(dāng)前演播室最常用的取樣頻率為48kHz取樣,即每秒傳輸48000個(gè)音頻幀,量化比特?cái)?shù)常為20bit或24bit量化。產(chǎn)生的并行數(shù)字字節(jié)通過串行器轉(zhuǎn)換為串行傳輸,此時(shí)輸出的信號(hào)為NRZ碼。AES/EBU編碼器將信號(hào)轉(zhuǎn)變?yōu)锳ES/EBU格式,對(duì)于不同比特量化的數(shù)據(jù),AES/EBU音頻幀結(jié)構(gòu)不同(具體在數(shù)字音頻幀結(jié)構(gòu)部分闡述)。在串行傳輸并行字節(jié)時(shí)先傳輸最低有效位(LSB),因此必須加入字節(jié)時(shí)鐘標(biāo)志以表明每一個(gè)樣值的開始。最后為保證信號(hào)傳輸質(zhì)量,數(shù)據(jù)流最終需進(jìn)行雙相標(biāo)志碼編碼(Bi-phase-mark)。
每一個(gè)AES/EBU數(shù)字音頻幀分為兩個(gè)子幀,每個(gè)子幀32比特量化。每192個(gè)音頻幀構(gòu)成一個(gè)塊。對(duì)于48KHz的系統(tǒng),一個(gè)音頻幀的時(shí)間是20.83μs,則一個(gè)音頻塊的時(shí)間為192×20.83μs=4000μs。AES/EBU數(shù)字音頻幀結(jié)構(gòu)如圖2所示。20bit及20bit以下量化的音頻幀的每個(gè)子幀含有4bit首標(biāo)(同步數(shù)據(jù)),4bit附加數(shù)據(jù),20bit音頻數(shù)據(jù),1bitV(有效比特),1bitU(用戶比特),1bitC(通道比特),1bitP(奇偶校驗(yàn)比特)[1][2]。
圖1 AES/EBU數(shù)字音頻編碼流程圖
圖2 AES/EBU數(shù)字音頻幀結(jié)構(gòu)
24bit量化的音頻幀的每個(gè)子幀包含24bit 音頻數(shù)據(jù),占用了本用于傳輸輔助字的4個(gè)比特,其余部分的結(jié)構(gòu)與20bit及20bit以下量化的音頻幀結(jié)構(gòu)相同。
(1)AES/EBU數(shù)字音頻編碼
①前置同步字
每一個(gè)子幀的最開頭處為前置同步字,同步字的編碼根據(jù)該子幀所在塊的位置而定。同步字共分X、Y、Z三種,如圖2中所示。同步數(shù)據(jù)為4bit量化,Z表示該子幀為每個(gè)音頻塊的第一幀的子幀1;X表示塊內(nèi)其余幀的子幀1;Y表示每個(gè)幀的子幀2[1]。傳輸時(shí),AES/EBU數(shù)據(jù)除同步數(shù)據(jù)外,都需使用BPM(雙向標(biāo)志碼)編碼。此時(shí),同步數(shù)據(jù)將以8比特編碼序列的形式傳輸,其具體編碼如表1所示[1][2]。
②輔助字(Auxiliarysample bits)
輔助字可作為輔助聲道傳送其他音頻信息,如制作人員的通話或演播室之間的音頻交流。每個(gè)音頻子幀可傳送一個(gè)輔助聲道的信息,每一個(gè)輔助聲道在4ms(即一個(gè)音頻塊)內(nèi)可傳送4bit×192=768bit附加數(shù)據(jù),可組成64個(gè)12bit分辨率的音頻字節(jié)[6]。每個(gè)4ms提供64個(gè)樣值,相當(dāng)于16kHz的抽樣頻率。在24bit量化的AES/EBU數(shù)字音頻系統(tǒng)中,輔助字被音頻數(shù)據(jù)占用,即此時(shí)的音頻數(shù)據(jù)有24bit,音頻幀里沒有輔助字。
③有效樣值(V——Validity bit)
如果樣值數(shù)據(jù)是音頻且可以進(jìn)行D/A轉(zhuǎn)換,則此比特值為0。否則,接收設(shè)備將有問題的樣值輸出靜音。該比特位并不被所有音頻設(shè)備產(chǎn)品支持[1][5]。
④用戶比特(U——User databit)
用戶比特可以以任何的形式被用戶所用,這有利于AES/EBU數(shù)字音頻傳輸?shù)撵`活性發(fā)展。在默認(rèn)情況下,用戶比特值為0[1][5]。
⑤通道比特(C——Channel status bit)
提供通道狀態(tài)信息。由于AES/EBU數(shù)字音頻支持單通道和雙通道(子幀1和子幀2各為不同通道)兩種傳輸模式。對(duì)于雙通道立體聲音頻,子幀1和子幀2的通道比特可以根據(jù)自己所攜帶的音頻數(shù)據(jù)不同而不同。通道狀態(tài)信息包含:音頻取樣字長度、音頻通道數(shù)量、取樣頻率、時(shí)間碼、源與目標(biāo)的字母數(shù)字顯示編碼信息、再次強(qiáng)調(diào)信息[7]。
由于AES/EBU數(shù)字音頻塊包含192個(gè)幀,即包含192個(gè)子幀1和192個(gè)子幀2兩個(gè)通道,每個(gè)子幀包含通道比特1bit,那么一個(gè)音頻塊的每一個(gè)通道就可提供192bit的通道狀態(tài)塊。一個(gè)通道狀態(tài)塊(Channel status bit block)包含24個(gè)字,每個(gè)字8bit量化。其格式如表2所示[2][4]。
⑥奇偶校驗(yàn)比特(P——Parity bit)
提供該子幀比特位從4至31(如圖2)的奇偶校驗(yàn)位。該值的設(shè)置可令4至31比特位中共有偶數(shù)個(gè)“0”和偶數(shù)個(gè)“1”。
(2)AES/EBU 數(shù)據(jù)特性
抽樣頻率為48kHz時(shí)總數(shù)據(jù)率為32×2×48000=3.072Mbps。在雙相標(biāo)志碼編碼后,數(shù)據(jù)傳輸率提高到兩倍,即為6.144Mbps[8]。雙相標(biāo)志碼的頻譜能量在6.144MHz的倍頻處為0。
表2 通道狀態(tài)數(shù)據(jù)格式
續(xù)表
續(xù)表
同步字包括三個(gè)低單元和隨之而來的三個(gè)連續(xù)的高單元。在AES/EBU信號(hào)頻譜中占據(jù)一個(gè)低的基頻,3.072/3=1.024MHz。
每個(gè)音頻幀包括64bit,每20.83μs發(fā)出一幀。幀中的一個(gè)數(shù)據(jù)比特持續(xù)時(shí)間為325.5ns,一個(gè)雙相標(biāo)志碼比特單元時(shí)間為163ns。這樣,由一些數(shù)據(jù)流比特疊加產(chǎn)生的眼圖眼寬時(shí)間為163ns[8]。
(3)AES/EBU接口的電特性
AES/EBU專業(yè)格式接口包括XLR、光纖接口和BNC接口[3],其中最常使用的XLR接口電特性示于表3。
表3 AES/EBU專業(yè)格式XLR接口特性
XLR又叫卡儂頭,接口如圖3(a)所示。
(a)XLR卡儂頭 (b)F05 光纖傳輸 (c)BNC圖3 AES/EBU專業(yè)音頻接口
AES/EBU消費(fèi)級(jí)格式接口的特性示于表4,這種消費(fèi)級(jí)格式用于CD和具有數(shù)字輸入和輸出接口的R-DAT中。
(a)RCA蓮花頭(b)TS插頭/大二芯(c)TRS插頭/大三芯圖4 AES/EBU消費(fèi)級(jí)接口
(4)數(shù)字音頻信號(hào)的傳送接口電路
原AES3-1992標(biāo)準(zhǔn)定義了在雙絞線音頻電纜上傳輸AES/EBU信號(hào)的規(guī)格。AES3-3id-1996文件和ANSI/SMPTE 276M-1995標(biāo)準(zhǔn)文件定義和采納了其他一些傳送格式。這些標(biāo)準(zhǔn)都定義了在不平衡同軸電纜上AES3格式化數(shù)據(jù)的傳輸。
表4 AES/EBU消費(fèi)格式RCA接口的特性
① 110Ω雙絞線電纜傳輸電路
AES3-1992建議的傳輸線路示于圖5。
②75Ω同軸電纜傳送電路
開發(fā)此標(biāo)準(zhǔn)是為了克服雙絞線傳送時(shí)的電纜長度、XLR接插件大小和費(fèi)用帶來的限制,但更重要的是可以用不箝位的模擬視頻分配放大器和路由器來傳送數(shù)字音頻信號(hào)[5]。但是,絕大多數(shù)音頻設(shè)備都使用卡儂(XLR)接插件,因此必須考慮到需要與BNC端子(圖3c)的轉(zhuǎn)接。此外,由于最少需要12MHz帶寬來傳輸雙相標(biāo)志碼編碼的AES/EBU信號(hào),所以有些模擬傳送放大器的帶寬可能不夠。
(a)75Ω同軸電纜傳送接口的特性
圖5 AES3-1992傳送連接電路
75Ω同軸電纜傳送接口的特性列于表5。
表5 75Ω同軸電纜傳送接口的特性
(b)AES-3id建議
AES-3id建議的傳送線路示于圖6[1]。該建議還包括關(guān)于電纜性能、電纜均衡器特性的信息。
(c)實(shí)際的線路連接
在錄音室中應(yīng)使用平衡電纜饋送可避免接地環(huán)路問題。在現(xiàn)有的錄音室中已安裝的模擬電纜可用于數(shù)字音頻分配,但電纜長度一般限于100米,具體視電纜類型而定,高質(zhì)量的雙絞線電纜可達(dá)到250米。一個(gè)數(shù)字音頻設(shè)備輸出只能連接一個(gè)接收端。
③其它接口協(xié)議
除AES/EBU協(xié)議外,還有三種接口格式廣泛使用:MADI(多聲道音頻數(shù)字接口),SDIF-2(Sony數(shù)字接口互連)和SPDIF(Sony Philips數(shù)字接口)。
(a)MADI格式
MADI格式在AES 10-1991標(biāo)準(zhǔn)文件和AES-10id-1995中定義,它可以容納最多56路遵從AES3-1992標(biāo)準(zhǔn)的32bit信號(hào)。MADI最早用于點(diǎn)到點(diǎn)的系統(tǒng),如多軌錄音機(jī)和數(shù)字音頻組件以及處理器間的互連,數(shù)字路由系統(tǒng)和錄音室到錄音室的互連。MADI信號(hào)很容易轉(zhuǎn)換成AES/EBU子幀,只有最初4bit 與AES/EBU子幀不同。支持抽樣頻率為32kHz到48kHz,可變化±12.5%,以支持錄音機(jī)的變速操作。數(shù)據(jù)傳輸率固定為125Mbps,對(duì)編碼數(shù)據(jù)流提供足夠帶寬(56路×40bits×48kHz×1.125=121Mbps)。
傳輸介質(zhì)可以是寬帶寬的同軸電纜(最多50米)或光纖(超過50米)。AES-10id-1995文件給出了光纖接口的說明。
圖6 AES3id-1996傳送連接
(b)SDIF-2格式
這種格式由Sony開發(fā),用于專業(yè)級(jí)控制和記錄,單聲道44.1kHz和48kHz信號(hào)的互連,由32bit長度的音頻字節(jié)組成。前20比特保留作為音頻樣值,接下來的9比特用來創(chuàng)建控制字,剩下的3比特為同步信息。控制字中包括有關(guān)預(yù)加重、正常音頻還是非音頻數(shù)據(jù)、拷貝禁止、每256音頻字節(jié)中SDIF音頻塊同步信息以及用戶數(shù)據(jù)等聲道信息[3]。
傳輸介質(zhì)是工作在TTL電平上的75Ω同軸電纜,數(shù)據(jù)率為1.54Mbps。它是一個(gè)點(diǎn)對(duì)點(diǎn)的互連系統(tǒng),需要三根同軸電纜來傳輸左、右聲道數(shù)據(jù)和字節(jié)時(shí)鐘信號(hào)。
(c)SPDIF格式
此格式是AES/EBU(AES3-1992)格式協(xié)議的消費(fèi)級(jí)版本。為了在專業(yè)設(shè)備和家用設(shè)備間傳輸數(shù)字音頻數(shù)據(jù)開發(fā)此標(biāo)準(zhǔn),在AES3專業(yè)設(shè)備和AES3家用設(shè)備之間需要進(jìn)行格式轉(zhuǎn)換(數(shù)據(jù)和電平轉(zhuǎn)換)。
在演播室內(nèi),對(duì)來自不同音頻源的數(shù)字音頻信號(hào)進(jìn)行混合、插入或組合時(shí),需要將樣值與一個(gè)基準(zhǔn)信號(hào)源在相位和頻率上同步。同一錄音室內(nèi)的兩臺(tái)設(shè)備在各自的輸出端可能會(huì)產(chǎn)生定時(shí)上的緩慢漂移,和視頻一樣,也需要一個(gè)時(shí)鐘發(fā)生器產(chǎn)生基準(zhǔn)信號(hào)或是從一臺(tái)設(shè)備提供基準(zhǔn)給另外一臺(tái)。
(1)數(shù)字音頻信號(hào)間的同步
不同的數(shù)字音頻源的同步需要考慮以下兩點(diǎn):
抽樣時(shí)鐘的時(shí)間校準(zhǔn)或頻率同步;
音頻信號(hào)的幀校準(zhǔn),即相位同步。
AES11-1991建議規(guī)定,在錄音室環(huán)境中數(shù)字音頻設(shè)備的頻率同步和相位同步應(yīng)采用專門的時(shí)鐘發(fā)生器提供基準(zhǔn)信號(hào)進(jìn)行頻率同步,所有的制作設(shè)備都鎖定于主基準(zhǔn)發(fā)生器;小的錄音室可使用一臺(tái)設(shè)備的輸出作為基準(zhǔn)。
圖7示出一個(gè)數(shù)字音頻樣值與一個(gè)AES/EBU數(shù)字音頻基準(zhǔn)信號(hào)(DARS)對(duì)準(zhǔn)的狀態(tài)。AES-11規(guī)定數(shù)字音頻樣值必須與一個(gè)基準(zhǔn)信號(hào)同相,在發(fā)送器輸出端一個(gè)音頻幀的同步容差為±5%,在接收器端一個(gè)音頻幀的同步容差是±25%。定時(shí)基準(zhǔn)點(diǎn)是X或Z同步字的第一個(gè)邊沿。
圖7 AES/EBU數(shù)字音頻信號(hào)與基準(zhǔn)信號(hào)的同步
當(dāng)兩個(gè)數(shù)字音頻信號(hào)抽樣率不同或無法將信號(hào)鎖定在一起時(shí),可使用抽樣率轉(zhuǎn)換和同步器。抽樣率鎖定且保持整數(shù)關(guān)系即為同步轉(zhuǎn)換。
(2)數(shù)字音頻和視頻信號(hào)間的同步
在電視系統(tǒng)中,數(shù)字音頻基準(zhǔn)信號(hào)必須與視頻基準(zhǔn)信號(hào)鎖定以使音頻和視頻信號(hào)同步,這樣可進(jìn)行無縫的音頻和視頻切換[9][10]。表6對(duì)三種不同的視頻幀速率示出對(duì)應(yīng)的三種不同抽樣率每個(gè)視頻幀內(nèi)所含的音頻樣值數(shù),數(shù)值表示單位數(shù)量的視頻幀傳輸?shù)囊纛l幀數(shù)量。
625行和525行標(biāo)準(zhǔn)的視頻抽樣頻率和48kHz音頻抽樣頻率之間的關(guān)系為:
數(shù)字分量視頻抽樣頻率13.5MHz,F(xiàn)H=15.625kHz,F(xiàn)V=25Hz 時(shí),
表6 每個(gè)視頻幀對(duì)應(yīng)的音頻樣值數(shù)
48kHz =13.5MHz / 864 / 625×1920
FH=15.734kHz,F(xiàn)V=29.97Hz 時(shí),
48kHz=13.5MHz /858 /525 ×8008/5
在625/25系統(tǒng)中,每一視頻幀有確定數(shù)目的音頻樣值(48kHz抽樣時(shí)有1920個(gè)音頻樣值),音頻和視頻信號(hào)間的相位關(guān)系很容易保持,見圖8(EBU R83-1996建議)。AES3音頻可與從625行基準(zhǔn)視頻信號(hào)中分離出的48kHz基準(zhǔn)信號(hào)進(jìn)行鑒相,實(shí)現(xiàn)音頻與視頻信號(hào)的鎖定。
圖8 625行電視系統(tǒng)中的數(shù)字音視頻同步
在525/60系統(tǒng)中,每一視頻幀對(duì)應(yīng)的音頻樣值數(shù)不是整數(shù),而是個(gè)小數(shù),按下式可計(jì)算得出:33366.67μs/20.8333μs=1601.6。這里,33366.67μs是一個(gè)視頻幀的時(shí)間,20.8333μs是一個(gè)音頻幀的時(shí)間。在5個(gè)視頻幀后,可獲得音頻樣值的整數(shù)(1601.6×5=8008),可利用數(shù)字音頻幀與視頻幀這種關(guān)系進(jìn)行音頻與視頻信號(hào)的鎖定。
[1]Michael Robin.The AES/EBU Digital Audio Signal Distribution Standard[S].2004.
[2]Revised AES standard for digital audio — Digital input-output interfacing — Serial transmission format for twochannel linearly represented digital audio data[Z].Audio Engineering Society,Inc,2003.
[3]John Emmett.Engineering Guidelines The EBU/AES Digital Audio Interface[Z].1995.
[4]Specification of The Digital Audio Interface,EBU[Z].2004.
[5]NTI Audio.AES3,AES/EBU,application note[Z].2012.
[6]王偉.數(shù)字視音頻復(fù)用技術(shù)[J].電視工程,2007,(3):41-45.
[7]劉越,章文輝.HDTV嵌人數(shù)字音頻分析軟件設(shè)計(jì)[J].電視技術(shù),2012,(2):12-14.
[8]盧志國.數(shù)字音頻信號(hào)接口技術(shù)[J].數(shù)字技術(shù)與應(yīng)用,2013,(04).
[9]鄭劍虹.嵌入音頻[J].音響技術(shù),2006,(04):48-53.
[10]張琪.數(shù)字電視制播技術(shù)[M].北京:中國廣播電視出版社,2003.