薛勇
隨著互聯(lián)網(wǎng)技術的快速發(fā)展,廣電行業(yè)音頻實時傳輸?shù)募夹g也日益更新。特別是近年來IP技術普遍應用,使得研究IP技術在專業(yè)廣電領域?qū)崿F(xiàn)數(shù)字音頻實時傳輸勢在必行。使用低成本、適應局域網(wǎng)網(wǎng)絡環(huán)境、高可用性的SIP協(xié)議,通過成熟而容易獲得的互聯(lián)網(wǎng)寬帶將外場直播的音頻信號高質(zhì)實時回傳到直播室,是一種高質(zhì)量、低成本的音頻傳輸手段。
1.光纖:傳輸質(zhì)量高,安全度較高,通信容量大,抗干擾能力強,但費用高,且必須在有光纖接入點的地方才可以使用。
2.微波:帶寬較大,穩(wěn)定性較高,但城市里高樓林立,容易受到遮擋,可行性不高。
3.ISDN:用MPEG-1、MPEG-2等編解碼方法,傳輸高質(zhì)量的音頻(立體聲)。缺點是申請繁瑣,調(diào)試也比較復雜,中國電信已經(jīng)停止新申請布點了。
4.電話線:方便容易獲取,但傳輸質(zhì)量不高。
5.基于IP的音頻傳輸:IP 傳輸是完全建立在Internet 網(wǎng)絡基礎上的傳輸模式,可以認為是經(jīng)濟實用且高效的傳輸模式,缺點是延時比較大,有些設備調(diào)試比較復雜,需要用電腦進行設置,同時穩(wěn)定性容易受網(wǎng)絡狀況影響。
圖1 系統(tǒng)連接框圖
6. 3G傳輸:3G和IP在傳輸模式和工作原理上是完全相同的,具有靈活、不受場地限制的優(yōu)點,對外場傳輸線路幾乎沒有要求。但3G 傳輸方式受制于基站的信號強度和上行速率,在基站附近人數(shù)眾多、使用量較大的時候容易受帶寬和基站負荷等各種外在干擾的影響,對于音頻傳輸而言會出現(xiàn)瓶頸現(xiàn)象。
本單位在近年每年都有不少外場活動,實時音頻信號根據(jù)具體活動的需求,采取了光纖、ISDN以及電話線來進行回傳。許多活動節(jié)目部門需要進行成本核算,因而選取一種既有優(yōu)秀的傳輸質(zhì)量,成本又不太高的傳輸方式尤為重要。經(jīng)過研究和實驗,我們發(fā)現(xiàn)基于互聯(lián)網(wǎng)的SIP網(wǎng)絡傳輸比較符合我們的要求。
SIP協(xié)議是由互聯(lián)網(wǎng)工程任務組(IETF)制定的應用層控制協(xié)議,主要功能是完成多媒體的呼叫控制,它借鑒了HTTP和SMTP等互聯(lián)網(wǎng)上成功的應用層控制協(xié)議,是一種基于文本的應用層控制信令協(xié)議,獨立于底層協(xié)議,可以使用TCP或UDP作為底層傳輸協(xié)議。SIP 協(xié)議和其他協(xié)議一起給用戶提供完整的服務,用于建立、修改和終止IP網(wǎng)上的雙方或多方多媒體會話。SIP協(xié)議支持代理、重定向、登記定位用戶等功能,支持移動用戶,與RTP/RTCP、SDP、RTSP、DNS 等協(xié)議配合,可支持和應用與語音、視頻、數(shù)據(jù)等多媒體業(yè)務。隨著SIP協(xié)議及其應用的不斷完善,3GPP組織已經(jīng)將SIP作為3G 全IP網(wǎng)絡多媒體子系統(tǒng)(IMS)的控制協(xié)議,下一代網(wǎng)絡(NGN)中SIP協(xié)議也成為核心協(xié)議。
以往基于互聯(lián)網(wǎng)進行實時音頻傳輸?shù)姆绞蕉即嬖谝恍﹩栴},如設置比較繁瑣,需要用電腦對設備的參數(shù)進行設置與調(diào)整,同時對網(wǎng)絡的要求比較高,如果一方或雙方不在同一個局域網(wǎng)進行傳輸,容易被防火墻阻隔,難以穿透局域網(wǎng)NAT等。
而基于SIP服務的實時網(wǎng)絡音頻傳輸優(yōu)勢在于其便利性。去到新的直播場地,只要接上寬帶網(wǎng)絡,設備自動登陸SIP服務器,連接成功后,即可連接當前在該服務器上登記注冊地址的另一臺SIP設備進行傳輸。
1.基于SIP服務的音頻傳輸?shù)倪B接方式
外場信號→ZIP音頻編解碼設備1→【互聯(lián)網(wǎng)】→ZIP音頻編解碼設備2→電臺播控室→電臺直播室。系統(tǒng)連接圖如圖1。
2.工作流程
和以往基于IP網(wǎng)絡的實時音頻傳輸點對點直接連接不一樣的是,SIP采取通過第三方服務器的方法獲得連接。
SIP協(xié)議采用邏輯帳號與物理地址相分離的方式,先給設備設定名稱,這個作為該設備的邏輯賬號,一個邏輯帳號可以對應若干真實的物理地址,SIP 用戶可以在不同的地方注冊到SIP服務器,將當前物理地址存儲在位置服務器中,因此,即使每次在不同地點直播,也不需要手動設置客戶端的物理地址。
SIP服務器的功能就是接受SIP終端的注冊請求,將用戶的邏輯帳號和物理地址在位置服務器中建立綁定關系,當有對該用戶的呼叫時,從服務器中獲取被叫用戶的物理地址,然后將呼叫請求轉(zhuǎn)移到被叫用戶。連接流程如圖2。
從流程框圖可以看到,基于SIP服務的實時音頻傳輸方式,設備A和B只需要連接到互聯(lián)網(wǎng),它們會自動連接到服務器,連接成功后,呼叫另一方即可建立連接。將網(wǎng)絡調(diào)試、連接工作交給服務器及設備端去自動執(zhí)行,簡化了技術人員的工作流程,使得易用性大大增加。由于SIP有著這樣的便利性,因此各大廠商也研發(fā)出通過SIP協(xié)議對音頻進行實時傳輸?shù)脑O備,用于簡化操作流程。
3.音頻編解碼方式的選擇
采用IP網(wǎng)絡的傳輸,延時較大是它的一個不足之處。因此應該選取合適的編解碼方式盡量減少延時,既要提供高質(zhì)量的音頻,同時也要保證延時不能太大。我們采用的是AAC-ELD系列通信編解碼。
傳統(tǒng)的窄帶電話僅能傳輸最高3.5kHz的音頻帶寬,而AAC全高清語音系統(tǒng)則能傳輸從14kHz到人耳能聽到的全部音頻頻譜。通過這種方法,我們可以做到利用較小的帶寬得到優(yōu)秀的音質(zhì)。AAC系列的全高清語音編解碼器包括低延遲AAC(Low Delay AAC,AACLD)、增強型低延遲AAC(Enhanced Low Delay AAC,AAC-ELD)。
AAC-LD是高品質(zhì)視頻會議的行業(yè)標準,可提供全帶寬、低延遲的音頻編碼。理論上僅有20毫秒的算法延遲,同時為所有類型的音頻信號提供良好的壓縮率和高聲質(zhì)。
AAC-ELD是AAC-LD的增強型版本,結(jié)合了MPEG-4AAC-LD和頻譜復制。AAC-ELD也是所有要求在24kbps低數(shù)據(jù)速率下?lián)碛腥纛l帶寬的延遲敏感型應用的最佳選擇。據(jù)統(tǒng)計,AAC-ELD在同樣的碼率情況下,比MP3的延遲要減少三分之一。
AAC-LD和AAC-ELD目前已經(jīng)用于專業(yè)及消費級視頻會議,例如,蘋果的Face Time應用就是基于AACELD。
4.穩(wěn)定性測試
經(jīng)過測試和研究,我們使用Telos公司的Z/IP ONE音頻傳輸設備,遠程連接后,音頻傳輸延遲在1秒以內(nèi),在可接受范圍內(nèi)。對于必須使用雙向傳送的節(jié)目直播,可使用模擬電話作為返送傳輸,以減少傳輸延時。
在測試中發(fā)現(xiàn),這套系統(tǒng)的性能主要決定因素是網(wǎng)絡狀況,可以根據(jù)網(wǎng)絡狀況來選擇設備的編碼碼率,緩沖時間的上下限等,以保證傳輸不中斷。在正常情況下4M Adsl就能夠滿足本系統(tǒng)的要求,傳輸延時一方面取決于設備設定的緩沖時間,另一方面取決于網(wǎng)絡中數(shù)據(jù)傳輸?shù)难訒r。
在今年全國兩會期間,深圳廣播新聞頻率先鋒898使用本套系統(tǒng)進行直播音頻的傳輸主路,以數(shù)字電話耦合器通過電話線作為傳輸備路,北京直播室使用電信寬帶,深圳直播室通過單位局域網(wǎng)連接,設備連接成功后,10天內(nèi)持續(xù)通電保持連接未有中斷,穩(wěn)定性還是比較高的。需要注意的是,當處于同一局域網(wǎng)的電腦或網(wǎng)絡設備進行大量的下載時,將會導致網(wǎng)絡波動,延遲增大,嚴重的話甚至會有中斷的情況,因此建議申請的寬帶網(wǎng)絡帶寬由傳輸設備獨享,不要連接其他設備或電腦,以保證播出的安全可靠。
1.彭煥峰:《SIP注冊服務器的研究與設計》,《電腦知識與技術》,2010年第32期。
2.趙軍:《基于互聯(lián)網(wǎng)的遠距離音頻傳輸應用》,《中國傳媒科技》,2010年第5期。
圖2 SIP協(xié)議連接流程