楊曉東 鄭樹強
(太原衛(wèi)星發(fā)射中心山西太原030027)
語音編碼在IP調(diào)度系統(tǒng)中的應(yīng)用研究
楊曉東 鄭樹強
(太原衛(wèi)星發(fā)射中心山西太原030027)
IP調(diào)度系統(tǒng)是航天任務(wù)中重要的新型指揮系統(tǒng),結(jié)合系統(tǒng)工作實際,簡述了IP調(diào)度系統(tǒng)的基本組成、基本原理和語音傳輸過程。根據(jù)語音編碼技術(shù)的基本特征,選取相關(guān)的3種主流語音編碼標準G.711、G.723和G729,從編碼質(zhì)量、編碼速率、時延和帶寬占用率等方面對其在IP調(diào)度系統(tǒng)中的應(yīng)用進行了分析和比較,總結(jié)了各自的優(yōu)點和不足,為IP調(diào)度系統(tǒng)工程實踐中的編碼標準選擇提供了技術(shù)依據(jù)。
語音編碼 IP網(wǎng)絡(luò) 指揮調(diào)度
指揮調(diào)度系統(tǒng)是航天發(fā)射場組織指揮發(fā)射試驗任務(wù)的基礎(chǔ)性系統(tǒng)之一,其系統(tǒng)性能與運行質(zhì)量直接影響著任務(wù)指揮流程的順利進行。發(fā)射場歷來都將調(diào)度系統(tǒng)作為重點試驗設(shè)施進行發(fā)展和建設(shè),先后經(jīng)歷了模擬系統(tǒng)和大容量數(shù)字化系統(tǒng)。
隨著信息技術(shù)的發(fā)展,業(yè)務(wù)承載網(wǎng)逐步向IP化發(fā)展,多種通信業(yè)務(wù)將逐步通過IP信道進行傳輸。數(shù)字指揮調(diào)度系統(tǒng)也將適應(yīng)形勢發(fā)展,依托IP網(wǎng)絡(luò)進行改造,并將逐步建設(shè)完全IP化的指揮調(diào)度系統(tǒng),統(tǒng)一納入到任務(wù)IP網(wǎng)絡(luò)中進行語音信號的傳輸。
IP調(diào)度系統(tǒng)在傳輸方式上與其他通信業(yè)務(wù)共享IP網(wǎng)絡(luò)的帶寬,提高了信道資源的利用率。由于IP網(wǎng)絡(luò)的開放性和標準化,以及發(fā)射場任務(wù)IP網(wǎng)絡(luò)雙路由的結(jié)構(gòu)特點,IP調(diào)度系統(tǒng)具有更高的靈活性、擴充性和可靠性。
IP調(diào)度系統(tǒng)與傳統(tǒng)的模擬和數(shù)字調(diào)度系統(tǒng)相比,同樣具備通播、越級、分割和屏蔽等控制功能,最主要的變化是:將語音信號的傳輸模式由點對點傳輸改變?yōu)榫W(wǎng)絡(luò)傳輸,由基于專線電路的數(shù)字信號傳輸改變?yōu)榛贗P網(wǎng)絡(luò)的數(shù)據(jù)包傳輸。IP調(diào)度系統(tǒng)的基本組成如圖1所示,系統(tǒng)主要由調(diào)度主機、網(wǎng)絡(luò)設(shè)備(包括交換機、防火墻和路由器等)、傳輸設(shè)備(包括衛(wèi)星通信設(shè)備和光纖通信設(shè)備等)和調(diào)度終端組成。
圖1 IP調(diào)度系統(tǒng)基本組成圖
IP調(diào)度語音信號傳輸?shù)幕驹砣鐖D2所示,語音通過麥克風(fēng)進入調(diào)度終端后,首先由調(diào)度終端對模擬語音信號進行抽樣、量化和壓縮編碼,將其轉(zhuǎn)換為語音數(shù)據(jù),數(shù)字化過程可以采用多種語音壓縮編碼算法實現(xiàn),然后把這些語音數(shù)據(jù)按TCP/IP等相關(guān)協(xié)議進行打包送到IP網(wǎng)絡(luò),在IP網(wǎng)絡(luò)上再經(jīng)過交換機、防火墻及路由器等網(wǎng)絡(luò)設(shè)備和光纖通信及衛(wèi)星通信等通信信道傳輸?shù)侥康恼{(diào)度終端,再把這些語音數(shù)據(jù)包串起來,經(jīng)過解碼解壓處理后,恢復(fù)成原來的語音信號,從而達到由IP網(wǎng)絡(luò)傳輸調(diào)度話音的目的[1]。
圖2 IP調(diào)度系統(tǒng)語音傳輸基本原理圖
根據(jù)IP調(diào)度系統(tǒng)的基本組成和話音傳輸?shù)幕驹砜芍?,影響語音質(zhì)量的主要因素是語音壓縮編碼算法的性能和傳輸網(wǎng)絡(luò)的性能。語音壓縮編碼的目的是用盡可能低的編碼速率獲得盡可能好的合成語音質(zhì)量,同時又使編碼過程的計算代價盡可能小。降低編碼速率的實質(zhì)就是降低占用的頻帶寬度,而編碼速率低意味著算法的復(fù)雜度增加,時延變大。在傳輸網(wǎng)絡(luò)性能一定的條件下,不同的語音壓縮編碼算法具有不同的計算復(fù)雜度、算法時延和帶寬占用率等性能指標,從而影響話音傳輸?shù)馁|(zhì)量[2]。
語音編碼方法主要分為3類:波形編碼、參數(shù)編碼和混合編碼[3]。
①波形編碼方法主要是基于語音信號的波形,力圖使經(jīng)過編碼壓縮、傳輸和解碼恢復(fù)后的合成語音信號與原始語音信號的波形誤差最小。由于語音信號的全部信息都蘊含在原始波形里,所以這種方法編碼后的合成語音質(zhì)量非常好,且信道適應(yīng)能力強。國際電報電話咨詢委員會CCITT于1972年制定的G.711 64 kbps的脈沖編碼調(diào)制(PCM)和ITU在1984年公布的G.721 32 kbps的自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)都屬于這一類編碼器;
②參數(shù)編碼是通過對語音信號特征參數(shù)進行提取及編碼,通常每隔20 ms到40 ms就會從語音信號中提取和量化特征參數(shù),最大優(yōu)點是編碼速率低,在理想條件下合成語音聽起來和原始語音相似,但對環(huán)境噪音特別敏感,在背景噪音較大的情況下就不能再生原始波形,其合成的語音質(zhì)量較差且時延值大;
③混合編碼融入了波形編碼和參數(shù)編碼的優(yōu)點,能獲得自然度較高的話音,并且有著非常低的比特率,但時延較大。目前VOIP系統(tǒng)中使用的語音壓縮編碼方式大多數(shù)是基于混合編碼方法的,比如G.723和G.729。
G.7XX系列語音編碼標準都是基于以上3類不同的編碼方法而定制的,語音編碼方法的基本原理決定了每種標準的編碼速率和話音質(zhì)量等具體特點,也決定了每種編碼標準適用于不同的應(yīng)用環(huán)境。
以上列舉的G.711、G.723和G.729為目前較為主流的幾種語音編碼標準,各自有著不同的技術(shù)特點。以此3種編碼技術(shù)為研究對象,比較其在IP網(wǎng)絡(luò)環(huán)境下的語音編碼性能,分析其在發(fā)射場IP調(diào)度通信網(wǎng)中的適用性。衡量語音編碼標準技術(shù)優(yōu)劣的主要指標有:編解碼語音質(zhì)量、編解碼速率、復(fù)雜度、時延和帶寬占用率等[4]。
①G.711是使用最為普遍的語音編碼標準,采用波形編碼方法,包括A律和u律2個變型。其數(shù)據(jù)采樣率為8 KHZ,編碼速率為64 kbps,由于其采用波形編碼算法,具有高質(zhì)量和低時延的特點,編碼速率高,獲得的話音質(zhì)量最好,MOS等級都在4.3左右,有著適應(yīng)能力強、話音質(zhì)量好和抗噪抗誤碼能力強等特點,最大的缺點是同其他的編解碼器相比,要使用大量的帶寬,當(dāng)其用于低帶寬時,話音質(zhì)量下降得非???;
②G.723是一個雙速率語音編碼協(xié)議,2種速率分別是5.3 kbps和6.3 kbps,編碼延遲為37.5 ms[5]。就目前而言,與ITU-T的其他編碼標準相比,G.723之中G.723.1的編碼速率是最低的。2種速率的編解碼基本原理是一樣的,只是對信號的量化方法有差別,2種速率下都能獲得很好的語音質(zhì)量,MOS值約為3.8。ITU建議其應(yīng)用于低速率多媒體服務(wù)中話音或其他音頻信號的壓縮,優(yōu)點在于僅需要很窄的語音帶寬便可具有較高的語音質(zhì)量,缺點在于編碼時延達到37.5 ms;
③G.729協(xié)議能夠?qū)崿F(xiàn)很高的話音質(zhì)量和很低的算法時延,可將經(jīng)過采樣的64 kbps話音以幾乎不失真的質(zhì)量壓縮至8 kbps,合成語音和原始語音之間的誤差很小,總的算法時延為15 ms,而且在有隨機比特誤碼、幀丟失和多次轉(zhuǎn)接等情況下仍然具有很好的穩(wěn)定性,特別是這種編碼方式在一定的背景噪聲下仍然可以保持較好的語音質(zhì)量。
3種語音編碼標準的具體性能指標對比如表1所示[6]。
表1 編碼標準指標比較
采用MOS分值法評價編碼語音質(zhì)量,可以看出,3種編碼方式的聽音質(zhì)量都比較高,其中,G.711與G.729的語音編碼質(zhì)量最好。從編碼速率來看,G.723的比特率最低,G.729的編碼速率僅高于G.723,G.711的編碼速率遠遠高于G.729和G. 723。
編解碼的復(fù)雜度與語音編碼的質(zhì)量有著密切的關(guān)系,在同樣的碼率下,采用復(fù)雜的算法將能獲得更好的語音質(zhì)量,但對硬件的計算能力要求也更高。由表1可知,在復(fù)雜度方面,G.723相對G.729較優(yōu),G.711最佳。增加算法復(fù)雜度可以提高語音的質(zhì)量,但同時也帶來了編解碼的時延,在實時語音通信中對通信質(zhì)量有著很大的影響。在編解碼時延方面G.711時延最小,G.729較G.723為優(yōu)。
在IP調(diào)度系統(tǒng)中,語音編碼是把話音轉(zhuǎn)換成數(shù)據(jù)方式來傳輸,傳輸協(xié)議中包含了RTP和UDP,與IP一起成為一個完整的語音協(xié)議。在Ipv4里,IP包占20 Bytes,UDP包占8 Bytes,RTP包頭占12 Bytes,則包頭共占40 Bytes,此外,以太網(wǎng)占14 Bytes,在每秒20 ms的語音負荷的情況下,以G.729編碼為例,實際要傳輸?shù)淖止?jié)數(shù)為:20+8+12+20+14=74 Bytes;傳輸速度應(yīng)為:74 Bytes/20 ms=29.6 kbps;而在相同的環(huán)境下,G.711編碼卻需要85.6 kbps的帶寬。
表2 編碼算法帶寬占用率比較
3種編碼算法的帶寬占用率比較如表2所示[7]。
根據(jù)帶寬占用率比較的結(jié)果,G.723的壓縮比最大,最節(jié)省帶寬,G.729次之,G.711的壓縮比最低,對帶寬的要求最高。
3種編碼技術(shù)從編碼質(zhì)量、編碼速率、編解碼復(fù)雜度、編解碼時延和帶寬占用率等這幾個方面綜合比較,可以得出以下結(jié)論:
①G.711的編碼質(zhì)量最好,編碼復(fù)雜度最低,編碼時延最小,但對帶寬的要求最高;
②G.723的編碼質(zhì)量次于G.711和G.729,編碼復(fù)雜度較高,時延值也較大,但最節(jié)省帶寬資源;
③G.729的編碼質(zhì)量較好,時延值也較小,均介于G.711和G.723之間,對帶寬的要求也較小。
在帶寬資源足夠豐富的情況下,選擇G.711可以獲得最佳的調(diào)度語音質(zhì)量;如果帶寬資源較為緊張,并可以接受一定程度的話音質(zhì)量損失,可以選擇G.723;如果不能接受較大的話音質(zhì)量損失和一定的通話時延,而帶寬資源又不是足夠富裕,則可以選擇G.729。從話音質(zhì)量和通信成本等多方面綜合考慮,3種編碼技術(shù)中,G.729為最佳編碼方案。
根據(jù)以上的分析和比較,3種編碼技術(shù)在語音質(zhì)量、編碼速率、時延大小和帶寬占用率等方面有著各自的優(yōu)點或不足,不能絕對的評價一種技術(shù)的優(yōu)劣。在具體的工程實踐中,應(yīng)該根據(jù)通信的指標要求和IP網(wǎng)絡(luò)環(huán)境的實際情況等因素綜合考慮,選擇適用的編碼技術(shù)。
[1]牛曉華,高山.VoIP語音壓縮技術(shù)在IP指揮調(diào)度系統(tǒng)中的應(yīng)用[J].數(shù)據(jù)通信,2011(5):44.
[2]韓紀慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004.
[3]楊會彩,樊延虎.幾種低速率語音編碼算法分析[J].延安大學(xué)學(xué)報(自然科學(xué)版),2009,28(1):44-46.
[4]徐作庭,李來勝.多媒體通信[M].北京:人民郵電出版社,2011.
[5]鞠鳴.VoIP中語音壓縮編碼技術(shù)的研究與性能分析[J].江蘇通信技術(shù),2007,23(2):36-37.
[6]李娜,王中元,胡瑞敏.數(shù)字語音編碼技術(shù)和標準介紹[J].中國新通信(技術(shù)版),2007(13):39-43.
[7]唐峰.數(shù)字音頻壓縮技術(shù)研究[J].中國傳媒科技,2008(5):43.
Research on Application of Speech Coding in IP Command Dispatching System
YANG Xiao-dong,ZHENG Shu-qiang
(Taiyuan Satellite Launch Center,Taiyuan Shanxi 030027,China)
The IP command dispatching system is a new important command system for space mission.Combined with practical system operation,this paper summarizes the basic composition,basic principle and voice transmission process of IP command dispatching system.Based on the basic characteristics of speech coding technology,such three kinds of mainstream speech coding standards as G.711, G.723 and G729 are selected,the applications of these standards in IP command dispatching system are analyzed and compared from such aspects of coding quality,coding rate,delay and bandwidth occupation,and their advantages and disadvantages are summarized,which provides the technical basis for coding standard selection in the engineering practice of IP command dispatching system.
speech coding;IP network;command dispatching
TP305
A
1008-1739(2014)06-61-3
定稿日期:2014-02-26