王晶, 劉寶光, 費澤松, 張劍寅
(1.北京理工大學 信息與電子學院, 北京 100081;2.中國移動通信集團公司研究院, 北京 100053)
?
基于AMR-WB編解碼器的移動網(wǎng)絡話音傳輸抗丟包算法
王晶1, 劉寶光1, 費澤松1, 張劍寅2
(1.北京理工大學 信息與電子學院, 北京 100081;2.中國移動通信集團公司研究院, 北京 100053)
針對移動通信網(wǎng)絡中AMR-WB編解碼器在話音分組傳輸中的抗丟包問題,提出了一種與VoLTE系統(tǒng)中語音編碼速率相匹配的AMR-WB抗丟包實現(xiàn)方案. 通過實驗分析AMR-WB編解碼器中經(jīng)過錯誤隱藏恢復的各個參數(shù)對語音質量的影響,利用多描述編碼(multiple description coding,MDC)技術設計了AMR-WB抗丟包方案,并進一步結合刪余卷積編碼提出了雙重差錯保護的增強型抗丟包算法,實現(xiàn)了多碼率下的差錯保護和速率匹配,該方案可兼容原有AMR-WB編碼模式下的語音編碼速率. 仿真結果表明,提出的新方案能夠增強AMR-WB的抗丟包能力,并且不需要增加額外的信令開銷,兼容現(xiàn)有系統(tǒng)網(wǎng)絡中的多速率語音編碼.
AMR-WB;MDC;刪余卷積編碼;移動網(wǎng)絡
自適應多速率寬帶語音編解碼器(adaptive multi rate-wide band,AMR-WB),憑借其優(yōu)異的性能在2001年3月被3GPP采納,成為用于GSM和第三代移動通信WCDMA系統(tǒng)的寬帶語音編碼器[1]. 由于AMR-WB編碼器參數(shù)之間具有很強的依賴性,丟失的語音包不但影響本幀語音的解碼,還會造成錯誤傳播,影響到隨后語音幀的正確解碼. 另外AMR-WB自帶的差錯隱藏模塊只在較低的丟包率條件下才能夠保證語音質量,所以進一步增強AMR-WB的抗丟包能力是十分必要的.
本文利用MDC技術增強AMR-WB的抗丟包能力,并結合刪余卷積編碼技術調整編碼速率,在此基礎上提出了一種與移動網(wǎng)絡話音編碼速率相融合的新型AMR-WB抗丟包方法. 本文的算法在實際應用中只需要在移動終端中加入兩個單獨的處理模塊,而不需要修改移動網(wǎng)絡協(xié)議或者增加額外的信令即可增強移動網(wǎng)絡的抗丟包能力,實現(xiàn)起來較為方便.
1.1 AMR-WB簡介
AMR-WB編碼器所采用的是代數(shù)碼本激勵線性預測編碼(algebraic code excited linear prediction,ACELP)結構,如圖1所示. 它基于分析-合成結構,從固定碼本(代數(shù)碼本)和自適應碼本中分別搜索出最佳碼矢量,乘以各自的最佳增益后相加,其和即是ACELP激勵信號源. 提取的ACELP模型參數(shù)包括兩部分:按幀提取的線性預測(linear prediction,LP)系數(shù);以及每子幀提取一次的固定碼本,固定碼本增益,基音周期和自適應碼本增益[2].
1.2 AMR-WB幀結構
AMR-WB編碼器共有9種編碼模式,每一種編碼模式的速率分別為23.85,23.05,19.85,18.25,15.85,14.25,12.65,8.85和6.60 kbit/s[3]. 其中編碼速率12.65 kbit/s及以上碼率模式都能夠提供高質量的寬帶語音,專門設計的兩個低碼率模式6.60和8.85 kbits主要用于惡劣的無線信道環(huán)境或者網(wǎng)絡擁塞的場合.
如圖2所示為AMR-WB一般的幀格式,幀類型占4 bits,表示從0~15共16個數(shù)字,其中0~8分別表示9種編碼模式,9、14、15分別用于表示AMR-WB靜默幀、語音丟失指示、沒有數(shù)據(jù)(沒有發(fā)送或者接收),10~13用于將來的使用. 在所提出的方案中利用10來指示這一幀信號是否為MDC幀信號,這樣就不需要額外的信令信息,只需要利用幀格式中的一個比特來進行判斷所傳語音信號. 幀質量指示(frame quality indicator,F(xiàn)QI)占用1 bit,F(xiàn)QI為1表示幀無誤,F(xiàn)QI為0表示幀信息出現(xiàn)錯誤.
帖類型4bits幀質量指示1bit幀模式指示4bits模式需求指示4bits校驗比特8bitsA類B類
圖2 一般的AMR-WB幀格式
Fig.2 General frame format of AMR-WB
A類比特會存放一些對語音質量恢復比較重要的比特數(shù)據(jù),如果接收到數(shù)據(jù)信息以后,檢測到A類信息出錯,在解碼端就會對A類信息進行錯誤隱藏,對B類信息不需要改變. 以編碼模式2為例,表1為AMR-WB在編碼速率為12.65 kbit/s時的比特分配,A類比特分布如表2所示,其中因為ISP參數(shù)和基音周期都是采用的矢量量化編碼,所以A類比特保存了ISP參數(shù)和基音周期的高比特位,對低比特位歸為B類信息.
表1 AMR-WB 12.65 kbit/s速率模式下的比特分配
表2 AMR-WB 12.65 kbit/s速率模式下的A類比特分布
1.3 AMR-WB各個參數(shù)對語音質量的影響
為了測試AMR-WB編解碼器中各個參數(shù)重要性,采用仿真實驗的方法分別測試ISP參數(shù)、LTP-filtering長時濾波參數(shù)、基音周期、增益、FCB固定碼本對語音質量的影響. 測試方法:假設在不同的丟包概率下,只對測試參數(shù)進行錯誤隱藏恢復,其它參數(shù)保持正確解碼,在測試不同參數(shù)時,確保丟包位置一樣. 利用寬帶PESQ(perceptual evaluation of speech quality)[4]對解碼出來的語音信號進行MOS評分. 在每一種丟包概率下每一種參數(shù)測試40條標準漢語語料(20條男聲,20條女聲)的PESQ分數(shù),計算所有語料PESQ分數(shù)的平均值. 實驗中采用AMR-WB的編碼模式2(語音編碼速率為12.65 kbit/s),測試結果如圖3所示. 丟包模型分別采用Bernoulli模型和Gilbert模型.
從圖3中分析7條曲線,得出在AMR-WB編解碼器中,Ltp-filtering參數(shù)對語音質量影響較小,相對來說影響最不重要,Ltp-filtering占用的比特數(shù)也是相對最少;影響最大的是基音周期和增益,固定碼本和ISP參數(shù)影響程度差不多.
2.1 MDC技術在AMR-WB的應用
分集技術能夠利用多徑效應來提高無線通信系統(tǒng)性能. 分集思想既可以用來設計信道編碼,也可以用來設計信源編碼. 當這種思想運用到信源編碼時,就產(chǎn)生了多描述編碼技術[5]. 如圖4所示為一個典型的多描述編碼系統(tǒng). 語音信號首先被分解到同等重要的描述中,每個描述在信道上單獨傳輸.
新一代移動通信TD-LTE系統(tǒng)是基于多載波技術,在每一個子載波上信號可以看作是平穩(wěn)的,但是每一個子載波的衰落也是不一樣的. 在發(fā)送信號時可以把每一個子載波看作是不同衰落的信號,各個子載波之間是不同衰落信號,子載波間的丟失也是不相關的,在TD-LTE系統(tǒng)中分組語音業(yè)務可以采用MDC技術來增強AMR-WB抗丟包能力.
目前基于AMR-WB的多描述編碼有多種實現(xiàn)方法,根據(jù)前面分析不同參數(shù)對語音質量的影響,可以得到基音周期和增益對語音質量的恢復最為重要,固定碼本和ISP參數(shù)的重要性相對較小一點. 另外固定碼本占用的比特數(shù)的比重最大,所以在多描述編碼中會考慮不同參數(shù)的重要性及各個參數(shù)所占用的比特數(shù)的比重,來合理進行多描述編碼. 而文獻[6]中對各個參數(shù)重要性的處理滿足前面的分析,所以選用文獻[6]中多描述編碼的實現(xiàn)方法.
以AMR-WB編碼模式2編碼速率為12.65 kbit/s為例,文獻[6]的編碼參數(shù)在各子幀和兩個描述中的比特分配如表3所示.
表3 比特分配方案
其中VAD話音激活檢測參數(shù)是分布在兩個描述中,ISP參數(shù)的一級矢量量化分布在兩個描述中,而第二級ISP矢量量化索引中,用20比特編碼的前三個矢量分配到描述1中,用10個比特編碼的后兩個矢量分配到描述2中;對于參數(shù)LTP-filtering,第1、3子幀放在描述1里面,第2、4子幀放在描述2里面;將基音周期都調整為9 bits表示,對于基音周期和增益都是把1、3子幀的放在描述1里,2、4子幀的放在描述2里面;固定碼本中,每子幀中奇數(shù)位上的脈沖分解到描述1中,偶數(shù)位上的脈沖分解到描述2中,這樣當一個描述丟失時,每個子幀仍然有脈沖信息可以恢復. 并且由于采用子幀脈沖交織的算法,所以需要重新計算每一個描述里面的增益,會多傳入2個交織碼本增益.
2.2 利用刪余卷積編碼技術調整編碼速率
刪余卷積編碼是文獻[7]提出的一種可以實現(xiàn)不同比率的卷積編碼方案,本文利用刪余卷積編碼對不同的編碼模式采用不同的卷積編碼比率,來實現(xiàn)比特速率匹配. 利用文獻[6]實現(xiàn)的MDC方法,對不同的AMR-WB編碼模式采用多描述算法時,不同模式下的比特占用如表4所示.
表4 AMR-WB和MDC算法下不同模式占用的比特數(shù)
Tab.4 The number of bits occupied by different modes under AMR-WB and MDC algorithm
模式AMR?WBMDC013211772162253292328532443173565365639743674618477
采用低模式下的MDC算法來匹配高模式下的AMR-WB編碼,例如模式2的MDC算法占用292 bits,來匹配AMR-WB的模式4,這樣就不會出現(xiàn)占用比特多的情況,為達到與已有移動通信系統(tǒng)相同的話音編碼比特,反而會有多余的比特數(shù)據(jù)沒有得到利用.
本文提出由低模式下的MDC算法來匹配AMR-WB的高模式編碼,然后多余的比特數(shù)據(jù)通過進行刪余卷積編碼實現(xiàn)不同的碼率匹配. 比如AMR-WB模式4占用317 bits,而模式2的MDC技術需要292 bits,這樣MDC方法需要補25 bits才會和AMR-WB模式4占用相同的比特資源. 通過對這25 bits數(shù)據(jù)采取不同碼率的卷積編碼來實現(xiàn)語音編碼速率匹配. 由于多余的比特并不是很多,如果對所有的比特數(shù)據(jù)都進行保護,碼率會比較高,實驗結果表明這樣做的效果并不好,甚至語音質量還會出現(xiàn)下降的現(xiàn)象. 最終采用不等差錯保護方式,對重要的比特數(shù)據(jù)進行保護,對不重要的比特數(shù)據(jù)不進行操作. 通過1.3的實驗分析可以得到不同參數(shù)對語音質量的影響不同,所以最終多余的比特數(shù)據(jù)只對ISP參數(shù)和基音周期進行保護,其它參數(shù)不進行保護.
所提方案的整體實現(xiàn)流程如圖5所示,在發(fā)送端首先會根據(jù)CQI(channel quality indicator)值來判斷下一步的操作,如果信道質量不好,則會選擇AMR-WB編碼模式下對應的MDC編碼模式,保持語音編碼速率和之前的速率一樣,如果信道質量較好,則保持編碼模式不變. 在接收端會根據(jù)幀頭指示比特來判斷是否經(jīng)過MDC和刪余卷積編碼處理,然后再進行下一步操作. 對于實際移動網(wǎng)絡,通過在移動終端加入語音編碼后處理的模塊和語音解碼前處理的模塊,即可實現(xiàn)語音傳輸?shù)目箒G包功能,而不需要修改終端中其它部分.
本文對3種抗丟包算法進行對比,包括AMR-WB本身的丟包隱藏算法,文獻[6]中MDC算法,以及本文所提的新方案,其中AMR-WB采用編碼模式4,文獻[6]中MDC算法對應AMR-WB的編碼模式2,本文對參數(shù)進行保護的MDC算法也對應AMR-WB的編碼模式2. 這樣所提算法的語音編碼速率與AMR-WB的編碼速率一致,而MDC算法的語音編碼速率相對低一點. 實驗中按照Bernoulli模型和Gilbert模型兩種模型來得到丟包數(shù)據(jù),測試每一種算法的丟包位置保持一致. 實驗中的原始語音文件來自NTT-AT寬帶中文語音數(shù)據(jù)庫. 選取的語料數(shù)目為40條(20男,20女),每條語料的長度為8 s,采用16 kHz采樣和16 bit PCM量化. 對處理后的語音信號采用寬帶PESQ來進行測試,對比出各個算法的語音質量.
實驗結果如圖6所示,在沒有丟包的情況下由于AMR-WB的編碼模式較高,且沒有任何損傷,所以恢復出來的語音質量比另外兩種算法相對較好一點. 在本次實驗中丟包率大于3%的情況下,AMR-WB的丟包隱藏效果沒有另外兩種算法的效果好,并且對基音周期和ISP進行保護的MDC算法比單純的MDC實現(xiàn)的語音質量要好. 這說明當移動網(wǎng)絡發(fā)生丟包時,本文提出的新的抗丟包方案可發(fā)揮較好的作用.
本文提出了一種在不改變原有移動網(wǎng)絡系統(tǒng)傳輸協(xié)議的情況下,通過對AMR-WB編碼器加入MDC處理和刪余卷積編碼兩個模塊實現(xiàn)對丟包的恢復,并保持與原有話音編碼速率的匹配,其實現(xiàn)方法簡單,算法復雜性較低,且不會產(chǎn)生額外的處理時延. 經(jīng)過仿真實驗與分析,新的抗丟包方法相比于AMR-WB本身的丟包隱藏算法和單純的MDC算法對語音質量的恢復有所提高,并且不會增加移動網(wǎng)絡的信令開銷.
[1] 3rd Generation Partnership Project (3GPP). TS 26.190 AMR wideband speech codec: transcoding functions[S]. [S.l.]: 3GPP, 2001.
[2] Schroeder M R, Atal B. Code-excited linear prediction (celp): high quality speech at very low bit rates[C]∥Proceedings of the IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP’85). Tampa, Florida: IEEE, 1985:937-940.
[3] 3rd Generation Partnership Project (3GPP). TS 26.190. AMR wideband speech codec: frame structure[S]. [S.l.]: 3GPP, 2001.
[4] ITU Telecommunication Standardization Sector (ITU-T). Recommendation P.862.3. Application guide for objective quality measurement based on recommendation P.862[S]. [S.l.]: ITUT, 2005.
[5] Goyal V K. Multiple description coding: compression meets the network[J]. Signal Processing Magazine, 2001:74-93.
[6] Lang Yue, Zhao Shenghui, Kuang Jingming. A multiple description speech coder based on AMR-WB[C]∥Proceedings of the IEEE Conference on Information Technology & Applications (ICITA2007). Harbin, China: IEEE, 2007:697-700.
[7] Host S,Johannesson R, Zyablov V V. A first encouter with binary woven convolutional codes[C]∥Proceedings of the 4th Int Symp Communication Theory and Application. U.K:[s.n.],1997:13-18.
(責任編輯:李兵)
The Anti Packet Loss Algorithm for Voice Transmission in the Mobile Network
WANG Jing1, LIU Bao-guang1, FEI Ze-song1, ZHANG Jian-yin2
(1.School of Information and Electronics,Beijing Institute of Technology, Beijing 100081,China;2.Research Institute of China Mobile Communication Corporation, Beijing 100053, China)
In mobile communication network, there exists anti packet loss problem in adaptive multi rate-wide band(AMR-WB) codec when transmitting voice packet. In order to settle the problem, AMR-WB anti packet loss implementation approach matching the rate of speech coding in VoLTE system was proposed. Firstly, the impacts of each parameter in the AMR-WB codec on voice quality after the recovery of error concealment was analyzed through experiment. Then an AMR-WB anti packet loss scheme was designed by taking advantage of MDC(multiple description coding) technology. Furthermore, combing with punctured-convolution coding, an enhanced anti packet algorithm with double error protection was proposed to implement error protection and rate matching under multi-rate situation. The scheme is compatible with the rate of voice coding under the original AMR-WB coding model. Simulation results show that the proposed novel scheme can strengthen anti packet loss capability of AMR-WB without the need of increasing signaling overhead in mobile network, and it is compatible with the multi-rate voice coding in existing mobile network.
adaptive multi rate-wide band; multiple description coding algorithm; punctured-convolution coding; mobile network
2014-04-10
國家自然科學基金資助項目(61571044,11461141004);國家教育部-中國移動科研基金資助項目(MCM201240113)
王晶(1980—),女,博士,副教授,E-mail:wangjing@bit.edu.cn.
TN 911
A
1001-0645(2016)10-1048-05
10.15918/j.tbit1001-0645.2016.10.012