摘 要:依據(jù)ETSI 頒布的DRM系統(tǒng)標(biāo)準(zhǔn),對DRM系統(tǒng)所采用的信源編碼和信道編碼方法進行了分析和研究, 詳細闡述了AAC、CELP和HVXC三種信源編碼的工作原理和實現(xiàn)方法,詳細闡述了卷積編碼器的工作原理。另外,簡要介紹了頻帶恢復(fù)技術(shù)在DRM中的應(yīng)用。
關(guān)鍵詞:DRM;信源編碼;信道編碼;SBR
中圖分類號:TN911.21,TN911.22 文獻標(biāo)識碼:B 文章編號:1004373X(2008)1505703
Source Encoding and Channel Encoding in DRM System
WAN Zhiqiang
(561 Station of SARFT,Nanchang,330212,China)
Abstract:According to the DRM system standard released by the ETSI,source encoding and channel encoding are analyzed and researched in this paper.Then the principle and realization of three approaches-AAC,CELP,HVXC-of source encoding are described particularly. The theory of convolutional encoder is investigated in this paper.The spectral band replicated for DRM system is introduced simply.
Keywords:DRM;source encoding;channel encoding;SBR
1 引 言
DRM(ETSI ES 201 980)技術(shù)標(biāo)準(zhǔn)是世界數(shù)字AM廣播組織DRM(Digital Radio Mondiale)確立的關(guān)于30 MHz以下的數(shù)字AM廣播標(biāo)準(zhǔn)。DRM系統(tǒng)是經(jīng)過嚴(yán)格的開路試驗、技術(shù)成熟的系統(tǒng),是世界上惟一的非專利的數(shù)字系統(tǒng),主要應(yīng)用于中、短波廣播,它可以使用已有的頻率和帶寬,是對傳統(tǒng)模擬AM廣播的重大改善。
信源編碼和信道編碼是DRM技術(shù)系統(tǒng)的關(guān)鍵技術(shù),它解決了數(shù)據(jù)的存儲、交換、傳輸?shù)挠行院涂煽啃詥栴},一個完整的DRM信源編碼和信道編碼方框圖如圖1所示。
DRM系統(tǒng)選擇了3種壓縮效率高,同時又有好的聲音質(zhì)量的信源編碼方法:AAC,CELP和HVXC,同時根據(jù)不同的信源編碼方式選用頻帶恢復(fù)技術(shù)SBR。在DRM系統(tǒng)中,SBR技術(shù)可以與AAC和CELP聯(lián)合工作??紤]到實際應(yīng)用的有效性和模塊的通用與廉價性,DRM系統(tǒng)選擇了卷積編碼器為其作信道編碼。
2 DRM系統(tǒng)的信源編碼
信源編碼的任務(wù)主要是通過對信源數(shù)據(jù)率的壓縮,力求用最少的數(shù)碼傳遞最大的信息量。眾所周知,數(shù)字音頻信號的質(zhì)量是由其數(shù)據(jù)率決定的,音頻數(shù)據(jù)率越高,在信道上傳輸?shù)臄?shù)據(jù)率也越高,所需的射頻帶寬也就越寬。DRM系統(tǒng)規(guī)定使用與模擬AM廣播相同的頻道寬度(9 kHz或10 kHz),在條件允許的情況下,最多可以使用到加倍的帶寬(18 kHz或20 kHz)。在這樣窄的帶寬限制下,為了得到好的聲音信號質(zhì)量,除了選擇相應(yīng)的信道編碼和調(diào)制方法外,十分重要的一點是選擇相應(yīng)的信源編碼方法。
為在給定的比特率下提供更好的質(zhì)量,DRM系統(tǒng)使用了屬于MPEG-4的不同的信源編碼方案,以適應(yīng)在數(shù)字AM廣播中不同節(jié)目(音樂/語言)的不同帶寬的需要:
(1) MPEG-4子集AAC(Advanced Audio Coding,先進音頻編碼),包括抗差錯強壯性(robust)處理,用于普通單聲道和立體聲廣播。
(2) MPEG-4子集CELP(Code Excited Linear Prediction,碼本激勵線性預(yù)測)語音編碼,用于單聲道語音廣播,對很低比特率是有效的,或者適合于在要求較高的抗差錯強壯性的情況下應(yīng)用。
(3) MPEG-4子集HVXC(諧波矢量激勵編碼)語音編碼,用于很低比特率和抗差錯強壯性單聲道語音廣播,特別適合于基于語音數(shù)據(jù)的應(yīng)用。
2.1 MPEG-4 AAC
MPEG-4 AAC是在MPEG-2投入應(yīng)用以后,對編碼技術(shù)的進一步發(fā)展。它的編碼效率是MPEG-2以后最有效的編碼方法,在48 kp/s的情況下,可以得到如同F(xiàn)M立體聲一樣的主觀聽覺質(zhì)量,其框圖見圖2。
MPEG-4 AAC編碼器包括心理聲學(xué)模型、增益控制、濾波器組、暫態(tài)噪聲整形、強度立體聲編碼、預(yù)測編碼、M/S立體聲編碼、縮放因子、量化和無噪聲編碼。它是一種對所有音頻素材來說都可以一樣好的編碼方法。它對音頻信號的能量成分進行分析,并利用人耳的掩蔽效應(yīng),以便從音頻信號中找到聽覺上可被其他聲音掩蓋的成分。
AAC本身的效率已經(jīng)比眾所周知的MP3方法高出30%,然而,由于窄的有限的帶寬,僅使用AAC是不夠的。借助附加應(yīng)用的SBR,可以在保持同樣高的音頻質(zhì)量的情況下,數(shù)據(jù)率還可以再減低40%。
2.2 MPEG-4 CELP
MPEG-4 CELP對語音重放非常有利,但不適于音樂。在MPEG-4中實施CELP語言編碼器的原因是,AAC在以低于14 kb/s的數(shù)據(jù)率進行語音傳輸時能力大大減弱。在明顯低的數(shù)據(jù)率的情況下,CELP的優(yōu)點是可以提供明顯好的音質(zhì),甚至數(shù)據(jù)率低至6 kb/s時仍然可以使用(有很好的可懂性,盡管此時達不到FM單聲道質(zhì)量),故為DRM系統(tǒng)所采用。MPEG-4 CELP的音頻質(zhì)量還可以通過應(yīng)用SBR來提高。
CELP建立在線形預(yù)測編碼(LPC)的基礎(chǔ)上,一個典型的CELP框圖見圖3。
可見,輸入信號的線形預(yù)測系統(tǒng)LP首先被分析,然后被量化以用于受激勵碼本輸出所驅(qū)動的LP合成濾波器中。編碼過程分兩步,第一步計算長時期預(yù)測系數(shù);第二步,最小化LP合成濾波器輸入信號和輸出信號之間的知覺加權(quán)誤差。這一最小化過程是通過為激勵碼本搜索一個合適的代碼矢量完成的。量化系數(shù),以及對激勵碼本代碼矢量的索引和長時期預(yù)測系數(shù),形成了位流。LP系數(shù)被矢量量化器所量化,其激勵既可以是MPE,也可以是規(guī)則脈沖激勵RPE。MPE和RPE都是用多脈沖作激勵信號,但存在不同的脈沖位置的自由度。和RPE中固定的脈沖間距相比,MPE對于脈沖間距允許更多自由。正是由于這種靈活的脈沖間距,MPE取得的編碼質(zhì)量比RPE更好。但另一方面,RPE以編碼質(zhì)量做折中,需要的計算量比MPE更少。
2.3 MPEG-4 HVXC
為了對典型的數(shù)據(jù)率低至2 kb/s的語言信號進行編碼,DRM系統(tǒng)應(yīng)用了一種叫做諧波矢量激勵編碼方法的編碼器,即MPEG-4 HVXC編碼器。MPEG-4 HVXC語音編碼工具集包括對以2.0 kb/s和4.0 kb/s比特率自然語音的壓縮和編碼。HVXC用于對聲音部分進行殘余信號諧波編碼和非聲音部分的矢量激勵編碼,在解碼時支持音調(diào)和速度變化,這一功能在進行語音數(shù)據(jù)庫快速搜索或瀏覽時非常有用。HVXC還有一個體系可以用錯誤保護工具提供錯誤敏感度分類。另外,錯誤隱藏功能可以用在有錯誤傾向的信道中。HVXC編碼器框圖見圖4。
HVXC首先執(zhí)行LP分析以找到LP系數(shù)。量化的LP系數(shù)被用于反向LP濾波器來尋找預(yù)測誤差。預(yù)測誤差被轉(zhuǎn)換到頻域,同時分析基音周期和譜包絡(luò)。這個包絡(luò)在濁音部分被加權(quán)矢量量化器所量化。在非濁音部分,會進行激勵矢量的閉環(huán)搜索。
HVXC工作的比特率為DRM提供了新的應(yīng)用,例如:語音業(yè)務(wù)附加到音頻業(yè)務(wù)中;多語言應(yīng)用;對多種節(jié)目例如新聞固化存儲;用于改變存儲的節(jié)目快速回放/瀏覽時的時間分級;在有/無分級調(diào)制時提供高的抗差錯強壯性傳輸。
2.4 SBR技術(shù)簡介
頻帶恢復(fù)SBR(Spectral Band Replicated)技術(shù)是德國Coding Technology公司的專利技術(shù),應(yīng)用在AAC和CELP編碼器中,可以在低比特率的情況下獲得整個語音帶寬,在DRM系統(tǒng)中是一種可選的語音編碼增強工具。
所謂SBR,簡而言之是,不需傳輸6 kHz以上的頻率范圍的音頻數(shù)據(jù),而通過產(chǎn)生6 kHz以上的諧波或“和聲”來仿真,在解碼端就可以得到直到15 kHz的音頻帶寬的音頻信號。SBR可以使已有的編碼方法更有效,并在低的比特率情況下得到明顯改善的聲音質(zhì)量。傳統(tǒng)的音頻壓縮算法在低的比特率時剪切掉了高音頻部分,信號聽起來感覺沉悶。在音頻數(shù)據(jù)壓縮前利用SBR分析音頻信號的高音頻部分,并將一些少量附加信息(引導(dǎo)信息)附加到壓縮的信號中。在接收機中,有SBR能力的解碼器從帶有少量附加信息的壓縮的信號中重建高音頻部分,并將其再附加到“沉悶”的音頻信號中。結(jié)果是音頻信號主觀感覺很好,音頻帶寬可達15 kHz,而僅需要22~25 kb/s的數(shù)據(jù)率。
3 DRM系統(tǒng)的信道編碼
在實際的無線電信道中傳輸數(shù)字信號時,由于信道的不理想或各種干擾的影響,使接收的信號產(chǎn)生差錯。要使差錯限制在一定的允許范圍內(nèi),數(shù)字基帶信號在進行調(diào)制前,必須進行信道編碼。
選擇信道編碼方法時,首先是在給定的剩余比特差錯率和平均編碼率以及傳輸帶寬下,選擇允許最低的載噪聲比C/N的一種方法。好的信道編碼方法使剩余比特差錯率曲線向小的C/N方向移動。
對于廣播傳輸來說,卷積碼相對于代數(shù)學(xué)的塊碼是有好處的。因此,DRM系統(tǒng)選擇了可刪除卷積碼。卷積編碼器采用原理圖輸入的方法,通過移位寄存器和其不同抽頭的組合來實現(xiàn)的。如圖5所示。
寄存器的初始化狀態(tài)為全0,每輸入一個比特會產(chǎn)生4個比特的輸出。當(dāng)有效數(shù)據(jù)送完時,還要繼續(xù)送入6個0以使全部寄存器清零。
X0,i=ai⊕ai-2⊕ai-3⊕ai-5⊕ai-6
X1,i=ai⊕ai-1⊕ai-2⊕ai-3⊕ai-6
X2,i=ai⊕ai-1⊕ai-4⊕ai-6
X3,i=ai⊕ai-2⊕ai-3⊕ai-5⊕ai-6式中,ai表示第i個時刻的現(xiàn)時輸入,ai-1是i-1時刻的輸入,即自左向右第一個存儲器的存儲內(nèi)容,ai-2,ai-3,ai-4,ai-5和ai-6,依此類推。
從圖5可以看出,編碼器的信道編碼率為1/4,只有在特別惡劣的傳輸環(huán)境和對差錯非常敏感的特別重要的數(shù)據(jù)才使用這樣的編碼率。對于要求較低的差錯保護來說,可以使用高的編碼率,可以通過對上述基本碼(母碼)的編碼比特的刪除來實現(xiàn)。所謂“刪除”,指的是母碼的碼位不是所有的都傳送,實際傳送的碼位按照一個確定的方案來選擇。采用刪除方法,可以得到8/9,8/10,…8/32共24種不同的編碼率,以實現(xiàn)對不同重要性的數(shù)據(jù)實施不同等級的差錯保護。
4 結(jié) 語
技術(shù)總是不斷進步的,以后肯定會出現(xiàn)更好的信源編碼和信道編碼方法。為了能夠解決這樣的現(xiàn)實性問題,就必須開發(fā)能夠進行完整的軟件升級的接收機。但是,這會妨礙接收機制造商在低電流消耗條件下的最佳芯片設(shè)計和開發(fā)。同時,也要解決新的編碼方式所需要的處理器的功率和存儲容量問題。所以,DRM系統(tǒng)不會考慮使用未來的更新的信源編碼和信道編碼。
參 考 文 獻
[1]Ken C.Pohlmann.數(shù)字音頻原理與應(yīng)用[M].4版.蘇菲,譯.北京:電子工業(yè)出版社,2002.
[2]李棟.數(shù)字音頻廣播(DAB)技術(shù)[M].北京:北京廣播學(xué)院出版社,1998.
[3]李棟.數(shù)字聲音廣播 [M].北京:北京廣播學(xué)院出版社,2001.
[4]王東山,楊明.數(shù)字AM廣播的特點和實現(xiàn)\\.現(xiàn)代電子技術(shù),2007,30(18):132-134.
作者簡介 萬志強 男,1978年出生,江西南昌人,工程師。主要從事廣播電視工程領(lǐng)域的研究。