鄒志遠
語音編碼技術在數(shù)字通信中的應用研究
鄒志遠
(湖南長沙麓山濱江實驗學校 410013)
隨著科技的不斷進步,語音編碼技術的使用率越來越高,常見的移動通信系統(tǒng)就是采用了語音編碼技術,以達到去除語音冗長,解決語音不清問題的目的。本文主要通過對移動通信系統(tǒng)中對不同語音編碼技術的使用來分析語音編碼技術在數(shù)字通信中的重要性。
語音編碼技術;數(shù)字通信;應用
隨著計算機網絡技術的發(fā)展,語音編碼技術也得到了推廣和使用,成為通信系統(tǒng)中的核心技術,對于通信系統(tǒng)而言,語音編碼技術決定了系統(tǒng)容量與語音接受質量。能夠應用較少的信道容量來傳送出高質量語音,其效率復雜度與編碼器效率之間是一個正比關系。常用的語音編碼技術算法有混合激勵線性預測編碼(MELPC)、正弦變換編碼(STC)、基音同步激勵線性預測編碼(PSELP)等等,并引起了多種新型分析技術,如多精度時頻分析技術、非線性預測技術、高階統(tǒng)計分析技術等等。這些新技術可以有效挖掘感知機理,促進語音編碼系統(tǒng)的進一步發(fā)展。
通常語音編碼可以分為以下幾大類,波形編碼、參數(shù)編碼、混合編碼。這些都是常用的編碼形式。波形編碼是比較簡單的,可以直接對模擬語音進行采樣,采樣成功之后再進行量化幅度,之后二進制編碼。解碼器通過特殊的轉換之后,通過低通濾波器就可以回到模擬語音波形的最初狀態(tài),這是最為簡單的脈沖編碼調制,也可以稱之為線性編碼。雖然波形編碼簡單,操作也不需要花費過多的時間,但是效果卻非常好,失真比率很小。波形編碼很容易就實現(xiàn),數(shù)碼率很高,傳輸過程中的音質非常好,數(shù)碼率如果很低,音質也會隨之下降,一旦數(shù)碼率達到一定的低幅度,那么音質就會大受影響。對于移動通信而言,其頻率資源非常緊張,波形編碼完全不適合于移動通信使用,這種編碼方式更適用于頻率資源不緊張的通信資源,而移動通信是頻率資源的非??斓模唵蔚牟ㄐ尉幋a是無法實現(xiàn)這一操作的。
語音壓縮編碼技術的發(fā)展是十分迅速的,CELP的編碼速率較低,但復雜度較高,可以在4.8kh/s左右的碼速率上獲得較高質量的語音,是當今中低速率語音編碼技術的主流技術之一,許多國際標準化組織及機構紛紛將這一編碼方案作為語音編碼標準。在對其改善質量、降低復雜度、減少編碼延遲等方面都提出了不少新的方法,使CELP在實踐中得到廣泛應用。隨著DSP技術的發(fā)展,CELP技術還具有一定的潛力,得到了革命性的發(fā)展。
參數(shù)編碼又稱之為聲碼器,是指信源號在頻率域或其它正交變換域提取特征參量,也就是通過信源號把聲音頻率進行提取之后,再把聲音頻率進行聲道參數(shù)的轉化,在轉化的過程中要使用到數(shù)字代碼,數(shù)字代碼直接轉化成為聲音,進而實現(xiàn)通信的實際意義,但是參數(shù)編碼的解碼過程非常復雜多變,而在整個數(shù)字序列的轉化過程中,所涉及到的聲碼器有可能會出現(xiàn)操作混亂,特別是像移動通信這樣高頻率的操作過程中,參數(shù)編碼很難進行全面的處理。再加之參數(shù)編碼能夠根據(jù)特征參量重新建立識別語音信號,這種做法有可能導致最初的語音被誤讀,原始波形達不到完好的還原,雖然音質效果被理想,但是有可能導致語音信號錯誤,因此,移動通信一般都不會使用參數(shù)編碼,參數(shù)編碼技術比起波形編碼而言,操作簡便,音質效果更好,對于較為復雜的聲波處理效果也相對穩(wěn)定,但是不適合應用于像移動通信這樣的高頻率的信源信號中。
混合編碼是把波形編碼與參數(shù)編碼兩者的優(yōu)勢進行重組,把兩者通過原理的方式結合起來,既保持了波形編碼的簡單操作的優(yōu)勢,同時也兼顧了參數(shù)編碼的對多信源信號高效處理的優(yōu)勢,實現(xiàn)兩者的重組,混合編碼在進行數(shù)碼率處理,一般數(shù)碼率可以直接達到最為理想的狀態(tài),音質效果非常清晰,混合編碼的復雜程度介于波形編碼與聲碼器之間,是相對理想的音質處理器,不論是進行多脈沖激勵線性預測編碼能完全進行操作,同時達到理想的預測效果,規(guī)劃脈沖激勵線性預測在高頻率信號源起到很強的處理作用??梢?,混合編碼波形編碼操作非常簡單,同時還能處理復雜多變的音頻,更具備了聲碼器的線性預測效果,進而實現(xiàn)語音編碼的實際效果,有效保障了數(shù)字通信的音質。
與發(fā)達國家相比,我國的語音編碼技術起步較晚,但是發(fā)展勢頭非常強勁,雖然與發(fā)達國家相比雖然還存在一定的差距,但是在不斷的研究與發(fā)展的過程中,中國語音編碼技術在整個數(shù)字通信中的應用也取得了理想的成效。像移動通信這樣復雜多變的高音頻需要混合編碼才能進行信源號的處理,滿足理想的音質傳輸效果。語音編碼技術是21世紀的一項創(chuàng)新技術發(fā)現(xiàn),不僅僅是像移動通信這樣高信源號傳遞的企業(yè)需要語音編碼技術,如今各行各業(yè)都在朝著網絡通信以及數(shù)字通信方面發(fā)展,普通的波形編碼、聲碼器開始被時代淘汰,而混合編碼不僅操作越來越簡單,而且具備良好的聲碼處理效果,數(shù)字通信質量非常理想,成為了下一階段的重要應用技術。
近年來,我國對于通信中語音編碼技術的研究越來越深入,針對在數(shù)字通信過程中語音編碼的應用也進行了深層次的研究與分析,而非線性預測與多精度時頻分技術等各項技術也開始進入到數(shù)字通信中,在技術的深入研究之下,有效促進了數(shù)字通信產業(yè)的可持續(xù)發(fā)展,只有不斷完善現(xiàn)有的技術水平,才能夠有效提升音質效果。
[1]湯敏,尹海宏.多帶激勵語音編碼及其在寬帶語音上的實現(xiàn)[J].江蘇教育學院學報(自然科學版),2006(04).
[2]鄒嘉宇,侯文生,鄭小林,彭承琳.基于DSP的電子耳蝸語音編碼及無線傳輸[J].微計算機信息,2009(02).
[3]白國棟,張雪英.自適應多速率寬帶語音編碼算法的研究與仿真實現(xiàn)[J].太原理工大學學報,2008(03).
[4]吳恒.AMR語音編碼技術及其在移動通信中的應用[J].黑龍江科技信息,2008(28).
TN912.3
A
1004-7344(2016)27-0277-01
2016-9-9