亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于混合MELP /CELP 的4 kbit /s 聲碼器

        2017-05-18 01:33:07舒勤軍謝虹恩
        關鍵詞:信號

        李 強,舒勤軍,謝虹恩,明 艷

        (重慶郵電大學 信號與信息處理重慶市重點實驗室,重慶 400065)

        一種基于混合MELP /CELP 的4 kbit /s 聲碼器

        李 強,舒勤軍,謝虹恩,明 艷

        (重慶郵電大學 信號與信息處理重慶市重點實驗室,重慶 400065)

        利用混合激勵線性預測 (mixed excitation linear prediction,MELP )算法和碼激勵線性預測(code excitation linear prediction,CELP)算法的優(yōu)點,提出了一種混合MELP/CELP語音編碼模型。編碼端對強濁音幀采用MELP編碼,對弱濁音幀和清音幀進行CELP編碼。MELP編碼器采用相位對齊技術提取強濁音幀的相位參數,解決了合成語音與原始語音在時間上不同步的問題。對實現的4 kbit/s混合MELP/CELP聲碼器進行客觀MOS(mean opinion score)值和主觀DRT(diagnostic rhythm test)清晰度測試,結果表明,該聲碼器的合成語音具有較高的可懂度和清晰度。

        低碼率聲碼器;混合激勵線性預測;碼激勵線性預測;相位對齊

        0 引 言

        混合激勵線性預測(mixed excitation linear prediction,MELP)[1]算法在線性預測編碼模型的基礎上,采用非周期脈沖、混合激勵、自適應譜增強、脈沖散布濾波器和殘差諧波幅度等技術,有效地提高了語音編碼器合成語音質量。由于MELP采用了語音參數編碼方案,可實現0.6 kbit/s-2.4 kbit/s速率的聲碼器,主要應用在衛(wèi)星通信、軍事保密通信等頻帶資源有限的語音通信系統(tǒng)中。碼激勵線性預測(code excitation linear prediction,CELP)[2]以碼本為激勵源,采取合成分析(analysis-by-synthesis,ABS)搜索、感覺加權矢量量化和線性預測等技術,合成的語音具有質量高、抗噪性強等優(yōu)點。基于CELP的聲碼器廣泛應用在IP電話、蜂窩移動通信等領域。

        由于MELP采用的是諧波編碼結構模型,適合表現周期性較強的強濁音信號[3],對于清音、爆破音、過渡音等非周期或準周期語音信號來說,表現效果不佳。而CELP是一種混合編碼模型,采用ABS和感知加權均方誤差最小原則,在時域上對目標語音做波形匹配。由于需要引入固定碼本來還原激勵源,需使用較多的編碼比特,因此適用4 kbit/s以上速率的編碼器。在較低編碼速率下,對周期信號的表現效果不如MELP,但是對非周期或準周期信號的表現效果較好[4]。

        本文利用MELP和CELP算法各自的優(yōu)點,實現了一種混合MELP/CELP的4 kbit/s聲碼器。編碼端將輸入語音幀分為強濁音幀、弱濁音幀和清音幀3種類型。對強濁音幀使用MELP編碼模型,對弱濁音幀和清音幀采用CELP編碼模型,并利用相位對齊技術解決了MELP在提取原始語音信號特征參數[5]時沒有考慮相位,造成合成語音與原始語音在時間上不同步的問題。為了與CELP聲碼器編碼幀長一致,把MELP的編碼幀長由22.5 ms改為20 ms,重新構建了線譜對頻率(line spectrum frequency,LSF)、傅氏級數幅度語音特征參數的矢量量化碼本。混合MELP/CELP的4 kbit/s聲碼器用C語言進行了實現,經測試,本文實現的4 kbit/s聲碼器的合成語音具有較高的可懂度和清晰度。

        1 混合MELP/CELP聲碼器編解碼結構

        圖1為混合MELP/CELP語音編碼流程框圖。編碼器輸入的是8 kHz采樣、16 bit均勻量化的語音信號,幀長為20 ms。對經過預處理后的語音幀進行線性預測分析,得到線性預測系數和殘差信號,殘差信號用于后續(xù)語音特征參數的提取。編碼端以語音幀的濁音強度值的大小來判定幀的類型,如果是強濁音幀,進行MELP編碼,若是弱濁音幀或清音幀則采用CELP編碼。在進行MELP編碼時,提取強濁音幀的相位參數以實現相位對齊[6]。語音特征參數量化編碼后形成比特流,最后加上指示該幀是MELP編碼還是CELP編碼的1 bit模式判決位后打包輸出。

        圖2是混合MELP/CELP語音解碼流程框圖。接收端對接收到的比特流進行解碼,根據模式判決信息選擇相應的MELP或CELP解碼算法。將解碼得到的參數生成MELP模型激勵源或CELP模型激勵源,通過線性預測合成濾波器后,重構出語音信號。將重構的語音信號進行后置濾波[7]得到最終的合成語音信號。

        圖1 混合MELP/CELP聲碼器編碼流程圖Fig.1 Block diagram of hybrid MELP/CELP speech coding

        圖2 混合MELP/CELP聲碼器解碼流程圖Fig.2 Block diagram of hybrid MELP/CELP speech decoding

        2 相位對齊

        CELP編碼是以逼近原始語音波形為目的,在傳輸的信息中含有相位參數,因此合成的語音波形與原始語音波形在時間上是同步的。而MELP提取的原始語音特征參數中沒有包含相位信息,導致了合成語音與原始語音在時間上不同步,表現出波形包絡不一致。因此,混合MELP/CELP聲碼器不能簡單地把解碼后合成的語音信號進行疊接,否則在聽覺上感覺會不自然,導致合成語音質量下降。為了解決相位對齊問題,MELP編碼端需提取強濁音幀的相位參數。

        2.1 相位參數的提取

        本文采用相關法來提取強濁音幀的相位參數。參與相關運算的一個信號是欲編碼的線性預測殘差語音信號e(n);另一個是利用本幀提取的殘差諧波譜幅度M(k)和基音周期Tp重建的激勵殘差信號e′(n),其計算公式為

        (1)

        由于e(n)和e′(n)信號長度可能不同,因此在做相關運算前需加窗截斷。所加矩形窗的中心位于當前幀的最后一個樣點,窗長取大于120的當前幀的基音周期值的最小整數倍值。將e′(n)在e(n)上滑動計算歸一化相關系數,將相關系數的最大值以該幀的基音周期值為參數進行換算,其結果即為本幀的相位[8]。

        2.2 立方相位內插

        在標準MELP編碼算法中,幀長為N的第l幀的語音特征參數是通過本幀語音特征參數Al與上一幀語音特征參數Al-1線性內插得到的,其內插公式為

        n=0,1,…,N-1

        (2)

        但是,這種方法不能用于相位內插,因為相位θl-1和θl是以2π取模得到的,不是常規(guī)的線性關系。本文采用立方相位內插[9]來解決這個問題。設相位內插函數為三次多項式,為方便起見,將該基波相位寫成時間變量t的連續(xù)函數,即

        θ(t)=a3t3+a2t2+a1t+a0

        (3)

        由于相位的導數為角頻率,將 (3) 式做微分運算后,得到如 (4) 式的基波角頻率。

        ω(t)=3a3t2+2a2t+a1

        (4)

        設第l幀信號的起始點時間為0,終點時間為語音幀的時長T,起始點的基波相位和角頻率分別為θl-1和ωl-1,終點的基波相位和角頻率分別為θl和ωl,這里的θl-1和ωl-1也是第l-1幀的終點的基波相位和角頻率。通過(3)式和(4)式可內插出第l幀的中間點的相位和角頻率,得到如(5)式所示的4個方程式。

        (5)

        由于末端相位θl是以2π取模得到的,所以必須加上2πM,這里的M是未知數。把(5)式寫成如(6)式的矩陣形式后,通過解方程,可得到計算a0~a3的(7)式。

        (6)

        (7)

        把a0~a3代入(3)式和(4)式,得到計算第l幀的非線性相位和時變頻率。

        為了確定M的值,需要找到相位變化最平坦的曲線區(qū)域,即是“最大程度平滑”。如果頻率是常數且聲道為平穩(wěn)的,則實際相位是線性變化的,相位的一階導數為常數,二階導數為0。所以,找最平坦區(qū)域的過程就是選擇合適的M,使得

        (10)

        為最小。經推導可以證明,使(10)式為最小的M值可表示為

        (11)

        (11)式中,INT表示取整。由于聲碼器處理的對象是離散時間語音信號,因此可將(8)式改寫為(12)式的離散形式。

        (12)式中:pl-1和pl分別是上一幀和當前幀的基音周期值。

        MELP解碼端加入相位信息后,脈沖激勵信號的計算公式為

        (13)

        3 混合MELP/CELP聲碼器的實現

        本文采用增強型變速率(enhanced variable rate codec,EVRC)[10]中的半速率算法來實現4 kbit/s的CELP聲碼器,而4 kbit/s的MELP聲碼器是在標準2.4 kbit/s 的MELP算法基礎上實現的。為了與CELP編碼器幀長一致,將MELP的幀長由22.5 ms調整為20 ms。在設計MELP幀結構時,除了考慮需要傳送編碼端的相位信息外,還重新劃分了子帶,增加了增益和殘差諧波幅度的量化比特數,以提高聲碼器的合成語音質量。下面重點介紹4 kbit/s的MELP編解碼器的實現。

        3.1 預處理

        對原始語音信號進行高通濾波和噪聲抑制,以濾除50 Hz的工頻干擾和其他噪聲。

        3.2 MELP聲碼器的實現

        3.2.1 參數提取與量化

        MELP聲碼器在編碼端提取的參數有:LSF、基音周期、帶通清/濁音強度、增益、殘差諧波譜幅度和對齊相位。每幀量化編碼輸出80 bit。為了能更精確地表示語音信號的特征,除了LSF、殘差諧波譜幅度和對齊相位每幀提取一次外,其他參數每子幀(10 ms)提取一次。相位參數的提取方法見2.2節(jié),其他參數的提取方法與標準MELP一樣。但是在子帶劃分和殘差諧波譜幅度的量化上有所不同。

        1)子帶的劃分。標準MELP編碼器將一幀語音信號的頻譜劃分為5個固定子頻帶,對每個子頻帶進行清/濁音判決后,將判決結果傳送給解碼端。采用這種多帶混合模型使得合成激勵信號更加準確[11]。為了對激勵信號進行更精細地劃分,本文將原來的5個固定子頻帶擴展到7個。采用7個六階的巴特沃斯帶通濾波器把輸入的語音信號分為如下7個子頻帶:0-500 Hz,500-1 000 Hz,1 000-1 500 Hz,1 500-2 000 Hz,2 000-2 500 Hz,2 500-3 000 Hz和3 000-4 000 Hz。第1子帶的清濁音強度值用來判斷當前幀的清/濁音狀態(tài),后6個子帶的清濁音強度值用來確定各子帶的清/濁音類型。

        2)殘差諧波幅度的量化。殘差諧波幅度主要用于提升合成語音低頻段的準確性,增加合成語音的自然度[12],對女聲和帶有背景噪聲的語音質量也有一定程度的改善。為了進一步提高殘差諧波幅度的精度,本文采用11 bit對其進行矢量量化。首先從大量的中英文語音中提取10維的殘差諧波幅度值,然后采用LBG算法生成矢量量化碼本。

        3.2.2 幀結構的設計

        語音幀的LSF和殘差諧波幅度分別用25 bit和11 bit進行矢量量化。其中,LSF采用7666四級矢量量化:對齊相位則用6 bit進行標量量化;每子幀的基音周期、通帶清/濁音判決和增益分別用7 bit,6 bit和6 bit進行標量量化。4 kbit/s的MELP聲碼器比特分配方案如表1所示。

        表1 MELP聲碼器比特分配方案

        3.2.3 參數插值

        由于聲碼器的編碼端只對強濁音幀采用MELP方式編碼,因此解碼端語音合成過程與標準MELP略有不同,即不用考慮清音幀的合成。解碼端對強濁音幀的參數解碼后,LSF和殘差諧波譜幅度與標準MELP的插值方式一樣,對齊相位則采用2.2節(jié)的三次插值方式。由于增益、基音周期和帶通清濁判決每幀提取2次參數,且MELP解碼端是按照基音周期長度進行語音合成的,因此,這些參數需根據合成語音信號的起始點進行參數插值,具體分為以下2種情況:

        1)如果合成語音信號的起點小于80,則判斷前一幀是否為MELP編碼幀,若是,則對前一幀的第2個子幀的參數與當前幀的第1個子幀的參數進行線性插值;否則不進行線性插值,直接使用當前幀的第1子幀的參數;

        2)若合成語音信號起點大于80,對當前幀的兩子幀參數進行線性插值。

        4 混合MELP/CELP聲碼器性能測試

        4.1 客觀MOS值測試

        在相同條件下對FS-1016標準中的4.8 kbit/s CELP聲碼器、EVRC的4 kbit/s聲碼器和本文實現的4 kbit/s聲碼器采用符合ITU-T P.862標準的PESQ軟件進行客觀MOS(mean opinion score)值測試。測試對象為P.862標準中男女各8組語音。表2和表3分別是3種聲碼器合成語音的MOS值測試結果。

        表2 男聲MOS值比較

        表3 女聲MOS值比較

        與FS-1016標準中的4.8 kbit/s聲碼器相比,本文聲碼器的男聲和女聲的平均MOS值都有一定提高。其中,女聲的平均MOS值提高幅度較大。與EVRC中的4 kbit/s聲碼器相比,本文的聲碼器男聲和女聲的平均MOS值均有所降低,平均降了0.05和0.04。由于PESQ是通過比較編碼前后語音信號之間的差異,得到編碼過程中引入的失真,計算出一個類似人工聽力評估測試的MOS分值。如果原始語音與合成語音波形差別較大,測試出來的MOS值較低。由于本文實現的4 kbit/s聲碼器對強濁音幀采用了參數編碼方式,而EVRC對所有語音幀均采用波形編碼和參數編碼的混合方式,因此EVRC聲碼器的合成語音信號在時域波形上要更接近原始語音信號,4 kbit/s 的EVRC聲碼器合成語音的MOS值要略高于本文聲碼器。

        4.2 DRT測試

        判斷韻字測試(diagnostic rhyme test,DRT)是反映語音清晰度或可懂度的一種主觀測試方法,主要用于低碼率語音編碼器的質量評估。本文采用國家標準《GBT 13504—2008漢語清晰度診斷押韻測試(DRT)法》對聲碼器質量進行測試,測試語音選自《GBT 16532—1996通信設備清晰度DRT法評價語音材料庫》,測試人員為5男5女在校大學生。表4是DRT的清晰度等級劃分。

        表4 DRT清晰度等級劃分

        表5是本文4 kbit/s聲碼器按漢語輔音的6個區(qū)別特征進行DRT測試的結果。女聲和男聲的濁音性和送氣性得分在95以上,這2項的DRT清晰度等級為優(yōu),其他4個區(qū)別特征DRT清晰度等級為良好。男聲和女聲平均DRT得分為93.4,聲碼器清晰度等級為良好。

        表5 本文聲碼器DRT測試得分

        表6是4 kbit/s 的EVRC聲碼器DRT清晰度測試結果。女聲的濁音性和緊密型,男聲的濁音性、低層性和持續(xù)性的DRT清晰度得分略高于本文聲碼器,其他區(qū)別特征的DRT清晰度得分均低于本文聲碼器。

        本文聲碼器女聲平均DRT清晰度得分比4 kbit/s EVRC聲碼器高了2.3,男聲略低了0.5,男聲和女聲平均DRT清晰度得分要高0.9。測試結果說明本文聲碼器合成語音的清晰度要略優(yōu)于4 kbit/s EVRC聲碼器。

        表6 EVRC聲碼器的 DRT測試得分

        5 結 論

        結合MELP和CELP算法的優(yōu)點,本文提出并實現了一種編碼速率為4 kbit/s的混合MELP/CELP聲碼器。通過PESQ客觀MOS值測試,女聲和男聲的MOS值達到了3.2和3.4以上。采用主觀DRT清晰度測試,女聲和男聲的平均DRT清晰度值分別達到了94.3和92.5,接近清晰度為優(yōu)的等級。本文實現的4kbit/s聲碼器的合成語音清晰度高,可應用在公眾通信、保密通信和衛(wèi)星移動通信等語音通信系統(tǒng)中。

        [1] MCCREE A, TRUONG K, GEORGE E, et al. A 2.4 kbits/s MELP coder candidate for the new US Federeal Standard[C]//Proc. of ICASSP. [s.l.]: IEEE, 1996: 200-203.

        [2] TANDEL M, SHAH V, PATEL B. Implementation of CELP coder and to evaluate the performance in terms of bit rate, coding delay and quality of speech[C]//2011 3rd International Conference on Electronics Computer Technology (ICECT). Piscataway, N. J: IEEE Press, 2011: 86-89.

        [3] MCCREE A, STACHURSKI J, UNNO T, et al. A 4 kbit/s hybrid MELP/CELP speech coding candidate for ITU standardization[C]//2002 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Piscataway, N. J: IEEE Press, 2002: I-629-I-632.

        [4] STACHURSKI J, MCCREE A, VISWANATHAN V, et al. Hybrid MELP/CELP coding at bit rates from 6.4 to 2.4 kbit/s[C]//2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Piscataway, N. J: IEEE Press, 2003: II-153- II-156.

        [5] STACHURSKI J, MCCREE A, VISWANATHAN V. High quality MELP coding at bit-rates around 4kbit/s[C]//1999 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Piscataway, N. J: IEEE Press, 1999: 485-488.

        [6] STACHURSKI J, MCCREE A. A 4 kbit/s hybrid MELP/CELP coder with alignment phase encoding and zero-phase equalization[C]//2000 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP).Piscataway,N.J:IEEE Press,2000:1379-1382.

        [7] 馬震. 混合激勵 MVDR 語音編碼技術研究[D]. 濟南: 山東大學, 2005. MA Zhen, Research on the MVDR Speech Coding Technology [D].Jinan: Shandong University, 2005.

        [8] 劉斌. HYBRID-MELP/CELP語音壓縮編解碼算法的研究[D].成都: 電子科技大學,2005. LIU Bin. Research on HYBRID-MELP/CELP Speech Compression Encoding and Decoding Algorithm [D]. Chengdu: University of Electronic Science and Technology of China, 2005.

        [9] QUATIERI T F.離散時間語音信號處理:原理與應用[M].趙勝輝,譯.北京:電子工業(yè)出版社,2004:347-350. QUATIERI T F. Discrete time speech signal processing: principle and application [M]. ZHAO Shenghui, Translate. Beijing: Publishing House of Electronics Industry, 2004:347-350.

        [10] 王炳錫, 王洪. 變速率語音編碼[M]. 西安: 西安電子科技大學出版社, 2004: 161-169. WANG Bingxi, WANG Hong. Variable rates speech coding [M]. Xi’an: Xi’an University of Electronic Science and Technology Press, 2004:161-169.

        [11] WANG Dusheng, LI Lizhong, ZHANG Jiankang, et al. An Adaptive variable low bit rate multi-band excitation speech coder[C]//2007IEEE International Conference on Industrial Electronics and Applications (ICIEA). Piscataway, N.J: IEEE Press, 2007: 2244-2247.

        [12] 計哲. 低速率語音編碼算法研究[D]. 北京: 清華大學, 2011: 17-18. JI Zhe. Research on Low bit Rate Speech Coding Algorithm [D].Beijing: Tsinghua University, 2011:17-18.

        (編輯:魏琴芳)

        A 4 kbit/s vocoder based on hybrid MELP/CELP

        LI Qiang, SHU Qinjun,XIE Hongen, MING Yan

        (Chongqing Key Laboratory of Signal and Information Processing, Chongqing University of Posts and Telecommunications, Chongqing 400065, P.R. China)

        Taking advantages of mixed excitation linear prediction(MELP) algorithm and code excitation linear prediction(CELP) algorithm, a hybrid MELP/CELP algorithm model is proposed. At the encoder, strongly voiced frames are coded by MELP while weakly voiced frames and unvoiced frames are coded by CELP. In MELP vocoder, the phase alignment technology is adopted to deal with the synchronization issue of original speech and synthesized speech. Objective mean opinion score(MOS) test and subjective diagnostic rhythm test(DRT) on 4 kbit/s hybrid MELP vocoder results indicate that the proposed algorithm offers good performance on high frequency speech signal and the synthesized speech, which achieves high intelligibility and clarity.

        low bit rate speech coding;mixed excitation linear prediction;code excitation linear prediction;phase alignment

        10. 3979 /j. issn. 1673-825X. 2017. 02. 001

        2015-06-24

        2016-01-22 通訊作者:李 強 liqiang@cqupt.edu.cn

        國家高技術研究發(fā)展計劃(863計劃)(2012AA01A508)

        Foundation Item:The National 863 High Tech Research and Development Projects (2012AA01A508)

        TN912.3

        A

        1673-825X(2017)02-0143-06

        李 強(1968-),男,湖南人,副教授,主要研究方向為音視頻信號處理。E-mail: liqiang@cqupt.edu.cn。

        舒勤軍(1989-),男,湖北荊州人,碩士研究生,主要研究方向為語音壓縮編碼及其DSP實現。E-mail:490005369@qq.com。

        猜你喜歡
        信號
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        完形填空二則
        7個信號,警惕寶寶要感冒
        媽媽寶寶(2019年10期)2019-10-26 02:45:34
        孩子停止長個的信號
        《鐵道通信信號》訂閱單
        基于FPGA的多功能信號發(fā)生器的設計
        電子制作(2018年11期)2018-08-04 03:25:42
        基于Arduino的聯(lián)鎖信號控制接口研究
        《鐵道通信信號》訂閱單
        基于LabVIEW的力加載信號采集與PID控制
        Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
        亚洲人成人网毛片在线播放| 亚洲国产精品高清在线| 亚洲精品乱码久久久久蜜桃| 亚洲av成人无码精品电影在线| 最新四色米奇影视777在线看| yy111111少妇影院| 亚洲综合在不卡在线国产另类| 人妻无码一区二区三区| 嗯啊哦快使劲呻吟高潮视频| 久久99精品中文字幕在| 综合久久加勒比天然素人| 色翁荡熄又大又硬又粗又动态图| 精品av天堂毛片久久久| 国产女高清在线看免费观看| 国产一区二区一级黄色片| 少妇人妻综合久久中文字幕| 天天夜碰日日摸日日澡| 久久精品伊人无码二区| 精品午夜中文字幕熟女| 色综合天天综合网国产成人网| 草草久久久无码国产专区| 久久国产综合精品欧美| 国产三级精品三级在专区中文 | 免青青草免费观看视频在线| 亚洲一区二区三区四区精品| 国产一区二区三区小说| 人妻少妇av无码一区二区| 国产精品va在线观看一| 在线免费观看蜜桃视频| 亚洲av无码一区二区三区天堂古代| 99精品视频69V精品视频| 最新精品国偷自产在线| 好吊妞人成免费视频观看| 日韩av中文字幕一卡二卡| 亚洲综合精品中文字幕| 啪啪无码人妻丰满熟妇| 国产chinese在线视频| 国产精品一区二区韩国av| 热久久美女精品天天吊色| 国产久视频国内精品999| 精品日本免费观看一区二区三区|