亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進的混合激勵線性預測編碼算法

        2015-07-23 06:09:40朱宗明姜占才
        新型工業(yè)化 2015年9期
        關(guān)鍵詞:編碼方案碼本子帶

        朱宗明,姜占才

        改進的混合激勵線性預測編碼算法

        朱宗明1,姜占才2

        (1.中國人民解放軍69220部隊,阿克蘇 843000;2.青海師范大學物理系,西寧 810008 )

        針對混合激勵線性預測編碼中子帶聲音強度的硬判決導致激勵源欠精細問題,將子帶聲音強度視為5維的模糊特征矢量,用改進的LBG算法設(shè)計碼本并用5bit對其作矢量量化;以精細量化的子帶聲音強度調(diào)制帶通濾波器,以此獲取精細的混合激勵信號,最終達到改善合成語音質(zhì)量的目標。仿真實驗表明:改進算法能有效地改善合成語音的自然度。

        低速率語音編碼;混合激勵;子帶聲音強度;矢量量化;碼本

        0 引言

        語音編碼是語音通信的核心技術(shù),其中低速率編碼廣泛應(yīng)用于移動通信、衛(wèi)星通信、軍事保密通信、多媒體存儲和數(shù)字數(shù)據(jù)網(wǎng)(DDN)中。語音編碼的目的是用盡可能低的比特率獲得盡可能高的合成語音質(zhì)量,其意義是去除語音信號中的冗余,降低傳輸比特率或存儲空間[1]。低速率語音編碼分為3類,即參數(shù)編碼、波形編碼和混合編碼,其中混合編碼兼有參數(shù)編碼和波形編碼的優(yōu)勢,混合激勵線性預測編碼(M ixed excitation Linear p rediction,M ELP)[2-4]是混合編碼的一種經(jīng)典編碼方案。

        MELP以線性預測編碼(Linear predictive coding,LPC)的參數(shù)模型為編碼的整體框架,將語音幀的線性預測系數(shù)即聲道模型參數(shù)轉(zhuǎn)換為線譜對參數(shù)(LSF)后,用25bit矢量量化(Vector quantization,VQ)后編碼、傳輸。為了克服LPC方案激勵源信息描述過于簡單、不準確的缺陷,將二元激勵改為混合激勵來獲取更加準確的激勵源信息,以混合激勵信號激勵合成濾波器,明顯提高了合成語音質(zhì)量。

        MELP編碼方案并非完美,仍在不斷的改進中[5]。在進一步降低比特率方面,文獻[6]從降低邊帶信息編碼比特入手,將深度學習理論引入?yún)?shù)編碼,嘗試將LSF參數(shù)的傳統(tǒng)矢量量化法改為利用深度自編碼機直接對語音幅度譜進行編碼的新方法,結(jié)論是在不降低合成語音質(zhì)量的前提下,進一步降低了編碼速率。

        MELP編碼方案將語音幀劃分為寬度不等的5個子帶,分別提取各子帶的聲音強度,稱為子帶聲音強度或帶通聲音強度,記為iVˉ,其中i=1,2,3,4,5,表示各子帶序號,然后將其4bit量化、編碼、傳輸。對子帶聲音強度的量化結(jié)果為非0即1,優(yōu)點是對運算帶來方便、不增加內(nèi)存空間,欠缺是對各子帶的清/濁音仍然執(zhí)行硬判決。

        無論是一幀語音還是一個子帶,對其的清/濁音分類采用硬判決都不能準確地描述語音的激勵源信息。文獻[7]對語音生成模型的激勵源提出了模糊激勵的概念—濁音隸屬度,它是一個5維矢量,其每一分量Vi都是介于0和1之間的數(shù),是一個模糊量。本文將MELP編碼方案中的子帶聲音強度清/濁音硬判決改為模糊判決,以模糊量濁音隸屬度調(diào)制5通帶帶通濾波器,以此獲得較精細的混合激勵源,最終獲得較高的合成語音質(zhì)量,而又不增加運算開銷。

        1 子帶聲音強度矢量的提取

        用5個6階的Butterw orth帶通濾波器將輸入語音幀分為(0-500)Hz、(500-1000)Hz、(1000-2000)Hz、(2000-3000)Hz、(3000-4000)Hz的5個子帶;提取某個能夠反映子帶隸屬于濁音程度的歸一化特征量V,獲得當前幀的子帶聲音強度[7],表示為:

        2 子帶聲音強度的精細量化

        2.1VQ及LBG算法碼本設(shè)計

        VQ是一種高效的數(shù)據(jù)編碼壓縮技術(shù),而碼本的設(shè)計是VQ的關(guān)鍵環(huán)節(jié)。碼本設(shè)計的本質(zhì)是以系統(tǒng)的失真函數(shù)最小作為目標,尋求將所有的訓練矢量劃分為N類的最佳方案,各類的質(zhì)心就是碼本的碼字。

        碼本設(shè)計的基本方法是LBG算法,實際上是尋求最佳碼本的必要條件的反復迭代過程,即由初始碼本開始,使之逐步優(yōu)化,直到系統(tǒng)性能滿足要求或不再有明顯的改進為止。基本的LBG算法過程如下:

        (1)已知碼本尺寸N,給定設(shè)計的失真門限ε(0<ε<1),給定一個初始碼本yN(0)。已知一個訓練樣本集[Xj,j=0,1,???,m ?1]。先取n=0(n是迭代次數(shù)),設(shè)初始平均失真D(?1)→∞;

        (2)用給定的碼本yN求出平均失真最小條件下的所有區(qū)域邊界Si(i=1,2,…,N),即根據(jù)最佳劃分準則把訓練樣本集劃分為N個胞腔,應(yīng)使訓練樣本集的樣本Xj∈Si滿足條件d(Xj,Yi)<d(Xj,Y) (Y∈y ),由此得出最佳的區(qū)域邊界S(n )。計算該區(qū)域邊界下(一次迭代后)參與訓練的訓練樣本的平均失真

        (3)計算與前一次迭代的相對平均失真,判斷是否滿足閾值門限條件

        滿足上式即為滿足設(shè)計要求,此時的yN就是設(shè)計的碼本;如果不滿足,進行下一步;

        (4)用各胞腔的質(zhì)心置換各初始碼字,構(gòu)成(n=1)次迭代的新碼本,重復前兩步,直至滿足閾值門限為止。

        2.2LBG算法的改進

        LBG算法設(shè)計碼本的過程是一個非凸優(yōu)化問題,設(shè)計過程中有陷入局部最優(yōu)的可能;若想通過群舉碼本的全部可能來尋找全局最優(yōu)碼本,在現(xiàn)有計算能力下幾乎不可能實現(xiàn)。MELP中LSF參數(shù)VQ的碼本采用LBG算法,所獲得的碼本為局部最優(yōu)或接近全局最優(yōu),存在初始碼本的選擇影響碼本訓練收斂速度和最終碼本性能的缺陷。

        子帶聲音強度作為5通帶帶通濾波器的調(diào)制信號,是獲得精準混合激勵信號的關(guān)鍵技術(shù),直接決定合成語音的質(zhì)量,對其應(yīng)當用VQ技術(shù)作精細量化。為了克服LBG算法的缺陷,對其作如下改進:

        (1)初始碼本的選取:用模糊聚類代替?zhèn)鹘y(tǒng)的隨機選取法,將聚類中心數(shù)設(shè)為碼本尺寸N,在一定規(guī)模的訓練樣本集上作模糊C均值聚類,聚類的結(jié)果即為各類的中心,將其作為LBG訓練的初始碼本[8]。該法選取初始碼本有效地避免了隨機性和偶然性;聚類結(jié)果既是陷入局部最優(yōu),對后續(xù)LBG算法趨于全局最優(yōu)的單調(diào)性幾乎沒有影響;聚類結(jié)果非常接近設(shè)計目標。

        (2)在LBG的迭代過程中,每次迭代后都檢測、處理空胞腔:碼本尺寸是預先確定的,胞腔的數(shù)目即為碼本尺寸,這就難免每次迭代后劃分到某些胞腔的輸入矢量較少,這樣的胞腔稱之為空胞腔。顯然,空胞腔的認定與設(shè)計碼本的尺寸和訓練樣本集的規(guī)模有關(guān):碼本尺寸越小、樣本集規(guī)模越大,自然進入每個胞腔的輸入矢量就多,反之,碼本尺寸越大、樣本集規(guī)模越小,形成的空胞腔數(shù)就越多。定義胞腔尺寸CZ:平均進入胞腔的輸入矢量的最小值,取CZ=200。這一定義對設(shè)計尺寸確定的碼本,對訓練樣本集的規(guī)模提出了下限。定義空胞腔下限δ:是胞腔尺寸CZ的百分比,設(shè)為δ=10%CZ。定義空胞腔:進入胞腔的矢量數(shù)小于δ的胞腔??瞻槐仨毺蕹?,方法是:測定空胞腔下限δ并存儲;每次迭代后檢驗中間碼本中的空胞腔數(shù);檢測同等數(shù)目的大胞腔數(shù);刪除所有的空胞腔,同時將每個大胞腔分裂為兩個胞腔;用處理后的結(jié)果替換當前的中間碼本,進入判斷和下一迭代過程。

        2.3子帶聲音強度碼本訓練

        建立碼本訓練樣本集:分別以31分鐘、26分鐘和24分鐘長度的三段連續(xù)語音的錄音為語音樣本,經(jīng)8kHz采樣、8bit量化、轉(zhuǎn)換為碼率為64kb/s的線性PCM碼后保存;以幀長22.5ms分幀,提取各幀的子帶聲音強度矢量[7],建立三個訓練樣本集YB1、YB2和YB3。最小的樣本集YB3的規(guī)模是64000×5維,對設(shè)計尺寸為128×5的碼本,平均胞腔尺寸CZ為500,顯然大于最小值200的要求。

        將植入空胞腔剔除算法的LBG算法級聯(lián)到模糊C均值聚類算法之后構(gòu)成改進的LBG算法(ALBG)。

        3 精細混合激勵信號的獲取

        獲取精細混合激勵信號的實質(zhì)是對子帶聲音強度矢量的精細量化,即將MELP編碼方案中對各子帶聲音強度非0即1的硬判決改為即非0也非1、而是介于0和1之間的模糊量的軟判決。量化的精確度除跟量化字長有關(guān)外,還與量化碼本的性能有關(guān)。當量化字長一定時,碼本的性能決定于訓練樣本集和訓練算法;量化的失真測度在VQ碼本訓練算法中已選取,本課題選擇歐氏距離失真測度;由于子帶聲音強度碼本尺寸(64或32)較小,采用最基本的全局搜索法即可滿足搜索速度要求;精細混合激勵信號的獲取過程如圖1所示。

        圖1 精細混合激勵信號獲取流程  Fig.1 Acquisition process of accurate mixed excitation signa l 

        4 算法仿真實驗

        4.1實驗方案

        ①改進的LBG碼本訓練算法(ALBG)仿真實驗;

        ②MELP編碼方案的改進算法(AMELP)仿真實驗。

        4.2實驗材料(實驗用語音樣本)

        實驗用語音取自筆者建立的語音庫yyk2.w av,庫中語音為8kHz采樣、8bit量化、線性PCM編碼的數(shù)字語音。實驗時從語音庫隨機抽取語音段,也可加入高斯白噪聲后形成含噪語音即語音的噪聲觀測。幀長和幀移都為180點(22.5ms),幀間無重疊。

        4.3實驗系統(tǒng)(程序)

        分別對改進的LBG算法和MELP改進編碼算法編程,以文件名ALBG.m和AM ELP.m存盤;在PC機上仿真實驗。

        4.4實驗結(jié)果及其分析

        4.4.1ALBG算法仿真實驗

        設(shè)置初始誤差是一萬級的隨機數(shù),目標誤差(設(shè)計精度)ε=0.001;分別訓練尺寸為256、128、64、32的4個子帶聲音強度碼本,并且對同一碼本依次調(diào)用YB1、YB2 和YB3三個訓練樣本集訓練;在23次(至少需要12次)的仿真實驗過程中,都無一例外的顯示目標函數(shù)平滑單調(diào)地達到全局最優(yōu),迭代次數(shù)少,收斂速度快。圖2是用YB1訓練碼本Vˉ(128)過程中目標函數(shù)變化過程圖。

        4.4.2AMELP仿真實驗

        (1)碼本尺寸選擇實驗。理論上碼本尺寸越大,量化精度越高,但會增加編碼比特開銷使比特率增大;當碼本尺寸增大到一定值時,再增大實際上對量化精度的貢獻甚微,因此,碼本尺寸(量化字長)的選擇應(yīng)在提高量化精度和控制碼率之間通過實驗作出折中。

        將用ALBG算法訓練得到的4個子帶聲音強度碼本依次置換MELP 編碼方案中子帶聲音強度的量化,得到基于子帶聲音強度碼本和量化的4 個AMELP軟件聲碼器,在同一輸入語音下,依次收聽合成語音,從可懂度和自然度兩個方面比較合成語音質(zhì)量。實驗結(jié)果表明:當量化字長超過5bit時,對提高合成語音質(zhì)量的貢獻已經(jīng)不明顯。為此,選取子帶聲音強度碼本的尺寸為32×5,即量化字長為5bit。

        圖2 碼本訓練目標函數(shù)變化過程  Fig.2 Objective function change process of codebook training

        圖3 精細混合激勵信號  Fig.3 Accurate mixed excitation signal

        (2)AMELP合成語音質(zhì)量實驗。將同一實驗語音樣本,分別作為MELP編碼方案和AMELP編碼方案的輸入語音,分別得到兩種編碼方案的合成語音,如圖4所示,試聽者的平均意見為:兩者的可懂度相同,但后者的自然度較前者稍優(yōu)。

        (3)AMELP對背景噪聲的頑健性實驗。分別在信號與背景噪聲的信噪比(SNR)為26dB、20dB、16dB三種情形下作仿真實驗,其中16dB時的實驗結(jié)果如圖5所示。實驗結(jié)果表明:AMELP和MELP對背景噪聲的頑健性是相同的。

        圖4 兩種編碼方案合成語音Fig.4 Synthetic speech of two coding program

        圖5 16dB時兩種編碼方案的合成語音  Fig.5 Synthetic speech of two coding program on 16dB 

        5 結(jié)論

        用改進的LBG算法(ALBG:用模糊C均值聚類算法選擇初始碼本;每次迭代后及時剔除空胞腔)設(shè)計、訓練5維的子帶聲音強度碼本,將其用于MELP編碼方案中子帶聲音強度的矢量量化,得到MELP的改進算法AMELP。仿真實驗表明:ALBG算法有效地克服了經(jīng)典LBG算法的兩個缺陷,目標函數(shù)快速、平滑、單調(diào)地趨近全局最優(yōu),訓練得到的碼本量化性能好;AM ELP方案將M ELP方案中子帶聲音強度精細量化,從而獲得精準的混合激勵信號,最終達到了提高合成語音質(zhì)量(自然度)的目標。

        [1] 張雄偉,陳亮,楊吉斌.現(xiàn)代語音處理技術(shù)及應(yīng)用[M].北京:機械工業(yè)出版社,2003:112-172. Zhang Xiongwei,Chen liang,Yang Jibin.Modern speech processing technique and application[M].Beijing:China Machine Press,2003:112-172.

        [2] Department of defense telecommunication systems standard. Mil-std-3005,Analog-to-Digital conversin of voice by 2.4kbps mixed excitation linear predication(MELP)[S].Washington,USA:Final Committee Draft,1995.

        [3] Gray R M.Vector quantization[J].IEEE ASSP Magazine,1984,4:4-29.

        [4] A lan V.McCree,Thomas P.Barnwell III.A Mixed Excitation LPC Vocoder[C]. ICASSP,1991,593-596.

        [5] 鮑長春.數(shù)字語音編碼原理[M].西安:西安電子科技大學出版社,2007,296-315. BAO Chang-chun. Princip le of digital speech coding[M].Xi’an:Xidian University Press,2007,296-315.

        [6] 張雄偉,吳海佳,張梁梁,等.一種基于重構(gòu)性深度網(wǎng)絡(luò)的MELP語音編碼改進算法[J].數(shù) 據(jù) 采集與處理,2015,30(2):307-314. ZHANG Xiong-wei,WU Hai-jia,ZHANG Liang-liang,et al. Improved MELP Algorithm Based on Reconstructive Deep Neural Network[J].Data Acquisition and Processing,2015,30(2):307-314.

        [7] 姜占才,楊林.語音模糊特征提取及碼本訓練算法[J].吉林大學學報(信息科學版),2012,30(3):279-283.JIANG Zhan-cai,YANG Lin.Algorithm of Voice Fuzzy Feature Extraction and Codebook Training[J]. Journal of Jilin University(Information Science),2012,30(3):279-283.

        [8] 姜占才,孫燕,姚剛.模糊聚類與LBG級聯(lián)的VQ算法[J].計算機工程與科學,2011,33(5):155-158. JIANG Zhan-cai,SUN Yan,YAO Gang.VQ A lgorithm of Fuzzy Clustering and LBG Cascade[J]. Computer Engineering and Science,2011,33(5):155-158.

        Improved Algorithm for Mixed Excitation Linear Prediction Coding

        ZHU Zong-m ing1, JIANG Zhan-cai2
        (1.The Chinese people’s liberation army 69220 troops, Akzo 843000,China; 2.Physics Department of Qinghai Normal University, Xining 810008,China)

        As modulating signal of five passband band-pass filter, subband voiced intensity vector which determ ines the quality of synthetic speech directly, is the key to acquire accurate m ixed excitation signal. In the scheme of m ixed excitation linear prediction coding (MELP), for the defects of excitation source which lacks accurate caused by hard decision that subband sound intensity is either 0 or 1, subband voiced intensity is seen as 5-dimension obscure eigenvector; subband voiced intensity codebook is designed using modified LBG algorithm and subband voiced intensity is quantized using 5-bit vector; five passband band-pass filter is modulated using accurate and quantized subband voiced intensity, thus acquiring accurate m ixed excitation signal; finally the quality of synthetic speech is improved. Simulation experiments show that modified algorithm not only can improve the naturalness of synthetic speech, but also has stronger robustness for background noise.

        Low rate speech coding; M ixed excitation; Subband voiced intensity; Vector quantization; Codebook

        10.3969/j.issn.2095-6649.2015.09.002

        ZHU Zong-m ing, JIANG Zhan-cai. Improved A lgorithm for M ixed Excitation Linear Prediction Coding[J]. The Journal of New Industrialization, 2015, 5(9): 8-13.

        國家社科基金(15XYY 026)。

        朱宗明(1985-),男,助理工程師,從事軍事通信和軍械保障方面的研究。

        姜占才(1958-),男,教授,主要從事通信語音處理與保密通信方面的研究。

        本文引用格式:朱宗明,姜占才.改進的混合激勵線性預測編碼算法[J]. 新型工業(yè)化,2015,5(9):8-13

        猜你喜歡
        編碼方案碼本子帶
        Galois 環(huán)上漸近最優(yōu)碼本的構(gòu)造
        免調(diào)度NOMA系統(tǒng)中擴頻碼優(yōu)化設(shè)計
        一種基于奇偶判斷WPT的多音干擾抑制方法*
        基于功能類別和技術(shù)參數(shù)的刀具編碼方案設(shè)計
        基于有限域上仿射空間構(gòu)造新碼本
        基于唯一標識的ATP車載設(shè)備編碼方案研究
        子帶編碼在圖像壓縮編碼中的應(yīng)用
        電子制作(2019年22期)2020-01-14 03:16:24
        基于改進粒子群算法的毫米波大規(guī)模MIMO混合預編碼方案
        幾類近似達到Welch界碼本的構(gòu)造
        基于虛擬孔徑擴展的子帶信息融合寬帶DOA估計
        日韩美女av一区二区| 在线播放真实国产乱子伦| 内射夜晚在线观看| 人妻少妇乱子伦精品无码专区电影| 国产成人无码a区在线观看视频 | 亚洲熟少妇一区二区三区| 人妻少妇69久久中文字幕| 一个人看的www片免费高清视频| 无码人妻丰满熟妇啪啪网站| 国产在视频线精品视频| 欧美亚洲国产日韩一区二区三区| 亚洲AⅤ男人的天堂在线观看| 亚洲一区二区三区免费av| 国产一区二区三区不卡在线观看| 亚洲综合色婷婷七月丁香| 夜色阁亚洲一区二区三区 | 性夜夜春夜夜爽aa片a| 精品理论一区二区三区| 国产精品女同一区二区免| 精品国产a一区二区三区v| 中文无码日韩欧| 亚洲视频1区| 日韩av一区二区在线观看| 精品人妻av一区二区三区麻豆| 少妇人妻精品一区二区三区| 精品88久久久久88久久久| 日韩AV无码一区二区三不卡| 自拍情爱视频在线观看| 免费a级毛片在线播放不收费| 午夜福利电影| 国产成人精品麻豆| 日韩在线视频专区九区| 久久天天躁夜夜躁狠狠| 久久精品国产亚洲av高清色欲| 麻豆av一区二区天堂| 精品国内日本一区二区| 影音先锋男人站| 乱码一二区在线亚洲| 日本一区二区在线看看| 国产人妻鲁鲁一区二区| 色狠狠一区二区三区香蕉|