亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于線性源濾波器的語音頻帶擴展方法研究

        2016-12-14 10:42:20林勝義肖政宏
        自動化與信息工程 2016年1期
        關(guān)鍵詞:窄帶評測頻帶

        林勝義 肖政宏

        (廣東技術(shù)師范學院計算機科學學院)

        基于線性源濾波器的語音頻帶擴展方法研究

        林勝義 肖政宏

        (廣東技術(shù)師范學院計算機科學學院)

        基于線性源濾波器模型的頻帶擴展方法,對矢量量化和隱馬爾可夫模型這兩種譜包絡(luò)重建方法進行評測對比。實驗結(jié)果表明:基于隱馬爾可夫模型方法所恢復的寬帶語音具有較低的失真度,其聽覺質(zhì)量要優(yōu)于矢量量化方法恢復的語音。

        頻帶擴展;矢量量化;隱馬爾可夫模型

        0 引言

        目前,語音通信已成為人們在網(wǎng)絡(luò)上進行信息交流的主要方式之一,語音作為數(shù)字音頻數(shù)據(jù)儲存時,其頻帶保留在5 Hz~7 kHz,此類語音信號稱為寬帶語音。然而由于傳輸帶寬和網(wǎng)絡(luò)硬件設(shè)備等原因,電信網(wǎng)絡(luò)中的語音信號以窄帶(300 Hz~3400 Hz)形式[1]進行傳輸。雖然人類語音的主要信息都集中在頻率為300Hz~3400Hz的范圍內(nèi),窄帶語音可基本滿足人們正常的對話交流。但在語音通信清晰度要求較高的場合,如藍牙車載免提電話,由于藍牙傳輸帶寬限制,窄帶語音必須轉(zhuǎn)換為寬帶(300 Hz~7500 Hz)語音,才能滿足清晰度和還原度較好的語音通信需求。這要求在不增加額外傳輸信息的條件下,將窄帶語音中所丟失的高頻信息恢復出來。因此,語音頻帶擴展技術(shù)應(yīng)運而生。

        目前常規(guī)的頻帶擴展方法大都基于線性源濾波器模型。該方法分為獨立的兩步:寬帶頻譜包絡(luò)的重建和寬帶激勵信號的產(chǎn)生。常用的頻帶擴展方法有譜平移結(jié)合矢量量化(vector quantization,VQ)和隱馬爾可夫模型(hidden Markov model,HMM),其中譜平移方法用來產(chǎn)生寬帶激勵信號,VQ或HMM方法用來重建寬帶頻譜包絡(luò)。

        本文在簡述譜平移方法產(chǎn)生寬帶激勵信號和VQ、HMM重建寬帶譜包絡(luò)原理機制的基礎(chǔ)上,實現(xiàn)基于線性源濾波器的頻帶擴展,并對VQ擴展所得的寬帶語音與HMM擴展所得的寬帶語音進行比較,以判斷哪種方法更適用于頻帶擴展技術(shù)中的譜包絡(luò)重建。

        1 線性源濾波器模型擴展方法的原理

        本文對2種譜包絡(luò)重建方法進行了仿真實驗,分別為基于線譜頻率參數(shù)(line spectral frequency,LSFs)和VQ的譜包絡(luò)重建方法,基于Mel頻率倒譜系數(shù)(Mel frequency cepstrum coefficient,MFCCs)和HMM譜包絡(luò)重建方法。本文采用的寬帶激勵信號產(chǎn)生方法為譜平移寬帶激勵產(chǎn)生法。基于線性源濾波器模型的擴展方法原理[1]如圖1所示。

        1.1 基于VQ的寬帶譜包絡(luò)重建

        VQ的寬帶譜包絡(luò)重建流程:1)將窄帶語音和寬帶語音的特征矢量LSFs綁定進行訓練,建立一個包含窄帶和寬帶譜信息的碼本;2)計算每個輸入的窄帶語音幀的譜包絡(luò)特征矢量LSFs,并將其與碼本中的窄帶譜信息進行匹配,找出窄帶部分的最佳碼字;3)利用該碼字的索引找到相對應(yīng)的寬帶譜包絡(luò)信息特征矢量,即找出最佳的寬帶LSFs碼字,進而恢復重建寬帶語音的頻譜包絡(luò)。基于LSFs和VQ的寬帶譜包絡(luò)重建原理如圖2所示。

        VQ方法具有運算復雜度低且易于實現(xiàn)等優(yōu)點。但該方法在進行碼本訓練時沒有考慮語音信號各頻帶成分之間的統(tǒng)計相關(guān)性,因此無法實現(xiàn)最優(yōu)搜索和分類;并且無法較好地反映語音信號各幀在時間上的動態(tài)變化特性,忽略了信號幀間特征矢量和譜包絡(luò)的連續(xù)性,因此恢復后的寬帶語音信號頻譜存在跳變現(xiàn)象。

        圖1 基于線性源濾波器模型頻帶擴展方法的原理示意圖

        圖2 基于LSFs和VQ的寬帶譜包絡(luò)重建原理示意圖

        1.2 基于HMM的寬帶譜包絡(luò)重建

        基于HMM的寬譜包絡(luò)估計重建方法原理[2-4]如圖3所示。將窄帶語音的特征矢量MFCCs和寬帶語音的線性倒譜系數(shù)(cepstral coefficients,CCs)綁定進行訓練,假設(shè)HMM的狀態(tài)矢量為Si(i=1,2,…,Ns;Ns為HMM的狀態(tài)數(shù)),每一種狀態(tài)對應(yīng)一類語音信號,每種狀態(tài)只取決于該類寬帶語音的譜包絡(luò)信息yeb(代表譜包絡(luò)信息特征矢量CCs)。由于HMM的狀態(tài)數(shù)有限,因此利用VQ中聚類的思想,譜包絡(luò)信息yeb經(jīng)過VQ后確定HMM的狀態(tài)數(shù)(即聚類的個數(shù)為HMM的狀態(tài)數(shù)),最后將HMM中的每個狀態(tài)Si與寬帶譜包絡(luò)yeb訓練所得的矢量碼本C={y1,y2,…,yN}中的某個碼字矢量yi(i為狀態(tài)序號,i=1,2,…,Ns)一一對應(yīng)起來。

        在實際應(yīng)用中,由于僅知道窄帶語音特征矢量x(即MFCCs),因此首先利用窄帶特征矢量x來計算其HMM的狀態(tài)概率,估計當前的窄帶語音幀屬于哪一種HMM狀態(tài),即計算已知特征矢量x的條件下HMM狀態(tài)為Si的條件后驗概率p(Si|x),再結(jié)合貝葉斯條件參數(shù)估計方法和最小均方差準則(minimum mean squared error,MMSE)估計當前窄帶語音幀所對應(yīng)的寬帶譜包絡(luò)yeb。關(guān)于寬帶譜包絡(luò)yeb的MMSE計算式推導以及具體的貝葉斯條件參數(shù)估計法的求解過程請參考文獻[2]和文獻[5]。

        圖3 HMM寬帝語音譜包絡(luò)重建原理圖

        HMM方法通過計算窄帶特征矢量和寬帶譜包絡(luò)之間的聯(lián)合概率密度函數(shù),再結(jié)合HMM的狀態(tài)轉(zhuǎn)移函數(shù)來擬合語音幀間的時間前后相關(guān)性并計算相應(yīng)的狀態(tài)后驗概率,最后通過MMSE準則計算選取對應(yīng)狀態(tài)的譜包絡(luò)作為輸出。HMM方法采用統(tǒng)計方式和MMSE準則估計譜包絡(luò)時,計算量較大,不適用于實時通信系統(tǒng)中。但是隨著現(xiàn)代集成電路運算能力和存儲能力的快速提升,已出現(xiàn)一系列適用于復雜運算的芯片,為HMM方法的實際應(yīng)用提供了硬件基礎(chǔ)。

        1.3 譜平移產(chǎn)生寬帶激勵信號

        譜平移對窄帶激勵信號進行復制并將其副本“搬移”到高頻帶中,形成的高頻帶激勵信號再與原來的窄帶激勵信號合并即可形成完整的寬帶激勵信號。譜平移通常采用時域調(diào)制方法實現(xiàn),即將窄帶激勵信號乘以一個頻率為?M(通常為3400 Hz)的余弦信號。由于窄帶激勵信號與調(diào)制信號相乘后會在原窄帶激勵所在的頻域上產(chǎn)生一個鏡像,因此需要將調(diào)制后的激勵信號進行高通濾波,保留其高頻帶的激勵信號,隨后與延時(調(diào)制后的激勵信號進行高通濾波會存在計算延時)的窄帶激勵信號unb(k)相加即可得到完整的激勵信號其原理如圖4所示。

        圖4 譜平移原理圖

        綜上所述,寬帶譜包絡(luò)信息重建的方法有VQ和HMM 2種,為判定哪種譜包絡(luò)重建的方法能更好地恢復寬帶語音,本文采用線性源濾波器模型設(shè)計VQ和HMM的對比評測實驗。

        2 實驗設(shè)計和結(jié)果

        2.1 實驗設(shè)計

        本文采用Matlab 7.12作為實驗平臺,實驗所用的寬帶語音庫為卡內(nèi)基梅隆大學專用于語音合成實驗的CMU ARCTIC數(shù)據(jù)庫[6],ARCTIC語料庫主要包含4組采樣頻率為16kHz的錄音(2名男性BDL和RMS,2名女性CLB和SLT)。實驗選取SLT100句英文短句作為訓練語音樣本,選取SLT另外10句英文短句作為測試語音樣本,取10句測試語音的語音評測數(shù)值的均值作為最終評測指標。

        矢量量化中的窄帶LSFs維數(shù)為13,Mel濾波器組個數(shù)[7-8]為15,即HMM的窄帶特征矢量為15維的MFCCs。高頻帶CCs設(shè)定為13維矢量,相應(yīng)的HMM

        狀態(tài)數(shù)為13。VQ碼本和HMM的訓練均采用LBG算法,碼書大小為500個碼字。

        為測試VQ和HMM方法的性能,實驗對2種方法擴展所得的寬帶語音進行語譜圖的比較分析、倒譜距離測度(cepstral distance measure,CDM)的評測和感知語音質(zhì)量評估值(perceptual evaluation of speech quality,PESQ)的評測。

        2.2 實驗結(jié)果

        2.2.1 語譜圖

        圖5分別為CMU ARCTIC中某一女聲短句的寬帶語音語譜圖(采樣頻率16 kHz)、HMM擴展語音語譜圖和VQ擴展語音語譜圖。

        圖5 寬帶語音和2種擴展語音的語譜圖

        語譜圖中顏色較深的紋理部分表示該語音在時間和頻譜中的能量分布,色調(diào)越深表示能量越高。對上述3幅語譜圖及所畫的橢圓形區(qū)域?qū)Ρ确治隹傻茫篐MM擴展恢復的寬帶語音中高頻帶能量與原寬帶語音較為接近,HMM擴展語音接近原寬帶語音的音質(zhì);VQ擴展恢復的寬帶語音中高頻帶能量分布過密,表明VQ擴展語音的高頻成分能量較高,語音中存在人耳可聞的雜音。

        2.2.2CDM測度值

        為評測頻帶擴展方法所造成的語音失真度,實驗依據(jù)文獻[10]的CDM計算方法,計算VQ和HMM方法恢復10句寬帶語音的CDM平均值,評測所得結(jié)果繪制為柱狀圖,如圖6所示。

        由圖6可看出:HMM擴展語音的CDM測度值比VQ擴展語音的CDM測度值少1 dB左右,可以判定HMM擴展語音的失真度明顯小于VQ擴展語音。

        圖6 寬帶語音與頻帶擴展語音的CDM測度柱狀圖

        2.2.3PESQ值

        為客觀評價2種頻帶擴展語音的音效質(zhì)量,依據(jù)文獻[11]中PESQ的計算方法,計算2種方法恢復10句寬帶語音的PESQ平均值,評測所得數(shù)值轉(zhuǎn)化為柱狀圖,如圖7所示。

        圖7 寬帶語音與頻帶擴展語音的PESQ評測柱狀圖

        由圖7的結(jié)果可知,HMM擴展語音的客觀評測值高于VQ擴展語音,并且由于VQ擴展語音中引入了人造雜音,導致了語音評測值低于未擴展前的窄帶語音,由此可進一步肯定,采用HMM作為譜包絡(luò)重建方法將有利于頻帶擴展語音的聽覺質(zhì)量并降低頻帶擴展語音的失真度。

        3 結(jié)語

        以線性源濾波器為模型的頻帶擴展方法是應(yīng)用較廣泛的語音頻帶擴展解決方案。寬帶譜包絡(luò)的重建和寬帶激勵信號的恢復產(chǎn)生是該技術(shù)方案中的兩大核心內(nèi)容。本文實現(xiàn)了基于線性源濾波器模型的語音頻帶擴展方法,在此基礎(chǔ)上對矢量量化和隱馬爾可夫模型所恢復的寬帶語音進行評測對比,選出適用于實際頻帶擴展應(yīng)用的譜包絡(luò)重建方法。實驗結(jié)果表明,隱馬爾可夫模型方法所重建的寬帶語音失真度小并且聲音質(zhì)量評測數(shù)值高于矢量量化方法所重建的寬帶語音。因此,隱馬爾可夫模型方法優(yōu)于矢量量化方法,基于隱馬爾可夫模型的頻帶擴展方法可廣泛應(yīng)用于網(wǎng)絡(luò)電話以及語音編解碼系統(tǒng)的接收端,進一步提高電信網(wǎng)中的語音通信質(zhì)量。

        [1]竇庚欣,鮑長春.一種基于矢量量化的語音信號頻帶擴展方法[C]//第十二屆全國信號處理學術(shù)年會(CCSP-2005).蘇州:信號處理,2005,21(z1).

        [2]張勇,劉軼.窄帶語音帶寬擴展算法研究[J].聲學學報,2014, 39(6):764-773.

        [3]張麗燕,鮑長春,劉鑫,等.基于非線性音頻特征分類的頻帶擴展方法[J].通信學報,2013,34(8):120-130,139.

        [4]Jax P,Vary P.On artificial bandwidth extension of telephone speech[J].SignalProcessing,2003,83(8):1707-1719.

        [5]Nels Rohde,Svend Aage Vedstesen.Artificial bandwidth extensionofnarrowbandSpeech[D].Aalborg:Aalborg University,2007.

        [6]Kominek J,Black A W.The CMU Arctic speech databases[J]. ProcofIscaSpeechSynthesisWorkshop,2004, 99(4):223--224.

        [7]Liu X,Bao C C.Audio bandwidth extension based on temporal smoothing cepstral coefficients[J].Eurasip Journal on Audio Speech&MusicProcessing,2014,2014(1):1-16.

        [8]劉鑫,鮑長春.基于耳蝸濾波器倒譜參數(shù)的音頻頻帶擴展方法[J].清華大學學報:自然科學版,2013,53(6):913-916.

        [9]何勇軍,韓紀慶.一種語音頻帶擴展的方法及其改進[C].烏魯木齊:第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集,2009:40-41.

        [10]Kitawaki N,Nagabuchi H,Itoh K.Objective quality evaluation for low-bit-rate speech coding systems[J].IEEE Journal on Selected Areas in Communications,1988,6(2): 242-248.

        [11]ITU-T.ITU-T Recommendation P.862,Perceptual evaluation of speech quality(PESQ),an objective method for end-to-end speech quality assessment of narrowband telephone networks and speech codecs[S].Geneva:ITU-TP.862 Recommendation, 2001.

        The Approach of Speech Bandwidth Expansion Based on Linear Source-Filter

        Lin ShengyiXiao Zhenghong
        (School of Computer Science,Guangdong Polytechnic Normal University)

        The wideband speech will become narrowband speech and have worse acoustic quality after transmitted through the communication networks.The bandwidth expansion is an effective way to recover the wideband speech from the narrowband speech.With the linear source-filter based bandwidth expansion implemented in this paper,authors make a comparison between Vector Quantization and Hidden Markov Model.The experiment results show that the wideband speech recovered by the Hidden Markov Model has less audio distortion and higher acoustic quality than the one recovered by Vector Quantization.

        Bandwidth Expansion;Vector Quantization;Hidden Markov Model

        林勝義,男,1990年生,在讀研究生,主要研究方向:模式識別、智能系統(tǒng)。E-mail:791306016@qq.com

        肖政宏(通信作者),男,1965年生,教授,主要研究方向:模式識別、智能系統(tǒng)。E-mail:huasxzh@126.com

        猜你喜歡
        窄帶評測頻帶
        次時代主機微軟XSX全方位評測(下)
        次時代主機微軟XSX全方位評測(上)
        Wi-Fi網(wǎng)絡(luò)中5G和2.4G是什么?有何區(qū)別?
        單音及部分頻帶干擾下DSSS系統(tǒng)性能分析
        熱軋窄帶鋼Q345B微合金化生產(chǎn)實踐
        山東冶金(2019年1期)2019-03-30 01:34:54
        攻坡新利器,TOKEN VENTOUS評測
        雙頻帶隔板極化器
        電子測試(2017年15期)2017-12-18 07:18:51
        Canyon Ultimate CF SLX 8.0 DI2評測
        中國自行車(2017年1期)2017-04-16 02:54:06
        無線通信中頻線路窄帶臨界調(diào)試法及其應(yīng)用
        電子制作(2017年19期)2017-02-02 07:08:38
        調(diào)諧放大器通頻帶的計算及應(yīng)用
        亚洲人成网站18男男| 日日噜噜噜夜夜爽爽狠狠| 国产在线手机视频| 日本啪啪一区二区三区| 男女做羞羞事的视频网站| 一边做一边喷17p亚洲乱妇50p| 亚洲男人第一av网站| 国产福利小视频91| 日本va中文字幕亚洲久伊人| 99久久免费只有精品国产| 久久精品亚洲乱码伦伦中文| 高跟丝袜一区二区三区| 日本a爱视频二区三区| 制服丝袜中文字幕在线| 杨幂AV污网站在线一区二区| 国产精品国产三级国产三不| 日本一区二区三区光视频| 任我爽精品视频在线播放| 69av视频在线观看| 久久蜜臀av一区三区| 亚洲av片无码久久五月| 男人添女人下部高潮全视频| 精品国产亚洲一区二区三区演员表 | 91九色精品日韩内射无| 久久精品成人一区二区三区| 麻豆高清免费国产一区| 精品国免费一区二区三区| 人妻有码av中文幕久久| 国产无遮挡又爽又刺激的视频老师| 福利网址在线观看| 国产精品亚洲av无人区二区| 国产狂喷水潮免费网站www| 依依成人精品视频在线观看| 日本岛国精品中文字幕| 国产高潮流白浆视频在线观看 | 成人免费在线亚洲视频| 白天躁晚上躁麻豆视频| 久久99热精品免费观看欧美| 久久精品亚洲一区二区三区画质| 国产二区交换配乱婬| 国产在视频线精品视频www666|