亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新型拉普拉斯模型因子估計(jì)語(yǔ)音增強(qiáng)算法

        2010-04-12 00:00:00v
        現(xiàn)代電子技術(shù) 2010年21期

        摘 要:針對(duì)拉普拉斯先驗(yàn)?zāi)P拖碌恼Z(yǔ)音增強(qiáng)問(wèn)題,給出了一種模型因子估計(jì)算法,它利用語(yǔ)音分量方差與模型因子的對(duì)應(yīng)關(guān)系來(lái)獲取模型因子的估計(jì);在語(yǔ)音分量方差的估計(jì)過(guò)程中,通過(guò)利用帶噪語(yǔ)音分量與先前幀語(yǔ)音方差計(jì)算當(dāng)前幀語(yǔ)音分量方差,提出一種新的語(yǔ)音分量方差估計(jì)算法。通過(guò)結(jié)合這兩種新算法獲得的拉普拉斯模型因子估計(jì)能夠有效消除噪聲分量能量對(duì)估計(jì)精度的影響,且提高系統(tǒng)的語(yǔ)音增強(qiáng)性能。多種噪聲背景下的仿真結(jié)果表明,基于該模型因子估計(jì)方案的方法的語(yǔ)音增強(qiáng)算法具有更好的增強(qiáng)效果。關(guān)鍵詞:語(yǔ)音增強(qiáng); 語(yǔ)音分量估計(jì); 離散余弦變換; 拉普拉斯模型; 因子估計(jì)

        中圖分類號(hào):TN912.3文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1004-373X(2010)21-0100-04

        Novel Algorithm of Laplacian Model Factor Estimation for Speech Enhancement

        HUANG Wei1, OU Shi-feng2

        (1. Institute of Humanities and Economics, Yantai University, Yantai 264005, China;

        2. Institute of Optoelectronic Information, Yantai University, Yantai 264005, China)

        Abstract: An algorithm of Laplacian factor estimation is proposed for solving the problem of speech enhancement using Laplacian apriori model. The estimation of Laplacian model factor is attained by the relation between the variance of clean speech components and the model factor. As for the estimation for speech component variance, a new adaptive algorithm that makes use of the noisy speech components and clean speech variance in previous frame is put forward to compute the current frame′s speech variance. In combination with the mentioned two approaches, the estimated Laplacian factor can effectively eliminate the effect of noise components energy on the estimation accuracy. The simulation results demonstrate that the proposed algorithm possesses a good effect on speech enhancement.Keywords: speech enhancement; speech component estimation; discrete cosine transform; Laplacian model; factor estimation

        0 引 言

        有效的語(yǔ)音增強(qiáng)算法能夠大大提高語(yǔ)音通訊的抗噪聲干擾能力,改善語(yǔ)音質(zhì)量,提高語(yǔ)音可懂度。單通道語(yǔ)音增強(qiáng)算法以其簡(jiǎn)單、有效和利于硬件實(shí)現(xiàn)等優(yōu)點(diǎn),而長(zhǎng)期以來(lái)都是國(guó)內(nèi)外學(xué)者的研究熱點(diǎn),代表性的算法有減譜法、最小均方誤差算法、維納濾波算法等[1-4]。這些單通道算法大都在變換域中結(jié)合語(yǔ)音和噪聲的不同特征來(lái)研究具有針對(duì)性的噪聲消除算法,通常所用的變換有DFT,DCT變換等。相對(duì)于DFT變換,由于DCT變換具有信號(hào)譜分量豐富,能量集中,且無(wú)需對(duì)語(yǔ)音相位進(jìn)行估計(jì)等優(yōu)點(diǎn),近年來(lái)在語(yǔ)音增強(qiáng)領(lǐng)域中得到了廣泛的研究與應(yīng)用[5-6]。

        語(yǔ)音增強(qiáng)算法往往在變換域中假定純凈語(yǔ)音和噪聲譜分量皆服從零均值的高斯分布模型[2,5],這一假設(shè)的理論依據(jù)源自中心極限定理最近的研究結(jié)果,它表明DCT域中純凈語(yǔ)音信號(hào)譜分量的拉普拉斯分布也是一種很好的擬合模型[7]?;谶@一結(jié)果,Gazor等人在DCT域中運(yùn)用MMSE估計(jì)得到了一種非線性濾波算法[8],其實(shí)驗(yàn)仿真顯示,該算法在保持低運(yùn)算復(fù)雜度的情況下取得了相對(duì)較為理想的語(yǔ)音增強(qiáng)效果。但由于在語(yǔ)音分量拉普拉斯模型因子的估計(jì)過(guò)程中,由于無(wú)法直接獲得純凈語(yǔ)音分量的真實(shí)值,該算法采用帶噪語(yǔ)音分量來(lái)代替純凈語(yǔ)音分量對(duì)模型因子進(jìn)行估計(jì),這種替代方法雖然簡(jiǎn)化了估計(jì)過(guò)程,但其估計(jì)結(jié)果不可避免地受到噪聲的影響,從而影響算法的語(yǔ)音增強(qiáng)性能。

        針對(duì)語(yǔ)音增強(qiáng)算法中的模型因子估計(jì)問(wèn)題,本文首先給出了一種間接拉普拉斯模型因子估計(jì)算法,它能有效消除噪聲的影響,但該算法卻又會(huì)引入加權(quán)系數(shù)對(duì)于估計(jì)精度的干擾。為提高算法的性能,本文在對(duì)語(yǔ)音分量方差的估計(jì)過(guò)程中提出一種新型的估計(jì)算法,通過(guò)與間接拉普拉斯模型因子估計(jì)算法相結(jié)合,可同時(shí)避免噪聲與加權(quán)系數(shù)對(duì)算法性能的影響。仿真結(jié)果表明,本文算法在多種噪聲背景下都具有較好的語(yǔ)音增強(qiáng)性能。

        1 拉普拉斯模型語(yǔ)音增強(qiáng)算法

        用y(m),x(m)和n(m)分別表示m時(shí)刻K維帶噪語(yǔ)音、純凈語(yǔ)音和加性噪聲向量,假設(shè)純凈語(yǔ)音信號(hào)與噪聲互不相關(guān),有:

        y(m)=x(m)+n(n),E{x(i)nT(j)}=0,i,j(1)

        對(duì)式(1)進(jìn)行DCT變換,得:

        vk(m)=sk(m)+uk(m)

        式中:vk(m),sk(m)與uk(m)分別表示向量y(m),x(m)和n(m)在m時(shí)刻的第k個(gè)DCT分量,此時(shí)語(yǔ)音增強(qiáng)的任務(wù)即是設(shè)計(jì)算法從帶噪語(yǔ)音分量vk(m)中獲取純凈語(yǔ)音分量sk(m)的估計(jì)。定義語(yǔ)音分量sk(m)與估計(jì)值k(m)的誤差為ε=sk(m)-k(m),則在最小均方誤差意義下ε的貝葉斯風(fēng)險(xiǎn)函數(shù)為R=E(ε2),將其最小化可得語(yǔ)音分量的MMSE估計(jì)為[5]:

        k(m)=E{sk(m)|vk(m)}(2)

        為方便起見(jiàn),下面的公式中省略了時(shí)間和頻率標(biāo)量m,k。設(shè)DCT域純凈語(yǔ)音分量s和噪聲分量u可分別用拉普拉斯模型與高斯模型描述,則它們的概率密度函數(shù)分別為p{s},p{u}[7]:

        p{s}=12aexp-sa(3)

        p{u}=12πλuexp-u22λu(4)

        式中:λu=E{u2}表示噪聲分量u的方差;a=E{s}為純凈語(yǔ)音分量s的拉普拉斯模型因子。由于s,u之間相互獨(dú)立,根據(jù)貝葉斯估計(jì)理論,結(jié)合式(2)~式(4)可推導(dǎo)出拉普拉斯-高斯混合模型下純凈語(yǔ)音分量s的MMSE估計(jì)為[8]:

        =aeψ/2(ψ+ξ)eξerfcψ+ξ2ψ-ψ-ξe-ξerfcψ-ξ2ψeξerfc ψ+ξ2ψ+e-ξerfc ψ-ξ2ψ(5)

        式中:erfc(t)=2π∫∞texp(-x2)dx表示補(bǔ)充誤差函數(shù);ξ=va;ψ=λua2。

        2 新型拉普拉斯模型因子估計(jì)

        對(duì)式(5)的估計(jì)需要噪聲方差σu與模型因子a的先驗(yàn)估計(jì),對(duì)于σu一般可在帶噪語(yǔ)音的起始階段或語(yǔ)音信號(hào)的非活動(dòng)期間對(duì)其進(jìn)行估計(jì)或更新,實(shí)現(xiàn)較為簡(jiǎn)單,多視其為已知條件。對(duì)于在m時(shí)刻對(duì)模型因子a(m)的估計(jì),文獻(xiàn)[8]提出通過(guò)利用帶噪語(yǔ)音分量v(m)代替s(m)對(duì)a(m)進(jìn)行估計(jì):

        (m)=β (m-1)-(1-β)v(m)(6)

        式中:β為加權(quán)系數(shù);(m-1)為前一幀對(duì)于模型因子的估計(jì)。利用v代替s對(duì)模型因子進(jìn)行估計(jì)雖然方便簡(jiǎn)單,但對(duì)于a的估計(jì)過(guò)程中不可避免地要受到噪聲的影響,從而導(dǎo)致估計(jì)結(jié)果準(zhǔn)確度的降低??紤]到系統(tǒng)無(wú)法獲得s的真實(shí)值,通過(guò)一般方法直接對(duì)模型因子進(jìn)行估計(jì)較為困難。根據(jù)廣義高斯分布模型及其形態(tài)參數(shù)的概念與性質(zhì), 文獻(xiàn)[9]推導(dǎo)了拉普拉斯模型因子a與語(yǔ)音方差λs之間的對(duì)應(yīng)關(guān)系,其采用間接的方式來(lái)實(shí)現(xiàn)算法對(duì)a的估計(jì),有效消除了背景噪聲的影響,該估計(jì)公式為[9]:

        a=22λs(7)

        式中:λs=E{s2},即純凈語(yǔ)音分量s的方差,文獻(xiàn)[9]中采用直接判決方法對(duì)其進(jìn)行估計(jì):

        s(m)=η 2(m-1)+(1-η)max{v2(m)-λu,0}(8)

        式中:(m-1)表示前一幀對(duì)于語(yǔ)音分量s(m-1)的估計(jì);η為加權(quán)系數(shù),其取值范圍為η∈[0,1]。該算法可以有效地消除系統(tǒng)輸出語(yǔ)音中殘留的音樂(lè)噪聲,但估計(jì)性能對(duì)于加權(quán)系數(shù)η的選值較為敏感,較小的η值將導(dǎo)致算法輸出語(yǔ)音中信號(hào)的失真程度減少,但會(huì)殘留較多的音樂(lè)噪聲;當(dāng)其數(shù)值較大,即接近1時(shí),算法在提高音樂(lè)噪聲消除能力的同時(shí),將會(huì)帶來(lái)較為嚴(yán)重的語(yǔ)音信號(hào)失真[10]。因此為平衡這兩種關(guān)系,提高算法估計(jì)性能,本文提出一種新的語(yǔ)音方差估計(jì)方法,其無(wú)需η值的設(shè)定,從而消除了η對(duì)于算法性能的影響:

        假設(shè)前一幀(第m-1幀)估計(jì)的語(yǔ)音方差為λs(m-1),則λs(m)只依賴以下3個(gè)參數(shù):當(dāng)前幀帶噪語(yǔ)音分量v(m)、噪聲分量方差σu以及s(m-1)。根據(jù)方差的定義λs(m)=E{s(m)2}可得,在以上3個(gè)參數(shù)條件下當(dāng)前幀語(yǔ)音分量方差λs(m)的估計(jì)為:

        s(m)={s(m)2v(m),λs(m-1),σu(m)}(9)

        為方便起見(jiàn),以下公式推導(dǎo)中省略了m,并將λs(m-1)表示為λs,p,故上式可寫為:

        s={s2v,λs,p,σu}=∫∞-∞s2p(s,v)ds∫∞-∞p(s,v)ds(10)

        由于在拉普拉斯模型下式(10)結(jié)果涉及到復(fù)雜的數(shù)字積分求和運(yùn)算,計(jì)算量過(guò)大,為此本文考慮采用語(yǔ)音分量分布的另一種模型——高斯分布模型為:

        p{s}=12πλsexp-s22λs(11)

        將其結(jié)合式(4)的噪聲分量分布,可得:

        p{s,v}=12πλsλuexp-s22λs-(v-s)22λu(12)

        由于相鄰幀中純凈語(yǔ)音分量的能量變化比較緩慢,且s(m)與s(m-1)均服從相同參數(shù)的高斯分布,實(shí)際計(jì)算中λs,p可近似等于λs。將式(12)代入式(10)并經(jīng)推導(dǎo)可得:

        s=∫∞-∞s2exp-s22λs,p-(v-s)22λuds∫∞-∞exp-s22λs,p-(v-s)22λuds

        =∫∞-∞2λs,pλuλs,p+λut+λs,pλs,p+λuv2exp{-t2}dt∫∞-∞exp{-t2}dt

        =Γ (1.5)2λs,pλuπ(λs,p+λu)+λ2s,pv2(λs,p+λu)2(13)

        式中:Γ(1.5)=π/2,將其代入上式,可得本文算法對(duì)于λs(m)的估計(jì)為:

        s(m)=λs,p(m)λu(m)λs(m-1)+λu(m)+λ2s(m-1)v2(m)[(λs(m-1)+λu(m)]2(14)

        最終可得本文算法對(duì)于a(m)的估計(jì)為:

        (m)=22s(m)(15)

        式中:λs(m)采用式(14)對(duì)其進(jìn)行更新。從以上兩式可以看出,本文算法無(wú)需加權(quán)系數(shù)的設(shè)定,從而有效避免了其值對(duì)于算法估計(jì)精度的影響。

        3 仿真結(jié)果

        為驗(yàn)證本文提出算法的有效性,將本文提出的新型拉普拉斯模型因子估計(jì)語(yǔ)音增強(qiáng)算法與文獻(xiàn)[9]中算法進(jìn)行性能對(duì)比,4種不同類型的噪聲信號(hào)為白噪聲、Volvo汽車駕駛室內(nèi)噪聲、F16飛機(jī)駕駛艙內(nèi)噪聲以及Babble噪聲,它們均取自標(biāo)準(zhǔn)噪聲庫(kù)NOISEX-92。純凈語(yǔ)音為4段(男女聲各2段),噪聲與語(yǔ)音信號(hào)的采樣頻率均為8 kHz,將不同噪聲信號(hào)疊加到純凈語(yǔ)音信號(hào)上,分別產(chǎn)生輸入信噪比為0 dB,5 dB和10 dB的帶噪語(yǔ)音信號(hào)。仿真中選取語(yǔ)音幀的長(zhǎng)度為K=128,幀間重疊64點(diǎn)。語(yǔ)音增強(qiáng)算法的性能采用分段信噪比和對(duì)數(shù)譜距離兩種客觀評(píng)價(jià)標(biāo)準(zhǔn)。表1,表2分別給出了經(jīng)兩種算法處理后語(yǔ)音信號(hào)的Seg SNR和LSD對(duì)比。從中不難看出,在各種噪聲背景和不同衡量標(biāo)準(zhǔn)下,相對(duì)于文獻(xiàn)[9]中算法,本文算法具有更好的噪聲消除性能。

        表1 算法輸出語(yǔ)音分段信噪比(Seg SNR)對(duì)比

        噪聲類型輸入SNR /dB文獻(xiàn)[9]算法 本文算法

        白噪聲04.835.72

        57.538.37

        1010.7911.44

        Volvo駕駛室內(nèi)噪聲06.567.87

        58.839.66

        1011.7212.20

        F16駕駛艙內(nèi)噪聲

        03.594.17

        55.696.72

        108.8110.12

        Babble噪聲03.333.94

        55.466.27

        108.689.81

        表2 算法輸出語(yǔ)音對(duì)數(shù)譜距離(LSD)對(duì)比

        噪聲類型輸入SNR /dB文獻(xiàn)[9]算法本文算法

        白噪聲

        05.665.37

        55.004.59

        104.413.95

        Volvo駕駛室內(nèi)噪聲

        02.712.36

        52.191.96

        101.721.57

        F16駕駛艙內(nèi)噪聲06.355.73

        55.194.86

        104.313.78

        Babble噪聲

        07.046.40

        55.034.56

        103.613.35

        圖1給出白噪聲背景下幾種語(yǔ)音信號(hào)的語(yǔ)譜圖,帶噪語(yǔ)音信號(hào)的輸入SNR為5 dB。

        圖1 白噪聲下語(yǔ)音信號(hào)語(yǔ)譜圖(SNR=5 dB)

        圖1(a)~(d)依次表示為:純凈語(yǔ)音、帶噪語(yǔ)音、文獻(xiàn)[9]中算法增強(qiáng)后的語(yǔ)音和本文算法增強(qiáng)后的語(yǔ)音。從仿真結(jié)果中不難看出,兩種算法在保存大部分語(yǔ)音信號(hào)能量的同時(shí)都可以有效地消除背景噪聲,但相對(duì)而言,本文算法輸出的語(yǔ)音信號(hào)與純凈語(yǔ)音信號(hào)要更相近。

        4 結(jié) 語(yǔ)

        本文提出了一種新的拉普拉斯模型因子估計(jì)算法,其利用語(yǔ)音方差和模型因子的關(guān)系,采用一種新型的語(yǔ)音方差估計(jì)方法,間接地獲得模型因子的估計(jì)。仿真實(shí)驗(yàn)表明,基于該模型因子估計(jì)方案的語(yǔ)音增強(qiáng)算法能夠有效地避免原始算法的不足,在多種噪聲背景下都具有更好的語(yǔ)音增強(qiáng)效果。

        參考文獻(xiàn)

        [1]BOLL S F. Suppression of acoustic noise in speech usingspectral subtraction [J]. IEEE Trans. Acoust. Speech Signal Processing, 1979, 27(2): 113-120.

        [2]EPHRAIM Y, MALAH D. Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator [J]. IEEE Trans. Acoust. Speech Signal Processing, 1984, 32(6): 1109-1121.

        [3]SOON I Y, KOH S N. Speech enhancement using 2-D Fourier transform[J]. IEEE Trans. Speech Audio Processing, 2003, 11(6): 717-724.

        [4]YOU C H, KOH S N, RAHARDJA S. Beta-order MMSE spectral amplitude estimation for speech enhancement [J]. IEEE Trans. Speech Audio Process., 2005, 13(4): 475-486.

        [5]SOON I Y, KOH S N, YEO C K. Noisy speech enhancement using discrete cosine transform [J]. Speech Commun., 1998, 24(3): 249-257.

        [6]CHANG J H. Warped discrete cosine transform-based noisy speech enhancement[J]. IEEE Trans. Circuits and Systems-Ⅱ: Express Briefs, 2005, 52(9): 535-539.

        [7]GAZOR S, ZHANG W. Speech probability distribution [J]. IEEE Signal Processing Lett., 2003, 10(7): 204-207.

        [8]GAZOR S. Employing laplacian-gaussian densities for speech enhancement [C]//Proc. ICASSP’04. Montreal, Canada: IEEE, 2004: 297-230.

        [9]歐世峰,趙曉暉,顧海軍.基于間接拉普拉斯模型因子估計(jì)的語(yǔ)音增強(qiáng)算法[J].數(shù)據(jù)采集與處理,2006,21(4):386-391.

        [10]PLAPOUS C, MARRO C, SCALART P. Improved signal to noise ratio estimation for speech enhancement [J]. IEEE Trans. Audio, Speech, Language Processing, 2006, 14(6): 2098-2108.

        国产麻豆精品久久一二三| 国产日产韩国级片网站| 国产一区二区视频在线免费观看| 免费黄色影片| 粉嫩少妇内射浓精videos| 国产精品欧美视频另类专区| 五月婷婷丁香视频在线观看| 中文字幕免费在线观看动作大片| 日本不卡一区二区三区在线视频| 97人人模人人爽人人喊网| 疯狂做受xxxx高潮欧美日本| 少妇的诱惑免费在线观看| 在线观看国产激情免费视频| 日韩av无码一区二区三区| 欧美日韩一区二区三区自拍| 甲状腺囊实性结节三级| 国产av一区二区三区天美| 久久久久99精品成人片| 无码少妇一区二区三区| 国产一精品一aⅴ一免费| 亚洲精品一区二区网站| av中文字幕潮喷人妻系列| 久久99国产乱子伦精品免费| 在线亚洲精品国产成人二区| 亚洲天堂av中文字幕在线观看 | 综合激情五月三开心五月| a级毛片免费观看在线播放| 国产女精品视频网站免费 | h视频在线观看视频在线| 免费成人电影在线观看| 永久免费的av在线电影网无码| 国产在线AⅤ精品性色| 久久综合久久综合久久| 免费操逼视频| 日本高清中文字幕一区二区三区| 五月综合丁香婷婷久久| 精品国际久久久久999波多野| 日韩一线无码av毛片免费| 国产三级伦理视频在线| 日本h片中文字幕在线| 精品欧洲av无码一区二区三区|