亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法

        2020-07-16 07:11:36阮振裔石超宇
        電聲技術(shù) 2020年4期
        關(guān)鍵詞:幅度信噪比增益

        阮振裔,王 濤,石超宇

        (上海大學(xué) 通信與信息工程學(xué)院,上海 200444)

        1 引言

        語(yǔ)音增強(qiáng)的作用是提高受損語(yǔ)音的質(zhì)量和可懂度[1]。于現(xiàn)實(shí)中采集到的語(yǔ)音信號(hào)往往伴有周?chē)沫h(huán)境噪聲,人聲干擾以及其他因素的影響。在許多語(yǔ)音系統(tǒng)如語(yǔ)音通信,語(yǔ)音識(shí)別中都需要使用到語(yǔ)音增強(qiáng)算法來(lái)提升系統(tǒng)的性能。

        根據(jù)麥克風(fēng)的數(shù)量進(jìn)行分類,可以把語(yǔ)音增強(qiáng)算法分為單通道(單麥克風(fēng))語(yǔ)音增強(qiáng)和多通道(多麥克風(fēng)或麥克風(fēng)陣列)語(yǔ)音增強(qiáng)。本文所研究的算法屬于單通道語(yǔ)音增強(qiáng)。單通道語(yǔ)音增強(qiáng)算法又可以大致分為以下幾類:譜減法[2],基于統(tǒng)計(jì)模型的算法[3-4],子空間算法[5],以及基于機(jī)器學(xué)習(xí)的算法[6-7]。需要指出的是,這些算法大多只關(guān)注幅度譜的修正,而采取使用含噪語(yǔ)音信號(hào)相位代替純凈語(yǔ)音信號(hào)相位的做法。其原因在于早期研究人員認(rèn)為人耳對(duì)于相位信息并不敏感[8];在高信噪比情況下,含噪語(yǔ)音信號(hào)相位譜和純凈語(yǔ)音信號(hào)相位譜非常接近[9];純凈語(yǔ)音信號(hào)相位譜的準(zhǔn)確較難估計(jì),會(huì)增加算法的復(fù)雜度等等。因此,從20世紀(jì)開(kāi)始的很長(zhǎng)一段時(shí)間范圍內(nèi),語(yǔ)音增強(qiáng)主要是對(duì)信號(hào)的幅度譜進(jìn)行增強(qiáng)。而對(duì)于相位譜的研究較少。

        隨著語(yǔ)音增強(qiáng)技術(shù)的發(fā)展,僅僅對(duì)幅度譜進(jìn)行增強(qiáng)后實(shí)現(xiàn)的效果提升越來(lái)越有限。同時(shí)硬件資源的提升使得算法復(fù)雜度較高的方法也能夠被接受。因此,研究人員將目光轉(zhuǎn)向相位譜。Paliwal K等人設(shè)計(jì)了多種實(shí)驗(yàn)證明了相位譜在語(yǔ)音增強(qiáng)中的重要性[10]。近年來(lái),越來(lái)越多的研究致力于相位譜語(yǔ)音增強(qiáng)[11-13]。

        本文提出了具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法。本文使用基于GMM的VAD算法[14]來(lái)估計(jì)噪聲和改進(jìn)基礎(chǔ)的log-MMSE增益函數(shù)。傳統(tǒng)的通過(guò)VAD來(lái)估計(jì)噪聲的方法只在噪聲段更新,而在語(yǔ)音段保持不變。本文結(jié)合VAD所產(chǎn)生的語(yǔ)音存在概率改進(jìn)噪聲功率譜更新方式,使得噪聲信息能夠一直得到更新。另外根據(jù)VAD給出的幀單位上檢測(cè)結(jié)果和語(yǔ)音存在概率改進(jìn)了基礎(chǔ)的log-MMSE增益函數(shù)。最后使用一個(gè)相位補(bǔ)償因子[15]來(lái)對(duì)相位譜作出補(bǔ)償。從而對(duì)含噪語(yǔ)音信號(hào)的相位譜和幅度譜同時(shí)進(jìn)行增強(qiáng)。

        本文在TIMIT和NOISEX-92,NOIZEUS數(shù)據(jù)集下,設(shè)立多種噪聲環(huán)境進(jìn)行算法有效性驗(yàn)證。實(shí)驗(yàn)數(shù)據(jù)表明,本文所提出的具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法與其他經(jīng)典語(yǔ)音增強(qiáng)算法相比,能夠?qū)崿F(xiàn)更好的噪聲抑制效果,更好地提升語(yǔ)音質(zhì)量。

        2 典型log-MMSE語(yǔ)音增強(qiáng)算法

        假設(shè)噪聲是加性的。則時(shí)域中含噪語(yǔ)音信號(hào)由可由式(1)來(lái)表示。

        x(n)=s(n)+v(n)

        (1)

        其中,x(n)、s(n)、v(n)分別表示時(shí)域中的含噪語(yǔ)音,純凈語(yǔ)音和噪聲信號(hào)。

        含噪語(yǔ)音信號(hào)經(jīng)過(guò)語(yǔ)音信號(hào)預(yù)處理過(guò)程,從時(shí)域變換到頻域后,用幅度譜和相位譜表示如下:

        |X(k,l)|eiφX(k,l)=|S(k,l)|eiφS(k,l)+

        |V(k,l)|eiφV(k,l)

        (2)

        其中,|X(k,l)|、|S(k,l)|、|V(k,l)|分別表示含噪語(yǔ)音、純凈語(yǔ)音、噪聲的幅度譜。φX(k,l)、φS(k,l)、φV(k,l)分別表示含噪語(yǔ)音、純凈語(yǔ)音、噪聲的相位譜。

        基礎(chǔ)log-MMSE增益函數(shù)通過(guò)令估計(jì)純凈語(yǔ)音與實(shí)際純凈語(yǔ)音對(duì)數(shù)幅度譜均方誤差最小化推導(dǎo)得出,可以表示如下:

        (3)

        然后通過(guò)增益函數(shù)增強(qiáng)幅度譜,并且使用含噪語(yǔ)音相位代替純凈語(yǔ)音相位。最后通過(guò)逆傅里葉變換轉(zhuǎn)換到時(shí)域上。其過(guò)程可以用圖1來(lái)展示。

        3 改進(jìn)log-MMSE語(yǔ)音增強(qiáng)算法

        3.1 改進(jìn)噪聲估計(jì)

        基于GMM的VAD算法選取子帶對(duì)數(shù)能量作為語(yǔ)音特征,其計(jì)算過(guò)程如下。

        P(k,l)=αP(k,l-1)+(1-α)|X(k,l)|2

        (4)

        (5)

        對(duì)含噪語(yǔ)音進(jìn)行建模,GMM可以表示如下(為了表達(dá)簡(jiǎn)潔,式中省略了部分索引):

        (6)

        其中,w,μ,κ分別表示權(quán)重,均值和方差,這三個(gè)值組成GMM參數(shù)集λ。下標(biāo)z=0,1分別表示噪聲分量和語(yǔ)音分量標(biāo)簽。

        初始化GMM模型參數(shù)集之后,對(duì)參數(shù)集進(jìn)行實(shí)時(shí)更新。通過(guò)參數(shù)集來(lái)求得語(yǔ)音存在概率,語(yǔ)音存在概率的計(jì)算公式如下:

        (7)

        其中,spp(b,l)表示第l幀中第b個(gè)子帶上的語(yǔ)音存在概率,w1(b,l)表示對(duì)應(yīng)的語(yǔ)音模型權(quán)重,p(y(b,l)|z=1,λl)表示對(duì)應(yīng)噪聲模型的概率密度函數(shù),λl表示第l幀的參數(shù)集。子帶上的語(yǔ)音存在概率spp(b,l)通過(guò)變換可以得到各頻點(diǎn)上的語(yǔ)音存在概率spp(k,l)。統(tǒng)計(jì)一幀中各子帶的語(yǔ)音存在概率,與一個(gè)閾值進(jìn)行比較得到可以每一幀信號(hào)的VAD結(jié)果。

        傳統(tǒng)基于VAD進(jìn)行噪聲估計(jì)的方法可以表示如下:

        (8)

        上述方法的缺點(diǎn)是在語(yǔ)音段無(wú)法更新噪聲功率譜,實(shí)際上語(yǔ)音段內(nèi)的噪聲功率譜可能會(huì)發(fā)生變化。因此本文對(duì)上面的噪聲估計(jì)方法做出了改進(jìn),通過(guò)一個(gè)可變平滑因子使得噪聲功率譜更新在語(yǔ)音段也能夠進(jìn)行。改進(jìn)后的噪聲估計(jì)方法可以用下式來(lái)表示。

        (9)

        其中αn(k,l)表示第l幀第k個(gè)頻點(diǎn)上的平滑因子,其計(jì)算公式如下:

        αn(k,l)=α0+spp(k,l)(1-α0)

        (10)

        3.2 改進(jìn)增益函數(shù)

        前文所給出的基礎(chǔ)log-MMSE增益函數(shù)是假設(shè)語(yǔ)音和噪聲都存在時(shí)推導(dǎo)得出的。但是人在說(shuō)話過(guò)程中必然會(huì)有停頓,此時(shí)只有噪聲信號(hào)的存在。因此對(duì)于一段含噪語(yǔ)音信號(hào),一般不直接使用增益函數(shù)與之相作用,而需要結(jié)合語(yǔ)音存在概率對(duì)增益函數(shù)作出修正。另外當(dāng)增強(qiáng)信號(hào)幅度為零時(shí),會(huì)出現(xiàn)惱人的音樂(lè)噪聲影響語(yǔ)音質(zhì)量。因此為了保證增益函數(shù)不為零,還需要為其設(shè)定一個(gè)最小值。

        值得注意的是,在有些情況下,GMM的建??赡艹鲥e(cuò),在這種情況下得到的語(yǔ)音存在概率是有誤的,若繼續(xù)使用其進(jìn)行語(yǔ)音增強(qiáng)會(huì)對(duì)語(yǔ)音有較大損傷。盡管頻點(diǎn)上的語(yǔ)音存在概率可能會(huì)出錯(cuò),但是幀單位上的VAD判決結(jié)果由于子帶融合機(jī)制一般是正確的,因此本文的增益函數(shù)最終設(shè)置如下:

        (11)

        其中G′(k,l)表示本文所用改進(jìn)增益函數(shù),Gm是為了防止語(yǔ)音存在概率為零時(shí)導(dǎo)致最終增益為零所設(shè)置的最小增益值,Gn是為了防止原先增益為零時(shí)導(dǎo)致最終增益為零所設(shè)置的最小增益值。

        3.3 相位補(bǔ)償

        在高信噪比情況下,含噪語(yǔ)音的相位與純凈語(yǔ)音相位接近,但在低信噪比情況下,兩者的差距會(huì)十分明顯。因此只對(duì)含噪語(yǔ)音進(jìn)行幅度譜增強(qiáng)而忽略相位譜的做法并不是最優(yōu)的。我們使用一個(gè)簡(jiǎn)單的實(shí)驗(yàn)來(lái)說(shuō)明上述現(xiàn)象。即選取一段純凈的語(yǔ)音信號(hào),疊加高斯白噪聲設(shè)立多種信噪比。并把這兩種信號(hào)轉(zhuǎn)換到頻域上,觀察兩者的相位譜,實(shí)驗(yàn)結(jié)果如表1所示。

        表1 不同信噪比情況下含噪語(yǔ)音信號(hào)與純凈語(yǔ)音信號(hào)相位的比較

        信噪比/dB-505101520φX(k,l)/度-28.9-37.3-42.5-45.5-47.2-48.2φS(k,l)/度-49.5-49.5-49.5-49.5-49.5-49.5

        可見(jiàn)信噪比越低,兩者的差距越來(lái)越大。

        因此本文使用一個(gè)相位補(bǔ)償因子來(lái)對(duì)相位譜進(jìn)行補(bǔ)償[15]。給出相位補(bǔ)償因子如下:

        Λ(k,l)=cΨ(k)|V(k,l)|

        (12)

        其中c為一經(jīng)驗(yàn)值常數(shù),|V(k,l)|表示噪聲幅度譜,Ψ(k)為一反對(duì)稱性函數(shù),其形式如下:

        (13)

        相位補(bǔ)償首先通過(guò)給原先的含噪信號(hào)加上相位補(bǔ)償因子:

        XΛ(k,l)=X(k,l)+Λ(k,l)

        (14)

        然后通過(guò)上式中的XΛ(k,l)來(lái)求得補(bǔ)償后的相位譜:

        φXΛ(k,l)=ARG[XΛ(k,l)]

        (15)

        最終的增強(qiáng)信號(hào)通過(guò)結(jié)合增強(qiáng)之后的幅度譜和補(bǔ)償?shù)南辔蛔V來(lái)得到:

        (16)

        3.4 本文改進(jìn)算法總結(jié)

        綜上所述,本文所提出的改進(jìn)語(yǔ)音增強(qiáng)算法主要研究?jī)?nèi)容如下:

        (1)使用基于GMM的VAD算法所得到的語(yǔ)音存在概率,改進(jìn)了傳統(tǒng)通過(guò)VAD算法進(jìn)行噪聲估計(jì)的方法,使得噪聲功率譜更新在語(yǔ)音段也能夠進(jìn)行。

        (2)使用基于GMM的VAD算法所得到幀單位上檢測(cè)結(jié)果和語(yǔ)音存在概率,改進(jìn)了基礎(chǔ)的log-MMSE增益函數(shù),在盡可能抑制噪聲的同時(shí)盡量保證語(yǔ)音成分不失真。

        (3)使用相位補(bǔ)償因子對(duì)相位譜作出補(bǔ)償,從而同時(shí)進(jìn)行幅度譜和相位譜的增強(qiáng)。

        本文所設(shè)計(jì)的具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法的整體流程圖如圖2所示。

        4 實(shí)驗(yàn)驗(yàn)證

        為了評(píng)估所提出的具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法的性能,我們從TIMIT語(yǔ)料庫(kù)中選擇純凈語(yǔ)音信號(hào)。并從NOISEX-92和NOIZEUS噪聲庫(kù)中選取噪聲,對(duì)純凈語(yǔ)音信號(hào)疊加不同的噪聲,設(shè)立多組信噪比作為測(cè)試數(shù)據(jù),對(duì)比本文算法與其他經(jīng)典語(yǔ)音增強(qiáng)算法的性能。

        本文使用信噪比和PESQ來(lái)評(píng)價(jià)增強(qiáng)之后的語(yǔ)音質(zhì)量。算法處理后的信號(hào)信噪比越高意味著噪聲抑制的效果越好。但語(yǔ)音增強(qiáng)不僅僅是對(duì)噪聲進(jìn)行抑制,還需要同時(shí)盡量保證語(yǔ)音成分不失真。語(yǔ)音質(zhì)量感知評(píng)價(jià)(PESQ)是一種比較常用的客觀評(píng)價(jià)方式。PESQ給出的得分越高,則說(shuō)明增強(qiáng)的語(yǔ)音質(zhì)量越高。通過(guò)這兩種評(píng)價(jià)方式來(lái)對(duì)比算法的性能。本文中語(yǔ)音信號(hào)采樣頻率為16 kHz,幀長(zhǎng)20 ms,平滑功率譜平滑常數(shù)α取0.98,噪聲功率譜平滑常數(shù)α0取0.75,增益控制值Gm取0.103,增益控制值Gn取0.001,相位補(bǔ)償因子常數(shù)c取3.74。

        4.1 不同噪聲環(huán)境下各算法輸出信噪比對(duì)比

        首先從NOISEX-92噪聲庫(kù)中選取平穩(wěn)噪聲:white噪聲和pink噪聲,以及非平穩(wěn)噪聲babble噪聲構(gòu)成不同的含噪信號(hào),通過(guò)信噪比來(lái)對(duì)比本文算法和其他經(jīng)典算法的降噪性能。表2展示了不同噪聲環(huán)境下,使用其他算法和本文算法進(jìn)行增強(qiáng)后的輸出信噪比情況。

        表2 多種噪聲環(huán)境下各算法的輸出信噪比比較

        噪聲類型輸入信噪比/dB輸出信噪比/dB譜減法維納濾波Log-MMSE本文算法-50.411.532.067.03white04.734.334.939.4359.057.668.2011.851013.4211.2711.8114.20-51.02-0.021.616.41pink04.574.574.908.8958.698.698.0911.511013.3911.6512.1414.21-50.381.962.162.91babble04.205.375.676.2558.248.889.179.731012.7513.2713.5313.39

        從表3的實(shí)驗(yàn)結(jié)果我們可以看到,除了在babble噪聲含噪語(yǔ)音信號(hào)輸入信噪比為10 dB情況下,本文算法的輸出信噪比略低于log-MMSE,其余情況下本文算法的輸出信噪比都高于其他算法。

        為了直觀形象地展示其他語(yǔ)音增強(qiáng)算法和本章所設(shè)計(jì)的算法的效果。圖3展示了在white噪聲0 dB情況下各算法輸出波形圖。從圖3我們可以看到相對(duì)而言譜減法的噪聲抑制效果最差,譜減法在高信噪比情況下能夠取得不錯(cuò)的噪聲抑制效果,但是在低信噪比情況下,其效果會(huì)急劇下降。在低信噪比情況下,維納濾波具有較小的增益函數(shù),因此具有更強(qiáng)的噪聲抑制效果。但與此同時(shí),和純凈語(yǔ)音信號(hào)的波形圖對(duì)比可以看到,一些有效語(yǔ)音成分也被消除掉,這是我們不希望看到的結(jié)果。log-MMSE保留了更多的語(yǔ)音成分,但也殘留了較多噪聲。而本文算法最終的增強(qiáng)效果既最大程度保留了語(yǔ)音的有效成分,也具有更低的噪聲殘留。

        4.2 不同噪聲環(huán)境下各算法PESQ對(duì)比

        為了進(jìn)一步驗(yàn)證本文算法的有效性。除了在NOISEX-92中選取的噪聲,另外從NOIZEUS噪聲庫(kù)中選取日常生活中常見(jiàn)的street噪聲和car噪聲組成測(cè)試集。對(duì)比各算法處理后的PESQ值,結(jié)果如表3所示。

        表3 多種噪聲環(huán)境下各算法的PESQ比較

        噪聲類型輸入信噪比/dBPESQ含噪信號(hào)譜減法維納濾波log-MMSE本文算法white-51.061.061.111.091.4201.081.101.161.191.6951.131.201.301.411.97101.281.451.681.832.32pink-51.061.061.171.101.4701.091.121.121.351.6551.201.291.291.661.94101.441.651.752.072.39babble-51.111.121.201.191.2401.191.211.231.381.4151.371.431.421.651.73101.371.861.932.152.19street-51.101.111.191.261.3001.171.231.281.481.5651.351.471.461.801.91101.651.922.022.272.31car-51.111.111.301.301.5101.191.201.641.691.8551.361.442.002.112.27101.651.852.362.502.75

        從表3中結(jié)果可以看到,本文算法在各種噪聲環(huán)境下都具有最高的PESQ得分。因此本文算法比其他算法更好的增強(qiáng)效果。

        5 結(jié)語(yǔ)

        本文提出了具有相位補(bǔ)償?shù)母倪M(jìn)log-MMSE語(yǔ)音增強(qiáng)算法。傳統(tǒng)的通過(guò)VAD來(lái)估計(jì)噪聲的方法只在噪聲段更新,而在語(yǔ)音段保持不變。本文結(jié)合基于GMM的VAD所產(chǎn)生的語(yǔ)音存在概率改進(jìn)噪聲功率譜更新方式,使得噪聲信息在語(yǔ)音段也能更新。另外結(jié)合VAD給出的幀單位上檢測(cè)結(jié)果和語(yǔ)音存在概率改進(jìn)了基礎(chǔ)的log-MMSE增益函數(shù)。最后使用一個(gè)相位補(bǔ)償因子來(lái)對(duì)相位譜作出補(bǔ)償。從而對(duì)含噪語(yǔ)音信號(hào)的相位譜和幅度譜同時(shí)進(jìn)行增強(qiáng)。在多種噪聲環(huán)境下的實(shí)驗(yàn)結(jié)果表明,本文提出的算法相比于其他經(jīng)典語(yǔ)音增強(qiáng)算法,具有更好的噪聲抑制效果,能夠獲得更好的語(yǔ)音質(zhì)量。

        猜你喜歡
        幅度信噪比增益
        基于增益調(diào)度與光滑切換的傾轉(zhuǎn)旋翼機(jī)最優(yōu)控制
        基于單片機(jī)的程控增益放大器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:36
        基于深度學(xué)習(xí)的無(wú)人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
        基于Multisim10和AD603的程控增益放大器仿真研究
        電子制作(2018年19期)2018-11-14 02:37:02
        微波超寬帶高速數(shù)控幅度調(diào)節(jié)器研制
        低信噪比下LFMCW信號(hào)調(diào)頻參數(shù)估計(jì)
        低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
        基于ANSYS的四連桿臂架系統(tǒng)全幅度應(yīng)力分析
        保持信噪比的相位分解反褶積方法研究
        2014年中期預(yù)增(降)幅度最大的50家上市公司
        二区三区日本高清视频| 久久久久久久妓女精品免费影院| AV中文码一区二区三区| 91精品国产自拍视频| 亚洲伊人成综合人影院| 尤物国产一区二区三区在线观看| 欧美乱大交xxxxx潮喷| 欧美亚洲精品一区二区| 综合网五月| 成人精品国产亚洲av久久| 96中文字幕一区二区| 精品国产天堂综合一区在线| 久久视频在线| 久久精品亚洲中文字幕无码网站 | 91伊人久久| 亚洲综合一| 国产剧情亚洲一区二区三区| 一区二区三区午夜视频在线 | 99er视频| 蜜桃在线观看免费高清| 亚洲一区二区三区熟妇| 无码熟妇人妻av在线影片最多 | 亚洲熟妇色xxxxx欧美老妇y| 青青草视频在线视频播放| 国产av一区二区日夜精品剧情| 亚洲国产果冻传媒av在线观看| 久久久久久国产精品免费免费| 亚洲乱码国产一区三区| 精品一二区| 亚洲女同人妻在线播放| 精品国产粉嫩内射白浆内射双马尾| 无码少妇一区二区浪潮av| 亚洲V无码一区二区三区四区观看| 国产一区二区三区18p| 亚洲精品乱码久久久久久| 亚洲色www成人永久网址| 久草热这里只有精品在线| 成人激情视频一区二区三区 | 亚洲最大中文字幕熟女| 97在线观看| 一级二级中文字幕在线视频|