楊龍
【摘 要】對(duì)目前常用的幾種單通道語(yǔ)音增強(qiáng)算法,即譜減法、最小均方誤差估計(jì)以及子空間算法進(jìn)行研究,通過(guò)仿真實(shí)驗(yàn)對(duì)三種單通道語(yǔ)音增強(qiáng)算法的去噪效果和去噪后語(yǔ)音失真程度以及信噪比進(jìn)行比較分析,由此論證三種方法的使用條件和在該條件下的增強(qiáng)效果。
【關(guān)鍵詞】語(yǔ)音增強(qiáng);去噪;信噪比
The Search of Single Channel Speech Enhancement Algorithms
YANG Long
(Department of Information Engineer, Academy of Armored Forces Engineering, Beijing 100072,China)
【Abstract】The paper compares the commonly used several kinds of single channel speech enhancement algorithms, such as spectral subtraction, minimum mean square error estimation and subspace algorithm. Through the experiments, the paper aims at arguing the performance of the three kinds of single channel speech enhancement algorithms and gains the condition and environment of using the algorithms..
【Key words】Speech enhancement;De-noise;SNR
語(yǔ)音通信是最直接有效的傳遞信息的手段,隨時(shí)代的發(fā)展,語(yǔ)音通信質(zhì)量不斷被提出更高的要求,因而語(yǔ)音增強(qiáng)技術(shù)一直是研究的熱點(diǎn),語(yǔ)音增強(qiáng)算法層出不窮。
語(yǔ)音增強(qiáng)算法可根據(jù)麥克風(fēng)的通道數(shù)分為單通道和多通道。由于模型簡(jiǎn)單和成本較低,單通道語(yǔ)音增強(qiáng)算法一直被廣泛的應(yīng)用并不斷研究推廣。常見(jiàn)的單通道語(yǔ)音增強(qiáng)算法有譜減法,基于統(tǒng)計(jì)的方法,子空間,維納濾波等。
1 三種單通道語(yǔ)音增強(qiáng)算法
1.1 譜減法
譜減法基本思想是假設(shè)加性噪聲的情況下,從帶噪語(yǔ)音的頻譜估值中減去噪聲頻譜估值,從而得到純凈語(yǔ)音的頻譜估值。譜相減法的一般形式如圖1所示,Y(ω)是帶噪語(yǔ)音頻域形式,(ω)為噪聲頻譜估計(jì)。
1.2 最小均方誤差估計(jì)(MMSE)
基于短時(shí)頻譜幅度(STSA)對(duì)于語(yǔ)音可懂度和質(zhì)量的重要性,研究者提出了從已知帶噪信號(hào)中提取信號(hào)幅度譜的最優(yōu)方法——最小均方誤差估計(jì)法(MMSE),其估計(jì)式如下,
(k)=exp(dt)R(k)
公式(3)中,(k)是純凈語(yǔ)音幅度估計(jì)值,R(k)是帶噪語(yǔ)音幅度估計(jì)值,為先驗(yàn)信噪比。此法關(guān)鍵在優(yōu)化算法結(jié)構(gòu),減少計(jì)算量。并且,先驗(yàn)信噪比估計(jì)的準(zhǔn)確度也對(duì)整體增強(qiáng)效果有較大的影響。
1.3 子空間算法
基于信號(hào)子空間的語(yǔ)音增強(qiáng)算法以線性代數(shù)為基礎(chǔ),通過(guò)正交分解的思想將帶噪信號(hào)向量空間分解為分別由純凈信號(hào)主導(dǎo)和噪聲信號(hào)主導(dǎo)的兩個(gè)子空間,通過(guò)去除落在“噪聲空間”里的帶噪向量分量來(lái)估計(jì)出純凈語(yǔ)音信號(hào)。利用值分解(SVD),可將帶噪信號(hào)分解到兩個(gè)信號(hào)子空間,這兩個(gè)空間相互正交,其中一個(gè)為目標(biāo)信號(hào)子空間,另一個(gè)為其正交子空間或“噪聲子空間”。
子空間算法通用結(jié)構(gòu)如圖2示。為了達(dá)到精準(zhǔn)實(shí)現(xiàn)語(yǔ)音和噪聲的空間分割,除了需構(gòu)建相關(guān)變換的U矩陣,還需估計(jì)出變換過(guò)程中的增益矩陣。由于以線性代數(shù)為基礎(chǔ),在每個(gè)語(yǔ)音幀都需進(jìn)行SVD因此計(jì)算量龐大,常以遞歸法或限定估計(jì)數(shù)量的方式優(yōu)化算法結(jié)構(gòu)。
2 實(shí)驗(yàn)與分析
通過(guò)利用matlab構(gòu)建仿真環(huán)境,本文使用來(lái)自NOISEUS語(yǔ)料庫(kù)的帶噪語(yǔ)音對(duì)三種經(jīng)典的單通道語(yǔ)音增強(qiáng)算法進(jìn)行仿真比較,分析和總結(jié)三種算法的優(yōu)缺點(diǎn)。所有測(cè)試含噪語(yǔ)音來(lái)自NOISEUS語(yǔ)料庫(kù),選取sp01作純凈語(yǔ)音,選取train,babble和airport作為噪聲。設(shè)置0dB和5dB兩種信噪比為仿真環(huán)境。帶噪語(yǔ)音信號(hào)的采樣頻率設(shè)置為8000Hz。以SNR=5的條件進(jìn)行仿真的波形圖如圖3所示。
以SNR和LLR作為測(cè)試實(shí)驗(yàn)性能的評(píng)價(jià)標(biāo)準(zhǔn)。根據(jù)文獻(xiàn)[]可知,SNR用來(lái)評(píng)價(jià)去噪能力,LLR用來(lái)評(píng)價(jià)語(yǔ)音失真度,SNR越大越好,LLR越小越好。其仿真結(jié)果所獲數(shù)據(jù)見(jiàn)表1。
三種單通道語(yǔ)音增強(qiáng)算法的SNR和LLR從表1可以看出,子空間的SNR和LLR最大,說(shuō)明子空間去噪效果最好,但語(yǔ)音失真度最大。MMSE的LLR最小,即語(yǔ)音失真度最低。在處理低信噪比的含噪語(yǔ)音時(shí),MMSE的去噪能力比譜減法強(qiáng),而在處理高信噪比的含噪語(yǔ)音時(shí),譜減法的去噪能力比MMSE強(qiáng)。
3 結(jié)束語(yǔ)
本文介紹了譜減法、最小均方誤差(MMSE)以及子空間法三種單通道的語(yǔ)音增強(qiáng)算法。通過(guò)對(duì)三種算法仿真,從數(shù)據(jù)對(duì)三種算法進(jìn)行了分析,從而論證了三種算法的優(yōu)缺點(diǎn)及其使用環(huán)境與條件。仿真實(shí)驗(yàn)表明,子空間法去噪效果好,但失真大,即可懂度低;MMSE去噪能力稍弱,但是可懂度高;譜減法做為最基本的語(yǔ)音增強(qiáng)算法,在實(shí)時(shí)性上占據(jù)優(yōu)勢(shì),但是去噪效果不如前兩種算法。
【參考文獻(xiàn)】
[1]P. C. Loizou,高毅,等.語(yǔ)音增強(qiáng):理論與實(shí)踐[M].成都:電子科技大學(xué)出版社,2012,12.
[2]王路露,劉光燦,夏旭.一種改進(jìn)型譜減算法的語(yǔ)音增強(qiáng)研究[J].計(jì)算機(jī)工程與應(yīng)用,2014,19:210-213.
[3]陳俊,孫洪,董航.基于MMSE先驗(yàn)信噪比估計(jì)的語(yǔ)音增強(qiáng)[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2005,05:638-642.
[4]楊琳,張建平,顏永紅.單通道語(yǔ)音增強(qiáng)算法對(duì)漢語(yǔ)語(yǔ)音可懂度影響的研究[J]. 聲學(xué)學(xué)報(bào),2010,02:248-253.
[5]楊海濱,張軍.基于模型的單通道語(yǔ)音分離綜述[J].計(jì)算機(jī)應(yīng)用研究,2010,11:4025-4031.
[6]歐世峰,趙曉暉,顧海軍.改進(jìn)的基于信號(hào)子空間的多通道語(yǔ)音增強(qiáng)算法[J].電子學(xué)報(bào),2005,10:60-63.
[責(zé)任編輯:劉展]