摘 要:在各種語音增強法中,譜減法以其簡單、有效而被廣泛應用。在譜減法中,一般使用周期圖法對語音信號進行功率譜估計,但是它的估計偏差以及方差較大,直接結(jié)果是引起了較大的音樂噪聲。而多窗譜(multitaper估計具有較小的估計偏差和方差。因此,使用基于多窗譜估計的改進譜減法可以有效降低音樂噪聲。實驗結(jié)果證明,在相同實驗條件下,該方法得到的增強語音中的音樂噪聲要明顯小于使用周期圖法的結(jié)果,且信噪比可提高1~2 dB。
關(guān)鍵詞:語音增強;多窗譜;譜減法;音樂噪聲
An Improved Spectral Subtraction Method Based on Multitaper Estimation
WU Pengpeng,HAO Gang,OU Ming
(School of Electronic Information,Sichuan University,Chengdu,610064,China
Abstract:In all speech enhancement methods,spectral subtraction,which is simply and efficient,is widely used.Usually,the periodogram method is used in spectral subtraction to estimate the speech signal′s power spectra.However,it has large and inaccurate variance which causes musical noise.The multitaper estimation has a lower variance.So the combination of multitaper estimation and spectral subtraction can reduce musical noise obviously.The experiment results also show that the multitaper method is better than the periodogram method in restraining musical noise,and improves the SNR by 1~2 dB.
eywords:speech enhancement;multitaper method;spectral subtraction;musical noise
1 引 言
在很多語音增強法中,都需要對語音信號進行功率譜估計,而周期圖估計法以其簡單、快速的優(yōu)點,被廣泛應用。但是周期圖法得出的功率譜,與信號的真實功率譜存在著較大的方差,導致了在每一幀信號的譜估計中會隨機出現(xiàn)一些尖峰。在增強后的語音中,這些尖峰就體現(xiàn)為另一種噪聲:“音樂噪聲”[1]。并且,已經(jīng)有研究表明[2],先驗信噪比估計的較大方差是產(chǎn)生音樂噪聲的根本原因。由此可見,功率譜估計的準確性與語音增強結(jié)果的優(yōu)劣存在著直接的關(guān)系。
如果能找到一種估計更加準確,方差性能更好的功率譜估計法,就可以有效降低音樂噪聲。多窗譜法就具備以上的特點,因此,本文采用多窗譜來估計語音信號的功率譜,并結(jié)合譜減法進行語音增強。
2 多窗譜
多窗譜估計是由Thomson于1982年提出的[3]。傳統(tǒng)的周期圖法只用一個數(shù)據(jù)窗,而Thomson對同一數(shù)據(jù)序列用多個正交的數(shù)據(jù)窗分別求直接譜,然后求平均得到譜估計,因可以得到較小的估計方差。這種思想同Welch提出的改進的周期圖法相似[4]。這多個數(shù)據(jù)窗必須相互正交,以阻止頻譜泄漏。假設有L個數(shù)據(jù)窗,則在理想的情況下,多窗譜估計的方差可以是周期圖法的1/L。可以看出,多窗譜是一種比周期圖法更準確的譜估計方法。
多窗譜定義如下: