陳建明 楊 龍
(裝甲兵工程學(xué)院信息工程系 北京 100072)
基于總體平均經(jīng)驗(yàn)?zāi)B(tài)分解的語(yǔ)音增強(qiáng)算法研究
陳建明 楊 龍
(裝甲兵工程學(xué)院信息工程系 北京 100072)
總體平均經(jīng)驗(yàn)?zāi)B(tài)分解EEMD(Ensemble Empirical Mode Decomposition)雖然能夠在一定程度上抑制模態(tài)混淆,但添加的白噪聲不能被完全中和,對(duì)所有本征模態(tài)函數(shù)IMF(Intrinsic Mode Function)分量進(jìn)行集成平均等增加了計(jì)算工作量?;贓EMD和結(jié)合小波閾值去噪思想,提出改進(jìn)的EEMD方法。首先對(duì)原始信號(hào)進(jìn)行EEMD分解,得到一系列IMF分量;其次對(duì)篩選后的每個(gè)IMF計(jì)算噪聲強(qiáng)度;然后采用小波啟發(fā)式閾值估計(jì)噪聲并計(jì)算閾值;最后以軟閾值的方式濾除每個(gè)IMF中噪聲并重構(gòu)信號(hào)還原出增強(qiáng)的語(yǔ)音。通過(guò)分析仿真信號(hào)和實(shí)測(cè)信號(hào),結(jié)果表明:該算法對(duì)帶噪語(yǔ)音有很好的濾波效果,與其他同類算法相比提高信噪比2~4 dB。
總體平均經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD) 小波閾值去噪 語(yǔ)音增強(qiáng)算法
20世紀(jì)60年代,人們對(duì)語(yǔ)音通信質(zhì)量有了更高的要求,語(yǔ)音增強(qiáng)技術(shù)成為了研究的熱點(diǎn),多種語(yǔ)音增強(qiáng)算法不斷涌現(xiàn)。從70年代開始,研究者以語(yǔ)音生成模型為基礎(chǔ),根據(jù)短時(shí)平穩(wěn)性相繼提出了一些常用的傳統(tǒng)語(yǔ)音增強(qiáng)算法,如譜相減法、自適應(yīng)濾波法等。之后,研究者采用統(tǒng)計(jì)模型來(lái)估計(jì)語(yǔ)音信號(hào)譜,此類算法增強(qiáng)效果相對(duì)較好,但是需要先驗(yàn)性經(jīng)驗(yàn)和訓(xùn)練數(shù)據(jù)且計(jì)算量偏大,處理時(shí)間長(zhǎng),因此,常用于信號(hào)識(shí)別處理。80年代,小波變換理論日趨成熟,研究者將研究重心轉(zhuǎn)移到更適合非平穩(wěn)信號(hào)分析的小波變換上。1998年,美籍華人Huang等創(chuàng)造性地提出一種新的信號(hào)處理方法——經(jīng)驗(yàn)?zāi)B(tài)分解EMD(Empirical Mode Decomposition)[1]。該方法實(shí)現(xiàn)了對(duì)非平穩(wěn)信號(hào)的平穩(wěn)化處理,不但具有小波變換的多頻率分辨率,且具有良好的自適應(yīng)特性。雖然EMD對(duì)非平穩(wěn)信號(hào)的分解有諸多優(yōu)勢(shì),但是為了能夠?qū)崿F(xiàn)最優(yōu)的分解效果且最大限度地保留原信號(hào)的信息,在利用EMD進(jìn)行語(yǔ)音信號(hào)處理的時(shí)候必須要克服EMD最容易發(fā)生端點(diǎn)效應(yīng)和混疊效應(yīng)問(wèn)題。針對(duì)EMD產(chǎn)生的混疊效應(yīng)問(wèn)題,Wu和Huang在2009年提出了總體平均經(jīng)驗(yàn)?zāi)B(tài)分解EEMD方法[2-3],EEMD是針對(duì)在EMD基礎(chǔ)上通過(guò)噪聲輔助產(chǎn)生的改進(jìn)算法來(lái)克服模態(tài)混疊問(wèn)題。EEMD在信號(hào)分解與檢測(cè)、故障診斷、信號(hào)預(yù)測(cè),以及語(yǔ)音去噪等許多領(lǐng)域都有較大的應(yīng)用[4-8],在使用中學(xué)者為了解決本領(lǐng)域的信號(hào)處理問(wèn)題,提出了許多改進(jìn)的EEMD算法。文獻(xiàn)[9]成對(duì)地添加符號(hào)相反的白噪聲到目標(biāo)信號(hào),大大減小了重構(gòu)誤差;文獻(xiàn)[10] 通過(guò)提取信號(hào)中的高頻成分來(lái)確定加入白噪聲的幅值,再根據(jù)減小白噪聲影響的統(tǒng)計(jì)規(guī)律得到總體平均次數(shù),然后引入有限帶寬高斯白噪聲,實(shí)現(xiàn)對(duì)信號(hào)的快速準(zhǔn)確分解;文獻(xiàn)[11] 以極值點(diǎn)分布特性為評(píng)價(jià)參數(shù),自適應(yīng)確定EEMD方法中高斯白噪聲優(yōu)化幅值;文獻(xiàn)[12]結(jié)合時(shí)域航空電磁信號(hào)的衰減特性,采用 Savitzky-Golay平滑濾波完成對(duì)時(shí)域航空電磁信號(hào)降噪;文獻(xiàn)[13] 采用“3σ法則”,對(duì)含噪信號(hào)先“粗篩”后進(jìn)行“細(xì)篩”等實(shí)現(xiàn)對(duì)低信噪比下的諧波檢測(cè)。這些算法針對(duì)各領(lǐng)域的信號(hào)特性,采用多種組合方法,克服EEMD混疊效應(yīng)問(wèn)題達(dá)到去噪的目的。本文在EEMD的基礎(chǔ)上,結(jié)合小波分解軟閾值的思想,采用啟發(fā)式閾值計(jì)算的方法,提出了基于EEMD的改進(jìn)算法。該算法的啟發(fā)式閾值去噪對(duì)帶噪語(yǔ)音信號(hào)具有自適應(yīng)性,有較好的濾波效果,與其他同類算法相比提高信噪比2~4 dB,能滿足實(shí)際應(yīng)用需要。
根據(jù)Huang對(duì)于EMD引入白噪聲改進(jìn)的思想,可將改進(jìn)后的EEMD的原理[14]歸納如下:
1) 對(duì)待分解的信號(hào)x(t)加入一組白噪聲wi(t)(i=1-N,N為次數(shù)),構(gòu)成一個(gè)總體X(t)。
Xi(t)=x(t)+wi(t)
(1)
2) 對(duì)式(1)中生成的總體Xi(t)進(jìn)行EMD分解,得到每個(gè)IMFj(j=1-K)分量。
(2)
式中cij(t) 為第i次加入白噪聲后,分解得到的第j個(gè)IMF。
3) 重復(fù)步驟1)~2),每次加入不同的白噪聲。
4) 取相應(yīng)的IMF的均值作為最終的IMF組。
(3)
對(duì)于EEMD來(lái)說(shuō),在噪聲幅度一定的條件下,總體個(gè)數(shù)越多,則平均后所得的IMFs越接近真實(shí)信號(hào)分量。但是需要注意如果加入的噪聲幅度過(guò)小,信噪比較高,則噪聲將無(wú)法影響極值點(diǎn)的選取,從而加入的白噪聲失去了彌補(bǔ)尺度的作用,因此無(wú)法克服模態(tài)混疊的作用而適得其反。
帶噪語(yǔ)音通過(guò)EEMD分解到不同的時(shí)間尺度上,因而整個(gè)信號(hào)的振動(dòng)模態(tài)可根據(jù)頻率的高低依次呈現(xiàn)在不同的IMF上,這樣可以直觀地看到語(yǔ)音和噪聲在不同尺度上的具體表現(xiàn)。通常,語(yǔ)音信號(hào)的主要信息大多分布在較大的時(shí)間尺度且有限個(gè)IMF中,因此,對(duì)所需的IMFs重構(gòu)來(lái)還原信號(hào)可為后續(xù)的信號(hào)處理提供有效支撐。
2.1 小波閾值去噪原理
語(yǔ)音根據(jù)其信號(hào)特征可知能量集中,從而通過(guò)小波分解后所得的小波系數(shù)較大;而噪聲能量通常比較分散,分解所得的小波系數(shù)較小且隨著分解尺度的增大,噪聲分解后的小波系數(shù)越小,即噪聲分量主要分布在小尺度的小波系數(shù)中。基于此,利用閾值的思想將噪聲系數(shù)進(jìn)行限制,只保留信號(hào)的小波系數(shù)以達(dá)到去噪的目的。閾值去噪的實(shí)現(xiàn)思想即對(duì)大于和小于閾值的小波系數(shù)作不同的處理。通常,閾值函數(shù)分為硬閾值和軟閾值[15]。
硬閾值定義為:
(4)
軟閾值定義為:
(5)
1) 固定閾值
(6)
式中,σ表示噪聲強(qiáng)度的估計(jì),由噪聲的方差求得,N表示分解系數(shù)的長(zhǎng)度。在EMD分解的前提下,σ的求得公式如下:
(7)
式中,j表示EMD分解尺度的序數(shù),N為IMF的長(zhǎng)度。
2) 無(wú)偏似然估計(jì)閾值
其步驟為:先對(duì)信號(hào)中所有數(shù)據(jù)的絕對(duì)值按照由小到大的順序排列,然后對(duì)排列好的數(shù)據(jù)依次求平方得到新的數(shù)據(jù)序列,表示為:
sx2(k)=(sort(x(n)))2k=1,2,…,N
(8)
若選取閾值為式(8)產(chǎn)生的序列中的第k個(gè)值,則可表示為:
(9)
而這第k個(gè)值作為閾值所產(chǎn)生的風(fēng)險(xiǎn)可表示為:
(10)
根據(jù)式(10)可獲得風(fēng)險(xiǎn)曲線,其中風(fēng)險(xiǎn)最小的點(diǎn)所對(duì)應(yīng)的值則為無(wú)偏估計(jì)的閾值,可表示為:
(11)
3) 啟發(fā)式閾值
該閾值綜合了前兩種閾值計(jì)算的思想,啟發(fā)式的選取最優(yōu)預(yù)測(cè)的閾值,具體公式如下:
(12)
(13)
根據(jù)式(12)和式(13),當(dāng)μ<ν時(shí),信噪比較低,采用固定閾值,反之,采用無(wú)偏似然估計(jì)閾值。
根據(jù)語(yǔ)音信號(hào)的非線性非平穩(wěn)特性,啟發(fā)式閾值具有固定閾值和無(wú)偏似然閾值兩種估計(jì)的優(yōu)勢(shì),可根據(jù)信號(hào)的特性自發(fā)進(jìn)行估計(jì)。因此,本文采用的類小波閾值的閾值選取方法為啟發(fā)式閾值。
2.2 基于EEMD的類小波軟閾值語(yǔ)音增強(qiáng)
由以上描述可知,帶噪語(yǔ)音中的語(yǔ)音信號(hào)和噪聲信號(hào)根據(jù)其特性在EEMD分解后,語(yǔ)音信號(hào)隨著分解尺度的增加,有效的語(yǔ)音分量體現(xiàn)的越多,而噪聲的分量隨著分解尺度的增加所占的信息不斷減少,尤其對(duì)于含有大量高頻分量的噪聲特別有效。通過(guò)選取適當(dāng)?shù)腎MF,即提取出可用的分解尺度上的信號(hào)分量進(jìn)行重構(gòu),可有效去除無(wú)用的噪聲分量。
在去除無(wú)用的IMF基礎(chǔ)上,本文提出了小波閾值思想設(shè)定閾值來(lái)消除噪聲。改進(jìn)的算法的具體步驟可表示為:
步驟1首先對(duì)原始信號(hào)進(jìn)行EEMD分解,得到一系列IMF分量;
步驟2對(duì)篩選后的每個(gè)IMF用式(7)計(jì)算噪聲強(qiáng)度;
步驟3采用小波啟發(fā)式閾值估計(jì)噪聲并計(jì)算閾值;
步驟4以軟閾值用式(5)的方式濾除每個(gè)IMF中噪聲;
步驟5重構(gòu)信號(hào)并還原出增強(qiáng)的語(yǔ)音。
3.1 實(shí)驗(yàn)素材
實(shí)驗(yàn)采用的純凈語(yǔ)音為男聲“裝甲兵工程學(xué)院”。其采樣頻率為8 kHz,參考噪聲來(lái)自NoiseX92噪聲庫(kù),以坦克內(nèi)部噪聲m109進(jìn)行仿真實(shí)驗(yàn)。
1) 純凈語(yǔ)音的時(shí)頻信息
純凈男聲“裝甲兵工程學(xué)院”的時(shí)域波形、FFT譜和語(yǔ)譜圖如圖1所示,從FFT譜中可以看出語(yǔ)音信號(hào)的頻率范圍在20 Hz~8 kHz,從頻譜中可知該語(yǔ)音的頻率主要集中在1 k~4 kHz,以中低頻為主。
圖1 純凈語(yǔ)音男聲的時(shí)域波形、FFT譜和頻譜
2) 噪聲m109的時(shí)頻信息
噪聲m109的時(shí)域波形和頻譜如圖2所示,噪聲m109是時(shí)速30 km/h行駛的M109坦克的內(nèi)部背景噪聲。從圖2中可看出噪聲幅值和頻率均呈現(xiàn)一定的機(jī)動(dòng)性,m109噪聲的頻率幾乎全部集中在1 kHz以下,但是還有部分高頻分量,在5 kHz、8 kHz、9 kHz附近有所體現(xiàn)。
圖2 噪聲m109的時(shí)域波形和頻譜
3.2 仿真結(jié)果與分析
為了測(cè)試本文提出的基于EEMD的類小波軟閾值語(yǔ)音增強(qiáng)算法的性能,現(xiàn)將上節(jié)的純凈語(yǔ)音和參考噪聲合成0 dB和5 dB的帶噪語(yǔ)音進(jìn)行仿真實(shí)驗(yàn),并以目前常用的LMS和MMSE語(yǔ)音增強(qiáng)算法作為參考進(jìn)行對(duì)比。
1) SNR=0時(shí)的仿真結(jié)果
圖3和圖4為在m109噪聲條件下通過(guò)本文算法得到的增強(qiáng)后語(yǔ)音的時(shí)域波形和頻譜,從帶噪語(yǔ)音的頻譜來(lái)看,中高頻都受到噪聲的干擾,原語(yǔ)音信號(hào)的低頻部分受到更大的影響。從增強(qiáng)后的頻譜來(lái)看,中高頻的噪聲影響被有效的抑制,而低頻的影響也由閾值限定有效去除。
圖3 m109(SNR=0)生成帶噪語(yǔ)音波形及EEMD分解結(jié)果
圖4 m109(SNR=0)噪聲下本文算法增強(qiáng)后語(yǔ)音時(shí)域波形和語(yǔ)音頻譜
圖5為L(zhǎng)MS的增強(qiáng)仿真結(jié)果,從時(shí)域波形上可以顯示出對(duì)噪聲有一定的抑制,但是頻譜上呈現(xiàn)的增強(qiáng)效果不太明顯。圖6為MMSE的增強(qiáng)結(jié)果,從時(shí)域和頻譜的仿真結(jié)果來(lái)看,增強(qiáng)效果不錯(cuò),頻譜上高頻有少許噪點(diǎn),但對(duì)于原始語(yǔ)音的還原度很好。
圖5 m109(SNR=0)噪聲下LMS語(yǔ)音增強(qiáng)時(shí)域波形和頻譜
圖6 m109(SNR=0)噪聲下MMSE語(yǔ)音增強(qiáng)時(shí)域波形和頻譜
2) SNR=5 dB的仿真結(jié)果
圖7(a)為m109噪聲在SNR=5條件下通過(guò)本文算法得到的增強(qiáng)后語(yǔ)音頻譜,通過(guò)頻譜可發(fā)現(xiàn)本文算法去噪效果有效。圖7(b)和(c)為L(zhǎng)MS和MMSE的增強(qiáng)結(jié)果,相比較于SNR=0的情況下,增強(qiáng)效果有所改善。
圖7 m109(SNR=5)噪聲下本文算法、LMS、MMSE后語(yǔ)音增強(qiáng)頻譜
通過(guò)上述SNR=5條件下的頻譜圖可以看出,本文算法對(duì)高頻噪聲的濾除非常有效,但是可能導(dǎo)致高頻的分量過(guò)少影響可懂度。從增強(qiáng)效果來(lái)講,本文算法優(yōu)于MMSE和LMS,表1為SNR=5時(shí)的三種算法實(shí)驗(yàn)的信噪比結(jié)果。
表1 三種算法增強(qiáng)后輸出信噪比結(jié)果
從仿真實(shí)驗(yàn)看,由于采用EEMD的濾波特性,對(duì)于噪聲而言,對(duì)高頻的去噪效果非常顯著,從圖中的三種方法的頻譜對(duì)比可知,噪聲頻率相對(duì)在低頻范圍。如圖7所示,本文算法信噪比改善的效果要好于LMS和MMSE,但是從頻譜上來(lái)看,過(guò)多的高頻分量被濾除,導(dǎo)致可懂度有所下降。
從EEMD分解圖中,噪聲根據(jù)參考尺度明顯分解至中頻或低頻部分,從而需通過(guò)小波軟閾值進(jìn)一步濾除,在增強(qiáng)后的語(yǔ)音中還會(huì)殘存一部分噪聲分量。
利用本文算法還對(duì)NoiseX92噪聲庫(kù)中的餐廳噪聲babble、F16艙內(nèi)噪聲f16、軍用車輛噪聲leopard等進(jìn)行了仿真實(shí)驗(yàn),結(jié)果表明該算法與其他同類算法相比提高信噪比2~4 dB,對(duì)帶噪語(yǔ)音有很好的濾波效果。
[1] Huang N E,Shen Z,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A Mathematical Physical & Engineering Sciences,1998,454(1971):903-995.
[2] Huang N E,Wu Z.A review on Hilbert-Huang transform: Method and its applications to geophysical studies[J].Reviews of Geophysics,2008,46(2):RG2006.
[3] Wu Zhaohua,Huang N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.
[4] Franzke C.Long-range dependence and climate noise characteristics of Antarctic temperature data[J].Journal of Climate,2010,23(22):6074-6081.
[5] Lei Y,He Z,Zi Y.Application of the EEMD method to rotor fault diagnosis of rotating machinery[J].Mechanical Systems & Signal Processing,2009,23(4):1327-1338.
[6] 李海濤,王成國(guó),許躍生,等.基于EEMD的軌道—車輛系統(tǒng)垂向動(dòng)力學(xué)的時(shí)頻分析[J].中國(guó)鐵道科學(xué),2007,28(5):24-30.
[7] Lotfi S,Jaouher Ben A,Farhat F.Bi-spectrum based-EMD applied to the non-stationary vibration signals for bearing faults diagnosis[J].Isa Transactions,2014,53(5):1650-1660.
[8] 張彥霞,肖清泰,徐建新,等.基于經(jīng)驗(yàn)?zāi)B(tài)分解的小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(10):284-287.
[9] 鄭近德,程軍圣,楊宇.改進(jìn)的EEMD算法及其應(yīng)用研究[J].振動(dòng)與沖擊,2013,32(21):21-26.
[10] 何星,王宏力,姜偉.改進(jìn)的自適應(yīng)EEMD方法及其應(yīng)用[J].系統(tǒng)仿真學(xué)報(bào),2014,26(4):869-873.
[11] 孔德同,劉慶超,雷亞國(guó),等.一種改進(jìn)的EEMD方法及其應(yīng)用研究[J].振動(dòng)工程學(xué)報(bào),2015,28(6):1015-1021.
[12] 張婷,李雙田.改進(jìn)的EEMD算法在時(shí)域航空電磁信號(hào)降噪中的研究[J].信號(hào)處理,2016,32(7):771-778.
[13] 孫曙光,龐毅,王景芹.改進(jìn)的EEMD去噪方法及其在諧波檢測(cè)中的應(yīng)用研究[J].電工電能新技術(shù),2016,35(4):67-74.
[14] 張梅軍,唐建,何曉暉.EEMD方法及其在機(jī)械故障診斷中的應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2015.
[15] 王蓓,張根耀,李智.新小波閾值函數(shù)在醫(yī)學(xué)圖像去噪中的應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014,23(7):175-179.
RESEARCHOFSPEECHENHANCEMENTALGORITHMBASEDONENSEMBLEEMPIRICALMODEDECOMPOSITION
Chen Jianming Yang Long
(DepartmentofInformationEngineering,AcademyofArmoredForceEngineering,Beijing100072,China)
Ensemble Empirical Mode Decomposition (EEMD) can restrain mode mixing of EMD at a certain level, however, the calculation amount of all ensemble IMF (Intrinsic Mode Function) grows due to the white noise unneutralized completely. Therefore, based on EEMD and wavelet soft threshold, we presented a modified EEMD algorithm for speech enhancement. First, the original signal was decomposed using EEMD, and a series of IMFs were acquired; second, noise intensity of the each screened IMF was calculated; third, using wavelet heuristic threshold method, the noise was estimated and the threshold was calculated; finally, noise of every IMF was filtered with wavelet soft threshold method, and speech signal was restructured. By analyzing the simulation signal and the measured signal, we show that the algorithm has a good filtering effect on the speech enhancement, and improves the SNR 2 ~ 4dB compared with other similar algorithm.
Ensemble empirical mode decomposition(EEMD) Wavelet soft threshold Speech enhancement algorithm
TP319 TN911.7
A
10.3969/j.issn.1000-386x.2017.09.064
2016-11-24。陳建明,教授,主研領(lǐng)域:信號(hào)與信息處理。楊龍,助教。