張小華,彭首峰,裴 浩
(湖北工業(yè)大學(xué)電氣與電子工程學(xué)院,湖北 武漢430068)
對(duì)語(yǔ)音背景噪聲消除的研究一直是語(yǔ)音信號(hào)處理中的一個(gè)重要研究課題.經(jīng)過(guò)各國(guó)學(xué)者的不懈努力,提出了各種語(yǔ)音降噪方法,這為語(yǔ)音降噪提供了大量的理論基礎(chǔ)并推進(jìn)其逐漸成熟.盲源分離技術(shù)是近年來(lái)發(fā)展起來(lái)的一種新的信號(hào)分離技術(shù),它是在信號(hào)源和信道傳輸參數(shù)未知的條件下,僅通過(guò)傳感器陣列接收到的信號(hào)去估計(jì)出源信號(hào)的過(guò)程.
目前對(duì)盲源分離的研究工作大致能夠分成兩類[1]:一是對(duì)瞬時(shí)混合模型的研究,在各國(guó)學(xué)者的共同努力下,對(duì)這一模型的研究已經(jīng)有很多比較成熟的算法可用;二是對(duì)卷積混合模型的研究,在實(shí)際應(yīng)用情況下,因?yàn)樾盘?hào)在傳輸中易受到各種干擾所導(dǎo)致的傳輸延遲等的影響,傳感器所得到的信號(hào)通常不是簡(jiǎn)單的瞬時(shí)疊加,而是更接近真實(shí)信號(hào)傳輸?shù)木矸e等混合形式,這種模型下的信號(hào)分離目前受到更多的關(guān)注.
麥克風(fēng)采集到的真實(shí)信號(hào)是原始帶噪語(yǔ)音信號(hào)與信道沖擊響應(yīng)的卷積輸出.可以用一個(gè)有限脈沖響應(yīng)(FIR)濾波器來(lái)描述該問(wèn)題[2].設(shè)有N 個(gè)源信號(hào)S(n)= [s1(n),…,sN(n)]T,M 個(gè)麥克風(fēng)采集到的觀測(cè)信號(hào)為 X(n)= [x1(n),…,xM(n)]T,混合濾波器沖擊響應(yīng)階數(shù)為P,則在時(shí)刻n第i個(gè)麥克風(fēng)采集到的信號(hào)能夠表示為
其中aij(p)表示第i個(gè)麥克風(fēng)采集到的第l階信道沖擊響應(yīng)系數(shù).式(1)可以用X(n)=A*S(n)簡(jiǎn)化表示,其中A為濾波器混合矩陣,且
要想根據(jù)采集到的觀測(cè)信號(hào)X(n)獲得源信號(hào)值,就必須找到一個(gè)Q階的分離濾波器wij,使得解卷積后輸出
可以用Y(n)=W*X(n)簡(jiǎn)化表示.
目前對(duì)卷積盲源分離問(wèn)題的處理方法大多是使用短時(shí)傅里葉變換(STFT)將時(shí)域中的卷積分離問(wèn)題轉(zhuǎn)換成多個(gè)頻域中的瞬時(shí)混合盲源分離問(wèn)題[3],這樣可以通過(guò)使用研究較成熟的瞬時(shí)盲源分離算法來(lái)解決分離問(wèn)題.具體的做法如下.
對(duì)得到的觀測(cè)數(shù)據(jù)進(jìn)行長(zhǎng)度為L(zhǎng)的傅里葉變換:
其中ωi=2πl(wèi)/L表示頻率點(diǎn),m表示對(duì)數(shù)據(jù)進(jìn)行長(zhǎng)度為L(zhǎng)的傅里葉變換的段數(shù),記利用瞬時(shí)盲源分離算法獲得觀測(cè)信號(hào)在頻率點(diǎn)ωi上的分離矩陣W(ωi),使得Y(ωi)=W(ωi)X(ωi),式中其中為第m個(gè)子段中源信號(hào)的估計(jì)值的傅里葉變換.然后通過(guò)對(duì)每一段數(shù)據(jù)各頻 點(diǎn) 上 的 值 [Y(ω0,m),Y(ω1,m),Y(ωL-1,m)](m=1,2,…,M)進(jìn)行傅里葉反變換,得到每一個(gè)數(shù)據(jù)段上的時(shí)域估計(jì)值Y(m)(m=1,2,…,珨M),依次將各段時(shí)域估計(jì)值連接起來(lái),就獲得了聲源信號(hào)的估計(jì)值.
由于瞬時(shí)盲源分離算法在信號(hào)分離過(guò)程中存在幅度和排序的不確定性,使得上面提到的方法在進(jìn)行傅里葉反變換前需要解決排序和幅度不確定性問(wèn)題.對(duì)于幅度的調(diào)整,通過(guò)采用將W(ωi)(i=0,1,…,L-1)中對(duì)應(yīng)的行向量歸一化,即W(ωi)←,能夠取得較好的效果.對(duì)于排序的問(wèn)題,Anemuller[4]等學(xué)者經(jīng)研究發(fā)現(xiàn),語(yǔ)音信號(hào)在頻域中表現(xiàn)出同信號(hào)相鄰頻點(diǎn)之間相關(guān)性很強(qiáng),但是不相同信號(hào)相鄰頻點(diǎn)的相關(guān)性較弱,這與人類聲帶所固有的特性有關(guān).設(shè)y1(ωi)和y1(ωi+1)為兩相鄰頻點(diǎn)的值,如果
的值大于設(shè)定的上限閾值,則說(shuō)明兩相鄰信號(hào)具有較強(qiáng)的相關(guān)性,是屬于同一源信號(hào)的兩個(gè)頻點(diǎn)值.反之如果小于設(shè)定的下限閾值,則認(rèn)為不屬于同一源信號(hào),需要重新調(diào)整通道值順序.一般的上限閾值取0.6,下限閾值取0.3[5].
在使用瞬時(shí)算法時(shí),由于處理的數(shù)據(jù)是復(fù)數(shù)形式,所以必須采用能處理復(fù)數(shù)的瞬時(shí)分離算法,現(xiàn)有的復(fù)數(shù)算法主要有復(fù)數(shù)FastICA算法、復(fù)數(shù)infomax算法和JADE算法.這三種算法都具有較好的性能,由于本文下面仿真中使用的是JADE算法,所以下面給出該算法的主要原理和具體的算法步驟.
聯(lián)合近似特征矩陣對(duì)角化(Joint Approximate Diagonalization of Eigenmatrices)是基于四階累積量的盲源分離算法,它聯(lián)合對(duì)角化下面定義的四階協(xié)方差矩陣[6]:
其中只有當(dāng)p=q=u=v時(shí)δ(p,q,u,v)=1,其它情況取0值.λpq是每個(gè)特征矩陣Epq對(duì)應(yīng)的特征值.
一種獲得滿足上面關(guān)系的特征矩陣Epq的方法是通過(guò)估計(jì)特征矩陣,產(chǎn)生N個(gè)四階協(xié)方差矩陣C珔x(Ep),其中是正交陣的第p列是用來(lái)估計(jì)對(duì)角陣的正交陣.為了得到準(zhǔn)確的對(duì)角陣,首先可以通過(guò)Ep=I的特殊四階協(xié)方差矩陣的特征值分解粗略的估計(jì)出它的值:對(duì)N個(gè)四階協(xié)方差矩陣C珔x(Ep)尋找正交陣U,要求它能同時(shí)使各C珔x(Ep)都盡可能對(duì)角化.一種聯(lián)合對(duì)角化的方法是Givens旋轉(zhuǎn)法,即為了使各Λ(Ep)=UTC珔x(Ep)U 盡可能對(duì)角化,用Λ(Ep)中非對(duì)角元素的平方和作為衡量指標(biāo),使下式的值極?。?/p>
JADE算法的具體實(shí)現(xiàn)步驟[7]
1)經(jīng)過(guò)白化后得到預(yù)處理的數(shù)據(jù)珚x(k)=Qx(k).
2)通過(guò)Ep=I得到四階協(xié)方差矩陣C珔x(I),并對(duì)其進(jìn)行特征值分解,得到
4)使用Givens旋轉(zhuǎn)方法,找到一個(gè)正交矩陣U ,使得
的值小于設(shè)定的值.
在matlab上使用語(yǔ)音采集程序采集了5s的帶有背景噪聲的語(yǔ)音信號(hào),并以Wav形式文件保存,采樣頻率為16kHz,數(shù)據(jù)點(diǎn)數(shù)80 000.由于實(shí)驗(yàn)條件有限,將采集到的數(shù)據(jù)做簡(jiǎn)單的類似譜減法處理后作為第二路觀測(cè)數(shù)據(jù),然后將兩路數(shù)據(jù)采用頻域盲源分離算法進(jìn)行處理,其中傅里葉變換數(shù)據(jù)長(zhǎng)度L=256,幀移為1/2.兩路觀測(cè)信號(hào)和分離后的信號(hào)分別如圖1、2所示.
采用matlab自帶的wavplay函數(shù)將分離后的兩路信號(hào)讀出,用人耳聽發(fā)現(xiàn)第一路信號(hào)基本上是背景噪聲,只有少量的語(yǔ)音信號(hào),第二路信號(hào)則剛好相反.這說(shuō)明通過(guò)盲源分離算法基本上能夠?qū)⒈尘霸肼暫驼Z(yǔ)音信號(hào)分離開來(lái),達(dá)到語(yǔ)音降噪的目的.為了得到更清晰的語(yǔ)音信號(hào)可以對(duì)分離出的信號(hào)進(jìn)行小波降噪處理或譜減法降噪處理.
圖1 兩路觀測(cè)信號(hào)
圖2 兩路分離信號(hào)
[1]汪 林.多通道語(yǔ)音信號(hào)處理中的關(guān)鍵技術(shù)研究[D].大連:大連理工大學(xué)圖書館,2010.
[2]張 華,馮大政,龐繼勇.卷積混迭語(yǔ)音信號(hào)的聯(lián)合塊對(duì)角化盲源分離方法[J].聲學(xué)學(xué)報(bào),2009,34(2):167-174.
[3]徐 舜,陳紹榮,劉郁林.卷積混合語(yǔ)音的聯(lián)合塊對(duì)角化盲源分離算法[J].振動(dòng)與沖擊,2007,26(8):86-90.
[4]Anemuller J,Kollmeier B.Amplitude modulation decorrelation for convolutive blind source separation[A]// Proc.of ICA2000 [C].Helsinki:Finland,2000:215-220.
[5]姜衛(wèi)東,陸佶人,張宏滔,等.基于相鄰頻點(diǎn)幅度相關(guān)的語(yǔ)音信號(hào)盲源分離[J].電路與系統(tǒng)學(xué)報(bào),2005,10(3):1-4.
[6]李昌利.盲源分離的若干算法及應(yīng)用研究[D].西安:西安電子科技大學(xué)圖書館,2010.
[7]許鵬飛.卷積混合數(shù)字通信信號(hào)的盲源分離[D].西安:西安電子科技大學(xué)圖書館,2010.