張 健,李白燕
(黃淮學(xué)院 信息工程學(xué)院,河南 駐馬店 463000)
盲源分離技術(shù)是信號(hào)處理一種重要方法,近年來(lái)取得了快速的發(fā)展,并廣泛的應(yīng)用于生物醫(yī)學(xué)工程、醫(yī)學(xué)圖像、遙感、通信系統(tǒng)、探測(cè)地震學(xué)、地球物理學(xué)、數(shù)據(jù)挖掘等數(shù)據(jù)的處理。盲源分離(Blind Source Separation,BSS)是指在源信號(hào)和混合參數(shù)等先驗(yàn)知識(shí)未知的情況下,僅從觀測(cè)到的混合信號(hào)中提取或恢復(fù)出源信號(hào)的技術(shù)。由于盲信號(hào)處理需要的先驗(yàn)信息很少,使得其具有極強(qiáng)的適應(yīng)性和廣闊的應(yīng)用領(lǐng)域。在這樣的背景之下,有關(guān)盲信號(hào)處理的研究一直是信號(hào)處理領(lǐng)域和神經(jīng)網(wǎng)絡(luò)領(lǐng)域的研究熱點(diǎn)。盲源分離技術(shù)為噪聲和語(yǔ)音的分離提供了可能,從而使得噪聲環(huán)境下和眾多講話人情形下的語(yǔ)音識(shí)別的實(shí)現(xiàn)成為可能,增大了識(shí)別算法的魯棒性和適應(yīng)能力。本文研究基于WVD分布與聯(lián)合對(duì)角化的盲分離方法,通過(guò)仿真實(shí)驗(yàn),結(jié)果表明該算法能夠?qū)崿F(xiàn)從混合信號(hào)中將源信號(hào)降序分離出來(lái),且具有很高的分離精度。
盲源分離就是指在信號(hào)的理論模型和源信號(hào)無(wú)法精確獲知的情況下,如何從混迭信號(hào)(觀測(cè)信號(hào))中分離出各源信號(hào)的過(guò)程。源信號(hào)之間是彼此相互獨(dú)立的。n維源信號(hào)矢量s(t)=[s1(t),s2(t),…,sn(t)]T經(jīng)混合系統(tǒng)混合后由一組傳感器采集得到 m 維觀測(cè)信號(hào)矢量 x(t)=[x1(t),x2(t),…,xm(t)]T,如圖1所示。每個(gè)傳感器接收到的都是多個(gè)源信號(hào)的混合,盲源信號(hào)分離就是利用源信號(hào)之間的相互獨(dú)立性,在不知道源信號(hào)和傳輸信道特性的情況下,從若干觀測(cè)到的混合信號(hào)中分離、提取、恢復(fù)出各個(gè)源信號(hào)的波形。通過(guò)觀測(cè)信號(hào)求解一個(gè)分離系統(tǒng),使得該分離系統(tǒng)在輸入為觀測(cè)信號(hào)x(t)時(shí),輸出 y(t)=[y1(t),y2(t),…,yn(t)]T為源信號(hào)的估計(jì),并使其最大限度的與源信號(hào)相似。盲源分離系統(tǒng)模型如圖2所示。
圖1 源信號(hào)混合過(guò)程示意圖Fig.1 Source signal mixing process diagram
圖2 盲源信號(hào)分離系統(tǒng)模型Fig.2 System model of blind source separation
魏格納分布(Wigner-Ville Distribution,WVD)是能夠表征信號(hào)能量分布的二次型時(shí)頻分布中最基本最重要的方法。其具有雙線性變換且不含任何窗函數(shù),它是一種最典型和常用的二次聯(lián)合時(shí)頻分布。是時(shí)間和頻率的二元函數(shù)。信號(hào)的維格納分布定義為:
其中,Z(w)是 s(t)的頻譜函數(shù),Z*(t)是 z(t)的復(fù)值共軛形式。
由于WVD可以表示瞬時(shí)頻率隨時(shí)間的變化情況,WVD的頻域表示為:
當(dāng)噪聲為零時(shí),源信號(hào)的 WVD 矩陣為 WVDs(t,f),觀測(cè)信號(hào)的WVD矩陣為WVDx(t,f)。源信號(hào)與混疊信號(hào)的矩陣關(guān)系為:
矩陣 WVDs(t,f)的對(duì)角線元素為自分布項(xiàng),非對(duì)角線元素為交叉項(xiàng),而對(duì)于真正的能量聚集t-f點(diǎn),矩陣為WVDs(t,f)對(duì)角陣。
聯(lián) 合 對(duì) 角 化 算 法 (Joint Approximate Digitalization of Eigen-matrices,JADE)是解決線性瞬時(shí)模型盲分離問(wèn)題的一個(gè)有效的工具,特別適合正常與超定的盲分離模型。JADE算法對(duì)接收到的混疊信號(hào),為了把求混疊矩陣A的過(guò)程轉(zhuǎn)化為求酉矩陣U,首先需要進(jìn)行預(yù)白化處理,通過(guò)聯(lián)合對(duì)角化一組觀測(cè)信號(hào)的矩陣得到酉矩陣U。
當(dāng)噪聲為零的情況下,混疊信號(hào)的自相關(guān)矩陣RX滿足:
把混疊信號(hào)預(yù)白化處理:用一個(gè)白化矩陣W乘以X(t),W滿足:
對(duì)于任一白化矩陣W,都存在一個(gè)酉矩陣U,使得成立WA=U。選擇適當(dāng)?shù)臅r(shí)頻域中的點(diǎn),利用混疊信號(hào)的時(shí)頻分布矩陣求得U,則混疊矩陣A可表示為:
白化后的混疊信號(hào)即為源信號(hào)的酉矩陣混疊。白化后的觀測(cè)矢量的線性模型為:
在各個(gè)源信號(hào)互不相關(guān)時(shí),自相關(guān)矩陣為:
由式(4)可知W*W=R-1x,即白化矩陣可由混疊信號(hào)的自相關(guān)陣Rx求得。求得白化矩陣后可得白化的矩陣:
根據(jù)式(6),式(7),式(10)可寫作:
由于矩陣 WVDs(t,f)是對(duì)角化的,故由上式可見(jiàn),U 可作為使 WVDz(t,f)對(duì)角化的酉矩陣求出。
算法實(shí)現(xiàn)流程如圖3所示。
圖3 算法實(shí)現(xiàn)流程圖Fig.3 The algorithm flowchart
算法實(shí)現(xiàn)步驟:
1)由n路源語(yǔ)音信號(hào)S(t)通過(guò)檢測(cè)得m路混合語(yǔ)音信號(hào) X(t)。
3)對(duì)觀測(cè)數(shù)據(jù)進(jìn)行白化。根據(jù)混疊信號(hào)的自相關(guān)陣W*W=R-1x,估計(jì)得白化矩陣W。
4)求酉矩陣U。計(jì)算混合語(yǔ)音信號(hào)的WVD矩陣,聯(lián)合對(duì)角化混合語(yǔ)音信號(hào)的的WVD矩陣WVDs(t,f)以得到U。
5)估計(jì)混疊矩陣 A 和源信號(hào) S(t)。 通過(guò)S^=U*WX(t)估計(jì)出源信號(hào),混疊矩陣A的估計(jì)式為A^=W*U。
為了檢驗(yàn)分離信號(hào)與源信號(hào)的相似程度及算法的性能,通常有相似系數(shù)、性能指數(shù)和信噪比等評(píng)價(jià)指標(biāo)。
1)相似系數(shù)
以分離輸出信號(hào)yi與源信號(hào)sj的相關(guān)系數(shù)為例,定義相似系數(shù)為:
若rij=1,說(shuō)明第i個(gè)分離出的信號(hào)與第j個(gè)源信號(hào)完全相同,這是理想的分離效果。但是由于估計(jì)誤差是不可避免的,因此分離完成后rij的值只能接近于1。在仿真實(shí)驗(yàn)中,若在由相似系數(shù)構(gòu)成的相似系數(shù)矩陣中,每一行每一列有且僅有一個(gè)元素接近于1,而其余元素都接近于0時(shí),可認(rèn)為該算法分離效果比較理想。
2)性能指數(shù)(Performance Index, PI)
算法的性能指數(shù)是混合-分離矩陣和全局矩陣之間的差別,定義為:
其中g(shù)為全局矩G (G=WA)陣元素,maxj|gij|是G的第i行元素中的絕對(duì)值最大值,maxj|gij|是第i列元素絕對(duì)值的最大值??梢钥闯鲂阅苤笖?shù)PI是一個(gè)不小于零的數(shù),當(dāng)分離出的信號(hào) y(t)與源信號(hào) s(t)波形完全相同時(shí),PI=0。 實(shí)際中,由于各種干擾因素和誤差的存在,當(dāng)PI的值接近10-2時(shí),說(shuō)明該算法的性能已非常良好。
當(dāng)信號(hào)的盲源分離算法是通過(guò)不斷的迭代使混合-分離矩陣逐漸收斂于廣義排列矩陣,因此可以通過(guò)計(jì)算每一步迭代得到的性能指數(shù),了解算法的收斂速度。
3)信噪比(SNR)
分離后的信號(hào)與源信號(hào)之間信噪比的定義式為:
分離后計(jì)算出的信噪比越大,說(shuō)明分離效果越好,算法的性能優(yōu)異。
本實(shí)驗(yàn)通過(guò)相似系數(shù)矩陣與性能指數(shù)來(lái)驗(yàn)證本算法的性能,評(píng)價(jià)分離效果,實(shí)驗(yàn)選取頻率為11 030 Hz、數(shù)據(jù)長(zhǎng)度為3 000點(diǎn)的語(yǔ)音源信號(hào),分別記作s1,s2和s3,在噪聲功率為零時(shí),采用矩陣路源語(yǔ)音信號(hào)通過(guò)混合矩陣混合后得到的四路混合語(yǔ)音信號(hào)后,求得混合語(yǔ)音信號(hào)的WVD矩陣,自相關(guān)矩陣RX,白化矩陣W,再通過(guò)聯(lián)合對(duì)角化的方法計(jì)算出酉矩陣U,計(jì)算得到的混疊矩陣A的值。從而恢復(fù)出源信號(hào)。各個(gè)矩陣的值如表1所示。
表1 仿真實(shí)驗(yàn)過(guò)程中的各個(gè)矩陣的值Tab.1 The value of each matrix during the simulation
1)計(jì)算信噪比。觀察表1可知,估計(jì)出的混疊矩陣和混疊矩陣相比較差距很小,計(jì)算分離后的信號(hào)與源信號(hào)之間的信噪比,SNR(yi)=28 dB,說(shuō)明本文的算法分離效果較好,對(duì)解決含多個(gè)高斯信號(hào)的超定盲分離問(wèn)題時(shí)是有效的。
2)抗噪性能驗(yàn)證。分別在混合語(yǔ)音信號(hào)中加入不同信噪比的白噪聲做對(duì)比試驗(yàn)。當(dāng)混合語(yǔ)音信號(hào)中混有不同功率的白噪聲時(shí),分離后分離信號(hào)與源信號(hào)的性能指數(shù)如表2所示。
表2 混有不同信噪比白噪聲情況下的評(píng)價(jià)指標(biāo)Tab.2 The mixed speech signals with white noise of different SNRs
通過(guò)對(duì)表2中不同白噪聲信噪比進(jìn)行比較,可以看出,當(dāng)混合語(yǔ)音信號(hào)中不含噪聲時(shí),計(jì)算得到的性能指數(shù)與相似系數(shù)矩陣都比較理想,說(shuō)明分離效果很好;從觀測(cè)性能指數(shù)與相似系數(shù)矩陣可以看出,當(dāng)白噪聲信噪比低于20 dB時(shí),該算法也能分離出比較理想的源信號(hào)。仿真實(shí)驗(yàn)表明該算法具有良好的抗噪性。
基于魏格納分布與聯(lián)合對(duì)角化的盲分離算法,對(duì)超定混合的語(yǔ)音信號(hào)的分離,首先對(duì)混疊語(yǔ)音信號(hào)進(jìn)行預(yù)白化,計(jì)算其WVD分布矩陣,用聯(lián)合對(duì)角化算法估計(jì)出混疊矩陣和源語(yǔ)音信號(hào),仿真實(shí)驗(yàn)結(jié)果表明該方法在信噪比低于20 dB的噪聲環(huán)境中也能有效的將混疊的盲語(yǔ)音信號(hào)分離,該算法具有良好的抗噪性能。
[1]孫守宇.盲信號(hào)處理基礎(chǔ)及應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2010.
[2]楊福生,洪波.獨(dú)立分量分析的原理與應(yīng)用[M].北京:清華大學(xué)出版社,2006.
[3]Hiroshi S,Shoko A,Shoji M.Underdetermined convolutive blind source separation via frequency Bin-Wise clustering and permutation alignment[J].IEEE Transactions on Audio,Speech, and Language Processing,2011,19(3):516-527.
[4]張倩蓉,王新新.混合語(yǔ)音信號(hào)的盲分離[J].山西電子技術(shù),2008(1):16-17.ZHANG Qian-rong,WANG Xin-xin.Blind source separation for mixed speech signal[J].Shanxi Electronic Technology,2008(1):16-17.
[5]徐麗琴,何曉川.一種有效的語(yǔ)音信號(hào)盲分離方法[J].現(xiàn)代電子技術(shù),2010(19):87-89,93.XU Li-qin,HE Xiao-chuan.Effective method of blind separation for speech signal[J].Modern Electronics Technique,2010(19):87-89,93.
[6]徐歡.基于獨(dú)立分量分析的瞬時(shí)混合語(yǔ)音信號(hào)盲分離算法研究[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010(11):99-100.XU Huan.Research on the blind source separation algorithm of instantaneously mixed speech signals based on ICA(Independent Component Analysis)[J].Sci-Tech Information Development&Economy ,2010(11):99-100.
[7]Zhou G X,Yang Z Y,Xie SL.Mixing matrix estimation from sparse mixtures with unknown number of sources[J].IEEE Transactions on Neural Networks,2011,22(2):211-221.