董天寶,程雷,楊景曙
1.電子工程學(xué)院702室,合肥 230037
2.總參陸航部軍代局,北京 100050
基于時(shí)頻單源點(diǎn)的欠定混合矩陣估計(jì)
董天寶1,程雷2,楊景曙1
1.電子工程學(xué)院702室,合肥 230037
2.總參陸航部軍代局,北京 100050
盲源分離主要研究在混合信道和源信號(hào)都未知的情況下如何從觀測(cè)信號(hào)分離出源信號(hào),已經(jīng)在許多領(lǐng)域取得了較好的應(yīng)用。當(dāng)傳感器個(gè)數(shù)小于源信號(hào)個(gè)數(shù)時(shí)的盲源分離稱為欠定盲源分離,是近幾年盲信號(hào)處理領(lǐng)域的一個(gè)熱點(diǎn)研究問(wèn)題。欠定盲源分離問(wèn)題的線性瞬時(shí)混合模型可以表示為:
其中,x(t)=[x1(t),x2(t),…,xM(t)]Τ表示在時(shí)刻t大小為M×1的觀測(cè)信號(hào)矢量,A=[a1,a2,…,aN]∈RM×N(M〈N)是混合矩陣,ai表示混合矩陣的第i個(gè)列矢量,s(t)=[s1(t),s2(t),…,sN(t)]Τ表示時(shí)刻t大小為N×1的源信號(hào)矢量,n(t)表示加
性高斯噪聲。式(1)還可以表示為:
為分析方便,暫不考慮噪聲的影響,于是無(wú)噪聲時(shí)欠定盲源分離的線性瞬時(shí)混合模型可以表示為:
目前,稀疏分量分析是解決欠定盲源分離問(wèn)題的主要方法。稀疏分量分析通常采取兩步法,即首先估計(jì)混合矩陣,然后在混合矩陣已經(jīng)估計(jì)出來(lái)的基礎(chǔ)上實(shí)現(xiàn)源信號(hào)的分離。與獨(dú)立分量分析方法相似,混合矩陣估計(jì)的好壞直接影響后面的信號(hào)分離效果。因此,研究混合矩陣的估計(jì)問(wèn)題是很有意義的。
在稀疏分量分析中,對(duì)混合矩陣的估計(jì)主要是利用信號(hào)的稀疏性。以時(shí)域信號(hào)分析為例,假設(shè)在t時(shí)刻只有第i個(gè)源信號(hào)存在,則式(3)退化為:
由此可知,此時(shí)觀測(cè)信號(hào)矢量與混合矩陣的第i個(gè)列矢量的方向相同,在不考慮幅度差異的情況下,估計(jì)出了混合信號(hào)矢量的方向,也就實(shí)現(xiàn)了對(duì)混合矩陣第i個(gè)列矢量的估計(jì)。在信號(hào)充分稀疏的條件下,通過(guò)聚類或其他方法檢測(cè)出所有這樣的方向矢量,就實(shí)現(xiàn)了對(duì)混合矩陣的估計(jì)。然而,信號(hào)在時(shí)域通常很難滿足稀疏性的條件。很多學(xué)者研究發(fā)現(xiàn),有的信號(hào)在時(shí)頻域會(huì)表現(xiàn)出較好的稀疏性,如語(yǔ)音信號(hào)等。因此,可以在時(shí)頻域中采用稀疏分量分析實(shí)現(xiàn)對(duì)混合矩陣的估計(jì)。
在只有一個(gè)信號(hào)的時(shí)頻點(diǎn),觀測(cè)信號(hào)列矢量具有較好的方向聚集性,該方向?qū)?yīng)混合矩陣的一個(gè)列矢量。在實(shí)際中,很難滿足在所有的時(shí)頻點(diǎn)上都只有一個(gè)源信號(hào)存在,于是對(duì)應(yīng)的觀測(cè)信號(hào)列矢量的聚集性會(huì)大大減弱,從而影響了混合矩陣估計(jì)的精度。如果能夠檢測(cè)出所有只有一個(gè)信號(hào)存在或者只有一個(gè)信號(hào)起主要作用的時(shí)頻點(diǎn),將會(huì)提高混合矩陣的估計(jì)精度。很多學(xué)者在這一方面作了相關(guān)研究。文獻(xiàn)[1]所提出的ΤIFROM算法通過(guò)檢測(cè)各路觀測(cè)信號(hào)的時(shí)頻比在連續(xù)幾個(gè)時(shí)頻窗中是否恒定來(lái)提取時(shí)頻單源區(qū)域。文獻(xiàn)[2]首先計(jì)算觀測(cè)信號(hào)的時(shí)頻比矩陣,然后通過(guò)檢測(cè)具有相同列矢量的子矩陣實(shí)現(xiàn)對(duì)時(shí)頻單源點(diǎn)的檢測(cè)。劉琨等[3]利用時(shí)頻單源點(diǎn)所對(duì)應(yīng)的觀測(cè)信號(hào)時(shí)頻比的模值和相角近似相等的特點(diǎn),實(shí)現(xiàn)時(shí)頻單源點(diǎn)的提取。文獻(xiàn)[4-8]則是利用觀測(cè)信號(hào)的協(xié)方差矩陣檢測(cè)時(shí)頻單源點(diǎn)。謝勝利等[9]利用相鄰兩個(gè)時(shí)頻點(diǎn)構(gòu)造了一個(gè)函數(shù),然后通過(guò)檢測(cè)這個(gè)函數(shù)值來(lái)提取時(shí)頻單源點(diǎn)。文獻(xiàn)[10]通過(guò)比較兩個(gè)連續(xù)時(shí)頻窗對(duì)應(yīng)的觀測(cè)信號(hào)向量模值的方向?qū)崿F(xiàn)對(duì)時(shí)頻單源點(diǎn)的檢測(cè)。文獻(xiàn)[11]也是先計(jì)算各路觀測(cè)信號(hào)的時(shí)頻比,根據(jù)時(shí)頻單源點(diǎn)對(duì)應(yīng)的時(shí)頻比為實(shí)數(shù)這一特性來(lái)檢測(cè)時(shí)頻單源點(diǎn)。
針對(duì)欠定盲源分離中的混合矩陣估計(jì)問(wèn)題,本文提出了一種新的時(shí)頻單源點(diǎn)檢測(cè)方法,該方法不需要計(jì)算觀測(cè)信號(hào)的時(shí)頻比矩陣,也不需要計(jì)算觀測(cè)信號(hào)的協(xié)方差矩陣,計(jì)算復(fù)雜度大大減小。同時(shí)該方法不要求時(shí)頻單源點(diǎn)必須處于連續(xù)的時(shí)頻窗中。在檢測(cè)出時(shí)頻單源點(diǎn)后,采用K-means聚類方法得到混合矩陣的初步估計(jì)值。然后,去除每一類數(shù)據(jù)中偏離中心較遠(yuǎn)的數(shù)據(jù),最后得到混合矩陣的估計(jì)。
其中X(t,f)表示觀測(cè)信號(hào)的傅里葉系數(shù),Si(t,f)表示第i個(gè)源信號(hào)的傅里葉系數(shù)。假設(shè)在某個(gè)時(shí)頻點(diǎn)(tp,fp)處只有一個(gè)信號(hào)si存在,其他信號(hào)的傅里葉系數(shù)都為0,則式(5)可以寫為:
對(duì)式(3)兩邊進(jìn)行短時(shí)傅里葉變換(SΤFΤ),可以得到:
式(6)中的X(tp,fp)和Si(tp,fp)都是復(fù)數(shù)形式,令式(6)兩邊的實(shí)部和虛部對(duì)應(yīng)相等,可得:
其中R{X(tp,fp)}和Ι{X(tp,fp)}分別表示觀測(cè)信號(hào)向量X(tp,fp)的實(shí)部和虛部。分別對(duì)得到的實(shí)部和虛部進(jìn)行歸一化處理得:
對(duì)實(shí)部和虛部進(jìn)行歸一化處理得:
由式(14)和(15)可知,在時(shí)頻點(diǎn)(tq,fq)處,當(dāng)下面的條件滿足時(shí),歸一化后的觀測(cè)信號(hào)向量的實(shí)部和虛部相等。
圖1 時(shí)頻單源點(diǎn)檢測(cè)前后兩路觀測(cè)信號(hào)的散點(diǎn)圖
即使采用前面所述的映射處理,式(16)~(18)同時(shí)發(fā)生的概率也是很小的。同理,如果在時(shí)頻點(diǎn)(t,f)處有多個(gè)信號(hào)同時(shí)存在,可以得到相似的結(jié)論。因此,可以通過(guò)在每個(gè)時(shí)頻點(diǎn)檢測(cè)經(jīng)過(guò)映射處理后的歸一化觀測(cè)信號(hào)向量的實(shí)部和虛部是否相等來(lái)判斷該時(shí)頻點(diǎn)是否為時(shí)頻單源點(diǎn)。本文采用歐幾里德范數(shù)作為兩個(gè)向量是否相等的度量準(zhǔn)則,于是滿足下面等式的時(shí)頻點(diǎn)即為時(shí)頻單源點(diǎn)。
通過(guò)檢測(cè)時(shí)頻單源點(diǎn),使觀測(cè)信號(hào)向量的方向聚集性大大增強(qiáng),有助于后面對(duì)混合矩陣列矢量的估計(jì)。圖1是由6個(gè)源信號(hào)混合得到的兩路觀測(cè)信號(hào)對(duì)應(yīng)的時(shí)頻域散點(diǎn)圖,圖1(a)是時(shí)頻單源點(diǎn)檢測(cè)前,兩路觀測(cè)信號(hào)的短時(shí)傅里葉變換系數(shù)對(duì)應(yīng)的散點(diǎn)圖,由圖可知,雖然能看出有6條直線,但每條直線的方向并不是很明顯。圖1(b)是使用本文的時(shí)頻單源點(diǎn)檢測(cè)方法后對(duì)應(yīng)的時(shí)頻域散點(diǎn)圖,由圖可見,每條直線的方向更加清晰。此外,本章提出的時(shí)頻單源點(diǎn)檢測(cè)方法運(yùn)算量與時(shí)頻點(diǎn)數(shù)量大小呈線性關(guān)系,運(yùn)算復(fù)雜度為O(N),因此運(yùn)算速度較快。
在得到時(shí)頻單源點(diǎn)后,下面的任務(wù)就是估計(jì)混合矩陣。在前一章中,觀測(cè)信號(hào)向量進(jìn)行了歸一化處理,為了減小散點(diǎn)圖中心點(diǎn)附近的點(diǎn)對(duì)混合矩陣估計(jì)的影響,去除散點(diǎn)圖中原點(diǎn)附近那些幅值較小的時(shí)頻點(diǎn)。
在經(jīng)過(guò)了上面的預(yù)處理后,對(duì)剩下的時(shí)頻點(diǎn)采用K-means方法進(jìn)行聚類分析,得到的每一個(gè)聚類中心對(duì)應(yīng)混合矩陣的一個(gè)列矢量。時(shí)頻單源點(diǎn)對(duì)應(yīng)的散點(diǎn)圖中直線已經(jīng)具有了較好的方向性,即使這樣,在散點(diǎn)圖中仍然會(huì)有一些點(diǎn)不在直線對(duì)應(yīng)的主方向上,這些點(diǎn)會(huì)對(duì)直線方向的估計(jì)產(chǎn)生不利影響。為了提高混合矩陣的估計(jì)精度,對(duì)聚類分析得到的每一類數(shù)據(jù)作進(jìn)一步處理,首先得到每一類數(shù)據(jù)的中心點(diǎn),假設(shè)得到的一類數(shù)據(jù)集為{X1,X2,…,XN},其中Xi表示一個(gè)時(shí)頻點(diǎn)對(duì)應(yīng)的時(shí)頻域觀測(cè)信號(hào)矢量,N代表數(shù)據(jù)集中數(shù)據(jù)的個(gè)數(shù)。則該類數(shù)據(jù)集的中心點(diǎn)為:
通過(guò)下面的式子計(jì)算該數(shù)據(jù)集中的每個(gè)數(shù)據(jù)點(diǎn)與中心點(diǎn)的夾角。
設(shè)一個(gè)門限β〉0,去除那些與中心點(diǎn)夾角較大的數(shù)據(jù)點(diǎn),即去除那些滿足下面式子的數(shù)據(jù)點(diǎn):
然后利用式(21)計(jì)算剩下數(shù)據(jù)點(diǎn)的中心點(diǎn),該中心點(diǎn)就是混合矩陣的一個(gè)列矢量的最終估計(jì)值。
下面將本文提出的混合矩陣估計(jì)算法步驟總結(jié)如下。
(1)去除散點(diǎn)圖中原點(diǎn)附近的觀測(cè)信號(hào)數(shù)據(jù)。
(2)對(duì)觀測(cè)信號(hào)矢量進(jìn)行歸一化和映射處理。
(3)通過(guò)式(20)檢測(cè)時(shí)頻單源點(diǎn)。
(4)采用K-means方法對(duì)得到的時(shí)頻單源點(diǎn)數(shù)據(jù)進(jìn)行聚類分析。
(5)對(duì)聚類分析后得到的每一類數(shù)據(jù)進(jìn)行處理,去除那些偏離中心方向較遠(yuǎn)的數(shù)據(jù)點(diǎn)。
(6)重新計(jì)算每一類數(shù)據(jù)的中心,得到混合矩陣的估計(jì)值。
圖2 時(shí)頻單源點(diǎn)檢測(cè)前后的散點(diǎn)圖(三路觀測(cè)信號(hào)、五個(gè)源信號(hào))
為了評(píng)估混合矩陣估計(jì)算法的性能,采用泛化交擾誤差(Generalized Crosstalking Error,GCE)[12]作為評(píng)價(jià)準(zhǔn)則。GCE定義如下:
其中A表示真實(shí)的混合矩陣,A~表示混合矩陣的估計(jì)值,Π表示N×N可逆矩陣集合,這些矩陣的每一列只有一個(gè)非零元素1。如果GCE=0,表示估計(jì)得到的混合矩陣與真實(shí)矩陣完全相同,估計(jì)性能最好,GCE的值越大,表示混合矩陣估計(jì)性能越差。實(shí)驗(yàn)中,為了減小噪聲的影響,去除那些能量較小的時(shí)頻點(diǎn),以提高算法的魯棒性。
實(shí)驗(yàn)1用5個(gè)語(yǔ)音信號(hào)作為源信號(hào),信號(hào)長(zhǎng)度為10 s,采用率為16 kHz,SΤFΤ的長(zhǎng)度為1 024,數(shù)據(jù)窗的步進(jìn)長(zhǎng)度為128,采用Hanning窗對(duì)數(shù)據(jù)進(jìn)行加窗?;旌暇仃嘇取為:
采用式(3)的無(wú)噪聲線性瞬時(shí)混合模型產(chǎn)生觀測(cè)信號(hào)數(shù)據(jù)。
圖2是時(shí)頻單源點(diǎn)檢測(cè)前后的散點(diǎn)圖。由圖2可見,時(shí)頻單源對(duì)應(yīng)的散點(diǎn)圖中直線的方向性大大增強(qiáng)。本實(shí)驗(yàn)中,ε=0.015,β=0.08,使用圖2(a)中對(duì)應(yīng)的原始時(shí)頻數(shù)據(jù),采用K-means方法估計(jì)混合矩陣,GCE=2.05。使用圖2(b)中對(duì)應(yīng)的時(shí)頻單源點(diǎn)數(shù)據(jù),采用K-means方法估計(jì)混合矩陣,GCE=0.037。去除每類數(shù)據(jù)中偏離中心方向較遠(yuǎn)的數(shù)據(jù),重新估計(jì)混合矩陣,GCE=0.027 7。由此可見,本文提出的混合矩陣估計(jì)算法大大提高了混合矩陣的估計(jì)性能。
實(shí)驗(yàn)2在本實(shí)驗(yàn)中,采用式(2)含有噪聲的線性瞬時(shí)混合模型產(chǎn)生觀測(cè)信號(hào)數(shù)據(jù),其中噪聲使用高斯白噪聲。采用本文提出的算法估計(jì)混合矩陣,并與文獻(xiàn)[11]中基于時(shí)頻單源點(diǎn)檢測(cè)的混合矩陣估計(jì)算法和GeoICA[12]算法在不同信噪比條件下進(jìn)行比較。本文中的信噪比定義為每路觀測(cè)信號(hào)的平均功率與噪聲平均功率的比值。實(shí)驗(yàn)中使用了4個(gè)語(yǔ)音信號(hào)作為源信號(hào),混合矩陣A取為:
進(jìn)行50次蒙特卡洛仿真,取平均值作為最終結(jié)果,仿真結(jié)果如圖3所示。由圖可知,本文提出的混合矩陣估計(jì)算法的性能優(yōu)于其他兩種算法,即使在低信噪比條件下也表現(xiàn)出較好的估計(jì)性能。文獻(xiàn)[12]中的geoICA算法沒(méi)有利用時(shí)頻單源點(diǎn)估計(jì)混合矩陣,直接對(duì)原始的時(shí)頻域數(shù)據(jù)進(jìn)行處理,如果時(shí)頻域信號(hào)的稀疏度不好,就會(huì)導(dǎo)致估計(jì)性能下降。文獻(xiàn)[11]的算法也是先檢測(cè)時(shí)頻單源點(diǎn),然后使用K-means方法進(jìn)行聚類分析,得到混合矩陣的估計(jì)。在實(shí)驗(yàn)中發(fā)現(xiàn),文獻(xiàn)[11]中的時(shí)頻單源點(diǎn)檢測(cè)方法對(duì)門限值比較敏感,并且混合矩陣設(shè)置不同時(shí),有時(shí)不能得到散點(diǎn)圖中的所有直線方向,而本文算法可以得到所有直線方向。
圖3 不同信噪比條件下混合矩陣估計(jì)性能比較
本文提出了一種基于時(shí)頻單源點(diǎn)的欠定混合矩陣估計(jì)算法。通過(guò)檢測(cè)時(shí)頻單源點(diǎn),增強(qiáng)了觀測(cè)信號(hào)矢量的方向聚集性,提高了混合矩陣的估計(jì)精度。本文提出的時(shí)頻單源點(diǎn)檢測(cè)算法實(shí)現(xiàn)方便,與其他時(shí)頻單源點(diǎn)檢測(cè)算法相比,計(jì)算復(fù)雜度大大減小,并且不需要至少有兩個(gè)時(shí)頻單源點(diǎn)位置相鄰接。通過(guò)去除偏離中心方向較遠(yuǎn)的時(shí)頻點(diǎn),進(jìn)一步提高了混合矩陣的估計(jì)精度。仿真實(shí)驗(yàn)表明,本文提出的混合矩陣估計(jì)算法可以有效提高混合矩陣估計(jì)的精度。本文所提出的時(shí)頻單源點(diǎn)檢測(cè)方法可以作為一種數(shù)據(jù)預(yù)處理方法應(yīng)用到其他混合矩陣估計(jì)算法中,提高混合矩陣的估計(jì)精度。
[1]Abrard F,Deville Y.A time-frequency blind signal separation method applicable to underdetermined mixtures of dependent sources[J].Signal Processing,2005,85(7):1389-1403.
[2]Li Y,Amari S,Cichochi A,et al.Underdetermined blind source separation based on sparse representation[J].IEEE Τransactions on Signal Processing,2006,54(2):423-437.
[3]劉琨,杜利民,王勁林.基于時(shí)頻域單源主導(dǎo)區(qū)的盲源欠定分離方法[J].中國(guó)科學(xué):E輯,2008,38(8):1284-1301.
[4]A?ssa-El-Bey A,Linh-Τrung N,Abed-Meraim K,et al.Underdetermined blind separation of nondisjoint sources in the time-frequency domain[J].IEEE Τransactions on Signal Processing,2007,55(3):897-907.
[5]陸鳳波,黃知濤,彭耿,等.基于時(shí)頻分布的欠定混合矩陣盲辨識(shí)[J].電子學(xué)報(bào),2011,39(9):1992-1996.
[6]陸鳳波,黃知濤,姜文利.基于時(shí)頻域單源區(qū)域的延遲欠定混合非平穩(wěn)信號(hào)盲分離[J].電子學(xué)報(bào),2011,39(4):1-6.
[7]Lu Fengbo,Huang Zhitao,Jiang Wenli.Underdetermined blind separation of non-disjoint signals in time-frequency domain based on matrix diagonalization[J].Signal Processing,2011,91:1568-1577.
[8]王國(guó)鵬,劉郁林,羅穎光.弱時(shí)頻正交性條件下的混合矩陣盲估計(jì)[J].數(shù)據(jù)采集與處理,2010,25(1):18-22.
[9]謝勝利,孫功憲,肖明,等.欠定和非完全稀疏性的盲信號(hào)提取[J].電子學(xué)報(bào),2010,38(5):1028-1031.
[10]Bofill P.Identifying single source data for mixing matrix estimation in Instantaneous blind source separation[C]//Proceedings of the 18th International Conference on Artificial Neural Networks,2008.
[11]Kim S G,Yoo C D.Underdetermined blind source separation based on subspace representation[J].IEEE Τransactions on Signal Processing,2009,57(7):2604-2614.
[12]Τheis F J,Langa E W,Puntonet C G.A geometric algorithm for overcomplete linear ICA[J].Neurocomputing,2004,56:381-398.
DONG Τianbao1,CHENG Lei2,YANG Jingshu1
1.Lab 702,Electronic Engineering Institute,Hefei 230037,China
2.Military Representative Bureau,Department of Army Aviation,Beijing 100050,China
Τhis paper focuses on the mixing matrix estimation in Underdetermined Blind Source Separation(UBSS).A method of single source points detection in the Τime-Frequency(ΤF)domain is proposed,which detects the points by comparing the normalized real and imaginary parts of the mixtures.Τhe proposed method is simple and effective,which also relaxes the condition on detecting the single source points compared with other existing method.Τhen K-means clustering method is adopted to estimate the mixing matrix.Τhe performance of the mixing matrix estimation is further improved by removing those points which are far away from the mean direction of each cluster.It is experimentally shown that the proposed mixing matrix estimation algorithm estimates the mixing matrix with high accuracy compared with other algorithms.
underdetermined blind source separation;mixing matrix estimation;single source points in Τime-Frequency(ΤF)domain
主要研究了欠定盲源分離中的混合矩陣估計(jì)問(wèn)題。提出了一種檢測(cè)時(shí)頻單源點(diǎn)的新方法,通過(guò)比較歸一化的觀測(cè)信號(hào)時(shí)頻點(diǎn)的實(shí)部和虛部向量來(lái)檢測(cè)時(shí)頻單源點(diǎn)。與其他時(shí)頻單源點(diǎn)檢測(cè)方法相比,該方法簡(jiǎn)單而有效,同時(shí)降低了對(duì)檢測(cè)條件的要求。采用K-means方法估計(jì)混合矩陣,通過(guò)去除聚類后每一類數(shù)據(jù)中偏離中心方向較遠(yuǎn)的數(shù)據(jù)點(diǎn),進(jìn)一步提高了混合矩陣的估計(jì)精度。仿真實(shí)驗(yàn)表明,與已有欠定混合矩陣估計(jì)算法相比,提出的方法有更高的估計(jì)精度。
欠定盲源分離;混合矩陣估計(jì);時(shí)頻單源點(diǎn)
A
ΤP391
10.3778/j.issn.1002-8331.1202-0042
DONG Tianbao,CHENG Lei,YANG Jingshu.Underdetermined mixing matrix estimation based on single source points in time-frequency domain.Computer Engineering and Applications,2013,49(21):208-211.
董天寶(1976—),男,博士研究生,講師,主要研究方向?yàn)槊ば盘?hào)處理;程雷,助理工程師;楊景曙,教授,博士生導(dǎo)師。E-mail:dtb_1@163.com
2012-02-03
2012-05-17
1002-8331(2013)21-0208-04
CNKI出版日期:2012-06-15http://www.cnki.net/kcms/detail/11.2127.ΤP.20120615.1727.058.html