溫江濤,趙倩云,孫潔娣
(1.燕山大學(xué) 河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北,秦皇島 066004;2.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北,秦皇島 066004)
?
基于信號(hào)時(shí)頻域聚集性的欠定盲分離混合矩陣估計(jì)方法
溫江濤1,趙倩云1,孫潔娣2
(1.燕山大學(xué) 河北省測(cè)試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北,秦皇島 066004;2.燕山大學(xué) 信息科學(xué)與工程學(xué)院,河北,秦皇島 066004)
為解決欠定盲分離中混合矩陣估計(jì)問題,通過研究觀測(cè)信號(hào)在時(shí)頻域的線性聚集特性,提出一種基于時(shí)頻域線性聚集程度差異的混合矩陣估計(jì)方法,并著重研究在信號(hào)線性聚集程度較弱情況下對(duì)混合矩陣的估計(jì). 首先,利用觀測(cè)信號(hào)或其時(shí)頻域中相應(yīng)變換系數(shù)的比值分布衡量信號(hào)線性聚集程度;其次,采用優(yōu)化初始中心的K-均值聚類算法估計(jì)混合矩陣. 該算法降低了對(duì)信號(hào)稀疏性的要求,并且可以較高精度地估計(jì)出混合矩陣. 仿真實(shí)驗(yàn)結(jié)果表明該方法具有可行性和有效性.
欠定盲源分離;混合矩陣估計(jì);線性聚集性;改進(jìn)K-均值聚類
盲源分離(blind source separation,BSS)是指?jìng)鬏斝诺篮驮葱盘?hào)都未知時(shí),僅從觀測(cè)信號(hào)中分離源信號(hào)的過程. 在實(shí)際問題中,觀測(cè)信號(hào)的個(gè)數(shù)一般少于源信號(hào)個(gè)數(shù),即為欠定盲源分離(underdetermined blind source separation,UBSS). 其簡(jiǎn)化的數(shù)學(xué)模型為
(1)
式中X(t)=[x1(t)x2(t) …xm(t)]T為由M個(gè)傳感器得到的觀測(cè)信號(hào);A∈Rm×n未知的混合矩陣;S(t)=[s1(t)s2(t) …sn(t)]T為N個(gè)未知的源信號(hào),且M Lee等[4]提出先估計(jì)混合矩陣,然后重構(gòu)源信號(hào)的方法,即“兩步法”,它是目前解決稀疏信號(hào)分離問題的常用方法. 實(shí)現(xiàn)源信號(hào)的精確重構(gòu),需準(zhǔn)確估計(jì)混合矩陣A,因此高精度地估計(jì)A是兩步法的核心. 近年來在SCA的基礎(chǔ)上,提出了許多解決欠定盲源分離問題的新算法,如退化分離估計(jì)技術(shù)(DUET)[5]、時(shí)頻混合比算法(TIFROM)[6]、超平面聚類算法[7]、非線性投影列掩蔽算法[8]等,這些算法均假設(shè)信號(hào)為稀疏或弱稀疏信號(hào),但并未對(duì)信號(hào)的稀疏程度做進(jìn)一步的研究. 估計(jì)A的前提條件是混合信號(hào)須在散點(diǎn)圖中呈現(xiàn)較為明顯的方向性,即信號(hào)須有一定的線性聚集性,而實(shí)際中很多情況并不滿足此要求. 針對(duì)上述問題,本文提出一種基于信號(hào)時(shí)頻域內(nèi)聚集性估計(jì)混合矩陣的算法. 該算法通過統(tǒng)計(jì)觀測(cè)信號(hào)在時(shí)頻域內(nèi)變換系數(shù)的比值分布情況衡量觀測(cè)信號(hào)的線性聚集程度,并根據(jù)不同程度的線性聚集性研究最佳的混合矩陣估計(jì)方法. 該方法降低了對(duì)信號(hào)稀疏性的要求,僅需增強(qiáng)散點(diǎn)圖中線性聚集程度即可較為精確地估計(jì)混合矩陣. 式(1)展開可改寫為如下形式: (2) 式中:xi(t)是行矢量,表示第i路觀測(cè)信號(hào);si(t)也為行矢量,表示第i個(gè)源信號(hào). 對(duì)式(2)進(jìn)行短時(shí)傅里葉變換(STFT)得 (3) 式中xi(t,k)和si(t,k)分別為第i路觀測(cè)信號(hào)xi(t)和第i個(gè)源信號(hào)si(t)的STFT系數(shù). 解決欠定盲源分離問題的方法主要基于信號(hào)的稀疏性,假設(shè)源信號(hào)S為強(qiáng)稀疏信號(hào)或其變換系數(shù)具有強(qiáng)稀疏性,即非零值的個(gè)數(shù)是唯一的或只有少數(shù)信號(hào)具有較大值,大部分?jǐn)?shù)值很小可視為零值. 研究表明多數(shù)信號(hào)在變換域中都具有稀疏性[9],本文主要以混合信號(hào)在時(shí)頻域中變換系數(shù)的稀疏性為例進(jìn)行理論推導(dǎo). 若在時(shí)頻點(diǎn)(tk,kk)僅有sj(tk,kk)為非零值,有 (4) 式中aj為混合矩陣A的第j列,式(4)可改寫為 (5) 從幾何意義來說,式(5)是一個(gè)直線方程,故sj(tk,kk)所有采樣時(shí)刻將確定一條直線,并且直線的方向?yàn)榛旌暇仃嘇的第j列向量,此時(shí)信號(hào)在時(shí)頻域中線性聚集性強(qiáng),可直接采用聚集算法估計(jì)混合矩陣. 然而,在實(shí)際情況中信號(hào)的線性聚集程度是未知的,不確定是否能夠直接采用聚類算法估計(jì)混合矩陣. 因此,有必要對(duì)信號(hào)的線性聚集程度進(jìn)行衡量,并根據(jù)線性聚集程度進(jìn)一步研究精度更高的混合矩陣估計(jì)算法. 估計(jì)混合矩陣A的主要依據(jù)是信號(hào)的線性聚集性,信號(hào)的線性聚集性強(qiáng),信號(hào)在散點(diǎn)圖中呈現(xiàn)出清晰地方向性,可直接運(yùn)用聚類算法估計(jì)混合矩陣;反之,不呈現(xiàn)方向性,直接運(yùn)用聚類算法得不到混合矩陣的估計(jì),需增強(qiáng)線性聚集性,再進(jìn)行混合矩陣的估計(jì). 因此,衡量信號(hào)線性聚集程度并增強(qiáng)其程度對(duì)精確估計(jì)A具有重要影響. 2.1 信號(hào)線性聚集程度的衡量 將信號(hào)X(t)進(jìn)行STFT,為了更好地衡量信號(hào)線性聚集程度,利用式(6)去除能量值較小的變換系數(shù): (6) 式中ε為閾值. 由此時(shí)的變換系數(shù)得到其比值d(t,k)為 (7) 令a=min{d(t,k)},b=max{d(t,k)},將區(qū)間[a,b]分為相等的P個(gè)子空間,可表示為{a+(i-1)δ,a+iδ}i=1,2,…,P,其中δ=(b-a)/P,且P充分大,統(tǒng)計(jì)d(t,k)樣本點(diǎn)落在各子區(qū)間的個(gè)數(shù)Di(i=1,2,…,P). 比值d(t,k)相差較小的變換系數(shù)近似匯聚于一條直線,且d(t,k)會(huì)落入同一子區(qū)間內(nèi);反之,落入不同的子區(qū)間. 線性聚集性強(qiáng)時(shí),比值d(t,k)集中落入部分子區(qū)間內(nèi),對(duì)應(yīng)的Di較大,P個(gè)子區(qū)間內(nèi)Di呈現(xiàn)極大值和極小值的間隔分布;線性聚集性弱時(shí),比值d(t,k)會(huì)散落在相對(duì)應(yīng)的子區(qū)間內(nèi),P個(gè)子區(qū)間內(nèi)Di不呈現(xiàn)極大值和極小值的間隔分布. 因此,統(tǒng)計(jì)Di分布能夠衡量線性聚集程度. 2.2 增強(qiáng)信號(hào)線性聚集程度 通?;旌闲盘?hào)在時(shí)域中甚至?xí)r頻域中的比值并不會(huì)集中落在某些子區(qū)間,即Di在P個(gè)子區(qū)間中不呈現(xiàn)峰值點(diǎn),因此,線性聚集性較弱. 針對(duì)此種情況,本文研究了基于時(shí)頻域等比系數(shù)增強(qiáng)觀測(cè)信號(hào)時(shí)頻域內(nèi)線性聚集程度的方法. 定義1 觀測(cè)信號(hào)在時(shí)頻域內(nèi)變換系數(shù)的實(shí)部之比與虛部之比相等,且為常數(shù),該常數(shù)是混合矩陣對(duì)應(yīng)列向量的比值,稱此類變換系數(shù)為等比系數(shù). 以觀測(cè)信號(hào)個(gè)數(shù)M=2為例,假設(shè)時(shí)頻域中某時(shí)頻點(diǎn)(tz,kz)上的比值與混合矩陣A第i列的比值相等. 則有 (8) 式(8)可改寫為 (9) 最大概率滿足式(9)的情況是在時(shí)頻點(diǎn)(tz,kz)處僅有源信號(hào)si(tz,kz)作用,其他源信號(hào)對(duì)X(tz,kz)不起作用或作用相互抵消. 式(9)可改寫為 (10) 由式(10)可知等比系數(shù)實(shí)部的比值與虛部的比值相等,且與混合矩陣對(duì)應(yīng)列向量的比值相等. 因此,等比系數(shù)散點(diǎn)圖呈現(xiàn)清晰的方向性,其線性聚集性強(qiáng). 然而實(shí)際應(yīng)用中,式(10)中Re[X2(t,k)]/Re[X1(t,k)]和lm[X2(t,k)]/lm[X1(t,k)]的值會(huì)存在一定的誤差,并非完全相等,因此設(shè)定一個(gè)門限值ω,消除此種誤差,判定等比系數(shù)的公式為 (11) 式中ω的取值范圍為(0,0.1),ω是一個(gè)經(jīng)驗(yàn)性取值,滿足式(11)的變換系數(shù)可視為時(shí)頻域中的等比系數(shù). 因此,可以進(jìn)一步對(duì)等比系數(shù)進(jìn)行分析得到混合矩陣的估計(jì)值. 2.3 混合矩陣的估計(jì)方法 前文對(duì)時(shí)頻域中等比系數(shù)進(jìn)行了有效判定,將有效選取的等比系數(shù)采用式(12)進(jìn)行單位化處理,得到集合U為 (12) 式中X(tz,kz)為時(shí)頻域上選定的等比系數(shù),Ωz為所有選定等比系數(shù)的集合. 由于該集合中的向量均為單位向量,進(jìn)一步計(jì)算向量之間的比值,即 (13) 運(yùn)用聚類的方法將集合H進(jìn)行分類,若H中任意兩個(gè)hm、hn相等或者近似相等,則將其歸為一類. (14) 式中:sum(Cn)為第n類中所有向量個(gè)數(shù);∑hCn為第n類中所有元素之和,則可通過式(15)估計(jì)混合矩陣列向量為 (15) 針對(duì)欠定盲源分離問題,對(duì)本文提出的基于時(shí)頻域信號(hào)聚集性估計(jì)混合矩陣的方法進(jìn)行仿真及分析. 估計(jì)誤差采用歸一化均方誤差(NMSE)進(jìn)行評(píng)價(jià),并與Bofill的勢(shì)函數(shù)算法進(jìn)行對(duì)比. 歸一化均方誤差為 (16) 3.1 觀測(cè)信號(hào)在時(shí)頻域內(nèi)線性聚集性較強(qiáng)的情況 取M=2、N=6,即有6路源信號(hào),2路觀測(cè)信號(hào). 6路源信號(hào)截取自6段長(zhǎng)笛聲音信號(hào),取自Bofill[10]的仿真實(shí)驗(yàn),6路源信號(hào)采樣點(diǎn)數(shù)均為32 768點(diǎn). 隨機(jī)選取混合矩陣A,并對(duì)其列矢量歸一化為 根據(jù)式(1)混合后得到兩路觀測(cè)信號(hào),如圖1所示. 首先衡量觀測(cè)信號(hào)的線性聚集性,圖2為P=40時(shí)觀測(cè)信號(hào)在時(shí)域及時(shí)頻域中比值分布情況. 分析圖2中Di的分布可知:觀測(cè)信號(hào)在時(shí)域中Di不具有明顯的極值,因此線性聚集性差;而在時(shí)頻域中Di的極值間隔分布,線性聚集性較強(qiáng). 為驗(yàn)證上述分析的正確性,圖3中給出觀測(cè)信號(hào)的時(shí)域和時(shí)頻域散點(diǎn)圖. 由圖3可知,觀測(cè)信號(hào)在時(shí)域散點(diǎn)圖中未呈現(xiàn)方向性,而在時(shí)頻域具有明顯的方向性,線性聚集性較強(qiáng). 因此估計(jì)混合矩陣A時(shí)可以采用改進(jìn)的K-均值聚類算法,得到的估計(jì)結(jié)果為 為評(píng)估本文算法估計(jì)矩陣的精確度,采用Bofill的勢(shì)函數(shù)算法[10]估計(jì)混合矩陣為 由圖4可知:本文提出的算法估計(jì)混合矩陣的歸一化均方誤差明顯小于Bofill勢(shì)函數(shù)算法,本文提出算法估計(jì)的混合矩陣更為精確. 3.2 觀測(cè)信號(hào)在時(shí)頻域內(nèi)線性聚集性較弱的情況 取M=2、N=4,即4路源信號(hào),2路觀測(cè)信號(hào). 采用的4個(gè)源信號(hào)均為實(shí)際語(yǔ)音信號(hào),取自http://www.speech.cs.cmu.edu/cmu_arctic/,每組源信號(hào)的采樣點(diǎn)數(shù)為35 920點(diǎn),混合矩陣為 根據(jù)式(1)混合后得到兩組觀測(cè)信號(hào)如圖5所示. 首先衡量觀測(cè)信號(hào)的線性聚集性,圖6是P=40時(shí)觀測(cè)信號(hào)在時(shí)域及時(shí)頻域中比值分布情況. 分析圖6中Di的分布可知:兩個(gè)分布圖均不具有明顯極值,因此,線性聚集性均較弱. 直接運(yùn)用改進(jìn)的K-均值聚類算法估計(jì)混合矩陣會(huì)有很大的誤差甚至無(wú)法得到估計(jì)矩陣. 圖7給出了觀測(cè)信號(hào)在時(shí)域、頻域、時(shí)頻域的散點(diǎn)圖用于驗(yàn)證上述分析的正確性. 由圖7可知,觀測(cè)信號(hào)在時(shí)域和頻域散點(diǎn)圖中未呈現(xiàn)方向性,在時(shí)頻域散點(diǎn)圖中呈現(xiàn)模糊的方向,線性聚集性依舊較弱. 下面利用本文提出的算法,在時(shí)頻域中選取適當(dāng)?shù)缺认禂?shù)增強(qiáng)線性聚集性進(jìn)而估計(jì)混合矩陣A. 利用式(11)選出時(shí)頻域中的等比系數(shù),其中選取ω=0.025,如圖8為等比系數(shù)的比值分布情況:所示Di的分布具有明顯的極值,線性聚集性得到了增強(qiáng). 分析圖8中Di的分布可知:等比系數(shù)在時(shí)頻域中具有較強(qiáng)的線性聚集性. 圖9為時(shí)頻域等比系數(shù)的散點(diǎn)圖. 實(shí)驗(yàn)2信號(hào)直接采用Bofill勢(shì)函數(shù)算法,無(wú)法估計(jì)出混合矩陣;若先進(jìn)行時(shí)頻域選取等比系數(shù)的方法增強(qiáng)信號(hào)線性聚集性后,再采用Bofill勢(shì)函數(shù)算法則可得到估計(jì)混合矩陣的估計(jì)值為 由圖10可知:本文提出的算法估計(jì)混合矩陣的歸一化均方誤差在-62 dB左右,而Bofill勢(shì)函數(shù)算法估計(jì)混合矩陣的歸一化均方誤差在-42 dB左右,本文提出的算法估計(jì)混合矩陣更為精確. 研究結(jié)果及仿真實(shí)驗(yàn)表明:對(duì)于稀疏程度未知的信號(hào),本文算法可以有效鑒別時(shí)頻域上的等比系數(shù),增強(qiáng)信號(hào)的線性聚集性,并采用改進(jìn)的聚類算法較為精確地估計(jì)出混合矩陣. 本文方法可用于語(yǔ)音信號(hào)、機(jī)械振動(dòng)信號(hào)等領(lǐng)域的欠定盲源分離問題;該算法降低了對(duì)信號(hào)稀疏性的要求且能高精度的估計(jì)混合矩陣,為下一步精確重構(gòu)信號(hào)奠定了基礎(chǔ). [1] Li X,Zhang X. Sequential blind extraction adopting second-order statistics[J]. IEEE Signal Processing Letters,2007,14(1):58-61. [2] Reju V G,Koh Soo Ngee,Soon Ing Yann. An algorithm for mixing matrix estimation in instantaneous blind source separation[J]. Signal Processing,2009,89:1762-1773. [3] Xie S L,Yang L,Yang J M,et al. Time-frequency approach to underdetermined blind source separation[J]. IEEE Transactions on Neural Networks and Learning Systems,2012,23(2):306-316. [4] Lee T W,Lewicki M S,Girolami M. Blind source separation of more sources than mixtures using overcomplete representations[J]. IEEE Signal Process,1999,6(4):87-90. [5] Tengtrairat N,Woo W L. Extension of DUTE to single-channel mixing model and separability analysis[J]. Signal Processing,2014,96(3):261-265. [6] Abrard F,Deville Y. A time-frequency blind signal separation method applicable to underdetermined mixtures of dependent sources[J]. Signal Process,2005,85(7):211-221. [7] Jayaraman J,Thiagarajan. Mixing matrix estimation using discriminative clustering for blind source separation[J]. Digital Signal Processing, 2013,23(1):9-18. [8] Zhou G X,Yang Z Y,Xie S L. Mixing matrix estimation from sparse mixtures with unknown number of source[J]. IEEE Trans on Neural Networks,2011,22(2):211-221. [9] Bao G Z,Ye Z F,Xu X,et al. A compressed sensing approach to blind separation of speech mixture based on a two-layer sparsity model[J]. IEEE Audio Speech Language Processing,2013,21(5):899-906. [10] Bofill P,Zibulevesky M. Undetermined blind source separation using sparse representations[J]. Signal Processing,2001,81(11):2353-2362. (責(zé)任編輯:劉芳) Mixing Matrix Estimation Based on Cluster Degree of Time-Frequency Signal for Underdetermined Blind Source Separation WEN Jiang-tao1,ZHAO Qian-yun1,SUN Jie-di2 (1.Key Laboratory of Measurement Technology and Instrumentation of HeBei Province ,Yanshan University,Qinhuangdao,Hebei 066004,China; 2.School of Information Science and Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China) To solve the mixing matrix estimation problem of underdetermined blind separation,through the study of signal linear aggregation feature in time-frequency domain,an estimation method of mixing matrix based on different signal linear aggregation degree in time-frequency domain was proposed in this paper,and focus on the estimation of mixing matrix under the signal linear aggregation degree in weaker conditions. First,the observed signal or the ratio distribution of the corresponding transformation coefficient in time-frequency domain was used to measure the degree of the signal linear aggregation; second,the improved K-means clustering algorithm was applied to estimate the mixing matrix. The proposed method reduces the requirement for signal sparsity and can estimate the mixing matrix accurately. The simulation results show that the proposed method is feasible and effective. underdetermined blind sources separation; mixture matrix estimation; linear aggregation; improved K-means clustering 2014-11-15 國(guó)家自然科學(xué)基金資助項(xiàng)目(51204145);河北省自然科學(xué)基金資助項(xiàng)目(E2013203300,E2016203223) 溫江濤(1974—),男,博士,副教授,E-mail:wens2002@163.com. TN 911.7 A 1001-0645(2016)07-0733-06 10.15918/j.tbit1001-0645.2016.07.0141 欠定盲源分離問題
2 基于信號(hào)時(shí)頻域聚集性的混合矩陣估計(jì)方法
3 實(shí)驗(yàn)結(jié)果及分析
6 結(jié) 論