黃小青,肖 瑛,馬藝偉
(大連民族大學(xué) 信息與通信工程學(xué)院,遼寧 大連 116605)
盲源分離是一種在源信號和混合矩陣未知的情況下,僅根據(jù)觀測信號完成對源信號估計的一種技術(shù),目前在地震信號處理、機(jī)械故障信號診斷、醫(yī)學(xué)信號處理、語音信號處理等領(lǐng)域具有廣泛的應(yīng)用[1-2]。根據(jù)源信號和觀測信號的數(shù)目,可將盲源分離問題分為:超定、正定和欠定盲源分離三類。當(dāng)接收傳感器小于源信號數(shù)目時,所得到的觀測信號數(shù)目小于源信號數(shù)目,則該類盲源分離稱為欠定盲源分離[3],單通道信號盲源分離是欠定盲源分離的一個特例,也是盲源分離研究中的一個技術(shù)瓶頸問題。對于欠定盲源分離,目前主要的解決方法是結(jié)合數(shù)據(jù)分解技術(shù)的盲源分離和稀疏化盲源分離方法,結(jié)合數(shù)據(jù)分解技術(shù)如小波分解、經(jīng)驗(yàn)?zāi)B(tài)分解等,通過維數(shù)擴(kuò)展補(bǔ)充觀測信號數(shù)目,使欠定盲源分離轉(zhuǎn)換為正定盲源分離,并在此基礎(chǔ)上利用獨(dú)立分量分析等傳統(tǒng)正定盲分離方法獲得分離結(jié)果[4]。結(jié)合數(shù)據(jù)分解的盲源分離方法缺點(diǎn)是在無法確知源信號數(shù)目的情況下,擴(kuò)展維數(shù)也無法確定,同時,不同的分解方法得到的在維數(shù)擴(kuò)展中的虛擬通道上的觀測信號質(zhì)量有時會制約傳統(tǒng)正定分離方法的性能。稀疏化盲源分離是利用觀測信號的稀疏特征或觀測信號在變換域中的稀疏特征,采用兩步法進(jìn)行源信號的估計[5],即首先利用信號的稀疏特征對混合矩陣進(jìn)行估計,對于欠定盲源分離,估計的混合矩陣的維數(shù)由觀測信號數(shù)目和源信號的數(shù)目共同決定,無法直接求逆得到分離矩陣,此時在所估計的混合矩陣基礎(chǔ)上利用線性規(guī)劃方法來逐步進(jìn)行源信號的估計。稀疏化盲源分離結(jié)果受混合矩陣估計精度的影響,同時當(dāng)觀測信號受到噪聲污染時,分離性能不佳。
信號的傳輸過程中不可避免受到傳輸環(huán)境噪聲的影響,為提高噪聲干擾下單通道盲源分離性能,提出一種基于SVD分解均值聚類盲源分離算法。即對單通道觀測信號進(jìn)行SVD分解,利用中值準(zhǔn)則對信號進(jìn)行降噪處理,對保留的特征值分別進(jìn)行分量恢復(fù),將恢復(fù)的分量作為盲源分離觀測信號。為了估計單通道信號中所包含源信號數(shù)目,對SVD分解分量作STFT進(jìn)行稀疏化處理,在時頻域中,根據(jù)各分量的散點(diǎn)圖判別源信號的數(shù)目。對各分量時頻域進(jìn)行能量極小點(diǎn)剔除和單源點(diǎn)判定,利用K均值聚類方法估計混合矩陣,將估計的混合矩陣求逆即可得到對應(yīng)的分離矩陣。算法將降噪、源信號數(shù)目判別和源信號恢復(fù)一并處理,適用于大多實(shí)際工程應(yīng)用場合,計算機(jī)仿真結(jié)果證明了算法的有效性。
盲源分離的簡化數(shù)學(xué)模型可以表示為
X(t)=AS(t)。
(1)
考慮實(shí)際工程中傳感器采集的觀測信號一般會受噪聲干擾,在正定盲源分離的約束條件中,噪聲可以被看作為一路源信號,并且在多路源信號中,最多只能有一路滿足高斯分布的噪聲,否則會降低源信號的分離性能,甚至導(dǎo)致分離方法失效。對于含有噪聲的單通道觀測信號,降噪是實(shí)現(xiàn)盲源分離的重要預(yù)處理工作。SVD降噪是利用信號與噪聲的奇異值不同[6],在奇異值分解后,可采用中值或者均值準(zhǔn)則使對應(yīng)于噪聲分量的奇異值為零,然后重構(gòu)原信號達(dá)到降噪的目的。對于給定的階數(shù)為M×N的矩陣C,設(shè)有兩個酉矩陣U∈RM×M和V∈RN×N,并且酉矩陣U和V同時滿足UUT=I,VVT=I,并設(shè)
Λ=[diag{λ1,λ2,…,λp}],
(2)
其中p=min(N,M),使得式(3)成立,
A=UΛVT。
(3)
那么U和V則分別是M×M和N×N的正交矩陣,式(2)中Λ的對角元素稱為奇異值,并且按照降序排列。因?yàn)棣珵閷蔷仃?,因此SVD可以將一個秩為K的M×N階矩陣C表示成為K個秩為1的M×N階子矩陣的和,每個子矩陣由兩個特征向量和一個權(quán)值相乘得到,
(4)
式中:矢量ui和vi分別為矩陣U和V的第i列向量;λi是矩陣C的按降序排列的第i個奇異值。因此一個矩陣經(jīng)過SVD分解,就成為一系列子矩陣Ci和相應(yīng)的奇異值λi的乘積。SVD分解的實(shí)質(zhì)是將矩陣投影到一系列不相關(guān)的子空間中,如果存在噪聲,那么矩陣C經(jīng)SVD分解得到的奇異值都不為零,即Λ為一個滿秩的對角矩陣。對于單通道信號利用SVD分解,首先要對單通道信號進(jìn)行相空間重構(gòu),即利用滑動窗對數(shù)據(jù)進(jìn)行截斷,構(gòu)建Hankel矩陣,假設(shè)離散單通道觀測信號為X(n)=[x(1),x(2),…,x(n)],那么該離散信號的Hankel矩陣可以表示為
(5)
如果觀測信號中存在噪聲或者突發(fā)的干擾信息,那么Hankel矩陣可以寫為
C=Cm+W。
(6)
式中:m=N-n+1;矩陣W可以看作是對矩陣C的一個擾動,對應(yīng)了信號中的噪聲部分;相對的Cm是信號的平滑部分在重構(gòu)相空間的中的軌跡矩陣。根據(jù)奇異值對應(yīng)信號和噪聲的特點(diǎn),利用SVD分解可以近似的獲得Cm,即保留平滑信息對應(yīng)的奇異值,將其他奇異值置零并利用式(4)重構(gòu)原信號的方法實(shí)現(xiàn)降噪。如果在降噪的基礎(chǔ)上,僅根據(jù)指定的奇異值利用SVD逆過程重構(gòu)就可以得到SVD分解對應(yīng)的不同分量,這些分量累加得到的信號就是降噪后的信號。利用SVD分解對應(yīng)的分量作為觀測信號,可以進(jìn)行進(jìn)一步的盲源分離工作。
利用SVD分解得到的分量作為多路觀測信號,實(shí)現(xiàn)了維數(shù)擴(kuò)展,但是在未知源信號數(shù)目的情況下,仍然無法利用傳統(tǒng)的獨(dú)立分量分析(Independent Component Analysis,ICA)方法進(jìn)行盲源分離??紤]式(1)模型中,如果源信號具有稀疏特征,即在大多數(shù)特定采樣時刻,僅有一個源信號占優(yōu),而其他源信號在當(dāng)前時刻可以近似為0。假設(shè)在采樣時刻t占優(yōu)的為第j個源信號sj(t),那么滿足系數(shù)特征的采樣時刻式(1)可以寫為
(7)
(8)
式(8)為一直線方程,該直線的方向與混合矩陣第j列向量方向相同,由此可知,如果源信號具有稀疏特征,那么觀測信號則具有線性聚類特征[7]。
如果時域中源信號不滿足稀疏特征,可以將時域信號轉(zhuǎn)換到變換域獲得滿足稀疏特征后進(jìn)行處理,常用的變換方法包括小波變換、傅立葉變換和時頻變換。三個中心頻率不同的正弦信號混合后選取其中兩個觀測信號的散點(diǎn)圖如圖1。可以看出在時域中散點(diǎn)圖并不具有直線特征。文中采用STFT增強(qiáng)觀測信號的稀疏性,根據(jù)式(1)得到對應(yīng)的時頻域盲源分離模型表示為
X(τ,f)=AS(τ,f)。
(9)
其中X(τ,f)和S(τ,f)分別對應(yīng)時域觀測信號X(t)和源信號S(t)的時頻域表示。在時頻域得到的觀測信號的散點(diǎn)圖如圖2。可以看出時頻域中源信號呈現(xiàn)典型的直線聚類特征。此外,根據(jù)時頻域中的直線方向角數(shù)目可以判別出源信號的數(shù)目為3。
圖1 時域觀測信號散點(diǎn)圖
圖2 時頻域中觀測信號散點(diǎn)圖
由SVD和K-means均值聚類方法,這里給出一種單通道盲源分離算法。首先將單通道觀測信號進(jìn)行相空間重構(gòu),利用SVD分解,根據(jù)均值準(zhǔn)則進(jìn)行降噪處理,即
(10)
對于保留的奇異值λi分別根據(jù)SVD逆過程重構(gòu)對應(yīng)的分量,即
(11)
(12)
利用M1剔除能量極小值,
(13)
(14)
式(14)可以直接由式(8)推導(dǎo)得到,可見如果時頻點(diǎn)(τi,fi)為單源點(diǎn),那么對應(yīng)在該時頻點(diǎn)上的任意兩個不同觀測信號的比值為實(shí)數(shù)。但是實(shí)際中由于STFT變換中加窗的能量泄露以及噪聲干擾等因素,這一比值嚴(yán)格為實(shí)數(shù)的概率很小,僅需要其虛部足夠小即可,設(shè)
(15)
(16)
其中ξ為設(shè)定的較小的判決閾值,則單源點(diǎn)則可以根據(jù)M2與相應(yīng)觀測信號的時頻表示點(diǎn)乘來獲得。
(17)
完成能量極小點(diǎn)剔除和單源點(diǎn)檢測可以在時頻平面內(nèi)去除影響聚類精度的大量無用樣本數(shù)據(jù),使得觀測信號的線性聚類特征更為明顯。
對完成預(yù)處理后的觀測信號進(jìn)行K-Means聚類,得到估計混合矩陣,并利用矩陣求逆獲得分離矩陣,以觀測信號和分離矩陣相乘獲得源信號的估計。
仿真中利用正弦信號與方波信號和一路高斯噪聲信號模擬源信號,其中采樣頻率為1024 Hz,正弦信號和方波信號的中心頻率分別為15 Hz和5 Hz,混合矩陣為
(18)
觀測信號的波形如圖3。
a)觀測信號1
b)觀測信號2
c)觀測信號3
以第一路觀測信號模擬單通道混合信號,并對其進(jìn)行SVD分解,在SVD分解結(jié)果中利用均值準(zhǔn)則去除噪聲分量,并保留前兩個奇異值分別重構(gòu)分解分量作為新的觀測信號。SVD分解得到的奇異值如圖4,采用均值準(zhǔn)則進(jìn)行降噪處理則只保留前兩個奇異值,分別以前兩個奇異值進(jìn)行分量重構(gòu),對兩個分量進(jìn)行STFT變換,并進(jìn)行能量極小值剔除和單源點(diǎn)檢測后繪制的散點(diǎn)圖如圖5,由圖5可確定源的數(shù)目為2。進(jìn)行K-Means均值聚類估計混合矩陣,并以混合矩陣的逆求得分
離矩陣,利用SVD重構(gòu)的兩個分量乘以分離矩陣得到源信號的估計結(jié)果如圖6。從圖6中可以看出,方波信號和正弦信號得到了有效分離。
圖4 SVD分解奇異值 圖5 預(yù)處理后散點(diǎn)圖
a)分離信號1
b)分離信號2
文中提出了一種基于SVD分解和K-Means聚類的單通道盲源分離算法,將SVD降噪與K-Means聚類估計混合矩陣進(jìn)行了結(jié)合,在利用SVD降噪的同時,分別以保留的不同奇異值構(gòu)建分量作為觀測信號,實(shí)現(xiàn)了觀測信號的維度擴(kuò)展。利用STFT對信號進(jìn)行稀疏化處理,在時頻域中通過能量極小值剔除和單源點(diǎn)檢測后的觀測分量散點(diǎn)圖估計源信號數(shù)目。利用K-Means均值聚類在觀測信號時頻域基礎(chǔ)上獲得混合矩陣的估計,得到源信號的恢復(fù)。算法在對工程上具有噪聲干擾條件下的單通道信號處理中具有實(shí)際應(yīng)用價值。