馬 誠,李云紅,陳錦妮
(西安工程大學 電子信息學院 西安 710048)
信源數(shù)目估計是盲信號分離算法應(yīng)用的前提,也是一個技術(shù)難點[1-2]。盲信號分離[3-6]也一直是信號處理領(lǐng)域的研究熱點,其可以根據(jù)混合信號和源信號的維數(shù)分為欠定[7]、適定[8]、超定[9]三種情況。目前,大多數(shù)盲信號分離算法屬于適定盲分離[10-11],即源信號維數(shù)與混合信號維數(shù)相等,然而在實際應(yīng)用中,源信號維數(shù)往往未知且處于動態(tài)變化中,并且信號在傳播過程中易受噪聲的干擾,因此,信源數(shù)目準確估計的難度大幅度提高,并直接影響盲信號分離效果。
隨著盲信號分離算法的發(fā)展,出現(xiàn)了一些性能較好的盲信號分離算法。主分量分析[12]作為其中分離性能較好的方法之一,其假定信號服從高斯分布,只考慮信號的二階統(tǒng)計特性,而無法描述信號的概率分布特性。非線性主分量分析[13](Nonlinear Principle Component Analysis)方法通過在算法中添加非線性函數(shù),使得變換后的信號服從高斯分布,因而算法實質(zhì)上考慮了信號的高階統(tǒng)計特性。核主分量分析方法的提出,進一步拓展了其應(yīng)用范圍。
目前,盲信號分離主要面臨兩個主要難題:一是傳感器接收到的信號會受到信道噪聲的影響;二是混合信號的維數(shù)不一定和源信號的維數(shù)相等。這就使得信道噪聲去除和源信號維數(shù)估計顯得尤為重要。因此,針對上述問題,本文提出基于信源數(shù)目估計的超定盲源信號分離方法,能有效去除信道中的噪聲,并對源信號維數(shù)準確估計,實現(xiàn)盲信號的準確分離。
含信道噪聲的盲信號分離的數(shù)學模型如下:
X(m×N)=A(m×n)·S(n×N)+ξ(m×N)。
(1)
式中:S=[s1,s2,…,sn]T為n維源信號,A是m×n維混合矩陣,ξ表示信道噪聲,N代表信號樣本個數(shù),X=[x1,x2,…,xn]T表示傳感器觀測的m維數(shù)據(jù)向量即混合信號。
白化是有效的盲源分離預(yù)處理方法。白化不僅可以消除原數(shù)據(jù)之間的相關(guān)性,而且一定程度上可以抑制噪聲。
當樣本個數(shù)N足夠大時,并且假定源信號S已經(jīng)經(jīng)過單位化處理,根據(jù)中心極限定理觀測信號的協(xié)方差矩陣Σ可以表示為
Σ=AAT+ψ。
(2)
式中:Σ=XXT/N,噪聲協(xié)方差矩陣ψ=ξξT/N是對角矩陣。
標準主分量分析算法用于預(yù)白化處理,當公式(1)的噪聲為零時或者信噪比非常高時C-AAT應(yīng)該趨近于零。根據(jù)主分量分析思想,可將AAT進行特征值分解,如公式(3)所示:
(3)
式中:Λn表示由矩陣C的前n個最大的特征值組成的對角矩陣,Un是其對應(yīng)的特征向量。則有
(4)
令
z=Λn-1/2UnTX,
(5)
則有E(zzT)=In,代表z各個分量之間相互正交,即各維信號之間不相關(guān)。
對于包含信道噪聲的數(shù)據(jù),特別是當信噪比較低時,公式(2)中的噪聲協(xié)方差矩陣ψ無法忽略,上述方法無法直接應(yīng)用。
采用類似于標準主分量分析方法,由公式(2)可發(fā)現(xiàn),C-ψ應(yīng)該與AAT相等。式(2)中假定噪聲協(xié)方差矩陣ψ是已知的,然而實際上噪聲協(xié)方差矩陣ψ未知,因此必須估計噪聲協(xié)方差矩陣。建立如下的評價函數(shù):
J(A,ψ)=tr[AAT-(C-ψ)][AAT-(C-ψ)]T。
(6)
很顯然,評價函數(shù)越小,C-ψ應(yīng)該與AAT越接近。評價函數(shù)的微分為
(7)
則可得到
(8)
設(shè)x=Af+ε,其協(xié)方差矩陣具有結(jié)構(gòu)Σ=AAT+ψ。這里A是n×m階矩陣,rank(A)=m,則A和ψ的極大似然估計滿足下面的方程組:
(9)
式中:矩陣S滿足
(10)
公式(9)方程組的解并不唯一,并且迭代法求解方程組時算法也有可能不收斂。Joreskog提出了一種求解方法,同時滿足解的唯一性條件和算法的收斂性要求。
假設(shè)A和ψ滿足唯一性條件ATψ-1A=Δ,則A和ψ的極大似然估計滿足
(11)
而且tr[(AAT+ψ)S-1]=n。通過公式(11)可得到ψ的估計。
(12)
則變換完后新的數(shù)據(jù)為
z=Qx。
(13)
交叉驗證法(Cross-validation)是多變量統(tǒng)計技術(shù)常用的一種方法,其基本思想是,一組數(shù)據(jù)用來提取特征,另一組數(shù)據(jù)來對數(shù)據(jù)進行驗證。本文也將采用該方法對源信號的維數(shù)進行估計。
(14)
根據(jù)上述描述方法,用于噪聲去除和源信號估計的方法的簡要步驟如下:
Step1 根據(jù)信號X計算其協(xié)方差矩陣C,并設(shè)置噪聲協(xié)方差矩陣ψ的初始值。
Step5 重復Step 3和Step 4,直至估計值收斂。
為了驗證本文方法的性能,選擇盲信號分離中常用的信噪比作為評價指標,其計算方式如式(15)所示:
(15)
圖1是由Matlab的系統(tǒng)函數(shù)生成的正弦波信號,周期分別為20 s和80 s,采樣點數(shù)為1 000,歸一化峭度分別為-1.297和-1.521。
圖1 源信號
圖2是線性混合后的信號。混合矩陣A服從區(qū)間[0,1]上均勻分布的6×2隨機矩陣,并在信道中添加高斯噪聲,信噪比為-10 dB。從圖2可看出,經(jīng)過線性混合之后,由于包含較強的高斯白噪聲,源信號已經(jīng)淹沒在噪聲信號中,無法看出原始信號。
圖2 線性混合信號
圖3 源信號維數(shù)估計
圖4是針對輕拖尾與輕拖尾混合信號采用擴展最大熵、Kernel ICA與高斯混合模型三種盲信號分離算法的信號分離結(jié)果。圖4(a)為擴展最大熵的信號分離效果,圖4(b)為Kernel ICA的信號分離效果,圖4(c)是經(jīng)過數(shù)據(jù)預(yù)處理后采用基于高斯混合模型盲信號分離算法的分離結(jié)果。通過對比可看出,經(jīng)過預(yù)處理后,可以很好地分離信號,并且分離信號與源信號較為接近。
(a)擴展最大熵分離信號
表1為三種方法的分離性能、運算時間的對比。從表中可知,高斯混合模型盲信號分離方法的信噪比最高,說明該方法的分離效果最好;同時,該方法運算時間也較少。
表1 三種方法分離輕拖尾與輕拖尾信號實驗結(jié)果
圖5是兩個正弦波信號和一段真實語音信號,三個源信號的歸一化峭度分別為0.373 9、-1.297和-1.521,樣本點個數(shù)為1 000個。
圖5 源信號
圖6是線性混合后的信號,混合矩陣A為服從區(qū)間[0,1]上均勻分布的6×3隨機矩陣,并在信道中添加高斯噪聲,信噪比為-12 dB。從圖中可看出,經(jīng)過混合之后,各維信號混合較為明顯,已經(jīng)無法看出原始信號。
圖6 線性混合信號
圖7是采用本文預(yù)處理方法對源信號維數(shù)進行估計的結(jié)果,橫坐標為源信號數(shù)目的估計值,范圍為1~6。從圖中可以看出,當估計的維數(shù)為3時誤差值最小,也就是源信號的維數(shù)為3,這與真實信號數(shù)目是一致的。
圖7 源信號維數(shù)估計
圖8是針對重拖尾與輕拖尾混合信號采用擴展最大熵、Kernel ICA與高斯混合模型三種盲信號分離算法的信號分離結(jié)果。圖8(a)為擴展最大熵對重拖尾與輕拖尾混合信號的分離效果,圖8(b)為Kernel ICA的分離結(jié)果,圖8(c)是經(jīng)過數(shù)據(jù)預(yù)處理后采用基于高斯混合模型盲信號分離算法的分離結(jié)果。從圖中可看出,采用基于高斯混合模型盲信號分離算法經(jīng)過預(yù)處理后可以很好地分離信號,并且分離信號與源信號較為接近,該方法還可以有效地恢復出源信號。
(a)擴展最大熵分離信號
表2為三種方法的實驗對比結(jié)果。從運算時間和恢復效果來看,本文方法能在相對較短的時間內(nèi)對信號進行有效恢復。
表2 三種方法對比實驗性能
從兩組實驗的仿真結(jié)果可得出,對于多種類型的混合信號,本文提出的噪聲去除和源信號維數(shù)估計方法能對源信號維數(shù)準確估計,根據(jù)估計結(jié)果可對盲信號準確分離。
本文提出了一種用于信道噪聲去除和源信號維數(shù)估計的數(shù)據(jù)預(yù)處理方法。采用本文算法對含噪聲的輕拖尾與輕拖尾、重拖尾與輕拖尾兩組混合信號的源信號個數(shù)進行估計,仿真結(jié)果表明,該算法能去除信道中的噪聲并準確估計盲源個數(shù),平均信噪比增加了2.4 dB,平均運行時間提高了近50%。但是,該方法主要適合于服從高斯分布的噪聲,對于其他分布類型噪聲去除效果并不理想,這一點還有待進一步改進。