焦芳芳,封志宏,楊桂芹
(蘭州交通大學(xué)電子與信息工程學(xué)院,甘肅蘭州730070)
盲信號(hào)分離技術(shù)是在源信號(hào)和混合過(guò)程未知的情況下,將混合信號(hào)中的源信號(hào)分離出來(lái)的一種方法。盲信號(hào)分離[1]的核心問(wèn)題是分離(或解混合)矩陣的學(xué)習(xí)算法,其基本思想是抽取統(tǒng)計(jì)特征作為輸入的表示,而不丟失信息。盲信號(hào)分離研究的信號(hào)模型主要有線性混合模型、卷積混合模型和非線性混合模型[2]。盲信號(hào)分離理論的發(fā)展可追溯到20世紀(jì)80年代初期。1985年,法國(guó)學(xué)者Herault和Jutten提出了一種使用簡(jiǎn)單的反饋網(wǎng)絡(luò)結(jié)構(gòu)的遞推算法,使得盲信號(hào)分離從此成為了信號(hào)處理領(lǐng)域的一個(gè)研究課題。Tong等給出了完善的盲分離問(wèn)題的數(shù)學(xué)框架并分析了盲分離問(wèn)題的可分離性和不確定性,提出了基于高階統(tǒng)計(jì)的矩陣代數(shù)特征分解方法。Comon系統(tǒng)地分析了瞬時(shí)混迭模型盲信號(hào)分離問(wèn)題[3],明確了獨(dú)立分量分析的概念。近年來(lái),盲信號(hào)分離在圖像處理和語(yǔ)音信號(hào)分離等方面的研究也逐漸引起國(guó)內(nèi)研究者的關(guān)注[4]。凌燮亭等在國(guó)內(nèi)較早地注意并且對(duì)盲分離進(jìn)行大量的理論研究和實(shí)際應(yīng)用研究。曹希仁對(duì)源盲信號(hào)分離的約束條件進(jìn)行了深入的分析研究,理論上提出了分離問(wèn)題的求解原則。何振亞等提出了一系列新的基于高階統(tǒng)計(jì)及信息理論的判據(jù)和改進(jìn)算法[5]。
盲分離的研究不斷深化,新的理論算法不斷被提出,盲信號(hào)混合模型也從開始的線性模型向多元化發(fā)展。近年來(lái),盲分離的研究受到了國(guó)內(nèi)外廣泛的重視,理論研究和實(shí)際應(yīng)用都得到了很大的發(fā)展。
盲信號(hào)分離的基本數(shù)學(xué)模型如圖1所示。
圖1 盲信號(hào)分離的基本數(shù)學(xué)模型
盲信號(hào)分離可以用下面的混合方程描述[6]:
式中,s(t)=[s1(t),…,sn(t)]T,為n個(gè)源信號(hào)構(gòu)成的n維向量;x(t)=[x1(t),…,xm(t)]T,為m 維觀測(cè)數(shù)據(jù)向量,其元素是各個(gè)傳感器得到的輸出;m×n維矩陣H稱為混合矩陣,其元素表示信號(hào)的混合情況,式(1)的含義是 n個(gè)源信號(hào)通過(guò)混合得到m維觀測(cè)數(shù)據(jù)向量,盲信號(hào)分離的基本數(shù)學(xué)模型。盲信號(hào)分離問(wèn)題的提法是:在混合矩陣 H和源信號(hào)未知的情況下,只根據(jù)觀測(cè)數(shù)據(jù)向量x(t)確定分離矩陣W,使得變換后的輸出為:
是源信號(hào)向量s(t)的拷貝或估計(jì)。
盲信號(hào)分離的最終目的就是尋找分離矩陣W,使輸出信號(hào)y(t)盡可能逼近真實(shí)源信號(hào) s(t)?;旌暇仃嘓未知,且在沒(méi)有任何源信號(hào)先驗(yàn)知識(shí)的情況下,源信號(hào)的恢復(fù)即是盲信號(hào)分離問(wèn)題。
由式(1)和式(2)可知,y(t)是對(duì)源信號(hào)s(t)的估計(jì),盲信號(hào)分離問(wèn)題允許存在2個(gè)方面的不確定性:
①排列順序的不確定性,無(wú)法了解所抽取的信號(hào)應(yīng)是源信號(hào)s(t)的哪一個(gè)分量;
②信號(hào)幅度的不確定性,即無(wú)法知道源信號(hào)的真實(shí)幅值。
由于信號(hào)的信息很大一部分隱含在波形中,所以很多時(shí)候這2種不確定性并不影響盲信號(hào)分離技術(shù)的應(yīng)用。
由于對(duì)源信號(hào)和混合矩陣無(wú)先驗(yàn)知識(shí)可以利用,因此必須對(duì)源信號(hào)和混合矩陣做出某些附加假設(shè),不同的實(shí)際問(wèn)題和不同的算法雖對(duì)源信號(hào)和混合矩陣所提出的假設(shè)不盡相同,但基本假設(shè)卻是相同的,即源信號(hào)s(t)各分量si(t)相互統(tǒng)計(jì)獨(dú)立,且其中最多只能有一個(gè)分量服從高斯分布(因多個(gè)高斯過(guò)程混合后仍是一個(gè)高斯過(guò)程,所以無(wú)法分離)。除此之外,還假設(shè):
①源信號(hào)各分量為平穩(wěn)隨機(jī)過(guò)程。大多數(shù)算法都要求源信號(hào)為平穩(wěn)的,對(duì)于非平穩(wěn)信號(hào)的盲分離問(wèn)題,文獻(xiàn)[7,8]提出了多種方法;
②混合矩陣 H為可逆的或者為列滿秩的(當(dāng)n≤m時(shí));
③si(t)是均值為零、方差為1的隨機(jī)信號(hào)。此項(xiàng)假設(shè)是為了使盲分離過(guò)程變得簡(jiǎn)便。即使 si(t)的均值不為零、方差不為1,也可通過(guò)白化方法變其均值為零、方差為1。
盲信號(hào)分離的基本步驟如下:
①建立模型;
②建立目標(biāo)函數(shù);
③尋找算法。
首先根據(jù)所研究的問(wèn)題建立模型;然后根據(jù)信息論和統(tǒng)計(jì)理論等方法建立一個(gè)以 W為變?cè)哪繕?biāo)函數(shù)J(W),在不同的地方,目標(biāo)函數(shù)或其期望值可能被稱為代價(jià)函數(shù)(Cost Function)、損失函數(shù)(Loss Function)、對(duì)比函數(shù)(Contrast Function)或風(fēng)險(xiǎn)函數(shù)(Risk Function)等;最后是尋找一種有效的算法求解^W,例如標(biāo)準(zhǔn)梯度法、隨機(jī)梯度法、自然梯度法以及其他啟發(fā)式的學(xué)習(xí)算法等。若某個(gè) ^W能使J(W)達(dá)到極大(或極小)值,即該 ^W為所求的解。
目標(biāo)函數(shù)的構(gòu)建有多種多樣的方法,最基本建立目標(biāo)函數(shù)的3種方法是:負(fù)熵、KL散度和最大似然目標(biāo)函數(shù)。
盲信號(hào)分離的主要任務(wù)是估計(jì)一個(gè)分離矩陣,并由分離矩陣算出分離信號(hào)。一般情況下不可能求得分離矩陣的封閉形式的解,也就是說(shuō),不可能將它寫成樣本的某個(gè)確定函數(shù),從而直接求得它的值。這時(shí)需要基于目標(biāo)函數(shù)的自適應(yīng)方法求解,具體過(guò)程是:首先對(duì)實(shí)際問(wèn)題信源和信道進(jìn)行分析,做出對(duì)信號(hào)源的統(tǒng)計(jì)性質(zhì)與混合過(guò)程合理假設(shè),建立盲源信號(hào)分離模型;然后,根據(jù)源信號(hào)的隨機(jī)特征確定度量輸出源分離結(jié)果的測(cè)度(非高斯性測(cè)度、信息測(cè)度、稀疏性的測(cè)度、平滑性測(cè)度和線性可預(yù)測(cè)性等)方法,以測(cè)度理論為依據(jù)分離準(zhǔn)則,構(gòu)造目標(biāo)函數(shù)(也稱代價(jià)函數(shù)),選定分離方法。在目標(biāo)函數(shù)明確的情況下,可以使用任何經(jīng)典的優(yōu)化算法,如(隨機(jī))梯度算法和擬牛頓方法等進(jìn)行優(yōu)化,得到分離矩陣和信號(hào)源的估計(jì)。因此,盲源信號(hào)分離的核心問(wèn)題可表示為:
目標(biāo)函數(shù)保證了盲信號(hào)分離實(shí)現(xiàn)可能性和實(shí)現(xiàn)途徑,具體的目標(biāo)函數(shù)還決定算法的統(tǒng)計(jì)性能;優(yōu)化算法決定盲信號(hào)分離方法的性能。根據(jù)對(duì)源信號(hào)的假設(shè)條件源信號(hào)的分離方法有獨(dú)立分量分析、稀疏元分析、主成分析和獨(dú)立因子分析等。
盲信號(hào)分離代表性的算法主要有:Bell-Sejnowski最大信息量(Infomax)方法、Amari自然梯度(Natural Gradient)方法、Cardoso等變化自適應(yīng)方法(EASI)、Hyvarinen快速獨(dú)立元分析算法(FastICA)和矩陣特征值分解方法等。其他算法很多都是在這些算法的基礎(chǔ)上推廣或者補(bǔ)充發(fā)展起來(lái)的,當(dāng)然盲分離并不僅僅局限于這些算法。盲分離中經(jīng)常要用到優(yōu)化運(yùn)算,就優(yōu)化手段而言,Infomax算法、自然梯度算法和EASI算法屬于梯度下降(上升)優(yōu)化算法,收斂速度是線性的,速度略慢一些,但屬于自適應(yīng)方法、具有實(shí)時(shí)在線處理能力;FastICA算法是一種快速而數(shù)值穩(wěn)定的方法,采用擬牛頓算法實(shí)現(xiàn)尋優(yōu),具有超線性收斂速度,通常收斂速度較梯度下降尋優(yōu)算法快得多;矩陣特征值分解盲分離方法通過(guò)對(duì)矩陣進(jìn)行特征分解或者廣義特征分解估計(jì)分離矩陣,是一種解析方法,可直接找到閉形式解(Closed Form Soutions),沒(méi)有迭代尋優(yōu)過(guò)程,因此運(yùn)行速度最快。
從分離的過(guò)程上來(lái)看,盲信號(hào)分離方法有兩大類:一類是前面提及的方法,同時(shí)將所有的信號(hào)都分離出來(lái);另一類是每次只提取出一個(gè)信號(hào)(抽取過(guò)程),然后把這個(gè)提取出的信號(hào)在觀測(cè)信號(hào)中的貢獻(xiàn)去除(緊縮過(guò)程),不斷重復(fù)這個(gè)過(guò)程,就可以將源信號(hào)逐次分離出來(lái)。將這類方法稱作盲信號(hào)抽取(Blind Signal Extraction,BSE),其原理圖如圖2所示。
圖2 盲信號(hào)抽取原理
假如源信號(hào)數(shù)目比較多,只對(duì)其中1個(gè)或幾個(gè)信號(hào)感興趣,就適合采用盲信號(hào)抽取方法。因?yàn)橄鄬?duì)于同時(shí)把所有的源信號(hào)都分離出來(lái)的方法,盲信號(hào)提取方法有幾個(gè)方面的優(yōu)點(diǎn):
①信號(hào)可以根據(jù)一個(gè)特征依次分離出來(lái);
②可以只提取感興趣的信號(hào),對(duì)信號(hào)比較多的情況,有時(shí)候沒(méi)有必要將它們?nèi)糠蛛x出來(lái),只要我們感興趣的信號(hào)被提取出來(lái)以后,就可以終止整個(gè)提取過(guò)程;
③用于BSE的學(xué)習(xí)算法是局部的,與同時(shí)分離所有源信號(hào)的算法相比,算法更簡(jiǎn)單。
由于BSE算法在每提取出一個(gè)信號(hào)以后接著要做一個(gè)降階的過(guò)程,以去除提取出的信號(hào)在原來(lái)輸入信號(hào)中的貢獻(xiàn)。這個(gè)降階過(guò)程依賴于前面提取出的信號(hào)的準(zhǔn)確度,隨著降階過(guò)程的不斷進(jìn)行,前面的誤差會(huì)逐漸放大,從而使提取信號(hào)的準(zhǔn)確度逐步下降。這是BSE算法的一個(gè)缺點(diǎn)。鑒于這一缺點(diǎn),BSE算法還有待于進(jìn)一步研究。
盲信號(hào)分離在最近幾年已獲得了長(zhǎng)足的發(fā)展,提出了若干理論和方法,但還有許多問(wèn)題有待進(jìn)一步研究和解決,尤其是需要對(duì)以下問(wèn)題進(jìn)行研究:
①研究在性質(zhì)未知的環(huán)境中的盲信號(hào)分離問(wèn)題,即對(duì)非平穩(wěn)、非高斯混合信號(hào)的盲分離問(wèn)題的研究;
②卷積混合模型和對(duì)于更一般的非線性混合模型盲分離問(wèn)題的研究較為復(fù)雜,所以研究能夠在奇異混合情況下工作的盲分離算法是未來(lái)盲分離問(wèn)題的發(fā)展方向;
③研究能夠在非線性混合情況下工作的盲分離算法。對(duì)于帶噪聲混合信號(hào)的盲分離,現(xiàn)有的盲源分離算法和盲反卷積算法,大都假設(shè)無(wú)噪聲或者把噪聲看作一個(gè)獨(dú)立源信號(hào)。如何將現(xiàn)有的盲分離算法推廣到一般的噪聲混合模型,是有待于進(jìn)一步研究的問(wèn)題;
④研究信號(hào)個(gè)數(shù)未知時(shí)能夠工作的盲分離問(wèn)題。由于各分量的排列順序和幅值本身存在的不確定性,所以,如何按順序輸出以及只提取1個(gè)或多個(gè)感興趣信號(hào)的盲分離問(wèn)題研究是未來(lái)的研究方向之一;
⑤研究欠定或病態(tài)條件下的盲分離問(wèn)?,F(xiàn)有的盲分離問(wèn)題都是假定信號(hào)個(gè)數(shù)一定的情況下進(jìn)行的,源信號(hào)個(gè)數(shù)未知且可能動(dòng)態(tài)變化時(shí)的盲信號(hào)分離問(wèn)題的研究,觀測(cè)信號(hào)個(gè)數(shù)比源信號(hào)個(gè)數(shù)多(少)的超(欠)定等問(wèn)題的研究,特別是關(guān)于欠定問(wèn)題的研究;
⑥研究混合矩陣不滿足列滿秩的情況下如何盡可能多地去提取源信號(hào)的盲分離問(wèn)題,因?yàn)槟壳按蠖鄶?shù)算法都是在混合矩陣為列滿秩的假設(shè)前提下完成的;
⑦因?yàn)楝F(xiàn)有的盲分離算法幾乎都是單獨(dú)考慮算法的某一方面的單一性能,對(duì)于其他方面性嫩,即對(duì)各種盲源分離算法的全局收斂性、漸近穩(wěn)定性以及魯棒性的研究也將是盲分離問(wèn)題的研究方向之一;
⑧模糊系統(tǒng)理論在盲信號(hào)分離中的應(yīng)用可能也是一個(gè)有前途的研究方向;
⑨與其他技術(shù)(如粒子濾波等)相結(jié)合的盲分離。
盲信號(hào)分離是解決陣列處理和數(shù)據(jù)分析中的一個(gè)典型問(wèn)題,經(jīng)過(guò)學(xué)者們的共同努力,盲分離的理論和算法得到了較快發(fā)展,提出了一些在分離能力、內(nèi)存需求和計(jì)算速度等方面性能各異的算法。盲信號(hào)分離的發(fā)展對(duì)信號(hào)處理起到了極大的推動(dòng)作用,要進(jìn)一步發(fā)揮其作用,許多理論問(wèn)題和算法的研究還有待進(jìn)一步解決,并且需要進(jìn)一步探索盲分離理論與實(shí)際應(yīng)用的契合點(diǎn)。
[1]張賢達(dá),保 錚.盲信號(hào)分離[J].電子學(xué)報(bào),2001,29(12A):1766-1771.
[2]李小軍,朱孝龍,張賢達(dá).盲信號(hào)分離研究分類與展望[J].西安電子科技大學(xué)學(xué)報(bào):自然科學(xué)版,2004,31(3):399-404.
[3]COMMON P.Independent Component Analysis,A New Concept[J].Signal Processing,1994(36):287-314.
[4]馬建倉(cāng),牛奕龍,陳海洋.盲信號(hào)處理[M].北京:國(guó)防工業(yè)出版社,2006:1-273.
[5]李榮華,趙 敏,王 進(jìn).盲信號(hào)分離的理論與發(fā)展現(xiàn)狀[J].移動(dòng)通信,2008,32(8):67-72.
[6]何繼愛(ài),王維芳,李力舟.盲信號(hào)分離方法研究[J].無(wú)線通信技術(shù),2009,35(4):10-14.
[7]PARRA L,SPENCE C.Convolutive Blind Source Separation of Nonstationary Sources[J].IEEE Trans.Speech Audio Processing,2000(10):320-327.
[8]PHAM Dinh-tuan,CARDOSO Jean-francois.BlindSeparationof Instantaneous Mixtures of Nonstationary Sources[J].IEEE Transactions on Signal Processing,2001,49(9):264-269.