徐麗琴
(西安郵電大學(xué)電子工程學(xué)院,陜西 西安710121)
盲源分離是指在源信號(hào)和傳輸信道參數(shù)均未知的情況下,根據(jù)源信號(hào)的統(tǒng)計(jì)特性,僅由觀測(cè)信號(hào)來(lái)恢復(fù)或分離出源信號(hào)。這里“盲”有兩重含義:第一,信號(hào)源是未知的;第二,傳輸信道也是未知的。盲源分離是當(dāng)前信號(hào)處理領(lǐng)域的一個(gè)研究熱點(diǎn),在語(yǔ)音信號(hào)處理、數(shù)字圖像處理、生物醫(yī)學(xué)信號(hào)處理等領(lǐng)域有著非常廣闊和誘人的應(yīng)用前景。獨(dú)立成分分析[1],即ICA,是一種應(yīng)用很廣泛的技術(shù),其目的是尋找一個(gè)變換矩陣,使得變換后的各輸出分量之間盡可能相互統(tǒng)計(jì)獨(dú)立,是目前實(shí)現(xiàn)盲源分離的一種最主要的方法。
假設(shè)N個(gè)統(tǒng)計(jì)獨(dú)立的源信號(hào)經(jīng)過(guò)線(xiàn)性瞬時(shí)混合被M個(gè)傳感器接收,則每個(gè)觀測(cè)信號(hào)是這N個(gè)信號(hào)的一個(gè)線(xiàn)性組合。下面的方程對(duì)于線(xiàn)性時(shí)不變瞬時(shí)混合函數(shù)成立:
其 中,aji,i∈[1,2,…,N],j∈[1,2,…,M]是 混 合 參 數(shù),si(t),i∈[1,2,…,N]是源信號(hào),xj(t),j∈[1,2,…,M]是觀測(cè)信號(hào)。(1)式也可用矢量的形式可表示為:
白化是一種有效的預(yù)處理方法,它可以提高算法的收斂速度。信號(hào)的白化預(yù)處理,即對(duì)信號(hào)進(jìn)行線(xiàn)性變換,使得變換后信號(hào)的各分離互不相關(guān)且各分量的方差均為1。設(shè)觀測(cè)信號(hào)為x,則白化后z=Vx,滿(mǎn)足E(zzT)=I,V為白化矩陣。如果源信號(hào)s具有單位方差,則輸出分離信號(hào)y也應(yīng)具有單位方差,設(shè)分離矩陣為W,則W滿(mǎn)足:
一般利用觀測(cè)數(shù)據(jù)x的協(xié)方差矩陣Rxx=E{xxT}進(jìn)行特征值分解來(lái)實(shí)現(xiàn)對(duì)信號(hào)的白化,即Rxx=EDET,其中,E是由Rxx的特征值向量組成的正交矩陣,D是由與特征向量對(duì)應(yīng)的特征值組成的對(duì)角矩陣。若白化矩陣取V=D-1/2ET,則白化后的信號(hào)z=Vx,滿(mǎn)足:
Fast—ICA算法是Hyvarinen從熵最優(yōu)化方法推導(dǎo)出一種算法[2],其思路是通過(guò)隨機(jī)梯度法調(diào)節(jié)分離矩陣W來(lái)達(dá)到優(yōu)化目的,在該算法的每次迭代中,采樣數(shù)據(jù)是成批使用的,算法是并行分布的,且計(jì)算簡(jiǎn)單,需要的內(nèi)存少,速度很快,又稱(chēng)為定點(diǎn)法算法。
對(duì)于單個(gè)信號(hào)的提取,F(xiàn)ast—ICA算法的代價(jià)函數(shù)定義為:
上式中,v是任一均值為零且具有單位方差的高斯隨機(jī)變量,G為某一非二次型函數(shù),wi是權(quán)向量,滿(mǎn)足條件由(4)式可知,當(dāng)取最優(yōu)值時(shí),J(wi)的值最大。讓J(wi)對(duì)wi求導(dǎo)可得,當(dāng)取最優(yōu)值時(shí),有下式成立:
Fast—ICA算法用牛頓迭代法來(lái)搜索求得上述代價(jià)函數(shù)的最優(yōu)解。基于牛頓迭代的算法的優(yōu)點(diǎn)是,在上述優(yōu)化問(wèn)題中,分離矩陣的每一行向量及其對(duì)應(yīng)的獨(dú)立分量可以一個(gè)一個(gè)提取出來(lái)。令則其雅克比矩陣為:
用當(dāng)前的wi代替w0,求得α的估計(jì)值,便得到牛頓迭代的分離矩陣更新公式為:
需要注意的是,在每次迭代完后都要對(duì)分離矩陣進(jìn)行歸一化處理,這樣做的目的是為了增強(qiáng)算法的穩(wěn)定性。對(duì)于多個(gè)獨(dú)立分量的分離,可以重復(fù)上述過(guò)程一個(gè)一個(gè)提取獨(dú)立分離,每提出一個(gè)分量后要從混合信號(hào)中減去這一獨(dú)立分量,如此重復(fù),直至所有的獨(dú)立分量全部分離出來(lái)為止。
為了驗(yàn)證Fast-ICA算法的快速有效性,我們用Fast-ICA算法對(duì)三路人工混合的語(yǔ)音信號(hào)進(jìn)行分離實(shí)驗(yàn),每路信號(hào)的樣本數(shù)均為10000。各路源語(yǔ)音信號(hào)的時(shí)域波形如圖1所示,混合矩陣A是隨機(jī)產(chǎn)生的隨機(jī)陣。圖2為三路源信號(hào)經(jīng)人工混合后得到的混合信號(hào)波形,在本次實(shí)驗(yàn)中,混合矩陣A為:
圖1 三路原信號(hào)波形
圖2 混合信號(hào)波形
圖3 三路分離信號(hào)波形
圖3為三路語(yǔ)混合語(yǔ)音信號(hào)用Fast—ICA算法恢復(fù)后的波形圖。對(duì)比源信號(hào)的波形和恢復(fù)信號(hào)波形可以看出,F(xiàn)ast—ICA算法能分離超高斯的語(yǔ)音信號(hào),具有良好的語(yǔ)音分離效果;從運(yùn)行過(guò)程來(lái)看,該算法具有很快的收斂速度,迭代幾步即可收斂。因此,F(xiàn)ast—ICA在語(yǔ)音信號(hào)盲分離應(yīng)用中具有很大的發(fā)展?jié)摿Α?/p>
[1]Herault J,Jutten C.Space or time adaptive signal pro cessing by neural network model[C]//Neural networks for computing:AIP conf.Proceedings 151,New York:American Institute for physics,April,1986:13-16.
[2]Hyvarinen A,Oja E.A fast fixed-point algorithm for independent component analysis[J].Neural Networks,1998,10(9):1483-1492.