張守成
(廣西民族師范學(xué)院 數(shù)理與電子信息工程學(xué)院, 廣西 崇左 532200)
獨(dú) 立 分 量 分 析 ( Independent Component Analysis,ICA)是20 世紀(jì)90 年代后期發(fā)展起來(lái)的一項(xiàng)新的信號(hào)分解技術(shù),目前已成功應(yīng)用在語(yǔ)音分析、特征提取、生物醫(yī)學(xué)工程等領(lǐng)域[1-2]。 傳統(tǒng)ICA 方法以分離出所有源信號(hào)為目標(biāo),往往同時(shí)分離出所有的源信號(hào)[3-6],而在很多實(shí)際應(yīng)用中,可能僅對(duì)其中某一個(gè)源信號(hào)感興趣。
在此背景下,Lu 等學(xué)者[7-8]提出了參考獨(dú)立成分分析(ICA-R)算法,利用期望提取信號(hào)的波形先驗(yàn)信息構(gòu)造出參考信號(hào),將其引入到傳統(tǒng)的ICA 算法中,通過(guò)優(yōu)化算法提取出在一定量度下與參考信號(hào)最接近的輸出作為期望源信號(hào),具有直接高效的優(yōu)點(diǎn),并且參考信號(hào)的引入能提高期望源信號(hào)的分離質(zhì)量和精度。 但該方法計(jì)算相對(duì)繁瑣。 本文通過(guò)對(duì)ICA-R 算法的原理進(jìn)行分析,利用峭度作為度量,巧妙調(diào)整目標(biāo)函數(shù),并利用蜂群優(yōu)化算法處理目標(biāo)函數(shù),得到一種計(jì)算簡(jiǎn)單、分離性能好的ICA-R算法。 最后通過(guò)仿真實(shí)驗(yàn)證明了該算法的有效性。
德國(guó)生物學(xué)家Frisch 發(fā)現(xiàn)在自然界中,雖然各組織內(nèi)不同職能的蜜蜂只能完成單一的任務(wù),但蜜蜂通過(guò)搖擺舞、氣味等多種信息交流方式,使得整個(gè)蜂群能夠迅捷地發(fā)現(xiàn)優(yōu)良蜜源,實(shí)現(xiàn)自組織行為[9]。 Seeley 在1995 年最先提出了蜂群的自組織模擬模型;Teodorovic 于2003 年進(jìn)一步提出了蜂群優(yōu)化算法(Artificial Bee Colony, ABC)[10-12]。 ABC算法是一種新興的仿生智能優(yōu)化算法,具有全局收斂能力強(qiáng)、設(shè)置參數(shù)少、適用范圍廣等特點(diǎn),ABC 已被應(yīng)用于許多科學(xué)工程領(lǐng)域。 例如,文獻(xiàn)[11]將ABC 算法應(yīng)用于盲信號(hào)分離代替了傳統(tǒng)的梯度法,克服了梯度法收斂速度慢、易陷入局部極值點(diǎn)等缺點(diǎn),提高了盲源分離算法的分離精度和穩(wěn)定性。
線性瞬時(shí)混合ICA 模型通常表示為[1]:x(t)=As(t),其中s(t)=[s1(t),…,sM(t)]T是M個(gè)假設(shè)為統(tǒng)計(jì)獨(dú)立的未知源信號(hào),A是一個(gè)未知的N × M混 合 矩 陣 ( 一 般 假 設(shè)N≥M),x t( )=[x1(t) ,…,xN(t) ]T是源信號(hào)經(jīng)A線性混合后得到的N個(gè)觀測(cè)信號(hào)。
ICA 的目標(biāo)是估計(jì)一個(gè)最佳的M × N解混矩陣W,使得觀測(cè)信號(hào)經(jīng)過(guò)W變換后得到的M個(gè)輸出信號(hào)y(t)=Wx(t) 是獨(dú)立的,從而作為源信號(hào)s(t)的估計(jì)。 一般情況下不可能直接求得解混矩陣的解,需要通過(guò)基于目標(biāo)函數(shù)的自適應(yīng)方法求解,具體過(guò)程是:首先對(duì)實(shí)際問(wèn)題的源信號(hào)和信道傳輸過(guò)程進(jìn)行分析,然后根據(jù)源信號(hào)的隨機(jī)特征確定度量輸出源分離結(jié)果的測(cè)度,如非高斯性、稀疏性等測(cè)度方法,根據(jù)測(cè)度理論構(gòu)造目標(biāo)函數(shù),并選擇合適的優(yōu)化方法。 常用的優(yōu)化算法有基于梯度的隨機(jī)梯度算法和牛頓方法等。 在進(jìn)行優(yōu)化后,最終獲得解混矩陣,輸出估計(jì)的源信號(hào)。 因此ICA 的核心問(wèn)題可以表示為:ICA 方法=目標(biāo)函數(shù)+優(yōu)化算法[12]。
而ICA-R 算法一般利用期望源信號(hào)的波形先驗(yàn)信息構(gòu)造出其參考信號(hào)r(t), 隨后將輸出信號(hào)y(t) 與r(t) 的某個(gè)接近性量度ε(y,r) 作為先驗(yàn)約束引入到傳統(tǒng)ICA 的學(xué)習(xí)中,算法收斂后得到一個(gè)最優(yōu)權(quán)向量w*(解混矩陣W的一行),將y =w*Tx(t) 作為期望源信號(hào)的估計(jì)信號(hào)。
以上就是ICA-R 算法的基本原理,文獻(xiàn)[7]選擇負(fù)熵作為信號(hào)非高斯性的度量,并據(jù)此構(gòu)造目標(biāo)函數(shù),利用擬牛頓方法得到了一種ICA-R 算法。 但由于涉及復(fù)雜的二階導(dǎo)數(shù)計(jì)算,效率較低。
峭度作為信號(hào)非高斯性的度量也被廣泛使用,基于ICA-R 算法的原理,本文選取輸出信號(hào)峭度的絕對(duì)值作為輸出信號(hào)非高斯型的度量,假定K(y) 有M個(gè)局部或全局最優(yōu)解wi(i=1,…,M),相應(yīng)給出M個(gè)源信號(hào)的估計(jì)。 則輸出信號(hào)與參考信號(hào)的接近性量度ε(y,r)當(dāng)且僅當(dāng)輸出y =w*Tx是期望源信號(hào)時(shí)取得最小值,即有:
由此可知,一定存在一個(gè)閾值參數(shù)ξ滿足以下不等式, 當(dāng)且僅當(dāng)輸出信號(hào)y =w*Tx時(shí)使得g(w)=ε(y,r) -ξ≤0 成立。 將g(w) ≤0 作為一個(gè)對(duì)K(y) 的約束,則算法的優(yōu)化框架為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
其中,等式約束h(w)=0 用于保證K(y) 和w有界。
將觀測(cè)數(shù)據(jù)x進(jìn)行白化,用表示白化后數(shù)據(jù),并對(duì)權(quán)向量w每次更新后歸一化。 則有E(y2)=,其中R~x~x =I是的協(xié)方差矩陣。 上式保證了h(w)=E(y2) - 1=0恒成立,從而算法的優(yōu)化框架簡(jiǎn)化為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
由ICA-R 算法設(shè)計(jì)的基本原理可知,在約束g(w) ≤0 下最大化得到最優(yōu)權(quán)向量w*, 此時(shí)接近性量度ε(y,r) 也取得最小值,則- ε(y,r) 取得最大值,從而可將最大化的目標(biāo)函數(shù)調(diào)整為K(y) 和- ε(y,r) 的乘積,即:
其中,ε(y,r)=E[(y - r)2]。
通過(guò)最大化M(y) 得到最優(yōu)權(quán)向量w*的優(yōu)化算法選擇較多,鑒于ABC 算法具有全局收斂性強(qiáng)、收斂速度快的特點(diǎn),采用ABC 算法對(duì)目標(biāo)函數(shù)M(y) 進(jìn)行優(yōu)化得到最優(yōu)權(quán)向量w*,就可以實(shí)現(xiàn)目標(biāo)源信號(hào)的提取。
為了驗(yàn)證本文改進(jìn)算法的有效性,對(duì)合成數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。取4 個(gè)零均值單位方差的獨(dú)立源信號(hào):S1,S2為確定性信號(hào),S3,S4為隨機(jī)信號(hào)。 樣本數(shù)據(jù)為2 000個(gè),經(jīng)白化后的源信號(hào)如圖1 所示(為方便觀察,只繪出前300 個(gè)樣本點(diǎn))。 用一個(gè)隨機(jī)生成的高斯矩陣對(duì)源信號(hào)進(jìn)行混合,得到的混合信號(hào)如圖2 所示。 用各源信號(hào)相應(yīng)的符號(hào)函數(shù)序列作為提取的對(duì)應(yīng)參考信號(hào),如圖3 所示。 采用本文所提算法對(duì)各源信號(hào)進(jìn)行抽取,收斂后抽取的信號(hào)如圖4 所示。 直觀上比較圖4 與圖1,波形基本一致,表明算法很好地實(shí)現(xiàn)了對(duì)各個(gè)信號(hào)的盲抽取。
圖1 源信號(hào)Fig. 1 Source signal
圖2 混合信號(hào)Fig. 2 Mixed signal
圖4 抽取信號(hào)Fig. 4 Extracted signal
為進(jìn)一步說(shuō)明分離效果,采用量化指標(biāo)IPI(Individual Performance Index)對(duì)分離性能進(jìn)行評(píng)價(jià)[1]:
其中,pj表示全局分離變量p =wTA的第j個(gè)元素。IPI越接近于零,表明算法分離性能越好。
對(duì)上述信號(hào)采用本文算法進(jìn)行150 次蒙特卡洛實(shí)驗(yàn),每次都隨機(jī)產(chǎn)生混合矩陣。 實(shí)驗(yàn)結(jié)果顯示,算法每次都能抽取成功,表明算法在不需要閾值參數(shù)選擇的情況下收斂性能穩(wěn)定。
150 次提取信號(hào)后的平均IPI值見(jiàn)表1。
表1 算法收斂的平均IPI 值Tab. 1 Average IPI of the algorithm
表1 顯示在成功抽取時(shí)采用本文算法有低IPI值,說(shuō)明算法對(duì)各源信號(hào)的抽取性能優(yōu)異。
通過(guò)巧妙調(diào)整目標(biāo)函數(shù)并采用蜂群優(yōu)化算法有效避免了閾值選擇問(wèn)題,簡(jiǎn)化了計(jì)算。 計(jì)算機(jī)仿真實(shí)驗(yàn)表明了本文算法收斂性能穩(wěn)定,可有效實(shí)現(xiàn)對(duì)信號(hào)的盲提取。 當(dāng)然,對(duì)實(shí)際應(yīng)用中不同的提取信號(hào),如何構(gòu)造合適的參考信號(hào)是需要進(jìn)一步探討的課題。