張守成
(廣西民族師范學院 數(shù)理與電子信息工程學院, 廣西 崇左 532200)
獨 立 分 量 分 析 ( Independent Component Analysis,ICA)是20 世紀90 年代后期發(fā)展起來的一項新的信號分解技術(shù),目前已成功應用在語音分析、特征提取、生物醫(yī)學工程等領域[1-2]。 傳統(tǒng)ICA 方法以分離出所有源信號為目標,往往同時分離出所有的源信號[3-6],而在很多實際應用中,可能僅對其中某一個源信號感興趣。
在此背景下,Lu 等學者[7-8]提出了參考獨立成分分析(ICA-R)算法,利用期望提取信號的波形先驗信息構(gòu)造出參考信號,將其引入到傳統(tǒng)的ICA 算法中,通過優(yōu)化算法提取出在一定量度下與參考信號最接近的輸出作為期望源信號,具有直接高效的優(yōu)點,并且參考信號的引入能提高期望源信號的分離質(zhì)量和精度。 但該方法計算相對繁瑣。 本文通過對ICA-R 算法的原理進行分析,利用峭度作為度量,巧妙調(diào)整目標函數(shù),并利用蜂群優(yōu)化算法處理目標函數(shù),得到一種計算簡單、分離性能好的ICA-R算法。 最后通過仿真實驗證明了該算法的有效性。
德國生物學家Frisch 發(fā)現(xiàn)在自然界中,雖然各組織內(nèi)不同職能的蜜蜂只能完成單一的任務,但蜜蜂通過搖擺舞、氣味等多種信息交流方式,使得整個蜂群能夠迅捷地發(fā)現(xiàn)優(yōu)良蜜源,實現(xiàn)自組織行為[9]。 Seeley 在1995 年最先提出了蜂群的自組織模擬模型;Teodorovic 于2003 年進一步提出了蜂群優(yōu)化算法(Artificial Bee Colony, ABC)[10-12]。 ABC算法是一種新興的仿生智能優(yōu)化算法,具有全局收斂能力強、設置參數(shù)少、適用范圍廣等特點,ABC 已被應用于許多科學工程領域。 例如,文獻[11]將ABC 算法應用于盲信號分離代替了傳統(tǒng)的梯度法,克服了梯度法收斂速度慢、易陷入局部極值點等缺點,提高了盲源分離算法的分離精度和穩(wěn)定性。
線性瞬時混合ICA 模型通常表示為[1]:x(t)=As(t),其中s(t)=[s1(t),…,sM(t)]T是M個假設為統(tǒng)計獨立的未知源信號,A是一個未知的N × M混 合 矩 陣 ( 一 般 假 設N≥M),x t( )=[x1(t) ,…,xN(t) ]T是源信號經(jīng)A線性混合后得到的N個觀測信號。
ICA 的目標是估計一個最佳的M × N解混矩陣W,使得觀測信號經(jīng)過W變換后得到的M個輸出信號y(t)=Wx(t) 是獨立的,從而作為源信號s(t)的估計。 一般情況下不可能直接求得解混矩陣的解,需要通過基于目標函數(shù)的自適應方法求解,具體過程是:首先對實際問題的源信號和信道傳輸過程進行分析,然后根據(jù)源信號的隨機特征確定度量輸出源分離結(jié)果的測度,如非高斯性、稀疏性等測度方法,根據(jù)測度理論構(gòu)造目標函數(shù),并選擇合適的優(yōu)化方法。 常用的優(yōu)化算法有基于梯度的隨機梯度算法和牛頓方法等。 在進行優(yōu)化后,最終獲得解混矩陣,輸出估計的源信號。 因此ICA 的核心問題可以表示為:ICA 方法=目標函數(shù)+優(yōu)化算法[12]。
而ICA-R 算法一般利用期望源信號的波形先驗信息構(gòu)造出其參考信號r(t), 隨后將輸出信號y(t) 與r(t) 的某個接近性量度ε(y,r) 作為先驗約束引入到傳統(tǒng)ICA 的學習中,算法收斂后得到一個最優(yōu)權(quán)向量w*(解混矩陣W的一行),將y =w*Tx(t) 作為期望源信號的估計信號。
以上就是ICA-R 算法的基本原理,文獻[7]選擇負熵作為信號非高斯性的度量,并據(jù)此構(gòu)造目標函數(shù),利用擬牛頓方法得到了一種ICA-R 算法。 但由于涉及復雜的二階導數(shù)計算,效率較低。
峭度作為信號非高斯性的度量也被廣泛使用,基于ICA-R 算法的原理,本文選取輸出信號峭度的絕對值作為輸出信號非高斯型的度量,假定K(y) 有M個局部或全局最優(yōu)解wi(i=1,…,M),相應給出M個源信號的估計。 則輸出信號與參考信號的接近性量度ε(y,r)當且僅當輸出y =w*Tx是期望源信號時取得最小值,即有:
由此可知,一定存在一個閾值參數(shù)ξ滿足以下不等式, 當且僅當輸出信號y =w*Tx時使得g(w)=ε(y,r) -ξ≤0 成立。 將g(w) ≤0 作為一個對K(y) 的約束,則算法的優(yōu)化框架為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
其中,等式約束h(w)=0 用于保證K(y) 和w有界。
將觀測數(shù)據(jù)x進行白化,用表示白化后數(shù)據(jù),并對權(quán)向量w每次更新后歸一化。 則有E(y2)=,其中R~x~x =I是的協(xié)方差矩陣。 上式保證了h(w)=E(y2) - 1=0恒成立,從而算法的優(yōu)化框架簡化為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
由ICA-R 算法設計的基本原理可知,在約束g(w) ≤0 下最大化得到最優(yōu)權(quán)向量w*, 此時接近性量度ε(y,r) 也取得最小值,則- ε(y,r) 取得最大值,從而可將最大化的目標函數(shù)調(diào)整為K(y) 和- ε(y,r) 的乘積,即:
其中,ε(y,r)=E[(y - r)2]。
通過最大化M(y) 得到最優(yōu)權(quán)向量w*的優(yōu)化算法選擇較多,鑒于ABC 算法具有全局收斂性強、收斂速度快的特點,采用ABC 算法對目標函數(shù)M(y) 進行優(yōu)化得到最優(yōu)權(quán)向量w*,就可以實現(xiàn)目標源信號的提取。
為了驗證本文改進算法的有效性,對合成數(shù)據(jù)進行仿真實驗。取4 個零均值單位方差的獨立源信號:S1,S2為確定性信號,S3,S4為隨機信號。 樣本數(shù)據(jù)為2 000個,經(jīng)白化后的源信號如圖1 所示(為方便觀察,只繪出前300 個樣本點)。 用一個隨機生成的高斯矩陣對源信號進行混合,得到的混合信號如圖2 所示。 用各源信號相應的符號函數(shù)序列作為提取的對應參考信號,如圖3 所示。 采用本文所提算法對各源信號進行抽取,收斂后抽取的信號如圖4 所示。 直觀上比較圖4 與圖1,波形基本一致,表明算法很好地實現(xiàn)了對各個信號的盲抽取。
圖1 源信號Fig. 1 Source signal
圖2 混合信號Fig. 2 Mixed signal
圖4 抽取信號Fig. 4 Extracted signal
為進一步說明分離效果,采用量化指標IPI(Individual Performance Index)對分離性能進行評價[1]:
其中,pj表示全局分離變量p =wTA的第j個元素。IPI越接近于零,表明算法分離性能越好。
對上述信號采用本文算法進行150 次蒙特卡洛實驗,每次都隨機產(chǎn)生混合矩陣。 實驗結(jié)果顯示,算法每次都能抽取成功,表明算法在不需要閾值參數(shù)選擇的情況下收斂性能穩(wěn)定。
150 次提取信號后的平均IPI值見表1。
表1 算法收斂的平均IPI 值Tab. 1 Average IPI of the algorithm
表1 顯示在成功抽取時采用本文算法有低IPI值,說明算法對各源信號的抽取性能優(yōu)異。
通過巧妙調(diào)整目標函數(shù)并采用蜂群優(yōu)化算法有效避免了閾值選擇問題,簡化了計算。 計算機仿真實驗表明了本文算法收斂性能穩(wěn)定,可有效實現(xiàn)對信號的盲提取。 當然,對實際應用中不同的提取信號,如何構(gòu)造合適的參考信號是需要進一步探討的課題。