徐中英,高迎彬,孔祥玉,杜伯陽
(火箭軍工程大學(xué)控制工程系,陜西 西安 710025)
在現(xiàn)代信號處理和數(shù)據(jù)分析領(lǐng)域,次成分分析是一種常用的分析方法。次成分代表了信號或數(shù)據(jù)具有最小偏差的方向,由多個次成分張成的空間稱為次子空間。次成分分析是指利用次成分或次子空間進(jìn)行信號處理的方法[1]。次成分分析方法可以應(yīng)用在很多領(lǐng)域,如濾波器設(shè)計[2]、Pisarenko 頻率估計[3]、陣列天線設(shè)計[4]、總體最小二乘估計[5]、波達(dá)方向(DoA,direction of arrival)估計[6]等。
早期的次成分分析是通過特征值分解(EVD,eigenvalue decomposition)或者奇異值分解(SVD,singular value decomposition)來實現(xiàn)的,這類算法本質(zhì)上是采用批處理方式,存在計算量大和無法實時運(yùn)算的問題[7]。因此,有研究者提出基于神經(jīng)網(wǎng)絡(luò)的算法,該類算法的優(yōu)點有:1)避免了自相關(guān)矩陣的直接計算,2)能夠?qū)崿F(xiàn)非平穩(wěn)信號的跟蹤,3)能夠處理高維數(shù)據(jù)[7]?;谏窠?jīng)網(wǎng)絡(luò)的算法自提出以來迅速成為國內(nèi)外研究的熱點。
目前,學(xué)者們提出了許多次成分分析算法,如M?ller 算法[8]、SDPM(stable data projection method)[9]、PAST(projection approximation subspace tracking)算法[10]、Douglas 算法[11]等,這些算法都是基于啟發(fā)式推理得到的,缺乏對應(yīng)的準(zhǔn)則函數(shù)。信息準(zhǔn)則規(guī)定了次成分分析方法的搜索方式,利用準(zhǔn)則函數(shù)可以快速確定算法的全局收斂域,因此發(fā)展準(zhǔn)則函數(shù)具有十分重要的意義。目前,已經(jīng)提出的準(zhǔn)則函數(shù)有AMEX(adaptive minor component extraction)函數(shù)[12]、Hasan 函數(shù)[13]、OJAm 函數(shù)[3]等。相比豐富的次成分分析算法而言,準(zhǔn)則函數(shù)并不多見,需要進(jìn)一步豐富和發(fā)展。
本文的主要工作是,通過對Rayleigh 商函數(shù)添加適當(dāng)?shù)膽土P項,提出了一個新型的次子空間準(zhǔn)則函數(shù);通過對所提準(zhǔn)則函數(shù)的平穩(wěn)點進(jìn)行分析,證明了準(zhǔn)則函數(shù)的最優(yōu)解是次子空間的一組基,構(gòu)建了準(zhǔn)則函數(shù)與次子空間之間的聯(lián)系;通過梯度上升法導(dǎo)出了一個次子空間跟蹤算法;通過李雅普諾夫函數(shù)法確定了導(dǎo)出算法的全局收斂域。
將矩陣R的特征值按照從小到大的順序排列,即
特征值對應(yīng)的特征向量也相應(yīng)排列,可以得到R的另外一種特征值分解表示,如式(3)所示。
其中,U1是由最小的r個特征值對應(yīng)的特征向量構(gòu)成的矩陣,U2則是由剩余的n-r個特征值對應(yīng)的特征向量構(gòu)成的矩陣。根據(jù)信號處理理論[14]可知,自相關(guān)矩陣R的最小的r個特征值對應(yīng)的特征向量張成的空間等于信號的次子空間。
其中,W是神經(jīng)網(wǎng)絡(luò)的權(quán)矩陣,tr(·)是矩陣的跡。J(W)是一個無約束優(yōu)化函數(shù),它由兩部分構(gòu)成,第一部分是Rayleigh 商函數(shù),作用是使算法能夠收斂到需要的次子空間;第二部分是一個懲罰函數(shù),作用是對權(quán)矩陣模值施加一個隱形約束,保證算法迭代過程中模值的收斂性。
對于準(zhǔn)則函數(shù)式(4)而言,是否存在全局極大值、是否可以建立與次子空間的聯(lián)系、是否存在其他局部極值是3個非常重要的問題,本文以定理1和定理2對上述問題進(jìn)行回答。
定理1在域內(nèi),當(dāng)且僅當(dāng)時,W是準(zhǔn)則函數(shù)J(W)的平穩(wěn)點,其中Q∈?r×r是一個正交矩陣。
證明由于WTRW>0和WTW≠0均是對稱正定矩陣,因此都是可逆矩陣。由式(4)可得,J(W)對矩陣W的一階微分存在,且有
反之,由平穩(wěn)點定義可得,在J(W)的平穩(wěn)點有?J(W)=0,即
式(7)同時左乘WT并化簡得
證畢。
定理2在域內(nèi),當(dāng)且僅當(dāng)時,準(zhǔn)則函數(shù)J(W)達(dá)到全局極大值。在全局極大值處,其他所有的平穩(wěn)點都是J(W)的鞍點,其中任意一個正交矩陣。
證明根據(jù)定理1可知,任意的均是準(zhǔn)則函數(shù)J(W)的平穩(wěn)點,其中Ur是由R的任意r個特征向量構(gòu)成的矩陣。令Ur中特征向量的位置序號構(gòu)成的集合為S1,即S1={i1,i2,…,ir}。同理,S2={1,2,…,r}為U1中特征向量的位置序號構(gòu)成的集合。
對于任意的S1(S1≠S2)而言,該集合中必定存在某一個元素j,滿足
將矩陣Ur中的第j列向量替換為vj+εvk(k∈S2且k?S1),則形成新矩陣。顯然,有λj>λk。令M1=[0,…,0,vk,0,…,0],即矩陣M1中只有第j列為vk,而其他列都是0,則
進(jìn)一步有
將式(13)和式(14)代入式(15)有
由于λj>λk,則根據(jù)式(15)可得,在平穩(wěn)點處,沿著向量vk的方向,J(W)是遞增的。此外,將矩陣Ur中的vj替換為vj+εvj,則可以獲得新的矩陣。令,即矩陣M2中只有第j列為vj,而其他列都是0,則
其中,D1=diag(0,…,0,1,0,…,0)是一個對角矩陣。
進(jìn)一步有
根據(jù)式(14)和式(19)可得
證畢。
定理1和定理2表明,J(W)存在全局極大值,在全局極大值時,W是次子空間的一組基,且WTRW=I可以被唯一確定。由于J(W)只有全局極大值而沒有其他局部極值,因此通過迭代法(如梯度法)導(dǎo)出的算法可以保證收斂到需要的次子空間。
通過定理1可得,式(5)是J(W)的一階微分。假設(shè)在第k次迭代時,神經(jīng)網(wǎng)絡(luò)的權(quán)矩陣為Wk,則通過利用梯度上升法可以給出下一時刻的權(quán)矩陣更新式,如式(22)所示。
其中,μ是算法的學(xué)習(xí)因子,滿足0<μ<1。經(jīng)過多次迭代運(yùn)算后,神經(jīng)網(wǎng)絡(luò)權(quán)矩陣將最終收斂到次子空間的一組基。
本節(jié)對導(dǎo)出算法式(22)的收斂性進(jìn)行討論。當(dāng)學(xué)習(xí)因子μ足夠小時,離散差分式(22)可以近似為與之相對應(yīng)的連續(xù)微分方程[15]。
其中,t=kμ。由此,算法的全局收斂性可以通過對該連續(xù)微分方程對應(yīng)的動態(tài)系統(tǒng)分析來完成。根據(jù)李雅普諾夫第二定律,動態(tài)系統(tǒng)的收斂性分析主要涉及以下兩方面:1)動態(tài)系統(tǒng)是否能夠全局收斂到次子空間;2)動態(tài)系統(tǒng)可以吸引的范圍是多少,即什么樣的初始化條件能夠保證系統(tǒng)的全局收斂性。
定理3將給出上述2個問題的答案。
定理3給定常微分方程式(23),假如初始化全矩陣滿足W(0)∈Ω,則當(dāng)t→∞時,W(t)必將全局漸進(jìn)收斂到集合中的一個點,其中Q∈?r×r任意一個正交矩陣。
證明令L(W)=-J(W)。根據(jù)定理1和定理2,L(W)與J(W)有相同的平穩(wěn)點,且在處,L(W)取得全局極小值。利用求導(dǎo)鏈?zhǔn)椒?,則
將式(5)和式(23)代入式(24),則很容易得到,對于任意的W∈Ω,均有。因此L(W)構(gòu)成了式(23)的李雅普諾夫函數(shù)。根據(jù)李雅普諾夫第二定律,從任意初始化權(quán)矩陣出發(fā)的動態(tài)系統(tǒng)都收斂到相同的不變集由于是不穩(wěn)定的鞍點,因此W(t)必將全局漸進(jìn)收斂到中的一個點。
證畢。
本節(jié)通過3個仿真實驗來驗證所提準(zhǔn)則函數(shù)和導(dǎo)出算法的正確性。第一個實驗提供了一種特殊情況下的準(zhǔn)則函數(shù)曲線,第二個實驗展示了導(dǎo)出算法在次成分分析方面的優(yōu)越性,第三個實驗是算法在DoA 估計中的應(yīng)用。
令準(zhǔn)則函數(shù)J(W)中R=diag(2,1)。當(dāng)提取子空間維數(shù)為1,即r=1時。如果W=[W11,W12]T,則通過適當(dāng)簡化有
圖1是利用Matlab 繪出上述情況下的J(W)曲線。從圖1中可以看出,J(W)存在全局極大值,而沒有局部極值,這與定理2的分析結(jié)果相一致。當(dāng)權(quán)矩陣W=[0,±1]T時,準(zhǔn)則函數(shù)J(W)取得全局極大值,此時W=[0,±1]T正好是R=diag(2,1)的次成分,從而證明了所提準(zhǔn)則函數(shù)的正確性。
圖1 準(zhǔn)則函數(shù)的3D 曲線
5.1 節(jié)實驗主要通過一個特例來證明所提信息準(zhǔn)則的正確性,本節(jié)實驗將考察準(zhǔn)則函數(shù)導(dǎo)出算法進(jìn)行次成分分析的能力。首先,利用文獻(xiàn)[10]的方法隨機(jī)生成一個5×5對稱正定矩陣,如式(26)所示。
該矩陣的最小特征值為λ1=0.8348,其對應(yīng)的次成分特征向量為
然后,分別利用導(dǎo)出算法、OJAm 算法[3]和Douglas 算法[11]對該矩陣的次成分進(jìn)行提取。為了定量描述算法的性能,這里引入2個評價函數(shù)[10]。
1)方向余弦
方向余弦(DC,direction cosine)實際上是權(quán)矩陣與次成分方向之間的夾角,如式(28)所示。如果DC=1,則表示W(wǎng)k與1v方向重合。
2)權(quán)矩陣過程模值
對于OJAm 算法和Douglas 算法,已經(jīng)證明算法收斂時WTW=I,因此過程模值??;對于導(dǎo)出算法而言,根據(jù)式(8)有WTRW=I,因此取
在迭代過程中,為了保證算法公平比較,3個算法采用相同的初始化權(quán)矩陣和學(xué)習(xí)因子。本實驗中,初始化權(quán)矩陣是隨機(jī)產(chǎn)生的(矩陣的每個元素均是高斯白噪聲),學(xué)習(xí)因子μ=0.01。3種算法的仿真結(jié)果如圖2和圖3所示,該結(jié)果曲線是100次獨立仿真結(jié)果的平均值。
從圖2中可以看出,所提算法的方向余弦曲線最終收斂到了單位1,即所提算法能夠收斂到次成分的方向。從圖3中可以看出,迭代過程中,權(quán)矩陣模值是有界的且最終也收斂到了1,與定理1的分析結(jié)果相吻合。因此,綜合圖2與圖3結(jié)果可知,所提算法具備次成分分析的能力。對比圖2和圖3中3種算法的表現(xiàn)可知,相比OJAm 算法和Douglas算法,本文所提算法在方向余弦和權(quán)矩陣模值方面具有較快的收斂速度。
圖2 方向余弦曲線
圖3 權(quán)矩陣模值曲線
假設(shè)一個具有8個陣子的線性等距天線陣列,陣子的間距為半個波長。3個遠(yuǎn)場信號的入射角(即DoA 角)分別為12°、19°和27°。信號中的噪聲為加性高斯白噪聲,且信噪比為20 dB。分別利用所提算法、OJAm 算法[3]和Douglas 算法[11]對信號的次子空間進(jìn)行估計,通過MUSIC 法計算DoA 角。本節(jié)實驗中,3種算法的初始化方法與實驗2相同,初始化權(quán)矩陣是隨機(jī)產(chǎn)生的,學(xué)習(xí)因子μ=0.1。為了評價算法對子空間的估計結(jié)果,算法迭代過程中分別計算3個算法估計子空間與單位矩陣之間的正交誤差,如式(29)所示。
其中,對于 Douglas 算法和 OJAm 算法有A=WTW;對于所提算法有A=WTRW。圖4是3個算法的正交誤差曲線,圖5是利用導(dǎo)出算法得到的譜密度曲線。
圖4 正交誤差曲線
圖5 所提算法的DoA 估計曲線
從圖4中可以看出,經(jīng)過大約100次迭代運(yùn)算后,所提算法的正交誤差已經(jīng)趨于0,即權(quán)矩陣已經(jīng)收斂到了信號的次子空間。通過與其他2個算法對比可以發(fā)現(xiàn),所提算法的收斂速度要快于其他2種算法。從圖5中可以看出,譜密度曲線分別在3個DoA 角處取得極值。因此可以得出結(jié)論,所提算法能夠有效地解決DoA 估計問題,而且收斂速度優(yōu)于同類型其他算法。
次成分分析是信號處理和數(shù)據(jù)分析領(lǐng)域一門重要的工具,而尋找準(zhǔn)則函數(shù)在次成分分析算法中具有十分重要的地位。本文首先提出了一個新型的次子空間跟蹤準(zhǔn)則函數(shù),并通過分析準(zhǔn)則函數(shù)平穩(wěn)點建立起了準(zhǔn)則函數(shù)與次子空間之間的關(guān)系;基于此信息準(zhǔn)則構(gòu)建了一個新的次子空間跟蹤算法,并證明了算法的全局收斂性。仿真實驗表明,與一些現(xiàn)有算法相比,本文提出的算法具有較快的收斂速度。