國 強,余華東
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院,黑龍江 哈爾濱 150001)
通常會遇到觀測信號數(shù)目少于源信號數(shù)目的欠定盲源分離情況,因此,研究雷達信號的欠定盲源分離具有重要意義??梢詫⑶范ぴ捶蛛x恢復(fù)源信號等效為求解線性系統(tǒng)模型的問題。目前,解決欠定盲源分離的主要方法是“兩步法”[1],首先UBSS采用聚類算法對混合矩陣的估計,接著利用估計出的混合矩陣根據(jù)信號的稀疏性分離出源信號,通常需要信號在變換域盡可能稀疏,通過逆變換恢復(fù)源信號的時域波形。
采用“兩步法”求解欠定方程的最優(yōu)解[2],混合矩陣的估計精度對后續(xù)重構(gòu)算法恢復(fù)源信號的精度影響較大,為此可以增強信號的稀疏性來提高混合矩陣的估計精度。可以采用聚類算法[3]以及張量分解[4]的方法對混合矩陣進行估計,傳統(tǒng)的聚類方法依據(jù)“最大化類內(nèi)相似性,最小化類間相似性”原則[5]嚴格分類各研究對象,前提是各子類之間互相獨立,但在實際中各子類之間肯存在各種各樣的關(guān)聯(lián)[6]。模糊C-均值聚類算法[7]是模糊聚類算法中較成功且應(yīng)用最廣泛的算法,其算法簡單高效,但是由于此算法對初值的選擇較為敏感,迭代過程容易陷入局部均值[8],使算法的收斂速度變慢,從而對混合矩陣估計時產(chǎn)生誤差。
本文在張量分解方法估計混合矩陣對信號的稀疏性要求低于傳統(tǒng)聚類算法的前提下,引進機器學(xué)習(xí)中的譜聚類算法[9],對譜聚類算法求得的特征矩陣進行張量分解[10]以求得混合矩陣,此方法的復(fù)雜度低于傳統(tǒng)的聚類算法,通過實驗仿真證明了該算法具有良好的估計性能。
盲源分離(BSS)旨在研究傳輸通道和源信號參數(shù)未知的情況下,根據(jù)輸入源信號的統(tǒng)計特征,僅由觀測到的信號特征參數(shù)來恢復(fù)各源信號[11]。信號的盲源分離包含2個未知概念:未知混合矩陣和未知系統(tǒng)輸入的原始信號,盲源分離系統(tǒng)組成如圖1所示。
圖1 盲源分離系統(tǒng)組成
盲源分離根據(jù)混合系統(tǒng)的不同特點可以分為線性混疊和非線性混疊2類,當(dāng)研究UBSS問題時,M x(t)=As(t)。 (1) 在稀疏域中,任何2個源都不能完全重疊,因為沒有SSPS的2個信號來完成混合矩陣估計。在BSS環(huán)境下,多個信源的稀疏性具有新的含義,即不同的信源占用不同的稀疏域帶寬。 FCM算法[12]是模糊聚類算法中較成功且應(yīng)用最廣泛的算法,F(xiàn)CM算法的主要過程是通過不斷更新隸屬度矩陣來不斷計算新的聚類中心,在更新的過程中需要設(shè)定迭代停止閾值。將此,迭代停止閾值與目標(biāo)函數(shù)的值進行對比,在目標(biāo)函數(shù)的值較小時,停止迭代,輸出最終聚類中心以及隸屬度矩陣,否則,持續(xù)不斷迭代更新聚類中心與隸屬度矩陣[13]。 在處理過程中引入拉格朗日乘數(shù)λ,構(gòu)造新的目標(biāo)函數(shù)式: (2) ① 初始化數(shù)據(jù),聚類中心的數(shù)目c(2≤c≤n),迭代停止閾值ε,迭代次數(shù)最大為Max,初始聚類中心p0,更新計數(shù)器b,b=0,加權(quán)指數(shù)m; ② 更新各個樣本點的隸屬度uik,從而更新劃分矩陣U; ③ 更新聚類中心pi,迭代計數(shù)器b=b+1; ④ 再次計算劃分矩陣,由式(2)計算出目標(biāo)函數(shù)的值,如果目標(biāo)函數(shù)的值小于ε或者超過Max時,算法終止并輸出結(jié)果,反之則回到步驟③。 對于大多數(shù)待聚類信號,不知道它的最優(yōu)聚類數(shù)目。FCM算法本質(zhì)上是局部搜索算法,對初始值要求較高,聚類中心是通過隨機初始化產(chǎn)生的,在聚類過程中FCM算法易遇到局部極值,它是一種梯度下降的尋優(yōu)算法;FCM算法首先需要給定聚類中心的數(shù)目c,這就使其存在一大缺陷——人們可以采用不同的聚類方法(如模糊近鄰密度聚類等)來進行混合矩陣的估計。信號經(jīng)STFT變換結(jié)果如圖2所示。 圖2 信號經(jīng)STFT變換結(jié)果 經(jīng)FCM算法處理后,混合信號在時頻域中的散點如圖3所示,可以看出圖像的聚類方向變得清晰,有4條明顯的直線,混合信號的方向性得到了明顯提升。但圖中仍存在一定數(shù)量的雜點,需要改進算法,降低聚類后雜點對源信號方向信息的影響,提高混合矩陣的估計精度。 圖3 經(jīng)FCM算法處理后混合信號在時頻域中的散點 譜聚類主要應(yīng)用在人工智能對信號的處理領(lǐng)域,將其引入盲源分離中對觀測信號進行聚類分析,比起傳統(tǒng)的K-means算法,譜聚類對數(shù)據(jù)分布的適應(yīng)性更強,聚類效果也很優(yōu)秀,同時聚類的計算量也小很多,更加難能可貴的是實現(xiàn)起來也不復(fù)雜。譜聚類是從圖論中演化出來的算法,它可以將帶權(quán)無向圖劃分為2個或2個以上的最優(yōu)子圖,使子圖內(nèi)部盡量相似,而子圖間距離盡量遠,以達到常見的聚類目的。譜聚類依據(jù)邊權(quán)重值具有一定的特性,兩點相距遠則邊權(quán)重值低,否則,兩點間具有較高邊權(quán)重值。通過對所有數(shù)據(jù)點組成的圖進行切圖,使切圖后不同的子圖間邊權(quán)重和盡可能低,而子圖內(nèi)的邊權(quán)重和盡可能高,從而達到聚類的目的[14]。 下面以切圖Ncut方式總結(jié)譜聚類算法流程。 輸入:樣本集D=(x1,x2,…,xn),相似矩陣的生成方式,降維后的維度k1,傳統(tǒng)聚類方法(如K-means),聚類后的維度k2。 ① 根據(jù)輸入的相似矩陣的生成方式構(gòu)建樣本的相似矩陣; ② 根據(jù)相似矩陣構(gòu)建鄰接矩陣,構(gòu)建度矩陣D; ③ 計算出拉普拉斯矩陣L; ④ 構(gòu)建標(biāo)準(zhǔn)化后的拉普拉斯矩陣; ⑤ 計算D-1/2LD-1/2最小的k1個特征值所各自對應(yīng)的特征向量f; ⑥ 將各自對應(yīng)的特征向量f組成的矩陣按行標(biāo)準(zhǔn)化,最終組成n×k1維的特征矩陣F; ⑦ 對F中的每一行作為一個k1維的樣本,共n個樣本,用輸入的K-means聚類方法進行聚類,聚類維數(shù)為k2; ⑧ 得到簇劃分。 輸出簇劃分。 譜聚類算法的主要優(yōu)點有: ① 譜聚類只需要數(shù)據(jù)之間的相似度矩陣,因此,對于處理稀疏數(shù)據(jù)的聚類很有效。傳統(tǒng)聚類算法(如K-means)很難做到這一點; ② 在聚類的過程中使用了降維,因此,其算法在處理高維數(shù)據(jù)聚類時的復(fù)雜度要低于傳統(tǒng)聚類算法。 譜聚類算法的主要缺點為聚類效果受相似矩陣的影響較大,當(dāng)處理后得到的相似矩陣不同時,得到的最終聚類效果可能具有很大的不同。信號經(jīng)STFT變換結(jié)果如圖4所示,信號經(jīng)譜聚類算法處理結(jié)果如圖5所示。 圖4 信號經(jīng)STFT變換結(jié)果 圖5 信號經(jīng)譜聚類算法處理結(jié)果 CP分解與Tucker分解是張量分解中最常用的2種方法,CP分解的核心思想是將一個高階張量分解成若干個秩一張量之和形式,保證分解結(jié)果是唯一的,其中對秩的求解問題是研究的重點;Tucker分解的核心思想是將一個高階張量分解成多個因子矩陣與一個核心張量乘積的形式,其中,核張量保留了原高階張量的主要信息[15]。此外,還有其他的一些分解方法,如帶權(quán)CP分解,這種方法為了方便計算,通過引入一個權(quán)重向量并且需要假設(shè)因子矩陣的列是單位長度的,從而達到提高分解精度的目的。下面介紹基于三階張量分解的經(jīng)典算法: ① 對于三階張量,CP分解將其分解成3個秩一張量之和形式,CP分解的數(shù)學(xué)表達式為: (3) 式中,A,B,C為分解后的矩陣;ar,br,cr為秩一張量;符號°表示向量的外積。如果分解后的矩陣A,B,C對應(yīng)的列被正則化,則分解后存在一個權(quán)重向量λ,則式(3)可以轉(zhuǎn)化為: (4) 對于一般的N階張量,CP分解的形式為: T≈[λ;A(1),A(2),…,A(N)]= (5) 經(jīng)典的CP交叉最小二乘分解算法主要步驟為在已知原始張量T的前提下,首先初始化A(n)∈R(n=1,2,…,N),接著循環(huán)n=1,2,…,N,當(dāng)?shù)玫揭?guī)范列A(n)和λ時迭代結(jié)束,最終輸出λ,A(1),A(2),…,A(N),以此估計出混合矩陣。 ② 對于三階張量,Tucker分解成3個因子矩陣與一個核心張量乘積的形式,此時Tucker分解的數(shù)學(xué)表達式為: (6) 張量的秩定義為用秩一張量之和來精確表示所需要的秩一張量的最少個數(shù),即為秩分解,由此可知秩分解是一種特殊的CP分解。對應(yīng)于矩陣的SVD分解,目前還沒有方法能夠直接求解一個任意給定張量的秩,張量的秩不同于矩陣的秩,高階張量的秩在實數(shù)域和復(fù)數(shù)域上不一定相同,張量的低秩近似相對于矩陣的SVD來說,高階張量的秩分解唯一性不需要正交性條件保證。 本文在譜聚類算法的基礎(chǔ)上對其進行了改進,將其與張量分解的方法結(jié)合起來,避免了單獨聚類算法容易陷入局部極值點的問題,提高了混合矩陣的估計精度。 算法的主要步驟為輸入:樣本集D=(x1,x2,…,xn),相似矩陣的生成方式,降維后的維度k1,傳統(tǒng)聚類方法(如K-means),聚類后的維度k2。 ① 根據(jù)輸入的相似矩陣的生成方式構(gòu)建樣本的相似矩陣S; ② 根據(jù)相似矩陣S構(gòu)建鄰接矩陣W,構(gòu)建度矩陣D; ③ 計算出拉普拉斯矩陣L; ④ 構(gòu)建標(biāo)準(zhǔn)化后的拉普拉斯矩陣D-1/2LD-1/2; ⑤ 計算D-1/2LD-1/2最小的k1個特征值所各自對應(yīng)的特征向量f; ⑥ 將各自對應(yīng)的特征向量f組成的矩陣按行標(biāo)準(zhǔn)化,最終組成n×k1維的特征矩陣F; ⑦ 對特征矩陣F采用張量分解的方法進行處理,得到估計的混合矩陣,在實際過程中,不同的雷達源信號之間是相互統(tǒng)計獨立且為非高斯信號,將特征矩陣分解成3個秩一張量之和的形式,雖然張量可以用分量的多維數(shù)組來表示,但是其處理較高維數(shù)時復(fù)雜度可能很大。如果分解后的矩陣對應(yīng)的列被正則化,則分解后存在一個權(quán)重向量λ,張量分解處理過程如下: (7) (8) 與傳統(tǒng)方法進行了對比實驗,證明本文提出方法的有效性。使用Windows 10操作系統(tǒng),處理器G3260+3.3 GHz在Matlab 2016(a)中進行仿真。 選擇歸一化均方誤差作為混合矩陣估計的評價準(zhǔn)則,其表達式為: (9) 實驗1:欠定盲源分離混合矩陣的估計 在該實驗中使用4個線性調(diào)頻(LFM)雷達信號。頻率分別為50~80 MHz,60~90 MHz,40~60 MHz和10~30 MHz,采樣率為200 MHz,采樣點為1 000,4個源信號由3個傳感器接收,選取欠定混合矩陣A為: (10) 欠定混合矩陣A為階的3×4矩陣,則在實際中接收端獲得3路不同的含噪聲的雷達信號。在對發(fā)射信號進行短時傅里葉變換獲得散點圖時采用窗函數(shù)長度為256點的漢明窗完成,最終可以得到3路時頻域的觀測信號。 經(jīng)過譜聚類與張量分解方法處理,最終得到混合矩陣的估計結(jié)果為: (11) 則混合矩陣估計的歸一化均方誤差為: (12) 實驗2:正定盲源分離混合矩陣的估計 4個源信號由3個傳感器接收,選取正定情形的混合矩陣A為: (13) 正定混合矩陣A為階的3×3矩陣,則在實際中接收端獲得3路不同的含噪聲的雷達信號。在對發(fā)射信號進行短時傅里葉變換獲得散點圖時采用窗函數(shù)長度為256點的漢明窗完成,最終可以得到3路時頻域的觀測信號。 經(jīng)過譜聚類與張量分解方法處理,最終得到混合矩陣的估計結(jié)果為: (14) 則混合矩陣估計的歸一化均方誤差為: (15) 實驗3:超定盲源分離混合矩陣的估計 4個源信號由3個傳感器接收,選取超定情形的混合矩陣A為: (16) 超定混合矩陣A為階的3×2矩陣,則在實際中接收端獲得3路不同的含噪聲的雷達信號。在對發(fā)射信號進行短時傅里葉變換獲得散點圖時采用窗函數(shù)長度為256點的漢明窗完成,最終可以得到3路時頻域的觀測信號。 經(jīng)過譜聚類與張量分解方法處理,最終得到混合矩陣的估計結(jié)果為: (17) 則混合矩陣估計的歸一化均方誤差為: (18) 通過前3個分別在欠定、正定和超定條件下的仿真實驗看出,本文所提的改進的譜聚類算法的混合矩陣估計性能較佳,在接收天線的數(shù)目保持不變時,混合矩陣估計的歸一化均方誤差值將隨著發(fā)射天線數(shù)目的減少而增大,算法具有普適性。 實驗4:不同信噪比條件下各算法的對比 將本文提出方法與傳統(tǒng)的混合矩陣估計精度進行對比,圖6中給出以上各種混合矩陣估計方法在5~30 dB信噪比時,進行100次蒙特卡羅獨立試驗得到的歸一化均方誤差平均值。 圖6 混合矩陣估計歸一化均方誤差對比圖 本文引進機器學(xué)習(xí)中的譜聚類算法,并在譜聚類方法基礎(chǔ)上采用張量分解優(yōu)化,將譜聚類得到的特征矩陣進行正則分解從而估計出混合矩陣。仿真結(jié)果表明,本文基于譜聚類與張量分解結(jié)合的方法相較于傳統(tǒng)聚類算法混合矩陣估計精度較高,估計性能較好,信噪比增大時估計精度較高。本文提出的改進譜聚類方法降低了算法的復(fù)雜度,在低信噪比情形中對混合矩陣的估計誤差值最小,從而能夠達到更高的混合矩陣估計精度。下一步將研究源信號恢復(fù)算法以提高其恢復(fù)性能。2 傳統(tǒng)混合矩陣估計算法
2.1 模糊C-均值聚類算法
2.2 傳統(tǒng)譜聚類檢測算法
2.3 基于張量分解方法
3 改進方法的實現(xiàn)步驟
4 算法仿真分析
4.1 估計誤差評價準(zhǔn)則
4.2 實驗仿真與分析
5 結(jié)束語