楊立儒, 劉永祥, 楊 威
(國防科技大學(xué)電子科學(xué)學(xué)院, 湖南 長沙 410073)
雷達(dá)對目標(biāo)探測和識別的過程中,雜波信號會對目標(biāo)的檢測產(chǎn)生干擾。在雷達(dá)目標(biāo)恒虛警率處理中,首先要考慮雜波的分布模型,只有雜波模型確定后,才能合理地設(shè)定門限因子。文獻[3]指出對海上目標(biāo)分類識別中,對雜波特性的研究具有十分重要的現(xiàn)實意義,雜波建模精度的改善對目標(biāo)的特征提升具有重要作用。因此,雜波幅度統(tǒng)計模型選擇成為雜波背景下目標(biāo)探測和識別的重要步驟。
近幾十年來,人們對雜波問題進行了大量的研究,對雜波的幅度特性認(rèn)識已經(jīng)逐漸深入,先后建立了瑞利分布、對數(shù)正態(tài)分布、韋布爾分布和K分布等概率統(tǒng)計模型。瑞利分布對于平穩(wěn)環(huán)境的高俯仰角雜波分布描述較好,適用于低分辨率雷達(dá)大入射角(大于等于5°)時平穩(wěn)環(huán)境的雜波。對數(shù)正態(tài)分布對于惡劣環(huán)境雜波的幅值分布描述效果較好,適用于描述低入射角(小于5°)時復(fù)雜地形的雜波數(shù)據(jù)或者平坦區(qū)高分辨率的雜波數(shù)據(jù)。韋布爾分布介于瑞利分布和對數(shù)正態(tài)分布之間,能在更寬廣的環(huán)境內(nèi)精確表示雜波的分布,適用于描述高分辨率雷達(dá)、低入射角(小于5°)、雜波起伏較為均勻的情況。K分布廣泛應(yīng)用于海雜波建模,可以在很寬的條件范圍內(nèi)匹配雜波的幅度分布,不僅在幅度分布上能很好地表現(xiàn)低擦地角、高分辨率雷達(dá)雜波的長拖尾特性,而且還可以正確地模擬回波脈沖間的相關(guān)特性,適用于高分辨率雷達(dá)的非均勻海雜波。實際情況中,實測雜波數(shù)據(jù)的幅度分布概率模型類型往往未知,采用遷移學(xué)習(xí)的方法對雜波數(shù)據(jù)進行模型類型的選擇。首先通過建模仿真獲取有明確模型類型的數(shù)據(jù),然后利用仿真數(shù)據(jù)輔助實測雜波的幅度模型選擇。建模仿真可以模擬現(xiàn)實測量中難以實現(xiàn)的狀況并且有明確的標(biāo)簽信息,試驗測量結(jié)果可以為建模仿真提供檢驗的依據(jù),這兩者互相驗證、互相補充。
遷移學(xué)習(xí)可以實現(xiàn)信息從一個任務(wù)(數(shù)據(jù))向另一個任務(wù)(數(shù)據(jù))的轉(zhuǎn)移,采用遷移學(xué)習(xí)的方法可以利用理論建模數(shù)據(jù)的信息輔助試驗測量數(shù)據(jù)的分析。零記憶非線性法(zero memory nonlinearity, ZMNL)易于實現(xiàn),仿真速度較快,通常用來產(chǎn)生服從瑞利分布、對數(shù)正態(tài)分布、韋布爾分布和K分布的雜波數(shù)據(jù),得到了廣泛的使用和研究。IPIX數(shù)據(jù)在加拿大格里姆斯比市安大略湖岸邊采集得到,包含不同日期不同時間不同氣象條件下的海面回波。本文提出了一種加權(quán)再均衡分布適配(weighted rebalance distribution adaptation, W-RBDA)算法,該算法可以實現(xiàn)ZMNL仿真數(shù)據(jù)的信息輔助IPIX數(shù)據(jù)的幅度統(tǒng)計模型選擇。為了評估W-RBDA算法性能,對IPIX海雜波數(shù)據(jù)集和Office-Caltech10圖像數(shù)據(jù)集分別進行了對比實驗,并與已有類似算法相比,分類準(zhǔn)確率能得到一定程度的提升。
論文首先討論了遷移學(xué)習(xí)相關(guān)算法,尤其是與本文相關(guān)的算法,如遷移成分分析、聯(lián)合分布適配、加權(quán)均衡分布適配等;其次描述了改進的遷移學(xué)習(xí)算法W-RBDA;然后由仿真數(shù)據(jù)向IPIX實測數(shù)據(jù)遷移的實驗結(jié)果和算法性能比較,并在公共數(shù)據(jù)集Office-Caltech10進行了算法驗證;最后給出了研究結(jié)論和下一步研究建議。
遷移學(xué)習(xí)是機器學(xué)習(xí)的一個重要分支,已經(jīng)引起越來越多學(xué)者的關(guān)注,被廣泛應(yīng)用于行為識別、圖像分類等任務(wù)中,基于遷移學(xué)習(xí)的雜波幅度統(tǒng)計模型選擇研究還未有學(xué)術(shù)成果發(fā)表。遷移學(xué)習(xí)是指利用數(shù)據(jù)、任務(wù)或模型之間的相似性,將在一個領(lǐng)域?qū)W習(xí)的信息應(yīng)用到新領(lǐng)域的一種方法。傳統(tǒng)機器學(xué)習(xí)要求訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集必須為相同數(shù)據(jù)分布,而遷移學(xué)習(xí)研究兩個不同數(shù)據(jù)分布的領(lǐng)域。通常情況下,與測試數(shù)據(jù)集服從相同分布的數(shù)據(jù)集稱為目標(biāo)數(shù)據(jù)集,對應(yīng)領(lǐng)域即為目標(biāo)領(lǐng)域;而與測試數(shù)據(jù)集服從不同分布的數(shù)據(jù)集則稱為源數(shù)據(jù)集,對應(yīng)領(lǐng)域為源領(lǐng)域。其中,源領(lǐng)域標(biāo)簽信息可用,而目標(biāo)領(lǐng)域標(biāo)簽信息則一般稀缺甚至沒有。文獻[20]將遷移學(xué)習(xí)分為基于樣本的遷移學(xué)習(xí)、基于特征的遷移學(xué)習(xí)、基于模型的遷移學(xué)習(xí)、基于關(guān)系的特征學(xué)習(xí)等?;跇颖镜倪w移學(xué)習(xí)中,通過核平均匹配(kernel mean matching, KMM)可以對源域數(shù)據(jù)分布和目標(biāo)域數(shù)據(jù)分布進行特征空間映射,特征對齊后可以認(rèn)為源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)服從相同分布,將遷移學(xué)習(xí)的任務(wù)轉(zhuǎn)化為傳統(tǒng)機器學(xué)習(xí)問題?;谔卣鞯倪w移學(xué)習(xí)中,在再生核希爾伯特空間(reproducing kernel Hilbert space, RKHS)基于核嵌入最大均值差異(maximum mean discrepancy,MMD)來度量源域和目標(biāo)域數(shù)據(jù)分布之間的距離,通過最大均值差異嵌入(maximum mean discrepancy embedding, MMDE)實現(xiàn)降維處理,將問題轉(zhuǎn)化為轉(zhuǎn)移矩陣學(xué)習(xí)問題,簡化優(yōu)化過程。
通過以上分析,TCA只適配邊緣分布,即適配源域數(shù)據(jù)樣本均值和目標(biāo)域數(shù)據(jù)樣本均值;JDA等權(quán)重適配邊緣分布和條件分布,即等權(quán)重適配源域數(shù)據(jù)樣本均值和目標(biāo)域數(shù)據(jù)樣本均值、源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)相同類別樣本均值;BDA、W-BDA平衡適配邊緣分布和條件分布,即通過調(diào)整的值,使源域數(shù)據(jù)樣本均值和目標(biāo)域數(shù)據(jù)樣本均值、源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)相同類別樣本均值所占比重為(1-)。以上算法都沒有考慮相同類別數(shù)據(jù)之間的關(guān)系,即類內(nèi)數(shù)據(jù)的適配。本文提出了W-RBDA來解決遷移學(xué)習(xí)中相同類別內(nèi)的關(guān)系(距離)問題,使得類內(nèi)數(shù)據(jù)更緊湊,類內(nèi)距更小。
W-RBDA在大粒度上約束源域樣本均值和目標(biāo)域樣本均值之間的距離,與W-BDA中的第一項約束相同;中粒度上約束源域和目標(biāo)域相同類別樣本均值之間的距離,與W-BDA中的第二項約束相同;細(xì)粒度上約束源域和目標(biāo)域中單個樣本與該樣本所屬類別均值之間的距離,這是W-RBDA的創(chuàng)新之處。3個粒度上的約束項權(quán)重和為1且0≤≤1, 0≤≤1-,W-RBDA的優(yōu)化問題可以表示為式(1)的形式,即3個粒度約束上的MMD。
∈{1,2,…,}
(1)
令
(2)
將式(2)代入式(1)可得
∈{1,2,…,}
(3)
參照文獻[26]中的思路,引入轉(zhuǎn)移矩陣,將源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)變換到新的樣本空間,隨著對轉(zhuǎn)移矩陣的不斷迭代更新,可以減小源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)之間的距離,使得式(3)的值不斷減小,直至達(dá)到收斂條件。式(3)可進一步寫為以下形式:
∈{1,2,…,}
(4)
參照文獻[24]中的思路,式(4)的第1項可由范數(shù)計算轉(zhuǎn)換為矩陣跡的計算,為
(5)
其中:
(6)
式(4)的第2項為
(7)
其中:
(8)
類似,式(4)的第3項為
(1--)tr()
(9)
其中:
(10)
綜上,式(4)可以轉(zhuǎn)換為式(11)的優(yōu)化問題:
(1--)))+tr()
(11)
文獻[28]中對進行了加權(quán)優(yōu)化,其表達(dá)式為
(12)
(13)
通過拉格朗日乘子=diag(,…,)對式(13)進行優(yōu)化求解,能夠得出:
=tr((++(1--)))+
tr()+tr((-))
(14)
令??=0且=得出:
((++(1--))+λ)=
(15)
式(15)為奇異值分解形式=,優(yōu)化問題轉(zhuǎn)換為奇異值分解問題。當(dāng)=1,=0時,W-RBDA算法退化為文獻[24]中的TCA算法;當(dāng)=05,=05時,W-RBDA算法退化為文獻[26]中的JDA算法;當(dāng)1--=0時,W-RBDA算法退化為文獻[28]中的W-BDA算法。通過參數(shù)和的搜索尋優(yōu),可以得到最優(yōu)的分類器。
通過以上分析,W-RBDA算法如算法1所示。
鑒于實測雜波數(shù)據(jù)的幅度統(tǒng)計模型未知,本文使用遷移學(xué)習(xí)的方法對實測雜波數(shù)據(jù)進行幅度統(tǒng)計模型的選擇。首先實驗仿真獲取源域數(shù)據(jù),IPIX實測海雜波數(shù)據(jù)作為目標(biāo)域數(shù)據(jù),通過W-RBDA實現(xiàn)有標(biāo)簽的仿真數(shù)據(jù)輔助無標(biāo)簽的IPIX數(shù)據(jù)幅度統(tǒng)計模型選擇,驗證本文所提方法的性能。為進一步驗證所提算法的普適性,最后還在通用遷移學(xué)習(xí)數(shù)據(jù)集Office-Caltech10上進行了實驗。
因為只涉及到幅度的概率密度分布模型,所以ZMNL仿真數(shù)據(jù)對文獻[29-30]中的方法進行簡化,去掉能夠產(chǎn)生功率譜分布的濾波器部分,一方面數(shù)據(jù)能夠滿足實驗要求,另一方面也能夠簡化雜波序列的產(chǎn)生。文獻[30]中分析了部分IPIX數(shù)據(jù)的參數(shù)估計值,基于此先驗知識經(jīng)驗確定各分布的參數(shù)范圍,隨機選取該范圍內(nèi)各分布的參數(shù),產(chǎn)生服從對數(shù)正態(tài)分布、韋布爾分布、K分布、瑞利分布的雜波序列。對仿真產(chǎn)生的雜波序列使用核平滑密度估計(kernel smoothing density estimation, KSdensity)計算概率密度,將各幅度區(qū)間對應(yīng)的概率密度函數(shù)幅值作為數(shù)據(jù)樣本,形成1×100的向量,部分仿真結(jié)果如圖1所示,各類分布的參數(shù)如表1所示。
圖1 ZMNL仿真產(chǎn)生的部分?jǐn)?shù)據(jù)概率密度值Fig.1 Probability density of partial data generated by ZMNL simulation
表1 圖1中各類分布的參數(shù)
實測數(shù)據(jù)采用IPIX雷達(dá)1998年測量的數(shù)據(jù),數(shù)據(jù)形式為復(fù)數(shù)形式,包含I通道和Q通道,PRF為1 kHz。對數(shù)據(jù)的每個距離單元內(nèi)每1 000個雷達(dá)脈沖回波取模,采用KSdensity計算回波幅度的概率密度函數(shù)。鑒于IPIX數(shù)據(jù)的幅度模型標(biāo)簽是未知的,因此可以采用投票機制來確定遷移學(xué)習(xí)方法的準(zhǔn)確率。采用文獻[30-32]中矩估計方法對回波數(shù)據(jù)擬合了對數(shù)正態(tài)分布、韋布爾分布、K分布、瑞利分布的概率密度,分布計算KSdensity得到的概率密度和四種擬合分布得到的概率密度的均方差檢驗(mean square difference, MSD)(校驗概率密度),通過判斷MSD來確定此雜波數(shù)據(jù)的幅度分布類型。遷移學(xué)習(xí)方法得到的幅度類型與MSD得到的幅度類型進行對比,幅度類型一致的樣本認(rèn)為分類正確,從而得到遷移學(xué)習(xí)各算法的準(zhǔn)確率。部分實測雜波的概率密度曲線和該雜波矩估計的概率密度曲線如圖2所示。
用ZMNL分別隨機仿真4種分布各20,50,100,300組數(shù)據(jù),各自命名為Xs80,Xs200,Xs400,Xs1200,該4組數(shù)據(jù)樣本量分別對應(yīng)IPIX數(shù)據(jù)樣本量的小樣本情況、等量樣本情況和大樣本情況。小樣本指的是源域數(shù)據(jù)的樣本量是目標(biāo)域數(shù)據(jù)樣本量的1/4、1/2左右,等量樣本指的是源域數(shù)據(jù)的樣本量與目標(biāo)域數(shù)據(jù)樣本量大致相同,大樣本指的是源域數(shù)據(jù)的樣本量是目標(biāo)域數(shù)據(jù)樣本量的3倍左右。IPIX數(shù)據(jù)分為兩類情況:第一類為均勻樣本量的情況,每種分布選擇90組,4種分布共360組數(shù)據(jù),記為Xt360;第二類情況為非均勻樣本量情況,對數(shù)正態(tài)分布、韋布爾分布、K分布、瑞利分布分別為20組、40組、60組、80組,記為Xt200。本實驗選擇的比較算法包括1NN、TCA+1NN、W-BDA+1NN,衡量算法優(yōu)劣指標(biāo)是迭代100次的準(zhǔn)確率。本實驗的參數(shù)搜索范圍為:、搜索范圍{0.1,0.2,…,2},dim搜索范圍{5,10,…,50},、搜索范圍{0,005,01,…,1}且+≤1。W-RBDA的參數(shù)取值除了和,其他與W-BDA相同。算法結(jié)果比較如表2所示。
表2 W-RBDA和其他算法迭代100次的準(zhǔn)確率
我們使用MMD變化情況和分類準(zhǔn)確率來判別算法的優(yōu)劣。IPIX數(shù)據(jù)中不同遷移任務(wù)的MMD變化情況如圖3所示。IPIX數(shù)據(jù)中不同遷移任務(wù)的準(zhǔn)確率隨迭代次數(shù)變化情況如圖4所示。
圖3 IPIX數(shù)據(jù)各任務(wù)中MMD的變化Fig.3 Changes of MMD in IPIX data tasks
圖4 IPIX數(shù)據(jù)各任務(wù)中迭代次數(shù)對準(zhǔn)確率的影響Fig.4 The effect of iterations on the accuracy of IPIX data
通過實驗結(jié)果可得出3個結(jié)論:① MMD曲線的趨勢與準(zhǔn)確率曲線的趨勢大致是反比,MMD減小準(zhǔn)確率上升,進一步反映了MMD對樣本分布的約束,使得映射空間中的源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)不斷地相似。W-RBDA的MMD比W-BDA的MMD大,是因為加入了單個樣本與該樣本所屬類別均值之間的MMD約束,比W-BDA多了一項距離約束。② 通過細(xì)粒度上源域和目標(biāo)域中單個樣本與該樣本所屬類別均值之間的MMD約束,可以提升算法準(zhǔn)確率,同時收斂速度更快,準(zhǔn)確率曲線的震蕩幅度也更小。③ 算法適用于各種情況的樣本分布,如:小樣本情況、等量樣本情況、大樣本情況、不均衡樣本情況。其中,對不均衡樣本分布的數(shù)據(jù)集分類準(zhǔn)確率提升效果更明顯,在Xs400→Xt200和Xs1200→Xt200任務(wù)中提升了8%的準(zhǔn)確率。
表3是部分IPIX數(shù)據(jù)的MSD擬合優(yōu)度檢驗結(jié)果和通過W-RBDA得到的標(biāo)簽。
表3 MSD擬合優(yōu)度檢驗結(jié)果
表1中已給出各分布對應(yīng)的標(biāo)簽,從表3可以看出,W-RBDA得到的標(biāo)簽所對應(yīng)分布的MSD檢驗值最小,也說明了該方法的有效性。
表4是遷移方法在Xs400→Xt360任務(wù)中得到全部IPIX數(shù)據(jù)樣本標(biāo)簽對應(yīng)的MSD擬合優(yōu)度檢驗平均結(jié)果。
表4 MSD擬合優(yōu)度檢驗平均結(jié)果
因為K分布參數(shù)的矩估計方法存在缺陷,當(dāng)受到數(shù)據(jù)長度有限的影響或者噪聲的影響時,高階矩會存在明顯的偏差。文獻[30-32]中高階矩估計法計算的K分布形狀參數(shù)出現(xiàn)<0的情況,這種情況下得到的估計參數(shù)是錯誤的,導(dǎo)致部分樣本計算的K分布MSD異常。這些異常值導(dǎo)致各遷移方法的分類標(biāo)簽不一樣時,計算的各分布MSD沒有可比性。但是從表4可以看出,W-RBDA得到的對數(shù)正態(tài)、韋布爾和瑞利等3個分布的標(biāo)簽所對應(yīng)MSD平均檢驗值最小,而比較算法都是2個分布的標(biāo)簽所對應(yīng)MSD平均檢驗值最小。文獻[34]在估計K分布雜波的形狀參數(shù)和尺度參數(shù)時,采用剔除部分雜波樣本來避免形狀參數(shù)出現(xiàn)負(fù)數(shù)的情況。文獻[35-36]提出的方法在高階矩估計形狀參數(shù)為負(fù)時有效,但是當(dāng)部分樣本的高階矩估計形狀參數(shù)為正時,存在無解的情況。本文K分布的參數(shù)估計選用高階矩估計,當(dāng)出現(xiàn)<0的情況時選用了文獻[35-36]的方法。
Office-Caltech10是遷移學(xué)習(xí)研究領(lǐng)域廣泛采用的一個開源數(shù)據(jù)集,包含4個不同的域,分別是Amazon、Dslr、Webcam、Caltech,每個域包含10類圖像,每個域的圖像分別來自amazon.com、單反相機、網(wǎng)絡(luò)攝像頭和使用不同的照明和姿勢變化拍攝的辦公環(huán)境圖像。本文使用該公開數(shù)據(jù)集進一步驗證所提算法的普適性,分別選不同的兩個域作為源域和目標(biāo)域,則共有12種組合,它們是A→D、…、C→W。
因為文獻[28]做過1NN、TCA+1NN、BDA+1NN、W-BDA+1NN算法準(zhǔn)確率的比較,本文只做W-BDA+1NN和W-RBDA+1NN算法之間的比較。本實驗中μ+ρ≤1,參數(shù)搜索范圍為:γ、λ搜索范圍{1,2,…,10},dim搜索范圍{5,10,…,100},μ、ρ搜索范圍{0,0.05,0.1,…,1}。W-RBDA的參數(shù)取值除了μ和ρ,其他與W-BDA相同。算法結(jié)果比較如表5所示。Office-Caltech10數(shù)據(jù)中不同遷移任務(wù)的MMD變化情況如圖5所示,C→D、A→C、A→W、W→D任務(wù)中W-BDA和W-RBDA曲線重合。Office-Caltech10數(shù)據(jù)中不同遷移任務(wù)的準(zhǔn)確率隨迭代次數(shù)變化情況如圖6所示。
表5 W-BDA和W-RBDA迭代100次的準(zhǔn)確率
通過實驗結(jié)果可得出3個結(jié)論:① 大多數(shù)情況下,W-RBDA算法可以提升算法準(zhǔn)確率、收斂速度更快、準(zhǔn)確率曲線的震蕩幅度更小,如C→A,C→W,A→D,W→C,D→C,D→A,D→W;② 數(shù)據(jù)的分布以及多分類問題對算法準(zhǔn)確率有影響,類別越多分類曲面越復(fù)雜,準(zhǔn)確率提升的越不明顯;③ W-RBDA算法中,當(dāng)+=1時退化為W-BDA算法,如C→D、A→C、A→W、W→D的遷移任務(wù)。
本文主要解決雷達(dá)雜波的幅度統(tǒng)計模型選擇問題,通過遷移學(xué)習(xí),可以利用ZMNL仿真的帶標(biāo)簽數(shù)據(jù)輔助IPIX數(shù)據(jù)幅度統(tǒng)計模型選擇。針對當(dāng)前樣本分布適配只適配邊緣分布和條件分布的不足,提出的W-RBDA算法增加了單個樣本和該樣本所屬類均值的適配,通過增加各樣本與其所屬類均值的MMD約束,可以顯著提高遷移學(xué)習(xí)的效果。通過公用數(shù)據(jù)集Office-Caltech10的實驗進一步驗證了W-RBDA算法的普適性,但是隨著約束條件的增多,超參數(shù)也越來越多,對于超參數(shù)的選取帶來一定的困難,對超參數(shù)的估計問題將是下一步研究的一項工作。同時更有效和更準(zhǔn)確的K分布參數(shù)估計問題也是下一步的重點研究工作。