趙興剛 王首勇
(空軍預(yù)警學(xué)院,武漢 430019)
?
高斯混合分布下雷達目標距離檢測方法
趙興剛王首勇
(空軍預(yù)警學(xué)院,武漢 430019)
摘要在非高斯相關(guān)雜波背景下,傳統(tǒng)檢測方法難以檢測到目標,基于球不變隨機過程雜波的似然比檢測方法通過對雜波準確建模,可以取得較好的檢測效果,但由于其分布形式往往較為復(fù)雜,一般情況下很難得到檢測統(tǒng)計量的閉合形式.針對該問題,基于信息幾何理論,通過計算高斯混合統(tǒng)計流形上兩分布間的距離,定義了一種距離檢測器,該檢測器通過計算估計分布與目標有無兩種假設(shè)分布間的距離差,來實現(xiàn)目標檢測,將檢測問題轉(zhuǎn)化為統(tǒng)計流形上的幾何問題.仿真和實測數(shù)據(jù)驗證結(jié)果表明:在復(fù)雜雜波背景下,與傳統(tǒng)方法相比,該方法具有更好的檢測性能,且易于實現(xiàn).
關(guān)鍵詞信息幾何;統(tǒng)計流形;測地線距離;Kullback-Leibler分離度
引言
現(xiàn)代雷達探測目標有時會面臨很強的地、海雜波,這類雜波通常呈現(xiàn)出顯著的非高斯相關(guān)特性,雜波尖峰顯著,概率密度函數(shù)拖尾嚴重,頻域上也存在目標多普勒頻率與強雜波譜區(qū)交疊的情況.由于以上問題的存在,使得傳統(tǒng)的檢測技術(shù)幾乎難以檢測到這類目標,對此國內(nèi)外專家提出了很多新的檢測方法[1-3],比較有代表性的是基于球不變隨機過程(Spherically Invariant Random Process, SIRP)雜波的似然比統(tǒng)計檢測方法.該方法通過利用SIRP分布模型對雜波進行建模,能比較準確地描述雜波的非高斯和相關(guān)特性,在此基礎(chǔ)上推導(dǎo)出的似然比檢測統(tǒng)計量,能在復(fù)雜雜波背景下取得較好的檢測性能,但由于SIRP雜波分布形式往往較為復(fù)雜,除了少數(shù)分布形式,一般情況下很難得到檢測統(tǒng)計量的閉合形式,某些特定分布下推導(dǎo)出的檢測統(tǒng)計量形式也非常復(fù)雜,難以實現(xiàn).信息幾何(Information Geometry)是近年來發(fā)展起來的用微分幾何的方法研究統(tǒng)計學(xué)問題的一門新興學(xué)科,已在多個領(lǐng)域得到廣泛應(yīng)用,如法國人Barbaresco將信息幾何應(yīng)用在了多普勒雷達恒虛警檢測、空時自適應(yīng)處理等方面[4-6],改善了多普勒雷達成像和檢測的性能.
利用信息幾何解決雷達目標檢測問題,首先要建立雜波分布統(tǒng)計流形,在非高斯相關(guān)雜波背景下,描述雜波的分布形式有多種,其中高斯混合分布通過改變模型參數(shù)幾乎可以擬合任何的分布類型[7],具有廣泛的通用性.因而文中利用高斯混合分布建立雜波統(tǒng)計流形,通過計算得到兩高斯混合分布之間的距離,定義了一種距離檢測器.該檢測器通過計算由觀測數(shù)據(jù)估計得到的分布與目標有無兩種假設(shè)分布之間的距離差,來實現(xiàn)目標的檢測,將檢測問題轉(zhuǎn)化為了統(tǒng)計流形上的幾何問題.仿真和實測數(shù)據(jù)驗證結(jié)果表明,在復(fù)雜雜波背景下,該方法具有更好的檢測性能,且形式簡單,易于實現(xiàn).
1信息幾何中的距離
設(shè)隨機矢量x服從的聯(lián)合概率密度函數(shù)為f(x),通過參數(shù)θ定義概率分布族
S={f(x|θ)|θ∈Rn}.
(1)
向量θ=(θ1,θ2,…,θn)T的每一組取值都代表了S中的一個概率密度函數(shù),即S由θ參數(shù)化,則在一定的拓撲結(jié)構(gòu)下概率分布族S構(gòu)成一個以θ為坐標的微分流形,稱為統(tǒng)計流形.在黎曼幾何中,流形定義為局部同胚于歐式空間的拓撲空間,維數(shù)沒有限制.統(tǒng)計流形上的黎曼度量由Fisher信息矩陣G(θ)=[gij(θ)]給出,其中
(2)
統(tǒng)計流形上相鄰兩個分布f(x|θ)和f(x|θ+dθ)之間的微分距離由Fisher信息矩陣給出:
ds2=dθTG(θ)dθ.
(3)
考慮連接統(tǒng)計流形上兩點θ1和θ2的任意曲線θ(t),其中t1≤t≤t2為自由變量,且θ(t1)=θ1,θ(t2)=θ2.統(tǒng)計流形上兩點f(x|θ1)和f(x|θ2)之間沿曲線θ(t)的距離[8]為
(4)
顯然,該距離的大小取決于曲線θ(t)的選取,流形上連接兩點的所有曲線的最小長度為Fisher信息距離,即
(5)
式中,DF(θ1,θ2)對應(yīng)的最短曲線γ(t)對應(yīng)了流形上兩點間的最短測地線,故也稱為測地線距離.測地線可以看做歐式空間中的直線在流形中的推廣.
2非高斯雜波下的距離檢測器
由式(5)可知,計算流形上兩點間的測地線距離需求解復(fù)雜的積分式,因而,除一些特殊的統(tǒng)計流形外,通常計算測地線距離是非常困難的.實際上,流形上的距離有多種定義方式,在一定距離范圍內(nèi),測地線距離可以由K-L分離度(Kullback Leibler Divergence, KLD)來代替[9],其定義為
DKL[f(x|θ1)‖f(x|θ2)]
=E{lnf(x|θ1)-lnf(x|θ2)}.
(6)
KLD提供了度量兩個概率分布間距離的一種方式,相比于測地線距離而言,KLD更容易計算.描述非高斯相關(guān)雜波的分布形式有多種,其中,高斯混合分布(Gaussian Mixture Distribution, GMD)模型通過改變模型參數(shù)幾乎可以擬合任何其他分布,在多個領(lǐng)域具有廣泛應(yīng)用[7].下面,通過定義高斯混合分布流形,并計算得到流形上兩GMD間的KLD,進而得到非高斯相關(guān)雜波背景下基于KLD的距離檢測器.
2.1高斯混合分布流形
令隨機矢量x服從的分布模型為GMD,其定義為
(7)
式中:Nk(x;μk,Rk)表示GMD的第k個高斯分量,其均值矢量為μk,協(xié)方差矩陣為Rk;λk是第k個高斯分量的混合系數(shù).通過改變模型的這些參數(shù),GMD能夠近似很多復(fù)雜的概率分布情況.根據(jù)式(1)定義高斯混合分布流形為
SGMD={f(x|θ)|θ∈R3K}.
(8)
式中,θ=(λ1,λ2,…,λK,μ1,μ2,…,μK,R1,R2,…,RK)為高斯混合分布流形的坐標.
2.2基于GMD的距離檢測方法
兩GMD之間的KLD為
DKL[f(x|θ1)‖f(x|θ2)]
= ∫é?êêê∑Kk=1λ1kN1k(x;μ1k,R1k)·
(9)
對于式(9)而言,一般情況下采用兩種方法來計算[10]:一種是基于采樣的蒙特卡洛方法;另一種是通過其KLD上界來近似.蒙特卡洛方法需采樣生成大量樣本數(shù)據(jù),計算量較大,而KLD上界可由模型參數(shù)直接估計.
引理1(對數(shù)求和不等式)對于非負數(shù)a1,a2,…,aN和b1,b2,…,bN,有下式成立:
(10)
如果an/bn=C,則等式成立.
根據(jù)引理1,式(9)可以寫為
DKL[f(x|θ1)‖f(x|θ2)]
= ∑Kk=1λ1klgλ1kλ2k+∑Kk=1λ1kKLD(N1k(x;μ1k
,
R1k)‖N2k(x;μ2k,R2k)).
(11)
兩高斯分布之間的KLD由下式計算得到:
DKL(N1k(x;μ1k,R1k)‖N2k(x;μ2k,R2k))
= 12ln|R1k||R2k|?è???÷+tr(R-11kR2k)+é?êê
(12)
式中: |·|和tr分別表示矩陣的行列式和跡;N為高斯分布的維數(shù).
至此,考慮在實際雷達系統(tǒng)中雜波服從GMD的情況,設(shè)雷達中某個距離單元觀測的復(fù)包絡(luò)信號為
x(n)=s(n)+v(n),
n=0,1,…,N-1.
(13)
式中:s(n)=αejωn,α為信號復(fù)幅度,ω=fd/fr,fd為目標的多普勒頻率,fr為脈沖重復(fù)頻率;N為CPI長度;v(n)為雜波序列,服從GMD.設(shè)觀測信號矢量x=[x(0),x(1),…,x(N-1)]T,那么式(13)的矢量形式為
x=s+v.
(14)
式中: s=α[1,ejω,…,ejω(N-1)]T; v=[v(1),v(2),…,v[N-1]]T.在實際應(yīng)用中,需要先根據(jù)觀測數(shù)據(jù)來估計GMD模型參數(shù),常用的算法為期望最大化(Expectation Maximization, EM)算法[11],要使用EM算法,需定義完整的和不完整的數(shù)據(jù)集,觀測矢量x=[x(0),x(1),…,x(N-1)]T是不完整的數(shù)據(jù),完整的數(shù)據(jù)可以被看作是帶有標志的觀測矢量,以此表明產(chǎn)生該混合高斯模型的分量,完整的數(shù)據(jù)可以定義為
y(m)=[x(m),k],
m=0,1,…,M-1,k∈(1,…,K).
(15)
式中,觀測數(shù)據(jù)x(m)的標記k,表示混合密度的第k個分量.EM算法的主要步驟是在給定觀測數(shù)據(jù)和參數(shù)矢量當前估計的條件下,定義完整數(shù)據(jù)的期望為
U(θ,^θ(i)) =E[lnf(y(m);θ)|x(m);^θ(i)]
(16)
式中: θ={θk=[λk,μk,Rk],k=1,…,K}為GMD模型的參數(shù);i為EM算法的迭代次數(shù); x(m)與混合密度第k個高斯分量的聯(lián)合分布函數(shù)為
f(x(m),k|^θ(i)) =^λ(i)kf[x(m)|^θ(i)k]
(17)
(18)
作為K個高斯密度混合的x(m),其分布函數(shù)為
f(x(m)|^θ(i)) =N[x(m)|^θ(i)]
(19)
將式(17)和式(19)代入式(16)可得
U(θ,^θi)= ∑N-1m=0∑Kk=1{^λ(i)kNk[x(m);^μ(i)k,^R(i)k]N[x(m)|^θ(i)]·
(20)
采用約束優(yōu)化方法,相對于λk對式(20)進行最大化,即對式(20)相對于λk求導(dǎo)數(shù),并令其為零,得
^λ(i+1)k =argmaxλkU(θ,^θ(i))
(21)
^μ(i+1)k =argmaxμkU(θ,^θ(i))
(22)
(23)
(24)
在H0(無目標)假設(shè)下,矢量x僅包含雜波v,設(shè)此時其服從分布為f(x|θH0); 在H1(有目標)假設(shè)下,矢量x是目標回波s和雜波v之和,其分布為f(x|θH1),兩分布在流形SGMD上的坐標分別為θH0和θH1.實際檢測時,利用觀測數(shù)據(jù)估計得到的GMD模型參數(shù)為θx,然后根據(jù)式(11)和式(12)計算得到θx與θH0、θH1之間的KLD分別為DKL(f(x|θx),f(x|θH0))、DKL(f(x|θx),f(x|θH1)),可定義高斯混合分布下雷達目標的距離檢測器(GMD-Distance Detector, GMD-DD)為
TGMD=DKL(f(x|θx),f(x|θH0))-
DKL(f(x|θx),f(x|θH1))>η.
(25)
當信雜比升高時,由觀測數(shù)據(jù)估計得到的分布f(x|θx)離f(x|θH0)越來越“遠”,DKL(f(x|θx),f(x|θH0))增大,而離f(x|θH1)越來越“近”,DKL(f(x|θx),f(x|θH1))減小,則檢測統(tǒng)計量TGMD不斷增大.由虛警概率設(shè)定門限η,當TGMD>η時,判定目標存在,反之,則不存在.距離檢測器的實現(xiàn)框圖如圖1所示.
圖1 距離檢測器實現(xiàn)框圖
3仿真分析與實測數(shù)據(jù)驗證
3.1檢測性能仿真分析
利用MATLAB仿真產(chǎn)生GMD雜波數(shù)據(jù),來驗證GMD-DD的檢測性能,并與基于SIRP的廣義似然比檢測(SIRP-Generalized LikelihoodRatio Test, SIRP-GLRT)[12]方法以及傳統(tǒng)的MTD技術(shù)進行比較分析.
首先對仿真產(chǎn)生的GMD雜波進行分析,圖2給出了雜波數(shù)據(jù)的時域分布和功率譜密度曲線.
從圖2可以看出,GMD雜波有較強的非高斯相關(guān)特性,脈沖尖峰特征明顯,雜波功率譜展寬.
在使用GMD-DD進行檢測之前,需要首先估計雜波模型參數(shù),即θ=(λ1,λ2,μ1,μ2,R1,R2),式(21)~(23)給出了GMD模型參數(shù)估計的EM算法,這里采用矩估計方法得到迭代的初始值,表1給出了混合系數(shù)λ1,λ2的三組估計結(jié)果.
(a) 時域分布
(b) 功率譜圖2 GMD雜波數(shù)據(jù)時域分布和功率譜密度曲線
參數(shù)值第1組λ1λ2第2組λ1λ2第3組λ1λ2真實值0.30.70.40.60.50.5EM估計值0.320.670.380.610.510.48
從表1可以看出,EM算法對GMD模型參數(shù)具有較高的估計精度.估計得到GMD模型參數(shù)后就可以利用GMD-DD對目標進行檢測,GMD-DD是通過比較估計分布與兩種假設(shè)分布之間距離差來實現(xiàn)目標檢測的,圖3給出了隨著信雜比(Signal to Clutter Ratio, SCR)的變化這兩個距離的變化曲線.
由圖3可以看出:隨著SCR的升高,DKL(f(x|θH0),f(x|θH1))會增大,由觀測數(shù)據(jù)估計得到的分布f(x|θx)離f(x|θH0)越來越“遠”,DKL(f(x|θx),f(x|θH0))增大;而離f(x|θH1)越來越“近”,DKL(f(x|θx),f(x|θH1))減?。@符合實際情況,SCR越高,檢測統(tǒng)計量TGMD越大,更容易發(fā)現(xiàn)目標.
令目標多普勒頻率fd=62.5Hz,由圖2(b)可知目標處于強雜波譜區(qū),給出此時GMD-DD、SIRP-GLRT、MTD的檢測性能比較曲線,如圖4所示.
圖3 估計分布與兩假設(shè)分布之間的KLD變化曲線
圖4 fd=62.5 Hz時三種方法檢測性能比較曲線
在此,SIRP-GLRT檢測方法利用K分布來描述雜波.從圖4可以看出,當目標處于強雜波譜區(qū)時,GMD-DD的檢測性能當檢測概率為0.5時比SIRP-GLRT和MTD分別改善了約2dB和8dB.比較圖3和圖4可以看出,估計分布與假設(shè)分布間距離的變化與GMD-DD檢測性能的變化趨勢是一致的.
為進一步觀察三種算法在目標處于不同情況下的檢測性能,圖5給出了多普勒頻率fd=250Hz時的檢測性能比較曲線,此時,由圖2(b)可知,目標處于非強雜波譜區(qū).
從圖5可以看出,當目標處于非強雜波譜區(qū)時,三種算法的檢測性能都有所改善.與圖4相比,三種算法間性能的差別變小,檢測概率為0.5時,GMD-DD與SIRP-GLRT和MTD相比,檢測性能分別提高了約2dB和5dB.其中MTD與圖4相比,檢測性能改善幅度較大,這也說明了雜波的功率譜寬度對MTD的檢測性能影響較大.
圖5 fd=250 Hz時三種方法檢測性能比較曲線
3.2實測數(shù)據(jù)下的性能分析
這里采用的是加拿大McMaster大學(xué)提供的IPIX海雜波[13]#320組數(shù)據(jù),通過添加仿真目標信號,比較分析了不同SCR、不同目標多普勒頻率條件下GMD-DD與SIRP-GLRT、MTD的檢測性能.
圖6給出了實測海雜波數(shù)據(jù)的功率譜密度曲線,可以看出雜波譜明顯展寬,主雜波譜3dB帶寬為[-160Hz,-50Hz].根據(jù)譜密度曲線,選取目標多普勒頻率分別為fd=-100Hz和fd=375Hz,其余信號取值同§3.1.
圖6 #320組數(shù)據(jù)樣本的功率譜密度曲線
首先給出目標多普勒頻率fd=-100Hz時,三種方法的檢測曲線,如圖7所示.可以看出與仿真數(shù)據(jù)不同的是,GMD-DD與SIRP-GLRT相比,性能改善程度明顯減小,改善了約0.5dB.這是因為仿真數(shù)據(jù)直接產(chǎn)生的是GMD雜波數(shù)據(jù),SIRP-GLRT是利用K分布來擬合雜波,與之相比,GMD-DD在檢測時雜波擬合和參數(shù)估計精度會更高,所以檢測性能改善幅度較大.在采用實測數(shù)據(jù)后,高斯混合分布的擬合精度下降,且為了提高實時性,這里EM算法采用了較少的迭代次數(shù),則GMD-DD參數(shù)估計的優(yōu)勢減弱,檢測性能也會相應(yīng)受到影響.
圖8給出了目標信號在弱雜波譜區(qū)即fd=375Hz時三種方法的檢測性能比較曲線.可以看出與圖7相比,三種方法檢測性能都有所提高,GMD-DD較SIRP-GLRT和MTD相比,檢測性能分別改善了0.8dB和9dB.
圖7 fd=-100 Hz時三種方法檢測性能比較曲線
圖8 fd=375 Hz時三種方法在實測數(shù)據(jù)下檢測性能比較曲線
4結(jié)論
論文首先利用EM算法估計GMD模型參數(shù),然后計算得到兩GMD間的KLD,得到了高斯混合分布下基于KLD的距離檢測器,最后,通過與SIRP-GLRT和MTD進行檢測性能比較,說明了該距離檢測器在復(fù)雜背景下具有較好的檢測性能.為了分析計算方便,論文在仿真實驗中只用了兩個高斯分布混合的情況,而在實際應(yīng)用中,可以根據(jù)實際雜波背景和硬件條件來選擇合適的混合分布數(shù)量,以保證較好的檢測性能.
參考文獻
[1]扈羅全, 林樂科, 朱洪波. 三種重拖尾分布海雜波的比較與分析[J]. 電波科學(xué)學(xué)報, 2007, 22(6): 1061-1067.
HULQ,LINLK,ZHUHB.Comparisonandanalysisofthreekindsofdistributionofseaclutterwithheavytails[J].Chinesejournalofradioscience, 2007, 22(6):1061-1067.(inChinese)
[2] 馮迅, 王首勇, 萬洋, 等. 非高斯相關(guān)雜波背景下雷達目標統(tǒng)計檢測方法[J].電波科學(xué)學(xué)報, 2012, 27(5): 1005-1011.
FENGX,WANGSY,WANY,etal.Radartargetstatisticaltestincorrelatednon-Gaussianclutterbackgrounds[J].Chinesejournalofradioscience, 2012, 27(5):1005-1011. (inChinese)
[3] 朱曉波, 王首勇, 馮迅. 基于分數(shù)低階本征濾波的雷達目標檢測方法[J].電波科學(xué)學(xué)報, 2012, 27(1): 165-171.
ZHUXB,WANGSY,FENGX.Radartargetdetectionmethodbasedonfractionallowerordereigenfilter[J].Chinesejournalofradioscience, 2012, 27(1):165-171. (inChinese)
[4]BARBARESCOF.NewfoundationofradarDopplersignalprocessingbasedonadvanceddifferentialgeometryofsymmetricspaces:DopplermatrixCFARandradarapplication[C]//InternationalRadarConference.Bordeaux, 2009.
[5]BARBARESCOF.RobuststatisticalradarprocessinginFréchetmetricspace:OS-HDR-CFARandOS-STAPprocessinginsiegelhomogeneousboundeddomains[C]//InternationalRadarSymposium(IRS'11).Leipzig, 2011.
[6]WANGXZ,CHENGYQ,MORELANDEM,BillMoran.Bearings-onlysensortrajectoryschedulingusingaccumulativeinformation[C]//ProceedingsofInternationalRadarSymposium.Leipzig,Germany, 2011, 682-688.
[7]ZHAOYX,ZHUANGXH.Gaussianmixturedensitymodelingofnon-Gaussiansourceforautoregressiveprocess[J].IEEEtransactionsonsignalprocessing, 1995, 43(4): 894-903.
[8]MENENDEZML,MORALESD,PARDOL,etal.Statisticaltestsbasedongeodesicdistance[J].Appliedmathematicsletters,1995, 8(1): 65-69.
[9]AMARIS.Informationgeometryonhierarchyofprobabilitydistributions[J].IEEEtransactionsoninformationtheory, 2001, 47(5): 1701-1711.
[10]VASCONCELOSN.Ontheefficientevaluationofprobabilisticsimilarityfunctionsforimageretrieval[J].IEEEtransactionsoninformationtheory, 2004, 50(7): 1482-1496.
[11]MOONTK.Theexpectationmaximizationalgorithm[J].IEEEsignalprocessingmagazine,1996,13(6):47-60.
[12]王首勇, 萬洋, 劉俊凱, 等.現(xiàn)代雷達目標檢測理論與方法[M].北京: 科學(xué)出版社, 2014.
[13]REMBRANDTB,BRIANC.TheMcMasterIPIXradarseaclutterdatabase[EB/OL].(2014-03-12)[2015-05-17].http://soma.ece.mcmaster.ca/ipix/dartmouth/datasets.htm.
Distance detection method to radar target under Gaussian mixture distribution
ZHAO XinggangWANG Shouyong
(AirForceEarlyWarningAcademy,Wuhan430019,China)
AbstractIt is hard for traditional methods to detect targets in correlated non-Gaussian clutter backgrounds. The likelihood ratio test based on spherically invariant random process clutter could get good performance by modeling clutter accurately. However, it is very hard to get closed form of test statistical magnitude for that the probability distribution function form is usually complicated. Based on information geometry theory, the distance detector is defined by comparing the distance between the distribution estimated by observation data and two hypothetical distributions, translating detecting problem into geometry problem on statistical manifold. Simulation results show that detection performance of distance detector under correlated non-Gaussian clutter backgrounds outperforms traditional methods,simultaneously,it can be easily operated.
Keywordsinformation geometry; statistical manifold;geodesic distance; Kullback-Leibler divergence
收稿日期:2015-05-17
中圖分類號TN957.51
文獻標志碼A
文章編號1005-0388(2016)02-0346-07
DOI10.13443/j.cjors.2015051701
作者簡介
趙興剛(1988-),男,山東人,空軍預(yù)警學(xué)院信息與通信處理專業(yè)博士研究生,研究方向為雷達目標檢測.
王首勇(1956-),男,河南人,空軍預(yù)警學(xué)院教授,博士生導(dǎo)師,主要研究方向為雷達信號處理.
趙興剛, 王首勇. 高斯混合分布下雷達目標距離檢測方法[J]. 電波科學(xué)學(xué)報,2016,31(2):346-352. DOI: 10.13443/j.cjors.2015051701
ZHAO X G, WANG S Y. Distance detection method to radar target under Gaussian mixture distribution[J]. Chinese journal of radio science,2016,31(2):346-352. (in Chinese). DOI: 10.13443/j.cjors.2015051701
資助項目: 國家自然科學(xué)基金(61179014); 青年科學(xué)基金(61302193)
聯(lián)系人: 趙興剛 E-mail: 565484636@qq.com