楊慶培,尚朝軒,董 健,王 韓
(1.陸軍工程大學(xué)(石家莊校區(qū)) 電子與光學(xué)工程系,石家莊 050003;2.中國電子科技集團(tuán)公司第五十四研究所,石家莊 050003)
雷達(dá)波形通常與探測的目標(biāo)類型、環(huán)境特性以及雷達(dá)的用途有關(guān),好的波形能夠提高雷達(dá)的檢測性能和目標(biāo)參數(shù)估計精度。傳統(tǒng)波形設(shè)計方法通常假設(shè)目標(biāo)是先驗知識已知的準(zhǔn)確量,并且不去考慮干擾機(jī)的相互干擾,這與實戰(zhàn)環(huán)境相去甚遠(yuǎn),會使波形設(shè)計性能降低,同時給波形參數(shù)優(yōu)化帶來較大的挑戰(zhàn)。因此,研究雷達(dá)與干擾機(jī)相互博弈條件下的波形優(yōu)化方法,提高雷達(dá)的檢測、跟蹤、識別性能,是當(dāng)前研究的重要課題。
對于隨機(jī)目標(biāo),可將其沖激響應(yīng)建模為復(fù)寬平穩(wěn)隨機(jī)過程。依據(jù)這一模型,Bell[1]研究了最大化接收信號和高斯目標(biāo)之間最大互信息量(Mutual Information,MI)的波形設(shè)計方法,Leshem[2]將基于MI的波形設(shè)計方法用于多個擴(kuò)展目標(biāo),Romero[3]分析了雜波條件下由MI準(zhǔn)則進(jìn)行波形設(shè)計在認(rèn)知雷達(dá)系統(tǒng)中的應(yīng)用。文獻(xiàn)[4]證明基于最大化互信息準(zhǔn)則設(shè)計的最優(yōu)波形相較于正交波形,性能有明顯提升。文獻(xiàn)[5]基于MI和信噪比(Signal-to-Noise Ratio,SNR)準(zhǔn)則對確定目標(biāo)和隨機(jī)擴(kuò)展目標(biāo)波形設(shè)計相關(guān)理論進(jìn)行了闡述和論證。文獻(xiàn)[6]以互信息最大為設(shè)計指標(biāo),建立統(tǒng)一信號模型,解決了頻譜受限多輸入多輸出(Multiple-Input Multiple-Output,MIMO)雷達(dá)波形設(shè)計問題。文獻(xiàn)[7]首先對MIMO雷達(dá)與干擾機(jī)間的相互博弈現(xiàn)象進(jìn)行了研究,針對Stackelberg博弈模型提出了基于MI準(zhǔn)則的波形優(yōu)化策略。 文獻(xiàn)[8]采用極大極小方法,對雷達(dá)與干擾機(jī)分層博弈模型進(jìn)行了建模與仿真,通過將目標(biāo)頻譜建模為上下限已知的條帶模型,得到了最不利條件下的魯棒波形,有效提高了雷達(dá)的參數(shù)估計性能,但是并沒有論證條帶范圍的選取準(zhǔn)則,也沒有證明相關(guān)模型的優(yōu)越性。文獻(xiàn)[9]基于最大信干噪比準(zhǔn)則,推導(dǎo)論證了彈載雷達(dá)與目標(biāo)相互博弈過程中波形設(shè)計納什均衡解的存在性,并通過多次迭代注水的方法進(jìn)行了求解,其方法更接近帕累托最優(yōu)。但是該算法需要對雙拉格朗日乘子進(jìn)行搜索,計算較復(fù)雜。文獻(xiàn)[10]研究了單基地雷達(dá)和干擾機(jī)的博弈策略設(shè)計問題,推導(dǎo)并驗證了平衡策略的有效性。但是在問題建模時,并沒有考慮信號相關(guān)雜波的影響。文獻(xiàn)[11]應(yīng)用拉格朗日乘數(shù)法和粒子群(Particle Swarm Optimization,PSO)算法得到了Stackelberg平衡,仿真證明了相關(guān)算法的有效性,但是同樣未考慮信號相關(guān)雜波的影響。基于上述研究,本文討論了雜波條件下雷達(dá)與干擾機(jī)均衡博弈策略,考慮到注水法對拉格朗日乘子初值設(shè)定以及搜索過程要求較高,采用最大邊緣分配(Maximum Marginal Allocation,MMA)算法進(jìn)行求解,并設(shè)計了仿真實驗進(jìn)行驗證。
本文的創(chuàng)新工作主要是:將MMA算法引入雷達(dá)博弈過程,相較于傳統(tǒng)迭代注水算法,該算法不需要對拉格朗日乘子進(jìn)行搜索,并且避免了乘子初值對波形的影響,大大減少了計算量;基于最大互信息準(zhǔn)則建立了認(rèn)知雷達(dá)與干擾之間的非合作博弈模型,迭代求解了納什均衡時雷達(dá)波形的能量譜分布,并將均衡策略與maxmin策略以及minmax策略和隨機(jī)策略進(jìn)行了對比,仿真實驗驗證了均衡策略的有效性。
定義在時間間隔為[0,Th]內(nèi)平穩(wěn)隨機(jī)目標(biāo)模型為一廣義平穩(wěn)隨機(jī)過程,在該區(qū)間外為0。圖1[12]是有限持續(xù)時間的隨機(jī)目標(biāo)信號的產(chǎn)生過程,其中g(shù)(t)是一個具有確定功率譜密度的復(fù)廣義平穩(wěn)隨機(jī)過程,a(t)是持續(xù)時間Tk的矩形窗函數(shù),由此可得輸出h(t)=a(t)?g(t)是一個僅在[0,Th]有效的有限時間隨機(jī)過程,且由于g(t)廣義平穩(wěn),故h(t)在[0,Th]上也是平穩(wěn)隨機(jī)過程[13]。
圖1 有限時間隨機(jī)目標(biāo)模型[12]
該隨機(jī)過程的能量譜密度(Energy Spectral Density,ESD)可定義為
ξH(f)=E[|H(f)|2] 。
(1)
若隨機(jī)過程的傅里葉變換函數(shù)的均值表示為
μH(f)=E[|H(f)|] ,
(2)
則該過程傅里葉變換H(f)的方差為
(3)
圖2給出了適用于基于MI波形設(shè)計方法的信道模型,其中,單一或擴(kuò)展隨機(jī)目標(biāo)為g(t),其傅里葉變換為g(f);n(t)是具有功率譜密度為Snn(f)的零均值接收機(jī)噪聲過程,假設(shè)Snn(f)是一個雙邊帶功率譜密度,頻帶范圍為[-W/2,W/2];雜波分量c(t)也是一個零均值隨機(jī)過程,PSD為Scc(f),且在帶寬范圍內(nèi)有效;x(t)為復(fù)值基帶發(fā)射信號,其傅里葉變換為X(f);干擾信號為j(t),其PSD為J(f)。
圖2 基于MI波形設(shè)計方法的信道模型
雷達(dá)接收回波為
y(t)=s(t)*g(t)+s(t)*c(t)+n(t)+j(t)。
(4)
用頻域相乘代替時域卷積過程:
Y(f)=S(f)G(f)+S(f)C(f)+N(f)+J(f)。
(5)
將帶寬W劃分為M個等寬的小頻段Δf,每個子頻段Fk=[fk,fk+Δf],其間信號頻譜近似為常數(shù),在時寬t∈[0,T]內(nèi)對每個子頻段的時域采樣,則互信息[14]為
(6)
對于一個時間有限的隨機(jī)目標(biāo)g(t),它的原始熵是有限的,因此并不存在功率譜密度。
用ESV代替PSD,得到
I(y(t);x(t)/s(t))=
(7)
考慮理想情況,雷達(dá)與干擾機(jī)均可以根據(jù)獲得的信息自適應(yīng)改變發(fā)射波形。對于雷達(dá)來說,通過改變發(fā)射波形的能量譜使得雷達(dá)所獲得的互信息最大,用數(shù)學(xué)表示即為
(8)
式中:Ep為發(fā)射機(jī)能量限制,Ej為干擾機(jī)能量限制,BW為頻帶范圍[-W/2,W/2]。
對于干擾機(jī)來說剛好相反。干擾機(jī)想通過優(yōu)化干擾波形J(f)使得雷達(dá)所獲得的互信息最小,數(shù)學(xué)表示為
(9)
由于目標(biāo)完全對立,雷達(dá)與干擾機(jī)構(gòu)成了二元零和博弈,一方策略的改變將直接影響另一方的策略。在電子戰(zhàn)中,雷達(dá)處于領(lǐng)先地位,干擾機(jī)會根據(jù)偵測信息改變策略,以匹配當(dāng)前環(huán)境,使雷達(dá)所獲得的互信息最小。雷達(dá)偵測到干擾機(jī)的變化,也會自適應(yīng)改變發(fā)射波形來提高互信息,兩者相互博弈直至達(dá)到納什均衡。文獻(xiàn)[9]和文獻(xiàn)[15]推導(dǎo)論證了納什均衡解的存在性和收斂性,在此不再贅述,直接引用結(jié)論。
MMA算法其實是解決固定資源分配問題,它是在單約束或多約束條件下將固定數(shù)量的資源投入給不同的活動,以達(dá)到最有效的效果。
假設(shè)給定式子
(10)
(11)
(12)
式中:
(13)
(14)
文獻(xiàn)[16-17]仿真驗證了MMA算法與拉格朗日乘子算法所得的波形能量譜幾近重合,前者因為突破了乘子復(fù)雜搜索過程,只與最小能量分配單元有關(guān),運行時間極大縮短。
將上述MMA算法原理運用在基于MI最大的博弈波形設(shè)計問題上。將MI離散化后得
(15)
式中:Δf=W/N;k=1,2,3,…,N;fk=kΔf。同時,將能量約束離散化,公式可寫為
(16)
(17)
令
u(k)=|S(fk)|2,
(18)
(19)
(20)
則最大化互信息可簡寫成
(21)
(22)
將umax離散等分成M份,最小單元為Δ,umax=MΔ,u(k)的取值范圍為{0,Δ,2Δ,…,MΔ}。該算法每一次都把Δ單位的能量分配給可以獲得最大互信息的頻段,當(dāng)所有的能量都分配完,獲得的目標(biāo)與回波之間互信息最大[18]。即:對所有k值,均選擇D(u(k),k)中的最大值D(u(kmax),kmax),將Δ的能量分配給u(kmax),在下一次能量分配之前更新D(u(k),k),直至整個能量分配過程結(jié)束,此時得到的結(jié)果即為目標(biāo)與回波之間的最大互信息量,且對不同的k值,在各頻段分配的能量u(k)就是最優(yōu)發(fā)射波形的能量譜。
本文利用MMA算法對納什均衡解進(jìn)行求解,將大大縮短運算時間。均衡博弈波形設(shè)計MMA算法流程如下:
Step5 更新干擾波形:|J(fk)|=|J(fk)|1。
Step6 重復(fù)Step 2~5,直至互信息不再變化。
某型雷達(dá)發(fā)射信號總能量限定為E=1,信號頻率范圍為[0,1],最小能量分配單元Δ設(shè)為0.2,則能量分配份數(shù)也即該算法步驟數(shù)M=500,采樣點數(shù)為100。設(shè)高斯白噪聲功率譜密度為Pnn(f)=0.05,觀測時間T=1。針對隨機(jī)目標(biāo),此時的目標(biāo)雜波比為-4.8 dB,目標(biāo)噪聲比為5.2 dB。
首先仿真固定能量干擾的博弈策略。干擾能量設(shè)置為0.8,圖3顯示了雷達(dá)與干擾機(jī)波形能量分配情況。能夠發(fā)現(xiàn),當(dāng)雷達(dá)處于主導(dǎo)地位時,雷達(dá)與干擾機(jī)相互博弈的結(jié)果是傾向于將能量分配在目標(biāo)沖激響應(yīng)最強(qiáng)烈的頻段。圖4是兩者相互博弈過程中互信息的變化情況??芍?jīng)過六次博弈,互信息達(dá)到平衡,之后兩者的策略均不再對互信息有明顯的影響。
圖3 固定能量干擾機(jī)波形
圖4 博弈過程中互信息變化情況
接下來對干擾機(jī)的變功率情況進(jìn)行仿真。設(shè)定干擾能量變化范圍0.6~1,仿真結(jié)果如圖5和圖6所示。由圖5可以發(fā)現(xiàn),干擾能量越強(qiáng),干擾機(jī)與雷達(dá)的策略越接近。圖6給出了變功率情況的互信息變化情況,可見干擾機(jī)的能量越強(qiáng),互信息的整體變化趨勢是減少,雷達(dá)所獲得的有效信息將減少。
(a)干擾能量為0.6
(b)干擾能量為0.7
(c)干擾能量為0.8
(d)干擾能量為1圖5 變功率干擾機(jī)與雷達(dá)博弈波形
圖6 變功率干擾機(jī)與雷達(dá)博弈互信息變化情況
圖7~10給出了變能量雷達(dá)與變能量干擾機(jī)相互博弈時互信息的變化情況。為了驗證均衡博弈策略的有效性,圖9和圖10給出了maxmin策略和minmax策略時雷達(dá)和干擾機(jī)能量變化時互信息變化情況的三維圖,能夠發(fā)現(xiàn)幾種策略較為接近,但是并不相同。
圖7 雷達(dá)主導(dǎo)時均衡策略互信息變化情況
圖8 干擾機(jī)主導(dǎo)時均衡策略互信息變化情況
圖9 maxmin策略互信息變化情況
圖10 minmax策略互信息變化情況
為了定量分析,圖11則對幾種策略進(jìn)行了直觀對比。該對比實驗固定了雷達(dá)能量,可以發(fā)現(xiàn),無論干擾機(jī)能量如何變化,均衡博弈策略互信息要始終高于其他策略,性能最優(yōu)。
圖11 幾種策略對比
本文通過對雷達(dá)與干擾機(jī)相互博弈過程的建模,研究了雷達(dá)與干擾機(jī)的策略設(shè)計問題。首先將認(rèn)知雷達(dá)和干擾機(jī)之間的關(guān)系建模為Stackelberg博弈,然后基于MI效用函數(shù)分析推導(dǎo)了平衡策略。仿真實驗表明,當(dāng)雷達(dá)處于主導(dǎo)地位時,雷達(dá)與干擾機(jī)互相博弈的策略都傾向于在目標(biāo)ESV較大的頻率上分配更多的能量,盡管干擾機(jī)設(shè)計的干擾波形會降低雷達(dá)系統(tǒng)的性能,但當(dāng)雷達(dá)處于主導(dǎo)地位時,基于均衡策略設(shè)計的發(fā)射波形最終可以保證雷達(dá)系統(tǒng)的估計性能,為解決干擾條件下提高雷達(dá)性能問題提供了有益的指導(dǎo)。