秦 童,戴奉周,劉宏偉,方 明(西安電子科技大學(xué)雷達(dá)信號處理國家重點(diǎn)實(shí)驗(yàn)室,陜西 西安710071)
火控相控陣?yán)走_(dá)的時間資源管理算法
秦 童,戴奉周,劉宏偉,方 明
(西安電子科技大學(xué)雷達(dá)信號處理國家重點(diǎn)實(shí)驗(yàn)室,陜西西安710071)
對于火控相控陣?yán)走_(dá),可以靈活地調(diào)整波束的指向方向,從而調(diào)整雷達(dá)用于跟蹤的時間資源。針對這樣的特性,提出了一種雷達(dá)用于跟蹤的時間資源的管理算法,以提升雷達(dá)最大可跟蹤目標(biāo)的數(shù)量。該文以概率密度函數(shù)來描述雷達(dá)對目標(biāo)的跟蹤誤差,綜合考慮了測距與測速精度對跟蹤誤差產(chǎn)生影響。而后,采用馬爾可夫決策的方法,對雷達(dá)照射目標(biāo)的駐留時間與重訪時間間隔進(jìn)行求解。仿真結(jié)果表明,對于雷達(dá)場景中的目標(biāo)數(shù)量較大情況下,相對于傳統(tǒng)的雷達(dá)時間資源管理方法,該文提出的方法在保證跟蹤精度符合要求的前提下,能夠有效提高雷達(dá)最大可跟蹤目標(biāo)的數(shù)量。
火控相控陣?yán)走_(dá);時間資源管理;馬爾可夫決策過程
網(wǎng)址:www.sys-ele.com
近年來,相控陣?yán)走_(dá)技術(shù)已經(jīng)取得了快速的發(fā)展。這種類型的雷達(dá)可以靈活地改變發(fā)射波的照射方向,可以根據(jù)目標(biāo)的方向調(diào)整電磁波的發(fā)射方向與駐留時間。這些特性為我們提供了管理、優(yōu)化雷達(dá)資源的可能性,進(jìn)而可以對駐留時間、重訪時間與發(fā)射功率等雷達(dá)資源進(jìn)行合理的分配。進(jìn)而達(dá)到節(jié)約雷達(dá)消耗功率,提高測量、跟蹤精度,提高最大跟蹤目標(biāo)的數(shù)量,節(jié)約時間消耗等效果。
目前已有一定的關(guān)于雷達(dá)資源優(yōu)化的研究工作,主要包括對雷達(dá)發(fā)射功率的優(yōu)化與電磁波照射目標(biāo)的駐留時間的優(yōu)化。對于雷達(dá)發(fā)射功率資源的管理,目前的一部分的研究[1-6],集中在采用跟蹤濾波的協(xié)方差或克拉美羅界作為評價函數(shù),利用最優(yōu)化方程的方法對雷達(dá)的功率資源進(jìn)行優(yōu)化。而對于時間資源的管理,主要集中在調(diào)節(jié)雷達(dá)照射目標(biāo)的駐留時間方面。例如文獻(xiàn)[7]在雷達(dá)時間資源有限的條件下,按照目標(biāo)的優(yōu)先級與威脅程度,對時間資源進(jìn)行調(diào)整。文獻(xiàn)[8]以雷達(dá)對目標(biāo)的跟蹤精度作為評價函數(shù),進(jìn)而調(diào)整駐留時間。文獻(xiàn)[9-10]則是根據(jù)信噪比的變化與多個目標(biāo)之間的信噪比比例,綜合調(diào)整駐留時間、發(fā)射功率等參數(shù)。而文獻(xiàn)[11-15]則是根據(jù)目標(biāo)的跟蹤濾波的協(xié)方差作為評價函數(shù),對雷達(dá)時間資源與功率資源進(jìn)行聯(lián)合的優(yōu)化。
對于單波束火控相控陣?yán)走_(dá),常常需要對多個目標(biāo)進(jìn)行跟蹤,如果目標(biāo)的數(shù)量超過雷達(dá)目前可以跟蹤的最大數(shù)量,則會對雷達(dá)產(chǎn)生巨大的威脅。本文希望在不改變雷達(dá)硬件設(shè)施,消耗雷達(dá)時間、功率資源不變的情況下,通過對場景進(jìn)行學(xué)習(xí),獲取目標(biāo)信息,調(diào)節(jié)、管理雷達(dá)資源,從而提高雷達(dá)可以跟蹤目標(biāo)數(shù)量。
目前現(xiàn)有的雷達(dá)主要利用回波的多普勒信息,對目標(biāo)進(jìn)行測速。如果雷達(dá)照射某個目標(biāo)的駐留時間越長,可以提取得到的多普勒信息越多,測速精度則越高。獲得目標(biāo)精確的速度的測量值,對于提高跟蹤目標(biāo)的精度有著巨大的幫助。然而在目前現(xiàn)有的研究中,對于目標(biāo)跟蹤精度的評價,主要采用跟蹤的克拉美羅界或跟蹤濾波的協(xié)方差的方法,這些方法只利用雷達(dá)對于目標(biāo)的測距、測角精度信息,而沒有衡量測速精度對最終跟蹤精度的影響。因此本文采用概率密度函數(shù)對跟蹤誤差進(jìn)行評價,綜合考慮雷達(dá)對目標(biāo)的測距精度與測速精度的影響,進(jìn)而更準(zhǔn)確地反映出雷達(dá)對目標(biāo)的跟蹤誤差。
目前針對雷達(dá)資源的管理,主要采用最優(yōu)化的方法進(jìn)行計算,進(jìn)而分配接下來一段時間的照射功率。而對于雷達(dá)時間資源的管理,若采用最優(yōu)化的方法,需要在當(dāng)前時刻預(yù)測接下來較長一段時間內(nèi)目標(biāo)的狀態(tài),并進(jìn)行時間資源的分配。若采用該方法,一方面需要預(yù)測的時間過長,增加了預(yù)測的難度與誤差,另一方面,經(jīng)過分配后,需要經(jīng)歷較長的時間來實(shí)現(xiàn)優(yōu)化的結(jié)果,雷達(dá)無法根據(jù)實(shí)際的情況進(jìn)行靈活的調(diào)整。因此本文采用馬爾可夫決策的優(yōu)化方法,對全部目標(biāo)短期與長期的跟蹤效果進(jìn)行綜合的評價,進(jìn)而對時間資源進(jìn)行實(shí)時的管理與分配。
因此,針對現(xiàn)有的資源管理方法的不足,本文創(chuàng)新地采用概率密度函數(shù)的方法對目標(biāo)跟蹤誤差進(jìn)行評價,綜合考慮雷達(dá)對目標(biāo)測距精度與測速的精度。接下來采用馬爾可夫決策的方法,實(shí)時地對雷達(dá)的時間資源進(jìn)行管理與分配。采用這種方法,一方面可以實(shí)時地調(diào)整資源分配的策略以適應(yīng)隨時變化的情況,另一方面兼顧考慮了此次的決策對于長期效果的影響。最終通過仿真結(jié)果表明,采用本文的馬爾可夫決策過程進(jìn)行資源管理,可以有效提高單波束火控相控陣?yán)卓筛櫮繕?biāo)的數(shù)量。
本文利用概率密度函數(shù)模型,描述雷達(dá)對目標(biāo)的跟蹤誤差。雷達(dá)在對目標(biāo)進(jìn)行跟蹤的過程中,會綜合計算目標(biāo)在前一個時刻位置的估計值、當(dāng)前速度的量測與當(dāng)前位置的量測,以得到雷達(dá)對當(dāng)前目標(biāo)位置的估計值。
1.1 跟蹤模型
式中,xk表示目標(biāo)在k時刻的位置的狀態(tài)值;p(xk)表示該狀態(tài)的后驗(yàn)概率。
對后驗(yàn)概率p(xk)進(jìn)行推導(dǎo),可以得到
式中,p(yk)表示雷達(dá)對目標(biāo)位置進(jìn)行測量,測量值為yk的概率;p()表示雷達(dá)對目標(biāo)速度進(jìn)行測量,測量值為y的概率;p()表示目標(biāo)在k-1時刻,位置為的概率p()表示經(jīng)過測量后,對目標(biāo)速度進(jìn)行估計的后驗(yàn)概率;p(xk|yk,,)表示通過當(dāng)前位置的量測、速度的估計值與上一個時刻對目標(biāo)位置的估計,計算得到的當(dāng)前目標(biāo)跟蹤位置的后驗(yàn)狀態(tài)估計值。
式(2)中的對目標(biāo)位置的后驗(yàn)狀態(tài)估計p(xk|yk,,)可以推導(dǎo)為
式中,p(yk|xk)表示目標(biāo)位置量測的概率密度函數(shù);p(xk|,)表示目標(biāo)的狀態(tài)轉(zhuǎn)移函數(shù),即已知當(dāng)前速度估計值為、上一個時刻目標(biāo)位置估計值為情況下,目標(biāo)當(dāng)前位置為xk的概率密度函數(shù)。
將式(4)代入式(2),得到
通過式(5)的描述,可以看到影響雷達(dá)對目標(biāo)跟蹤的精度,受到以下幾個因素的影響:雷達(dá)對目標(biāo)位置的量測、對目標(biāo)速度的量測、目標(biāo)速度的估計與上一個時刻目標(biāo)的位置估計。
1.2 跟蹤誤差模型
根據(jù)式(5)可以看到,對目標(biāo)進(jìn)行跟蹤后目標(biāo)所在位置的概率密度函數(shù),可以視為由位置量測概率、速度量測概率、狀態(tài)轉(zhuǎn)移概率等多種概率綜合影響的結(jié)果。本文將在下面對于各種影響因素進(jìn)行詳細(xì)的描述。
雷達(dá)對目標(biāo)位置測量的概率密度函數(shù)p(yk|xk)可以表示為
式中,N(yk;xk,)表示目標(biāo)的位置量測yk服從以xk為均值,為方差的正態(tài)分布。方差的克拉美羅界(Cramer-Rao lower bound,C R LB)描述為
式中,CRLB(xk)表示對于目標(biāo)的位置量測的CRLB;c表示光速;α表示雷達(dá)照射目標(biāo)回波信噪比;表示均方帶寬。
回波的信噪比α受到雷達(dá)波束持續(xù)照射目標(biāo)的駐留時間τk與平均照射功率Pk影響,即αk∝τk·Pk。
式中,T表示當(dāng)前時刻距離上一次雷達(dá)照射該目標(biāo)的重訪時間間隔;σ2表示目標(biāo)在飛行過程中單位時間的狀態(tài)噪聲方差。目標(biāo)狀態(tài)轉(zhuǎn)移的概率密度函數(shù)可以描述為:當(dāng)前目標(biāo)的位置狀態(tài)xk,服從以+T為均值,(Tσ)2為方差的正態(tài)分布。
則跟蹤過程中,目標(biāo)n在k時刻丟失的概率Ploss(k,n)可以描述為,雷達(dá)對于目標(biāo)位置的估計值與真實(shí)值差距超過門限的概率,表示為
本章節(jié)采用概率密度函數(shù)的方法,將雷達(dá)對目標(biāo)的跟蹤的概率密度函數(shù)與丟失概率進(jìn)行了描述,為接下來的資源管理提供了評價函數(shù)。本文將對雷達(dá)照射目標(biāo)的時間資源進(jìn)行管理,而駐留時間的長短對于測速精度具有至關(guān)重要的影響。因此本文創(chuàng)新的采用概率密度函數(shù)來評價雷達(dá)對目標(biāo)的跟蹤性能,綜合考慮了測速精度的影響。
在第1章,本文提出了一種采用概率密度來描述目標(biāo)跟蹤誤差的方法,并推導(dǎo)出了目標(biāo)丟失概率的函數(shù)。接下來,本章節(jié)將以目標(biāo)丟失概率作為評價函數(shù),對雷達(dá)跟蹤目標(biāo)的時間資源進(jìn)行管理與優(yōu)化。
2.1 馬爾可夫決策
在雷達(dá)視線范圍內(nèi)共有N個目標(biāo),則n∈[1,N]。采用fk(n,τ)表示決策函數(shù),即在k時刻,雷達(dá)對目標(biāo)n進(jìn)行照射,照射該目標(biāo)的駐留時間為τ。
雷達(dá)在進(jìn)行決策fk(n,τ)后,即對目標(biāo)n進(jìn)行照射后產(chǎn)生的效果表示為r[fk(n,τ)],也就是目標(biāo)n的丟失概率:
雷達(dá)在k時刻進(jìn)行決策過后,會對剩余的時間資源與其他目標(biāo)產(chǎn)生一定的影響。為了量化這種影響,我們假設(shè)經(jīng)過當(dāng)前決策之后,即k+τ時刻,對目標(biāo)m再進(jìn)行照射的效果表示為
采用馬爾可夫決策的方法,對于雷達(dá)時間資源進(jìn)行管理,一方面希望能夠根據(jù)當(dāng)前目標(biāo)的狀態(tài)進(jìn)行決策,另一方面希望能夠考慮到該決策產(chǎn)生的長期影響。
如果在當(dāng)前k時刻,雷達(dá)進(jìn)行了時間資源管理的決策,即對某個目標(biāo)n照射了τ的時間,則直接會對目標(biāo)n產(chǎn)生影響,導(dǎo)致該目標(biāo)丟失概率減小為Ploss(k,n)=r[fk(n,τ)]。這一部分是進(jìn)行決策后的短期影響。
當(dāng)雷達(dá)對目標(biāo)n照射了τ的時間之后,雷達(dá)就需要對其他目標(biāo)進(jìn)行跟蹤,即對k+τ時刻進(jìn)行決策。對于目標(biāo)m在k+τ時刻進(jìn)行照射的概率表示為Pk+τ(m)。Pk+τ(m)與目標(biāo)m當(dāng)前的丟失概率成正比,即目標(biāo)m的丟失概率越大,就越有可能需要在k+τ時刻對該目標(biāo)進(jìn)行照射,以保證其丟失概率處于合理的范圍之內(nèi)。而在k+τ時刻對目標(biāo)m進(jìn)行了駐留時間長度為τ0的照射,則會導(dǎo)致該目標(biāo)的丟失概率變?yōu)镻loss(k+τ,m)。該丟失概率描述了在k時刻對目標(biāo)n照射了τ的時間之后,對于目標(biāo)m可能產(chǎn)生的影響,因此稱為k時刻決策產(chǎn)生的長期影響。綜合所有目標(biāo)的長期影響,可以描述為
因而將影響的函數(shù)Tk(n,τ)表示為在k時刻對目標(biāo)n照射了τ的時間之后,對于所有目標(biāo)的丟失概率產(chǎn)生的短期影響與長期影響。Tk(n,τ)可以表示為
2.2 優(yōu)化方程
根據(jù)第2.1節(jié)中式(14)的描述可以看到,在k時刻進(jìn)行決策后,將會對所有的目標(biāo)產(chǎn)生一個短期與長期的影響,即對影響函數(shù)Tk(n,τ)的描述。
在優(yōu)化的過程中,在每個k時刻進(jìn)行決策,決定需要照射的目標(biāo)n與相應(yīng)的駐留時間τ。同時需要保證對當(dāng)前照射的目標(biāo)保持跟蹤情況下,其他目標(biāo)在接下來的時間內(nèi)不丟失,即影響函數(shù)Tk(n,τ)最小。則優(yōu)化函數(shù)可以寫為
式中,Tr表示當(dāng)前雷達(dá)剩余的可以用于跟蹤的時間資源;約束條件s.t.τ≤Tr表示為當(dāng)前用于跟蹤的駐留時間不超過當(dāng)前可用的時間資源。
本文提出的算法的運(yùn)算復(fù)雜度較高,運(yùn)算量的多少取決于目標(biāo)的數(shù)量N與設(shè)置的速度狀態(tài)的數(shù)量L1與位置狀態(tài)的數(shù)量L2。根據(jù)式(10)與式(14)可以將算法的時間復(fù)雜度表示為O(n2·L31·L32)。然而在雷達(dá)實(shí)際的應(yīng)用中,可以根據(jù)實(shí)際精度的需求改變設(shè)置的狀態(tài)的數(shù)量L1與L2,以提高運(yùn)算速度。
2.3 時間資源分配流程
接下來本文將詳細(xì)描述在跟蹤過程中,對于時間資源分配的流程。
步驟1 在k-1時刻,首先對雷達(dá)視線范圍內(nèi)的N個目標(biāo)建立跟蹤,對目標(biāo)n(n∈[1,N])進(jìn)行測量后,獲得目標(biāo)的位置的估計:^xk-1(n)。
步驟2 在當(dāng)前時刻k,需要決定接下來一段時間內(nèi)需要照射的目標(biāo)n,以及對其照射的駐留時間τ。當(dāng)前時刻剩余的用于跟蹤的時間資源為Tr,則可分配的時間τ<Tr。
首先根據(jù)當(dāng)前時刻對目標(biāo)位置的估計,計算雷達(dá)距離目標(biāo)n的徑向距離Rk(n)。回波的信噪比αk(n)受到雷達(dá)波束持續(xù)照射目標(biāo)的駐留時間τk(n)與平均照射功率Pk影響:
步驟3 由于已知k時刻的目標(biāo)位置與信噪比,根據(jù)式(10)可以計算得到任意目標(biāo)n在分配給予τ的時間長度照射后的丟失概率r[fk(n,τ)]。并且能夠計算k+τ時刻后,對其他目標(biāo)進(jìn)行照射τ0時間的丟失概率總和
根據(jù)以上計算得到的任意目標(biāo)n分配任意τ的駐留時間后的影響函數(shù)Tk(n,τ),根據(jù)全部數(shù)值求解優(yōu)化函數(shù)(15),得到滿足條件的需要照射的目標(biāo)n以及需要照射的駐留時間長度τ。
步驟4 根據(jù)分配的結(jié)果,對雷達(dá)k到k+τ時刻的波束方向進(jìn)行調(diào)整,對目標(biāo)n進(jìn)行駐留時間為τ的照射,當(dāng)前剩余的時間資源Tr=Tr-τ。
步驟5 時刻k=k+τ,若當(dāng)前時刻可以補(bǔ)充時間資源,則Tr=Tr+Tb,其中Tb表示經(jīng)過一段時間之后,可以補(bǔ)充的照射時間資源。跳轉(zhuǎn)至步驟2,繼續(xù)對全部目標(biāo)進(jìn)行跟蹤,并進(jìn)行時間資源的分配。
本章節(jié)采用馬爾可夫決策過程,對資源分配的方法進(jìn)行優(yōu)化。相對于傳統(tǒng)的自適應(yīng)的資源管理,采用本文的方法,一方面考慮了目標(biāo)當(dāng)前的情況,可以實(shí)時地進(jìn)行決策;另一方面,兼顧了此刻的決策造成的長期影響。
為了驗(yàn)證采用馬爾可夫決策的時間資源綜合分配算法的有效性,本文進(jìn)行了如下仿真,并將該算法的性能與傳統(tǒng)的平均分配、自適應(yīng)分配時間資源的方法進(jìn)行比較。
3.1 對比驗(yàn)證方法
為了驗(yàn)證本文方法的有效性,在仿真過程中將采用兩種傳統(tǒng)的方法,對雷達(dá)時間資源進(jìn)行管理,用來對跟蹤后的結(jié)果進(jìn)行比較。
方法1 平均分配的方法
雷達(dá)照射每個目標(biāo)的重訪時間間隔均為1s,根據(jù)目標(biāo)的狀態(tài)調(diào)整駐留時間的長短。駐留時間與雷達(dá)與目標(biāo)的徑向距離、目標(biāo)的RCS等因素有關(guān),可以描述為τk∝R4/RCS。
方法2 自適應(yīng)分配方法
該方法在每個時刻,均對所有目標(biāo)的跟蹤誤差σk(n)進(jìn)行計算與估計,當(dāng)存在某個目標(biāo)的σk(n)>Thr,其中Thr表示跟蹤誤差的門限,則對該目標(biāo)n進(jìn)行照射,分配給該目標(biāo)的駐留時間τk∝R4/R CS。
該方法的核心思想是根據(jù)目標(biāo)的跟蹤精度的需求,即時地給予一定的時間資源,以保證所有目標(biāo)的跟蹤誤差小于門限Thr。
3.2 仿真場景
仿真場景如圖1所示,在雷達(dá)的視線范圍內(nèi),存在10個飛行的目標(biāo),目標(biāo)的速度在400~800 km/h之間,所有目標(biāo)在飛行過程中均為勻速直線運(yùn)動,并存在一定的R CS起伏。因此根據(jù)對場景內(nèi)的目標(biāo)的運(yùn)動特性,均采用卡爾曼濾波的方法,對目標(biāo)進(jìn)行跟蹤。如果按照傳統(tǒng)的平均分配雷達(dá)的時間資源,視線內(nèi)的目標(biāo)個數(shù)已經(jīng)遠(yuǎn)遠(yuǎn)超過雷達(dá)的最大可跟蹤目標(biāo)的數(shù)量,即雷達(dá)無法對這10個目標(biāo)全部進(jìn)行跟蹤,只能對其中5~6個目標(biāo)進(jìn)行跟蹤。,則在整個飛行過程中,雷達(dá)照射每個目標(biāo)獲得的回波的平均信噪比如圖2所示。
圖1 仿真場景與目標(biāo)軌跡
圖2 場景中10個目標(biāo)的平均信噪比
仿真采用的是單波束相控陣?yán)走_(dá),采用線性調(diào)頻脈沖信號對目標(biāo)進(jìn)行照射。雷達(dá)同時發(fā)射一個波束照射某個位置上的目標(biāo),并且可以即時調(diào)整發(fā)射方向。雷達(dá)每1 s的時間中有15%的時間資源用以對目標(biāo)進(jìn)行跟蹤,即150 ms。我們設(shè)定的跟蹤誤差的門限為10 m,即需要通過時間資源管理,保證進(jìn)行跟蹤的目標(biāo),跟蹤的位置與真實(shí)位置間的差距不超過10 m。
3.3 仿真結(jié)果
對仿真場景中的10個目標(biāo)建立跟蹤,分別采用方法1、方法2與本文的方法對時間資源進(jìn)行管理。由于目標(biāo)數(shù)量遠(yuǎn)遠(yuǎn)大于雷達(dá)可以跟蹤的目標(biāo)的最大數(shù)量,故在跟蹤過程中,需要根據(jù)不同的分配方法所剩余的時間,對跟蹤目標(biāo)進(jìn)行取舍。
則采用3種方法,對場景中的目標(biāo)進(jìn)行跟蹤,跟蹤過程中全部目標(biāo)的平均跟蹤誤差如圖3~圖5所示。其中圖3表示采用方法1進(jìn)行時間管理得到的實(shí)際跟蹤誤差,圖4表示采用方法2進(jìn)行時間管理得到的實(shí)際跟蹤誤差,圖5表示采用方法3進(jìn)行時間管理得到的實(shí)際跟蹤誤差。圖中顯示的柱狀圖表示對應(yīng)編號的目標(biāo)在整個跟蹤過程中,平均的跟蹤誤差。若某個目標(biāo)編號上不存在柱狀圖,表示沒有對該目標(biāo)進(jìn)行跟蹤。
圖3 采用方法1每個目標(biāo)平均跟蹤誤差
圖4 采用方法2每個目標(biāo)平均跟蹤誤差
圖5 采用本文方法每個目標(biāo)平均跟蹤誤差
通過圖3可以看到,若采用方法1,即平均分配的方法管理時間資源,雷達(dá)可以跟蹤6個目標(biāo),且保證每個目標(biāo)的跟蹤精度都處于要求的門限之下。如圖4所示,若采用方法2,即自適應(yīng)的方法,可以保證6個目標(biāo)的有效跟蹤。同時剩余出一部分的時間資源,對目標(biāo)9進(jìn)行跟蹤,但是無法形成有效的跟蹤,所以這個目標(biāo)的跟蹤誤差遠(yuǎn)超過門限要求。若采用本文中提出的馬爾可夫決策的方法,如圖5所示,則可以保證對8個目標(biāo)的有效跟蹤。通過3種方法的比較,采用本文提到的方法,可以保證目標(biāo)的跟蹤誤差處于門限范圍內(nèi)。
而在整個跟蹤過程中,以圖6中目標(biāo)3為例,代表了諸如目標(biāo)2~6、10等6個目標(biāo),可以采用方法1與方法2進(jìn)行很好的跟蹤。而以目標(biāo)9為例,采用方法1已經(jīng)無法進(jìn)行跟蹤,采用方法2則有一部分時間可以進(jìn)行照射,而采用方法3可以進(jìn)行跟蹤。目標(biāo)5與目標(biāo)9在3種跟蹤模式下的跟蹤誤差如圖6與圖7所示。
圖6 分別采用3種方法情況下目標(biāo)5的跟蹤誤差
圖7 分別采用3種方法情況下目標(biāo)7的跟蹤誤差
通過圖7可以看到,以目標(biāo)5為例的目標(biāo)2~6、10等6個目標(biāo),由于距離雷達(dá)較近,較容易進(jìn)行跟蹤。因此在整個跟蹤過程中,不論采用3種方法中的任意一個,跟蹤誤差均處于設(shè)定的門限之下。而通過圖7可以看到,對目標(biāo)7的跟蹤,由于時間資源的不足,采用方法1完全無法跟蹤,被完全舍棄;采用方法2,由于時間資源的不足,雖然可以分配一定的時間資源進(jìn)行照射與跟蹤,但是跟蹤誤差超過了門限設(shè)定的要求,無法滿足跟蹤的要求;而采用本文中的馬爾可夫決策的方法,可以對該目標(biāo)進(jìn)行跟蹤,并保證部分時刻的跟蹤精度處于要求的范圍內(nèi)。
通過以上的仿真可以看到,當(dāng)雷達(dá)的視野范圍內(nèi)出現(xiàn)了較多數(shù)量的目標(biāo),目標(biāo)的數(shù)量超過了雷達(dá)最大可以進(jìn)行跟蹤的能力,采用傳統(tǒng)的時間資源管理的方法已經(jīng)無法滿足需求。因此采用本文的馬爾可夫決策的方法對單波束火控相控陣?yán)走_(dá)用于跟蹤的時間資源繼續(xù)管理,可以有效地節(jié)約一部分時間資源,以跟蹤更多的目標(biāo),提高雷達(dá)跟蹤性能。同時保證增加的目標(biāo)跟蹤誤差處于設(shè)定的門限范圍內(nèi)。
本文針對單波束火控相控陣?yán)走_(dá)的應(yīng)用,提出了一種基于馬爾可夫決策的時間資源管理算法,目的是針對雷達(dá)有限的時間資源,進(jìn)行合理的管理,進(jìn)而盡可能地節(jié)約時間資源,對更多的目標(biāo)進(jìn)行跟蹤。
由于傳統(tǒng)的評價雷達(dá)對目標(biāo)跟蹤誤差描述的函數(shù),無法衡量速度量測的影響,而駐留時間的長度對于測速精度有著巨大的影響。因此本文創(chuàng)新地采用概率密度函數(shù)的方法,綜合測速精度與測距精度的影響,以目標(biāo)的丟失概率作為跟蹤誤差的評價函數(shù)。
在進(jìn)行資源管理的過程中,考慮到預(yù)測的難度與資源分配的實(shí)時性,采用馬爾可夫決策的方法進(jìn)行資源管理的計算。實(shí)時的決策標(biāo)準(zhǔn)既兼顧了當(dāng)前的目標(biāo)狀態(tài),同時考慮到了進(jìn)行分配后對于整體狀態(tài)的長期影響。
本文所采用的馬爾可夫決策的方法對雷達(dá)時間資源進(jìn)行管理,適用于單波束火控相控陣?yán)走_(dá),即雷達(dá)可以實(shí)時、快速改變單個波束發(fā)射方向。而該算法適用于雷達(dá)場景中的目標(biāo)數(shù)量較多,超過了雷達(dá)最大的可跟蹤目標(biāo)的數(shù)量的情況??梢酝ㄟ^本文的方法,對時間資源進(jìn)行管理與調(diào)整,以提高可以跟蹤的目標(biāo)個數(shù)。
通過仿真實(shí)驗(yàn)表明,相對于平均分配時間資源與傳統(tǒng)的自適應(yīng)的分配方法,本文的方法能夠有效地節(jié)約時間資源,并對節(jié)省下來的時間資源合理利用,對更多的目標(biāo)進(jìn)行跟蹤。對于單波束相控陣?yán)走_(dá),跟蹤目標(biāo)的數(shù)量可以提高30%,在保證資源不變情況下,有效提高性能。提高最大可跟蹤的目標(biāo)數(shù)量,對于火控相控陣?yán)走_(dá),這種經(jīng)常需要大量目標(biāo)數(shù)量的雷達(dá),具有重要的意義。
[1]Narykov A S,Oleg A K.Algorith m for resource management of multiple phased array radars for target tracking[C]∥Proc.of the 16th International Conference on Inform ation Fusion Istanbul,2013:1258-1264.
[2]Yan J K,Jiu B,Liu HW,et al.Joint cluster and power allocation algorith m for m ultiple targets tracking in m ultistatic radar systems[J].Journal of Electronics&Inform ation Technology,2013,35(8):1875-1881.(嚴(yán)俊坤,糾博,劉宏偉,等.一種針對多目標(biāo)跟蹤的多基雷達(dá)系統(tǒng)聚類與功率聯(lián)合分配算法[J].電子與信息學(xué)報,2013,35(8):1875-1881.)
[3]Yan J K,Xia S Z,Dai F Z,et al.Power allocation strategy for target tracking in asynchronous m ultistatic radar systems[J]. Journal of Xidian University,2013,46(6):32-40.(嚴(yán)俊坤,夏雙至,戴奉周,等.異步多基地雷達(dá)系統(tǒng)目標(biāo)跟蹤的功率分配算法[J].西安電子科技大學(xué)學(xué)報,2013,46(6):32-40.)
[4]Zhao J X,Seok J W.A greedy policy for fleet-level radar resource management[C]∥Proc.of the52nd IE E E Conference on Decision and Control,2013:3160-3165.
[5]Narykov A S,Krasnov O A.Effectiveness-based radar resource management for target tracking[C]∥Proc.of the International Radar Conference,2014:1-5.
[6]Seok J,Zhao J X.Radar resource management:dyna mic program ming and dyna mic finite state machines[C]∥Proc.of the European Control Conference,2013:4100-4105.
[7]Jin woo S,Zhao J X.Radar resource management:dyna mic program ming and dyna mic finite state machines[C]∥Proc.of the European Control Conference,2013:4100-4105.
[8]Chen Y J,Luo Y,Zhang Q,et al.Adaptive schedul ing algorith m for phased array radar based on cognitive ISA R imaging[J].Journal of Electronics&Information Technology,2014,36(7):1566-1572.(陳怡君,羅迎,張群,等.基于認(rèn)知ISAR成像的相控陣?yán)走_(dá)資源自適應(yīng)調(diào)度算法[J].電子與信息學(xué)報,2014,36(7):1566-1572.)
[9]Zhang Z K,W ang F,Zhou J J,et al.A daptive time resource scheduling for m ultiple target tracking[J].Acta Aeronautica et Astronautica Sinica,2011,32(3):522-530.(張貞凱,汪飛,周建江,等.多目標(biāo)跟蹤中自適應(yīng)時間資源調(diào)度[J].航空學(xué)報,2011,32(3):522-530.)
[10]M atthiesen D J.Efficient bea m scanning,energy allocation,and time allocation for search and detection[J].Phased Array Systems and Technology,2010:361-368.
[11]M oham mad R,Bi l l M.Constrained multi-object Markov decision schedul ing with appl ication to radar resource management[C]∥Proc.of the13th Information Fusion,2010:1-8.
[12]Vikra m K,Djonin D V.Optimalthreshold policies for m ultivariate P O M D Ps in radar resource management[J].IE E E Trans.on Signal Processing,2009,57(10):3954-3969.
[13]Fotios K,Driessen H.Radar resource management for improved situational awareness[C]∥Proc.of the International Radar Conference,2014:1-6.
[14]Chen M Y,W ang L.Resource management algorith m based on the minim u m covariance mean deviation criterion for phased array radars[C]∥Proc.of the Microwave and Millimeter W ave Circuits and System Technology,2012:1-2.
[15]Li W L,Yuan S.Efficient anchor power allocation forlocationaware networks[C]∥Proc.of the IE E E International Conference,2011:1-6.
Time resource management algorithm for the fire control phased-array radar
QIN Tong,D AI Feng-zhou,LIU Hong-wei,F(xiàn) A N G Ming
(National Laboratory of Radar Signal Processing,Xidian University,Xi’an 710071,China)
For fire control phased array radar,itis flexible to adjust the direction of the beam,so as to adjust the time resource of radar for tracking.Aiming at this characteristic,a kind of time resource management algorith mis proposed,which is used to enhance the maxim umnumber of radar tracking targets.The tracking precision of the targetis described with the probability density function,and the influence of ranging and velocity precision ofthe measurement on the tracking erroris considered.The method of Markov’s decision is used to allocate the dwell time and revisit time interval for each target.The simulation results show that,co m pared with the traditional methods of resource management,the proposed method can increase the maxim u m nu m ber of the target and the radar can track with the same tracking accuracy.
fire control phased-array radar;time resource management;Markov decision
TN953
A
10.3969/j.issn.1001-506 X.2016.03.11
1001-506 X(2016)03-0545-06
2015-04-20;
2015-09-15;網(wǎng)絡(luò)優(yōu)先出版日期:2015-12-24。
網(wǎng)絡(luò)優(yōu)先出版地址:http:∥w w w.cnki.net/kcms/detail/11.2422.T N.20151224.1018.004.html
國家自然科學(xué)基金(61271291,61201285);新世紀(jì)優(yōu)秀人才支持計劃(N C E T-09-0630);全國優(yōu)秀博士學(xué)位論文作者專項(xiàng)資金(F A N E D D-201156);國防預(yù)研基金;中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助課題
秦 童(1988-),男,博士研究生,主要研究方向?yàn)檎J(rèn)知雷達(dá)、雷達(dá)資源管理。
E-mail:qin13@yeah.net
戴奉周(1978-),男,副教授,博士,主要研究方向?yàn)榻y(tǒng)計與自適應(yīng)信號處理、信號檢測。
E-mail:fzdai@xidian.edu.cn
劉宏偉(1971-),男,教授,博士研究生導(dǎo)師,主要研究方向?yàn)槔走_(dá)系統(tǒng)、雷達(dá)信號處理、雷達(dá)自動目標(biāo)識別。
E-mail:h wliu@xidian.edu.cn
方 明(1987-),男,教授,博士研究生,主要認(rèn)知雷達(dá)、空時自適應(yīng)處理、目標(biāo)檢測。
E-mail:zj02065119@163.com