王樹亮,畢大平,劉 寶,2,杜明洋
(1. 國防科技大學(xué)電子對(duì)抗學(xué)院,合肥 230037;2. 73676部隊(duì),江陰 214400)
現(xiàn)代戰(zhàn)場(chǎng)環(huán)境中,雷達(dá)目標(biāo)跟蹤已經(jīng)發(fā)展成為具有顯著復(fù)雜性特征的系統(tǒng)建模與處理問題。目前,對(duì)機(jī)動(dòng)目標(biāo)跟蹤建模主要有兩個(gè)方向[1],一是多模型算法,也稱為結(jié)構(gòu)自適應(yīng)方法,典型的有交互式多模型(Interacting Multiple Model,IMM)算法和變結(jié)構(gòu)多模型(Varied Structure Multiple Model,VSMM)算法,其前提是要尋找合適的模型集,計(jì)算過程中代價(jià)比較大[2];另一類是單模型算法,也稱為參數(shù)自適應(yīng)方法,典型的有Singer模型、Jerk模型和“當(dāng)前”統(tǒng)計(jì)(Current Statistic,CS)模型等,然而此類算法的模型參數(shù)往往需要根據(jù)經(jīng)驗(yàn)提前假定,濾波性能受模型參數(shù)的影響比較大[3-4]。
傳統(tǒng)雷達(dá)通常采用固定的發(fā)射信號(hào)或者按照某種工作模式周期性地發(fā)射信號(hào),通過對(duì)接收端處理機(jī)制的選擇與設(shè)計(jì)提高雷達(dá)性能[5],即基于回波數(shù)據(jù)以開環(huán)方式工作,這種僅僅依靠基于回波數(shù)據(jù)的接收端被動(dòng)自適應(yīng)處理越來越難以應(yīng)對(duì)復(fù)雜時(shí)變且無法預(yù)知的雷達(dá)工作環(huán)境。認(rèn)知雷達(dá)[6]將腦科學(xué)和人工智能融入雷達(dá)系統(tǒng),賦予了雷達(dá)系統(tǒng)感知環(huán)境、理解環(huán)境、學(xué)習(xí)、推理并判斷決策的能力,使雷達(dá)系統(tǒng)能夠適應(yīng)日益復(fù)雜多變的電磁環(huán)境,從而提高雷達(dá)系統(tǒng)的性能[7]?;诳刂评碚摵托畔⒗碚摚S多學(xué)者對(duì)面向目標(biāo)跟蹤的自適應(yīng)波形選擇技術(shù)如波形庫的設(shè)計(jì)、波形選擇準(zhǔn)則以及波形參數(shù)對(duì)跟蹤影響等進(jìn)行了深入研究[8-14]。在傳統(tǒng)認(rèn)知雷達(dá)基礎(chǔ)上Haykin將人類“記憶、注意、智能”等認(rèn)知過程充分融入雷達(dá)信號(hào)及數(shù)據(jù)處理,使雷達(dá)跟蹤系統(tǒng)具有更加廣泛的認(rèn)知屬性[15]。文獻(xiàn)[16]在研究認(rèn)知控制理論時(shí),基于信息理論,提出用感知信息熵來表征雷達(dá)對(duì)目標(biāo)的跟蹤質(zhì)量,其中感知信息熵用濾波誤差協(xié)方差的行列式來簡(jiǎn)化等價(jià)表示。文獻(xiàn)[9]指出機(jī)動(dòng)目標(biāo)跟蹤誤差由目標(biāo)運(yùn)動(dòng)誤差橢球(圓)和量測(cè)誤差橢球(圓)相交的區(qū)域大小決定。為提高系統(tǒng)跟蹤性能,一方面要不斷優(yōu)化機(jī)動(dòng)模型,減小運(yùn)動(dòng)誤差橢球(圓)體積;另一方面通過波形選擇技術(shù)使量測(cè)誤差橢球(圓)與運(yùn)動(dòng)誤差橢球(圓)保持正交。
受認(rèn)知雷達(dá)研究成果的啟發(fā),本文提出一種基于認(rèn)知結(jié)構(gòu)模型的機(jī)動(dòng)目標(biāo)跟蹤算法,算法綜合考慮目標(biāo)機(jī)動(dòng)模型構(gòu)建和波形量測(cè)的優(yōu)化,1)將“記憶”模塊嵌入到雷達(dá)接收端來動(dòng)態(tài)感知環(huán)境和目標(biāo)特性,通過神經(jīng)網(wǎng)絡(luò)離線學(xué)習(xí)生成記憶并存儲(chǔ),指導(dǎo)機(jī)動(dòng)模型參數(shù)的實(shí)時(shí)調(diào)整,使模型對(duì)運(yùn)動(dòng)狀態(tài)變化的描述更加準(zhǔn)確;2)基于人類認(rèn)知“感知-行動(dòng)”循環(huán)思想,用感知信息熵來描述目標(biāo)跟蹤不確定性,并將其作為波形選擇的代價(jià)函數(shù),從波形庫中自適應(yīng)選擇最佳波形來匹配目標(biāo),從而使目標(biāo)的跟蹤性能得到明顯提升。
1.1.1線性狀態(tài)模型
目標(biāo)運(yùn)動(dòng)的離散狀態(tài)方程表示為
X(k)=Φ(k|k-1)X(k-1)+
(1)
1.1.2量測(cè)模型
目標(biāo)的量測(cè)方程為
Y(k)=H(k)X(k)+Vθ(k)
(2)
目標(biāo)運(yùn)動(dòng)和環(huán)境變化構(gòu)成了一系列的不確定性問題,從信息論的觀點(diǎn)出發(fā),可以將雷達(dá)對(duì)目標(biāo)運(yùn)動(dòng)特性的感知用信息熵來表示[16]
E(k)=f(p(X(k)|Y(k)))
(3)
(4)
如果跟蹤模型絕對(duì)準(zhǔn)確且環(huán)境為理想環(huán)境,即p(X(k)|Y(k))趨近于1,此時(shí)信息熵E(k)趨近于0,但實(shí)際上由于環(huán)境和目標(biāo)運(yùn)動(dòng)的不確定性永遠(yuǎn)存在,100%的精確也不存在,所以熵的值不可能為0。評(píng)價(jià)一個(gè)模型跟蹤性能的好壞可以由信息熵來表征,其值越大,性能越差,反之則性能較佳。認(rèn)知雷達(dá)的顯著特點(diǎn)就是將信號(hào)處理與數(shù)據(jù)處理結(jié)合起來進(jìn)行研究,而感知信息熵就是它們聯(lián)系的一個(gè)橋梁。文獻(xiàn)[16]給出了信息熵的簡(jiǎn)化表達(dá)式
(5)
模型的基本思想是在每一種具體的戰(zhàn)術(shù)場(chǎng)合,人們所關(guān)心的僅是機(jī)動(dòng)加速度的“當(dāng)前”概率密度,其概率密度由修正的瑞利分布描述[17]。
(6)
(7)
文獻(xiàn)[19]利用一個(gè)反映當(dāng)前加速度與加速度極限值匹配程度的高斯隸屬度函數(shù)L(k)來加權(quán)調(diào)整加速度極限值,
(8)
式中,ε1,ε2∈[20,25]為實(shí)驗(yàn)后得到的經(jīng)驗(yàn)值,此時(shí)amax←L(k)·amax。該修正算法在加速度極限值設(shè)置不太大時(shí)取得了不錯(cuò)的效果,然而對(duì)于非合作目標(biāo),加速度極限值往往取較大的值以保證對(duì)目標(biāo)不失跟,此時(shí)若當(dāng)前估計(jì)加速度很小或?yàn)?,式(8)可能會(huì)產(chǎn)生一個(gè)很小的L(k),使amax過小,導(dǎo)致對(duì)機(jī)動(dòng)目標(biāo)失跟。為克服文獻(xiàn)算法存在的問題,本文提出一種嵌入“記憶”的CS模型,在考慮當(dāng)前加速度匹配程度信息的基礎(chǔ)上,利用神經(jīng)網(wǎng)絡(luò)融合濾波的歷史信息來產(chǎn)生一個(gè)合適的加速度極限值加權(quán)因子。
記憶是是人類認(rèn)知的重要過程,它通過從環(huán)境中不斷地學(xué)習(xí)而獲得知識(shí)或經(jīng)驗(yàn)以有效指導(dǎo)人類行為。記憶的信息處理過程本質(zhì)上就是“把輸入數(shù)據(jù)映射到一個(gè)合適的輸出集”,神經(jīng)網(wǎng)絡(luò)一般被認(rèn)為是構(gòu)建認(rèn)知雷達(dá)中記憶的優(yōu)秀工具。
通過神經(jīng)網(wǎng)絡(luò)這一工具將記憶嵌入CS模型,就是要通過對(duì)目標(biāo)運(yùn)動(dòng)特性的實(shí)時(shí)感知,輸出一個(gè)機(jī)動(dòng)調(diào)整因子來加權(quán)加速度極限值,從而減弱模型參數(shù)提前假定不合理所帶來的影響。本文采用單個(gè)卡爾曼濾波器,融合能夠充分反映機(jī)動(dòng)特性的速度當(dāng)前變化以及歸一化新息對(duì)加速度極限值做調(diào)整。算法首先對(duì)兩屬性參數(shù)進(jìn)行提取,作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),通過訓(xùn)練好的網(wǎng)絡(luò)對(duì)自適應(yīng)濾波的系統(tǒng)方差進(jìn)行調(diào)整。
2.2.1神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù)
a)速度的當(dāng)前變化
選取當(dāng)前速度變化,即當(dāng)前加速度(Acceleration)作為神經(jīng)網(wǎng)絡(luò)的一個(gè)輸入(Input)特征參數(shù),來衡量其與加速度極限值的匹配程度,為使其分布于[0,1]之間,根據(jù)文獻(xiàn)[18]對(duì)CS模型加速度適用范圍的描述,將其表示為
Ainput(k)=
(9)
b)歸一化新息
首先定義k時(shí)刻歸一化新息的平方為
εv(k)=vT(k)S-1(k)v(k)
(10)
(11)
(12)
為便于神經(jīng)網(wǎng)絡(luò)訓(xùn)練,使輸入值(Input)分布于[0,1]之間,故將其變換為
(13)
式中,B為門限值。
2.2.2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及輸出
神經(jīng)網(wǎng)絡(luò)選取基于誤差反向傳播的BP網(wǎng)絡(luò),該神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線映射能力,一個(gè)3層BP神經(jīng)網(wǎng)絡(luò)能夠?qū)崿F(xiàn)任意非線性函數(shù)的逼近。選取輸入節(jié)點(diǎn)數(shù)為2,即速度變化Ainput(k)和模型匹配度變量Minput(k),傳遞函數(shù)為雙曲正切S型傳遞函數(shù),隱層節(jié)點(diǎn)數(shù)設(shè)為8,輸出節(jié)點(diǎn)數(shù)為1,即輸出Ooutput。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 3層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Three layers BP neural network
CS模型在實(shí)際跟蹤中,為了確保能及時(shí)地追蹤戰(zhàn)場(chǎng)目標(biāo)的“機(jī)動(dòng)”變化,往往以犧牲對(duì)弱機(jī)動(dòng)目標(biāo)的跟蹤精度取較大的加速度極限值,此時(shí),若Ainput(k)較小,說明當(dāng)前加速度極限值設(shè)置過大,應(yīng)輸出一個(gè)小的加權(quán)因子,反之則應(yīng)輸出一個(gè)大的加權(quán)因子;若Minput(k)較小,說明過程模型匹配較好,加速度極限值設(shè)置合理,此時(shí)輸出一個(gè)較大的加權(quán)因子,這就避免了若當(dāng)前加速度估計(jì)不準(zhǔn)確而陷入局部最優(yōu)的情況。經(jīng)過神經(jīng)網(wǎng)絡(luò)調(diào)整因子Ooutput加權(quán)后的加速度極限值為a±m(xù)ax←Ooutput·a±m(xù)ax。
量測(cè)誤差協(xié)方差Rθ(k)與發(fā)射波形參數(shù)θ有關(guān),采用量測(cè)噪聲協(xié)方差參數(shù)估計(jì)的克拉羅下界來表示,取發(fā)射信號(hào)為高斯包絡(luò)線性調(diào)頻信號(hào)形式即[8]
(14)
式中,λ為信號(hào)的有效持續(xù)時(shí)間;b為頻率調(diào)制率。其距離、速度測(cè)量誤差協(xié)方差的表達(dá)式為
(15)
式中,η為信噪比,c為電磁波速度,fc為載頻。波形庫是在雷達(dá)工作之前事先需要設(shè)計(jì)的,可以想象波形庫為二維網(wǎng)格,每一個(gè)網(wǎng)格代表一個(gè)可用的波形,網(wǎng)格位置由(λ,b)唯一確定。波形庫WB可以表示為
WB={λ∈[λmin:Δλ:λmax],b∈[bmin:Δb:bmax]}
(16)
式中,下標(biāo)min和max表示設(shè)計(jì)好的參數(shù)的最小值和最大值,Δ為參數(shù)的取值步長(zhǎng)。
波形庫設(shè)計(jì)的目標(biāo)是能夠提供有限的波形以滿足跟蹤需要。從信息論角度出發(fā),選擇波形的目標(biāo)是使下一個(gè)時(shí)刻模型的概率分布熵最小,也就是模型和量測(cè)之間的互信息最大。當(dāng)量測(cè)誤差橢球(圓)與目標(biāo)狀態(tài)預(yù)測(cè)誤差橢球(圓)正交時(shí),波形是最優(yōu)的[9],如圖2所示。
圖2 不同波形目標(biāo)跟蹤效果Fig.2 Tracking effect of different waveform
根據(jù)1.2節(jié)感知信息熵不確定性的描述,基于信息熵準(zhǔn)則的代價(jià)函數(shù)可描述為
(17)
“感知-行動(dòng)”循環(huán)是人類的認(rèn)知過程,體現(xiàn)在雷達(dá)目標(biāo)跟蹤中,其信息流循環(huán)如圖3所示,有以下3個(gè)基本步驟
a)發(fā)射機(jī)在k-1時(shí)刻向環(huán)境中發(fā)射具有一定參數(shù)θk-1的波形,得到相應(yīng)測(cè)量精度的量測(cè)Y(k-1);
圖3 認(rèn)知雷達(dá)跟蹤信息流循環(huán)圖Fig.3 Information flow of cognitive radar
假設(shè)雷達(dá)發(fā)射波形載頻為10.4 GHz,發(fā)射信號(hào)采用式(14)所描述的波形。雷達(dá)位于直角坐標(biāo)原點(diǎn),波形庫內(nèi)脈沖有效持續(xù)時(shí)間λ選擇范圍為[2×10-6,20×10-6]s,間隔為2×10-6s;調(diào)頻斜率b的范圍是[-30×107,30×107]Hz·s-1,間隔為5×107Hz·s-1;雷達(dá)系統(tǒng)的信噪比設(shè)為16 db。
a)固定波形算法對(duì)比
采取固定波形(λ=4×10-6s,b=0),對(duì)比CS模型算法,文獻(xiàn)[16]算法以及本文提出的嵌入記憶的CS(Memory Current Statistic,MCS)模型。假設(shè)模型機(jī)動(dòng)頻率常數(shù)為1/60,檢驗(yàn)統(tǒng)計(jì)量的樣本數(shù)N設(shè)為20,B取值為0.4。進(jìn)行50次Monte Carlo仿真實(shí)驗(yàn)。
圖4(a)、(b)分別為20個(gè)采樣周期后利用MCS算法加速度匹配和模型匹配輸入的動(dòng)態(tài)變化曲線,圖4(c)為網(wǎng)絡(luò)輸出加權(quán)因子的動(dòng)態(tài)輸出曲線。表1給出三種算法在最大加速度取30,40,50,60 m·s-2時(shí)的距離、速度估計(jì)均方根誤差的均值(Average Root Mean Square Error,ARMSE)。
由圖4 (a)、(b)實(shí)時(shí)輸入?yún)?shù)變化曲線看出,階段2、階段3和階段4中加速度匹配參數(shù)相比階段1、階段5明顯較小,而模型匹配參數(shù)則相對(duì)較大,反映了目標(biāo)的機(jī)動(dòng)性較弱且模型匹配度較差,此時(shí)輸出相對(duì)小的權(quán)值因子(如圖4 (c));而在強(qiáng)機(jī)動(dòng)階段(階段1、5),則輸出一個(gè)接近1的輸出因子。由表1不同加速度極限值情況下三種算法距離估計(jì)ARMSE對(duì)比可知,隨著加速度極限值的增大,三種算法的跟蹤誤差都有所增大,CS模型的跟蹤誤差增大最為明顯,反映了算法對(duì)加速度極限值的依賴;文獻(xiàn)[19]算法在加速度為40 m·s-2以下時(shí),由于高斯隸屬度函數(shù)L(k)的加權(quán)調(diào)整其跟蹤性能得到明顯改善,而且要優(yōu)于MCS算法,然而當(dāng)其加速度極限值繼續(xù)增大時(shí),由于加權(quán)函數(shù)本身存在的問題,可能導(dǎo)致目標(biāo)失跟,誤差較大;本文MCS算法充分考慮了當(dāng)前加速度和濾波的歷史信息,避免了因?yàn)楫?dāng)前加速度估計(jì)不準(zhǔn)確可能陷入的局部最優(yōu)情況,其魯棒性要優(yōu)于文獻(xiàn)[19]算法。
圖4 神經(jīng)網(wǎng)絡(luò)輸入和輸出Fig.4 Input and output of the neural network
Table 1 Comparisons of range ARMSE for the three algorithms (m)
b)自適應(yīng)波形算法對(duì)比
比較采取固定波形(波形1參數(shù)為λ=4×10-6s, b=0;波形2參數(shù)為λ2=10×10-6s,b=0)的CS模型算法以及采取基于波形選擇的MCS(WS-MCS)模型算法的濾波性能,指標(biāo)選取距離、速度的估計(jì)均方根誤差(Root Mean Square Error,RMSE),狀態(tài)感知不確定性信息熵,仿真結(jié)果由50次Monte Carlo實(shí)驗(yàn)統(tǒng)計(jì)得到。
圖5分別為自適應(yīng)波形跟蹤算法和固定波形跟蹤算法距離、速度RMSE對(duì)比曲線。圖6為波形動(dòng)態(tài)自適應(yīng)選擇情況,圖7為三種算法的狀態(tài)感知信息熵對(duì)比曲線。
圖5 距離和速度RMSE對(duì)比Fig.5 Comparisons of range and velocity RMSE
圖6 波形動(dòng)態(tài)選擇Fig.6 Waveform dynamic selection
圖7 跟蹤狀態(tài)不確定性對(duì)比Fig.7 Comparison of tracking state uncertainty
波形1-MCS波形2-MCSWS-MCS距離ARMSE/m54.7181.5833.62速度ARMSE/(m·s-1)15.5015.3211.37
由圖5和表2可以看出,選用固定波形1的算法,相比波形2算法因?yàn)槠溆行}沖持續(xù)時(shí)間較小,其距離量測(cè)精度較高、測(cè)速精度較差,所以使得距離跟蹤誤差較小,但速度跟蹤誤差較大。由圖6波形自適應(yīng)選擇曲線可知,調(diào)頻斜率取正的最大值,使量測(cè)誤差橢球(圓)與運(yùn)動(dòng)誤差橢球(圓)盡量保持正交,而脈沖有效持續(xù)時(shí)間除在開始階段選擇第10個(gè)波形,其余時(shí)刻在第1個(gè)波形和第10個(gè)波形之間交替轉(zhuǎn)換,持續(xù)平衡距離測(cè)量誤差和速度測(cè)量誤差,以使誤差橢球(圓)相交區(qū)域的體積(面積)最小,這在圖7跟蹤不確定性對(duì)比曲線中反映得非常明顯,總體上看,波形1要優(yōu)于波形2,自適應(yīng)波形跟蹤精度要明顯優(yōu)于采取固定波形的方法,且在跟蹤穩(wěn)定性上也明顯較優(yōu),魯棒性較強(qiáng)。
本文所提出的跟蹤算法,實(shí)質(zhì)上是雷達(dá)接收端機(jī)動(dòng)模型和雷達(dá)發(fā)射端波形的全自適應(yīng)認(rèn)知結(jié)構(gòu)模型算法。算法將人類認(rèn)知中的“記憶”過程嵌入到雷達(dá)接收機(jī)前端來動(dòng)態(tài)感知目標(biāo)運(yùn)動(dòng)特性,從而提出一種嵌入“記憶”的“當(dāng)前”統(tǒng)計(jì)模型,該模型能夠通過離線訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)有效指導(dǎo)模型中系統(tǒng)方差的自適應(yīng)調(diào)整,仿真結(jié)果驗(yàn)證了模型對(duì)目標(biāo)機(jī)動(dòng)運(yùn)動(dòng)的描述更為合理有效,基于信息熵最小準(zhǔn)則的波形自適應(yīng)結(jié)構(gòu)也明顯優(yōu)于采取固定波形結(jié)構(gòu)的方法。由于篇幅受限,僅研究了認(rèn)知結(jié)構(gòu)單機(jī)動(dòng)跟蹤模型以及波形自適應(yīng)機(jī)制,對(duì)認(rèn)知結(jié)構(gòu)的交互多模型還有待在以后的研究中繼續(xù)探討。