高曉光, 李 飛, 萬開方
(1. 西北工業(yè)大學(xué)電子信息學(xué)院, 陜西 西安 710129; 2. 電子信息控制重點實驗室, 四川 成都 610036)
隨著軍事技術(shù)的發(fā)展,集團化、規(guī)?;⑿畔⒒鲬?zhàn)逐漸成為現(xiàn)代戰(zhàn)爭的主要形式,尤其是制信息權(quán),更是成為決定戰(zhàn)爭成敗的關(guān)鍵。要實現(xiàn)對多個來犯目標的有效攔截,及早發(fā)現(xiàn)目標并對其穩(wěn)定跟蹤是關(guān)鍵。在綜合利用多傳感器對目標進行探測和跟蹤過程中,為實現(xiàn)資源的高效利用,提升對目標的跟蹤效果,獲得信息優(yōu)勢,需要對有限的傳感器資源進行動態(tài)的資源管理與協(xié)同跟蹤調(diào)度[1]。
關(guān)于多傳感器協(xié)同跟蹤調(diào)度問題,已有眾多文獻對其進行過研究。文獻[2]基于信息熵理論提出了多傳感器管理算法,建立了相應(yīng)的目標模型并給出了求解算法;文獻[3]將目標權(quán)重與信息熵理論相結(jié)合,考慮目標不同威脅度值的不同,最終給出了基于目標權(quán)重的多傳感器多目標跟蹤信息熵模型;文獻[4]基于信息理論提出了基于分辨力的傳感器分配模型,并且給出了重加權(quán)多模型濾波模型,彌補了多模型濾波模型的缺陷;文獻[5]給出了基于克拉美羅下界的多傳感器管理模型,克拉美羅下界為濾波的理論下界,因此在進行跟蹤資源協(xié)同分配時無需考慮濾波方法的選擇;文獻[6]基于彈道導(dǎo)彈防御系統(tǒng),給出了基于該系統(tǒng)的多傳感器跟蹤框架;文獻[7]建立了基于Renyi信息差理論建立了多傳感器管理模型,并給出了相應(yīng)的求解算法;文獻[8]將伯努利濾波應(yīng)用到多傳感器多目標跟蹤過程中,同時基于Renyi信息差理論建立了目標模型,針對多目標跟蹤具有很好的效果。
綜合分析現(xiàn)有研究不難發(fā)現(xiàn),現(xiàn)有傳感器協(xié)同調(diào)度問題的研究主要集中在傳感器分配策略上,即假定數(shù)據(jù)可以成功傳輸?shù)饺诤现行摹H欢趯嶋H戰(zhàn)場環(huán)境中,由于天氣,地形等電磁環(huán)境的影響,特別是敵方電子干擾的存在,使得跟蹤傳感器的測量數(shù)據(jù)在遠距離傳輸過程中很容易發(fā)生數(shù)據(jù)丟包,不能成功地傳輸?shù)饺诤现行?。這種在傳輸過程中造成的數(shù)據(jù)損失勢必會對最終的融合結(jié)果以及傳感器調(diào)度策略造成影響。因此,數(shù)據(jù)丟包環(huán)境下的多傳感器協(xié)同控制問題成為實際戰(zhàn)場環(huán)境中亟需解決的問題。
目前對這類數(shù)據(jù)丟包環(huán)境下的多傳感器協(xié)同控制問題尚缺乏足夠的研究。文獻[9]研究了數(shù)據(jù)丟失的概率模型,但并沒有給出數(shù)據(jù)補償,這樣并沒有消除數(shù)據(jù)丟失對融合結(jié)果的影響。本文在文獻[9]的基礎(chǔ)上,討論了造成數(shù)據(jù)丟包的幾種情況,給出了幾種丟包模型,同時分別制定了相應(yīng)的補償策略,最后給出了仿真驗證,證明了這種補償策略的有效性。
考慮如下作戰(zhàn)想定:在空中預(yù)警系統(tǒng)中,由一架預(yù)警機和多架偵察機組成的作戰(zhàn)編隊對入侵目標進行跟蹤[10]。某一時刻,傳感器探測到NT個入侵目標。探測傳感器將目標信息傳輸給控制中心,控制中心將目標信息傳輸給預(yù)警機,并由預(yù)警機控制多架偵察機對入侵目標進行跟蹤,如圖1所示。初始時刻,預(yù)警機分配傳感器對目標進行探測,傳感器將探測信息傳輸給預(yù)警機,預(yù)警機根據(jù)一定的優(yōu)化準則重新制定傳感器目標配對策略,并重新組合傳感器對目標進行照射。重復(fù)以上過程,直至跟蹤精度滿足要求為止。同時,在實際戰(zhàn)場環(huán)境中,由于電磁干擾等因素的存在,使得偵察機上的傳感器的測量數(shù)據(jù)不能及時有效的傳輸?shù)筋A(yù)警機,即發(fā)生數(shù)據(jù)丟包,從而影響最終的跟蹤精度。因此,必須制定一定的丟包補償策略,以防止因數(shù)據(jù)丟包導(dǎo)致的目標失跟。
圖1 作戰(zhàn)想定示意圖Fig.1 Description of Missile Battle Scenario
通過以上描述可知,該跟蹤優(yōu)化問題是一個多傳感器多目標決策問題。首先對數(shù)據(jù)丟包進行描述,建立丟包模型;然后給出丟包補償策略,當(dāng)發(fā)生數(shù)據(jù)丟包時,應(yīng)基于相應(yīng)的補償策略進行數(shù)據(jù)補償,使數(shù)據(jù)丟包帶來的損失降至最低;最后給出求解算法,基于以上思路,本文建立了問題求解模型,并給出了相應(yīng)的求解算法和最終的仿真驗證。
在集中式傳感器管理框架中,丟包環(huán)境下的協(xié)同控制結(jié)構(gòu)分為兩部分:跟蹤策略制定部分和跟蹤策略執(zhí)行部分,如圖2所示。
圖2 控制架構(gòu)圖Fig.2 Control architecture
數(shù)據(jù)丟包條件下,融合中心在接收到傳感器測量的目標實時數(shù)據(jù)之后,首先判斷是否發(fā)生了數(shù)據(jù)丟包,如果數(shù)據(jù)接收正常,則直接根據(jù)既定的優(yōu)化準則制定搜索策略;如果發(fā)生數(shù)據(jù)丟包,則調(diào)用丟包補償算法,通過既定的丟包補償策略修補數(shù)據(jù),然后將修補后的數(shù)據(jù)輸入到搜索策略制定模塊,根據(jù)既定的優(yōu)化準則制定搜索策略。最后,融合中心將搜索策略傳輸?shù)絺鞲衅鹘M,各傳感器根據(jù)接收到的搜索策略重新組網(wǎng),對目標進行重新掃描。以上過程重復(fù)循環(huán),直到完成整個跟蹤任務(wù)。整個任務(wù)規(guī)劃偽代碼如下:
Mission Planning
①Fori=1 toNdo
②Input: Target Data
③ifTarget Data is losing
④ Data compensate;
⑤endif;
⑥Strategyplanning;
⑦Output: strategy;
⑧endfor;
數(shù)據(jù)丟包是指在數(shù)據(jù)傳輸時,數(shù)據(jù)不能傳輸?shù)饺诤现行幕蛑荒懿糠值貍鬏數(shù)饺诤现行摹T斐蓴?shù)據(jù)丟包的原因主要有3方面:①戰(zhàn)場復(fù)雜的環(huán)境,在實際作戰(zhàn)過程中,由于天氣、地形等復(fù)雜環(huán)境的影響,使得探測數(shù)據(jù)不能準確傳輸?shù)娜诤现行?甚至造成數(shù)據(jù)丟失;②敵方干擾,是指敵方對我方施加一定的電子干擾,影響我方的數(shù)據(jù)通信鏈路,從而造成數(shù)據(jù)丟包;③通信帶寬的限制,由于我方融合系統(tǒng)通信帶寬的固有限制,使得同一時刻只能允許特定數(shù)量的數(shù)據(jù)通過,即只有部分測量數(shù)據(jù)能夠傳輸?shù)饺诤现行??;谝陨厦枋?建立數(shù)據(jù)丟包模型。
定義隨機變量ηi來表示傳感器i的數(shù)據(jù)傳輸情況。若測量數(shù)據(jù)成功傳輸?shù)饺诤现行?則ηi=1;若測量數(shù)據(jù)沒有傳輸?shù)饺诤现行?則ηi=0。且ηt滿足伯努利方程[11],即
(1)
式中,λi為傳感器測量數(shù)據(jù)成功傳輸?shù)饺诤现行牡母怕?如圖3所示。
圖3 傳輸示意圖Fig.3 Transmission schematic
本文假設(shè)各個傳感器成功傳輸?shù)母怕适窍嗤?即λ1=λ2=…=λi=…=λn=λ。
如圖3所示,各傳感器對指定目標進行測量,并將測量數(shù)據(jù)傳回到融合中心進行融合處理,以實現(xiàn)對目標的跟蹤。設(shè)目標的狀態(tài)方程和各傳感器的非線性觀測方程[12-13]分別為
(2)
對式(2)進行線性化處理得
(3)
(4)
式中,X(tk)表示tk時刻的目標狀態(tài)向量;w(tk)是系統(tǒng)的白噪聲向量,其協(xié)方差矩陣為Q(tk);F(tk)∈Rn×n是tk時刻的狀態(tài)轉(zhuǎn)移矩陣;G(tk)∈Rn×n是tk時刻的輸入分布矩陣;Zj(tk)表示tk時刻第j個傳感器的量測向量;vj(tk)是量測噪聲,其協(xié)方差矩陣為Rj(tk);H(tk)是觀測方程的觀測矩陣噪聲;vi,vj和w相互之間統(tǒng)計獨立,且與初始狀態(tài)X(t0)無關(guān)。
當(dāng)發(fā)生數(shù)據(jù)丟包時,融合中心不能準確獲得傳感器測量的目標數(shù)據(jù)。如果直接剔除該傳感器,則由于數(shù)據(jù)缺失使得融合結(jié)果不準確,最終導(dǎo)致跟蹤精度降低。因此,本文提出了數(shù)據(jù)丟包后的補償策略。以每個傳感器為基本補償單位,分為如下兩種情況進行討論。
(1)單個傳感器跟蹤單個目標。在這種情況下,如果發(fā)生數(shù)據(jù)丟包,則融合中心將完全失去目標當(dāng)前時刻的觀測值,從而導(dǎo)致跟蹤失敗。因此,要想在數(shù)據(jù)丟包的情況下繼續(xù)保持對目標的跟蹤,必須對當(dāng)前時刻的測量數(shù)據(jù)做出合理估計。基于以上描述,本文給出了相應(yīng)的補償策略。當(dāng)單個傳感器跟蹤單個目標時,若發(fā)生數(shù)據(jù)丟包,則把該目標上一時刻對下一時刻即當(dāng)前時刻的預(yù)測值,作為當(dāng)前時刻目標測量數(shù)據(jù)的估計值,以此來替代丟包數(shù)據(jù),完成對丟包數(shù)據(jù)的重構(gòu)。并把重構(gòu)數(shù)據(jù)用于最后的數(shù)據(jù)融合處理,完成數(shù)據(jù)補償。
(5)
(2)多個傳感器跟蹤單個目標。在這種情況下,對該目標進行跟蹤的傳感器集合中,設(shè)其中一個或幾個傳感器的測量數(shù)據(jù)在傳輸過程中發(fā)生數(shù)據(jù)丟包,其他傳感器數(shù)據(jù)傳輸正常。在這種情況下,應(yīng)對發(fā)生數(shù)據(jù)丟包的傳感器的測量數(shù)據(jù)做出合理估計。根據(jù)以上描述,本文給出的補償策略是,當(dāng)某個傳感器的測量數(shù)據(jù)發(fā)生丟包時,把該目標上一時刻對下一時刻即當(dāng)前時刻的預(yù)測值,和其他正常工作的傳感器獲得的目標當(dāng)前時刻的測量值,進行加權(quán)求和,作為丟包數(shù)據(jù)的估計值,以此完成丟包數(shù)據(jù)重構(gòu)。對重構(gòu)數(shù)據(jù)進行濾波,即數(shù)據(jù)補償。
設(shè)某一時刻tk有n個傳感器同時跟蹤一個目標。在測量數(shù)據(jù)傳輸?shù)饺诤现行牡倪^程中,傳感器ni(i=1,2,…,n)發(fā)生數(shù)據(jù)丟包,其他傳感器的測量數(shù)據(jù)分別為Znj(tk),j=1,2,…,n且j≠i。對于傳感器ni,其上一時刻tk-1預(yù)測的當(dāng)前時刻的狀態(tài)為Xni(tk),則最終得到的傳感器ni的測量數(shù)據(jù)為該預(yù)測狀態(tài)值與其他傳感器的當(dāng)前測量值的加權(quán)求和,即
κ1Zn1(tk)+κ2Zn2(tk)+…+
κiXni(tk)+…+κnZnn(tk)
(6)
式中,κi為權(quán)值,滿足
0≤κi≤1
(7)
綜上,可以得到某傳感器用于最終跟蹤融合濾波的觀測數(shù)據(jù)為
(8)
序貫擴展卡爾曼濾波是用多個傳感器的測量值對目標的狀態(tài)進行估計的一種融合算法[14]。其基本思想是:對每一個傳感器運行一個獨立的擴展卡爾曼濾波器,對其進行排序,然后依次將前一個濾波器的狀態(tài)估計值作為下一個濾波器的狀態(tài)預(yù)測值。本文在第2.2節(jié)給出的丟包模型下,推導(dǎo)出數(shù)據(jù)丟包環(huán)境下的序貫擴展卡爾曼濾波模型。
根據(jù)上節(jié)給出的目標狀態(tài)方程和觀測方程,首先給出狀態(tài)一步預(yù)測值x(tk)和預(yù)測誤差協(xié)方差矩陣P(tk)為
x(tk)=F(tk-1,tk)x(tk-1)
P(tk)=F(tk-1,tk)P(tk-1)FT(tk-1,tk)+…+
G(tk-1,tk)Q(tk-1,tk)GT(tk-1,tk)
(9)
設(shè)某一時刻有n個傳感器對某一目標進行跟蹤測量,下面給出相應(yīng)的序貫狀態(tài)估計:
x(tk)=(x(tk))n,i∈n
(10)
(11)
狀態(tài)估計協(xié)方差矩陣P(tk)為
(12)
Shannon用發(fā)生概率的倒數(shù)來表示一個事件的信息,假設(shè)每一個事件的發(fā)生概率為pi,則信息定義[15]為
ΔI(pi)=lg(1/pi)=-lg(pi)
(13)
那么信息熵定義為信息的期望值,即
(14)
信息熵只描述了系統(tǒng)的不確定性,并不能反映信息量的大小。因此,用量測前后信息熵的差值即信息增量來表征信息量的變化,即
I=H(k|k-1)-H(k|k)
(15)
跟蹤任務(wù)下,目標的不確定性可以用目標量測前后的濾波協(xié)方差矩陣表示,由此可得跟蹤任務(wù)下信息增量的形式為
(16)
式中,‖cP‖為協(xié)方差陣的矩陣范數(shù)
在實際計算中,只需要信息增量的相對大小,并不需要其絕對值。因此,可以用矩陣范數(shù)的變化來近似表示信息增量,即
I=‖cP(k|k-1)‖-‖cP(k|k)‖
(17)
為簡化計算,可以用矩陣的跡替代矩陣范數(shù)近似計算,即
I=tr{cP(k|k-1)}-tr{cP(k|k)}
(18)
設(shè)有M個傳感器同時跟蹤N個目標。M個傳感器組網(wǎng)對目標進行跟蹤,共有2M-1個子傳感器網(wǎng)絡(luò)Si。i∈2M-1跟蹤策略即在充分考慮目標威脅度值的同時,盡量減少目標狀態(tài)的不確定性,即使得每次量測前后的信息增量最大。因此,以目標威脅度值為權(quán)值,結(jié)合得到的信息增量,得到基于信息熵的傳感器跟蹤管理任務(wù)模型為
(19)
式中,mi為目標i的威脅度值;Iimax為傳感器組網(wǎng)對目標i進行跟蹤測量所能獲得的最大信息增量;si表示子傳感器網(wǎng)絡(luò);[si]表示組成子傳感器網(wǎng)絡(luò)si的傳感器的個數(shù)。約束條件表示同一時間所有傳感器都要工作,并且對目標i應(yīng)至少有一個傳感器對其進行照射。
本文基于二值粒子群算法,設(shè)計了求解上述優(yōu)化模型的算法。傳感器對目標的照射只有兩種情況,照射或者不照射。設(shè)照射為1,不照射為0,則每個粒子的每一位的取值只有兩種情況,因此本文選取二值離散粒子群算法對問題進行求解。計粒子種群的大小為N=20。
由上面假設(shè),二值離散粒子群算法的計算步驟如下:
步驟1初始化粒子群,對每個粒子進行二進制編碼。
步驟2計算每個粒子的適應(yīng)度值。本文中的適應(yīng)度值為傳感器對目標配對所獲得的信息增量。
步驟3更新個體最優(yōu)Pbest及全局最優(yōu)Gbest
(21)
(22)
其中
(23)
步驟4更新速度,對每個粒子的每一位更新速度。首先計算每個粒子的每一位的速度
(24)
然后利用sigmoid函數(shù)將粒子速度映射到[0,1],即
Sig(vij)=1/(1+exp(-vij))
(25)
步驟5更新粒子位置:
(26)
式中,rand()是一個隨機數(shù),從區(qū)間[0,1]產(chǎn)生。
步驟6如果滿足條件,則輸出全局最優(yōu)粒子值,并輸出其對應(yīng)的適應(yīng)度值。否則轉(zhuǎn)到步驟2,重復(fù)迭代。
算法流程圖如圖4所示。
仿真中,假設(shè)由5個傳感器對3個運動目標進行跟蹤。傳感器為機載傳感器,載機在指定區(qū)域作盤旋機動,對入侵的3個目標進行跟蹤,并將測量的到的目標數(shù)據(jù)傳遞給融合中心,由融合中心制定搜索編隊策略,然后傳感器根據(jù)搜索策略重新進行測量。目標的初始數(shù)據(jù)由地面或空中融合中心傳輸給跟蹤系統(tǒng)。假設(shè)笛卡爾坐標系下目標的機動模型為
(27)
圖4 算法流程圖Fig.4 Algorithm flow
各目標的初始位置和速度參數(shù)如表1所示。
表1 目標初始參數(shù)
傳感器在極坐標下的測量模型為
(28)
以傳感器的位置為坐標原點,各傳感器在笛卡爾坐標系下的初始位置如表2所示。
表2 傳感器初始位置
各目標的狀態(tài)轉(zhuǎn)移模型為
F=[1,t,0,0;0,1,0,0,0;0,0,1,1;0,0,0,1]
初始協(xié)方差為
P=[100,0,0,0;0,0,0,0;0,0,100,0;0,0,0,0]
初始狀態(tài)估計值為
仿真次數(shù)為100,采樣周期為t=1 s。
正常情況下,傳感器將測量得到的目標數(shù)據(jù)傳輸?shù)饺诤现行?融合中心對目標進行濾波融合,并根據(jù)第3節(jié)提出的優(yōu)化準則,制定新的搜索策略。傳感器接收到新的搜索策略后,重新組網(wǎng),繼續(xù)對目標進行探測,直到完成跟蹤任務(wù),具體仿真結(jié)果如圖5所示。
圖5 數(shù)據(jù)接收正常時各目標仿真圖Fig.5 Simulation chart of each target when data receives normal
圖5給出了傳感器對各個目標的分配策略,并給出了整個過程中各目標濾波均方差的變化情況。由圖5可知,各目標的融合曲線很快收斂到穩(wěn)定值,穩(wěn)定后的濾波均方差小于10,完全可以滿足實際作戰(zhàn)需要。
實際戰(zhàn)場環(huán)境中,由于電磁干擾等不確定性因素的存在,造成傳感器的測量數(shù)據(jù)在傳輸?shù)饺诤现行牡倪^程中發(fā)生數(shù)據(jù)丟包。假設(shè)在40~50 s時間段內(nèi),傳感器1和傳感器2發(fā)生數(shù)據(jù)丟包,其他條件不變,得到仿真結(jié)果如圖6所示。
圖6 數(shù)據(jù)丟包仿真結(jié)果Fig.6 Data packet loss simulation results
圖6分別給出了目標1、目標2、目標3在數(shù)據(jù)丟包情況下的融合曲線和局部放大圖,以及數(shù)據(jù)傳輸正常和數(shù)據(jù)丟包情況下傳感器對目標的分配情況。通過目標數(shù)據(jù)丟包放大圖可以看出,傳感器1和傳感器2發(fā)生數(shù)據(jù)丟包對各個目標均造成了不同程度的影響。通過對比丟包前后的仿真圖可知,在數(shù)據(jù)丟包的40~50 s時間段內(nèi),傳感器1和傳感器2較少照射目標1和目標2,因此,目標1和目標2所受影響較小,丟包后融合曲線雖然發(fā)散,但并不是很大;在該時間段內(nèi),傳感器1和傳感器2主要照射目標3,因此數(shù)據(jù)丟包對目標3的影響較大。40~50 s內(nèi),融合曲線發(fā)散很大。
通過上面仿真可知,當(dāng)發(fā)生數(shù)據(jù)丟包時,如果不進行補償,最終的融合曲線將出現(xiàn)一定程度的發(fā)散,甚至?xí)?dǎo)致目標丟失,因此必須對丟包數(shù)據(jù)進行補償。根據(jù)本文提出的補償策略,給出丟包補償仿真結(jié)果如圖7所示。
圖7 丟包補償仿真結(jié)果Fig.7 Packet loss compensation simulation results
圖7(a)~圖7(e)分別給出了各目標在丟包補償策略下的融合曲線和局部放大圖。對于目標1和目標2,雖然受數(shù)據(jù)丟包影響較小,但通過局部放大圖可以看出,補償后的融合曲線相對于補償之前的融合曲線仍具有極好的補償效果;對于受數(shù)據(jù)丟包影響較大的目標3,補償策略具有顯著的效果,不僅抑制了濾波曲線的發(fā)散,同時最終的融合曲線也非常接近正常情況下的融合曲線。由仿真結(jié)果可以看出,本文提出的補償策略具有很好的補償效果,可以有效的緩解短時間內(nèi)數(shù)據(jù)丟包對最終融合結(jié)果所造成的不良影響,保證一定的目標跟蹤精度。
圖8和圖9分別給出了丟包補償前后傳感器對目標的分配情況。對比丟包補償前后傳感器對目標的分配情況。在發(fā)生數(shù)據(jù)丟包的40~50 s時間段內(nèi),傳感器1和傳感器2更多地分配給目標1和目標2,而不是像丟包補償之前那樣全部分配給目標3,這樣就有效地減小了傳感器1和傳感器2的數(shù)據(jù)丟包對目標3融合結(jié)果的影響,即通過其他目標的參與,使得更多的目標來分擔(dān)數(shù)據(jù)丟包帶來的損失,而不是只讓一個目標來承擔(dān)。對于目標3,在40~50 s時間段內(nèi),補償之后傳感器1和傳感器2的照射時間相對于補償之前大幅度減小,同時,剩余正常工作的傳感器在該時間段內(nèi)的照射時間相應(yīng)增加。從而最終保證在數(shù)據(jù)丟包情況下,各目標的融合結(jié)果雖然受到一點影響,但是仍能保持在一定精度范圍內(nèi),有效抑制了濾波發(fā)散,保證了目標的有效跟蹤。
圖8 數(shù)據(jù)丟包下傳感器對目標的分配情況Fig.8 Distribution of the sensor to the target under the data packet loss
圖9 丟包補償下傳感器對目標的分配情況Fig.9 Distribution of the sensor to the target under thepacket loss compensation
本文針對實際戰(zhàn)場中復(fù)雜的電磁環(huán)境,首先分析了實際戰(zhàn)場環(huán)境中傳感器數(shù)據(jù)丟包對最終數(shù)據(jù)融合造成的影響,給出了數(shù)據(jù)丟包模型,然后根據(jù)兩種不同的數(shù)據(jù)丟包模型,分別給出了數(shù)據(jù)丟包補償策略。基于信息熵理論建立了數(shù)據(jù)丟包環(huán)境下的多傳感器跟蹤任務(wù)管理模型,并給出了基于二值粒子群的求解算法。最后通過仿真驗證證明了本文提出了數(shù)據(jù)補償策略的合理性和有效性,可以在實際戰(zhàn)場環(huán)境中減小數(shù)據(jù)丟包帶來的損失,有效抑制濾波發(fā)散,將最終融合結(jié)果保持在一定精度。