祝 武,彭冬亮,任 剛,呂鵬飛
(1.通信信息傳輸與融合技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,杭州 310018;2.杭州電子科技大學(xué),杭州 310018)
Rényi信息增量和協(xié)方差聯(lián)合控制的多傳感器管理算法*
祝 武1,2,彭冬亮1,2,任 剛1,2,呂鵬飛1,2
(1.通信信息傳輸與融合技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室,杭州 310018;2.杭州電子科技大學(xué),杭州 310018)
針對(duì)目標(biāo)跟蹤中雷達(dá)組網(wǎng)場(chǎng)景下多傳感器管理問(wèn)題,結(jié)合Rényi信息增量和協(xié)方差兩種算法各自特性,利用并行處理的思想提出了一種基于Rényi信息增量和協(xié)方差聯(lián)合控制的傳感器管理算法。在具體仿真設(shè)計(jì)環(huán)節(jié),分為傳感器跟蹤能力大于目標(biāo)數(shù)和傳感器跟蹤能力小于目標(biāo)數(shù)兩種場(chǎng)景。仿真結(jié)果表明該算法在單目標(biāo)勻速、多目標(biāo)勻加速等多數(shù)場(chǎng)景下能夠?qū)δ繕?biāo)進(jìn)行有效跟蹤,同時(shí)降低了傳感器的切換頻率,具有更好的實(shí)時(shí)性。
多傳感器管理,Rényi信息增量,協(xié)方差控制,并行處理
多傳感器管理核心是依據(jù)目標(biāo)信息的變化,實(shí)時(shí)調(diào)整傳感器系統(tǒng)中傳感器工作方式及參數(shù),以期獲得整個(gè)系統(tǒng)度量特性(如檢測(cè)概率、跟蹤精度、識(shí)別概率等)的最優(yōu)值從而完成特定任務(wù)[1]。雷達(dá)組網(wǎng)下的傳感器資源管理是基于不同任務(wù)合理分配傳感器資源以期獲得目標(biāo)的最優(yōu)狀態(tài)信息。信息融合中傳感器管理的核心是融合處理,在具體的作戰(zhàn)系統(tǒng)中通常由各種算法來(lái)實(shí)現(xiàn)。目前解決多傳感器管理的方法主要有:基于協(xié)方差控制的方法[2],基于信息論的方法[3],基于規(guī)劃論和智能優(yōu)化算法的方法[4]。
傳統(tǒng)協(xié)方差控制的傳感器管理方法主要利用當(dāng)前目標(biāo)狀態(tài)下的誤差協(xié)方差和期望協(xié)方差組建目標(biāo)函數(shù)對(duì)雷達(dá)組網(wǎng)下的傳感器資源進(jìn)行分配,通常能夠有效保持目標(biāo)的跟蹤精度,但協(xié)方差控制中目標(biāo)期望協(xié)方差由人為給出容易存在偏差切,當(dāng)目標(biāo)跟蹤精度要求過(guò)嚴(yán)時(shí)易導(dǎo)致目標(biāo)函數(shù)無(wú)解或不存在最優(yōu)解[2];其次算法通常在傳感器資源充足的情況下得到理想傳感器管理方案,沒(méi)有考慮當(dāng)傳感器資源有限時(shí)傳感器跟蹤能力限制的問(wèn)題。Rényi信息增量通過(guò)比較概率密度函數(shù)的近似程度來(lái)表示當(dāng)前狀態(tài)下信息的差異,因而更加強(qiáng)調(diào)某個(gè)局部信息,從而能夠根據(jù)目標(biāo)的機(jī)動(dòng)情況實(shí)時(shí)分配傳感器資源,但當(dāng)傳感器系統(tǒng)的最大跟蹤能力大于目標(biāo)數(shù)時(shí),容易造成傳感器資源的浪費(fèi)[3]。鑒于此,本文結(jié)合兩種算法各自的特性,利用“Rényi信息增量”和“協(xié)方差”聯(lián)合控制的思想相互驗(yàn)證并利用目標(biāo)跟蹤精度進(jìn)一步完成傳感器資源的分配。
1.1 協(xié)方差算法描述
以協(xié)方差控制角度研究傳感器管理問(wèn)題其主要通過(guò)遍歷所有傳感器組來(lái)選擇與期望協(xié)方差最靠近的實(shí)際協(xié)方差組合作為當(dāng)前狀態(tài)傳感器組合[5-6]。本文結(jié)合規(guī)劃類(lèi)思想設(shè)置其最優(yōu)的目標(biāo)函數(shù)為:
協(xié)方差控制的傳感器算法能夠在維持有效跟蹤精度的前提下,合理分配現(xiàn)有的傳感器資源,但該算法并沒(méi)有考慮到外界因素對(duì)量測(cè)誤差的影響,容易引起跟蹤性能下降。同時(shí)各時(shí)刻在最優(yōu)組合的選擇上并無(wú)關(guān)聯(lián)性,因此,前后時(shí)刻使用的傳感器組時(shí)常不同,這樣頻繁地切換傳感器組合會(huì)在一定程度上造成系統(tǒng)的負(fù)擔(dān)。
1.2 Rényi信息增量
Rényi熵是Shannon熵的廣義形式,用以描述一個(gè)事件的信息,反映了系統(tǒng)信息的高階特性。假設(shè)先、后驗(yàn)概率密度函數(shù) p0、p1服從高斯分布,基于Shannon熵的信息增量[7]為:

Rényi信息增量被定義為:

若采用以卡爾曼濾波為代表的濾波算法,當(dāng)?shù)玫侥繕?biāo)狀態(tài)估計(jì)的均值和協(xié)方差時(shí),Rényi信息增量的計(jì)算公式可簡(jiǎn)化為[7]:

其中參數(shù)選取α=0.5可獲得較好的跟蹤性能[7]。
針對(duì)雷達(dá)組網(wǎng)系統(tǒng)中目標(biāo)跟蹤問(wèn)題,因?yàn)閭鞲衅鞯牟町惢?,不同傳感器?duì)目標(biāo)量測(cè)后的后驗(yàn)概率密度也存在差異。因此,在當(dāng)前時(shí)刻選擇最優(yōu)的傳感器進(jìn)行目標(biāo)跟蹤時(shí),采用基于Rényi信息增量的傳感器管理方法尋找tk時(shí)刻為系統(tǒng)帶來(lái)最多信息的傳感器jtk,如果不滿(mǎn)足則尋找?guī)?lái)次優(yōu)的傳感器,直到滿(mǎn)足要求。其目標(biāo)函數(shù)可描述為:

傳統(tǒng)的Rényi信息增益?zhèn)鞲衅鞴芾硭惴ㄆ禺?dāng)前狀態(tài)下為系統(tǒng)帶來(lái)最大信息增益的傳感器組合,容易造成部分目標(biāo)被多個(gè)傳感器跟蹤,而某些目標(biāo)未被跟蹤,協(xié)方差控制效果并不理想[4]。而協(xié)方差控制算法是從控制每個(gè)目標(biāo)盡可能接近其期望協(xié)方差角度來(lái)實(shí)現(xiàn)傳感器的目標(biāo)分配,但根據(jù)周文輝給出的Raccati方程的推導(dǎo),當(dāng)誤差協(xié)方差矩陣保持不變時(shí)算法分配下的最優(yōu)傳感器組合Dopt(tk)也是固定的,導(dǎo)致特定的傳感器組合一直跟蹤固定的目標(biāo),因此,降低了跟蹤精度和傳感器資源利用率。本文結(jié)合兩種算法各自的特點(diǎn),利用“Rényi信息增量”和“協(xié)方差”兩個(gè)并行目標(biāo)函數(shù)來(lái)完成傳感器資源的分配,該方法通過(guò)每次從組網(wǎng)傳感器中選擇“最優(yōu)”的傳感器組進(jìn)行目標(biāo)跟蹤,而當(dāng)兩者形成的傳感器組不同時(shí),利用跟蹤精度進(jìn)行傳感器組合的微調(diào),若符合當(dāng)前的跟蹤精度則當(dāng)前的傳感器組是最優(yōu)選擇,若不滿(mǎn)足則在當(dāng)前傳感器組的基礎(chǔ)上適當(dāng)?shù)匚⒄{(diào)傳感器組合以期達(dá)到合適的效果。
2.1 算法思想及流程
圖1表示基于Rényi信息增量和協(xié)方差聯(lián)合控制的多傳感器管理算法基本思想:一方面根據(jù)協(xié)方差控制原理,為當(dāng)前狀態(tài)選擇使目標(biāo)函數(shù)最小的最優(yōu)傳感器分配策略;另一方面利用并行處理的思想計(jì)算當(dāng)前狀態(tài)下為系統(tǒng)帶來(lái)最多信息的傳感器組合,然后驗(yàn)證兩種算法下的式(1)、式(7)最優(yōu)傳感器組合是否相同,若不相同則利用誤差協(xié)方差矩陣判斷是否滿(mǎn)足跟蹤精度,在后續(xù)的傳感器分配決策時(shí)不必重新分配傳感器,而是利用上一時(shí)刻的傳感器分配方案,在當(dāng)前傳感器分配方案基礎(chǔ)上快速確定一組能夠有效跟蹤目標(biāo)的傳感器組合。

圖1 算法流程圖
2.2 跟蹤精度判斷
當(dāng)偏差矩陣△P為正定矩陣,亦即其所有特征值均為正時(shí)濾波協(xié)方差所表示的各元素的誤差均小于期望值,則說(shuō)明滿(mǎn)足跟蹤精度,而當(dāng)△P非正定時(shí),則無(wú)法作出此判斷。同時(shí)在不影響跟蹤精度的前提下盡量降低計(jì)算量和傳感器切換頻率。本文為偏差矩陣特征值的判斷設(shè)定了一個(gè)接近于零的上下限閾值。即使特征值不全為正,但只要它們均在零附近的一個(gè)較小的范圍內(nèi),亦可認(rèn)為滿(mǎn)足精度需求。當(dāng)特征值過(guò)大時(shí),表示誤差遠(yuǎn)遠(yuǎn)小于期望值,則可以從當(dāng)前傳感器組中減少一個(gè)傳感器再進(jìn)行觀測(cè);同理,當(dāng)特征值過(guò)小時(shí),可以增加一個(gè)傳感器。
2.3 量綱變換
協(xié)方差矩陣中各元素的量綱是不同的,采用無(wú)量綱變換方法[10-12]。設(shè)和分別為期望協(xié)方差矩陣Pd(tk)的對(duì)角線(xiàn)元素,則無(wú)量綱變規(guī)則如下:

2.4 序貫卡爾曼濾波
在多個(gè)傳感器工作時(shí),針對(duì)時(shí)間上無(wú)法完全同步的問(wèn)題采用序貫濾波的方法,按時(shí)間或優(yōu)先級(jí)順序,依次對(duì)各傳感器獲得的觀測(cè)進(jìn)行濾波,這樣不僅能夠解決時(shí)間同步問(wèn)題,更有利于目標(biāo)跟蹤的連續(xù)性。對(duì)于tk時(shí)刻有J個(gè)傳感器的傳感器組Di,每個(gè)傳感器獲得的量測(cè)值可以當(dāng)作預(yù)測(cè)時(shí)間為零的新的量測(cè)信息,然后序貫地加以濾波處理如下[13]:


本文提出基于Rényi信息增益和協(xié)方差聯(lián)合控制傳感器管理算法,并以跟蹤精度(位置均方誤差)、傳感器組切換率作為評(píng)價(jià)算法性能的指標(biāo)。
仿真場(chǎng)景1:?jiǎn)文繕?biāo)CV運(yùn)動(dòng)模型。
仿真對(duì)象以巡航導(dǎo)彈為例,巡航導(dǎo)彈按照規(guī)劃或臨時(shí)指定的路線(xiàn)飛行,除了上升下降轉(zhuǎn)彎等情況,處于勻速平飛狀態(tài)較多,所以用CV模型仿真[14]。
假設(shè)目標(biāo)在[30 km×30 km]平面內(nèi)運(yùn)動(dòng),用3種類(lèi)型共10部雷達(dá)組網(wǎng)對(duì)其進(jìn)行跟蹤,最大探測(cè)距離為200 km,量測(cè)噪聲標(biāo)準(zhǔn)差如表1所示。

表1 量測(cè)噪聲標(biāo)準(zhǔn)差
將本文提出的基于Rényi信息增益和協(xié)方差聯(lián)合控制傳感器管理算法分別與協(xié)方差算法和Rényi信息增益算法進(jìn)行比較,仿真結(jié)果如圖2所示。
由圖2分析可知,當(dāng)目標(biāo)的運(yùn)動(dòng)模型為CV模型時(shí),協(xié)方差算法雖然跟蹤精度較好,但傳感器切換率較高;Rényi信息增益算法傳感器切換率相對(duì)減少,但使用傳感器資源較多,同時(shí)位置均方誤差偏大;本文算法結(jié)合兩種算法各自的特性,保持了良好跟蹤精度的同時(shí)又能適時(shí)地調(diào)整傳感器分配策略。

圖2 CV模型仿真結(jié)果
仿真場(chǎng)景2:多目標(biāo)CA運(yùn)動(dòng)模型。
針對(duì)低動(dòng)態(tài)臨近空間目標(biāo)(如平流層飛艇,浮空平臺(tái)等),隱身目標(biāo)等機(jī)動(dòng)性較強(qiáng)的特點(diǎn),以CA模型仿真。
由3個(gè)不同類(lèi)型雷達(dá)隨機(jī)分布在[30km×30km]平面區(qū)域內(nèi)組成探測(cè)網(wǎng)絡(luò)對(duì)4個(gè)目標(biāo)進(jìn)行跟蹤,3種雷達(dá)的數(shù)據(jù)獲取概率為0.6,0.7,0.8,觀測(cè)噪聲均為閃爍噪聲對(duì)應(yīng)的觀測(cè)距離誤差分別為:20 m,250 m,300 m,閃爍效應(yīng)系數(shù)分別為0.04,0.2,0.4.過(guò)程噪聲服從零均值的高斯白噪聲且相獨(dú)立。同時(shí)考慮到前期粗略跟蹤后期精確跟蹤的參考因素,將期望協(xié)方差前半段變化較大而后半段變化較小。目標(biāo)采用CA模型,目標(biāo)初始狀態(tài)分別為T(mén)1=[1 000 200 1 500 350 5 5]T,T2=[3 000-800 2 500 190 9 7]T,T3=[15 300-400 400 200 50 50]T,T4=[230 11 500 200 340 70 20]T;仿真時(shí)間110 s,采樣周期為1 s。

圖3 協(xié)方差傳感器分配分配情況

圖4 Rényi信息增益?zhèn)鞲衅鞣峙淝闆r

圖5 Rényi信息增益和協(xié)方差控制傳感器分配情況

圖6 4個(gè)目標(biāo)位置均方誤差圖
圖4中由于Rényi信息增益算法追求局部信息增量最大,在此仿真場(chǎng)景中由于傳感器跟蹤能力的限制,引起目標(biāo)跟蹤過(guò)程中出現(xiàn)失衡的現(xiàn)象,由圖6中可知該算法犧牲了對(duì)目標(biāo)3的跟蹤精度,由圖中各目標(biāo)位置均方誤差圖可知,本文算法分別相對(duì)協(xié)方差和Rényi信息增益算法跟蹤精度有了很大提高,但應(yīng)該指出的是該算法相對(duì)于圖2單目標(biāo)勻速運(yùn)動(dòng)而言,在多目標(biāo)勻加速運(yùn)動(dòng)場(chǎng)景中效果并不理想。
本文在傳統(tǒng)Rényi信息增益的傳感器管理算法和協(xié)方差控制傳感器管理算法的基礎(chǔ)上,重點(diǎn)闡述了基于兩者聯(lián)合控制的傳感器管理算法并給出了整個(gè)算法流程。在具體仿真設(shè)計(jì)環(huán)節(jié),分為傳感器跟蹤能力大于目標(biāo)數(shù)和傳感器跟蹤能力小于目標(biāo)數(shù)兩種場(chǎng)景。該算法相比于傳統(tǒng)的Rényi信息增益算法和協(xié)方差控制算法,在單目標(biāo)勻速、多目標(biāo)勻加速等多數(shù)場(chǎng)景下保持了目標(biāo)的跟蹤精度,能夠?qū)δ繕?biāo)進(jìn)行有效跟蹤。同時(shí)降低了傳感器的切換頻率,具有更好的實(shí)時(shí)性。
[1]劉先省,申石磊,潘泉.傳感器管理及方法綜述[J].電子學(xué)報(bào),2002,30(3):394-398.
[2]KALANDROS M.Covariance control for multisensor systems[J].Aerospace and Electronic Systems,IEEE Transactions on,2002,38(4):1138-1157.
[3]劉先省,周林,杜曉玉.基于目標(biāo)權(quán)重和信息增量的傳感器管理方法[J].電子學(xué)報(bào),2005,33(9):1683-1687.
[4]YANG H Y,YOU Z,WANG L.Dynamic sensor management for distributed tracking in collaborative network[J].Journal of South China University ofTechnology,2012,35(5);1000-1007.
[5]LIU Y,WANG H,HOU C.UKF based nonlinear filtering using minimum entropy criterion[J].Signal Processing IEEE Transactions on,2013,61(20):4988-4999.
[6]周文輝,胡衛(wèi)東,余安喜,等.基于協(xié)方差控制的集中式傳感器分配算法研究[J].電子學(xué)報(bào),2004,31(B12):2158-2162.
[7]劉欣怡,趙誠(chéng),單甘霖,等.面向目標(biāo)跟蹤的基于Rényi信息增量多的傳感器管理[J].信息與控制,2015,44(2):184-189.
[8]KUSCHEL H,HECKENBACH J,APPEL R.Countering stealth with passive,multi-static,low frequency radars[J]. IEEE Aerospace and Electronic Systems Magazine,2010,9(25):11-17.
[9]楊秀珍,何友,鞠傳文.基于跟蹤精度控制的傳感器管理方法研究[J].電光與控制,2005,12(1):9-11.
[10]KALANDROS M,PAO L Y.Controlling target estimate covariance in centralized multisensor systems[C]//American Control Conference,1998.Proceedings of the 1998.IEEE,1998,5:2749-2753.
[11]HERO A O,COCHRAN D.Sensor management:Past,present,and future[J].Sensors Journal,IEEE,2011,11(12):3064-3075.
[12]周文輝.相控陣?yán)走_(dá)及組網(wǎng)跟蹤系統(tǒng)資源管理技術(shù)研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué),2004.
[13]馬照英,楊莘元,楊雷,等.機(jī)動(dòng)目標(biāo)跟蹤中的序貫濾波[J].應(yīng)用科技,2006,33(6):49-50,109.
[14]巴宏欣,何心怡,何勇.基于網(wǎng)絡(luò)中心站的信息融合結(jié)構(gòu)研究[J].艦船科學(xué)技術(shù),2012,11(34):89-93.
Multi Sensor Management Algorithm Based on Joint Control of Rényi Information Increment and Covariance
ZHU Wu1,2,PENG Dong-liang1,2,REN Gang1,2,LYU Peng-fei1,2
(1.Fundamental Science on Communication Information Transmission and Fusion Technology Laboratory,Hangzhou 310018,China;2.Hangzhou Dianzi University,Hangzhou 310018,China)
Based on target tracking radar networking scenario multisensor management issues,combining Renyi information increment and covariance characteristics of each algorithm,a sensor management algorithm based on joint Renyi information gain and covariance control using the idea of parallel processing is proposed.In specific aspects of the simulation design,sensor tracking ability is greater than the number of targets and sensors tracking ability and less than the target number of scenes.The simulation results show that the proposed algorithm can effectively track the target in most scenes,such as uniform speed,multi target uniform acceleration and so on.At the same time,the switching frequency of the sensor is better.
multisensor management,Rényi information increments,covariance control,parallel processing
TP953
A
1002-0640(2017)05-0042-05
2016-02-17
2016-05-17
國(guó)家自然科學(xué)基金資助項(xiàng)目(61174024)
祝 武(1991- ),男,安徽亳州人,碩士研究生。研究方向:信息融合,傳感器管理。