龐策,單甘霖,*,段修生
(1.陸軍工程大學(xué)石家莊校區(qū) 電子與光學(xué)工程系,石家莊050003; 2.石家莊鐵道大學(xué) 機(jī)械工程學(xué)院,石家莊050043)
在目標(biāo)探測(cè)過(guò)程中,如何尋找一種有效的傳感器管理方法使傳感器網(wǎng)絡(luò)發(fā)揮最大效用,一直是軍事方面研究的熱點(diǎn)和難點(diǎn)問(wèn)題。目前,主要存在3類基于貝葉斯理論的傳感器管理方法,即:基于任務(wù)的傳感器管理方法[1-3]、基于信息論的傳感器管理方法[4-6]、基于風(fēng)險(xiǎn)理論的傳感器管理方法[7-9]。
在以往對(duì)傳感器管理問(wèn)題研究中,并不區(qū)分目標(biāo)種類,而在對(duì)目標(biāo)攔截的作戰(zhàn)背景下,探明目標(biāo)類型至關(guān)重要,因?yàn)獒槍?duì)不同的目標(biāo)后應(yīng)對(duì)措施也應(yīng)不同,例如當(dāng)目標(biāo)為偵察機(jī)時(shí),即可采取干擾措施也可發(fā)射導(dǎo)彈攔截,甚至在威脅不大的情況下保持一定預(yù)警即可,而當(dāng)目標(biāo)為導(dǎo)彈時(shí),應(yīng)發(fā)射導(dǎo)彈攔截。由此,針對(duì)不同目標(biāo)探測(cè)情況下的代價(jià)函數(shù)[10]不同,傳感器管理模型也應(yīng)有所區(qū)別。此外,在目標(biāo)來(lái)襲過(guò)程中,敵方會(huì)采取電子干擾等措施,探測(cè)到的目標(biāo)中通常摻雜著虛假目標(biāo),在傳感器資源十分珍貴有限的情況下,對(duì)這些目標(biāo)探測(cè)必定造成資源浪費(fèi);此外,在判定來(lái)襲目標(biāo)為導(dǎo)彈之后,應(yīng)當(dāng)通過(guò)武器系統(tǒng)對(duì)目標(biāo)攔截,若對(duì)虛假目標(biāo)攔截必定同時(shí)造成武器資源浪費(fèi)。
本文主要研究傳感器同時(shí)對(duì)目標(biāo)識(shí)別跟蹤背景下的傳感器管理方法。首先建立風(fēng)險(xiǎn)理論、貝葉斯理論和證據(jù)理論的目標(biāo)識(shí)別模型;隨后考慮邊跟蹤邊識(shí)別的情況,建立跟蹤情況下的目標(biāo)識(shí)別模型,并對(duì)模型進(jìn)行理論分析,在模型求解過(guò)程中提出一種基于多Agent分布計(jì)算理論的分布式算法;最后通過(guò)仿真,驗(yàn)證了本文方法、模型和算法的有效性、可行性。
本文將風(fēng)險(xiǎn)定義為不確定性事件發(fā)生后帶來(lái)的損失與該事件發(fā)生的概率乘積。將來(lái)襲目標(biāo)分為兩類,一類是具有攻擊性的真實(shí)導(dǎo)彈目標(biāo)C(1),另一類是虛假目標(biāo)C(2)。當(dāng)判定目標(biāo)為C(1)時(shí),我方將發(fā)射導(dǎo)彈攔截,則存在的風(fēng)險(xiǎn)為R(1)=c(1)p(2),其中,c(1)為發(fā)射導(dǎo)彈產(chǎn)生的消耗,p(2)為k時(shí)刻目標(biāo)類型為C(2)的概率。當(dāng)判定目標(biāo)為C(2)時(shí),存在的風(fēng)險(xiǎn)為R(2)=c(2)p(1),其中,c(2)為敵方導(dǎo)彈擊中我方設(shè)施后帶來(lái)的損失,p(1)為k時(shí)刻目標(biāo)類型為C(1)的概率。
我方在作決策過(guò)程中,遵循風(fēng)險(xiǎn)最低原則,將風(fēng)險(xiǎn)定義為
對(duì)目標(biāo)類型的判斷為C=arg R。
在傳感器si獲得觀測(cè)值后,si獲得的關(guān)于k+1時(shí)刻目標(biāo)tj類型的后驗(yàn)概率為
式中:K為證據(jù)之間的沖突概率。
目標(biāo)tj的運(yùn)動(dòng)狀態(tài)狀態(tài)轉(zhuǎn)移矩陣為
式中:T為采樣時(shí)間,本文取T=1 s。
在k+1時(shí)刻,目標(biāo)tj的狀態(tài)為式中:W 為過(guò)程演化噪聲,為均值為0的高斯白噪聲。
協(xié)方差矩陣為式中:σx、σy為噪聲的功率譜密度。
在k時(shí)刻傳感器si對(duì)目標(biāo)tj的觀測(cè)為
狀態(tài)觀測(cè)矩陣為
將上述極坐標(biāo)轉(zhuǎn)化為Cartesian坐標(biāo)系坐標(biāo),有
對(duì)模型進(jìn)行線性近似,觀測(cè)矩陣為
此時(shí),目標(biāo)坐標(biāo)協(xié)方差在Cartesian坐標(biāo)系坐標(biāo)中的協(xié)方差矩陣為
給定k=0時(shí)刻目標(biāo)tj的初始狀態(tài)Xj0,及其均值E()=u0,協(xié)方差矩陣P0=E[(-u0)·(-u0)T]。
式中:Hi、Ri分別為傳感器si觀測(cè)矩陣、觀測(cè)噪聲矩陣。
目標(biāo)識(shí)別的過(guò)程是在目標(biāo)跟蹤的過(guò)程中進(jìn)行的,在目標(biāo)跟蹤過(guò)程中,存在目標(biāo)丟失的風(fēng)險(xiǎn),同時(shí)考慮目標(biāo)跟蹤與目標(biāo)識(shí)別,建立風(fēng)險(xiǎn)函數(shù),有
此時(shí),有
圖1 風(fēng)險(xiǎn)值分析Fig.1 Analysis of value-at-risk
由圖1可知,當(dāng)目標(biāo)為虛假目標(biāo)時(shí),即p(1)=0,無(wú)論目標(biāo)丟失概率為何值,風(fēng)險(xiǎn)值均為0;當(dāng)目標(biāo)為導(dǎo)彈時(shí),即p(1)=1,目標(biāo)丟失概率越低,風(fēng)險(xiǎn)值越低;目標(biāo)丟失概率越高,風(fēng)險(xiǎn)值越高,模型與實(shí)際情況相符。由式(16)和圖1可知,當(dāng)目標(biāo)為真目標(biāo)C(1)的概率較低(p(1)→0)時(shí),風(fēng)險(xiǎn)主要來(lái)自目標(biāo)識(shí)別,一旦將真目標(biāo)判定為假目標(biāo),真目標(biāo)擊毀我方軍事設(shè)施,將會(huì)為我方帶來(lái)?yè)p失;當(dāng)目標(biāo)為真目標(biāo)C(1)的概率較高(p(1)→1)時(shí),風(fēng)險(xiǎn)主要來(lái)自于目標(biāo)跟蹤,此時(shí)將發(fā)射導(dǎo)彈對(duì)目標(biāo)實(shí)施攔截,在跟蹤精度較低,目標(biāo)丟失概率較高的情況下,一旦攔截失敗,依然會(huì)給我方帶來(lái)?yè)p失;若 目 標(biāo) 丟 失 概 率 較 高(p(miss)→1),則R(1)>R(2)恒成立,此時(shí),不再發(fā)射導(dǎo)彈,由于目標(biāo)跟蹤精度較低,丟失概率較高,導(dǎo)彈命中率較低,使武器資源浪費(fèi)。
圖2 目標(biāo)丟失概率示意圖Fig.2 Sketch map of target losing probability
用于求解傳感器管理方案的算法主要有集中式算法和分布式算法兩種[13-15],前者計(jì)算時(shí)間長(zhǎng)、通信壓力大,但求解質(zhì)量高,后者計(jì)算時(shí)間短、通信壓力小,但求解質(zhì)量不如前者。由于傳感器管理過(guò)程中作戰(zhàn)態(tài)勢(shì)變化較快,使用求解速度較快的分布式算法求解傳感器管理方案,同時(shí)提高求解質(zhì)量,成為研究的熱點(diǎn)和難點(diǎn)。
本文采用分布計(jì)算的思想,其優(yōu)化思路為將整體效能函數(shù)轉(zhuǎn)化為單目標(biāo)的局部效能函數(shù),將每個(gè)傳感器看作一個(gè)具有自主計(jì)算功能的Agent,每個(gè)目標(biāo)通過(guò)分別優(yōu)化自身局部效能,使局部效能最優(yōu)的同時(shí)達(dá)到全局最優(yōu)。
基于以上敘述,傳感器管理流程如圖3所示。
圖3 傳感器管理流程圖Fig.3 Flowchart of sensormanagement
傳感器的探測(cè)性能和目標(biāo)參數(shù)如表1、表2所示,pf為傳感器的誤警率。我方用于目標(biāo)跟蹤的傳感器為4個(gè),在k=0時(shí)刻,同時(shí)探測(cè)到4個(gè)目標(biāo),假定目標(biāo)飛行過(guò)程中均在所有傳感器的探測(cè)范圍內(nèi),作戰(zhàn)態(tài)勢(shì)如圖4所示。
表1 傳感器信息Tab le 1 In form ation of sensors
表2 目標(biāo)信息Tab le 2 In form ation of targets
圖4 作戰(zhàn)態(tài)勢(shì)Fig.4 Combat situation
當(dāng)用傳感器s1對(duì)目標(biāo)t1跟蹤識(shí)別時(shí),取前30 s,其過(guò)程如圖5所示。當(dāng)用傳感器s2對(duì)目標(biāo)t3跟蹤識(shí)別時(shí),取前30 s,其過(guò)程如圖6所示。
圖5 傳感器s1 對(duì)目標(biāo)t1 的目標(biāo)識(shí)別過(guò)程Fig.5 Process of target identification of sensor s1 to target t1
圖6 傳感器s2 對(duì)目標(biāo)t3 的目標(biāo)識(shí)別過(guò)程Fig.6 Process of target identification of sensor s2 to target t3
在k=0時(shí)刻,生成k=1時(shí)刻的傳感器-目標(biāo)分配方案,以便后續(xù)時(shí)刻對(duì)目標(biāo)進(jìn)行跟蹤。在仿真過(guò)程中,將本文提出的分布式算法與貪婪算法、拍賣算法作對(duì)比,如圖7所示。
圖7 算法對(duì)比Fig.7 Comparison of algorithms
由圖7可知,與貪婪算法相比,本文算法求解質(zhì)量較高;與拍賣算法相比,本文算法求解速度較快,說(shuō)明本文算法具有良好性能。
比較經(jīng)典的傳感器管理方法為基于協(xié)方差矩陣的傳感器管理方法與基于信息論的傳感器管理方法,本文分別選取基于跟蹤精度控制的傳感器管理方法[16](簡(jiǎn)稱跟蹤精度控制)和基于Rényi矩陣的傳感器管理方法[17](簡(jiǎn)稱信息增量控制)與本文方法作對(duì)比。分別計(jì)算3種傳感器管理方法生成的傳感器管理方案對(duì)應(yīng)的風(fēng)險(xiǎn)值以及目標(biāo)跟蹤精度,其過(guò)程如圖8所示。由圖8(a)可以看出,風(fēng)險(xiǎn)值整體呈下降的趨勢(shì),由此可見,隨著對(duì)目標(biāo)的跟蹤探測(cè),對(duì)目標(biāo)的識(shí)別風(fēng)險(xiǎn)和跟蹤風(fēng)險(xiǎn)降低。在風(fēng)險(xiǎn)值方面,傳感器管理方法的優(yōu)劣依次為:本文方法>跟蹤精度控制>信息增量控制。由圖8(b)可以看出,雖然本文方法尚未采取跟蹤精度控制的方法,但其獲得的目標(biāo)跟蹤精度值最低,原因?yàn)樵趉=5時(shí)刻后,傳感器不再對(duì)虛假目標(biāo)t3、t4跟蹤,節(jié)省出傳感器資源對(duì)真目標(biāo)t1、t2跟蹤,由此避免了傳感器資源浪費(fèi)。而采用跟蹤精度控制和信息增量控制的傳感器管理方法,未考慮到跟蹤目標(biāo)的種類,一味追求對(duì)包括虛假目標(biāo)在內(nèi)的所有目標(biāo)提高跟蹤精度,由此造成了傳感器資源浪費(fèi)。該分析在圖8(c)~圖8(f)中得到證實(shí)。
圖8 傳感器管理方法對(duì)比Fig.8 Comparison of sensor managementmethods
本文研究多傳感器協(xié)同跟蹤多目標(biāo)作戰(zhàn)背景的傳感器管理問(wèn)題,建立同時(shí)考慮目標(biāo)跟蹤和目標(biāo)識(shí)別任務(wù)的傳感器管理模型,并針對(duì)模型的求解提出基于多Agent分布計(jì)算理論的分布式算法,通過(guò)仿真驗(yàn)證了模型和算法的有效性,仿真結(jié)果表明,本文方法不但能夠得到最低的風(fēng)險(xiǎn)值,還能及時(shí)停止對(duì)虛假目標(biāo)跟蹤,從而避免傳感器資源浪費(fèi)。在多目標(biāo)跟蹤情況下,伴隨著已有目標(biāo)的消失與新目標(biāo)的出現(xiàn),若在對(duì)目標(biāo)數(shù)目估計(jì)不準(zhǔn)確情況下對(duì)傳感器進(jìn)行管理,得到的傳感器管理方案可能欠準(zhǔn)確,下一步將研究此種情況下的傳感器風(fēng)險(xiǎn)管理問(wèn)題。