安 雷,李召瑞,吉 兵,陳志剛
(1.陸軍工程大學(xué)石家莊校區(qū),河北 石家莊 050003;2.中國(guó)人民解放軍32272部隊(duì),甘肅 蘭州 733000)
傳感器調(diào)度主要通過(guò)有針對(duì)性地分配傳感器資源及探測(cè)時(shí)間區(qū)間,以達(dá)到提升目標(biāo)跟蹤精度、增強(qiáng)系統(tǒng)生存能力、擴(kuò)大偵測(cè)覆蓋范圍及優(yōu)化信號(hào)處理效果等改善傳感器系統(tǒng)性能的目的[1]。根據(jù)決策時(shí)長(zhǎng)可將調(diào)度方法分為短時(shí)調(diào)度和長(zhǎng)時(shí)調(diào)度,短時(shí)調(diào)度方法以單步收益為決策依據(jù),系統(tǒng)設(shè)計(jì)簡(jiǎn)單、計(jì)算量小[2];而長(zhǎng)時(shí)調(diào)度方法考慮多步累計(jì)收益,雖然增加了一定計(jì)算量,但優(yōu)化性能要明顯優(yōu)于短時(shí)調(diào)度[3-4]。不過(guò),由于兩類方法均未對(duì)單個(gè)傳感器的工作時(shí)間進(jìn)行約束,導(dǎo)致存在因頻繁切換而使系統(tǒng)響應(yīng)延遲大量累積,進(jìn)而降低目標(biāo)跟蹤精度的問(wèn)題[5]。
為此,在確保跟蹤精度的同時(shí),必須充分考慮降低傳感器頻繁切換所帶來(lái)的使用代價(jià)即切換代價(jià)的問(wèn)題。文獻(xiàn)[6—7]將交接次數(shù)閾值代入到調(diào)度方案求解當(dāng)中,但獲得的結(jié)果并不穩(wěn)定。文獻(xiàn)[8]為應(yīng)對(duì)相控陣?yán)走_(dá)跟蹤中存在的時(shí)延問(wèn)題,引入調(diào)度代價(jià)以確保任務(wù)優(yōu)先級(jí),但可操作性不強(qiáng),容易丟失最優(yōu)解。文獻(xiàn)[9—10]則對(duì)傳感器每次執(zhí)行觀測(cè)任務(wù)的時(shí)長(zhǎng)進(jìn)行了約束,若當(dāng)前傳感器完成了此輪觀測(cè),則立即擇優(yōu)選取其他傳感器執(zhí)行任務(wù),由于該方法放棄了過(guò)多的可選方案,導(dǎo)致調(diào)度效果明顯欠佳。而文獻(xiàn)[11—12]雖然同樣對(duì)傳感器每次執(zhí)行任務(wù)的時(shí)長(zhǎng)進(jìn)行了約束,但規(guī)定了達(dá)到基本時(shí)長(zhǎng)后,仍可依據(jù)下步預(yù)測(cè)結(jié)果繼續(xù)調(diào)用當(dāng)前傳感器,保留了更多可選方案,優(yōu)化效果更好。
針對(duì)上述問(wèn)題,本文以理想條件下的多傳感器多目標(biāo)跟蹤為應(yīng)用場(chǎng)景,借助經(jīng)典目標(biāo)跟蹤濾波算法,提出基于切換代價(jià)控制的最小工作時(shí)長(zhǎng)約束調(diào)度方法。
在傳感器對(duì)目標(biāo)的實(shí)際跟蹤中,由于量測(cè)結(jié)果常常存在包含噪聲、目標(biāo)漏檢以及虛警等問(wèn)題,因此普遍基于部分可觀馬爾可夫決策過(guò)程(partially observed MDP, POMDP)對(duì)傳感器調(diào)度過(guò)程進(jìn)行建模[13]。其基本流程:系統(tǒng)執(zhí)行上一時(shí)刻得到的調(diào)度動(dòng)作,由相應(yīng)傳感器工作一定時(shí)長(zhǎng),獲得目標(biāo)狀態(tài)的量測(cè)結(jié)果;將量測(cè)結(jié)果代入調(diào)度方法,并依據(jù)優(yōu)化目標(biāo)得到下一時(shí)刻調(diào)度動(dòng)作,如此循環(huán)往復(fù)[3]。
規(guī)定系統(tǒng)中有N部主動(dòng)傳感器,觀測(cè)區(qū)域內(nèi)存在M個(gè)敵方目標(biāo),且當(dāng)前為k時(shí)刻,則調(diào)度動(dòng)作可定義為:
(1)
式(1)中,
(2)
由于觀測(cè)區(qū)域內(nèi)共有M個(gè)目標(biāo),所以k時(shí)刻的多目標(biāo)狀態(tài)模型為:
(3)
(4)
(5)
充分考慮不同傳感器功能的差異性,將傳感器n的最小工作時(shí)長(zhǎng)設(shè)為φn。假設(shè)傳感器n1在k時(shí)刻已工作滿φn1時(shí)長(zhǎng),則此時(shí)依據(jù)目標(biāo)優(yōu)化函數(shù)決策是否進(jìn)行切換,其中n1按照單步時(shí)長(zhǎng)確定決策依據(jù),其余傳感器則按照最小工作時(shí)長(zhǎng)φn確定決策依據(jù)。在此基礎(chǔ)上,構(gòu)建最小工作時(shí)長(zhǎng)約束調(diào)度目標(biāo)優(yōu)化函數(shù)
(6)
(7)
結(jié)合前文對(duì)目標(biāo)狀態(tài)模型和目標(biāo)量測(cè)模型的定義,本文采取基于交互式多模型(interacting multiple model,IMM)[14-15]的濾波算法進(jìn)行目標(biāo)狀態(tài)估計(jì)。同時(shí),由于模糊積分粒子濾波(fuzzy quadrature particle filter,FQPF)[16]相比于粒子濾波所具備的并行處理能力和更佳的濾波性能,為更好地實(shí)現(xiàn)多目標(biāo)跟蹤濾波,提出IMM-FQPF濾波算法。
步驟1 初始數(shù)據(jù)交互
(8)
(9)
步驟2 模型濾波估計(jì)
1) 狀態(tài)估計(jì)及其協(xié)方差矩陣
(10)
2) 模型殘差及其協(xié)方差矩陣
(11)
式(11)中,NS為粒子數(shù)目,且有
則為粒子u的權(quán)值。
3) 狀態(tài)估計(jì)及其協(xié)方差矩陣
(12)
(13)
步驟3 模型概率更新
(14)
且模型j的模型概率更新為:
(15)
式(15)中,c為歸一化因子,
(16)
步驟4 數(shù)據(jù)估計(jì)融合
(17)
步驟1 初始化
步驟2 獲取狀態(tài)轉(zhuǎn)移矩陣
(18)
步驟3 計(jì)算目標(biāo)狀態(tài)預(yù)測(cè)值
步驟4 計(jì)算目標(biāo)量測(cè)預(yù)測(cè)值
步驟5 代入IMM-FQPF濾波算法
步驟6 定義Fisher信息矩陣
由于目標(biāo)估計(jì)狀態(tài)預(yù)測(cè)值滿足:
(19)
故Fisher信息矩陣可定義為:
(20)
步驟7 獲取目標(biāo)運(yùn)動(dòng)狀態(tài)模型
(21)
步驟8 計(jì)算目標(biāo)狀態(tài)轉(zhuǎn)移先驗(yàn)概率密度函數(shù)
依據(jù)文獻(xiàn)[20],目標(biāo)m的狀態(tài)轉(zhuǎn)移先驗(yàn)概率密度函數(shù)為:
(22)
步驟9 計(jì)算Fisher信息矩陣
(23)
式(23)中,
(24)
步驟10 計(jì)算跟蹤精度預(yù)測(cè)值
本文考慮理想條件下的多目標(biāo)跟蹤背景,所以采取將多目標(biāo)跟蹤分解成多個(gè)單目標(biāo)跟蹤的方式來(lái)實(shí)現(xiàn),傳感器n針對(duì)目標(biāo)m的跟蹤精度預(yù)測(cè)值為:
(25)
則傳感器n針對(duì)多目標(biāo)的跟蹤精度預(yù)測(cè)值為:
(26)
式(26)中,αm為傳感器系統(tǒng)在跟蹤目標(biāo)時(shí)根據(jù)其威脅程度分配的權(quán)重系數(shù)。
步驟11 循環(huán)
若h<φn,令h=h+1,轉(zhuǎn)到步驟2;若h=φn,循環(huán)結(jié)束,計(jì)算傳感器n在最小工作時(shí)長(zhǎng)φn內(nèi)的長(zhǎng)時(shí)跟蹤精度預(yù)測(cè)值:
(27)
步驟1 初始時(shí)刻
步驟2 重新決策
若k時(shí)刻(k>1)傳感器n1已達(dá)到最小工作時(shí)長(zhǎng)要求,則重新進(jìn)行決策。
步驟3 預(yù)測(cè)目標(biāo)跟蹤精度
步驟4 決策選取調(diào)度方案
將各傳感器跟蹤精度預(yù)測(cè)值代入目標(biāo)優(yōu)化函數(shù)式(6)中,決策選取最優(yōu)傳感器η。
若η=n1,則k時(shí)刻繼續(xù)調(diào)用傳感器n1工作,工作時(shí)長(zhǎng)h=1。
若η≠n1,則k時(shí)刻切換傳感器η工作,工作時(shí)長(zhǎng)h=φη。
步驟5 執(zhí)行調(diào)度方案
步驟6 循環(huán)
若k+h-1 若k+h-1≥H,則調(diào)度任務(wù)結(jié)束。 調(diào)度方法流程如圖1所示。 圖1 最小工作時(shí)長(zhǎng)約束調(diào)度方法流程圖Fig.1 Flow chart ofminimum working timestep constrained scheduling method 假設(shè)系統(tǒng)采樣間隔τ=1 s,且包含3臺(tái)主動(dòng)傳感器,跟蹤2個(gè)機(jī)動(dòng)目標(biāo),傳感器的位置分別為N1(0 m,-2 000 m),N2(-5 000 m,0 m),N3(5 000 m, 0 m),量測(cè)噪聲協(xié)方差矩陣分別為R1=diag([0.5 m;10-6rad]),R2=diag([1 m;2×10-6rad]),R3=diag([1.5 m;3×10-6rad])。由于探測(cè)性能越好的傳感器向外輻射電磁波的能力越強(qiáng),為提高傳感器系統(tǒng)戰(zhàn)場(chǎng)生存能力,盡可能地避免被敵方截獲探測(cè)信號(hào),規(guī)定探測(cè)性能越好的傳感器最小工作時(shí)間φ越短,則各傳感器最小工作時(shí)長(zhǎng)分別設(shè)置為φ1=2 s,φ2=3 s,φ3=4 s,跟蹤任務(wù)時(shí)長(zhǎng)75 s。 在仿真中,為驗(yàn)證提出的基于切換代價(jià)控制的最小工作時(shí)長(zhǎng)約束調(diào)度方法(minimum working timestep constrained scheduling method, MTSM),同時(shí)與基于目標(biāo)跟蹤精度最優(yōu)化的短時(shí)調(diào)度方法(myopic scheduling method, MSM)[7]和就近調(diào)度方法(nearby scheduling method, NSM)[11]、固定時(shí)長(zhǎng)調(diào)度方法(fixed time scheduling method, FTSM)[9]以及單傳感器跟蹤進(jìn)行對(duì)比。 為較為直觀地顯示調(diào)度方法對(duì)傳感器切換代價(jià)的控制作用,采取仿真時(shí)間內(nèi)傳感器系統(tǒng)的切換次數(shù)(switching times, ST)作為切換代價(jià)的評(píng)價(jià)指標(biāo),并以任務(wù)時(shí)間內(nèi)目標(biāo)估計(jì)狀態(tài)的均方根誤差均值(root mean square error, RMSE)作為目標(biāo)跟蹤精度的評(píng)價(jià)指標(biāo),為便于表述,后文中以“RMSE”代表任務(wù)時(shí)間內(nèi)的均方根誤差均值。在目標(biāo)跟蹤精度閾值ρth=4 m時(shí),利用本文所提MTSM進(jìn)行調(diào)度,得到目標(biāo)運(yùn)動(dòng)軌跡如圖2所示,傳感器調(diào)度序列如圖3所示。 圖2 目標(biāo)運(yùn)動(dòng)軌跡Fig.2 The targetmotion trajectory 圖3 傳感器調(diào)度序列Fig.3 Sensor scheduling sequence 圖4所示為本文所提的MTSM與MSM、FTSM在不同閾值條件下,以及NSM、各傳感器單獨(dú)工作時(shí),仿真時(shí)間內(nèi)各時(shí)刻目標(biāo)估計(jì)狀態(tài)的均方根誤差對(duì)比情況。 圖4 各時(shí)刻目標(biāo)估計(jì)狀態(tài)均方根誤差對(duì)比Fig.4 Comparison of root mean square error of target estimation state at each time 相同實(shí)驗(yàn)中的RMSE及ST對(duì)比情況如表1、2所示。 從表2中可知,在使用單傳感器實(shí)施目標(biāo)跟蹤時(shí),由于不進(jìn)行優(yōu)化選取,跟蹤全程都采取同一傳感器,導(dǎo)致跟蹤精度較低,與應(yīng)用各調(diào)度方法得到的跟蹤結(jié)果相比存在較大的差距。 表1 閾值可調(diào)節(jié)調(diào)度方法的性能對(duì)比Tab.1 Performance comparison of threshold adjustable scheduling methods 而相比于MSM的短時(shí)調(diào)度方法,MTSM在跟蹤精度上稍差,在表1中的3個(gè)閾值條件下,得到的RMSE均高于MSM,但傳感器切換次數(shù)ST則要遠(yuǎn)低于MSM。由于MTSM的優(yōu)化目標(biāo)是在一定跟蹤精度的基礎(chǔ)上,有效降低傳感器切換代價(jià),所以MSM在切換代價(jià)上的巨大差距使得其跟蹤精度優(yōu)勢(shì)并不明顯,無(wú)法滿足切換代價(jià)優(yōu)化的要求。 同時(shí),對(duì)比FTSM工作滿固定時(shí)長(zhǎng)后即切換其他傳感器的情況,本文所提MTSM規(guī)定傳感器在工作滿最小時(shí)長(zhǎng)后,再依據(jù)決策指標(biāo)決定是否切換,保留了更多的可行解,所以得到的調(diào)度方案更優(yōu)。在表1中,MTSM在3個(gè)閾值條件下,無(wú)論是RMSE還是ST,均要優(yōu)于FTSM。 表2 NSM調(diào)度及各傳感器單獨(dú)工作時(shí)的性能對(duì)比Tab.2 Performance comparison of NSM scheduling and each sensor working alone 結(jié)合表1和2可知,僅基于傳感器和目標(biāo)間距離進(jìn)行調(diào)度的NSM得到的RMSE要優(yōu)于本文所提MTSM,高于短時(shí)調(diào)度MSM。但由于影響跟蹤精度的約束條件不僅只有距離,還必須考慮傳感器的探測(cè)性能,所以,NSM的原理與實(shí)際情況不符,在傳感器調(diào)度中并不適用。 仿真可知,相較于其他調(diào)度方法以及單傳感器目標(biāo)跟蹤,MTSM能夠在保證跟蹤精度的基礎(chǔ)上,實(shí)現(xiàn)對(duì)傳感器切換代價(jià)的高效控制,更加符合實(shí)際跟蹤情況,具備一定的優(yōu)勢(shì)。 從表1中可知,隨著目標(biāo)跟蹤精度閾值的增加,本文所提MTSM調(diào)度得到的RMSE和ST發(fā)生了明顯變化,為進(jìn)一步分析閾值ρth對(duì)MTSM調(diào)度性能的影響,在[0 m,30 m]區(qū)間內(nèi)間隔0.5 m采樣,進(jìn)行仿真實(shí)驗(yàn)與分析,其余參數(shù)設(shè)置不變。如圖5所示為不同跟蹤精度閾值條件下,采取MTSM進(jìn)行調(diào)度所得到的RMSE和ST變化情況,圖6則為仿真時(shí)間內(nèi)滿足閾值要求的采樣時(shí)刻數(shù)。 從圖5可知,隨著跟蹤精度閾值的增加,RMSE先增大再減小后保持平穩(wěn),而ST先減小再增大后保持平穩(wěn)。同時(shí),在閾值ρth≥7 m時(shí),RMSE及ST開(kāi)始趨于穩(wěn)定,且ρth在區(qū)間[7 m,30 m]內(nèi)的平均RMSE=3.44 m,平均ST=20.86,而ρth=0 m時(shí)RMSE=3.45 m,ST=21.40,可見(jiàn)在ρth=0 m及ρth≥7 m時(shí),MTSM的調(diào)度性能基本相同。 圖5 不同跟蹤精度閾值條件下MTSM的調(diào)度性能Fig.5 Scheduling performance of MTSM under different tracking accuracy thresholds 圖6 不同跟蹤精度閾值條件下任務(wù)時(shí)間內(nèi)滿足閾值要求的時(shí)長(zhǎng)Fig.6 Time to meet threshold requirements within the mission time under different tracking accuracy thresholds 而當(dāng)ρth在 (0 m,7 m)區(qū)間內(nèi)時(shí),由于閾值的限制,MTSM在調(diào)度中出現(xiàn)舍去可行解的情況,并隨著ρth的增大,出現(xiàn)該情況的時(shí)刻相應(yīng)增多,導(dǎo)致RMSE增大,但當(dāng)ρth增加到1.5 m時(shí),從圖5可知,此時(shí)RMSE=4.01 m,ST=1.24,且通過(guò)仿真可知調(diào)度序列中傳感器1的占比達(dá)到了96.51%,說(shuō)明在ρth≤1.5 m時(shí),閾值的限制作用會(huì)隨著ρth的增大而增強(qiáng),逐漸舍去了傳感器2和傳感器3,導(dǎo)致調(diào)度效果變差;而在ρth≥1.5 m時(shí),跟蹤精度滿足閾值要求的時(shí)刻逐漸增多,閾值限制作用減弱,調(diào)度效果得到改善。 因此,可以通過(guò)調(diào)整跟蹤精度閾值,實(shí)現(xiàn)對(duì)目標(biāo)跟蹤精度和傳感器切換代價(jià)的有效控制。在本文仿真條件下,建議跟蹤精度閾值可以在區(qū)間[1.5 m, 7 m]內(nèi)選取。 由于本文所提MTSM的長(zhǎng)時(shí)屬性是由最小工作時(shí)長(zhǎng)φ所賦予的,為進(jìn)一步分析研究φ對(duì)調(diào)度性能的影響,分別在[1 s,75 s]區(qū)間內(nèi)按照系統(tǒng)采樣時(shí)間間隔1 s對(duì)φ進(jìn)行取值,開(kāi)展仿真實(shí)驗(yàn)。為便于對(duì)結(jié)果進(jìn)行分析比較,設(shè)定3臺(tái)傳感器的最小工作時(shí)長(zhǎng)相同。同時(shí)通過(guò)3.2節(jié)仿真可知,閾值會(huì)對(duì)調(diào)度性能產(chǎn)生較大影響,為確保實(shí)驗(yàn)的準(zhǔn)確性,規(guī)定ρth=0 m,以隔絕跟蹤精度閾值干擾。不同最小工作時(shí)長(zhǎng)下MTSM調(diào)度得到RMSE和ST對(duì)比情況如圖7、圖8所示。 圖7 不同最小工作時(shí)長(zhǎng)下MTSM調(diào)度得到的RMSEFig.7 RMSE obtained by MTSM under different minimum working timestep 圖8 不同最小工作時(shí)長(zhǎng)下MTSM調(diào)度得到的STFig.8 ST obtained by MTSM under different minimum working timestep 從圖7可知,隨著最小工作時(shí)長(zhǎng)φ的增加,RMSE先是逐漸增大,隨后由于傳感器位置和性能、目標(biāo)運(yùn)動(dòng)軌跡等仿真條件的限制,以及噪聲干擾等多種因素的綜合作用,在[10 s,44 s]區(qū)間內(nèi)表現(xiàn)出先平穩(wěn)再降低再平穩(wěn)的趨勢(shì)。 當(dāng)φ≥44 s之后,RMSE又逐漸增大,結(jié)合圖4(d)和表2分析原因,隨著φ的進(jìn)一步增加,初始時(shí)刻決策得到的最優(yōu)傳感器將固定為單獨(dú)跟蹤時(shí)RMSE最低的M1,但由于其在44 s之后的局部跟蹤精度低于M2,所以隨著φ的增加,M1的工作時(shí)間增加,M2的工作時(shí)間減少,導(dǎo)致RMSE增大,直至φ=75 s時(shí),調(diào)度序列全部為M1,得到的RMSE和ST與M1單獨(dú)工作時(shí)的一致。 本文仿真條件下,為在降低切換代價(jià)的同時(shí),避免單個(gè)傳感器長(zhǎng)時(shí)間的工作,結(jié)合圖7和圖8,建議最小工作時(shí)長(zhǎng)φ在區(qū)間[2 s,9 s]內(nèi)選取。 本文以多傳感器跟蹤多目標(biāo)為應(yīng)用場(chǎng)景,利用IMM-FQPF濾波算法和PCRLB實(shí)現(xiàn)目標(biāo)跟蹤精度預(yù)測(cè),引入最小工作時(shí)長(zhǎng)約束策略,提出切換代價(jià)控制的調(diào)度方法MTSM。仿真實(shí)驗(yàn)表明,所提最小工作時(shí)長(zhǎng)約束調(diào)度方法MTSM跟蹤效果穩(wěn)定,在保證一定目標(biāo)跟蹤精度的基礎(chǔ)上,有效降低了傳感器切換代價(jià);同時(shí),可依據(jù)實(shí)際任務(wù)需求,通過(guò)改變目標(biāo)跟蹤精度閾值和最小工作時(shí)長(zhǎng)的大小,對(duì)調(diào)度方法的優(yōu)化性能進(jìn)行調(diào)整,最后給出了目標(biāo)跟蹤精度閾值和最小工作時(shí)長(zhǎng)的取值建議。3 仿真驗(yàn)證與分析
3.1 調(diào)度方法性能分析
3.2 目標(biāo)跟蹤精度閾值對(duì)調(diào)度性能的影響
3.3 最小工作時(shí)長(zhǎng)對(duì)調(diào)度性能的影響
4 結(jié)論