張昀普, 單甘霖,*, 黃 燕, 付 強
(1. 陸軍工程大學(xué)石家莊校區(qū)電子與光學(xué)工程系, 河北 石家莊 050003;2. 中國人民解放軍32316部隊, 新疆 烏魯木齊 830001)
隨著戰(zhàn)爭形態(tài)的變化,利用諸如雷達、紅外和電子支援設(shè)備等傳感器獲取戰(zhàn)場信息已經(jīng)成為現(xiàn)代戰(zhàn)爭中必不可少的環(huán)節(jié)[1-3]。在目標(biāo)環(huán)境復(fù)雜、任務(wù)協(xié)同難度高、傳感器資源有限的背景下,合理地根據(jù)任務(wù)態(tài)勢調(diào)度傳感器資源,能夠在大幅度提升作戰(zhàn)收益的同時,降低己方的損失[4-5]。因此,如何根據(jù)不同的作戰(zhàn)任務(wù),制定傳感器調(diào)度方法,已成為相關(guān)領(lǐng)域的研究熱點。
按照作戰(zhàn)任務(wù)劃分,不同的傳感器調(diào)度方法可分別應(yīng)用于目標(biāo)檢測[6]、目標(biāo)識別[7]和目標(biāo)跟蹤[8-11]等任務(wù)中。其中,面向目標(biāo)跟蹤的調(diào)度方法是學(xué)者們研究的重點,該類方法的目的是通過合理地制定調(diào)度方案,獲取理想的跟蹤精度,同時減少因傳感器觀測行為所帶來的代價。文獻[8]以分布式傳感器網(wǎng)絡(luò)為研究對象,提出了一種快速調(diào)度方法以提高目標(biāo)跟蹤的實時性。文獻[9]以主/被動傳感器系統(tǒng)為研究對象,提出了一種傳感器調(diào)度方法,使得跟蹤精度和傳感器輻射代價達到了合理的平衡,增強了跟蹤時傳感器系統(tǒng)的生存能力。文獻[10]在文獻[9]的基礎(chǔ)上,考慮了跟蹤任務(wù)的實際需求,使得系統(tǒng)在滿足任務(wù)要求精度的同時,輻射代價達到最小。文獻[11]將傳感器調(diào)度過程建模為部分可觀馬爾可夫決策過程,提出了一種基于能量有效的調(diào)度方法,減少了跟蹤時的能耗。然而,大多文獻均集中于對空中目標(biāo)跟蹤進行研究,而忽略了地面目標(biāo)。相比于空中目標(biāo),地面目標(biāo)的速度慢,機動性強,且傳感器對其探測時易受地物遮蔽的影響,從而造成視野盲區(qū)[12-13]。同時,文獻[14-16]指出,為避免地雜波的干擾,對地探測的傳感器通常采用脈沖多普勒體制,在抑制地雜波的同時,徑向速度不大于最小可檢測速度(minimum detectable velocity, MDV)的目標(biāo)將落入多普勒盲區(qū),致使其無法被探測,從而造成航跡中斷、跟蹤性能降低。因此,在對地面目標(biāo)進行跟蹤時,傳感器調(diào)度方法也將有別于面向空中目標(biāo)的方法。同時,在調(diào)度時應(yīng)考慮多任務(wù)協(xié)同的情況,例如,在目標(biāo)跟蹤時,常常還需要對潛在目標(biāo)所在區(qū)域進行檢測,此時所制定的調(diào)度方法應(yīng)兼顧跟蹤和檢測任務(wù)。
在傳統(tǒng)的傳感器調(diào)度研究中,通常以靜態(tài)傳感器為研究對象,隨著無人機、無人車和車載雷達等移動傳感器的應(yīng)用越來越廣泛,如何利用移動傳感器系統(tǒng)獲取最大的作戰(zhàn)收益已成為亟需解決的問題。目前,對移動傳感器的研究主要集中在大型傳感器網(wǎng)絡(luò)的協(xié)同控制上,主要的方法有蜂擁控制[17-18]和分布式優(yōu)化控制[19]等,對于多移動傳感器協(xié)同調(diào)度方法的研究還較少。由于移動傳感器的機動能力較強,因此可通過對傳感器機動方向的合理控制,適時地調(diào)整其觀測位置,從而擴展探測范圍,提升對目標(biāo)環(huán)境的探測能力[20-21]。在地面目標(biāo)跟蹤中,由于目標(biāo)的速度較慢,如果利用移動傳感器跟蹤,則目標(biāo)和傳感器相對位置的變化對觀測性能的影響也較大,因此,可通過找出每時刻傳感器的最優(yōu)觀測位置,提升跟蹤性能。
針對上述問題,本文面向陸戰(zhàn)場偵察中的地面目標(biāo)檢測和跟蹤任務(wù),以移動傳感器系統(tǒng)為調(diào)度對象,結(jié)合多普勒盲區(qū)和視野盲區(qū)等約束因素,提出了一種考慮盲區(qū)的多移動傳感器協(xié)同地面目標(biāo)檢測跟蹤的調(diào)度方法。主要貢獻如下:① 建立了目標(biāo)檢測模型,結(jié)合貝葉斯風(fēng)險理論,給出了目標(biāo)檢測損失的計算方法,以衡量目標(biāo)檢測性能;② 建立了考慮盲區(qū)的目標(biāo)跟蹤模型,結(jié)合多普勒盲區(qū)和視野盲區(qū)的特點,提出基于盲區(qū)信息輔助的目標(biāo)跟蹤算法;③ 結(jié)合檢測和跟蹤任務(wù),同時考慮傳感器能耗、安全性和信息處理能力等因素建立了傳感器優(yōu)化調(diào)度模型,通過求解相應(yīng)的目標(biāo)優(yōu)化函數(shù)即可得到最優(yōu)調(diào)度方案。
本文考慮場景如圖1所示,己方利用多移動傳感器系統(tǒng)(以多無人機為例)對陸戰(zhàn)場進行偵察,作戰(zhàn)任務(wù)共分為兩類:對潛在目標(biāo)所在區(qū)域進行搜索檢測和對已知目標(biāo)進行跟蹤。傳感器系統(tǒng)采用集中式結(jié)構(gòu),由控制中心完成對戰(zhàn)場信息的融合處理和調(diào)度方案的制定。
圖1 多移動傳感器協(xié)同檢測與跟蹤示意圖Fig.1 Schematic diagram of multiple moving sensors cooperative detection and tracking
傳感器調(diào)度過程如圖2所示,在當(dāng)前時刻傳感器系統(tǒng)接收到調(diào)度指令,執(zhí)行檢測和跟蹤;然后根據(jù)相關(guān)算法更新目標(biāo)狀態(tài);接著,綜合系統(tǒng)模型和實際觀測值預(yù)測未來時刻的相關(guān)收益以及能耗,并結(jié)合其他約束條件,建立目標(biāo)函數(shù)并求解,從而得到未來時刻的最優(yōu)傳感器調(diào)度方案。為了便于下文描述,做出如下假設(shè):
(1) 己方傳感器共有兩種工作模式:跟蹤模式和檢測模式;
(2) 一部傳感器在同一時刻僅能檢測一個區(qū)域/跟蹤一個目標(biāo);
(3) 己方傳感器在任務(wù)過程中能量有限;
(4) 本文考慮二維場景,且對方目標(biāo)之間的航跡互不關(guān)聯(lián)。
圖2 傳感器調(diào)度過程Fig.2 Process of sensor scheduling
(1)
(2)
(3)
當(dāng)k時刻調(diào)度t部傳感器對s檢測時,假定其中h部傳感器的檢測值為1,t-h部的檢測值為0,則可結(jié)合式(2)~式(3)進行概率更新,即
--------------------
(4)
在k時刻,傳感器完成檢測后,控制中心會進行判決,其具體包含如下幾種情況。
(5)
(6)
(7)
(8)
采用最小風(fēng)險原則,則控制中心對區(qū)域s中目標(biāo)存在情況的判斷結(jié)果為
(9)
判斷完畢后,定義其估計值對應(yīng)的風(fēng)險為目標(biāo)檢測損失,即
(10)
(11)
(12)
第3.1節(jié)給出的觀測模型默認(rèn)傳感器必定能夠成功獲取目標(biāo)觀測,但是在地面目標(biāo)跟蹤中,多普勒盲區(qū)和地形障礙物所造成的視野盲區(qū)會對傳感器觀測造成影響,能否持續(xù)獲取目標(biāo)觀測成為一個不確定性事件,因此需要建立考慮盲區(qū)的傳感器觀測模型。
當(dāng)雜波為靜態(tài)時,則目標(biāo)n對應(yīng)的雜波多普勒[25]為
(13)
(14)
當(dāng)徑向速度不大于MDV時,傳感器無法成功探測到該目標(biāo),即無法獲取其觀測值。根據(jù)文獻[26],結(jié)合多普勒盲區(qū)和視野盲區(qū)的特點,k時刻傳感器m對目標(biāo)n的檢測概率可表示為
(15)
因此,考慮盲區(qū)的傳感器觀測模型建立如下:
(16)
式中:ρ為隨機數(shù)0或1,服從伯努利分布,具體為
(17)
在k時刻,若成功獲取目標(biāo)的觀測值,則可利用容積卡爾曼濾波(cubature Kalman filter, CKF)對目標(biāo)狀態(tài)進行估計,針對多運動模型目標(biāo),可結(jié)合交互式多模型算法進行估計,上述方法較常規(guī),具體可參見文獻[10,27],在此不再詳述。
若沒有獲取目標(biāo)的觀測,說明目標(biāo)可能進入了多普勒盲區(qū)或視野盲區(qū),此時僅能通過運動模型對目標(biāo)狀態(tài)進行預(yù)測,再將各個模型的預(yù)測值融合以作為目標(biāo)狀態(tài)的估計值,即
(18)
(19)
(20)
(21)
顯然,當(dāng)目標(biāo)進入傳感器的多普勒盲區(qū)后,上述狀態(tài)修正公式才適用。因此,當(dāng)傳感器沒有獲取目標(biāo)觀測時,需判斷原因,以區(qū)分目標(biāo)進入了傳感器的視野盲區(qū),還是多普勒盲區(qū)。文獻[25]指出,目標(biāo)的徑向速度并不會發(fā)生突變,當(dāng)目標(biāo)進入傳感器的多普勒盲區(qū)前,該值會逐漸減小。因此,本文建立一個長度為5的速度檢測滑窗,在k時刻,該滑窗存儲了時域[k-5,k-1]內(nèi)各時刻的徑向速度值,定義k時刻徑向速度變化率為
(22)
式中:τ為傳感器m的采樣間隔。采取四分之三法,當(dāng)下述4個不等式中有3個滿足條件時,判定丟失觀測值的原因是目標(biāo)進入了多普勒盲區(qū):
(23)
上述基于盲區(qū)信息輔助的目標(biāo)跟蹤算法的簡要流程如圖3所示。
圖3 基于盲區(qū)信息輔助的目標(biāo)跟蹤算法Fig.3 Target tracking algorithm based on blind zone information assisted
根據(jù)傳感器調(diào)度理論,要搜索出最優(yōu)的調(diào)度方案,需要結(jié)合任務(wù)實際預(yù)測未來時刻的調(diào)度收益,因此如何確定與調(diào)度收益相關(guān)的性能指標(biāo)是至關(guān)重要的。本文面向目標(biāo)檢測和跟蹤任務(wù),同時結(jié)合移動傳感器的工作實際,主要考慮以下5種性能指標(biāo)。
(1) 檢測損失
若沒有傳感器對區(qū)域s進行檢測,則
(24)
若使用t部傳感器對區(qū)域s進行檢測(其中h部傳感器的檢測值為1,t-h部的檢測值為0),則
(25)
(2) 目標(biāo)跟蹤精度
目標(biāo)跟蹤精度衡量了傳感器對目標(biāo)的跟蹤性能,為對該指標(biāo)進行合理描述,本文引入后驗克拉美羅下界(posterior Carmer-Rao lower bound, PCRLB),其反應(yīng)了目標(biāo)狀態(tài)估計誤差的理論下界,且其取值不依賴于具體的濾波算法,對于非線性系統(tǒng)也有很好的適用性[10,28]。值得注意的是,由于調(diào)度時不能獲取未來時刻的系統(tǒng)狀態(tài)與量測值,下文所提利用PCRLB量化的跟蹤精度為預(yù)測值而并非實際真值。
(26)
針對高斯系統(tǒng),式(26)等號右邊各項的計算公式[28]為
(27)
(28)
(3) 傳感器能耗
E(Uk)=
(29)
(4) 傳感器的安全性
(5) 控制中心的信息處理能力
由于控制中心的信息處理能力有限,每時刻處于工作狀態(tài)的傳感器數(shù)量不能過多。設(shè)定同一時刻控制中心最多處理Wdetection批次檢測信息和Wtracking批次目標(biāo)跟蹤信息(同一時刻一部傳感器進行檢測/跟蹤,控制中心需處理一批次相關(guān)信息)。因此,結(jié)合傳感器-區(qū)域的分配方案ak和傳感器-目標(biāo)的分配方案bk,控制中心的信息能力可用以下不等式描述:
(30)
根據(jù)第4.1節(jié)所提各項指標(biāo),建立如下的目標(biāo)函數(shù):
s.t.
(31)
(32)
圖4 傳感器機動方案離散化Fig.4 Discretization of sensor maneuver scheme
整個偵察區(qū)域內(nèi),己方共部署了8部傳感器跟蹤2個對方目標(biāo),并對3個待檢測區(qū)域進行潛在目標(biāo)檢測,目標(biāo)航跡、檢測區(qū)域和傳感器分布情況如圖5所示。
圖5 目標(biāo)航跡、檢測區(qū)域和傳感器分布情況Fig.5 Target tracks, detected zones and multi-sensor locations
為模擬真實地面上的地形遮蔽,在仿真中設(shè)定了兩處障礙,當(dāng)傳感器的視線被障礙遮蔽時,即產(chǎn)生了視野盲區(qū),兩處障礙的起始點坐標(biāo)為:A(1 300, 3 600)m、B(2 200, 3 000)m、C(700, 250)m、D(1 400, 750)m。傳感器的采樣時間為1 s,仿真時間為50 s。所有傳感器的MDV均為10 m/s,傳感器的初始朝向均為0°(與X軸正方向夾角),一次采樣間隔的移動距離為40 m,機動方案共有10種:靜止、0°、±15°、±30°、±45°和±60°,傳感器的其他參數(shù)如表1所示,為不失一般性,設(shè)定檢測和跟蹤性能越好的傳感器能耗越大。
表1 傳感器參數(shù)
傳感器和目標(biāo)的安全距離rsafe=300 m,控制中心的信息處理能力Wdetection=4、Wtracking=4,目標(biāo)函數(shù)中平衡系數(shù)α=1,β=0.03,γ=0.01。
為充分說明本文所提調(diào)度方法的性能,采用兩種調(diào)度方法進行對比:
(1) 方法1:隨機調(diào)度方法,即每一時刻隨機選擇傳感器調(diào)度方案執(zhí)行任務(wù)[9];
(2) 方法2:僅考慮跟蹤精度的調(diào)度方法,即在本文調(diào)度方法的基礎(chǔ)上,令目標(biāo)函數(shù)中平衡系數(shù)α=γ=0,β=1,該方法能獲得使跟蹤精度達到最優(yōu)的調(diào)度方案。
圖6給出了整個仿真過程中,不同調(diào)度方法下各區(qū)域瞬時檢測損失和總檢測損失的對比圖??梢钥闯?對各個區(qū)域進行幾次檢測后,瞬時檢測損失和總檢測損失均會收斂至固定值,這說明目標(biāo)的存在概率不會再改變,區(qū)域內(nèi)目標(biāo)存在狀態(tài)的估計值也已確定,且與實際值一致,檢測任務(wù)已基本完成。對比各調(diào)度方法可以看出,本文調(diào)度方法所得的檢測損失最小,方法1、方法2和所制定的調(diào)度方案均不考慮檢測損失,故二者所得檢測損失較大。同時,方法2制定的調(diào)度方案僅關(guān)注優(yōu)化跟蹤精度,造成了檢測性能好的傳感器更可能被用于完成跟蹤任務(wù),因此其獲得的總檢測損失最大。圖6中,本文方法、方法1和方法2完成所有區(qū)域目標(biāo)檢測所用的平均時間分別為7.1 s、9.4 s和10.5 s。綜合上述分析,本文方法能夠獲得較優(yōu)的檢測性能,提高檢測速度,在減少檢測損失的同時盡快獲得目標(biāo)存在信息。
圖6 不同調(diào)度方法下各區(qū)域瞬時檢測損失和總檢測損失對比Fig.6 Comparison of instantaneous detection loss and total detection loss in each region under different scheduling methods
圖7給出了100次蒙特卡羅仿真實驗后,不同調(diào)度方法下傳感器盲區(qū)出現(xiàn)概率對比。對比3種調(diào)度方法可以看出,方法1不預(yù)測未來時刻目標(biāo)狀態(tài),因此其“盲區(qū)傳感器”出現(xiàn)的概率最大;方法2制定的傳感器調(diào)度方案僅關(guān)注跟蹤精度,因此其能夠較準(zhǔn)缺地避免“盲區(qū)傳感器”的出現(xiàn),故該方法下多普勒盲區(qū)和視野盲區(qū)出現(xiàn)的頻率均為最低,也說明了本文目標(biāo)函數(shù)中利用PCRLB預(yù)測跟蹤收益并制定相應(yīng)調(diào)度方案的做法是合理的;本文方法因為需要兼顧區(qū)域檢測和控制能耗,因此出現(xiàn)“盲區(qū)傳感器”的概率稍大于方法2,但是要遠(yuǎn)好于方法1,具有較好地規(guī)避盲區(qū)的能力。
圖7 不同調(diào)度方法下傳感器盲區(qū)出現(xiàn)概率對比Fig.7 Comparison of occurrence probability of sensor blind zone under different scheduling methods
為進一步評價調(diào)度方法的跟蹤性能,引入均方根誤差(root mean squared error, RMSE)和均方根的時間均值(root time average mean squared error, RTAMSE)作為評價指標(biāo)。表2給出了在整個仿真時間中,不同調(diào)度方法對各目標(biāo)的跟蹤性能對比,表中盲區(qū)平均出現(xiàn)次數(shù)為100次蒙特卡羅仿真后的統(tǒng)計平均值。圖8給出了不同調(diào)度方法在每時刻對各目標(biāo)跟蹤所得RMSE對比??梢钥闯?3種方法中,方法1不對未來時刻的系統(tǒng)收益進行預(yù)測,隨機選擇傳感器調(diào)度方案,跟蹤性能最差,且容易進入多普勒盲區(qū)和探測盲區(qū)中,造成跟蹤精度下降。只關(guān)注優(yōu)化跟蹤精度的方法2所得的各項指標(biāo)均為最優(yōu),這是因為該方法可根據(jù)目標(biāo)的狀態(tài)實時選擇跟蹤精度最優(yōu)的傳感器,并調(diào)整傳感器的觀測位置,從而得到能夠使跟蹤精度達到最優(yōu)的傳感器調(diào)度方案。而本文方法雖然在跟蹤性能上不如方法2,但是各項指標(biāo)均差距不大,尤其是從圖8可以看出,本文方法在每時刻所得RMSE值與方法2所得值十分接近,說明即使本文方法需要兼顧檢測和控制能耗,但依然能保證出色的跟蹤性能,驗證了本文方法的合理性和有效性。
表2 不同調(diào)度方法下跟蹤性能對比
圖8 不同調(diào)度方法下對各目標(biāo)跟蹤的RMSE對比Fig.8 RMSE comparison of targets tracking under different scheduling methods
圖9給出了不同調(diào)度方法下總能耗對比結(jié)果??梢钥闯?本文調(diào)度方法由于在目標(biāo)函數(shù)中考慮了優(yōu)化能耗,因此所獲總能耗最低,且其相較于其他兩種方法差距很大,結(jié)合上文檢測和跟蹤的對比結(jié)果,說明本文方法能夠平衡檢測性能、跟蹤性能和能量消耗三方面表現(xiàn),從而使整體的任務(wù)收益達到最佳。
圖9 不同調(diào)度方法下總能耗對比Fig.9 Comparison of total energy consumption under different scheduling methods
本文以多移動傳感器系統(tǒng)對地面目標(biāo)探測為研究背景,同時考慮檢測和跟蹤任務(wù),提出一種考慮盲區(qū)的傳感器調(diào)度方法。首先建立了傳感器檢測模型,并結(jié)合貝葉斯風(fēng)險理論提出了檢測損失的計算方法;然后建立了考慮盲區(qū)的目標(biāo)跟蹤模型,給出了基于盲區(qū)信息輔助的目標(biāo)跟蹤算法;最后建立了傳感器調(diào)度模型,結(jié)合檢測損失、跟蹤精度和傳感器能耗等因素建立了目標(biāo)優(yōu)化函數(shù),并給出了傳感器機動方案離散化方法以減少計算復(fù)雜度。通過與隨機調(diào)度方法和僅考慮跟蹤精度的調(diào)度方法進行對比仿真可以得出,本文調(diào)度方法能夠通過合理制定傳感器調(diào)度方案,使檢測損失、跟蹤精度和控制能耗達到合理平衡,從而令系統(tǒng)的整體收益達到最優(yōu)。
在未來的工作中,需要將起伏地形、道路網(wǎng)等陸戰(zhàn)場要素考慮進傳感器調(diào)度模型中,使調(diào)度方法更具實用性。