(杭州電子科技大學(xué)信息與控制研究所,浙江 杭州310018)
隨著現(xiàn)代戰(zhàn)爭(zhēng)環(huán)境日益復(fù)雜,防空預(yù)警體系通過配置多個(gè)傳感器組網(wǎng)進(jìn)行協(xié)同探測(cè),可提高對(duì)目標(biāo)的探測(cè)和跟蹤效果[1]。在跟蹤系統(tǒng)中引入傳感器管理是在跟蹤性能和系統(tǒng)資源之間建立一種平衡,以達(dá)到系統(tǒng)整體性能最優(yōu)[2]。傳感器管理技術(shù)的核心問題是依據(jù)一定的準(zhǔn)則,對(duì)傳感器資源進(jìn)行優(yōu)化分配[3]。目前主要有基于線性規(guī)劃論[4]、基于信息論和基于協(xié)方差控制[5-7]的傳感器管理方法。但是由于組網(wǎng)中傳感器數(shù)目的增加,帶來傳感器選擇算法計(jì)算量過大的問題。于是便有了貪婪算法[5]的提出,但是該算法對(duì)傳感器的選取過于保守,導(dǎo)致頻繁選擇了精度過高的傳感器。本文提出了一種快速多傳感器選擇算法。本方法以控制協(xié)方差水平的思想對(duì)傳感器進(jìn)行管理,在線通過每次選取期望最接近期望增益的傳感器形成探測(cè)某目標(biāo)的傳感器組合,在滿足目標(biāo)跟蹤精度的前提下,減少了算法的計(jì)算量。
目標(biāo)的運(yùn)動(dòng)方程和量測(cè)方程為X(k)=FX(k-1)+Gw(k-1)和Zi(k)=HiX(k)+vi(k)。其中i=1,…,N,X(k)是k時(shí)刻的目標(biāo)狀態(tài)向量,Zi(k)是k時(shí)刻傳感器i 對(duì)目標(biāo)的量測(cè)值,w(k)是系統(tǒng)噪聲,vi(k)是第i個(gè)傳感器的量測(cè)誤差,都是高斯噪聲且均值為零。Q和Ri是相應(yīng)的協(xié)方差矩陣。F為狀態(tài)轉(zhuǎn)移矩陣,G為輸入分布矩陣,Hi為傳感器i的觀測(cè)矩陣,N為跟蹤系統(tǒng)中的傳感器個(gè)數(shù)。對(duì)于這樣一個(gè)系統(tǒng),傳感器的組合數(shù)可以達(dá)到2N-1種。假設(shè)第s個(gè)傳感器組合用Ds表示,每個(gè)組合中的個(gè)數(shù)用Ns表示,那么對(duì)于給定的第s個(gè)組合,其序貫卡爾曼濾波的主要過程為:先對(duì)第一個(gè)傳感器做一次卡爾曼濾波,接著從第二個(gè)傳感器開始依次將前一個(gè)傳感器的濾波結(jié)果,即狀態(tài)估計(jì)值作為下一個(gè)傳感器濾波的預(yù)測(cè)值。
在多傳感器跟蹤融合中,協(xié)方差的遞推更新表達(dá)式如下:
狀態(tài)估計(jì)的更新過程通常采用上述的逆協(xié)方差形式,這種形式又稱為信息矩陣。定義傳感器組合Ds的信息增益Js為:
由式(2)可知,在不同的觀測(cè)噪聲下,各傳感器的信息增益不同。
在組網(wǎng)系統(tǒng)中,傳感器資源相對(duì)比較豐富,所以對(duì)系統(tǒng)內(nèi)的傳感器資源在跟蹤模式下做選擇時(shí)很有必要的。一方面可以提高組網(wǎng)的跟蹤性能,另一方面在滿足跟蹤精度的要求下,可節(jié)省系統(tǒng)資源。
然而使式(3)達(dá)到最小的傳感器組合并不一定是控制實(shí)際協(xié)方差逼近期望協(xié)方差的最優(yōu)傳感器組合。為此,采用基于協(xié)方差控制的策略進(jìn)行傳感器分配傳感器資源,其基本思想是對(duì)每個(gè)目標(biāo)預(yù)先設(shè)定一個(gè)期望的跟蹤精度Pd(k),即期望協(xié)方差陣,控制傳感器在某種度量及準(zhǔn)則下使實(shí)際協(xié)方差在某種意義上逼近Pd(k)。目標(biāo)函數(shù)為:
傳感器選擇問題可描述為一個(gè)組合優(yōu)化問題。以前對(duì)于傳感器組合的選擇一般都需要遍歷組網(wǎng)中所有的傳感器組合,假設(shè)組網(wǎng)中有N個(gè)傳感器,那么遍歷步長則為2N-1步,其計(jì)算復(fù)雜度為O(2Nn3)。所以增加組網(wǎng)中的傳感器數(shù)量,計(jì)算量會(huì)顯著增加,全遍歷尋優(yōu)方式存在組合爆炸問題。為了減少計(jì)算量,本文提出一種貪婪啟發(fā)式算法,算法的主要思想是基于期望信息增益的思想,每次選取一個(gè)“最佳”的傳感器形成探測(cè)某目標(biāo)的傳感器組合,通過一系列的貪婪選擇當(dāng)前狀態(tài)下的最優(yōu)選擇,逐步逼近給定的目標(biāo),直到滿足跟蹤精度要求。
算法結(jié)合協(xié)方差控制傳感器管理方法的概念,引入“期望信息增益”概念,動(dòng)態(tài)計(jì)算各傳感器的期望信息增益,根據(jù)式(2)可計(jì)算出各傳感器觀測(cè)目標(biāo)時(shí)的信息增益:
根據(jù)各傳感器接近期望信息增益的程度對(duì)傳感器進(jìn)行排序,在線通過每次選取期望最接近期望增益的傳感器形成探測(cè)某目標(biāo)的傳感器組合。排序目標(biāo)函數(shù)如下:
根據(jù)每個(gè)時(shí)刻的排序結(jié)果,利用協(xié)方差思想可以選出當(dāng)前時(shí)刻使的對(duì)角陣的最小值大于零的傳感器組合D(k),這便是當(dāng)前時(shí)刻作為濾波跟蹤的傳感器組合。
與傳統(tǒng)協(xié)方差控制相比,本方法中待選的傳感器組合數(shù)為M個(gè),而傳統(tǒng)協(xié)方差控制中待選傳感器組合個(gè)數(shù)為2M-1。同時(shí)本算法無需遍歷所有傳感器組合,當(dāng)某種組合下跟蹤精度滿足時(shí),停止搜索。本算法保證在滿足跟蹤精度的前提下,大大減小了計(jì)算量。克服了基于信息論傳感器管理方法片面追求信息量最大的缺點(diǎn),滿足系統(tǒng)對(duì)跟蹤精度要求的前提下,可以盡可能地節(jié)省資源。
仿真場(chǎng)景參考文獻(xiàn)[8]。將本文提出的快速啟發(fā)式算法與傳統(tǒng)協(xié)方差控制算法和貪婪算法進(jìn)行比較,使用Monte Carlo仿真,仿真測(cè)試為50次。經(jīng)過50次Monte Carlo仿真,貪婪算法和快速啟發(fā)式算法的平均計(jì)算時(shí)間為0.001 1 s和0.001 4 s,而傳統(tǒng)的協(xié)方差控制算法的平均耗時(shí)為0.499 5 s,可以發(fā)現(xiàn)算法在減少計(jì)算量上取得了明顯的效果。
3種算法各時(shí)刻的雷達(dá)選擇情況如圖1所示。由圖1可知傳統(tǒng)協(xié)方差控制算法在傳感器選擇上出現(xiàn)明顯的切換情況,貪婪算法在穩(wěn)定后沒有出現(xiàn)切換,快速啟發(fā)式算法在穩(wěn)定后傳感器2和6 之間有切換。而且在前50 s 快速啟發(fā)式算法比貪婪算法只多選了一個(gè)傳感器,在后50 s 快速啟發(fā)式算法雖然與傳統(tǒng)協(xié)方差控制算法都選擇了5個(gè)傳感器,但是明顯穩(wěn)定了許多。
3種算法的濾波協(xié)方差與期望協(xié)方差的一個(gè)相互比較如圖2所示,控制效果最好的自然是傳統(tǒng)的協(xié)方差控制算法,但是它的耗時(shí)大大降低了其實(shí)用性。其他兩種算法中,都具有耗時(shí)短實(shí)用性強(qiáng)的特點(diǎn),但是快速啟發(fā)式算法的協(xié)方差控制效果與期望的差距明顯小于貪婪算法,控制效果的提高體現(xiàn)了在選擇最好傳感器的準(zhǔn)則的改變是可行的。
圖1 3種算法各時(shí)刻的雷達(dá)選擇情況
圖2 3種算法的位置協(xié)方差比較
傳統(tǒng)的協(xié)方差控制算法由于計(jì)算量太大常不能應(yīng)用于實(shí)際系統(tǒng)中,貪婪算法和快速啟發(fā)式算法降低了傳感器選擇算法中計(jì)算的復(fù)雜度,具有很強(qiáng)實(shí)用性,這也是降低傳感器選擇算法的一種趨勢(shì)。在這個(gè)趨勢(shì)下,可以通過選取某種更好地貪婪準(zhǔn)則使其即快速又準(zhǔn)確的選擇與最優(yōu)組合更接近的傳感器組合。本文討論的多傳感器快速選擇算法比貪婪算法增加計(jì)算量很少,并且可以找到一個(gè)更優(yōu)的傳感器組合,使濾波協(xié)方差更接近期望協(xié)方差水平。所以它具有貪婪算法的計(jì)算效率,同時(shí)獲得比貪婪算法具有更好性能。
[1]葉朝謀,丁建江,李庭勝,等.雷達(dá)探測(cè)資源管理技術(shù)分析與評(píng)估[J].現(xiàn)代雷達(dá),2012,34(3):6-11.
[2]田康生,朱光喜.目標(biāo)跟蹤中的傳感器管理[J].傳感器技術(shù),2003,22(3):27-29.
[3]何友,王國宏,關(guān)欣.信息融合理論及應(yīng)用[M].北京:電子工業(yè)出版社,2010:444-447.
[4]Xiong N,Svensson P.Multi-sensor management for information fusion:issues and approaches[J].Information Fusion,2002,3(2):163-186.
[5]Kalandros M,Pao L Y.Controlling Target Estimate Covariance in Centralized Multisensor Systems[C].Philadelphia:American Automatic Control Council,1998:2 749-2 753.
[6]周文輝,胡衛(wèi)東,余安喜,等.基于協(xié)方差控制的集中式傳感器分配算法研究[J].電子學(xué)報(bào),2003,31(12):2 158-2 162.
[7]楊秀珍,何友,鞠傳文.基于跟蹤精度控制的傳感器管理方法研究[J].電光與控制,2005,12(1):9-11.
[8]韓海峰,周文輝,陳國海.目標(biāo)跟蹤中期望協(xié)方差控制的分布式多傳感器管理[J].現(xiàn)代雷達(dá),2007,29(1):47-51.