許志剛,周 立
(淮海工學(xué)院a.理學(xué)院;b.測繪工程學(xué)院,江蘇連云港 222005)
純方位目標(biāo)跟蹤(bearings-only tracking,BOT)技術(shù)在紅外探測、無人機(jī)空中偵察、海洋中的目標(biāo)搜救等一些實(shí)際工程中具有重要的應(yīng)用價(jià)值[1-2].
由于特殊的可觀測性問題[3],被動(dòng)觀測平臺(tái)必須進(jìn)行有效的機(jī)動(dòng),才能保證系統(tǒng)存在唯一解[4].在實(shí)際應(yīng)用中,量測的角度往往受噪音的干擾,即使在系統(tǒng)可觀測情況下,估計(jì)器的性能受觀測平臺(tái)機(jī)動(dòng)軌跡的影響也非常大,具體體現(xiàn)在目標(biāo)參數(shù)估計(jì)精度、估計(jì)器穩(wěn)定性、收斂時(shí)間等指標(biāo)方面.
在研究觀測平臺(tái)機(jī)動(dòng)策略時(shí),選用不同的性能指標(biāo)會(huì)產(chǎn)生不同的機(jī)動(dòng)軌跡;從跟蹤估計(jì)目標(biāo)運(yùn)動(dòng)參數(shù)角度,大多數(shù)文獻(xiàn)選用FIM信息陣和方位變化率來研究.如文獻(xiàn)[5]選用FIM下界為性能指標(biāo),研究固定目標(biāo)定位問題中的平臺(tái)機(jī)動(dòng)軌跡;文獻(xiàn)[6]直接基于最大化FIM的行列式,用微分包含技術(shù)試圖尋找目標(biāo)定位問題的觀測平臺(tái)最優(yōu)軌跡;文獻(xiàn)[7]則選用方位變化率最大作為性能指標(biāo),推導(dǎo)出勻速直航目標(biāo)跟蹤的本載體最優(yōu)軌跡;Passerieux等[8]以變形FIM為指標(biāo),通過解析和數(shù)值迭代方法給出最佳觀測平臺(tái)機(jī)動(dòng)Euler方程.另外有文獻(xiàn)基于Cramer-Rao下界(CRLB)性能指標(biāo),利用矩陣跡最小探索觀測平臺(tái)的最優(yōu)軌跡[9].目前對(duì)運(yùn)動(dòng)目標(biāo)跟蹤問題,文獻(xiàn)大多利用批處理方法給出末端點(diǎn)平臺(tái)航向控制,且控制表達(dá)式非常繁瑣,計(jì)算復(fù)雜,不利于應(yīng)用;或者利用方位差最大指標(biāo)給出實(shí)時(shí)控制,但這種控制只考慮了方位信息,與觀測器和目標(biāo)相對(duì)距離以及速度無關(guān),達(dá)不到充分利用現(xiàn)有信息的效果.
文獻(xiàn)[10]選用最大化當(dāng)前FIM增量行列式指標(biāo)給出了定位系統(tǒng)的一種基于當(dāng)前量測的最優(yōu)控制策略.本文將上述結(jié)果推廣到遠(yuǎn)距離目標(biāo)被動(dòng)跟蹤系統(tǒng),給出當(dāng)前時(shí)刻一種新的觀測平臺(tái)航向控制策略,設(shè)計(jì)的航向機(jī)動(dòng)控制序列幾何意義明確,在工程應(yīng)用中具有可操作的借鑒價(jià)值.
傳統(tǒng)上,CRLB主要被用來估計(jì)次優(yōu)線性/非線性濾波的誤差性能[11],由于CRLB在系統(tǒng)構(gòu)建前能預(yù)測可達(dá)到的最優(yōu)理論性能指標(biāo),因此也可以利用它來進(jìn)行系統(tǒng)設(shè)計(jì).雖然CRLB批處理計(jì)算需要求取高階矩陣的逆,使得計(jì)算復(fù)雜度隨采樣時(shí)間延長越來越高[12],但Tichavsky等[13]給出離散系統(tǒng)濾波CRLB(PCRLB)遞推式,使得計(jì)算復(fù)雜度大為減小.
記Jk為濾波Fisher信息矩陣(FIM)[11],離散型濾波信息陣Jk的一個(gè)遞推計(jì)算公式[13]為
這里
假定目標(biāo)和觀測平臺(tái)都在同一平面上,觀測平臺(tái)以速率Vw,k運(yùn)動(dòng).觀測平臺(tái)動(dòng)力學(xué)方程為
初始條件
其中xw,k,yw,k分別為k時(shí)刻觀測平臺(tái)在x和y方向的坐標(biāo);Cw,k為k時(shí)刻觀測平臺(tái)運(yùn)動(dòng)航向,為控制參數(shù).
量測噪音ηk~N(0,R).
Fisher信息矩陣(FIM)為
其中
式(5)可化為
利用式(1)可得FIM遞歸式為
在BOT系統(tǒng)中,F(xiàn)IM是反映觀測平臺(tái)機(jī)動(dòng)后對(duì)目標(biāo)信息提取的度量陣.隨著量測數(shù)據(jù)的增加,F(xiàn)IM陣的全局計(jì)算量呈指數(shù)型增長,同時(shí)也不適合實(shí)時(shí)控制;在工程應(yīng)用中,k時(shí)刻觀測平臺(tái)機(jī)動(dòng)模式控制策略的選擇更具有現(xiàn)實(shí)意義.
不失一般性,第一步先研究k到k+1時(shí)刻(k>1)的觀測平臺(tái)機(jī)動(dòng)軌跡.如圖1所示,設(shè)觀測平臺(tái)在時(shí)刻k位于O點(diǎn),目標(biāo)位于A點(diǎn),在k+1時(shí)刻觀測平臺(tái)運(yùn)動(dòng)到B點(diǎn),假設(shè)觀測平臺(tái)速度在一個(gè)采樣周期內(nèi)保持不變,即從k時(shí)刻到k+1時(shí)刻速度Vw,k不變,采樣周期為T,則sk=|OB|=Vw,kT;記|OA|=rk,|BA|=rk+1,現(xiàn)要確定觀測平臺(tái)在k時(shí)刻的航向Cw,k,使得當(dāng)前信息量最大.由于從k時(shí)刻到下一采樣時(shí)刻之前僅有前k時(shí)刻的量測方位,可假定一個(gè)采樣周期內(nèi)目標(biāo)近似不動(dòng)(仍位于A).
圖1 觀測平臺(tái)與目標(biāo)的幾何態(tài)勢(shì)Fig.1 Geometric state of observer platform and target
依據(jù)貪婪法思想,盡可能使當(dāng)前信息最大,這里取最大化信息陣行列式增量為性能指標(biāo),即可歸結(jié)為求解優(yōu)化問題:
經(jīng)推導(dǎo)得
下面給出k時(shí)刻觀測平臺(tái)航向的幾何描述.
觀測平臺(tái)在k時(shí)刻測得目標(biāo)角度βk;作以O(shè)為圓心,sk=Vw,kT為半徑的圓(如圖2所示),作OD⊥OA交圓O于D點(diǎn),連AD交圓于B點(diǎn),則∠OAD=αk.作OE⊥BD,容易看出∠DOE=∠BOE=αk,且αk=βk-βk+1,所以因此觀測平臺(tái)最優(yōu)軌跡為從O點(diǎn)運(yùn)動(dòng)到B點(diǎn).如果僅就當(dāng)前量測信息,關(guān)于觀測器與目標(biāo)瞄準(zhǔn)線對(duì)稱方向還有另一個(gè)機(jī)動(dòng)軌跡,由于這里的目標(biāo)是運(yùn)動(dòng)的,對(duì)于左右兩個(gè)機(jī)動(dòng)軌跡的選擇可通過所有量測方位信息給出判斷.
圖2 當(dāng)前時(shí)刻k的觀測平臺(tái)次優(yōu)機(jī)動(dòng)航向Fig.2 Optimal maneuver heading of observer platform at current time k
當(dāng)觀測平臺(tái)到達(dá)B點(diǎn)后,此時(shí)目標(biāo)運(yùn)動(dòng)到F點(diǎn),目標(biāo)在F點(diǎn)方位被測量.觀測平臺(tái)在進(jìn)行下一個(gè)機(jī)動(dòng)控制選擇時(shí),當(dāng)采樣時(shí)間很小時(shí),可繼續(xù)將目標(biāo)看作在F點(diǎn)不動(dòng).下面討論左右支機(jī)動(dòng)策略的選擇.
考慮n時(shí)刻累計(jì)信息陣:
由目標(biāo)與觀測平臺(tái)運(yùn)動(dòng)態(tài)勢(shì),根據(jù)投影定理得
上式化簡可得
其中qm,k,qw,k分別為目標(biāo)和觀測平臺(tái)的舷角,左負(fù)右正(見圖2).
當(dāng)觀測平臺(tái)與目標(biāo)互為右舷(sin qm,k,sin qw,k均為正值)時(shí),此時(shí)0≤βk+1-βk≤π;反之,當(dāng)觀測平臺(tái)與目標(biāo)互為左舷(sin qm,k,sin qw,k均為負(fù)值)時(shí),此時(shí)-π≤βk+1-βk≤0;由于這里主要考慮遠(yuǎn)距離目標(biāo)跟蹤,當(dāng)觀測平臺(tái)與目標(biāo)相對(duì)距離的變化率很小時(shí),可忽略不計(jì),因此,若觀測平臺(tái)與目標(biāo)同舷時(shí),sin2(βiβj)取得最大值,也即max{det[(~JToln)2×2]}存在.
以圖3為例,當(dāng)目標(biāo)軌跡為P→A1→A2→A3→A4→A5時(shí),運(yùn)用機(jī)動(dòng)策略可得觀測平臺(tái)1條次優(yōu)機(jī)動(dòng)序列:O→B1→B2→B3→B4→B5.這里目標(biāo)與觀測平臺(tái)互為左舷(-π≤qm,k,qw,k≤0).同理可給出目標(biāo)與觀測平臺(tái)互為右舷的機(jī)動(dòng)序列.
圖3 觀測平臺(tái)機(jī)動(dòng)軌跡(-π≤qm,k,qw,k≤0)Fig.3 Observer platform maneuver trajectoryl(-π≤qm,k,qw,k≤0)
特別地,若目標(biāo)沿瞄準(zhǔn)線(LOS)走接近或遠(yuǎn)離觀測平臺(tái)的直線運(yùn)動(dòng),可以找到觀測平臺(tái)2條次優(yōu)機(jī)動(dòng)軌跡.圖4給出當(dāng)目標(biāo)沿LOS航向走接近觀測平臺(tái)情形下觀測平臺(tái)2支次優(yōu)機(jī)動(dòng)航向.目標(biāo)軌跡為P→A1→A2→A3→A4→A5.左支:O→B1→B2→B3→B4→B5→B6.右支:O→D1→D2→D3→D4→D5→D6.
圖4 目標(biāo)走LOS航向時(shí)觀測平臺(tái)的2支機(jī)動(dòng)軌跡Fig.4 Two observer maneuver trajectories in LOS course
給出最大化FIM行列式增量指標(biāo)下不同目標(biāo)初距、觀測平臺(tái)速度和采樣時(shí)間情形下最優(yōu)軌跡的形態(tài)變化.圖5為觀測平臺(tái)與目標(biāo)互為右舷情形下的運(yùn)動(dòng)平臺(tái)機(jī)動(dòng)軌跡.其中:目標(biāo)初始坐標(biāo)(單位:m)(0,2 000),速度8m/s,航向5π/6;觀測平臺(tái)初始位置(0,0),速度15m/s;采樣周期T=5s.圖6為觀測平臺(tái)與目標(biāo)互為左舷情形下的運(yùn)動(dòng)平臺(tái)機(jī)動(dòng)軌跡.其中:目標(biāo)初始坐標(biāo)(單位:m)(0,10 000),速度15m/s,航向7π/6;觀測平臺(tái)初始位置(0,0),速度20m/s;采樣周期T=10s.
在方位率最大指標(biāo)下機(jī)動(dòng)軌跡與平臺(tái)速度無關(guān),航向與瞄準(zhǔn)線垂直,信息提取以方位信息為唯一目的,這里信息包含距離信息和方位信息.從圖6可看出機(jī)動(dòng)軌跡隨觀測平臺(tái)速度的提高,向目標(biāo)靠近的速度相對(duì)也加快,反映了觀測平臺(tái)速度提高、機(jī)動(dòng)策略加強(qiáng)對(duì)目標(biāo)距離信息的提??;反之則更側(cè)重目標(biāo)角度信息的提取,使信噪比逐漸提高,增加信息量的獲取.
圖5 觀測平臺(tái)與目標(biāo)互為右舷Fig.5 Observer moves along starboard side of the target
圖6 觀測平臺(tái)與目標(biāo)互為左舷Fig.6 Observer moves along portside of the target
純方位目標(biāo)跟蹤系統(tǒng)觀測平臺(tái)的貪婪法機(jī)動(dòng)策略,利用當(dāng)前時(shí)刻的角度量測數(shù)據(jù),選用當(dāng)前FIM行列式增量作為指標(biāo),使得每一步選擇中都采取在當(dāng)前狀態(tài)下最好或最有利的機(jī)動(dòng)選擇.由于貪婪法的計(jì)算簡單以及所求得的結(jié)果比較接近最優(yōu)結(jié)果,所以得到的機(jī)動(dòng)控制策略更具有可操作性和實(shí)用性.傳統(tǒng)最大角度變化率絕對(duì)值指標(biāo)法,與相對(duì)距離和觀測平臺(tái)速度沒有關(guān)系,所以它更單一地以提高角度信息為主,當(dāng)量測容量達(dá)到一定飽和度時(shí),濾波效果隨時(shí)間增加將趨于平緩.貪婪法機(jī)動(dòng)軌跡隨觀測平臺(tái)速度、目標(biāo)初始距離的變化而變化,在距離信息和角度信息側(cè)重性上保持一種平衡.速度越大,相對(duì)距離越小,則機(jī)動(dòng)策略越加強(qiáng)距離信息的提取,反之則更側(cè)重加強(qiáng)角度信息的提取.在短距離目標(biāo)跟蹤中,目標(biāo)和平臺(tái)幾何態(tài)勢(shì)以及距離因素對(duì)左右支策略選擇的影響是進(jìn)一步研究的問題.
[1] BARSHALOM Y,LI Xiaolong,KIRUBARAJAN T. Estimation with Applications to Tracking and Navigation[M].New York:Wiley,2001.
[2] DENG Xinpu,WANG Qiang,ZHONG Danxing.Observability of airborne passive location system with phase difference measurements[J].Chinese Journal of Aeronautics,2008,21(2):149-154.
[3] NARDONE S C,AIDALA V J.Observability criteria for bearings-only target motion analysis[J].IEEE Transactions on Aerospace and Electronic Systems,1981,17(2):161-166.
[4] 許志剛,董志榮.純方位系統(tǒng)定位與跟蹤解的唯一性問題[J].火力與指揮控制,2002,27(4):38-42.
[5] LIU P T.An optimum approach in target tracking with bearings measurements[J].Journal of Optimization Theory and Applications,1987,56(2):205-214.
[6] OSHMAN Y,DAVIDSON P.Optimization of observer trajectories for bearings-only target localization[J]. IEEE Transactions on Aerospace and Electronic Systems,1999,35(3):892-902.
[7] 董志榮.純方位系統(tǒng)定位與跟蹤的本載體最優(yōu)軌線方程及其最優(yōu)軌線[J].指揮控制與仿真,2007,29(1):7-15.
[8] PASSERIEUX J M,VAN CAPPEL D.Optimal observer maneuver for bearings-only tracking[J].IEEE Transactions on Aerospace and Electronic Systems,1998,34(3):777-788.
[9] HELFERTY J P,MUDGETT D R.Optimal observe trajectories for bearing-only tracking by minimizing the trace of the Cramer-Rao lower bound[C]//Proceedings of the 32nd Conference on Decision and Control.San Antonlo,Texas,December,1993:936-939.
[10] 許志剛,盛安冬,陳黎,等.被動(dòng)目標(biāo)定位系統(tǒng)觀測平臺(tái)的最優(yōu)機(jī)動(dòng)軌跡[J].控制理論與應(yīng)用,2009,26(12):1337-1344.
[11] KERR T H.Status of CR-like lower bounds for nonlinear filtering[J].IEEE Transactions on Aerospace and Electronic Systems,1989,25(9):590-601.
[12] TAYLOR J H.The Cramer-Rao estimation error lower bound computation for deterministic nonlinear systems[J].IEEE Transactions on Automatic Control,1979,24(2):343-344.
[13] TICHAVSKY P,MURAVCHIK C H,NEHORAI A.Posterior Cramer-Rao bounds for discrete-time nonlinear filtering[J].IEEE Transactions on Signal Processing,1998,46(5):1386-1396.