陳方正,郝紹杰
(中國電子科技集團(tuán)公司第四十一研究所, 山東 青島 266555)
近年來隨著機(jī)載電子設(shè)備的小型化,將無人機(jī)(unmanned aerial vehicles,UAV)作為機(jī)動(dòng)觀測平臺(tái),搭載測向設(shè)備對(duì)敵方目標(biāo)進(jìn)行探測定位成為重要的發(fā)展方向。機(jī)動(dòng)單站測向定位是指單個(gè)觀測站通過機(jī)動(dòng),在不同位置測得目標(biāo)方位角信息并結(jié)合某種估計(jì)算法實(shí)現(xiàn)對(duì)目標(biāo)的快速定位和跟蹤[1]。利用UAV等單觀測站進(jìn)行測向定位航跡優(yōu)化問題的本質(zhì)是研究如何通過優(yōu)化觀測平臺(tái)的運(yùn)動(dòng)軌跡來提升對(duì)目標(biāo)預(yù)測的可觀測性問題[2-5]。然而以往這些研究大多基于理想飛行空間,缺乏復(fù)雜環(huán)境因素對(duì)優(yōu)化航跡影響的考量。因此近年來,結(jié)合飛行環(huán)境因素進(jìn)行測向定位航跡優(yōu)化成為研究的熱點(diǎn)。其中,文獻(xiàn)[6-7]在飛行環(huán)境中引入了威脅模型,文獻(xiàn)[8]則研究了飛行環(huán)境中的靜、動(dòng)障礙和雷達(dá)探測對(duì)定位航跡的影響。不過這些環(huán)境模型通常較為簡單,距離實(shí)用仍有一定差距,并且沒有考慮環(huán)境對(duì)電磁信號(hào)傳播的影響,從而限制了其實(shí)際應(yīng)用,特別是在復(fù)雜城市環(huán)境中的應(yīng)用。
在城市環(huán)境中,大量建筑物的存在將會(huì)對(duì)目標(biāo)形成遮擋和空域限制,使得對(duì)城市環(huán)境中的目標(biāo)定位和跟蹤成為一個(gè)極具挑戰(zhàn)性的課題。美國空軍研究實(shí)驗(yàn)室的COUNTER(cooperative operations in urban terrain)項(xiàng)目開展了協(xié)同多UAV實(shí)現(xiàn)對(duì)城市環(huán)境中目標(biāo)偵查和跟蹤的研究[9]。Shaferman等考慮城市環(huán)境中的空域限制和地形遮擋,以目標(biāo)觀測總時(shí)間為評(píng)價(jià)函數(shù),使用遺傳算法求解多架UAV對(duì)目標(biāo)跟蹤的協(xié)同規(guī)劃問題,但是該方法為一種離線規(guī)劃方法,并且假設(shè)目標(biāo)運(yùn)動(dòng)規(guī)律已知[10]。王林等提出一種基于主動(dòng)感知的多UAV協(xié)作式目標(biāo)跟蹤問題求解框架,采用分布式無色信息濾波實(shí)現(xiàn)融合目標(biāo)狀態(tài)估計(jì)和預(yù)測,根據(jù)城市地物信息計(jì)算目標(biāo)可視區(qū)域,結(jié)合隨機(jī)搜索與滾動(dòng)時(shí)域控制實(shí)現(xiàn)城市環(huán)境中多UAV在線協(xié)同目標(biāo)跟蹤[11]。Yu等假設(shè)目標(biāo)運(yùn)動(dòng)為Markov過程,實(shí)現(xiàn)了使用UAV和無人車協(xié)同跟蹤城市中的運(yùn)動(dòng)目標(biāo)[12]。Yao等考慮城市環(huán)境中的遮擋、空間約束、UAV動(dòng)力學(xué)約束及其探測范圍等約束,基于模型預(yù)測控制框架,求解多UAV協(xié)同跟蹤目標(biāo)的問題[13]。Oh等根據(jù)目標(biāo)估計(jì)位置計(jì)算三維視距(line-of-sight, LOS)通信區(qū)域,作為UAV盤旋區(qū)域,保證了已知合作目標(biāo)在城市中運(yùn)動(dòng)時(shí)與UAV之間保持無遮擋[14]。Bhagat等提出一種基于深度強(qiáng)化學(xué)習(xí)的目標(biāo)跟蹤算法,實(shí)現(xiàn)單UAV在城市環(huán)境中跟蹤運(yùn)動(dòng)目標(biāo),并考慮了目標(biāo)運(yùn)動(dòng)的隨機(jī)性[15]。胡超芳等考慮建筑物對(duì)無人機(jī)視線的遮擋等因素,采用基于分布式預(yù)測控制的模糊多目標(biāo)航跡規(guī)劃方法解決城市環(huán)境中多無人機(jī)協(xié)同追蹤地面目標(biāo)問題[16-17]。劉大千等針對(duì)未知城市環(huán)境下的目標(biāo)搜索問題,構(gòu)建了基于信息共享代價(jià)和區(qū)域覆蓋收益的協(xié)同優(yōu)化模型,利用群智能方法求解,使得平均目標(biāo)發(fā)現(xiàn)成功率和區(qū)域覆蓋率均有明顯提升[18]。但是在上述研究中,UAV通常采用光電設(shè)備對(duì)目標(biāo)進(jìn)行探測和跟蹤,目標(biāo)在UAV探測視場內(nèi)即認(rèn)為滿足觀測要求。而對(duì)于城市環(huán)境中輻射源目標(biāo)的定位問題來說,由于建筑物對(duì)電磁信號(hào)存在反射、繞射和散射效應(yīng),城市環(huán)境中電磁信號(hào)傳播存在顯著的LOS和非視距(non-line-of-sight, NLOS)信號(hào)混合的情況,存在多徑干擾,嚴(yán)重降低定位算法的性能和精度[19]。目前無論采用何種定位體制,針對(duì)LOS/NLOS混合環(huán)境下對(duì)輻射源目標(biāo)的定位問題,常見的手段仍是從數(shù)據(jù)處理的角度入手,主要包括NLOS鑒別與消除方法[20-21]、基于NLOS傳播模型的方法[1,22-23]、基于射線跟蹤的定位方法[24]以及間接濾波方法[25-26]等。然而目前不管采用何種方法,由于NLOS引起的參數(shù)估計(jì)誤差受實(shí)際環(huán)境影響較大,所以并不存在普適的算法完全消除NLOS誤差。文獻(xiàn)[27]考慮全球定位系統(tǒng)(global positioning system,GPS)衛(wèi)星信號(hào)在城市中的多徑效應(yīng)對(duì)其定位誤差的影響,規(guī)劃UAV航跡時(shí)考慮選擇定位精度較高的區(qū)域,為城市環(huán)境中單UAV測向定位航跡優(yōu)化提供了思路。
因此,本文針對(duì)城市環(huán)境中輻射源目標(biāo)的測向定位問題,提出了基于環(huán)境預(yù)測的單站測向定位航跡優(yōu)化算法,以單架UAV作為機(jī)動(dòng)平臺(tái),基于滾動(dòng)時(shí)域控制框架,在線生成滿足UAV運(yùn)動(dòng)學(xué)約束的預(yù)測航跡,根據(jù)當(dāng)前估計(jì)目標(biāo)位置和已知環(huán)境信息,預(yù)測信號(hào)遮擋區(qū)和NLOS信號(hào)干擾區(qū),構(gòu)建預(yù)測航跡評(píng)價(jià)函數(shù),使UAV盡量在無遮擋和干擾的空域內(nèi)進(jìn)行測向定位飛行,以改善測向信號(hào)的質(zhì)量和連續(xù)性,同時(shí)考慮躲避建筑障礙,進(jìn)而從全新的角度解決單架UAV在復(fù)雜城市環(huán)境下的精確測向定位問題。
三維空間中單UAV測向定位示意圖如圖1所示。其中Oxyz為地面慣性坐標(biāo)系;XT=[xT,yT,zT]T為待定位目標(biāo);XU,k=[xU,k,yU,k,zU,k,ψU,k]T為UAV狀態(tài)向量,Vk為其速度矢量,下標(biāo)k為時(shí)間步,ηk為其觀測的XT的方位角。
圖1 測向定位示意圖Fig.1 Illustration for bearings-only target localization
UAV離散形式運(yùn)動(dòng)學(xué)模型為:
(1)
在本文中,假設(shè)XT位于地面且靜止,即zT=0 m,UAV僅能測量XT的方位角ηk,不考慮過程噪聲,選取XT=[xT,yT]T為待估計(jì)的狀態(tài)變量,則由圖1可知,理想觀測環(huán)境下UAV對(duì)XT的方位觀測方程可表示為:
(2)
式中,εk是均值為μ、方差為σ2的高斯白噪聲序列。
1.2.1 建筑物對(duì)飛行空域的限制
UAV在城市環(huán)境中安全飛行,首先需要保證的是其不能與建筑物等障礙物發(fā)生碰撞。本文中使用幾何體表示建筑物,UAV在飛行過程中時(shí)刻需要對(duì)這些建筑物進(jìn)行躲避,避免與其相撞,即滿足:
(3)
式中,ABuild為建筑物占據(jù)總空間,Bj為第j個(gè)障礙物占據(jù)的三維空間,Q為障礙物總數(shù)量。此外,對(duì)于小型UAV來說,受其性能影響,其最大飛行高度有限,從安全角度考慮飛行高度也不宜過低,因此需將其飛行高度限制在一定范圍內(nèi),即滿足:
hmin≤zU,k≤hmax
(4)
式中,hmin、hmax分別為UAV最小、最大飛行高度。
1.2.2 建筑物對(duì)電磁信號(hào)傳播的影響
本文僅考慮建筑物對(duì)電磁信號(hào)的遮擋和反射效應(yīng),基于射線追蹤法[28]計(jì)算信號(hào)傳播路徑。為表示直觀,以二維形式表示,如圖2所示,容易推廣到三維空間。當(dāng)UAV處于X′U,k位置時(shí),受建筑物遮擋,此時(shí)UAV無法接收到由XT發(fā)出的電磁信號(hào),因而無法測量XT方位。所有XT受到遮擋的位置集合稱為信號(hào)遮擋區(qū),表示為AShadow。根據(jù)文獻(xiàn)[29],多徑現(xiàn)象干擾的原理為:當(dāng)UAV處于XU,k位置時(shí),XT發(fā)射的電磁信號(hào)經(jīng)由建筑物反射形成NLOS信號(hào),與LOS信號(hào)疊加,使UAV測量的ηk偏離實(shí)際值,進(jìn)而產(chǎn)生多徑干擾,影響UAV測向定位的精度。
圖2 建筑物對(duì)電磁信號(hào)傳播的影響Fig.2 Influence of buildings on electromagnetic signal propagation
疊加信號(hào)的場強(qiáng)矢量由式(5)計(jì)算[29]。
(5)
式中,ELOS為LOS信號(hào)場強(qiáng)矢量,ENLOS,i為第i路NLOS信號(hào)場強(qiáng)矢量,M為NLOS信號(hào)路徑個(gè)數(shù)。場強(qiáng)大小計(jì)算如式(6)所示。
(6)
式中,P為天線發(fā)射功率,DLOS和DNLOS,i分別為天線在各路徑方向的方向性系數(shù),rLOS為LOS路徑距離,rNLOS,i為NLOS路徑距離,R2為反射面對(duì)電磁信號(hào)的反射率。 所有存在NLOS信號(hào)的位置集合稱為信號(hào)反射區(qū),表示為ANLOS。
采用參考文獻(xiàn)[28]所述的射線追蹤法計(jì)算AShadow和ANLOS。 為了簡化算法,電磁信號(hào)的傳播僅考慮一次反射。AShadow計(jì)算如式(7)所示。
(7)
其中,AShadow,s為XT關(guān)于建筑可見墻面s的信號(hào)遮擋區(qū),是由頂點(diǎn)圍成的多面體,根據(jù)射線傳播原理,其頂點(diǎn)坐標(biāo)為:
Xshadow,s={X|X=Xs,i,X=l(Xs,i-XT),i=1,2,3,4}
(8)
式中:Xs,i為墻面s的第i個(gè)頂點(diǎn)坐標(biāo);l為比例因子,為使AShadow影響距離足夠遠(yuǎn),令l=50。同理,ANLOS由式(9)計(jì)算:
(9)
其中,ANLOS,s為墻面s的信號(hào)反射區(qū),也是由頂點(diǎn)圍成的多面體,其頂點(diǎn)坐標(biāo)為:
XNLOS,s={X|X=Xs,i,X=l(Xs,i-X′T,s),i=1,2,3,4}
(10)
式中,X′T,s為XT關(guān)于墻面s的鏡像點(diǎn),根據(jù)空間幾何容易得到。
本文從LOS/NLOS混合環(huán)境下定位算法和基于環(huán)境預(yù)測的航跡優(yōu)化算法兩個(gè)方面解決UAV在城市環(huán)境中對(duì)輻射源目標(biāo)定位的問題。
交互多模型(interacting multiple model,IMM)與濾波技術(shù)相結(jié)合,可改善LOS/NLOS混合環(huán)境下的定位算法性能[30]。IMM算法無須對(duì)LOS/NLOS進(jìn)行鑒別,而是通過濾波模型的模型概率對(duì)LOS/NLOS進(jìn)行概率估計(jì),進(jìn)而加權(quán)融合,在一定程度上避免了基于鑒別的算法中鑒別不準(zhǔn)引起的誤差[31]。通??梢越普J(rèn)為NLOS信號(hào)與LOS信號(hào)在噪聲特性上不同[30],因此本文采用IMM算法框架和擴(kuò)展卡爾曼濾波(extended Kalman filter, EKF)結(jié)合的IMM-EKF算法,通過對(duì)LOS和NLOS條件下觀測噪聲模型的改造,實(shí)現(xiàn)定位過程中多模型的融合和自適應(yīng)調(diào)整,改善LOS/NLOS混合環(huán)境下的測向定位算法的穩(wěn)定性。IMM-EKF算法流程參見文獻(xiàn)[25]。由于目標(biāo)靜止,本文中各EKF濾波器均采用相同的預(yù)測模型,但是對(duì)于不同的觀測信號(hào)狀態(tài),采用不同的觀測噪聲模型,如式(11)~(12)所示。
(11)
(12)
UAV在城市環(huán)境中飛行并對(duì)電磁輻射源目標(biāo)XT進(jìn)行測向定位時(shí),首先要保證其不與建筑發(fā)生碰撞,其次需要XT與UAV之間保持LOS,同時(shí)需要盡量減小NLOS信號(hào)對(duì)測向精度的影響,才能確保最終定位的精度。然而在XT未知的前提下,單架UAV僅依賴實(shí)際測量數(shù)據(jù)難以獲得整個(gè)城市環(huán)境中的電磁場分布,無法選擇有利的位置進(jìn)行測向,并且由于NLOS信號(hào)引起的觀測誤差受實(shí)際環(huán)境影響較大,單純從數(shù)據(jù)處理著手無法完全消除NLOS信號(hào)帶來的估計(jì)誤差。實(shí)際上由于建筑物尺寸是有限的,因此其對(duì)信號(hào)的遮擋和反射的影響區(qū)域也是有限的,在城市環(huán)境中總是存在較為理想的LOS信號(hào)區(qū)域,UAV在該區(qū)域內(nèi)測向精度較高。
圖3 基于環(huán)境預(yù)測的單UAV測向定位航跡優(yōu)化示意圖Fig.3 Trajectory optimization illustration of single UAV for bearings-only target localization based on environmental prediction
本文以Fisher信息矩陣(Fisher information matrix, FIM)行列式最大作為UAV測向定位航跡優(yōu)化的準(zhǔn)則以提高對(duì)XT的定位精度。文獻(xiàn)[32]推導(dǎo)了無過程噪聲條件下FIM的遞推計(jì)算方法:
(13)
式中,Φk+1|k為XT狀態(tài)轉(zhuǎn)移矩陣,XT靜止,故
(14)
FIMk為Fisher信息矩陣,Rk為觀測噪聲序列εk的協(xié)方差矩陣,Hk為觀測方程h(·) 的雅可比矩陣,表達(dá)式為
(15)
(16)
(17)
UAV應(yīng)盡量避免進(jìn)入ABuild和AShadow區(qū)域。因此采用式(18)所述評(píng)價(jià)函數(shù),以未進(jìn)入上述區(qū)域的最大預(yù)步數(shù)為評(píng)價(jià)函數(shù)。
(18)
UAV可以進(jìn)入NLOS測向區(qū),但是NLOS導(dǎo)致的多徑干擾會(huì)影響UAV測向定位的精度,因此應(yīng)盡量減少在ANLOS中的停留時(shí)間,評(píng)價(jià)函數(shù)如式(19)所示。
(19)
綜合考慮定位、避障、信號(hào)遮擋和信號(hào)多徑干擾等因素,一條航跡的總評(píng)價(jià)函數(shù)為:
Jp=c1JFIM,p+c2JT,p+c3JNLOS,p
(20)
J=[J1,J2,…,Jp]T
(21)
具體算法流程如算法1所示。
O(B)+O(1)+O(S2(n+nB+1))+O(S2)=O(S2nB)
(22)
由式(22)可知,本文算法復(fù)雜度對(duì)于S、n和B來說屬于多項(xiàng)式復(fù)雜度,雖問題規(guī)模增加,但時(shí)間非爆炸式增長。
(23)
圖4 航跡對(duì)比Fig.4 Flight path comparison
三種航跡最終定位精度如表1所示,其中航跡1評(píng)價(jià)函數(shù)最為全面,定位精度最高。圖4為UAV某次定位航跡,圖中AShadow和ANLOS根據(jù)XT實(shí)際位置計(jì)算,圖5為平均定位誤差收斂過程。由圖4和圖5可知,由于航跡3只考慮了定位評(píng)價(jià)因素,UAV在定位過程中首先進(jìn)入AShadow,導(dǎo)致XT被遮擋,此時(shí)濾波算法不再更新,RMSEk保持固定值(80≤k≤120)。航跡3的末端進(jìn)入ANLOS,由于NLOS信號(hào)的干擾,UAV最終定位精度受到一定程度的影響。航跡2添加了JT,p評(píng)價(jià)因素,使得UAV在飛行過程中通過機(jī)動(dòng)避開了AShadow,有效改善了XT被遮擋的問題,并且在機(jī)動(dòng)過程中沒有與建筑物發(fā)生碰撞,同時(shí)說明了避障約束的有效性。但是UAV沿航跡2飛行,更早地進(jìn)入ANLOS,在ANLOS中不同位置NLOS信號(hào)的干擾強(qiáng)度也不盡相同,航跡2相比于航跡3定位精度受到NLOS信號(hào)更強(qiáng)烈的影響, IMM-EKF濾波器雖然不致發(fā)散但是導(dǎo)致航跡2末段RMSEk不降反升,誤差最大。航跡1由于考慮了JT,p、JNLOS,p評(píng)價(jià)因素,因此在飛行定位過程中,首先類似于航跡2通過機(jī)動(dòng)避開了ABuild和AShadow,保持XT未被遮擋,同時(shí)也避免了UAV在航跡末端進(jìn)入ANLOS,進(jìn)而使其不受到NLOS信號(hào)的影響,因此最終定位精度最高。
圖5 平均定位誤差收斂過程Fig.5 Convergence process of RMSE
本文針對(duì)城市復(fù)雜環(huán)境下的單UAV對(duì)輻射源目標(biāo)的測向定位問題,提出了一種基于環(huán)境預(yù)測的定位航跡優(yōu)化算法。該方法以單架UAV作為機(jī)動(dòng)觀測平臺(tái),使用IMM-EKF濾波改善LOS/NLOS混合環(huán)境下目標(biāo)估計(jì)算法的穩(wěn)定性,基于滾動(dòng)時(shí)域控制框架生成滿足UAV運(yùn)動(dòng)學(xué)約束的預(yù)測軌跡,以Fisher信息矩陣行列式最大為定位準(zhǔn)則,同時(shí)基于當(dāng)前估計(jì)的目標(biāo)位置和城市環(huán)境模型,預(yù)測信號(hào)遮擋區(qū)域和NLOS干擾區(qū)域,并對(duì)UAV預(yù)測航跡進(jìn)行評(píng)價(jià),生成最優(yōu)控制指令,控制UAV盡量在無遮擋和干擾的空域內(nèi)進(jìn)行測向定位飛行,進(jìn)而改善測向信號(hào)的質(zhì)量和連續(xù)性,提高定位精度。仿真結(jié)果表明,本文所述算法能夠有效解決城市環(huán)境中測向定位面臨的避障、目標(biāo)遮擋和NLOS信號(hào)干擾問題,使UAV在復(fù)雜的城市環(huán)境下依然能夠完成高精度測向定位任務(wù)。