鐘昊
摘要:多無(wú)人機(jī)協(xié)同無(wú)源定位移動(dòng)輻射源目標(biāo),需要實(shí)時(shí)優(yōu)化調(diào)整多機(jī)組合航向,不斷追求多機(jī)與目標(biāo)之間的動(dòng)態(tài)最優(yōu)構(gòu)型,以提高和穩(wěn)定定位精度。針對(duì)傳統(tǒng)集中式優(yōu)化方法由于航向計(jì)算時(shí)延和信息分發(fā)時(shí)延造成的定位精度低和穩(wěn)定性差,本文提出一種多機(jī)航向協(xié)同自主生成方法,通過(guò)離線(xiàn)構(gòu)建多樣化構(gòu)型和最優(yōu)航向數(shù)據(jù)集,基于圖神經(jīng)網(wǎng)絡(luò)離線(xiàn)機(jī)器學(xué)習(xí)組合航向與最優(yōu)構(gòu)型下的隱式規(guī)則,線(xiàn)上各無(wú)人機(jī)航向決策神經(jīng)網(wǎng)絡(luò)基于一致實(shí)時(shí)態(tài)勢(shì),自主預(yù)測(cè)本機(jī)航向和協(xié)同生成最優(yōu)航向組合。仿真驗(yàn)證表明,該方法相對(duì)于傳統(tǒng)方法能夠更快達(dá)到更高定位精度,且提高了定位跟蹤穩(wěn)定性。
Abstract: In order to improve and stabilize the positioning accuracy, it is necessary to optimize and adjust the Multi-UAV combination heading in real time, and constantly pursue the dynamic optimal configuration between the Multi-UAV and the target. In view of the low positioning precision and poor stability caused by the time delay and information distribution delay of the traditional centralized optimization method, a Multi-UAV combination heading cooperative autonomous generation method is proposed in this paper. The multiple configurations and optimal heading data sets are constructed off line, and the combination course and the optimal structure are machine learned off-line based on the graph neural network. Under the implicit rule, the line decision neural network based on the unmanned aerial vehicle (UAV) is based on the consistent real time situation and independently predicts the course direction and cooperative generation of the optimal course combination. Simulation results show that the proposed method can achieve higher positioning accuracy and improve the stability of location tracking compared with traditional methods.
關(guān)鍵詞:多機(jī)無(wú)源定位;航向自主生成;圖神經(jīng)網(wǎng)絡(luò);動(dòng)態(tài)構(gòu)型;克拉羅美下界
Key words: multi-UAV passive location;autonomous generation heading;graph neural network;dynamic configuration;Cramer-Rao Lower Bound
中圖分類(lèi)號(hào):V24;TP3? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1006-4311(2020)12-0254-05
0? 引言
隨著無(wú)人機(jī)集群技術(shù)、現(xiàn)代電子戰(zhàn)技術(shù)和航空通信技術(shù)的迅猛發(fā)展,多無(wú)人機(jī)對(duì)移動(dòng)信號(hào)輻射源目標(biāo)進(jìn)行無(wú)源協(xié)同定位,在軍事偵察、環(huán)境監(jiān)測(cè)、反恐維穩(wěn)和應(yīng)急救援諸多領(lǐng)域具有巨大應(yīng)用潛力。在運(yùn)動(dòng)狀態(tài)下,多無(wú)人機(jī)與目標(biāo)的之間的動(dòng)態(tài)構(gòu)型,即各無(wú)人機(jī)與目標(biāo)之間的實(shí)時(shí)距離,以及任意兩架無(wú)人機(jī)與目標(biāo)之間的實(shí)時(shí)角度,直接影響多機(jī)協(xié)同無(wú)源定位精度以及穩(wěn)定跟蹤效果。如何在線(xiàn)生成各無(wú)人機(jī)實(shí)時(shí)航向指令,實(shí)現(xiàn)多無(wú)人機(jī)與目標(biāo)之間的最優(yōu)動(dòng)態(tài)構(gòu)型,從而提高無(wú)源定位精度和跟蹤穩(wěn)定性,成為熱點(diǎn)研究問(wèn)題之一[1-2]。
當(dāng)前針對(duì)面向無(wú)源定位的多機(jī)航向動(dòng)態(tài)生成問(wèn)題,主要采用集中式實(shí)時(shí)優(yōu)化方法(Centralized Real-Time Optimization,CRTO)[3-6],基于測(cè)角、測(cè)頻或測(cè)TOA等無(wú)源定位方式,獲得目標(biāo)位置估計(jì)值后,以卡拉美羅下界卡拉羅美下界(Cramer-Rao Lower Bound,CRLB)[7]為定位精度指標(biāo),并假設(shè)環(huán)境電磁噪聲服從高斯分布,然后實(shí)時(shí)計(jì)算搜索下一時(shí)刻CRLB最小的多機(jī)組合航向,最后逆推各無(wú)人機(jī)當(dāng)前航向指令。該方法存在兩個(gè)問(wèn)題,一是無(wú)源定位精度對(duì)組合航向敏感,需要對(duì)航向粒度進(jìn)行細(xì)致劃分,隨著無(wú)人機(jī)數(shù)量增多,可選組合航空決策變量空間呈指數(shù)增加,從而導(dǎo)致計(jì)算延時(shí)過(guò)大,難以滿(mǎn)足對(duì)高速移動(dòng)目標(biāo)定位需求;二是需要對(duì)所有無(wú)人機(jī)的航向指令進(jìn)行集中計(jì)算,然后分發(fā)給各無(wú)人機(jī),增加了通信延時(shí),且存在中心節(jié)點(diǎn),在作戰(zhàn)環(huán)境下,造成無(wú)人機(jī)集群抗毀性差。
針對(duì)CRTO方法存在的問(wèn)題,本文提出分布式協(xié)同自主生成方法(Distributed Cooperative and Autonomous Generation Approach,DCAG),即基于自組織協(xié)同思想和機(jī)器學(xué)習(xí)方法[8-9],為每架無(wú)人機(jī)最優(yōu)航向決策構(gòu)建均構(gòu)建一個(gè)多隱含層神經(jīng)網(wǎng)絡(luò),并大樣本仿真多無(wú)人機(jī)與目標(biāo)的不同構(gòu)型數(shù)據(jù)集和離線(xiàn)搜索最優(yōu)航向標(biāo)簽集,實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)線(xiàn)下機(jī)器學(xué)習(xí)如何針對(duì)不同構(gòu)型生成最優(yōu)航向,線(xiàn)上根據(jù)真實(shí)無(wú)源定位信息,自主快速輸出最優(yōu)航向指令,確保多機(jī)自同步按照最優(yōu)航跡飛行,不斷減小定位誤差和保持跟蹤穩(wěn)定性,使得多機(jī)無(wú)源定位中計(jì)算量大耗時(shí)長(zhǎng)的航向組合實(shí)時(shí)優(yōu)化問(wèn)題,被轉(zhuǎn)化為低功耗低時(shí)延的分布式在線(xiàn)預(yù)測(cè)問(wèn)題,使得該問(wèn)題得以有效解決。
1? 問(wèn)題描述與建模
理論上單機(jī)測(cè)向,雙機(jī)即可完成定位,但是存在環(huán)境電磁噪聲,定位會(huì)存在誤差。在信號(hào)處理和定位算法確定的條件下,且假設(shè)無(wú)人機(jī)速度方向始終與航向始終保持一致,要提高對(duì)移動(dòng)目標(biāo)的無(wú)源定位精度,需要在線(xiàn)組合優(yōu)化多無(wú)人機(jī)實(shí)時(shí)組合航向,從而直接決定多無(wú)人機(jī)下一時(shí)刻航跡點(diǎn),達(dá)到不斷追求多無(wú)人機(jī)與目標(biāo)之間的動(dòng)態(tài)最優(yōu)構(gòu)型的目的。由于CRLB可以屏蔽無(wú)人機(jī)輻射信號(hào)和環(huán)境噪聲對(duì)定位精度的影響,因此通過(guò)計(jì)算CRLB值,定量比較多無(wú)人機(jī)可選組合航向下的不同定位精度,從而找出CRLB最小的組合航向,即為使得定位精度最高的最優(yōu)航向組合。
假設(shè)無(wú)人機(jī)數(shù)量為M,可選航向粒度為θ,無(wú)人機(jī)可機(jī)動(dòng)航向角區(qū)間為[?準(zhǔn)1,?準(zhǔn)2],則每一時(shí)刻多無(wú)人機(jī)協(xié)同航向組合可選決策空間數(shù)量規(guī)模如式(1)所示,隨M的增加呈指數(shù)增長(zhǎng),為NP-Hard問(wèn)題。
根據(jù)上述分析,在X-Y絕對(duì)二維坐標(biāo)下,以各無(wú)人機(jī)下一時(shí)刻最優(yōu)航向?yàn)闆Q策變量,以下一時(shí)刻CRLB最小為目標(biāo)函數(shù),建立下一時(shí)刻最優(yōu)航向的優(yōu)化模型,如式(2)-(8)所示,其中,式(2)是受各無(wú)人機(jī)與目標(biāo)實(shí)時(shí)時(shí)刻位置影響的目標(biāo)函數(shù),式(3)表示無(wú)人機(jī)下一時(shí)刻位置更新方程,且受實(shí)時(shí)航向VUdi影響,式(4)是移動(dòng)目標(biāo)位置更新方程,式(5)是最大可選航向邊界約束條件。
2? 傳統(tǒng)集中式實(shí)時(shí)優(yōu)化方法
針對(duì)上述多無(wú)人機(jī)航向組合優(yōu)化問(wèn)題,傳統(tǒng)集中式實(shí)時(shí)優(yōu)化方法CRTO需要將各無(wú)人機(jī)實(shí)時(shí)測(cè)向數(shù)據(jù)及其實(shí)時(shí)定位信息,發(fā)送至中心無(wú)人機(jī),根據(jù)協(xié)同定位算法結(jié)算目標(biāo)估計(jì)位置,然后以式(2)所示目標(biāo)函數(shù),面向大規(guī)模組合優(yōu)化變量空間,運(yùn)用啟發(fā)式或超啟發(fā)式等智能優(yōu)化算法進(jìn)行求解,然后通過(guò)搜索尋優(yōu)得到多機(jī)組合最優(yōu)航向,最后中心無(wú)人機(jī)通過(guò)機(jī)載數(shù)據(jù)鏈將每一時(shí)刻最優(yōu)航向指令不斷分發(fā)給其他對(duì)應(yīng)的無(wú)人機(jī),如圖1所示。根據(jù)工程經(jīng)驗(yàn),由實(shí)時(shí)優(yōu)化計(jì)算各無(wú)人機(jī)組合航向和分發(fā)航向指令帶來(lái)的延時(shí)超過(guò)2秒以上,易造成精度降低和跟蹤穩(wěn)定性降低。
3? 分布式協(xié)同自主生成方法
3.1 方法框架
針對(duì)CRTO方法帶來(lái)的延時(shí)過(guò)長(zhǎng)問(wèn)題,本文所提DCAG方法針對(duì)CRLB直接反映構(gòu)型對(duì)定位精度影響這一特點(diǎn),在地面離線(xiàn)仿真生成大樣本多無(wú)人機(jī)與目標(biāo)的構(gòu)型數(shù)據(jù),并運(yùn)用智能優(yōu)化算法離線(xiàn)搜索每種構(gòu)型下各無(wú)人機(jī)最優(yōu)航向組合,由此一對(duì)一地形成面向每架無(wú)人機(jī)的帶標(biāo)簽數(shù)據(jù)集,實(shí)現(xiàn)離線(xiàn)訓(xùn)練測(cè)試各無(wú)人機(jī)航向決策圖神經(jīng)網(wǎng)絡(luò),在線(xiàn)使用訓(xùn)練好的各無(wú)人機(jī)神經(jīng)網(wǎng)絡(luò),如圖2所示。
通過(guò)DCAG方法,各無(wú)人機(jī)只需要實(shí)時(shí)共享各自的定位信息和測(cè)向數(shù)據(jù),在求出目標(biāo)估計(jì)值一致的條件下,就能基于圖神經(jīng)網(wǎng)絡(luò)快速自主運(yùn)算生成本機(jī)最優(yōu)航向,從而避免在線(xiàn)實(shí)時(shí)優(yōu)化NP-Hard問(wèn)題,造成的過(guò)長(zhǎng)延時(shí)。同時(shí),由于各機(jī)神經(jīng)網(wǎng)絡(luò)離線(xiàn)學(xué)習(xí)到自主協(xié)同生成最優(yōu)航向組合的隱式規(guī)律,在線(xiàn)生成實(shí)時(shí)最優(yōu)航向天然即為組合最優(yōu),從而也避免了由于中心計(jì)算組合航向需要分發(fā)帶來(lái)的通信延時(shí)。
3.2 圖神經(jīng)網(wǎng)絡(luò)構(gòu)建
圖神經(jīng)網(wǎng)絡(luò)[10,11]是為了在圖結(jié)構(gòu)的數(shù)據(jù)信息基礎(chǔ)上進(jìn)行學(xué)習(xí)而建立起來(lái)的。本文所研究多架無(wú)人機(jī)在定位過(guò)程中的航跡生成,其本質(zhì)屬于圖數(shù)據(jù)下的構(gòu)型變換,因此本文采用圖神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)訓(xùn)練,實(shí)時(shí)生成不同時(shí)刻每架無(wú)人機(jī)航跡角輸出。
為了實(shí)現(xiàn)多無(wú)人機(jī)之間的在線(xiàn)協(xié)同飛行以減小定位誤差,需要將所有無(wú)人機(jī)當(dāng)前時(shí)刻到目標(biāo)的構(gòu)型圖作為每架無(wú)人機(jī)神經(jīng)網(wǎng)絡(luò)的輸入。在目標(biāo)真實(shí)位置未知條件下,以目標(biāo)無(wú)源定位估計(jì)值近似為目標(biāo)真實(shí)位置。神經(jīng)網(wǎng)絡(luò)輸出則設(shè)計(jì)為所控制無(wú)人機(jī)的下一時(shí)刻最優(yōu)航向。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用多個(gè)隱含層和全連接結(jié)構(gòu)。設(shè)無(wú)人機(jī)數(shù)量為M,則隱含層數(shù)量和每個(gè)隱含層的節(jié)點(diǎn)數(shù)可以設(shè)置為M和2M。
3.3 網(wǎng)絡(luò)離線(xiàn)訓(xùn)練測(cè)試
按照無(wú)人機(jī)航向決策圖神經(jīng)網(wǎng)絡(luò)的輸入和輸出構(gòu)建好數(shù)據(jù)集和標(biāo)簽集后,采用TensorFlow[12]進(jìn)行網(wǎng)絡(luò)的離線(xiàn)訓(xùn)練和學(xué)習(xí)。在訓(xùn)練過(guò)程中需要注意三點(diǎn):一是對(duì)于神經(jīng)網(wǎng)絡(luò)在兩種坐標(biāo)軸角度下表示預(yù)測(cè)航向,需要分別與真實(shí)最優(yōu)航向相減后,以偏差最小值作為損失函數(shù)值;二是選擇Adam學(xué)習(xí)算法優(yōu)化網(wǎng)絡(luò)的權(quán)重和閾值;三是在每一輪訓(xùn)練完成后都輸入測(cè)試數(shù)據(jù)集,判斷損失函數(shù)值是否連續(xù)變小作為訓(xùn)練終止條件之一,以防止過(guò)擬合,具體流程如圖3所示。
4? 仿真驗(yàn)證分析
4.1 仿真示例描述
以雙機(jī)無(wú)源定位移動(dòng)通信輻射源仿真示例,驗(yàn)證本文所提DCAG方法的有效性,并假設(shè)如下:①無(wú)源定位算法采用AOA到達(dá)角測(cè)量法;②信噪比為0.05;③雙機(jī)速度在單次仿真中固定,多次仿真中變化范圍為[120,200];④目標(biāo)速度大小在單次仿真中固定,多次仿真中變化范圍為[100,180];⑤目標(biāo)速度方向始終為雙機(jī)位置連線(xiàn)中點(diǎn)至目標(biāo)方向;⑥無(wú)人機(jī)每秒內(nèi)完成50次測(cè)向信號(hào)采樣;⑦目標(biāo)與各無(wú)人機(jī)之間的距離不大于15000,不小于1000;⑧雙機(jī)之間的距離不小1000;⑨用于離線(xiàn)訓(xùn)練各無(wú)人機(jī)無(wú)源定位航向圖神經(jīng)網(wǎng)絡(luò)產(chǎn)生的部分?jǐn)?shù)據(jù)集如表1所示。