汪瀚洋, 陳 亮, 徐 海, 白景波
(1. 陸軍工程大學(xué)野戰(zhàn)工程學(xué)院, 江蘇 南京 210007; 2. 陸軍軍事交通學(xué)院汽車士官學(xué)校, 安徽 蚌埠 233011)
無人機(jī)自主執(zhí)行戰(zhàn)場(chǎng)任務(wù)將是未來無人機(jī)作戰(zhàn)的主要樣式,航跡規(guī)劃是無人機(jī)自主作戰(zhàn)的關(guān)鍵技術(shù)之一。目前,航跡規(guī)劃問題有兩個(gè)熱門研究方向:一是將航跡規(guī)劃問題視作多目標(biāo)優(yōu)化問題(multi-objective optimization problem,MOP)進(jìn)行求解,并按照偏好從Pareto解集中選擇執(zhí)行解;另一個(gè)是將航跡規(guī)劃問題視作動(dòng)態(tài)優(yōu)化問題,即在線航跡規(guī)劃問題。
航跡代價(jià)和威脅代價(jià)是航跡規(guī)劃問題中兩類重要指標(biāo),兩類指標(biāo)本質(zhì)上相互沖突。因此,無人機(jī)航跡規(guī)劃問題是MOP。對(duì)于MOP,比較有效的求解方法是多目標(biāo)進(jìn)化算法(multi-objective evolutionary algorithm,MOEA)。文獻(xiàn)[1]考慮航跡距離代價(jià)和航跡安全代價(jià),建立了航跡時(shí)空協(xié)同約束模型,采用協(xié)同非支配排序進(jìn)化算法進(jìn)行求解,得到了多組滿足不同性能要求的結(jié)果。文獻(xiàn)[2]建立了3個(gè)目標(biāo)的MOP模型,并采用改進(jìn)的多目標(biāo)粒子群算法進(jìn)行求解,在多種地形條件下驗(yàn)證了算法的有效性。文獻(xiàn)[3]建立了由航跡代價(jià)、空間協(xié)同約束和時(shí)間協(xié)同約束的3個(gè)目標(biāo)構(gòu)成的多目標(biāo)優(yōu)化模型,并運(yùn)用第三代非支配排序遺傳算法(nondomi nated sorting genetic algorithm Ⅲ, NSGA-Ⅲ)規(guī)劃航跡。然而,以上算法均是離線規(guī)劃算法,沒有考慮航跡規(guī)劃的動(dòng)態(tài)特性。
無人機(jī)在線航跡規(guī)劃問題具有明顯的動(dòng)態(tài)性。無人機(jī)位置的快速變化和威脅源的增加、減少或移動(dòng),都會(huì)使得無人機(jī)所處的戰(zhàn)場(chǎng)環(huán)境發(fā)生著變化。文獻(xiàn)[5]綜合考慮多個(gè)指標(biāo)構(gòu)造出無人機(jī)航跡規(guī)劃代價(jià)函數(shù),并采用模型預(yù)測(cè)控制和粒子群算法對(duì)無人機(jī)航跡進(jìn)行預(yù)測(cè)控制,從而有效避開威脅源,在線規(guī)劃無人機(jī)航跡。文獻(xiàn)[6]建立了評(píng)估航跡優(yōu)劣的代價(jià)函數(shù),運(yùn)用改進(jìn)的ARA(anytime repairing A)算法獲取可行航跡,并利用剩余時(shí)間不斷完善規(guī)劃的航跡,可滿足不同時(shí)間要求的在線航跡規(guī)劃任務(wù)。文獻(xiàn)[7]在建立航跡規(guī)劃綜合評(píng)價(jià)模型的基礎(chǔ)上,運(yùn)用改進(jìn)的粒子群算法在線規(guī)劃航跡,實(shí)驗(yàn)結(jié)果表明改進(jìn)算法可以滿足在線航跡規(guī)劃的實(shí)時(shí)性要求。然而,以上算法只考慮單一目標(biāo),或者通過加權(quán)求和的方法將多目標(biāo)轉(zhuǎn)化為單一目標(biāo)。而且,以上算法均將動(dòng)態(tài)問題視作靜態(tài)問題求解,在進(jìn)行重規(guī)劃時(shí)并未利用環(huán)境變化前的有效信息輔助求解。
綜合以上分析可知,無人機(jī)在線航跡規(guī)劃問題本質(zhì)上是一種動(dòng)態(tài)MOP(dynamic MOP,DMOP)。目前,多目標(biāo)的無人機(jī)在線航跡規(guī)劃問題的相關(guān)研究較少。文獻(xiàn)[8]建立了二維動(dòng)態(tài)航跡規(guī)劃問題模型,提出了一種基于Pareto解集預(yù)測(cè)的動(dòng)態(tài)MOEA(dynamic MOEA, DMOEA)進(jìn)行求解,仿真結(jié)果表明該算法用于求解在線航跡規(guī)劃問題是合理有效的。
本文針對(duì)無人機(jī)在線航跡規(guī)劃問題,提出了一種以基于分解的MOEA (MOEA based on decomposition, MOEA/D)為框架,使用自適應(yīng)應(yīng)答機(jī)制選擇(adaptive reaction mechanism selection,ARMS)的DMOEA,記作MOEA/D-ARMS。算法采用整體評(píng)估的方式賦予應(yīng)答機(jī)制相應(yīng)的獎(jiǎng)勵(lì),選擇了4種應(yīng)答機(jī)制組成應(yīng)答機(jī)制池,使用基于概率匹配(probability matching, PM)的自適應(yīng)應(yīng)答機(jī)制從應(yīng)答池中選擇應(yīng)答機(jī)制。MOEA/D-ARMS有兩個(gè)特點(diǎn):一是根據(jù)應(yīng)答機(jī)制近期表現(xiàn)選擇應(yīng)答機(jī)制,而不是根據(jù)Pareto最優(yōu)解集(Pareto optimal set,PS)的類型或者環(huán)境的變化強(qiáng)度選擇應(yīng)答機(jī)制;二是該自適應(yīng)應(yīng)答機(jī)制是一種框架,在該框架下可以容納更多的應(yīng)答機(jī)制,從而融合多種應(yīng)答機(jī)制的優(yōu)良特性。新的算法應(yīng)用于無人機(jī)在線航跡規(guī)劃問題,以權(quán)重向量作為決策的偏好,成功實(shí)現(xiàn)了無人機(jī)在靜態(tài)威脅情況、突發(fā)威脅情況、突變威脅情況和偏好改變情況下的仿真實(shí)驗(yàn),證明了該方法進(jìn)行無人機(jī)在線航跡規(guī)劃的有效性。
戰(zhàn)場(chǎng)中存在包括預(yù)警雷達(dá)和制導(dǎo)雷達(dá)在內(nèi)的(>1)個(gè)威脅。無人機(jī)從某基地出發(fā),前往目標(biāo)點(diǎn)執(zhí)行攻擊任務(wù),無人機(jī)可感知一定范圍內(nèi)的威脅。要求無人機(jī)根據(jù)當(dāng)前任務(wù)要求,同時(shí)考慮距離代價(jià)和威脅代價(jià),在線規(guī)劃出由起點(diǎn)到終點(diǎn)的可飛航跡。
為方便建模,對(duì)問題作如下假設(shè)。
無人機(jī)在二維空間飛行,即無人機(jī)執(zhí)行任務(wù)時(shí)飛行高度不變;
當(dāng)無人機(jī)與攻擊目標(biāo)間的距離滿足≤時(shí),無人機(jī)即可發(fā)起進(jìn)攻,為攻擊發(fā)起距離;
威脅擊落無人機(jī)的概率服從多維高斯分布;
無人機(jī)可以根據(jù)自身的偏好從PS中選擇一個(gè)解,作為無人機(jī)飛行的規(guī)劃解。
在線航跡規(guī)劃要求規(guī)劃器連續(xù)不斷地輸出規(guī)劃航跡結(jié)果以適應(yīng)不斷變化的環(huán)境。在每個(gè)規(guī)劃響應(yīng)點(diǎn)(planning trigger point, PTP),規(guī)劃器都會(huì)輸出一條規(guī)劃航跡。規(guī)劃航跡分為兩個(gè)部分:第一部分是執(zhí)行部分,第二部分是調(diào)整部分。無人機(jī)按照?qǐng)?zhí)行部分飛行。在執(zhí)行期間,規(guī)劃器繼續(xù)從下一個(gè)PTP開始規(guī)劃新的航跡,直到下一個(gè)PTP到來并輸出新的規(guī)劃結(jié)果,如此往復(fù)。
如圖1所示,在PTP,規(guī)劃器輸出航跡[(),(),…,(sp+),…,(sp+)]。其中,(sp+)表示時(shí)間區(qū)間[sp+-1,sp+](=1,2,…,)內(nèi)的航跡。時(shí)間區(qū)間[,]為執(zhí)行部分時(shí)間,[,sp+]為調(diào)整部分時(shí)間。=-為規(guī)劃器最大可用規(guī)劃時(shí)間。=sp+-為規(guī)劃器規(guī)劃時(shí)域。和是規(guī)劃器的兩個(gè)重要參數(shù),顯然≤。越大意味著規(guī)劃器能夠“看”得越遠(yuǎn),可在更加廣闊的空間進(jìn)行尋優(yōu),避免陷入局部最優(yōu)。越小表明規(guī)劃器能夠快速響應(yīng)環(huán)境變化,適應(yīng)瞬息萬變的戰(zhàn)場(chǎng)環(huán)境。同時(shí),越小的也意味著規(guī)劃器尋優(yōu)的時(shí)間越短,對(duì)規(guī)劃算法的時(shí)效性要求更高。
圖1 在線航跡規(guī)劃示意圖Fig.1 Schematic diagram of online trajectory planning
131 航跡距離代價(jià)
規(guī)劃得到解對(duì)應(yīng)一條可飛航跡。如圖2所示,航跡由個(gè)航跡段組成,和分別是航跡的起始點(diǎn)和末端點(diǎn),(,)表示起始點(diǎn)坐標(biāo),(,)表示末端點(diǎn)坐標(biāo)。為目標(biāo)點(diǎn),(,)表示目標(biāo)點(diǎn)的坐標(biāo)。
圖2 距離代價(jià)示意圖Fig.2 Schematic diagram of distance cost
對(duì)于規(guī)劃航跡,起始點(diǎn)到目標(biāo)點(diǎn)的距離記為
(1)
航跡的末端點(diǎn)到目標(biāo)點(diǎn)的距離記為
(2)
以上兩個(gè)距離的差值-表示無人機(jī)逼近目標(biāo)點(diǎn)的實(shí)際距離。對(duì)于規(guī)劃航跡,無人機(jī)可能逼近目標(biāo)點(diǎn)的最大距離為=·Δ·,表示無人機(jī)的速度。顯然,=(-)的取值在[-1,1]之間,的值越小表示無人機(jī)越接近目標(biāo)點(diǎn)。歸一化后得到以下目標(biāo)函數(shù):
(,)=[(-)+1]2
(3)
132 基于概率的威脅環(huán)境建模
航跡規(guī)劃問題與無人機(jī)所處的環(huán)境存在著密切的聯(lián)系,因此需要對(duì)戰(zhàn)場(chǎng)環(huán)境建立合理模型。本文采用概率地圖對(duì)威脅環(huán)境進(jìn)行建模。無人機(jī)被第(=1,2,…,)個(gè)威脅源擊落的概率可表示為
(4)
133 威脅代價(jià)
圖3 威脅代價(jià)示意圖Fig.3 Schematic diagram of threat cost
(5)
134 無人機(jī)性能約束
綜上,可建立無人機(jī)在線航跡規(guī)劃問題的動(dòng)態(tài)多目標(biāo)優(yōu)化模型:
(6)
135 決策方法
對(duì)于一個(gè)MOP,在求得其PS后,還需要從PS中選擇一個(gè)解作為執(zhí)行解。顯然,選擇解的時(shí)候應(yīng)該考慮決策者偏好。在MOEA/D框架下,權(quán)重向量具有表達(dá)決策者偏好的特性。對(duì)于偏好,理論上其關(guān)聯(lián)的解可以直接作為執(zhí)行解。然而,MOEA/D并不能保證一定是非支配解。因此,對(duì)于權(quán)重向量,以作為執(zhí)行解:
(7)
式中:表示切比雪夫(Tchebycheff,TCH)分解方法;表示TCH方法的理想點(diǎn)。
應(yīng)答機(jī)制是環(huán)境發(fā)生變化后,DMOEA響應(yīng)變化環(huán)境的策略。有效的應(yīng)答機(jī)制引導(dǎo)種群快速收斂,無效的應(yīng)答機(jī)制可能誤導(dǎo)種群的進(jìn)化方向。由于問題的復(fù)雜性,單一的應(yīng)答機(jī)制只能求解某一類DMOP。應(yīng)答機(jī)制與DMOP的有效配對(duì)并不是一件容易的事情。目前處理應(yīng)答機(jī)制與問題配對(duì)的方法有兩種:一種是通過分析DMOP的屬性(例如,PS是否變化或環(huán)境變化強(qiáng)度),決定選擇的應(yīng)答機(jī)制;另一種是根據(jù)應(yīng)答機(jī)制近期的表現(xiàn),從應(yīng)答機(jī)制池中選擇合適的應(yīng)答機(jī)制,即ARMS。目前,第一種方法得到了較充分研究,第二種方法的研究相對(duì)較少。本文設(shè)計(jì)了一種新的ARMS策略,并提出了MOEA/D-ARMS。
ARMS策略由獎(jiǎng)勵(lì)分配、應(yīng)答機(jī)制選擇和應(yīng)答機(jī)制池3部分組成。
圖4 種群在二維決策空間進(jìn)化過程示意圖Fig.4 Schematic diagram of population evolution process in two-dimensional decision space
由于本文以MOEA/D為基本框架,那么每個(gè)個(gè)體均與唯一權(quán)重向量關(guān)聯(lián)。因此,兩個(gè)種群中關(guān)聯(lián)于同一權(quán)重向量的個(gè)體自動(dòng)形成關(guān)聯(lián)關(guān)系。
基于以上整體評(píng)估應(yīng)答機(jī)制的思想,進(jìn)一步采用以下基于評(píng)分策略的獎(jiǎng)勵(lì)分配方法。
首先,計(jì)算關(guān)聯(lián)個(gè)體,(-1)和,(-1)之間的距離:
(8)
其次,計(jì)算所有關(guān)聯(lián)個(gè)體距離的平均值:
(9)
=,=1,2,…,
(10)
該值越大,表明應(yīng)答機(jī)制發(fā)揮的作用越大。本文直接以作為應(yīng)答機(jī)制的獎(jiǎng)勵(lì)。
使用式(10)給應(yīng)答機(jī)制分配獎(jiǎng)勵(lì);
更新應(yīng)答機(jī)制(=1,2,…,)的評(píng)估質(zhì)量:
,+1=(1-),+
(11)
式中:∈[0,1]是適應(yīng)率參數(shù),平衡過去接收的獎(jiǎng)勵(lì)和最近接收的獎(jiǎng)勵(lì)的重要程度。
確定應(yīng)答機(jī)制的選擇概率:
(12)
式中:∈[0,1],且≤1,表示選擇概率的下限。這樣可以確保所有的算子選擇概率始終大于零,從而避免丟失當(dāng)前性能較差而將來可能變得有效的應(yīng)答機(jī)制。隨著迭代的進(jìn)行,無效應(yīng)答機(jī)制的選擇概率逐漸收斂到,同時(shí)有效的應(yīng)答機(jī)制將會(huì)以概率=[1-(-1)·]被選擇。
基本的環(huán)境變化應(yīng)答機(jī)制主要有以下幾類:多樣性引入機(jī)制、多樣性保持機(jī)制、卡爾曼濾波預(yù)測(cè)機(jī)制及混合記憶和預(yù)測(cè)機(jī)制。本文選擇了以上4類具有不同特性的應(yīng)答機(jī)制的典型方法(機(jī)制)組成應(yīng)答機(jī)制池。
(1) 多樣性引入機(jī)制:環(huán)境變化后,按照下式隨機(jī)方式生成新個(gè)體隨機(jī)替換掉種群中%的個(gè)體:
=rand·(upper-lower)(=1,2,…,)
(13)
式中:表示第個(gè)體的第維值;rand表示[0,1]間的均勻分布隨機(jī)數(shù);upper和lower表示的上限和下限;表示決策變量維數(shù)。
(2) 多樣性保持機(jī)制:環(huán)境變化后,種群中%的個(gè)體被保留下來。
(3) 卡爾曼濾波預(yù)測(cè)機(jī)制:卡爾曼濾波分別由狀態(tài)方程和觀測(cè)方程兩部分組成:
(14)
(15)
式中:表示卡爾曼濾波器估計(jì)的狀態(tài)向量;表示狀態(tài)轉(zhuǎn)移矩陣;表示控制輸入矩陣;表示狀態(tài)的控制輸入;表示誤差協(xié)方差矩陣;表示狀態(tài)的觀測(cè)值;表示觀測(cè)矩陣;和分別表示過程和測(cè)量噪聲協(xié)方差;表示單位矩陣;表示卡爾曼增益。
+1=+-
(16)
若不存在相似的環(huán)境,則采用差分法預(yù)測(cè)新環(huán)境中的個(gè)體:
+1=+--1+Gaussian(0,)
(17)
以上機(jī)制中,卡爾曼濾波預(yù)測(cè)機(jī)制是預(yù)測(cè)機(jī)制的典型代表,混合記憶和預(yù)測(cè)機(jī)制同時(shí)采用了記憶和預(yù)測(cè)機(jī)制。
圖5 編碼方式示意圖Fig.5 Schematic diagram of encoding method
(18)
重復(fù)以上過程,即可得到航跡上各點(diǎn)的坐標(biāo)位置。
算法1給出了MOEA/D-ARMS求解無人機(jī)在線航跡規(guī)劃問題算法流程。第3~4行,初始化種群和選擇概率。第5行,初始化應(yīng)答機(jī)制的相關(guān)參數(shù)。第6~19行是算法的迭代過程。第7行,采用重新評(píng)估解的方法檢測(cè)環(huán)境是否發(fā)生變化。第9~11行,檢測(cè)到環(huán)境變化時(shí),為種群中每一個(gè)個(gè)體選擇應(yīng)答機(jī)制,并采用該應(yīng)答機(jī)制更新該個(gè)體。第12~14行,按照PM方法計(jì)算應(yīng)答機(jī)制選擇概率。第16行,未檢測(cè)到環(huán)境發(fā)生變化時(shí),直接調(diào)用MOEA/D-DE(MOEA/D based on differential evolution)優(yōu)化時(shí)刻的航跡規(guī)劃問題。
算法 1 MOEA/D-ARMS輸入 N:種群規(guī)模,應(yīng)答機(jī)制池:O={o1,o2,…,oJ},J:應(yīng)答機(jī)制池的規(guī)模。輸出 一系列近似PS。1. t=0, gen=1;2. 初始化N個(gè)均勻分布的權(quán)向量,并計(jì)算每個(gè)子問題的鄰域;3. 初始化種群Pt={x1,t,x2,t,…,xN,t};4. 初始化選擇概率pt=(1/J,…,1/J);5. 初始化應(yīng)答機(jī)制的相關(guān)參數(shù);6. While (不滿足終止條件) do7. If 檢測(cè)到環(huán)境變化 then8. t=t+1;9. 對(duì)于每一個(gè)xi,t∈Pt10. 基于概率向量pt采用輪盤賭的方式從應(yīng)答池O中選擇應(yīng)答機(jī)制oj;11. 使用應(yīng)答機(jī)制oj更新xi,t;12. 利用式(10)計(jì)算rt={r1,t-1,…,rJ,t-1};13. 利用式(11)計(jì)算qt={q1,…,qJ};14. 利用式(12)計(jì)算pt={p1,t,…,pJ,t};15. else16. 使用MOEA/D-DE[18]優(yōu)化t時(shí)刻的航跡規(guī)劃問題;17. gen=gen+1;18. End if19.End while
仿真實(shí)驗(yàn)環(huán)境借鑒文獻(xiàn)[8]中的設(shè)置。假設(shè)在100 km×100 km的戰(zhàn)場(chǎng)環(huán)境中,分布著17個(gè)威脅源(見圖6),威脅源的參數(shù)如表1所示。無人機(jī)的飛行速度為200 m/s,攻擊發(fā)起距離為1 km,無人機(jī)雷達(dá)反射面積為2 m。無人機(jī)的初始位置和目標(biāo)位置將在不同實(shí)驗(yàn)中分別給出。將無人機(jī)視作決策者,無人機(jī)依據(jù)戰(zhàn)場(chǎng)環(huán)境同時(shí)考慮航跡距離代價(jià)和威脅代價(jià),自主規(guī)劃航跡。
圖6 威脅源分布示意圖Fig.6 Schematic diagram of threat sources distribution
表1 威脅源參數(shù)列表Table 1 List of threat source parameters km
DMOEA扮演規(guī)劃器的角色,在每個(gè)PPT時(shí)刻輸出一組非支配解。實(shí)驗(yàn)中,選擇MOEA/D-KF (MOEA/D using Kalman filter)與本文提出的MOEA/D-ARMS算法進(jìn)行對(duì)比研究,分別研究決策者偏好為(,)=(03,07)和(,)=(07,03)時(shí)的在線規(guī)劃航跡。其中,越大表示決策者越重視距離代價(jià),希望距離代價(jià)越小越好;越大表示決策者越重視威脅代價(jià),希望威脅越小越好。
編碼長(zhǎng)度=30,規(guī)劃時(shí)間Δ=1 s,規(guī)劃時(shí)間內(nèi)無人機(jī)的最大航向角改變值為30°。種群規(guī)模設(shè)置為100,最大函數(shù)評(píng)價(jià)次數(shù)設(shè)置為1 000,ζ%設(shè)置為20%。MOEA/D-DE和MOEA/D-KF的參數(shù)來自文獻(xiàn)[18]和文獻(xiàn)[15],MOEA/D-ARMS的外部文檔的規(guī)模設(shè)置為50。通過前期在測(cè)試函數(shù)集合DF,FDA,dMOP和F上的大量實(shí)驗(yàn),適應(yīng)率參數(shù)設(shè)置為02,選擇概率下限設(shè)置為0。
實(shí)驗(yàn)中,無人機(jī)初始位置為(-10,-18)km,目標(biāo)位置為(-40,-4)km,初始航向角為初始位置到目標(biāo)位置連線的方向。如圖7所示,相關(guān)區(qū)域內(nèi)有威脅源R10和R13。圖7和圖8是靜態(tài)威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡。紅色實(shí)線和藍(lán)色實(shí)線分別是MOEA/D-ARMS和MOEA/D-KF規(guī)劃的航跡??梢钥闯?MOEA/D-ARMS規(guī)劃的航跡比MOEA/D-KF規(guī)劃的航跡更為平滑。
圖7 靜態(tài)威脅情況下(ω1,ω2)T=(0.3,0.7)T的航跡Fig.7 Trajectory with(ω1,ω2)T=(0.3,0.7)T under static threat
圖8 靜態(tài)威脅情況下(ω1,ω2)T=(0.7,0.3)T的航跡Fig.8 Trajectory with(ω1,ω2)T=(0.7,0.3)T under static threat
圖9和圖10是靜態(tài)威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡的航向角變化曲線。可以發(fā)現(xiàn),MOEA/D-KF規(guī)劃航跡的航向角劇烈變化,而MOEA/D-ARMS規(guī)劃航跡的航向角則較為平緩。
圖9 靜態(tài)威脅情況下(ω1,ω2)T=(0.3,0.7)T的航向角Fig.9 Heading angle with(ω1,ω2)T=(0.3,0.7)T under static threat
圖10 靜態(tài)威脅情況下(ω1,ω2)T=(0.7,0.3)T的航向角Fig.10 Heading angle with(ω1,ω2)T=(0.7,0.3)T under static threat
表2給出了MOEA/D-ARMS和MOEA/D-KF按照兩種偏好規(guī)劃航跡的飛行時(shí)間、生存概率和航向角變化平均值的對(duì)比。由于飛行速度恒定,飛行時(shí)間直接反映了航跡的長(zhǎng)度??梢钥闯?無論執(zhí)行哪一種偏好,MOEA/D-ARMS的結(jié)果都要優(yōu)于MOEA/D-KF。以上結(jié)果證明,MOEA/D-ARMS的性能優(yōu)于MOEA/D-KF。實(shí)驗(yàn)中,MOEA/D-ARMS最大耗時(shí)為359 ms,平均耗時(shí)為254 ms,滿足Δ=1 s條件下實(shí)時(shí)性要求。
表2 靜態(tài)威脅情況下規(guī)劃結(jié)果對(duì)比Table 2 Comparison of planning results under static threat
突發(fā)威脅是指威脅源出現(xiàn)的時(shí)機(jī)、位置和威脅大小均無法預(yù)知。當(dāng)發(fā)生突發(fā)威脅時(shí),要求DMOEA必須迅速“適應(yīng)”新環(huán)境,及時(shí)規(guī)劃出合理航跡。實(shí)驗(yàn)中,無人機(jī)初始位置為(40,-5) km,目標(biāo)位置為(-18,-0) km,初始航向角為初始位置到目標(biāo)位置連線的方向。突發(fā)威脅R18將在230 s時(shí)出現(xiàn)在(-10,2) km位置處,威脅范圍參數(shù)和均為2.1 km。
圖11和圖12是突發(fā)威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡。紅色實(shí)線和紅色虛線分別是突發(fā)威脅發(fā)生前(前230 s)和突發(fā)威脅發(fā)生后MOEA/D-ARMS的規(guī)劃航跡,藍(lán)色實(shí)線和藍(lán)色虛線分別是突發(fā)威脅發(fā)生前(前230 s)和突發(fā)威脅發(fā)生后MOEA/D-KF的規(guī)劃航跡。
圖11 突發(fā)威脅情況下(ω1,ω2)T=(0.3,0.7)T航跡Fig.11 Trajectory with(ω1,ω2)T=(0.3,0.7)T under sudden threat
圖12 突發(fā)威脅情況下(ω1,ω2)T=(0.7,0.3)T航跡Fig.12 Trajectory with(ω1,ω2)T=(0.7,0.3)T under sudden threat
圖13和圖14是突發(fā)威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡的航向角變化曲線。
圖13 突發(fā)威脅情況下(ω1,ω2)T=(0.3,0.7)T的航向角Fig.13 Heading angle with(ω1,ω2)T=(0.3,0.7)T under sudden threat
圖14 突發(fā)威脅情況下(ω1,ω2)T=(0.7,0.3)T的航向角Fig.14 Heading angle with(ω1,ω2)T=(0.7,0.3)T under sudden threat
表3給出了突發(fā)威脅情況下,MOEA/D-ARMS和MOEA/D-KF按照兩種偏好規(guī)劃航跡的飛行時(shí)間、生存概率和航向角變化平均值的對(duì)比??梢钥闯?無論執(zhí)行哪一種偏好,MOEA/D-ARMS的結(jié)果都要優(yōu)于MOEA/D-KF。以上結(jié)果表明,MOEA/D-ARMS在突發(fā)威脅情況下的性能優(yōu)于MOEA/D-KF。MOEA/D-ARMS最大耗時(shí)為367 ms,平均耗時(shí)為258 ms,可以滿足Δ=1 s條件下實(shí)時(shí)性要求。
表3 突發(fā)威脅情況下規(guī)劃結(jié)果對(duì)比Table 3 Comparison of planning results under sudden threat
突變威脅是指威脅源的威脅范圍參數(shù)突然發(fā)生變化。當(dāng)威脅源突變時(shí),要求DMOEA必須迅速“適應(yīng)”新的環(huán)境,及時(shí)規(guī)劃出合理航跡。實(shí)驗(yàn)中,無人機(jī)初始位置為(35,20)km,目標(biāo)位置為(-45,45) km,初始航向角為初始位置到目標(biāo)位置連線的方向。威脅源R7將第220 s發(fā)生突變,其威脅范圍參數(shù)和將由3 km變?yōu)? km。
圖15和圖16是突變威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡。紅色實(shí)線和紅色虛線分別是突變威脅發(fā)生前(前220 s)和突變威脅發(fā)生后MOEA/D-ARMS的規(guī)劃航跡,藍(lán)色實(shí)線和藍(lán)色虛線分別是突變威脅發(fā)生前(前220 s)和突變威脅發(fā)生后MOEA/D-KF的規(guī)劃航跡。
圖15 突變威脅情況下(ω1,ω2)T=(0.3,0.7)T航跡Fig.15 Trajectory with (ω1,ω2)T=(0.3,0.7)T under mutation threat
圖16 突變威脅情況下(ω1,ω2)T=(0.7,0.3)T航跡Fig.16 Trajectory with(ω1,ω2)T=(0.7,0.3)T under mutation threat
圖17和圖18是突變威脅情況下,偏好分別為(,)=(03,07)和(,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡的航向角變化曲線。
圖17 突變威脅情況下(ω1,ω2)T=(0.3,0.7)T的航向角Fig.17 Heading angle with(ω1,ω2)T=(0.3,0.7)T under mutation threat
圖18 突變威脅情況下(ω1,ω2)T=(0.7,0.3)T的航向角Fig.18 Heading angle with(ω1,ω2)T=(0.7,0.3)T under mutation threat
表4給出了突變威脅情況下,MOEA/D-ARMS和MOEA/D-KF按照兩種偏好規(guī)劃航跡的飛行時(shí)間、生存概率和航向角變化平均值的對(duì)比??梢钥闯?無論執(zhí)行哪一種偏好,MOEA/D-ARMS的結(jié)果都要優(yōu)于MOEA/D-KF。以上結(jié)果表明MOEA/D-ARMS在突變威脅情況下的性能優(yōu)于MOEA/D-KF。MOEA/D-ARMS最大耗時(shí)為354 ms,平均耗時(shí)為248 ms,可以滿足Δ=1 s條件下實(shí)時(shí)性要求。
表4 突變威脅情況下規(guī)劃結(jié)果對(duì)比Table 4 Comparison of planning results under mutation threat
偏好改變是指決策者根據(jù)戰(zhàn)場(chǎng)環(huán)境自主調(diào)整偏好。當(dāng)決策者的偏好發(fā)生變化時(shí),要求DMOEA必須迅速“適應(yīng)”新的偏好,及時(shí)規(guī)劃出合理航跡。實(shí)驗(yàn)中,無人機(jī)初始位置為(35,20)km,目標(biāo)位置為(-45,45)km,初始航向角為初始位置到目標(biāo)位置連線的方向。決策者初始偏好為(,)=(03,07),當(dāng)無人機(jī)與目標(biāo)的距離小于40 km時(shí),偏好改變?yōu)?,)=(07,03)。
圖19是偏好由(,)=(03,07)變?yōu)?,)=(07,03),MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡。紅色實(shí)線和藍(lán)色實(shí)線是無人機(jī)與目標(biāo)距離大于40 km時(shí),MOEA/D-ARMS和MOEA/D-KF按照偏好(,)=(03,07)規(guī)劃的航跡。紅色虛線和藍(lán)色虛線是無人機(jī)與目標(biāo)距離小于或等于40 km時(shí),MOEA/D-ARMS和MOEA/D-KF按照偏好(,)=(07,03)規(guī)劃的航跡。圖20是偏好變化情況下,MOEA/D-ARMS和MOEA/D-KF的規(guī)劃航跡的航向角變化曲線。表5給出了偏好變化情況下,MOEA/D-ARMS和MOEA/D-KF規(guī)劃的航跡的飛行時(shí)間、生存概率和航向角變化平均值的對(duì)比??梢钥闯?無論執(zhí)行哪一種偏好,MOEA/D-ARMS的結(jié)果都要優(yōu)于MOEA/D-KF。以上結(jié)果表明,MOEA/D-ARMS在偏好變化情況下的性能優(yōu)于MOEA/D-KF。MOEA/D-ARMS最大耗時(shí)為361 ms,平均耗時(shí)為259 ms,可以滿足Δ=1 s條件下實(shí)時(shí)性要求。
圖19 偏好變化情況下的航跡規(guī)劃Fig.19 Trajectory planning under preference change
圖20 偏好變化情況下的航向角Fig.20 Heading angle under preference change
表5 偏好變化情況下規(guī)劃結(jié)果對(duì)比Table 5 Comparison of planning results under preference change
本文在分析無人機(jī)在線航跡規(guī)劃問題的基礎(chǔ)上,建立了無人機(jī)在線航跡規(guī)劃問題動(dòng)態(tài)多目標(biāo)問題模型,提出了簡(jiǎn)單有效的決策方法。為了有效求解無人機(jī)在線航跡規(guī)劃這類DMOP,提出了一種自適應(yīng)應(yīng)答機(jī)制選擇的MOEA/D-ARMS。MOEA/D-ARMS應(yīng)用于靜態(tài)威脅情況、突發(fā)威脅情況、突變威脅情況和偏好改變情況等4個(gè)仿真實(shí)例中,實(shí)驗(yàn)表明MOEA/D-ARMS能夠更好地規(guī)劃出合理航跡,提高了無人機(jī)自主遂行任務(wù)的能力。