亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于MFO-HTN的超視距空戰(zhàn)戰(zhàn)術(shù)機動組合規(guī)劃

        2022-09-16 12:18:18閆孟達俞利新左家亮胡東愿岳龍飛楊任農(nóng)
        空軍工程大學(xué)學(xué)報 2022年4期
        關(guān)鍵詞:規(guī)劃優(yōu)化

        閆孟達, 俞利新, 左家亮, 張 瀅, 胡東愿, 岳龍飛, 楊任農(nóng)

        (空軍工程大學(xué)空管領(lǐng)航學(xué)院,西安,710051)

        空戰(zhàn)機動決策一直是軍事領(lǐng)域的熱點問題之一??諔?zhàn)機動決策的研究方法主要有專家系統(tǒng)[1-2]、矩陣對策[3-5]、優(yōu)化理論[6]、模糊推理[7-8]和人工智能[9-14]等方法。文獻[1~2]在專家系統(tǒng)的基礎(chǔ)上結(jié)合滾動時域、模糊規(guī)則等方法,解決專家系統(tǒng)不夠靈活、不可拓展的問題。矩陣對策法需要對當前態(tài)勢進行準確建模,從而求得當前時刻的最優(yōu)對策,而超視距空戰(zhàn)決策周期長,且態(tài)勢難以用數(shù)學(xué)公式準確描述,因此并不適用。文獻[6]提出多目標優(yōu)化結(jié)合強化學(xué)習(xí)的方法,先通過多目標優(yōu)化得到可行集,再通過強化學(xué)習(xí)尋找最優(yōu)解。辛辛那提大學(xué)提出遺傳模糊樹[7],開發(fā)了ALPHA空戰(zhàn)機器人,并擊敗了人類飛行員,是空戰(zhàn)決策領(lǐng)域最具代表性的成果之一。近年來,隨著人工智能浪潮的興起,越來越多的研究人員開始探索強化學(xué)習(xí)在空戰(zhàn)決策問題上的應(yīng)用[8-14]。尤其是DARPA在2020年舉辦的“阿爾法”空中格斗競賽[15],基于強化學(xué)習(xí)的空戰(zhàn)智能體大比分戰(zhàn)勝了人類飛行員,展示了智能空戰(zhàn)的巨大研究潛力。

        以上研究推動了空戰(zhàn)決策的自動化和智能化,目前關(guān)于近距格斗的研究比較成熟,相對而言,關(guān)于超視距空戰(zhàn)智能決策的研究并不充分,超視距空戰(zhàn)決策的研究難度主要體現(xiàn)在3個方面:一是現(xiàn)有研究對空戰(zhàn)態(tài)勢的描述大多還是基于優(yōu)勢函數(shù),如角度優(yōu)勢函數(shù)、距離優(yōu)勢函數(shù)、能量優(yōu)勢函數(shù)等,此類函數(shù)無法準確描述超視距空戰(zhàn)的態(tài)勢;二是兩者的核心問題不同,近距空戰(zhàn)要求在短時間內(nèi)搶占發(fā)射位置,對瞬時大機動的能力要求較高,而超視距空戰(zhàn)更關(guān)注“機動時機”問題,根據(jù)雙方相對距離等態(tài)勢要素決策何時開始機動、機動多長時間、何時發(fā)射導(dǎo)彈以及如何規(guī)避導(dǎo)彈等問題;三是相比于近距空戰(zhàn),超視距空戰(zhàn)決策周期長、決策邊界不清晰,這使強化學(xué)習(xí)方法很難訓(xùn)練出可解釋和可接受的超視距空戰(zhàn)智能體。

        而現(xiàn)代空戰(zhàn)最主要的形態(tài)是超視距空戰(zhàn),因此當前急需研究高效、合理的超視距空戰(zhàn)決策方法。本文針對超視距空戰(zhàn)機動決策問題,提出基于戰(zhàn)術(shù)機動組合的規(guī)劃方法,引入層次任務(wù)網(wǎng)絡(luò)(hierarchical task network, HTN),并通過多目標優(yōu)化算法對其進行參數(shù)優(yōu)化,仿真結(jié)果表明該方法能夠輸出高效的超視距空戰(zhàn)戰(zhàn)術(shù)執(zhí)行序列。

        1 超視距空戰(zhàn)機動描述

        空戰(zhàn)戰(zhàn)術(shù)機動動作復(fù)雜多樣,很難一一列舉,但復(fù)雜的戰(zhàn)術(shù)動作可以由基礎(chǔ)的機動動作組合而成。目前常見的機動動作有兩種劃分方式,依據(jù)操作方式進行劃分的操作機動動作[16-17]和依據(jù)戰(zhàn)術(shù)動作理論進行劃分的戰(zhàn)術(shù)機動動作[18]。美國NASA研究人員將機動動作劃分為7類基本操縱機動[19],分別為:最大加速,最大減速,最大過載爬升,最大過載俯沖,最大過載左轉(zhuǎn),最大過載右轉(zhuǎn)及穩(wěn)定飛行。這7種基礎(chǔ)動作是從飛行員的角度,根據(jù)操作控制變量來進行劃分。從戰(zhàn)術(shù)效果角度,可以將7類基本動作進行初步的組合實現(xiàn)、歸類細化,得到常用的6種基本的戰(zhàn)術(shù)機動動作[19],如圖1所示。

        圖1 6種戰(zhàn)術(shù)機動示意圖

        其中,側(cè)轉(zhuǎn)和蛇形機動是在水平面的機動,桶滾可以看作是蛇形機動同時進行垂直面的機動,俯沖、斤斗、半斤斗是在垂直面上的機動,而斤斗和半斤斗多用于近距空戰(zhàn),本文暫不考慮。因此,超視距空戰(zhàn)機動可以分為兩類:“側(cè)轉(zhuǎn)+垂直面機動”“蛇形+垂直面機動”。本文用參數(shù)化語言來描述這兩類機動[20],側(cè)轉(zhuǎn)機動為一個四元組φ,η,γ,h,其中為轉(zhuǎn)彎角度(°),η為過載(g),γ為坡度(°),h為降高(m),表示載機在進行側(cè)轉(zhuǎn)機動的同時完成高度差為h的垂直面機動;類似地,蛇形機動為一個六元組i,t,φ,η,γ,h,其中i表示蛇形機動中的轉(zhuǎn)彎次數(shù),t表示每次轉(zhuǎn)彎的時間間隔。當機動參數(shù)被指定后,完成此次機動所需要的時間也就確定了。如,側(cè)轉(zhuǎn)機動180,4,60,2 000和蛇形機動2,5,120,4,60,2 000,分別如圖2(a)、(b)所示。

        圖2 2種戰(zhàn)術(shù)機動示意圖

        通過以上2種類型的機動組合,就可以實現(xiàn)各種復(fù)雜的超視距空戰(zhàn)戰(zhàn)術(shù)。

        2 基于HTN的戰(zhàn)術(shù)機動組合模型

        2.1 層次任務(wù)網(wǎng)絡(luò)規(guī)劃

        HTN規(guī)劃的思想與專家求解問題的思維方式十分相似,因而受到廣泛的推崇。HTN規(guī)劃的基本思想是利用相關(guān)領(lǐng)域?qū)I(yè)知識,結(jié)合專家在實際過程中的相關(guān)經(jīng)驗,遞歸地將復(fù)雜的任務(wù)網(wǎng)絡(luò)順序分解,逐層細化,直到分解成為一個個可以直接獨立執(zhí)行的原子任務(wù)為止[21]。以系統(tǒng)給定的初始狀態(tài)、領(lǐng)域知識、任務(wù)目標作為輸入,輸出完整的、可執(zhí)行的動作方案。初始狀態(tài)主要是系統(tǒng)在規(guī)劃前初始時刻的狀態(tài)信息;領(lǐng)域知識即指規(guī)劃域,包括操作集合和方法集合,操作集合主要描述執(zhí)行動作的前提條件和效果,方法集合是描述任務(wù)分解的途徑和相關(guān)要求;任務(wù)目標是任務(wù)網(wǎng)絡(luò)的起點,也是任務(wù)分解后進行執(zhí)行的總目標。動作方案主要是一系列動作,構(gòu)成了問題的規(guī)劃解。HTN規(guī)劃在任務(wù)的表達和分解、任務(wù)分派、任務(wù)完成上優(yōu)勢比較突出,對任務(wù)分解和細化比較符合作戰(zhàn)人員的思維模式,利用HTN算法及其思想來對軍事問題進行規(guī)劃、求解和執(zhí)行更容易被理解和接受。

        HTN規(guī)劃中最關(guān)鍵的部分就是方法集合,以“處方”的形式告訴系統(tǒng)如何對任務(wù)進行分解。

        2.2 空戰(zhàn)HTN模型

        HTN規(guī)劃中的主要元素包括任務(wù)、方法和操作。其中,任務(wù)表示可分解的任務(wù);操作表示不可分解的原子任務(wù),在本文中為單次機動;方法包括條件和分解方法,具體描述了在何種態(tài)勢下如何完成任務(wù),是HTN規(guī)劃的關(guān)鍵。在空戰(zhàn)HTN規(guī)劃中,“任務(wù)”即要執(zhí)行何種戰(zhàn)術(shù),“操作”即單個戰(zhàn)術(shù)機動,多個戰(zhàn)術(shù)機動組合完成一個戰(zhàn)術(shù),“方法”表示在何種態(tài)勢下如何建立空戰(zhàn)HTN網(wǎng)絡(luò)。

        圖3 攻擊區(qū)劃分示意圖

        在超視距空戰(zhàn)中,相對距離和攻擊區(qū)的關(guān)系是進行決策的重要依據(jù)。文獻[22]提出基于目標機機動的五線攻擊區(qū),如圖3所示,本文在此基礎(chǔ)之上,從以下3個方面描述空戰(zhàn)態(tài)勢:①敵我相對距離與敵機攻擊區(qū)的關(guān)系;②雙方的相對航向;③敵機是否發(fā)射導(dǎo)彈。

        若某種態(tài)勢下需要執(zhí)行“側(cè)轉(zhuǎn)+側(cè)轉(zhuǎn)+蛇形機動”的戰(zhàn)術(shù)組合,則HTN規(guī)劃見圖4。

        圖4 空戰(zhàn)戰(zhàn)術(shù)機動HTN規(guī)劃示意圖

        3 GA-HTN參數(shù)優(yōu)化算法

        3.1 優(yōu)化模型

        HTN規(guī)劃確定了空戰(zhàn)機動的順序,但與一般HTN規(guī)劃中的操作不同,空戰(zhàn)機動由參數(shù)確定,且機動和機動之間有一定時間間隔,如圖5所示,仿真開始后在t1時刻進行機動1,機動1完成后間隔t2進行機動2,之后間隔t3進行機動3。

        圖5 規(guī)劃參數(shù)序列示意圖

        在機動參數(shù)給定的情況下,影響空戰(zhàn)結(jié)果的主要是時間參數(shù),需要通過算法進行尋優(yōu),優(yōu)化目標為:①機動時間間隔之和最小;②達成發(fā)射條件的時間最長;③達成發(fā)射條件的平均距離最小。優(yōu)化模型為:

        (1)

        式(1)是一個多目標優(yōu)化問題,多目標優(yōu)化問題會得到一系列帕累托最優(yōu)解,不符合空戰(zhàn)輔助決策的需求,因此將公式(1)中3個優(yōu)化目標歸一化后轉(zhuǎn)換為單目標問題,如公式(2):

        (2)

        3.2 MFO-HTN算法流程

        3.2.1 MFO算法原理及流程

        飛蛾撲火優(yōu)化算法[23](moth-flame optimization algorithm, MFO)是一種新型智能優(yōu)化算法,具有調(diào)節(jié)參數(shù)少、收斂快、不易陷入局部最優(yōu)等優(yōu)點。MFO算法的思想源于飛蛾沿等角螺旋路徑朝火焰飛行的現(xiàn)象[23],飛蛾是在搜索空間內(nèi)移動的個體,火焰表示某一只飛蛾當前看到的最優(yōu)解。在飛蛾朝向火焰飛行的過程中,如果發(fā)現(xiàn)了更好的火焰,則更新火焰的位置。算法規(guī)定一只飛蛾對應(yīng)一個火焰,因此能夠避免陷入局部最優(yōu)。

        本文中,M為飛蛾矩陣,OM為飛蛾適應(yīng)度值矩陣,F(xiàn)為火焰位置矩陣,OF為火焰適應(yīng)度值矩陣,分別如式(3)和(4)所示。

        (3)

        (4)

        式中:n為飛蛾的個數(shù);d為待求變量的個數(shù)。

        根據(jù)適應(yīng)度值對火焰位置從小到大進行排序,飛蛾分別圍繞排序后的火焰,根據(jù)式(5)進行等角螺線飛行。

        Mi=Diebtcos(2πt)+Fj

        (5)

        式中:Mi為第i只飛蛾的位置,Di=|Mi-Fj|表示第i只飛蛾與第j個火焰的距離;b為等角螺線參數(shù);t為路徑系數(shù)。

        為提高算法的搜索效率,MFO采用火焰自適應(yīng)減少機制,舍掉一些較差的火焰,使得飛蛾不用在劣解附近繼續(xù)尋優(yōu),加快收斂速度。火焰數(shù)量自適應(yīng)減少公式為:

        (6)

        式中:NF為當前火焰數(shù)量;N為最大火焰數(shù)量;i為當前迭代次數(shù),I為最大迭代次數(shù)。

        MFO算法流程[24]如下。

        步驟1 飛蛾種群初始化。設(shè)置飛蛾數(shù)量、最大迭代次數(shù)、求解問題維度等參數(shù)。

        步驟2 飛蛾位置初始化。在搜索空間中隨機生成飛蛾位置,令迭代次數(shù)i=1。

        步驟3 將飛蛾位置按適應(yīng)度值從小到大排序后賦給火焰,作為第1代火焰的位置。

        步驟4 更新飛蛾位置,將飛蛾位置適應(yīng)度和火焰適應(yīng)度重新排序,更新火焰位置。

        步驟5 自適應(yīng)減少火焰數(shù)量,迭代次數(shù)i=i+1。

        步驟6 判斷是否達到最大迭代次數(shù),是則輸出最優(yōu)火焰位置,否則轉(zhuǎn)步驟4。

        3.2.2 MFO-HTN算法流程

        適應(yīng)度是用來度量種群中個體優(yōu)劣的指標,適應(yīng)度函數(shù)的設(shè)定決定算法的收斂程度和目標函數(shù)最優(yōu)解。將優(yōu)化目標轉(zhuǎn)化為適應(yīng)度函數(shù)為:

        (7)

        其中δ為正值常數(shù),確保適應(yīng)度函數(shù)值為正。

        MFO-HTN規(guī)劃流程如圖6所示。

        圖6 MFO-HTN超視距空戰(zhàn)規(guī)劃流程圖

        4 仿真實驗

        4.1 仿真條件設(shè)置

        仿真的初始態(tài)勢參數(shù)包括相對距離、相對方位、相對航向角、雙機的高度和速度,本節(jié)的算例設(shè)置如表1所示。

        表1 初始態(tài)勢參數(shù)

        設(shè)敵機在0時刻發(fā)射一枚導(dǎo)彈,則當前空戰(zhàn)態(tài)勢滿足以下描述:① 我機處于敵機的Ω3區(qū)域中;②雙方為正迎頭態(tài)勢;③ 敵機發(fā)射一枚導(dǎo)彈。此時空戰(zhàn)HTN規(guī)劃網(wǎng)絡(luò)如圖7所示。

        圖7 空戰(zhàn)HTN規(guī)劃網(wǎng)絡(luò)

        相應(yīng)的機動參數(shù)設(shè)置如表2所示。

        表2 機動參數(shù)設(shè)置

        4.2 飛蛾赴火算法優(yōu)化結(jié)果

        將本文方法與傳統(tǒng)的遺傳算法(GA)、粒子群算法(PSO)進行對比,圖8展示了3種算法的收斂曲線對比。為了加快收斂速度,使算法滿足實時性要求,本文限制了算法僅搜索整數(shù)解。

        圖8 算法對比

        由圖8可以看出,3種算法均在第50代就基本達到收斂狀態(tài),但GA和PSO算法收斂到了局部最優(yōu),MFO算法搜索精度更高,且收斂速度更快。MFO算法搜索到最優(yōu)解為t1=5 s,t2=1 s,t3=4 s。

        則最終得到的空戰(zhàn)機動執(zhí)行序列如圖9所示。

        圖9 空戰(zhàn)機動執(zhí)行序列

        4.3 空戰(zhàn)仿真結(jié)果

        設(shè)仿真起始時刻為0時刻,整個空戰(zhàn)仿真過程持續(xù)114 s,可分為3個階段,見圖10~12。

        1)階段1。敵機在0時刻發(fā)射一枚導(dǎo)彈,我機在5 s開始采取側(cè)轉(zhuǎn)180°機動來規(guī)避敵方導(dǎo)彈,同時敵機采取偏置機動保持對我機的壓迫,見圖10。

        2)階段2 。我機完成導(dǎo)彈規(guī)避后立刻形成了對敵機的鎖定并發(fā)射一枚導(dǎo)彈,而敵機也同時發(fā)射了第2枚導(dǎo)彈。我機保持對敵機的鎖定4 s后完成中末制導(dǎo)交接,導(dǎo)彈導(dǎo)引頭開機,進行最后一次側(cè)轉(zhuǎn)180°機動,見圖11。

        3)階段3。70 s時,敵機向下做側(cè)轉(zhuǎn)機動規(guī)避我機發(fā)射的導(dǎo)彈,但在107 s時被擊落,而我機隨后在114 s 時完成了對敵機第2枚導(dǎo)彈的規(guī)避,仿真結(jié)束,見圖12。

        5 結(jié)語

        本文提出的MFO-HTN超視距空戰(zhàn)機動規(guī)劃模型在引入專家經(jīng)驗的基礎(chǔ)上,建立多目標優(yōu)化模型,采用飛蛾撲火優(yōu)化算法對空戰(zhàn)HTN模型參數(shù)進行優(yōu)化,能夠輸出高效、可解釋的超視距空戰(zhàn)戰(zhàn)術(shù)機動執(zhí)行序列。研究成果可以為飛行員提供輔助決策,也為研究智能超視距空戰(zhàn)提供了新的思路。下一步研究如何將HTN模型與模糊推理、強化學(xué)習(xí)等算法相結(jié)合,構(gòu)建更靈活、可擴展的超視距空戰(zhàn)戰(zhàn)術(shù)模型。

        猜你喜歡
        規(guī)劃優(yōu)化
        超限高層建筑結(jié)構(gòu)設(shè)計與優(yōu)化思考
        民用建筑防煙排煙設(shè)計優(yōu)化探討
        關(guān)于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        由“形”啟“數(shù)”優(yōu)化運算——以2021年解析幾何高考題為例
        發(fā)揮人大在五年規(guī)劃編制中的積極作用
        規(guī)劃引領(lǐng)把握未來
        快遞業(yè)十三五規(guī)劃發(fā)布
        商周刊(2017年5期)2017-08-22 03:35:26
        多管齊下落實規(guī)劃
        十三五規(guī)劃
        華東科技(2016年10期)2016-11-11 06:17:41
        国产成人无码一区二区在线观看| 亚洲综合久久精品少妇av| 成人国产激情自拍视频| 人妻 日韩 欧美 综合 制服| 亚洲av第一成肉网| 欧洲无码一级毛片无遮挡| 男女激情视频网站免费在线| 国产精品国产三级国产av品爱网| 欧美激情a∨在线视频播放 | 久久人妻内射无码一区三区| jlzzjlzz全部女高潮| 中文字幕亚洲视频三区| 亚洲av综合色区无码一区| 怡红院a∨人人爰人人爽| 亚洲AV无码成人精品区天堂| 亚洲一区二区三区免费av| 优优人体大尺大尺无毒不卡 | 97精品国产一区二区三区| 九九99无码精品视频在线观看| 91免费国产| 东北老熟女被弄的嗷嗷叫高潮| 欧美亚洲国产一区二区三区| 尤物99国产成人精品视频| 日韩久久免费精品视频| 国语对白福利在线观看 | 国产一级农村无码| 日本高清长片一区二区| 不卡的av网站在线观看| 青青草视频免费观看| 日本高清在线播放一区二区三区| 新视觉亚洲三区二区一区理伦| 一本色道久久爱88av| 亚洲日韩乱码中文无码蜜桃臀| 国产精品丝袜一区二区三区在线| 亚洲精品1区2区在线观看| 亚洲精品无码av中文字幕| 免费一级a毛片在线播出| 蜜桃网站免费在线观看视频| 亚洲人成色7777在线观看| 国产精品欧美久久久久老妞| 日本在线综合一区二区|