亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智能化作戰(zhàn)任務(wù)規(guī)劃需求分析

        2021-08-26 09:09:32悅,吳琳,許霄,劉
        指揮控制與仿真 2021年4期
        關(guān)鍵詞:規(guī)劃智能模型

        馬 悅,吳 琳,許 霄,劉 昀

        (1.國防大學(xué),北京 100091;2.中國人民解放軍31002部隊,北京 100091)

        現(xiàn)代戰(zhàn)爭對指揮決策的精度、速度和強度提出了更高的需求,而指揮員及參謀機構(gòu)在腦力、體力和反應(yīng)力方面難以承擔(dān)重任。作戰(zhàn)任務(wù)規(guī)劃采用科學(xué)方法和計算機工具,為實現(xiàn)科學(xué)化和精確化作戰(zhàn)指揮提供了有效途徑。近年來,人工智能技術(shù)不斷實現(xiàn)群體性突破,為實現(xiàn)作戰(zhàn)任務(wù)規(guī)劃注入了新鮮血液。尤其是諸多智能博弈系統(tǒng)在邊界和規(guī)則確定的游戲?qū)怪腥〉昧孙@著成績,不僅極大地推動了認知智能發(fā)展,更為軍事決策智能指明了探索方向。例如,Deep Mind相繼推出圍棋Alpha Go系列AI系統(tǒng),成功解決了有限狀態(tài)零和完全信息兩人博弈問題[1-3];美國卡耐基梅隆大學(xué)開發(fā)了Libratus系統(tǒng)[4]和Pluribus系統(tǒng)[5],突破了多人游戲智能博弈的壁壘。繼圍棋、德州撲克等序貫博弈之后,以實時策略游戲為代表的同步博弈問題成為研究熱點,Deep Mind在2019年公布的Alpha Star[6],對開發(fā)具有安全性、魯棒性和實用性的通用AI系統(tǒng)具有重要意義。

        本文通過梳理作戰(zhàn)任務(wù)規(guī)劃的基本概念、關(guān)鍵內(nèi)容和研究現(xiàn)狀,分析了現(xiàn)有模型方法在滿足軍事需求和應(yīng)對戰(zhàn)爭復(fù)雜性方面存在的局限性,提出了利用智能方法輔助作戰(zhàn)任務(wù)規(guī)劃的必要性,并基于分層決策、知識引導(dǎo)和效果作戰(zhàn)等理論構(gòu)建了智能規(guī)劃框架,為如何提高復(fù)雜戰(zhàn)場環(huán)境下作戰(zhàn)任務(wù)規(guī)劃的全局優(yōu)化能力和泛化適應(yīng)能力提供借鑒。

        1 作戰(zhàn)任務(wù)規(guī)劃的概念及內(nèi)容

        作戰(zhàn)任務(wù)規(guī)劃(Operation Task Planning)是在作戰(zhàn)資源和作戰(zhàn)規(guī)則等諸多約束條件下,以實現(xiàn)作戰(zhàn)意圖為目的,運用科學(xué)規(guī)劃方法和計算機工具對作戰(zhàn)行動進程、作戰(zhàn)任務(wù)安排、力量資源使用和部隊協(xié)同行動等進行籌劃設(shè)計的過程[7-11]。如圖1所示,戰(zhàn)前的作戰(zhàn)任務(wù)規(guī)劃用于輔助生成作戰(zhàn)方案計劃,指導(dǎo)部隊執(zhí)行作戰(zhàn)任務(wù);戰(zhàn)時的作戰(zhàn)任務(wù)規(guī)劃與指揮控制密切關(guān)聯(lián),輔助方案計劃的動態(tài)調(diào)整或重新生成,以應(yīng)對種種不確定性因素。

        圖1 作戰(zhàn)任務(wù)規(guī)劃的作用

        作戰(zhàn)任務(wù)規(guī)劃對上接收作戰(zhàn)意圖和作戰(zhàn)構(gòu)想,對下為所屬力量規(guī)劃目標(biāo)和行動,其內(nèi)容及邊界如圖2所示,主要包括:1)明確作戰(zhàn)任務(wù),通過分析確定需要執(zhí)行的作戰(zhàn)任務(wù)及相應(yīng)的協(xié)同保障事宜,形成作戰(zhàn)任務(wù)清單;2)生成任務(wù)序列,充分認識作戰(zhàn)過程中可能遭遇的種種情況,設(shè)計作戰(zhàn)行動或作戰(zhàn)任務(wù)流程,為力量資源分配和部隊協(xié)同動作提供依據(jù);3)合理分配資源,實現(xiàn)作戰(zhàn)任務(wù)與作戰(zhàn)資源的動態(tài)映射,主要解決資源轉(zhuǎn)移、資源沖突和效益最大化等問題;4)協(xié)調(diào)作戰(zhàn)行動,在明確作戰(zhàn)任務(wù)及其執(zhí)行單元、所需資源、完成時間和空間位置后,通過協(xié)調(diào)作戰(zhàn)行動,使各種作戰(zhàn)力量相互配合、優(yōu)勢互補、效果銜接,從而形成有機整體。

        圖2 作戰(zhàn)任務(wù)規(guī)劃的內(nèi)容及邊界

        2 作戰(zhàn)任務(wù)規(guī)劃的智能化需求

        作戰(zhàn)任務(wù)規(guī)劃是一個迭代優(yōu)化的過程,傳統(tǒng)方法難以同時滿足任務(wù)規(guī)劃的長程性、對抗性、適應(yīng)性和成長性需求,戰(zhàn)爭的高度復(fù)雜性增大了規(guī)劃難度。因此,迫切需要采用智能化手段來解決重難點問題。

        2.1 傳統(tǒng)方法的局限性

        作戰(zhàn)任務(wù)規(guī)劃相關(guān)研究主要分為兩方面,如圖3所示。一是規(guī)劃模型研究,包括數(shù)學(xué)解析模型[12-13]、概率網(wǎng)絡(luò)模型[14-16]、分層網(wǎng)絡(luò)模型[17-19]、資源調(diào)度模型[20]、動態(tài)決策模型[21-22]和多智能體模型[23-24];二是求解方法研究,包括空間搜索方法[25-27]、遺傳進化方法(如遺傳算法、差分進化算法等)[28-31]、仿生物學(xué)方法(如蟻群算法、粒子群算法等)[32-36]、市場機制方法(如合同網(wǎng)協(xié)議、拍賣法等)[37-39]、智能規(guī)劃方法(如基于有限狀態(tài)機規(guī)劃、基于分層任務(wù)網(wǎng)絡(luò)規(guī)劃和基于行為樹規(guī)劃等)[40-41]和深度強化學(xué)習(xí)[6]。

        圖3 模型構(gòu)建與求解方法

        上述研究雖各有成功案例,但均存在一定缺陷:

        1)模型對問題描述不夠全面。如數(shù)學(xué)解析模型只適用于靜態(tài)的宏觀或微觀問題;概率網(wǎng)絡(luò)模型側(cè)重于描述作戰(zhàn)行動之間的因果關(guān)系;層次網(wǎng)絡(luò)模型側(cè)重于描述任務(wù)之間的層次關(guān)系;資源調(diào)度模型側(cè)重于描述作戰(zhàn)任務(wù)與作戰(zhàn)力量及資源之間的匹配關(guān)系,常被嵌入其他模型使用;而智能規(guī)劃模型側(cè)重于動作的選擇與尋優(yōu),缺乏對長期利益的考慮。

        2)模型構(gòu)建的復(fù)雜性較高。如概率網(wǎng)絡(luò)中存在大量條件概率需要人工定義,模型構(gòu)造難度大,問題求解效率低;層次網(wǎng)絡(luò)模型構(gòu)建質(zhì)量決定了智能規(guī)劃的好壞,且難以在動態(tài)復(fù)雜問題中表現(xiàn)出智能;有限狀態(tài)機和行為樹對知識依賴性高,模型構(gòu)造和維護的難度隨問題規(guī)模增大呈指數(shù)級增長,難以滿足敏捷開發(fā)的要求;合同網(wǎng)協(xié)議存在大量協(xié)同規(guī)則,需要相關(guān)領(lǐng)域?qū)<液湍P驮O(shè)計人員共同定義。

        3)求解算法本身存在缺陷。如狀態(tài)空間搜索方法,當(dāng)采用深度優(yōu)先時可能無法求解,而采用廣度優(yōu)先時,搜索空間將呈指數(shù)級增長;進化算法存在收斂過早、迭代時間長、求解精度不高等缺陷,算法參數(shù)較為復(fù)雜且初始值對最終解的影響較大;蟻群算法的參數(shù)敏感性高、解的多樣性和準(zhǔn)確性之間存在矛盾、容易陷入局部最優(yōu)或發(fā)生搜索停滯;粒子群算法全局搜索能力弱、可信度低且需較高的時間復(fù)雜度才能得到較優(yōu)解;市場機制法在全局尋優(yōu)過程中,當(dāng)協(xié)商通信量較大時,由于協(xié)調(diào)機制有效性低,容易導(dǎo)致整體利益與個體利益產(chǎn)生沖突;智能規(guī)劃大多用于產(chǎn)生反應(yīng)式行為,無法展現(xiàn)復(fù)雜態(tài)勢下符合人類認知機理的高級決策智能行為。

        2.2 作戰(zhàn)任務(wù)規(guī)劃難點

        戰(zhàn)爭是交戰(zhàn)雙方的動態(tài)博弈,時刻受諸多不確定性因素的影響。作戰(zhàn)任務(wù)規(guī)劃要在“知己知彼”的基礎(chǔ)上,始終圍繞軍事使命展開任務(wù)流程、資源使用和行動協(xié)同的籌劃設(shè)計,并能根據(jù)戰(zhàn)局發(fā)展進行調(diào)整。而當(dāng)前規(guī)劃模型和求解方法的研究成果還難以滿足軍事應(yīng)用需求,作戰(zhàn)任務(wù)規(guī)劃需要著重把握以下要點。

        1)實現(xiàn)動態(tài)對抗條件下的有效規(guī)劃

        在動態(tài)對抗條件下,戰(zhàn)爭中的諸多不確定性因素隨之而來,戰(zhàn)場信息的不完全/不完美、敵方威脅評估和意圖識別的模糊性等時刻存在。目前,大多數(shù)研究通常僅從自身任務(wù)完成效果、時間限制、效益最大化等角度來構(gòu)建作戰(zhàn)任務(wù)規(guī)劃的最優(yōu)化問題,將對手視為靜態(tài)的、非智能的被動防御目標(biāo),忽略了動態(tài)博弈的本質(zhì)特征——作戰(zhàn)雙方的策略高度關(guān)聯(lián)、相互制約,從而導(dǎo)致方案計劃在現(xiàn)實條件下失效。因此,必須貼近軍事對抗博弈實際,基于雙方作戰(zhàn)模式考慮敵方作戰(zhàn)意圖及行動對完成任務(wù)造成的威脅,探索在動態(tài)對抗中研究作戰(zhàn)任務(wù)規(guī)劃的新方法,更加有效地實現(xiàn)作戰(zhàn)力量的聚合與解聚。

        2)實現(xiàn)面向戰(zhàn)役使命的全局優(yōu)化

        戰(zhàn)役級作戰(zhàn)任務(wù)規(guī)劃的決策周期長、動作空間大、態(tài)勢復(fù)雜多變,極易導(dǎo)致規(guī)劃結(jié)果局部最優(yōu)和泛化能力弱等問題。針對作戰(zhàn)任務(wù)與作戰(zhàn)效果之間的關(guān)系,當(dāng)前研究或是采用Petri網(wǎng)、貝葉斯網(wǎng)以及影響網(wǎng)等概率網(wǎng)絡(luò)方法生成詳細的戰(zhàn)前作戰(zhàn)方案計劃,或是基于智能規(guī)劃方法進行反應(yīng)式規(guī)劃。兩種方式都難以滿足實際作戰(zhàn)對“瞄準(zhǔn)目標(biāo)、靈活指導(dǎo)”的需求。首先,由于戰(zhàn)爭系統(tǒng)復(fù)雜性和小概率意外事件不可“窮舉”,導(dǎo)致難以生成詳細精確的作戰(zhàn)方案計劃[42];其次,戰(zhàn)前周密的任務(wù)規(guī)劃雖然能在直觀上細化每個階段的作戰(zhàn)行動,但無疑增加了未來不適應(yīng)性的風(fēng)險,各種不確定性因素將導(dǎo)致其失效,從而增加了調(diào)整甚至重新規(guī)劃的開銷,同時也容易禁錮指揮員的思維;第三,反應(yīng)式規(guī)劃難以滿足作戰(zhàn)指揮對戰(zhàn)爭設(shè)計、指揮藝術(shù)性和長程規(guī)劃的要求,我們期望兵棋系統(tǒng)中的“智能指揮員”能像Alpha Go一般,面對復(fù)雜變化的“棋盤”,可以預(yù)測往后每一步“落子”產(chǎn)生的效果,從而能夠面向更全局、更長久的目標(biāo)進行籌劃,體現(xiàn)各領(lǐng)域各層級的協(xié)同性以及指揮員的指揮藝術(shù)性。

        3)提高應(yīng)對不確定性因素的適應(yīng)能力

        針對不確定性因素問題,當(dāng)前研究可分為預(yù)測式和反應(yīng)式兩種方案。預(yù)測式方法旨在增加作戰(zhàn)任務(wù)序列的魯棒性,以實現(xiàn)對影響因素的不敏感。但是,預(yù)測式方法中冗余的判斷條件和作戰(zhàn)行動會帶來過大的執(zhí)行代價;魯棒性優(yōu)化是在一定約束條件下增大行動方案完成預(yù)期目標(biāo)的概率,而非更加有效地完成使命任務(wù),這與實現(xiàn)長程規(guī)劃不相符。反應(yīng)式方法旨在持續(xù)保持對戰(zhàn)場態(tài)勢和意外事件的監(jiān)控識別,以實現(xiàn)方案計劃的實時動態(tài)調(diào)整,相對魯棒性優(yōu)化而言,該方法執(zhí)行成本小、實施靈活。然而,反應(yīng)式方法不符合實際作戰(zhàn)要求,作戰(zhàn)任務(wù)規(guī)劃主要用于為部隊執(zhí)行任務(wù)提供參照標(biāo)準(zhǔn),確保任務(wù)部隊有充足的時間進行準(zhǔn)備,頻繁調(diào)整將導(dǎo)致部隊疲于奔命,陷入被敵人“牽著鼻子走”的困境。因此,作戰(zhàn)任務(wù)規(guī)劃的適應(yīng)性既不是反應(yīng)式規(guī)劃也不是魯棒性優(yōu)化,而是根據(jù)戰(zhàn)場態(tài)勢感知、敵方意圖識別和威脅評估的動態(tài)監(jiān)控情況,對基線方案進行調(diào)整,響應(yīng)意外情況并確保戰(zhàn)局發(fā)展朝向既定戰(zhàn)役目標(biāo)。

        2.3 智能方法需求

        現(xiàn)有模型方法的局限性、聯(lián)合作戰(zhàn)的軍事需求以及戰(zhàn)爭的復(fù)雜性,對采用智能化手段輔助作戰(zhàn)任務(wù)規(guī)劃提出了迫切需求。

        1)戰(zhàn)爭充滿迷霧和不確定性,迫切需要采用智能化手段認知戰(zhàn)場態(tài)勢、推測敵方意圖和記憶敵方策略。由于預(yù)警范圍和偵察注意力受限,只能從戰(zhàn)場環(huán)境中獲取部分信息,敵方行動策略和作戰(zhàn)企圖無法完全知曉。戰(zhàn)爭信息的高度不確定性,導(dǎo)致基于先驗知識推理未知領(lǐng)域的方式難以奏效;信息的缺失導(dǎo)致以求解局部最優(yōu)來獲取全局最優(yōu)的方式無法完成策略回溯。指揮員需要在一個非完全信息環(huán)境下進行決策,必須具備高效準(zhǔn)確的偵察、探索、記憶和推測能力。

        2)軍事博弈對抗持續(xù)、激烈且非零和,迫切需要采用智能化方法構(gòu)建動態(tài)決策模型、迭代更新方案計劃和優(yōu)化多目標(biāo)作戰(zhàn)評估體系。戰(zhàn)爭節(jié)奏緊張,局勢變幻莫測,雖然可將動態(tài)連續(xù)決策過程離散為更精細的時間片段,然后采用輪次博弈的靜態(tài)解決方法,但以離散方式進行抽象建模,必然需要解決時間尺度、模型精度和求解復(fù)雜度之間的矛盾。作戰(zhàn)指揮不僅要考慮作戰(zhàn)目的和戰(zhàn)場態(tài)勢,還要持續(xù)判斷敵方企圖和戰(zhàn)法,反復(fù)迭代更新方案計劃,巧妙利用佯裝行動誘騙敵方,以掌握戰(zhàn)爭主動權(quán)。軍事博弈的多方參與和政治、經(jīng)濟、軍事及外交利益的平衡,導(dǎo)致難以依靠單一指標(biāo)的價值網(wǎng)絡(luò),來評價這種模糊、復(fù)雜、稀疏及非零和的博弈收益。

        3)作戰(zhàn)指揮的決策空間大,難以依靠遍歷求解或模擬仿真等方法進行求解,需要采用智能化方法降低決策空間維度和尋找策略均衡解。指揮員的每次決策都會涉及任務(wù)類型、執(zhí)行單位、執(zhí)行空間和時間的選擇,不同作戰(zhàn)單位和作戰(zhàn)行動之間的時間協(xié)同、效果協(xié)同和任務(wù)協(xié)同進一步增大了策略空間。此外,多方博弈增大了達成納什均衡的難度,多軍兵種參戰(zhàn)增加了協(xié)同難度,策略之間相互克制和歷史遺忘特性明顯。而戰(zhàn)爭規(guī)則的多樣性、創(chuàng)新性和復(fù)雜性,進一步增大了狀態(tài)策略空間的規(guī)模和納什均衡的求解難度。

        4)聯(lián)合作戰(zhàn)具有大空間作戰(zhàn)和多領(lǐng)域融合的特性,迫切需要采用智能化方法解決指揮決策在時間、空間和事件上的推理問題?,F(xiàn)代作戰(zhàn)方式已從傳統(tǒng)的由外及內(nèi)逐層消滅敵人的線性作戰(zhàn),轉(zhuǎn)變?yōu)榧腥蛄α窟M行全縱深整體打擊的非線性作戰(zhàn)。戰(zhàn)爭中事件因果關(guān)系錯綜復(fù)雜,通常難以在短時間內(nèi)呈現(xiàn),作戰(zhàn)方案計劃的制定要重點研究作戰(zhàn)行動與作戰(zhàn)效果之間的非線性關(guān)系。策略學(xué)習(xí)應(yīng)具有記憶功能,以判斷什么樣的行動產(chǎn)生了好的效果、什么樣的策略更具有獲勝的可能性,從而在不斷對抗中實現(xiàn)成長。

        3 作戰(zhàn)任務(wù)智能規(guī)劃框架

        3.1 理論依據(jù)

        1)模擬人類思維進行分層決策

        戰(zhàn)爭的非透明性和不確定性,使得作戰(zhàn)指揮過程極其復(fù)雜,模擬人類思維流程進行分層決策和多尺度規(guī)劃,將復(fù)雜問題分解為若干子問題,從而降低求解難度。上層策略為下層規(guī)劃目標(biāo),而下層策略執(zhí)行支撐上層規(guī)劃,如高層策略關(guān)注戰(zhàn)役全局問題、底層策略聚焦短期利益、即時策略控制當(dāng)前反應(yīng)式動作。

        在當(dāng)前技術(shù)條件下,完全依賴機器存在可解釋性差、輸出不可控等問題,分層決策框架下實現(xiàn)人機融合決策是提高決策合理性和適用性的有效方法。智能機器能夠提高決策速度,而以人類戰(zhàn)法思想牽引機器智能的策略生成,能夠適應(yīng)不同想定和不同應(yīng)用場景。人機融合決策有兩種實現(xiàn)形式。一是分層融合,低層決策采用傳統(tǒng)運籌學(xué)、貝葉斯網(wǎng)絡(luò)、機器學(xué)習(xí)等方法;中間層級決策采用不同程度的人機協(xié)作決策,重點研究人機協(xié)作的時機、場合和方式等;而高層級指揮決策需要由指揮員及參謀機構(gòu)完成。二是分時機融合,指揮決策是一個滾動迭代、不斷優(yōu)化的過程。人與機器在各環(huán)節(jié)都有擅長與不足之處,如機器善于快速運籌計算和基于數(shù)據(jù)挖掘關(guān)聯(lián)關(guān)系,人善于基于因果關(guān)系進行非即時反饋決策。

        2)基于知識規(guī)則提高決策效率和質(zhì)量

        人類在解決問題時更傾向于遵循成熟規(guī)則。當(dāng)前,機器還難以模仿人類大腦的復(fù)雜學(xué)習(xí)能力,智能博弈水平需要漫長的成長過程。充分利用軍事領(lǐng)域?qū)<业慕?jīng)驗知識和兵棋系統(tǒng)對抗演習(xí)的歷史數(shù)據(jù),可以避免讓機器從零學(xué)習(xí)而進行過長時間的探索,同時也對決策過程有更好的解釋。

        傳統(tǒng)基于知識的專家系統(tǒng),利用人類經(jīng)驗和專家知識,便可解決各領(lǐng)域的復(fù)雜問題。在深度學(xué)習(xí)盛行之后,基于知識規(guī)則的智能技術(shù)依舊取得了不凡的成績。例如,東京大學(xué)日麻AI系統(tǒng)利用9.6萬多條規(guī)則進行監(jiān)督學(xué)習(xí),達到了專業(yè)六段水平[43];韓國三星的賽達(SDS AI Data Analysis,SAIDA)系統(tǒng)完全憑借職業(yè)玩家規(guī)則知識,在2018年第八屆星際爭霸智能挑戰(zhàn)賽中獲得第一[44]。即便融合了深層神經(jīng)網(wǎng)絡(luò)的AlphaGo和Alpha Star,依然需要在預(yù)訓(xùn)練中使用大量人類對局數(shù)據(jù)進行模仿學(xué)習(xí)。雖然Alpha Zero和Muzero能夠完全通過自主學(xué)習(xí)實現(xiàn)成長[45],但圍棋游戲與戰(zhàn)爭對抗存在天壤之別,難以直接應(yīng)用于軍事領(lǐng)域。當(dāng)前強化學(xué)習(xí)還難以實現(xiàn)從基本策略中總結(jié)出高層策略,現(xiàn)有的條令條例、作戰(zhàn)規(guī)則等大量知識可轉(zhuǎn)化為知識網(wǎng)絡(luò)以引導(dǎo)AI系統(tǒng)。

        3)面向使命任務(wù)的基于效果作戰(zhàn)

        戰(zhàn)役所期望達到的作戰(zhàn)效果,就是戰(zhàn)役所確立的終止態(tài)勢,可描述為一組態(tài)勢指標(biāo)。指揮員在下達作戰(zhàn)任務(wù)時,既要考慮能否應(yīng)對當(dāng)前敵方威脅,又要考慮能否為完成最終作戰(zhàn)使命提供較大貢獻。因此,需要綜合分析我方行動、敵方威脅和作戰(zhàn)效果之間的影響關(guān)系,以確保作戰(zhàn)任務(wù)規(guī)劃能夠促成期望態(tài)勢。

        基于效果作戰(zhàn)研究“從效果到任務(wù)以及任務(wù)對效果的支持”,實際是基于目標(biāo)分解的逆向規(guī)劃,將目標(biāo)分解為具體預(yù)期的效果,不僅體現(xiàn)了作戰(zhàn)的非線性,而且能夠表達作戰(zhàn)的不確定性。目前,大多數(shù)文獻主要采用貝葉斯網(wǎng)絡(luò)、影響網(wǎng)、影響圖等技術(shù)開展研究,雖然能夠形式化地描述作戰(zhàn)任務(wù)與作戰(zhàn)效果之間的不確定影響關(guān)系,但是一般只關(guān)注作戰(zhàn)任務(wù)或作戰(zhàn)行動的即時作戰(zhàn)效果及實現(xiàn)概率,而對長遠作戰(zhàn)效益的討論較少。這相當(dāng)于將整個作戰(zhàn)計劃機械地割裂為若干階段,通過簡單疊加各階段的最優(yōu)來尋求全局最優(yōu)。近年來,基于效果作戰(zhàn)的理論產(chǎn)生很大爭議,反對者認為戰(zhàn)爭充滿了不確定性,要準(zhǔn)確預(yù)測某一行動的效果在邏輯上是不可能的,忽視了戰(zhàn)爭系統(tǒng)的不可預(yù)測性。但是,美軍《Joint Publication 5-0:Joint Planning》[46]將“作戰(zhàn)效果”作為作戰(zhàn)行動方案(Course of Action,COA)生成鏈中的5大要素之一,從而將COA的生成過程統(tǒng)一成一個邏輯整體,每一作戰(zhàn)階段都需要確定對上一作戰(zhàn)階段的支撐效果,以及對最終戰(zhàn)役目的的支持程度,正是體現(xiàn)了長期與短期收益、全局與局部收益的權(quán)衡。

        4)任務(wù)式指揮提高決策的靈活性和適應(yīng)性

        任務(wù)式指揮是集中指揮與分散指揮的結(jié)合。集中指揮體現(xiàn)在將指揮信息、行動指向和作戰(zhàn)效果集中在統(tǒng)一意圖上,指揮官的精力不再受任務(wù)執(zhí)行細節(jié)的牽扯,而聚焦于統(tǒng)籌全局和把握作戰(zhàn)關(guān)鍵環(huán)節(jié);分散指揮體現(xiàn)在作戰(zhàn)力量分散部署、作戰(zhàn)決策分散實施和作戰(zhàn)過程分散控制,各級部隊在一定權(quán)限內(nèi)充分發(fā)揮主動性來自主行動[47]。任務(wù)式指揮為實現(xiàn)決策智能提供了很好的借鑒。首先,智能決策的本質(zhì)在于進行權(quán)衡和選擇,而不是擬制周密的方案計劃,作戰(zhàn)任務(wù)規(guī)劃是一個貫穿作戰(zhàn)始終的螺旋升級優(yōu)化的過程。戰(zhàn)爭中態(tài)勢瞬息萬變,預(yù)測中的小概率“灰犀?!笔录筒恢売傻摹昂谔禊Z”事件往往成為突發(fā)意外,各種不確定性因素將導(dǎo)致戰(zhàn)前周密計劃不適用。其次,智能決策的核心是科學(xué)分析和任務(wù)協(xié)調(diào),而不是實時進行臨機規(guī)劃或頻繁進行重規(guī)劃,作戰(zhàn)任務(wù)規(guī)劃的適應(yīng)性是圍繞基線預(yù)案在戰(zhàn)役目標(biāo)保持不變的情況下對所有子任務(wù)進行聯(lián)動協(xié)調(diào)。根據(jù)復(fù)雜系統(tǒng)理論,涌現(xiàn)可以在局部感知計算、多智能體非線性交互等簡單條件下產(chǎn)生,從而實現(xiàn)靈活性、非機械性和創(chuàng)造性。因此,作戰(zhàn)任務(wù)智能規(guī)劃可采取以下基本思路:通過戰(zhàn)前規(guī)劃形成基線預(yù)案,粗粒度的基線預(yù)案為動態(tài)調(diào)整設(shè)置了方向和限制,戰(zhàn)時根據(jù)實時態(tài)勢對作戰(zhàn)任務(wù)進行聯(lián)動的協(xié)調(diào)控制。

        3.2 智能框架設(shè)計

        本文對文獻[42]中提出的“局部優(yōu)化+全局平衡+控制調(diào)度”智能決策思路進行拓展,引入領(lǐng)域知識進行引導(dǎo),將自頂向下的規(guī)劃和自底向上的決策相結(jié)合,構(gòu)建“知識引導(dǎo)+全局平衡+協(xié)調(diào)控制+局部優(yōu)化”的作戰(zhàn)任務(wù)智能規(guī)劃框架,如圖4所示。智能規(guī)劃框架旨在通過“集中規(guī)劃和分布決策”的方式,提高作戰(zhàn)任務(wù)規(guī)劃的全局優(yōu)化能力和泛化適應(yīng)能力,滿足在動態(tài)對抗條件下的有效性和復(fù)雜環(huán)境中應(yīng)對不確定性因素的適用性。

        圖4 作戰(zhàn)任務(wù)智能規(guī)劃框架

        知識引導(dǎo)主要完成領(lǐng)域知識的形式化描述和作戰(zhàn)任務(wù)的智能推薦,為作戰(zhàn)任務(wù)規(guī)劃提供支撐。利用軍事領(lǐng)域知識和演習(xí)歷史數(shù)據(jù)構(gòu)建事理圖譜,而后基于事理圖譜設(shè)計智能推薦算法,實現(xiàn)針對敵方行動意圖和任務(wù)執(zhí)行效果遇阻的作戰(zhàn)任務(wù)推薦。實際是為作戰(zhàn)任務(wù)序列的不確定性推理進行策略空間約簡,為后續(xù)研究作戰(zhàn)任務(wù)與作戰(zhàn)效果關(guān)系降低復(fù)雜度。

        全局平衡,主要完成作戰(zhàn)任務(wù)序列規(guī)劃,為作戰(zhàn)任務(wù)分布式執(zhí)行提供基線方案,規(guī)范方案動態(tài)調(diào)整的范圍,確保戰(zhàn)局始終朝向終止態(tài)勢。模仿指揮員觀察、判斷、決策和執(zhí)行的思維過程,以戰(zhàn)役作戰(zhàn)任務(wù)為規(guī)劃對象,將作戰(zhàn)任務(wù)規(guī)劃過程轉(zhuǎn)換為馬爾科夫決策過程,采用靜態(tài)策略求解算法,得到最優(yōu)“動作”序列。這種“集中式規(guī)劃基線方案,而后交由下層任務(wù)智能體執(zhí)行”的思路,模擬了“任務(wù)式指揮”的軍事思想。

        協(xié)調(diào)控制主要完成對作戰(zhàn)任務(wù)落地執(zhí)行的協(xié)調(diào)控制,通過作戰(zhàn)任務(wù)在時間、空間、力量配屬和效果上的協(xié)同,完成基線方案規(guī)定的作戰(zhàn)任務(wù)安排。作戰(zhàn)任務(wù)協(xié)調(diào)是銜接作戰(zhàn)任務(wù)序列與作戰(zhàn)任務(wù)執(zhí)行的關(guān)鍵,通過上層規(guī)劃引導(dǎo)下層智能體的非線性交互實現(xiàn)智能涌現(xiàn)。下層任務(wù)智能體接收上層指定的任務(wù)后,通過分布式協(xié)作決定“在何時(When)于哪里(Where)如何(How)協(xié)同完成,并確定具體執(zhí)行單元(Who)”。在實時戰(zhàn)場態(tài)勢下,多智能體通過協(xié)商機制來確定任務(wù)執(zhí)行的“作戰(zhàn)單位、時間、位置和資源”,從而實現(xiàn)任務(wù)協(xié)同、目標(biāo)協(xié)同和行動協(xié)同。智能的涌現(xiàn),正是體現(xiàn)在多任務(wù)智能體在不同戰(zhàn)場態(tài)勢和威脅情況下的“動作”協(xié)同上,而這里的“動作空間”是<單位,時間,位置,資源>的聯(lián)合空間。

        局部優(yōu)化主要基于智能體理論構(gòu)建任務(wù)智能體,將戰(zhàn)術(shù)層作戰(zhàn)行動映射為任務(wù)智能體可執(zhí)行動作,采用經(jīng)典運籌學(xué)方法優(yōu)化底層動作策略。任務(wù)智能體的構(gòu)建,一方面能夠保證作戰(zhàn)任務(wù)序列方案落地為具體動作,另一方面能夠簡化高層策略尋優(yōu)的“動作”和“狀態(tài)”空間,從而將智能決策重點聚焦于戰(zhàn)役層作戰(zhàn)任務(wù)序列規(guī)劃和作戰(zhàn)行動協(xié)調(diào)控制策略的優(yōu)化。

        學(xué)習(xí)機制主要通過深度強化學(xué)習(xí)不斷優(yōu)化策略。學(xué)習(xí)主要體現(xiàn)在三方面:一是通過學(xué)習(xí)優(yōu)化“威脅-任務(wù)”的因果關(guān)系,從而實現(xiàn)作戰(zhàn)任務(wù)推薦;二是通過學(xué)習(xí)確定作戰(zhàn)任務(wù)之間的轉(zhuǎn)移概率;三是通過學(xué)習(xí)提升多智能體協(xié)同策略的泛化性。強化學(xué)習(xí)通過“試錯”進行反復(fù)訓(xùn)練和學(xué)習(xí),理論上可以不依賴于任何知識。深度學(xué)習(xí)具有強大的非線性表示能力,利用多層神經(jīng)網(wǎng)絡(luò)能夠從海量數(shù)據(jù)中逐層抽象特征、學(xué)習(xí)經(jīng)驗知識。深度學(xué)習(xí)與強化學(xué)習(xí)結(jié)合后,深度學(xué)習(xí)提供了學(xué)習(xí)基準(zhǔn),保證了前期策略探索在有監(jiān)督下進行,強化學(xué)習(xí)在訓(xùn)練過程中根據(jù)獎懲不斷提升策略水平,實現(xiàn)了高效的策略優(yōu)化。

        4 結(jié)束語

        本文討論了作戰(zhàn)任務(wù)規(guī)劃的基本概念、主要內(nèi)容及邊界,分析了傳統(tǒng)方法的局限性和智能化需求,詳細闡述了相關(guān)理論基礎(chǔ),并依此構(gòu)建了智能規(guī)劃框架。雖然當(dāng)前機器還難以模仿人類大腦的復(fù)雜學(xué)習(xí)能力,智能水平需要漫長的成長過程。但是,通過經(jīng)驗知識引導(dǎo)減少搜索空間,模擬人類思維分層決策降低問題難度,基于效果分析提高全局優(yōu)化能力,利用多智能體協(xié)作實現(xiàn)智能涌現(xiàn),可為實現(xiàn)智能化作戰(zhàn)任務(wù)規(guī)劃提供借鑒及參考。

        猜你喜歡
        規(guī)劃智能模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        規(guī)劃引領(lǐng)把握未來
        快遞業(yè)十三五規(guī)劃發(fā)布
        商周刊(2017年5期)2017-08-22 03:35:26
        多管齊下落實規(guī)劃
        内谢少妇xxxxx8老少交| 国产人成无码视频在线观看 | 日本三级香港三级人妇99| 亚洲av无码日韩av无码网站冲| 天堂国产一区二区三区| 久久天天躁狠狠躁夜夜2020一| 国产熟妇按摩3p高潮大叫| 洗澡被公强奷30分钟视频| 欧美黑人乱大交| 在线免费观看韩国a视频| 亚洲精品综合一区二区| 亚洲综合色丁香婷婷六月图片 | 一区欧美在线动漫| 国产大陆av一区二区三区| 熟女乱乱熟女乱乱亚洲| 亚洲不卡av二区三区四区| 中文字幕av人妻少妇一区二区| 日本一区二区三区视频在线观看| 五月丁香六月综合缴清无码 | 亚洲中文久久精品无码ww16| 在线人妻无码一区二区| 国产美女精品AⅤ在线老女人| 女同国产日韩精品在线| 精品国产日韩亚洲一区在线| 国产让女高潮的av毛片| 射精区-区区三区| 午夜丰满少妇性开放视频| 999国产精品亚洲77777| 天天干夜夜躁| 亚洲av乱码国产精品色| 国产自拍成人免费视频| 国产aⅴ无码专区亚洲av| 97久久精品无码一区二区天美| 娇妻玩4p被三个男人伺候电影| AV教师一区高清| 亚洲高清在线观看免费视频| 中文字幕中文字幕三区| 大陆老熟女自拍自偷露脸| 亚洲精品成人网站在线播放| 亚洲日韩中文字幕一区| 国产精品不卡无毒在线观看|