劉先章 張自然
【摘 要】闡述了大數(shù)據(jù)環(huán)境下如何使用深度學習技術(shù),解決軍事(戰(zhàn)術(shù)級)作戰(zhàn)任務(wù)規(guī)劃面臨的戰(zhàn)場環(huán)境復雜,信息不完備、不確定,策略制定設(shè)計到的因素復雜性提高等問題。并分析了深度學習技術(shù)在作戰(zhàn)任務(wù)規(guī)劃中的具體應用模式和工作流程,探討了未來可能的發(fā)展方向,為作戰(zhàn)任務(wù)規(guī)劃的自動化、智能化、自適應化提供了新思路。
【關(guān)鍵詞】大數(shù)據(jù);深度;任務(wù)規(guī)劃
一、什么是作戰(zhàn)任務(wù)規(guī)劃
(一)概念內(nèi)涵
從其規(guī)劃的方法過程來看,“任務(wù)規(guī)劃”一詞可以追索到《運籌學》中的“規(guī)劃”,即研究約束條件下實現(xiàn)目標函數(shù)最優(yōu)的理論和方法。應用于軍事領(lǐng)域,“作戰(zhàn)任務(wù)規(guī)劃”是指根據(jù)已知的約束條件、作戰(zhàn)資源和目標狀態(tài),運用相應的規(guī)劃推理方法,生成一系列、成體系的作戰(zhàn)行動指令,通過執(zhí)行以上指令實現(xiàn)“初始狀態(tài)—目標狀態(tài)”的演變,即在戰(zhàn)爭設(shè)計、組織籌劃的過程中,按流程化的作戰(zhàn)程序,將作戰(zhàn)要素、作戰(zhàn)資源和作戰(zhàn)行動等精確地統(tǒng)籌管理的基本過程。
(二)作戰(zhàn)任務(wù)規(guī)劃的基本流程
目前,作戰(zhàn)任務(wù)規(guī)劃涵蓋了作戰(zhàn)計劃、作戰(zhàn)輔助決策和任務(wù)規(guī)劃等概念,美軍經(jīng)過多年的實戰(zhàn),不斷修訂,形成了較為完備的作戰(zhàn)規(guī)劃流程。美軍《聯(lián)合作戰(zhàn)規(guī)劃》中規(guī)定,作戰(zhàn)任務(wù)規(guī)劃主要包括任務(wù)啟動、規(guī)劃分析、方案制定、行動分析、兵棋推演、方案對比、行動方案報批、計劃或命令制定共七步。本文根據(jù)當代信息化技術(shù)在作戰(zhàn)中應用的特點,結(jié)合我軍目前作戰(zhàn)規(guī)劃任務(wù)的實際需求,采用常規(guī)作戰(zhàn)中任務(wù)規(guī)劃的 “構(gòu)想—方案—計劃”三階段流程,對作戰(zhàn)任務(wù)規(guī)劃流程進行了梳理。
(三)任務(wù)規(guī)劃在作戰(zhàn)領(lǐng)域中的發(fā)展需求
作戰(zhàn)任務(wù)規(guī)劃的出現(xiàn)和發(fā)展是技術(shù)發(fā)展和戰(zhàn)爭形態(tài)變化所驅(qū)動的結(jié)果。信息化條件下的聯(lián)合作戰(zhàn),尤其當下大數(shù)據(jù)和深度學習背景下的人工智能時代,對作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)提出了更高的要求。需要我們必須轉(zhuǎn)換思想觀念,完善體制機制,加強基礎(chǔ)研究,突破關(guān)鍵技術(shù)。將大數(shù)據(jù)和深度學習技術(shù)應用于作戰(zhàn)任務(wù)規(guī)劃中,提高系統(tǒng)的智能化、認知化和自適應化,以適應未來戰(zhàn)爭戰(zhàn)場態(tài)勢瞬變,信息量爆炸等復雜的戰(zhàn)場環(huán)境。
二、深度學習關(guān)鍵技術(shù)
深度學習技術(shù)興起的主要驅(qū)動因素有三個方面,一是大量數(shù)據(jù)的收集與以前相比變得容易;二是計算機硬件技術(shù)發(fā)展所帶來的強大算力,如GPU技術(shù)和并行計算硬件系統(tǒng);三是算法的有效性高更多依賴于數(shù)據(jù)質(zhì)量的好壞。可以說,深度學習帶來的是一種解決問題思維方式的轉(zhuǎn)換:傳統(tǒng)的算法思維是根據(jù)數(shù)據(jù)和規(guī)定尋找答案;而深度學習技術(shù)處理問題的思路,是知道答案和數(shù)據(jù),去尋找數(shù)據(jù)中所蘊含的規(guī)律。也可以理解為解決問題的思路,由曾經(jīng)的模型驅(qū)動轉(zhuǎn)變?yōu)楝F(xiàn)在的數(shù)據(jù)驅(qū)動,是的解決問題的思路發(fā)生了根本性的改變。在當前的大數(shù)據(jù)時代下,用深度學習技術(shù)解決作戰(zhàn)任務(wù)規(guī)劃中的問題,深度學習技術(shù)可以自學習找出數(shù)據(jù)中所蘊含的隱形規(guī)律,有利用問題更好的解決。
三、大數(shù)據(jù)環(huán)境下深度學習在作戰(zhàn)任務(wù)規(guī)劃中的應用
在作戰(zhàn)任務(wù)規(guī)劃的OODA循環(huán)中,各作戰(zhàn)單元實現(xiàn)戰(zhàn)場態(tài)勢信息的實時感知和共享,并在此基礎(chǔ)上對戰(zhàn)場整體態(tài)勢進行理解,實現(xiàn)分布式的動態(tài)規(guī)劃與協(xié)調(diào)。由上節(jié)對大數(shù)據(jù)環(huán)境下深度的簡要介紹可知,在作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)中,深度學習可用于戰(zhàn)場態(tài)勢感知及理解,進而為戰(zhàn)術(shù)決策和任務(wù)規(guī)劃提供重要依據(jù)。即通過獲取海量戰(zhàn)場信息和數(shù)據(jù),實時感知并準確理解戰(zhàn)場態(tài)勢,挖掘復雜態(tài)勢中的隱藏信息,是指揮員做出正確決策規(guī)劃的基礎(chǔ)。近年來,快速發(fā)展的大數(shù)據(jù)和深度學習技術(shù)通過構(gòu)建多層卷積神經(jīng)網(wǎng)絡(luò),采用無、半監(jiān)督逐層訓練方法,提取目標的多尺度特征,避免了梯度發(fā)散和局部最優(yōu)問題,在目標檢測、行為識別、無人駕駛等諸多領(lǐng)域都得到了廣泛應用。將深度學習應用在態(tài)勢理解中,通過多層神經(jīng)網(wǎng)絡(luò)逐層進行訓練,實現(xiàn)對戰(zhàn)場態(tài)勢的認知和理解。訓練數(shù)據(jù)的來源包括歷史數(shù)據(jù)、演習訓練、靶場試驗、戰(zhàn)場仿真等。
(一)場景識別
戰(zhàn)場環(huán)境是戰(zhàn)爭的載體,影響著作戰(zhàn)的全過程。對戰(zhàn)場環(huán)境分析的準確與否,決定了態(tài)勢感知的效果。尤其是未來戰(zhàn)爭環(huán)境包括了海陸空天等多域的結(jié)合,使人主觀判斷的局限性愈發(fā)明顯,此時深度學習等人工智能技術(shù)領(lǐng)域的發(fā)展將有效地適應未來戰(zhàn)場環(huán)境的客觀需求。
(二)目標檢測
在未來戰(zhàn)爭中,敵方目標均為多域多兵種,目標的多樣性、隱蔽性、偽裝性以及戰(zhàn)場環(huán)境的復雜性都大大提升了目標檢測識別的難度,傳統(tǒng)的人工提取特征設(shè)計分類器的方式難以滿足作戰(zhàn)中快速準確識別敵方目標的需求,而深度學習的快速發(fā)展以及大量公開圖像數(shù)據(jù)集的建立,將大幅提高檢測戰(zhàn)場目標的速度和精度,例如:基于區(qū)域選擇的R-CNN系列與端到端的YOLO和SSD系列的檢測速度和精度均有了較大提高。由此可見,基于深度學習的目標檢測方法相較于傳統(tǒng)目標檢測方法而言,其檢測性能得到了顯著提升,部分模型已能夠達到特定應用需求。
(三)行為判斷
行為判斷是通過深層神經(jīng)網(wǎng)絡(luò)提取不同行為的多尺度特征,經(jīng)過分類回歸的方法將待檢測的行為劃分至行為集合中的某一類,包括特征提取、行為描述和回歸分類3個環(huán)節(jié):神經(jīng)網(wǎng)絡(luò)向三維空間的擴展,促使了三維卷積在行為識別中的運用;視頻數(shù)據(jù)中空間和時間信息進行的編碼后,進一步加深和改進了三維卷積在行為識別領(lǐng)域的發(fā)展;雙流卷積神經(jīng)網(wǎng)絡(luò)的方法的提出,可以將空間流和時間流信息進行融合后用于分類識別,大幅提高了行為識別的準確率。
(四)威脅估計
威脅估計是根據(jù)當前戰(zhàn)場形勢對敵方軍事力量的殺傷能力以及對我方的威脅程度的綜合評估。在充分考慮戰(zhàn)場態(tài)勢感知的前提下,根據(jù)敵我雙方的兵力部署、武器性能、敵方攻擊意圖和我方作戰(zhàn)策略,以定量分析的方式對敵方威脅等級進行評估?,F(xiàn)代戰(zhàn)場的快節(jié)奏要求指揮員從戰(zhàn)場上多源數(shù)據(jù)信息中實時分析并預測目標威脅等級,針對敵方作戰(zhàn)行動場景提前進行決策規(guī)劃,這種超前行動方式更適合復雜、多變、突發(fā)性強的未來作戰(zhàn)場景,具有非常重要的意義。因此,及時準確地評估敵方目標威脅度,并根據(jù)我方的作戰(zhàn)方案和武器系統(tǒng)的性能,提前進行科學火力分配和打擊決策,是提高戰(zhàn)場致勝能力的關(guān)鍵。DARPA開展的洞察項目,通過對多類傳感器數(shù)據(jù)進行融合和推理,實現(xiàn)對潛在威脅的評估和預測。
四、結(jié)語
為適應未來智能化戰(zhàn)爭的需要,就要求作戰(zhàn)規(guī)劃任務(wù)朝著自動化、智能化和自學習化發(fā)展。在實際的戰(zhàn)場空間當中,我們所采集的數(shù)據(jù),大多沒有標識,那如何解決這個問題,是作戰(zhàn)任務(wù)規(guī)劃中的核心技術(shù),為此本文根據(jù)數(shù)據(jù)的拓展性和數(shù)據(jù)信息的可遷移性,在現(xiàn)有訓練模型的基礎(chǔ)上,高效分析整合有用信息,結(jié)合遷徙學習、集成學習和半監(jiān)督學習等技術(shù),提高學習效能和質(zhì)量。在對數(shù)據(jù)進行不斷分類、訓練、學習的基礎(chǔ)上,將生成結(jié)果作為作戰(zhàn)任務(wù)規(guī)劃的重要參考,并結(jié)合人工智能、深度等技術(shù),逐步實現(xiàn)數(shù)據(jù)層面和技術(shù)層面的自動化,為指揮員的籌劃提供科學依據(jù),最大程度上降低主觀因素對于作戰(zhàn)指揮的不良影響。
參考文獻:
[1]趙國宏,羅雪山. 作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)研究[J]. 指揮與控制學報,2015(5).
[2]謝蘇明,毛萬峰,李杏. 關(guān)于作戰(zhàn)籌劃與作戰(zhàn)任務(wù)規(guī)劃[J]. 指揮與控制學報,2017,3(4):281-285.
[3]胡曉峰. 關(guān)于聯(lián)合作戰(zhàn)規(guī)劃系統(tǒng)的幾個問題[J]. 指揮與控制學報,2017,3(4):273-280.
[4]劉全,翟建偉,章宗長. 深度強化學習綜述. 計算機學報,2018,41(1).
[5]姜娜,顧慶傳,楊海燕,黃吉亞 .大數(shù)據(jù)下的深度學習算法[J]. 電腦與信息技術(shù),2019(3):33.
[6]U.S. Joint Chiefs of Staff. Joint Operation Planning,Joint Publication(JP)5-0[Z]. 2011(8).
(作者單位:空軍航空大學)