鄭 劍,郭陽芃,劉俊先
(1. 中國人民解放軍63786部隊,新疆 烏魯木齊 830000;2. 國防科技大學信息系統(tǒng)工程重點實驗室,湖南 長沙 410073)
隨著新軍事變革,未來戰(zhàn)爭形態(tài)正由信息化戰(zhàn)爭向智能化戰(zhàn)爭演進,無人作戰(zhàn)必將在未來作戰(zhàn)場景中占有重要定位。美國國防部于2018年8月28日公布了無人系統(tǒng)綜合路線圖,即《無人系統(tǒng)綜合路線圖(2017-2042)》[1],確定了無人系統(tǒng)未來發(fā)展的四個關鍵性主題,其中包括自主性。因此,面向未來作戰(zhàn)場景,在無人作戰(zhàn)系統(tǒng)設計環(huán)節(jié),自主性作為無人作戰(zhàn)系統(tǒng)性能評價的重要指標之一,是衡量未來無人作戰(zhàn)系統(tǒng)與有人作戰(zhàn)系統(tǒng)或其他無人作戰(zhàn)系統(tǒng)的集成程度、自主行為能力、能否在動態(tài)的戰(zhàn)場環(huán)境中獨立地完成復雜任務能力等的標準。
隨著人們對自主性研究的深入,自主性評估的方法也越來越多。Sheridan等人[2]概述了具有自主能力的人機交互等級模型。文獻[3]提出的模型是基于計算機系統(tǒng)做出自主決策的。Rgyan等[4]提出了用任務評估和重規(guī)劃能力對系統(tǒng)按照模塊化功能進行評級的方法。除此之外,還有基于代價分析[5]、成本/收益分析[6]、軌跡片段分析[7]、智能行為能力[8]等多種性能決策的方法。文獻[9] 提出了一種基于無人機自主水平的選擇方法。NIST的 ALFUS工作組在2003年提出了無人系統(tǒng)自主級別框架,該框架對各種類型的無人系統(tǒng)進行評估及相應的等級劃分,并且第一次對無人系統(tǒng)的自主性評估進行規(guī)范化,建立對應框架,并且提供了相應的理論指導[10]。另一個有代表性的軸分析方法是蛛網(wǎng)評估模型[11-12]。
目前,我國對無人裝備研究較多,但對無人作戰(zhàn)系統(tǒng)自主性的研究比較少。與其他軍事強國特別是美國相比,無人系統(tǒng)在軍事方面的應用研究仍需加強。本文針對當前軍事領域無人系統(tǒng)自主性評估面臨的現(xiàn)實問題,分析無人作戰(zhàn)系統(tǒng)自主性特性,提出無人作戰(zhàn)系統(tǒng)自主性的內涵及其概念模型,通過對無人作戰(zhàn)系統(tǒng)自主性的分析建立相關等級模型及評估方法,研究面向任務的無人作戰(zhàn)系統(tǒng)自主性等級優(yōu)化分配模型,為作戰(zhàn)任務規(guī)劃人機協(xié)同分工提供方法和技術支撐。
自主性(autonomy)在許多領域都有相關概念,且每個領域都有各自不同的定義。雖然自主性是一個看似無處不在的概念,但是現(xiàn)在大多數(shù)討論都涉及人工智能和機器人技術,尤其是無人系統(tǒng),導致其很難定義。文獻[13-18]對“自主”和“自主系統(tǒng)”進行了定義,其中,比較常出現(xiàn)的片段和短語有:單獨行動、自我管理、沒有直接干預、控制自己的行為、自我導向行為、修改自己的行為、適應環(huán)境的變化、獨立撰寫和選擇行動、適應環(huán)境的變化、選擇/參與目標而無須人工操作員的干預、獨立實現(xiàn)任務目標。
本文對無人作戰(zhàn)系統(tǒng)自主性的定義:無人作戰(zhàn)系統(tǒng)在一系列軍事任務中,根據(jù)對外部戰(zhàn)場環(huán)境信息獲取以及自身所具有的能力,系統(tǒng)內部之間相互交流協(xié)作,適應其環(huán)境中的動態(tài)變化,在人的監(jiān)督管理下能夠獨立做出判斷和決策,完成所執(zhí)行任務的能力。
1)自主性等級的垂直劃分依據(jù)
麻省理工學院的Parasuraman 等人提出無人自主系統(tǒng)是一個智能化的系統(tǒng),并分別介紹了信息獲取(Information Acquisition)、信息分析(Information Analysis)、決策和行動選擇(Decision and Action Selection)、行動實施(Action Implementation)四個層次結構[19]。Parasuraman提出的無人自主系統(tǒng)信息處理的四個層次結構同樣適用于無人作戰(zhàn)系統(tǒng)。無人作戰(zhàn)系統(tǒng)結構核心是指揮控制,根據(jù)OODA環(huán)理論,指揮控制過程就是按照觀察(Observe)、定位(Orient)、決策(Decide)、執(zhí)行(Act)的OODA環(huán)路進行的過程。無人自主系統(tǒng)信息處理的四個結構層次與無人作戰(zhàn)系統(tǒng)OODA環(huán)理論的四個活動是相對應的。
Parasuraman等人提出的無人自主系統(tǒng)四個層次結構從信息獲取層依次到行為實施層,智能水平逐漸提高。綜上所述,本文以外界操作人員影響無人系統(tǒng)的智能層次范圍作為無人系統(tǒng)自身智能水平的垂直劃分依據(jù)。
2)自主性等級的水平劃分依據(jù)
人和無人系統(tǒng)在執(zhí)行相應任務時,具有不同的合作方式。其中,人類和無人系統(tǒng)之間會有一些合作關系,例如,無人系統(tǒng)主動、雙方協(xié)商或者無人系統(tǒng)被動。根據(jù)雙方的合作關系,可以劃分為系統(tǒng)全自主、機主人輔、人機協(xié)商、人主機輔和用戶全手動五個層次。所有感知、分析、計劃和決策都由人類完成,外界操作員從人類的參照系引導所有無人系統(tǒng)行為,無人系統(tǒng)只能按照人類指示完成既定簡單任務。
五種合作方式的區(qū)分主要是人占據(jù)主導權的程度不同以及人和無人系統(tǒng)的分工差異。人占據(jù)主導的程度越低,說明無人系統(tǒng)自身的智能水平越高,無人系統(tǒng)自身能夠完成大部分任務,即無人系統(tǒng)的自主性水平越高。同理,人占據(jù)主導的程度越高,說明無人系統(tǒng)自身的智能水平越低,需要外界的幫助越大,即無人系統(tǒng)的自主性水平越低。綜上所述,本文將人和無人系統(tǒng)合作方式的層次作為無人系統(tǒng)智能水平的劃分依據(jù)。
無人作戰(zhàn)系統(tǒng)自主性等級的劃分是無人作戰(zhàn)系統(tǒng)對于所分配任務做出判斷和決策的能力的評價。2012年,美國國防部發(fā)布《武器系統(tǒng)自主性》,將自主武器系統(tǒng)的自主性等級劃分為三級[16]:“人在回路外的控制”(human out of the loop control)“人在回路上的控制”(human on the loop control)“人在回路中的控制”(human in the loop control),如圖1所示。本文參考自主武器系統(tǒng)劃分,結合無人作戰(zhàn)系統(tǒng)特性,根據(jù)無人作戰(zhàn)系統(tǒng)對于自身智能的認知結果以及人機交互程度屬性,提出無人作戰(zhàn)系統(tǒng)自主性等級劃分。根據(jù)現(xiàn)有參考文獻,結合軍事應用背景,把無人作戰(zhàn)系統(tǒng)自主性等級定義為5個級別,分別為全自主、半自主、人類監(jiān)督、用戶協(xié)作和全手動,如表1所示,各等級描述如表2所示。
表1 自主性等級定義
表2 自主性等級描述
圖1 美軍自主武器系統(tǒng)劃分
1)5級:全自主
無人系統(tǒng)在自身的能力和限制范圍內提供了最大程度的獨立性和自我決定權; 無人系統(tǒng)具有感知、決策、規(guī)劃和執(zhí)行的能力,具有全部行為的主導權;所有的感知和行動都是由無人系統(tǒng)進行的; 大多數(shù)規(guī)劃和決策都是由無人系統(tǒng)進行的; 一些重要情況如談判與合作由用戶進行。無人系統(tǒng)所具備的能力可以支持其完全自主完成絕大多數(shù)復雜任務,其交互能力強,能夠應對外部環(huán)境變化帶來的未知問題,自主進行決策。
2)4級:半自主
分析、計劃和決策在用戶與無人系統(tǒng)之間共享; 感知和行動是由無人系統(tǒng)完成的。無人系統(tǒng)能夠完成一定復雜的任務,用戶參與執(zhí)行任務,并在環(huán)境較復雜的情況下參與決策分析,幫助無人系統(tǒng)做出合適的選擇。在整個任務執(zhí)行過程中,無人系統(tǒng)工作占據(jù)主動權,對整個團隊貢獻最大,但是用戶擁有最終決策權。
3)3級:人類監(jiān)督
大多數(shù)分析、計劃和決策都是由用戶完成的;感知和行動由無人系統(tǒng)完成。無人系統(tǒng)能夠完成一定任務,用戶和無人系統(tǒng)共同參與執(zhí)行,雙方都不占據(jù)絕對的主動權優(yōu)勢。無人系統(tǒng)為用戶決策提供信息和基本方案,雙方相互協(xié)商產(chǎn)生較優(yōu)的方案。
4)2級:用戶協(xié)作
所有分析、計劃和決策都由用戶完成;感知是由無人系統(tǒng)完成的;用戶從機器的參照系引導所有無人系統(tǒng)完成動作。無人系統(tǒng)能夠執(zhí)行較為簡單的任務,由于其擁有豐富的傳感器和快速計算分析能力,可以輔助用戶做出決策,完成任務,用戶占據(jù)主動權。
5)1級:全手動
所有感知、分析、計劃和決策都由用戶完成;用戶根據(jù)用戶的參照系引導所有無人系統(tǒng)的行為;無人系統(tǒng)只能按照人類指示完成既定簡單任務。
傳統(tǒng)的無人作戰(zhàn)系統(tǒng)結構存在不能自主調整其自主性等級的問題。在復雜的環(huán)境下,無人作戰(zhàn)系統(tǒng)面對大量的態(tài)勢,每個態(tài)勢都需要正確處理,這樣的推理機制是不存在的,因此,需要人的干預。
OODA控制循環(huán)的結構設計不利于無人系統(tǒng)實現(xiàn)可變自主并發(fā)揮使用者性能,因此,本文中的無人作戰(zhàn)系統(tǒng)自主性概念模型采用了OOADA 的控制循環(huán)結構,增加的“A”為“Adjustable Autonomy”,代表可變自主性。無人作戰(zhàn)系統(tǒng)中,自主等級決策模塊需要根據(jù)外界戰(zhàn)場信息、系統(tǒng)自身信息、所執(zhí)行任務信息,經(jīng)過決策判斷,確定所要變換的自主性等級。因此,在無人作戰(zhàn)系統(tǒng)控制循環(huán)中,自主等級決策模塊和協(xié)同控制模塊位于任務規(guī)劃模塊之前,調整無人作戰(zhàn)系統(tǒng)的自主性等級,并根據(jù)相應情況,將外界操作人員規(guī)劃、決策等輔助信息通過人機交互在協(xié)同控制模塊傳遞給無人作戰(zhàn)系統(tǒng)。經(jīng)過上述分析,提出無人作戰(zhàn)系統(tǒng)自主性概念模型如圖2所示。
圖2 無人作戰(zhàn)系統(tǒng)自主性概念模型
1)信息融合模塊:負責收集環(huán)境感知的數(shù)據(jù),其任務是對收集到的數(shù)據(jù)進行匯集并上報態(tài)勢理解模塊。該模塊收集的數(shù)據(jù)來源于各數(shù)據(jù)源的信息(如情報信息、雷達聲吶探索等)以及知識庫中的信息。
2)態(tài)勢理解模塊:負責對外界環(huán)境理解、評價和預測,將信息融合模塊收集的數(shù)據(jù)進行整理匯合,進行威脅評估、使命評估、行動效果評估,為自主等級決策提供其規(guī)劃自主能力的環(huán)境認知結果。
3)自主等級決策模塊:其是無人作戰(zhàn)系統(tǒng)實現(xiàn)可變自主的關鍵模塊。它需要根據(jù)態(tài)勢評估的結果以及任務目標推理得到的任務執(zhí)行情況,對自身目前的自主能力進行判斷,決定是否需要做出適應性調整,改變其自主性等級以更好地執(zhí)行任務。
4)協(xié)同控制模塊:將自主等級決策模塊做出的決策轉到任務規(guī)劃模塊,輔助進行調整,并且可以接受外部(操作人員、其他無人作戰(zhàn)系統(tǒng))的幫助,共同執(zhí)行任務。
5)任務規(guī)劃模塊:根據(jù)協(xié)同控制模塊轉移過來的決策信息,以及任務目標推理確定的當前任務執(zhí)行情況,負責當前的任務規(guī)劃和執(zhí)行,將經(jīng)過決策分析形成的無人作戰(zhàn)系統(tǒng)動作指令向相應的無人裝備發(fā)送。
6)任務執(zhí)行模塊:根據(jù)任務規(guī)劃模塊轉移過來的任務決策信息,實施相應行動。
無人作戰(zhàn)系統(tǒng)自主性調整的具體步驟如下:
步驟1:由信息融合模塊獲得環(huán)境感知數(shù)據(jù);
步驟2:態(tài)勢理解模塊進行推理,獲得當前態(tài)勢的描述,提供給自主等級決策模塊和任務規(guī)劃模塊;
步驟3:自主等級決策模塊根據(jù)態(tài)勢理解模塊的信息,決定自主等級是否調整;
步驟4:協(xié)同控制模塊接收等級調整信息,并轉到任務規(guī)劃模塊;
步驟5:任務規(guī)劃模塊根據(jù)新的決策信息,進行任務規(guī)劃;
步驟6:任務執(zhí)行模塊根據(jù)任務規(guī)劃安排采取相應行動來完成任務。
根據(jù)本文對無人作戰(zhàn)系統(tǒng)自主性的定義,無人作戰(zhàn)系統(tǒng)的自主性體現(xiàn)在所執(zhí)行的任務,與人的交互,獨立做出判斷和決策,系統(tǒng)內部之間和系統(tǒng)與外界的交互以及系統(tǒng)對信息的獲取等五個方面。因此,將無人作戰(zhàn)系統(tǒng)自主性等級評估指標分為五個,分別為任務復雜度、人機交互程度、自主決策要求、系統(tǒng)交互強度和信息保障力度。每個評估指標分解為若干個二級指標,進一步描述無人作戰(zhàn)系統(tǒng)自主性,如圖3所示。
圖3 自主性分級評估指標
任務復雜度表示無人作戰(zhàn)系統(tǒng)能夠處理的任務的復雜性,任務復雜度越高,表示無人作戰(zhàn)系統(tǒng)能處理任務的水平越高,無人作戰(zhàn)系統(tǒng)的自主能力越強。本文設計了三組二級指標來描述任務的復雜性,分別為任務分解級別、任務類型和任務要求。
人機交互程度表示對外界操作人員的依賴程度,人機交互程度越高,表示對外界操作人員的依賴程度越低,無人作戰(zhàn)系統(tǒng)自主能力越強。本文設計了四組二級指標來描述人機交互程度,分別為人工干預時間比、人機交互級別、操作員技術水平和操作員工作強度。
自主決策指的是無人作戰(zhàn)系統(tǒng)根據(jù)外界戰(zhàn)場環(huán)境信息、任務相關信息和自身狀態(tài)信息, 做出判斷和決策,使得在盡可能少用資源的前提下,實現(xiàn)任務目標取得最大收益率。自主決策要求越高,表示無人作戰(zhàn)系統(tǒng)處理任務的水平越高,無人作戰(zhàn)系統(tǒng)自主能力越強。本文設計了三組二級指標來描述自主決策要求,分別為動態(tài)規(guī)劃能力、分析能力和自主導航能力。
系統(tǒng)交互強度表示無人作戰(zhàn)系統(tǒng)內部各裝備之間協(xié)作的能力、信息結構的連通性以及系統(tǒng)與外部環(huán)境之間的連通性。系統(tǒng)交互強度越高,表示無人作戰(zhàn)系統(tǒng)交互水平越高,無人作戰(zhàn)系統(tǒng)自主能力越強。本文設計了兩組二級指標來描述系統(tǒng)交互強度,分別為系統(tǒng)協(xié)同程度和信息傳輸速度。
信息保障力度表示無人作戰(zhàn)系統(tǒng)為完成所執(zhí)行的作戰(zhàn)任務獲得信息的程度。信息保障力度越高,表示無人作戰(zhàn)系統(tǒng)態(tài)勢感知和獲取任務相關信息的能力越強,無人作戰(zhàn)系統(tǒng)自主能力越強。本文設計了三組二級指標來描述信息保障力度,分別為態(tài)勢理解程度、信息融合程度和威脅感知程度。
自主性等級評估指標評估數(shù)據(jù)和評估結果具有不同屬性,有定性、半定性或定量等不同體現(xiàn)形式。根據(jù)指標值獲取的方式,可以將評估指標分為估計型指標和實測型指標。例如,一些無法由計算或者實際測試得到的指標值,只能根據(jù)一些專業(yè)人員給出的主觀意見,得到指標評估結果,這些指標被稱為估計型指標。另外一部分由系統(tǒng)自身的信息記錄并對這些數(shù)據(jù)進行計算處理得到的指標,如人工干預時間比、接口/數(shù)據(jù)共享、威脅感知等,稱為實測型指標。根據(jù)自主性等級評估指標的不同屬性以及評估專家的評價偏好,將自主性等級評估指標體系中各評價指標相應地分為實數(shù)型指標和語言型指標兩類,并對這兩種指標值進行初始化無量綱處理。
無人作戰(zhàn)系統(tǒng)自主性等級的高低是由任務復雜度、人機交互程度、自主決策要求、系統(tǒng)交互強度和信息保障力度五個指標值綜合決定的,自主性不只受水平較低指標的影響,任意一個“短板”評估指標都會嚴重影響整個無人作戰(zhàn)系統(tǒng)的自主性等級。
五個指標的權重根據(jù)所執(zhí)行的任務的不同有所變化。在執(zhí)行一般軍事任務時,任務復雜度、人機交互程度以及自主決策要求三個指標所占權重較大。其中,任務復雜度指標主要影響所執(zhí)行任務完成時間和任務完成率等效果指標,人機交互程度指標的提高,可以減少外界操作人員的需求量,降低無人作戰(zhàn)系統(tǒng)對外界操作人員的依賴程度,自主決策要求指標越高,表示無人作戰(zhàn)系統(tǒng)能處理任務的水平越高,無人作戰(zhàn)系統(tǒng)自主能力越強。由無人作戰(zhàn)系統(tǒng)自主性的概念分析,無人作戰(zhàn)系統(tǒng)的自主性水平主要體現(xiàn)在無人作戰(zhàn)系統(tǒng)獨立做出判斷和決策,完成所執(zhí)行任務的能力的水平。任務復雜度、人機交互程度以及自主決策這三個指標主要決定了無人作戰(zhàn)系統(tǒng)執(zhí)行任務水平的高低。綜上所述,本文認為這三個指標主要決定了無人作戰(zhàn)系統(tǒng)自主性等級,而系統(tǒng)交互強度、信息保障力度兩個指標則影響了無人作戰(zhàn)系統(tǒng)自主性等級的下限問題。
本文定義了一個自主性等級評估函數(shù),如公式(1)所示:
l(Um)=F(Z1,Z2,Z3)+y(f(Z4,Z5)-F(Z1,Z2,Z3))
(1)
F(Z1,Z2,Z3)表示由任務復雜度、人機交互程度以及自主決策要求三個指標所決定的無人作戰(zhàn)系統(tǒng)基礎自主性等級。F(Z1,Z2,Z3)由公式(2)計算得出。
F(Z1,Z1,Z3)=N(w1Z1+w2Z2+w3Z3)
(2)
Zi表示各自主性等級評估指標無量綱處理后的劃分等級,其值由各專業(yè)人員根據(jù)二級指標的測量指標評估結果綜合得到。
公式(2)中的N(x)可由公式(3)得出。
(3)
y(f(Z4,Z5)-F(Z1,Z2,Z3))表示系統(tǒng)交互強度、信息保障力度兩個指標影響無人作戰(zhàn)系統(tǒng)自主性等級的下限問題,其中,f(Z4,Z5)由公式(4)計算得到,y(x)由公式(5)計算得到。
f(Z4,Z5)=w4Z4+w5Z5
(4)
(5)
各權重值可由Delphi法、AHP法、二項系數(shù)法、熵值法等來確定。
無人作戰(zhàn)系統(tǒng)自主性等級優(yōu)化分配模型主要解決兩個問題。第一個問題是作戰(zhàn)任務規(guī)劃問題,考慮能力資源、自主性等條件約束,分派無人作戰(zhàn)系統(tǒng)完成作戰(zhàn)活動,在滿足活動需求的基礎上,使得完成作戰(zhàn)任務消耗資源最少,時間最短。第二個問題是無人作戰(zhàn)系統(tǒng)自主性等級優(yōu)化調整問題,即基于任務規(guī)劃的結果,如何調整無人作戰(zhàn)系統(tǒng)的自主性等級,使無人作戰(zhàn)系統(tǒng)執(zhí)行任務的效用極大化,同時,工作負荷適當,資源得到極大利用。
作戰(zhàn)任務可分解為一系列作戰(zhàn)活動,不同作戰(zhàn)活動分配給不同無人作戰(zhàn)系統(tǒng)。那么,如何選取合適的無人作戰(zhàn)系統(tǒng)來完成某個作戰(zhàn)活動,需要滿足一定的條件,并且使得完成作戰(zhàn)任務消耗資源最少,完成任務時間最短。
無人作戰(zhàn)系統(tǒng)完成某一作戰(zhàn)活動需要具備處理這個活動的所有條件,這些條件包括具有足夠的能力來完成這個活動,無人作戰(zhàn)系統(tǒng)在執(zhí)行該活動時處于準備就緒狀態(tài),即一次只能完成一個活動,并且,該無人系統(tǒng)的自主性屬性要滿足完成這個作戰(zhàn)活動的需求。本文認為無人作戰(zhàn)系統(tǒng)完成作戰(zhàn)活動的能力即為具有足夠的作戰(zhàn)資源來執(zhí)行作戰(zhàn)活動,每種能力即為一種資源,本文以四種作戰(zhàn)能力為例,分別為Com通信能力、Rec偵察能力、Cbt打擊能力、Mot機動能力。
本文分別定義無人作戰(zhàn)系統(tǒng)執(zhí)行相應作戰(zhàn)活動的相關決策變量如下:
1)無人作戰(zhàn)系統(tǒng)作戰(zhàn)活動分配變量Dim:作戰(zhàn)活動acti分配給無人作戰(zhàn)系統(tǒng)Um時,Dim=1,否則Dim=0。
2)無人作戰(zhàn)系統(tǒng)在作戰(zhàn)活動之間的轉移變量Xijm:無人作戰(zhàn)系統(tǒng)Um完成作戰(zhàn)活動acti后,分配給作戰(zhàn)活動actj,則Xijm=1,不分配給作戰(zhàn)活動,則Xijm=0。
3)活動順序變量aij:如果作戰(zhàn)活動actj必須在作戰(zhàn)活動acti完成后才能開始,則aij=1,否則aij=0。
4)時間變量si:作戰(zhàn)活動acti開始的時間。
5)同一無人作戰(zhàn)系統(tǒng)執(zhí)行活動的先后順序Zij:無人作戰(zhàn)系統(tǒng)在完成作戰(zhàn)活動acti后去執(zhí)行作戰(zhàn)活動actj時,Zij=1,否則Zij=0。
作戰(zhàn)任務效益可由任務消耗資源、任務完成總時間來描述。
1)最小化任務消耗資源
任務消耗資源e(T)的定義為完成任務T需要的資源總和,即
(6)
2)最小化任務完成總時間
任務完成總時間Y對任意活動的處理的時間約束式(7)總能成立,其中,T(acti)為作戰(zhàn)活動acti完成所需時間,即
Y≥si+T(acti)
(7)
任務消耗資源,任務完成總時間Y越低越好,綜上所述,作戰(zhàn)任務效益最優(yōu)可以描述為:
(8)
1)無人作戰(zhàn)系統(tǒng)能力約束
設SU={U1,U2,…,UN}表示無人作戰(zhàn)系統(tǒng)的集合,每個無人作戰(zhàn)系統(tǒng)Um擁有一定的資源;RUm=[ComUm,RecUm,CbtUm,MotUm]表示無人作戰(zhàn)系統(tǒng)Um擁有的四種資源的量:Com通信能力、Rec偵察能力、Cbt打擊能力、Mot機動能力。Sact={act1,act2,…,actK}為作戰(zhàn)任務中待分配的作戰(zhàn)活動集,Ractj=[Comactj,Recactj,Cbtactj,Motactj]表示作戰(zhàn)活動acti分別對四種資源的需求。在作戰(zhàn)活動分配中,若對于任意r∈[Com,Rec,Cbt,Mot],滿足rUm≥ractj,則可認為無人作戰(zhàn)系統(tǒng)Um可完成作戰(zhàn)活動acti。即約束條件為
rUm≥ractj;r∈[Com,Rec,Cbt,Mot]m=1,2,…,n;
i=1,2,…,k
(9)
2)無人作戰(zhàn)系統(tǒng)自主性等級約束
無人作戰(zhàn)系統(tǒng)自主性約束可由無人作戰(zhàn)系統(tǒng)自主性的等級來進行描述,無人作戰(zhàn)系統(tǒng)完成某一作戰(zhàn)活動需要具備處理這個活動的自主性等級。
無人作戰(zhàn)系統(tǒng)Um的自主性等級l記為Um(l),常值acti(l)表示為執(zhí)行作戰(zhàn)活動acti最低的自主性等級,則應滿足無人作戰(zhàn)系統(tǒng)Um的自主性等級高于或等于執(zhí)行作戰(zhàn)活動acti最低的自主性等級,即Um(l)-acti(l)≥0。
綜上所述,無人作戰(zhàn)系統(tǒng)自主性約束表示如下:
Um(l)-acti(l)≥0i=1,2,…,K;m=1,2,…,N;
l=1,2,…,5
(10)
3)無人作戰(zhàn)系統(tǒng)時序約束
對任意無人作戰(zhàn)系統(tǒng)Um執(zhí)行活動actj,即Djm=1,那么,無人作戰(zhàn)系統(tǒng)Um僅存在兩種情況來執(zhí)行作戰(zhàn)活動actj:第一種是無人作戰(zhàn)系統(tǒng)Um在完成作戰(zhàn)活動acti后執(zhí)行作戰(zhàn)活動actj,即Xijm=1;第二種是無人作戰(zhàn)系統(tǒng)Um第一次執(zhí)行作戰(zhàn)活動就被分配去執(zhí)行作戰(zhàn)活動actj,即Xijm=0。則無人作戰(zhàn)系統(tǒng)作戰(zhàn)活動分配變量Dim和無人作戰(zhàn)系統(tǒng)在作戰(zhàn)活動之間的轉移變量Xjim存在如下約束關系:
(11)
一個無人作戰(zhàn)系統(tǒng)可以執(zhí)行多個作戰(zhàn)活動,但一次只能執(zhí)行一個作戰(zhàn)活動,其所執(zhí)行的作戰(zhàn)活動不能存在時間沖突,存在約束關系見式(12):
(12)
每個作戰(zhàn)活動由一個無人作戰(zhàn)系統(tǒng)完成,無人作戰(zhàn)系統(tǒng)Um在同一時間只能執(zhí)行一個作戰(zhàn)活動,只有在完成當前分配的作戰(zhàn)活動acti后才能執(zhí)行后續(xù)活動,即約束條件見式(13):
(13)
各作戰(zhàn)活動還有時間先后順序關系,即無人作戰(zhàn)系統(tǒng)Um在執(zhí)行作戰(zhàn)活動actj時,該作戰(zhàn)活動的所有前置作戰(zhàn)活動必須全部完成,即約束條件見式(14):
(14)
其中,T(acti)為作戰(zhàn)活動acti完成所需的時間。
無人作戰(zhàn)系統(tǒng)Um執(zhí)行活動actj即Dim=1,無人作戰(zhàn)系統(tǒng)的能力資源滿足執(zhí)行活動需要,且其自主性等級滿足活動自主性等級要求,約束條件見式(15):
(15)
式中,K、N、r分別表示作戰(zhàn)活動總數(shù)、無人作戰(zhàn)系統(tǒng)數(shù)量、能力資源類型。
無人作戰(zhàn)系統(tǒng)任務規(guī)劃總的約束條件見式(16):
(16)
綜上所述,完整的無人作戰(zhàn)系統(tǒng)任務規(guī)劃模型如下:
(17)
一般多屬性決策問題有m個可行方案和s個決策目標,分別計算s個決策目標的效用函數(shù)u1,u2,…,us,即可得到m個可行方案a1,a2,…,am,在s個決策目標下的效用值為u1(ai),u2(ai),…,us(ai),i=1,2,…,m。采用一定計算方法將s個決策目標下的效用值綜合為可行方案ai的總效用,并采用相應排序方法對每個可行方案的總效用值進行排序,最終得到最優(yōu)方案。
無人作戰(zhàn)系統(tǒng)自主性等級調整問題是一個多屬性決策問題,這個多屬性決策問題的可行方案集、評價目標集、效用函數(shù)集以及后果集詳細情況如下所述。
1)可行方案集
無人作戰(zhàn)系統(tǒng)自主性等級調整問題的可行方案集為其滿足所執(zhí)行的作戰(zhàn)活動最低的自主性等級的集合,在本文中其自主性等級共有五級,即可行方案集為L={l1,l2,…,l5}。
2)評價目標集
無人作戰(zhàn)系統(tǒng)自主性等級調整目標,廣義上是無人作戰(zhàn)系統(tǒng)以最合適的自主性等級來執(zhí)行相應作戰(zhàn)活動;狹義上是指無人作戰(zhàn)系統(tǒng)對于每個自主性等級的具體評價標準。無人作戰(zhàn)系統(tǒng)自主等級調整目標集包括三項決策目標,分別為任務完成率s1、資源消耗s2、執(zhí)行任務風險s3,即S={s1,s2,s3},每個目標受自主性的五個指標即任務復雜度、人機交互程度、自主決策要求、系統(tǒng)交互強度、信息保障力度影響。
3)效用函數(shù)集
無人作戰(zhàn)系統(tǒng)自主性等級調整問題的效用函數(shù)集F={f1,f2,f3},其中,f1為任務完成率,f2為資源消耗,f3為執(zhí)行任務風險,分別評估無人作戰(zhàn)系統(tǒng)采用每一級自主性等級的效用值,即{f1(li),f2(li),f3(li)} 。
4)后果集
無人作戰(zhàn)系統(tǒng)自主等級調整問題的后果集是采用每一級自主性等級的效用值作為行向量構成的矩陣,即自主性等級li的效用值{f1(li),f2(li),f3(li)}是后果集矩陣的第i行。設后果集為D={dij},那么dij=fj(li)即為無人作戰(zhàn)系統(tǒng)調整為自主性等級li的第j個決策目標的效用值。
無人作戰(zhàn)系統(tǒng)自主性等級調整模型利用相應決策規(guī)則來調整其自主性等級,即根據(jù)三個決策目標的效用值的比較來評估各自主性等級,最終得到最優(yōu)方案。對于無人作戰(zhàn)系統(tǒng),其等級決策結果希望無人作戰(zhàn)系統(tǒng)執(zhí)行作戰(zhàn)活動的任務完成率極大化,同時無人作戰(zhàn)系統(tǒng)資源消耗最小,執(zhí)行任務風險最低。
那么,對于無人作戰(zhàn)系統(tǒng)自主性等級問題的決策規(guī)則定義如下:
1)無人作戰(zhàn)系統(tǒng)自主性等級調整對于任務完成率這個決策目標的原則是求最大,這表明無人作戰(zhàn)系統(tǒng)應把自主性等級往最大任務完成率方向調整。無人作戰(zhàn)系統(tǒng)用效用函數(shù)f1(li)對任務完成率這一目標進行預測。
無人作戰(zhàn)系統(tǒng)自主性等級li和lj對于任務完成率這一決策目標的效用值分別為di1=f1(li),dj1=f1(lj)。若di1>dj1,在任務完成率這個決策目標下,li?lj,令d=di4-dj4,則d越大,自主性等級li對比lj的優(yōu)勢越大。
2)無人作戰(zhàn)系統(tǒng)自主性等級調整對于資源消耗這個決策目標的原則是求最小,這表明無人作戰(zhàn)系統(tǒng)應把自主性等級往最小資源消耗方向調整。無人作戰(zhàn)系統(tǒng)用效用函數(shù)f2(li)對資源消耗這一目標進行預測。
無人作戰(zhàn)系統(tǒng)自主性等級li和lj對于資源消耗這一決策目標的效用值分別為di2=f2(li),dj2=f2(lj)。若di2 3)無人作戰(zhàn)系統(tǒng)自主性等級調整對于執(zhí)行任務風險這一決策目標的原則是求最大,這表明無人作戰(zhàn)系統(tǒng)應把自主性等級往最小執(zhí)行任務風險方向調整。無人作戰(zhàn)系統(tǒng)用效用函數(shù)f3(li)對信息獲取程度這個屬性進行預測。 無人作戰(zhàn)系統(tǒng)自主性等級li和lj對于執(zhí)行任務風險這個決策目標的效用值分別為di3=f3(li),dj3=f3(lj)。若di3 如上所述,三個決策目標任務完成率、資源消耗和執(zhí)行任務風險與自主性分析的五種指標任務復雜度、人機交互程度、自主決策要求、系統(tǒng)交互強度和信息保障力度的關系如表3所示。其中,“+”表示該指標或者目標增加,“-”表示該指標或者目標降低。 表3 決策目標與自主性指標關系 綜上所述,根據(jù)規(guī)則1、2、3,無人作戰(zhàn)系統(tǒng)自主性調整的3個決策目標的效用函數(shù)為{f1(li),f2(li),f3(li)},則取得最優(yōu)解的約束為: (18) max表示效用函數(shù)f1(li)在無人作戰(zhàn)系統(tǒng)自主性等級調整中效用值最高時最好。 min表示效用函數(shù)f2(li)、f3(li)在無人作戰(zhàn)系統(tǒng)自主性等級調整中效用值最低時最好。 根據(jù)這三項效用值,采用一定的判斷邏輯,可以得到無人作戰(zhàn)系統(tǒng)自主性等級的完全序,應滿足: ?li,lj∈L,存在li?lj或lj?li,其中L={l1,l2,…,l5}。 無人作戰(zhàn)系統(tǒng)自主性等級的分配問題本質是系統(tǒng)做出的一種決策,即自主性等級決策問題。而決策問題就是通過理性分析,滿足所制定的決策規(guī)則,最終獲得評價最優(yōu)結果。無人作戰(zhàn)系統(tǒng)將自主性等級決策視為自身所擁有各個自主性等級期望效用的比對,通過分別評價采用每種自主性等級的任務完成率、資源消耗和執(zhí)行任務風險,最后,選擇最大效用的自主性等級分配。 無人作戰(zhàn)系統(tǒng)自主性等級調整問題中,自主等級li與lj的優(yōu)先程度利用優(yōu)先函數(shù)來描述。其目標決策集S={s1,s2,s3} ,根據(jù)線性優(yōu)先關系準則,定義優(yōu)先函數(shù)為 (19) 其中,Ps(li,lj)函數(shù)值表示自主性等級li與lj在指標s上的差異,其函數(shù)值越小,代表兩個自主性等級之間的差異越小。ds=dis-djs,由自主性等級方案li與lj在指標s上效用值的差計算得到,s={1,2,3},d*為指標s上效用值之間的最大差值。 Ps(li,lj)函數(shù)表示無人作戰(zhàn)系統(tǒng)的自主性等級在某一決策目標下的相對優(yōu)先程度,把所有決策目標下的相對優(yōu)先程度合并起來,就可以計算得到無人作戰(zhàn)系統(tǒng)的自主性等級每一級總的優(yōu)先程度。 首先,分別計算無人作戰(zhàn)系統(tǒng)自主性等級之間比較的優(yōu)先值,如下所示。 (20) 然后,計算出所有無人作戰(zhàn)系統(tǒng)自主性等級對于其他等級的優(yōu)先值,P(li,lj)表示自主性等級li對于自主性等級lj的優(yōu)先值,即可賦為li指向lj邊的值,最后,得到一個有向圖,如圖4所示。 圖4 自主性等級的賦值有向圖 通過計算每個自主性等級節(jié)點的所有流入和流出來評價相應自主性等級的相對優(yōu)勢,其中,流出代表該節(jié)點的優(yōu)勢,流入代表該節(jié)點的劣勢,其步驟如下: 組織排序法是基于無人作戰(zhàn)系統(tǒng)所擁有的自主性等級的兩兩比較,無論減少或增加一個自主性等級,對最終結果都會產(chǎn)生影響。無人作戰(zhàn)系統(tǒng)執(zhí)行一些較為復雜的任務時,可以進一步分解為簡單的子任務,從而調整其自主性等級的分配,利用該算法可求解自主等級決策問題。 本節(jié)以一個登陸作戰(zhàn)任務為例,介紹作戰(zhàn)任務規(guī)劃模型和無人作戰(zhàn)系統(tǒng)自主性等級調整模型,驗證本文提出模型的正確性和有效性,其案例來源于《指控組織設計方法》一書[20]。首先,解決登陸作戰(zhàn)任務規(guī)劃問題,考慮能力資源、自主性、時序等條件約束,分派無人作戰(zhàn)系統(tǒng)完成作戰(zhàn)活動,在滿足活動需求的基礎上,使得完成作戰(zhàn)任務效益最高,時間最短。然后,解決無人作戰(zhàn)系統(tǒng)自主性等級分配問題,使得無人作戰(zhàn)系統(tǒng)執(zhí)行任務的效用極大化,同時,工作負荷適當,其資源得到極大利用。 登陸作戰(zhàn)案例想定描述如下:我軍準備對敵軍所占領的某島嶼進行攻擊,奪取該島嶼作為下一步作戰(zhàn)的基地。這次登陸作戰(zhàn)的首要目標是攻擊島上的碼頭和機場。其中,經(jīng)前期偵察發(fā)現(xiàn),適合我軍登陸的海灘為地圖右側海灘,由此登陸后,向北占領碼頭,向南占領機場,敵軍在中間布置了雷區(qū),對我軍進行阻擊。在海灘西南側還有一高地,敵軍在此駐有小股部隊,需占領此高地,掩護我軍行動。敵方增援部隊須經(jīng)過西側橋梁,需提前炸毀該橋梁,如圖5所示。 圖5 案例想定 案例給定的任務流程如圖6所示,任務能力資源要求及自主性等級等屬性數(shù)據(jù)如表4所示,其中,Com代表通信能力,Rec代表偵察能力,Cbt代表打擊能力,Mot代表機動能力,可用無人作戰(zhàn)系統(tǒng)的能力資源及自主性等級等屬性數(shù)據(jù)表示,如表5所示。其中,各作戰(zhàn)活動為無人作戰(zhàn)系統(tǒng)和有人部隊形成有人/無人聯(lián)合部隊共同參與。 圖6 任務流程圖 表4 任務屬性數(shù)據(jù) 表5 無人作戰(zhàn)系統(tǒng)屬性數(shù)據(jù) 由無人作戰(zhàn)系統(tǒng)作戰(zhàn)任務規(guī)劃模型計算執(zhí)行結果,其任務持續(xù)時間為110 min,共有8個無人作戰(zhàn)系統(tǒng)參與執(zhí)行作戰(zhàn)活動。其中:act1協(xié)助占領近海,由無人作戰(zhàn)系統(tǒng)U1執(zhí)行;act2清除海區(qū)障礙,由無人作戰(zhàn)系統(tǒng)U7執(zhí)行;act3沖擊搶占海灘,由無人作戰(zhàn)系統(tǒng)U10執(zhí)行;act4協(xié)助壓制高地,由無人作戰(zhàn)系統(tǒng)U4執(zhí)行;act5協(xié)助占領高地,由無人作戰(zhàn)系統(tǒng)U8執(zhí)行;act6清剿海灘殘敵,由無人作戰(zhàn)系統(tǒng)U4執(zhí)行;act7快速公路補給,由無人作戰(zhàn)系統(tǒng)U2執(zhí)行;act8清除公路障礙,由無人作戰(zhàn)系統(tǒng)U2執(zhí)行;act9協(xié)助占領港口,由無人作戰(zhàn)系統(tǒng)U10執(zhí)行;act10協(xié)助占領機場,由無人作戰(zhàn)系統(tǒng)U6執(zhí)行;act11協(xié)助奪取橋頭,由無人作戰(zhàn)系統(tǒng)U6執(zhí)行;act12協(xié)助炸橋阻援,由無人作戰(zhàn)系統(tǒng)U12執(zhí)行。 由上文作戰(zhàn)任務規(guī)劃數(shù)學模型,可以得到作戰(zhàn)活動分配至無人作戰(zhàn)系統(tǒng)的信息,無人作戰(zhàn)系統(tǒng)要滿足其所執(zhí)行的作戰(zhàn)活動等級要求,具體情況如表6所示。 表6 無人作戰(zhàn)系統(tǒng)與作戰(zhàn)活動自主性等級情況表 通過計算各無人作戰(zhàn)系統(tǒng)執(zhí)行相應作戰(zhàn)活動最合適的自主性等級,得到無人作戰(zhàn)系統(tǒng)自主性等級調整如表7所示。 表7 無人作戰(zhàn)系統(tǒng)自主性等級調整結果 現(xiàn)分析自主性等級調整的收益情況。若各無人作戰(zhàn)系統(tǒng)不進行自主性等級調整,均由最高自主性等級執(zhí)行作戰(zhàn)活動,或對各無人作戰(zhàn)系統(tǒng)進行自主性等級調整,分別計算其各自主性等級三個決策目標效用值,如表8所示。 表8 無人作戰(zhàn)系統(tǒng)自主性等級調整前后決策目標效用值 無人作戰(zhàn)系統(tǒng)自主性等級調整前后,其三項決策目標任務完成率s1、資源消耗s2、執(zhí)行任務風險s3對比如表9所示。 表9 無人作戰(zhàn)系統(tǒng)自主性等級調整前后對比 綜上所述,當無人作戰(zhàn)系統(tǒng)自主性等級調整后,任務完成率提升7.5%,資源消耗量提升4.85%,執(zhí)行任務風險降低12.3%。通過實驗對比,無人作戰(zhàn)系統(tǒng)采用自主性等級優(yōu)化分配模型后,雖然資源消耗有所增加,但大幅度降低了執(zhí)行任務的風險,提升了任務完成率。 本文針對我軍無人作戰(zhàn)系統(tǒng)自主性存在的問題,圍繞無人作戰(zhàn)系統(tǒng)自主性等級評估和優(yōu)化分配展開研究,主要研究了無人作戰(zhàn)系統(tǒng)自主性內涵定義、自主性評估分析以及面向任務的無人作戰(zhàn)系統(tǒng)自主性等級優(yōu)化分配實際運用。通過分析軍事應用背景下無人作戰(zhàn)系統(tǒng)自主性特性,提出無人作戰(zhàn)系統(tǒng)自主性的內涵及其概念模型,分析無人作戰(zhàn)系統(tǒng)自主性,建立相關等級模型及評估方法,研究面向任務的無人作戰(zhàn)系統(tǒng)自主性等級優(yōu)化分配模型,從而為進一步加快無人作戰(zhàn)系統(tǒng)建設,增強作戰(zhàn)效能提供方法和技術支撐。4 案例研究
5 結束語