李大偉,李 丹,劉博文,劉賽賽,王 棟
(中國(guó)電子科學(xué)研究院,北京 100041)
自然界中發(fā)現(xiàn)的大多數(shù)系統(tǒng)都是復(fù)雜的分布式系統(tǒng),需要溝通和合作以實(shí)現(xiàn)共同目標(biāo)。現(xiàn)代社會(huì)隨著科技的不斷發(fā)展,由異構(gòu)節(jié)點(diǎn)構(gòu)成的物聯(lián)網(wǎng)、運(yùn)輸網(wǎng)等復(fù)雜體系也呈現(xiàn)出“網(wǎng)絡(luò)極大化”的發(fā)展趨勢(shì),如何讓復(fù)雜體系中的各節(jié)點(diǎn)各司其職就成了一個(gè)亟需解決的問(wèn)題。
文獻(xiàn)[1]將復(fù)雜體系中群體的組織模式分為網(wǎng)絡(luò)、層次和聯(lián)盟3類(lèi),每類(lèi)模式具有其自身特性,往往根據(jù)任務(wù)場(chǎng)景需要采取相適應(yīng)的群體結(jié)構(gòu)組織模式。網(wǎng)絡(luò)結(jié)構(gòu)模式的群體內(nèi)各節(jié)點(diǎn)之間可任意建立關(guān)系,具有極大的不確定性和自組織特性;層次結(jié)構(gòu)模式中,群體可自頂向下按等級(jí)劃分,高層級(jí)的節(jié)點(diǎn)具有較高的指揮控制權(quán)限,體現(xiàn)了任務(wù)由宏觀到微觀的逐級(jí)傳遞;聯(lián)盟結(jié)構(gòu)模式中,根據(jù)節(jié)點(diǎn)的特定屬性可被劃分為不同領(lǐng)域,任務(wù)可按領(lǐng)域進(jìn)行拆分執(zhí)行。
在軍事應(yīng)用中,層次結(jié)構(gòu)是一種較為普遍和適用的多節(jié)點(diǎn)組織運(yùn)用模式。文獻(xiàn)[2]提出了多態(tài)認(rèn)知智能體架構(gòu)(polymorphic cognitive agent architecture,PCAA),建立宏觀(Macro)、微觀(Micro)、原子(Proto)這3層認(rèn)知架構(gòu),是一種多分辨率的層次結(jié)構(gòu)。美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)開(kāi)展的進(jìn)攻性蜂群使能戰(zhàn)術(shù)(offensive swarm-enabled tactics,OFFSET)項(xiàng)目[3],提出基于任務(wù)的集群系統(tǒng)架構(gòu),將無(wú)人蜂群作戰(zhàn)行動(dòng)自上而下分解為任務(wù)層、戰(zhàn)術(shù)層、原語(yǔ)層、算法層,如圖1所示。集群任務(wù)層主要表征粗粒度的整體使命需求,集群戰(zhàn)術(shù)層對(duì)使命需求中的戰(zhàn)術(shù)活動(dòng)任務(wù)樹(shù)進(jìn)行建模,原子層對(duì)具體戰(zhàn)術(shù)任務(wù)活動(dòng)中的蜂群行為進(jìn)行建模,算法層為具體蜂群行為提供基礎(chǔ)功能模型。OFFSET也是典型的層次化體系架構(gòu),旨在推動(dòng)蜂群自主性和人與蜂群協(xié)同工作方面的革命性發(fā)展,尤其關(guān)注蜂群自主戰(zhàn)術(shù)行動(dòng)的可行性,相關(guān)研究成果將直接應(yīng)用到“馬賽克戰(zhàn)”體系中,推動(dòng)低成本無(wú)人蜂群作戰(zhàn)能力的快速構(gòu)建形成。
圖1 OFFSET集群系統(tǒng)架構(gòu)
美國(guó)聯(lián)合全域指揮控制條令規(guī)定使用集中式指揮和分布式控制執(zhí)行的原則進(jìn)行聯(lián)合空中作戰(zhàn),推動(dòng)這一空中力量組織運(yùn)用原則的原因是,集中式指揮使高級(jí)梯隊(duì)指揮官能夠有效地控制、集結(jié)和領(lǐng)導(dǎo)部隊(duì);執(zhí)行權(quán)力下放使部隊(duì)能夠掌握主動(dòng)權(quán),應(yīng)對(duì)不確定和不斷變化的環(huán)境,并提升末端的自組織靈活性[4]。
對(duì)于復(fù)雜群體結(jié)構(gòu)的多智能體節(jié)點(diǎn),處理分布式任務(wù)時(shí),由于復(fù)雜性、高動(dòng)態(tài)等因素具有較大挑戰(zhàn)性。此外,多個(gè)智能體的存在提高了執(zhí)行任務(wù)的性能和可信度,因?yàn)楦嗟闹悄荏w可以合作更快地完成相同的任務(wù),并且系統(tǒng)對(duì)智能體的丟失或故障更加具有魯棒性。此外,全局智能體分布式合作完成任務(wù)可能會(huì)降低油、電等資源消耗成本。然而,當(dāng)使用多智能體系統(tǒng)來(lái)完成多項(xiàng)任務(wù)時(shí),就會(huì)出現(xiàn)分工問(wèn)題。
當(dāng)前流行的多智能體強(qiáng)化學(xué)習(xí)方法則主要專(zhuān)注于構(gòu)建完全分布式系統(tǒng)用于多智能體合作。在分布式系統(tǒng)中,每個(gè)智能體單獨(dú)運(yùn)行,它們自己觀察環(huán)境并可通過(guò)點(diǎn)對(duì)點(diǎn)通信交換信息,實(shí)現(xiàn)多智能體合作。這樣的分布式系統(tǒng)可以靈活構(gòu)建大規(guī)模多智能體系統(tǒng),并且具有極低的通信成本。但是在大多數(shù)情況下,分布式策略不穩(wěn)定且難以學(xué)習(xí),因?yàn)樗鼈兺ǔ?huì)互相影響,導(dǎo)致環(huán)境動(dòng)態(tài)過(guò)程不穩(wěn)定。雖然這個(gè)問(wèn)題通過(guò)最近流行的“集中式訓(xùn)練和分布式執(zhí)行”AC(Actor-Critic)方法得到緩解[5],但如何有效地訓(xùn)練集中式的“Critic”至今仍是一個(gè)挑戰(zhàn)。
任務(wù)分配問(wèn)題的求解方法可分為集中式、分布式、混合式。集中式算法是過(guò)去研究較多的一類(lèi)算法,中央?yún)f(xié)調(diào)或類(lèi)似模塊與所有其它智能體均有通信渠道,并決定必須分配給其它智能體的任務(wù)[6,7]。集中式任務(wù)分配方法主要包括蟻群算法[8]、粒子群算法[9]、遺傳算法[10]等,這些方法的優(yōu)點(diǎn)是它們使用較少的系統(tǒng)資源并且可能具有較低的實(shí)現(xiàn)成本,但是通信、計(jì)算成本高并且不適用于動(dòng)態(tài)環(huán)境,因此它們主要用于少量智能體或靜態(tài)任務(wù)的分配。此外所有智能體都與中央處理單元進(jìn)行通信這一前提條件限制了它們的可擴(kuò)展性[11,12]。
分布式算法克服了集中式算法的一些缺點(diǎn)[13,14],引起了研究人員的廣泛關(guān)注。分布式任務(wù)分配算法主要采用基于博弈論和基于市場(chǎng)的機(jī)制。在這種類(lèi)型的算法中,沒(méi)有中央?yún)f(xié)調(diào)模塊,智能體對(duì)環(huán)境有局部感知,并且可能會(huì)彼此之間進(jìn)行任務(wù)協(xié)商而不是被統(tǒng)一分配任務(wù)。每個(gè)智能體都有自己的收益函數(shù)。分布式算法將部分智能體的故障對(duì)整體的性能影響降到較小,同時(shí)具有較好的節(jié)點(diǎn)擴(kuò)展性,但是由于局部的溝通結(jié)果可能會(huì)導(dǎo)致全局的任務(wù)沖突[11]。這種完全自主和分布式覆蓋任務(wù)分配算法的主要特點(diǎn)和優(yōu)勢(shì)是,能夠讓感知和通信能力有限的無(wú)人機(jī)在未知環(huán)境下進(jìn)行協(xié)同與控制。文獻(xiàn)[15]針對(duì)異構(gòu)多無(wú)人機(jī)執(zhí)行偵察、攻擊等多任務(wù)時(shí)的分配問(wèn)題,提出帶有時(shí)間窗的基于共識(shí)的捆綁算法(windows consensus-based bundle algorithm,WCBBA)。
混合式算法將上述兩種方法進(jìn)行結(jié)合,文獻(xiàn)[16]將集中式優(yōu)化和分布式拍賣(mài)的方法相結(jié)合,文獻(xiàn)[17]將進(jìn)化算法與貪心算法相結(jié)合,文獻(xiàn)[18]將博弈論的方法與學(xué)習(xí)算法相結(jié)合。
本文主要聚焦解決實(shí)際作戰(zhàn)場(chǎng)景中戰(zhàn)役集中式指揮與戰(zhàn)術(shù)分布式指揮控制相結(jié)合的任務(wù)分配模式,重點(diǎn)提出戰(zhàn)術(shù)末端分布式任務(wù)分配方法,通過(guò)構(gòu)建包含任務(wù)要素、多智能體要素的任務(wù)空間,分析智能體任務(wù)包構(gòu)建、沖突消解等關(guān)鍵技術(shù),將全局任務(wù)在收益最大化的要求下指派給合適的作戰(zhàn)單元,研究特定時(shí)間窗口下的分布式無(wú)人作戰(zhàn)資源優(yōu)選技術(shù),并在典型空海場(chǎng)景中進(jìn)行仿真驗(yàn)證,具有較好的分布式任務(wù)分配效果。
任務(wù)空間要素主要包括任務(wù)、服務(wù)和作戰(zhàn)單元,三者之間的關(guān)系如圖2所示,作戰(zhàn)單元提供服務(wù),服務(wù)支撐上層任務(wù)的執(zhí)行,三者之間存在內(nèi)在聯(lián)動(dòng)的映射關(guān)系。
圖2 任務(wù)、服務(wù)、作戰(zhàn)單元三元關(guān)系
服務(wù)集合S={S1,S2,…,SK}。 尋求滿足資源本體和任務(wù)執(zhí)行等約束條件下的最優(yōu)任務(wù)分配方案,從而發(fā)揮體系最大效能。
作戰(zhàn)單元集合A={A1,A2,…,AN}, 其中N為作戰(zhàn)單元的總數(shù)。作戰(zhàn)單元通過(guò)服務(wù)的形式供任務(wù)組織編排和調(diào)用。
聚焦分布式任務(wù)分配,對(duì)作戰(zhàn)單元進(jìn)行基于多智能體的建模,首先給出作戰(zhàn)單元關(guān)鍵屬性要素如下:
(1)任務(wù)包
智能體i被分配的任務(wù)有序集合表示為bi={bi1,bi2,…,bi|bi|},bi中的任務(wù)元素按加入包的先后順序排列,|bi| 表示該智能體被分配的任務(wù)總數(shù)。
(2)任務(wù)路徑
智能體i為完成所分配任務(wù)所需運(yùn)行的矢量路徑列表表示為pi={pi1,pi2,…,pi|pi|}, 其中 |pi| 表示列表長(zhǎng)度。
(3)任務(wù)狀態(tài)
智能體i的任務(wù)狀態(tài)表示為τi={τi1,τi2,…,τi|τi|}, 列表中的每一個(gè)變量包含了執(zhí)行任務(wù)的開(kāi)始時(shí)間、持續(xù)時(shí)間和結(jié)束時(shí)間,在智能體投標(biāo)和任務(wù)分配時(shí)需要考慮當(dāng)前任務(wù)與智能體的任務(wù)狀態(tài)是否沖突。
(4)智能體成功競(jìng)標(biāo)矩陣
(5)任務(wù)中標(biāo)矩陣
每個(gè)智能體對(duì)任務(wù)的中標(biāo)者具有局部任務(wù),即任務(wù)中標(biāo)列表vi={vi1,vi2,…,viM}, 其中vij表示任務(wù)j的中標(biāo)值,vij=0即意味著該任務(wù)尚沒(méi)有中標(biāo)的智能體。
(6)智能體信息時(shí)間戳
這里將智能體i的信息時(shí)間戳定義為si={si1,si2,…,si|si|}, 列表中的元素sik表示智能體i最后一次獲知智能體k信息的時(shí)間,可以是直接信息交互或通過(guò)其它智能體進(jìn)行間接信息交互。
異構(gòu)無(wú)人系統(tǒng)的任務(wù)分配問(wèn)題可以定義為將一組復(fù)雜任務(wù)分配給一組智能體的問(wèn)題,其中智能體和任務(wù)都可能隨著時(shí)間的推移進(jìn)入和離開(kāi)系統(tǒng)。任務(wù)分配問(wèn)題可轉(zhuǎn)換為典型的混合整數(shù)線性規(guī)劃問(wèn)題,即:對(duì)給定的任務(wù)集合T={T1,T2,…,TM} 和作戰(zhàn)單元集合A={A1,A2,…,AN}, 在規(guī)定的條件約束下尋求任務(wù)最大完成度的最優(yōu)分配方案。上述問(wèn)題可建模為
(1)
式中:Na為作戰(zhàn)單元的數(shù)量,Nt為任務(wù)的數(shù)量,pi為作戰(zhàn)單元i執(zhí)行所分配任務(wù)的順序,xij為作戰(zhàn)單元Ai被分配了任務(wù)Tj,xi={xi1,xi2,…,xiN}, 求解目標(biāo)為尋求全局收益最大化的任務(wù)分配模式。任務(wù)分配過(guò)程中服從以下約束條件
(2)
式中:Lt為作戰(zhàn)單元最多可以被分配的任務(wù)數(shù)量。
智能體i對(duì)任務(wù)j的投標(biāo)函數(shù)cij(xi,pi) 可以是任務(wù)分配結(jié)果xi或者路徑pi的函數(shù),與路徑總長(zhǎng)、任務(wù)完成時(shí)間等相關(guān)。
考慮任務(wù)執(zhí)行的先后順序以及任務(wù)的時(shí)間窗口,各作戰(zhàn)單元需要在規(guī)定的時(shí)間內(nèi)抵達(dá)指定的位置,任務(wù)分配需要將完成整體任務(wù)的消耗時(shí)間、路徑代價(jià)最小化。
“云-邊-端”體現(xiàn)層次結(jié)構(gòu),“云”側(cè)強(qiáng)調(diào)人在回路,重點(diǎn)對(duì)任務(wù)進(jìn)行分解,并按照領(lǐng)域、方向?qū)⒎纸夂蟮娜蝿?wù)分配給“邊”,“邊”側(cè)人機(jī)協(xié)作,為聯(lián)盟結(jié)構(gòu),圍繞特定領(lǐng)域開(kāi)展任務(wù)分配;“端”側(cè)為網(wǎng)絡(luò)結(jié)構(gòu),強(qiáng)調(diào)末端作戰(zhàn)單元的自主組織?!霸?邊-端”分布式任務(wù)分配模式的工作流程如圖3所示。
圖3 “云-邊-端”跨層跨域任務(wù)分配和資源優(yōu)選模式
“云”側(cè)在任務(wù)分解時(shí),依據(jù)混合知識(shí)空間的通用任務(wù)清單,通過(guò)OV-5a作戰(zhàn)活動(dòng)分解樹(shù)模型[19],呈現(xiàn)作戰(zhàn)構(gòu)想中的戰(zhàn)略/戰(zhàn)役/戰(zhàn)術(shù)作戰(zhàn)任務(wù)層次結(jié)構(gòu)清單,通過(guò)將任務(wù)關(guān)聯(lián)到作戰(zhàn)活動(dòng)分解樹(shù)模型中的具體任務(wù)項(xiàng),檢索任務(wù)項(xiàng)下的子任務(wù),實(shí)現(xiàn)將高層級(jí)任務(wù)進(jìn)行分解,并將子任務(wù)按領(lǐng)域分配給“邊”,由“邊”進(jìn)行具體的任務(wù)到資源的分配,是一個(gè)面向任務(wù)的資源優(yōu)選過(guò)程。
“邊”側(cè)依據(jù)混合知識(shí)空間的“任務(wù)-服務(wù)-資源”內(nèi)在聯(lián)動(dòng)知識(shí)模型,按需抽取任務(wù)所關(guān)聯(lián)的作戰(zhàn)單元資源池,其關(guān)聯(lián)關(guān)系如上文圖2中任務(wù)空間要素的三元關(guān)系所示。在具體任務(wù)分配時(shí),各智能體作為“端”節(jié)點(diǎn),采用分布式任務(wù)分配模式,根據(jù)自身功能屬性、能力指標(biāo)、任務(wù)狀態(tài)等情況,對(duì)任務(wù)進(jìn)行競(jìng)標(biāo),通過(guò)分布式節(jié)點(diǎn)局部信息交互共享,對(duì)存在沖突的競(jìng)標(biāo)結(jié)果進(jìn)行消解,不斷迭代以達(dá)成全局收益最大化。
本文提出一種基于分布式拍賣(mài)機(jī)制的“云-邊-端”跨層 多任務(wù)分配算法,算法包含兩個(gè)階段,即智能體任務(wù)包構(gòu)建和基于全局共識(shí)的沖突消解。在智能體任務(wù)包構(gòu)建階段,每個(gè)智能體根據(jù)自身能力、位置、狀態(tài)、收益等情況投標(biāo)合適的任務(wù),生成自己的任務(wù)包,任務(wù)包中的任務(wù)按時(shí)間次序執(zhí)行,并能夠按照一定的路徑串聯(lián)起來(lái);在基于全局共識(shí)的沖突消解階段,相鄰智能體之間進(jìn)行信息交互,根據(jù)投標(biāo)值高低更新自己的任務(wù)包信息,并采用沖突消解規(guī)則達(dá)成共識(shí),通過(guò)不斷迭代促進(jìn)分布式智能體完成全局信息交換并達(dá)成全局共識(shí),算法思路如圖4所示。
圖4 算法思路
每個(gè)智能體僅創(chuàng)建其自身任務(wù)包,該任務(wù)包會(huì)隨著分配過(guò)程的進(jìn)行而更新。在智能體具備的能力約束條件范圍內(nèi),每個(gè)智能體按照最大化自身任務(wù)收益為原則進(jìn)行任務(wù)投標(biāo),任務(wù)包具有兩個(gè)任務(wù)相關(guān)向量:bi和pi,其中bi是按照任務(wù)的添加順序,pi是按照任務(wù)的執(zhí)行順序。
設(shè)智能體i初始任務(wù)包為bi,則其在后續(xù)的任務(wù)投標(biāo)過(guò)程中會(huì)選擇將邊際收益最大的任務(wù)Tj∈T加入到bi中,直到無(wú)法添加。
任務(wù)包的更新如下
bi←(bi⊕endj)
(3)
pi←(pi⊕njj)
(4)
式中:⊕nj表示增加在位置n的任務(wù)j。
在所有任務(wù)完成分配后,當(dāng)出現(xiàn)某服務(wù)失效或失去連接時(shí),該服務(wù)需求會(huì)再次發(fā)布。任務(wù)包中的任務(wù)根據(jù)添加順序進(jìn)行排序,而路徑中的任務(wù)根據(jù)其預(yù)測(cè)的執(zhí)行時(shí)間進(jìn)行排序。
(5)
算法1:任務(wù)包構(gòu)建
輸入:Wi(t-1),Vi(t-1),bi(t-1)和pi(t-1)
輸出:Wi(t),Vi(t),bi(t),pi(t)
While |bi(t-1)| cij=maxSi(pi⊕{j}) for ?j∈J hij=1 hij=1 else hij=0 end else end end end Ji=agmaxjcijhij ni,Ji=agmaxnSi(pi⊕{j}) bi(t)=bi(t-1)⊕end{j}) pi(t)=pi(t-1)⊕ni,Ji{j}) end while 在構(gòu)建完成自身的任務(wù)包后,各智能體之間是不知道相互之間的任務(wù)分配狀態(tài)情況的,由于智能體之間可能存在沖突任務(wù),例如不同智能體分配到同一任務(wù),因此需要智能體之間進(jìn)行信息交互和共享,重置或更新自身的任務(wù)包,從而確保每個(gè)智能體的任務(wù)包都是正確的,在全局智能體之間達(dá)成任務(wù)分配的共識(shí)。在基于全局共識(shí)的任務(wù)沖突消解階段,所有智能體需要與相鄰智能體之間進(jìn)行信息交換,包括獲勝智能體列表、獲勝投標(biāo)列表和時(shí)間戳列表,并按照一定的規(guī)則更新自身信息以達(dá)成面向任務(wù)的全局共識(shí)。 從具體規(guī)則來(lái)看,智能體Ai會(huì)通過(guò)比較其它智能體對(duì)相同任務(wù)的投標(biāo)值來(lái)確定自己是否會(huì)中標(biāo)。如果自身投標(biāo)值更高,則它將通過(guò)競(jìng)標(biāo)分配到任務(wù)。如果獲知任務(wù)Tj有更高的投標(biāo)值,則Aj會(huì)釋放Tj, 并將任務(wù)包中后續(xù)的任務(wù)進(jìn)行刪除和再分配。智能體選擇全局最高收益任務(wù)如下所示 (6) 其中,hij=I(cij(pij)>vij), 表示智能體i之外高于vij的有效投標(biāo)值。 在全局最高收益下,智能體i的任務(wù)包更新情況可表示為 bi←(bi⊕endj*) (7) pi←(pi⊕nj*j*) (8) 任務(wù)路徑pi在該任務(wù)后的所有任務(wù)也會(huì)隨之刪除,在下一次的迭代中進(jìn)行重新分配。 全局共識(shí)是為了避免由于廣域分布的智能體之間信息不共享導(dǎo)致同一任務(wù)被加入到不同智能體的任務(wù)包中。在相鄰智能體之間進(jìn)行信息交互共享時(shí),當(dāng)發(fā)現(xiàn)別的智能體投標(biāo)值更高的情況,則進(jìn)行任務(wù)更新;當(dāng)路徑出現(xiàn)變動(dòng)時(shí),則后續(xù)任務(wù)進(jìn)行重置;當(dāng)自身投標(biāo)值高時(shí),進(jìn)行任務(wù)保持,沖突消解規(guī)則公式如下: (1)任務(wù)更新:wij=wkj,vij=vkj; (2)任務(wù)重置:wij=?,vij=0; (3)任務(wù)保持:wij=wij,vij=vij。 在本節(jié)中,我們對(duì)提出的方法進(jìn)行仿真驗(yàn)證。仿真環(huán)境配置為Intel(R)Core(TM)i7-8700K @3.70 GHz CPU處理器,Window 10操作系統(tǒng)。設(shè)定在某空海場(chǎng)景中,任務(wù)空間范圍設(shè)定為30 km×30 km×10 km,作戰(zhàn)單元包含有無(wú)人誘餌平臺(tái)、無(wú)人偵察平臺(tái)、無(wú)人打擊平臺(tái)、察打一體無(wú)人平臺(tái)、遠(yuǎn)距離無(wú)人通信平臺(tái)5類(lèi)6種異構(gòu)無(wú)人系統(tǒng),可以執(zhí)行誘騙、偵察、打擊、通信4類(lèi)任務(wù),任務(wù)遵循OODA環(huán)的順序,在場(chǎng)景中可根據(jù)需求隨機(jī)生成所需任務(wù)清單列表,并且可根據(jù)需要隨時(shí)加入或刪除任務(wù)和資源,每個(gè)任務(wù)具有任務(wù)類(lèi)型、坐標(biāo)位置、最晚完成時(shí)間、任務(wù)需持續(xù)時(shí)間等信息。無(wú)人平臺(tái)、服務(wù)的關(guān)聯(lián)關(guān)系見(jiàn)表1。 表1 某空海場(chǎng)景下無(wú)人平臺(tái)類(lèi)型 假定該空海場(chǎng)景中共有6型異構(gòu)無(wú)人系統(tǒng)共10個(gè),需執(zhí)行誘騙、偵察、打擊、通信4類(lèi)任務(wù)共計(jì)22項(xiàng),各無(wú)人系統(tǒng)及任務(wù)的位置由MatLab中的rand函數(shù)生成。設(shè)定該空海場(chǎng)景下優(yōu)化目標(biāo)為所有任務(wù)執(zhí)行完成用時(shí)最小化,各無(wú)人平臺(tái)的任務(wù)分配結(jié)果如圖5所示,圓圈代表各類(lèi)異構(gòu)無(wú)人系統(tǒng),線段表示異構(gòu)無(wú)人系統(tǒng)的運(yùn)行路徑,兩個(gè)相鄰的三角形之間的連線代表在執(zhí)行相關(guān)的任務(wù),無(wú)人平臺(tái)在任務(wù)分配中可能執(zhí)行多個(gè)任務(wù),結(jié)果清晰地展現(xiàn)了各無(wú)人系統(tǒng)的任務(wù)分配結(jié)果及執(zhí)行任務(wù)的路線圖。算法確保無(wú)人平臺(tái)在任務(wù)執(zhí)行過(guò)程中路徑及消耗相對(duì)較少,全局收益趨向極大值,且智能體所執(zhí)行的任務(wù)之間不會(huì)出現(xiàn)任務(wù)和路線沖突。 圖5 時(shí)間窗口下的任務(wù)分配結(jié)果(A=10,T=22) 面向復(fù)雜、高動(dòng)態(tài)的環(huán)境,在任務(wù)完成初始分配后,主要存在2種變數(shù),一是“端”節(jié)點(diǎn)發(fā)生變化,比如由于某些作戰(zhàn)單元被打擊失效或失去連接無(wú)法使用;二是任務(wù)發(fā)生變化,比如出現(xiàn)新增任務(wù)或任務(wù)出現(xiàn)判斷分支。面對(duì)這些變化時(shí)就需要對(duì)任務(wù)分配進(jìn)行動(dòng)態(tài)調(diào)整,適變?nèi)蝿?wù)分配流程如圖6所示?!斑叀眰?cè)實(shí)時(shí)更新可用的作戰(zhàn)單元,同時(shí)發(fā)布新的“任務(wù)-服務(wù)”需求,“端”側(cè)各作戰(zhàn)單元根據(jù)自身功能屬性、能力匹配、任務(wù)狀態(tài)、預(yù)期收益判斷是否投標(biāo)以及具體投標(biāo)值,通過(guò)全局共識(shí)確認(rèn)是否中標(biāo),從而執(zhí)行新的任務(wù)。 圖6 任務(wù)適變調(diào)整流程 為簡(jiǎn)化問(wèn)題,任務(wù)取誘騙、偵查、打擊3種,任務(wù)數(shù)量及類(lèi)型見(jiàn)表2,作戰(zhàn)單元共有3種,每種數(shù)量有3個(gè),每種作戰(zhàn)單元可以執(zhí)行任一任務(wù)。 表2 任務(wù)類(lèi)型及數(shù)量 在t時(shí)刻,假定智能體9失效,其原先被分配的后續(xù)任務(wù)將無(wú)法執(zhí)行,此時(shí)需要對(duì)所有尚未執(zhí)行完的任務(wù)進(jìn)行適變分配調(diào)整,根據(jù)當(dāng)前智能體的位置、能力、狀態(tài)等情況,將尚未完成的任務(wù)重新分配給剩下的智能體1-8,分配后的智能體任務(wù)計(jì)劃如圖7所示,各智能體執(zhí)行任務(wù)的空間路徑如圖8所示。 圖7 不同無(wú)人平臺(tái)的任務(wù)分配計(jì)劃 圖8 時(shí)間窗口下的任務(wù)分配結(jié)果(A=8,T=20) 不同作戰(zhàn)單元會(huì)具有不同集成度的服務(wù),平臺(tái)越大功能越多,其集成度也越高。美軍的“馬賽克戰(zhàn)”新型作戰(zhàn)概念提出采用分布式小平臺(tái)的馬賽克單元構(gòu)建分布式殺傷網(wǎng),基于多智能體建模方法對(duì)可快速分散、組合且異構(gòu)作戰(zhàn)力量進(jìn)行建模仿真,并得出結(jié)論:分布式小平臺(tái)的作戰(zhàn)適變性和造價(jià)性?xún)r(jià)比要高于大平臺(tái)[20]。 圖9 不同服務(wù)集成度的任務(wù)完成效果 針對(duì)異構(gòu)無(wú)人系統(tǒng)的分布式任務(wù)分配和優(yōu)選問(wèn)題,基于全局動(dòng)態(tài)合約共識(shí),提出知識(shí)驅(qū)動(dòng)的“云-邊-端”跨層分布式任務(wù)分配模式,重點(diǎn)設(shè)計(jì)針對(duì)端側(cè)的分布式任務(wù)分配算法,實(shí)現(xiàn)戰(zhàn)場(chǎng)上任務(wù)與資源的匹配和優(yōu)選,并結(jié)合典型場(chǎng)景進(jìn)行仿真驗(yàn)證,結(jié)果表明該算法能夠?qū)崿F(xiàn)跨域分布式任務(wù)分配,并能夠面向擾動(dòng)進(jìn)行動(dòng)態(tài)適變,具備面向未來(lái)復(fù)雜動(dòng)態(tài)環(huán)境的適應(yīng)能力。2.4 基于全局共識(shí)的沖突消解
3 算法仿真
3.1 跨域分布式任務(wù)分配
3.2 面向擾動(dòng)的適變調(diào)整
3.3 不同服務(wù)集成度的效能分析
4 結(jié)束語(yǔ)