劉學(xué)達(dá) 何明 禹明剛,2 陳國友 張偉士
1.陸軍工程大學(xué)指揮控制工程學(xué)院江蘇南京210007 2.陸軍工程大學(xué)通信工程學(xué)院江蘇南京210007
合作被當(dāng)作演化的自然法則之一, 在人類社會(huì)進(jìn)步發(fā)展、生物群體進(jìn)化演化中發(fā)揮著非常重要的作用.合作行為的普遍出現(xiàn)且能夠相對(duì)穩(wěn)定的延續(xù)已經(jīng)成為一個(gè)前沿?zé)狳c(diǎn)問題[1].演化博弈理論[2]是傳統(tǒng)博弈論結(jié)合生物進(jìn)化論發(fā)展而來的, 它將經(jīng)濟(jì)學(xué)的“均衡觀”與生物學(xué)的“適應(yīng)性”相結(jié)合,刻畫了在理性不完全、信息不對(duì)稱、對(duì)環(huán)境及預(yù)期存在偏差的條件下,群體通過學(xué)習(xí)、模仿、試錯(cuò)而不斷適應(yīng)外部環(huán)境,最終達(dá)到演化穩(wěn)定狀態(tài)(Evolutionary Stable State,ESS)[3]的過程,演化博弈為多智能體之間的交互提供了一種有效的研究框架[4?5].近年來, 眾多學(xué)者利用演化博弈理論研究合作問題, 取得了很多重要成果,并在解決實(shí)際問題中廣泛應(yīng)用.
無人機(jī)集群被當(dāng)作未來戰(zhàn)場(chǎng)中智能作戰(zhàn)的主要樣式, 其自主協(xié)同能力是影響戰(zhàn)斗力生成的關(guān)鍵問題.高度智能化的無人機(jī)個(gè)體在有限信息、有限資源的條件下穩(wěn)定合作并有效協(xié)同, 與演化博弈的思想不謀而合.所以,用演化博弈理論解決無人機(jī)集群合作問題極具理論價(jià)值和現(xiàn)實(shí)意義.
無人機(jī)集群協(xié)同控制方法大體分為集中式和分布式兩類,其中分布式方法逐漸成為熱點(diǎn),發(fā)展出協(xié)商一致理論、信息素、博弈論、多智能體系統(tǒng)等多種方法.國內(nèi)學(xué)者在此方向取得了很多成果[6],最具代表性的是國防科技大學(xué)沈林成教授團(tuán)隊(duì), 對(duì)無人機(jī)集群協(xié)同控制的多個(gè)問題都有分析總結(jié), 具有非常高的指導(dǎo)價(jià)值[7?9].
針對(duì)于此,我們梳理了促進(jìn)合作演化的機(jī)制,并參考無人機(jī)集群的發(fā)展現(xiàn)狀及應(yīng)用前景, 對(duì)未來無人機(jī)集群作戰(zhàn)中的具體任務(wù), 提出演化博弈理論框架下的應(yīng)用想定, 旨在對(duì)提高和完善無人機(jī)集群的自主協(xié)同能力提供新的思路和方案.
1944年, 馮· 諾伊曼(Von Neumann) 與摩根斯坦(Morgenstern) 初步創(chuàng)立了博弈論.而后約翰納什(Nash) 提出納什均衡(Nash Equilibrium) 的概念, 標(biāo)志著經(jīng)典博弈論走向成熟[10].
此時(shí)演化的思想被學(xué)者關(guān)注, 如阿爾欽(Alchian) 提出將自然選擇機(jī)制應(yīng)用于經(jīng)濟(jì)分析領(lǐng)域,最終達(dá)成演化均衡.1973年,斯密斯(Smith)和普銳斯(Price)在有限理性的假設(shè)下提出演化穩(wěn)定策略的概念,極大促進(jìn)了演化博弈的發(fā)展,成為演化博弈論誕生的標(biāo)志.1978年泰勒(Taylor)和瓊克(Jonker)提出了模仿者動(dòng)態(tài)概念, 標(biāo)志著演化博弈理論的又一次重大進(jìn)展[11].隨著更多學(xué)科的科學(xué)家投身于演化博弈的研究,演化博弈理論體系進(jìn)一步完善,促進(jìn)合作涌現(xiàn)的機(jī)制也進(jìn)一步明晰.
演化博弈理論的核心思想可以總結(jié)為在有限理性(指由于信息不完全、不完美,決策者追求“滿意”而非“最優(yōu)”) 條件下, 智能體通過不斷的博弈嘗試進(jìn)行策略更新, 最終達(dá)到演化穩(wěn)定.現(xiàn)如今已經(jīng)成為研究合作問題的有力工具.關(guān)于演化博弈在解決合作問題上的應(yīng)用已經(jīng)在經(jīng)濟(jì)貿(mào)易[12?13]、企業(yè)管理[14?15]、環(huán)境保護(hù)[16?17]、社會(huì)與市場(chǎng)管理[18?19]等方面有著廣泛的研究和應(yīng)用.但由于領(lǐng)域特殊性及無人集群作戰(zhàn)的新質(zhì)性和問題復(fù)雜性, 當(dāng)前在無人機(jī)集群方面的研究比較少見.
近年來, 許多學(xué)者對(duì)促進(jìn)合作演化的機(jī)制進(jìn)行了系統(tǒng)而富有成效的研究.促進(jìn)合作演化的機(jī)制總體上可分為兩類,如圖1 所示.
圖1 促進(jìn)合作的演化機(jī)制Fig.1 Evolutionary mechanisms to promote cooperation
第一類為混合均勻群體下的合作機(jī)制, 這是演化博弈發(fā)展以來最先也是最為普遍的一類機(jī)制.其按照群體規(guī)模大致可以分為兩類:
一是群體的個(gè)體數(shù)目接近無限大的混合均勻群體,即無限群體.通常利用復(fù)制動(dòng)力學(xué)方程解出演化穩(wěn)定策略:博弈參與者具有不完全理性,在博弈開始時(shí)不能選出最優(yōu)策略,隨著博弈反復(fù)進(jìn)行,參與者為增大收益不斷修正自身策略, 致使群體中各策略的占比發(fā)生變化, 而某個(gè)策略占比的變化速度會(huì)正比于策略占比以及策略收益與平均收益的差值, 如式其中,ρ 代表策略i的個(gè)體在群體中所占比例,fi代表策略i 的個(gè)體的平均適應(yīng)度,表示所有個(gè)體的平均適應(yīng)度.以此建立復(fù)制方程,最終求出演化穩(wěn)定策略[20].此方法的靈感來源于達(dá)爾文的生物進(jìn)化理論, 復(fù)制動(dòng)力學(xué)方程提供的數(shù)學(xué)框架對(duì)實(shí)際問題的應(yīng)用非常廣泛.
二是群體的個(gè)體數(shù)目有限的混合均勻群體, 即有限群體.其研究目前相對(duì)較為成熟,常用的策略更新機(jī)制有模仿機(jī)制和愿景驅(qū)動(dòng)機(jī)制,如圖2.
圖2 模仿機(jī)制與愿景驅(qū)動(dòng)機(jī)制示意圖Fig.2 Schematic diagram of imitation mechanism and aspiration driven mechanism
模仿機(jī)制是指個(gè)體與其他個(gè)體比較收益大小,然后決定模仿策略還是沿用自己的策略[21?22].其更新模式大致有兩種: 一種是同步更新,即全部個(gè)體同時(shí)交互和更新策略, 每一代都可以清晰的區(qū)分交互階段和模仿階段;另一種是異步更新,即個(gè)體隨機(jī)交互和更新,并在整個(gè)一代更新完之前只進(jìn)行一次.關(guān)于個(gè)體的更新規(guī)則,常用的有以下3 種: 一是模仿最成功規(guī)則,即個(gè)體模仿收益最高者的策略,如果自身收益與其相同或更高,則保持原策略;二是概率更新規(guī)則, 即某個(gè)策略被選擇的概率正比于其在總收益中的比重;三是差值比較規(guī)則,即把其他個(gè)體與自身的收益做差值,差值越大的策略被使用的概率越大,差值為負(fù)則概率為零[23].
愿景驅(qū)動(dòng)機(jī)制在生物界中普遍存在, 比如候鳥選擇遷移路線和動(dòng)物外出覓食等[24].愿景驅(qū)動(dòng)是指個(gè)體將實(shí)際收益與預(yù)期收益相比較, 來決定是否調(diào)整策略.這種策略更新規(guī)則類似于自發(fā)行為而不需要掌握其他個(gè)體更多的信息,因此,更少考慮環(huán)境的影響.設(shè)個(gè)體改變策略的概率為ρ,則有
其中,ω 表示選擇強(qiáng)度,π 表示個(gè)體在博弈中的收益,而α 表示個(gè)體的愿景水平.在不考慮突變的情況下,根據(jù)公式很容易得知: 若個(gè)體的收益大于愿景水平,則個(gè)體改變策略的概率小于1/2,若個(gè)體的收益小于愿景水平, 個(gè)體改變策略的概率大于1/2, 若個(gè)體的收益等于愿景水平, 個(gè)體改變策略的概率等于1/2.形成演化穩(wěn)定后,即可得出策略的平均豐度[25?26].
混合均勻群體下, 參與者對(duì)除自身以外的所有個(gè)體都建立連接關(guān)系, 且等概率的與其他參與者進(jìn)行博弈.如果以圖論的知識(shí)作解釋, 節(jié)點(diǎn)代表個(gè)體,邊代表博弈關(guān)系,整個(gè)群體組成一張全連通圖.但是這只是一種理想化的模型,現(xiàn)實(shí)中極少存在.于是第二類空間結(jié)構(gòu)群體下的合作機(jī)制被提出, 這種情況下個(gè)體根據(jù)空間結(jié)構(gòu)關(guān)系只與其鄰居進(jìn)行博弈, 現(xiàn)在已經(jīng)成為合作涌現(xiàn)問題的研究熱點(diǎn), 對(duì)于分析解決實(shí)際問題的意義更為重大.
在空間結(jié)構(gòu)群體中, 基于圖論的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)是這類問題的主要研究方向, 其策略更新機(jī)制也主要采用模仿機(jī)制和愿景驅(qū)動(dòng)機(jī)制.代表性學(xué)者為哈佛大學(xué)的Nowak 教授, 他和May 在1992年首次研究了二維規(guī)則網(wǎng)格上的演化博弈, 證明了空間結(jié)構(gòu)對(duì)合作水平有正向作用.之后更多的學(xué)者投入到一維格子、二維格子、環(huán)形網(wǎng)絡(luò)等規(guī)則網(wǎng)絡(luò)的研究中[27?29].然而,現(xiàn)實(shí)世界中的網(wǎng)絡(luò)并非是均質(zhì)的,各節(jié)點(diǎn)的鄰居數(shù)目存在很大差異, 于是近些年來更符合現(xiàn)實(shí)世界的小世界網(wǎng)絡(luò)和無標(biāo)度網(wǎng)絡(luò)得到了更多的關(guān)注[30?32].復(fù)雜網(wǎng)絡(luò)上的研究大體上分為兩種:一是純策略演化, 主要研究固定的網(wǎng)絡(luò)拓?fù)湎卵莼呗詫?duì)合作行為的影響, 許多研究已經(jīng)證明系統(tǒng)的拓?fù)浣Y(jié)構(gòu)會(huì)對(duì)合作水平產(chǎn)生非常大的影響[33?35]; 二是共演化,主要研究網(wǎng)絡(luò)拓?fù)浜筒呗缘墓惭莼?包括斷邊重連機(jī)制對(duì)合作演化的影響以及遷移機(jī)制對(duì)合作演化的影響, 許多學(xué)者同樣給出了非常重要的結(jié)論[36?38].目前,復(fù)雜網(wǎng)絡(luò)上的演化博弈已經(jīng)成為國際公認(rèn)的前沿?zé)狳c(diǎn)領(lǐng)域之一, 在各領(lǐng)域都將有廣闊的應(yīng)用前景.
無人機(jī)已成為各國爭相發(fā)展的新型作戰(zhàn)平臺(tái),而無人機(jī)集群憑借其更好的經(jīng)濟(jì)性、適應(yīng)性、抗毀性、任務(wù)多樣性等特點(diǎn)受到了前所未有的關(guān)注,在不久的將來勢(shì)必會(huì)影響甚至改變戰(zhàn)爭規(guī)則, 成為戰(zhàn)場(chǎng)上的“力量倍增器”[39?40].其中無人機(jī)集群的合作水平直接關(guān)系其自主協(xié)同的效能,涉及到情報(bào)共享、任務(wù)分配、資源調(diào)整、編隊(duì)重組等方面,是亟待研究和解決的關(guān)鍵問題之一[41].
當(dāng)前無人機(jī)集群主要有兩種協(xié)同模式[39,42].一種是人–機(jī)協(xié)同,如美國“忠誠僚機(jī)”項(xiàng)目,此模式下無人機(jī)個(gè)體性能優(yōu)越且功能完善,一般數(shù)量不多,可看作具有簡單結(jié)構(gòu)的空間結(jié)構(gòu)群體(如圖3(a)), 在有人機(jī)通信受阻指揮不暢時(shí)要求高度智能化的無人機(jī)集群能夠自主協(xié)同并繼續(xù)完成任務(wù).一種是機(jī)–機(jī)協(xié)同,如無人機(jī)蜂群,一般個(gè)體功能相對(duì)簡單且數(shù)量龐大,自主程度要求更高,可看作有限混合均勻群體(如圖3(b)).或者考慮到無人機(jī)個(gè)體通信范圍有限,可作為具有一定結(jié)構(gòu)的空間結(jié)構(gòu)群體進(jìn)行研究(如圖3(c)).
圖3 無人機(jī)集群協(xié)同模式示意圖Fig.3 Schematic diagram of cooperative mode of UAV Swarm
結(jié)合4 個(gè)方面的需求描述演化博弈理論在無人機(jī)集群合作方面的具體應(yīng)用構(gòu)想,如圖4 所示.
圖4 演化博弈理論在無人機(jī)集群合作問題上的應(yīng)用想定Fig.4 Application scenarios of evolutionary game theory in UAV swarm cooperation
1)情報(bào)共享方面
任務(wù)場(chǎng)景: 規(guī)模龐大的無人機(jī)集群可以擔(dān)負(fù)復(fù)雜多樣的軍事任務(wù), 這需要各型號(hào)的無人機(jī)共同組群, 它們根據(jù)自身功能特點(diǎn)在集群中扮演不同的角色.比如大型攻擊無人機(jī)負(fù)責(zé)對(duì)地攻擊,偵察無人機(jī)負(fù)責(zé)偵察戰(zhàn)場(chǎng)環(huán)境, 通信無人機(jī)作為通信節(jié)點(diǎn)負(fù)責(zé)集群通信暢通,電子對(duì)抗無人機(jī)負(fù)責(zé)電磁壓制.在協(xié)同過程中,情報(bào)資源作為集群的稀缺資源,在情報(bào)獲取階段就會(huì)因個(gè)體獲取能力不同而存在情報(bào)資源分布不均的特點(diǎn).此時(shí)高度智能化的個(gè)體從“有限理性”的角度出發(fā),都會(huì)盡量多地競爭情報(bào)資源為己所用,以達(dá)到最大化自身效用的目的.如果沒有良好有效的情報(bào)共享機(jī)制,就會(huì)產(chǎn)生惡性競爭的局面,使得競爭能力強(qiáng)的個(gè)體情報(bào)冗余而競爭能力弱的個(gè)體情報(bào)不足, 嚴(yán)重影響整體的作戰(zhàn)效能.因此, 可以考慮用演化博弈理論設(shè)計(jì)出一種促進(jìn)個(gè)體間合作的機(jī)制,以合作代替惡性競爭來分配稀缺資源, 使整體的作戰(zhàn)效能達(dá)到最大.
應(yīng)用構(gòu)想:在眾多博弈模型中,鷹鴿博弈是一種用于分析沖突本質(zhì)的經(jīng)典博弈模型, 研究的是群體內(nèi)部競爭和沖突中的策略選擇和均衡問題, 適用于稀缺資源分配, 所以應(yīng)用鷹鴿博弈來解決上述問題是一個(gè)可行方案.然而傳統(tǒng)的鷹鴿博弈存在整體效用與合作水平(和平型策略個(gè)體所占比例)相互矛盾的問題,即合作并不總是好的,無原則的競爭和無原則的共享都會(huì)使集群整體收益較少.針對(duì)于此, 借鑒“針鋒相對(duì)”(Tit for Tat,TFT)策略[45],可以探索引入“自由民”策略的鷹鴿博弈模型,有學(xué)者證明改進(jìn)后的鷹鴿博弈在解決類似問題中可以達(dá)到演化穩(wěn)定,同時(shí)最大化整體效益[44].
2)任務(wù)分配方面
任務(wù)場(chǎng)景: 在人–機(jī)協(xié)同模式中,有人機(jī)充當(dāng)核心指揮角色,飛行員根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)、任務(wù)目標(biāo)和無人機(jī)技戰(zhàn)術(shù)性能等因素分配任務(wù), 以此發(fā)揮無人機(jī)集群的作戰(zhàn)效能.然而, 在復(fù)雜戰(zhàn)場(chǎng)電磁環(huán)境下, 尤其當(dāng)集群進(jìn)入敵縱深后, 通信不暢甚至通信失效是常見的現(xiàn)實(shí)風(fēng)險(xiǎn)[45].
設(shè)想有人機(jī)在敵防區(qū)外指揮控制無人機(jī)集群執(zhí)行偵察任務(wù),突然遭遇強(qiáng)電磁干擾致使通信中斷,敵發(fā)射防空導(dǎo)彈攻擊集群, 此時(shí)高度智能化無人機(jī)集群應(yīng)具備自主決策和任務(wù)分配能力: 根據(jù)威脅大小、個(gè)體重要程度、個(gè)體機(jī)動(dòng)能力、在集群中位置等多種因素采取不同措施(規(guī)避撤離、繼續(xù)偵察、攔截導(dǎo)彈等),以保證完成任務(wù)的前提下最大限度減小損失.
應(yīng)用構(gòu)想: 演化博弈理論可以求解出達(dá)到演化穩(wěn)定時(shí)各策略的平均豐度(各策略在集群中所占比例),如果將策略集與無人機(jī)可能采取的措施相對(duì)應(yīng),則平均豐度意味著每一種應(yīng)對(duì)措施在集群中所占比例.無人機(jī)個(gè)體各自執(zhí)行演化穩(wěn)定時(shí)的策略,即達(dá)到了任務(wù)分配的目的.在博弈模型中,關(guān)鍵問題在于收益矩陣中引入個(gè)體對(duì)集群重要程度、在集群中相對(duì)位置、個(gè)體機(jī)動(dòng)能力等相關(guān)參數(shù),使個(gè)體收益與集群收益正相關(guān),最終達(dá)到演化穩(wěn)定時(shí),在探究平均豐度的同時(shí)保證集群整體收益最大.
3)資源調(diào)整方面
任務(wù)場(chǎng)景: 無人機(jī)集群執(zhí)行對(duì)地攻擊任務(wù),需對(duì)每個(gè)目標(biāo)投放適當(dāng)?shù)膹椝? 既要保證目標(biāo)達(dá)到毀傷指標(biāo),又要盡可能節(jié)約彈藥確保持續(xù)作戰(zhàn)能力.掛載對(duì)地攻擊武器會(huì)使無人機(jī)個(gè)體機(jī)動(dòng)性降低并且油耗增大,作為高度智能化的理性作戰(zhàn)單元,無人機(jī)個(gè)體在執(zhí)行任務(wù)過程中會(huì)傾向于超量貢獻(xiàn)彈藥, 這可以視為一種“搭便車”行為:使個(gè)體受益(機(jī)動(dòng)性提高、油耗減小)而影響集群收益(持續(xù)作戰(zhàn)能力),作極端假設(shè), 就會(huì)使集群在攻擊首個(gè)目標(biāo)時(shí)就投放所有彈藥.這與無人合作困境“公共悲劇”十分相似.所以,無人機(jī)個(gè)體在攻擊目標(biāo)時(shí)投還是不投彈藥?投多少彈藥?是一個(gè)需要多方均衡優(yōu)化的問題.
應(yīng)用構(gòu)想: 公共物品博弈為解決公共悲劇問題提供了很好的模型.傳統(tǒng)的公共物品博弈中,參與者擁有相同的本金(資源),每個(gè)個(gè)體有投入全部或者不投入兩種策略選擇, 投資結(jié)束后公共池資金乘以增益因子,平均分給所有參與者.但現(xiàn)實(shí)情況并非“非黑即白”,需要考慮投資的多樣性,即博弈參與者可根據(jù)自身實(shí)際選擇投資的多少.因此,可以引入多策略,探求以策略數(shù)量為代表的多樣性對(duì)集群合作水平的影響.即博弈參與者可根據(jù)自身實(shí)際選擇投資的多少,而這對(duì)于解決上述多方均衡優(yōu)化問題很有幫助.
4)編隊(duì)重組方面
任務(wù)場(chǎng)景: 在對(duì)抗環(huán)境下,無人機(jī)集群往往會(huì)有個(gè)體損失、個(gè)體加入、隊(duì)形變換等編隊(duì)重組的問題.例如,由于基地?zé)o人機(jī)數(shù)目有限,在派出執(zhí)行攻擊任務(wù)的無人機(jī)集群時(shí)沒有足夠數(shù)量的偵察無人機(jī), 需要在飛行途中與另一個(gè)執(zhí)行完偵察任務(wù)的無人機(jī)集群會(huì)合組成新的集群.此時(shí),便涉及到編隊(duì)重組問題.而無人機(jī)集群自主協(xié)同在編隊(duì)層面, 須要不同功能的無人機(jī)均勻地分布在其功能互補(bǔ)個(gè)體的周圍.比如此場(chǎng)景下,需要通信無人機(jī)、偵察無人機(jī)等保障性無人機(jī)在攻擊無人機(jī)周圍, 使各類型無人機(jī)相互補(bǔ)充,從而高效完成任務(wù).所以如何利用演化博弈理論,達(dá)到功能互補(bǔ)的無人機(jī)大致均勻分布的目的是值得探究的關(guān)鍵性問題.
應(yīng)用構(gòu)想:在邊動(dòng)力學(xué)研究中,經(jīng)常針對(duì)不同類型的邊產(chǎn)生不同的邊動(dòng)力學(xué), 以達(dá)到促進(jìn)合作的目的.例如, 對(duì)合作者的邊施加一定的優(yōu)待,而非合作者的邊極易被斷開.通過這種機(jī)制,合作得以促進(jìn)背叛得以抑制.借于此思想,可以將無人機(jī)個(gè)體間的連接屬性考慮在內(nèi), 使不同功能無人機(jī)之間的連接加以優(yōu)待,而同類無人機(jī)之間的連接加以抑制,并考慮空間位置[46]、親緣選擇[47]、網(wǎng)絡(luò)互惠[48]等多種因素的共同影響,得到一種柔和的邊的調(diào)整方式.雪堆博弈的納什均衡恰好滿足上述需求(演化穩(wěn)定策略為采取與鄰居相反的策略, 集群收益更高)[49], 可以作為博弈模型進(jìn)行研究驗(yàn)證.
1)無人機(jī)集群的作戰(zhàn)環(huán)境是一個(gè)對(duì)抗的、動(dòng)態(tài)的環(huán)境.敵火威脅、天氣氣候條件、通信交互等偶然因素和突發(fā)事件紛繁復(fù)雜, 怎樣將偶然因素和突發(fā)事件恰當(dāng)?shù)赜成涞绞找婢仃囍惺且粋€(gè)難點(diǎn)問題.對(duì)此,不妨利用解決“黑盒”問題的思路,如利用神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等的手段來得到關(guān)系參數(shù),從而確定收益矩陣.
2)大規(guī)模無人機(jī)集群由不同型號(hào)的無人機(jī)共同組成,它們之間存在動(dòng)力學(xué)特性、功能側(cè)重、信息獲取和處理能力等方面的差異.那么在演化博弈過程中,各型號(hào)無人機(jī)的實(shí)際“偏好”一定是不同的,無差別地對(duì)待來進(jìn)行研究可能會(huì)存在一定的偏差.所以,如何將“偏好”融入博弈過程是未來探索的方向.或者在沒有完美解決方案的前提下, 聚焦同類型無人機(jī)之間的博弈,對(duì)整個(gè)集群的研究也有很大幫助.
3) 無人機(jī)集群在動(dòng)態(tài)環(huán)境下, 對(duì)各種決策的時(shí)效性要求比較高, 這就要求集群內(nèi)部的交互和響應(yīng)規(guī)則盡可能簡單.而演化博弈理論不能使博弈參與者一次性選擇最優(yōu)策略,而是存在學(xué)習(xí)調(diào)整的過程,這就出現(xiàn)了時(shí)效性是否滿足要求的矛盾問題.對(duì)此,現(xiàn)階段還沒有有效的研究, 下一步可以將演化博弈理論的決策時(shí)效性與無人機(jī)集群指揮控制的主流算法[50?52]進(jìn)行仿真比較.
本文對(duì)演化博弈理論進(jìn)行了簡要地介紹和梳理,結(jié)合無人機(jī)集群在作戰(zhàn)中的具體應(yīng)用,從情報(bào)共享、任務(wù)分配、資源調(diào)整和編隊(duì)重組4 個(gè)方面闡述了應(yīng)用構(gòu)想, 預(yù)想了研究中可能存在的難點(diǎn)問題并提出解決思路, 為無人機(jī)集群的協(xié)同控制提供了演化博弈視角下的解決方案, 也為下一步更為深入和具體的研究奠定了基礎(chǔ).