劉 暢,李 杰,李 娟,李億俍
(北京理工大學(xué)機(jī)電學(xué)院,北京 100081)
隨著近年來無人武器系統(tǒng)的發(fā)展,越來越多的無人裝備在戰(zhàn)爭中頻繁出現(xiàn)。在納卡沖突中,作戰(zhàn)雙方的無人裝備承擔(dān)了偵察、攻擊、干擾、誘騙多種任務(wù),甚至出現(xiàn)了雙方無人裝備對抗的場面[1-3]。同時(shí),無人裝備還在以更加迅猛的勢頭不斷發(fā)展。以飛航領(lǐng)域?yàn)槔?,從早期的無人機(jī)[4]到巡飛彈[5],再到最新的“蜂群”作戰(zhàn)[6]可以看出,飛行器的使用已經(jīng)向智能化、集群化的方向發(fā)展(如圖1 所示),這期間所經(jīng)歷的技術(shù)變革時(shí)間也在逐漸縮短。
圖1 國外集群項(xiàng)目示例Fig. 1 Illustration of foreign swarm projects
作為無人裝備的一個(gè)重要發(fā)展方向,集群智能是一個(gè)涉及多學(xué)科交叉的前沿問題,也是當(dāng)前研究的熱點(diǎn)問題。目前,集群武器裝備的實(shí)現(xiàn)仍面臨很多問題,其中集群行為涌現(xiàn)機(jī)理以及對大規(guī)模集群的控制方法是要解決的首要問題[7]。
對于集群行為涌現(xiàn)機(jī)理而言,慎思型集群和反應(yīng)式集群[7]均可完成分布式自主集群行為。其中,慎思型集群任務(wù)效率高,但對信息的依賴程度高;反應(yīng)型集群任務(wù)效率低,但對信息的依賴程度低。
在實(shí)際系統(tǒng)中,上述兩種構(gòu)型的混合可以獲得良好的作戰(zhàn)效能[8]。當(dāng)前,慎思型集群的相關(guān)研究已經(jīng)相當(dāng)充分,并有了比較深入的應(yīng)用,如多任務(wù)分配、協(xié)同路徑規(guī)劃等,實(shí)現(xiàn)了很多復(fù)雜編隊(duì)、聯(lián)盟呼叫等集群行為[9-11]。然而,反應(yīng)式集群則仍停留在理論層面。
構(gòu)建反應(yīng)式集群的最大難點(diǎn)在于探索集群行為涌現(xiàn)的機(jī)理。由于信息的不完整和隨機(jī)性,導(dǎo)致個(gè)體在進(jìn)行決策時(shí)無法向涌現(xiàn)的方向“前進(jìn)”。這方面的研究始于對大自然中群體性生物的研究,特別是昆蟲,如蟻群、蜂群、魚群、鳥群等。研究者發(fā)現(xiàn),大量的看似有規(guī)律的集群行為往往不需要或僅需要簡單的信息交互就能完成,如蟻群合作搬運(yùn)大型物體、蜂群建巢、魚群躲避大魚攻擊等[7-8]。相比于直接信息交互(如廣播、射頻通信等),基于共識主動性的間接信息交互是導(dǎo)致大規(guī)模集群出現(xiàn)涌現(xiàn)現(xiàn)象的主要原因。此處,共識主動性描述了個(gè)體通過自身的行動改變環(huán)境,而改變的環(huán)境能夠被集群中的個(gè)體發(fā)現(xiàn)并影響其個(gè)體行為[8]的現(xiàn)象,如圖2 所示。
圖2 共識主動性原理示意圖Fig. 2 Schematic diagram of consensus initiative
近幾年,有關(guān)集群涌現(xiàn)的理論研究和實(shí)驗(yàn)性驗(yàn)證正在逐漸增加,其中比較有代表性的包括依靠個(gè)體簡單二維震動向光源移動(如圖3 所示)[12]、基于簡單信息和個(gè)體規(guī)則的組群/避碰/躲避等動作的最大化未來狀態(tài)(Future State Maximization)框架[13]以及基于無人機(jī)規(guī)則的作戰(zhàn)任務(wù)執(zhí)行框架[14]。雖然上述研究成果僅從原理上說明了反應(yīng)式集群的可行性,但是其展示出了以下優(yōu)點(diǎn):良好的環(huán)境適應(yīng)性;數(shù)目可任意擴(kuò)展;較低的人機(jī)交互難度等。
圖3 基于個(gè)體震顫的集群趨光過程Fig. 3 Phototaxis process based on individual tremor
本文在上述幾種反應(yīng)式集群框架的基礎(chǔ)上,結(jié)合現(xiàn)有視覺信息處理技術(shù),構(gòu)建了基于個(gè)體行為規(guī)則(和個(gè)體能力與控制關(guān)聯(lián))和集群行為原型(和作戰(zhàn)任務(wù)相關(guān)聯(lián))的反應(yīng)式集群框架。此外,對簡單的區(qū)域搜索、飽和攻擊進(jìn)行了嵌入式級的實(shí)現(xiàn),并對影響效率的關(guān)鍵因素進(jìn)行了深入分析,為構(gòu)建智能集群裝備進(jìn)行了基礎(chǔ)理論的探索。
對于構(gòu)建反應(yīng)式智能集群的實(shí)現(xiàn)而言,需要解決的關(guān)鍵問題有:個(gè)體行為和集群行為之間的關(guān)聯(lián);個(gè)體之間的信息交互方式;集群決策方法。
借鑒多智能體理論中對自組織集群的構(gòu)想,反應(yīng)式集群的基本框架如圖4 所示。其中,A為集群中的智能體,E為環(huán)境,S為宏觀狀態(tài),f是狀態(tài)轉(zhuǎn)移公式,h是抽象方法,g是行為規(guī)則。微觀層級包含個(gè)體、個(gè)體感知到的環(huán)境,宏觀層級則由微觀層級或部分微觀層級組成。圖4 描述了這樣一個(gè)過程:微觀層級的改變(按照f進(jìn)行狀態(tài)轉(zhuǎn)移)會造成宏觀層級的改變,且宏觀層級的改變之間沒有直接的聯(lián)系(僅和h相關(guān))。下面將對該模型進(jìn)行數(shù)學(xué)化描述。
圖4 反應(yīng)式集群的基本框架Fig. 4 Framework of reactive swarm
狀態(tài)的轉(zhuǎn)移是基于個(gè)體完成的,確定狀態(tài)轉(zhuǎn)移方程主要有兩個(gè)目的:①確定行為特點(diǎn);②確定決策的輸出。以巡飛彈為例,個(gè)體的轉(zhuǎn)彎半徑、飛行速度、飛行高度、探測距離、攻擊命中精度都可以納入到狀態(tài)轉(zhuǎn)移的方程中。以二維平面運(yùn)動為例,建立3 自由度運(yùn)動模型,運(yùn)動學(xué)方程可簡化為
式中,在機(jī)體坐標(biāo)系下,tv為前向速度,lv為側(cè)向速度;在導(dǎo)航坐標(biāo)系下,xF為橫軸受力,yF為縱軸受力;θ為航向角。
基于這類行為特征,控制模型使用常見的縱向總能量控制和橫側(cè)向的L1 控制,基本控制結(jié)構(gòu)如圖5 所示。基于這一考慮,由航點(diǎn)引申出的速度方向、大小均可作為個(gè)體決策的輸出量。理由如下:作為一個(gè)典型的雙環(huán)控制結(jié)構(gòu),外環(huán)控制量響應(yīng)周期長,對巡飛彈安全影響不大,適合作為個(gè)體決策的輸出量。
圖5 適用于巡飛彈的雙環(huán)控制結(jié)構(gòu)Fig. 5 Dual-loop control structure for aircraft
在確定了以外環(huán)控制量為決策輸出量后,就可以構(gòu)建個(gè)體行為規(guī)則。基于個(gè)體的能力以及實(shí)際的工作過程,可以設(shè)計(jì)出個(gè)體的行為規(guī)則。以巡飛彈集群的工作過程為例:首先假設(shè)個(gè)體能夠感知到一定范圍內(nèi)的其他個(gè)體的角度信息和速度信息,此時(shí)最基礎(chǔ)的個(gè)體行為規(guī)則可以設(shè)計(jì)為速度方向一致、聚集、避免碰撞3 條。這3 條最簡單的規(guī)則來源于對生物界大規(guī)模集群的觀察[15]。我們以速度方向?yàn)閭€(gè)體行為規(guī)則的輸出,那么針對第i個(gè)個(gè)體3 條規(guī)則的詳細(xì)描述如下。
速度一致規(guī)則
聚集規(guī)則
避免碰撞規(guī)則
式中,dk是個(gè)體i到鄰域個(gè)體k的距離。
最終這些規(guī)則都是以期望的速度矢量作為輸出,這樣綜合使用上述3 條規(guī)則便可以得到個(gè)體的決策模型
不難發(fā)現(xiàn),這3 條規(guī)則中并沒有包含任何與集群行為相關(guān)的信息,只是規(guī)定了當(dāng)能夠感知到其他個(gè)體時(shí)的自己的速度方向決策規(guī)則。
式中,φm為第m種規(guī)則的權(quán)重,且 ∑φm=1。
應(yīng)用上述的方法,可以實(shí)現(xiàn)一些最簡單的集群行為。例如,聚成一團(tuán)向某一方向移動且相互之間沒有碰撞、以簇為單位躲避障動態(tài)/靜態(tài)的障礙物。
圖6 展示了100 個(gè)個(gè)體的集群行為,其中藍(lán)色箭頭代表了個(gè)體的速度方向,紅色曲線表明了集群形狀重心的變化??梢钥吹剿龇磻?yīng)式集群框架有效地維持了集群的形狀。
圖6 集群成團(tuán)隨機(jī)移動Fig. 6 Moving randomly as a swarm
進(jìn)一步,文獻(xiàn)[15]中的結(jié)果,調(diào)整權(quán)值的大小可以將自然界中的一些集群行為對應(yīng)到數(shù)值仿真中,如表1 所示。我們以躲避動態(tài)障礙為例,進(jìn)一步分析模型及關(guān)鍵參數(shù)的作用。此時(shí),會增加一個(gè)遠(yuǎn)離障礙的規(guī)則4,其方法與式(2)~(4)類似。
表1 不同集群的參數(shù)設(shè)置Table 1 Parameter settings of different kinds of swarm
首先,集群中的個(gè)體在初始時(shí)刻會有一個(gè)隨機(jī)分配的移動方向和速度,并同時(shí)能夠觀察到領(lǐng)域內(nèi)的個(gè)體速度方向。此時(shí),式(6)將信息進(jìn)行加權(quán)處理。當(dāng)1φ為1,其余為0 時(shí),個(gè)體將以趨向觀察的速度矢量和方向移動(形成速度一致的群);反之,則按照各自的初始速度方向移動(無法形成群)。由此可見,規(guī)則2 和規(guī)則3 保證了集群的基本形狀,即不遠(yuǎn)離也不碰撞。
然后,當(dāng)遇到障礙物時(shí),規(guī)則4 發(fā)生作用。此時(shí),個(gè)體在遠(yuǎn)離障礙物的同時(shí),還要保證規(guī)則1~3 的作用,表現(xiàn)出了集體躲避的效果。此時(shí),個(gè)體的探測范圍將對集群后續(xù)的行為起到至關(guān)重要的作用。如果探測范圍足夠大,個(gè)體能夠看到更多的其他個(gè)體,則集群會恢復(fù)至遠(yuǎn)離的狀態(tài);反之,由于躲避而分散的個(gè)體將形成新的集群,繼續(xù)向目標(biāo)前進(jìn)。集群躲避障礙物過程如圖7 所示。
圖7 集群躲避障礙物過程Fig. 7 Process of swarm avoiding obstacles
至此,通過可以總結(jié)出反應(yīng)式集群具有以下優(yōu)秀特征:
(1)集群規(guī)模限制較少。由于個(gè)體之間不存在頻繁的主動通信,因此個(gè)體數(shù)量不會受到動態(tài)數(shù)據(jù)鏈的制約。
(2)同構(gòu)個(gè)體能夠自主分化。受到環(huán)境和個(gè)體自身能力的影響,集群能夠自動分化出新的、小的集群。
(3)個(gè)體規(guī)則保證了任務(wù)執(zhí)行的下限。即使遇到最惡劣的環(huán)境,即信息完全封閉時(shí),個(gè)體規(guī)則仍能保證基礎(chǔ)任務(wù)的執(zhí)行。
基于上述特性,我們認(rèn)為將這一框架推廣到裝備領(lǐng)域具有光明的前景。首先,規(guī)模無限制以及對通信的不依賴可以使得集群裝備在戰(zhàn)場上的生存能力和環(huán)境適應(yīng)能力大大提升;其次,同構(gòu)分化的能力可以降低對裝備的操作依賴程度并提供了同時(shí)進(jìn)行多種任務(wù)的可能性;最后,個(gè)體規(guī)則的存在使得一些作戰(zhàn)中特殊的使命,如自毀、掩護(hù)、安全對抗等能夠得到執(zhí)行。
當(dāng)然,距離反應(yīng)式集群的實(shí)用化還存在一個(gè)巨大的技術(shù)難點(diǎn):如何基于作戰(zhàn)任務(wù)進(jìn)行驅(qū)動。換句話說,就是如何利用上述特性控制一個(gè)反應(yīng)式集群,使之能夠高效地完成作戰(zhàn)任務(wù)。我們通過添加集群行為原型可以解決這一問題。
首先,進(jìn)行簡單的作戰(zhàn)想定:20 個(gè)個(gè)體對1 km2區(qū)域進(jìn)行搜索;找到隱藏在區(qū)域內(nèi)的5 個(gè)目標(biāo)并進(jìn)行攻擊;每個(gè)目標(biāo)遭到2 次以上的打擊后消失,剩余的個(gè)體繼續(xù)在區(qū)域內(nèi)實(shí)施封鎖壓制。
為了簡化問題,還是以式(1)~(6)來建立基礎(chǔ)的個(gè)體規(guī)則。然后建立集群行為原型,且每個(gè)行為原型都對應(yīng)一種作戰(zhàn)任務(wù)。以最簡單的原型為例:對固定區(qū)域進(jìn)行搜索,等價(jià)于最大化個(gè)體航跡的覆蓋率;對某一點(diǎn)的聚集,等價(jià)于對某一目標(biāo)的飽和攻擊。將這兩種行為原型的權(quán)值添加到式(6)中,得
式中,ω是行為原型的權(quán)值,l是行為原型的種類,在示例中為1 和2,且ω∑ =1。作用過程和個(gè)體規(guī)則中的φ類似,不同的ω可以組合出各種和搜索、攻擊相關(guān)的任務(wù),如搜索覆蓋率、搜索隊(duì)形、聚集方式、攻擊判斷等。具體來講,比如對于集群協(xié)同攻擊任務(wù)而言,在發(fā)現(xiàn)目標(biāo)前,蜂群可以在搜索行為與聚集行為的加權(quán)共同作用下,以小編隊(duì)形式進(jìn)行分組區(qū)域搜索;當(dāng)某一個(gè)體發(fā)現(xiàn)目標(biāo)后,范圍內(nèi)其余個(gè)體聚集規(guī)則的權(quán)值增大,將趨于快速飛向發(fā)現(xiàn)目標(biāo)的個(gè)體,實(shí)現(xiàn)協(xié)同攻擊。個(gè)體決策流程如圖8 所示。
圖8 個(gè)體決策過程Fig. 8 Individual decision-making process
不難發(fā)現(xiàn),集群行為原型將個(gè)體、環(huán)境通過預(yù)先規(guī)定的任務(wù)聯(lián)系到一起。至此,基于任務(wù)驅(qū)動的反應(yīng)式集群框架已經(jīng)搭建完畢。
接下來,就是確定任務(wù)驅(qū)動反應(yīng)式集群框架中的權(quán)值,也就是式(7)中的ω和φ。與第1 節(jié)中確定φ的方式不同,我們需要將任務(wù)帶入到權(quán)值過程,才能讓集群按照期望的方向涌現(xiàn)集群行為。例如,希望集群能夠涌現(xiàn)出覆蓋目標(biāo)區(qū)域的行為,我們需要以搜索覆蓋率最大化為目標(biāo)進(jìn)行訓(xùn)練,并得到相適應(yīng)的權(quán)值組合。
如何組合多個(gè)權(quán)值(即示例中的2 個(gè)ω值和3 個(gè)φ值),這一問題在實(shí)現(xiàn)過程中是一個(gè)NP 完全問題。同時(shí),這一問題還是動態(tài)的、隨機(jī)的:個(gè)體、集群面對的環(huán)境隨機(jī)性比較大,任務(wù)充滿對抗。例如,我們既希望集群能夠在最短的時(shí)間內(nèi)完成對目標(biāo)區(qū)域的覆蓋,又希望在發(fā)現(xiàn)目標(biāo)時(shí)能夠形成協(xié)同攻擊。前者要求個(gè)體盡量分散,而后者則希望集群在搜索中能夠保持一定的隊(duì)形,方便攻擊。因此,造成集群中個(gè)體所面對的環(huán)境差異很大,這就對權(quán)值的適應(yīng)性提出了較高的要求;另外,為了高效率完成集群任務(wù),權(quán)值對行為原型目的的實(shí)現(xiàn)要有比較高的準(zhǔn)確性。
面對這樣的問題,啟發(fā)式算法脫穎而出。啟發(fā)式算法是相對于最優(yōu)化算法提出的,其目標(biāo)是基于經(jīng)驗(yàn)構(gòu)造算法,在可接受的花費(fèi)(指計(jì)算時(shí)間和空間)下給出待解決組合優(yōu)化問題全部實(shí)例的可行解[16-18]。由于隨機(jī)性和環(huán)境不確定性的存在,一般的最優(yōu)算法無法給出滿意的權(quán)值設(shè)計(jì),因此啟發(fā)式算法是目前找到行為原型權(quán)值的理想方法。由于啟發(fā)式算法種類很多,本文以遺傳算法為例簡單介紹針對示例問題的權(quán)值確定過程。
與一般的問題類似,首先確定優(yōu)化變量。這一步很簡單,所有行為原型的權(quán)重和每一個(gè)行為原型中的個(gè)體規(guī)則對應(yīng)的權(quán)值就是優(yōu)化變量。
然后是編碼過程。本文采用5 位二進(jìn)制編碼,將所有權(quán)重組合起來形成一串編碼,如圖9所示。
圖9 編碼過程Fig. 9 Encoding process
交叉過程則類似于兩點(diǎn)交叉,在行為原型權(quán)重和個(gè)體規(guī)則權(quán)重之間進(jìn)行交叉,有目的地?cái)U(kuò)大任務(wù)對進(jìn)化的影響。
變異與一般的變異操作相同,種群中的每個(gè)個(gè)體根據(jù)概率決定是否進(jìn)行變異操作,需要進(jìn)行變異的個(gè)體根據(jù)變異比例的參數(shù)隨機(jī)選出需要變異的基因位。
最后是選擇過程。在這過程中,最重要的環(huán)節(jié)是適應(yīng)度函數(shù)的構(gòu)建,也是將任務(wù)和個(gè)體規(guī)則相關(guān)聯(lián)的過程,以對區(qū)域進(jìn)行搜索的任務(wù)為例:設(shè)定任務(wù)區(qū)域的總面積為Lx×L y=Ωarea,在仿真結(jié)束時(shí),巡飛彈集群對區(qū)域的搜索覆蓋總面積為Ωcoverage,則以區(qū)域搜索為任務(wù)目標(biāo)的適應(yīng)度函數(shù)為
適應(yīng)度值fitness越大,表示巡飛彈集群的行為表現(xiàn)越好,并以此作為選擇遺傳結(jié)果的標(biāo)準(zhǔn)。進(jìn)而采用最優(yōu)保持選擇的策略進(jìn)行選擇過程,即將種群中所有個(gè)體按適應(yīng)度值進(jìn)行排序,選擇適應(yīng)度值較高的一部分個(gè)體進(jìn)入下一代。這樣做可以保證快速收斂,最終得到一組權(quán)重值。該組權(quán)重值連接了個(gè)體的輸入和輸出,如圖10 所示。至此,我們就完成了全部的反應(yīng)式集群框架,并將之處理成加權(quán)求和的算式,可以很方便地在各種計(jì)算平臺上進(jìn)行實(shí)現(xiàn)。
圖10 個(gè)體決策選擇過程Fig. 10 Individual decision-making process
雖然式(7)解釋了個(gè)體決策過程,然而對于裝備的研制而言,至少還需要加入集群中個(gè)體的控制規(guī)律以及感知手段。為了進(jìn)一步提高仿真的仿真度,我們基于開源的MPE(Multiple Particle Environment)環(huán)境,構(gòu)建了巡飛彈集群行為仿真環(huán)境MAE(Multiple Agent Environment),基本組成框圖如圖11 所示。
圖11 MAE 仿真環(huán)境基本構(gòu)成Fig. 11 Basic composition of MAE simulation environment
其中,決策算法的實(shí)現(xiàn)是基于嵌入式系統(tǒng)和C++環(huán)境完成的;MPE 環(huán)境中質(zhì)點(diǎn)運(yùn)動方程被改成描述飛行器平面運(yùn)動的“質(zhì)點(diǎn)+平面轉(zhuǎn)動”剛體運(yùn)動方程,增加了飛行器的雙環(huán)控制回路;通過對信息傳遞建模,可以對環(huán)境感知進(jìn)行模擬。
(1)僅依賴視覺的感知輸入:個(gè)體依靠距離和角度模擬是否能夠發(fā)現(xiàn)其他個(gè)體?;镜呐袛鄺l件如圖12 所示。該方法類似于視網(wǎng)膜投影,個(gè)體僅能獲得離散的相對方位(θ)上的其是否存在他個(gè)體這一條信息。這么做的目的是最大程度上削弱個(gè)體對通信的需求,從而提升框架的適應(yīng)性。
圖12 個(gè)體獲取信息的示意圖Fig. 12 Schematic diagram of information obtain
(2)優(yōu)化確定權(quán)重。為了使得權(quán)值兼顧適應(yīng)性和執(zhí)行效率,大量的離線訓(xùn)必不可少,也就是需要設(shè)計(jì)場景提供數(shù)據(jù),以滿足遺傳算法的要求。這里以隨機(jī)初始位置、隨機(jī)初始速度、隨機(jī)區(qū)域內(nèi)目標(biāo)位置等變量構(gòu)建場景,并進(jìn)行訓(xùn)練。
(3)邊界規(guī)則。與個(gè)體行為規(guī)則不同,邊界規(guī)則是優(yōu)先級最高的規(guī)則,它規(guī)定了飛行器觸碰到邊界時(shí)該如何決策。這個(gè)決策和集群行為無關(guān),簡單的鏡面反射或隨機(jī)反射均可。
設(shè)置測試場景參數(shù)如下:區(qū)域范圍 4 km×4 km、節(jié)點(diǎn)數(shù)50 個(gè)、通信判斷范圍500 m、探測范圍200 m×300 m、目標(biāo)識別概率80%、固定目標(biāo)5 個(gè)。通過1000 次5000 步訓(xùn)練,得到的權(quán)重為[0.46 0.54 | 0.44 0.2 0.36]。仿真關(guān)鍵節(jié)點(diǎn)如圖13 所示。
圖13 仿真過程典型時(shí)刻圖Fig. 13 Simulation process of typical time
在圖中,以黑色坦克表示目標(biāo),彩色飛機(jī)代表不同行為狀態(tài)下的蜂群個(gè)體。不同顏色對應(yīng)不同行為,紅色對應(yīng)鎖定目標(biāo)行為,藍(lán)色對應(yīng)列隊(duì)行為,黃色對應(yīng)搜索行為,綠色對應(yīng)跟隨行為。從圖13-1 中可以看到,仿真開始,集群中的個(gè)體以隨機(jī)的位置和方向從起始點(diǎn)出發(fā)。圖13-2 中可以看到,隨著仿真時(shí)間的前進(jìn),部分個(gè)體已經(jīng)組成了一列進(jìn)行搜索,逐漸形成了4~6 列,每列大致有7~8 枚巡飛彈。這樣既保證能夠快速地完成搜索,又保證了當(dāng)看到目標(biāo)后能夠最快形成協(xié)同攻擊。從圖13-3 中看到,已經(jīng)有巡飛彈發(fā)現(xiàn)了目標(biāo),并進(jìn)行盤旋,等待攻擊的時(shí)機(jī)。圖13-4 中展示出,所有的目標(biāo)都被分配了巡飛彈并進(jìn)行監(jiān)視,其余的巡飛彈繼續(xù)偵查并形成了新的隊(duì)列。由于信息獲取距離的限制,組成的隊(duì)列規(guī)模比開始時(shí)減小了很多,約3~4 架。從集群飛行的過程中可以看出,在巡飛彈間距離過近時(shí),避碰規(guī)則會起到較明顯的作用,飛機(jī)會避免繼續(xù)靠近;反之,在機(jī)間距離過遠(yuǎn)時(shí),聚集規(guī)則會起到明顯作用,使信息獲取范圍內(nèi)飛機(jī)更加緊湊;當(dāng)機(jī)群飛行方向混亂時(shí),速度逐漸趨同的過程尤為明顯??梢燥@著看出速度一直受規(guī)則的影響。從結(jié)果來看,反應(yīng)式集群框架已經(jīng)起到了預(yù)想的作用,總結(jié)如下:
(1)實(shí)現(xiàn)了自底向上的集群自組織。與傳統(tǒng)的集群行為涌現(xiàn)方式不同,不存在任務(wù)分配(無論是集中式還是分布式)的過程,集群中的個(gè)體僅依靠自身的決策算法和自身探測到的信息完成決策過程,并完成了設(shè)定的任務(wù)目標(biāo)。
(2)反應(yīng)式集群適應(yīng)性較強(qiáng)。如果將結(jié)果和慎思式的集群進(jìn)行對比,當(dāng)通信條件下降或個(gè)體發(fā)生故障時(shí),本方法的適應(yīng)性高于慎思式的集群,如圖14 所示。其中,紅線是慎思式集群(蛇形搜索)的搜索效率下降程度,綠線是本方法的搜索效率下降程度??梢钥闯觯S著失效個(gè)體的增加,慎思式集群搜索效率下降越來越明顯,而反應(yīng)式集群則抑制了這一影響。
圖14 20%、40%和80%個(gè)體失效狀態(tài)下,搜索性能下降程度對比Fig. 14 Comparison of search performance degradation under 20%, 40% and 80% individual failure states
(3)實(shí)現(xiàn)了同構(gòu)集群的自主分化。作為集群智能的一個(gè)重要指標(biāo),自主分化意味著集群能夠同時(shí)完成多項(xiàng)任務(wù)。在本方法下,分化是根據(jù)探測范圍、初始狀態(tài)、目標(biāo)位置等因素完成的,也就是說這種分化并不是設(shè)計(jì)好的,而是根據(jù)環(huán)境因素自動完成的。當(dāng)調(diào)整個(gè)體探測范圍后,集群在搜索時(shí)將形成不同的集群形狀,如圖13 所示。列隊(duì)搜索、聚集盤旋、再列隊(duì)搜索、再盤旋過程,所形成的隊(duì)列大小、盤旋的終止等功能,均是在式(7)的作用下完成的。
基于上述仿真與分析,進(jìn)一步驗(yàn)證了反應(yīng)式集群的可行性和優(yōu)勢:不依賴全局信息就可以完成組群,降低了對數(shù)據(jù)鏈的要求;數(shù)量不再是制約集群的因素,這使得大規(guī)模使用成為了可能;同構(gòu)個(gè)體仍可完成多種任務(wù),降低了生產(chǎn)集群個(gè)體的成本。當(dāng)然,反應(yīng)式集群在任務(wù)執(zhí)行效率上還存在一定的問題。無論是搜索覆蓋率,還是針對目標(biāo)的打擊分配成功率,本方法都沒有給出能和任務(wù)分配類似的結(jié)果。過毀傷和欠毀傷將是后期研究主要面臨的問題,這也是可以預(yù)見的,畢竟全局信息的缺失勢必會導(dǎo)致這一結(jié)果的發(fā)生。
如開篇所提,本文所述僅僅是對反應(yīng)式集群在彈藥領(lǐng)域應(yīng)用的一種原理性的探索和嘗試。同樣,也僅在決策算法這一層面論述了其可行性。然而,距離該類裝備的實(shí)現(xiàn)還非常遙遠(yuǎn),這就涉及氣動設(shè)計(jì)領(lǐng)域、控制領(lǐng)域、探測領(lǐng)域、計(jì)算機(jī)領(lǐng)域等多種技術(shù)的共同發(fā)展。課題組將沿著這一思路,進(jìn)一步細(xì)化所涉及到的技術(shù),從添加彈藥控制模型、不依賴通信、組隊(duì)搜索、飽和攻擊等方面深入開展研究,最終為該類裝備的實(shí)現(xiàn)奠定良好的理論基礎(chǔ)和技術(shù)儲備。