李士波
摘要:多無(wú)人作戰(zhàn)飛機(jī)任務(wù)分配是無(wú)人機(jī)協(xié)同控制的一項(xiàng)關(guān)鍵技術(shù)。綜合無(wú)人機(jī)后續(xù)攻擊任務(wù)和影響無(wú)人機(jī)作戰(zhàn)效能評(píng)估的各種因素,按照分階段分配方法建立了多UCAV任務(wù)分配模型,并使用粒子群算法對(duì)建立的任務(wù)分配模型進(jìn)行求解,將每個(gè)粒子的位置使用兩個(gè)多維向量表示,兩個(gè)向量分別采用兩種不同方式同時(shí)進(jìn)化。該方法解決了分配模型復(fù)雜性帶來(lái)的分配難題,取得了良好的分配效果。
關(guān)鍵詞:任務(wù)分配;協(xié)同控制;無(wú)人作戰(zhàn)飛機(jī);粒子群優(yōu)化
DOI:10.11907/rjdk.173133
中圖分類(lèi)號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1672-7800(2018)007-0193-03
Abstract:Multi-UCAVmissionallocationisthekeytechniqueforcoordinatecontrol.Consideringtheconsequentattackmissionandthemainfactorsthataffectcombatefficiencyassessment,themissionallocationmodelthatbasedondifferentstagesisestablished.Particleswarmoptimizationalgorithmisproposedtosolvetheproblem,eachparticlespositionisexpressedintwomulti-dimensionvectorsandthevectorsevolveindifferentmannerssynchronously,theevolvevalueisusedincostevaluationsubsequently.Thismethodhassolvedtheallocationproblemthatbroughtaboutthecomplexityoftheallocationmodelandreceivedgoodallocationresults.
KeyWords:missionallocation;coordinatecontrol;unmannedcombataerialvehicle;particleswarmoptimization(PSO)
0引言
無(wú)人作戰(zhàn)飛機(jī)(UnmannedCombatAerialVehicles,UCAV)從事的任務(wù)具有很大的危險(xiǎn)性和復(fù)雜性,因此通常采用多架無(wú)人機(jī)共同執(zhí)行任務(wù)的策略[1-3]。在多架無(wú)人機(jī)共同執(zhí)行任務(wù)過(guò)程中,多UCAV任務(wù)規(guī)劃技術(shù)是實(shí)現(xiàn)多無(wú)人機(jī)協(xié)同控制的關(guān)鍵技術(shù)[4-6]。因此,多UCAV任務(wù)分配技術(shù)研究尤其重要。
多無(wú)人機(jī)任務(wù)分配問(wèn)題是一個(gè)多目標(biāo)組合優(yōu)化問(wèn)題,即通過(guò)一定的分配策略給無(wú)人機(jī)分配不同的任務(wù)。分配原則是在保護(hù)無(wú)人機(jī)的前提下,增大對(duì)目標(biāo)的殺傷概率,避免重復(fù)攻擊和遺漏。
多UCAV任務(wù)分配問(wèn)題是研究熱點(diǎn)[7-9],學(xué)者們先后提出了匈牙利算法、線(xiàn)性規(guī)劃法、禁忌搜索方法、市場(chǎng)交易模型等方法,這些方法在分配規(guī)模較大時(shí)會(huì)導(dǎo)致求解困難,并且往往未能充分考慮影響無(wú)人機(jī)作戰(zhàn)效能的各種因素和后續(xù)攻擊任務(wù),很難適應(yīng)動(dòng)態(tài)復(fù)雜環(huán)境下無(wú)人機(jī)任務(wù)分配需求。
本文提出按階段分配的方法建立多UCAV任務(wù)分配模型,在建模過(guò)程中充分考慮影響無(wú)人機(jī)作戰(zhàn)效能評(píng)估的各種因素,并提出使用粒子群算法對(duì)建立的復(fù)雜任務(wù)分配模型進(jìn)行求解。該分配方法對(duì)無(wú)人機(jī)數(shù)目和攻擊目標(biāo)數(shù)目均沒(méi)有限制,無(wú)人機(jī)可先后對(duì)多個(gè)目標(biāo)進(jìn)行攻擊,在分配過(guò)程中并不簡(jiǎn)單地要求每一架無(wú)人機(jī)都執(zhí)行攻擊任務(wù),更好地反映了任務(wù)分配的實(shí)際情況和要求。
1多UCAV任務(wù)分配模型建立
在多UCAV任務(wù)分配問(wèn)題中,每架無(wú)人機(jī)可賦予攻擊多個(gè)目標(biāo),因此可將多無(wú)人機(jī)任務(wù)分配過(guò)程劃分為多個(gè)階段,如圖1所示。在每個(gè)階段中,選擇一架無(wú)人機(jī)去攻擊一個(gè)目標(biāo),在每個(gè)分配階段不僅要考慮選擇無(wú)人機(jī)攻擊目標(biāo),還要考慮選擇執(zhí)行攻擊任務(wù)的無(wú)人機(jī)。
無(wú)人機(jī)任務(wù)分配要考慮的因素包括執(zhí)行攻擊任務(wù)的次序、無(wú)人機(jī)對(duì)目標(biāo)殺傷的概率、無(wú)人機(jī)對(duì)抗威脅的能力(生存概率)、攻擊路徑最短等。執(zhí)行攻擊任務(wù)的次序指在攻擊目標(biāo)確定后,為每架無(wú)人機(jī)首先確定攻擊哪一個(gè)目標(biāo),之后確定要攻擊的第二目標(biāo),依次類(lèi)推,直至所有攻擊目標(biāo)均被確定。任務(wù)分配目標(biāo)是使無(wú)人機(jī)對(duì)目標(biāo)的殺傷概率達(dá)到最大而自身的損失最低,并盡可能地使所有無(wú)人機(jī)攻擊路徑總和最短[10-11]。
式(3)表示在每個(gè)階段中只有一架無(wú)人機(jī)從事攻擊任務(wù),并只對(duì)一個(gè)目標(biāo)發(fā)起攻擊。式(4)表示無(wú)人機(jī)攻擊的目標(biāo)數(shù)目最多不能超過(guò)其自身能力的限制。
2粒子群算法
粒子群算法是Kennedy和Eberhart[12-13]于1995年提出的一種優(yōu)化算法,該算法被證明在優(yōu)化問(wèn)題方面具有很大潛力。與傳統(tǒng)算法相比,PSO算法有一定的智能性,具有適用范圍廣、搜索能力強(qiáng)、不易陷入局部最優(yōu)等優(yōu)點(diǎn),在路徑規(guī)劃領(lǐng)域效果非常好[14]。
粒子群算法本質(zhì)是一種基于群體和適應(yīng)度的優(yōu)化算法[15-16]。在求解優(yōu)化問(wèn)題時(shí),每個(gè)粒子代表問(wèn)題的一個(gè)潛在解。粒子群算法使用適應(yīng)度函數(shù)評(píng)估粒子優(yōu)劣,適應(yīng)度函數(shù)的大小由粒子的具體位置坐標(biāo)決定。每個(gè)粒子記憶、追隨當(dāng)前的最優(yōu)粒子,在解空間中搜索。每次迭代過(guò)程不完全隨機(jī),如果找到較優(yōu)解,將會(huì)以此為依據(jù)尋找下一個(gè)解。
每個(gè)粒子用3個(gè)指標(biāo)表征:位置、速度、適應(yīng)度。在進(jìn)化前,粒子的初始位置和速度根據(jù)問(wèn)題限制在一定區(qū)間內(nèi)任意取值。粒子在每次迭代過(guò)程中需要記憶更新兩個(gè)極值。第一個(gè)極值是粒子自身歷史上的最優(yōu)位置,另一個(gè)極值是整個(gè)種群目前的最優(yōu)解。所有粒子通過(guò)這兩個(gè)極值修正粒子自身的位置,對(duì)下一步行為進(jìn)行調(diào)節(jié),使之迅速向最優(yōu)值方向收斂。每個(gè)粒子在多維空間中不斷改變位置,直到一個(gè)相對(duì)穩(wěn)定的位置被找到,或者到達(dá)設(shè)定的進(jìn)化次數(shù)限制。所有粒子按照下式演化:
Rand1()函數(shù)和Rand2()函數(shù)在[0,1]之間產(chǎn)生隨機(jī)數(shù)。C1和C2是一個(gè)正常數(shù),作為權(quán)重因子。權(quán)值ω用于控制粒子以前的速度對(duì)現(xiàn)在粒子速度的影響,在一定程度上,該參數(shù)平衡全局和局部粒子搜索能力。
用Vpbest表示粒子過(guò)去經(jīng)歷的所有位置中的最好位置時(shí)產(chǎn)生的速度矢量,用Vgbest表示在所有粒子中經(jīng)歷的最好位置所產(chǎn)生的速度矢量,繪制粒子自身位置變化原理如圖2所示。
3任務(wù)分配問(wèn)題粒子群算法
針對(duì)復(fù)雜任務(wù)分配模型的粒子群方法需要構(gòu)造一個(gè)2Nt維空間,每個(gè)粒子都包含兩個(gè)Nt維向量,分別定義為T(mén)arget和Vehicle向量。Target向量對(duì)應(yīng)于在不同階段所要攻擊的目標(biāo),Vehicle向量則對(duì)應(yīng)于不同階段攻擊時(shí)所使用的無(wú)人機(jī)。例如使用3架無(wú)人機(jī)去打擊5個(gè)目標(biāo),則某個(gè)粒子的位置向量如表1所示。
攻擊過(guò)程劃分為5個(gè)階段:①序號(hào)為3的無(wú)人機(jī)攻擊目標(biāo)2;②序號(hào)為1的無(wú)人機(jī)攻擊目標(biāo)4;③序號(hào)為2的無(wú)人機(jī)攻擊目標(biāo)3;④序號(hào)為3的無(wú)人機(jī)攻擊目標(biāo)1;⑤序號(hào)為1的無(wú)人機(jī)攻擊目標(biāo)5。要保證所有目標(biāo)均分配給一架無(wú)人機(jī)攻擊,無(wú)人機(jī)可使用多次但不能超過(guò)其最大攻擊次數(shù)。
在粒子群進(jìn)化中,Target向量和Vehicle向量采用兩種不同的方式同時(shí)進(jìn)化。由于Target向量代表不同階段要攻擊的目標(biāo),每個(gè)目標(biāo)只能攻擊一次,因此Target向量定義為有序整數(shù)數(shù)列:
其進(jìn)化可通過(guò)離散PSO算法進(jìn)行。Vehicle向量對(duì)應(yīng)于不同階段攻擊時(shí)使用的無(wú)人機(jī),將其定義為序列Y=(u1,u2…uNv),ui∈U。
Vehicle向量與Target向量的區(qū)別在于Vehicle向量允許重復(fù),并且有最大攻擊目標(biāo)數(shù)的限制。因此,Vehicle向量的進(jìn)化采用標(biāo)準(zhǔn)PSO算法變形,實(shí)現(xiàn)方法及過(guò)程如下:
(1)每個(gè)粒子的位置中Vehicle向量的每一維隨機(jī)取1-Nv(目標(biāo)數(shù))之間的整數(shù),其中1-Nv代表無(wú)人機(jī)序號(hào)。
(2)為了保證滿(mǎn)足約束條件(4),考察生成的序列,若Vehicle向量中某個(gè)無(wú)人機(jī)的序號(hào)出現(xiàn)次數(shù)超過(guò)無(wú)人機(jī)最大攻擊的目標(biāo)數(shù)目,則重新生成該向量,直到滿(mǎn)足約束條件為止。
(3)與Vehicle向量相對(duì)應(yīng)的速度向量V2為-(Nv-1)~(Nv-1)之間任意值。
(4)結(jié)合Target向量,按照代價(jià)評(píng)估函數(shù)(2)計(jì)算個(gè)體歷史最優(yōu)解和群體全局最優(yōu)解。
(5)按照速度更新公式和位置更新公式計(jì)算Y和V2,對(duì)Y取整,當(dāng)Y和V2超過(guò)邊界限制時(shí)按邊界取值。若更新后某個(gè)粒子的位置Y不滿(mǎn)足約束條件(4),則恢復(fù)更新前的原值。
(6)重復(fù)執(zhí)行步驟(4)和步驟(5),直到滿(mǎn)足終止條件或達(dá)到最大迭代次數(shù)。
4任務(wù)分配問(wèn)題仿真實(shí)現(xiàn)
例:若使用3架無(wú)人機(jī)去攻擊5個(gè)目標(biāo),無(wú)人機(jī)當(dāng)前位置和目標(biāo)位置已知,如圖3所示。
其中□代表無(wú)人機(jī),◇代表目標(biāo),無(wú)人機(jī)攻擊每個(gè)目標(biāo)的殺傷概率、生存概率以及目標(biāo)價(jià)值如表2、表3所示,最大攻擊目標(biāo)數(shù)目Nmax為3。
按照式(2)給出的任務(wù)分配模型進(jìn)行建模,將模型中的各參數(shù)分別取值為Nt=Ns=5,Nu=3,加權(quán)系數(shù)w1=w2=w3=1/5,即將各個(gè)子目標(biāo)賦予相同的重要程度。分配過(guò)程使用PSO算法,使分配代價(jià)按照評(píng)估函數(shù)計(jì)算達(dá)到最大值。
5結(jié)語(yǔ)
本文采用分階段分配方法建立無(wú)人機(jī)任務(wù)分配模型,該模型充分考慮了無(wú)人機(jī)對(duì)目標(biāo)的殺傷概率、目標(biāo)對(duì)抗威脅能力和攻擊路徑長(zhǎng)度等重要戰(zhàn)術(shù)指標(biāo),并考慮了無(wú)人機(jī)對(duì)后續(xù)目標(biāo)的攻擊任務(wù)。建立的復(fù)雜任務(wù)分配模型使用粒子群算法求解,將每個(gè)粒子的位置使用兩個(gè)多維向量表示,兩個(gè)向量采用兩種不同方式同時(shí)進(jìn)化。仿真結(jié)果證明了該方法的可行性,本文提出的建模方法和分配算法可直接應(yīng)用到多無(wú)人機(jī)自主控制體系中。
參考文獻(xiàn):
[1]劉重,高曉光,符小衛(wèi),等.未知環(huán)境下異構(gòu)多無(wú)人機(jī)協(xié)同搜索打擊中的聯(lián)盟組建[J].兵工學(xué)報(bào),2015(12):2284-2297.
[2]龍濤,沈林成,朱華勇.面向協(xié)同任務(wù)的多UCAV分布式任務(wù)分配與協(xié)調(diào)技術(shù)[J].自動(dòng)化學(xué)報(bào),2007(7):731-737.
[3]曹文靜,徐勝紅.多無(wú)人機(jī)協(xié)同方法研究[J].飛航導(dǎo)彈,2007(1):44-48.
[4]肖作林,田鴻堂,秦楓.多UCAV協(xié)同任務(wù)規(guī)劃技術(shù)研究[J].戰(zhàn)術(shù)導(dǎo)彈技術(shù),2013(6):53-57.
[5]張紅,盧廣山,朱榮剛.無(wú)人作戰(zhàn)飛機(jī)任務(wù)系統(tǒng)技術(shù)研究[J].電光與控制,2006(1):55-59.
[6]邸斌,周銳,丁全心.多無(wú)人機(jī)分布式協(xié)同異構(gòu)任務(wù)分配[J].控制與決策,2013(2):274-278.
[7]閔桂龍,端木京順,張冰,等.軍事后勤中的多目標(biāo)無(wú)人機(jī)任務(wù)規(guī)劃[J].計(jì)算機(jī)仿真,2016(3):85-89.
[8]TAKENOT,TSUJIMURAY,YAMAZAKIG.Asingle-phasemethodbasedonevolutioncalculationforvehicleroutingproblem[C].ConferenceofComputationalIntelligenceandMultimediaApplications,2001:103-107.
[9]UCHIMURAK,SAKAGUCHIH,NAKASHIMAT.Geneticalgorithmsforvehicleroutingproblemindeliverysystem[C].Yokohama:VehicleNavigationandInformationSystemsConference,1994.
[10]TANK,LEEL,ZHUQ,etal.Heuristicmethodsforvehicleroutingproblemwithtimewindows[J].ArtificialIntelligenceinEngineering,2001,15(3):281-295.
[11]葉媛媛,閔春平,朱華勇,等基于整數(shù)規(guī)劃的多任務(wù)分配問(wèn)題研究[J].信息與控制,2005,34(5):548-552.
[12]EBERHARTRC,KENNEDYJ.ANewOptimizerusingparticleswarmtheory[C].Proceedingofthe6thInternationalSymposiumMicroMachineandHumanScience,1995:39-43.
[13]KENNEDYJ,EBERHARTRC.Particleswarmoptimization[C].ProceedingsofIEEEInternationalConferenceonNeutralNetwork,1995:1942-1948.
[14]張建南,劉以安,王剛.基于優(yōu)化粒子群算法的無(wú)人機(jī)航路規(guī)劃[J].傳感器與微系統(tǒng),2017(3):1-4.
[15]吳曉軍,楊戰(zhàn)中,趙明.均勻搜索粒子群算法[J].電子學(xué)報(bào),2011(6):1261-1266.
[16]王東風(fēng),孟麗,趙文杰.基于自適應(yīng)搜索中心的骨干粒子群算法[J].計(jì)算機(jī)學(xué)報(bào),2016(12):2652-2667.
(責(zé)任編輯:杜能鋼)