李 崢,蔡譯鋒,吳 軍
(西南電子設(shè)備研究所,四川 成都 610036)
反輻射無(wú)人機(jī)作為重要的硬殺傷武器,能夠自主完成尋的和制導(dǎo),實(shí)現(xiàn)對(duì)威脅輻射源的動(dòng)態(tài)打擊[1]。傳統(tǒng)運(yùn)用反輻射無(wú)人機(jī)多為單機(jī)或雙機(jī)編組對(duì)單個(gè)目標(biāo)進(jìn)行預(yù)置參數(shù)式打擊。隨著戰(zhàn)場(chǎng)輻射源目標(biāo)數(shù)量的增多、地理密度增加和戰(zhàn)技手段增強(qiáng),預(yù)置模式的打擊效果明顯下降。同時(shí)使用多架無(wú)人機(jī)構(gòu)建無(wú)人機(jī)集群,對(duì)敵方的多部威脅輻射源進(jìn)行集群式打擊[2]的作戰(zhàn)模式,集群式打擊應(yīng)運(yùn)而生,。
多目標(biāo)分配是集群作戰(zhàn)中有助于提升作戰(zhàn)效能的一項(xiàng)關(guān)鍵問題[3],學(xué)界的相關(guān)研究提供了不同的解決方式。最簡(jiǎn)單的解決方式為遍歷法,通過對(duì)所有目標(biāo)分配方案進(jìn)行遍歷,選取作戰(zhàn)效能最大的方案,但是面臨計(jì)算量過大的問題。滿意決策法對(duì)遍歷法進(jìn)行了改進(jìn),對(duì)每個(gè)無(wú)人機(jī)劃定可能的作戰(zhàn)目標(biāo)范圍,在范圍內(nèi)進(jìn)行搜索,從而提高計(jì)算效率[4-5]。當(dāng)存在定性約束條件時(shí),模糊推理法根據(jù)實(shí)際情況和專家經(jīng)驗(yàn)給出不同目標(biāo)定性條件重要度的相對(duì)隸屬度關(guān)系,從而實(shí)現(xiàn)無(wú)人機(jī)集群作戰(zhàn)中的目標(biāo)分配[6]。博弈論方法考慮攻防雙方對(duì)目標(biāo)分配的影響,能夠較逼真地反映作戰(zhàn)過程,使目標(biāo)分配結(jié)果對(duì)作戰(zhàn)效能具有較大的提升作用[7]。隨著各種智能算法的發(fā)展,無(wú)人機(jī)作戰(zhàn)目標(biāo)分配找到了新的發(fā)展方向[8],粒子群算法[9]和遺傳算法[10]將目標(biāo)分配問題建模為數(shù)值問題進(jìn)行計(jì)算,簡(jiǎn)化分析過程,但普遍面臨局部最小化的問題;而聚類算法[11]將目標(biāo)根據(jù)屬性相似性聚集成類,建模過程相對(duì)復(fù)雜。
現(xiàn)有無(wú)人機(jī)集群作戰(zhàn)目標(biāo)分配算法普遍面臨計(jì)算量大、不能定量分析和局部最小化等問題,在實(shí)戰(zhàn)應(yīng)用中的可實(shí)現(xiàn)性較差。為探索更為貼近實(shí)戰(zhàn)使用的無(wú)人機(jī)作戰(zhàn)目標(biāo)分配方法,本文以最大化作戰(zhàn)效能期望為目標(biāo),利用貪心法設(shè)計(jì)出一種作戰(zhàn)目標(biāo)分配算法,該方法能夠得到全局最優(yōu)解,并且計(jì)算量較小,具備工程可實(shí)現(xiàn)性,能夠?yàn)閷?shí)戰(zhàn)中的反輻射無(wú)人機(jī)自主作戰(zhàn)目標(biāo)分配提供理論支撐。
不同輻射源威脅程度存在差異,集群式反輻射運(yùn)用需要對(duì)無(wú)人機(jī)集群進(jìn)行作戰(zhàn)目標(biāo)分配,確定每個(gè)無(wú)人機(jī)的攻擊對(duì)象,提升整體作戰(zhàn)效能。同時(shí),在執(zhí)行任務(wù)過程中,作戰(zhàn)進(jìn)程會(huì)隨作戰(zhàn)過程不斷變化,造成戰(zhàn)前目標(biāo)分配策略需要根據(jù)實(shí)時(shí)戰(zhàn)場(chǎng)情況快速、準(zhǔn)確地完成目標(biāo)重分配。在無(wú)人機(jī)集群式作戰(zhàn)模式下,不同無(wú)人機(jī)之間的協(xié)同通常通過構(gòu)建無(wú)中心的自組網(wǎng)絡(luò)并采用分布式控制算法完成,最大程度上減少無(wú)人機(jī)集群在任務(wù)執(zhí)行過程中對(duì)地面站以及空地通信鏈路的依賴。在機(jī)間自組網(wǎng)和分布式自主協(xié)同的架構(gòu)下,無(wú)人機(jī)的各類控制算法必須在自身的內(nèi)置計(jì)算芯片上實(shí)現(xiàn),這就要求面向任務(wù)執(zhí)行過程中的無(wú)人機(jī)動(dòng)態(tài)作戰(zhàn)目標(biāo)分配算法必須能適應(yīng)無(wú)人機(jī)芯片計(jì)算能力有限的現(xiàn)實(shí)情況。因此,反輻射無(wú)人機(jī)作戰(zhàn)目標(biāo)分配方法不僅需要能夠最大化優(yōu)化集群作戰(zhàn)效能,還需要算法高效以滿足實(shí)時(shí)目標(biāo)重分配的高時(shí)效性要求[12]。
在進(jìn)行作戰(zhàn)目標(biāo)分配時(shí),假設(shè)當(dāng)前目標(biāo)輻射源數(shù)量m、各輻射源權(quán)重wi以及打擊成功率pi均已知。由于各無(wú)人機(jī)的性能完全相同,則由n架無(wú)人機(jī)組成的集群進(jìn)行作戰(zhàn)目標(biāo)分配的本質(zhì)為確定分配到各目標(biāo)輻射源的無(wú)人機(jī)個(gè)數(shù)。因此,無(wú)人機(jī)集群的作戰(zhàn)目標(biāo)分配策略可用包含m個(gè)元素的集合S={ci|i=1,2,…,m}來(lái)表示,其中,ci∈[0,n]是分配到第i個(gè)輻射源的無(wú)人機(jī)數(shù)量。
由于在進(jìn)行作戰(zhàn)目標(biāo)分配時(shí),打擊任務(wù)還未完成,因此無(wú)法計(jì)算集群作戰(zhàn)效能Q,可通過計(jì)算集群作戰(zhàn)效能Q的數(shù)學(xué)期望作為對(duì)集群作戰(zhàn)效能的評(píng)估準(zhǔn)則,并在此基礎(chǔ)上進(jìn)行目標(biāo)分配方案設(shè)計(jì)。對(duì)于一種給定的分配策略S,其對(duì)應(yīng)的集群作戰(zhàn)效能的數(shù)學(xué)期望為:
(1)
綜上,本論文需要解決的問題可描述為:在給定目標(biāo)輻射源數(shù)量m、各輻射源權(quán)重wi、打擊成功率pi、無(wú)人機(jī)數(shù)量n的情況下,尋找一種目標(biāo)分配策略S= {ci|i=1,2,…,m},使集群作戰(zhàn)效能的數(shù)學(xué)期望E(S)最大化。
Δ=k(m,n+1)-k(m,n)=
(2)
由式(2)可以看出,m≥2的情況下,k(m,n)的值隨著n的增加單調(diào)遞增,在m=2時(shí)保持線性增長(zhǎng),而在m≥3的情況下,k(m,n)的增速隨n的增大而增大。上述結(jié)論可理解為,隨著反輻射打擊場(chǎng)景規(guī)模的增大,目標(biāo)分配方案的總數(shù)持續(xù)增多,若采用遍歷法對(duì)問題去進(jìn)行求解,其所需的計(jì)算時(shí)間將隨著打擊場(chǎng)景規(guī)模的增大而快速增加。戰(zhàn)場(chǎng)態(tài)勢(shì)變化迅速,進(jìn)行目標(biāo)重分配計(jì)算必須盡快完成才能適應(yīng)作戰(zhàn)要求。因此,采用遍歷法難以適用上述動(dòng)態(tài)目標(biāo)分配的場(chǎng)景。
為解決上述問題,本文采用“貪心法”[16]實(shí)現(xiàn)一種高效的目標(biāo)分配策略。
wi[(1-pi)di(j)-(1-pi)di(j)+1],
(3)
式中,di(j)是在第j輪分配之前,已經(jīng)分配到輻射源i上的無(wú)人機(jī)數(shù)量。在對(duì)所有的m個(gè)輻射源的分配增益都計(jì)算完畢后,選擇其中分配增益最大的輻射源,并將該輻射源分配給第j架無(wú)人機(jī)。重復(fù)上述過程直到給所有的無(wú)人機(jī)都完成作戰(zhàn)目標(biāo)分配。
上述算法流程如圖1所示。
圖1 算法流程
對(duì)于問題1中任何一個(gè)分配策略S={ci|i=1,2,…,m},都可以通過依次為n架無(wú)人機(jī)分配其作戰(zhàn)目標(biāo)的方式獲得。
(4)
式中,u(j)是在第j輪中為第j架無(wú)人機(jī)分配的目標(biāo)輻射源編號(hào)。對(duì)于輻射源i,由S={ci|i=1,2,…,m}可知共ci架無(wú)人機(jī)分配了該目標(biāo)。將式(4)中所有滿足u(j)=i的ci個(gè)分量提取出來(lái),設(shè)上述ci個(gè)分量對(duì)應(yīng)的無(wú)人機(jī)編號(hào)由小到大依次為v(1),v(2),…,v(ci),則上述ci個(gè)分量的和為:
wi[(1-pi)di(v(1))-(1-pi)di(v(1))+1]+
wi[(1-pi)di(v(2))-(1-pi)di(v(2))+1]+…+
wi[(1-pi)di(v(ci))-(1-pi)di(v(ci)+1)]=
wi[(1-pi)0-(1-pi)1]+
wi[(1-pi)1-(1-pi)2]+…+
wi[(1-pi)ci-1-(1-pi)ci]=
wi[1-(1-pi)ci]。
(5)
綜合考慮所有的m個(gè)輻射源有:
(6)
即Fn與分配策略S對(duì)應(yīng)集群作戰(zhàn)效能相等。進(jìn)而,問題1可等價(jià)于:
在給定目標(biāo)輻射源數(shù)量m、各輻射源權(quán)重wi、打擊成功率pi、無(wú)人機(jī)數(shù)量n的情況下,尋找一種目標(biāo)分配策略S= {ci|i=1,2,…,m},使Fn最大化。
對(duì)Φ(i,j)關(guān)于j求偏導(dǎo)可得:
(7)
Φ(i,j)≥Φ(i,j')。
(8)
也一定是所有可能當(dāng)中最大的,由式(6)可知,采用本文算法得到策略的集群作戰(zhàn)效能的數(shù)學(xué)期望也是最大的。
為驗(yàn)證所述目標(biāo)分配方法的效能,首先通過仿真對(duì)該方法所對(duì)應(yīng)的作戰(zhàn)效能期望以及計(jì)算時(shí)間進(jìn)行測(cè)試,然后設(shè)計(jì)反輻射無(wú)人機(jī)集群執(zhí)行反輻射任務(wù)的典型場(chǎng)景,驗(yàn)證使用該方法進(jìn)行戰(zhàn)前靜態(tài)目標(biāo)分配以及臨機(jī)動(dòng)態(tài)目標(biāo)分配所對(duì)應(yīng)的作戰(zhàn)效果。
本節(jié)針對(duì)所述目標(biāo)分配方法,利用Matlab進(jìn)行仿真,分析對(duì)應(yīng)的作戰(zhàn)效能期望和計(jì)算時(shí)間情況。
仿真分為2組,分別分析在輻射源數(shù)量m和無(wú)人機(jī)數(shù)量n變化時(shí),所述方法對(duì)應(yīng)的作戰(zhàn)效能期望和計(jì)算時(shí)間變化情況,并且在每組仿真中均同時(shí)選擇遍歷法和遺傳算法作為對(duì)照組。遺傳算法的終止進(jìn)化代數(shù)設(shè)為50,種群大小設(shè)為200。
在第1組仿真當(dāng)中,令m從2~10以1為步進(jìn)進(jìn)行變化。其他參數(shù),令n=10,各輻射源的權(quán)重wi隨機(jī)生成,并令打擊成功率pi與wi負(fù)相關(guān)。共進(jìn)行100次重復(fù)獨(dú)立試驗(yàn),將所有重復(fù)獨(dú)立試驗(yàn)的平均值作為最終結(jié)果。
圖2給出了當(dāng)目標(biāo)輻射源數(shù)量變化時(shí),采用3種方法生成的策略所對(duì)應(yīng)的作戰(zhàn)效能期望情況??梢钥闯?,當(dāng)目標(biāo)輻射源數(shù)量變大時(shí),作戰(zhàn)效能的期望呈現(xiàn)遞減趨勢(shì)。這是由于在無(wú)人機(jī)數(shù)量確定的情況下,當(dāng)目標(biāo)數(shù)增大時(shí),由于平均分配到每個(gè)目標(biāo)上的無(wú)人機(jī)數(shù)不斷減少,造成對(duì)每個(gè)目標(biāo)打擊成功概率減小,從而導(dǎo)致整體作戰(zhàn)效能的持續(xù)降低。同時(shí),由圖2還可以看出,采用本方法與采用遍歷法得到的全局最優(yōu)策略的效能相同,證明了本方法所得到解的全局最優(yōu)性。遺傳算法得到的解的效能在輻射源數(shù)量較少時(shí)十分接近最優(yōu)解,但隨著輻射源數(shù)量的增大,與最優(yōu)解之間開始出現(xiàn)差距。
圖2 m變化時(shí)對(duì)應(yīng)的作戰(zhàn)效能期望
圖3給出了當(dāng)目標(biāo)輻射源數(shù)量變化時(shí),采用3種方法生成策略所需要的計(jì)算時(shí)間情況。在輻射源較少時(shí),遺傳算法所需要的計(jì)算計(jì)算時(shí)間遠(yuǎn)大于遍歷法和本方法。隨著輻射源數(shù)量的增多問題復(fù)雜度也隨之增大,3種方法所需的計(jì)算時(shí)間均呈增長(zhǎng)趨勢(shì)。其中遍歷法的增長(zhǎng)速度最快并且逐漸超過了遺傳算法,遺傳算法和本方法的增長(zhǎng)速度相對(duì)緩慢。總體而言,本文中的方法相較于其他2種方法的計(jì)算效率優(yōu)勢(shì)十分明顯。
圖3 m變化時(shí)對(duì)應(yīng)的計(jì)算時(shí)長(zhǎng)
在第2組仿真當(dāng)中,令n從10~18以1為步進(jìn)進(jìn)行變化。其他參數(shù),令m=10,各輻射源的權(quán)重wi隨機(jī)生成,并令打擊成功率pi與wi負(fù)相關(guān)。共進(jìn)行100次重復(fù)獨(dú)立試驗(yàn),將所有重復(fù)獨(dú)立試驗(yàn)的平均值作為最終結(jié)果。
圖4給出了當(dāng)集群無(wú)人機(jī)數(shù)量變化時(shí),采用3種方法生成的策略所對(duì)應(yīng)的作戰(zhàn)效能期望情況??梢钥闯觯?dāng)無(wú)人機(jī)數(shù)量變大時(shí),作戰(zhàn)效能的期望呈現(xiàn)遞增趨勢(shì)。這是由于在需要打擊的輻射源數(shù)量固定的情況下,所使用的無(wú)人機(jī)數(shù)越多,能分配到每個(gè)目標(biāo)上的平均無(wú)人機(jī)數(shù)也越多,從而提升了對(duì)各目標(biāo)的打擊成功概率,進(jìn)而提升了整體的作戰(zhàn)效能期望。在參數(shù)變化過程中,采用遍歷法和本方法所得到的策略對(duì)應(yīng)的效能期望始終相同,采用遺傳算法得到的效能期望略低于其他2種方法,這說明采用遺傳算法并不能得到全局最優(yōu)解。
圖4 n變化時(shí)對(duì)應(yīng)的作戰(zhàn)效能期望
圖5給出了當(dāng)集群無(wú)人機(jī)數(shù)量變化時(shí),采用3種方法生成策略所需要的計(jì)算時(shí)間情況。可以看出隨著無(wú)人機(jī)數(shù)量的增多,3種方法所需的計(jì)算時(shí)長(zhǎng)均呈增加趨勢(shì),但遍歷法增長(zhǎng)速度明顯高于其他2種方法。本文中的方法所需的計(jì)算時(shí)間在此次仿真中始終保持在1 ms以內(nèi),相較于2種對(duì)照方法中相對(duì)較優(yōu)的遺傳算法也有3個(gè)數(shù)量級(jí)以上的優(yōu)勢(shì)。
圖5 n變化時(shí)對(duì)應(yīng)的計(jì)算時(shí)長(zhǎng)
通過上述2組仿真,可以看出本方法能夠得出無(wú)人機(jī)集群執(zhí)行反輻射打擊任務(wù)時(shí)的目標(biāo)分配問題的全局最優(yōu)解,并且所需計(jì)算時(shí)間遠(yuǎn)小于遍歷法以及遺傳算法,隨著場(chǎng)景規(guī)模的擴(kuò)大,本方法在計(jì)算速度方面的優(yōu)勢(shì)變得越為明顯,適用于規(guī)模較大的集群式作戰(zhàn)場(chǎng)景。因此,本方法具備在無(wú)人機(jī)內(nèi)部計(jì)算芯片上進(jìn)行集成實(shí)現(xiàn)的條件,從而能夠有效支撐無(wú)人機(jī)集群在任務(wù)執(zhí)行過程中的目標(biāo)動(dòng)態(tài)分配。
通過設(shè)計(jì)一種無(wú)人機(jī)集群執(zhí)行反輻射任務(wù)的典型場(chǎng)景,利用仿真對(duì)比采用本方法進(jìn)行靜態(tài)和動(dòng)態(tài)目標(biāo)分配的效果。
仿真所選用的典型場(chǎng)景如圖6所示,由n架無(wú)人機(jī)組成的集群從起飛點(diǎn)出發(fā),經(jīng)過突防通道抵達(dá)任務(wù)區(qū)對(duì)任務(wù)區(qū)內(nèi)的敵方地面雷達(dá)進(jìn)行反輻射打擊。在無(wú)人起飛前,已知掌握到信息的目標(biāo)數(shù)量為m,但在作戰(zhàn)過程中又有L個(gè)新目標(biāo)被發(fā)現(xiàn)。
圖6 典型反輻射打擊任務(wù)仿真場(chǎng)景
在仿真過程中,令L的取值從1~10以1為步進(jìn)進(jìn)行變化,其他參數(shù),m=10,n=20,各輻射源的權(quán)重wi隨機(jī)生成,并令打擊成功率pi與wi負(fù)相關(guān)。對(duì)于L的每一種取值,均進(jìn)行1 000次重復(fù)獨(dú)立試驗(yàn)。所有重復(fù)獨(dú)立試驗(yàn)完成后,取所有作戰(zhàn)效能Q的均值作為最終結(jié)果。
為了進(jìn)行對(duì)比,對(duì)同一場(chǎng)景分別使用靜態(tài)分配和動(dòng)態(tài)分配2種策略。靜態(tài)分配策略是指在無(wú)人機(jī)起飛前完成對(duì)已知的m的作戰(zhàn)目標(biāo)的分配,在任務(wù)執(zhí)行程中不再進(jìn)行全局調(diào)整;動(dòng)態(tài)分配策略是指在起飛前形成初始目標(biāo)分配策略,在突防過程中若發(fā)現(xiàn)新的目標(biāo)則重新進(jìn)行全局目標(biāo)分配。靜態(tài)和動(dòng)態(tài)的目標(biāo)分配算法均使用本論文中的方法。
圖7描繪了在戰(zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)變化時(shí),采用動(dòng)態(tài)和靜態(tài)目標(biāo)分配策略所取得的作戰(zhàn)效能平均值變化情況。
圖7 動(dòng)態(tài)/靜態(tài)策略作戰(zhàn)效能對(duì)比(絕對(duì)值)
可以看出,隨著戰(zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)的增加,無(wú)論是采用靜態(tài)分配還是動(dòng)態(tài)分配策略,最終的集群作戰(zhàn)效能均呈下降趨勢(shì)。這是因?yàn)槿蝿?wù)總目標(biāo)變多時(shí),無(wú)人機(jī)數(shù)量并未增大,平均到每個(gè)目標(biāo)上的無(wú)人機(jī)數(shù)量降低,降低了將目標(biāo)實(shí)際摧毀的概率,造成最終的任務(wù)完成情況不斷變差。在2種策略當(dāng)中,由于動(dòng)態(tài)分配能夠根據(jù)戰(zhàn)場(chǎng)雷達(dá)數(shù)量的變化,從全局優(yōu)化的角度重新分配各無(wú)人機(jī)的作戰(zhàn)目標(biāo),故而其實(shí)際作戰(zhàn)效能始終大于采用靜態(tài)分配方法的效能。
圖8描繪了在戰(zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)變化時(shí),動(dòng)態(tài)/靜態(tài)策略作戰(zhàn)效能對(duì)比??梢钥闯?,隨著戰(zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)的增加,采用動(dòng)態(tài)策略的作戰(zhàn)效能與采用靜態(tài)策略的作戰(zhàn)效能之間的比值不斷增大,即動(dòng)態(tài)策略的效能優(yōu)勢(shì)隨著戰(zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)的增大而增大。因?yàn)閼?zhàn)場(chǎng)新發(fā)現(xiàn)雷達(dá)數(shù)越多,最終的真實(shí)打擊場(chǎng)景與戰(zhàn)前預(yù)期的差異也越大,造成了靜態(tài)分配策略對(duì)最終真實(shí)打擊場(chǎng)景的適應(yīng)性不足,進(jìn)而造成靜態(tài)分配策略的作戰(zhàn)效能快速下降。
圖8 動(dòng)態(tài)/靜態(tài)策略作戰(zhàn)效能對(duì)比(相對(duì)值)
本文針對(duì)反輻射無(wú)人機(jī)集群在執(zhí)行對(duì)多個(gè)輻射源目標(biāo)的打擊任務(wù)時(shí)的目標(biāo)分配問題,建立了問題的數(shù)學(xué)模型,采用“貪心法”提出了一種可獲得全局最優(yōu)解的目標(biāo)分配策略方法,并對(duì)該方法的全局最優(yōu)性進(jìn)行了數(shù)學(xué)證明。通過計(jì)算機(jī)仿真,驗(yàn)證了該方法與通過遍歷法獲得的全局最優(yōu)解的一致性,同時(shí)在計(jì)算效率上相較于經(jīng)典的次優(yōu)算法——遺傳算法有明顯的優(yōu)勢(shì),從而使得該方法具有在計(jì)算資源有限的無(wú)人機(jī)內(nèi)部芯片上實(shí)現(xiàn)的可行性。仿真結(jié)果同時(shí)顯示了基于本方法對(duì)作戰(zhàn)目標(biāo)進(jìn)行動(dòng)態(tài)分配能夠有效地提升集群作戰(zhàn)任務(wù)的效能,相較于靜態(tài)目標(biāo)分配是一種更優(yōu)的目標(biāo)分配策略。
本文進(jìn)行問題建模時(shí)只考慮了反輻射打擊任務(wù)的完成情況,未考慮與之相對(duì)應(yīng)的無(wú)人機(jī)開銷。在后續(xù)的研究中,將考慮為實(shí)現(xiàn)給定作戰(zhàn)效能所應(yīng)使用的最少無(wú)人機(jī)數(shù)等問題,從而提供更為貼近實(shí)戰(zhàn)的理論成果。