國(guó)海峰,侯滿義,張慶杰,唐傳林
(1.空軍航空大學(xué),吉林 長(zhǎng)春 130022;2.94782部隊(duì),浙江 杭州 310004)
基于統(tǒng)計(jì)學(xué)原理的無(wú)人作戰(zhàn)飛機(jī)魯棒機(jī)動(dòng)決策
國(guó)海峰1,侯滿義1,張慶杰1,唐傳林2
(1.空軍航空大學(xué),吉林 長(zhǎng)春 130022;2.94782部隊(duì),浙江 杭州 310004)
為解決無(wú)人作戰(zhàn)飛機(jī)(UCAV)魯棒自主空戰(zhàn)決策問(wèn)題,提出基于統(tǒng)計(jì)學(xué)原理的魯棒機(jī)動(dòng)決策方法。為使空戰(zhàn)態(tài)勢(shì)變化具有一定的鈍感性,建立UCAV數(shù)學(xué)模型,改進(jìn)典型的機(jī)動(dòng)動(dòng)作庫(kù),設(shè)計(jì)空戰(zhàn)態(tài)勢(shì)參數(shù)的魯棒隸屬度函數(shù)。在魯棒機(jī)動(dòng)決策中引入統(tǒng)計(jì)學(xué)方法,針對(duì)UCAV對(duì)抗非機(jī)動(dòng)目標(biāo)和機(jī)動(dòng)目標(biāo)兩種典型空戰(zhàn)案例進(jìn)行了數(shù)字仿真。仿真結(jié)果表明,基于統(tǒng)計(jì)學(xué)原理的魯棒機(jī)動(dòng)決策方法在引導(dǎo)UCAV向態(tài)勢(shì)優(yōu)勢(shì)區(qū)域攻擊占位方面具有一定的魯棒性和尋優(yōu)性。
控制科學(xué)與技術(shù);統(tǒng)計(jì)學(xué);魯棒;機(jī)動(dòng);決策;空戰(zhàn)
自主空戰(zhàn)決策是關(guān)于無(wú)人作戰(zhàn)飛機(jī)(UCAV)在空戰(zhàn)過(guò)程中如何實(shí)時(shí)地選擇戰(zhàn)術(shù)方案或者機(jī)動(dòng)動(dòng)作的機(jī)制,機(jī)制的優(yōu)劣反映了UCAV決策的智能程度的高低[1]。
空戰(zhàn)機(jī)動(dòng)決策方法主要分為基于對(duì)策的機(jī)動(dòng)決策方法和基于人工智能的機(jī)動(dòng)決策方法[2]。前者以微分對(duì)策[3]、影響圖法[4-5]等方法為代表;后者包括神經(jīng)網(wǎng)絡(luò)、遺傳算法[6]、粒子群算法等?;谌斯ぶ悄艿臋C(jī)動(dòng)決策方法存在難以獲取真實(shí)的空戰(zhàn)樣本數(shù)據(jù)來(lái)訓(xùn)練,且計(jì)算效率較低等缺點(diǎn)。基于對(duì)策的機(jī)動(dòng)決策方法在每一個(gè)仿真步長(zhǎng)內(nèi)通過(guò)對(duì)無(wú)人機(jī)當(dāng)前所處態(tài)勢(shì)進(jìn)行判斷,在機(jī)動(dòng)動(dòng)作庫(kù)中選擇合適的動(dòng)作,使每一步都達(dá)到相對(duì)最優(yōu)的飛行軌跡。
為了應(yīng)對(duì)空戰(zhàn)戰(zhàn)場(chǎng)信息不完備、動(dòng)態(tài)性強(qiáng)等特點(diǎn),部分學(xué)者提出了魯棒機(jī)動(dòng)決策方法,耿文學(xué)等[7]提出了基于模糊貝葉斯網(wǎng)絡(luò)的UAV中遠(yuǎn)距空戰(zhàn)戰(zhàn)術(shù)決策,但推理過(guò)程較為復(fù)雜;屈曉波等[8]給出了一種在不確定環(huán)境下的無(wú)人機(jī)攻擊決策方法,采用差分進(jìn)化算法進(jìn)行攻擊軌跡決策;文獻(xiàn)[9]提出了一種基于模糊邏輯的魯棒空戰(zhàn)決策方法,但文獻(xiàn)中采用的最小、最大決策方法并不能同時(shí)保證4個(gè)態(tài)勢(shì)參數(shù)的隸屬度函數(shù)在每次決策過(guò)程中保持單調(diào)上升,并最終收斂到1.
本文針對(duì)文獻(xiàn)[9]中提出的決策方法進(jìn)行改進(jìn),擴(kuò)展了機(jī)動(dòng)動(dòng)作庫(kù),引入統(tǒng)計(jì)學(xué)原理作為機(jī)動(dòng)動(dòng)作選取的決策方法,提出了一種基于統(tǒng)計(jì)學(xué)原理的UCAV自主空戰(zhàn)魯棒機(jī)動(dòng)決策方法。
本文的魯棒機(jī)動(dòng)決策框架如圖1所示,通過(guò)設(shè)計(jì)具有魯棒性能的空戰(zhàn)態(tài)勢(shì)隸屬度函數(shù),來(lái)克服目標(biāo)位置等信息不確定給決策帶來(lái)的影響,然后基于當(dāng)前獲取的目標(biāo)信息,通過(guò)試探機(jī)動(dòng)設(shè)計(jì)多個(gè)態(tài)勢(shì)場(chǎng)景,并提出具有尋優(yōu)能力、基于統(tǒng)計(jì)學(xué)原理的決策方法,綜合分析得到具有一定魯棒性能的機(jī)動(dòng)決策方案。
圖1 魯棒機(jī)動(dòng)決策框架圖Fig.1 Block diagram of robust maneuver decision framework
1.1 UCAV運(yùn)動(dòng)學(xué)模型
對(duì)于機(jī)動(dòng)決策這類高層級(jí)決策來(lái)說(shuō),UCAV平臺(tái)的質(zhì)點(diǎn)模型可以滿足要求。模型參數(shù)定義如圖2所示,質(zhì)點(diǎn)運(yùn)動(dòng)學(xué)模型為
(1)
圖2 質(zhì)點(diǎn)模型圖Fig.2 Point masses model
當(dāng)控制命令nxc、nzc、φc輸入系統(tǒng)時(shí),執(zhí)行機(jī)構(gòu)存在動(dòng)態(tài)延遲效應(yīng),因此對(duì)延遲效應(yīng)進(jìn)行建模,如(2)式所示:
(2)
式中:τx、τz分別為nx、nz的延遲時(shí)間常數(shù);ωn為自然震蕩頻率;ξ為阻尼系數(shù)。
1.2 基本機(jī)動(dòng)動(dòng)作庫(kù)
UCAV機(jī)動(dòng)動(dòng)作庫(kù)的建立可以借鑒有人戰(zhàn)斗機(jī)飛行員進(jìn)行空戰(zhàn)時(shí)的戰(zhàn)術(shù)動(dòng)作。飛行員根據(jù)駕駛機(jī)型、身體承受能力、戰(zhàn)場(chǎng)態(tài)勢(shì)等多種因素可以派生出許多戰(zhàn)術(shù)動(dòng)作,比如桶滾、眼鏡蛇機(jī)動(dòng)、高速搖搖、低速搖搖等。但歸根結(jié)底還是從基本操縱動(dòng)作發(fā)展而來(lái),因此只要UCAV戰(zhàn)術(shù)動(dòng)作庫(kù)包含這些基本的機(jī)動(dòng)動(dòng)作便可滿足在地面仿真和原理系統(tǒng)驗(yàn)證時(shí)的使用要求。
根據(jù)常用的空戰(zhàn)機(jī)動(dòng)方式,美國(guó)NASA學(xué)者設(shè)計(jì)了7種典型機(jī)動(dòng)動(dòng)作[10](見圖3):1)直線勻速飛行;2)最大加力加速飛行;3)最大減速飛行;4)最大過(guò)載左轉(zhuǎn)彎;5)最大過(guò)載右轉(zhuǎn)彎;6)最大過(guò)載爬升;7)最大過(guò)載俯沖。對(duì)于最大過(guò)載約束,由于沒(méi)有飛行員的身體承受能力約束,只需考慮UCAV平臺(tái)的物理結(jié)構(gòu)限制即可。
圖3 典型機(jī)動(dòng)動(dòng)作庫(kù)示意圖Fig.3 Schematic diagram of typical maneuver library
上述機(jī)動(dòng)動(dòng)作庫(kù)中包含的機(jī)動(dòng)動(dòng)作單一,且只在兩個(gè)獨(dú)立的平面內(nèi)運(yùn)動(dòng),不符合空戰(zhàn)的實(shí)際情況。文獻(xiàn)[11]設(shè)計(jì)了一種包含描述參數(shù)的機(jī)動(dòng)動(dòng)作庫(kù)設(shè)計(jì)方法,針對(duì)不同的機(jī)動(dòng)動(dòng)作,采用一個(gè)或多個(gè)參數(shù)進(jìn)行定量刻畫,以體現(xiàn)機(jī)動(dòng)動(dòng)作的角度、速度、曲率等空間特性和起止、持續(xù)等時(shí)間特性,然而文獻(xiàn)中針對(duì)空戰(zhàn)的劇烈動(dòng)態(tài)性沒(méi)有給出這些參數(shù)的自適應(yīng)調(diào)整機(jī)制。自主空戰(zhàn)過(guò)程中UCAV如何選擇機(jī)動(dòng)動(dòng)作類型,如何識(shí)別機(jī)動(dòng)的起始、持續(xù)時(shí)間,機(jī)動(dòng)動(dòng)作參數(shù)設(shè)置合理性取值等問(wèn)題還有待進(jìn)一步研究。
本節(jié)根據(jù)上述典型機(jī)動(dòng)動(dòng)作存在的問(wèn)題,對(duì)機(jī)動(dòng)動(dòng)作進(jìn)行擴(kuò)充,如圖4所示。擴(kuò)展的機(jī)動(dòng)動(dòng)作庫(kù)包含了右上、左上、右下、左下方的機(jī)動(dòng),且每個(gè)方向上的機(jī)動(dòng)動(dòng)作包括了加速狀態(tài)、減速狀態(tài)、勻速狀態(tài)3類,總共45種動(dòng)作。通過(guò)擴(kuò)展機(jī)動(dòng)動(dòng)作庫(kù),UCAV可以實(shí)現(xiàn)斜筋斗、戰(zhàn)斗轉(zhuǎn)彎、滾筒機(jī)動(dòng)等典型動(dòng)作庫(kù)無(wú)法實(shí)現(xiàn)的動(dòng)作。
圖4 改進(jìn)的典型機(jī)動(dòng)動(dòng)作庫(kù)示意圖Fig.4 Schematic diagram of improved typical maneuver library
1.3 空戰(zhàn)態(tài)勢(shì)函數(shù)魯棒設(shè)計(jì)
如圖5所示,根據(jù)文獻(xiàn)[12]中關(guān)于空戰(zhàn)態(tài)勢(shì)優(yōu)劣的闡述,空戰(zhàn)態(tài)勢(shì)可分為均勢(shì)、優(yōu)勢(shì)、劣勢(shì)、相互不利4種態(tài)勢(shì),而空戰(zhàn)決策的目的是從任意一種態(tài)勢(shì)轉(zhuǎn)變?yōu)橛欣?優(yōu)勢(shì))態(tài)勢(shì)??諔?zhàn)過(guò)程中可用4個(gè)參數(shù)表征當(dāng)前的空戰(zhàn)態(tài)勢(shì)[9]:Θ=(α,R,v,h),α表示當(dāng)前態(tài)勢(shì)下UCAV與敵機(jī)的方位,R表示UCAV與敵機(jī)的距離矢量,v表示UCAV速度,h表示UCAV飛行高度。
圖5 敵我優(yōu)劣態(tài)勢(shì)示意圖Fig.5 Schematic diagram of friend or foe situation
根據(jù)文獻(xiàn)[13]提出的魯棒設(shè)計(jì)可以分為目標(biāo)函數(shù)魯棒設(shè)計(jì)與可行域魯棒設(shè)計(jì)兩類,本文選擇前者進(jìn)行魯棒設(shè)計(jì)。為了增強(qiáng)決策結(jié)果的魯棒性,對(duì)空戰(zhàn)態(tài)勢(shì)參數(shù)的隸屬度函數(shù)進(jìn)行魯棒設(shè)計(jì)。
方位參數(shù)的隸屬度函數(shù)ηα(α)定義為
(3)
R=[xu-xe,yu-ye,zu-ze],
(4)
(5)
(6)
式中:下角標(biāo)u表示UCAV,e表示敵機(jī);方位角αe、αu的定義如圖6所示。
圖6 方位角與距離定義圖Fig.6 Definition of azimuth and distance
由圖7隸屬度函數(shù)與方位角的關(guān)系可知,當(dāng)αe、αu皆趨近于π時(shí),方位參數(shù)的隸屬度函數(shù)值最大,即UCAV處于對(duì)敵進(jìn)行尾追攻擊態(tài)勢(shì)。
圖7 方位隸屬度函數(shù)曲線 Fig.7 Azimuth membership function
當(dāng)敵機(jī)與UCAV的距離小于導(dǎo)彈攻擊距離時(shí),為了使距離參數(shù)隸屬度函數(shù)對(duì)距離的變化具有一定的鈍感性,從而使UCAV決策結(jié)果具有一定的魯棒性,對(duì)距離參數(shù)的隸屬度函數(shù)ηR(R)定義為
(7)
式中:R=‖R‖;Rg表示UCAV武器攻擊距離,σ為其標(biāo)準(zhǔn)偏差。
速度參數(shù)的隸屬度函數(shù)ηv(v)定義為
(8)
式中:v*表示UCAV攻擊敵機(jī)的最佳攻擊速度,取值為
(9)
vmax表示UCAV速度的最大值,ve表示敵機(jī)的速度。
與距離參數(shù)隸屬度函數(shù)類似,為了增強(qiáng)UCAV決策結(jié)果的魯棒性,對(duì)高度參數(shù)的隸屬度函數(shù)ηH(Δz)定義為
式中:hs表示UCAV對(duì)敵機(jī)的最佳攻擊高度差;Δz=zu-ze為UCAV與敵機(jī)的高度差;σh為最佳攻
擊高度標(biāo)準(zhǔn)偏差。
從以上4個(gè)參數(shù)的隸屬度函數(shù)可以看出:當(dāng)4個(gè)隸屬度函數(shù)值都逐漸趨近于1時(shí),UCAV處于占位攻擊態(tài)勢(shì);若都趨近于0,則UCAV處于被攻擊態(tài)勢(shì)。
綜上,自主空戰(zhàn)過(guò)程中UCAV總的態(tài)勢(shì)評(píng)價(jià)函數(shù)形式表示為
(11)
式中:wi表示權(quán)重;下標(biāo)x∈{α,R,v,h}.
戰(zhàn)斗機(jī)飛行員基于當(dāng)前敵我態(tài)勢(shì)信息做出機(jī)動(dòng)決策,自主空戰(zhàn)過(guò)程中,UCAV同樣也需要根據(jù)得到的當(dāng)前目標(biāo)及態(tài)勢(shì)信息進(jìn)行決策。考慮到目標(biāo)信息是通過(guò)間接渠道獲取的,本文針對(duì)信息的時(shí)效性存在一定折扣的問(wèn)題,為了使決策具有一定的魯棒性,一方面對(duì)決策過(guò)程中態(tài)勢(shì)評(píng)價(jià)函數(shù)仍然采用隸屬度函數(shù)的表示形式,對(duì)隸屬度函數(shù)進(jìn)行了改進(jìn),使態(tài)勢(shì)函數(shù)對(duì)空戰(zhàn)態(tài)勢(shì)變化具有一定的鈍感性,函數(shù)值的鈍感性轉(zhuǎn)變?yōu)闆Q策結(jié)果的魯棒性;另一方面在決策過(guò)程中采用統(tǒng)計(jì)學(xué)原理使決策過(guò)程充分考慮各個(gè)態(tài)勢(shì)參數(shù)的綜合作用,盡可能使決策結(jié)果最優(yōu)。
基于統(tǒng)計(jì)學(xué)原理的決策方法具體的流程如下:
1) 基于當(dāng)前t時(shí)刻UCAV與敵機(jī)信息,將動(dòng)作庫(kù)中所有動(dòng)作的控制指令送入質(zhì)點(diǎn)模型,進(jìn)行機(jī)動(dòng)試探;
(12)
(13)
4) 時(shí)間更新,返回步驟1.
在決策過(guò)程中引入統(tǒng)計(jì)學(xué)方法的好處在于能夠綜合考慮所有空戰(zhàn)態(tài)勢(shì)參數(shù)的作用,取均值高的動(dòng)作能確保態(tài)勢(shì)參數(shù)隸屬度函數(shù)值向優(yōu)勢(shì)區(qū)域收斂,取標(biāo)準(zhǔn)差小的能使所有空戰(zhàn)態(tài)勢(shì)參數(shù)的隸屬度函數(shù)值盡可能聚集,從而保證UCAV在自主空戰(zhàn)中能夠最終到達(dá)態(tài)勢(shì)優(yōu)勢(shì)區(qū)域。
本文主要針對(duì)敵機(jī)進(jìn)行直線定常飛行、S型機(jī)動(dòng)飛行兩種情況進(jìn)行仿真驗(yàn)證,并與文獻(xiàn)[9]中的方法進(jìn)行比較,討論本文提出機(jī)動(dòng)決策方法的魯棒尋優(yōu)性能。為了驗(yàn)證本文提出方法的性能,仿真中假設(shè)敵機(jī)不對(duì)UCAV的機(jī)動(dòng)行為做出反應(yīng)。考慮到UCAV在平臺(tái)上沒(méi)有優(yōu)勢(shì),以及隱身目標(biāo)側(cè)向、尾向雷達(dá)散射截面積比較大的特點(diǎn),仿真中設(shè)置攻擊方式為尾后攻擊。
通用仿真參數(shù)設(shè)置如下:τx=0.17,τz=1.17,ωn=6.34,ξ=0.7;UCAV對(duì)敵最佳攻擊距離Rg為2 500 m,標(biāo)準(zhǔn)偏差σ為500 m;敵機(jī)、UCAV的最大、最小飛行速度均分別為406 m/s、90 m/s;UCAV對(duì)敵機(jī)攻擊的最佳高度差hs為0 m,標(biāo)準(zhǔn)偏差σh為100 m;最小、最大飛行高度限制分別為1 000 m、20 000 m;不考慮地面敵方防空火力的威脅,權(quán)重w1=w2=w3=w4=0.25,控制量nxc∈[0,2],nzc∈[0,10],φc∈[-π,π]. UCAV仿真開始時(shí)設(shè)置飛行動(dòng)作為水平直線飛行,仿真中UCAV占位達(dá)成條件為ηα≥0.9∩ηR≥0.9∩ηh≥0.9∩ηv≥0.8為真,仿真隨即終止。
3.1 敵機(jī)直線飛行
UCAV前半球正面迎敵,敵機(jī)直線飛行,敵機(jī)初始飛行狀態(tài)為:位置(3 000 m,3 000 m,3 000 m),速度204 m/s,航跡傾角0°,航向角-135°. UCAV初始飛行狀態(tài)為:位置(0 m,0 m,2 700 m),速度250 m/s,航跡傾角0°,航向角45°. 仿真初始態(tài)勢(shì)如圖8所示。
圖8 初始態(tài)勢(shì)圖Fig.8 Initial situation
在正面迎頭態(tài)勢(shì)下,使用最小最大機(jī)動(dòng)決策方法與本文提出的基于統(tǒng)計(jì)學(xué)原理的決策方法在相同條件下分別進(jìn)行仿真,結(jié)果如圖9和圖10所示。
圖9 最小最大決策方法結(jié)果Fig.9 Simulated result of min-max decision method
圖10 統(tǒng)計(jì)學(xué)方法決策結(jié)果Fig.10 Simulated result of statistics decision method
從兩種方法的三維仿真結(jié)果看,都是采用了“左轉(zhuǎn)—爬升—右轉(zhuǎn)—尾追”的機(jī)動(dòng)序列來(lái)完成從迎頭逐漸轉(zhuǎn)向?yàn)槲沧返目諔?zhàn)態(tài)勢(shì)變化過(guò)程。
從圖11和圖12兩種決策方法的態(tài)勢(shì)隸屬度函數(shù)變化曲線中可以看出,統(tǒng)計(jì)學(xué)決策方法可以使態(tài)勢(shì)函數(shù)整體趨于上升,在45 s處達(dá)到最優(yōu)態(tài)勢(shì)區(qū)域,完成機(jī)動(dòng)占位;而最小最大決策方法的隸屬度函數(shù)起伏比較劇烈,無(wú)法使態(tài)勢(shì)隸屬度函數(shù)同時(shí)以上升的趨勢(shì)實(shí)現(xiàn)向最優(yōu)態(tài)勢(shì)區(qū)域機(jī)動(dòng),且在仿真時(shí)間內(nèi)未能達(dá)到最優(yōu)態(tài)勢(shì)區(qū)域。
圖11 最小最大方法隸屬度函數(shù)曲線Fig.11 Membership function curves of min-max method
圖12 統(tǒng)計(jì)學(xué)決策方法隸屬度函數(shù)曲線Fig.12 Membership function curves of statistics decision method
圖13為態(tài)勢(shì)評(píng)價(jià)函數(shù)變化曲線,從中可以看出最小最大決策方法未能使空戰(zhàn)態(tài)勢(shì)在每次決策過(guò)程中保持上升的趨勢(shì),而統(tǒng)計(jì)學(xué)決策方法在每次決策過(guò)程中使態(tài)勢(shì)不斷趨于最優(yōu)。圖14給出了決策過(guò)程產(chǎn)生的機(jī)動(dòng)動(dòng)作序列示意圖。
圖13 態(tài)勢(shì)評(píng)價(jià)函數(shù)曲線Fig.13 Curves of situation evaluation function
圖14 統(tǒng)計(jì)學(xué)機(jī)動(dòng)決策序列演示Fig.14 Sequence diagram of statistics maneuver decision
3.2 敵機(jī)S型曲線飛行
敵機(jī)機(jī)動(dòng)方式設(shè)置為S機(jī)動(dòng),仿真初始條件如下:
敵機(jī)初始飛行狀態(tài)為:位置(3 000 m,3 000 m,3 000 m),速度204 m/s,航跡傾角0°,航向角45°. UCAV初始飛行狀態(tài)為:位置(0 m,0 m,2 700 m),速度250 m/s,航跡傾角0°,航向角45°. 仿真時(shí)長(zhǎng)為20 s.
圖15給出了兩種決策方法下的三維仿真結(jié)果,圖中藍(lán)色曲線表示統(tǒng)計(jì)學(xué)決策方法下UCAV選擇的機(jī)動(dòng)序列構(gòu)成的機(jī)動(dòng)軌跡,黑色點(diǎn)曲線表示最小最大決策方法下UCAV選擇的機(jī)動(dòng)序列構(gòu)成的機(jī)動(dòng)軌跡。在仿真初期,兩種方法都選擇了相同機(jī)動(dòng)序列,在中后期選擇的機(jī)動(dòng)序列逐漸不同。
圖15 兩種決策方法下的三維仿真結(jié)果Fig.15 Simulated results of two decision methods
圖16 最小最大決策方法態(tài)勢(shì)參數(shù)隸屬度函數(shù)曲線Fig.16 Membership function curves of min-max method
圖17 統(tǒng)計(jì)學(xué)決策方法態(tài)勢(shì)參數(shù)隸屬度函數(shù)曲線Fig.17 Membership function curves of statistics decision method
從圖16、圖17兩種方法下態(tài)勢(shì)參數(shù)隸屬度函數(shù)變化曲線圖可以看出,前4 s兩種方法的態(tài)勢(shì)參數(shù)隸屬度函數(shù)值基本相等,表明在仿真初期兩種方法選擇了相同的機(jī)動(dòng)動(dòng)作。第4 s后,最小最大決策方法下各個(gè)態(tài)勢(shì)參數(shù)隸屬度函數(shù)值沒(méi)有呈上升趨勢(shì)變化,距離與高度參數(shù)的隸屬度函數(shù)值始終在0.6以下變化;統(tǒng)計(jì)學(xué)決策方法在第4 s后,隨著時(shí)間的推進(jìn),各個(gè)態(tài)勢(shì)參數(shù)的隸屬度函數(shù)值呈聚攏并上升趨勢(shì)發(fā)展。在仿真截止時(shí),各個(gè)態(tài)勢(shì)參數(shù)的隸屬度函數(shù)值都大于0.8,雖然部分態(tài)勢(shì)參數(shù)隸屬度函數(shù)值沒(méi)有達(dá)到仿真設(shè)置的閾值,但是統(tǒng)計(jì)學(xué)決策方法所形成的態(tài)勢(shì)明顯要比最小最大決策方法要好。
圖18 態(tài)勢(shì)評(píng)價(jià)函數(shù)變化曲線Fig.18 Changing curves of situation evaluation function
圖18給出了兩種方法的態(tài)勢(shì)評(píng)價(jià)函數(shù)值變化曲線。從對(duì)比中可以看出兩種方法在前4 s的態(tài)勢(shì)評(píng)價(jià)值相等,之后統(tǒng)計(jì)學(xué)決策方法的決策結(jié)果使UCAV逐漸向態(tài)勢(shì)優(yōu)勢(shì)區(qū)域靠近,而最小最大決策方法決策結(jié)果的這一趨勢(shì)并不明顯。
仿真結(jié)果表明,由于敵機(jī)的機(jī)動(dòng)運(yùn)動(dòng),對(duì)最小最大決策方法決策結(jié)果影響比較大,而對(duì)本文提出的基于統(tǒng)計(jì)學(xué)原理的魯棒機(jī)動(dòng)決策方法決策結(jié)果影響較小。因此目標(biāo)在有限幅度機(jī)動(dòng)的情況下,統(tǒng)計(jì)學(xué)決策方法的決策結(jié)果要比最小最大決策方法的要好。
根據(jù)前面設(shè)置的仿真情形進(jìn)行仿真,可以得出結(jié)論:
1)敵機(jī)在非機(jī)動(dòng)運(yùn)動(dòng)條件下,本文提出的基于統(tǒng)計(jì)學(xué)原理的機(jī)動(dòng)決策方法能夠在有限時(shí)間里控制UCAV達(dá)到態(tài)勢(shì)優(yōu)勢(shì)區(qū)域,而文獻(xiàn)[9]中的最小最大決策方法的性能與本文提出的統(tǒng)計(jì)學(xué)決策方法相比較為遜色。
2)在敵機(jī)進(jìn)行機(jī)動(dòng)運(yùn)動(dòng)的條件下,敵機(jī)的機(jī)動(dòng)動(dòng)作,導(dǎo)致UCAV對(duì)其運(yùn)動(dòng)的預(yù)測(cè)與判斷出現(xiàn)誤差,在設(shè)置的仿真時(shí)間里,兩種決策方法得到的態(tài)勢(shì)評(píng)價(jià)函數(shù)值都出現(xiàn)較大波動(dòng),基于統(tǒng)計(jì)學(xué)原理的決策方法表現(xiàn)出向態(tài)勢(shì)優(yōu)勢(shì)區(qū)域靠近的趨勢(shì)。
3)從仿真結(jié)果可以看出,統(tǒng)計(jì)學(xué)決策方法向態(tài)勢(shì)優(yōu)勢(shì)靠近的趨勢(shì)比最小最大決策方法更明顯,表明本文提出的基于統(tǒng)計(jì)學(xué)原理的魯棒機(jī)動(dòng)決策方法具有一定的魯棒性能和尋優(yōu)能力。
References)
[1] Trsek R B. The last manned fighter: replacing manned fighters with unmanned combat air vehicles[M].Austin, TX, US: Bible Scholars, 2012.
[2] 周思羽, 吳文海, 張楠, 等. 自主空戰(zhàn)機(jī)動(dòng)決策方法綜述[J]. 航空計(jì)算技術(shù), 2012, 42(1): 27-31.
ZHOU Si-yu, WU Wen-hai, ZHANG Nan, et al. Overview of autonomous air combat maneuver decision[J]. Aeronautical Computing Technique, 2012, 42(1): 27-31. (in Chinese)
[3] 王曉光. 基于微分對(duì)策理論的無(wú)人飛機(jī)空戰(zhàn)建模及其仿真[D]. 沈陽(yáng):沈陽(yáng)航空航天大學(xué), 2012. WANG Xiao-guang. The air combat modeling and simulation of UCAV based on differential game[D]. Shenyang:Shenyang Aerospace University, 2012.(in Chinese)
[4] Virtanen K, Raivio T, H?m?l?inen R P. Modeling pilot’s sequential maneuvering decisions by a multistage influence diagram[J]. Journal of Guidance, Control, and Dynamics, 2004, 36(4): 665-677.
[5] 萬(wàn)偉, 姜長(zhǎng)生, 吳慶憲. 單步預(yù)測(cè)影響圖法在空戰(zhàn)機(jī)動(dòng)決策中的應(yīng)用[J]. 電光與控制, 2009, 16(7):13-16. WAN Wei, JIANG Chang-sheng, WU Qing-xian. Application of one-step prediction influence diagram in air combat maneuvering decision[J]. Electronics Optics & Control, 2009, 16(7): 13-16. (in Chinese)
[6] 張濤, 于雷, 周中良, 等. 基于變權(quán)重偽并行遺傳算法的空戰(zhàn)機(jī)動(dòng)決策[J]. 飛行力學(xué), 2012, 30(5):470-474. ZHANG Tao, YU Lei, ZHOU Zhong-liang, et al. Decision-making for air combat maneuvering based on variable weight pseudo-parallel genetic algorithm[J]. Flight Dynamics, 2012, 30(5): 470-474.(in Chinese)
[7] 耿文學(xué), 孔繁峨, 馬冬前. 基于模糊貝葉斯網(wǎng)絡(luò)的UAV中遠(yuǎn)距空戰(zhàn)戰(zhàn)術(shù)決策[J]. 火力與指揮控制, 2014, 39(3): 99-103. GENG Wen-xue, KONG Fan-e, MA Dong-qian. Tactical decision-making of UAV for long-range air combat based on fuzzy Bayesian network[J]. Fire Control & Command Control, 2014, 39(3): 99-103. (in Chinese)
[8] 屈曉波, 章衛(wèi)國(guó), 王曉光. 不確定環(huán)境下的無(wú)人機(jī)攻擊策略研究[J]. 飛行力學(xué), 2015,33(4): 381-384. QU Xiao-bo, ZHANG Wei-guo, WANG Xiao-guang. Research of UAV attack strategy under uncertain condition[J]. Flight Dynamics, 2015, 33(4): 381-384. (in Chinese)
[9] Sun T Y,Tsai S J,Lee Y N,et al. The study on intelligent advanced fighter air combat decision support system[C]∥2006 IEEE International Conference on Information Reuse and Integration. Waikoloa, Hawaii, US:IEEE, 2006:39-44.
[10] Fred A, Giro C, Michael F, et al. Automated maneuvering decisions for air-to-air combat[C]∥AIAA Guidance, Navigation and Control Conference. Monterey, CA:AIAA, 1987:659-669.
[11] 鐘友武, 柳嘉潤(rùn), 楊凌宇. 自主近距空戰(zhàn)中機(jī)動(dòng)動(dòng)作庫(kù)及其綜合控制系統(tǒng)[J]. 航空學(xué)報(bào), 2008, 29(5):114-121. ZHONG You-wu, LIU Jia-run, YANG Ling-yu. Maneuver library and integrated control system for autonomous close-in combat[J]. Acta Aeronautica et Astronautica Sinica, 2008, 29(5):114-121. (in Chinese)
[12] Kai V,Tuomas R,Raimo P H. Decision theoretical approach to pilot simulation[J]. Journal of Aircraft, 1999, 36(4):632-641.
[13] Au F T K,Cheng Y S,Tham L G,et al. Robust design of structures using convex models[J]. Computers and Structures, 2003, 81(28):2611-2619.
UCAV Robust Maneuver Decision Based on Statistics Principle
GUO Hai-feng1, HOU Man-yi1, ZHANG Qing-jie1, TANG Chuan-lin2)
(1.Aviation University of Air Force, Changchun 130022, Jilin, China;2.Unit 94782 of PLA, Hangzhou 310004, Zhejiang, China)
An UCAV (unmanned combat air vehicle) robust maneuver decision method based on statistics principle is proposed for UCAV robust autonomous combat decision. A mathematic model of UCAV is built to reduce the sensibility of the combat maneuver decision. The typical maneuver library is improved, and the robust membership functions of the air combat situation parameters are designed. The statistics method is introduced in the robust maneuver decision, and the simulations are carried out with two typical air combat cases of UCAV confront maneuver and non-maneuver objects. The simulated results indicate that the robust maneuver decision method has the robustness and optimizing capability in guiding UCAV to the advantage situation.
control science and technology; statistics; robust; maneuver; decision; air combat
2016-03-23
國(guó)家自然科學(xué)基金項(xiàng)目(61203355)
國(guó)海峰(1985—), 男, 講師。E-mail: guohaifeng_hkd@sina.com
V279
A
1000-1093(2017)01-0160-08
10.3969/j.issn.1000-1093.2017.01.021