許佳駱, 胥 彪, 馮建鑫, 張金鵬
(1. 南京航空航天大學(xué),南京 210016; 2. 中國空空導(dǎo)彈研究院,洛陽 471009; 3.航空制導(dǎo)武器航空科技重點實驗室,洛陽 471009)
由于軍事技術(shù)進步,現(xiàn)代強機動性能飛行器對于制導(dǎo)性能的指標(biāo)要求較高。傳統(tǒng)的比例制導(dǎo)律、最優(yōu)制導(dǎo)律在應(yīng)對高機動目標(biāo)時,需要準(zhǔn)確的目標(biāo)加速度信息,而不準(zhǔn)確的目標(biāo)加速度信息會對制導(dǎo)效果產(chǎn)生極大影響。微分對策制導(dǎo)律對于精確目標(biāo)加速度信息的依賴程度較小,制導(dǎo)過程中只需要目標(biāo)的機動能力信息,而不需要精確的目標(biāo)加速度信息。
微分對策問題(diferntial games, DG)最早由Isaacs提出。 Gutman利用簡化的模型設(shè)計出一種微分對策制導(dǎo)律。Shinar假設(shè)攻防雙方均具有1階動態(tài)響應(yīng),提出了一種基于零化脫靶量方法的微分對策制導(dǎo)律DGL/1。該微分對策制導(dǎo)律利用狀態(tài)轉(zhuǎn)移矩陣對微分對策問題進行降階,并采用哈密頓方法進行極大極小值求解,得到的制導(dǎo)律幅值為導(dǎo)彈的最大加速度,而加速度方向由脫靶量符號決定,其中計算脫靶量符號時需要用到目標(biāo)的加速度信息。Shinar等假設(shè)對目標(biāo)加速度觀測存在延遲,利用延遲的目標(biāo)加速度信息,結(jié)合已知的目標(biāo)最大機動能力以及目標(biāo)動態(tài)響應(yīng)延遲估計出實時的目標(biāo)加速度,利用估計的加速度代替實時目標(biāo)加速度進行脫靶量計算,設(shè)計延遲目標(biāo)加速度信息條件下的微分對策制導(dǎo)律DGL/C。隨后,Shinar等針對時間延遲對于制導(dǎo)律設(shè)計的影響進行詳細(xì)論述。Glizer等針對目標(biāo)的速度、加速度存在觀測延遲的情況,設(shè)計出考慮雙信息延遲的微分對策制導(dǎo)律DGL/CC。Glizer等又給出了一種考慮多信息延遲的微分對策制導(dǎo)律。Oshman 等針對DGL/C制導(dǎo)律,利用無延遲的目標(biāo)加速度方向觀測對延遲目標(biāo)加速度信息進行補償,設(shè)計出利用目標(biāo)加速度方向觀測改進的制導(dǎo)律DGL/S。相較于DGL/C制導(dǎo)律,該制導(dǎo)律對于目標(biāo)加速度的預(yù)測值更加準(zhǔn)確,進一步降低了脫靶量,提升制導(dǎo)效果。以上制導(dǎo)律都基于DGL/1制導(dǎo)律的框架,針對不同的延遲信息條件進行研究,利用目標(biāo)機動能力值與動態(tài)響應(yīng)方程對目標(biāo)加速度可達(dá)域進行預(yù)測,同時利用低延遲的加速度相關(guān)的信息進行補償,隨后利用這些預(yù)測得到目標(biāo)加速度進行脫靶量的計算,提升延遲信息條件下的制導(dǎo)效果。
上述制導(dǎo)律得益于零化脫靶量模型的特點,在進行極大極小值求解時可以將問題轉(zhuǎn)化為求解脫靶量的符號。但是這類制導(dǎo)律是一種bang-bang類型的控制,同時在面對新的制導(dǎo)要求如攻擊角時,求解困難較大,而狀態(tài)依賴?yán)杩ㄌ岱匠谭椒?state-dependent Riccati equation, SDRE)可以極大地降低微分對策問題的求解難度。
Bardhan利用零化視線角速率的方式進行制導(dǎo)律設(shè)計,并采用SDRE的方法對極大極小值問題進行求解。同時基于無窮穩(wěn)定理論將黎卡提方程的微分項舍去,將問題轉(zhuǎn)化為每一決策階段的SDRE求解,設(shè)計出利用SDRE方法求解微分對策問題的SDRE-DG制導(dǎo)律。該制導(dǎo)律不需要剩余時間的估計,而之前的微分對策制導(dǎo)律都需要利用剩余時間來對脫靶量進行估計。Bardhan等又將狀態(tài)空間擴展為視線角速率與攻擊角,由于采用了SDRE方法,問題的求解難度降低。這些制導(dǎo)律利用SDRE方法進行求解,將問題轉(zhuǎn)化為狀態(tài)依賴參數(shù)(state-dependent coefficient, SDC)和代數(shù)黎卡提方程的求解。這類制導(dǎo)律可以對支付函數(shù)進行設(shè)計以滿足不同的性能指標(biāo),同時舍去黎卡提方程的微分項以避免剩余時間估計,利用實時計算的SDC將問題轉(zhuǎn)化為代數(shù)黎卡提方程的求解。 Cloutier等對于SDRE方法進行了總體論述。?imen對于SDRE方法進行了詳細(xì)的論述分析,并著重對穩(wěn)定性、求解方法、結(jié)構(gòu)進行介紹與分析。孫平等集中解釋了SDRE問題集中于狀態(tài)相關(guān)參數(shù)的構(gòu)造、權(quán)重矩陣的選擇以及代數(shù)黎卡提的求解。Menon等介紹了SDC的構(gòu)造原則,同時介紹了Schur法和Kleinman法兩種方法來解決代數(shù)黎卡提的實時求解問題。
上述文獻都未對目標(biāo)存在非博弈機動的情況進行考慮。而Farhan在微分對策問題的設(shè)計過程中,將導(dǎo)彈與目標(biāo)的機動分為追逃機動和干擾機動,給出了一種考慮目標(biāo)進行干擾機動的微分對策制導(dǎo)律。
本文利用SDRE的方法研究了導(dǎo)彈微分博弈制導(dǎo)問題,引入了目標(biāo)加速度方向觀測,提高了制導(dǎo)精度。在實際應(yīng)用中,實時且精確的目標(biāo)加速度往往難以獲得,假設(shè)導(dǎo)彈只能獲得具有一定時間延遲的目標(biāo)加速度,結(jié)合Oshman等的方法進行目標(biāo)加速度方向觀測,即對目標(biāo)加速度的極性進行觀測,可以得到補償后的目標(biāo)加速度值的符號。將補償后預(yù)測得到的目標(biāo)加速度取代上述微分對策制導(dǎo)律所需要的實時目標(biāo)加速度,最終設(shè)計出考慮目標(biāo)加速度方向觀測的微分對策制導(dǎo)律,該制導(dǎo)律可以更好地實現(xiàn)延遲信息條件下的機動目標(biāo)攔截。
考慮彈-目追逃問題,動力學(xué)模型如下
(1)
同樣,目標(biāo)的動力學(xué)模型為
(2)
式中,x
,z
和x
,z
分別為導(dǎo)彈與目標(biāo)在慣性系的x
,z
軸上的坐標(biāo);V
和V
分別為導(dǎo)彈與目標(biāo)的速度;φ
和φ
為導(dǎo)彈與目標(biāo)的飛行路徑角;a
和a
為導(dǎo)彈與目標(biāo)垂直于速度的加速度;τ
和τ
為導(dǎo)彈與目標(biāo)的1階動態(tài)響應(yīng)時間;u
2和u
2為導(dǎo)彈與目標(biāo)垂直于速度的加速度指令。結(jié)合圖1,獲得導(dǎo)彈與目標(biāo)的相對運動方程
(3)
(4)
本文基于零化視線角速率的方法進行制導(dǎo)律設(shè)計,對公式(4)進行求導(dǎo)得到
(5)
式中,u
和u
分別為導(dǎo)彈與目標(biāo)垂直于視線方向的加速度指令。圖1 導(dǎo)彈和目標(biāo)碰撞幾何圖形Fig.1 Missile-target engagement configuration
(6)
式中,γ
為目標(biāo)相對于導(dǎo)彈可以獲得的機動大小,其值越大在支付函數(shù)中對于目標(biāo)的機動懲罰越大,代表目標(biāo)相對于導(dǎo)彈所能獲得的機動越小,其取值取決于目標(biāo)相對于導(dǎo)彈的機動能力強弱;q
(x
)為關(guān)于視線角速率的權(quán)重系數(shù);r
(x
)和r
(x
)為導(dǎo)彈與目標(biāo)機動指令的權(quán)重系數(shù)。(7)
針對式(6)所示的微分對策問題,傳統(tǒng)方法需要求解哈密頓-雅可比-貝爾曼-伊薩克斯偏微分方程,但是該偏微分方程往往難以求解,可以使用狀態(tài)依賴?yán)杩ㄌ岱匠虒ζ溥M行求解。求解過程主要分為:狀態(tài)依賴參數(shù)SDC與狀態(tài)依賴?yán)杩ㄌ岱匠蘏DRE求解。
針對式(6)所述的微分對策問題,需要對式(8)進行線性化,已知
(8)
如果f
(0)=0,那么就可以將f
(x
)轉(zhuǎn)化為a
(x
)x
,獲得(9)
式中,a
(x
),b
(x
),c
(x
)為需要實時計算的SDC(10)
(11)
(12)
針對式(6)的微分對策問題,利用哈密頓方法進行求解,獲得哈密頓方程
λ
(a
(x
)x
+b
(x
)u
+c
(x
)u
)(13)
式中,λ
為協(xié)變量。方程要獲得最小值時需要滿足(14)
由式(12)得到鞍點解
(15)
假設(shè)λ
=p
(x
)x
,p
(x
)為協(xié)變量λ
與x
相關(guān)的系數(shù),對λ
求導(dǎo)并結(jié)合公式(12)和(13)(16)
(17)
x
為1階,并假設(shè)r
(x
)=1和r
(x
)=1,那么式(15)所示的狀態(tài)依賴?yán)杩ㄌ岱匠剔D(zhuǎn)為一元二次方程(b
(x
)-γ
c
(x
))p
(x
)-2a
(x
)p
(x
)-q
(x
)=0(18)
可以直接進行一元二次方程求解
p
(x
)=(19)
獲得SDRE-DG微分對策制導(dǎo)律
u
=(20)
該制導(dǎo)律不需要進行剩余時間估計。
不同于SDRE-DG制導(dǎo)律,該微分對策制導(dǎo)律在微分對策問題設(shè)計過程中考慮了目標(biāo)存在非博弈機動,將導(dǎo)彈與目標(biāo)的控制量分為兩部分
u
=u
+u
(21)
u
=u
+u
(22)
式中,u
為導(dǎo)彈的追捕機動,u
為目標(biāo)的逃逸機動,而u
與u
為導(dǎo)彈與目標(biāo)進行的非博弈機動,選擇支付函數(shù)J
=(23)
式中,q
(x
)為關(guān)于視線角速率的權(quán)重系數(shù),r
(x
)為關(guān)于導(dǎo)彈追捕機動指令的權(quán)重系數(shù),r
(x
)為關(guān)于目標(biāo)逃逸機動指令的權(quán)重系數(shù),而導(dǎo)彈與目標(biāo)的非博弈機動由于其隨機性,在支付函數(shù)中并進行考慮。結(jié)合式(5),(19),(20)獲得了考慮目標(biāo)非博弈機動的微分對策問題(24)
獲得哈密頓函數(shù)
(25)
式中,λ
為協(xié)變量。方程要取得最小值需要滿足式(26)(26)
不同于SDRE-DG制導(dǎo)律,由于引入了非博弈機動,需要假設(shè)λ
=p
(x
)x
+ξ
,其中p
(x
)為協(xié)變量λ
與x
相關(guān)的系數(shù),ξ
為一個與狀態(tài)空間同階的向量得到了鞍點解(27)
對協(xié)變量λ
進行求導(dǎo)得(28)
同時由式(26)獲得
(29)
結(jié)合式(28)和(29),獲得兩個黎卡提方程
(30)
(31)
假設(shè)r
=1和r
=1,并求解得(32)
(33)
假設(shè)目標(biāo)進行的機動全部是非博弈機動,即u
=u
=a
,獲得考慮非博弈機動的微分對策制導(dǎo)律對脆弱性指數(shù)用歐式距離聚類聚成3類,如果這個國家所得的V大于0.9,則這個國家的狀態(tài)為非常脆弱;如果這個國家所得V在之間,則這個國家的狀態(tài)為脆弱;如果這個國家所得V值小于0.6,則這個國家的狀態(tài)為穩(wěn)定。
u
=-b
(px
+ξ
)(34)
將式(10)~(12)以及式(32)代入得
(35)
該制導(dǎo)律包含了對目標(biāo)加速度進行補償?shù)臄U展項,相較于SDRE-DG制導(dǎo)律可以更為有效地應(yīng)對機動目標(biāo)。
a
(t
-Δt
)。同時導(dǎo)彈可以獲得實時的目標(biāo)加速度方向信息sgn(a
(t
))。結(jié)合Oshman等提出的方法,利用目標(biāo)加速度方向信息sgn(a
(t
))補償延遲目標(biāo)加速度信息a
(t
-Δt
)。(36)
(37)
如果沒有其他信息進行進一步補償,則可以利用預(yù)測的目標(biāo)加速度可達(dá)域的中心代替目標(biāo)加速度信息。而利用目標(biāo)加速度方向的方法則是基于實時的目標(biāo)加速度方向這個可以得到的低延遲信息,進一步將目標(biāo)加速度信息可達(dá)域縮小,目標(biāo)加速度可達(dá)域的上界或者下界變?yōu)?,并利用縮小后的目標(biāo)加速度可達(dá)域中心值當(dāng)作目標(biāo)加速度值。相較于未進行補償?shù)难舆t目標(biāo)加速度估計,得到的目標(biāo)加速度值更加接近實際值。
當(dāng)sgn(a
(t
)min)=sgn(a
(t
)max)時a
(t
)=a
(t
-Δt
)e
-Δ/(38)
當(dāng)sgn(a
(t
)min)≠sgn(a
(t
)max)時a
(t
)=(39)
式中,sgn(·)為符號函數(shù)。
隨后利用補償后獲得的目標(biāo)加速度可達(dá)域中心值a
(t
)代替式(34)中的a
,可以得到考慮目標(biāo)加速度方向觀測的微分對策制導(dǎo)律(40)
相較于第3節(jié)中考慮非博弈機動的制導(dǎo)律,新的考慮加速度方向觀測的制導(dǎo)律不需要實時的目標(biāo)加速度信息,可以更為有效地應(yīng)對延遲目標(biāo)加速度信息條件下的機動目標(biāo)攔截問題。
下面將在目標(biāo)進行常值機動和目標(biāo)進行蛇形機動的情況下,分別對制導(dǎo)律的制導(dǎo)效果進行仿真研究。為了方便表達(dá),將第4節(jié)中考慮目標(biāo)加速度方向觀測的制導(dǎo)律命名為SDRE-ODG,并與SDRE-DG制導(dǎo)律進行仿真對比研究
仿真過程中,利用式(1)~(2)建立導(dǎo)彈與目標(biāo)的運動學(xué)空間。利用式(8)~(10)在每一個決策階段計算得到狀態(tài)依賴參數(shù)a
(x
),b
(x
),c
(x
),并利用狀態(tài)依賴參數(shù)并結(jié)合式(18)和(39)計算得到SDRE-DG制導(dǎo)律與SDRE-ODG制導(dǎo)律的制導(dǎo)量。將制導(dǎo)量代入到運動學(xué)中,實現(xiàn)導(dǎo)彈的攔截運動仿真。通過兩種制導(dǎo)律進行對比,以便于進一步論證新制導(dǎo)律的制導(dǎo)效果。表1 目標(biāo)進行常值機動時初始參數(shù)
由視線角速率對比圖2可以看出,在目標(biāo)進行常值機動的情況下,SDRE-ODG制導(dǎo)律相較于SDRE-DG制導(dǎo)律視線角速率收斂效果更好。SDRE-ODG制導(dǎo)律由于包含了對目標(biāo)加速度的補償項,在初期可以更為有效地利用導(dǎo)彈的機動能力。由加速度指令對比圖3可以看出,早期SDRE-ODG制導(dǎo)律的控制量大于SDRE-DG制導(dǎo)律,在后期則較小。相應(yīng)的SDRE-ODG制導(dǎo)律在末制導(dǎo)前期收斂快于SDRE-DG制導(dǎo)律,而在后期則收斂速度較慢并趨于0。而從軌跡對比圖4可以看出,SDRE-ODG制導(dǎo)律制導(dǎo)下,導(dǎo)彈的軌跡更為平直,結(jié)合式(18)和(33)可以看出,這主要是由于SDRE-ODG制導(dǎo)律相較于SDRE-DG制導(dǎo)律多出了補償目標(biāo)機動的擴展項。在上述仿真條件下,前期SDRE-ODG制導(dǎo)律的值大于SDRE-DG,而后期則相反。這樣SDRE-ODG制導(dǎo)律軌跡在前期轉(zhuǎn)向較快,總體上軌跡較為平直。
圖2 目標(biāo)進行常值機動時視線角速率Fig.2 Line of sight rate when target conducts constant maneuvers
圖3 目標(biāo)進行常值機動時導(dǎo)彈加速度指令Fig.3 Missile’s acceleration command when target conducts constant maneuvers
圖4 目標(biāo)進行常值機動時軌跡Fig.4 Trajectory when target conducts constant maneuvers
從脫靶量對比表2來看,SDRE-ODG制導(dǎo)律的脫靶量值為0.23 m,而SDRE-DG制導(dǎo)律的脫靶量值為1.36 m,主要是由于SDRE-DG制導(dǎo)律在視線角速率的收斂上,對于目標(biāo)機動的補償效果弱于SDRE-ODG制導(dǎo)律。可以看出,SDRE-ODG制導(dǎo)律在延遲信息條件下,應(yīng)對進行常值機動的目標(biāo)時的攔截效果較好。
表2 目標(biāo)進行常值機動時脫靶量對比
表3 目標(biāo)進行階躍機動時初始參數(shù)
由視線角速率對比圖5可以看出,在制導(dǎo)初期的兩個制導(dǎo)律的視線角速率收斂相同,這主要是由于在攔截初期的目標(biāo)加速度為0,導(dǎo)致SDRE-ODG制導(dǎo)律相較于SDRE-DG制導(dǎo)律在補償目標(biāo)機動的方面沒有區(qū)別,使得兩個制導(dǎo)律的收斂效果相同。而在4 s左右目標(biāo)開始機動,使得兩者在收斂性方面開始出現(xiàn)差異。同5.1節(jié)仿真一樣,SDRE-ODG制導(dǎo)律在對于目標(biāo)的機動具有補償作用,其在目標(biāo)機動時可以更好地實現(xiàn)視線角速率的收斂,最終導(dǎo)致在4 s后兩者在視線角速率的收斂性的差異。而從機動指令對比圖6可以看出,在4 s左右時SDRE-ODG制導(dǎo)律的機動指令大于SDRE-DG制導(dǎo)律,而后則小于SDRE-DG制導(dǎo)律,這進一步說明SDRE-ODG制導(dǎo)律對于目標(biāo)機動的補償效果,可以更為有效地利用導(dǎo)彈機動能力。而從導(dǎo)彈的軌跡圖7可以看出,制導(dǎo)初期兩種制導(dǎo)律的軌跡完全一樣,而后期的RE-ODG制導(dǎo)律的軌跡更加平直,進一步證明SDRE-ODG制導(dǎo)律在攔截機動目標(biāo)方面效果更好。
從脫靶量對比表4來看,SDRE-ODG制導(dǎo)律的脫靶量值為0.48 m,而SDRE-DG制導(dǎo)律的脫靶量為1.46 m,主要是由于SDRE-DG制導(dǎo)律在視線角速率的收斂上,對于目標(biāo)機動的補償效果弱于SDRE-ODG制導(dǎo)律??梢钥闯?,SDRE-ODG制導(dǎo)律在延遲信息條件下,應(yīng)對進行階躍機動目標(biāo)時的攔截效果較好。
圖5 目標(biāo)進行階躍機動時視線角速率Fig.5 Line of sight rate when target conducts step maneuvers
圖6 目標(biāo)進行階躍機動時導(dǎo)彈加速度指令Fig.6 Missile’s acceleration command when target conducts step maneuvers
圖7 目標(biāo)進行階躍機動時軌跡Fig.7 Trajectory when target conducts step maneuvers
表4 目標(biāo)進行階躍機動時脫靶量對比
表5 目標(biāo)進行蛇形機動時初始參數(shù)
由視線角速率對比圖8可以看出,在應(yīng)對進行蛇形機動的目標(biāo)時,SDRE-ODG制導(dǎo)律相較于SDRE-DG制導(dǎo)律可以對目標(biāo)機動作出補償,其在視線角速率收斂方面較好,可以實現(xiàn)最后收斂至0值附近,而SDRE-DG制導(dǎo)律在目標(biāo)變機動值后視線角速率離開0值附近。而從機動指令對比圖9可以看出, SDRE-ODG制導(dǎo)律的控制量在SDRE-DG制導(dǎo)律的周圍波動。其中第一次變動是SDRE-ODG制導(dǎo)律在目標(biāo)機動的每個階段可以有效利用導(dǎo)彈機動,視線角速率收斂較快,此后不再需要高機動值,導(dǎo)致SDRE-ODG制導(dǎo)律的機動值比SDRE-DG制導(dǎo)律小。隨后由于目標(biāo)變機動,SDRE-ODG制導(dǎo)律的機動值發(fā)生較大變化,從視線角速率變化可以看出,SDRE-DG制導(dǎo)律對于目標(biāo)變機動反應(yīng)較小。而SDRE-ODG對于目標(biāo)變機動反應(yīng)較大,其在3.7 s時視線角速率變化沒有SDRE-DG大,并很快再次趨向收斂。從攔截軌跡對比圖10可以看出,SDRE-ODG制導(dǎo)律的軌跡更加平直。
從脫靶量對比表6看出,SDRE-ODG制導(dǎo)律的脫靶量為0.65 m,而SDRE-DG制導(dǎo)律的脫靶量為1.47 m,這和視線角速率收斂性的結(jié)果相符。SDRE-DG制導(dǎo)律由于在目標(biāo)變機動后視線角速率發(fā)生突變,在末期未完全收斂至0,而SDRE-ODG制導(dǎo)律的收斂效果較好,最終SDRE-ODG在脫靶量上較小,攔截效果較好。
圖8 目標(biāo)進行蛇形機動時視線角速率Fig.8 Line of sight rate when target conducts serpentine maneuvers
圖9 目標(biāo)進行蛇形機動時導(dǎo)彈加速度指令Fig.9 Missile’s acceleration command when target conducts serpentine maneuvers
圖10 目標(biāo)進行蛇形機動時軌跡Fig.10 Trajectory when target conducts serpentine maneuvers
表6 目標(biāo)進行蛇形機動時脫靶量對比
綜上所述,SDRE-ODG制導(dǎo)律包含了對目標(biāo)機動的補償項,制導(dǎo)律可以更為有效地利用導(dǎo)彈的機動能力,在延遲條件下有效地實現(xiàn)視線角速率收斂,可以更為有效地實現(xiàn)對機動目標(biāo)的攔截。
本文研究了導(dǎo)彈微分博弈制導(dǎo)問題,在設(shè)計微分對策問題的過程中,引入目標(biāo)的非博弈機動并進行微分對策問題求解。隨后在延遲信息條件下,利用目標(biāo)加速度方向觀測的方法,對延遲的目標(biāo)加速度進行補償,得到預(yù)測的目標(biāo)加速度并代入到制導(dǎo)律中,最終得到考慮目標(biāo)加速度方向觀測的微分對策制導(dǎo)律。
本文提出的考慮目標(biāo)加速度方向觀測的制導(dǎo)律在延遲信息條件下,相較于傳統(tǒng)微分博弈導(dǎo)律可以更為有效地實現(xiàn)對機動目標(biāo)的攔截。從仿真結(jié)果表明,本文提出的制導(dǎo)方法使得視線角速率可以更快地收斂,同時對于機動目標(biāo)可以更為有效地進行攔截,降低脫靶量,提高了制導(dǎo)精度。