徐東宇 王淳寶 趙 碩 葉 東
1.哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱150001 2.中國(guó)空間技術(shù)研究院,北京100094 3.航天東方紅衛(wèi)星有限公司,北京100094
隨著科技的發(fā)展,未來(lái)戰(zhàn)場(chǎng)態(tài)勢(shì)必將越來(lái)越復(fù)雜,而衛(wèi)星作為空間力量的重要組成部分,在提供戰(zhàn)場(chǎng)信息時(shí)具有傳送信息量大、不受地形限制等優(yōu)點(diǎn)[1],為了奪取空間信息主動(dòng)權(quán),對(duì)敵方衛(wèi)星實(shí)施攔截打擊有著重要意義。
針對(duì)攔截問(wèn)題,文獻(xiàn)[2]基于滑模面進(jìn)行了導(dǎo)彈的制導(dǎo)與控制一體化設(shè)計(jì),仿真表明了采用所設(shè)計(jì)的控制方法能夠滿足攔截要求。馮[3]分析了視線角和視線角速度對(duì)動(dòng)能攔截器末制導(dǎo)的影響,通過(guò)劃分參數(shù)域,給出了攔截域和突防域的分布,分析了參數(shù)對(duì)其影響。賴[4]考慮目標(biāo)進(jìn)行程序機(jī)動(dòng)時(shí)的攔截策略,基于動(dòng)態(tài)面和擴(kuò)張狀態(tài)觀測(cè)器對(duì)制導(dǎo)與控制進(jìn)行了設(shè)計(jì),仿真分析了目標(biāo)在進(jìn)行正弦機(jī)動(dòng)時(shí),采用相應(yīng)的控制策略能夠?qū)崿F(xiàn)對(duì)目標(biāo)的精確攔截。李[5]分別研究了攔截衛(wèi)星的中制導(dǎo)和末制導(dǎo)方法,基于Lambert軌道轉(zhuǎn)移設(shè)計(jì)了中制導(dǎo)策略以接近衛(wèi)星,完成交班后進(jìn)入末制導(dǎo)過(guò)程,采用滑模控制策略實(shí)現(xiàn)精確攔截。雖然上述文獻(xiàn)對(duì)目標(biāo)攔截問(wèn)題均進(jìn)行了研究,但并未考慮目標(biāo)的機(jī)動(dòng)性,且僅考慮單個(gè)攔截器。而隨著科技的發(fā)展,目標(biāo)可以進(jìn)行自主決策,采取相應(yīng)的策略以應(yīng)對(duì)不同的戰(zhàn)場(chǎng)態(tài)勢(shì),此時(shí)攔截策略的設(shè)計(jì)需要考慮目標(biāo)的最優(yōu)機(jī)動(dòng)性,傳統(tǒng)的單邊攔截策略已不再適用,此時(shí)為了實(shí)現(xiàn)可靠攔截,通常需要多顆攔截器,因此研究多攔截器的合作攔截策略有著重要的意義。
針對(duì)博弈攔截問(wèn)題,學(xué)者們已經(jīng)進(jìn)行了充分的研究。文獻(xiàn)[6]中作者以小車模擬導(dǎo)彈攔截態(tài)勢(shì),基于深度確定性策略梯度算法設(shè)計(jì)了追逃策略,該方法能夠?qū)崿F(xiàn)對(duì)目標(biāo)的有效攔截,具有較強(qiáng)的自適應(yīng)性。Horie[7]等基于飛機(jī)三維動(dòng)力學(xué)模型,通過(guò)微分對(duì)策理論將優(yōu)化攔截問(wèn)題轉(zhuǎn)化為兩點(diǎn)邊值問(wèn)題,通過(guò)仿真得出,最優(yōu)飛行軌跡分為偏離垂直平面以及垂直面內(nèi)運(yùn)動(dòng)2個(gè)階段。當(dāng)攔截器距離目標(biāo)較近時(shí),攔截過(guò)程進(jìn)入末端攔截,針對(duì)航天器末端攔截問(wèn)題,Prussing[8-9]等應(yīng)用主矢量理論分別研究了多脈沖逃逸策略以及攔截策略。文獻(xiàn)[10]考慮航天器攔截目標(biāo)后返回原軌道的情況,通過(guò)在目標(biāo)函數(shù)中引入一個(gè)參數(shù)k對(duì)路徑進(jìn)行約束。Gutman S[11]在雙積分動(dòng)力學(xué)模型的基礎(chǔ)上,以終端相對(duì)距離為指標(biāo)建立了攔截器與目標(biāo)的控制策略,分別給出了在極坐標(biāo)、球坐標(biāo)下的策略形式。文獻(xiàn)[12-13]在給出攔截器與目標(biāo)控制策略的基礎(chǔ)上,建立了關(guān)于攔截剩余時(shí)間的一元四次方程,以求解終端攔截時(shí)間,并討論了方程的分叉現(xiàn)象。文獻(xiàn)[14]考慮攔截過(guò)程中視線角測(cè)量存在噪聲的情況,通過(guò)狀態(tài)觀測(cè)器對(duì)其進(jìn)行估計(jì),再將其應(yīng)用于控制策略。對(duì)于多星合作博弈問(wèn)題,LIU[15]考慮2枚導(dǎo)彈攔截同一目標(biāo),在簡(jiǎn)化的導(dǎo)彈動(dòng)力學(xué)模型基礎(chǔ)上,通過(guò)Nash均衡集設(shè)計(jì)最優(yōu)加速度方向,即最優(yōu)制導(dǎo)率。文獻(xiàn)[16-17]中均以平面雙積分系統(tǒng)為模型,通過(guò)可達(dá)集設(shè)計(jì)合作攔截時(shí)的最優(yōu)策略。文獻(xiàn)[18]中假設(shè)攔截器與目標(biāo)速度不變,基于阿波羅尼圓設(shè)計(jì)初始速度方向角以實(shí)現(xiàn)最優(yōu)攔截。
對(duì)于航天器末端攔截問(wèn)題,雖然已經(jīng)存在較多的研究,但大多局限于雙星博弈或簡(jiǎn)化模型的多星博弈,與實(shí)際情況相差較大。針對(duì)多星博弈攔截問(wèn)題進(jìn)行研究,分別推導(dǎo)了各攔截器非合作的Nash反饋策略,以及合作的Pareto反饋策略。
文章安排如下:1)建立末端攔截動(dòng)力學(xué)模型;2)以終端零控脫靶量為指標(biāo)推導(dǎo)了各攔截器非合作態(tài)勢(shì)的Nash均衡解;3)推導(dǎo)了各攔截器以合作方式態(tài)勢(shì)進(jìn)行攔截的Pareto均衡解;4)將博弈策略應(yīng)用于多星博弈攔截,并進(jìn)行了仿真分析。
末端攔截過(guò)程中,攔截器與目標(biāo)距離較近,因此在攔截器附近建立參考衛(wèi)星,如圖1,其中O為地心;O1為參考衛(wèi)星;P為攔截器。設(shè)參考衛(wèi)星運(yùn)行在圓軌道,則在軌道坐標(biāo)系下,攔截器相對(duì)參考衛(wèi)星的動(dòng)力學(xué)方程可簡(jiǎn)化為CW方程
(1)
式中:x,y和z為攔截器相對(duì)參考衛(wèi)星的位置;ω為參考衛(wèi)星的軌道角速度;ux,uy,uz分別為攔截器的控制輸入。
圖1 攔截器與參考衛(wèi)星
(2)
由線性系統(tǒng)理論可得狀態(tài)轉(zhuǎn)移矩陣為
(3)
其中,子矩陣分別為[19]
設(shè)末端攔截段存在N個(gè)攔截器P1,…,PN與目標(biāo),其動(dòng)力學(xué)均滿足CW方程,即
(4)
分別定義攔截器P1,…,PN與目標(biāo)的相對(duì)狀態(tài)
XPiE=XPi-XEi=1,…,N
對(duì)其求導(dǎo)并將式(4)代入,可得相對(duì)狀態(tài)方程
(5)
在多星攔截過(guò)程中,攔截器與目標(biāo)圍繞攔截終端距離展開(kāi)爭(zhēng)奪,因此僅需考慮星間的位置矢量[20]。分別定義攔截器P1, …, 攔截器PN與目標(biāo)的零控脫靶量,對(duì)系統(tǒng)進(jìn)行降維
ZPiE(t)=DΦ(tfi,t)XPiE其中,i=1,…,N
(6)
對(duì)式(6)求導(dǎo),并結(jié)合可得
(7)
式中:BPi=DΦ(tfi,t)B=Φ12(tfi,t);CEi=-DΦ(tfi,t)C=-Φ12(tfi,t)。
對(duì)于多星博弈問(wèn)題,根據(jù)各航天器是否合作攔截,將其分為Nash均衡策略和Pareto均衡策略。
(8)
對(duì)于航天器攔截問(wèn)題,要求在有限時(shí)間內(nèi)使目標(biāo)進(jìn)入某一攔截器的攔截范圍,因此各攔截器的指標(biāo)函數(shù)定義為其與目標(biāo)的終端零控脫靶量范數(shù)。
根據(jù)Nash均衡定義,分別定義攔截器Pi(i=1,…,N)和目標(biāo)的指標(biāo)函數(shù)如下
(9)
(10)
(11)
(12)
(13)
其中:ki(i=1,…,N)代表了目標(biāo)對(duì)各攔截器的博弈程度:
若ki>kj(j={1,…,N}i), 則目標(biāo)主要與攔截器Pi進(jìn)行博弈,即主要躲避Pi;
若ki 若ki=kj(j={1,…,N}i), 則目標(biāo)進(jìn)行無(wú)差博弈,即同等程度躲避攔截器Pi和Pj。 通過(guò)Nash反饋策略,各航天器雖然可以達(dá)到均衡態(tài),但由于并非合作關(guān)系,攔截系統(tǒng)可能并未達(dá)到最優(yōu)狀態(tài),因此對(duì)于多星博弈問(wèn)題,設(shè)各攔截器采取合作策略,使系統(tǒng)達(dá)到Pareto均衡。 (14) 對(duì)于Pareto均衡,攔截器的優(yōu)化指標(biāo)為式(9)的凸組合,即 (15) (16) 其中,ki(i=1,…,N)定義與第2節(jié)相同 (17) (18) 類似地,目標(biāo)的控制策略UE仍為 (19) 通過(guò)比較Nash反饋策略式(12-13)和Pareto反饋策略式(18-19)可知,攔截器無(wú)論采取合作或非合作攔截方式,其博弈策略均相同,即各攔截器采取非合作方式,即可達(dá)到合作攔截的目的。 由于合作與非合作策略相同,因此只對(duì)合作態(tài)勢(shì)下的多星博弈攔截問(wèn)題進(jìn)行仿真。 考慮2顆攔截器進(jìn)行仿真,初始條件如下:假設(shè)攔截器P1和P2及目標(biāo)均在地球同步軌道附近運(yùn)動(dòng),則將參考衛(wèi)星選為GEO軌道上與其相近的衛(wèi)星,軌道角速度為ω=7.2722×10-5rad/s。攔截器P1初始位置為[-2;0;1]km,初始速度為[0;-0.005;0.005]km/s;攔截器P2的初始位置為[1;1;0]km,初始速度為[0.01;0;0.005]km/s;目標(biāo)的初始位置為[0;0;0]km,初始速度為[0;0.005;0]km/s。設(shè)攔截器P1的推力幅值為ρP1=0.686m/s2,攔截器P2的推力幅值為ρP2=3/2ρP1m/s2,目標(biāo)的推力幅值為ρE=1/2ρP1m/s2。此外,設(shè)攔截器的攔截半徑l=0.01km。 1) 合作博弈態(tài)勢(shì)。設(shè)終端攔截時(shí)間tf=100s,且目標(biāo)的綜合權(quán)重為k1=0.5,k2=0.5。 圖 2給出了各航天器的運(yùn)動(dòng)軌跡,圖3繪制了博弈過(guò)程中各攔截器與目標(biāo)之間相對(duì)距離的變化情況。可以看出,在100s時(shí),攔截器P1和P2與目標(biāo)的相對(duì)距離均達(dá)到了0,滿足攔截要求,即實(shí)現(xiàn)了對(duì)目標(biāo)的攔截。 圖2 多星博弈的三維運(yùn)動(dòng)軌跡 圖3 多星博弈的相對(duì)距離變化 2)目標(biāo)綜合權(quán)重對(duì)攔截的影響。設(shè)終端攔截時(shí)間tf=100s,目標(biāo)綜合權(quán)重為k1=0.8,k2=0.2,此時(shí)目標(biāo)主要躲避攔截器P1。 圖4和5分別給出了三星的運(yùn)動(dòng)軌跡,以及相對(duì)距離的變化情況??梢钥闯?,由于目標(biāo)主要對(duì)推力幅值較大的攔截器P1進(jìn)行躲避,導(dǎo)致在100s的終端時(shí)間條件下,攔截任務(wù)失敗,此時(shí)只能通過(guò)延長(zhǎng)攔截時(shí)間實(shí)現(xiàn)對(duì)目標(biāo)的攔截。 圖4 多星博弈的三維運(yùn)動(dòng)軌跡 圖5 多星博弈的相對(duì)距離變化 針對(duì)多星博弈末端攔截問(wèn)題,分別考慮了多攔截器非合作與合作態(tài)勢(shì)下的攔截策略,基于Nash均衡建立了非合作博弈策略,基于Pareto均衡建立了合作博弈策略。通過(guò)比較,2種態(tài)勢(shì)下各攔截器策略相同。最后,仿真驗(yàn)證了采用提出的博弈策略,攔截器可以實(shí)現(xiàn)對(duì)目標(biāo)的攔截,且不同的綜合權(quán)重將導(dǎo)致不同的攔截結(jié)果。3Pareto博弈策略設(shè)計(jì)
4 仿真結(jié)果及分析
5 結(jié)論