王淳寶,葉 東,孫兆偉,孫楚琦
(哈爾濱工業(yè)大學(xué)航天學(xué)院,哈爾濱 150001)
衛(wèi)星作為空間力量重要組成部分,具有傳送信息量大、不受地形限制等優(yōu)點(diǎn),可以為指揮者制定策略提供戰(zhàn)場信息,也可為導(dǎo)彈等作戰(zhàn)單元提供導(dǎo)航制導(dǎo)信息[1]。因此為了奪取戰(zhàn)時空間信息主動權(quán),對敵方衛(wèi)星實施攔截打擊有著重要意義。
針對攔截問題,文獻(xiàn)[2-3]基于滑模面進(jìn)行了導(dǎo)彈的制導(dǎo)與控制一體化設(shè)計,仿真表明了采用所設(shè)計的控制方法能夠滿足攔截要求。賴超等[4]考慮目標(biāo)進(jìn)行機(jī)動時的攔截策略,基于動態(tài)面和擴(kuò)張狀態(tài)觀測器對制導(dǎo)與控制進(jìn)行了設(shè)計,仿真分析了目標(biāo)在進(jìn)行正弦機(jī)動時,采用相應(yīng)的控制策略能夠?qū)崿F(xiàn)對目標(biāo)的精確攔截。雖然上述文獻(xiàn)對目標(biāo)攔截問題均進(jìn)行了研究,但其中的目標(biāo)并未進(jìn)行機(jī)動或未采取最優(yōu)的機(jī)動策略。而隨著科技的發(fā)展,目標(biāo)獲取空間戰(zhàn)場信息能力的提高,可以對戰(zhàn)場情報進(jìn)行分析,并做出相應(yīng)的決策,采取最優(yōu)躲避策略以應(yīng)對不同的戰(zhàn)場態(tài)勢,此時攔截策略的設(shè)計需要考慮目標(biāo)機(jī)動的最優(yōu)性,傳統(tǒng)的攔截方法已不能滿足攔截要求,單邊攔截策略已不再適用。此外,隨著衛(wèi)星任務(wù)的復(fù)雜化及多樣化,目標(biāo)的被動逃逸可能會影響其任務(wù)的實施,此時為了避免具有重要價值的衛(wèi)星被攔截,附近通常會存在伴飛星進(jìn)行主動防御,這種態(tài)勢無疑增加了攔截難度,對空間攔截提出了更高的要求,因此研究存在防御器的多邊攔截策略有著重要的意義。
針對多邊攔截問題,學(xué)者們已經(jīng)進(jìn)行了充分的研究。史明明[1]分別考慮了衛(wèi)星遠(yuǎn)程攔截、近程攔截時的控制策略,遠(yuǎn)程攔截時建立了考慮J2攝動的動力學(xué)模型,近程攔截以CW方程為模型,基于微分對策分別給出了相應(yīng)的最優(yōu)控制策略。Horie等[5]基于飛機(jī)三維動力學(xué)模型,通過微分對策理論將攔截問題轉(zhuǎn)化為兩點(diǎn)邊值問題,通過仿真分析,最優(yōu)飛行軌跡分為偏離垂直平面以及垂直面內(nèi)運(yùn)動的兩個階段。Shinar等[6]考慮二維平面攔截,且離散控制的情況,設(shè)計了攔截器在有限步數(shù)內(nèi)成功攔截目標(biāo)的最優(yōu)控制策略。當(dāng)攔截器動力學(xué)模型較復(fù)雜時,通過微分對策理論會得到非線性強(qiáng)耦合的兩點(diǎn)邊值問題方程組,一般難以求解。文獻(xiàn)[7-8]給出了一種求解兩點(diǎn)邊值問題的方法,即半直接配點(diǎn)法:將整個控制過程離散化,分別對每段進(jìn)行優(yōu)化設(shè)計,以得到完整的控制規(guī)律,該方法可以有效地求解兩點(diǎn)邊值問題。
當(dāng)攔截器距離目標(biāo)較近時,攔截過程進(jìn)入末端攔截,此時攔截器利用自身的敏感器可以獲得精度較高的目標(biāo)信息,從而實現(xiàn)精確攔截。針對末端攔截問題,Prussing等[9-10]應(yīng)用主矢量理論分別研究了多脈沖逃逸策略以及攔截策略。文獻(xiàn)[11]考慮航天器攔截目標(biāo)后返回原軌道的情況,通過在目標(biāo)函數(shù)中引入一個參數(shù)k對路徑進(jìn)行約束。Stupik等[12]基于CW方程,應(yīng)用最大值原理求解攔截控制問題,對于開環(huán)解應(yīng)用粒子群優(yōu)化方法進(jìn)行求解,閉環(huán)解應(yīng)用Kriging方法求解,其中的Kriging方法是插值和外推相結(jié)合的方法,是一種狀態(tài)反饋控制器。Gutman等[13]在雙積分動力學(xué)模型的基礎(chǔ)上,以終端相對距離為指標(biāo)建立了攔截器與目標(biāo)的控制策略,并分別給出了在極坐標(biāo)、球坐標(biāo)下的策略形式。文獻(xiàn)[14-15]在給出攔截器與目標(biāo)的控制策略的基礎(chǔ)上,建立了關(guān)于攔截剩余時間的一元四次方程,以求解終端攔截時間,并討論了方程的分叉現(xiàn)象。文獻(xiàn)[16]討論了攔截過程中角度測量存在噪聲的情況,通過狀態(tài)觀測器實現(xiàn)對角度的估計,再將其應(yīng)用于控制策略。
對于三星博弈問題,Garcia等[17-18],Pachter等[19-20]假設(shè)攔截器、防御器與目標(biāo)三者的速度大小不變,因此三者運(yùn)動軌跡為直線,應(yīng)用微分對策求解最優(yōu)飛行路徑角,經(jīng)過進(jìn)一步分析,三者軌跡覆蓋區(qū)域為阿波羅尼圓,簡化了求解過程。文獻(xiàn)[21]以簡單的雙積分系統(tǒng)為模型,研究了攔截器、目標(biāo)和防御器三者的追逃控制策略,同樣對終端攔截時間進(jìn)行了求解,仿真表明了過短的攔截時間不能實現(xiàn)對目標(biāo)的攔截。
雖然對于航天器末端攔截問題已經(jīng)存在較多的研究,但大多局限于攔截器與目標(biāo)的雙星博弈。對于三星博弈問題,大多局限于針對簡化模型進(jìn)行研究,與實際情況偏差較大。此外,對于不同博弈態(tài)勢,終端攔截時間作為博弈策略參數(shù),其設(shè)定具有隨機(jī)性,導(dǎo)致策略自適應(yīng)性較差。本文針對具有防御器的三星博弈末端攔截問題進(jìn)行研究,由于各航天器之間利益對立,符合博弈思想,因此采用微分對策理論進(jìn)行求解,推導(dǎo)了各航天器的博弈策略,并提出了時間分析方程以計算終端攔截時間,提高策略的自適應(yīng)性。
本文安排如下:首先建立了航天器末端攔截動力學(xué)模型。其次,討論了雙星博弈態(tài)勢,基于零控脫靶量推導(dǎo)了攔截器與目標(biāo)的最優(yōu)博弈策略,同時建立雙邊時間分析方程以消除終端攔截時間的隨機(jī)特性,將隨機(jī)終端博弈轉(zhuǎn)化為固定終端博弈。再次,將雙星博弈擴(kuò)展為目標(biāo)攜帶防御器的三星博弈,類似的方法推導(dǎo)了各航天器的分段博弈策略,同時修正雙邊時間分析方程以適應(yīng)三星博弈態(tài)勢。最后,將建立的博弈策略、時間分析方程應(yīng)用于三星博弈攔截,并進(jìn)行了相應(yīng)的仿真分析。
在末端攔截過程中,攔截器與目標(biāo)的相對距離較近,因此在攔截器附近建立參考衛(wèi)星,如圖1,其中,O1為參考衛(wèi)星,P為攔截器。設(shè)參考衛(wèi)星運(yùn)行在圓軌道,以參考衛(wèi)星為原點(diǎn),O1x軸沿著參考衛(wèi)星地心矢徑方向,O1z軸沿著軌道角動量方向,O1y軸滿足右手定則,定義軌道坐標(biāo)系O1xyz,在該坐標(biāo)系下,攔截器相對參考衛(wèi)星的動力學(xué)方程可以簡化為CW方程。
圖1 攔截器與參考衛(wèi)星Fig.1 Interceptor and reference satellite
(1)
式中:x,y,z為攔截器相對參考衛(wèi)星的位置,ω為參考衛(wèi)星的軌道角速度,ux,uy,uz分別為攔截器的控制輸入。
(2)
由線性系統(tǒng)理論可得狀態(tài)轉(zhuǎn)移矩陣為
(3)
其中的子矩陣分別為[22]
若目標(biāo)不攜帶防御器,則攔截過程呈現(xiàn)雙星博弈態(tài)勢,此時攔截器與目標(biāo)的動力學(xué)方程均滿足CW方程,即
(4)
定義攔截器與目標(biāo)的相對狀態(tài)
XPE=XP-XE
關(guān)于時間求導(dǎo),并結(jié)合式(4)整理可得相對動力學(xué)方程
(5)
式中:C=B。
在攔截過程中,攔截器與目標(biāo)圍繞攔截終端距離展開爭奪,因此只需考慮兩星的位置矢量[14],定義零控脫靶量ZPE(t)對系統(tǒng)進(jìn)行降維處理
ZPE(t)=MΦ(tf,t)XPE
(6)
式中:M=[I3,03×3],I3為3×3的單位陣。
對式(6)求導(dǎo),并綜合式(5)可得
M(ΦBUP-ΦCUE)=BPUP+CEUE
(7)
式中:tf為終端攔截時間,且BP=MΦ(tf,t)B=Φ12,CE=-MΦ(tf,t)C=-Φ12。
(8)
(9)
(10)
(11)
由式(10)~(11)以及零控脫靶量定義式(6)可知,終端攔截時間是調(diào)整博弈策略的重要參數(shù)。選取不同終端攔截時間tf,將攔截器與目標(biāo)的策略(10)~(11)代入式并積分,可得在不同攔截時間條件下,攔截器與目標(biāo)相對距離的變化,如圖2所示。可以看出,當(dāng)選取特定的攔截時間后,攔截器會在該時刻實現(xiàn)對目標(biāo)的攔截,并不會提前攔截目標(biāo),因此,終端攔截時間的設(shè)定直接影響了博弈結(jié)果。
圖2 不同攔截時間下攔截器與目標(biāo)相對距離的變化Fig.2 Relative distance between interceptor and target with different intercept time
但在文獻(xiàn)[1]和[23]中,終端攔截時間均直接給定,隨機(jī)性較大,對于不同博弈態(tài)勢,需要設(shè)定不同的攔截時間,自適應(yīng)性較差。針對該問題,提出雙邊時間分析方程以確定終端攔截時間,達(dá)到消除攔截時間隨機(jī)性,提高策略自適應(yīng)性的目的。
將攔截器與目標(biāo)的博弈策略(10)~(11)帶入式(7)中得
(12)
定義攔截剩余時間tgo=tf-t,當(dāng)終端攔截時間不變時,有dtgo=-dt,于是
(13)
積分式(13)得到零控脫靶量ZPE(tgo)隨剩余時間tgo的變化關(guān)系
(14)
定義ZPE(0)=l,其中l(wèi)為攔截器的攔截半徑,對式(14)取范數(shù)并記為
(15)
此外,對于式(6)有
(16)
聯(lián)立式(15)~(16)兩式,可以得到關(guān)于剩余時間tgo的方程,即
(17)
對于具有重要價值的目標(biāo),附近通常存在伴飛防御器,以保護(hù)其不被攔截[24-25],此時末端攔截會呈現(xiàn)三星博弈態(tài)勢,博弈過程更加復(fù)雜,攔截更加困難。針對該問題,需要重新設(shè)計航天器博弈策略,并對雙邊時間分析方程進(jìn)行修正。
在三星博弈態(tài)勢下,攔截器、目標(biāo)、防御器三星的運(yùn)動均滿足CW方程,即
(18)
定義攔截器與目標(biāo)的相對狀態(tài)XPE,以及攔截器與防御器的相對狀態(tài)XDP,對其求導(dǎo),并結(jié)合式(18)整理得到相對狀態(tài)方程
(19)
(20)
式中:D=B。
與第2節(jié)類似,分別定義ZPE(t),ZDP(t)為攔截器與目標(biāo)、防御器與攔截器的零控脫靶量
ZPE(t)=MΦ(tf1,t)XPE
(21)
ZDP(t)=MΦ(tf2,t)XDP
(22)
式中:tf2,tf1分別為防御器反攔截時間和終端攔截時間,且滿足tf2 對式(21)~(22)兩式求導(dǎo),并結(jié)合式(19)~(20)兩式整理得 (23) BP2UP+DDUD (24) 式中:BP1=DD=MΦ(tf1,t)B=Φ12(tf1,t),BP2=CE=-MΦ(tf2,t)B=-Φ12(tf2,t)。 在三星博弈攔截對抗中,攔截器與目標(biāo)利益對立,攔截器與防御器同樣存在利益對立關(guān)系,導(dǎo)致三星之間相互影響。為了降低該影響,以tf2作為博弈策略切換時間將其化為分段雙星博弈:第一階段為攔截器與防御器的雙星博弈,此階段攔截器只躲避防御器;第二階段為攔截器與目標(biāo)的雙星博弈,此階段攔截器已成功躲避防御器,只考慮攔截目標(biāo)。因此定義指標(biāo)函數(shù)JPE,JDP分別為tf1,tf2時刻的相對零控脫靶量 (25) (26) (27) 對式(25)進(jìn)行類似地推導(dǎo)并綜合上述分析,可得各航天器的分段最優(yōu)博弈策略為 當(dāng)t0 (28) (29) 當(dāng)tf2 (30) UD=0 (31) 目標(biāo)的博弈策略一直為 (32) 當(dāng)攔截器采用策略(30)時,攔截器與目標(biāo)之間的零控脫靶量變化如圖3中的Z1,攔截器與防御器之間的零控脫靶量變化如圖3中的Z4;當(dāng)攔截器采用策略(28)時,攔截器與目標(biāo)之間的零控脫靶量變化如圖3中的Z2,攔截器與防御器之間的零控脫靶量變化如圖3中的Z3。 圖3 不同策略下零控脫靶量的變化Fig.3 Changes of zero effort miss under different strategies 可以看出,當(dāng)攔截器躲避防御器時,會導(dǎo)致攔截器與目標(biāo)之間的相對距離變大,因此為了達(dá)到攔截目標(biāo)的快速性,需要提前攔截器博弈策略的切換時間點(diǎn),在t0~tf2之間定義躲避時間tf3,攔截器在t0~tf2時間內(nèi)采取如下分段策略: 防御器與目標(biāo)的策略不變,記此時三星的博弈策略為(*)。相應(yīng)的攔截過程為:當(dāng)t0 由于策略(30)會導(dǎo)致攔截器與防御器之間的相對距離減小,因此需要合理設(shè)定切換時間點(diǎn)tf3,以保證在t0~tf2范圍內(nèi)攔截器不被防御器反攔截。 定義攔截器與防御器的安全距離m,在t0~tf2時間內(nèi)各航天器采取相應(yīng)的分段博弈策略(*),帶入式(24),同時令tgo2=tf2-t,由終端攔截時間tf2不變得到dtgo2=-dt,因此 當(dāng)t0 (33) 當(dāng)tf3 (34) 積分式(33)~(34),并分別記為 ZDP(tgo2)=g1(tgo2) (35) (36) 由攔截器不被反攔截得到tf2時刻的終端條件 (37) 同時,在tf3時刻有狀態(tài)連續(xù)條件 g1(tf2-tf3)=g2(tf2-tf3) (38) 綜合式(35)~(38)以及零控脫靶量的定義式(22)可解出最短躲避時間tf3。 為了驗證博弈策略及時間分析方程的有效性,分別對雙星博弈隨機(jī)、固定終端攔截,以及三星博弈隨機(jī)、固定終端攔截四種態(tài)勢進(jìn)行仿真驗證。 初始條件如下:設(shè)攔截器、目標(biāo)、防御器均在地球同步軌道附近運(yùn)動,則將參考衛(wèi)星選為GEO軌道上與其相近的衛(wèi)星,軌道角速度為w=7.2722×10-5rad/s。攔截器的推力幅值為ρP=0.686 m/s2,目標(biāo)的推力幅值為ρE=1/2ρPm/s2,防御器的推力幅值為ρD=5/8ρPm/s2。攔截器初始狀態(tài)為[0, 0, 0, -0.005, 0, 0.005],目標(biāo)初始狀態(tài)為[2, 0, 1, 0, 0.005, 0],防御器初始狀態(tài)為[1, 0, 0, 0.005, 0, 0],位置單位為km,速度單位為km/s。設(shè)攔截器與目標(biāo)之間的攔截距離為1 m,攔截器與防御器之間的安全距離為100 m。假設(shè)防御器反攔截時間tf2=200 s。 1) 雙星博弈隨機(jī)終端攔截,此時攔截空間只存在攔截器與目標(biāo)。設(shè)終端攔截時間為200 s,圖4和圖5分別給出了該博弈態(tài)勢下,攔截器與目標(biāo)的運(yùn)動軌跡和相對距離的變化。可以看出,在終端攔截時間為200 s的情況下,攔截器可以實現(xiàn)對目標(biāo)的攔截,但由圖2可知,設(shè)定攔截時間為200 s不是最快的攔截方案,即可以在更短的時間內(nèi)攔截目標(biāo)。 圖4 隨機(jī)終端下的雙星博弈運(yùn)動軌跡Fig.4 Motion trajectory of two-satellite game with stochastic terminal time 圖5 隨機(jī)終端下的雙星博弈相對距離Fig.5 Relative distance of two-satellite game with stochastic terminal time 圖6給出了攔截器與目標(biāo)的三維運(yùn)動軌跡,圖7繪制了兩星相對距離的變化情況,可以看出,在126.28 s時,兩星的相對距離為0.7 m,滿足攔截條件。 圖6 固定終端下的雙星博弈運(yùn)動軌跡Fig.6 Motion trajectory of two-satellite game with fixed terminal time 圖7 固定終端下的雙星博弈相對距離Fig.7 Relative distance of two-satellite game with fixed terminal time 3) 三星博弈隨機(jī)終端攔截,即博弈空間存在攔截器、目標(biāo)與防御器。此時的攔截時間、躲避時間均是隨機(jī)變量,需要人為設(shè)定。 圖8繪制了在不同躲避時間下,攔截器與目標(biāo)終端距離隨攔截時間的變化情況,此時暫不考慮攔截器是否被防御器反攔截??梢钥闯?,隨著躲避時間的增加,攔截目標(biāo)所需時間也相應(yīng)地增加,因此在博弈過程中,為了快速攔截目標(biāo),躲避時間不應(yīng)過長。 圖9繪制了在不同攔截時間下,攔截器與防御器最短距離隨躲避時間的變化情況,類似地,此時暫不考慮是否成功攔截目標(biāo)??梢钥闯觯瑪r截器與防御器最短距離與躲避時間之間呈現(xiàn)非線性關(guān)系,而且終端攔截時間對躲避時間也會產(chǎn)生影響,當(dāng)設(shè)定攔截時間大于300 s時,攔截器不被反攔截至少需要15 s,但當(dāng)攔截時間設(shè)定為200 s時,相應(yīng)的躲避時間只需6 s左右,因此在博弈開始前,終端攔截時間與躲避時間應(yīng)合理地進(jìn)行設(shè)定,以達(dá)到最優(yōu)攔截狀態(tài)。 圖8 攔截器與目標(biāo)終端距離Fig.8 Terminal distance between interceptor and target 圖9 攔截器與防御器的最短距離Fig.9 Minimal distance between interceptor and defender 若不采用時間方程計算攔截時間與躲避時間,為了保證成功攔截目標(biāo)且不被反攔截,攔截器通常會選取較大的攔截時間,相應(yīng)的躲避時間也會較大。這里選取攔截時間tf1=500 s,躲避時間tf3=50 s進(jìn)行仿真,此時攔截器、目標(biāo)和防御器的三維運(yùn)動軌跡如圖10,圖11給出了三星之間的相對距離隨時間的變化規(guī)律。 從圖11中可以看出,博弈過程中攔截器與目標(biāo)之間的相對距離峰值較大,雖然最后成功攔截,但消耗了較多的時間,攔截效率較低。同時攔截器與防御器之間的最短相對距離為140 m,有被反攔截的風(fēng)險。由圖8,圖9可知,相比于選取較大的攔截時間與躲避時間,存在著更優(yōu)的時間選取方案。 圖10 隨機(jī)終端下的三星博弈運(yùn)動軌跡Fig.10 Motion trajectory of three-satellite game with stochostic terminal time 4) 三星博弈固定終端攔截。此時通過時間分析方程得到終端攔截時間tf1=200 s,躲避時間tf3=8 s。相比于2)的雙星博弈固定終端攔截,終端攔截時間明顯增加,防御器的引入直接減慢了博弈速度。相比于3)的三星隨機(jī)終端博弈,時間方程可以計算得到圖8,圖9中最佳的時間選取方案,此時的攔截方案更優(yōu)。 圖12、圖13分別給出了三星的運(yùn)動軌跡以及相對距離的變化情況??梢钥闯?,攔截器與目標(biāo)的終端距離為1 m,滿足攔截條件。此時攔截器與防御器之間的最小相對距離為190 m。與3)的三星隨機(jī)終端博弈相比,8 s的躲避時間就可以保證攔截器不被防御器反攔截,明顯縮短了躲避時間,節(jié)約了攔截成本,提高了攔截效率。 圖12 固定終端下的三星博弈運(yùn)動軌跡Fig.12 Motion trajectory of three-satellite game with fixed terminal time 圖13 固定終端下的三星博弈相對距離Fig.13 Relative distance of three-satellite game with fixed terminal time 本文研究了航天器末端攔截博弈問題,基于微分對策理論建立了多邊攔截策略,具有以下特點(diǎn): 1) 針對策略中終端攔截時間的設(shè)定隨機(jī)性問題,創(chuàng)新性地提出了時間分析方程,將隨機(jī)終端博弈轉(zhuǎn)化為固定終端博弈,提高了攔截策略的自適應(yīng)性。 2) 攔截空間中防御器的引入導(dǎo)致三星博弈態(tài)勢,以及攔截時間的延長,通過博弈策略的切換將其化為分段雙星博弈,降低了攔截難度。 3) 針對不同博弈態(tài)勢進(jìn)行仿真,結(jié)果表明應(yīng)用所建立的博弈策略,攔截器在不被防御器反攔截的情況下,能夠?qū)崿F(xiàn)對目標(biāo)的打擊,具有一定的工程價值。3.2 終端攔截時間的分段確定
4 仿真校驗
5 結(jié) 論