亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

航天器末端攔截自適應(yīng)博弈策略

2020-04-15 09:28:06王淳寶孫兆偉孫楚琦

宇航學(xué)報 2020年3期

王淳寶，葉東，孫兆偉，孫楚琦

(哈爾濱工業(yè)大學(xué)航天學(xué)院，哈爾濱 150001)

0 引言

衛(wèi)星作為空間力量重要組成部分，具有傳送信息量大、不受地形限制等優(yōu)點(diǎn)，可以為指揮者制定策略提供戰(zhàn)場信息，也可為導(dǎo)彈等作戰(zhàn)單元提供導(dǎo)航制導(dǎo)信息[1]。因此為了奪取戰(zhàn)時空間信息主動權(quán)，對敵方衛(wèi)星實施攔截打擊有著重要意義。

針對攔截問題，文獻(xiàn)[2-3]基于滑模面進(jìn)行了導(dǎo)彈的制導(dǎo)與控制一體化設(shè)計，仿真表明了采用所設(shè)計的控制方法能夠滿足攔截要求。賴超等[4]考慮目標(biāo)進(jìn)行機(jī)動時的攔截策略，基于動態(tài)面和擴(kuò)張狀態(tài)觀測器對制導(dǎo)與控制進(jìn)行了設(shè)計，仿真分析了目標(biāo)在進(jìn)行正弦機(jī)動時，采用相應(yīng)的控制策略能夠?qū)崿F(xiàn)對目標(biāo)的精確攔截。雖然上述文獻(xiàn)對目標(biāo)攔截問題均進(jìn)行了研究，但其中的目標(biāo)并未進(jìn)行機(jī)動或未采取最優(yōu)的機(jī)動策略。而隨著科技的發(fā)展，目標(biāo)獲取空間戰(zhàn)場信息能力的提高，可以對戰(zhàn)場情報進(jìn)行分析，并做出相應(yīng)的決策，采取最優(yōu)躲避策略以應(yīng)對不同的戰(zhàn)場態(tài)勢，此時攔截策略的設(shè)計需要考慮目標(biāo)機(jī)動的最優(yōu)性，傳統(tǒng)的攔截方法已不能滿足攔截要求，單邊攔截策略已不再適用。此外，隨著衛(wèi)星任務(wù)的復(fù)雜化及多樣化，目標(biāo)的被動逃逸可能會影響其任務(wù)的實施，此時為了避免具有重要價值的衛(wèi)星被攔截，附近通常會存在伴飛星進(jìn)行主動防御，這種態(tài)勢無疑增加了攔截難度，對空間攔截提出了更高的要求，因此研究存在防御器的多邊攔截策略有著重要的意義。

針對多邊攔截問題，學(xué)者們已經(jīng)進(jìn)行了充分的研究。史明明[1]分別考慮了衛(wèi)星遠(yuǎn)程攔截、近程攔截時的控制策略，遠(yuǎn)程攔截時建立了考慮J2攝動的動力學(xué)模型，近程攔截以CW方程為模型，基于微分對策分別給出了相應(yīng)的最優(yōu)控制策略。Horie等[5]基于飛機(jī)三維動力學(xué)模型，通過微分對策理論將攔截問題轉(zhuǎn)化為兩點(diǎn)邊值問題，通過仿真分析，最優(yōu)飛行軌跡分為偏離垂直平面以及垂直面內(nèi)運(yùn)動的兩個階段。Shinar等[6]考慮二維平面攔截，且離散控制的情況，設(shè)計了攔截器在有限步數(shù)內(nèi)成功攔截目標(biāo)的最優(yōu)控制策略。當(dāng)攔截器動力學(xué)模型較復(fù)雜時，通過微分對策理論會得到非線性強(qiáng)耦合的兩點(diǎn)邊值問題方程組，一般難以求解。文獻(xiàn)[7-8]給出了一種求解兩點(diǎn)邊值問題的方法，即半直接配點(diǎn)法：將整個控制過程離散化，分別對每段進(jìn)行優(yōu)化設(shè)計，以得到完整的控制規(guī)律，該方法可以有效地求解兩點(diǎn)邊值問題。

當(dāng)攔截器距離目標(biāo)較近時，攔截過程進(jìn)入末端攔截，此時攔截器利用自身的敏感器可以獲得精度較高的目標(biāo)信息，從而實現(xiàn)精確攔截。針對末端攔截問題，Prussing等[9-10]應(yīng)用主矢量理論分別研究了多脈沖逃逸策略以及攔截策略。文獻(xiàn)[11]考慮航天器攔截目標(biāo)后返回原軌道的情況，通過在目標(biāo)函數(shù)中引入一個參數(shù)k對路徑進(jìn)行約束。Stupik等[12]基于CW方程，應(yīng)用最大值原理求解攔截控制問題，對于開環(huán)解應(yīng)用粒子群優(yōu)化方法進(jìn)行求解，閉環(huán)解應(yīng)用Kriging方法求解，其中的Kriging方法是插值和外推相結(jié)合的方法，是一種狀態(tài)反饋控制器。Gutman等[13]在雙積分動力學(xué)模型的基礎(chǔ)上，以終端相對距離為指標(biāo)建立了攔截器與目標(biāo)的控制策略，并分別給出了在極坐標(biāo)、球坐標(biāo)下的策略形式。文獻(xiàn)[14-15]在給出攔截器與目標(biāo)的控制策略的基礎(chǔ)上，建立了關(guān)于攔截剩余時間的一元四次方程，以求解終端攔截時間，并討論了方程的分叉現(xiàn)象。文獻(xiàn)[16]討論了攔截過程中角度測量存在噪聲的情況，通過狀態(tài)觀測器實現(xiàn)對角度的估計，再將其應(yīng)用于控制策略。

對于三星博弈問題，Garcia等[17-18]，Pachter等[19-20]假設(shè)攔截器、防御器與目標(biāo)三者的速度大小不變，因此三者運(yùn)動軌跡為直線，應(yīng)用微分對策求解最優(yōu)飛行路徑角，經(jīng)過進(jìn)一步分析，三者軌跡覆蓋區(qū)域為阿波羅尼圓，簡化了求解過程。文獻(xiàn)[21]以簡單的雙積分系統(tǒng)為模型，研究了攔截器、目標(biāo)和防御器三者的追逃控制策略，同樣對終端攔截時間進(jìn)行了求解，仿真表明了過短的攔截時間不能實現(xiàn)對目標(biāo)的攔截。

雖然對于航天器末端攔截問題已經(jīng)存在較多的研究，但大多局限于攔截器與目標(biāo)的雙星博弈。對于三星博弈問題，大多局限于針對簡化模型進(jìn)行研究，與實際情況偏差較大。此外，對于不同博弈態(tài)勢，終端攔截時間作為博弈策略參數(shù)，其設(shè)定具有隨機(jī)性，導(dǎo)致策略自適應(yīng)性較差。本文針對具有防御器的三星博弈末端攔截問題進(jìn)行研究，由于各航天器之間利益對立，符合博弈思想，因此采用微分對策理論進(jìn)行求解，推導(dǎo)了各航天器的博弈策略，并提出了時間分析方程以計算終端攔截時間，提高策略的自適應(yīng)性。

本文安排如下：首先建立了航天器末端攔截動力學(xué)模型。其次，討論了雙星博弈態(tài)勢，基于零控脫靶量推導(dǎo)了攔截器與目標(biāo)的最優(yōu)博弈策略，同時建立雙邊時間分析方程以消除終端攔截時間的隨機(jī)特性，將隨機(jī)終端博弈轉(zhuǎn)化為固定終端博弈。再次，將雙星博弈擴(kuò)展為目標(biāo)攜帶防御器的三星博弈，類似的方法推導(dǎo)了各航天器的分段博弈策略，同時修正雙邊時間分析方程以適應(yīng)三星博弈態(tài)勢。最后，將建立的博弈策略、時間分析方程應(yīng)用于三星博弈攔截，并進(jìn)行了相應(yīng)的仿真分析。

1 末端攔截動力學(xué)模型

在末端攔截過程中，攔截器與目標(biāo)的相對距離較近，因此在攔截器附近建立參考衛(wèi)星，如圖1，其中，O1為參考衛(wèi)星，P為攔截器。設(shè)參考衛(wèi)星運(yùn)行在圓軌道，以參考衛(wèi)星為原點(diǎn)，O1x軸沿著參考衛(wèi)星地心矢徑方向，O1z軸沿著軌道角動量方向，O1y軸滿足右手定則，定義軌道坐標(biāo)系O1xyz，在該坐標(biāo)系下，攔截器相對參考衛(wèi)星的動力學(xué)方程可以簡化為CW方程。

圖1 攔截器與參考衛(wèi)星Fig.1 Interceptor and reference satellite

(1)

式中：x,y,z為攔截器相對參考衛(wèi)星的位置，ω為參考衛(wèi)星的軌道角速度，ux,uy,uz分別為攔截器的控制輸入。

(2)

由線性系統(tǒng)理論可得狀態(tài)轉(zhuǎn)移矩陣為

(3)

其中的子矩陣分別為[22]

2 雙星博弈攔截策略

若目標(biāo)不攜帶防御器，則攔截過程呈現(xiàn)雙星博弈態(tài)勢，此時攔截器與目標(biāo)的動力學(xué)方程均滿足CW方程，即

(4)

定義攔截器與目標(biāo)的相對狀態(tài)

XPE=XP-XE

關(guān)于時間求導(dǎo)，并結(jié)合式(4)整理可得相對動力學(xué)方程

(5)

式中：C=B。

2.1 最優(yōu)博弈策略設(shè)計

在攔截過程中，攔截器與目標(biāo)圍繞攔截終端距離展開爭奪，因此只需考慮兩星的位置矢量[14]，定義零控脫靶量ZPE(t)對系統(tǒng)進(jìn)行降維處理

ZPE(t)=MΦ(tf,t)XPE

(6)

式中：M=[I3,03×3]，I3為3×3的單位陣。

對式(6)求導(dǎo)，并綜合式(5)可得

M(ΦBUP-ΦCUE)=BPUP+CEUE

(7)

式中：tf為終端攔截時間，且BP=MΦ(tf,t)B=Φ12，CE=-MΦ(tf,t)C=-Φ12。

(8)

(9)

(10)

(11)

2.2 終端攔截時間的確定

由式(10)～(11)以及零控脫靶量定義式(6)可知，終端攔截時間是調(diào)整博弈策略的重要參數(shù)。選取不同終端攔截時間tf，將攔截器與目標(biāo)的策略(10)～(11)代入式并積分，可得在不同攔截時間條件下，攔截器與目標(biāo)相對距離的變化，如圖2所示。可以看出，當(dāng)選取特定的攔截時間后，攔截器會在該時刻實現(xiàn)對目標(biāo)的攔截，并不會提前攔截目標(biāo)，因此，終端攔截時間的設(shè)定直接影響了博弈結(jié)果。

圖2 不同攔截時間下攔截器與目標(biāo)相對距離的變化Fig.2 Relative distance between interceptor and target with different intercept time

但在文獻(xiàn)[1]和[23]中，終端攔截時間均直接給定，隨機(jī)性較大，對于不同博弈態(tài)勢，需要設(shè)定不同的攔截時間，自適應(yīng)性較差。針對該問題，提出雙邊時間分析方程以確定終端攔截時間，達(dá)到消除攔截時間隨機(jī)性，提高策略自適應(yīng)性的目的。

將攔截器與目標(biāo)的博弈策略(10)～(11)帶入式(7)中得

(12)

定義攔截剩余時間tgo=tf-t，當(dāng)終端攔截時間不變時，有dtgo=-dt，于是

(13)

積分式(13)得到零控脫靶量ZPE(tgo)隨剩余時間tgo的變化關(guān)系

(14)

定義ZPE(0)=l，其中l(wèi)為攔截器的攔截半徑，對式(14)取范數(shù)并記為

(15)

此外，對于式(6)有

(16)

聯(lián)立式(15)～(16)兩式，可以得到關(guān)于剩余時間tgo的方程，即

(17)

3 三星博弈攔截策略

對于具有重要價值的目標(biāo)，附近通常存在伴飛防御器，以保護(hù)其不被攔截[24-25]，此時末端攔截會呈現(xiàn)三星博弈態(tài)勢，博弈過程更加復(fù)雜，攔截更加困難。針對該問題，需要重新設(shè)計航天器博弈策略，并對雙邊時間分析方程進(jìn)行修正。

在三星博弈態(tài)勢下，攔截器、目標(biāo)、防御器三星的運(yùn)動均滿足CW方程，即

(18)

定義攔截器與目標(biāo)的相對狀態(tài)XPE，以及攔截器與防御器的相對狀態(tài)XDP，對其求導(dǎo)，并結(jié)合式(18)整理得到相對狀態(tài)方程

(19)

(20)

式中：D=B。

3.1 分段最優(yōu)博弈策略設(shè)計

與第2節(jié)類似，分別定義ZPE(t),ZDP(t)為攔截器與目標(biāo)、防御器與攔截器的零控脫靶量

ZPE(t)=MΦ(tf1,t)XPE

(21)

ZDP(t)=MΦ(tf2,t)XDP

(22)

式中：tf2,tf1分別為防御器反攔截時間和終端攔截時間，且滿足tf2

對式(21)～(22)兩式求導(dǎo)，并結(jié)合式(19)～(20)兩式整理得

(23)

BP2UP+DDUD

(24)

式中：BP1=DD=MΦ(tf1,t)B=Φ12(tf1,t),BP2=CE=-MΦ(tf2,t)B=-Φ12(tf2,t)。

在三星博弈攔截對抗中，攔截器與目標(biāo)利益對立，攔截器與防御器同樣存在利益對立關(guān)系，導(dǎo)致三星之間相互影響。為了降低該影響，以tf2作為博弈策略切換時間將其化為分段雙星博弈：第一階段為攔截器與防御器的雙星博弈，此階段攔截器只躲避防御器；第二階段為攔截器與目標(biāo)的雙星博弈，此階段攔截器已成功躲避防御器，只考慮攔截目標(biāo)。因此定義指標(biāo)函數(shù)JPE,JDP分別為tf1,tf2時刻的相對零控脫靶量

(25)

(26)

(27)

對式(25)進(jìn)行類似地推導(dǎo)并綜合上述分析，可得各航天器的分段最優(yōu)博弈策略為

當(dāng)t0

(28)

(29)

當(dāng)tf2

(30)

UD=0

(31)

目標(biāo)的博弈策略一直為

(32)

當(dāng)攔截器采用策略(30)時，攔截器與目標(biāo)之間的零控脫靶量變化如圖3中的Z1，攔截器與防御器之間的零控脫靶量變化如圖3中的Z4；當(dāng)攔截器采用策略(28)時，攔截器與目標(biāo)之間的零控脫靶量變化如圖3中的Z2，攔截器與防御器之間的零控脫靶量變化如圖3中的Z3。

圖3 不同策略下零控脫靶量的變化Fig.3 Changes of zero effort miss under different strategies

可以看出，當(dāng)攔截器躲避防御器時，會導(dǎo)致攔截器與目標(biāo)之間的相對距離變大，因此為了達(dá)到攔截目標(biāo)的快速性，需要提前攔截器博弈策略的切換時間點(diǎn)，在t0～tf2之間定義躲避時間tf3，攔截器在t0～tf2時間內(nèi)采取如下分段策略：

防御器與目標(biāo)的策略不變，記此時三星的博弈策略為(*)。相應(yīng)的攔截過程為：當(dāng)t0tf3時，攔截器切換為攔截策略(29)快速攔截目標(biāo)。

由于策略(30)會導(dǎo)致攔截器與防御器之間的相對距離減小，因此需要合理設(shè)定切換時間點(diǎn)tf3，以保證在t0～tf2范圍內(nèi)攔截器不被防御器反攔截。

3.2 終端攔截時間的分段確定

定義攔截器與防御器的安全距離m，在t0～tf2時間內(nèi)各航天器采取相應(yīng)的分段博弈策略(*)，帶入式(24)，同時令tgo2=tf2-t，由終端攔截時間tf2不變得到dtgo2=-dt，因此

當(dāng)t0

(33)

當(dāng)tf3

(34)

積分式(33)～(34)，并分別記為

ZDP(tgo2)=g1(tgo2)

(35)

(36)

由攔截器不被反攔截得到tf2時刻的終端條件

(37)

同時，在tf3時刻有狀態(tài)連續(xù)條件

g1(tf2-tf3)=g2(tf2-tf3)

(38)

綜合式(35)～(38)以及零控脫靶量的定義式(22)可解出最短躲避時間tf3。

4 仿真校驗

為了驗證博弈策略及時間分析方程的有效性，分別對雙星博弈隨機(jī)、固定終端攔截，以及三星博弈隨機(jī)、固定終端攔截四種態(tài)勢進(jìn)行仿真驗證。

初始條件如下：設(shè)攔截器、目標(biāo)、防御器均在地球同步軌道附近運(yùn)動，則將參考衛(wèi)星選為GEO軌道上與其相近的衛(wèi)星，軌道角速度為w=7.2722×10-5rad/s。攔截器的推力幅值為ρP=0.686 m/s2，目標(biāo)的推力幅值為ρE=1/2ρPm/s2，防御器的推力幅值為ρD=5/8ρPm/s2。攔截器初始狀態(tài)為[0, 0, 0, -0.005, 0, 0.005]，目標(biāo)初始狀態(tài)為[2, 0, 1, 0, 0.005, 0]，防御器初始狀態(tài)為[1, 0, 0, 0.005, 0, 0]，位置單位為km，速度單位為km/s。設(shè)攔截器與目標(biāo)之間的攔截距離為1 m，攔截器與防御器之間的安全距離為100 m。假設(shè)防御器反攔截時間tf2=200 s。

1) 雙星博弈隨機(jī)終端攔截，此時攔截空間只存在攔截器與目標(biāo)。設(shè)終端攔截時間為200 s，圖4和圖5分別給出了該博弈態(tài)勢下，攔截器與目標(biāo)的運(yùn)動軌跡和相對距離的變化。可以看出，在終端攔截時間為200 s的情況下，攔截器可以實現(xiàn)對目標(biāo)的攔截，但由圖2可知，設(shè)定攔截時間為200 s不是最快的攔截方案，即可以在更短的時間內(nèi)攔截目標(biāo)。

圖4 隨機(jī)終端下的雙星博弈運(yùn)動軌跡Fig.4 Motion trajectory of two-satellite game with stochastic terminal time

圖5 隨機(jī)終端下的雙星博弈相對距離Fig.5 Relative distance of two-satellite game with stochastic terminal time

圖6給出了攔截器與目標(biāo)的三維運(yùn)動軌跡，圖7繪制了兩星相對距離的變化情況，可以看出，在126.28 s時，兩星的相對距離為0.7 m，滿足攔截條件。

圖6 固定終端下的雙星博弈運(yùn)動軌跡Fig.6 Motion trajectory of two-satellite game with fixed terminal time

圖7 固定終端下的雙星博弈相對距離Fig.7 Relative distance of two-satellite game with fixed terminal time

3) 三星博弈隨機(jī)終端攔截，即博弈空間存在攔截器、目標(biāo)與防御器。此時的攔截時間、躲避時間均是隨機(jī)變量，需要人為設(shè)定。

圖8繪制了在不同躲避時間下，攔截器與目標(biāo)終端距離隨攔截時間的變化情況，此時暫不考慮攔截器是否被防御器反攔截?？梢钥闯?，隨著躲避時間的增加，攔截目標(biāo)所需時間也相應(yīng)地增加，因此在博弈過程中，為了快速攔截目標(biāo)，躲避時間不應(yīng)過長。

圖9繪制了在不同攔截時間下，攔截器與防御器最短距離隨躲避時間的變化情況，類似地，此時暫不考慮是否成功攔截目標(biāo)?？梢钥闯觯瑪r截器與防御器最短距離與躲避時間之間呈現(xiàn)非線性關(guān)系，而且終端攔截時間對躲避時間也會產(chǎn)生影響，當(dāng)設(shè)定攔截時間大于300 s時，攔截器不被反攔截至少需要15 s，但當(dāng)攔截時間設(shè)定為200 s時，相應(yīng)的躲避時間只需6 s左右，因此在博弈開始前，終端攔截時間與躲避時間應(yīng)合理地進(jìn)行設(shè)定，以達(dá)到最優(yōu)攔截狀態(tài)。

圖8 攔截器與目標(biāo)終端距離Fig.8 Terminal distance between interceptor and target

圖9 攔截器與防御器的最短距離Fig.9 Minimal distance between interceptor and defender

若不采用時間方程計算攔截時間與躲避時間，為了保證成功攔截目標(biāo)且不被反攔截，攔截器通常會選取較大的攔截時間，相應(yīng)的躲避時間也會較大。這里選取攔截時間tf1=500 s，躲避時間tf3=50 s進(jìn)行仿真，此時攔截器、目標(biāo)和防御器的三維運(yùn)動軌跡如圖10，圖11給出了三星之間的相對距離隨時間的變化規(guī)律。

從圖11中可以看出，博弈過程中攔截器與目標(biāo)之間的相對距離峰值較大，雖然最后成功攔截，但消耗了較多的時間，攔截效率較低。同時攔截器與防御器之間的最短相對距離為140 m，有被反攔截的風(fēng)險。由圖8，圖9可知，相比于選取較大的攔截時間與躲避時間，存在著更優(yōu)的時間選取方案。

圖10 隨機(jī)終端下的三星博弈運(yùn)動軌跡Fig.10 Motion trajectory of three-satellite game with stochostic terminal time

4) 三星博弈固定終端攔截。此時通過時間分析方程得到終端攔截時間tf1=200 s，躲避時間tf3=8 s。相比于2)的雙星博弈固定終端攔截，終端攔截時間明顯增加，防御器的引入直接減慢了博弈速度。相比于3)的三星隨機(jī)終端博弈，時間方程可以計算得到圖8，圖9中最佳的時間選取方案，此時的攔截方案更優(yōu)。

圖12、圖13分別給出了三星的運(yùn)動軌跡以及相對距離的變化情況?？梢钥闯?，攔截器與目標(biāo)的終端距離為1 m，滿足攔截條件。此時攔截器與防御器之間的最小相對距離為190 m。與3)的三星隨機(jī)終端博弈相比，8 s的躲避時間就可以保證攔截器不被防御器反攔截，明顯縮短了躲避時間，節(jié)約了攔截成本，提高了攔截效率。

圖12 固定終端下的三星博弈運(yùn)動軌跡Fig.12 Motion trajectory of three-satellite game with fixed terminal time

圖13 固定終端下的三星博弈相對距離Fig.13 Relative distance of three-satellite game with fixed terminal time

5 結(jié) 論

本文研究了航天器末端攔截博弈問題，基于微分對策理論建立了多邊攔截策略，具有以下特點(diǎn)：

1) 針對策略中終端攔截時間的設(shè)定隨機(jī)性問題，創(chuàng)新性地提出了時間分析方程，將隨機(jī)終端博弈轉(zhuǎn)化為固定終端博弈，提高了攔截策略的自適應(yīng)性。

2) 攔截空間中防御器的引入導(dǎo)致三星博弈態(tài)勢，以及攔截時間的延長，通過博弈策略的切換將其化為分段雙星博弈，降低了攔截難度。

3) 針對不同博弈態(tài)勢進(jìn)行仿真，結(jié)果表明應(yīng)用所建立的博弈策略，攔截器在不被防御器反攔截的情況下，能夠?qū)崿F(xiàn)對目標(biāo)的打擊，具有一定的工程價值。