葛丹桐,朱圣英
(1.北京理工大學(xué) 深空探測(cè)技術(shù)研究所,北京 100081;2.深空自主導(dǎo)航與控制工信部重點(diǎn)實(shí)驗(yàn)室,北京 100081;3.飛行器動(dòng)力學(xué)與控制教育部重點(diǎn)實(shí)驗(yàn)室,北京 100081)
小行星具有極高的科學(xué)探索價(jià)值,通過研究與探索小行星,人類可進(jìn)一步開發(fā)與利用太空資源,發(fā)展并驗(yàn)證小行星防御技術(shù)。近兩年,日本“隼鳥2號(hào)”(Hayabusa 2)與美國(guó)“奧西里斯–雷克斯”(Origins Spectral Interpretation Resource Identification Security Regolith Explorer,OSIRIS-REx)任務(wù)分別對(duì)一顆C類小行星與一顆B類小行星開展了采樣返回探測(cè)[1-2]。其中Hayabusa 2已完成對(duì)小行星“龍宮”(Ryugu)的采樣任務(wù),并于2020年底將樣品送回地球;OSIRIS-REx于2020年10月在小行星“貝努”( Bennu)表面實(shí)現(xiàn)首次附著采樣,目前正在返回地球途中。
在小行星探測(cè)任務(wù)中,目標(biāo)形貌復(fù)雜多樣,表面碎石、陡坡、凸包、隕石坑等障礙對(duì)探測(cè)器附著安全帶來挑戰(zhàn)[3-5]。同時(shí),受動(dòng)力學(xué)建模誤差、星上導(dǎo)航控制誤差以及太陽輻射、第三天體引力等環(huán)境擾動(dòng)影響,探測(cè)器狀態(tài)存在不確定性[6-7]。在日本的“隼鳥號(hào)”(Hayabusa)任務(wù)中,當(dāng)探測(cè)器第一次嘗試在目標(biāo)小行星表面附著時(shí),在其附近檢測(cè)到未知障礙并發(fā)出緊急上升指令,而由于存在較大姿態(tài)測(cè)量誤差,該指令并未執(zhí)行,導(dǎo)致探測(cè)器在目標(biāo)表面發(fā)生了多次彈跳[8],對(duì)任務(wù)安全構(gòu)成了威脅。因此,為了實(shí)現(xiàn)探測(cè)器在復(fù)雜形貌環(huán)境中的安全附著,有必要針對(duì)附著環(huán)境與探測(cè)器狀態(tài)不確定下的軌跡規(guī)劃方法展開研究,通過動(dòng)態(tài)評(píng)估碰撞威脅并實(shí)時(shí)調(diào)整下降軌跡,提高小行星附著任務(wù)安全性。
現(xiàn)有研究中,常將軌跡規(guī)劃問題轉(zhuǎn)化為最優(yōu)控制問題求解[9-10]。然而受星上計(jì)算能力制約,最優(yōu)軌跡一般需提前在地面計(jì)算與存儲(chǔ),并在實(shí)際下降過程中采用比例積分微分(Proportional Integral Derivative,PID)控制、滑??刂?、自適應(yīng)控制等方法[11-12]對(duì)標(biāo)稱軌跡進(jìn)行跟蹤,驅(qū)動(dòng)探測(cè)器到達(dá)目標(biāo)著陸點(diǎn)附近。此類方法缺乏一定靈活性,難以根據(jù)環(huán)境實(shí)時(shí)檢測(cè)結(jié)果對(duì)下降軌跡進(jìn)行調(diào)整,且一旦實(shí)際動(dòng)力學(xué)建模誤差與環(huán)境干擾超出預(yù)期,系統(tǒng)狀態(tài)有違背約束的風(fēng)險(xiǎn)[13],從而可能導(dǎo)致任務(wù)失敗。
針對(duì)動(dòng)態(tài)環(huán)境中的路徑規(guī)劃問題,文獻(xiàn)[14]在經(jīng)典A*算法基礎(chǔ)上提出D*算法,即動(dòng)態(tài)A*算法。在已有路徑點(diǎn)序列上,結(jié)合環(huán)境地圖變化更新局部代價(jià)函數(shù),并對(duì)局部路徑點(diǎn)進(jìn)行重規(guī)劃,避免重新規(guī)劃整條路徑占用過多星上資源,提高規(guī)劃效率。隨后,進(jìn)一步發(fā)展出LPA*、D* Lite、D*PO等算法[15-16],其中D*PO算法引入多目標(biāo)優(yōu)化理論,通過求解帕累托最優(yōu)路徑點(diǎn),可實(shí)現(xiàn)多優(yōu)化目標(biāo)下的路徑動(dòng)態(tài)規(guī)劃。然而,與地面機(jī)器人路徑規(guī)劃相比,小行星附著任務(wù)中探測(cè)器運(yùn)動(dòng)受動(dòng)力學(xué)、推力幅值、下降速度、末端狀態(tài)等約束[17-19],且在環(huán)境擾動(dòng)與狀態(tài)不確定性的共同影響下,探測(cè)器實(shí)際下降過程難以嚴(yán)格按照預(yù)設(shè)軌跡運(yùn)動(dòng)[20]。為了避免跟蹤過程中探測(cè)器違背工程約束,需要在規(guī)劃軌跡時(shí)考慮狀態(tài)與環(huán)境的不確定性影響,設(shè)計(jì)可安全跟蹤的路徑點(diǎn)序列。
基于以上問題,本文針對(duì)小行星復(fù)雜形貌附著軌跡動(dòng)態(tài)規(guī)劃方法展開研究,旨在構(gòu)建小行星附著多目標(biāo)最優(yōu)路徑點(diǎn)序列,基于標(biāo)稱軌跡與實(shí)時(shí)檢測(cè)環(huán)境障礙的沖突預(yù)判,形成形貌自適應(yīng)的附著軌跡動(dòng)態(tài)規(guī)劃方法,提高探測(cè)器在小行星復(fù)雜形貌環(huán)境附著的安全性。
在小行星質(zhì)心固連系下建立探測(cè)器動(dòng)力學(xué)方程
其中:r為探測(cè)器位置;v為探測(cè)器速度;ω為小行星自旋角速度;g(r)為探測(cè)器在r處所受的引力加速度,其值由多面體引力場(chǎng)模型給出[21];u為控制量;ap為探測(cè)器所受的太陽光壓、第三體引力等環(huán)境擾動(dòng)。
基于狀態(tài)反饋,以上方程可在當(dāng)前狀態(tài)附近線性化為
本文所提出的形貌自適應(yīng)附著軌跡動(dòng)態(tài)規(guī)劃方法由3部分構(gòu)成——初始最優(yōu)路徑點(diǎn)規(guī)劃、碰撞威脅評(píng)估與局部路徑點(diǎn)重規(guī)劃,算法結(jié)構(gòu)如圖1所示。
圖1 算法結(jié)構(gòu)Fig.1 Structure of the algorithm
算法包含以下步驟:
1)將位置空間離散成網(wǎng)格。結(jié)合實(shí)時(shí)導(dǎo)航獲取的探測(cè)器狀態(tài)估計(jì)結(jié)果,計(jì)算位置誤差橢球?yàn)閇22]
其中:μr為位置估計(jì)均值;Dr為位置估計(jì)協(xié)方差矩陣;Cr為特征根構(gòu)成的對(duì)角矩陣;UE為著陸點(diǎn)固連坐標(biāo)系到誤差橢球坐標(biāo)系的轉(zhuǎn)換矩陣。記位置誤差橢球半長(zhǎng)軸長(zhǎng)度為aE,則網(wǎng)格邊長(zhǎng)應(yīng)滿足l≥aE。
2)附著過程初始時(shí)刻t0,基于初始時(shí)刻環(huán)境地圖障礙集合O0,規(guī)劃探測(cè)器從初始位置rO到著陸點(diǎn)rf的帕累托最優(yōu)路徑點(diǎn)序列W?。
3)附著過程中更新障礙集合Ok,基于探測(cè)器當(dāng)前狀態(tài)x(k)、初始最優(yōu)路徑點(diǎn)序列W?,評(píng)估是否存在碰撞威脅。若無碰撞威脅,繼續(xù)步驟4);若存在碰撞威脅,跳到步驟6)。
4)結(jié)合探測(cè)器當(dāng)前狀態(tài)x(k),跟蹤初始最優(yōu)路徑點(diǎn)序列W?的下一路徑點(diǎn)。
小行星附著過程初始時(shí)刻,假設(shè)所有未知區(qū)域?yàn)闊o障礙空間,將與障礙重合的網(wǎng)格標(biāo)記為禁飛區(qū),剩余網(wǎng)格視為安全區(qū),網(wǎng)格的中心點(diǎn)集合構(gòu)成路徑點(diǎn)解空間。在搜索路徑點(diǎn)時(shí),從初始位置rO開始,依次考慮當(dāng)前節(jié)點(diǎn)相鄰3n?1節(jié)點(diǎn),其中n為維數(shù),將位于安全區(qū)的節(jié)點(diǎn)放入OPEN表中。結(jié)合小行星附著任務(wù)能耗、著陸精度、障礙規(guī)避3個(gè)方面的任務(wù)需求,設(shè)計(jì)以下目標(biāo)函數(shù)。
代價(jià)目標(biāo)函數(shù)c1(wi)用于估計(jì)探測(cè)器從初始位置w0轉(zhuǎn)移到節(jié)點(diǎn)wi的代價(jià),其值等于從初始位置w0到達(dá)上一節(jié)點(diǎn)wi?1的轉(zhuǎn)移代價(jià)與從節(jié)點(diǎn)wi?1到達(dá)節(jié)點(diǎn)wi的轉(zhuǎn)移代價(jià)之和
在初始位置時(shí)c1(w0)=0。從安全節(jié)點(diǎn)wi?1到達(dá)安全節(jié)點(diǎn)wi的轉(zhuǎn)移代價(jià)?c1(wi?1,wi)由兩節(jié)點(diǎn)之間距離矢量的?!琩(wi?1,wi)‖與探測(cè)器運(yùn)動(dòng)方向共同決定
對(duì)于禁飛區(qū)節(jié)點(diǎn),進(jìn)入或從禁飛區(qū)網(wǎng)格出來的轉(zhuǎn)移代價(jià)記為+∞。著陸點(diǎn)目標(biāo)函數(shù)c2(wi)作為啟發(fā)式函數(shù),通過計(jì)算節(jié)點(diǎn)與著陸點(diǎn)間的直線距離
確定不同節(jié)點(diǎn)在搜索過程中的優(yōu)先級(jí),提高路徑規(guī)劃效率。風(fēng)險(xiǎn)評(píng)估目標(biāo)函數(shù)c3(wi)用于評(píng)估探測(cè)器轉(zhuǎn)移至節(jié)點(diǎn)wi的過程中,在狀態(tài)不確定性影響下與最近障礙發(fā)生碰撞的概率。受下降過程中動(dòng)力學(xué)建模誤差、導(dǎo)航誤差、執(zhí)行誤差等因素影響,探測(cè)器的實(shí)際運(yùn)動(dòng)軌跡可能偏離路徑點(diǎn)連線,使得路徑規(guī)劃階段滿足要求的軌跡在附著跟蹤過程中超出任務(wù)約束。假設(shè)軌跡跟蹤最大偏移量為δ,定義風(fēng)險(xiǎn)評(píng)估目標(biāo)函數(shù)c3(wi)為
其中:wh為障礙集合O0中的節(jié)點(diǎn)。
節(jié)點(diǎn)wi距離wh越近,探測(cè)器與障礙碰撞概率越高,風(fēng)險(xiǎn)評(píng)估目標(biāo)函數(shù)c3(wi)取值越大。通過在風(fēng)險(xiǎn)評(píng)估目標(biāo)函數(shù)中引入冗余量δ,可在搜索路徑點(diǎn)時(shí)避免選取禁飛區(qū)相鄰節(jié)點(diǎn),使得探測(cè)器即使在最大跟蹤誤差下,仍能與障礙保持安全距離。
附著過程中,探測(cè)器通過星上敏感器如相機(jī)、激光雷達(dá)等對(duì)測(cè)量范圍內(nèi)的碎石、陡坡、凸包、隕石坑等障礙進(jìn)行檢測(cè)[13]。為了提高附著安全性,除了考慮探測(cè)器在狀態(tài)不確定條件下的障礙碰撞概率,還需對(duì)星上新檢測(cè)到的環(huán)境障礙與初始最優(yōu)路徑點(diǎn)序列W?間是否存在沖突進(jìn)行實(shí)時(shí)評(píng)估。
第2節(jié)給出標(biāo)稱情況下探測(cè)器附著的多目標(biāo)最優(yōu)路徑點(diǎn)序列,并在環(huán)境與軌跡存在沖突時(shí),局部調(diào)整路徑點(diǎn)實(shí)現(xiàn)障礙規(guī)避。而在實(shí)際附著過程中,探測(cè)器還需要對(duì)規(guī)劃得到的路徑點(diǎn)序列進(jìn)行實(shí)時(shí)跟蹤,生成滿足系統(tǒng)動(dòng)力學(xué)的安全附著軌跡。
在現(xiàn)有跟蹤控制方法中,模型預(yù)測(cè)控制[23-24]根據(jù)系統(tǒng)最新狀態(tài),通過在有限時(shí)域上反復(fù)求解最優(yōu)控制問題,在降低優(yōu)化問題求解難度的同時(shí),提高了多約束下系統(tǒng)跟蹤性能。本節(jié)基于模型預(yù)測(cè)控制方法構(gòu)造路徑點(diǎn)跟蹤控制律,通過考慮動(dòng)力學(xué)方程環(huán)境擾動(dòng)與模型線性化導(dǎo)致的有界建模誤差,實(shí)現(xiàn)對(duì)所規(guī)劃路徑點(diǎn)序列的實(shí)時(shí)魯棒跟蹤。
具體來說,在探測(cè)器跟蹤路徑點(diǎn)序列向著陸點(diǎn)運(yùn)動(dòng)過程中,結(jié)合探測(cè)器動(dòng)力學(xué)方程與實(shí)時(shí)狀態(tài)更新,采用模型預(yù)測(cè)控制方法構(gòu)造路徑點(diǎn)跟蹤優(yōu)化性能指標(biāo),通過對(duì)探測(cè)器控制量進(jìn)行優(yōu)化,生成動(dòng)力學(xué)建模誤差下的路徑點(diǎn)序列跟蹤軌跡。
其中:Nf為有限時(shí)域長(zhǎng)度;k為當(dāng)前有限時(shí)域的第k步;Q,R為地面提前選定的正定矩陣,為保證優(yōu)化結(jié)果收斂性,矩陣 P通過求解里卡蒂方程得到
圖2 仿真地形與初始最優(yōu)路徑點(diǎn)序列Fig.2 Simulated terrain model and the initial optimal waypoint sequence
圖3 X-Z平面內(nèi)的初始最優(yōu)路徑點(diǎn)序列Fig.3 The Pareto optimal waypoint sequence on the X-Z plane
圖4 實(shí)際跟蹤軌跡在X-Z平面投影Fig.4 The projection of the landing trajectory on the X-Z plane
圖5 探測(cè)器位置與速度在X軸和Z軸的變化Fig.5 Positions and velocities of the spacecraft on X and Z axes
圖6 X-Z平面內(nèi)的重規(guī)劃路徑點(diǎn)序列Fig.6 The re-planning waypoint sequence on the X-Z plane
本文結(jié)合小行星探測(cè)器狀態(tài)不確定性與實(shí)時(shí)障礙檢測(cè)結(jié)果,對(duì)復(fù)雜形貌小行星附著軌跡動(dòng)態(tài)規(guī)劃方法展開研究。在多目標(biāo)優(yōu)化理論基礎(chǔ)上,考慮附著過程工程約束,通過魯棒跟蹤最優(yōu)路徑點(diǎn)序列并局部重規(guī)劃沖突路徑點(diǎn),得到對(duì)小行星復(fù)雜形貌環(huán)境具有自適應(yīng)能力的軌跡動(dòng)態(tài)規(guī)劃方法。仿真結(jié)果表明該算法可生成與環(huán)境相匹配的安全附著軌跡,并在新障礙出現(xiàn)時(shí),通過調(diào)整最少路徑點(diǎn)對(duì)障礙進(jìn)行有效規(guī)避。