張洪禮,韓潮,胡雯婷
(1. 北京航空航天大學(xué) 宇航學(xué)院,北京 100191;2. 北京機電工程研究所,北京 100074)
基于UKF參數(shù)估計的地月自由返回軌道設(shè)計
張洪禮1,2,韓潮1*,胡雯婷2
(1. 北京航空航天大學(xué) 宇航學(xué)院,北京 100191;2. 北京機電工程研究所,北京 100074)
為快速簡便地設(shè)計地月自由返回軌道,提出了一種基于UKF參數(shù)估計算法的地月自由返回軌道設(shè)計方法。該算法不僅避免了傳統(tǒng)數(shù)值方法推導(dǎo)相關(guān)梯度矩陣的復(fù)雜性,而且只需基于地月系統(tǒng)二體模型給出猜測初值,從而顯著降低了自由返回軌道設(shè)計的難度,將地月自由返回軌道對應(yīng)的兩點邊值問題的求解轉(zhuǎn)化為參數(shù)估計問題,該算法可以得到高精度模型下收斂的精確解。數(shù)值仿真結(jié)果表明:該算法結(jié)構(gòu)簡潔,求解效率較高,所得結(jié)果精確且具有良好的魯棒性,可以作為地月自由返回軌道設(shè)計的一個有力工具。
地月自由返回軌道;微分修正法;無跡卡爾曼濾波;參數(shù)估計
自20世紀(jì)的探月工程開始,地月自由返回軌道就受到了廣泛關(guān)注。當(dāng)故障發(fā)生時自由返回軌道提供了乘員救生的機會,對當(dāng)前及未來的探月任務(wù)具有重要的工程意義。最早的3次阿波羅任務(wù)就采用了自由返回軌道,對保證任務(wù)的成功起了重要作用。
從Apollo時代起,很多學(xué)者致力于地月系統(tǒng)中自由返回軌道的研究。Schwaniger利用圓形限制性三體系統(tǒng)的鏡面對稱原理,研究了具有對稱特性的自由返回軌道[1],但該方法局限于對稱自由返回軌道。Jesick和Ocampo在此基礎(chǔ)上研究了對稱自由返回軌道的設(shè)計方法,并使用多點打靶和序列二次規(guī)劃對其進(jìn)行了優(yōu)化,但這種方法計算量比較大,并且仍然局限于對稱自由返回軌道[2]。Green提出了一種基于初始設(shè)計搜索自由返回軌道精確解的梯度法[3],但此方法收斂性能不佳,并且需要人工干預(yù)。Miele利用鏡像特性和微分修正法,研究了月球和火星任務(wù)的自由返回軌道的最優(yōu)化問題[4]。Peng引入優(yōu)化算法,提出了基于PSO和SQP算法的串行軌道設(shè)計策略,并對自由返回軌道的全局特性進(jìn)行了研究,但求解效率不能令人滿意[5]。Luo提出了一種基于偽狀態(tài)理論的地月自由返回軌道設(shè)計方法,這種方法與基于圓錐曲線拼接的方法相比,能夠極大提高初始設(shè)計解的精度,但相對來說比較復(fù)雜[6]。
地月自由返回軌道設(shè)計本質(zhì)上是一個兩點邊值問題,一般的求解過程分為2步:首先通過解析方法和簡化的地月系統(tǒng)動力學(xué)模型得到設(shè)計初值;然后采用數(shù)值方法或優(yōu)化算法搜索完整動力學(xué)模型對應(yīng)的精確解。對于自由返回軌道,由于模型的敏度和非線性程度非常高,對猜測初值的精確度和精確解求解算法的收斂性都提出了苛刻的要求。在地月自由返回軌道設(shè)計中,微分修正法是最常用的精確解求解方法,但在實際應(yīng)用中會遇到一定困難。考慮到模型對初值的高度敏感性,通常需要良好的初值,作為迭代求解精確解的基礎(chǔ)。但是在不清楚解空間結(jié)構(gòu)的情況下,很難通過簡單的方法獲得良好的初值。
為了解決上述的問題,本文提出一種基于UKF參數(shù)估計算法(UPE)的地月自由返回軌道設(shè)計方法。該方法通過生成采樣點高效地估計Jacobian矩陣,從而避免了微分修正法等傳統(tǒng)數(shù)值方法推導(dǎo)相關(guān)梯度矩陣的復(fù)雜性。另外,由于該方法具有大范圍收斂特性,從而只需基于地月系統(tǒng)二體模型給出猜測初值,就可以通過若干迭代獲得收斂的精確解,從而極大地降低了自由返回軌道設(shè)計的難度。因此,該方法可用來高效準(zhǔn)確地設(shè)計地月自由返回軌道。
1.1 動力學(xué)模型
在初值設(shè)計時,本文使用二體模型。二體模型是地月系統(tǒng)最簡單的近似模型,該模型略去其它天體引力對探測器運動的影響,探測器只在地心引力場內(nèi)運動,月球是繞地心做約束圓周運動的空間幾何點,這樣就把地月轉(zhuǎn)移軌道設(shè)計問題轉(zhuǎn)化為在地球引力場中的探測器-月球交會或攔截問題。
在精確解求解時,本文使用高精度軌道預(yù)報模型。除了考慮地球和月球的中心引力,同時考慮地球的J2項非球形攝動、太陽的第三體引力和太陽光壓攝動,其中,太陽和月球的真實空間位置通過DE405星歷獲取,太陽光壓攝動模型選為圓柱陰影模型,光壓系數(shù)選為1.95,光照面積選為20 m2。
1.2 約束分析
對于自由返回軌道,給定起始時刻和轉(zhuǎn)移時間時,整條軌道就由初始狀態(tài)決定。工程實際情況中,自由返回軌道的設(shè)計需要滿足施于3個特殊點上的一系列約束條件,即起始點、近月點和再入點。
在起始點,奔月軌道傾角是由發(fā)射場決定的,奔月軌道起始點地心距是根據(jù)運載的能力或停泊軌道確定,一般要求起始點為近地點。在近月點,為保證良好的觀測條件,并且能完成近月點制動,近月點月心距和到達(dá)近月點時間一般是給定的。在再入點,為滿足再入時的熱防護(hù)需求,再入角有嚴(yán)格的限制,而再入點地心距是根據(jù)稠密大氣層的高度確定的。為了確保問題有解,對再入時間沒有嚴(yán)格的要求,并且通過調(diào)整轉(zhuǎn)移起始時間等其他參數(shù)來滿足再入傾角和著陸場的限制。
地月系統(tǒng)最簡單的近似模型是二體模型,在二體模型下,探測器的軌跡為地心圓錐曲線,即開普勒軌道。關(guān)于開普勒軌道的兩點邊值問題一直以來受到人們的關(guān)注,其中Lambert問題是最受人關(guān)注的問題之一,在近地和深空軌道設(shè)計中都得到了成功的應(yīng)用。
在地月轉(zhuǎn)移軌道設(shè)計中,經(jīng)常遇到另一種開普勒軌道的兩點邊值問題,要求根據(jù)給定的起始點的徑向距離和飛行方向角、終止點的徑向距離,求解一條在給定飛行時間內(nèi)從起始點轉(zhuǎn)移到終止點的開普勒軌道,例如地月自由返回軌道設(shè)計中對起始點飛行方向角和再入角的約束,這類問題被稱為約束起始點飛行方向角的類Lambert問題,往往比經(jīng)典的Lambert問題更為復(fù)雜。Luo提出了一種解決此問題的有效方法[7],本文利用其中的計算方法給出自由返回軌道的初值。
圖 1 約束起始點飛行方向角的類Lambert問題Fig. 1 Quasi-Lambert’s problem with fixed flight-path angle constraint
首先,根據(jù)約束分析,給定起始點的地心距R0和飛行方向角γ1、地月轉(zhuǎn)移時間TE2L和轉(zhuǎn)移起始時間T0,如從近地點出發(fā),則γ1=π/2,由T0和DE405星歷可以得到地月距RL,問題歸結(jié)于求解對應(yīng)的約束起始點飛行方向角的類Lambert問題,如圖 1所示。利用相關(guān)文獻(xiàn)中的方法,就可以求得一條滿足條件的奔月軌道,這實際上是一條對稱的自由返回軌道[;最后,可以進(jìn)]一步求得迭代變量的初值w0=vTLI,0?TLI,0ωTLI,0T,其中vTLI,0、?TIL,0、ωTLI,0分別為起始點的近地點速度、升交點赤經(jīng)、近地點幅角,作為下一步利用UKF濾波器進(jìn)行參數(shù)估計的基礎(chǔ)。
在初值的基礎(chǔ)上w0,進(jìn)一步研究通過數(shù)[值方法搜索高精度軌道預(yù)報模型下的精確解對于自由返回軌道,自由變量選為:w= [vTLI?TLIωTLI]T,約束條件為
d被看作w經(jīng)過非線性映射后的輸出,即:
其中:F為打靶函數(shù),實際上是從初始狀態(tài)到末端狀態(tài)的積分。
該問題本質(zhì)上是求解一個具有三個變量和三個方程的非線性方程組F(w)=0,即尋找某個向量w?使得F(w?)=0。微分修正法是常用的求解非線性方程組的方法之一,迭代公式如下S={Wiχi},使得它們的平均值等于wk,方差等于Pwk。接下來,對每個采樣點進(jìn)行非線性映射F,以獲得新的一組投影點L={Wi,di}。輸出的估計平均值dk和方差Pdkdk可以通過求投影點的帶權(quán)重的平均值和方法近似獲得。這樣,通過以下UPE方法的迭代過程,可以獲得迭代序列{wk}
本文提出一種基于UKF參數(shù)估計的算法來求解該問題。不同于微分修正法,把w看成平均值wk和方差Pwk的三維隨機變量。然后,選擇一組帶權(quán)重的采樣點
其中:Kk是卡爾曼增益矩陣。通過逐步更新wk,序列{dk}逼近于零,當(dāng)和足夠接近于零,認(rèn)為滿足施加的約束,此時的即為精確解。整個迭代過程如圖 2所示,盡管形式上與微分修正法類似,但UKF方法本質(zhì)上是不同的,是基于概率理論的。
圖 2 UKF參數(shù)估計示意圖Fig. 2 UKF parameter estimation
將原問題改寫為狀態(tài)空間表達(dá)式為
其中:w為待估計參數(shù);d為輸出,期望值為零;F為非線性測量;rk~N(0, Rr)為系統(tǒng)噪聲;ek~N(0, Re)為測量噪聲。
對于該確定性問題,rk和ek應(yīng)該設(shè)為零,但考慮到保證數(shù)值穩(wěn)定性,Rr和Re通常設(shè)為小值。這樣,UPE算法可以用來求解待估計參數(shù),如圖 3所示,關(guān)于UPE算法的詳細(xì)描述可參見文獻(xiàn)[8]。尺度因子決定了采樣點的分布大小,一般設(shè)為[10?4,1],β考慮了w的先驗分布,一般設(shè)為0,一般有兩種常用的更新方法,其中η∈[0,1],ρRLS∈(0,1]。UPE算法的計算復(fù)雜度受采樣點的個數(shù)影響很大,當(dāng)給定待估計參數(shù)的維度后,由采樣策略唯一確定??紤]到地月自由返回軌道設(shè)計的高度非線性,本文選擇將超球形單形采樣[9]和比例采樣[10]結(jié)合起來作為采樣策略。通過將原問題進(jìn)行合適的單位化處理,可以增強求解問題的穩(wěn)定性,因此在本文研究的算例中,所有自由變量和約束條件都被處理為個位數(shù)的量級,以提高數(shù)值搜索的穩(wěn)定性。
圖 3 UKF參數(shù)估計流程圖Fig. 3 UKF-PE flowchart
針對以上軌道設(shè)計方法,下面考慮一組仿真算例,對比微分修正法和UPE方法在地月自由返回軌道設(shè)計中的表現(xiàn)。本文中的微分修正法采用了目前應(yīng)用最廣泛的擬牛頓法-Broyden方法,并不需要推導(dǎo)Jacobian矩陣。由于地月幾何關(guān)系對自由返回軌道設(shè)計的影響很大,本文選擇了月球公轉(zhuǎn)周期中的4個特殊算例,如表 1所示。
首先,通過求解相應(yīng)的類Lambert問題,4個算例的初值可以在地月二體模型下生成,如表 2所示。實際上,對于每個算例都存在2個初值,分別對應(yīng)著地球順行出發(fā)和地球逆行出發(fā)2種情況。不失一般性,本文只討論地球逆行出發(fā)這種情況。
在初值基礎(chǔ)上,微分修正法和UPE方法用來搜索收斂精確解。迭代停止條件選為
表 1 初始條件Table 1 Initial conditions
表 2 UPE方法的求解性能Table 2 Targeting performance of UPE
其中ε=10?5。另外,每種方法的最大迭代次數(shù)為300。對于UPE方法的詳細(xì)設(shè)置,Pw0設(shè)為I,R0r設(shè)為10–4I,R0
e設(shè)為10–20I,W0設(shè)為0.5,尺度因子α設(shè)為5×10?4,β設(shè)為0,權(quán)重因子η設(shè)為0.5。微分修正法對于上述4個算例都無法獲得收斂的精確解,而UPE方法可以通過若干迭代后搜索到收斂的精確解并且獲得穩(wěn)健的收斂表現(xiàn)。初值(IE)、最終解(FS)、約束函數(shù)值(f(d))、迭代次數(shù)(Iter)如表 2所示,目標(biāo)參數(shù)的誤差如表 3所示。
從表 2可以看出,UPE方法可以在30步之內(nèi)搜索到精確解,并且表現(xiàn)了良好的收斂特性。從表 3可以看出,高度的誤差小于15 m,飛行方向角的誤差小于10–4(°),這表明約束條件得到了很好的滿足。因此,UPE算法在地月自由返回軌道設(shè)計中的有效性得到驗證。
表 3 目標(biāo)參數(shù)誤差Table 3 Errors of the targeting parameters of UKF-PE
為了進(jìn)一步研究UKF參數(shù)估計算法的收斂域,對于該算例最終解的某一個分量添加擾動,而另外兩個分量保持不變。從這個擾動點出發(fā),分別使用微分修正算法和UKF參數(shù)估計算法來搜索轉(zhuǎn)移軌道的精確解,不斷增加擾動量,一直到精確解搜索過程發(fā)散,由此得到這2種算法對于特性的擾動分量的收斂域,2種算法的收斂域統(tǒng)計如表 4。
從表 4可以看出,自由變量的單個分量收斂域與約束條件之間沒有特定的規(guī)律,而僅僅有很大的變化區(qū)間,體現(xiàn)了該問題收斂域具有十分復(fù)雜的幾何結(jié)構(gòu),這也是由于自由返回軌道的高度非線性特性導(dǎo)致的。另外,UKF參數(shù)估計算法的收斂范圍比微分修正算法更大,在最差的情況,微分修正法的和的收斂域只有約1°,這意味著需要非常好的初值。根據(jù)進(jìn)一步的算例驗證,對于地月自由返回軌道設(shè)計問題,在平均水平上,UKF參數(shù)估計算法的收斂域是微分修正算法收斂域的10~15倍。
表 4 一維搜索空間中的收斂域?qū)Ρ萒able 4 Convergence domains in the one-dimensional search space
本文提出了一種基于UKF參數(shù)估計的從初步設(shè)計到高精度設(shè)計的地月自由返回軌道設(shè)計方法。該方法只需要利用地月二體模型給出的初值,同時避免了傳統(tǒng)數(shù)值方法對梯度矩陣的推導(dǎo),因此極大地降低了自由返回軌道設(shè)計的難度。利用該方法求解得到的自由返回軌道,可以很好地滿足探月任務(wù)的各類約束條件。數(shù)值仿真表明:該方法具有收斂域廣、收斂速度較快、魯棒性好等優(yōu)點。因此,該方法可以作為地月自由返回軌道設(shè)計的一個有力工具。
[1]Schwaniger A J. Trajectories in the earth-moon space with symmetrical free return properties, Technical Note D-1833[R]. [S. l]:National Aeronautics and Space Administration,1963.
[2]Jesick M,Ocampo. Automated generation of symmetric lunar freereturn trajectories[J]. Journal of Guidance,Control,and Dynamics,2011,34(1):98-106.
[3]Green B S,LewinN. A gradient method for obtaining circumlunar trajectories[C]// AIAA Astrodynamics conference. [S.l]:AIAA,1963.
[4]Miele A,Wang T,Mancuso S. Optimal free-return trajectories for moon missions and mars missions[J]. Journal of the Astronautical Sciences,2000,48(2-3):183-206.
[5]Peng Q B,Shen H X,Li H Y. Free return orbit design and characteristics analysis for manned lunar mission[J]. Science China Technological Sciences,2012,54(12):3243-3250.
[6]Luo Q,Yin J,Han C. Design of earth-moon free-return trajectories[J]. Journal of Guidance,Control,and Dynamics,2012,36(1):263-271.
[7]Luo Q,Meng Z,Han C. Solution algorithm to a quasi-lambert's problem with fixed flight-direction angle constraint[J]. Celestial Mechanics and Dynamical Astronomy,2011,109(4):409-427.
[8]Haykin S. Kalman filtering and neural networks[M]. New York:John Wiley &Amp Sons Inc,2001.
[9]Julier S J. The spherical simplex unscented transformation [C]//Proceedings of the American Control Conference. Denver,Colorado:[s. n.],2003.
[10]Julier S J. The scaled unscented transformation[C]//Proceedings of the American Control Conference. Anchorage:[s. n],2002.
通信地址:北京航空航天大學(xué)宇航學(xué)院新主樓B1110室(100191)
電話:(010)82316536
E-mail:zhanghongli@buaa.edu.cn
Design of Lunar Free-Return Trajectories Based on UKF Parameter Estimation
ZHANG Hongli1,2,HAN Chao1*,HU Wenting2
(1. School of Astronautics, Beihang University, Beijing 100191, China;2. Beijing Institute of Mechanical and Electrical Engineering, Beijing 100074, China)
A fast and convenient design-method based on UKF parameter estimation is proposed for lunar free-return trajectories. The method proposed avoids calculating the Jacobian matrix and obtains large convergence ability compared with the common differential-correction method. Given that the initial estimate of the free-return trajectory is generated under the two-body Earth-spacecraft model, the difficulty of guessing a good initial estimate is greatly reduced. Through solving the converted parameter estimation problem using the method proposed, the converged final solution can be found under a high-fidelity gravitational model by a few iterations. Despite its simplicity, the method is proves to be quite effective in finding the solution of lunar free-return trajectories with great numerical accuracy.
lunar free-return trajectories;differential-correction method;unscented Kalman filter;parameter estimation
V412.4
A
2095-7777(2017)02-0178-06
10.15982/j.issn.2095-7777.2017.02.012
張洪禮(1988– ),男,博士生,主要研究方向:航天器軌道動力學(xué)與仿真。
[責(zé)任編輯:宋宏,英文審校:朱魯青]
張洪禮,韓潮,胡雯婷. 基于UKF參數(shù)估計的地月自由返回軌道設(shè)計[J]. 深空探測學(xué)報,2017,4(2):178-183.
Reference format: Zhang H L,Han C,Hu W T. Design of lunar free-return trajectories based on UKF parameter estimation [J]. Journal of Deep Space Exploration,2017,4(2):178-183.
2015-09-20
2015-12-02