李九天, 羅亞中, 唐國(guó)金
(國(guó)防科學(xué)技術(shù)大學(xué) 航天與材料工程學(xué)院, 湖南 長(zhǎng)沙 410073)
路徑約束的時(shí)間最短多脈沖交會(huì)全局優(yōu)化
李九天, 羅亞中, 唐國(guó)金
(國(guó)防科學(xué)技術(shù)大學(xué) 航天與材料工程學(xué)院, 湖南 長(zhǎng)沙 410073)
不同于現(xiàn)有的多脈沖最優(yōu)交會(huì)研究多集中于交會(huì)時(shí)間固定的最省燃料優(yōu)化,研究了路徑約束和脈沖受限的多脈沖最短時(shí)間交會(huì)問(wèn)題。綜合考慮了交會(huì)測(cè)量視場(chǎng)角、脈沖總量和脈沖作用時(shí)刻等約束,基于Lambert交會(huì)算法,建立了多脈沖交會(huì)最短時(shí)間優(yōu)化的非線性規(guī)劃模型。為了高效獲得全局最優(yōu)解,采用了模擬退火算法用于非線性?xún)?yōu)化問(wèn)題的求解。最后,通過(guò)解決一個(gè)尋的三脈沖交會(huì)問(wèn)題驗(yàn)證了模型和算法的有效性。該研究方法可尋找滿(mǎn)足特定約束條件的最優(yōu)交會(huì)軌道。
多脈沖交會(huì); 最短時(shí)間; 模擬退火算法; 視場(chǎng)約束
多脈沖最優(yōu)交會(huì)是交會(huì)問(wèn)題研究中的一個(gè)重要方面,國(guó)內(nèi)外學(xué)者在此方面取得了豐碩的研究成果[1-2]。目前的研究多集中于交會(huì)時(shí)間固定的燃料消耗最省,對(duì)于空間救援活動(dòng)等實(shí)際交會(huì)問(wèn)題,滿(mǎn)足一定燃料消耗約束的最短時(shí)間交會(huì)研究則具有一定意義。雖然文獻(xiàn)[3]等基于C-W方程研究了脈沖總量和最大脈沖受限的時(shí)間最短線性交會(huì)問(wèn)題,但是目前最短時(shí)間多脈沖交會(huì)問(wèn)題的研究仍較少。
本文考慮了更為實(shí)際的測(cè)量視場(chǎng)約束,基于非線性二體方程研究了最短時(shí)間多脈沖交會(huì)問(wèn)題。
航天器交會(huì)起動(dòng)的初始條件是t0,r0,v0,終端條件是tf,rf,vf。假定航天器軌道機(jī)動(dòng)過(guò)程中滿(mǎn)足中心反平方引力場(chǎng)假設(shè),則動(dòng)力學(xué)方程為:
(1)
脈沖施加時(shí),施加前的狀態(tài)用“-”表示,施加后的狀態(tài)用“+”表示,則有:
(2)
為便于表示,不加區(qū)分地令
(3)
并令r(t+Δt)=f(r(t),v(t),t,t+Δt)和v(t+Δt)=g(r(t),v(t),t,t+Δt)為式(1)的解。則對(duì)于一個(gè)中間脈沖(i≠1,i≠n,n>2),滿(mǎn)足如下條件:
(4)
第一脈沖作用前狀態(tài)滿(mǎn)足如下條件:
(5)
式中,t1為第一個(gè)脈沖作用時(shí)刻。
終端約束如下:
(6)
式中,t0和tf為給定多脈沖交會(huì)的起始和結(jié)束時(shí)刻。
(7)
通常選擇總的速度增量為優(yōu)化指標(biāo):
(8)
式(7)和式(8)表示了非線性最優(yōu)交會(huì)優(yōu)化問(wèn)題,其規(guī)劃模型可分為可行解迭代規(guī)劃模型和非可行解迭代規(guī)劃模型[2]。構(gòu)造非線性交會(huì)可行解迭代規(guī)劃模型的一個(gè)重要問(wèn)題就是選擇合適的獨(dú)立變量,同時(shí)通過(guò)引入Lambert算法用于自動(dòng)滿(mǎn)足終端條件,Hughes等[4]對(duì)此進(jìn)行了較為詳細(xì)的討論。本文選用了其中一個(gè)優(yōu)化模型,簡(jiǎn)述如下。
優(yōu)化變量選為脈沖時(shí)刻和脈沖矢量:
(9)
(10)
3.1 優(yōu)化變量
由于是最短時(shí)間交會(huì),tf為設(shè)計(jì)變量。式(9)所表示的脈沖點(diǎn)火時(shí)刻ti(i=1,2,…,n)和脈沖矢量Δvj(j=1,2,…,n-2)也為優(yōu)化變量。為有效提高優(yōu)化性能,對(duì)脈沖變軌時(shí)刻進(jìn)行歸一化處理。令αi=(ti-t0)/(tf-t0),并限定αi≤1。因此,本文選擇的優(yōu)化變量x包括:
x=[tf,α1,…,αn,Δv1,…,Δvn-2]T
(11)
3.2 目標(biāo)函數(shù)和約束條件
本文研究的最短時(shí)間交會(huì),目標(biāo)函數(shù)不同于式(8),而是交會(huì)的總時(shí)間:
J=min (tf-t0)
(12)
約束主要考慮三個(gè)方面:變軌時(shí)刻、脈沖總量約束和測(cè)量視場(chǎng)約束等。變軌點(diǎn)時(shí)刻滿(mǎn)足的約束條件為:
t0≤t1 (13) 更進(jìn)一步考慮實(shí)際要求,如考慮脈沖機(jī)動(dòng)的調(diào)姿準(zhǔn)備需要,要求任意兩個(gè)脈沖作用時(shí)刻的間距大于一定的值。該約束表述如下: ti+1-ti≥Δt(i=1,2,…,n-1) (14) 脈沖總量約束如下: (15) 式中,Δvtotal為最大允許脈沖總量。 在現(xiàn)有的自主交會(huì)導(dǎo)航敏感器中,大多均受到測(cè)量視場(chǎng)的限制,并且具有隨相對(duì)距離減少視場(chǎng)范圍不斷減少的特點(diǎn)。因此,通常采用圓錐體模型近似表達(dá)受限條件,其中錐頂為目標(biāo)航天器質(zhì)心,軸線為接近軸方向,即目標(biāo)航天器運(yùn)動(dòng)速度方向,錐頂角θ表示視場(chǎng)受限角。視場(chǎng)角(FOV)定義如下[2]: θ(t)=arctan|y(t)/x(t)| (16) 則視場(chǎng)角約束表述如下: (17) 一個(gè)典型的測(cè)量視場(chǎng)角受限示意圖如圖1所示。 圖1 測(cè)量視場(chǎng)受限與相對(duì)位置軌跡之間的關(guān)系 采用一個(gè)簡(jiǎn)化的方法計(jì)算θm。在[t0,tf]等距離選擇m個(gè)點(diǎn)(t1,t2,…,tm),計(jì)算θ(ti),令θm=max (θ(t1),…,θ(tm))。 3.3 優(yōu)化算法 最短時(shí)間多脈沖交會(huì)問(wèn)題本質(zhì)上是一個(gè)終端時(shí)刻可變的最優(yōu)控制問(wèn)題,該類(lèi)問(wèn)題屬于最優(yōu)控制問(wèn)題中較難解決的一類(lèi)。 本文綜合考慮各類(lèi)型約束條件,建立多脈沖最短時(shí)間交會(huì)的非線性規(guī)劃模型。根據(jù)數(shù)值試驗(yàn),經(jīng)典的非線性規(guī)劃算法如序列二次規(guī)劃算法(Sequential Quadratic Programming, SQP)和單純形法很難獲得該問(wèn)題的最優(yōu)解。本文采用全局收斂性較好的模擬退火算法[2]和遺傳算法進(jìn)行求解,取得了較好的應(yīng)用效果,其中約束條件處理采用罰函數(shù)法。遺傳算法基本配置如下:實(shí)數(shù)編碼、算術(shù)交叉算子、非均勻變異算子、基于最優(yōu)保留策略的聯(lián)賽競(jìng)爭(zhēng)算子為選擇算子。 假設(shè)目標(biāo)航天器在400 km高度的圓軌道上運(yùn)行,采用建立在目標(biāo)航天器質(zhì)心上的軌道坐標(biāo)系描述交會(huì)問(wèn)題,其中x沿速度反向,y沿地心向上,z由右手法則確定,如圖1所示。算例為尋的段交會(huì)問(wèn)題。在尋的段,兩個(gè)航天器由相距幾十千米經(jīng)過(guò)若干次軌道機(jī)動(dòng)到相距幾千米處,在此階段的導(dǎo)航由星載測(cè)量設(shè)備完成。通常受視場(chǎng)角限制,綜合考慮燃料最優(yōu)和誤差修正因素,該階段的軌道機(jī)動(dòng)次數(shù)(n)通常為3~4次。追蹤航天器在目標(biāo)航天器軌道坐標(biāo)系中的初始相對(duì)狀態(tài)為(65 000 m,-22 000 m,0 m,-4 m/s,0 m/s,0 m/s),交會(huì)終端相對(duì)狀態(tài)為(3000 m,0 m,0 m,0 m/s,0 m/s,0 m/s)。交會(huì)過(guò)程中,n=3,Δvtotal=15 m/s,Δt=100 s,θFOV/2=40°。 為了測(cè)試優(yōu)化算法的有效性,測(cè)試對(duì)比了模擬退火算法、遺傳算法、單純形算法和序列二次規(guī)劃算法的性能,隨機(jī)產(chǎn)生初始點(diǎn),每類(lèi)算法都隨機(jī)運(yùn)行30次。表1給出了算法的統(tǒng)計(jì)結(jié)果。 表1 不同優(yōu)化算法的優(yōu)化統(tǒng)計(jì)結(jié)果 注:交會(huì)時(shí)間是針對(duì)所有可行解的統(tǒng)計(jì)結(jié)果;遺傳算法和模擬退火算法均以目標(biāo)函數(shù)計(jì)算次數(shù)為20 000作為終止條件;收斂概率是指獲得可行解的概率。 由表1可知,經(jīng)典的優(yōu)化算法(包括單純形算法和序列二次規(guī)劃算法)收斂可靠性非常低;遺傳算法表現(xiàn)出了100%的收斂可靠性,稍高于模擬退火算法的90%,但解的最優(yōu)性顯著差于模擬退火算法。根據(jù)數(shù)值實(shí)驗(yàn)和相關(guān)分析,因?yàn)橐肓艘晥?chǎng)角約束,使得該問(wèn)題具有強(qiáng)約束、非光滑特性,所以序列二次規(guī)劃算法這一對(duì)光滑約束問(wèn)題非常有效的算法在求解該問(wèn)題時(shí)難以收斂。應(yīng)用遺傳算法和模擬退火算法時(shí),采取了罰函數(shù)法處理約束。一般而言,模擬退火算法收斂性受罰函數(shù)影響更大一些,對(duì)罰函數(shù)進(jìn)行精細(xì)調(diào)整可以提高模擬退火算法的優(yōu)化效果。對(duì)于實(shí)際求解,推薦采用模擬退火算法。 在上述測(cè)試中,獲得最優(yōu)解對(duì)應(yīng)的交會(huì)時(shí)間為2 973.5 s,對(duì)應(yīng)的總的速度增量為14.97 m/s,實(shí)際最大視場(chǎng)角為39.994°,最優(yōu)解是在接近約束邊界處獲得的。 圖2給出了該最優(yōu)解對(duì)應(yīng)的相對(duì)速度變化曲線,圖3給出了在目標(biāo)航天器軌道平面內(nèi)的追蹤航天器接近示意圖。 根據(jù)數(shù)值實(shí)驗(yàn)和相關(guān)分析,得到了如下一些基本結(jié)論: (1)視場(chǎng)角和脈沖總量約束的最短時(shí)間最優(yōu)交會(huì)問(wèn)題求解非常困難,經(jīng)典的優(yōu)化算法收斂性很差,引入模擬退火算法和遺傳算法則可以取得較好的效果; (2)當(dāng)視場(chǎng)角和脈沖總量約束均為有效約束時(shí),最優(yōu)解通常在邊界處獲得; (3)脈沖數(shù)目的增大可保證視場(chǎng)角約束得到滿(mǎn)足,對(duì)于本文測(cè)試的尋的交會(huì)問(wèn)題,其燃料最優(yōu)解多數(shù)是二脈沖解,但是二脈沖由于對(duì)自身飛行軌跡的調(diào)整有限,難以滿(mǎn)足視場(chǎng)角約束。 圖2 相對(duì)速度隨時(shí)間變化曲線 圖3 軌道面內(nèi)追蹤接近目標(biāo)位置變化示意圖 本文研究了含測(cè)量視場(chǎng)約束的最短時(shí)間多脈沖交會(huì)問(wèn)題,建立起了考慮測(cè)量視場(chǎng)、脈沖總量和脈沖機(jī)動(dòng)時(shí)刻約束的非線性規(guī)劃模型,采用模擬退火算法作為優(yōu)化算法,通過(guò)算例驗(yàn)證了模型和算法的有效性。研究成果可尋找滿(mǎn)足特定約束條件的最優(yōu)交會(huì)軌道,揭示交會(huì)軌道整體性能指標(biāo)如交會(huì)時(shí)間、燃料消耗和測(cè)量視場(chǎng)角等之間的關(guān)系。 [1] Jezewski D J,Brazzel J P,Prust E E,et al.Survey of rendezvous trajectory planning [J].Advances in the Astronautical Sciences,1992,76:1373-1396. [2] 唐國(guó)金,羅亞中,張進(jìn).空間交會(huì)對(duì)接任務(wù)規(guī)劃[M].北京:科學(xué)出版社,2008. [3] Luo Ya-zhong,Tang Guo-jin,Li Hai-yang.Optimization of multi-impulse minimum-time rendezvous using a hybrid genetic algorithm [J].Aerospace Science and Technology,2006,10(6):534-540. [4] Hughes S P,Mailhe L M,Guzman J J.A comparison of trajectory optimization methods for the impulsive minimum fuel rendezvous problem [J].Advances in the Astronautical Sciences,2003,113:85-104. Globaloptimizationoftime-optimalmultiple-impulserendezvouswithpathconstraints LI Jiu-tian, LUO Ya-zhong, TANG Guo-jin (College of Aerospace and Material Engineering, NUDT, Changsha 410073, China) Different from the current studies on optimal multiple-impulse rendezvous that always concentrate on fuel-optimal time-fixed rendezvous, this paper studies time-optimal multiple-impulse rendezvous with path constraints and impulse constraints. Considering the constraints such as the measure sight-angle, the total impulse magnitude and the time of imposing impulse, a nonlinear programming model for time-optimal multiple-impulse time-optimal rendezvous was established using the Lambert algorithm. In order to obtain the global solution efficiently, a simulated annealing algorithm was employed to resolve the resulting nonlinear optimization problem. The effectiveness of the proposed optimization model and algorithm was testified by solving a three-impulse homing rendezvous problem. The proposed method can be employed to seek the optimal rendezvous trajectory satisfying special constraints. multiple-impulse rendezvous; time-optimal; simulated annealing algorithm; sight-angle constraint 2011-09-09; 2011-12-05 國(guó)家自然科學(xué)基金資助(10902121) 李九天(1975-),男,河南正陽(yáng)人,博士研究生,研究方向?yàn)楹教祜w行任務(wù)規(guī)劃。 V412.4 A 1002-0853(2012)02-0185-04 (編輯:崔立峰)4 計(jì)算結(jié)果及分析
5 結(jié)束語(yǔ)