李海洋 周曉東 張旭光 寶音賀西
(1.上海衛(wèi)星工程研究所,上海 201109) (2.上海航天技術(shù)研究院,上海 201109) (3.清華大學(xué) 航天航空學(xué)院,北京 100084)
探索浩瀚宇宙是人類自古以來的夢想.隨著技術(shù)的進(jìn)步,太空進(jìn)入門檻降低,航天將有望迎來一段黃金時(shí)期,人類需要更加經(jīng)濟(jì)、理性且可持續(xù)的太空探索與開發(fā)方案——多目標(biāo)空間探測即為一種可選方案.多目標(biāo)空間探測是指用一個(gè)或多個(gè)航天器對多個(gè)空間目標(biāo)進(jìn)行探測,其優(yōu)勢在于能夠以較低的花費(fèi)獲取極大的收益,其難點(diǎn)在于任務(wù)的設(shè)計(jì)與優(yōu)化.深空探測任務(wù)設(shè)計(jì)中,部分任務(wù)需要借用行星進(jìn)行引力輔助,或者在探測器完成其主要任務(wù)的前提下順便對其他天體進(jìn)行飛越,這些都屬于一個(gè)航天器訪問多個(gè)目標(biāo)的情況.表1是根據(jù)NASA統(tǒng)計(jì)的1958-2016年的深空探測任務(wù)[1]而整理得到的訪問多個(gè)目標(biāo)的深空探測任務(wù),這些任務(wù)均給人類帶來極大的科學(xué)收益.但是多目標(biāo)空間探測任務(wù)與上述深空探測任務(wù)并不完全相同.上述深空探測任務(wù)以某一目標(biāo)或少量目標(biāo)為主要目標(biāo),其他目標(biāo)的探測是通過借用其進(jìn)行引力輔助或者在訪問主要目標(biāo)的基礎(chǔ)上附加進(jìn)行的.多目標(biāo)空間探測與之不同之處主要有幾點(diǎn):一是多目標(biāo)空間探測并不存在主要目標(biāo),目標(biāo)的選擇是為了任務(wù)整體收益的最大化;二是多目標(biāo)空間探測的目標(biāo)更多,可多達(dá)幾十個(gè);三是多目標(biāo)空間探測并不僅限于深空探測任務(wù),地球軌道同樣有多目標(biāo)空間探測的任務(wù)需求.因此能夠創(chuàng)造更大的收益.
表1 訪問多個(gè)目標(biāo)的深空探測任務(wù)(按發(fā)射日期排序)Table 1 Space missions that visited multiple targets (sorted by launch date)
多目標(biāo)空間探測從任務(wù)目標(biāo)類型上可分為深空任務(wù)和地球軌道任務(wù).深空多目標(biāo)任務(wù)方面,探測目標(biāo)主要為大行星及小天體(小行星和彗星),其中小天體為重點(diǎn)[2].小天體被認(rèn)為保留著太陽系早期物質(zhì),對于研究太陽系起源以及生命起源有著極其重要的科學(xué)價(jià)值;一些小天體上含有儲(chǔ)量豐富的稀有金屬,小天體采礦也有望形成一個(gè)新興產(chǎn)業(yè);同時(shí),一些小天體有著潛在的撞擊地球威脅,對小天體進(jìn)行防御也是非常重要研究內(nèi)容.地球軌道多目標(biāo)任務(wù)方面,由于人類進(jìn)入太空的能力已經(jīng)較為成熟,更加高效地對空間進(jìn)行開發(fā)利用將會(huì)是未來的重點(diǎn),空間碎片清除、在軌燃料加注、在軌維修等方面對多目標(biāo)空間探測均有重大需求.此外,多目標(biāo)空間探測還可以是多個(gè)航天器協(xié)同進(jìn)行,每個(gè)航天器對多個(gè)目標(biāo)進(jìn)行探測;多目標(biāo)空間探測的目標(biāo)并不局限于天體或者航天器,只要有探測價(jià)值均可視為目標(biāo).
雖然多目標(biāo)空間探測有著諸多優(yōu)點(diǎn),但也有許多困難,其中最為主要的困難之一為軌跡優(yōu)化,又分為轉(zhuǎn)移軌跡優(yōu)化和探測序列優(yōu)化兩部分.以多目標(biāo)主帶小行星探測為例,目前已經(jīng)編號(hào)的主帶小行星共計(jì)約12萬顆,假設(shè)篩除掉軌道偏心率較大、軌道傾角較大、以及絕對星等較大的小行星后,還剩下3000顆備選小行星.若考慮單個(gè)航天器訪問10顆小行星的多目標(biāo)任務(wù),每次訪問完一顆小行星后經(jīng)過篩選,下一個(gè)可選目標(biāo)為1000個(gè),其可選的探測序列組合為3×1012個(gè).為了從這些組合中選出最優(yōu)的探測序列,若采用窮舉法對所有的探測序列都進(jìn)行一次評估,假設(shè)每次評估耗時(shí)1ms,則評估完所有探測序列的時(shí)間約為95年(不考慮使用并行計(jì)算等其他方法).通過這一簡單直觀的比較可見多目標(biāo)空間探測任務(wù)設(shè)計(jì)之復(fù)雜,設(shè)計(jì)空間之巨大,優(yōu)化之難.因此,全局優(yōu)化,包含快速準(zhǔn)確的轉(zhuǎn)移軌跡評估方法與高效的探測序列全局優(yōu)化方法,是多目標(biāo)空間探測軌跡優(yōu)化的核心難點(diǎn).
此外,未來航天任務(wù)對航天器的自主性能需求越來越高,對星上實(shí)時(shí)規(guī)劃、自主決策等方面有要求[3],多目標(biāo)空間探測任務(wù)同樣如此.面對未來可能會(huì)存在大量航天器同時(shí)進(jìn)行多目標(biāo)空間探測任務(wù)的情況(如SpaceX的星鏈計(jì)劃),近地衛(wèi)星多航天器多目標(biāo)協(xié)同自主工作將成為新模式,深空探測器由于器地時(shí)延更需要具備器上自主優(yōu)化的能力.此外,多目標(biāo)探測任務(wù)中航天器自主優(yōu)化能力的提升也能大大降低地面飛控系統(tǒng)的負(fù)擔(dān)與壓力.在多目標(biāo)空間探測任務(wù)中,需要能夠?qū)崟r(shí)對轉(zhuǎn)移軌跡和探測序列進(jìn)行優(yōu)化.但是航天器星上計(jì)算能力非常有限,任務(wù)設(shè)計(jì)時(shí)常用的優(yōu)化方法無法在航天器上執(zhí)行,因此與航天器星上計(jì)算能力相適應(yīng)的實(shí)時(shí)優(yōu)化也是多目標(biāo)空間探測軌跡優(yōu)化的重要挑戰(zhàn).
面對上述難點(diǎn)與挑戰(zhàn),智能方法有望提供解決途徑.智能方法在航天動(dòng)力學(xué)領(lǐng)域一直有著廣泛應(yīng)用[4].航天動(dòng)力學(xué)領(lǐng)域應(yīng)用人工智能技術(shù)應(yīng)以需求為導(dǎo)向,從需求出發(fā).作為航天動(dòng)力學(xué)的研究內(nèi)容之一,多目標(biāo)空間探測軌跡優(yōu)化對智能方法的需求與其難點(diǎn)與挑戰(zhàn)是對應(yīng)的.多目標(biāo)空間探測軌跡優(yōu)化的全局優(yōu)化難度很大,需要解決轉(zhuǎn)移軌跡快速評估和探測序列全局優(yōu)化的問題,而智能方法在快速準(zhǔn)確預(yù)測與求解組合優(yōu)化問題上有著優(yōu)異的表現(xiàn).同時(shí),面向未來航天任務(wù)的多目標(biāo)空間探測軌跡優(yōu)化需要具備實(shí)時(shí)優(yōu)化的能力,需要解決轉(zhuǎn)移軌跡實(shí)時(shí)優(yōu)化和探測序列實(shí)時(shí)優(yōu)化的問題,而實(shí)時(shí)優(yōu)化也正是智能方法的研究重點(diǎn)之一.人工智能中常用的方法有樹搜索、進(jìn)化計(jì)算以及機(jī)器學(xué)習(xí),這三種方法也是航天動(dòng)力學(xué)領(lǐng)域應(yīng)用最多的智能方法[4].
多目標(biāo)空間探測軌跡優(yōu)化近十幾年來已逐漸成為軌道動(dòng)力學(xué)與控制領(lǐng)域的研究熱點(diǎn),國際空間軌道設(shè)計(jì)競賽(Global Trajectory Optimization Competition, GTOC)和中國空間軌道設(shè)計(jì)競賽(China Trajectory Optimization Competition, CTOC)在其中起到了重要推動(dòng)作用.本文首先通過國內(nèi)外軌道競賽介紹多目標(biāo)空間探測軌跡優(yōu)化的研究趨勢,然后從轉(zhuǎn)移軌跡優(yōu)化和探測序列優(yōu)化兩個(gè)方面對其中涉及智能方法的研究進(jìn)行綜述,其中,轉(zhuǎn)移軌跡優(yōu)化將分為進(jìn)化計(jì)算方法和機(jī)器學(xué)習(xí)方法兩個(gè)部分進(jìn)行綜述.
多目標(biāo)空間探測軌跡優(yōu)化的研究,以國際空間軌道設(shè)計(jì)競賽GTOC和中國空間軌道設(shè)計(jì)競賽CTOC為代表.兩個(gè)競賽所研究的問題均為極具挑戰(zhàn)、幾乎不可能得到全局最優(yōu)解的問題,其中絕大多數(shù)問題是多目標(biāo)空間探測軌跡優(yōu)化問題.此外,國內(nèi)外高水平的研究團(tuán)隊(duì)都會(huì)參加競賽,因此可以通過梳理競賽來窺探多目標(biāo)軌跡優(yōu)化國際研究趨勢.
GTOC由歐洲空間局先進(jìn)概念組的Dario Izzo博士在2005年發(fā)起,每一年或兩年舉辦一次,至今(2020年)已經(jīng)舉辦了10屆,每屆的冠軍負(fù)責(zé)舉辦下一屆競賽.參與過該項(xiàng)賽事的團(tuán)隊(duì)共有134個(gè),除首屆外其他均為多目標(biāo)空間探測問題.綜合各屆競賽題目來看,多目標(biāo)空間探測的探測目標(biāo)主要為小行星(近地小行星和主帶小行星)、木衛(wèi)系統(tǒng)、宇宙射線源和空間碎片;任務(wù)形式有單個(gè)探測器飛越或者交會(huì)、多個(gè)探測器協(xié)同探測等形式.
從參與團(tuán)隊(duì)來看,在GTOC中起主導(dǎo)地位的為美國噴氣推進(jìn)實(shí)驗(yàn)室(Jet Propulsion Laboratory, JPL)和歐洲空間局先進(jìn)概念組(European Space Agency′s Advanced Concepts Team, ESA-ACT).JPL獲得第一名的次數(shù)遙遙領(lǐng)先.JPL主導(dǎo)或參與了美國的多項(xiàng)深空探測任務(wù),包括表1中提到的先鋒號(hào)系列、水手號(hào)系列、旅行者號(hào)、伽利略號(hào)、卡西尼號(hào)、深空1號(hào)、星塵號(hào)、深度撞擊號(hào)和黎明號(hào),幾乎包含了所有表1中提到的美國任務(wù),可以認(rèn)為JPL無論在科研還是工程上都處于國際領(lǐng)先地位.ESA-ACT雖然僅獲得過一次冠軍,但是其成績始終穩(wěn)定靠前,綜合實(shí)力并不遜于JPL,作為競賽的發(fā)起方始終走在多目標(biāo)空間探測軌跡優(yōu)化研究的最前線.此外,還有美國國家航空航天局多家研究中心(約翰遜研究中心,戈達(dá)德研究中心等)、法國國家太空中心、德國宇航局、俄羅斯赫魯尼契夫國家航天研制中心等多家航天機(jī)構(gòu),都靈理工大學(xué)、格拉斯哥大學(xué)、米蘭理工大學(xué)、莫斯科大學(xué)、奧斯汀大學(xué)等多家歐美航天強(qiáng)校持續(xù)參與到競賽中來并取得不錯(cuò)的成績,充分說明多目標(biāo)空間探測在科研和工程上均是極具挑戰(zhàn)的研究內(nèi)容,一個(gè)團(tuán)隊(duì)需要在科研和工程上都具備扎實(shí)的基礎(chǔ)才可以取得優(yōu)異的成績.
中國研究團(tuán)隊(duì)包括清華大學(xué)、北京航空航天大學(xué)、南京航空航天大學(xué)、中科院、國防科技大學(xué)、西安衛(wèi)星測控中心、北京飛控中心、南京大學(xué)、西北工業(yè)大學(xué)、哈爾濱工業(yè)大學(xué)等(按參賽時(shí)間排序)同樣積極參與到GTOC中來,并且成績整體上在不斷進(jìn)步,在第十屆競賽中首次包攬了前兩名,力壓歐美其他傳統(tǒng)強(qiáng)隊(duì).圖1總結(jié)了各國各次競賽的參賽成績,橫坐標(biāo)為競賽的屆次,縱坐標(biāo)為該國在該次競賽中的分?jǐn)?shù).分?jǐn)?shù)的計(jì)算方法為:該國所有參賽并提交正確結(jié)果的團(tuán)隊(duì)里,第1名得16分,第2名得8分,第3名得4分,第4名得2分,其余得1分;這樣的計(jì)分方式,既能體現(xiàn)該國研究團(tuán)隊(duì)的整體實(shí)力,又能體現(xiàn)該國的參與程度.從圖中可以看出,隨著競賽舉辦次數(shù)的增加,中國研究團(tuán)隊(duì)在不斷縮小與歐美研究團(tuán)隊(duì)的差距,且在第十屆競賽中成為第一;美國在JPL參賽的大多數(shù)屆次中仍然保持領(lǐng)先地位;歐洲中國研究團(tuán)隊(duì)的沖擊分?jǐn)?shù)而受到影響;俄羅斯分?jǐn)?shù)在逐漸下降,這與其參與程度有一定關(guān)系;在美國、中國、歐洲、俄羅斯這四個(gè)航天大國中,中國有著非常強(qiáng)勁的勢頭,這也表明在多目標(biāo)空間探測軌跡優(yōu)化領(lǐng)域中國的研究團(tuán)隊(duì)緊跟著中國從航天大國邁向航天強(qiáng)國的步伐.
圖1 國際軌跡優(yōu)化競賽各國參賽成績Fig.1 Scores of global trajectory optimization competition of various nations
我國的研究團(tuán)隊(duì)能在GTOC中取得如此優(yōu)異的成績,與我國自己的CTOC是分不開的.CTOC由清華大學(xué)在2009年發(fā)起,至今(2020年)已經(jīng)舉辦了十屆,也已經(jīng)有文獻(xiàn)對其進(jìn)行了總結(jié)與回顧[5,6],本文不再贅述.CTOC題目絕大多數(shù)也為多目標(biāo)空間探測軌跡優(yōu)化問題,包括小行星探測、小行星表面巡游、空間碎片清除、多星編隊(duì)、木星磁場與木衛(wèi)探測等.參賽團(tuán)隊(duì)也主要為上述參與過國際軌跡優(yōu)化競賽的團(tuán)隊(duì).每一次的GTOC與CTOC不僅鍛煉了我國的研究團(tuán)隊(duì),也一次次地為多目標(biāo)空間探測任務(wù)提供新的思路,為將來我國開展多目標(biāo)空間探測任務(wù)打下了夯實(shí)的基礎(chǔ).
綜合各研究團(tuán)隊(duì)在競賽中的求解方法來看,智能方法越來越多地被應(yīng)用,而且取得的成績也越來越好[5].最近的兩屆GTOC中排名前三的團(tuán)隊(duì)均采用了智能方法[7-9],可見智能方法在多目標(biāo)空間探測軌跡優(yōu)化中將會(huì)越來越重要.
接下來,本文分別從轉(zhuǎn)移軌跡優(yōu)化和探測序列優(yōu)化兩部分的智能方法進(jìn)行綜述.
轉(zhuǎn)移軌跡的形式一般為脈沖、連續(xù)推力、引力輔助(可以視為一種變軌形式)等.考慮到航天器所攜帶燃料有限且昂貴、任務(wù)時(shí)長有限等因素的制約,轉(zhuǎn)移軌跡設(shè)計(jì)的核心問題即為優(yōu)化問題,優(yōu)化目標(biāo)通常為燃料消耗或者任務(wù)時(shí)長.轉(zhuǎn)移軌跡優(yōu)化問題為復(fù)雜的優(yōu)化問題,存在著許多局部最優(yōu)解.由于該類問題中許多優(yōu)化變量的梯度并不容易解析獲得或者不連續(xù),基于梯度的優(yōu)化方法解決該類問題有著諸多困難,比如對初值的要求較高,或者不易跳出較差的局部解.進(jìn)化計(jì)算,如遺傳算法,差分進(jìn)化,粒子群優(yōu)化等,不需要優(yōu)化變量的梯度,且全局性較好,因此被廣泛應(yīng)用到轉(zhuǎn)移軌跡優(yōu)化中.
Cage等[10]最早在1994年將遺傳算法應(yīng)用到深空脈沖軌跡優(yōu)化中,并且指出遺傳算法明顯優(yōu)于當(dāng)時(shí)通用的網(wǎng)格搜索算法.此后,Kim和Spencer[11]用遺傳算法研究了脈沖交會(huì)問題,并用霍曼轉(zhuǎn)移與雙橢圓轉(zhuǎn)移驗(yàn)證了遺傳算法的最優(yōu)性.Abdelkhalik 和Mortari[12]改進(jìn)了Kim論文中的求解模型,用遺傳算法計(jì)算了其中的算例并得到了更優(yōu)的結(jié)果.Vasile等將分支技術(shù)應(yīng)用在進(jìn)化算法中提出了進(jìn)化分支算法,研究了地火轉(zhuǎn)移多脈沖軌跡優(yōu)化問題[13],也提出了一種基于行為的元啟發(fā)算法應(yīng)用到地球小行星的雙脈沖轉(zhuǎn)移軌跡優(yōu)化中[14].Radice和Olmo[15]用蟻群算法研究了雙脈沖轉(zhuǎn)移問題,不僅得到了之前研究中的最優(yōu)解,還發(fā)現(xiàn)了若干新的局部解.羅亞中[16]使用遺傳算法、并行模擬退火單純形等方法研究了空間最優(yōu)交會(huì)問題.Zhang等用遺傳算法研究了復(fù)雜約束條件下的交會(huì)問題[17]以及多目標(biāo)優(yōu)化問題[18].Yao等[19]提出了一種自適應(yīng)差分進(jìn)化算法研究了脈沖問題.Sentinella和Casalino[20]將差分進(jìn)化、遺傳算法與粒子群優(yōu)化并行計(jì)算優(yōu)化多脈沖問題.Pontani 等[21]用粒子群優(yōu)化研究了多脈沖交會(huì)問題,并建議對于交會(huì)問題可以首先嘗試使用粒子群優(yōu)化.Bessette和Spencer[22]研究了用差分進(jìn)化、粒子群優(yōu)化以及進(jìn)化策略優(yōu)化多脈沖轉(zhuǎn)移并進(jìn)行比較,發(fā)現(xiàn)粒子群優(yōu)化效果更好.可以將進(jìn)化計(jì)算方法的全局最優(yōu)性與非線性規(guī)劃等基于梯度算法的局部最優(yōu)性結(jié)合起來,使用進(jìn)化計(jì)算為非線性規(guī)劃算法提供初值,能夠高效求解脈沖轉(zhuǎn)移軌跡優(yōu)化問題.
小推力軌跡優(yōu)化領(lǐng)域智能方法同樣有著較多的應(yīng)用.Rauwolf和Coverstone-Carroll[23]在1996年使用遺傳算法優(yōu)化了深空小推力軌跡,文中將小推力軌跡分成多段,每段內(nèi)推力方向?yàn)楣潭ㄖ?,?yōu)化每段開關(guān)機(jī)以及推力方向角.除了將小推力軌跡進(jìn)行分段,還可以將推力方向角用函數(shù)進(jìn)行描述,從而優(yōu)化函數(shù)的參數(shù).Dewell和Menon[24]將推力方向角表示為切比雪夫多項(xiàng)式的形式,用遺傳算法優(yōu)化切比雪夫多項(xiàng)式的系數(shù),研究了地球同步軌道小推力轉(zhuǎn)移問題.Wall和Conway[25]將小推力方向角用三次多項(xiàng)式擬合,用遺傳算法優(yōu)化三次多項(xiàng)式系數(shù).Ghosh和Conway[26]用B樣條曲線擬合小推力方向角,用粒子群優(yōu)化對B樣條曲線系數(shù)進(jìn)行優(yōu)化.Lee等[27]使用李雅普諾夫Q函數(shù)進(jìn)行小推力軌跡優(yōu)化,用遺傳算法優(yōu)化Q函數(shù)的參數(shù),研究了同時(shí)考慮燃料消耗與飛行時(shí)間的多目標(biāo)優(yōu)化問題.上述進(jìn)化計(jì)算方法都是將小推力問題進(jìn)行了一定的近似(比如將推力方向角用含參數(shù)的函數(shù)描述),對于末端精度要求不高或者對最優(yōu)性要求不高的情況下適用.
除了直接優(yōu)化小推力開關(guān)機(jī)與方向角之外,還有許多學(xué)者使用智能方法為其他數(shù)值解法提供初值.Coverstone-Carroll等[28]用遺傳算法優(yōu)化協(xié)態(tài)變量與轉(zhuǎn)移時(shí)間,為SEPTOP(美國噴氣推進(jìn)實(shí)驗(yàn)室開發(fā)的小推力求解軟件)提供初值,研究了同時(shí)考慮燃料消耗與轉(zhuǎn)移時(shí)間的多目標(biāo)優(yōu)化問題.Wuerl等[29]、Sentinella和Casalino[30]也研究了使用遺傳算法為小推力間接法求解提供初值.Pontani和Conway[31]研究了粒子群優(yōu)化在脈沖以及小推力軌跡優(yōu)化中的應(yīng)用,應(yīng)用之一即為小推力間接法求解提供初值.同樣,Jiang等[32]也使用粒子群優(yōu)化為小推力間接法求解提供初值.Shan和Ren[33]使用粒子群優(yōu)化提供協(xié)態(tài)初值,再將軌跡離散后作為初值用直接法進(jìn)行求解.Chilan和Conway[34,35]將脈沖、連續(xù)推力段和滑行段整體進(jìn)行優(yōu)化,機(jī)動(dòng)類型也作為優(yōu)化的結(jié)果,使用遺傳算法為非線性規(guī)劃提供初值.可以看到進(jìn)化計(jì)算方法在小推力軌跡優(yōu)化初值求解中有著較多應(yīng)用,能夠充分發(fā)揮進(jìn)化計(jì)算方法全局性好的優(yōu)勢.
多次引力輔助的軌跡較為復(fù)雜,如圖 2所示,其優(yōu)化也有著許多研究.對于給定的引力輔助序列,如何選取引力輔助時(shí)刻以及如何施加深空機(jī)動(dòng)是一個(gè)較為復(fù)雜的優(yōu)化問題,許多學(xué)者使用智能方法進(jìn)行優(yōu)化.Vasile等設(shè)計(jì)了進(jìn)化算法與分支策略結(jié)合的進(jìn)化分支算法,研究了脈沖和小推力的含深空機(jī)動(dòng)的多引力輔助軌跡優(yōu)化問題[36],又提出了多主體協(xié)作搜索算法[37],并對該算法進(jìn)行了改進(jìn)研究多目標(biāo)優(yōu)化問題[38].Vasile等[39]還改進(jìn)了差分進(jìn)化算法,在含深空機(jī)動(dòng)的多引力輔助問題上其性能優(yōu)于標(biāo)準(zhǔn)的差分進(jìn)化算法.Olds等[40]和Qiao等[41]使用差分進(jìn)化算法研究了含深空機(jī)動(dòng)的多引力輔助軌跡優(yōu)化問題,發(fā)現(xiàn)算法的性能對算法參數(shù)設(shè)置非常敏感.Izzo等[42]在研究木衛(wèi)探測的問題時(shí)將參數(shù)自適應(yīng)、約束處理等技術(shù)應(yīng)用在進(jìn)化算法上,避免了人工設(shè)置算法參數(shù).Izzo等[43]還提出了空間剪枝方法研究多引力輔助問題,與差分進(jìn)化、遺傳算法、粒子群優(yōu)化結(jié)合,提升了算法性能,Vasile等[44]在此基礎(chǔ)上研究了含深空機(jī)動(dòng)的多引力輔助問題.Schütze等[45]用空間剪枝研究了小推力引力輔助多目標(biāo)優(yōu)化.Schütze等[46]使用非支配排序遺傳算法NSGA-II對引力輔助軌跡多目標(biāo)優(yōu)化進(jìn)行了研究,同時(shí)NSGA-II的提出者Deb等[47]也用該算法研究了類似問題.
圖2 多引力輔助探測軌跡(圖片來自文獻(xiàn)[41])Fig.2 Trajectory of multiple gravity-assist mission
與小推力軌跡優(yōu)化問題類似,引力輔助軌跡優(yōu)化中也有學(xué)者使用智能方法為其他數(shù)值解法提供初值.Crain等[48]將遺傳算法得到的結(jié)果作為初值,使用遞歸二次規(guī)劃來進(jìn)一步優(yōu)化.Woo等[49]使用遺傳算法為SEPTOP提供初值,研究了小推力引力輔助軌跡優(yōu)化問題.Yang等[50]使用粒子群優(yōu)化為含引力輔助的小推力間接法求解提供初值.此外,喬棟等[51,52]用差分進(jìn)化為序列二次規(guī)劃提供初值,研究了使用引力輔助的小行星探測軌跡優(yōu)化問題.這些研究也再一次表明進(jìn)化計(jì)算方法在提供優(yōu)化初值上的優(yōu)勢.
由于含深空機(jī)動(dòng)的多引力輔助軌跡優(yōu)化問題的復(fù)雜性,許多學(xué)者以該問題為基礎(chǔ)將多種智能方法進(jìn)行比較.Myatt等[53]比較了遺傳算法、差分進(jìn)化、粒子群、交叉熵等多種算法,發(fā)現(xiàn)差分進(jìn)化性能更優(yōu).Bessette和Spencer[54]比較差分進(jìn)化和粒子群優(yōu)化,認(rèn)為粒子群優(yōu)化性能更好,雖然二者均能找到最優(yōu)解,但是粒子群優(yōu)化需要的迭代次數(shù)更少.Sentinella和Casalino[55]將差分進(jìn)化、遺傳算法與粒子群算法并行計(jì)算,每次迭代時(shí)三種算法共享最優(yōu)個(gè)體,在某些復(fù)雜問題上性能更好.Vasile[56]等比較了差分進(jìn)化、遺傳算法、粒子群優(yōu)化等,認(rèn)為各種算法的性能非常依賴于研究問題本身.
機(jī)器學(xué)習(xí)在轉(zhuǎn)移軌跡優(yōu)化中的應(yīng)用主要有兩個(gè)方面,一是對轉(zhuǎn)移軌跡優(yōu)化最優(yōu)指標(biāo)(如最優(yōu)的燃料消耗或者轉(zhuǎn)移時(shí)間)的快速預(yù)測,二是設(shè)計(jì)實(shí)時(shí)最優(yōu)控制器.
由于多目標(biāo)空間探測軌跡優(yōu)化需要大量優(yōu)化轉(zhuǎn)移軌跡,如果可以快速準(zhǔn)確地對轉(zhuǎn)移軌跡的最優(yōu)指標(biāo)進(jìn)行預(yù)測,避免精確優(yōu)化求解,將會(huì)極大地提高計(jì)算速度.該問題可以概括為:已知初始軌道和末端軌道,如何做到不進(jìn)行精確優(yōu)化而快速準(zhǔn)確地給出最優(yōu)燃料消耗或者最優(yōu)轉(zhuǎn)移時(shí)間?該問題對小推力轉(zhuǎn)移尤其重要,因?yàn)樾⊥屏壽E的優(yōu)化過程較為耗時(shí).Edelbaum[57]早在1961年就研究過航天器軌道轉(zhuǎn)移所需要的最優(yōu)速度增量,給出了用初末軌道狀態(tài)差表示的速度增量表達(dá)式.但是Edelbaum所研究的軌道轉(zhuǎn)移是多圈轉(zhuǎn)移,其速度增量公式推導(dǎo)是以一個(gè)軌道周期為基本單位,將不足整數(shù)圈的部分忽略.但是在深空探測任務(wù)中,圈數(shù)非常多的小推力轉(zhuǎn)移是不現(xiàn)實(shí)的,更接近實(shí)際情況的是非整數(shù)圈轉(zhuǎn)移.針對該問題,Casalino[58]基于Edelbaum的方法研究了共面小偏心率軌道轉(zhuǎn)移的最優(yōu)速度增量估計(jì)公式,Gatto[59]又在其基礎(chǔ)上進(jìn)一步研究了非共面軌道轉(zhuǎn)移的情況.在他們的方法中,最優(yōu)速度增量需要通過求解方程得到,而且對于交會(huì)問題還需要添加較為復(fù)雜的修正項(xiàng).機(jī)器學(xué)習(xí)由于其處理數(shù)據(jù)關(guān)聯(lián)上的優(yōu)勢,對于該問題非常適用.Hennes等[60]以及Mereta等[61]使用機(jī)器學(xué)習(xí)方法預(yù)測燃料最優(yōu)小推力問題的剩余質(zhì)量,使用了多種機(jī)器學(xué)習(xí)方法比如回歸森林和決策樹等,預(yù)測精度遠(yuǎn)優(yōu)于雙脈沖近似.對于脈沖轉(zhuǎn)移問題,Shang等[62,63]使用高斯過程回歸方法預(yù)測地球到主帶小行星轉(zhuǎn)移的最優(yōu)速度增量,同樣是為了解決大量計(jì)算下精確優(yōu)化速度太慢的問題.Zhu[64,65]以及Li[66]等使用深度神經(jīng)網(wǎng)絡(luò)預(yù)測小推力時(shí)間最優(yōu)問題、小推力燃料最優(yōu)問題以及多脈沖速度增量最優(yōu)問題,預(yù)測精度高達(dá)99%.此外,機(jī)器學(xué)習(xí)還可以用在進(jìn)化計(jì)算優(yōu)化轉(zhuǎn)移軌跡的過程中,用來預(yù)測目標(biāo)函數(shù)[67]或者提供初值[68].
實(shí)時(shí)最優(yōu)控制也是軌跡優(yōu)化的一個(gè)重要領(lǐng)域,近年來隨著神經(jīng)網(wǎng)絡(luò)相關(guān)研究的進(jìn)展,軌跡優(yōu)化領(lǐng)域基于神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)最優(yōu)控制也有著較多研究,一般通過大量的數(shù)據(jù)訓(xùn)練來進(jìn)行,如圖3所示.Sánchez等[69]針對著陸問題系統(tǒng)地研究了基于神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)最優(yōu)控制.在他們的研究中,首先需要通過優(yōu)化生成大量的狀態(tài)-控制對數(shù)據(jù),然后使用生成的數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),訓(xùn)練完成后,每當(dāng)給神經(jīng)網(wǎng)絡(luò)一個(gè)當(dāng)前的狀態(tài),神經(jīng)網(wǎng)絡(luò)都應(yīng)當(dāng)給出接近最優(yōu)的控制律.為了提高神經(jīng)網(wǎng)絡(luò)控制深空小推力軌跡的末端精度.Cheng等[70]設(shè)計(jì)了兩個(gè)神經(jīng)網(wǎng)絡(luò)分別進(jìn)行大范圍轉(zhuǎn)移段控制和末端精確控制.此外,對于小天體著陸問題,Cheng等訓(xùn)練了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)小天體的不規(guī)則引力場并進(jìn)行了小天體著陸控制[71,72],還訓(xùn)練了神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)小天體著陸軌跡間接法的協(xié)態(tài)初值[73].Furfaro等[74]使用循環(huán)神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)著陸控制器.上述神經(jīng)網(wǎng)絡(luò)控制的輸入為位置速度等狀態(tài)信息,但是在實(shí)際情況中精確的位置速度可能不易獲得,F(xiàn)urfaro等[75]設(shè)計(jì)了直接輸入著陸圖像的神經(jīng)網(wǎng)絡(luò)控制器,使用卷積神經(jīng)網(wǎng)絡(luò)以及循環(huán)神經(jīng)網(wǎng)絡(luò)處理序列的圖像信息從而給出最優(yōu)控制律.
圖3 小行星著陸神經(jīng)網(wǎng)絡(luò)控制軌跡[76]Fig.3 Asteroid landing trajectories using neural network control
強(qiáng)化學(xué)習(xí)方法在轉(zhuǎn)移軌跡優(yōu)化領(lǐng)域也有應(yīng)用.Dachwald[76]在2004年就使用強(qiáng)化學(xué)習(xí)進(jìn)行了太陽帆軌跡優(yōu)化,用遺傳算法訓(xùn)練單層神經(jīng)網(wǎng)絡(luò)作為最優(yōu)控制器.Dachwald使用強(qiáng)化學(xué)習(xí)的目的是為了避免優(yōu)化陷入局部最優(yōu)解,從而找到全局最優(yōu)解[77].在實(shí)時(shí)控制方面,Gaudet和Furfaro[78]使用強(qiáng)化學(xué)習(xí)訓(xùn)練了小天體附近懸??刂破?,Willis等[79]又在此基礎(chǔ)上將精度提高了一個(gè)量級(jí).針對著陸問題,Gaudet等[80]使用強(qiáng)化學(xué)習(xí)訓(xùn)練了六自由度的神經(jīng)網(wǎng)絡(luò)控制器,Cheng等[81]使用強(qiáng)化學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)預(yù)測著陸軌跡間接法的協(xié)態(tài)初值.
機(jī)器學(xué)習(xí)方法本質(zhì)是對數(shù)據(jù)的處理,因而該方法在處理最優(yōu)指標(biāo)預(yù)測等方面可以獲得大量數(shù)據(jù)的問題上具有明顯優(yōu)勢,但是對于航天中面臨的更多未知、小樣本的新問題如何應(yīng)用,仍是值得深入研究的內(nèi)容.
探測序列優(yōu)化是多目標(biāo)空間探測軌跡優(yōu)化的核心問題,也是GTOC中最為常見的問題,如圖4中的木衛(wèi)巡游探測任務(wù).探測序列優(yōu)化是一個(gè)組合優(yōu)化問題,若考慮時(shí)間因素則為離散-連續(xù)變量的組合優(yōu)化問題,離散變量為目標(biāo)的選取以及排序等,連續(xù)變量為與目標(biāo)飛越或者交會(huì)的時(shí)刻等.由于解空間巨大,探測序列優(yōu)化是一個(gè)極其復(fù)雜的優(yōu)化問題,研究中多用智能方法進(jìn)行優(yōu)化.探測序列優(yōu)化主要包含多引力輔助序列優(yōu)化,多目標(biāo)小天體探測序列優(yōu)化,以及多目標(biāo)在軌服務(wù)與空間碎片清除序列優(yōu)化.
圖4 木衛(wèi)巡游探測任務(wù)[94]Fig.4 Jovian moons tour
多引力輔助序列優(yōu)化與1.2.3小節(jié)中關(guān)于多引力輔助問題的研究不同,這里引力輔助的序列也變?yōu)榱舜齼?yōu)化的離散變量,與引力輔助時(shí)刻等構(gòu)成了離散-連續(xù)變量的組合優(yōu)化問題.華鵬[82]使用粒子群算法確定行星序列,再用遺傳算法求解小推力軌道.Ceriotti和Vasile[83]提出了一種基于蟻群算法的多引力輔助序列優(yōu)化算法,并與遺傳算法進(jìn)行了比較.之后,Vasile等[84]又提出了一種新的生物啟發(fā)式算法——絨泡菌優(yōu)化算法,進(jìn)行了多引力輔助序列優(yōu)化,仿真表明該算法只需進(jìn)行少量的參數(shù)調(diào)試即可得到優(yōu)異的性能.Gad和Abdelkhalik[85]針對引力輔助次數(shù)無法提前確定的問題,提出了隱藏基因遺傳算法,將引力輔助次數(shù)也變?yōu)閮?yōu)化的結(jié)果,后來又將隱藏基因遺傳算法進(jìn)行了改進(jìn)[86].之后,二人又提出了可變種群大小的遺傳算法研究了類似的問題[87],算法性能得到進(jìn)一步提升.Englander等[88]使用遺傳算法優(yōu)化外層序列,使用粒子群結(jié)合差分進(jìn)化優(yōu)化內(nèi)層連續(xù)變量,通過在遺傳算法中使用空值的辦法優(yōu)化引力輔助次數(shù).Englander等[89]繼續(xù)使用遺傳算法優(yōu)化外層序列的同時(shí),在內(nèi)層使用盆地跳法優(yōu)化小推力轉(zhuǎn)移問題.此外,Izzo等[90]使用了一種集束搜索的懶人樹搜索算法(Lazy-Race Tree Search)研究了木衛(wèi)系統(tǒng)探測問題.Hennes和Izzo[91]使用蒙特卡洛樹搜索重現(xiàn)了卡西尼任務(wù),得到了原任務(wù)一樣的引力輔助序列和非常接近的時(shí)間線.
多目標(biāo)在軌服務(wù)與空間碎片清除序列優(yōu)化問題也有著較多研究.與小天體探測相比,在軌服務(wù)與空間碎片清除會(huì)更多地考慮目標(biāo)全部訪問的問題.樹搜索方法方面,相關(guān)研究主要有Barbee等[108]使用的級(jí)數(shù)搜索算法、Madakat等[109]使用的分支定界方法、Olympio和Frouvelle[110]使用的分支和剪枝策略,以及Bérend和Olive[111]使用的多優(yōu)化指標(biāo)的分支定界算法等.由于在軌服務(wù)與空間碎片清除序列優(yōu)化問題與旅行商問題具有較高的相似度,因此在旅行商問題上表現(xiàn)優(yōu)異的進(jìn)化計(jì)算類方法同樣適用于在軌服務(wù)與空間碎片清除問題.模擬退火算法[112,113]、遺傳算法[114,115]、倒置算子的遺傳算法[116]、混合編碼遺傳算法[117]、多目標(biāo)遺傳算法[118]、多目標(biāo)粒子群算法[119]等都被用來研究在軌服務(wù)與空間碎片清除序列優(yōu)化問題.還有學(xué)者提出了改進(jìn)的進(jìn)化計(jì)算類方法,如多主體協(xié)作搜索算法[120]以及絨泡菌優(yōu)化算法[121]等.蟻群算法在該問題中也有較多應(yīng)用.Stuart[122]使用蟻群算法,優(yōu)化了多航天器多目標(biāo)空間碎片清除問題.Shen等[123]也使用蟻群算法,同時(shí)借用攝動(dòng)帶來的軌道面漂移.Petropoulos等[7]使用遺傳算法將蟻群算法得到的結(jié)果再次進(jìn)行優(yōu)化,求解了第九屆國際空間軌道設(shè)計(jì)競賽的空間碎片清除問題,取得了第一名的成績.因此,充分利用各個(gè)算法的優(yōu)勢,如蟻群算法能夠快速構(gòu)建較優(yōu)的可行解,以及遺傳算法能夠在已有解的基礎(chǔ)上進(jìn)一步優(yōu)化,將是求解優(yōu)化問題的一個(gè)重要思路.
本文針對多目標(biāo)空間探測軌跡優(yōu)化問題,對轉(zhuǎn)移軌跡優(yōu)化和探測序列優(yōu)化兩個(gè)部分的智能方法進(jìn)行了綜述.轉(zhuǎn)移軌跡優(yōu)化中智能方法有著大量的應(yīng)用,相比于其他優(yōu)化方法(間接法等),智能方法的優(yōu)勢在于其不需要梯度信息,而且全局性較好,同時(shí)應(yīng)對復(fù)雜約束的能力較強(qiáng).在轉(zhuǎn)移軌跡快速評估方面,已有解析的方法,由于其在為了解析而做的簡化過程中會(huì)丟失部分信息,導(dǎo)致其精度存在瓶頸,因此智能方法會(huì)是一個(gè)突破口.未來的研究可以考慮將動(dòng)力學(xué)性質(zhì)與智能方法相結(jié)合,比如將解析推導(dǎo)與訓(xùn)練神經(jīng)網(wǎng)絡(luò)結(jié)合,使神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到軌道轉(zhuǎn)移問題中的本質(zhì)規(guī)律,而不只是數(shù)據(jù)的映射關(guān)系,再將其應(yīng)用如轉(zhuǎn)移軌跡快速評估等航天動(dòng)力學(xué)的問題中.探測序列優(yōu)化中,樹搜索算法的優(yōu)點(diǎn)在于其可以構(gòu)建一個(gè)龐大的搜索樹,進(jìn)化計(jì)算的優(yōu)點(diǎn)在于其全局反饋機(jī)制可以減少貪婪的情況,同時(shí)其隨機(jī)性使得進(jìn)化計(jì)算具有更好的全局性,二者的結(jié)合將有望進(jìn)一步提升全局優(yōu)化算法的性能.對于實(shí)時(shí)優(yōu)化問題,轉(zhuǎn)移軌跡實(shí)時(shí)優(yōu)化已有相關(guān)研究,但是面對復(fù)雜約束未知環(huán)境等的實(shí)時(shí)優(yōu)化仍是難點(diǎn),而探測序列實(shí)時(shí)優(yōu)化研究較為空白,設(shè)想未來可能存在大量航天器同時(shí)進(jìn)行多目標(biāo)探測任務(wù)(大量航天器進(jìn)行空間碎片清除或者小行星采礦),探測序列實(shí)時(shí)優(yōu)化將是一個(gè)充滿挑戰(zhàn)的研究方向.