徐 杭,梁維奎,,劉魯江,馬廣富,宋 斌
(1.哈爾濱工業(yè)大學(xué)航天學(xué)院控制科學(xué)與工程系,哈爾濱 150001;2.上海宇航系統(tǒng)工程研究所,上海 201109)
空間設(shè)備在軌運(yùn)行時(shí)環(huán)境復(fù)雜多變,不可避免出現(xiàn)各種損耗,因此往往具有高風(fēng)險(xiǎn)、長(zhǎng)期使用、高投入等特征。根據(jù)UCS衛(wèi)星數(shù)據(jù)庫(kù)統(tǒng)計(jì)[1],截至2021年12月31日,在地球同步軌道(GEO)上已有574顆衛(wèi)星,包括通信衛(wèi)星等高價(jià)值空間設(shè)備。除此以外,還有大量無(wú)法觀測(cè)到的空間碎片也分布在該區(qū)域。與近地軌道(LEO)不同,GEO報(bào)廢衛(wèi)星不會(huì)飛回大氣層銷(xiāo)毀,根據(jù)歐洲航天局的年度調(diào)查報(bào)告,2017年19顆大型靜止軌道衛(wèi)星在服役期滿后被送入更高的墳?zāi)管壍?,這些報(bào)廢衛(wèi)星與空間碎片一旦發(fā)生碰撞將嚴(yán)重威脅GEO衛(wèi)星的正常運(yùn)行,帶來(lái)災(zāi)難性影響[2]。因此為了延長(zhǎng)空間設(shè)備的使用壽命、保障空間設(shè)備的穩(wěn)定運(yùn)行、提升工作性能,需要使用空間在軌服務(wù)(On-orbit servicing,OOS),為各類(lèi)航天器提供燃料加注、功能維護(hù)、模塊升級(jí)等輔助保障服務(wù),同時(shí)及時(shí)紓解太空垃圾,減少空間碎片對(duì)在軌衛(wèi)星的碰撞風(fēng)險(xiǎn)。隨著技術(shù)水平的不斷進(jìn)步,中國(guó)在該方向已經(jīng)積累了不少經(jīng)驗(yàn)。2016年中國(guó)成功發(fā)射天源一號(hào)衛(wèi)星實(shí)現(xiàn)首次衛(wèi)星“空中加油”,相繼又實(shí)現(xiàn)了天舟一號(hào)對(duì)天宮二號(hào)的推進(jìn)劑補(bǔ)加、實(shí)踐二十一號(hào)對(duì)太空垃圾的抓捕。隨著人類(lèi)發(fā)射衛(wèi)星數(shù)量的增多和在軌服務(wù)技術(shù)的日漸成熟,在可預(yù)見(jiàn)的未來(lái)在軌服務(wù)技術(shù)將得到大規(guī)模的應(yīng)用。而在實(shí)現(xiàn)在軌服務(wù)的過(guò)程中,多個(gè)航天器對(duì)多個(gè)目標(biāo)進(jìn)行任務(wù)規(guī)劃是任務(wù)實(shí)施的重要一環(huán),本文針對(duì)GEO多對(duì)多在軌服務(wù)任務(wù)規(guī)劃進(jìn)行分析。
目前國(guó)內(nèi)外對(duì)于航天器多對(duì)多的在軌服務(wù)任務(wù)規(guī)劃已經(jīng)開(kāi)展了大量的研究。吳鈺飛等[3]建立了面向地球靜止軌道航天器的合同網(wǎng)協(xié)議多agent模型,任務(wù)緊急程度近似為目標(biāo)函數(shù)時(shí)間燃料權(quán)重比,但其任務(wù)分配過(guò)程中只是確定哪個(gè)航天器去服務(wù)哪個(gè)單目標(biāo)。張進(jìn)等[4]提出了一種混合編碼遺傳算法來(lái)求解近地軌道的多航天器加油模型,模型中考慮了J2攝動(dòng)影響和時(shí)間窗約束,并使用相對(duì)動(dòng)力學(xué)方程來(lái)求解轉(zhuǎn)移過(guò)程。趙凡宇等[5]提出了基于規(guī)劃活動(dòng)相關(guān)度的領(lǐng)域無(wú)關(guān)啟發(fā)式規(guī)劃方法,明顯減少了規(guī)劃步數(shù)與回溯步數(shù)。歐陽(yáng)琦等[6]以地球同步軌道衛(wèi)星群為對(duì)象,基于遺傳算法求解多對(duì)多在軌加注任務(wù)規(guī)劃問(wèn)題。陳小前等[7]比較了一對(duì)一策略、一對(duì)多策略、多對(duì)多策略、P2P策略的經(jīng)濟(jì)效率,提出了一種混合策略框架以實(shí)現(xiàn)更好的收益。余婧等[8]基于混雜優(yōu)化控制理論對(duì)GEO在軌燃油加注過(guò)程提出了數(shù)學(xué)表征,其中變軌過(guò)程考慮霍曼變軌和調(diào)相機(jī)動(dòng)的組合,優(yōu)化模型考慮多目標(biāo)粒子群算法進(jìn)行求解。文獻(xiàn)[9]中優(yōu)化目標(biāo)考慮任務(wù)的燃油與時(shí)間消耗,以Lambert變軌過(guò)程建立優(yōu)化模型,并用多目標(biāo)粒子群算法求解。Bang等[10]基于車(chē)輛路徑規(guī)劃模型對(duì)主動(dòng)式碎片清除任務(wù)規(guī)劃問(wèn)題建模,考慮短時(shí)任務(wù)(一星期以下)采用Lambert變軌方式,利用升交點(diǎn)赤經(jīng)漂移的三步變軌方式用于長(zhǎng)時(shí)任務(wù)。鄭紅星等[11]針對(duì)一對(duì)多的在軌服務(wù)規(guī)劃問(wèn)題設(shè)計(jì)了基于霍曼轉(zhuǎn)移、異面機(jī)動(dòng)、Lambert轉(zhuǎn)移的空間任意目標(biāo)變軌流程,并使用遺傳算法進(jìn)行求解,計(jì)算出服務(wù)時(shí)序。
在上述的研究中,由于航天器的多對(duì)多在軌服務(wù)任務(wù)規(guī)劃為一個(gè)典型的混合整數(shù)規(guī)劃問(wèn)題,通常為了尋找“最優(yōu)”方案,使用優(yōu)化算法進(jìn)行多輪次的迭代求解,在求解過(guò)程存在算法復(fù)雜性高、效率低、運(yùn)行時(shí)間長(zhǎng)、收斂性差等問(wèn)題。且由于星上資源有限,往往需要在地面站形成方案后進(jìn)行上注,存在時(shí)延、反應(yīng)不及時(shí)(存在測(cè)控時(shí)間窗口)的問(wèn)題。針對(duì)于突發(fā)事件(大量碎片產(chǎn)生),多個(gè)航天器平臺(tái)進(jìn)行自主探測(cè)、分布式規(guī)劃相較于傳統(tǒng)方案有顯著優(yōu)勢(shì),并可以結(jié)合啟發(fā)式策略應(yīng)對(duì)任務(wù)過(guò)載問(wèn)題[12]。由于航天領(lǐng)域的特殊性,航天器自主任務(wù)規(guī)劃面對(duì)計(jì)算資源有限、及時(shí)性、環(huán)境不確定性、目標(biāo)動(dòng)態(tài)性、系統(tǒng)耦合性、資源約束的動(dòng)態(tài)復(fù)雜性、動(dòng)作時(shí)間連續(xù)性等難點(diǎn)[13-15]。綜上所述,對(duì)于星上規(guī)劃平臺(tái)而言,除了支持分布式框架,快速性規(guī)劃方案生成是一個(gè)重要指標(biāo)。
與優(yōu)化算法的多輪次迭代求解不同,拍賣(mài)算法作為一種快速的分配算法,可以在計(jì)算速度上體現(xiàn)出很大優(yōu)勢(shì),目前在機(jī)器人、無(wú)人機(jī)、軍事等多個(gè)領(lǐng)域上得到了廣泛關(guān)注[16-19]。結(jié)合啟發(fā)式策略和一對(duì)一變軌策略取優(yōu),可以實(shí)現(xiàn)短時(shí)快速的規(guī)劃問(wèn)題“次優(yōu)”解獲取,比傳統(tǒng)的優(yōu)化求解方式具有更好的時(shí)間效率和更靈活的架構(gòu)。
綜上,為增強(qiáng)航天器自身自主化、智能化程度,實(shí)現(xiàn)快速任務(wù)規(guī)劃,得到多個(gè)航天器對(duì)多個(gè)任務(wù)的分配關(guān)系、執(zhí)行順序、機(jī)動(dòng)窗口、脈沖速度指令,本文基于拍賣(mài)算法,并根據(jù)飛行器在軌服務(wù)任務(wù)規(guī)劃問(wèn)題求解的需求特點(diǎn),提出了一套融入啟發(fā)式目標(biāo)優(yōu)先級(jí)排序策略的任務(wù)規(guī)劃求解算法,并與傳統(tǒng)的遺傳算法、模擬退火算法求解效果進(jìn)行對(duì)比,驗(yàn)證了所提算法的有效性和快速性。
針對(duì)GEO待服務(wù)衛(wèi)星目標(biāo),相對(duì)于LEO部署方案(服務(wù)航天器初始在LEO上運(yùn)行)、應(yīng)急發(fā)射方案(有服務(wù)任務(wù)時(shí),航天器從地面發(fā)射),將服務(wù)航天器部署在相同GEO時(shí)更加經(jīng)濟(jì),響應(yīng)速度更快[20]。本文基于上述在軌服務(wù)模式建立數(shù)學(xué)模型,并考慮到如下假設(shè):
1)在軌服務(wù)過(guò)程簡(jiǎn)化
考慮到問(wèn)題研究的通用性,本文并未限制在軌服務(wù)的具體樣式,服務(wù)過(guò)程近似處理為接觸式,且不考慮服務(wù)時(shí)太陽(yáng)光照角的影響。變軌過(guò)程空間位置變化相對(duì)于航天器尺寸也極大,航天器執(zhí)行服務(wù)任務(wù)時(shí),與目標(biāo)在空間中同位置、同速度。
2)多航天器與多任務(wù)目標(biāo)軌道高度相近
本文分析對(duì)象為GEO航天器與目標(biāo),考慮到實(shí)際偏差,假設(shè)存在高度差但較小。
3)多航天器與多任務(wù)目標(biāo)軌道面相近
GEO上1°的軌道面傾角調(diào)整約需速度增量54 m/s,考慮到不同軌道面間的變軌調(diào)整燃料消耗極大,實(shí)際任務(wù)中考慮不會(huì)頻繁得修正軌道面與軌道面之間的夾角。本文考慮所有航天器與目標(biāo)軌道面夾角很小。超出范圍的其余軌道面的服務(wù)航天器、任務(wù)目標(biāo)可視為另一組獨(dú)立規(guī)劃。
4)圓軌道近似
多數(shù)GEO衛(wèi)星偏心率都極小,本文考慮所有服務(wù)航天器與任務(wù)目標(biāo)軌道為圓軌道。
5)地球碰撞不考慮
受航天器燃料約束,從GEO軌道上撞擊地球需要耗費(fèi)大量速度增量,分析時(shí)不必判斷碰撞概率。
在航天器進(jìn)行在軌服務(wù)時(shí),需要與目標(biāo)進(jìn)行交會(huì)。作為多對(duì)多任務(wù)規(guī)劃問(wèn)題的重要子問(wèn)題,一對(duì)一的單次軌道交會(huì)問(wèn)題求解尤為重要。在通常任務(wù)規(guī)劃問(wèn)題求解中[20],往往采用異面交點(diǎn)變軌、霍曼變軌與調(diào)相機(jī)動(dòng)完成與目標(biāo)的相對(duì)軌道面調(diào)整、軌高調(diào)整、相位角調(diào)整,這些變軌方式在節(jié)約燃料消耗的同時(shí)放棄了變軌過(guò)程的快速性、靈活性。由于本文只對(duì)近軌高、近共面問(wèn)題進(jìn)行分析,選取變軌方式更為靈活的Lambert變軌,可以實(shí)現(xiàn)軌高、軌道面調(diào)整,且相比霍曼變軌、異面交點(diǎn)變軌不會(huì)有很大燃料消耗差距,調(diào)相機(jī)動(dòng)視為一種特例考慮。構(gòu)建變軌過(guò)程的二體運(yùn)動(dòng)模型如圖1所示(近共面情況下的二維截面)。過(guò)程①中,針對(duì)相近軌高、近共面的服務(wù)目標(biāo),其初始位于C1處;服務(wù)航天器初始位于A處,采用多圈Lambert變軌方式進(jìn)行軌道轉(zhuǎn)移,在C2處與目標(biāo)交會(huì)并進(jìn)行在軌服務(wù)。
在轉(zhuǎn)移軌道運(yùn)行時(shí),初末兩點(diǎn)位置矢量為r1與r2,對(duì)應(yīng)轉(zhuǎn)移軌道速度為v1與v2,軌道轉(zhuǎn)移過(guò)程運(yùn)動(dòng)時(shí)長(zhǎng)為t,圈數(shù)為nr,Lambert變軌過(guò)程可表述為:
(v1,v2)=f(r1,r2,t,nr)
(1)
v1與v2的求解過(guò)程中[21],r1與r2矢量方向一致或相反時(shí)會(huì)導(dǎo)致無(wú)解,考慮當(dāng)r1與r2相同時(shí),可以采用調(diào)相軌道(視為L(zhǎng)ambert變軌的一種特殊情況)進(jìn)行補(bǔ)充,如圖1中過(guò)程②所示,目標(biāo)初始位于B處,當(dāng)運(yùn)動(dòng)到A處時(shí),航天器恰好通過(guò)調(diào)相軌道運(yùn)動(dòng)回A處。轉(zhuǎn)移軌道初末速度可表述為:
(2)
式中:G表示萬(wàn)有引力常量;Me表示地球質(zhì)量;r1表示轉(zhuǎn)移軌道初末位置矢量模;aL表示橢圓轉(zhuǎn)移軌道半長(zhǎng)軸;h1表示轉(zhuǎn)移前軌道面法向(和轉(zhuǎn)移軌道、轉(zhuǎn)移后軌道一致)。變軌前后位置矢量r1與r2、軌道速度v10,v20與變軌前后軌道的六要素φ1,φ2相關(guān),可通過(guò)相關(guān)公式求解:
(v10,r1)=f(φ1)
(3)
(v20,r2)=f(φ2)
(4)
航天器在變軌后與目標(biāo)交會(huì)視為相對(duì)靜止,速度增量Δv為:
Δv=|v1-v10|+|v2-v20|
(5)
圖1 Lambert變軌與調(diào)相機(jī)動(dòng)Fig.1 Lambert transfer and phasing maneuver
為了確定一對(duì)一模式下的Lambert變軌策略,在六種不同工況下繪制變軌過(guò)程速度增量消耗與變軌時(shí)長(zhǎng)關(guān)系曲線,工況參數(shù)如表1所示:
表1 六種不同工況Table 1 Six different conditions
服務(wù)航天器與目標(biāo)偏心率均為零,對(duì)比結(jié)果如圖2所示:
圖2 速度增量與時(shí)長(zhǎng)消耗圖Fig.2 Relation between Δv and the consumption of time
可以從圖2中得到幾個(gè)結(jié)論:
1) Lambert變軌過(guò)程中存在周期性,整體變軌圈數(shù)越多、時(shí)間越長(zhǎng),速度增量消耗越小。
2) 當(dāng)航天器與目標(biāo)軌高相同時(shí),每一個(gè)波谷對(duì)應(yīng)調(diào)相軌道情況,速度增量消耗最小。
3) 當(dāng)航天器與目標(biāo)軌高不同時(shí),會(huì)在近似相同軌高處理的對(duì)應(yīng)調(diào)相軌道變軌時(shí)長(zhǎng)處,速度增量消耗迅速增大,形成一前一后兩個(gè)子波谷段。
4) 當(dāng)航天器與目標(biāo)存在軌道面夾角很小時(shí),如圖中工況A相對(duì)于B,工況C相對(duì)于D,產(chǎn)生的影響很小,不影響整體變化趨勢(shì)。
5) 每一個(gè)波谷段前,近似變軌時(shí)間越長(zhǎng),速度增量消耗越小,大致呈遞減趨勢(shì)。
6) 當(dāng)目標(biāo)滯后相位角減小至60°時(shí),第一個(gè)波谷段近似消失,此時(shí)單圈Lambert變軌近似至少消耗速度增量300 m/s??紤]受航天器燃料與任務(wù)時(shí)長(zhǎng)約束,通常大相位角差時(shí)變軌超出了其自身能力,因此忽略目標(biāo)相位角較大滯后情況下的第一個(gè)波谷,將第二個(gè)波谷視為第一個(gè)。
進(jìn)一步分析,設(shè)置第一個(gè)波谷對(duì)應(yīng)時(shí)長(zhǎng)為T(mén)1:
(6)
TL 0=Tt 0-Ts
(7)
涉及到一個(gè)航天器對(duì)mi個(gè)目標(biāo)服務(wù)時(shí),一對(duì)一任務(wù)約束時(shí)長(zhǎng)Tt 0由總時(shí)長(zhǎng)約束T0平均分配:
(8)
當(dāng)航天器與目標(biāo)近軌高、近共面時(shí),近似考慮在GEO上相對(duì)空間關(guān)系不會(huì)隨著時(shí)間發(fā)生變化,不考慮光照情況下不存在時(shí)間窗口,因此本文中航天器在任務(wù)開(kāi)始時(shí)立刻進(jìn)行變軌,且在涉及對(duì)多個(gè)目標(biāo)服務(wù)時(shí)不設(shè)置等待時(shí)間,前一個(gè)服務(wù)完立刻服務(wù)下一個(gè)。
同時(shí)考慮在給定的變軌時(shí)長(zhǎng)約束下,盡可能得追求燃料最省。如果航天器與目標(biāo)軌高相同,則可以直接取各波谷對(duì)應(yīng)調(diào)相機(jī)動(dòng)的變軌時(shí)長(zhǎng),然而實(shí)際中很難完全保持一致,因此需要變軌時(shí)長(zhǎng)減去時(shí)間修正量Δt以對(duì)應(yīng)到各波谷段的第一個(gè)子波谷(后一個(gè)子波谷段對(duì)應(yīng)耗時(shí)更久不考慮)。
綜上所述Lambert變軌過(guò)程時(shí)長(zhǎng)t選取規(guī)則為:
(9)
式中:Δt表示時(shí)間修正量(和雙方高度差及變軌時(shí)長(zhǎng)有關(guān));Tkmax表示可取的各波谷段第一個(gè)子波谷中時(shí)間最長(zhǎng)的值(若共軌高沒(méi)有子波谷則為波谷)。從上述也可以看出,針對(duì)每次一對(duì)一服務(wù)計(jì)算過(guò)程,本文策略僅需要數(shù)值求解一次Lambert變軌方程。
設(shè)定在空間軌道部署有n個(gè)服務(wù)航天器,某時(shí)刻有m個(gè)目標(biāo)衛(wèi)星需要被執(zhí)行相應(yīng)的在軌服務(wù),定義m個(gè)多維變量x:
x(i)=[ns,vL1,vL2,TL1,TL2,TL3],i=1,2,…,m
(10)
式中:x(i)表示每個(gè)目標(biāo)對(duì)應(yīng)的服務(wù)變量;ns表示服務(wù)航天器編號(hào);vL1表示Lambert變軌第一次速度脈沖;vL2表示Lambert變軌第二次速度脈沖;TL1表示第一次變軌時(shí)刻;TL2表示第二次變軌時(shí)刻;TL3表示任務(wù)完成時(shí)刻。
1)軌道動(dòng)力學(xué)約束
考慮質(zhì)點(diǎn)模型,受地球引力約束,航天器與目標(biāo)的軌道動(dòng)力學(xué)約束為:
(11)
式中:r表示空間位置矢量,r對(duì)應(yīng)其模,軌道動(dòng)力學(xué)約束主要用于求解在非機(jī)動(dòng)情況下航天器與目標(biāo)的任意時(shí)刻空間位置。若考慮攝動(dòng)影響,對(duì)于非近地軌道的衛(wèi)星,其在軌運(yùn)動(dòng)過(guò)程中主要受地球非球形攝動(dòng)的影響,在文獻(xiàn)[22]中給出了考慮J2攝動(dòng)影響時(shí),簡(jiǎn)化的引力勢(shì)函數(shù):
(12)
式中:Re表示地球半徑;φ表示航天器在球坐標(biāo)系上的緯度。本文中采用文獻(xiàn)[23]中的方法對(duì)Lambert結(jié)果進(jìn)行修正:將Lambert求解速度增量附加給原軌道速度,從初始位置開(kāi)始進(jìn)行軌道遞推,遞推加速度由引力勢(shì)函數(shù)的梯度獲得。遞推航天器運(yùn)行時(shí)間長(zhǎng)度后,根據(jù)實(shí)際求得的軌道位置與設(shè)定的目標(biāo)軌道位置進(jìn)行偏差計(jì)算,并用于更新下次迭代計(jì)算初始速度。最終在多次迭代后遞推位置結(jié)果與設(shè)定位置結(jié)果趨于一致,獲得了真實(shí)的變軌參數(shù)。
本文任務(wù)規(guī)劃中考慮兩種軌道動(dòng)力學(xué)約束分析方式:先考慮式(11)中二體動(dòng)力學(xué)約束對(duì)式(10) 中變量進(jìn)行求解,再考慮式(12)中攝動(dòng)約束對(duì)va和vb進(jìn)行修正;第二種為直接考慮式(12)中攝動(dòng)約束對(duì)式(10)中變量進(jìn)行求解。
2) 服務(wù)時(shí)長(zhǎng)約束
由于服務(wù)時(shí)長(zhǎng)差異對(duì)于本文中算法求解效果影響不大,故此處考慮每個(gè)目標(biāo)的服務(wù)時(shí)長(zhǎng)為一固定值簡(jiǎn)化問(wèn)題。
Ts=const
(13)
3) 目標(biāo)服務(wù)次數(shù)約束
考慮每個(gè)目標(biāo)被服務(wù)次數(shù)ns滿足:
ns=1
(14)
4) 單航天器總時(shí)長(zhǎng)約束
任一服務(wù)航天器任務(wù)總時(shí)長(zhǎng)Ti約束:
max(Ti)≤T0,i=1,2,…,n
(15)
5) 單航天器燃料約束
以速度增量近似表示:
Δvi≤ΔVi,i=1,2,…,n
(16)
式中:Δvi表示任一服務(wù)航天器i任務(wù)中總速度增量消耗;ΔVi表示服務(wù)航天器i任務(wù)開(kāi)始前攜帶燃料對(duì)應(yīng)的可產(chǎn)生速度增量。
在軌服務(wù)任務(wù)中,燃料消耗是重要的指標(biāo),通常要求在規(guī)定時(shí)間約束范圍內(nèi)盡可能地節(jié)省燃料。本文考慮時(shí)間緊迫性已由時(shí)間約束量表現(xiàn),因此在規(guī)劃中要求在給定的任務(wù)時(shí)長(zhǎng)下盡可能地節(jié)省燃料消耗。針對(duì)于整體的數(shù)學(xué)求解模型,為了使的燃料總消耗代價(jià)最小,目標(biāo)函數(shù)考慮采用如下形式:
(17)
傳統(tǒng)的優(yōu)化算法往往會(huì)從全局角度出發(fā)將目標(biāo)適應(yīng)度表述為優(yōu)化變量的函數(shù)形式,并進(jìn)行迭代求解獲得最優(yōu)的決策變量。拍賣(mài)算法則通過(guò)模擬拍賣(mài)活動(dòng),每個(gè)競(jìng)拍者根據(jù)“自利”原則依次對(duì)各個(gè)商品進(jìn)行報(bào)價(jià)。多輪次的拍賣(mài)活動(dòng)后,最終每個(gè)拍賣(mài)商品都盡可能在滿足買(mǎi)家預(yù)期利潤(rùn)最大的前提下,找到對(duì)應(yīng)的買(mǎi)家。在本論文中將服務(wù)航天器視為買(mǎi)家,目標(biāo)任務(wù)視為拍賣(mài)品。
在本文中,考慮航天器數(shù)量n可能比目標(biāo)數(shù)量m少,也可能比目標(biāo)數(shù)量多。當(dāng)n≥m時(shí),將所有任務(wù)均進(jìn)行分配即可,只有當(dāng)重拍情況出現(xiàn)時(shí)會(huì)進(jìn)行多輪拍賣(mài);當(dāng)n 在多輪拍賣(mài)的過(guò)程中需要確定每輪拍賣(mài)的目標(biāo)集合,結(jié)果方案中每個(gè)服務(wù)航天器的服務(wù)序列取為拍得任務(wù)的順序。在以往的拍賣(mài)算法實(shí)現(xiàn)案例中,由于對(duì)拍賣(mài)品的收入、價(jià)格計(jì)算一般都只需要考慮各拍賣(mài)品和各買(mǎi)家關(guān)系,通常進(jìn)行隨機(jī)分配。然而在軌服務(wù)領(lǐng)域的任務(wù)規(guī)劃有一個(gè)顯著特征:相同航天器分配得到的多個(gè)目標(biāo)前后價(jià)格關(guān)聯(lián)。服務(wù)航天器分配了一個(gè)任務(wù)后再去服務(wù)下一個(gè)目標(biāo),和直接服務(wù)下一個(gè)目標(biāo)相比變軌代價(jià)不同。任意航天器對(duì)任意目標(biāo)的服務(wù)代價(jià)不固定導(dǎo)致需要全局考慮,也是以往用優(yōu)化算法進(jìn)行求解運(yùn)算量大的原因之一。 在本論文中,為了加快運(yùn)算,引入啟發(fā)式規(guī)則,在目標(biāo)的服務(wù)時(shí)序確定上引入了先驗(yàn)知識(shí),綜合考慮變軌服務(wù)代價(jià)和目標(biāo)重要度評(píng)分: Gj=Vj-Cj,j=1,2,…,m (18) 式中:Gj可以視為對(duì)于目標(biāo)j的優(yōu)先級(jí)評(píng)分;Vj表示對(duì)于目標(biāo)j的重要度評(píng)分;Cj表示對(duì)于目標(biāo)j的變軌代價(jià)評(píng)分。重要度評(píng)分需要綜合變軌相關(guān)的信息給出,這里將變軌相關(guān)先驗(yàn)知識(shí)融入Cj進(jìn)行表述,可以概括為如圖3所示三項(xiàng)原則: a) 服務(wù)先近后遠(yuǎn)原則 對(duì)每一個(gè)服務(wù)航天器,先服務(wù)近的再服務(wù)遠(yuǎn)的變軌燃料消耗更小,如圖3(a)中先服務(wù)1再服務(wù)2。 b) 就近服務(wù)原則 對(duì)每一個(gè)目標(biāo),盡可能要求接近的服務(wù)航天器去進(jìn)行服務(wù),如圖3(b)中目標(biāo)1優(yōu)先B提供服務(wù): c) 有限燃料聚集任務(wù)優(yōu)先原則 當(dāng)服務(wù)航天器數(shù)量或燃料資源有限時(shí),注定部分目標(biāo)無(wú)法被服務(wù),這時(shí)優(yōu)先考慮服務(wù)更聚集的目標(biāo),以在有限資源下盡量滿足更多的服務(wù)需求。如圖3(c)中A號(hào)服務(wù)航天器優(yōu)先考慮服務(wù)1而不是4: 圖3 先驗(yàn)知識(shí)Fig.3 Prior knowledge 然而當(dāng)燃料充足時(shí),過(guò)早地服務(wù)聚集目標(biāo)將導(dǎo)致本可以服務(wù)的離群目標(biāo)很難被覆蓋,因此需要對(duì)航天器服務(wù)能力進(jìn)行粗略的衡量??紤]兩種工況: 1) 航天器與目標(biāo)半長(zhǎng)軸為42064169 m和42264169 m,偏心率均為零,軌道面夾角為1°; 2)航天器與目標(biāo)半長(zhǎng)軸均為42164169 m,偏心率均為零,其余參數(shù)相同; (19) 式中:ΔV0為速度增量修正量(共面共高下為零),可近似取為變軌時(shí)長(zhǎng)t下的計(jì)算結(jié)果統(tǒng)計(jì)平均值。 圖4 速度增量消耗與相位角差關(guān)系圖Fig.4 Relation between Δv and phase difference 進(jìn)一步可估算當(dāng)前任務(wù)場(chǎng)景下服務(wù)能力系數(shù)η: (20) 式中:min(Δφj)表示目標(biāo)j相對(duì)航天器集的最小相位角差,考慮到當(dāng)η<1時(shí),航天器集的整體服務(wù)能力較強(qiáng),因此可以優(yōu)先選取較近的目標(biāo)服務(wù);當(dāng)η≥1,航天器集的整體服務(wù)能力較弱,可以優(yōu)先選取更聚集的目標(biāo)。為了盡可能得覆蓋多數(shù)目標(biāo),考慮η≥1時(shí)快速趨向于第二種優(yōu)先選取方式。設(shè)計(jì)系數(shù)α: (21) 融合上述先驗(yàn)知識(shí),進(jìn)行近似的變軌代價(jià)表述: (22) 對(duì)于每一個(gè)本輪次的拍賣(mài)任務(wù)j,需要計(jì)算每一個(gè)服務(wù)航天器i服務(wù)其的變軌代價(jià)(拍賣(mài)價(jià)格),即速度增量消耗,同時(shí)也用于后續(xù)的服務(wù)能力判斷。當(dāng)服務(wù)航天器無(wú)分配任務(wù)時(shí),考慮在總時(shí)長(zhǎng)約束范圍內(nèi)進(jìn)行變軌速度增量求解,由式(5)給出,變軌代價(jià)和速度增量消耗Pij為: Pij=Δvij (23) (24) 對(duì)于每一個(gè)買(mǎi)家(服務(wù)航天器)i0,在輪次k的拍賣(mài)活動(dòng)中,需要追求其自身的最大利潤(rùn),選中的目標(biāo)任務(wù)j0應(yīng)滿足: (25) i=1,2,…,n (26) (27) 式中:ε為設(shè)置正值參數(shù),目的是使任務(wù)在被選中時(shí)必定提高價(jià)格,確保在多個(gè)買(mǎi)家相互競(jìng)爭(zhēng)中任務(wù)成本不斷上升,避免算法陷入死循環(huán)。ε值如果選大了會(huì)使得最終方案總利潤(rùn)降低,結(jié)果不理想;選小了則算法計(jì)算效率下降。后續(xù)若仍有買(mǎi)家i′依據(jù)式(25)原則選取目標(biāo)任務(wù)j0,則認(rèn)為發(fā)生了競(jìng)標(biāo)沖突。 競(jìng)標(biāo)沖突發(fā)生后,任務(wù)j0重新被分配給買(mǎi)家i′,同時(shí)任務(wù)j0的價(jià)格重新由式(26)和式(27)進(jìn)行更新;買(mǎi)家i0重新在拍賣(mài)任務(wù)中選擇利潤(rùn)最高的任務(wù),并再次進(jìn)行燃料約束判斷及價(jià)格更新。若競(jìng)拍沖突再次發(fā)生,迭代重復(fù)上述過(guò)程,直到無(wú)競(jìng)拍沖突事件發(fā)生或航天器無(wú)法在滿足燃料約束前提下分得任務(wù)。 以往的拍賣(mài)算法設(shè)計(jì)過(guò)程中,如果對(duì)于某一買(mǎi)家,本輪任務(wù)中沒(méi)有一個(gè)任務(wù)滿足約束條件,則認(rèn)為該買(mǎi)家沒(méi)有拍得任務(wù)。在航天器任務(wù)規(guī)劃計(jì)算過(guò)程中,Lambert變軌過(guò)程的變軌時(shí)長(zhǎng)是通過(guò)提前設(shè)置確定的,因此時(shí)間消耗必定不會(huì)超過(guò)閾值,考慮通過(guò)任務(wù)價(jià)格是否超過(guò)剩余速度增量來(lái)進(jìn)行判斷。 在拍賣(mài)結(jié)束后剩余未分配的任務(wù)認(rèn)為流拍,但考慮到航天器任務(wù)分配中可能出現(xiàn)目標(biāo)扎堆而服務(wù)航天器分散的可能:多個(gè)目標(biāo)可以被同一個(gè)航天器進(jìn)行服務(wù),而不能被其他航天器服務(wù)。因此設(shè)計(jì)流拍的任務(wù)自動(dòng)進(jìn)入下一輪拍賣(mài)任務(wù)候選集進(jìn)行重拍。 當(dāng)所有買(mǎi)家均已競(jìng)價(jià)完畢,則認(rèn)為本輪拍賣(mài)結(jié)束,拍賣(mài)成功的任務(wù)歸屬相應(yīng)的買(mǎi)家并進(jìn)入下一輪拍賣(mài)。在每一輪次的拍賣(mài)過(guò)程結(jié)束后,需要根據(jù)式(18)對(duì)所有剩余任務(wù)進(jìn)行優(yōu)先級(jí)更新,并選出下一輪拍賣(mài)任務(wù),同時(shí)根據(jù)式(5),(24),(26)和(27)確定拍賣(mài)任務(wù)的速度消耗、價(jià)格。該過(guò)程為增量式分配,對(duì)于執(zhí)行任務(wù)過(guò)程中新添加的任務(wù)或者未完成任務(wù)狀態(tài)發(fā)生改變,可以更新剩余任務(wù)集實(shí)現(xiàn)快速規(guī)劃。 拍賣(mài)算法整體的流程如框圖5所示。當(dāng)所有的任務(wù)均已分配完畢,或者在本輪次拍賣(mài)中所有拍賣(mài)品均流拍,則認(rèn)為拍賣(mài)結(jié)束。若式(5)計(jì)算過(guò)程中未考慮攝動(dòng)力影響,則對(duì)方案中速度脈沖進(jìn)行修正,最終輸出規(guī)劃方案。 圖5 改進(jìn)啟發(fā)式拍賣(mài)算法流程框圖Fig.5 Schematic diagram of the improved heuristic auction algorithm 若將本文算法應(yīng)用于航天器星上在線規(guī)劃,需要設(shè)計(jì)計(jì)算體系。當(dāng)任何一個(gè)航天器探測(cè)到需要清除的碎片目標(biāo),或者需要被保障時(shí),將被服務(wù)目標(biāo)的軌道六根數(shù)信息、時(shí)刻信息發(fā)布給其余服務(wù)航天器,所有服務(wù)航天器隨機(jī)依次進(jìn)行競(jìng)拍。算法實(shí)現(xiàn)過(guò)程中價(jià)格計(jì)算考慮二體動(dòng)力學(xué)約束。 考慮實(shí)際在軌應(yīng)用中服務(wù)航天器的運(yùn)算能力存在差異,設(shè)計(jì)如圖6集中式與分布式兩種計(jì)算體系: 圖6 計(jì)算體系Fig.6 Computing architecture (1)集中式體系主要考慮到服務(wù)航天器運(yùn)算能力較低,要求計(jì)算中心航天器具備較強(qiáng)的運(yùn)算能力,并對(duì)其依賴(lài)度高。計(jì)算中心航天器收集各服務(wù)航天器信息及發(fā)布的任務(wù)信息,進(jìn)行集中式運(yùn)算,各服務(wù)航天器按照隨機(jī)順序依次競(jìng)拍,最后將考慮攝動(dòng)力約束修正后的規(guī)劃指令下發(fā)各服務(wù)航天器執(zhí)行。計(jì)算中心航天器也可以具備任務(wù)信息發(fā)布的能力。 (2)分布式體系要求服務(wù)航天器具備一定的運(yùn)算能力進(jìn)行分布式信息交互與運(yùn)算。該模式下任意服務(wù)航天器出現(xiàn)故障對(duì)其他服務(wù)航天器影響較小??梢杂脠DG(V,E)表示服務(wù)航天器通信網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),圖中點(diǎn)的集合V表示服務(wù)航天器集合U,E表示連接各節(jié)點(diǎn)的邊。如果兩個(gè)服務(wù)航天器可以通信,則存在連接這兩個(gè)節(jié)點(diǎn)的邊;若任意兩個(gè)節(jié)點(diǎn)間至少存在一條鏈路,則稱(chēng)通信網(wǎng)絡(luò)是聯(lián)通的。本文中假設(shè)滿足聯(lián)通要求,由于分布式體系中沒(méi)有計(jì)算中心收集并發(fā)布每輪次任務(wù)信息、價(jià)格信息,因此需通過(guò)信息交互過(guò)程計(jì)算得出。具體步驟為: a)各任務(wù)發(fā)布航天器發(fā)布任務(wù),所有服務(wù)航天器通過(guò)信息交互獲得任務(wù)集; b)通過(guò)信息交互各服務(wù)航天器獲得該輪次任務(wù)優(yōu)先級(jí)排序結(jié)果,判定該輪次分配任務(wù)集; c)通過(guò)信息交互各服務(wù)航天器獲得所有任務(wù)價(jià)格信息、收入信息,按照隨機(jī)順序進(jìn)行競(jìng)拍。競(jìng)拍過(guò)程中也依賴(lài)于信息交互進(jìn)行價(jià)格更新、沖突解決; d)該輪次任務(wù)分配后進(jìn)入下一輪次,直到滿足結(jié)束條件。各服務(wù)航天器分別考慮攝動(dòng)力約束對(duì)自身分得任務(wù)進(jìn)行速度脈沖修正、執(zhí)行。 本節(jié)將設(shè)置算例對(duì)本文所提出的算法進(jìn)行仿真驗(yàn)證。仿真過(guò)程采用個(gè)人計(jì)算機(jī)完成,CPU型號(hào)為Intel Core i5-10210U@1.6G Hz,內(nèi)存為16 GB。設(shè)計(jì)在某次在軌服務(wù)任務(wù)中,有5個(gè)服務(wù)航天器和20個(gè)待服務(wù)目標(biāo),每個(gè)服務(wù)航天器攜帶燃料可以滿足200 m/s的速度增量產(chǎn)生,要求在10天內(nèi)完成多對(duì)多在軌服務(wù)任務(wù),目標(biāo)的重要度評(píng)分相同,各服務(wù)航天器對(duì)所有目標(biāo)的收入相同。設(shè)置雙方軌道偏心率和近地點(diǎn)幅角均為零,其余六根數(shù)信息服務(wù)航天器見(jiàn)表2,目標(biāo)任務(wù)見(jiàn)表3。服務(wù)航天器和目標(biāo)的軌道傾角、升交點(diǎn)赤經(jīng)在正負(fù)0.05°之間隨機(jī)選取,平近點(diǎn)角在50°至60°之間隨機(jī)選取。 表2 各服務(wù)航天器軌道參數(shù)Table 2 Orbital parameters of each servicing spacecraft 表3 目標(biāo)軌道參數(shù)Table 3 Orbital parameters of each target 續(xù)表3 將本文設(shè)計(jì)算法與常用的遺傳算法(GA)與模擬退火算法(SA)進(jìn)行比較。其中模擬退火算法與遺傳算法為了保證對(duì)比的有效性和快速性,針對(duì)一對(duì)多部分時(shí)序取優(yōu)過(guò)程統(tǒng)一采用模擬退火算法實(shí)現(xiàn),多對(duì)多規(guī)劃部分迭代初值采用隨機(jī)選取。考慮加速運(yùn)算,均加入了一對(duì)多規(guī)劃結(jié)果歷史存儲(chǔ)與查詢部分,以減少重復(fù)運(yùn)算,仿真時(shí)間均設(shè)定為2022年5月10日04∶00∶00~2022年5月20日04∶00∶00。算法參數(shù)設(shè)定變軌時(shí)間修正量1800 s,代價(jià)更新ε取為0.05,GA種群規(guī)模和SA馬爾科夫鏈長(zhǎng)度取為10,GA最大遺傳代數(shù)取為50,SA初始溫度數(shù)值取為100,SA衰減參數(shù)取為0.8,服務(wù)時(shí)長(zhǎng)取為1800 s。 改進(jìn)啟發(fā)式拍賣(mài)算法(Improved heuristic auction algorithm,IHAA)任務(wù)規(guī)劃結(jié)果見(jiàn)表4和表5,考慮二體動(dòng)力學(xué)約束、J2攝動(dòng)計(jì)算價(jià)格規(guī)劃結(jié)果相同,速度增量消耗總量均為250.0093 m/s。 表4 任務(wù)規(guī)劃結(jié)果(部分)Table 4 Part of the task planning results 表5 任務(wù)分配結(jié)果Table 5 Task assignment results 為了驗(yàn)證本文算法的快速性和有效性,以IHAA算法結(jié)果目標(biāo)函數(shù)值作為遺傳算法與模擬退火算法的迭代結(jié)束條件,以對(duì)比達(dá)到同樣性能時(shí),三種算法的求解效率差異,仿真對(duì)比結(jié)果見(jiàn)表6。 表6 三種算法求解效率對(duì)比Table 6 Comparison of the efficiency of three algorithms 表6中第二列表示僅考慮二體動(dòng)力學(xué)計(jì)算算法中每一步目標(biāo)函數(shù)(拍賣(mài)價(jià)格);第三列表示對(duì)第二列結(jié)果(兩次脈沖速度矢量)考慮J2攝動(dòng)影響進(jìn)行修正后的總耗時(shí);第四列表示每一步目標(biāo)函數(shù)(拍賣(mài)價(jià)格)計(jì)算時(shí)便考慮J2攝動(dòng)影響。三類(lèi)算法速度增量消耗與迭代次數(shù)變化關(guān)系對(duì)比如圖7所示。 圖7 三種算法迭代計(jì)算對(duì)比圖Fig.7 Comparison of iterative calculation of three algorithms IHAA算法不存在迭代次數(shù)的概念,考慮對(duì)比效果在圖7中畫(huà)為一條直線。觀察結(jié)果可以看出拍賣(mài)算法在短時(shí)間內(nèi)能快速給出一個(gè)相對(duì)較優(yōu)的方案,在時(shí)間上相對(duì)于傳統(tǒng)優(yōu)化算法有極大優(yōu)勢(shì),能大幅度提高求解效率,尤其是僅考慮二體動(dòng)力學(xué)約束計(jì)算拍賣(mài)價(jià)格時(shí),具備星上自主在線規(guī)劃潛力(考慮J2攝動(dòng)修正機(jī)動(dòng)指令可由各執(zhí)行航天器分別計(jì)算)。 當(dāng)考慮燃料不充足時(shí),設(shè)置所有服務(wù)航天器攜帶燃料可以滿足10 m/s的速度增量產(chǎn)生,仍然要求十天內(nèi)完成任務(wù),此時(shí)GA算法和SA算法均無(wú)法得到有效解,IHAA算法實(shí)現(xiàn)分配結(jié)果如表7所示??梢钥闯霎?dāng)燃料資源緊張時(shí),相比于優(yōu)化算法無(wú)法給出規(guī)劃,IHAA仍然可以實(shí)現(xiàn)部分結(jié)果輸出。 表7 燃料不充足時(shí)任務(wù)分配結(jié)果Table 7 Task assignment results when fuel is insufficient 無(wú)論是集中式計(jì)算體系還是分布式計(jì)算體系,都需要確定各服務(wù)航天器的競(jìng)拍順序。設(shè)計(jì)中各服務(wù)航天器可按照隨機(jī)順序依次競(jìng)拍,需要分析該策略對(duì)于分配方案結(jié)果的影響。實(shí)驗(yàn)中改變5個(gè)服務(wù)航天器的競(jìng)拍順序,每次規(guī)劃方案在形成規(guī)劃方案后對(duì)兩次脈沖速度矢量考慮J2攝動(dòng)影響修正,共120種時(shí)序下計(jì)算速度增量總消耗值的變化情況。 圖8 速度增量消耗與競(jìng)拍時(shí)序關(guān)系圖Fig.8 Relation between Δv and auction order 圖8中更新工況1航天器速度增量改為1000 m/s,雙方平近點(diǎn)角在50°至100°間隨機(jī)選取更新,更新工況2將ε值調(diào)整為0.5。可以看出,不同的航天器競(jìng)拍順序?qū)τ谧罱K規(guī)劃方案影響相對(duì)較小,且速度增量消耗量?jī)?yōu)于優(yōu)化算法初始多輪次的計(jì)算結(jié)果,具體與雙方軌道根數(shù)、代價(jià)更新ε值等有關(guān)。在本文算例中,120種競(jìng)拍順序最終燃料消耗相同,規(guī)劃結(jié)果也相同。可以看出隨機(jī)順序策略具備可行性。 本文針對(duì)GEO航天器多對(duì)多在軌服務(wù)任務(wù)規(guī)劃問(wèn)題建立了數(shù)學(xué)模型,探索運(yùn)用拍賣(mài)算法實(shí)現(xiàn)快速的規(guī)劃方案制定,設(shè)計(jì)了改進(jìn)啟發(fā)式拍賣(mài)算法,解決了傳統(tǒng)優(yōu)化算法制定規(guī)劃方案耗時(shí)久、計(jì)算資源消耗大的問(wèn)題,最后通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了所提算法的有效性和可行性。研究成果及總結(jié)如下: 1) 建立了基于Lambert變軌的規(guī)劃問(wèn)題數(shù)學(xué)表征,并在給定變軌時(shí)長(zhǎng)約束前提下快速確定變軌時(shí)長(zhǎng)與速度增量消耗,可用于拍賣(mài)算法的價(jià)格計(jì)算和優(yōu)化算法的代價(jià)函數(shù)計(jì)算。 2) 提出了基于拍賣(mài)算法的快速規(guī)劃,針對(duì)拍賣(mài)品的時(shí)序確定問(wèn)題提出了一種基于先驗(yàn)知識(shí)的確定策略,并設(shè)計(jì)了重拍機(jī)制以增加目標(biāo)的被選中概率,在考慮J2攝動(dòng)影響下給出最終任務(wù)規(guī)劃方案。仿真測(cè)試結(jié)果表明,與遺傳算法、模擬退火優(yōu)化算法相比,具有更高效的“次優(yōu)”方案確定能力,在動(dòng)態(tài)環(huán)境下(突發(fā)事件發(fā)生或新任務(wù)添加)相比傳統(tǒng)優(yōu)化算法更快速,具備快速形成有效規(guī)劃方案的能力。 3) 在燃料、時(shí)間約束限制強(qiáng)時(shí),優(yōu)化算法往往難以找到可行的迭代初值導(dǎo)致無(wú)解,而此時(shí)本文所提算法可以給出部分可行方案。但同時(shí)也可能會(huì)出現(xiàn)實(shí)際可以覆蓋所有任務(wù),但方案未實(shí)現(xiàn)全分配的現(xiàn)象,這是由算法結(jié)果并不是全局最優(yōu)解導(dǎo)致的。 4) 鑒于本文算法的快速性,后續(xù)可考慮用于效能評(píng)估指導(dǎo)服務(wù)航天器空間部署。同時(shí)本文設(shè)計(jì)了集中式與分布式兩種計(jì)算體系,后續(xù)可考慮應(yīng)用于星上規(guī)劃平臺(tái)。若運(yùn)算時(shí)間充裕,允許多次迭代優(yōu)化,本文算法亦適用于優(yōu)化算法的初值尋找。2.2 拍賣(mài)任務(wù)價(jià)格計(jì)算
2.3 出價(jià)策略設(shè)計(jì)
2.4 競(jìng)標(biāo)沖突過(guò)程設(shè)計(jì)
2.5 重拍機(jī)制設(shè)計(jì)
2.6 中標(biāo)機(jī)制
2.7 方案確定
2.8 星上在線規(guī)劃
3 仿真校驗(yàn)
3.1 仿真工況
3.2 算法效率對(duì)比
3.3 買(mǎi)家競(jìng)拍順序影響分析
4 結(jié) 論