亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        集群航天器魯棒自適應(yīng)快速任務(wù)分配

        2023-09-22 12:44:20張潤德蔡偉偉楊樂平范大偉
        宇航學(xué)報 2023年8期
        關(guān)鍵詞:優(yōu)化

        張潤德,蔡偉偉,楊樂平,范大偉

        (國防科技大學(xué)空天科學(xué)學(xué)院,長沙 410073)

        0 引 言

        隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和空間任務(wù)的日趨復(fù)雜,航天領(lǐng)域發(fā)展逐漸呈現(xiàn)出從單一、大型航天器到分布式空間系統(tǒng)的新趨勢[1-2]。集群航天器以其靈活性、魯棒性、自適應(yīng)性等優(yōu)點(diǎn)受到學(xué)者們的廣泛關(guān)注[3]。集群航天器任務(wù)分配可表示為多約束條件下的離散空間組合優(yōu)化問題,其目的在于建立航天器和任務(wù)之間的映射關(guān)系,以保證每個航天器在對應(yīng)的時間窗口內(nèi)執(zhí)行特定的活動[4]。受通信能力、任務(wù)需求、機(jī)載存儲能力、計(jì)算能力和軌道特性等諸多因素限制,集群航天器快速任務(wù)分配仍是一項(xiàng)極具挑戰(zhàn)的工作。

        根據(jù)控制框架的不同,集群航天器任務(wù)分配方法可分為集中式和分布式兩大類。集中式任務(wù)分配主要包括最優(yōu)化方法和啟發(fā)式算法,其中以群智能算法、遺傳算法、模擬退火等為代表的智能算法應(yīng)用最為廣泛[5]。分布式結(jié)構(gòu)類似于自然界中生物種群,各航天器間通過信息交互協(xié)同完成各項(xiàng)任務(wù)。典型的分布式任務(wù)分配模型包括多智能體理論、分布式約束和類市場機(jī)制等[6]。類市場機(jī)制通過航天器間通信協(xié)商解決分配沖突,主要包括合同網(wǎng)法[7]和拍賣算法[8],其區(qū)別在于拍賣算法中每個航天器都是系統(tǒng)中的投標(biāo)人,而合同網(wǎng)中接到任務(wù)的航天器會充當(dāng)局部拍賣商的角色,主持競拍程序[9]。Bertsekas[10]借鑒拍賣過程中根據(jù)參與者競價決定商品歸屬的思路,率先提出了拍賣算法,并將其拓展至最短路徑問題和任務(wù)分配問題。Zavlanos等[11]考慮去掉共享存儲中心,在缺乏全局信息的情況下提出了完全分布式拍賣算法。但在智能體數(shù)大于任務(wù)數(shù)的場景中,同一任務(wù)可能被分配給多個智能體,導(dǎo)致任務(wù)分配失敗。

        燃料消耗是集群任務(wù)分配中一項(xiàng)關(guān)鍵指標(biāo),可通過相對運(yùn)動軌跡規(guī)劃進(jìn)行數(shù)值求解,主要思路包括“優(yōu)化+離散”的間接法和“離散+優(yōu)化”的直接法[12]。間接法先基于變分法推導(dǎo)最優(yōu)控制的一階必要條件,再求解哈密頓邊值問題獲得最優(yōu)控制序列,但非線性動力學(xué)模型和集群重構(gòu)中各種復(fù)雜約束限制了間接法的應(yīng)用范圍。直接法通過離散狀態(tài)或控制空間,將最優(yōu)控制問題轉(zhuǎn)化為非線性規(guī)劃問題,利用數(shù)值優(yōu)化算法進(jìn)行求解,主要包括偽譜法[13]、凸優(yōu)化[14-15]等算法,其中文獻(xiàn)[16]表明序列凸優(yōu)化的計(jì)算效率高于偽譜法,展現(xiàn)出其在在線規(guī)劃中巨大潛力。但在集群航天器協(xié)同觀測任務(wù)中,航天器終端邊界條件不固定,即使是計(jì)算效率較高的凸優(yōu)化算法也將消耗巨大的計(jì)算資源。針對航天器進(jìn)入自然繞飛軌道問題,文獻(xiàn)[17]基于凸松弛和線性投影技術(shù)提出一種混合凸優(yōu)化算法,但該算法單次求解耗時約15~20 s,難以滿足集群航天器自主快速任務(wù)分配的需求。

        為提高燃料指標(biāo)求解效率,Edelbaum[18]基于軌道根數(shù)推導(dǎo)了絕對坐標(biāo)系下近圓軌道間連續(xù)推力轉(zhuǎn)移所需特征速度的解析解,眾多學(xué)者在此基礎(chǔ)上考慮J2項(xiàng)攝動、共面小偏心率軌道轉(zhuǎn)移和轉(zhuǎn)移圈數(shù)等因素提出了一系列改進(jìn)方法[19-21]。Edelbaum法適用于大范圍連續(xù)推力轉(zhuǎn)移軌跡的燃料預(yù)測,且通常基于多圈轉(zhuǎn)移假設(shè)[22],難以直接應(yīng)用于小范圍、固定轉(zhuǎn)移時間的相對運(yùn)動軌跡規(guī)劃問題。隨著人工智能技術(shù)的飛速發(fā)展,越來越多的學(xué)者嘗試?yán)脵C(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等技術(shù)解決航天領(lǐng)域的難題,在動力學(xué)建模、最優(yōu)控制和任務(wù)設(shè)計(jì)等領(lǐng)域取得良好的應(yīng)用[23-24]。朱閱訸等[25]分別利用分類和回歸多層感知機(jī)預(yù)測轉(zhuǎn)移軌跡的可行性和最優(yōu)燃料消耗。Viavattene等[26]針對近地小行星交會任務(wù),利用人工神經(jīng)網(wǎng)絡(luò)快速預(yù)測星際小推力轉(zhuǎn)移的時間和燃料消耗,將神經(jīng)網(wǎng)絡(luò)的輸出用于樹搜索算法以確定可行的小行星交會序列,仿真結(jié)果表明計(jì)算效率可提升兩個數(shù)量級。Li等[22,27]針對行星際多目標(biāo)任務(wù)規(guī)劃問題,利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測小推力轉(zhuǎn)移軌跡的最優(yōu)轉(zhuǎn)移時間和燃料消耗,仿真表明預(yù)測值的平均相對誤差小于0.5%。現(xiàn)有文獻(xiàn)中利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測轉(zhuǎn)移軌跡時間和燃料消耗指標(biāo)研究多集中于大范圍、小推力的行星間轉(zhuǎn)移,對航天器相對運(yùn)動軌跡預(yù)測研究較少。

        針對航天器集群協(xié)同觀測任務(wù)分配問題,本文提出一種基于深度神經(jīng)網(wǎng)絡(luò)和魯棒自適應(yīng)拍賣算法的快速任務(wù)分配策略。為快速求解航天器到達(dá)各觀測點(diǎn)所消耗的燃料,本文利用深度神經(jīng)網(wǎng)絡(luò)直接預(yù)測轉(zhuǎn)移軌跡的燃料消耗,以替代計(jì)算耗時的相對運(yùn)動軌跡規(guī)劃環(huán)節(jié)。為拓展拍賣算法的應(yīng)用范圍,通過構(gòu)造虛擬收益矩陣和虛擬分配向量使其適用于航天器數(shù)與任務(wù)數(shù)不一致的分配問題。根據(jù)航天器集與任務(wù)集的不匹配度自適應(yīng)調(diào)整報價增量,以提高算法的收斂速度。此外,考慮到分配過程中通信失聯(lián)、航天器故障等不確定因素,通過在線調(diào)整故障衛(wèi)星的收益和報價矩陣,使得拍賣算法能快速進(jìn)行任務(wù)重分配,從而提升算法魯棒性。

        首先,在相對運(yùn)動框架下描述集群航天器協(xié)同觀測任務(wù),對觀測收益、燃料消耗和任務(wù)分配問題進(jìn)行數(shù)學(xué)建模。其次,設(shè)計(jì)深度神經(jīng)網(wǎng)絡(luò)預(yù)測轉(zhuǎn)移軌跡的燃料消耗,利用凸優(yōu)化算法生成訓(xùn)練數(shù)據(jù),針對不同結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和優(yōu)化,并對比其性能。再次,提出一種改進(jìn)的魯棒自適應(yīng)拍賣算法,以提高任務(wù)分配的計(jì)算效率和精度。最后,通過數(shù)值仿真驗(yàn)證魯棒自適應(yīng)拍賣算法的性能。

        1 問題描述

        航天器相對運(yùn)動通常在如圖1所示的Hill坐標(biāo)系中表示,坐標(biāo)系原點(diǎn)位于目標(biāo)航天器質(zhì)心處,x軸與目標(biāo)航天器地心矢徑rt方向一致,y軸在軌道面內(nèi)與x軸垂直,并指向運(yùn)動方向,z軸由右手法則確定。

        圖1 Hill坐標(biāo)系示意圖Fig.1 Diagram of Hill coordinate

        當(dāng)觀測航天器初始相對狀態(tài)中長期項(xiàng)為零時,觀測航天器可圍繞目標(biāo)航天器進(jìn)行閉環(huán)周期性繞飛,且不需額外消耗燃料。繞飛軌跡在軌道面內(nèi)投影為2∶1的橢圓,航天器的相對運(yùn)動狀態(tài)x(t)可由一組繞飛軌道參數(shù)[b,c,yc,φ,ψ]進(jìn)行表示[28]。

        (1)

        式中:n為目標(biāo)航天器的平均軌道角速度;b為繞飛軌跡在軌道面內(nèi)投影橢圓的半短軸;c為繞飛軌跡在z軸方向的最大值;yc為繞飛中心在y軸方向的偏移量;φ和ψ分別為軌道面內(nèi)和面外相位角。

        相較于遠(yuǎn)距離觀測和地面觀測,航天器抵近觀測可獲得更加精細(xì)的目標(biāo)特征數(shù)據(jù)。利用多航天器協(xié)同觀測可有效提升任務(wù)時效性,尤其是針對高軌航天器。單個航天器對地球同步軌道目標(biāo)繞飛觀測一周耗時約24小時,觀測效率較低。利用多航天器協(xié)同觀測,再將多個航天器的觀測信息融合,可有效縮短所需觀測時間。

        集群航天器協(xié)同觀測任務(wù)如圖2所示。初始時刻,集群航天器在己方航天器周圍進(jìn)行伴飛。任務(wù)開始后,需從伴飛集群中選擇部分或全部航天器進(jìn)入目標(biāo)航天器的繞飛軌道,對目標(biāo)執(zhí)行協(xié)同觀測任務(wù)。首先,需要優(yōu)化觀測點(diǎn)的相對狀態(tài)。受光照條件影響,每個觀測點(diǎn)對應(yīng)的觀測收益不同,集群中各航天器轉(zhuǎn)移至不同觀測點(diǎn)所需消耗的燃料也不相同。其次,綜合考慮觀測收益和燃料消耗,確定集群中各航天器前往各觀測點(diǎn)的實(shí)際收益。最后,求解任務(wù)分配序列為集群內(nèi)各航天器分配任務(wù),使得集群整體收益最大。

        圖2 協(xié)同觀測任務(wù)示意圖Fig.2 Diagram of cooperative observation mission

        由式(1)可知,φ決定航天器在繞飛軌跡上的相對位置。假設(shè)集群航天器在繞飛軌道等相位分布,定義首個觀測點(diǎn)的面內(nèi)相位角為φ1,則第j個航天器的面內(nèi)相位角為

        (2)

        式中:0≤φ1<2π/Nt,Nt為觀測點(diǎn)個數(shù),可根據(jù)觀測航天器數(shù)量、繞飛軌道周期、任務(wù)時間和觀測角度等參數(shù)提前設(shè)定。因此,當(dāng)繞飛軌跡構(gòu)型確定后,給定相位角φ1,即可確定所有觀測點(diǎn)的相對狀態(tài)。

        集群航天器執(zhí)行協(xié)同觀測任務(wù)時,需同時考慮觀測收益和轉(zhuǎn)移軌跡的燃料消耗。當(dāng)航天器相機(jī)視場內(nèi)出現(xiàn)強(qiáng)烈光源時,電荷耦合器件會發(fā)生浮散現(xiàn)象,導(dǎo)致成像不清晰。因此,觀測航天器進(jìn)行成像觀測時,需滿足光照角約束。

        (3)

        式中:rct和rcs分別表示地球慣性坐標(biāo)系下觀測航天器指向目標(biāo)航天器和太陽的矢量。若θ小于預(yù)設(shè)的θmin,表示此時成像質(zhì)量無法滿足要求。此外,當(dāng)目標(biāo)航天器進(jìn)入地球陰影區(qū)時,觀測航天器也無法對其成像。因此,航天器i在觀測點(diǎn)j的觀測收益可表示為

        (4)

        式中:tobs表示觀測時長。當(dāng)θ(t)≥θmin且目標(biāo)航天器不處于地球陰影區(qū)時,oij(t)=1。否則,oij(t)=0。

        航天器i機(jī)動至觀測點(diǎn)j消耗的燃料最優(yōu)軌跡優(yōu)化問題可表示如下:

        (5)

        式中:i,k=1,2,…,Ns且i≠k,j=1,2,…,Nt。xi(t)和ui(t)分別表示集群中第i個航天器的相對狀態(tài)和控制量,Ns為集群中航天器個數(shù),xj表示第j個觀測點(diǎn)的相對狀態(tài)。動力學(xué)模型采用經(jīng)典的Clohessy-Wiltshire方程,矩陣A和B的具體表達(dá)式參見文獻(xiàn)[29]。Tmax為推進(jìn)器最大推力值。xi(t0)=xi0和xi(tf)=xj表示航天器i的初始狀態(tài)和終端狀態(tài)分別為xi0和xj,C=[I3×303×3],Rcol為兩航天器間最小容許距離。

        任務(wù)指派的決策變量c∈Ns×Nt,cij∈{0,1},其中cij=1表示第i個航天器部署在第j個觀測點(diǎn)。否則,cij=0。為使得每個觀測點(diǎn)只有一個航天器,且每個航天器至多只前往一個觀測點(diǎn),任務(wù)分配模型可表示如下:

        (6)

        式中:J=ω1O-ω2F。Jij表示航天器i執(zhí)行任務(wù)j的實(shí)際收益等于觀測收益減去燃料消耗,ω1和ω2為對應(yīng)的收益系數(shù)。

        綜上所述,集群航天器協(xié)同觀測任務(wù)分配主要包括優(yōu)化相位角φ1、計(jì)算收益矩陣和任務(wù)指派三部分。如圖3所示,相位角φ1決定所有觀測點(diǎn)的相對狀態(tài),為相對運(yùn)動軌跡規(guī)劃提供終端邊界條件。收益矩陣J為任務(wù)指派提供分配指標(biāo),任務(wù)指派確定的決策向量c最終決定集群航天器的總收益。

        圖3 集群航天器任務(wù)分配流程圖Fig.3 Flow chart of task assignment for spacecraft swarm

        2 基于深度神經(jīng)網(wǎng)絡(luò)的燃料消耗預(yù)測

        航天器相對運(yùn)動燃料最優(yōu)軌跡規(guī)劃問題可轉(zhuǎn)化為非線性最優(yōu)控制問題,并利用凸優(yōu)化等數(shù)值優(yōu)化算法進(jìn)行求解。但隨著集群規(guī)模增大,任務(wù)分配的計(jì)算量急劇增加,以至于現(xiàn)有計(jì)算條件難以滿足在線規(guī)劃的需求。為提高計(jì)算效率,本文利用深度神經(jīng)網(wǎng)絡(luò)直接預(yù)測航天器相對運(yùn)動的燃料消耗,從而替代數(shù)值優(yōu)化過程。

        深度神經(jīng)網(wǎng)絡(luò)包含一個輸入層、一個輸出層和多個隱藏層,輸入層和輸出層的維度分別與輸入和輸入數(shù)據(jù)維度一致,每個隱藏層包含多個神經(jīng)元。本文選用初始和終端繞飛軌道特征參數(shù)[b0,c0,φ0,ψ0,bf,cf,φf,ψf]作為神經(jīng)網(wǎng)絡(luò)的輸入,最優(yōu)控制對應(yīng)的燃料消耗矩陣F為輸出,如圖4所示。

        圖4 深度神經(jīng)網(wǎng)絡(luò)示意圖Fig.4 The diagram of deep neural network

        2.1 數(shù)據(jù)生成與預(yù)處理

        實(shí)際任務(wù)中航天器的尺寸遠(yuǎn)小于集群構(gòu)形尺寸,衛(wèi)星間發(fā)生碰撞的概率通常較小。為提高迭代效率,在任務(wù)分配階段可先不考慮避碰約束,然后再評估最優(yōu)分配方案是否會發(fā)生碰撞,若發(fā)生碰撞可利用文獻(xiàn)[15]中基于序列凸優(yōu)化和模型預(yù)測控制的閉環(huán)制導(dǎo)策略進(jìn)行在線調(diào)整。因此,在離散化和解耦的基礎(chǔ)上可將集群重構(gòu)軌跡規(guī)劃問題轉(zhuǎn)化為如下凸優(yōu)化問題:

        (7)

        式中:i=1,2,…,Ns,j=1,2,…,Nt,k=0,1,…,Nd-1,Nd為離散步數(shù)。xi(k)和ui(k)分別表示行航天器i第k步的相對狀態(tài)和相對控制向量,Ad和Bd可由離散形式的相對運(yùn)動方程推導(dǎo)而得。

        假設(shè)目標(biāo)航天器位于地球同步軌道,集群航天器從10 km外的伴飛軌道轉(zhuǎn)移至相對坐標(biāo)原點(diǎn)的繞飛軌道,集群航天器最大推力加速度為0.98 m/s2,飛行時長為800 s,繞飛軌道的各參數(shù)服從均勻分布,取值范圍如表1所示。

        表1 繞飛軌道參數(shù)取值范圍Table 1 Value ranges of fly-by orbit parameters

        在各參數(shù)的取值范圍內(nèi)隨機(jī)生成繞飛軌道參數(shù),構(gòu)造相對運(yùn)動初始和終端邊界條件,再利用凸優(yōu)化算法求解上述凸優(yōu)化問題,得到對應(yīng)的燃料消耗指標(biāo)F。仿真共生成15萬組數(shù)據(jù),并按照8∶1∶1的比例構(gòu)建訓(xùn)練集、驗(yàn)證集和測試集。

        由于各參數(shù)間的數(shù)量級相差較大,采用最大-最小歸一化方法對繞飛軌道參數(shù)和燃料消耗指標(biāo)進(jìn)行歸一化處理。最大-最小歸一化方法是深度學(xué)習(xí)數(shù)據(jù)預(yù)處理中常用的一種方法,可將樣本轉(zhuǎn)化為[0,1]區(qū)間內(nèi)無量綱的純數(shù)值,便于不同單位或量級的參數(shù)能夠進(jìn)行比較和加權(quán),進(jìn)而提升神經(jīng)網(wǎng)絡(luò)的收斂速度和精度,其定義如下:

        (8)

        式中:p為原始數(shù)據(jù),pmax和pmin分別表示原始數(shù)據(jù)的最大值和最小值,p′為歸一化之后的數(shù)據(jù)。

        2.2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練與優(yōu)化

        選用全連接神經(jīng)網(wǎng)絡(luò),隱藏層的之間的激活函數(shù)為Relu函數(shù)。神經(jīng)網(wǎng)絡(luò)優(yōu)化目標(biāo)為訓(xùn)練樣本與預(yù)測值之間的均方差。

        (9)

        神經(jīng)網(wǎng)絡(luò)規(guī)模主要取決于隱藏層的層數(shù)和神經(jīng)元數(shù)目。網(wǎng)絡(luò)規(guī)模過大會導(dǎo)致結(jié)構(gòu)復(fù)雜、訓(xùn)練時間增長,甚至出現(xiàn)過擬合現(xiàn)象。網(wǎng)絡(luò)規(guī)模過小難以擬合輸入和輸出之間的映射關(guān)系,無法滿足訓(xùn)練精度。本文對比了不同結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)對訓(xùn)練結(jié)果的影響,神經(jīng)網(wǎng)絡(luò)的測試結(jié)果如表2所示。

        表2 不同網(wǎng)絡(luò)的相對誤差對比Table 2 Comparison of relative errors of different networks

        神經(jīng)網(wǎng)絡(luò)“3×20”表示該網(wǎng)絡(luò)隱藏層數(shù)和隱藏層神經(jīng)元數(shù)分別為3和20。由表2可知,神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差服從正態(tài)分布,且誤差的均值接近零。第1-4組仿真中隱藏層的神經(jīng)元數(shù)不變,隨著隱藏層層數(shù)增加,相對誤差的標(biāo)準(zhǔn)差先減小而后基本保持不變,其中7層和9層網(wǎng)絡(luò)預(yù)測精度相近。對比第5-8組仿真中的7層神經(jīng)網(wǎng)絡(luò),隨著隱藏層神經(jīng)元數(shù)增加,相對誤差標(biāo)準(zhǔn)差先逐漸減小而后增大。對比第9-12組仿真,預(yù)測結(jié)果的相對誤差標(biāo)準(zhǔn)差同樣呈現(xiàn)先減小后增大的規(guī)律。表2中神經(jīng)網(wǎng)絡(luò)“7×140”和“9×120”的預(yù)測精度相近,網(wǎng)絡(luò)訓(xùn)練時間分別為1.8和2小時。綜合考慮訓(xùn)練精度和訓(xùn)練效率,本文選用神經(jīng)網(wǎng)絡(luò)“7×140”用于后續(xù)仿真中預(yù)測轉(zhuǎn)移軌跡的燃料消耗,該網(wǎng)絡(luò)預(yù)測相對誤差的3σ區(qū)間為[-3.78%, 3.68%],即相對誤差位于該區(qū)間的概率為99.73%。實(shí)際任務(wù)中可利用地面控制站的計(jì)算資源生成樣本并訓(xùn)練神經(jīng)網(wǎng)絡(luò),僅將訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)參數(shù)上傳至觀測航天器上,避免占用寶貴的在軌計(jì)算資源。

        為驗(yàn)證深度神經(jīng)網(wǎng)絡(luò)的適應(yīng)性,利用上述針對地球同步軌道航天器設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)“7×140”分別預(yù)測低軌、中軌和高軌航天器相對運(yùn)動的燃料消耗,其中每個軌道隨機(jī)生成100個任務(wù)場景,神經(jīng)網(wǎng)絡(luò)“7×140”預(yù)測值相較于凸優(yōu)化精確解的相對誤差的均值和標(biāo)準(zhǔn)差如表3所示。仿真結(jié)果表明,在地球同步軌道上下100 km處,神經(jīng)網(wǎng)絡(luò)“7×140”的預(yù)測精度與該網(wǎng)絡(luò)對地球同步軌道目標(biāo)的預(yù)測精度相近。但當(dāng)軌道高度與地球同步軌道相距較大時,其預(yù)測誤差較大,可信度較低,需利用對應(yīng)的軌道仿真數(shù)據(jù)重新訓(xùn)練神經(jīng)網(wǎng)絡(luò)。

        表3 不同軌道處燃料消耗預(yù)測相對誤差Table 3 Relative errors of predicted fuel consumption at different orbits

        3 魯棒自適應(yīng)拍賣算法

        拍賣算法借鑒了人類社會中的競拍流程,各航天器根據(jù)當(dāng)前狀態(tài)計(jì)算任務(wù)收益,通過與鄰居通信了解對方的競價信息并調(diào)整自身的任務(wù)報價,最終選擇凈收益最大的任務(wù)。

        由于分配問題中任務(wù)數(shù)與航天器數(shù)可能不相等,本文通過構(gòu)造虛擬收益矩陣和虛擬分配方案,將原問題轉(zhuǎn)化為任務(wù)數(shù)與航天器數(shù)一致的分配問題,以便于應(yīng)用分布式拍賣的算法。對航天器i執(zhí)行如下步驟:

        1)集群內(nèi)每個航天器根據(jù)當(dāng)前狀態(tài)和觀測點(diǎn)狀態(tài),分布式計(jì)算觀測收益、燃料消耗,并構(gòu)造收益矩陣J∈Ns×Nt,其中Jij表示航天器i執(zhí)行任務(wù)j的收益。若Ns≠Nt,則通過補(bǔ)零的策略將J展為虛擬收益方陣Ns×Ns。

        3)航天器i通過星間通信獲取上一輪中所有鄰居Ni(k)對任務(wù)j的最高報價p(k+1)及對應(yīng)的最高出價者b(k+1)。

        4)如果航天器i對目標(biāo)任務(wù)的上輪報價小于等于此輪報價,且目標(biāo)任務(wù)的最高出價者不是航天器i,則將凈收益最高的任務(wù)分配給航天器i,同時在上輪報價的基礎(chǔ)上增加γi,其中γi表示航天器i執(zhí)行所有任務(wù)的最大凈收益和第二凈收益之差再加上增量ε。

        (10)

        3.1 ε自適應(yīng)調(diào)整策略

        增量ε會影響拍賣算法計(jì)算效率和精度,通過定義任務(wù)集和航天器集之間的不匹配度,可使得ε在迭代過程中可根據(jù)不匹配度自適應(yīng)調(diào)整。

        初始時刻航天器對所有任務(wù)報價均為零,所有航天器都傾向于執(zhí)行收益最大的任務(wù),而其他任務(wù)沒有航天器執(zhí)行,此時任務(wù)集與航天器集的匹配度較低。在迭代過程中,航天器不斷提升自身報價,并根據(jù)凈收益調(diào)整分配目標(biāo),最終實(shí)現(xiàn)任務(wù)與航天器一一匹配。定義如下指標(biāo)M表征航天器集與任務(wù)集之間的不匹配程度

        (11)

        式中:

        (12)

        由式(11)和(12)可知,M∈[0,Nt]。若執(zhí)行所有任務(wù)的航天器數(shù)量均不等于1,即M=Nt,ε可取較大值以快速提高任務(wù)報價,增加航天器集與任務(wù)集間的匹配程度。隨著不匹配度M值的減小,ε值可逐漸減小,使得算法收斂精度更高。因此,為實(shí)現(xiàn)增量ε隨不匹配度M自適應(yīng)調(diào)整,定義如下線性變化關(guān)系

        (13)

        式中:εmin和εmax為設(shè)定的最小和最大增量。

        3.2 魯棒自適應(yīng)拍賣算法

        在實(shí)際任務(wù)中,考慮到航天器發(fā)生故障失去任務(wù)能力、通信失聯(lián)等不確定因素,需要針對不確定情況下任務(wù)分配展開研究。集中式分配方法根據(jù)已知全局信息為集群中所有航天器分配任務(wù),若發(fā)生不確定事件,則需在初次分配結(jié)束后根據(jù)更新的狀態(tài)信息重新分配。分布式分配方法在優(yōu)化過程中每個航天器需要反復(fù)獲取其他航天器的報價信息以調(diào)整自身報價,若某個航天器發(fā)生故障或通信失聯(lián),可以直接調(diào)整其收益和報價信息進(jìn)行魯棒規(guī)劃。

        定義通信矩陣G∈Ns×Nt,若在第k迭代中航天器i能接收到航天器j的報價信息,則Gij(k)=1。若航天器i無法接收到航天器j的報價信息,或收到航天器j的故障信息,則Gij(k)=0。假設(shè)航天器間采用雙向通信,則Gij(k)=Gji(k)。

        假設(shè)集群中所有航天器i在第k輪迭代中都無法接收到航天器j的報價信息,或僅收到航天器j發(fā)出的故障信息,則認(rèn)為航天器j失效,無法繼續(xù)執(zhí)行任務(wù),其中i,j=1,2,…,Ns且i≠j。由于航天器j已失去任務(wù)能力,令其執(zhí)行所有任務(wù)的收益均為零,即

        (14)

        在前k-1輪迭代中,其他航天器已經(jīng)分配到相應(yīng)的任務(wù),為避免失效航天器j對其他航天器任務(wù)分配結(jié)果的干擾,將其第k-1輪報價置零,即

        pj(k-1)=0

        (15)

        通過將失效航天器的收益和報價信息置零,可降低失效航天器的后續(xù)分配過程中的競爭力。若任務(wù)數(shù)小于航天器數(shù),則失效航天器將無法分配到實(shí)際任務(wù)。若任務(wù)數(shù)等于航天器數(shù),則失效航天器只能分配到收益較低的任務(wù),從而使得整個集群收益最大。完整的魯棒自適應(yīng)拍賣算法流程如圖5所示。

        圖5 魯棒自適應(yīng)拍賣算法流程圖Fig.5 Flow chart of robust adaptive auction algorithm

        4 仿真校驗(yàn)

        為驗(yàn)證魯棒自適應(yīng)拍賣算法性能,在給定觀測點(diǎn)的場景下,針對不同規(guī)模的分配問題和不同ε值進(jìn)行數(shù)值仿真。此外,針對集群航天器協(xié)同觀測任務(wù)分配問題展開仿真,并與凸優(yōu)化和遺傳算法進(jìn)行對比。

        4.1 魯棒自適應(yīng)拍賣算法性能驗(yàn)證

        假設(shè)仿真開始時間為2022年6月16日0時0分0秒,目標(biāo)航天器在地球慣性坐標(biāo)系下的初始位置和速度分別為rt=[37 097.59, 20 029.27,46.28]Tkm和vt=[-1.46, 2.70, 0.11]Tkm/s。初始繞飛軌道參數(shù)為b0=1 000 m,c0=900 m,yc0=10 km,ψ0=-π/6,首星面內(nèi)相位角為π/10,其他衛(wèi)星呈等相位分布。目標(biāo)繞飛軌道參數(shù)為bf=1 000 m,cf=800 m,ycf=0 m,ψf=π/4。繞飛時長為24小時,觀測收益系數(shù)ω1=1/864,燃料消耗系數(shù)ω2=1。集群航天器最大推力加速度為0.98 m/s2,轉(zhuǎn)移時間為800 s。由于集群航天器間相對距離較近,假設(shè)所有航天器均能雙向通信。在分布式迭代中過程,通信拓?fù)渲朽従有畔?、收益矩陣、價格矩陣、報價增量和當(dāng)前分配矩陣是每個航天器算法模塊的輸入,航天器根據(jù)輸入信息調(diào)整任務(wù)報價,獲得收益最高的任務(wù),并將報價信息傳遞至通信拓?fù)渲?進(jìn)入下一輪迭代,直至算法收斂[9]。仿真計(jì)算機(jī)處理器主頻和內(nèi)存分別為3.0 GHz和16 GB。為排除非線性優(yōu)化算法和燃料預(yù)測方法的影響,令首個觀測點(diǎn)面內(nèi)相位角為0,其他觀測點(diǎn)在繞飛軌道上等相位排列,利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測轉(zhuǎn)移軌跡的燃料消耗。

        首先,在航天器與觀測點(diǎn)數(shù)目相等的任務(wù)場景中驗(yàn)證拍賣算法、遺傳算法和蟻群算法的計(jì)算性能,參數(shù)設(shè)置如表4所示,其中優(yōu)化終止條件取值20表示收益值連續(xù)20代不變則認(rèn)為算法收斂。仿真中遺傳算法的優(yōu)化終止條件設(shè)為20、50和100,分別用GA20、GA50和GA100表示。

        由圖6(a)可知,拍賣算法和遺傳算法的計(jì)算耗時均小于1 s,優(yōu)于蟻群算法。圖6(b)表示遺傳算法和蟻群算法相較于拍賣算法的總收益差值,遺傳算法和蟻群算法的總收益值均低于拍賣算法,且總收益差值隨問題規(guī)模增加而整體呈現(xiàn)放大趨勢。此外,隨著優(yōu)化終止條件取值增大,遺傳算法的計(jì)算精度逐漸提高,計(jì)算效率逐漸降低。在當(dāng)前仿真條件下,拍賣算法的計(jì)算效率和精度均優(yōu)于遺傳算法和蟻群算法。由于GA100的計(jì)算精度最接近拍賣算法,后續(xù)仿真中遺傳算法的優(yōu)化終止條件設(shè)為100代。此外,由于種群初始化和進(jìn)化操作是基于概率隨機(jī)確定的,所以遺傳算法和蟻群算法每次的計(jì)算結(jié)果略有不同。對于魯棒自適應(yīng)拍賣算法而言,當(dāng)ε取值范圍固定,每次計(jì)算結(jié)果一致。

        圖6 不同算法的性能對比Fig.6 Performance comparison of different algorithms

        其次,為驗(yàn)證ε自適應(yīng)調(diào)整策略的性能,在不同規(guī)模的任務(wù)場景中展開仿真,在各個場景中觀測點(diǎn)數(shù)與航天器數(shù)目一致。傳統(tǒng)拍賣算法的ε值分別取0.01、0.05、0.1,魯棒自適應(yīng)拍賣的εmin=0.01,εmax=0.1,仿真結(jié)果如圖7所示。為便于對比,圖7(b)中縱軸代表拍賣算法的總收益值與遺傳算法的差值,遺傳算法的參數(shù)設(shè)置與表4中GA100一致。

        圖7 拍賣算法取不同ε值的性能對比Fig.7 Performance comparison for auction algorithm with different ε

        由圖7(a)和可知,隨著分配問題規(guī)模變大,拍賣算法和遺傳算法所需的計(jì)算時間都逐漸增加?;讦抛赃m應(yīng)調(diào)整策略的魯棒自適應(yīng)拍賣算法所需計(jì)算時間約為ε=0.01對應(yīng)的拍賣算法一半。隨著ε的減小,拍賣算法的總收益逐漸增加。魯棒自適應(yīng)拍賣的總收益與ε=0.01時的拍賣算法的總收益極為接近。綜上所述,ε∈[0.01, 0.1]的魯棒自適應(yīng)拍賣計(jì)算精度與傳統(tǒng)拍賣算法ε=0.01相近,但計(jì)算耗時僅為其一半。

        最后,針對集群任務(wù)分配過程可能存在航天器故障、通信失聯(lián)等不確定情況展開仿真。假設(shè)航天器個數(shù)和任務(wù)數(shù)均為100個,在拍賣算法的迭代過程中,隨機(jī)確定發(fā)生故障的航天器的編號和迭代輪數(shù),采用任務(wù)重規(guī)劃和魯棒自適應(yīng)拍賣進(jìn)行任務(wù)再分配。任務(wù)重規(guī)劃的思路是在發(fā)生故障后,根據(jù)更新的航天器信息重新采用分布式拍賣算法進(jìn)行任務(wù)分配。魯棒自適應(yīng)拍賣則是在原有的報價信息基礎(chǔ)上,將故障航天器的收益和報價信息置零,繼續(xù)規(guī)劃,仿真結(jié)果如表5所示。

        表5 不確定條件下拍賣算法的分配結(jié)果Table 5 Task assignment results of auction algorithm under uncertainty

        表5中第一行數(shù)據(jù)表示第34號航天器在第511輪迭代中出現(xiàn)故障,集群中其他衛(wèi)星根據(jù)更新的信息重新分配任務(wù)需迭代11 964輪,則總迭代次數(shù)為12 475。若采用魯棒自適應(yīng)拍賣算法則只需迭代11 941次,兩種分配方法的收益誤差為0.009。由表5可知,不確定情況下兩種任務(wù)重分配方法都能成功完成任務(wù)分配,且分配結(jié)果的任務(wù)總收益基本一致。由于魯棒自適應(yīng)拍賣能利用已有的分配信息,及時調(diào)整收益矩陣和報價信息,其總迭代次數(shù)在所有算例中均小于任務(wù)重分配策略。此外,若故障發(fā)生較早,則兩種方法的迭代輪數(shù)相近,若故障發(fā)生較遲,則魯棒自適應(yīng)拍賣算法的迭代輪數(shù)遠(yuǎn)小于任務(wù)重分配策略。

        4.2 在線任務(wù)分配方法驗(yàn)證

        針對航天器集群協(xié)同觀測任務(wù)分配問題,本節(jié)設(shè)計(jì)兩組不同規(guī)模的算例以驗(yàn)證基于深度神經(jīng)網(wǎng)絡(luò)和魯棒自適應(yīng)拍賣算法的快速任務(wù)分配方法的性能。

        首先,從包含6個航天器的集群中選擇4個航天器執(zhí)行協(xié)同觀測任務(wù)。相位角φ1優(yōu)化采用序列二次規(guī)劃方法,航天器轉(zhuǎn)移燃料消耗分別采用凸優(yōu)化和深度神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算,任務(wù)分配基于遺傳算法和魯棒自適應(yīng)拍賣算法。由于非線性優(yōu)化算法的計(jì)算結(jié)果受初值影響較大,仿真中每個算例重復(fù)計(jì)算10次,取收益最高的一組解作為最優(yōu)解,并統(tǒng)計(jì)10次仿真的平均計(jì)算時間,仿真結(jié)果如表6所示。

        表6 不同方法的任務(wù)分配結(jié)果Table 6 Task assignment results of different methods

        表6中CVX和DNN分別表示利用凸優(yōu)化和深度神經(jīng)網(wǎng)絡(luò)求解轉(zhuǎn)移軌跡的最優(yōu)燃料消耗。φ1表示目標(biāo)繞飛軌道上首個觀測點(diǎn)的面內(nèi)相位角,指派方案中[0,1,2,3,4,0]代表航天器1和6不機(jī)動,航天器2至5分別轉(zhuǎn)移到觀測點(diǎn)1至觀測點(diǎn)4。

        基于凸優(yōu)化和深度神經(jīng)網(wǎng)絡(luò)的方案總收益分別為274.31和273.51,相對誤差小于0.3%。圖8中展示了前兩個算例中各航天器乘以收益系數(shù)后的觀測受益、燃料消耗和實(shí)際收益。航天器1和6未執(zhí)行任務(wù),對應(yīng)的收益值始終為零,航天器2至5的觀測收益、燃料消耗和實(shí)際收益基本一致,再次證明基于深度神經(jīng)網(wǎng)絡(luò)的燃料預(yù)測方法的可靠性。

        圖8 集群中各航天器的收益值Fig.8 Performance for each spacecraft in swarm

        對比表6中前兩種方法的計(jì)算時間可知,基于凸優(yōu)化的方案在優(yōu)化連續(xù)變量φ1過程中需多次調(diào)用底層的凸優(yōu)化算法求解轉(zhuǎn)移軌跡,因此計(jì)算效率較低,CVX-GA方案耗時1 962.33 s,而DNN-GA方案直接利用深度神經(jīng)網(wǎng)絡(luò)預(yù)測燃料消耗,僅耗時1.47 s,計(jì)算效率提升約兩個數(shù)量級。對比CVX-GA和CVX-DA方法的仿真結(jié)果可知,CVX-DA方案將凸優(yōu)化求解最優(yōu)轉(zhuǎn)移軌跡的計(jì)算過程分散到集群內(nèi)各個航天器上,其仿真耗時僅為CVX-GA方案的1/6。同理,對比DNN-GA和DNN-DA方法的計(jì)算結(jié)果可知,DNN-DA方案的計(jì)算效率明顯優(yōu)于DNN-GA方案。綜上所述,基于深度神經(jīng)網(wǎng)絡(luò)和魯棒自適應(yīng)拍賣算法的在線分配方法能在保證計(jì)算精度的同時,將計(jì)算效率提升約兩個數(shù)量級。

        為進(jìn)一步驗(yàn)證基于深度神經(jīng)網(wǎng)絡(luò)的分配方案在不同集群重構(gòu)問題中的性能,假設(shè)集群航天器的規(guī)模和觀測點(diǎn)數(shù)為10至100個。由于基于凸優(yōu)化的CVX-GA和CVX-DA方案耗時過長(大于24小時),表7中僅展示DNN-GA和DNN-DA方案的仿真結(jié)果。

        表7 不同規(guī)模集群任務(wù)分配結(jié)果Table 7 Task assignment results of swarm with different sizes

        由表7可知,隨著集群航天器規(guī)模增大,任務(wù)分配的平均計(jì)算時間也逐步增加。由于采用分布式框架,DNN-DA的計(jì)算效率比DNN-GA提高了約一個數(shù)量級,兩者的總收益相近。值得強(qiáng)調(diào)的是,基于凸優(yōu)化的CVX-GA和CVX-DA方法在當(dāng)前計(jì)算配置下難以求解上述算例,而DNN-DA解決包含100個航天器的大規(guī)模集群的任務(wù)分配問題僅耗時8.72 s,為在線求解集群航天器任務(wù)分配問題提供新思路。

        5 結(jié) 論

        針對集群航天器協(xié)同觀測任務(wù)分配問題,本文提出了一種基于深度神經(jīng)網(wǎng)絡(luò)和魯棒自適應(yīng)拍賣算法的快速任務(wù)分配策略。深度神經(jīng)網(wǎng)絡(luò)可用于預(yù)測航天器相對運(yùn)動轉(zhuǎn)移軌跡的最優(yōu)燃料消耗,數(shù)值仿真表明神經(jīng)網(wǎng)絡(luò)預(yù)測的相對誤差小于4%。魯棒自適應(yīng)拍賣算法適用于任務(wù)數(shù)與航天器數(shù)不一致的分配問題,且能有效應(yīng)對通信失聯(lián)、航天器故障等不確定情況?;谏疃壬窠?jīng)網(wǎng)絡(luò)和魯棒自適應(yīng)拍賣算法的在線任務(wù)分配方法可在保持計(jì)算精度的同時,將計(jì)算效率提升約兩個數(shù)量級。未來工作將進(jìn)一步考慮通信代價對分布式任務(wù)分配算法的影響。

        猜你喜歡
        優(yōu)化
        超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
        PEMFC流道的多目標(biāo)優(yōu)化
        能源工程(2022年1期)2022-03-29 01:06:28
        民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
        關(guān)于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        由“形”啟“數(shù)”優(yōu)化運(yùn)算——以2021年解析幾何高考題為例
        圍繞“地、業(yè)、人”優(yōu)化產(chǎn)業(yè)扶貧
        事業(yè)單位中固定資產(chǎn)會計(jì)處理的優(yōu)化
        4K HDR性能大幅度優(yōu)化 JVC DLA-X8 18 BC
        幾種常見的負(fù)載均衡算法的優(yōu)化
        電子制作(2017年20期)2017-04-26 06:57:45
        日韩色久悠悠婷婷综合| 国产成人一区二区三区在线观看| 97无码人妻Va一区二区三区| www.尤物视频.com| 国产在线精品成人一区二区三区| 精品视频一区二区三区在线观看 | 一区二区三区国产美女在线播放| 亚洲综合精品一区二区| 亚洲午夜精品一区二区| 久久精品无码专区免费青青| 日韩欧美在线观看成人| 日本高清一区二区在线播放| 免费在线黄色电影| 日日碰狠狠躁久久躁96avv | 亚洲av成人无码网天堂| 国产午夜精品美女裸身视频69| 亚洲成a人一区二区三区久久| 色一情一乱一伦麻豆| 亚洲免费人成在线视频观看| 中文字幕人妻系列一区尤物视频| 综合久久精品亚洲天堂| 无码国内精品久久人妻| 国产成人综合久久精品推| 在线观看黄片在线播放视频| 白嫩人妻少妇偷人精品| 国产精品va无码一区二区| 亚洲中文字幕av天堂| av在线入口一区二区| 无码视频在线观看| 国产成人午夜福利在线观看者| 人妻熟女妇av北条麻记三级| 精品人无码一区二区三区| 中文字幕爆乳julia女教师| www.日本一区| 美女露出奶头扒开内裤的视频| 日本精品无码一区二区三区久久久| 日本免费人成视频播放| 亚洲人妻av在线播放| 亚洲成av人综合在线观看| 丰满岳乱妇久久久| 一区二区三区在线视频免费观看|