胡慶雷,邵小東,楊昊旸,段超
1. 北京航空航天大學(xué) 自動(dòng)化科學(xué)與電氣工程學(xué)院,北京 100191 2. 北京航空航天大學(xué) 杭州創(chuàng)新研究院(余杭),杭州 311100 3. 北京航空航天大學(xué) 航空科學(xué)與工程學(xué)院,北京 100191
姿態(tài)控制系統(tǒng)作為航天器最為重要的分系統(tǒng)之一,是航天器實(shí)現(xiàn)高精度高穩(wěn)定度姿態(tài)調(diào)整的保障,對(duì)空間任務(wù)的順利實(shí)施尤為關(guān)鍵。航天器的姿態(tài)控制系統(tǒng)主要由以下4部分組成[3]:測(cè)量單元、規(guī)劃單元、控制單元和執(zhí)行機(jī)構(gòu),如圖1所示。測(cè)量單元利用星載姿態(tài)和角速度測(cè)量敏感器(如星敏感器、速率陀螺等)實(shí)時(shí)監(jiān)測(cè)航天器運(yùn)動(dòng)信息并反饋給規(guī)劃和控制單元,規(guī)劃單元?jiǎng)t根據(jù)航天任務(wù)需求規(guī)劃出任務(wù)軌跡并生成相應(yīng)的控制指令,隨后控制環(huán)節(jié)根據(jù)這些指令輸出控制信號(hào),通過(guò)驅(qū)動(dòng)執(zhí)行機(jī)構(gòu)實(shí)現(xiàn)航天器穩(wěn)定飛行或跟蹤制導(dǎo)指令。強(qiáng)自主、高可靠、高精度的姿態(tài)規(guī)劃與控制技術(shù)是保證航天器在復(fù)雜空間環(huán)境下穩(wěn)定可靠運(yùn)行并安全實(shí)施空間任務(wù)的關(guān)鍵。
航天器在軌執(zhí)行姿態(tài)機(jī)動(dòng)時(shí)往往會(huì)面臨復(fù)雜的約束,本文將這些約束分為 4 大類。第 1 類為狀態(tài)約束,主要包括空間指向約束和角速度約束[4-5],而且空間指向約束又細(xì)分為禁止指向約束和強(qiáng)制指向約束[6]。禁止指向約束源于星載光學(xué)敏感載荷(如紅外望遠(yuǎn)鏡、激光干涉儀等)應(yīng)避免直接指向太陽(yáng)、月亮等光亮目標(biāo),以防止光線影響觀測(cè)[7]。例如,紅外天文學(xué)衛(wèi)星(Infrared Astronomical Satellite, IRAS)要求搭載的紅外望遠(yuǎn)鏡的指向與太陽(yáng)方向的夾角不小于60°以防止光線直射,使其能夠工作在紅外觀測(cè)所需的低溫環(huán)境下。JWST、Hubble 望遠(yuǎn)鏡、紅外空間天文臺(tái)(Infrared Space Observatory, ISO)以及 Cassini 號(hào)深空探測(cè)器也都存在類似的禁止指向約束[8]。強(qiáng)制指向約束的場(chǎng)景是承擔(dān)中繼通信、深空探測(cè)和編隊(duì)飛行等任務(wù)的航天器需要保持天線對(duì)準(zhǔn)地面站或鄰居航天器,以穩(wěn)定地維持通信鏈路[9]。角速度約束源于速率陀螺、星敏感器等角速度傳感器的量程有限,要求航天器的角速度必須維持在特定的范圍內(nèi),例如美國(guó)的 X 射線計(jì)時(shí)探測(cè)器(X-ray Timing Explorer, XTE)[10]。第 2 類為物理約束,包括執(zhí)行機(jī)構(gòu)輸出幅值和速率約束,主要源于反作用飛輪、控制力矩陀螺等姿控執(zhí)行機(jī)構(gòu)的有限輸出能力[11]。第 3 類為任務(wù)性能約束,包括時(shí)間和能耗約束,其中時(shí)間約束主要是由任務(wù)時(shí)間窗口造成的[12],而能耗約束則是源于航天器所攜帶的工質(zhì)燃料有限,且其所配備的電能生產(chǎn)和存儲(chǔ)設(shè)備有限[13]。規(guī)劃環(huán)節(jié)需要重點(diǎn)考慮前述 3 類約束。第 4 類為廣義約束,主要包括參數(shù)不確定性、多源干擾、執(zhí)行機(jī)構(gòu)故障、暫穩(wěn)態(tài)性能以及測(cè)量信息不完備等,這些約束都嚴(yán)重影響了航天器安全、姿態(tài)控制精度及穩(wěn)定度,在姿態(tài)控制器設(shè)計(jì)中需要對(duì)這些約束進(jìn)行考慮,才能從穩(wěn)定性和安全性角度保證航天器姿態(tài)控制系統(tǒng)的正常工作。綜上所述,研究復(fù)雜約束下的航天器姿態(tài)規(guī)劃與控制新理論與新方法,是當(dāng)前航天器控制領(lǐng)域的前沿?zé)狳c(diǎn)方向,已成為進(jìn)一步提升航天器智能自主性、安全可靠性和任務(wù)執(zhí)行能力的核心關(guān)鍵,具有重要的現(xiàn)實(shí)意義。
本文基于課題組前期研究成果,并參閱國(guó)內(nèi)外知名團(tuán)隊(duì)和學(xué)者的部分代表性工作,總結(jié)和梳理了現(xiàn)有航天器多約束姿態(tài)規(guī)劃與控制方法的研究思路和優(yōu)缺點(diǎn),并給出了未來(lái)發(fā)展建議,希望對(duì)從事相關(guān)研究的同行學(xué)者和工程人員提供一定的參考。航天器多約束姿態(tài)規(guī)劃與控制技術(shù)經(jīng)過(guò)20多年的發(fā)展,算法研究仍方興未艾,尤其是結(jié)合人工智能等前沿技術(shù)的新成果近年來(lái)更是層出不窮,論文未能提及之處,敬請(qǐng)諒解。
正如引言中所分析,在航天器執(zhí)行在軌任務(wù)的過(guò)程中,姿態(tài)系統(tǒng)面臨著多種約束。在針對(duì)這些約束設(shè)計(jì)安全的規(guī)劃和控制算法之前,需要首先針對(duì)這些約束進(jìn)行分析并利用適當(dāng)?shù)臄?shù)學(xué)表達(dá)式來(lái)刻畫。本節(jié)將對(duì)狀態(tài)約束、物理約束、任務(wù)性能約束以及廣義約束進(jìn)行分析與表征。其中前 3 類約束主要面向姿態(tài)規(guī)劃算法設(shè)計(jì),而廣義約束則主要是面向姿態(tài)控制器設(shè)計(jì)。
1.1.1 空間指向約束
在軌飛行任務(wù)中,由于星上載荷保護(hù)和通信保障等原因,航天器的姿態(tài)將受限于特定的指向空間中,這使得航天器姿態(tài)機(jī)動(dòng)路徑的可行空間大大減小,因此分析姿態(tài)指向約束的形成原理及其分類具有重要的實(shí)際工程指導(dǎo)意義。本文所考慮的指向約束可以分為 2 大類[6]:禁止指向約束和強(qiáng)制指向約束。
1) 禁止指向約束
(1)
(2)
(3)
(4)
(5)
2) 強(qiáng)制指向約束
(6)
同樣的,也可以用修正羅德里格斯參數(shù)和單位四元數(shù)的形式表述:
(7)
qTMfq≤0
(8)
上述對(duì)于指向約束的描述是以傳感器視線場(chǎng)約束為圓錐體,而實(shí)際的傳感器視線場(chǎng)約束區(qū)有可能為臺(tái)體等形狀,對(duì)于這一類多面體的約束在工程上也往往以其外包絡(luò)圓錐(或內(nèi)切圓錐)進(jìn)行描述以便于實(shí)現(xiàn)。
本節(jié)的分類是根據(jù)約束區(qū)域的進(jìn)入和逃出劃分的,除此之外還可以根據(jù)約束區(qū)域的時(shí)變性分為動(dòng)態(tài)指向約束和靜態(tài)指向約束。而且還可根據(jù)約束所承受的嚴(yán)格程度分為硬約束和軟約束,前者是在全過(guò)程中都要滿足的約束,而后者則為時(shí)間積分約束,當(dāng)其積分值小于某個(gè)指標(biāo)值時(shí)不產(chǎn)生約束效果,當(dāng)大于指標(biāo)值時(shí),該約束轉(zhuǎn)變?yōu)橛布s束。在一些復(fù)雜的任務(wù)場(chǎng)景中,上述2種約束可能同時(shí)存在,且往往是動(dòng)靜、軟硬并存的,這種更為復(fù)雜的約束情況會(huì)給航天器的規(guī)劃與控制系統(tǒng)帶來(lái)了更大的挑戰(zhàn)。
1.1.2 角速度約束
以光纖陀螺為代表的角速度測(cè)量?jī)x器,往往存在著測(cè)量范圍的限制[10],因此需要保證航天器的角速度ω=[ω1,ω2,ω3]T∈3的3個(gè)分量都需要在量程范圍ωR內(nèi),數(shù)學(xué)表示為
|ωi|≤ωRi=1,2,3
(9)
對(duì)于以星敏感器為代表的姿態(tài)測(cè)量?jī)x器在軌工作時(shí)需要保證整體的轉(zhuǎn)動(dòng)角速率不能過(guò)大以保證光學(xué)測(cè)量系統(tǒng)能正常捕獲定位,同時(shí)也考慮到航天器本身的部件結(jié)構(gòu)強(qiáng)度在轉(zhuǎn)動(dòng)過(guò)程中不會(huì)被甩出,因此在姿態(tài)機(jī)動(dòng)的過(guò)程中的角速度必須保持在星體可承受的上限ωM內(nèi)[15]。這類角速度約束可以由如下不等式描述:
(10)
1) 執(zhí)行機(jī)構(gòu)幅值飽和
航天器姿態(tài)控制系統(tǒng)常見(jiàn)的執(zhí)行機(jī)構(gòu)主要包括:推力器、反作用飛輪、控制力矩陀螺、磁力矩器等[16]。盡管這些執(zhí)行機(jī)構(gòu)的工作原理有所不同,但它們的輸出幅值均受限。鑒于此,在姿態(tài)規(guī)劃和控制算法設(shè)計(jì)時(shí),控制輸入τ∈N(N為執(zhí)行機(jī)構(gòu)的數(shù)量)需要滿足如下約束:
|τi|≤τMi=1,2,…,N
(11)
式中:τM>0為幅值限制。
2) 執(zhí)行機(jī)構(gòu)速率飽和
除了輸出幅值限制,由于執(zhí)行機(jī)構(gòu)自身響應(yīng)機(jī)理等原因,其輸出力矩的變化率也受限,具體可描述為如下不等式[11]:
(12)
式中:sM>0為速率幅值限制。
對(duì)于某些航天器姿態(tài)機(jī)動(dòng)任務(wù),機(jī)動(dòng)時(shí)間和能量消耗是重要的任務(wù)性能指標(biāo),為規(guī)劃算法的設(shè)計(jì)引入了相應(yīng)的約束。
1.3.1 任務(wù)時(shí)間約束
考慮到一些在軌觀測(cè)任務(wù)(如重要目標(biāo)的偵察等),其存在最佳的觀測(cè)窗口[12],需要在最佳觀測(cè)窗口開(kāi)始之前使航天器機(jī)動(dòng)到特定的指向范圍內(nèi),可以描述為如下時(shí)間約束:
0 (13) 式中:Tf為姿態(tài)機(jī)動(dòng)過(guò)程所用時(shí)間;Tw為當(dāng)前時(shí)間距離任務(wù)最佳觀測(cè)窗口開(kāi)始的時(shí)間。 1.3.2 能量消耗約束 在軌航天器不僅所攜帶的工質(zhì)燃料不多,其所配備的電能生產(chǎn)和存儲(chǔ)設(shè)備也是有限的。因此在姿態(tài)機(jī)動(dòng)過(guò)程中執(zhí)行機(jī)構(gòu)所消耗的燃料也會(huì)受到限制。 對(duì)于使用推力裝置的航天器而言,其能量消耗以工質(zhì)燃料的質(zhì)量減少來(lái)計(jì)算,其過(guò)程可表示為[17] (14) 式中:mF為最大工質(zhì)燃料消耗質(zhì)量限制;fk為每個(gè)推力器產(chǎn)生的推力;NT為推力器的數(shù)量;Isp為推力器的比沖系數(shù);g0為重力系數(shù)。 對(duì)于使用電機(jī)作為動(dòng)量交換裝置進(jìn)行姿態(tài)機(jī)動(dòng)的任務(wù)而言,其能量消耗以電機(jī)消耗的能量來(lái)計(jì)算,其過(guò)程可表示為[13] (15) 式中:E為本次任務(wù)可消耗的最大電能;Nτ為電機(jī)的數(shù)量;Pi為每個(gè)電機(jī)的瞬時(shí)功率,可以由如式(16)計(jì)算: (16) 其中:τi為每個(gè)電機(jī)的輸出力矩;Ωi為每個(gè)電機(jī)的轉(zhuǎn)速;KT、Rm、βm分別表示電機(jī)的扭矩系數(shù)、電樞電阻、黏滯摩擦系數(shù)。 在姿態(tài)機(jī)動(dòng)任務(wù)中,往往不是由單一種類執(zhí)行機(jī)構(gòu)實(shí)現(xiàn)的,在考慮混合執(zhí)行機(jī)構(gòu)的能量消耗時(shí),可綜合考慮式(14)和式(15)來(lái)處理。 上述2點(diǎn)闡述的性能約束主要是考慮時(shí)間或者能耗小于一個(gè)確切的值。但是,在大多數(shù)姿態(tài)控制系統(tǒng)的設(shè)計(jì)中,往往將它們作為優(yōu)化的性能指標(biāo)綜合處理。在數(shù)學(xué)上可以表示為如下的性能指標(biāo)最優(yōu): (17) 式中:Q(e)為關(guān)于狀態(tài)誤差e的代價(jià)函數(shù);R(u)為關(guān)于控制輸入u的代價(jià)函數(shù)。前者在物理意義上即對(duì)應(yīng)為任務(wù)完成時(shí)間的指標(biāo),后者則對(duì)應(yīng)能量消耗的代價(jià)。在姿態(tài)控制系統(tǒng)設(shè)計(jì)中,通過(guò)調(diào)節(jié)兩者的權(quán)重大小,即可根據(jù)實(shí)際的任務(wù)需求調(diào)整性能指標(biāo)。 將參數(shù)不確定性、多源干擾、執(zhí)行機(jī)構(gòu)故障、暫穩(wěn)態(tài)性能約束、測(cè)量信息不完備等歸結(jié)為廣義約束。這些約束主要影響軌跡規(guī)劃后的跟蹤控制器設(shè)計(jì)。下面將對(duì)各類廣義約束進(jìn)行簡(jiǎn)要介紹和數(shù)學(xué)描述。 1.4.1 參數(shù)不確定性 航天器在軌運(yùn)行期間,載荷運(yùn)動(dòng)、工質(zhì)及燃料消耗、目標(biāo)抓捕等因素不可避免地會(huì)導(dǎo)致慣量參數(shù)存在不確定性。對(duì)于時(shí)變的慣量參數(shù),可以將其寫成如下形式[18]: J=J0+ΔJ (18) 式中:J0∈3×3為名義的慣量矩陣;ΔJ∈3×3為慣量矩陣的不確定部分。針對(duì)這一情況,通??蓪⒆藨B(tài)動(dòng)力學(xué)中的ΔJ相關(guān)項(xiàng)集總到系統(tǒng)干擾中,并應(yīng)用抗干擾控制方法對(duì)其進(jìn)行處理。對(duì)于不變/慢變的慣量參數(shù),可將動(dòng)力學(xué)方程中關(guān)于J的函數(shù)項(xiàng)進(jìn)行如下仿射線性化處理: Jx=L(x)θ?x∈3 (19) 其中:θ=[J11,J22,J33,J12,J13,J23]T代表未知參數(shù)向量;L(x):3→3×6為已知的回歸矩陣。針對(duì)線性回歸式(19),可設(shè)計(jì)自適應(yīng)律對(duì)未知參數(shù)θ進(jìn)行在線估計(jì)[19]。 1.4.2 多源干擾 航天器在軌運(yùn)行不可避免地會(huì)受到外部環(huán)境干擾力矩(包括重力梯度力矩、太陽(yáng)光壓和輻射力矩、氣動(dòng)力矩、地磁力矩等)以及內(nèi)部非環(huán)境干擾力矩(包括系統(tǒng)建模誤差、執(zhí)行機(jī)構(gòu)安裝偏差、撓性部件振動(dòng)等)的影響,這些內(nèi)外部干擾力矩形成了多源異質(zhì)的干擾因素,極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。文獻(xiàn)[20] 詳細(xì)分析了各類環(huán)境干擾力矩的特性以及對(duì)航天器姿態(tài)的影響,并提供了相應(yīng)的數(shù)學(xué)模型,這里不再贅述。對(duì)于系統(tǒng)建模誤差、執(zhí)行機(jī)構(gòu)安裝偏差等內(nèi)部擾動(dòng),一般對(duì)它們不進(jìn)行精細(xì)化建模,而將它們視為外部干擾。這里重點(diǎn)描述撓性部件振動(dòng)。考慮撓性航天器的動(dòng)力學(xué)方程[21]: (20) (21) 式中:ω∈3為航天器的角速度;J∈3×3為航天器的慣量矩陣;τ∈3和τd∈3為控制和干擾力矩;η∈n為模態(tài)向量;δ∈n×3為耦合矩陣;D=diag{2ξ1w1,2ξ2w2,…,2ξnwn}和分別代表阻尼和剛性矩陣,ξi∈和wi∈(i=1,2,…,n)分別為阻尼比和模態(tài)頻率。 需要指出的是,為便于設(shè)計(jì)現(xiàn)有抗干擾控制方法大多將內(nèi)外多源干擾以及第1.4.3節(jié)提到的加性偏差故障歸結(jié)為總干擾,并加以處理。 1.4.3 執(zhí)行機(jī)構(gòu)故障 航天器長(zhǎng)時(shí)間運(yùn)行在高低溫、強(qiáng)輻射的惡劣太空環(huán)境中,執(zhí)行機(jī)構(gòu)(如推力器、反作用飛輪等)因需要頻繁工作,極易發(fā)生故障。執(zhí)行機(jī)構(gòu)故障輕則導(dǎo)致姿態(tài)控制性能下降,重則造成系統(tǒng)失穩(wěn)。通過(guò)分析故障對(duì)姿態(tài)控制系統(tǒng)的影響,可將執(zhí)行機(jī)構(gòu)故障分為以下4類[22]: 1) 控制輸出減?。河捎陔姎?、機(jī)械等原因?qū)е聢?zhí)行機(jī)構(gòu)的實(shí)際輸出力矩小于控制指令。 2) 輸出力矩偏移:由于執(zhí)行機(jī)構(gòu)的結(jié)構(gòu)原因和外部不確定性,其實(shí)際輸出力矩在指令控制的基礎(chǔ)上產(chǎn)生了附加偏移力矩。 3) 執(zhí)行機(jī)構(gòu)卡死:由于執(zhí)行機(jī)構(gòu)部件損壞或部分失效(如:噴氣推力裝置的節(jié)流閥泄漏等情況),導(dǎo)致其輸出為某一不為零的常值。 4) 對(duì)控制信號(hào)無(wú)響應(yīng):由于電路、電源失效或機(jī)械結(jié)構(gòu)損毀,導(dǎo)致執(zhí)行機(jī)構(gòu)不能響應(yīng)控制指令,實(shí)際的輸出為零。 為對(duì)1)~4)類故障進(jìn)行建模,可將執(zhí)行機(jī)構(gòu)的實(shí)際輸出力矩改寫為如下形式: τ=Euc+ud (22) 式中:E=diag{e1,e2,…,eN}(0≤ei≤1)代表故障因子矩陣;uc∈N為控制力矩指令;ud∈N為加性偏差故障。 1.4.4 暫穩(wěn)態(tài)性能約束 深空探測(cè)、在軌服務(wù)與維護(hù)以及空間對(duì)抗等新一代航天任務(wù)對(duì)航天器姿態(tài)控制提出了更高的性能要求,主要體現(xiàn)在以下幾個(gè)方面: 1) 完成時(shí)間:由于任務(wù)時(shí)間緊,要求航天器在規(guī)定時(shí)間內(nèi)完成給定的姿態(tài)機(jī)動(dòng)任務(wù),即ts≤T,其中ts表示系統(tǒng)的穩(wěn)定時(shí)間,T>0為規(guī)定的任務(wù)時(shí)間。典型的例子是非合作目標(biāo)在軌捕獲要求在服務(wù)航天器進(jìn)入陰影區(qū)前完成,否則視覺(jué)傳感器將無(wú)法為捕獲操作提供相對(duì)導(dǎo)航信息。 2) 最大超調(diào):超調(diào)量是衡量系統(tǒng)動(dòng)態(tài)性能的重要指標(biāo),姿態(tài)控制的最大超調(diào)一般不能超過(guò)規(guī)定的值,即(xmax-x∞)/x∞≤om,其中xmax代表瞬時(shí)最大偏差值,x∞代表輸出穩(wěn)態(tài)值,om為最大可允許的超調(diào)量。例如,航天器在對(duì)滿足禁止指向約束的姿態(tài)軌跡進(jìn)行跟蹤的過(guò)程中,為避免光學(xué)敏感器的視線軸進(jìn)入禁止區(qū)域,要求跟蹤誤差無(wú)超調(diào)。 3) 穩(wěn)態(tài)誤差:穩(wěn)態(tài)誤差是衡量控制系統(tǒng)穩(wěn)態(tài)性能的重要指標(biāo),為了確保航天器高品質(zhì)地完成指定任務(wù),要求姿態(tài)和角速度收斂到期望值附近的可接受范圍內(nèi),即穩(wěn)態(tài)誤差界,數(shù)學(xué)上可描述為ess≤em,其中ess代表穩(wěn)態(tài)誤差,em為穩(wěn)態(tài)誤差上界。通常,穩(wěn)態(tài)誤差界可根據(jù)星載敏感器的測(cè)量精度來(lái)設(shè)定。 上述性能要求對(duì)姿態(tài)控制系統(tǒng)施加了嚴(yán)格的暫穩(wěn)態(tài)性能約束。 1.4.5 測(cè)量信息不完備 對(duì)于一些小型航天器(如立方衛(wèi)星、微納衛(wèi)星等),由于所能容納的載荷成本、體積、重量和功率有限,往往沒(méi)有安裝能夠直接測(cè)量角速度的敏感元件,因此對(duì)于控制系統(tǒng)設(shè)計(jì)來(lái)說(shuō),得到的狀態(tài)反饋只有姿態(tài)信息。上述的測(cè)量信息受限的問(wèn)題可以由如下測(cè)量方程表述: y=Hx+w (23) 式中:y∈m為測(cè)量信息;H∈m×(m+3)為測(cè)量矩陣;x∈m+3表示由姿態(tài)和角速度整合的運(yùn)動(dòng)狀態(tài)向量,當(dāng)姿態(tài)由四元數(shù)表示時(shí)m=4,由 MRPs 或者歐拉角表示時(shí)m=3;w∈m為傳感器測(cè)量中引入的干擾噪聲。需要指出的是,對(duì)于控制器而言,其接收到的反饋信號(hào)為m維,小于被控狀態(tài)的(m+3)維。 為滿足深空探測(cè)、在軌服務(wù)等新型航天任務(wù)日益提升的需求,航天器需要搭載越來(lái)越多的高精度載荷與設(shè)備。為此,姿態(tài)規(guī)劃算法設(shè)計(jì)不但需要考慮既定的任務(wù)目標(biāo)與任務(wù)性能約束,還應(yīng)當(dāng)兼顧在任務(wù)執(zhí)行過(guò)程中由載荷、執(zhí)行機(jī)構(gòu)等設(shè)備引入的各種狀態(tài)和物理約束。例如,ISO 衛(wèi)星設(shè)計(jì)了使載荷規(guī)避地球熱輻射源的機(jī)動(dòng)策略,避免對(duì)探測(cè)結(jié)果造成影響[23];Cassini 號(hào)深空探測(cè)器要求具備姿態(tài)規(guī)避機(jī)制以保護(hù)配置的傳感器受到太陽(yáng)照射[24];太陽(yáng)能電池陣列需指向太陽(yáng),保證電力供應(yīng);XTE 衛(wèi)星要求機(jī)動(dòng)速度不超過(guò)速度陀螺儀的測(cè)量上限等。因此,研究多約束自主姿態(tài)規(guī)劃方法,使航天器的姿態(tài)能夠沿著一條滿足約束的軌跡運(yùn)動(dòng),盡可能地避免對(duì)設(shè)備載荷的損傷,從而有效地延長(zhǎng)航天器壽命,是一項(xiàng)亟需解決的關(guān)鍵技術(shù)。 現(xiàn)有的多約束自主規(guī)劃方法可大致分為幾何方法、基于勢(shì)函數(shù)的方法、空間離散化方法、隨機(jī)采樣方法、基于優(yōu)化的方法與智能規(guī)劃方法6類。這些方法能夠處理的約束類型、軌跡尋優(yōu)能力、以及計(jì)算復(fù)雜度有所不同,表1 簡(jiǎn)要總結(jié)了 6 種方法對(duì)指向約束、角速度約束與執(zhí)行機(jī)構(gòu)飽和的處理能力。圖4 給出了方法關(guān)于尋優(yōu)能力與計(jì)算復(fù)雜度的遞進(jìn)關(guān)系,本文也將著重在這些方面對(duì)現(xiàn)有多約束規(guī)劃方法進(jìn)行分析。 表1 不同規(guī)劃方法約束處理能力對(duì)比Table 1 Comparison of constraint-handling capability of different planning methods 通過(guò)建立敏感器視線指向與特定指向之間的幾何關(guān)系,傳統(tǒng)幾何方法能夠有效應(yīng)對(duì)姿態(tài)指向約束。一般來(lái)說(shuō),傳統(tǒng)幾何方法首先在無(wú)約束環(huán)境下,設(shè)計(jì)一種能夠準(zhǔn)確驅(qū)動(dòng)航天器從起點(diǎn)到期望姿態(tài)的最優(yōu)控制策略,而后在空間內(nèi)尋找一個(gè)中間姿態(tài),使得無(wú)約束的控制策略能夠直接應(yīng)用于兩段路徑,并且不違反任何的約束。幾何方法設(shè)計(jì)簡(jiǎn)單,且能夠獲得解析的姿態(tài)規(guī)劃策略,在計(jì)算效率上具有顯著的優(yōu)勢(shì)。 針對(duì)太陽(yáng)、異常和磁層粒子探測(cè)器 (Solar, Anomalous, and Magnetospheric Particle Explorer, SAMPEX),F(xiàn)rakes等[25]研究了探測(cè)器規(guī)避星體速度方向的方法,降低了空間碎片與微流星體對(duì)微粒子探測(cè)精度的影響。同時(shí),考慮對(duì)明亮天體規(guī)避與對(duì)地通訊保持約束,Hablani[9]提出了2種替代最小旋轉(zhuǎn)路徑的機(jī)動(dòng)方案,使得視線軸能夠相切地通過(guò)禁止區(qū),并基于其中一種方案進(jìn)一步設(shè)計(jì)了天線指向策略。針對(duì)欠驅(qū)動(dòng)航天器,文獻(xiàn)[26-27] 利用非標(biāo)準(zhǔn)歐拉軸角參數(shù),將欠驅(qū)動(dòng)約束描述可行驅(qū)動(dòng)軸與欠驅(qū)動(dòng)軸的垂直幾何關(guān)系;進(jìn)一步提出了兩種兩步相切姿態(tài)機(jī)動(dòng)策略,實(shí)現(xiàn)了視線軸對(duì)某個(gè)指向約束區(qū)域的規(guī)避。針對(duì)空間內(nèi)多個(gè)錐形約束,徐瑞等[28]提出了有效路徑約束的檢測(cè)方法;通過(guò)將有效三維指向約束投影到二維平面,導(dǎo)出了滿足約束的中間姿態(tài)的解析解??紤]太陽(yáng)規(guī)避約束,Ayoubi 和 Hsin[7]提出了一種新型最優(yōu)幾何規(guī)劃策略。 意大利Biggs團(tuán)隊(duì)針對(duì)連續(xù)時(shí)間系統(tǒng)的幾何最優(yōu)控制問(wèn)題,取得了一系列重要成果[31-33]。Biggs 和 Colley[31]提出了一種基于特殊正交群(Special Orthogonal group, SO(3))的半解析最優(yōu)規(guī)劃策略,通過(guò)優(yōu)化權(quán)重因子與控制參數(shù),可實(shí)現(xiàn)對(duì)系統(tǒng)軌跡和控制幅值的限制。利用ε截面曲率的連通曲面的標(biāo)架叢,Henninger 和 Biggs[32]將最優(yōu)規(guī)劃問(wèn)題轉(zhuǎn)化為兩點(diǎn)邊值問(wèn)題,導(dǎo)出了基于拉克斯對(duì)(Lax pair)的解析解。結(jié)合人工勢(shì)函數(shù)方法與滑模控制,Geng等[33]提出了一種基于對(duì)偶單位群的姿態(tài)控制律,獲得了滑動(dòng)階段系統(tǒng)軌跡的解析形式,而后通過(guò)對(duì)系統(tǒng)初值與控制參數(shù)的整定,可以按需地改變系統(tǒng)軌跡的曲率,從而實(shí)現(xiàn)障礙規(guī)避。 另一方面,國(guó)內(nèi)外學(xué)者研究了航天器動(dòng)力學(xué)系統(tǒng)的幾何離散化方法。針對(duì)受頻率約束與點(diǎn)約束的李群系統(tǒng),Kotpalliwar 等[34]研究了離散形式的龐特里亞金原理最優(yōu)條件。李益群等[35]提出了一種基于李群譜配點(diǎn)法的航天器姿態(tài)仿真方法。文獻(xiàn)[36] 提出了將變分積分子與譜方法通過(guò)伽遼金方法與打靶法結(jié)合的方法,在很好地保持了系統(tǒng)幾何結(jié)構(gòu)(辛結(jié)構(gòu)、李群結(jié)構(gòu)等)和物理特性(動(dòng)量、能量等)的同時(shí),不降低譜方法原有的收斂速度和計(jì)算效率。 由以上的研究結(jié)果可以看出,幾何規(guī)劃方法能夠獲得解析或半解析的最優(yōu)姿態(tài)機(jī)動(dòng)路徑,在計(jì)算效率上具有明顯優(yōu)勢(shì);能夠很好的保守群結(jié)構(gòu)與物理特性,有利于數(shù)值計(jì)算。但是,幾何方法應(yīng)對(duì)較多的約束時(shí)能力有限,并且能夠考慮的優(yōu)化指標(biāo)相對(duì)單一。 勢(shì)函數(shù)方法是一種處理運(yùn)動(dòng)學(xué)約束非常有效的方法,該方法的基本原理如圖6所示??紤]目標(biāo)在一個(gè)人工勢(shì)場(chǎng)中運(yùn)動(dòng),其中障礙物處于高勢(shì)能處,期望位置處于最低勢(shì)能處。只需根據(jù)當(dāng)前位置勢(shì)能的負(fù)梯度方向設(shè)計(jì)控制力,就能實(shí)現(xiàn)目標(biāo)遠(yuǎn)離高勢(shì)能的障礙區(qū)域,驅(qū)向低勢(shì)能的期望平衡點(diǎn)?;趧?shì)函數(shù)的控制器無(wú)需提前規(guī)劃完整的系統(tǒng)軌跡,具有良好的實(shí)時(shí)性。國(guó)內(nèi)外眾多學(xué)者通過(guò)構(gòu)造出形式多樣的勢(shì)函數(shù)形成特定的人工勢(shì)場(chǎng),來(lái)實(shí)現(xiàn)不同系統(tǒng)動(dòng)態(tài)性能。目前,常見(jiàn)的勢(shì)函數(shù)有指數(shù)函數(shù)(包括高斯函數(shù))、二次型函數(shù)、對(duì)數(shù)函數(shù)、導(dǎo)航函數(shù)等。 針對(duì)空間光亮天體指向,Mclnnes[37]采用無(wú)歧義的高斯函數(shù)建立障礙高勢(shì)能區(qū)域,結(jié)合轉(zhuǎn)動(dòng)動(dòng)能與姿態(tài)勢(shì)能的 Lyapunov 函數(shù),提出了一種有界的姿態(tài)控制策略。Wisniewski和Kulczycki[38]基于四元數(shù)建立了哈密頓形式的姿態(tài)動(dòng)力學(xué)方程,通過(guò)能量成型方法設(shè)計(jì)控制律,使得敏感指向?yàn)閯?shì)能高點(diǎn),期望平衡點(diǎn)為唯一的勢(shì)能極小值點(diǎn)。針對(duì)航天器姿態(tài)規(guī)避問(wèn)題,鄭重等[39]提出一種新型的高斯勢(shì)函數(shù),保證了控制律的連續(xù)與有界。郭延寧等[40]提出了排斥勢(shì)函數(shù)存在的條件,避免了不必要的退繞問(wèn)題;進(jìn)一步針對(duì)控制受限,設(shè)計(jì)了自適應(yīng)的反步跟蹤控制器,實(shí)現(xiàn)了控制幅值的在線自動(dòng)調(diào)整。考慮多個(gè)空間內(nèi)禁止區(qū)域與強(qiáng)制區(qū)域,美國(guó) University of Washington 的 Lee 和 Mesbaihi[6,41]提出了一系列基于對(duì)數(shù)函數(shù)的勢(shì)函數(shù)方法,實(shí)現(xiàn)了控制律光滑性與近似全局收斂性,進(jìn)而保證了多約束求解的可行性與穩(wěn)定性。崔祜濤和程小軍[42]考慮了輸入飽和與常值干擾下的姿態(tài)規(guī)避控制問(wèn)題,利用導(dǎo)航函數(shù)避免了勢(shì)函數(shù)方法局部極小的問(wèn)題,并采用輔助系統(tǒng)解決了輸入飽和的問(wèn)題。 此外,勢(shì)函數(shù)方法還能夠方便地處理角速度受限約束。針對(duì)靜止到靜止的航天器姿態(tài)機(jī)動(dòng)問(wèn)題,Shen等[43]利用滑模面變量設(shè)計(jì)了一種對(duì)數(shù)型勢(shì)函數(shù),使得系統(tǒng)在臨近角速度限制邊界時(shí)具有極高的勢(shì)能。筆者團(tuán)隊(duì)[4,44]分別考慮減小階姿態(tài)系統(tǒng)與不確定姿態(tài)系統(tǒng),通過(guò)設(shè)計(jì)角速度的對(duì)數(shù)勢(shì)函數(shù),實(shí)現(xiàn)了角速度約束。 筆者團(tuán)隊(duì)基于勢(shì)函數(shù)方法解決了航天器姿態(tài)機(jī)動(dòng)與近距離交會(huì)的問(wèn)題。針對(duì)交會(huì)對(duì)接問(wèn)題,Dong等[45]利用對(duì)偶四元數(shù)參數(shù),設(shè)計(jì)了基于一種新型勢(shì)函數(shù)的姿軌控制律,能夠同時(shí)滿足視場(chǎng)約束與對(duì)接走廊約束??紤]多個(gè)姿態(tài)禁止約束,筆者團(tuán)隊(duì)[14,46]提出了幾種基于對(duì)數(shù)型勢(shì)函數(shù)的姿態(tài)機(jī)動(dòng)控制策略,克服了四元數(shù)的退繞問(wèn)題;還針對(duì)航天器姿態(tài)機(jī)動(dòng)問(wèn)題,基于導(dǎo)航函數(shù)設(shè)計(jì)了系統(tǒng)的勢(shì)能函數(shù),在避免將禁止約束轉(zhuǎn)化為凸約束的前提下,嚴(yán)格證明了勢(shì)函數(shù)的極小值點(diǎn)能夠無(wú)線趨近于系統(tǒng)的平衡點(diǎn)[47-48]。 從以上分析可以看到,勢(shì)函數(shù)方法能夠有效處理多類型姿態(tài)約束,且不依賴于全局信息,可以實(shí)現(xiàn)動(dòng)態(tài)的規(guī)劃。此外,勢(shì)函數(shù)方法能夠直接用于解析控制律設(shè)計(jì),在計(jì)算實(shí)時(shí)性上具有明顯的優(yōu)勢(shì)。然而,勢(shì)函數(shù)方法通常會(huì)存在局部極小值問(wèn)題,導(dǎo)致系統(tǒng)駐留在極小值點(diǎn),不能實(shí)現(xiàn)既定的控制目標(biāo)。 相比于前述方法共有的解析特征,下面主要介紹一系列數(shù)值優(yōu)化方法,它們對(duì)多種優(yōu)化指標(biāo)具有更強(qiáng)的軌跡優(yōu)化能力,為多約束運(yùn)動(dòng)規(guī)劃問(wèn)題求解提供了新思路。首先介紹一種離散化方法。這種方法利用多面體(比如立方體、二十面體)均勻離散化姿態(tài)單位球,將指向向量轉(zhuǎn)換為整數(shù),建立起指向向量的拓?fù)浣Y(jié)構(gòu);通過(guò)路徑規(guī)劃算法將約束集轉(zhuǎn)化為單位球上的像素點(diǎn)集;最后,定義一個(gè)關(guān)于路徑長(zhǎng)度的代價(jià)函數(shù),利用路徑搜索算法獲得最(次)優(yōu)路徑,這一過(guò)程如圖7所示。當(dāng)?shù)玫狡谕穆窂街?,就形成了描述旋轉(zhuǎn)序列的一系列姿態(tài),可以進(jìn)一步通過(guò)反饋控制器來(lái)實(shí)現(xiàn)期望的軌跡。 目前,姿態(tài)單位球離散化的方法主要包括天立方算法(Cosmic Background Explorer,COBE)[49]、正二十面體算法[50-52]等。在 COBE 天立方算法的基礎(chǔ)上,Tegmark[50]提出了一種基于正二十面體的離散化方法。該方法相比于COBE天立方算法具有2方面優(yōu)勢(shì):①用六邊形像素替代COBE天立方算法里的正方形像素,空間離散化需要更少的像素;②每個(gè)像素點(diǎn)有6個(gè)相似等距的鄰居,使得生成的軌跡更加光滑。針對(duì) Bevo-2 或 ARMADILLO 立方星所攜帶的低等級(jí)光學(xué)儀器對(duì)強(qiáng)光的敏感,Kjellgerg和Lightsey[51-52]基于正二十面體離散化算法提出了滿足姿態(tài)指向約束與控制約束的路徑規(guī)劃方法。該方法將連續(xù)點(diǎn)離散為姿態(tài)單位球內(nèi)接二十面體的正六邊形像素點(diǎn),并采用 A*圖搜索算法搜尋可行路徑。但是該方法只能考慮單一敏感設(shè)備,缺乏多敏感設(shè)備軌跡規(guī)劃能力。針對(duì)這一問(wèn)題,Tanygin[53-54]提出了 ARPs (Airy-Rodrigues Parameters)的定義以及一種新型最小形變投影,在新的參數(shù)下描述姿態(tài)約束并進(jìn)行離散化,通過(guò)改進(jìn)的 A*算法,實(shí)現(xiàn)了多路姿態(tài)的最優(yōu)路徑規(guī)劃。 離散化方法具有明確的物理含義,在機(jī)器人運(yùn)動(dòng)規(guī)劃領(lǐng)域也得到了廣泛的應(yīng)用。離散化方法能夠有效地處理姿態(tài)指向約束與控制約束,實(shí)現(xiàn)概率意義下的最短機(jī)動(dòng)路徑。但是,離散化方法也具有明顯的缺點(diǎn),一方面是依賴于離線求解的結(jié)構(gòu),另一方面是相比于解析的方法(幾何方法與勢(shì)函數(shù)方法),離散化方法的計(jì)算量較大,故而難以實(shí)現(xiàn)動(dòng)態(tài)規(guī)劃,限制了其應(yīng)用。 2.3節(jié)中基于空間離散化的規(guī)劃方法更適用于低維度空間上的路徑規(guī)劃問(wèn)題,它在這類問(wèn)題中往往具有較好的完備性,而且需要對(duì)環(huán)境進(jìn)行完整的建模,并且在高維度空間中很容易導(dǎo)致現(xiàn)“維數(shù)災(zāi)難”。為了解決這些問(wèn)題,基于隨機(jī)采樣的規(guī)劃算法被提出來(lái)[55],這一方法以概率完備性來(lái)代替完備性,從而提高搜索效率,適用于高維度空間的規(guī)劃問(wèn)題。這一類方法的主要原理是在可行的空間中隨機(jī)生成狀態(tài)點(diǎn),然后找到一組可行的連通方式將這些狀態(tài)點(diǎn)連接得到一條規(guī)劃軌跡[56],具體過(guò)程如圖8中所示。 利用隨機(jī)規(guī)劃算法的原理,許多學(xué)者也開(kāi)展了航天器姿態(tài)機(jī)動(dòng)規(guī)劃研究。美國(guó)麻省理工大學(xué)的Feron等[57]提出了一種基于快速擴(kuò)展隨機(jī)樹(Rapidly exploring Random Tree, RRT)的隨機(jī)姿態(tài)規(guī)劃方法,并基于 Lyapunov 函數(shù)建立局部制導(dǎo)律,在多種類型的姿態(tài)約束下,實(shí)現(xiàn)了航天器大角度姿態(tài)指向路徑規(guī)劃。Yershova 和 Lavalle[58]提出了在旋轉(zhuǎn)矩陣空間上的確定性采樣算法,這種分辨率完備性的采樣方式為姿態(tài)隨機(jī)規(guī)劃算法的發(fā)展提出了嶄新的方向。利用確定性采樣方法來(lái)更換傳統(tǒng) RRT 算法中的完全隨機(jī)采樣方法,可以在一定程度上減少 RRT 算法所用時(shí)間。文獻(xiàn)[59-60] 將姿態(tài)描述從旋轉(zhuǎn)矩陣映射到羅德里格參數(shù)中進(jìn)行姿態(tài)指向規(guī)劃,減小了變量維度、提高了規(guī)劃速度,但也造成了某些工況下的搜索范圍擴(kuò)大。 采用基于隨機(jī)算法的規(guī)劃方法的優(yōu)點(diǎn)是能夠解決各種類型的運(yùn)動(dòng)軌跡約束,利用基于概率的方法提高了計(jì)算效率。但是,正是因?yàn)椴捎昧穗S機(jī)概率的機(jī)制,所以這類方法只能在概率意義上規(guī)劃到期望狀態(tài)的附近。最終狀態(tài)的偏差也會(huì)隨著狀態(tài)圖中的頂點(diǎn)數(shù)的增加而指數(shù)收斂到零。而且與2.3節(jié)中離散化方法相似,這一類方法也難以滿足多個(gè)敏感軸的約束。同時(shí),這類方法大多是規(guī)劃出一條可行的安全路徑,并未能將動(dòng)力學(xué)約束和角速度約束同時(shí)考慮在規(guī)劃策略設(shè)計(jì)中,并且對(duì)于姿態(tài)機(jī)動(dòng)過(guò)程中的最優(yōu)性就難以滿足。 由于航天器攜帶的工質(zhì)推進(jìn)燃料有限和特定任務(wù)的機(jī)動(dòng)時(shí)間需求,航天器姿態(tài)控制系統(tǒng)設(shè)計(jì)在考慮各類運(yùn)動(dòng)約束的同時(shí),還需要針對(duì)特定的性能指標(biāo)優(yōu)化。因此,基于數(shù)值優(yōu)化的方法也被廣泛的用于姿態(tài)規(guī)劃的研究。這一類方法的核心思想是將給定的性能指標(biāo)作為目標(biāo)函數(shù),把姿態(tài)運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)方程作為等式約束,并刻畫運(yùn)動(dòng)過(guò)程中的各類物理約束成不等式約束,從而特定工況下的性能最優(yōu)的控制問(wèn)題轉(zhuǎn)化為約束條件下數(shù)值優(yōu)化進(jìn)行求解,如圖9所示。 針對(duì)求解姿態(tài)機(jī)動(dòng)的最優(yōu)控制問(wèn)題,密歇根大學(xué)的團(tuán)隊(duì)[61-62]基于間接法將最優(yōu)控制問(wèn)題轉(zhuǎn)換成了兩點(diǎn)邊值問(wèn)題求解了約束下航天器的重新定向的問(wèn)題,這一系列方法中使用的李群變分積分的離散化方法有助于提高離散化精度,提高了求解精度和效率。凸優(yōu)化技術(shù)作為一種相對(duì)成熟的優(yōu)化問(wèn)題求解工具,近年來(lái)也在航天器運(yùn)動(dòng)中得到了廣泛的研究[63]。華盛頓大學(xué)的Kim和Mesbahi[64]采用了凸優(yōu)化的思路進(jìn)行處理,針對(duì) Planck 空間觀測(cè)衛(wèi)星等典型的實(shí)際型號(hào)的約束下姿態(tài)重定向任務(wù),將姿態(tài)約束轉(zhuǎn)化為凸的線性矩陣不等式(Linear Matrix Inequality, LMI)形式的約束,并證明了轉(zhuǎn)化后的問(wèn)題與原問(wèn)題等價(jià)。文獻(xiàn)[65] 針對(duì)更為復(fù)雜的軟約束、動(dòng)態(tài)約束以及混合約束進(jìn)行約束凸化處理,解決了姿態(tài)機(jī)動(dòng)中的凸優(yōu)化規(guī)劃問(wèn)題。Sun和Dai[66]提出了基于二次約束二次規(guī)劃(Quadratically Constrained Quadratic Programming, QCQP)的迭代算法。在文獻(xiàn)[64] 的基礎(chǔ)上,姿態(tài)禁止區(qū)約束及強(qiáng)制區(qū)約束被轉(zhuǎn)化成了基于四元數(shù)的不等式約束,并考慮了姿態(tài)機(jī)動(dòng)過(guò)程中存在的角速度約束和控制飽和限制。該方法采用半定松弛技術(shù)對(duì)將問(wèn)題轉(zhuǎn)化為帶有秩約束的半定規(guī)劃問(wèn)題,提出了一種逐次迭代的秩最小化迭代算法,最后利用凸優(yōu)化求解工具得到姿態(tài)機(jī)動(dòng)的最優(yōu)軌跡。此外,Tam和Glenn[67]也在Kim的工作的基礎(chǔ)上,使用了混合整數(shù)規(guī)劃算法,求解對(duì)應(yīng)的航天器多約束姿態(tài)規(guī)劃問(wèn)題。 上述基于數(shù)值優(yōu)化的方法是通過(guò)刻畫最優(yōu)問(wèn)題并求其數(shù)值解,從而得到特定工況下的最優(yōu)姿態(tài)機(jī)動(dòng)軌跡。但是求解這一類問(wèn)題往往需要較高的計(jì)算硬件支持和較長(zhǎng)的求解時(shí)間,尤其是當(dāng)約束非線性且相互耦合的時(shí)候,更會(huì)導(dǎo)致運(yùn)算成本增加。此外,這類方法是基于數(shù)學(xué)模型的,它們的求解往往依賴于精確的模型信息,因此基于數(shù)值規(guī)劃的方法也存在一定的局限性。 正如2.5節(jié)中分析,傳統(tǒng)基于數(shù)值優(yōu)化的方法存在求解效率低和模型依賴強(qiáng)等不足,特別是對(duì)于一些復(fù)雜的問(wèn)題(如模型非完全精確已知的“灰/黑箱”問(wèn)題、非凸形式的博弈問(wèn)題等)很難有效地處理。值得注意的是,人工智能技術(shù)的近期進(jìn)展為空間智能自主規(guī)劃提供理論、方法及技術(shù)支撐[68-70]?;谠獑l(fā)式的智能優(yōu)化算法在航天器姿態(tài)機(jī)動(dòng)中也得到了廣泛研究,如遺傳算法(Genetic Algorithm, GA)及其拓展方法[71-73]、粒子群算法(Particle Swarm Optimization, PSO)[74-76]以及差分進(jìn)化算法(Differential Evolution, DE)[77]等。這些算法利用仿生學(xué)的特點(diǎn)和機(jī)制能夠緩解傳統(tǒng)優(yōu)化算法中問(wèn)題非凸造成的局部極小值的問(wèn)題。 值得注意的是,近年來(lái)以強(qiáng)化學(xué)習(xí)技術(shù)為代表的新一代人工智能技術(shù)已經(jīng)在各類無(wú)人系統(tǒng)中受到了重點(diǎn)關(guān)注[78]。這類方法的基本原理如圖10所示,通過(guò)構(gòu)建環(huán)境反饋(“獎(jiǎng)勵(lì)”或“懲罰”),從而激勵(lì)智能體在環(huán)境反饋中學(xué)習(xí)調(diào)整當(dāng)前策略,最終實(shí)現(xiàn)“獎(jiǎng)勵(lì)”最大化的執(zhí)行策略[79]。因此,在利用環(huán)境反饋處理約束時(shí),將期望的運(yùn)動(dòng)狀態(tài)構(gòu)造成“獎(jiǎng)勵(lì)”,將違背約束的運(yùn)動(dòng)狀態(tài)刻畫成“懲罰”是一種處理運(yùn)動(dòng)約束規(guī)劃的有效途徑。 在航天器姿態(tài)機(jī)動(dòng)任務(wù)中,文獻(xiàn)[80] 針對(duì)非合作目標(biāo)抓捕任務(wù),基于深度 Q 網(wǎng)絡(luò)(Deep-Q Networks, DQN)學(xué)習(xí)算法設(shè)計(jì)了一套姿態(tài)鎮(zhèn)定策略,該方法利用歷史數(shù)據(jù)進(jìn)行訓(xùn)練,不依賴于空間目標(biāo)的質(zhì)量參數(shù),具有比較強(qiáng)的智能性和適應(yīng)性。文獻(xiàn)[81] 提出了一種基于近端策略優(yōu)化算法(Proximal Policy Optimization, PPO)的姿態(tài)機(jī)動(dòng)策略,在無(wú)需轉(zhuǎn)動(dòng)慣量信息的情況下,顯著提升了性能。Elkin等[82]針對(duì)航天器姿態(tài)機(jī)動(dòng)問(wèn)題,提出了一個(gè)新型的強(qiáng)化學(xué)習(xí)框架,該框架利用地面高保真的數(shù)字仿真環(huán)境進(jìn)行訓(xùn)練,同時(shí)由測(cè)量的運(yùn)動(dòng)狀態(tài)更新仿真環(huán)境的數(shù)字模型,并近乎實(shí)時(shí)的將最新的姿態(tài)機(jī)動(dòng)策略更新,實(shí)現(xiàn)了策略在線更新的運(yùn)動(dòng)規(guī)劃。上述方法主要是針對(duì)無(wú)約束情況下的姿態(tài)機(jī)動(dòng),筆者團(tuán)隊(duì)[5]針對(duì)多約束下的航天器姿態(tài)機(jī)動(dòng)問(wèn)題,在自適應(yīng)動(dòng)態(tài)規(guī)劃(Adaptive Dynamic Programming, ADP)框架下設(shè)計(jì)了一種在線學(xué)習(xí)的算法,結(jié)合歷史數(shù)據(jù)與實(shí)時(shí)測(cè)量狀態(tài),在線近似求解最優(yōu)問(wèn)題對(duì)應(yīng)的哈密頓-雅可比-貝爾曼(Hamilton-Jacobi-Bellman equation, HJB)方程,對(duì)姿態(tài)機(jī)動(dòng)策略的實(shí)時(shí)更新,實(shí)現(xiàn)了在指向和角速度雙重約束下的姿態(tài)重定向機(jī)動(dòng)。文獻(xiàn)[83] 進(jìn)一步考慮了執(zhí)行機(jī)構(gòu)偏差,改進(jìn)在線學(xué)習(xí)策略,實(shí)現(xiàn)了姿態(tài)約束和執(zhí)行機(jī)構(gòu)不確定性下的高精度姿態(tài)機(jī)動(dòng)。上述方法首先設(shè)計(jì)了比例微分算法得到初始的規(guī)劃策略,然后通過(guò)在線的“獎(jiǎng)勵(lì)”反饋完成策略的實(shí)時(shí)更新,實(shí)現(xiàn)了小計(jì)算代價(jià)的安全規(guī)避和性能的在線優(yōu)化。 以強(qiáng)化學(xué)習(xí)為代表的人工智能方法是解決航天器運(yùn)動(dòng)規(guī)劃的新途徑,前述工作中約束的處理主要取決于環(huán)境“環(huán)境獎(jiǎng)勵(lì)”的構(gòu)造,如何針對(duì)航天任務(wù)的需求,設(shè)計(jì)更為精準(zhǔn)合理的“獎(jiǎng)勵(lì)量化”機(jī)制是一項(xiàng)有待研究的內(nèi)容。此外,考慮到航天器機(jī)動(dòng)任務(wù)的特殊性,利用小樣本數(shù)據(jù)進(jìn)行快速在線策略學(xué)習(xí)有著十分重要的作用,故設(shè)計(jì)高效的學(xué)習(xí)律是亟需突破的關(guān)鍵技術(shù)。 姿態(tài)控制是保障航天器穩(wěn)定飛行或跟蹤制導(dǎo)指令的關(guān)鍵技術(shù)之一。在實(shí)際工程中,比例積分微分控制(Proportional-Integral-Derivative control, PID)因其結(jié)構(gòu)簡(jiǎn)單、參數(shù)調(diào)整直觀、易于工程實(shí)現(xiàn)等優(yōu)點(diǎn),一直被廣泛應(yīng)用于航天器姿態(tài)控制系統(tǒng)的設(shè)計(jì)中[84]。然而,傳統(tǒng) PID 控制不能有效處理姿態(tài)控制設(shè)計(jì)面臨的系統(tǒng)不確定性、多源干擾、執(zhí)行機(jī)構(gòu)故障、暫穩(wěn)態(tài)性能約束以及測(cè)量信息不完備等廣義約束,難以滿足新興空間任務(wù)對(duì)姿態(tài)控制系統(tǒng)高自主、高可靠和高精度的發(fā)展需求。近年來(lái),國(guó)內(nèi)外學(xué)者圍繞航天器姿態(tài)控制問(wèn)題(包括姿態(tài)鎮(zhèn)定、姿態(tài)機(jī)動(dòng)和姿態(tài)跟蹤)開(kāi)展了大量的理論與應(yīng)用研究,提出了一系列先進(jìn)的控制方法。下面將著重面向參數(shù)不確定性、多源干擾、執(zhí)行機(jī)構(gòu)故障和暫穩(wěn)態(tài)性能約束,依次介紹自適應(yīng)控制、抗干擾控制、容錯(cuò)控制、預(yù)設(shè)性能控制等姿態(tài)控制方法的研究進(jìn)展。 航天器的慣量不確定性可能會(huì)導(dǎo)致控制精度下降,嚴(yán)重時(shí)甚至?xí)斐上到y(tǒng)失穩(wěn)?;凇耙宰儜?yīng)變”思想的自適應(yīng)控制可以有效處理參數(shù)不確定性問(wèn)題。傳統(tǒng)自適應(yīng)控制方法大多基于確定等價(jià)(Certainty-Equivalence, CE)原則,其基本思想是[85]:首先在假設(shè)不確定參數(shù)已知的前提下進(jìn)行反饋控制設(shè)計(jì),而后用估計(jì)值替換控制律中的不確定參數(shù),并設(shè)計(jì)相應(yīng)的自適應(yīng)律在線更新參數(shù)的估計(jì)值,保證閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)跟蹤誤差的收斂?;?CE 的自適應(yīng)控制因思路簡(jiǎn)單、直觀,在航天器姿態(tài)控制中得到了廣泛的應(yīng)用[19,86]。然而,在 CE 框架下,自適應(yīng)律的設(shè)計(jì)主要是為了精確抵消由參數(shù)不確定性所引入的附加“擾動(dòng)”項(xiàng),但當(dāng)參數(shù)估計(jì)無(wú)法收斂到它們的真值時(shí),這種脆弱的抵消操作往往會(huì)降低閉環(huán)系統(tǒng)的暫態(tài)性能和魯棒性。然而,參數(shù)收斂?jī)H在參考軌跡滿足嚴(yán)格的持續(xù)激勵(lì)(Persistent Excitation, PE)條件時(shí)才能實(shí)現(xiàn)。 為了提高自適應(yīng)控制性能,相關(guān)學(xué)者脫離CE原則,基于浸入與不變(Immersion and Invariance, I&I)技術(shù)提出了非確定等價(jià)自適應(yīng)控制方法。I&I方法論最早是由Astolfi和Ortega[87]基于微分幾何概念提出的。I&I自適應(yīng)控制方法主要是通過(guò)在參數(shù)估計(jì)中額外增加一個(gè)函數(shù)項(xiàng)以構(gòu)造一個(gè)微分流形,并設(shè)計(jì)控制律和自適應(yīng)律使得所構(gòu)造的流形不變且吸引,從而以魯棒的思想處理系統(tǒng)參數(shù)不確定性。這一方法極大地放寬了 CE 自適應(yīng)控制對(duì) PE 條件的依賴。需要指出的是,I&I 自適應(yīng)控制需要求解一個(gè)特定的 PDE 來(lái)構(gòu)造微分流形,但對(duì)于航天器姿態(tài)動(dòng)力學(xué)這類多輸入非線性系統(tǒng)而言,PDE 通常無(wú)解析解,即所謂的“可積性障礙”。這一障礙極大地限制了傳統(tǒng) I&I 自適應(yīng)控制在航天姿態(tài)控制中的應(yīng)用。為了克服此問(wèn)題,Seo 和 Akella[88]分別針對(duì)航天器姿態(tài)跟蹤問(wèn)題,提出了基于回歸濾波的 I&I 自適應(yīng)控制方法,通過(guò)引入狀態(tài)和回歸矩陣濾波器,構(gòu)造了一個(gè)增廣濾波系統(tǒng),并利用增廣濾波狀態(tài)和濾波回歸矩陣直接給出了PDE的解析解。文獻(xiàn)[89]利用這一方法設(shè)計(jì)了I&I自適應(yīng)姿態(tài)控制器。Karagiannis等[90]將動(dòng)態(tài)縮放(Dynamic Scaling)技術(shù)應(yīng)用到I&I自適應(yīng)控制設(shè)計(jì)中,為克服可積性障礙提供了一個(gè)新思路。該方法通過(guò)引入狀態(tài)濾波器,將原始回歸矩陣中的積分變量按照一定方式替換為相應(yīng)的濾波狀態(tài)量,使回歸矩陣可積,并給出ODE的近似解,之后設(shè)計(jì)動(dòng)態(tài)縮放因子補(bǔ)償近似解導(dǎo)致的誤差。與文獻(xiàn)[88]相比,基于動(dòng)態(tài)縮放的方法只需對(duì)原系統(tǒng)進(jìn)行低維的動(dòng)態(tài)擴(kuò)張便可實(shí)現(xiàn)與之相似的性能。Yang等[91]將該方法應(yīng)用到了航天器姿態(tài)跟蹤控制問(wèn)題中,并改進(jìn)了動(dòng)態(tài)增益的設(shè)計(jì),有效避免了高增益控制問(wèn)題。Wen等[92]進(jìn)一步改進(jìn)了動(dòng)態(tài)縮放因子,移除了文獻(xiàn)[91]需要慣量矩陣最小特征值的假設(shè)。Xia和Yue[93]針對(duì)航天器抗退繞姿態(tài)穩(wěn)定問(wèn)題,提出了基于動(dòng)態(tài)縮放的 I&I 自適應(yīng)控制方法,并通過(guò)引入飽和的縮放因子,使得控制器不需要任何動(dòng)態(tài)增益。本文作者團(tuán)隊(duì)將基于動(dòng)態(tài)縮放的 I&I 自適應(yīng)控制方法應(yīng)用于航天器受限的姿態(tài)重定向中[4]。 CE 和 I&I 自適應(yīng)控制方法均僅當(dāng)回歸矩陣滿足 PE 條件時(shí),才能保證參數(shù)估計(jì)收斂到它們的真值[94]。但 PE 條件較為嚴(yán)苛,在實(shí)際中通常難以滿足。近年來(lái),國(guó)內(nèi)外眾多學(xué)者都開(kāi)展了放寬參數(shù)收斂對(duì) PE 條件依賴的研究。Chowdhary 和 Johnson[95]在 MRAC 框架下,提出了一種基于并行學(xué)習(xí)(Concurrent Learning, CL)的自適應(yīng)控制方法,通過(guò)并行使用豐富的歷史數(shù)據(jù)和當(dāng)前量測(cè)數(shù)據(jù)設(shè)計(jì)自適應(yīng)律,可在系統(tǒng)狀態(tài)僅滿足寬松的有限激勵(lì)(Finite Excitation, FE)條件下保證參數(shù)收斂。這一方法自提出以來(lái)就獲得了廣泛的關(guān)注與應(yīng)用。Zhao 和 Duan[96]針對(duì)慣量不確定性下的組合體航天器姿態(tài)跟蹤問(wèn)題,提出了 CL 自適應(yīng)律,精確地估計(jì)出了組合體未知的慣量參數(shù)。由于 CL 算法需要數(shù)據(jù)選取與存儲(chǔ),為使存儲(chǔ)的數(shù)據(jù)盡可能多地包含線性無(wú)關(guān)元素,需要選擇一個(gè)合適的記錄方案,這極大地增加了算法設(shè)計(jì)的復(fù)雜度。而且,傳統(tǒng) CL 算法需要狀態(tài)導(dǎo)數(shù)(如角加速度)來(lái)構(gòu)造參數(shù)估計(jì)誤差,但狀態(tài)導(dǎo)數(shù)一般是不可測(cè)的信號(hào)。盡管可以使用固定點(diǎn)平滑器、滑模微分器等對(duì)狀態(tài)導(dǎo)數(shù)進(jìn)行在線估計(jì),但這種處理方法對(duì)測(cè)量噪聲比較敏感。為避免使用狀態(tài)導(dǎo)數(shù)信息,Cho等[97]提出了復(fù)合自適應(yīng)控制方法,無(wú)需狀態(tài)導(dǎo)數(shù)信息,在 FE 條件下實(shí)現(xiàn)了參數(shù)收斂,而且由于其使用濾波回歸的積分進(jìn)行數(shù)據(jù)存儲(chǔ),也避免了在線數(shù)據(jù)選取。基于相似的思想,文獻(xiàn)[98] 提出了復(fù)合學(xué)習(xí)控制方法,并成功應(yīng)用于機(jī)械臂控制中。本文作者團(tuán)隊(duì)針對(duì)航天器姿態(tài)跟蹤和多約束姿態(tài)再定向問(wèn)題,基于復(fù)合學(xué)習(xí)思想,提出了幾種自適應(yīng)與學(xué)習(xí)控制方法,在保證高精度姿態(tài)控制的前提下,實(shí)現(xiàn)了慣量參數(shù)的在線辨識(shí)[99-100]。 雖然國(guó)內(nèi)外研究人員在航天器姿態(tài)自適應(yīng)控制方面取得了一定的進(jìn)展,但現(xiàn)有的自適應(yīng)控制方法大多要求慣量參數(shù)是常值或慢變的(近似于常值)。對(duì)于未知時(shí)變慣量條件下的航天器姿態(tài)自適應(yīng)控制技術(shù),尤其是時(shí)變慣量參數(shù)進(jìn)行在線辨識(shí),有待系統(tǒng)性的探索。 航天器在軌運(yùn)行期間所受的多源干擾極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。姿態(tài)控制設(shè)計(jì)需要針對(duì)性地抑制或抵消這些干擾,以提升姿態(tài)控制系統(tǒng)的抗擾能力和控制精度?,F(xiàn)有航天器姿態(tài)抗干擾控制方法可大致歸為3類:①魯棒控制方法;②自抗擾控制方法;③基于干擾觀測(cè)器的控制方法。 魯棒控制誕生于20世紀(jì) 70 年代末期,最初是為解決航空航天領(lǐng)域的控制問(wèn)題,直到 1988 年著名的 DGKF 方法發(fā)表[101],相關(guān)理論才趨于成熟。至今,魯棒控制仍是最為廣泛使用的姿態(tài)抗干擾控制方法。Liu等[102]提出了一種非脆弱的魯棒H∞控制方法,解決了存在建模不確定性、控制攝動(dòng)、外部干擾和控制輸入限制的撓性航天器姿態(tài)穩(wěn)定和振動(dòng)抑制問(wèn)題。一些學(xué)者結(jié)合H2和H∞魯棒控制方法,提出了混合H2/H∞魯棒姿態(tài)控制方法[103-104]。Luo等[105]針對(duì)存在外部干擾的航天器姿態(tài)跟蹤問(wèn)題,結(jié)合魯棒控制和最優(yōu)控制方法,提出了一種H∞逆最優(yōu)控制器,實(shí)現(xiàn)對(duì)干擾的H∞最優(yōu)。Wang 和 Li[106]提出了一種魯棒最優(yōu)控制方法,解決了存在執(zhí)行機(jī)構(gòu)安裝偏差和干擾的航天器姿態(tài)穩(wěn)定問(wèn)題。 變結(jié)構(gòu)控制憑借其對(duì)不確定性和干擾的強(qiáng)魯棒性,也是最為廣泛應(yīng)用的魯棒抗干擾方法。筆者團(tuán)隊(duì)[107]針對(duì)撓性航天器大角度姿態(tài)機(jī)動(dòng)問(wèn)題,結(jié)合主動(dòng)振動(dòng)抑制技術(shù),提出了滑??刂?Sliding Mode Control, SMC)方案,有效抑制了外部干擾和撓性振動(dòng)。為實(shí)現(xiàn)有限時(shí)間控制,相關(guān)學(xué)者也提出了終端 SMC 方案[108-109]。針對(duì)存在外部干擾和控制幅值受限的航天器姿態(tài)控制問(wèn)題,Wallsgrove 和 Akella[110]提出了一種飽和的光滑變結(jié)構(gòu)姿態(tài)控制方案,通過(guò)構(gòu)造時(shí)變的濾波變量,并引入一個(gè)銳度函數(shù),有效抑制了干擾對(duì)閉環(huán)系統(tǒng)的影響,實(shí)現(xiàn)了漸進(jìn)的姿態(tài)收斂。本文作者團(tuán)隊(duì)基于文獻(xiàn)[110] 也提出了幾種光滑的變結(jié)構(gòu)控制方法[111-112],解決了控制輸入和角速度受限下的航天器抗退繞姿態(tài)穩(wěn)定問(wèn)題,在干擾下實(shí)現(xiàn)了姿態(tài)和角速度的漸進(jìn)收斂。魯棒控制方法的核心思想是“以不變應(yīng)萬(wàn)變”,即考慮系統(tǒng)可能面臨的“最壞”擾動(dòng)情況,設(shè)計(jì)一個(gè)結(jié)構(gòu)不變的魯棒控制器,實(shí)現(xiàn)對(duì)有界擾動(dòng)的有效抑制,故而具有較強(qiáng)的保守性。相比而言,自抗擾控制和基于干擾觀測(cè)器的方法通過(guò)對(duì)擾動(dòng)進(jìn)行估計(jì)和補(bǔ)償,可有效減小控制器的保守性。 自韓京清[113]1998 年提出自抗擾控制(Active Disturbance Rejection Control, ADRC)以來(lái),該方法一直受到控制界的廣泛關(guān)注,并已成功應(yīng)用于航空航天、工業(yè)控制等領(lǐng)域。ADRC 繼承了經(jīng)典 PID 控制的誤差反饋精髓,并引入擾動(dòng)估計(jì)補(bǔ)償技術(shù),使其不依賴于被控對(duì)象精確的數(shù)學(xué)模型,對(duì)干擾具有較好的抑制能力。ADRC 一般由跟蹤微分器、擴(kuò)張狀態(tài)觀測(cè)器(Extended State Observer, ESO)、非線性狀態(tài)誤差反饋控制律和擾動(dòng)補(bǔ)償?shù)葞讉€(gè)環(huán)節(jié)組成[18]。Xia 等[18]針對(duì)航天器姿態(tài)跟蹤問(wèn)題,提出了一種基于 ESO 的 SMC 方案,通過(guò)設(shè)計(jì) ESO 對(duì)系統(tǒng)集總干擾進(jìn)行估計(jì)補(bǔ)償,極大地放寬了傳統(tǒng) SMC 的保守性。文獻(xiàn)[114] 針對(duì)外部擾動(dòng)、輸入/測(cè)量噪聲及飽和約束等影響下的無(wú)拖曳衛(wèi)星位姿控制問(wèn)題,采用基于擴(kuò)展?fàn)顟B(tài)的卡爾曼濾波器對(duì)系統(tǒng)狀態(tài)和擾動(dòng)進(jìn)行估計(jì),并設(shè)計(jì)自抗擾控制器,實(shí)現(xiàn)了無(wú)拖曳衛(wèi)星的聯(lián)合控制。 盡管前述的非線性 ADRC 方法具有參數(shù)效率高、干擾觀測(cè)性能好等突出優(yōu)點(diǎn),但其結(jié)構(gòu)較為復(fù)雜,需要調(diào)節(jié)的參數(shù)較多,導(dǎo)致參數(shù)整定困難。針對(duì)此問(wèn)題,美國(guó) Cleveland State University 的Gao[115]提出了線性 ADRC 方法,給出了基于觀測(cè)器帶寬的觀測(cè)器增益整定方法,通過(guò)將多參數(shù)整定問(wèn)題簡(jiǎn)化為單參數(shù)整定問(wèn)題,極大地簡(jiǎn)化了控制器設(shè)計(jì)和理論分析。Bai等[116]針對(duì)存在干擾的航天器姿態(tài)跟蹤問(wèn)題,采用線性 ESO 對(duì)外部干擾進(jìn)行估計(jì)和補(bǔ)償,并設(shè)計(jì)一種自適應(yīng)控制方法,實(shí)現(xiàn)了姿態(tài)和角速度跟蹤誤差的快速高精度收斂。除此之外,還有很多基于 ADRC 的姿態(tài)抗干擾控制成果,但限于篇幅,這里不再一一羅列?,F(xiàn)有 ADRC 方法在測(cè)量噪聲明顯時(shí),因觀測(cè)器增益限制,極易導(dǎo)致擾動(dòng)估計(jì)不精確,進(jìn)而造成控制性能下降。 基于干擾觀測(cè)器的控制方法(Disturbance Observer Based Control, DOBC)起源于 20 世紀(jì) 80 年代,最初是日本學(xué)者 Ohishi等[117]針對(duì)直流伺服電機(jī)的控制問(wèn)題,提出了一種頻域干擾觀測(cè)器對(duì)伺服電機(jī)干擾進(jìn)行估計(jì)和補(bǔ)償。DOBC 方法的基本思想是設(shè)計(jì)干擾觀測(cè)器對(duì)系統(tǒng)的內(nèi)外干擾進(jìn)行估計(jì)和前饋補(bǔ)償,以抵消干擾對(duì)系統(tǒng)的影響,并結(jié)合其他控制方法,實(shí)現(xiàn)特定的控制需求。由于結(jié)構(gòu)簡(jiǎn)單、參數(shù)整定方便,DOBC 方法自提出以來(lái)便在控制領(lǐng)域得到了廣泛關(guān)注。盡管頻域干擾觀測(cè)器被成功應(yīng)用于各類系統(tǒng),但其分析設(shè)計(jì)均基于線性化的模型和線性系統(tǒng)理論,極大地限制了其應(yīng)用范圍。 英國(guó) Loughborough University 的陳文華[118]于2000年首次利用時(shí)域方法提出了一種非線性干擾觀測(cè)器,并應(yīng)用于機(jī)械臂控制中實(shí)現(xiàn)了精確的摩擦估計(jì)和補(bǔ)償。此后,非線性DOBC理論得到了迅速發(fā)展。針對(duì)航天器姿態(tài)控制系統(tǒng),該方法的結(jié)構(gòu)如圖11所示。Sun 和 Zheng[119]針對(duì)存在測(cè)量噪聲和控制輸入飽和的航天器姿態(tài)穩(wěn)定問(wèn)題,將測(cè)量噪聲、參數(shù)攝動(dòng)和外部干擾當(dāng)成“集總干擾”,采用非線性 DOB 對(duì)集總干擾進(jìn)行估計(jì)和前饋補(bǔ)償,并基于抗積分飽和補(bǔ)償器設(shè)計(jì)了飽和魯棒控制器。Zhang等[120]結(jié)合積分型 DOB 和終端滑??刂萍夹g(shù),設(shè)計(jì)了自適應(yīng)滑??刂破?,實(shí)現(xiàn)了有限時(shí)間姿態(tài)跟蹤。Zhu等[121]針對(duì)撓性航天器的主振動(dòng)抑制和姿態(tài)抗擾控制問(wèn)題,分別設(shè)計(jì)了自適應(yīng) DOB 和撓性振動(dòng)觀測(cè)器,有效補(bǔ)償了集總干擾和撓性振動(dòng)。北京航空航天大學(xué)吳忠團(tuán)隊(duì)分別設(shè)計(jì)了有限時(shí)間 DOB[122]和迭代學(xué)習(xí) DOB[123],并應(yīng)用于撓性航天器姿態(tài)控制中。 值得注意的是,航天器姿態(tài)控制系統(tǒng)往往會(huì)受到模型不確定性、未建模動(dòng)態(tài)、時(shí)滯、執(zhí)行器誤差、測(cè)量噪聲以及外部環(huán)境干擾等內(nèi)外部多源干擾的影響,這些干擾具有不同的表征形式,如范數(shù)有界變量、諧波變量、階躍變量、非高斯/高斯隨機(jī)變量以及變化率有界變量等[124]。傳統(tǒng)的 DOBC 大多僅能對(duì)單一干擾進(jìn)行補(bǔ)償,沒(méi)有充分挖掘出各類干擾的內(nèi)在特征,并有針對(duì)性地進(jìn)行精細(xì)化補(bǔ)償和抑制。文獻(xiàn)[125-126] 在傳統(tǒng) DOBC 的基礎(chǔ)上,首次提出了復(fù)合分層抗干擾控制方法,在對(duì)系統(tǒng)干擾進(jìn)行分析和分類建模的基礎(chǔ)上,采用內(nèi)環(huán)+外環(huán)的雙環(huán)控制結(jié)構(gòu),實(shí)現(xiàn)對(duì)系統(tǒng)多源干擾的精細(xì)估計(jì)和補(bǔ)償,該方法目前已在航天器、機(jī)器人等系統(tǒng)中進(jìn)行了應(yīng)用,并取得了較好的效果。Zhu等[127]結(jié)合 ADRC 和 DOBC 方法提出了一種增強(qiáng)的復(fù)合抗擾控制方法,該方法建立了一個(gè)外部模型對(duì)撓性振動(dòng)引起的干擾進(jìn)行描述,并將參數(shù)不確定性、環(huán)境干擾等其他干擾歸結(jié)為一個(gè)微分有界的等效干擾,然后利用 DOBC 對(duì)撓性振動(dòng)干擾進(jìn)行精細(xì)估計(jì)與補(bǔ)償,并采用 ADRC 補(bǔ)償其他干擾,相較于單一的 DOBC 或 ADRC 方法具有更強(qiáng)的抗擾能力。Yu等[21]首次提出了干擾可估計(jì)性和可補(bǔ)償性概念,并與文獻(xiàn) [127] 相似,結(jié)合 ADRC 和 DOBC 技術(shù)設(shè)計(jì)了一種增強(qiáng)的抗干擾姿態(tài)控制器,實(shí)現(xiàn)了撓性航天器的精細(xì)干擾補(bǔ)償和高精度姿態(tài)控制。 雖然過(guò)去20年 DOBC 技術(shù)取得了長(zhǎng)足的發(fā)展,并在航天器姿態(tài)抗干擾控制中得到了應(yīng)用與驗(yàn)證,但是提高 DOBC 在大延時(shí)、高對(duì)抗和強(qiáng)干擾等復(fù)雜環(huán)境下的精細(xì)抗干擾能力,仍是一項(xiàng)有待深入研究的工作。 世界各空間機(jī)構(gòu)在航天器的設(shè)計(jì)、生產(chǎn)及其在軌運(yùn)行過(guò)程中,都非常重視航天器的可靠性和操作的安全性。但受制造工藝水平、成本限制等客觀因素的制約,以及高/低溫、強(qiáng)輻射、強(qiáng)電磁干擾等惡劣太空環(huán)境的影響,航天器故障事件仍時(shí)有發(fā)生,如太陽(yáng)帆板損壞、陀螺儀失效、遙測(cè)指令系統(tǒng)異常等。航天器故障給航天器的安全性帶來(lái)了極大隱患。據(jù)統(tǒng)計(jì)表明[128],1980—2005年間在軌航天器所發(fā)生的 156 起故障事件中,姿態(tài)和軌道控制系統(tǒng)(Attitude and Orbit Control System, AOCS)與電力系統(tǒng)(Power)故障占總故障的 59%。進(jìn)一步分析故障對(duì)任務(wù)的影響,發(fā)現(xiàn)近 65% 的故障是非致命性故障,致使了航天任務(wù)降級(jí),而近 40% 的故障是致命性的,導(dǎo)致航天任務(wù)完全失敗,造成了巨大的經(jīng)濟(jì)損失。 姿態(tài)控制系統(tǒng)因功能和結(jié)構(gòu)復(fù)雜,是航天器故障事件最高發(fā)的子系統(tǒng)之一。根據(jù)文獻(xiàn)[128]可知,1980—2005年發(fā)生的 156 起故障事件中AOCS 故障占總故障的 32%,而且近 50% 的 AOCS 故障是由反作用飛輪、動(dòng)量輪、推力器等姿軌控執(zhí)行機(jī)構(gòu)故障引起的。航天器長(zhǎng)期在軌運(yùn)行期間,這些姿軌控執(zhí)行機(jī)構(gòu)需要頻繁工作以驅(qū)動(dòng)航天器完成指定任務(wù),這也是它們故障高發(fā)的原因。表2 和表3 分析了典型的推力器和反作用飛輪故障案例。由此可見(jiàn),執(zhí)行機(jī)構(gòu)故障輕則會(huì)導(dǎo)致航天器任務(wù)降級(jí)、壽命縮減,重則直接致使航天器完全失效甚至失控解體,造成巨大的經(jīng)濟(jì)損失和災(zāi)難性的后果。因此,使航天器具備自主故障處理能力尤為重要。 表2 推力器故障典型案例Table 2 Typical cases of thruster faults 表3 反作用飛輪故障典型案例Table 3 Typical cases of reaction wheel faults 為滿足航天器日益提升的安全性、可靠性和可維護(hù)性需求,迫切需要發(fā)展容錯(cuò)控制(Fault-Tolerant Control, FTC)技術(shù),使航天器具備自主故障處理能力。FTC 發(fā)端于航空航天高可靠性需求,20 世紀(jì) 80 年代美國(guó)空軍提出了“自修復(fù)飛行控制系統(tǒng)”等概念,以保證飛行器在故障情況下仍能安全著陸。文獻(xiàn)[129]對(duì)FTC技術(shù)進(jìn)行了系統(tǒng)性梳理和回顧。根據(jù)文獻(xiàn)[130],現(xiàn)有的航天器姿態(tài)FTC方法可分為2大類:被動(dòng)FTC和主動(dòng)FTC。 被動(dòng) FTC 本質(zhì)上屬于“以不變應(yīng)萬(wàn)變”的魯棒控制方法,在設(shè)計(jì)過(guò)程中需要充分考慮潛在的故障,并將它們視為系統(tǒng)不確定性,而后設(shè)計(jì)一個(gè)魯棒控制器實(shí)現(xiàn)容錯(cuò)控制。該方法不需要故障的在線信息,且無(wú)需進(jìn)行控制重構(gòu),能夠同時(shí)處理多種類型故障,具有設(shè)計(jì)簡(jiǎn)單、工程實(shí)用性強(qiáng)等優(yōu)勢(shì),目前已在航天器控制領(lǐng)域得到了廣泛關(guān)注?,F(xiàn)有的航天器姿態(tài)被動(dòng) FTC 方法主要集中于“自適應(yīng) + X”方法(如自適應(yīng) + 滑??刂?、自適應(yīng) + 魯棒控制等)。Cai等[131]針對(duì)航天器姿態(tài)跟蹤問(wèn)題,提出了一種“間接自適應(yīng)+滑??刂啤钡聂敯羧蒎e(cuò)控制方法,該方法不僅能夠在有限推力下應(yīng)對(duì)推力器故障,還對(duì)參數(shù)不確定性和外部干擾具有強(qiáng)魯棒性。Shen等[132]結(jié)合終端滑??刂坪妥赃m應(yīng)控制技術(shù),研究了有限時(shí)間FTC問(wèn)題。Xiao等[133]研究了剛?cè)狁詈虾教炱鞯淖藨B(tài)跟蹤問(wèn)題,考慮執(zhí)行機(jī)構(gòu)故障、測(cè)量噪聲、未知模態(tài)位移、參數(shù)不確定性和外部干擾等,設(shè)計(jì)了自適應(yīng)容錯(cuò)控制器,采用序列Lyapunov方法分析了跟蹤誤差的保性能收斂界。近年來(lái),本文作者團(tuán)隊(duì)[134-135]提出了“自適應(yīng)+預(yù)設(shè)性能控制”的航天器姿態(tài)FTC方法,在參數(shù)不確定性、外部干擾和執(zhí)行機(jī)構(gòu)故障下實(shí)現(xiàn)了姿態(tài)跟蹤誤差的預(yù)設(shè)性能收斂。盡管被動(dòng)FTC能夠有效處理一大類執(zhí)行機(jī)構(gòu)故障,且對(duì)干擾具有強(qiáng)魯棒性,但控制器的保守性較強(qiáng),難以恢復(fù)理想的控制性能。 不同于被動(dòng) FTC,主動(dòng) FTC 方法主要是通過(guò)引入一個(gè)故障檢測(cè)和診斷(Fault Dection and Digonosis, FDD)算法對(duì)執(zhí)行機(jī)構(gòu)故障進(jìn)行在線實(shí)時(shí)檢測(cè)與診斷,而后利用 FDD 模塊的診斷信息重構(gòu)控制器,以“精準(zhǔn)診斷-對(duì)癥下藥”的思想主動(dòng)地應(yīng)對(duì)執(zhí)行機(jī)構(gòu)故障,保證整個(gè)系統(tǒng)在故障下仍具有可接受的性能。主動(dòng) FTC 方法的框架如圖12所示,該方法能夠充分利用系統(tǒng)的物理和解析冗余,主動(dòng)地應(yīng)對(duì)執(zhí)行機(jī)構(gòu)故障,故具有較小的保守性。主動(dòng) FTC 系統(tǒng)一般包含故障診斷與容錯(cuò)控制2部分內(nèi)容,而故障診斷又分為 3 部分:① 故障檢測(cè),即檢測(cè)出系統(tǒng)是否發(fā)生故障與故障發(fā)生的時(shí)間;② 故障隔離,即獲知系統(tǒng)哪個(gè)部件發(fā)生故障以及故障類型和發(fā)生的具體位置;③ 故障辨識(shí),即根據(jù)系統(tǒng)測(cè)量信息辨識(shí)出故障大小。目前,大量學(xué)者對(duì)航天器姿態(tài)控制系統(tǒng)的故障診斷問(wèn)題進(jìn)行了研究,現(xiàn)有成果可劃分為基于模型的方法、基于數(shù)據(jù)的方法和基于知識(shí)的方法3大類。哈爾濱工業(yè)大學(xué)沈毅等[136]和筆者團(tuán)隊(duì)[137]已對(duì)現(xiàn)有航天器姿態(tài)控制系統(tǒng)的故障診斷算法進(jìn)行了梳理與總結(jié),這里不再詳述。盡管故障診斷技術(shù)取得了一些的研究成果,但大多方法在多源干擾的影響下面臨故障虛警率高、隔離難、辨識(shí)精度低等問(wèn)題,如何提高干擾下的故障診斷精度有待深入研究。 接下來(lái),重點(diǎn)回顧故障辨識(shí)與容錯(cuò)控制方法的研究進(jìn)展。Shen等[138]研究了姿態(tài)主動(dòng) FTC 問(wèn)題,提出可避免虛警的故障檢測(cè)方案,并構(gòu)造了指數(shù)收斂的間接故障辨識(shí)器對(duì)系統(tǒng)總故障進(jìn)行估計(jì),在此基礎(chǔ)上進(jìn)一步設(shè)計(jì)了自適應(yīng)滑模容錯(cuò)控制器,在滿足輸入飽和的前提下有效補(bǔ)償執(zhí)行機(jī)構(gòu)故障對(duì)系統(tǒng)的影響。筆者團(tuán)隊(duì)[139]針對(duì)航天器單框架控制力矩陀螺的故障診斷問(wèn)題,提出了一種基于神經(jīng)網(wǎng)絡(luò)的干擾觀測(cè)器在線學(xué)習(xí)周期干擾,實(shí)現(xiàn)了故障和干擾的解耦,并基于神經(jīng)網(wǎng)絡(luò)和自適應(yīng)估計(jì)器設(shè)計(jì)了故障診斷方案,實(shí)現(xiàn)對(duì)控制力矩陀螺故障的隔離和估計(jì)。近年來(lái),一些學(xué)者也將執(zhí)行機(jī)構(gòu)故障和干擾統(tǒng)一歸結(jié)為“集總干擾”,并基于 ADRC 或 DOBC 方法提出了一系列容錯(cuò)抗干擾控制方法[140-142]。筆者團(tuán)隊(duì)[142]提出了基于迭代學(xué)習(xí)干擾觀測(cè)器的姿態(tài)容錯(cuò)抗干擾控制方法,并通過(guò)硬件在環(huán)實(shí)驗(yàn)驗(yàn)證了算法的有效性。Gui[143]研究了基于觀測(cè)器的航天器姿態(tài) FTC 問(wèn)題,考慮執(zhí)行機(jī)構(gòu)故障、慣量不確定性、外部干擾以及狀態(tài)估計(jì)誤差,設(shè)計(jì)了一種連續(xù)滑模容錯(cuò)控制器,并使用序列 Lypunov 方法預(yù)測(cè)了穩(wěn)態(tài)跟蹤誤差的收斂界。 基于控制重分配的容錯(cuò)控制方法具有故障發(fā)生時(shí)無(wú)需改變控制器結(jié)構(gòu)的特點(diǎn),也被廣泛應(yīng)用于主動(dòng) FTC 系統(tǒng)設(shè)計(jì)中。Shen等[144]針對(duì)航天器姿態(tài)跟蹤問(wèn)題,基于故障辨識(shí)結(jié)果,結(jié)合滑??刂坪头囚敯艨刂品峙浼夹g(shù),提出了一種容錯(cuò)控制分配方法,該方法可充分利用健康和尚未完全失效的執(zhí)行機(jī)構(gòu)應(yīng)對(duì)故障;隨后,Shen等[145]又進(jìn)一步提出了一種魯棒容錯(cuò)控制分配方案。Li等[146]考慮執(zhí)行機(jī)構(gòu)故障、控制輸入飽和以及外部干擾,提出了一種基于閉環(huán)控制分配的姿態(tài) FTC 方法,在控制輸入飽和限制下,通過(guò)將基準(zhǔn)控制信號(hào)分配到冗余執(zhí)行機(jī)構(gòu),并將分配誤差納入控制閉環(huán),保證了閉環(huán)系統(tǒng)的穩(wěn)定性。筆者團(tuán)隊(duì)[147]也提出了一種閉環(huán)的魯棒容錯(cuò)控制分配方法,充分考慮故障估計(jì)誤差,將控制分配問(wèn)題描述為一個(gè)魯棒最小方差問(wèn)題,并給出了相應(yīng)的解析解,克服了傳統(tǒng)控制分配方法僅能給出數(shù)值解,且缺乏嚴(yán)格閉環(huán)穩(wěn)定性保證的局限。 隨著航天器星載設(shè)備集成化程度和航天任務(wù)品質(zhì)需求的不斷提升,以及空間對(duì)抗態(tài)勢(shì)的日益升級(jí),航天器發(fā)生執(zhí)行/傳感故障以及部件損傷的概率劇增。盡管目前航天器容錯(cuò)控制技術(shù)在理論和應(yīng)用方面均取得了顯著的進(jìn)展,但針對(duì)航天器結(jié)構(gòu)性故障(如航天器受攻擊或撞擊而發(fā)生帆板損壞等)的容錯(cuò)控制技術(shù)仍有待研究。 為確保航天器高品質(zhì)地完成深空探測(cè)、在軌服務(wù)、空間對(duì)抗等新一代空間任務(wù),姿態(tài)控制系統(tǒng)的設(shè)計(jì)需要考慮第1.4.4節(jié)總結(jié)的暫穩(wěn)態(tài)性能要求。然而,現(xiàn)有的非線性控制方法(如滑??刂?、自適應(yīng)控制等)大多都側(cè)重于分析閉環(huán)系統(tǒng)的穩(wěn)定性與輸出誤差的穩(wěn)態(tài)行為,缺乏對(duì)暫態(tài)性能指標(biāo)的分析與保證。盡管混合H2和H∞魯棒控制[148]和L2增益性能指標(biāo)[149]可以分析閉環(huán)系統(tǒng)的暫態(tài)性能,但所引入的性能指標(biāo)均與軌跡導(dǎo)向的暫態(tài)性能沒(méi)有預(yù)先確定的關(guān)系,因此需要繁瑣的參數(shù)選取才能獲得期望的暫態(tài)性能。希臘學(xué)者 Bechlioulis 和 Rovithakis[150]提出了預(yù)設(shè)性能控制(Prescribed Performance Control, PPC),為保證控制系統(tǒng)暫穩(wěn)態(tài)性能提供了嶄新的設(shè)計(jì)思路。該方法的核心思想是通過(guò)引入性能函數(shù)為受控系統(tǒng)的狀態(tài)或誤差設(shè)定性能包絡(luò),刻畫收斂速度、最大超調(diào)量和穩(wěn)態(tài)誤差等暫穩(wěn)態(tài)控制性能,如圖13所示,并結(jié)合誤差轉(zhuǎn)換技術(shù)和非線性控制方法,保證狀態(tài)或誤差嚴(yán)格在預(yù)設(shè)的性能包絡(luò)內(nèi)收斂。由于 PPC 框架并沒(méi)有指定特定的控制器設(shè)計(jì)方法,故而可以根據(jù)實(shí)際控制需求,利用現(xiàn)有先進(jìn)的非線性控制方法(如 SMC、DOBC、自適應(yīng)控制等)對(duì)誤差轉(zhuǎn)換后的系統(tǒng)進(jìn)行控制器設(shè)計(jì)。 鑒于 PPC 方法在保證系統(tǒng)暫穩(wěn)態(tài)性能上的優(yōu)勢(shì),該方法自 2008 年提出以來(lái)便得到了大量的應(yīng)用。文獻(xiàn)[151-152] 對(duì)航天器姿態(tài) PPC 方法的研究進(jìn)展和未來(lái)趨勢(shì)進(jìn)行了綜述??紤] PPC 方法的魯棒性、抗干擾性和容錯(cuò)能力,本文從新的視角對(duì)航天器姿態(tài) PPC 方法的進(jìn)展進(jìn)行重新梳理,將現(xiàn)有方法劃分為2大類:“PPC + 估計(jì)/觀測(cè)”方法和無(wú)模型 PPC 方法,其中第一類方法主要包括“PPC + 自適應(yīng)控制”“PPC + DOBC”“PPC + 神經(jīng)網(wǎng)絡(luò)逼近”等。本文作者團(tuán)隊(duì)[89]針對(duì)航天器逼近操作問(wèn)題,將空間運(yùn)動(dòng)約束轉(zhuǎn)換為位姿跟蹤誤差的暫穩(wěn)態(tài)性能約束,并考慮航天器質(zhì)量特性不確定性,提出了一種 I&I 自適應(yīng) PPC 方法,能夠保證航天器按照預(yù)設(shè)的性能要求完成對(duì)空間目標(biāo)的逼近操作,且在逼近過(guò)程中嚴(yán)格遵循空間運(yùn)動(dòng)約束。此外,筆者團(tuán)隊(duì)[134-135]還研究了執(zhí)行機(jī)構(gòu)故障和輸入飽和下的航天器姿態(tài)跟蹤 PPC 問(wèn)題,提出了兩種基于障礙函數(shù)的自適應(yīng)容錯(cuò) PPC 方案,能夠在執(zhí)行機(jī)構(gòu)故障和飽和下保證姿態(tài)跟蹤誤差的暫穩(wěn)態(tài)性能要求。Liu 等[153]考慮外部干擾和執(zhí)行機(jī)構(gòu)影響下的航天器姿態(tài)跟蹤問(wèn)題,提出了一種自適應(yīng)容錯(cuò) PPC 方法,實(shí)現(xiàn)了姿態(tài)和角速度跟蹤誤差的預(yù)設(shè)性能收斂。哈爾濱工業(yè)大學(xué)Huang和Duan[154]針對(duì)組合體航天器姿態(tài)跟蹤 PPC 問(wèn)題,考慮慣量不確定性、外部干擾、執(zhí)行機(jī)構(gòu)故障和飽和等因素,提出了一種基于非線性 ESO 的抗積分飽和容錯(cuò) PPC 方案。 盡管前述的姿態(tài) PPC 方法具備較強(qiáng)的魯棒性、抗干擾性和容錯(cuò)能力,但大多需要在線估計(jì)或觀測(cè),致使算法復(fù)雜度高、計(jì)算量大,在星載計(jì)算資源嚴(yán)重受限的情況下,難以在軌應(yīng)用。為了提高 PPC 算法的實(shí)用性,近年來(lái)一些學(xué)者探究了低復(fù)雜度的無(wú)模型 PPC 方法[155],并在航天控制領(lǐng)域得到了應(yīng)用。Zhou等[156]針對(duì) SO(3) 描述下的航天器姿態(tài)跟蹤問(wèn)題,提出了一種無(wú)坐標(biāo)的魯棒 PPC 方法,該方法具有簡(jiǎn)單的控制器結(jié)構(gòu),無(wú)需動(dòng)力學(xué)參數(shù)信息,但對(duì)外部干擾具有強(qiáng)魯棒性。西北工業(yè)大學(xué)殷澤陽(yáng)等[157-159]針對(duì)航天器姿態(tài)穩(wěn)定、跟蹤和組合體航天器姿態(tài)接管控制問(wèn)題,提出了幾種低復(fù)雜度的無(wú)模型 PPC 方法,這些方法無(wú)需對(duì)模型參數(shù)和干擾進(jìn)行先驗(yàn)估計(jì)或在線辨識(shí),能夠保證系統(tǒng)輸出在存在參數(shù)不確定性和外部干擾的條件下仍能滿足預(yù)設(shè)的暫穩(wěn)態(tài)性能要求。特別的是,文獻(xiàn)[159] 基于終端滑模設(shè)計(jì)了一個(gè)指定時(shí)間性能函數(shù),并在此基礎(chǔ)上提出了無(wú)模型雙層 PPC 方法。Hu等[160]進(jìn)一步為撓性航天器姿態(tài)跟蹤設(shè)計(jì)了一種無(wú)模型雙層 PPC 方法。 現(xiàn)有姿態(tài) PPC 方法大多僅能處理暫穩(wěn)態(tài)性能約束,而難以兼顧各類運(yùn)動(dòng)和物理約束。文獻(xiàn) [161] 通過(guò)引入一個(gè)基于正系統(tǒng)理論的輔助系統(tǒng)來(lái)放寬飽和發(fā)生時(shí)的性能約束包絡(luò),克服了控制輸入飽和下的 PPC 設(shè)計(jì)難題,但該方法仍無(wú)法用于處理運(yùn)動(dòng)約束下的 PPC 設(shè)計(jì)問(wèn)題。如何在多運(yùn)動(dòng)和物理約束并存的情況下,形成有效的姿態(tài) PPC 方法,完成多約束下的航天器姿態(tài)預(yù)設(shè)性能控制是亟待解決的難題。 除了3.1~3.4節(jié)介紹的4種姿態(tài)控制方法外,一些典型的姿態(tài)控制方法還有: 1) 航天器姿態(tài)輸出反饋控制。由于成本和容積的限制,一些衛(wèi)星(尤其是小型化衛(wèi)星)通常不裝備角速度測(cè)量元件,或因傳感器故障,導(dǎo)致其無(wú)法獲得角速度測(cè)量信息。輸出反饋控制能夠在角速度信息缺失下實(shí)現(xiàn)控制目標(biāo)。傳統(tǒng)方法基于航天器姿態(tài)動(dòng)力學(xué)的無(wú)源性(Passivity),利用姿態(tài)信息設(shè)計(jì)輸出反饋控制器[162]。但這類方法需要在控制設(shè)計(jì)中額外引入一個(gè)動(dòng)態(tài)環(huán)節(jié),降低了系統(tǒng)的動(dòng)態(tài)響應(yīng)?;跔顟B(tài)觀測(cè)器的輸出反饋控制方法是另一種被廣泛應(yīng)用的方法。美國(guó)德克薩斯大學(xué)奧斯汀分校的Akella等[163]提出了全局漸近收斂的角速度觀測(cè)器,并利用觀測(cè)信息設(shè)計(jì)了類 PD 姿態(tài)控制器,解決了觀測(cè)器和控制器之間分離性質(zhì)(Separation Property)難以建立的難題,證明了閉環(huán)系統(tǒng)的穩(wěn)定性。 2) 航天器姿態(tài)事件觸發(fā)控制(Event-triggered Control, ETC)?,F(xiàn)有航天器姿態(tài)控制方法大多是時(shí)間驅(qū)動(dòng)的,即控制指令更新和通信是周期性采樣的。盡管周期性采樣易于工程實(shí)現(xiàn),但從資源利用的角度來(lái)看,周期性采樣和控制方式不可避免地會(huì)導(dǎo)致大量的計(jì)算和通信資源浪費(fèi)。ETC 為克服這一問(wèn)題提供了解決思路,該方法通過(guò)預(yù)先設(shè)定閾值和觸發(fā)條件,保證控制指令和通信僅在特定事件觸發(fā)時(shí)才執(zhí)行,極大降低了控制指令和通信的更新頻率[164]。文獻(xiàn)[165] 首次在 ETC 框架下研究了航天器的姿態(tài)穩(wěn)定控制問(wèn)題,通過(guò)設(shè)計(jì)基于狀態(tài)的觸發(fā)條件保證姿態(tài)信息和控制指令只在離散的觸發(fā)時(shí)刻被傳遞和更新。筆者團(tuán)隊(duì)[166]在角速度和通信資源受限的情況下,提出了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)事件觸發(fā)姿態(tài)機(jī)動(dòng)控制算法,有效降低了通信資源消耗。 3) 航天器姿態(tài)智能控制。隨著人工智能技術(shù)的迅猛發(fā)展,在航天器控制中得到了廣泛的關(guān)注與應(yīng)用。在文獻(xiàn)[167-168]中,全面分析并展望了智能方法在解決航天任務(wù)中執(zhí)行器故障、參數(shù)不確定、控制性能優(yōu)化等問(wèn)題的案例,為多約束下的航天器姿態(tài)控制設(shè)計(jì)提供了嶄新的途徑。針對(duì)模型參數(shù)不確定性,文獻(xiàn)[169]提出了一種智能 PD 撓性航天器姿態(tài)控制器,利用徑向基函數(shù)(Radial Basis Function,RBF)網(wǎng)絡(luò)以實(shí)現(xiàn)對(duì)未知擾動(dòng)項(xiàng)的補(bǔ)償。Schram等[170]則設(shè)計(jì)了智能自適應(yīng)姿態(tài)控制算法,利用強(qiáng)化學(xué)習(xí)技術(shù)對(duì)不確定性進(jìn)行在線逼近,實(shí)現(xiàn)了高精度姿態(tài)跟蹤。在文獻(xiàn)[171] 中,基于深度神經(jīng)網(wǎng)絡(luò)的參數(shù)估計(jì)設(shè)計(jì)了自適應(yīng)魯棒姿態(tài)跟蹤算法。Li等[172]針對(duì)分布式航天器的姿態(tài)協(xié)同跟蹤問(wèn)題,設(shè)計(jì)了自適應(yīng)神經(jīng)網(wǎng)絡(luò)逼近系統(tǒng)不確定項(xiàng),從而進(jìn)一步設(shè)計(jì)反饋控制器。面向執(zhí)行機(jī)構(gòu)故障,Baldi等[173]使用 RBF 網(wǎng)絡(luò)建立主動(dòng)容錯(cuò)控制系統(tǒng)對(duì)故障產(chǎn)生的控制偏差進(jìn)行補(bǔ)償,實(shí)現(xiàn)了容錯(cuò)故障跟蹤控制。Chen和Tao[174]也采用 RBF 網(wǎng)絡(luò)構(gòu)建閉環(huán)自適應(yīng)容錯(cuò)控制器,實(shí)現(xiàn)了存在未知死區(qū)和不確定擾動(dòng)的姿態(tài)高精度跟蹤。文獻(xiàn)[175] 考慮了多個(gè)控制力矩陀螺多種故障發(fā)生的工況,采用深度神經(jīng)網(wǎng)絡(luò)建立了自適應(yīng)容錯(cuò)控制架構(gòu),實(shí)現(xiàn)了高精度的容錯(cuò)控制。針對(duì)控制性能的優(yōu)化,Liu等[176]針對(duì)組合航天器的姿態(tài)跟蹤,基于 Q-learning 的方法實(shí)現(xiàn)利用離線數(shù)據(jù)學(xué)習(xí)的控制器設(shè)計(jì)。在文獻(xiàn)[177] 中,使用深度神經(jīng)網(wǎng)絡(luò)替代傳統(tǒng)的 PID 算法設(shè)計(jì)姿態(tài)跟蹤控制器,并利用遺傳算法進(jìn)行網(wǎng)絡(luò)初始權(quán)值的選取,提升了智能算法的部署效率。Zhang等[178]設(shè)計(jì)了一種 PID-Guide TD3 的學(xué)習(xí)算法,用來(lái)訓(xùn)練航天器姿態(tài)控制器, 利用 PID 控制器作為引導(dǎo)訓(xùn)練,提高了傳統(tǒng) TD3 算法的離線學(xué)習(xí)效率。筆者團(tuán)隊(duì)[179-181]最近提出了一系列基于在線學(xué)習(xí)的在線強(qiáng)化學(xué)習(xí)控制策略,實(shí)現(xiàn)了航天器在線最優(yōu)姿態(tài)控制,并在半物理實(shí)驗(yàn)平臺(tái)上得到了驗(yàn)證。 限于篇幅,其他方法在這里不再介紹。 針對(duì)航天器姿態(tài)規(guī)劃與控制面臨的各類復(fù)雜約束,自主規(guī)劃與控制技術(shù)從滿足飛行任務(wù)需求出發(fā),從系統(tǒng)級(jí)、任務(wù)級(jí)的規(guī)劃,發(fā)展到設(shè)備級(jí)的精細(xì)化規(guī)劃與控制,在保障航天器安全與健康運(yùn)行、延長(zhǎng)航天器的在軌壽命具有顯著的學(xué)術(shù)價(jià)值和應(yīng)用前景。從當(dāng)前的研究進(jìn)展和需要解決的問(wèn)題來(lái)看,建議多約束姿態(tài)規(guī)劃與控制技術(shù)在未來(lái)研究的發(fā)展方向?yàn)槿缦聨追矫妫?/p> 1) 復(fù)雜不確定環(huán)境下多約束多目標(biāo)在線姿態(tài)規(guī)劃技術(shù) 傳統(tǒng)規(guī)劃方法大多是在任務(wù)執(zhí)行前,根據(jù)航天器初始姿態(tài)和目標(biāo)姿態(tài),預(yù)先規(guī)劃出一條可行軌跡。然而,航天器在執(zhí)行空間對(duì)抗、深空探測(cè)等任務(wù)的過(guò)程中,復(fù)雜不確定的飛行環(huán)境、突發(fā)事件造成的任務(wù)目標(biāo)改變等因素會(huì)導(dǎo)致預(yù)先規(guī)劃難以正常執(zhí)行。所以,需要研究復(fù)雜不確定環(huán)境下的在線快速重規(guī)劃方法,以快速應(yīng)對(duì)預(yù)先規(guī)劃失效的問(wèn)題,在保證航天器在軌飛行安全的前提下盡可能地完成任務(wù)目標(biāo)。另一方面,隨著空間任務(wù)日趨復(fù)雜,姿態(tài)規(guī)劃問(wèn)題逐漸由傳統(tǒng)單目標(biāo)運(yùn)動(dòng)規(guī)劃向多約束多目標(biāo)運(yùn)動(dòng)規(guī)劃發(fā)展,需要考慮執(zhí)行時(shí)間、能量消耗等性能指標(biāo),且面臨的約束更加復(fù)雜,除了常見(jiàn)的靜態(tài)硬約束外,還可能存在動(dòng)態(tài)軟約束(如時(shí)變指向約束、進(jìn)入禁止區(qū)的時(shí)長(zhǎng)限制)等。因此,考慮靜態(tài)硬約束、動(dòng)態(tài)軟約束等復(fù)雜多約束,并綜合各性能指標(biāo),研究復(fù)雜不確定環(huán)境下的多約束多目標(biāo)在線姿態(tài)規(guī)劃技術(shù)是未來(lái)值得探討的問(wèn)題。 2) 控制系統(tǒng)能力退化下的柔性任務(wù)重構(gòu)與多約束姿態(tài)控制一體化技術(shù) 當(dāng)一個(gè)或多個(gè)執(zhí)行機(jī)構(gòu)發(fā)生完全失效、卡死等嚴(yán)重故障時(shí),會(huì)導(dǎo)致航天器姿態(tài)控制系統(tǒng)能力退化,甚至導(dǎo)致系統(tǒng)由過(guò)/全驅(qū)動(dòng)系統(tǒng)變?yōu)榍夫?qū)動(dòng)系統(tǒng),嚴(yán)重影響了既定空間任務(wù)的順利執(zhí)行以及航天器在復(fù)雜環(huán)境下的運(yùn)行安全。已有成果大多假設(shè)在執(zhí)行機(jī)構(gòu)故障條件下,姿態(tài)控制系統(tǒng)仍是過(guò)/全驅(qū)動(dòng)的,并側(cè)重于保證系統(tǒng)的穩(wěn)定性和穩(wěn)態(tài)性能,而對(duì)故障下的系統(tǒng)剩余驅(qū)動(dòng)能力量化分析的研究尚不多見(jiàn)。從工程的角度來(lái)看,控制系統(tǒng)能力退化可能會(huì)導(dǎo)致既定的任務(wù)無(wú)法完成,需要進(jìn)行在線任務(wù)重構(gòu)(如任務(wù)降級(jí)等),以確保控制系統(tǒng)的剩余驅(qū)動(dòng)能力能夠順利完成任務(wù)。另一方面,控制系統(tǒng)能力下降,尤其是導(dǎo)致系統(tǒng)欠驅(qū)動(dòng)的情況,會(huì)顯著減小航天器姿態(tài)機(jī)動(dòng)路徑的可行空間,給多約束姿態(tài)規(guī)劃與控制設(shè)計(jì)帶來(lái)了巨大挑戰(zhàn),目前鮮有這方面的研究。因此,亟需開(kāi)展控制系統(tǒng)能力退化下的柔性任務(wù)重構(gòu)與多約束姿態(tài)控制一體化關(guān)鍵技術(shù)研究,突破控制系統(tǒng)能力量化評(píng)估、柔性任務(wù)重構(gòu)、欠驅(qū)動(dòng)系統(tǒng)姿態(tài)可行空間與能控性分析等關(guān)鍵技術(shù),重點(diǎn)解決欠驅(qū)動(dòng)系統(tǒng)的多約束姿態(tài)規(guī)劃與控制難題。 3) 基于“數(shù)字孿生 + 深度強(qiáng)化學(xué)習(xí)”的多約束姿態(tài)規(guī)劃與控制技術(shù) 隨著計(jì)算機(jī)硬件算力的顯著提升,考慮到空間環(huán)境復(fù)雜、未知因素多等特點(diǎn),以深度強(qiáng)化學(xué)習(xí)為代表的人工智能技術(shù)應(yīng)用于規(guī)劃與控制也將是必然的趨勢(shì)。然而,這類方法大多是探索驅(qū)動(dòng)的,即需要通過(guò)積累大量的“動(dòng)作-反饋”數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,從而形成最佳策略。但是,對(duì)于空間任務(wù)來(lái)說(shuō),考慮到在軌燃料稀缺、安全性以及部件壽命,航天器不能進(jìn)行大量的“反復(fù)試錯(cuò)”,無(wú)法獲取豐富的經(jīng)驗(yàn)數(shù)據(jù)。數(shù)字孿生技術(shù)的出現(xiàn)為這一問(wèn)題提供了解決思路。數(shù)字孿生可將航天任務(wù)中的復(fù)雜環(huán)境和航天器系統(tǒng)進(jìn)行數(shù)字化鏡像,從而對(duì)約束場(chǎng)景、執(zhí)行機(jī)構(gòu)、傳感器等虛擬映射,進(jìn)而實(shí)現(xiàn)環(huán)境模擬,約束演化,故障的預(yù)測(cè)診斷等。因此,利用數(shù)字孿生技術(shù)可以讓智能算法積累與真實(shí)環(huán)境近乎相同的“探索經(jīng)驗(yàn)”,并根據(jù)傳感的數(shù)據(jù)實(shí)時(shí)更新孿生模型。通過(guò)“數(shù)字孿生 + 人工智能”的模式,實(shí)現(xiàn)數(shù)據(jù)模型混合驅(qū)動(dòng)的多約束在線規(guī)劃與控制必將是今后發(fā)展的重要方向。 4) 基于合作博弈強(qiáng)化學(xué)習(xí)的細(xì)胞衛(wèi)星姿態(tài)接管控制技術(shù) 隨著微小衛(wèi)星技術(shù)的發(fā)展,以利用多個(gè)細(xì)胞衛(wèi)星附著在失效航天器上實(shí)施接管控制為代表的技術(shù),為航天器的在軌維護(hù)提供了新的發(fā)展方向。在細(xì)胞衛(wèi)星附著組合后,航天器具有冗余的執(zhí)行機(jī)構(gòu)和較高的可靠性。為了使各個(gè)細(xì)胞衛(wèi)星能夠協(xié)調(diào)控制并使得控制的代價(jià)消耗最小,對(duì)于每個(gè)細(xì)胞衛(wèi)星來(lái)說(shuō)都是一個(gè)合作博弈的過(guò)程,即“付出最小的單體代價(jià),實(shí)現(xiàn)整體最優(yōu)目標(biāo)”。而傳統(tǒng)的控制技術(shù)難以應(yīng)對(duì)這一需求。基于微分博弈的合作控制策略是實(shí)現(xiàn)這一任務(wù)的解決方案??紤]到細(xì)胞衛(wèi)星附著后的組合體質(zhì)量特性未知,且多體博弈控制所轉(zhuǎn)化而成的數(shù)值優(yōu)化問(wèn)題較為復(fù)雜,難以利用已有基于模型的數(shù)值求解工具進(jìn)行求解。而以自適應(yīng)動(dòng)態(tài)規(guī)劃為代表的強(qiáng)化學(xué)習(xí)技術(shù)為這一新興任務(wù)提供了解決途徑。因此,研究基于強(qiáng)化學(xué)習(xí)的合作博弈控制技術(shù)是面向細(xì)胞衛(wèi)星接管控制為代表的新興航天任務(wù)的技術(shù)基礎(chǔ),也是未來(lái)航天器在軌服務(wù)技術(shù)發(fā)展的新方向。 5) 多約束下的航天器編隊(duì)飛行分布式協(xié)同規(guī)劃與控制技術(shù) 近年來(lái),隨著星載計(jì)算、通信、傳感等技術(shù)的迅猛發(fā)展,利用多顆小型衛(wèi)星構(gòu)成一個(gè)大規(guī)模的航天器編隊(duì)系統(tǒng),并通過(guò)無(wú)線通信與感知形成特定的構(gòu)型進(jìn)行自主協(xié)同飛行,協(xié)作地完成傳統(tǒng)大型單航天器無(wú)法完成的大孔徑、長(zhǎng)基線等新興空間探測(cè)和成像任務(wù),已成為航天技術(shù)發(fā)展的新趨勢(shì)。相比于單航天器系統(tǒng),編隊(duì)系統(tǒng)具有研發(fā)周期短、適用性強(qiáng)、容錯(cuò)性高等特點(diǎn),以及快速的空間響應(yīng)能力和空間攻防對(duì)抗下的空間任務(wù)保護(hù)與生存能力,在科學(xué)研究、國(guó)民經(jīng)濟(jì)以及國(guó)防建設(shè)等領(lǐng)域發(fā)揮著至關(guān)重要的作用。在編隊(duì)系統(tǒng)運(yùn)行的過(guò)程中,各航天器之間需要保持通信并避免碰撞,這給協(xié)同規(guī)劃與控制算法設(shè)計(jì)帶來(lái)了復(fù)雜約束,同時(shí)空間環(huán)境往往是高動(dòng)態(tài)的,任務(wù)也可能是變化的,這都對(duì)規(guī)劃和控制算法的在線適應(yīng)能力提出了更高的要求。另外,編隊(duì)飛行任務(wù)可能會(huì)發(fā)生一個(gè)或多個(gè)成員故障或損毀、新航天器補(bǔ)充等情況,這對(duì)編隊(duì)系統(tǒng)的任務(wù)協(xié)同、編隊(duì)飛行安全以及通信拓?fù)鋷?lái)了巨大挑戰(zhàn)?,F(xiàn)有的編隊(duì)系統(tǒng)協(xié)同規(guī)劃與控制方法大多沒(méi)有考慮復(fù)雜約束條件,且大多采用集中式處理方式,具有實(shí)時(shí)性差、響應(yīng)慢、一致性差等缺陷。因此,亟需突破現(xiàn)有局限,設(shè)計(jì)具有強(qiáng)約束處理能力的航天器編隊(duì)分布式協(xié)同規(guī)劃與控制技術(shù)、成員故障或損毀下的“任務(wù)重規(guī)劃-編隊(duì)構(gòu)型重構(gòu)”一體化在線規(guī)劃與控制技術(shù)等,保證多約束下的航天器編隊(duì)系統(tǒng)飛行安全和穩(wěn)定性。 隨著航天器自主規(guī)劃與控制技術(shù)的不斷發(fā)展以及在深空探測(cè)、在軌服務(wù)等一系列航天任務(wù)的成功應(yīng)用,極大提升了航天器的自主性和智能化水平。多約束姿態(tài)規(guī)劃與控制技術(shù)是保證航天器在復(fù)雜空間環(huán)境下穩(wěn)定可靠運(yùn)行并安全實(shí)施各類空間任務(wù)的關(guān)鍵,因此受到了廣泛的關(guān)注與深入的研究。本文在總結(jié)航天器姿態(tài)機(jī)動(dòng)任務(wù)所面臨的各類約束的基礎(chǔ)上,梳理了現(xiàn)有航天器多約束姿態(tài)規(guī)劃與控制方法的設(shè)計(jì)思路,并對(duì)各方法的優(yōu)缺點(diǎn)和部分代表成果進(jìn)行了綜述。最后,面向航天任務(wù)未來(lái)需求,給出了航天器多約束姿態(tài)規(guī)劃與控制技術(shù)的發(fā)展方向。1.4 廣義約束
2 多約束姿態(tài)規(guī)劃方法
2.1 幾何方法
2.2 勢(shì)函數(shù)方法
2.3 離散化方法
2.4 基于隨機(jī)規(guī)劃算法的姿態(tài)規(guī)劃方法
2.5 基于數(shù)值優(yōu)化的姿態(tài)規(guī)劃方法
2.6 基于人工智能的姿態(tài)規(guī)劃方法
3 航天器姿態(tài)控制方法
3.1 航天器姿態(tài)自適應(yīng)控制
3.2 航天器姿態(tài)抗干擾控制
3.3 航天器姿態(tài)容錯(cuò)控制
3.4 航天器姿態(tài)預(yù)設(shè)性能控制
3.5 其他航天器姿態(tài)控制方法
4 發(fā)展趨勢(shì)
5 結(jié) 論