亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        航天器多約束姿態(tài)規(guī)劃與控制:進展與展望綜述

        2022-11-05 04:18:40胡慶雷邵小東楊昊旸段超
        航空學報 2022年10期
        關鍵詞:姿態(tài)控制執(zhí)行機構航天器

        胡慶雷,邵小東,楊昊旸,段超

        1. 北京航空航天大學 自動化科學與電氣工程學院,北京 100191 2. 北京航空航天大學 杭州創(chuàng)新研究院(余杭),杭州 311100 3. 北京航空航天大學 航空科學與工程學院,北京 100191

        姿態(tài)控制系統(tǒng)作為航天器最為重要的分系統(tǒng)之一,是航天器實現高精度高穩(wěn)定度姿態(tài)調整的保障,對空間任務的順利實施尤為關鍵。航天器的姿態(tài)控制系統(tǒng)主要由以下4部分組成[3]:測量單元、規(guī)劃單元、控制單元和執(zhí)行機構,如圖1所示。測量單元利用星載姿態(tài)和角速度測量敏感器(如星敏感器、速率陀螺等)實時監(jiān)測航天器運動信息并反饋給規(guī)劃和控制單元,規(guī)劃單元則根據航天任務需求規(guī)劃出任務軌跡并生成相應的控制指令,隨后控制環(huán)節(jié)根據這些指令輸出控制信號,通過驅動執(zhí)行機構實現航天器穩(wěn)定飛行或跟蹤制導指令。強自主、高可靠、高精度的姿態(tài)規(guī)劃與控制技術是保證航天器在復雜空間環(huán)境下穩(wěn)定可靠運行并安全實施空間任務的關鍵。

        航天器在軌執(zhí)行姿態(tài)機動時往往會面臨復雜的約束,本文將這些約束分為 4 大類。第 1 類為狀態(tài)約束,主要包括空間指向約束和角速度約束[4-5],而且空間指向約束又細分為禁止指向約束和強制指向約束[6]。禁止指向約束源于星載光學敏感載荷(如紅外望遠鏡、激光干涉儀等)應避免直接指向太陽、月亮等光亮目標,以防止光線影響觀測[7]。例如,紅外天文學衛(wèi)星(Infrared Astronomical Satellite, IRAS)要求搭載的紅外望遠鏡的指向與太陽方向的夾角不小于60°以防止光線直射,使其能夠工作在紅外觀測所需的低溫環(huán)境下。JWST、Hubble 望遠鏡、紅外空間天文臺(Infrared Space Observatory, ISO)以及 Cassini 號深空探測器也都存在類似的禁止指向約束[8]。強制指向約束的場景是承擔中繼通信、深空探測和編隊飛行等任務的航天器需要保持天線對準地面站或鄰居航天器,以穩(wěn)定地維持通信鏈路[9]。角速度約束源于速率陀螺、星敏感器等角速度傳感器的量程有限,要求航天器的角速度必須維持在特定的范圍內,例如美國的 X 射線計時探測器(X-ray Timing Explorer, XTE)[10]。第 2 類為物理約束,包括執(zhí)行機構輸出幅值和速率約束,主要源于反作用飛輪、控制力矩陀螺等姿控執(zhí)行機構的有限輸出能力[11]。第 3 類為任務性能約束,包括時間和能耗約束,其中時間約束主要是由任務時間窗口造成的[12],而能耗約束則是源于航天器所攜帶的工質燃料有限,且其所配備的電能生產和存儲設備有限[13]。規(guī)劃環(huán)節(jié)需要重點考慮前述 3 類約束。第 4 類為廣義約束,主要包括參數不確定性、多源干擾、執(zhí)行機構故障、暫穩(wěn)態(tài)性能以及測量信息不完備等,這些約束都嚴重影響了航天器安全、姿態(tài)控制精度及穩(wěn)定度,在姿態(tài)控制器設計中需要對這些約束進行考慮,才能從穩(wěn)定性和安全性角度保證航天器姿態(tài)控制系統(tǒng)的正常工作。綜上所述,研究復雜約束下的航天器姿態(tài)規(guī)劃與控制新理論與新方法,是當前航天器控制領域的前沿熱點方向,已成為進一步提升航天器智能自主性、安全可靠性和任務執(zhí)行能力的核心關鍵,具有重要的現實意義。

        本文基于課題組前期研究成果,并參閱國內外知名團隊和學者的部分代表性工作,總結和梳理了現有航天器多約束姿態(tài)規(guī)劃與控制方法的研究思路和優(yōu)缺點,并給出了未來發(fā)展建議,希望對從事相關研究的同行學者和工程人員提供一定的參考。航天器多約束姿態(tài)規(guī)劃與控制技術經過20多年的發(fā)展,算法研究仍方興未艾,尤其是結合人工智能等前沿技術的新成果近年來更是層出不窮,論文未能提及之處,敬請諒解。

        1 約束分析與表征

        正如引言中所分析,在航天器執(zhí)行在軌任務的過程中,姿態(tài)系統(tǒng)面臨著多種約束。在針對這些約束設計安全的規(guī)劃和控制算法之前,需要首先針對這些約束進行分析并利用適當的數學表達式來刻畫。本節(jié)將對狀態(tài)約束、物理約束、任務性能約束以及廣義約束進行分析與表征。其中前 3 類約束主要面向姿態(tài)規(guī)劃算法設計,而廣義約束則主要是面向姿態(tài)控制器設計。

        1.1 狀態(tài)約束

        1.1.1 空間指向約束

        在軌飛行任務中,由于星上載荷保護和通信保障等原因,航天器的姿態(tài)將受限于特定的指向空間中,這使得航天器姿態(tài)機動路徑的可行空間大大減小,因此分析姿態(tài)指向約束的形成原理及其分類具有重要的實際工程指導意義。本文所考慮的指向約束可以分為 2 大類[6]:禁止指向約束和強制指向約束。

        1) 禁止指向約束

        (1)

        (2)

        (3)

        (4)

        (5)

        2) 強制指向約束

        (6)

        同樣的,也可以用修正羅德里格斯參數和單位四元數的形式表述:

        (7)

        qTMfq≤0

        (8)

        上述對于指向約束的描述是以傳感器視線場約束為圓錐體,而實際的傳感器視線場約束區(qū)有可能為臺體等形狀,對于這一類多面體的約束在工程上也往往以其外包絡圓錐(或內切圓錐)進行描述以便于實現。

        本節(jié)的分類是根據約束區(qū)域的進入和逃出劃分的,除此之外還可以根據約束區(qū)域的時變性分為動態(tài)指向約束和靜態(tài)指向約束。而且還可根據約束所承受的嚴格程度分為硬約束和軟約束,前者是在全過程中都要滿足的約束,而后者則為時間積分約束,當其積分值小于某個指標值時不產生約束效果,當大于指標值時,該約束轉變?yōu)橛布s束。在一些復雜的任務場景中,上述2種約束可能同時存在,且往往是動靜、軟硬并存的,這種更為復雜的約束情況會給航天器的規(guī)劃與控制系統(tǒng)帶來了更大的挑戰(zhàn)。

        1.1.2 角速度約束

        以光纖陀螺為代表的角速度測量儀器,往往存在著測量范圍的限制[10],因此需要保證航天器的角速度ω=[ω1,ω2,ω3]T∈3的3個分量都需要在量程范圍ωR內,數學表示為

        |ωi|≤ωRi=1,2,3

        (9)

        對于以星敏感器為代表的姿態(tài)測量儀器在軌工作時需要保證整體的轉動角速率不能過大以保證光學測量系統(tǒng)能正常捕獲定位,同時也考慮到航天器本身的部件結構強度在轉動過程中不會被甩出,因此在姿態(tài)機動的過程中的角速度必須保持在星體可承受的上限ωM內[15]。這類角速度約束可以由如下不等式描述:

        (10)

        1.2 物理約束

        1) 執(zhí)行機構幅值飽和

        航天器姿態(tài)控制系統(tǒng)常見的執(zhí)行機構主要包括:推力器、反作用飛輪、控制力矩陀螺、磁力矩器等[16]。盡管這些執(zhí)行機構的工作原理有所不同,但它們的輸出幅值均受限。鑒于此,在姿態(tài)規(guī)劃和控制算法設計時,控制輸入τ∈N(N為執(zhí)行機構的數量)需要滿足如下約束:

        |τi|≤τMi=1,2,…,N

        (11)

        式中:τM>0為幅值限制。

        2) 執(zhí)行機構速率飽和

        除了輸出幅值限制,由于執(zhí)行機構自身響應機理等原因,其輸出力矩的變化率也受限,具體可描述為如下不等式[11]:

        (12)

        式中:sM>0為速率幅值限制。

        1.3 任務性能約束

        對于某些航天器姿態(tài)機動任務,機動時間和能量消耗是重要的任務性能指標,為規(guī)劃算法的設計引入了相應的約束。

        1.3.1 任務時間約束

        考慮到一些在軌觀測任務(如重要目標的偵察等),其存在最佳的觀測窗口[12],需要在最佳觀測窗口開始之前使航天器機動到特定的指向范圍內,可以描述為如下時間約束:

        0

        (13)

        式中:Tf為姿態(tài)機動過程所用時間;Tw為當前時間距離任務最佳觀測窗口開始的時間。

        1.3.2 能量消耗約束

        在軌航天器不僅所攜帶的工質燃料不多,其所配備的電能生產和存儲設備也是有限的。因此在姿態(tài)機動過程中執(zhí)行機構所消耗的燃料也會受到限制。

        對于使用推力裝置的航天器而言,其能量消耗以工質燃料的質量減少來計算,其過程可表示為[17]

        (14)

        式中:mF為最大工質燃料消耗質量限制;fk為每個推力器產生的推力;NT為推力器的數量;Isp為推力器的比沖系數;g0為重力系數。

        對于使用電機作為動量交換裝置進行姿態(tài)機動的任務而言,其能量消耗以電機消耗的能量來計算,其過程可表示為[13]

        (15)

        式中:E為本次任務可消耗的最大電能;Nτ為電機的數量;Pi為每個電機的瞬時功率,可以由如式(16)計算:

        (16)

        其中:τi為每個電機的輸出力矩;Ωi為每個電機的轉速;KT、Rm、βm分別表示電機的扭矩系數、電樞電阻、黏滯摩擦系數。

        在姿態(tài)機動任務中,往往不是由單一種類執(zhí)行機構實現的,在考慮混合執(zhí)行機構的能量消耗時,可綜合考慮式(14)和式(15)來處理。

        上述2點闡述的性能約束主要是考慮時間或者能耗小于一個確切的值。但是,在大多數姿態(tài)控制系統(tǒng)的設計中,往往將它們作為優(yōu)化的性能指標綜合處理。在數學上可以表示為如下的性能指標最優(yōu):

        (17)

        式中:Q(e)為關于狀態(tài)誤差e的代價函數;R(u)為關于控制輸入u的代價函數。前者在物理意義上即對應為任務完成時間的指標,后者則對應能量消耗的代價。在姿態(tài)控制系統(tǒng)設計中,通過調節(jié)兩者的權重大小,即可根據實際的任務需求調整性能指標。

        1.4 廣義約束

        將參數不確定性、多源干擾、執(zhí)行機構故障、暫穩(wěn)態(tài)性能約束、測量信息不完備等歸結為廣義約束。這些約束主要影響軌跡規(guī)劃后的跟蹤控制器設計。下面將對各類廣義約束進行簡要介紹和數學描述。

        1.4.1 參數不確定性

        航天器在軌運行期間,載荷運動、工質及燃料消耗、目標抓捕等因素不可避免地會導致慣量參數存在不確定性。對于時變的慣量參數,可以將其寫成如下形式[18]:

        J=J0+ΔJ

        (18)

        式中:J0∈3×3為名義的慣量矩陣;ΔJ∈3×3為慣量矩陣的不確定部分。針對這一情況,通??蓪⒆藨B(tài)動力學中的ΔJ相關項集總到系統(tǒng)干擾中,并應用抗干擾控制方法對其進行處理。對于不變/慢變的慣量參數,可將動力學方程中關于J的函數項進行如下仿射線性化處理:

        Jx=L(x)θ?x∈3

        (19)

        其中:θ=[J11,J22,J33,J12,J13,J23]T代表未知參數向量;L(x):3→3×6為已知的回歸矩陣。針對線性回歸式(19),可設計自適應律對未知參數θ進行在線估計[19]。

        1.4.2 多源干擾

        航天器在軌運行不可避免地會受到外部環(huán)境干擾力矩(包括重力梯度力矩、太陽光壓和輻射力矩、氣動力矩、地磁力矩等)以及內部非環(huán)境干擾力矩(包括系統(tǒng)建模誤差、執(zhí)行機構安裝偏差、撓性部件振動等)的影響,這些內外部干擾力矩形成了多源異質的干擾因素,極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。文獻[20] 詳細分析了各類環(huán)境干擾力矩的特性以及對航天器姿態(tài)的影響,并提供了相應的數學模型,這里不再贅述。對于系統(tǒng)建模誤差、執(zhí)行機構安裝偏差等內部擾動,一般對它們不進行精細化建模,而將它們視為外部干擾。這里重點描述撓性部件振動??紤]撓性航天器的動力學方程[21]:

        (20)

        (21)

        式中:ω∈3為航天器的角速度;J∈3×3為航天器的慣量矩陣;τ∈3和τd∈3為控制和干擾力矩;η∈n為模態(tài)向量;δ∈n×3為耦合矩陣;D=diag{2ξ1w1,2ξ2w2,…,2ξnwn}和分別代表阻尼和剛性矩陣,ξi∈和wi∈(i=1,2,…,n)分別為阻尼比和模態(tài)頻率。

        需要指出的是,為便于設計現有抗干擾控制方法大多將內外多源干擾以及第1.4.3節(jié)提到的加性偏差故障歸結為總干擾,并加以處理。

        1.4.3 執(zhí)行機構故障

        航天器長時間運行在高低溫、強輻射的惡劣太空環(huán)境中,執(zhí)行機構(如推力器、反作用飛輪等)因需要頻繁工作,極易發(fā)生故障。執(zhí)行機構故障輕則導致姿態(tài)控制性能下降,重則造成系統(tǒng)失穩(wěn)。通過分析故障對姿態(tài)控制系統(tǒng)的影響,可將執(zhí)行機構故障分為以下4類[22]:

        1) 控制輸出減?。河捎陔姎狻C械等原因導致執(zhí)行機構的實際輸出力矩小于控制指令。

        2) 輸出力矩偏移:由于執(zhí)行機構的結構原因和外部不確定性,其實際輸出力矩在指令控制的基礎上產生了附加偏移力矩。

        3) 執(zhí)行機構卡死:由于執(zhí)行機構部件損壞或部分失效(如:噴氣推力裝置的節(jié)流閥泄漏等情況),導致其輸出為某一不為零的常值。

        4) 對控制信號無響應:由于電路、電源失效或機械結構損毀,導致執(zhí)行機構不能響應控制指令,實際的輸出為零。

        為對1)~4)類故障進行建模,可將執(zhí)行機構的實際輸出力矩改寫為如下形式:

        τ=Euc+ud

        (22)

        式中:E=diag{e1,e2,…,eN}(0≤ei≤1)代表故障因子矩陣;uc∈N為控制力矩指令;ud∈N為加性偏差故障。

        1.4.4 暫穩(wěn)態(tài)性能約束

        深空探測、在軌服務與維護以及空間對抗等新一代航天任務對航天器姿態(tài)控制提出了更高的性能要求,主要體現在以下幾個方面:

        1) 完成時間:由于任務時間緊,要求航天器在規(guī)定時間內完成給定的姿態(tài)機動任務,即ts≤T,其中ts表示系統(tǒng)的穩(wěn)定時間,T>0為規(guī)定的任務時間。典型的例子是非合作目標在軌捕獲要求在服務航天器進入陰影區(qū)前完成,否則視覺傳感器將無法為捕獲操作提供相對導航信息。

        2) 最大超調:超調量是衡量系統(tǒng)動態(tài)性能的重要指標,姿態(tài)控制的最大超調一般不能超過規(guī)定的值,即(xmax-x∞)/x∞≤om,其中xmax代表瞬時最大偏差值,x∞代表輸出穩(wěn)態(tài)值,om為最大可允許的超調量。例如,航天器在對滿足禁止指向約束的姿態(tài)軌跡進行跟蹤的過程中,為避免光學敏感器的視線軸進入禁止區(qū)域,要求跟蹤誤差無超調。

        3) 穩(wěn)態(tài)誤差:穩(wěn)態(tài)誤差是衡量控制系統(tǒng)穩(wěn)態(tài)性能的重要指標,為了確保航天器高品質地完成指定任務,要求姿態(tài)和角速度收斂到期望值附近的可接受范圍內,即穩(wěn)態(tài)誤差界,數學上可描述為ess≤em,其中ess代表穩(wěn)態(tài)誤差,em為穩(wěn)態(tài)誤差上界。通常,穩(wěn)態(tài)誤差界可根據星載敏感器的測量精度來設定。

        上述性能要求對姿態(tài)控制系統(tǒng)施加了嚴格的暫穩(wěn)態(tài)性能約束。

        1.4.5 測量信息不完備

        對于一些小型航天器(如立方衛(wèi)星、微納衛(wèi)星等),由于所能容納的載荷成本、體積、重量和功率有限,往往沒有安裝能夠直接測量角速度的敏感元件,因此對于控制系統(tǒng)設計來說,得到的狀態(tài)反饋只有姿態(tài)信息。上述的測量信息受限的問題可以由如下測量方程表述:

        y=Hx+w

        (23)

        式中:y∈m為測量信息;H∈m×(m+3)為測量矩陣;x∈m+3表示由姿態(tài)和角速度整合的運動狀態(tài)向量,當姿態(tài)由四元數表示時m=4,由 MRPs 或者歐拉角表示時m=3;w∈m為傳感器測量中引入的干擾噪聲。需要指出的是,對于控制器而言,其接收到的反饋信號為m維,小于被控狀態(tài)的(m+3)維。

        2 多約束姿態(tài)規(guī)劃方法

        為滿足深空探測、在軌服務等新型航天任務日益提升的需求,航天器需要搭載越來越多的高精度載荷與設備。為此,姿態(tài)規(guī)劃算法設計不但需要考慮既定的任務目標與任務性能約束,還應當兼顧在任務執(zhí)行過程中由載荷、執(zhí)行機構等設備引入的各種狀態(tài)和物理約束。例如,ISO 衛(wèi)星設計了使載荷規(guī)避地球熱輻射源的機動策略,避免對探測結果造成影響[23];Cassini 號深空探測器要求具備姿態(tài)規(guī)避機制以保護配置的傳感器受到太陽照射[24];太陽能電池陣列需指向太陽,保證電力供應;XTE 衛(wèi)星要求機動速度不超過速度陀螺儀的測量上限等。因此,研究多約束自主姿態(tài)規(guī)劃方法,使航天器的姿態(tài)能夠沿著一條滿足約束的軌跡運動,盡可能地避免對設備載荷的損傷,從而有效地延長航天器壽命,是一項亟需解決的關鍵技術。

        現有的多約束自主規(guī)劃方法可大致分為幾何方法、基于勢函數的方法、空間離散化方法、隨機采樣方法、基于優(yōu)化的方法與智能規(guī)劃方法6類。這些方法能夠處理的約束類型、軌跡尋優(yōu)能力、以及計算復雜度有所不同,表1 簡要總結了 6 種方法對指向約束、角速度約束與執(zhí)行機構飽和的處理能力。圖4 給出了方法關于尋優(yōu)能力與計算復雜度的遞進關系,本文也將著重在這些方面對現有多約束規(guī)劃方法進行分析。

        表1 不同規(guī)劃方法約束處理能力對比Table 1 Comparison of constraint-handling capability of different planning methods

        2.1 幾何方法

        通過建立敏感器視線指向與特定指向之間的幾何關系,傳統(tǒng)幾何方法能夠有效應對姿態(tài)指向約束。一般來說,傳統(tǒng)幾何方法首先在無約束環(huán)境下,設計一種能夠準確驅動航天器從起點到期望姿態(tài)的最優(yōu)控制策略,而后在空間內尋找一個中間姿態(tài),使得無約束的控制策略能夠直接應用于兩段路徑,并且不違反任何的約束。幾何方法設計簡單,且能夠獲得解析的姿態(tài)規(guī)劃策略,在計算效率上具有顯著的優(yōu)勢。

        針對太陽、異常和磁層粒子探測器 (Solar, Anomalous, and Magnetospheric Particle Explorer, SAMPEX),Frakes等[25]研究了探測器規(guī)避星體速度方向的方法,降低了空間碎片與微流星體對微粒子探測精度的影響。同時,考慮對明亮天體規(guī)避與對地通訊保持約束,Hablani[9]提出了2種替代最小旋轉路徑的機動方案,使得視線軸能夠相切地通過禁止區(qū),并基于其中一種方案進一步設計了天線指向策略。針對欠驅動航天器,文獻[26-27] 利用非標準歐拉軸角參數,將欠驅動約束描述可行驅動軸與欠驅動軸的垂直幾何關系;進一步提出了兩種兩步相切姿態(tài)機動策略,實現了視線軸對某個指向約束區(qū)域的規(guī)避。針對空間內多個錐形約束,徐瑞等[28]提出了有效路徑約束的檢測方法;通過將有效三維指向約束投影到二維平面,導出了滿足約束的中間姿態(tài)的解析解??紤]太陽規(guī)避約束,Ayoubi 和 Hsin[7]提出了一種新型最優(yōu)幾何規(guī)劃策略。

        意大利Biggs團隊針對連續(xù)時間系統(tǒng)的幾何最優(yōu)控制問題,取得了一系列重要成果[31-33]。Biggs 和 Colley[31]提出了一種基于特殊正交群(Special Orthogonal group, SO(3))的半解析最優(yōu)規(guī)劃策略,通過優(yōu)化權重因子與控制參數,可實現對系統(tǒng)軌跡和控制幅值的限制。利用ε截面曲率的連通曲面的標架叢,Henninger 和 Biggs[32]將最優(yōu)規(guī)劃問題轉化為兩點邊值問題,導出了基于拉克斯對(Lax pair)的解析解。結合人工勢函數方法與滑模控制,Geng等[33]提出了一種基于對偶單位群的姿態(tài)控制律,獲得了滑動階段系統(tǒng)軌跡的解析形式,而后通過對系統(tǒng)初值與控制參數的整定,可以按需地改變系統(tǒng)軌跡的曲率,從而實現障礙規(guī)避。

        另一方面,國內外學者研究了航天器動力學系統(tǒng)的幾何離散化方法。針對受頻率約束與點約束的李群系統(tǒng),Kotpalliwar 等[34]研究了離散形式的龐特里亞金原理最優(yōu)條件。李益群等[35]提出了一種基于李群譜配點法的航天器姿態(tài)仿真方法。文獻[36] 提出了將變分積分子與譜方法通過伽遼金方法與打靶法結合的方法,在很好地保持了系統(tǒng)幾何結構(辛結構、李群結構等)和物理特性(動量、能量等)的同時,不降低譜方法原有的收斂速度和計算效率。

        由以上的研究結果可以看出,幾何規(guī)劃方法能夠獲得解析或半解析的最優(yōu)姿態(tài)機動路徑,在計算效率上具有明顯優(yōu)勢;能夠很好的保守群結構與物理特性,有利于數值計算。但是,幾何方法應對較多的約束時能力有限,并且能夠考慮的優(yōu)化指標相對單一。

        2.2 勢函數方法

        勢函數方法是一種處理運動學約束非常有效的方法,該方法的基本原理如圖6所示??紤]目標在一個人工勢場中運動,其中障礙物處于高勢能處,期望位置處于最低勢能處。只需根據當前位置勢能的負梯度方向設計控制力,就能實現目標遠離高勢能的障礙區(qū)域,驅向低勢能的期望平衡點?;趧莺瘮档目刂破鳠o需提前規(guī)劃完整的系統(tǒng)軌跡,具有良好的實時性。國內外眾多學者通過構造出形式多樣的勢函數形成特定的人工勢場,來實現不同系統(tǒng)動態(tài)性能。目前,常見的勢函數有指數函數(包括高斯函數)、二次型函數、對數函數、導航函數等。

        針對空間光亮天體指向,Mclnnes[37]采用無歧義的高斯函數建立障礙高勢能區(qū)域,結合轉動動能與姿態(tài)勢能的 Lyapunov 函數,提出了一種有界的姿態(tài)控制策略。Wisniewski和Kulczycki[38]基于四元數建立了哈密頓形式的姿態(tài)動力學方程,通過能量成型方法設計控制律,使得敏感指向為勢能高點,期望平衡點為唯一的勢能極小值點。針對航天器姿態(tài)規(guī)避問題,鄭重等[39]提出一種新型的高斯勢函數,保證了控制律的連續(xù)與有界。郭延寧等[40]提出了排斥勢函數存在的條件,避免了不必要的退繞問題;進一步針對控制受限,設計了自適應的反步跟蹤控制器,實現了控制幅值的在線自動調整??紤]多個空間內禁止區(qū)域與強制區(qū)域,美國 University of Washington 的 Lee 和 Mesbaihi[6,41]提出了一系列基于對數函數的勢函數方法,實現了控制律光滑性與近似全局收斂性,進而保證了多約束求解的可行性與穩(wěn)定性。崔祜濤和程小軍[42]考慮了輸入飽和與常值干擾下的姿態(tài)規(guī)避控制問題,利用導航函數避免了勢函數方法局部極小的問題,并采用輔助系統(tǒng)解決了輸入飽和的問題。

        此外,勢函數方法還能夠方便地處理角速度受限約束。針對靜止到靜止的航天器姿態(tài)機動問題,Shen等[43]利用滑模面變量設計了一種對數型勢函數,使得系統(tǒng)在臨近角速度限制邊界時具有極高的勢能。筆者團隊[4,44]分別考慮減小階姿態(tài)系統(tǒng)與不確定姿態(tài)系統(tǒng),通過設計角速度的對數勢函數,實現了角速度約束。

        筆者團隊基于勢函數方法解決了航天器姿態(tài)機動與近距離交會的問題。針對交會對接問題,Dong等[45]利用對偶四元數參數,設計了基于一種新型勢函數的姿軌控制律,能夠同時滿足視場約束與對接走廊約束。考慮多個姿態(tài)禁止約束,筆者團隊[14,46]提出了幾種基于對數型勢函數的姿態(tài)機動控制策略,克服了四元數的退繞問題;還針對航天器姿態(tài)機動問題,基于導航函數設計了系統(tǒng)的勢能函數,在避免將禁止約束轉化為凸約束的前提下,嚴格證明了勢函數的極小值點能夠無線趨近于系統(tǒng)的平衡點[47-48]。

        從以上分析可以看到,勢函數方法能夠有效處理多類型姿態(tài)約束,且不依賴于全局信息,可以實現動態(tài)的規(guī)劃。此外,勢函數方法能夠直接用于解析控制律設計,在計算實時性上具有明顯的優(yōu)勢。然而,勢函數方法通常會存在局部極小值問題,導致系統(tǒng)駐留在極小值點,不能實現既定的控制目標。

        2.3 離散化方法

        相比于前述方法共有的解析特征,下面主要介紹一系列數值優(yōu)化方法,它們對多種優(yōu)化指標具有更強的軌跡優(yōu)化能力,為多約束運動規(guī)劃問題求解提供了新思路。首先介紹一種離散化方法。這種方法利用多面體(比如立方體、二十面體)均勻離散化姿態(tài)單位球,將指向向量轉換為整數,建立起指向向量的拓撲結構;通過路徑規(guī)劃算法將約束集轉化為單位球上的像素點集;最后,定義一個關于路徑長度的代價函數,利用路徑搜索算法獲得最(次)優(yōu)路徑,這一過程如圖7所示。當得到期望的路徑之后,就形成了描述旋轉序列的一系列姿態(tài),可以進一步通過反饋控制器來實現期望的軌跡。

        目前,姿態(tài)單位球離散化的方法主要包括天立方算法(Cosmic Background Explorer,COBE)[49]、正二十面體算法[50-52]等。在 COBE 天立方算法的基礎上,Tegmark[50]提出了一種基于正二十面體的離散化方法。該方法相比于COBE天立方算法具有2方面優(yōu)勢:①用六邊形像素替代COBE天立方算法里的正方形像素,空間離散化需要更少的像素;②每個像素點有6個相似等距的鄰居,使得生成的軌跡更加光滑。針對 Bevo-2 或 ARMADILLO 立方星所攜帶的低等級光學儀器對強光的敏感,Kjellgerg和Lightsey[51-52]基于正二十面體離散化算法提出了滿足姿態(tài)指向約束與控制約束的路徑規(guī)劃方法。該方法將連續(xù)點離散為姿態(tài)單位球內接二十面體的正六邊形像素點,并采用 A*圖搜索算法搜尋可行路徑。但是該方法只能考慮單一敏感設備,缺乏多敏感設備軌跡規(guī)劃能力。針對這一問題,Tanygin[53-54]提出了 ARPs (Airy-Rodrigues Parameters)的定義以及一種新型最小形變投影,在新的參數下描述姿態(tài)約束并進行離散化,通過改進的 A*算法,實現了多路姿態(tài)的最優(yōu)路徑規(guī)劃。

        離散化方法具有明確的物理含義,在機器人運動規(guī)劃領域也得到了廣泛的應用。離散化方法能夠有效地處理姿態(tài)指向約束與控制約束,實現概率意義下的最短機動路徑。但是,離散化方法也具有明顯的缺點,一方面是依賴于離線求解的結構,另一方面是相比于解析的方法(幾何方法與勢函數方法),離散化方法的計算量較大,故而難以實現動態(tài)規(guī)劃,限制了其應用。

        2.4 基于隨機規(guī)劃算法的姿態(tài)規(guī)劃方法

        2.3節(jié)中基于空間離散化的規(guī)劃方法更適用于低維度空間上的路徑規(guī)劃問題,它在這類問題中往往具有較好的完備性,而且需要對環(huán)境進行完整的建模,并且在高維度空間中很容易導致現“維數災難”。為了解決這些問題,基于隨機采樣的規(guī)劃算法被提出來[55],這一方法以概率完備性來代替完備性,從而提高搜索效率,適用于高維度空間的規(guī)劃問題。這一類方法的主要原理是在可行的空間中隨機生成狀態(tài)點,然后找到一組可行的連通方式將這些狀態(tài)點連接得到一條規(guī)劃軌跡[56],具體過程如圖8中所示。

        利用隨機規(guī)劃算法的原理,許多學者也開展了航天器姿態(tài)機動規(guī)劃研究。美國麻省理工大學的Feron等[57]提出了一種基于快速擴展隨機樹(Rapidly exploring Random Tree, RRT)的隨機姿態(tài)規(guī)劃方法,并基于 Lyapunov 函數建立局部制導律,在多種類型的姿態(tài)約束下,實現了航天器大角度姿態(tài)指向路徑規(guī)劃。Yershova 和 Lavalle[58]提出了在旋轉矩陣空間上的確定性采樣算法,這種分辨率完備性的采樣方式為姿態(tài)隨機規(guī)劃算法的發(fā)展提出了嶄新的方向。利用確定性采樣方法來更換傳統(tǒng) RRT 算法中的完全隨機采樣方法,可以在一定程度上減少 RRT 算法所用時間。文獻[59-60] 將姿態(tài)描述從旋轉矩陣映射到羅德里格參數中進行姿態(tài)指向規(guī)劃,減小了變量維度、提高了規(guī)劃速度,但也造成了某些工況下的搜索范圍擴大。

        采用基于隨機算法的規(guī)劃方法的優(yōu)點是能夠解決各種類型的運動軌跡約束,利用基于概率的方法提高了計算效率。但是,正是因為采用了隨機概率的機制,所以這類方法只能在概率意義上規(guī)劃到期望狀態(tài)的附近。最終狀態(tài)的偏差也會隨著狀態(tài)圖中的頂點數的增加而指數收斂到零。而且與2.3節(jié)中離散化方法相似,這一類方法也難以滿足多個敏感軸的約束。同時,這類方法大多是規(guī)劃出一條可行的安全路徑,并未能將動力學約束和角速度約束同時考慮在規(guī)劃策略設計中,并且對于姿態(tài)機動過程中的最優(yōu)性就難以滿足。

        2.5 基于數值優(yōu)化的姿態(tài)規(guī)劃方法

        由于航天器攜帶的工質推進燃料有限和特定任務的機動時間需求,航天器姿態(tài)控制系統(tǒng)設計在考慮各類運動約束的同時,還需要針對特定的性能指標優(yōu)化。因此,基于數值優(yōu)化的方法也被廣泛的用于姿態(tài)規(guī)劃的研究。這一類方法的核心思想是將給定的性能指標作為目標函數,把姿態(tài)運動學和動力學方程作為等式約束,并刻畫運動過程中的各類物理約束成不等式約束,從而特定工況下的性能最優(yōu)的控制問題轉化為約束條件下數值優(yōu)化進行求解,如圖9所示。

        針對求解姿態(tài)機動的最優(yōu)控制問題,密歇根大學的團隊[61-62]基于間接法將最優(yōu)控制問題轉換成了兩點邊值問題求解了約束下航天器的重新定向的問題,這一系列方法中使用的李群變分積分的離散化方法有助于提高離散化精度,提高了求解精度和效率。凸優(yōu)化技術作為一種相對成熟的優(yōu)化問題求解工具,近年來也在航天器運動中得到了廣泛的研究[63]。華盛頓大學的Kim和Mesbahi[64]采用了凸優(yōu)化的思路進行處理,針對 Planck 空間觀測衛(wèi)星等典型的實際型號的約束下姿態(tài)重定向任務,將姿態(tài)約束轉化為凸的線性矩陣不等式(Linear Matrix Inequality, LMI)形式的約束,并證明了轉化后的問題與原問題等價。文獻[65] 針對更為復雜的軟約束、動態(tài)約束以及混合約束進行約束凸化處理,解決了姿態(tài)機動中的凸優(yōu)化規(guī)劃問題。Sun和Dai[66]提出了基于二次約束二次規(guī)劃(Quadratically Constrained Quadratic Programming, QCQP)的迭代算法。在文獻[64] 的基礎上,姿態(tài)禁止區(qū)約束及強制區(qū)約束被轉化成了基于四元數的不等式約束,并考慮了姿態(tài)機動過程中存在的角速度約束和控制飽和限制。該方法采用半定松弛技術對將問題轉化為帶有秩約束的半定規(guī)劃問題,提出了一種逐次迭代的秩最小化迭代算法,最后利用凸優(yōu)化求解工具得到姿態(tài)機動的最優(yōu)軌跡。此外,Tam和Glenn[67]也在Kim的工作的基礎上,使用了混合整數規(guī)劃算法,求解對應的航天器多約束姿態(tài)規(guī)劃問題。

        上述基于數值優(yōu)化的方法是通過刻畫最優(yōu)問題并求其數值解,從而得到特定工況下的最優(yōu)姿態(tài)機動軌跡。但是求解這一類問題往往需要較高的計算硬件支持和較長的求解時間,尤其是當約束非線性且相互耦合的時候,更會導致運算成本增加。此外,這類方法是基于數學模型的,它們的求解往往依賴于精確的模型信息,因此基于數值規(guī)劃的方法也存在一定的局限性。

        2.6 基于人工智能的姿態(tài)規(guī)劃方法

        正如2.5節(jié)中分析,傳統(tǒng)基于數值優(yōu)化的方法存在求解效率低和模型依賴強等不足,特別是對于一些復雜的問題(如模型非完全精確已知的“灰/黑箱”問題、非凸形式的博弈問題等)很難有效地處理。值得注意的是,人工智能技術的近期進展為空間智能自主規(guī)劃提供理論、方法及技術支撐[68-70]?;谠獑l(fā)式的智能優(yōu)化算法在航天器姿態(tài)機動中也得到了廣泛研究,如遺傳算法(Genetic Algorithm, GA)及其拓展方法[71-73]、粒子群算法(Particle Swarm Optimization, PSO)[74-76]以及差分進化算法(Differential Evolution, DE)[77]等。這些算法利用仿生學的特點和機制能夠緩解傳統(tǒng)優(yōu)化算法中問題非凸造成的局部極小值的問題。

        值得注意的是,近年來以強化學習技術為代表的新一代人工智能技術已經在各類無人系統(tǒng)中受到了重點關注[78]。這類方法的基本原理如圖10所示,通過構建環(huán)境反饋(“獎勵”或“懲罰”),從而激勵智能體在環(huán)境反饋中學習調整當前策略,最終實現“獎勵”最大化的執(zhí)行策略[79]。因此,在利用環(huán)境反饋處理約束時,將期望的運動狀態(tài)構造成“獎勵”,將違背約束的運動狀態(tài)刻畫成“懲罰”是一種處理運動約束規(guī)劃的有效途徑。

        在航天器姿態(tài)機動任務中,文獻[80] 針對非合作目標抓捕任務,基于深度 Q 網絡(Deep-Q Networks, DQN)學習算法設計了一套姿態(tài)鎮(zhèn)定策略,該方法利用歷史數據進行訓練,不依賴于空間目標的質量參數,具有比較強的智能性和適應性。文獻[81] 提出了一種基于近端策略優(yōu)化算法(Proximal Policy Optimization, PPO)的姿態(tài)機動策略,在無需轉動慣量信息的情況下,顯著提升了性能。Elkin等[82]針對航天器姿態(tài)機動問題,提出了一個新型的強化學習框架,該框架利用地面高保真的數字仿真環(huán)境進行訓練,同時由測量的運動狀態(tài)更新仿真環(huán)境的數字模型,并近乎實時的將最新的姿態(tài)機動策略更新,實現了策略在線更新的運動規(guī)劃。上述方法主要是針對無約束情況下的姿態(tài)機動,筆者團隊[5]針對多約束下的航天器姿態(tài)機動問題,在自適應動態(tài)規(guī)劃(Adaptive Dynamic Programming, ADP)框架下設計了一種在線學習的算法,結合歷史數據與實時測量狀態(tài),在線近似求解最優(yōu)問題對應的哈密頓-雅可比-貝爾曼(Hamilton-Jacobi-Bellman equation, HJB)方程,對姿態(tài)機動策略的實時更新,實現了在指向和角速度雙重約束下的姿態(tài)重定向機動。文獻[83] 進一步考慮了執(zhí)行機構偏差,改進在線學習策略,實現了姿態(tài)約束和執(zhí)行機構不確定性下的高精度姿態(tài)機動。上述方法首先設計了比例微分算法得到初始的規(guī)劃策略,然后通過在線的“獎勵”反饋完成策略的實時更新,實現了小計算代價的安全規(guī)避和性能的在線優(yōu)化。

        以強化學習為代表的人工智能方法是解決航天器運動規(guī)劃的新途徑,前述工作中約束的處理主要取決于環(huán)境“環(huán)境獎勵”的構造,如何針對航天任務的需求,設計更為精準合理的“獎勵量化”機制是一項有待研究的內容。此外,考慮到航天器機動任務的特殊性,利用小樣本數據進行快速在線策略學習有著十分重要的作用,故設計高效的學習律是亟需突破的關鍵技術。

        3 航天器姿態(tài)控制方法

        姿態(tài)控制是保障航天器穩(wěn)定飛行或跟蹤制導指令的關鍵技術之一。在實際工程中,比例積分微分控制(Proportional-Integral-Derivative control, PID)因其結構簡單、參數調整直觀、易于工程實現等優(yōu)點,一直被廣泛應用于航天器姿態(tài)控制系統(tǒng)的設計中[84]。然而,傳統(tǒng) PID 控制不能有效處理姿態(tài)控制設計面臨的系統(tǒng)不確定性、多源干擾、執(zhí)行機構故障、暫穩(wěn)態(tài)性能約束以及測量信息不完備等廣義約束,難以滿足新興空間任務對姿態(tài)控制系統(tǒng)高自主、高可靠和高精度的發(fā)展需求。近年來,國內外學者圍繞航天器姿態(tài)控制問題(包括姿態(tài)鎮(zhèn)定、姿態(tài)機動和姿態(tài)跟蹤)開展了大量的理論與應用研究,提出了一系列先進的控制方法。下面將著重面向參數不確定性、多源干擾、執(zhí)行機構故障和暫穩(wěn)態(tài)性能約束,依次介紹自適應控制、抗干擾控制、容錯控制、預設性能控制等姿態(tài)控制方法的研究進展。

        3.1 航天器姿態(tài)自適應控制

        航天器的慣量不確定性可能會導致控制精度下降,嚴重時甚至會造成系統(tǒng)失穩(wěn)。基于“以變應變”思想的自適應控制可以有效處理參數不確定性問題。傳統(tǒng)自適應控制方法大多基于確定等價(Certainty-Equivalence, CE)原則,其基本思想是[85]:首先在假設不確定參數已知的前提下進行反饋控制設計,而后用估計值替換控制律中的不確定參數,并設計相應的自適應律在線更新參數的估計值,保證閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)跟蹤誤差的收斂。基于 CE 的自適應控制因思路簡單、直觀,在航天器姿態(tài)控制中得到了廣泛的應用[19,86]。然而,在 CE 框架下,自適應律的設計主要是為了精確抵消由參數不確定性所引入的附加“擾動”項,但當參數估計無法收斂到它們的真值時,這種脆弱的抵消操作往往會降低閉環(huán)系統(tǒng)的暫態(tài)性能和魯棒性。然而,參數收斂僅在參考軌跡滿足嚴格的持續(xù)激勵(Persistent Excitation, PE)條件時才能實現。

        為了提高自適應控制性能,相關學者脫離CE原則,基于浸入與不變(Immersion and Invariance, I&I)技術提出了非確定等價自適應控制方法。I&I方法論最早是由Astolfi和Ortega[87]基于微分幾何概念提出的。I&I自適應控制方法主要是通過在參數估計中額外增加一個函數項以構造一個微分流形,并設計控制律和自適應律使得所構造的流形不變且吸引,從而以魯棒的思想處理系統(tǒng)參數不確定性。這一方法極大地放寬了 CE 自適應控制對 PE 條件的依賴。需要指出的是,I&I 自適應控制需要求解一個特定的 PDE 來構造微分流形,但對于航天器姿態(tài)動力學這類多輸入非線性系統(tǒng)而言,PDE 通常無解析解,即所謂的“可積性障礙”。這一障礙極大地限制了傳統(tǒng) I&I 自適應控制在航天姿態(tài)控制中的應用。為了克服此問題,Seo 和 Akella[88]分別針對航天器姿態(tài)跟蹤問題,提出了基于回歸濾波的 I&I 自適應控制方法,通過引入狀態(tài)和回歸矩陣濾波器,構造了一個增廣濾波系統(tǒng),并利用增廣濾波狀態(tài)和濾波回歸矩陣直接給出了PDE的解析解。文獻[89]利用這一方法設計了I&I自適應姿態(tài)控制器。Karagiannis等[90]將動態(tài)縮放(Dynamic Scaling)技術應用到I&I自適應控制設計中,為克服可積性障礙提供了一個新思路。該方法通過引入狀態(tài)濾波器,將原始回歸矩陣中的積分變量按照一定方式替換為相應的濾波狀態(tài)量,使回歸矩陣可積,并給出ODE的近似解,之后設計動態(tài)縮放因子補償近似解導致的誤差。與文獻[88]相比,基于動態(tài)縮放的方法只需對原系統(tǒng)進行低維的動態(tài)擴張便可實現與之相似的性能。Yang等[91]將該方法應用到了航天器姿態(tài)跟蹤控制問題中,并改進了動態(tài)增益的設計,有效避免了高增益控制問題。Wen等[92]進一步改進了動態(tài)縮放因子,移除了文獻[91]需要慣量矩陣最小特征值的假設。Xia和Yue[93]針對航天器抗退繞姿態(tài)穩(wěn)定問題,提出了基于動態(tài)縮放的 I&I 自適應控制方法,并通過引入飽和的縮放因子,使得控制器不需要任何動態(tài)增益。本文作者團隊將基于動態(tài)縮放的 I&I 自適應控制方法應用于航天器受限的姿態(tài)重定向中[4]。

        CE 和 I&I 自適應控制方法均僅當回歸矩陣滿足 PE 條件時,才能保證參數估計收斂到它們的真值[94]。但 PE 條件較為嚴苛,在實際中通常難以滿足。近年來,國內外眾多學者都開展了放寬參數收斂對 PE 條件依賴的研究。Chowdhary 和 Johnson[95]在 MRAC 框架下,提出了一種基于并行學習(Concurrent Learning, CL)的自適應控制方法,通過并行使用豐富的歷史數據和當前量測數據設計自適應律,可在系統(tǒng)狀態(tài)僅滿足寬松的有限激勵(Finite Excitation, FE)條件下保證參數收斂。這一方法自提出以來就獲得了廣泛的關注與應用。Zhao 和 Duan[96]針對慣量不確定性下的組合體航天器姿態(tài)跟蹤問題,提出了 CL 自適應律,精確地估計出了組合體未知的慣量參數。由于 CL 算法需要數據選取與存儲,為使存儲的數據盡可能多地包含線性無關元素,需要選擇一個合適的記錄方案,這極大地增加了算法設計的復雜度。而且,傳統(tǒng) CL 算法需要狀態(tài)導數(如角加速度)來構造參數估計誤差,但狀態(tài)導數一般是不可測的信號。盡管可以使用固定點平滑器、滑模微分器等對狀態(tài)導數進行在線估計,但這種處理方法對測量噪聲比較敏感。為避免使用狀態(tài)導數信息,Cho等[97]提出了復合自適應控制方法,無需狀態(tài)導數信息,在 FE 條件下實現了參數收斂,而且由于其使用濾波回歸的積分進行數據存儲,也避免了在線數據選取。基于相似的思想,文獻[98] 提出了復合學習控制方法,并成功應用于機械臂控制中。本文作者團隊針對航天器姿態(tài)跟蹤和多約束姿態(tài)再定向問題,基于復合學習思想,提出了幾種自適應與學習控制方法,在保證高精度姿態(tài)控制的前提下,實現了慣量參數的在線辨識[99-100]。

        雖然國內外研究人員在航天器姿態(tài)自適應控制方面取得了一定的進展,但現有的自適應控制方法大多要求慣量參數是常值或慢變的(近似于常值)。對于未知時變慣量條件下的航天器姿態(tài)自適應控制技術,尤其是時變慣量參數進行在線辨識,有待系統(tǒng)性的探索。

        3.2 航天器姿態(tài)抗干擾控制

        航天器在軌運行期間所受的多源干擾極大地影響了航天器姿態(tài)控制的精度及穩(wěn)定度。姿態(tài)控制設計需要針對性地抑制或抵消這些干擾,以提升姿態(tài)控制系統(tǒng)的抗擾能力和控制精度?,F有航天器姿態(tài)抗干擾控制方法可大致歸為3類:①魯棒控制方法;②自抗擾控制方法;③基于干擾觀測器的控制方法。

        魯棒控制誕生于20世紀 70 年代末期,最初是為解決航空航天領域的控制問題,直到 1988 年著名的 DGKF 方法發(fā)表[101],相關理論才趨于成熟。至今,魯棒控制仍是最為廣泛使用的姿態(tài)抗干擾控制方法。Liu等[102]提出了一種非脆弱的魯棒H∞控制方法,解決了存在建模不確定性、控制攝動、外部干擾和控制輸入限制的撓性航天器姿態(tài)穩(wěn)定和振動抑制問題。一些學者結合H2和H∞魯棒控制方法,提出了混合H2/H∞魯棒姿態(tài)控制方法[103-104]。Luo等[105]針對存在外部干擾的航天器姿態(tài)跟蹤問題,結合魯棒控制和最優(yōu)控制方法,提出了一種H∞逆最優(yōu)控制器,實現對干擾的H∞最優(yōu)。Wang 和 Li[106]提出了一種魯棒最優(yōu)控制方法,解決了存在執(zhí)行機構安裝偏差和干擾的航天器姿態(tài)穩(wěn)定問題。

        變結構控制憑借其對不確定性和干擾的強魯棒性,也是最為廣泛應用的魯棒抗干擾方法。筆者團隊[107]針對撓性航天器大角度姿態(tài)機動問題,結合主動振動抑制技術,提出了滑模控制(Sliding Mode Control, SMC)方案,有效抑制了外部干擾和撓性振動。為實現有限時間控制,相關學者也提出了終端 SMC 方案[108-109]。針對存在外部干擾和控制幅值受限的航天器姿態(tài)控制問題,Wallsgrove 和 Akella[110]提出了一種飽和的光滑變結構姿態(tài)控制方案,通過構造時變的濾波變量,并引入一個銳度函數,有效抑制了干擾對閉環(huán)系統(tǒng)的影響,實現了漸進的姿態(tài)收斂。本文作者團隊基于文獻[110] 也提出了幾種光滑的變結構控制方法[111-112],解決了控制輸入和角速度受限下的航天器抗退繞姿態(tài)穩(wěn)定問題,在干擾下實現了姿態(tài)和角速度的漸進收斂。魯棒控制方法的核心思想是“以不變應萬變”,即考慮系統(tǒng)可能面臨的“最壞”擾動情況,設計一個結構不變的魯棒控制器,實現對有界擾動的有效抑制,故而具有較強的保守性。相比而言,自抗擾控制和基于干擾觀測器的方法通過對擾動進行估計和補償,可有效減小控制器的保守性。

        自韓京清[113]1998 年提出自抗擾控制(Active Disturbance Rejection Control, ADRC)以來,該方法一直受到控制界的廣泛關注,并已成功應用于航空航天、工業(yè)控制等領域。ADRC 繼承了經典 PID 控制的誤差反饋精髓,并引入擾動估計補償技術,使其不依賴于被控對象精確的數學模型,對干擾具有較好的抑制能力。ADRC 一般由跟蹤微分器、擴張狀態(tài)觀測器(Extended State Observer, ESO)、非線性狀態(tài)誤差反饋控制律和擾動補償等幾個環(huán)節(jié)組成[18]。Xia 等[18]針對航天器姿態(tài)跟蹤問題,提出了一種基于 ESO 的 SMC 方案,通過設計 ESO 對系統(tǒng)集總干擾進行估計補償,極大地放寬了傳統(tǒng) SMC 的保守性。文獻[114] 針對外部擾動、輸入/測量噪聲及飽和約束等影響下的無拖曳衛(wèi)星位姿控制問題,采用基于擴展狀態(tài)的卡爾曼濾波器對系統(tǒng)狀態(tài)和擾動進行估計,并設計自抗擾控制器,實現了無拖曳衛(wèi)星的聯合控制。

        盡管前述的非線性 ADRC 方法具有參數效率高、干擾觀測性能好等突出優(yōu)點,但其結構較為復雜,需要調節(jié)的參數較多,導致參數整定困難。針對此問題,美國 Cleveland State University 的Gao[115]提出了線性 ADRC 方法,給出了基于觀測器帶寬的觀測器增益整定方法,通過將多參數整定問題簡化為單參數整定問題,極大地簡化了控制器設計和理論分析。Bai等[116]針對存在干擾的航天器姿態(tài)跟蹤問題,采用線性 ESO 對外部干擾進行估計和補償,并設計一種自適應控制方法,實現了姿態(tài)和角速度跟蹤誤差的快速高精度收斂。除此之外,還有很多基于 ADRC 的姿態(tài)抗干擾控制成果,但限于篇幅,這里不再一一羅列?,F有 ADRC 方法在測量噪聲明顯時,因觀測器增益限制,極易導致擾動估計不精確,進而造成控制性能下降。

        基于干擾觀測器的控制方法(Disturbance Observer Based Control, DOBC)起源于 20 世紀 80 年代,最初是日本學者 Ohishi等[117]針對直流伺服電機的控制問題,提出了一種頻域干擾觀測器對伺服電機干擾進行估計和補償。DOBC 方法的基本思想是設計干擾觀測器對系統(tǒng)的內外干擾進行估計和前饋補償,以抵消干擾對系統(tǒng)的影響,并結合其他控制方法,實現特定的控制需求。由于結構簡單、參數整定方便,DOBC 方法自提出以來便在控制領域得到了廣泛關注。盡管頻域干擾觀測器被成功應用于各類系統(tǒng),但其分析設計均基于線性化的模型和線性系統(tǒng)理論,極大地限制了其應用范圍。

        英國 Loughborough University 的陳文華[118]于2000年首次利用時域方法提出了一種非線性干擾觀測器,并應用于機械臂控制中實現了精確的摩擦估計和補償。此后,非線性DOBC理論得到了迅速發(fā)展。針對航天器姿態(tài)控制系統(tǒng),該方法的結構如圖11所示。Sun 和 Zheng[119]針對存在測量噪聲和控制輸入飽和的航天器姿態(tài)穩(wěn)定問題,將測量噪聲、參數攝動和外部干擾當成“集總干擾”,采用非線性 DOB 對集總干擾進行估計和前饋補償,并基于抗積分飽和補償器設計了飽和魯棒控制器。Zhang等[120]結合積分型 DOB 和終端滑??刂萍夹g,設計了自適應滑??刂破鳎瑢崿F了有限時間姿態(tài)跟蹤。Zhu等[121]針對撓性航天器的主振動抑制和姿態(tài)抗擾控制問題,分別設計了自適應 DOB 和撓性振動觀測器,有效補償了集總干擾和撓性振動。北京航空航天大學吳忠團隊分別設計了有限時間 DOB[122]和迭代學習 DOB[123],并應用于撓性航天器姿態(tài)控制中。

        值得注意的是,航天器姿態(tài)控制系統(tǒng)往往會受到模型不確定性、未建模動態(tài)、時滯、執(zhí)行器誤差、測量噪聲以及外部環(huán)境干擾等內外部多源干擾的影響,這些干擾具有不同的表征形式,如范數有界變量、諧波變量、階躍變量、非高斯/高斯隨機變量以及變化率有界變量等[124]。傳統(tǒng)的 DOBC 大多僅能對單一干擾進行補償,沒有充分挖掘出各類干擾的內在特征,并有針對性地進行精細化補償和抑制。文獻[125-126] 在傳統(tǒng) DOBC 的基礎上,首次提出了復合分層抗干擾控制方法,在對系統(tǒng)干擾進行分析和分類建模的基礎上,采用內環(huán)+外環(huán)的雙環(huán)控制結構,實現對系統(tǒng)多源干擾的精細估計和補償,該方法目前已在航天器、機器人等系統(tǒng)中進行了應用,并取得了較好的效果。Zhu等[127]結合 ADRC 和 DOBC 方法提出了一種增強的復合抗擾控制方法,該方法建立了一個外部模型對撓性振動引起的干擾進行描述,并將參數不確定性、環(huán)境干擾等其他干擾歸結為一個微分有界的等效干擾,然后利用 DOBC 對撓性振動干擾進行精細估計與補償,并采用 ADRC 補償其他干擾,相較于單一的 DOBC 或 ADRC 方法具有更強的抗擾能力。Yu等[21]首次提出了干擾可估計性和可補償性概念,并與文獻 [127] 相似,結合 ADRC 和 DOBC 技術設計了一種增強的抗干擾姿態(tài)控制器,實現了撓性航天器的精細干擾補償和高精度姿態(tài)控制。

        雖然過去20年 DOBC 技術取得了長足的發(fā)展,并在航天器姿態(tài)抗干擾控制中得到了應用與驗證,但是提高 DOBC 在大延時、高對抗和強干擾等復雜環(huán)境下的精細抗干擾能力,仍是一項有待深入研究的工作。

        3.3 航天器姿態(tài)容錯控制

        世界各空間機構在航天器的設計、生產及其在軌運行過程中,都非常重視航天器的可靠性和操作的安全性。但受制造工藝水平、成本限制等客觀因素的制約,以及高/低溫、強輻射、強電磁干擾等惡劣太空環(huán)境的影響,航天器故障事件仍時有發(fā)生,如太陽帆板損壞、陀螺儀失效、遙測指令系統(tǒng)異常等。航天器故障給航天器的安全性帶來了極大隱患。據統(tǒng)計表明[128],1980—2005年間在軌航天器所發(fā)生的 156 起故障事件中,姿態(tài)和軌道控制系統(tǒng)(Attitude and Orbit Control System, AOCS)與電力系統(tǒng)(Power)故障占總故障的 59%。進一步分析故障對任務的影響,發(fā)現近 65% 的故障是非致命性故障,致使了航天任務降級,而近 40% 的故障是致命性的,導致航天任務完全失敗,造成了巨大的經濟損失。

        姿態(tài)控制系統(tǒng)因功能和結構復雜,是航天器故障事件最高發(fā)的子系統(tǒng)之一。根據文獻[128]可知,1980—2005年發(fā)生的 156 起故障事件中AOCS 故障占總故障的 32%,而且近 50% 的 AOCS 故障是由反作用飛輪、動量輪、推力器等姿軌控執(zhí)行機構故障引起的。航天器長期在軌運行期間,這些姿軌控執(zhí)行機構需要頻繁工作以驅動航天器完成指定任務,這也是它們故障高發(fā)的原因。表2 和表3 分析了典型的推力器和反作用飛輪故障案例。由此可見,執(zhí)行機構故障輕則會導致航天器任務降級、壽命縮減,重則直接致使航天器完全失效甚至失控解體,造成巨大的經濟損失和災難性的后果。因此,使航天器具備自主故障處理能力尤為重要。

        表2 推力器故障典型案例Table 2 Typical cases of thruster faults

        表3 反作用飛輪故障典型案例Table 3 Typical cases of reaction wheel faults

        為滿足航天器日益提升的安全性、可靠性和可維護性需求,迫切需要發(fā)展容錯控制(Fault-Tolerant Control, FTC)技術,使航天器具備自主故障處理能力。FTC 發(fā)端于航空航天高可靠性需求,20 世紀 80 年代美國空軍提出了“自修復飛行控制系統(tǒng)”等概念,以保證飛行器在故障情況下仍能安全著陸。文獻[129]對FTC技術進行了系統(tǒng)性梳理和回顧。根據文獻[130],現有的航天器姿態(tài)FTC方法可分為2大類:被動FTC和主動FTC。

        被動 FTC 本質上屬于“以不變應萬變”的魯棒控制方法,在設計過程中需要充分考慮潛在的故障,并將它們視為系統(tǒng)不確定性,而后設計一個魯棒控制器實現容錯控制。該方法不需要故障的在線信息,且無需進行控制重構,能夠同時處理多種類型故障,具有設計簡單、工程實用性強等優(yōu)勢,目前已在航天器控制領域得到了廣泛關注。現有的航天器姿態(tài)被動 FTC 方法主要集中于“自適應 + X”方法(如自適應 + 滑??刂?、自適應 + 魯棒控制等)。Cai等[131]針對航天器姿態(tài)跟蹤問題,提出了一種“間接自適應+滑??刂啤钡聂敯羧蒎e控制方法,該方法不僅能夠在有限推力下應對推力器故障,還對參數不確定性和外部干擾具有強魯棒性。Shen等[132]結合終端滑??刂坪妥赃m應控制技術,研究了有限時間FTC問題。Xiao等[133]研究了剛柔耦合航天器的姿態(tài)跟蹤問題,考慮執(zhí)行機構故障、測量噪聲、未知模態(tài)位移、參數不確定性和外部干擾等,設計了自適應容錯控制器,采用序列Lyapunov方法分析了跟蹤誤差的保性能收斂界。近年來,本文作者團隊[134-135]提出了“自適應+預設性能控制”的航天器姿態(tài)FTC方法,在參數不確定性、外部干擾和執(zhí)行機構故障下實現了姿態(tài)跟蹤誤差的預設性能收斂。盡管被動FTC能夠有效處理一大類執(zhí)行機構故障,且對干擾具有強魯棒性,但控制器的保守性較強,難以恢復理想的控制性能。

        不同于被動 FTC,主動 FTC 方法主要是通過引入一個故障檢測和診斷(Fault Dection and Digonosis, FDD)算法對執(zhí)行機構故障進行在線實時檢測與診斷,而后利用 FDD 模塊的診斷信息重構控制器,以“精準診斷-對癥下藥”的思想主動地應對執(zhí)行機構故障,保證整個系統(tǒng)在故障下仍具有可接受的性能。主動 FTC 方法的框架如圖12所示,該方法能夠充分利用系統(tǒng)的物理和解析冗余,主動地應對執(zhí)行機構故障,故具有較小的保守性。主動 FTC 系統(tǒng)一般包含故障診斷與容錯控制2部分內容,而故障診斷又分為 3 部分:① 故障檢測,即檢測出系統(tǒng)是否發(fā)生故障與故障發(fā)生的時間;② 故障隔離,即獲知系統(tǒng)哪個部件發(fā)生故障以及故障類型和發(fā)生的具體位置;③ 故障辨識,即根據系統(tǒng)測量信息辨識出故障大小。目前,大量學者對航天器姿態(tài)控制系統(tǒng)的故障診斷問題進行了研究,現有成果可劃分為基于模型的方法、基于數據的方法和基于知識的方法3大類。哈爾濱工業(yè)大學沈毅等[136]和筆者團隊[137]已對現有航天器姿態(tài)控制系統(tǒng)的故障診斷算法進行了梳理與總結,這里不再詳述。盡管故障診斷技術取得了一些的研究成果,但大多方法在多源干擾的影響下面臨故障虛警率高、隔離難、辨識精度低等問題,如何提高干擾下的故障診斷精度有待深入研究。

        接下來,重點回顧故障辨識與容錯控制方法的研究進展。Shen等[138]研究了姿態(tài)主動 FTC 問題,提出可避免虛警的故障檢測方案,并構造了指數收斂的間接故障辨識器對系統(tǒng)總故障進行估計,在此基礎上進一步設計了自適應滑模容錯控制器,在滿足輸入飽和的前提下有效補償執(zhí)行機構故障對系統(tǒng)的影響。筆者團隊[139]針對航天器單框架控制力矩陀螺的故障診斷問題,提出了一種基于神經網絡的干擾觀測器在線學習周期干擾,實現了故障和干擾的解耦,并基于神經網絡和自適應估計器設計了故障診斷方案,實現對控制力矩陀螺故障的隔離和估計。近年來,一些學者也將執(zhí)行機構故障和干擾統(tǒng)一歸結為“集總干擾”,并基于 ADRC 或 DOBC 方法提出了一系列容錯抗干擾控制方法[140-142]。筆者團隊[142]提出了基于迭代學習干擾觀測器的姿態(tài)容錯抗干擾控制方法,并通過硬件在環(huán)實驗驗證了算法的有效性。Gui[143]研究了基于觀測器的航天器姿態(tài) FTC 問題,考慮執(zhí)行機構故障、慣量不確定性、外部干擾以及狀態(tài)估計誤差,設計了一種連續(xù)滑模容錯控制器,并使用序列 Lypunov 方法預測了穩(wěn)態(tài)跟蹤誤差的收斂界。

        基于控制重分配的容錯控制方法具有故障發(fā)生時無需改變控制器結構的特點,也被廣泛應用于主動 FTC 系統(tǒng)設計中。Shen等[144]針對航天器姿態(tài)跟蹤問題,基于故障辨識結果,結合滑??刂坪头囚敯艨刂品峙浼夹g,提出了一種容錯控制分配方法,該方法可充分利用健康和尚未完全失效的執(zhí)行機構應對故障;隨后,Shen等[145]又進一步提出了一種魯棒容錯控制分配方案。Li等[146]考慮執(zhí)行機構故障、控制輸入飽和以及外部干擾,提出了一種基于閉環(huán)控制分配的姿態(tài) FTC 方法,在控制輸入飽和限制下,通過將基準控制信號分配到冗余執(zhí)行機構,并將分配誤差納入控制閉環(huán),保證了閉環(huán)系統(tǒng)的穩(wěn)定性。筆者團隊[147]也提出了一種閉環(huán)的魯棒容錯控制分配方法,充分考慮故障估計誤差,將控制分配問題描述為一個魯棒最小方差問題,并給出了相應的解析解,克服了傳統(tǒng)控制分配方法僅能給出數值解,且缺乏嚴格閉環(huán)穩(wěn)定性保證的局限。

        隨著航天器星載設備集成化程度和航天任務品質需求的不斷提升,以及空間對抗態(tài)勢的日益升級,航天器發(fā)生執(zhí)行/傳感故障以及部件損傷的概率劇增。盡管目前航天器容錯控制技術在理論和應用方面均取得了顯著的進展,但針對航天器結構性故障(如航天器受攻擊或撞擊而發(fā)生帆板損壞等)的容錯控制技術仍有待研究。

        3.4 航天器姿態(tài)預設性能控制

        為確保航天器高品質地完成深空探測、在軌服務、空間對抗等新一代空間任務,姿態(tài)控制系統(tǒng)的設計需要考慮第1.4.4節(jié)總結的暫穩(wěn)態(tài)性能要求。然而,現有的非線性控制方法(如滑??刂?、自適應控制等)大多都側重于分析閉環(huán)系統(tǒng)的穩(wěn)定性與輸出誤差的穩(wěn)態(tài)行為,缺乏對暫態(tài)性能指標的分析與保證。盡管混合H2和H∞魯棒控制[148]和L2增益性能指標[149]可以分析閉環(huán)系統(tǒng)的暫態(tài)性能,但所引入的性能指標均與軌跡導向的暫態(tài)性能沒有預先確定的關系,因此需要繁瑣的參數選取才能獲得期望的暫態(tài)性能。希臘學者 Bechlioulis 和 Rovithakis[150]提出了預設性能控制(Prescribed Performance Control, PPC),為保證控制系統(tǒng)暫穩(wěn)態(tài)性能提供了嶄新的設計思路。該方法的核心思想是通過引入性能函數為受控系統(tǒng)的狀態(tài)或誤差設定性能包絡,刻畫收斂速度、最大超調量和穩(wěn)態(tài)誤差等暫穩(wěn)態(tài)控制性能,如圖13所示,并結合誤差轉換技術和非線性控制方法,保證狀態(tài)或誤差嚴格在預設的性能包絡內收斂。由于 PPC 框架并沒有指定特定的控制器設計方法,故而可以根據實際控制需求,利用現有先進的非線性控制方法(如 SMC、DOBC、自適應控制等)對誤差轉換后的系統(tǒng)進行控制器設計。

        鑒于 PPC 方法在保證系統(tǒng)暫穩(wěn)態(tài)性能上的優(yōu)勢,該方法自 2008 年提出以來便得到了大量的應用。文獻[151-152] 對航天器姿態(tài) PPC 方法的研究進展和未來趨勢進行了綜述??紤] PPC 方法的魯棒性、抗干擾性和容錯能力,本文從新的視角對航天器姿態(tài) PPC 方法的進展進行重新梳理,將現有方法劃分為2大類:“PPC + 估計/觀測”方法和無模型 PPC 方法,其中第一類方法主要包括“PPC + 自適應控制”“PPC + DOBC”“PPC + 神經網絡逼近”等。本文作者團隊[89]針對航天器逼近操作問題,將空間運動約束轉換為位姿跟蹤誤差的暫穩(wěn)態(tài)性能約束,并考慮航天器質量特性不確定性,提出了一種 I&I 自適應 PPC 方法,能夠保證航天器按照預設的性能要求完成對空間目標的逼近操作,且在逼近過程中嚴格遵循空間運動約束。此外,筆者團隊[134-135]還研究了執(zhí)行機構故障和輸入飽和下的航天器姿態(tài)跟蹤 PPC 問題,提出了兩種基于障礙函數的自適應容錯 PPC 方案,能夠在執(zhí)行機構故障和飽和下保證姿態(tài)跟蹤誤差的暫穩(wěn)態(tài)性能要求。Liu 等[153]考慮外部干擾和執(zhí)行機構影響下的航天器姿態(tài)跟蹤問題,提出了一種自適應容錯 PPC 方法,實現了姿態(tài)和角速度跟蹤誤差的預設性能收斂。哈爾濱工業(yè)大學Huang和Duan[154]針對組合體航天器姿態(tài)跟蹤 PPC 問題,考慮慣量不確定性、外部干擾、執(zhí)行機構故障和飽和等因素,提出了一種基于非線性 ESO 的抗積分飽和容錯 PPC 方案。

        盡管前述的姿態(tài) PPC 方法具備較強的魯棒性、抗干擾性和容錯能力,但大多需要在線估計或觀測,致使算法復雜度高、計算量大,在星載計算資源嚴重受限的情況下,難以在軌應用。為了提高 PPC 算法的實用性,近年來一些學者探究了低復雜度的無模型 PPC 方法[155],并在航天控制領域得到了應用。Zhou等[156]針對 SO(3) 描述下的航天器姿態(tài)跟蹤問題,提出了一種無坐標的魯棒 PPC 方法,該方法具有簡單的控制器結構,無需動力學參數信息,但對外部干擾具有強魯棒性。西北工業(yè)大學殷澤陽等[157-159]針對航天器姿態(tài)穩(wěn)定、跟蹤和組合體航天器姿態(tài)接管控制問題,提出了幾種低復雜度的無模型 PPC 方法,這些方法無需對模型參數和干擾進行先驗估計或在線辨識,能夠保證系統(tǒng)輸出在存在參數不確定性和外部干擾的條件下仍能滿足預設的暫穩(wěn)態(tài)性能要求。特別的是,文獻[159] 基于終端滑模設計了一個指定時間性能函數,并在此基礎上提出了無模型雙層 PPC 方法。Hu等[160]進一步為撓性航天器姿態(tài)跟蹤設計了一種無模型雙層 PPC 方法。

        現有姿態(tài) PPC 方法大多僅能處理暫穩(wěn)態(tài)性能約束,而難以兼顧各類運動和物理約束。文獻 [161] 通過引入一個基于正系統(tǒng)理論的輔助系統(tǒng)來放寬飽和發(fā)生時的性能約束包絡,克服了控制輸入飽和下的 PPC 設計難題,但該方法仍無法用于處理運動約束下的 PPC 設計問題。如何在多運動和物理約束并存的情況下,形成有效的姿態(tài) PPC 方法,完成多約束下的航天器姿態(tài)預設性能控制是亟待解決的難題。

        3.5 其他航天器姿態(tài)控制方法

        除了3.1~3.4節(jié)介紹的4種姿態(tài)控制方法外,一些典型的姿態(tài)控制方法還有:

        1) 航天器姿態(tài)輸出反饋控制。由于成本和容積的限制,一些衛(wèi)星(尤其是小型化衛(wèi)星)通常不裝備角速度測量元件,或因傳感器故障,導致其無法獲得角速度測量信息。輸出反饋控制能夠在角速度信息缺失下實現控制目標。傳統(tǒng)方法基于航天器姿態(tài)動力學的無源性(Passivity),利用姿態(tài)信息設計輸出反饋控制器[162]。但這類方法需要在控制設計中額外引入一個動態(tài)環(huán)節(jié),降低了系統(tǒng)的動態(tài)響應?;跔顟B(tài)觀測器的輸出反饋控制方法是另一種被廣泛應用的方法。美國德克薩斯大學奧斯汀分校的Akella等[163]提出了全局漸近收斂的角速度觀測器,并利用觀測信息設計了類 PD 姿態(tài)控制器,解決了觀測器和控制器之間分離性質(Separation Property)難以建立的難題,證明了閉環(huán)系統(tǒng)的穩(wěn)定性。

        2) 航天器姿態(tài)事件觸發(fā)控制(Event-triggered Control, ETC)?,F有航天器姿態(tài)控制方法大多是時間驅動的,即控制指令更新和通信是周期性采樣的。盡管周期性采樣易于工程實現,但從資源利用的角度來看,周期性采樣和控制方式不可避免地會導致大量的計算和通信資源浪費。ETC 為克服這一問題提供了解決思路,該方法通過預先設定閾值和觸發(fā)條件,保證控制指令和通信僅在特定事件觸發(fā)時才執(zhí)行,極大降低了控制指令和通信的更新頻率[164]。文獻[165] 首次在 ETC 框架下研究了航天器的姿態(tài)穩(wěn)定控制問題,通過設計基于狀態(tài)的觸發(fā)條件保證姿態(tài)信息和控制指令只在離散的觸發(fā)時刻被傳遞和更新。筆者團隊[166]在角速度和通信資源受限的情況下,提出了一種基于神經網絡的自適應事件觸發(fā)姿態(tài)機動控制算法,有效降低了通信資源消耗。

        3) 航天器姿態(tài)智能控制。隨著人工智能技術的迅猛發(fā)展,在航天器控制中得到了廣泛的關注與應用。在文獻[167-168]中,全面分析并展望了智能方法在解決航天任務中執(zhí)行器故障、參數不確定、控制性能優(yōu)化等問題的案例,為多約束下的航天器姿態(tài)控制設計提供了嶄新的途徑。針對模型參數不確定性,文獻[169]提出了一種智能 PD 撓性航天器姿態(tài)控制器,利用徑向基函數(Radial Basis Function,RBF)網絡以實現對未知擾動項的補償。Schram等[170]則設計了智能自適應姿態(tài)控制算法,利用強化學習技術對不確定性進行在線逼近,實現了高精度姿態(tài)跟蹤。在文獻[171] 中,基于深度神經網絡的參數估計設計了自適應魯棒姿態(tài)跟蹤算法。Li等[172]針對分布式航天器的姿態(tài)協(xié)同跟蹤問題,設計了自適應神經網絡逼近系統(tǒng)不確定項,從而進一步設計反饋控制器。面向執(zhí)行機構故障,Baldi等[173]使用 RBF 網絡建立主動容錯控制系統(tǒng)對故障產生的控制偏差進行補償,實現了容錯故障跟蹤控制。Chen和Tao[174]也采用 RBF 網絡構建閉環(huán)自適應容錯控制器,實現了存在未知死區(qū)和不確定擾動的姿態(tài)高精度跟蹤。文獻[175] 考慮了多個控制力矩陀螺多種故障發(fā)生的工況,采用深度神經網絡建立了自適應容錯控制架構,實現了高精度的容錯控制。針對控制性能的優(yōu)化,Liu等[176]針對組合航天器的姿態(tài)跟蹤,基于 Q-learning 的方法實現利用離線數據學習的控制器設計。在文獻[177] 中,使用深度神經網絡替代傳統(tǒng)的 PID 算法設計姿態(tài)跟蹤控制器,并利用遺傳算法進行網絡初始權值的選取,提升了智能算法的部署效率。Zhang等[178]設計了一種 PID-Guide TD3 的學習算法,用來訓練航天器姿態(tài)控制器, 利用 PID 控制器作為引導訓練,提高了傳統(tǒng) TD3 算法的離線學習效率。筆者團隊[179-181]最近提出了一系列基于在線學習的在線強化學習控制策略,實現了航天器在線最優(yōu)姿態(tài)控制,并在半物理實驗平臺上得到了驗證。

        限于篇幅,其他方法在這里不再介紹。

        4 發(fā)展趨勢

        針對航天器姿態(tài)規(guī)劃與控制面臨的各類復雜約束,自主規(guī)劃與控制技術從滿足飛行任務需求出發(fā),從系統(tǒng)級、任務級的規(guī)劃,發(fā)展到設備級的精細化規(guī)劃與控制,在保障航天器安全與健康運行、延長航天器的在軌壽命具有顯著的學術價值和應用前景。從當前的研究進展和需要解決的問題來看,建議多約束姿態(tài)規(guī)劃與控制技術在未來研究的發(fā)展方向為如下幾方面:

        1) 復雜不確定環(huán)境下多約束多目標在線姿態(tài)規(guī)劃技術

        傳統(tǒng)規(guī)劃方法大多是在任務執(zhí)行前,根據航天器初始姿態(tài)和目標姿態(tài),預先規(guī)劃出一條可行軌跡。然而,航天器在執(zhí)行空間對抗、深空探測等任務的過程中,復雜不確定的飛行環(huán)境、突發(fā)事件造成的任務目標改變等因素會導致預先規(guī)劃難以正常執(zhí)行。所以,需要研究復雜不確定環(huán)境下的在線快速重規(guī)劃方法,以快速應對預先規(guī)劃失效的問題,在保證航天器在軌飛行安全的前提下盡可能地完成任務目標。另一方面,隨著空間任務日趨復雜,姿態(tài)規(guī)劃問題逐漸由傳統(tǒng)單目標運動規(guī)劃向多約束多目標運動規(guī)劃發(fā)展,需要考慮執(zhí)行時間、能量消耗等性能指標,且面臨的約束更加復雜,除了常見的靜態(tài)硬約束外,還可能存在動態(tài)軟約束(如時變指向約束、進入禁止區(qū)的時長限制)等。因此,考慮靜態(tài)硬約束、動態(tài)軟約束等復雜多約束,并綜合各性能指標,研究復雜不確定環(huán)境下的多約束多目標在線姿態(tài)規(guī)劃技術是未來值得探討的問題。

        2) 控制系統(tǒng)能力退化下的柔性任務重構與多約束姿態(tài)控制一體化技術

        當一個或多個執(zhí)行機構發(fā)生完全失效、卡死等嚴重故障時,會導致航天器姿態(tài)控制系統(tǒng)能力退化,甚至導致系統(tǒng)由過/全驅動系統(tǒng)變?yōu)榍夫寗酉到y(tǒng),嚴重影響了既定空間任務的順利執(zhí)行以及航天器在復雜環(huán)境下的運行安全。已有成果大多假設在執(zhí)行機構故障條件下,姿態(tài)控制系統(tǒng)仍是過/全驅動的,并側重于保證系統(tǒng)的穩(wěn)定性和穩(wěn)態(tài)性能,而對故障下的系統(tǒng)剩余驅動能力量化分析的研究尚不多見。從工程的角度來看,控制系統(tǒng)能力退化可能會導致既定的任務無法完成,需要進行在線任務重構(如任務降級等),以確??刂葡到y(tǒng)的剩余驅動能力能夠順利完成任務。另一方面,控制系統(tǒng)能力下降,尤其是導致系統(tǒng)欠驅動的情況,會顯著減小航天器姿態(tài)機動路徑的可行空間,給多約束姿態(tài)規(guī)劃與控制設計帶來了巨大挑戰(zhàn),目前鮮有這方面的研究。因此,亟需開展控制系統(tǒng)能力退化下的柔性任務重構與多約束姿態(tài)控制一體化關鍵技術研究,突破控制系統(tǒng)能力量化評估、柔性任務重構、欠驅動系統(tǒng)姿態(tài)可行空間與能控性分析等關鍵技術,重點解決欠驅動系統(tǒng)的多約束姿態(tài)規(guī)劃與控制難題。

        3) 基于“數字孿生 + 深度強化學習”的多約束姿態(tài)規(guī)劃與控制技術

        隨著計算機硬件算力的顯著提升,考慮到空間環(huán)境復雜、未知因素多等特點,以深度強化學習為代表的人工智能技術應用于規(guī)劃與控制也將是必然的趨勢。然而,這類方法大多是探索驅動的,即需要通過積累大量的“動作-反饋”數據進行學習訓練,從而形成最佳策略。但是,對于空間任務來說,考慮到在軌燃料稀缺、安全性以及部件壽命,航天器不能進行大量的“反復試錯”,無法獲取豐富的經驗數據。數字孿生技術的出現為這一問題提供了解決思路。數字孿生可將航天任務中的復雜環(huán)境和航天器系統(tǒng)進行數字化鏡像,從而對約束場景、執(zhí)行機構、傳感器等虛擬映射,進而實現環(huán)境模擬,約束演化,故障的預測診斷等。因此,利用數字孿生技術可以讓智能算法積累與真實環(huán)境近乎相同的“探索經驗”,并根據傳感的數據實時更新孿生模型。通過“數字孿生 + 人工智能”的模式,實現數據模型混合驅動的多約束在線規(guī)劃與控制必將是今后發(fā)展的重要方向。

        4) 基于合作博弈強化學習的細胞衛(wèi)星姿態(tài)接管控制技術

        隨著微小衛(wèi)星技術的發(fā)展,以利用多個細胞衛(wèi)星附著在失效航天器上實施接管控制為代表的技術,為航天器的在軌維護提供了新的發(fā)展方向。在細胞衛(wèi)星附著組合后,航天器具有冗余的執(zhí)行機構和較高的可靠性。為了使各個細胞衛(wèi)星能夠協(xié)調控制并使得控制的代價消耗最小,對于每個細胞衛(wèi)星來說都是一個合作博弈的過程,即“付出最小的單體代價,實現整體最優(yōu)目標”。而傳統(tǒng)的控制技術難以應對這一需求?;谖⒎植┺牡暮献骺刂撇呗允菍崿F這一任務的解決方案??紤]到細胞衛(wèi)星附著后的組合體質量特性未知,且多體博弈控制所轉化而成的數值優(yōu)化問題較為復雜,難以利用已有基于模型的數值求解工具進行求解。而以自適應動態(tài)規(guī)劃為代表的強化學習技術為這一新興任務提供了解決途徑。因此,研究基于強化學習的合作博弈控制技術是面向細胞衛(wèi)星接管控制為代表的新興航天任務的技術基礎,也是未來航天器在軌服務技術發(fā)展的新方向。

        5) 多約束下的航天器編隊飛行分布式協(xié)同規(guī)劃與控制技術

        近年來,隨著星載計算、通信、傳感等技術的迅猛發(fā)展,利用多顆小型衛(wèi)星構成一個大規(guī)模的航天器編隊系統(tǒng),并通過無線通信與感知形成特定的構型進行自主協(xié)同飛行,協(xié)作地完成傳統(tǒng)大型單航天器無法完成的大孔徑、長基線等新興空間探測和成像任務,已成為航天技術發(fā)展的新趨勢。相比于單航天器系統(tǒng),編隊系統(tǒng)具有研發(fā)周期短、適用性強、容錯性高等特點,以及快速的空間響應能力和空間攻防對抗下的空間任務保護與生存能力,在科學研究、國民經濟以及國防建設等領域發(fā)揮著至關重要的作用。在編隊系統(tǒng)運行的過程中,各航天器之間需要保持通信并避免碰撞,這給協(xié)同規(guī)劃與控制算法設計帶來了復雜約束,同時空間環(huán)境往往是高動態(tài)的,任務也可能是變化的,這都對規(guī)劃和控制算法的在線適應能力提出了更高的要求。另外,編隊飛行任務可能會發(fā)生一個或多個成員故障或損毀、新航天器補充等情況,這對編隊系統(tǒng)的任務協(xié)同、編隊飛行安全以及通信拓撲帶來了巨大挑戰(zhàn)?,F有的編隊系統(tǒng)協(xié)同規(guī)劃與控制方法大多沒有考慮復雜約束條件,且大多采用集中式處理方式,具有實時性差、響應慢、一致性差等缺陷。因此,亟需突破現有局限,設計具有強約束處理能力的航天器編隊分布式協(xié)同規(guī)劃與控制技術、成員故障或損毀下的“任務重規(guī)劃-編隊構型重構”一體化在線規(guī)劃與控制技術等,保證多約束下的航天器編隊系統(tǒng)飛行安全和穩(wěn)定性。

        5 結 論

        隨著航天器自主規(guī)劃與控制技術的不斷發(fā)展以及在深空探測、在軌服務等一系列航天任務的成功應用,極大提升了航天器的自主性和智能化水平。多約束姿態(tài)規(guī)劃與控制技術是保證航天器在復雜空間環(huán)境下穩(wěn)定可靠運行并安全實施各類空間任務的關鍵,因此受到了廣泛的關注與深入的研究。本文在總結航天器姿態(tài)機動任務所面臨的各類約束的基礎上,梳理了現有航天器多約束姿態(tài)規(guī)劃與控制方法的設計思路,并對各方法的優(yōu)缺點和部分代表成果進行了綜述。最后,面向航天任務未來需求,給出了航天器多約束姿態(tài)規(guī)劃與控制技術的發(fā)展方向。

        猜你喜歡
        姿態(tài)控制執(zhí)行機構航天器
        中寰氣動執(zhí)行機構
        中寰氣動執(zhí)行機構
        2022 年第二季度航天器發(fā)射統(tǒng)計
        國際太空(2022年7期)2022-08-16 09:52:50
        風擾動下空投型AUV的飛行姿態(tài)控制研究
        2019 年第二季度航天器發(fā)射統(tǒng)計
        國際太空(2019年9期)2019-10-23 01:55:34
        2018 年第三季度航天器發(fā)射統(tǒng)計
        國際太空(2018年12期)2019-01-28 12:53:20
        2018年第二季度航天器發(fā)射統(tǒng)計
        國際太空(2018年9期)2018-10-18 08:51:32
        多星發(fā)射上面級主動抗擾姿態(tài)控制技術研究
        自動化學報(2018年2期)2018-04-12 05:46:05
        基于UC/OS-II四旋翼姿態(tài)控制系統(tǒng)設計
        彈道修正執(zhí)行機構綜述
        99国产精品无码专区| 麻豆精品国产精华液好用吗| 久久精品人人爽人人爽| 午夜视频网址| 国产一区二区三区特黄| 丰满人妻一区二区三区视频| 97在线观看| 91精品全国免费观看青青| 人妻中文字幕一区二区三区| 欧美牲交a欧美牲交| 日本不卡一区二区三区在线 | 日韩精品中文字幕人妻中出| 亚洲国产精品高清在线| 中文字幕丰满乱子无码视频| 欧美一区波多野结衣第一页| 日韩精品中文字幕免费人妻| 青青草精品视频在线播放| 欧美 丝袜 自拍 制服 另类| 无码人妻专区免费视频 | 青青草视频网站在线观看| 天堂网在线最新版www| 亚洲欧美日韩中文天堂| 日韩精品中文字幕人妻中出| 婷婷久久国产综合精品| 国产va在线观看免费| 女同av在线观看网站| 久久综合亚洲鲁鲁五月天| 伊人久久大香线蕉av色| chinese国产乱在线观看| av网址不卡免费在线观看| 国产一区二区三区中文在线| 欧美猛男军警gay自慰| 亚洲中文欧美日韩在线| 久久老熟女一区二区三区福利| 大地资源在线观看官网第三页| 精品国产福利在线观看网址2022 | 久久精品国产亚洲av影院毛片 | 久久久久99精品国产片| 男女在线免费视频网站| 国产精品一区二区三区在线免费| 东北寡妇特级毛片免费|