胡錦昌,張洪華,李毛毛
(1.北京控制工程研究所,北京 100190; 2.空間智能控制技術(shù)重點實驗室,北京 100190)
基于自適應(yīng)的月球著陸器懸停避障方法*
胡錦昌1,2,張洪華1,2,李毛毛1,2
(1.北京控制工程研究所,北京 100190; 2.空間智能控制技術(shù)重點實驗室,北京 100190)
考慮質(zhì)量和推力不確定性,月球著陸器在懸停避障時將難以快速穩(wěn)定到設(shè)計高度.為解決此問題,提出一種基于自適應(yīng)的高精度懸停避障方法,其核心是利用位置測量作為觀測器的輸入,對質(zhì)量和推力不確定性進行快速估計和補償.與基于PID的方案相比,該方案具有估計速度更快的優(yōu)點,能夠快速實現(xiàn)高精度的懸停避障控制.最后對所提方法給出仿真驗證.
月球著陸; 懸停避障; 質(zhì)量和推力不確定性;浸入與不變流形
在月球著陸器的懸停避障階段,著陸器需要將自身位置控制到安全目標點的上方.在避障目標較遠時,一般利用主發(fā)動機來提供避障所需的平動加速度,此時需要本體姿態(tài)機動來配合.此時控制目標為位置和姿態(tài)六個自由度,而輸入為主發(fā)動機推力和三軸姿態(tài)控制力矩,可見此時避障問題實質(zhì)上是一個四階級聯(lián)的欠驅(qū)動問題.對于此類欠驅(qū)動的著陸避障問題,在過去的幾十年里已經(jīng)得到了學(xué)者的大量研究.文獻[1]針對速度不可測的情形設(shè)計了觀測器及使得系統(tǒng)漸近穩(wěn)定的控制器.文獻[2]針對質(zhì)量不確定的情形設(shè)計了自適應(yīng)的控制器,在針對質(zhì)量進行自適應(yīng)辨識的同時,通過二階濾波器來獲得目標角速度和角加速度.文獻[3]針對帶液體晃動的月球著陸器,提出了一種基于無源性的位置和姿態(tài)控制器.文獻[4]則設(shè)計了一種分層滑模控制器來穩(wěn)定整個六自由度系統(tǒng).文獻[5]針對著陸器最終下降段設(shè)計了一種基于嵌套飽和函數(shù)的制導(dǎo)律.
在實際工程當中,難免會出現(xiàn)推力和質(zhì)量的偏差.在設(shè)計避障控制律時,如果不考慮該不確定性的影響,那么將對豎直通道的控制產(chǎn)生重要影響.針對此問題,本文設(shè)計了不確定性的自適應(yīng)律.實際控制律將利用自適應(yīng)結(jié)果進行實時補償.不同于文獻[2],本文利用位置而非速度作為不確定觀測器的輸入量,這樣可以進一步降低估計結(jié)果的波動.
本文對推力和質(zhì)量不確定性的影響進行了分析,在此基礎(chǔ)上針對推力和質(zhì)量不確定性設(shè)計了自適應(yīng)控制器并進行了仿真驗證.
為簡化問題,考慮剛體形式的軟著陸懸停避障問題.考慮到在懸停避障階段,離月表比較接近,可以忽略月球自轉(zhuǎn)的影響.設(shè)懸停避障開始時刻著陸器點為坐標系原點,豎直向上為z方向,x和y方向與z方向成右手坐標系.
基于以上假設(shè),著陸器的平動和轉(zhuǎn)動方程可寫為:
(1)
(2)
(3)
(4)
其中:r∈R3表示著陸器相對于月表的位置;v∈R3表示著陸器相對于月球表面的速度;g:=[0 0 1.62] m/s2表示月表的重力加速度矢量;R∈R3×3為本體姿態(tài)相對于慣性空間的方向余弦矩陣;F∈R表示推力,m∈R表示質(zhì)量;e3=(0 0 1)T表示本體系推力方向矢量;ω:=(ω1ω2ω3)∈R3表示衛(wèi)星相對于慣性系的角速度,并且在本體系表達;u∈R3表示控制力矩;J∈R3×3為慣量陣;ω×定義如下:
假設(shè)1.相對月表的位置r可以通過導(dǎo)航系統(tǒng)得到.
假設(shè)2.設(shè)指令推力為Fcmd,實際推力F,實際推力與指令推力之間的關(guān)系為F=(1+x)Fcmd,其中x為偏差百分比.為簡化問題,假設(shè)x為常值.
假設(shè)3.設(shè)實際質(zhì)量為m,估計質(zhì)量為m0,實際質(zhì)量與估計質(zhì)量之間的關(guān)系為m=(1+y)m0,其中y為偏差百分比.為簡化問題,假設(shè)y為常值.
本文的控制目標為:基于假設(shè)1-3,設(shè)計推力F和力矩u的控制律,使得對一定范圍的給定懸停初始狀態(tài),有:
r→rf,v→0,R→I3,ω→0
設(shè)目標姿態(tài)對應(yīng)的方向余弦陣為Rd,指令推力為Fcmd,則應(yīng)該有:
(5)
其中制導(dǎo)律f(r,v)為位置和速度的函數(shù).
假設(shè)不存在推力和質(zhì)量不確定誤差,那么將(5)代入(1)~(2)后得
(6)
(7)
由式(6)~(7)可知,只要設(shè)計制導(dǎo)律f(r,v)使得在姿態(tài)角誤差收斂的同時,子系統(tǒng)(6)~(7)是漸近穩(wěn)定的即可.
當存在推力和質(zhì)量不確定性時,可得
(8)
定義
(9)
α為推力和質(zhì)量不確定性的綜合等參數(shù).由此,式(8)可以簡化為:
(10)
由式(10)可知,推力和質(zhì)量不確定性的效果是兩方面的.一方面,改變了制導(dǎo)律的增益,由于一般|α|<1,因此推力和質(zhì)量不確定性一般不改變制導(dǎo)律的收斂性質(zhì);另一方面,推力和質(zhì)量的不確定性在豎直方向產(chǎn)生了常值加速度.為了消除此常值加速度的影響,一般有兩種方法:一種是在豎直通道引入積分項,即采用PID形式的制導(dǎo)律;另外一種是對不確定參數(shù)α進行辨識,并引入制導(dǎo)律的設(shè)計當中.考慮到積分過程一般比較緩慢,下面主要針對第二種思路進行控制器設(shè)計.
基于式(9),平動子系統(tǒng)動力學(xué)為
(11)
(12)
(13)
其中,ξ∈R和η∈R3為估計器的狀態(tài)變量,Kr∈R3和kv∈R為增益系數(shù)矩陣.
設(shè)α和v的觀測誤差分別為:
(14)
(15)
對式(15)求導(dǎo)可得
(16)
可設(shè)
(17)
將式(17)代入式(16)可得:
(18)
對式(14)求導(dǎo),可得:
(19)
設(shè)
(20)
將式(20)代入式(19),可得
(21)
進一步求導(dǎo),可得:
(22)
為證明觀測誤差方程(22)的收斂性,首先介紹引理1.
引理1.考慮如下所示的二階系統(tǒng):
(23)
其中,[x1x2]∈R×R為狀態(tài)變量,kp,δkp>0,kd>0為反饋系數(shù).則方程(23)全局漸近穩(wěn)定的一個充分條件如下:
(24)
證明.針對方程(23)構(gòu)造如下所示的Lyapunov函數(shù):
(25)
易知V1>0.對V1求導(dǎo)并代入式(23)可得
(26)
總結(jié)推力和質(zhì)量不確定性的觀測器如下:
(27)
(28)
(29)
基于對不確定性的估計結(jié)果,設(shè)計推力控制律為:
(30)
采用式(30)所示的控制律的優(yōu)點主要包括3個方面:(1)通過嵌套飽和函數(shù),可以在初始速度過大時優(yōu)先進行減速過程;(2)可以控制各個分量的最大加速度大小,有效地限制本體的最大傾斜角,從而防止著陸器的翻倒并保證敏感器的視場;(3)通過限制式(30)的垂向分量,還可以防止發(fā)動機推力的奇異.
為表述方便,設(shè):
(31)
基于式(30),可以提取出目標推力為:
(32)
(33)
(34)
θ3d=0
(35)
由θd可計算得到目標四元數(shù)qd,從而可得到本體相對于目標姿態(tài)的誤差四元數(shù)δq,具體過程可參考文獻[2],在此略.
下面給出平動子系統(tǒng)的收斂性證明.由此首先需要介紹引理2.
引理2[5]. 考慮如下所示的二階系統(tǒng):
(36)
其中,(x1,x2)∈R×R為狀態(tài)變量,δ(t):R+→R為外界干擾,λ1,λ2,K1,K2為正常數(shù).如果δ(t)→0,t→∞,并且各個參數(shù)滿足如下所示的關(guān)系式:
K2λ1<λ2
(37)
那么狀態(tài)(x1,x2)的最終收斂到零.
引理2的證明可參考文獻[5],具體過程略.
將(30)代入式(1)~(2)可得:
(38)
(39)
設(shè)
(40)
式(39)即可簡化為式(36)的形式.
r→rf,v→0
證畢.
事實上,當δ(t)不趨于零但最終界很小時,仍然可以得到位置和速度最終有界的結(jié)果.由于篇幅所限,在此省略其證明.
設(shè)計姿態(tài)跟蹤控制律為:
u=-kpδqv-kvω
(41)
其中δqv為δq的矢量部分.
為理論上保證姿態(tài)跟蹤系統(tǒng)的穩(wěn)定,事實上式(41)還應(yīng)考慮到對目標角速度和目標角加速度的前饋,其控制律形式如下:
(42)
月表重力加速度矢量為g=[0 0 -1.62] m/s2.選取著陸器的參數(shù)為:
控制參數(shù)的選擇為:Kr=[0.4 0.4 0.4]T,kv=1.6,σ(0)=38,η(0)=[150 183.5 -169]T,K1=[0.037 5 0.037 5 0.046 9]T,K2=[0.081 0.081 0.12]T,λ1=[0.49 0.49 0.49]T,λ2=[6 6 4]T.
仿真結(jié)果如圖1~7所示.圖1與圖2分別顯示了位置和速度的控制結(jié)果,對于所設(shè)定的初始狀態(tài),在60s左右的時間即到達了安全著陸點上方.圖3顯示了本體相對于慣性系的三軸歐拉角(轉(zhuǎn)序123),三軸姿態(tài)最大在15°左右,能夠保證著陸過程的姿態(tài)安全和正常的敏感器視場.圖4顯示了本體的角速度,盡管沒有對目標姿態(tài)角和角速度進行前饋,姿態(tài)系統(tǒng)最終仍然是漸近穩(wěn)定的.圖5顯示了主發(fā)動機推力方向與豎直方向的夾角,在避障過程中推力最大偏斜角不超過20°.圖6顯示了主發(fā)動機推力大小.圖7給出了α的真實值與估計值的比對結(jié)果.由于質(zhì)量消耗,α成不斷增大的趨勢,但是采用本文的方法仍然能夠很好地跟蹤時變的α.由圖7可進一步看出,由于α的時變特性,α的辨識結(jié)果有微小的常偏,但是由圖1和圖2可見,此時仍然能夠獲得較好的懸停避障效果,表明本文的制導(dǎo)律有較好的魯棒性.
圖8顯示了本文方法與采用積分消除推力和質(zhì)量不確定的方法,及僅采用PD控制律的垂向控制結(jié)果的比較,其中積分系數(shù)已經(jīng)過反復(fù)調(diào)試為一個最優(yōu)值.由圖可見,僅采用PD形式制導(dǎo)律時,垂向方向控制緩慢,并且具有較大的高度常值偏差;對于采用積分的方法來說,達到目標高度則需要大概120 s左右,比本文的方法慢了將近40 s的時間.
針對存在推力和質(zhì)量不確定性的月球著陸器的懸停避障問題,本文提出了一種對不確定性進行快速辨識的方法.該方法利用浸入與不變流形的基本原理,以位置測量值作為觀測器輸入,可以實現(xiàn)不確定性辨識誤差的快速收斂,同時可以減少辨識結(jié)果的波動.數(shù)值仿真表明,使用本文所提的方法可以快速實現(xiàn)豎直通道的高精度控制.后續(xù)將對噴氣控制和存在姿控干擾力的情形進行進一步深入研究.
[1] ABDESSAMEUD A, TAYEBI A. Global trajectory tracking control of VTOL-UAVs without linear velocity measurements[J]. Automatica, 2010, 46(6): 1053-1059.
[2] HU J, ZHANG H. Immerion and invariance based command-filtered adaptive backstepping control of VTOL vehicles[J]. Automatica, 2013, 49(7): 2160-2167.
[3] 杜輝. 基于無源性的帶液體晃動月球著陸器的姿態(tài)控制[J]. 空間控制技術(shù)與應(yīng)用, 2011, 37(1): 50-54.
DU H. Passivity based attitude control for lunar lander with fuel sloshing[J]. Aerospace Control And Application, 2011, 37(1): 50-54.
[4] 杜輝,張洪華.一類帶液體晃動航天器的姿態(tài)控制[J]. 空間控制技術(shù)與應(yīng)用, 2010, 36(2): 25-30.
DU H,ZHANG H H. Attitude control for a kind of spacecraft with fuel slosh[J]. Aerospace Control and Application, 2010, 36(2): 25-30.
[5] 胡錦昌,張洪華.月球著陸器最終下降段的制導(dǎo)與控制方法研究 [J]. 宇航學(xué)報, 2012, 33(11): 1577-1585.
HU J C,ZHANG H H. Guidance and control method for lunar lander’s final descent phase[J]. Journal of Astronautics, 2012, 33(11): 1577-1585.
[6] ASTOLFI A, KARAGIANNIS D, ORTEGA R. Nonlinear and Adaptive Control with Applications,Springer, London, 2008.
HoveringandAvoidanceMethodofLunarLandersBasedonAdaptiveControl
HU Jinchang1,2, ZHANG Honghua1,2, LI Maomao1,2
(1.BeijingInstituteofControlEngineering,Beijing100190,China;2.ScienceandTechnologyonSpaceIntelligentControlLaboratory,Beijing100190,China)
When mass and force uncertainties are taken into account, it will be difficult for lunar landers to hover on the designed height. To address this problem, we propose a new method for hovering and avoidance which is based on adaption.The core idea is to employ the position as the input of the observer for estimating and compensating the uncertainties. Compared with conventional PID methods, the proposed control strategy enjoys the properties of fast speed and small fluctuation, and it is able to realize high performance for hovering and avoidance. Numerical simulations demonstrate the effectiveness of the proposed approach.
lunar landing; hovering and avoidance; uncertainties of mass and thrust force; immersion and invariance.
*國家青年自然科學(xué)基金資助項目(61403031).
2017-05-08
V448.22
A
1674-1579(2017)06-0025-07
10.3969/j.issn.1674-1579.2017.06.005
胡錦昌(1984—),男,高級工程師,研究方向為航天器姿態(tài)控制、非線性系統(tǒng)控制;張洪華(1963—),男,研究員,研究方向為深空探測導(dǎo)航、制導(dǎo)與控制,非線性系統(tǒng)控制等;李毛毛(1990—),男,博士研究生,研究方向為航天器導(dǎo)航、制導(dǎo)與控制.