高 艾,崔平遠(yuǎn),,崔祜濤
(1.北京理工大學(xué)深空探測技術(shù)研究所,100081 北京;2.哈爾濱工業(yè)大學(xué)深空探測基礎(chǔ)研究中心,150001 哈爾濱)
深空著陸器對偶控制策略
高 艾1,崔平遠(yuǎn)1,2,崔祜濤2
(1.北京理工大學(xué)深空探測技術(shù)研究所,100081 北京;2.哈爾濱工業(yè)大學(xué)深空探測基礎(chǔ)研究中心,150001 哈爾濱)
以深空著陸任務(wù)為背景,針對視覺導(dǎo)航過程中由于有限觀測能力引起的估計性能不佳問題,研究了一種深空著陸器對偶控制策略.該策略將導(dǎo)航估計不確定性引入系統(tǒng)狀態(tài),給出包含與估計方差相關(guān)的二次型性能指標(biāo)評價方法,利用著陸狀態(tài)可觀測性與著陸軌跡之間的耦合特性,合理優(yōu)化觀測軌跡,克服著陸過程中可觀測性缺乏問題,大幅度提高系統(tǒng)的導(dǎo)航估計性能,使深空著陸器導(dǎo)航制導(dǎo)控制整體性能得到保障.
深空探測軟著陸;自主GNC技術(shù);非線性耦合;對偶控制
深空著陸過程中,由于著陸器受到各種不確定性因素影響,其制導(dǎo)控制律的設(shè)計必須建立在對系統(tǒng)狀態(tài)最優(yōu)估計的基礎(chǔ)上,這使得精確的導(dǎo)航定位顯得尤為關(guān)鍵;加之著陸時間較短,深空環(huán)境中通信延遲時間較長,基于地面站的導(dǎo)航制導(dǎo)控制模式不再適用,因此發(fā)展深空著陸自主實時精確的導(dǎo)航制導(dǎo)控制策略已成為目前國內(nèi)外學(xué)者研究的熱點.
傳統(tǒng)的制導(dǎo)控制設(shè)計過程是基于確定性等價假設(shè),其制導(dǎo)控制策略的選取與導(dǎo)航估計不確定性互不影響,從而可將系統(tǒng)的導(dǎo)航制導(dǎo)控制設(shè)計分為兩個獨立的過程,即利用導(dǎo)航濾波器從噪聲污染測量中估計出系統(tǒng)狀態(tài);再假設(shè)這樣的估計狀態(tài)即為系統(tǒng)的真實狀態(tài),利用傳統(tǒng)的制導(dǎo)控制技術(shù)給出到達(dá)目標(biāo)著陸區(qū)域所需的控制量.由于這種方法簡便易行且運算量低,因此成為以往著陸段任務(wù)制導(dǎo)控制策略的選擇[1-2].
然而,對于非線性的著陸器系統(tǒng)而言,其可觀測性與狀態(tài)軌跡間存在非線性耦合,因此其可觀測性會受到系統(tǒng)狀態(tài)軌跡的影響[3].當(dāng)觀測能力受到限制時,有限的觀測能力會導(dǎo)致缺乏狀態(tài)觀測的估計性能不佳,進(jìn)而弱化制導(dǎo)控制性能,尤其對于具有不規(guī)則引力場特性的小行星著陸制導(dǎo)控制而言,一個很小的控制偏差會導(dǎo)致最終著陸器與目標(biāo)著陸點的大范圍偏離,達(dá)到可靠的著陸性能就變得極具挑戰(zhàn)性.因此,利用盡可能少的導(dǎo)航敏感器,通過優(yōu)化觀測軌跡,在滿足著陸任務(wù)要求的同時,盡可能地減小導(dǎo)航定位誤差,從而提高導(dǎo)航制導(dǎo)控制系統(tǒng)的整體性能是深空著陸過程中亟待解決的問題.
為了使這類非線性系統(tǒng)達(dá)到更好的控制性能,A.A.Feldbaum[4-6]首先提出了對偶效應(yīng)的概念,指出控制輸入具有雙重性目的:一是達(dá)到系統(tǒng)穩(wěn)定的控制目標(biāo);二是改善系統(tǒng)狀態(tài)估計信息.二者緊密耦合而不能分離,這種耦合導(dǎo)致了無法獲得最優(yōu)控制的解析解.自此以后,國內(nèi)外學(xué)者針對這一主題開展了大量的研究工作,并已獲得一些簡單問題的最優(yōu)解.J.Sternby[7]解決了四狀態(tài)馬爾科夫鏈問題;B.Bernbardsson[8]處理了具有雙增益的一階系統(tǒng).此外,還求得了一些簡單的自適應(yīng)對偶控制問題的代數(shù)解[9].然而,已得到解決的問題僅是特例,那些具有合理規(guī)模的問題幾乎都是既無解析解又無數(shù)值解的不可解問題.處理某些對偶特性的多種次優(yōu)技術(shù)[10-11],同時被發(fā)展應(yīng)用于自適應(yīng)控制和隨機控制.對于更特殊的物理背景應(yīng)用——采用單角度測量的導(dǎo)彈攔截備受關(guān)注,多個不同的對偶控制制導(dǎo)律被提出[12-13].這些技術(shù)分別通過加入擾動信號、約束估計量變化、修正代價函數(shù)和利用有限參數(shù)逼近價值函數(shù)等手段提供問題的近似解.其中存在兩種相對簡單和直觀的方法:1)增加一個試探性的控制輸入以改進(jìn)系統(tǒng)狀態(tài)的可觀性.這種方法簡單易行,附加控制輸入可與確定性控制輸入的設(shè)計過程分離開,由一系列啟發(fā)式方法獨立完成,但在設(shè)計流程中缺乏系統(tǒng)性方法且整體性能嚴(yán)重依賴于啟發(fā)式方法的選取;2)構(gòu)造代價函數(shù),該代價函數(shù)是標(biāo)準(zhǔn)代價函數(shù)與系統(tǒng)誤差方差標(biāo)量函數(shù)的加權(quán).這種方法的優(yōu)點在于可直接應(yīng)用數(shù)值搜索技術(shù)進(jìn)行求解,然而其搜索空間會隨時間呈指數(shù)增長,因此求解問題相當(dāng)有限.同時,代價加權(quán)系數(shù)的選取同樣缺乏系統(tǒng)性方法,這會導(dǎo)致最終構(gòu)造的代價函數(shù)與實際代價相距甚遠(yuǎn).
本文以基于單目視覺導(dǎo)航的深空著陸制導(dǎo)控制任務(wù)為背景,考慮有效控制與可靠估計間的對偶問題,通過擴展?fàn)顟B(tài)空間將系統(tǒng)不確定性作為部分代價引入二次型性能指標(biāo)中,從而采用簡便易行的線性二次型控制技術(shù)給出隨機優(yōu)化反饋控制律.該對偶控制策略利用非線性系統(tǒng)可觀測性與狀態(tài)軌跡間存在的非線性耦合關(guān)系來克服著陸過程中可觀測性缺乏的問題,通過合理地優(yōu)化著陸器下降軌跡,大幅度提高系統(tǒng)的導(dǎo)航估計性能,使深空著陸器導(dǎo)航制導(dǎo)控制整體性能得到保障.
定義著陸點固連坐標(biāo)系Σl:ol-xlylzl,該坐標(biāo)系原點ol位于預(yù)定的著陸點,olzl軸與行星質(zhì)心指向著陸點矢量oiol方向一致.olxl沿經(jīng)線的切線方向指向南極方向,olyl與olxl、olzl之間滿足右手法則,如圖1所示.
圖1 坐標(biāo)系定義
圖1中坐標(biāo)系Σi:oi-xiyizi為行星中心慣性坐標(biāo)系,其原點在行星的質(zhì)量中心,zi軸沿行星最大慣量軸方向,xi軸沿歷元時刻行星最小慣量軸所指方向,yi軸與xi軸、zi軸之間滿足右手法則.
在著陸點固連坐標(biāo)系下建立探測器動力學(xué)方程
式中:r,v分別為著陸器相對于預(yù)定著陸點的位置矢量與速度矢量;u為控制加速度;g為行星引力加速度;ae,ak分別為由行星自旋所引起的離心慣性加速度與科氏加速度;aΔ為未建模加速度.
將式(1)中的加速度項-ae-ak+aΔ作為系統(tǒng)過程噪聲處理,得到如下動力學(xué)模型
式中:x=[r v]T為著陸器狀態(tài);Er=[I0]為系數(shù)矩陣;A= [[0 0]T[I0]T]為系統(tǒng)矩陣;B=[0 I]T為輸入矩陣,ω =-ae-ak+aΔ為系統(tǒng)過程噪聲.
這里采用基于單目視覺矢量測量的光學(xué)相對導(dǎo)航方案,選擇著陸點固連坐標(biāo)系下探測器的位置矢量作為觀測量,則觀測模型為
式中:rc=Cclr= [rcxrcyrcz]T為探測器相對于目標(biāo)著陸點的位置矢量在相機坐標(biāo)系下的投影;Ccl為著陸點坐標(biāo)系與相機坐標(biāo)系之間的轉(zhuǎn)換矩陣;υk為光學(xué)導(dǎo)航觀測噪聲.
對于線性系統(tǒng),可觀測性僅依賴于系統(tǒng)動力學(xué)和觀測模型.然而,對于非線性系統(tǒng)而言,由于可觀測性與狀態(tài)軌跡間存在非線性耦合,因此其可觀測性會受到系統(tǒng)狀態(tài)軌跡的影響.實際上,如果系統(tǒng)是動態(tài)可觀的,可以利用這種耦合來克服可觀測性的缺乏,從而達(dá)到更好的估計性能.
尤其對式(2)和式(3)描述的基于單目視覺導(dǎo)航控制的軟著陸過程而言,通過合理地規(guī)劃著陸器下降軌跡可以大幅度提高系統(tǒng)的可觀性.然而,如何在眾多可行軌跡中計算出最優(yōu)軌跡是一個富有挑戰(zhàn)性的隨機優(yōu)化任務(wù).由于有效控制與可靠估計間權(quán)衡問題的復(fù)雜性,普遍應(yīng)用的確定性等價控制技術(shù)和其他多種近似技術(shù)在該問題的處理中受到限制[14].這里考慮了該權(quán)衡問題的新的對偶控制算法,該算法將系統(tǒng)不確定性作為部分代價引入性能指標(biāo)中,并應(yīng)用線性二次型控制技術(shù)給出反饋控制率,進(jìn)而通過對深空著陸下降軌跡的隨機優(yōu)化,在滿足著陸任務(wù)要求的同時,盡可能地減小導(dǎo)航定位誤差,從而提高導(dǎo)航制導(dǎo)控制系統(tǒng)的整體性能.
將著陸器狀態(tài)x描述為分布在狀態(tài)空間中的粒子云 xi(i=1,2,…,N),期望狀態(tài) xd與每個粒子xi之間距離的平方和作為代價函數(shù)用于優(yōu)化.這一代價反映了粒子與期望狀態(tài)間的距離以及其分散程度.在某一特定時刻的控制性能可用二次型表達(dá)式描述為
式中:Wx為狀態(tài)偏差權(quán)重矩陣;Wu為控制燃耗權(quán)重矩陣.
則式(4)可整理為
式(5)中前2項為典型的二次型,如果能將第3項描述為二次型形式,則可以利用現(xiàn)有的數(shù)學(xué)工具對問題進(jìn)行求解.注意到誤差方差陣P為非負(fù)定矩陣,由矩陣?yán)碚摽芍瑢ΨQ的非負(fù)定矩陣P ∈R6×6可分解成P=SST,其中S∈R6×6為下三角陣,由P唯一確定,即矩陣P的下三角分解平方根陣為
為便于后記,設(shè)Wx為一對角陣,且Wx(i,i)=wii(i=1,2,…,6),則式(5)中最后一項可整理為
進(jìn)而,式(5)可改寫為
將式(6)對時間積分作為隨機優(yōu)化的性能指標(biāo)為
式(7)中前2項對應(yīng)于確定性等價控制代價,第3項對應(yīng)于系統(tǒng)不確定性代價.
綜上所述對于深空著陸器下降軌跡優(yōu)化問題可描述如下:
1)對于系統(tǒng)的擴展?fàn)顟B(tài)空間描述為
2)在時間區(qū)間[0,tf)上尋找最優(yōu)控制輸入u*,滿足
由于涉及協(xié)方差傳播和擴展空間描述的復(fù)雜性,尋求非線性控制系統(tǒng)的最優(yōu)解十分困難.這里采用無限時長穩(wěn)態(tài)增益狀態(tài)反饋控制技術(shù)獲得優(yōu)化問題的次優(yōu)解.
假設(shè)對于優(yōu)化問題(8)存在矩陣Γ滿足代數(shù)Riccati方程為
則反饋控制率有如下形式
式中:χss=[xdsss]T為擴展系統(tǒng)穩(wěn)態(tài)解;Kx主要側(cè)重于穩(wěn)定控制目標(biāo);Ks提供附加反饋控制用于削弱系統(tǒng)的不確定性,從而提高控制性能.
以小行星Eros433作為目標(biāo)天體,其自旋角速度為1 639.4(°)/d,名義半徑為16 km,引力常數(shù)為4.462 1×105m3·s-2,在仿真中采用其四階引力場模型.在著陸點固連坐標(biāo)系下,探測器初始位置為[500 20 -50]Tm,相對小行星表面速度為[1.5 2.0 0]Tm·s-1,預(yù)期著陸時間300 s.
考慮著陸器初始狀態(tài)估計誤差,其位置初始估計誤差與速度估計誤差分別服從方差為100 m2和0.1 m2·s-2的隨機分布時,利用傳統(tǒng)制導(dǎo)控制算法對著陸器進(jìn)行前饋控制,在預(yù)期著陸時間內(nèi)著陸器最終著陸速度高達(dá)3 m·s-1,在期望著陸時間內(nèi)存在撞入目標(biāo)天體的危險,如圖2所示.這主要是由于探測器狀態(tài)的可觀測性受系統(tǒng)狀態(tài)軌跡的影響,當(dāng)觀測能力受到限制時,導(dǎo)航估計誤差將持續(xù)增大,且其制導(dǎo)控制性能會隨著導(dǎo)航誤差的增大被大幅度弱化,如圖3所示.
圖2 傳統(tǒng)制導(dǎo)控制下著陸器下降軌跡
圖3 導(dǎo)航估計性能與制導(dǎo)控制性能對比
考慮導(dǎo)航估計誤差的存在,在行星著陸控制過程中加入本文設(shè)計的反饋對偶控制對著陸軌跡進(jìn)行隨機優(yōu)化,由圖4可見,探測器的估計誤差隨著下降軌跡的變化在不斷減小,末端著陸器真實狀態(tài)與前饋制導(dǎo)所產(chǎn)生的路徑點基本相符,其最終著陸位置偏差在5 m范圍內(nèi),速度偏差在0.05 m·s-1左右.由圖5給出的導(dǎo)航偏差與制導(dǎo)控制偏差的變化趨勢,可看出通過反饋對偶控制對前饋制導(dǎo)給出的下降軌跡的隨機優(yōu)化作用使導(dǎo)航與制導(dǎo)控制性能得到了整體提高.
圖4 隨機優(yōu)化反饋對偶控制下著陸器下降軌跡
觀察導(dǎo)航誤差與著陸器水平運動情況的關(guān)系,如圖6和圖7所示,可發(fā)現(xiàn)前饋制導(dǎo)給出的水平運動規(guī)劃十分平滑,特別是著陸末端著陸器在水平運動方向幾乎無變化,導(dǎo)航性能隨著規(guī)劃軌跡逐漸變差;而通過加入反饋對偶控制隨機優(yōu)化后的觀測軌跡在水平運動方向變化劇烈,導(dǎo)航性能逐步提高.可見,反饋對偶控制通過增加著陸器的水平運動,對運動軌跡進(jìn)行隨機優(yōu)化,提高了系統(tǒng)狀態(tài)的可觀測性.進(jìn)一步對比其控制燃耗與整體優(yōu)化性能指標(biāo),如圖8中數(shù)據(jù)顯示,盡管加入反饋對偶控制后系統(tǒng)控制燃耗增加,但其總體性能得到了102量級的提升.
圖5 導(dǎo)航估計性能與制導(dǎo)控制性能對比
圖6 傳統(tǒng)制導(dǎo)控制下著陸器水平運動趨勢對導(dǎo)航誤差的影響
圖7 反饋對偶控制下著陸器水平運動趨勢對導(dǎo)航誤差的影響
圖8 控制燃耗與總體性能對比
1)針對視覺導(dǎo)航過程中由于有限觀測能力引起的估計性能不佳問題,研究了一種深空著陸器對偶控制策略,利用非線性系統(tǒng)可觀測性與狀態(tài)軌跡間存在的非線性耦合關(guān)系來克服著陸過程中可觀測性缺乏的問題.
2)利用著陸過程中著陸狀態(tài)可觀測性與著陸下降軌跡之間的耦合特性,將導(dǎo)航估計不確定性引入并擴展系統(tǒng)狀態(tài),給出包含與估計方差相關(guān)的二次型性能指標(biāo)評價方法,使復(fù)雜優(yōu)化問題的求解變?yōu)榫€性二次型最優(yōu)控制的求解,避免了動態(tài)規(guī)劃與基于搜索方法的運算負(fù)擔(dān).
3)通過進(jìn)一步的仿真分析可知,該隨機優(yōu)化方法以控制燃耗為代價,通過對標(biāo)稱軌跡的合理優(yōu)化,在滿足著陸任務(wù)的同時,使導(dǎo)航估計性能大幅提高,從而使系統(tǒng)整體性能得到提升,達(dá)到可靠著陸行星的最終目標(biāo).
[1]KLUMPP A R.Apollo lunar descent guidance[J].Automatica,1974,10(2):133-146.
[2]SOSTARIC R R,REA J R.Powered descent guidance methods for the moon and mars[C]//Collection of Technical Papers- AIAA Guidance,Navigation,and Control Conference.San Francisco,USA:American Institute of Aeronautics and Astronautics Inc,2005:4495-4514.
[3]METTHIES L,KANADE T,SZELISKI R.Kalman filter-based algorithms for estimating depth from image sequences[J].International Journal of Computer Vision,1989,3(3):209-238.
[4]FELDBAUM A A.Dual control theory I-II[J].Automation and Remote Control,1960,21(9):874 -880,1033-1039.
[5]FELDBAUM A A.Dual control theory III-IV[J].Automation and Remote Control,1961,22:1-12,109-121.
[6]TSE E,BAR-SHALOM Y,MEIER L.Wide-sense adaptive dual control for nonlinear stochastic systems[J].IEEE Transactions on Automatic Control,1973,AC-18(2):98-108.
[7]STERNBY J.A simple dual control problem with an analytical solution[J].IEEE Transactions on Automatic Control,1976,21(6):840 -844.
[8]BERNHARDSSON B.Dual control of a first-order system with two possible gains[J].International Journal of Adaptive Control and Signal Processing,1989,3(1):15-22.
[9]ASTROM K J,WITTENMARK B.Adaptive Control[M].2nd ed.Boston,MA:Addison-Wesley Longman Publishing Co Inc,1995:365 -370.
[10]WITTENMARK B.Adaptive dual control methods:an overview[C]//Adaptive Systems in Control and Signal Processing 1995.A Postprint Volume from the 5th IFAC Symposium.Oxford,UK:Pergamon,1995:62-72.
[11]UNBEHAUEN H.Adaptive dual control systems:a survey[C]//Proceedings of the IEEE 2000 Adaptive Systems for Signal Processing,Communications,and Control Symposium(Cat.No.00EX373).Piscataway,NJ:IEEE,2000:171-180.
[12]CASLER R J.Dual-control guidance strategy for homing interceptors taking angle-only measure-ments[J].JournalofGuidance, Control, and Dynamics, 1978,1(1):63-70.
[13]HULL D G,SPEYER J L,BURRIS D B.Linear-quadratic guidance law for dual control of homing missiles[J].Journal of Guidance,Control,and Dynamics,1990,13(1):137-144.
[14]BRYSON A E,HO Y C.Applied Optimal Control[M].Hemisphere,New York:Taylor & Francis,1975:131-141.
[15]JULIER S J,UHLMANN J K.Unscented filtering and nonlinear estimation[C]//Proceedings of the IEEE.Piscataway,NJ:IEEE,2004:401-422.
[16]MERWE R,WAN E A.The square-root unscented Kalman filter for state and parameter estimation[C]//2001 IEEE InternationalConference on Acoustics,Speech,and Signal Processing.Proceedings(Cat.No.01CH37221).Piscataway,NJ:IEEE,2001:3461 -3464.
Dual control strategy of planetary lander
GAO Ai1,CUI Ping-yuan1,2,CUI Hu-tao1,2
(1.Institute of Deep Space Exploration Technology,Beijing Institute of Technology,100081 Beijing,China;2.Deep Space Exploration Research Center,Harbin Institute of Technology,150080 Harbin,China)
For landing on planet,a dual control strategy is developed to solve the problem of poor estimation performance which results from the lack of observability.The system uncertainty is incorporated into the quadratic performance index as a cost by extending state space,which takes advantage of the nonlinear coupling between observability and trajectory to overcome the lack of observability and to achieve better estimation performance.By stochastic optimizing the landing trajectory,the overall performance of GNC system for landing on planets is improved.
soft landing for deep space exploration;autonomous GNC technology;nonlinear coupling;dual control
V448.233
A
0367-6234(2012)11-0075-06
2012-02-13.
國家自然科學(xué)基金資助項目(60874094);國家高技術(shù)研究發(fā)展計劃資助項目(2010AA122206).
高 艾(1984—),女,博士,講師;
崔平遠(yuǎn)(1961—),男,教授,博士生導(dǎo)師;
崔祜濤(1970-),男,教授,博士生導(dǎo)師.
高 艾,gaoai@bit.edu.cn.
(編輯 張 紅)