柴 源,羅建軍,韓 楠,謝劍鋒
(1. 西北工業(yè)大學(xué)航天學(xué)院,西安 710072;2. 西北工業(yè)大學(xué)航天飛行動(dòng)力學(xué)技術(shù)重點(diǎn)實(shí)驗(yàn)室,西安 710072;3. 北京航天飛行控制中心,北京 100094)
近年來(lái),航天器在軌服務(wù)受到世界各國(guó)的重視。服務(wù)航天器與失效航天器形成組合體后通過(guò)自身執(zhí)行機(jī)構(gòu)可接管失效航天器姿軌控系統(tǒng),實(shí)現(xiàn)穩(wěn)定控制,失效航天器的接管控制作為一種急需的在軌服務(wù)受到廣泛關(guān)注[1-2]。由于目前在軌運(yùn)行的多數(shù)航天器事先未進(jìn)行可服務(wù)和可維修設(shè)計(jì),無(wú)交會(huì)對(duì)接輔助設(shè)備,因此,采用傳統(tǒng)的交會(huì)對(duì)接方法進(jìn)行接管控制存在困難。文獻(xiàn)[3]研究了空間機(jī)械臂的失效航天器姿態(tài)接管控制,但空間機(jī)械臂難以對(duì)失效航天器進(jìn)行長(zhǎng)周期姿態(tài)調(diào)整。文獻(xiàn)[4]研究了繩系空間機(jī)器人對(duì)非合作目標(biāo)進(jìn)行抓捕的問(wèn)題,但是存在繩索被割斷的可能性。此外,針對(duì)不同任務(wù)定制相應(yīng)的空間機(jī)械臂和繩系機(jī)器人,也需要消耗巨大的成本和時(shí)間。近年來(lái),微小衛(wèi)星技術(shù)得益于微電子技術(shù)的進(jìn)步而快速發(fā)展,具有發(fā)射成本低、研制周期短、可批量生產(chǎn)等優(yōu)勢(shì)。鳳凰計(jì)劃項(xiàng)目[5]和iboss系列任務(wù)[6]利用多顆微小衛(wèi)星來(lái)實(shí)現(xiàn)空間飛行器的部件再利用和新衛(wèi)星的在軌組裝,是微小衛(wèi)星應(yīng)用的新方向。文獻(xiàn)[7]通過(guò)多顆納星協(xié)同,設(shè)計(jì)辨識(shí)和控制一體化方法,實(shí)現(xiàn)失效衛(wèi)星的低成本姿態(tài)接管控制。其中多顆微衛(wèi)星如何通過(guò)分布式協(xié)同來(lái)實(shí)現(xiàn)失效航天器的姿態(tài)接管和長(zhǎng)期的姿軌協(xié)同控制,仍有很多理論和方法問(wèn)題需要解決。
多顆微衛(wèi)星對(duì)失效航天器姿態(tài)接管控制問(wèn)題的解決方案包括集中式控制和分布式控制等[8]。文獻(xiàn)[9]通過(guò)任務(wù)分配方法實(shí)現(xiàn)了多機(jī)器人的集中式控制,但是集中式控制依賴中央控制個(gè)體,容錯(cuò)性差,更適合控制中心可靠的場(chǎng)合。分布式控制通過(guò)個(gè)體之間信息的交互實(shí)現(xiàn)運(yùn)動(dòng)行為的協(xié)同,具有靈活性好、容錯(cuò)性高和容易拓展等優(yōu)勢(shì)。傳統(tǒng)的分布式協(xié)同控制[10-12]基于相對(duì)運(yùn)動(dòng)模型來(lái)設(shè)計(jì)控制器,更適合編隊(duì)、集群等空間任務(wù);文獻(xiàn)[13]利用分布式控制分配方法實(shí)現(xiàn)空間細(xì)胞機(jī)器人的姿態(tài)接管,但是頻繁不斷進(jìn)行的控制分配增加了機(jī)器人計(jì)算負(fù)擔(dān)。
微分博弈方法研究了多個(gè)參與者的最優(yōu)決策與控制問(wèn)題,其中每個(gè)個(gè)體通過(guò)優(yōu)化各自性能指標(biāo)函數(shù)可得到各自的控制策略[14]。該方法可以視為一種特殊的分布式控制,其通信拓?fù)浣Y(jié)構(gòu)為可切換的全連通拓?fù)洌试S個(gè)體的加入與退出,具有容錯(cuò)性和靈活性。文獻(xiàn)[15]將微分博弈方法用于多智能體的一致性控制問(wèn)題中;文獻(xiàn)[16]研究了在軌衛(wèi)星的追逃博弈問(wèn)題;文獻(xiàn)[17]將二人非零和微分博弈方法用于航天器對(duì)接任務(wù)中。
本文將失效航天器姿態(tài)接管控制問(wèn)題轉(zhuǎn)化為多顆微衛(wèi)星的微分博弈問(wèn)題,從而通過(guò)微衛(wèi)星的自主決策實(shí)現(xiàn)分布式姿態(tài)接管控制。該問(wèn)題的關(guān)鍵在于求解耦合的HJ(Hamilton-Jacobi)方程得到多顆微衛(wèi)星的納什均衡策略[18],但是由于HJ方程的非線性及耦合性,很難得到解析解。傳統(tǒng)的解法大多采用離線計(jì)算[19],近年來(lái)提出的基于策略迭代的求解算法,利用神經(jīng)網(wǎng)絡(luò)近似值函數(shù),但是權(quán)值的調(diào)整依賴于經(jīng)驗(yàn)[20]。本文采用狀態(tài)相關(guān)黎卡提方程(State-dependent Riccati equation, SDRE)方法,引入狀態(tài)相關(guān)系數(shù)(State-dependent coefficient, SDC)矩陣[19-20]將非線性模型轉(zhuǎn)化為狀態(tài)相關(guān)線性模型,從而得到狀態(tài)相關(guān)線性二次型微分博弈[21],通過(guò)對(duì)耦合的狀態(tài)相關(guān)黎卡提方程組進(jìn)行求解,得到微分博弈的納什均衡,從而得到微衛(wèi)星控制策略的閉環(huán)表達(dá)式。
為了實(shí)現(xiàn)對(duì)失效航天器的姿態(tài)接管控制,N顆微衛(wèi)星需要通過(guò)自身的執(zhí)行機(jī)構(gòu)實(shí)現(xiàn)組合航天器的姿態(tài)穩(wěn)定,如圖1所示。本文采用基于SDRE的微分博弈方法進(jìn)行姿態(tài)接管控制?;炯僭O(shè)如下:
1)微衛(wèi)星和失效航天器均為剛體。
2)微衛(wèi)星已貼附在失效航天器上,且在姿態(tài)穩(wěn)定過(guò)程中,各顆微衛(wèi)星的相對(duì)位置保持不變。
3)失效航天器的姿控系統(tǒng)完全失效,所需控制力矩僅由微衛(wèi)星提供。
4)微衛(wèi)星上安裝有三軸正交的反作用飛輪。
5)組合航天器的轉(zhuǎn)動(dòng)慣量已辨識(shí)且保持不變。
圖1 微衛(wèi)星姿態(tài)接管控制示意圖
所涉及的坐標(biāo)系定義如下:
1)微衛(wèi)星i(i∈N)本體坐標(biāo)系Oixiyizi:Oi表示微衛(wèi)星i的質(zhì)心,xi,yi,zi分別表示微衛(wèi)星i的三個(gè)慣量主軸,在三個(gè)慣量主軸上各安裝一個(gè)反作用飛輪。
2)參考坐標(biāo)系Oxyz:用來(lái)描述每顆微衛(wèi)星的方位。選取微衛(wèi)星1的本體坐標(biāo)系為參考坐標(biāo)系,則其他微衛(wèi)星相對(duì)于微衛(wèi)星1的方位可由各自的本體坐標(biāo)系與參考坐標(biāo)系之間的轉(zhuǎn)換矩陣來(lái)描述。
假設(shè)微衛(wèi)星和失效航天器均為剛體,因此姿態(tài)接管控制過(guò)程,由N顆微衛(wèi)星和失效航天器形成的組合航天器的姿態(tài)運(yùn)動(dòng)可由剛體航天器的姿態(tài)運(yùn)動(dòng)學(xué)方程來(lái)描述。本文采用修正羅德里格斯參數(shù)(Modified Rodrigues parameters, MRPs)描述姿態(tài),以避免奇異。組合航天器的姿態(tài)運(yùn)動(dòng)學(xué)方程為[7]
(1)
式中:σ∈R3×1是以MRPs表示的組合航天器姿態(tài)角;ω∈R3×1為組合航天器的姿態(tài)角速度。M(σ)為可逆矩陣,有
(2)
式中:σ×=[0,-σ3,σ2;σ3,0,-σ1;-σ2,σ1,0];I3為3×3的單位對(duì)角陣。
組合航天器的姿態(tài)動(dòng)力學(xué)方程為
(3)
式中:J∈R3×3是組合航天器在參考坐標(biāo)系Oxyz中的轉(zhuǎn)動(dòng)慣量矩陣;N是微衛(wèi)星的個(gè)數(shù);Cj∈R3×3是從微衛(wèi)星j的本體坐標(biāo)系Ojxjyjzj到參考坐標(biāo)系Oxyz的轉(zhuǎn)換矩陣,用來(lái)表示微衛(wèi)星j的方位[7];uj∈R3×1為微衛(wèi)星j在本體坐標(biāo)系Ojxjyjzj的三軸姿態(tài)控制力矩;ω×=[0,-ω3,ω2;ω3,0,-ω1;-ω2,ω1,0]。
根據(jù)組合航天器的姿態(tài)運(yùn)動(dòng)學(xué)模型和姿態(tài)動(dòng)力學(xué)模型,可得多顆微衛(wèi)星接管失效航天器姿態(tài)運(yùn)動(dòng)的微分博弈模型為
(4)
式中:x=[σT,ωT]T∈R6×1,且
(5a)
(5b)
式中:03為3×3的全0矩陣。
微衛(wèi)星的性能指標(biāo)函數(shù)定義為
(6)
定義1.可行控制策略集[17]:若反饋控制策略u(píng)i(x)在緊集Ω上連續(xù),ui(0)=0,反饋控制策略集u(x)={u1(x),…,uN(x)}在Ω上能夠穩(wěn)定式(4),且式(6)對(duì)于任意的x0∈Ω是有限的,則u(x)在Ω上相對(duì)于式(6)定義為可行的,記作ui(x)∈Ψ(Ω)。
對(duì)于給定的可行控制策略,微衛(wèi)星的值函數(shù)可表示為
(7)
并滿足Vi(x)>0,Vi(0)=0且連續(xù)可微。
(8)
多顆微衛(wèi)星的微分博弈可以由下式來(lái)描述
(9)
微衛(wèi)星的值函數(shù)的微分等價(jià)形式為
(10)
定義哈密爾頓函數(shù)為
(11)
(12)
將式(12)代入式(10)中可以得到N個(gè)耦合的HJ方程
(13)
(14)
式中:A(x)=[03,M(σ);03,-J-1ω×J]∈R6×6是與狀態(tài)相關(guān)的狀態(tài)矩陣,且(A(x),Bj)滿足能控性秩判據(jù)。根據(jù)上述分析,將非線性微分博弈問(wèn)題轉(zhuǎn)化為由式(14)和式(6)描述的狀態(tài)相關(guān)線性二次型微分博弈問(wèn)題,能夠在保留了原模型的非線性特性的同時(shí),使得微分博弈問(wèn)題更加易于求解[19]。
針對(duì)狀態(tài)相關(guān)線性模型(14),獨(dú)立優(yōu)化每顆微衛(wèi)星的性能指標(biāo)函數(shù)(6),可以得到每顆微衛(wèi)星的控制策略,實(shí)現(xiàn)失效航天器的姿態(tài)接管控制。
定理1. 對(duì)于狀態(tài)相關(guān)線性二次型微分博弈問(wèn)題,在系統(tǒng)(A(x),Bi)完全能控的條件下,線性狀態(tài)反饋控制策略為
(15)
對(duì)稱正定矩陣Pi(x)∈R6×6為下面耦合狀態(tài)相關(guān)黎卡提方程組的解
(16)
證. 為了方便推導(dǎo),在證明中將Pi(x)記為Pi,將A(x)記為A。
假設(shè)最優(yōu)值函數(shù)(9)在狀態(tài)x(t)下有線性二次型形式的解
(17)
則可得
(18)
忽略式(18)中的高階項(xiàng),則微衛(wèi)星i(?j≠i)對(duì)應(yīng)的反饋控制為
(19)
將其代入式(10)中可得
(20)
整理為二次型形式得
(21)
(22)
將其代入式(21)得
(23)
整理得
0=xT(Qi+PiA+ATPi-
(24)
由于存在下式關(guān)系
(25)
則可以得到
(26)
(27)
取i=1,2,…,N,可以得到耦合的狀態(tài)相關(guān)黎卡提方程組(16),對(duì)其求解可以得到矩陣Pi,從而得到狀態(tài)反饋控制策略(15)。
根據(jù)上述分析,系統(tǒng)模型可以表示為如下形式
(28)
(29)
式中:ψ(x)是高階展開(kāi)項(xiàng),且滿足
(30)
因此,在原點(diǎn)的鄰域內(nèi),常系數(shù)矩陣Acl(0)的穩(wěn)定,保證了系統(tǒng)的局部漸近穩(wěn)定性。
注1.要求系統(tǒng)完全能控是為了保證系統(tǒng)的穩(wěn)定性。由于控制區(qū)間為無(wú)限時(shí)域,若出現(xiàn)狀態(tài)不能控,無(wú)論采取任何控制策略,性能指標(biāo)都會(huì)趨于無(wú)窮大。
注2.上述定理得到的狀態(tài)反饋控制律,在每一時(shí)刻更新?tīng)顟B(tài)x(t),得到對(duì)應(yīng)的狀態(tài)矩陣A(x),并通過(guò)求解耦合狀態(tài)相關(guān)黎卡提方程組(16)得到對(duì)稱正定矩陣Pi(x),在下一時(shí)刻重復(fù)上述過(guò)程,得到時(shí)變的狀態(tài)反饋調(diào)節(jié)器,能方便地實(shí)現(xiàn)閉環(huán)控制,這在工程應(yīng)用中具有十分重要的意義。
對(duì)于耦合的狀態(tài)相關(guān)黎卡提方程組(16),要求在每一步求解耦合的代數(shù)黎卡提方程組。目前對(duì)于耦合代數(shù)黎卡提方程組的求解有很多研究成果[14,21],本文采用李雅普諾夫迭代法進(jìn)行計(jì)算。該方法將耦合的代數(shù)黎卡提方程組降階并解耦為李雅普諾夫方程來(lái)獨(dú)立運(yùn)算,算法速度快,準(zhǔn)確性高。本文將文獻(xiàn)[21]中針對(duì)二人微分博弈得到的迭代算法進(jìn)行歸納,給出一般性的李亞普諾夫迭代公式。
迭代算法:
k=0,1,2,…;i= 1,…,N
(31)
初值選擇:
(32)
通過(guò)迭代求解李亞普諾夫方程(31)可以得到狀態(tài)x(t)下的矩陣Pi(x)(i∈N)。
為了驗(yàn)證對(duì)失效航天器姿態(tài)接管的SDRE微分博弈控制方法的有效性和容錯(cuò)性,對(duì)組合航天器的姿態(tài)穩(wěn)定控制過(guò)程進(jìn)行仿真研究。
假設(shè)采用三顆微衛(wèi)星對(duì)失效航天器進(jìn)行姿態(tài)接管控制,微衛(wèi)星可提供的控制力矩滿足|u|≤0.25 N·m,其各自的本體坐標(biāo)系到參考坐標(biāo)系的轉(zhuǎn)換矩陣為
組合航天器的轉(zhuǎn)動(dòng)慣量矩陣為
組合航天器以MRPs表示的初始姿態(tài)角為σ0=[0.015,0.009,0.013]T,初始姿態(tài)角速度為ω0=[0,0,0]T。取兩個(gè)微衛(wèi)星的權(quán)重矩陣分別為Q1=5I6,Q2=5I6,Q3=5I6,R11=R12=R13=0.01I3,R21=R22=R23=0.01I3,R31=R32=R33=0.01I3。取仿真步長(zhǎng)為dt=0.01s。在上述參數(shù)下,仿真驗(yàn)證SDRE微分博弈控制的有效性。
圖2和圖3是組合航天器分別以MRPs和歐拉角表示的姿態(tài)角變化曲線,圖4是組合航天器的姿態(tài)角速度變化曲線。從圖中可以看出,組合航天器在40 s到達(dá)穩(wěn)定狀態(tài),精度為1×10-5量級(jí),在仿真結(jié)束時(shí),可以達(dá)到更高的精度。因此,基于微分博弈的姿態(tài)控制器可以實(shí)現(xiàn)失效航天器的姿態(tài)穩(wěn)定。
圖2 姿態(tài)角σ曲線
圖3 姿態(tài)角歐拉角曲線
圖4 姿態(tài)角速度ω曲線
圖5是姿態(tài)接管控制階段三顆微衛(wèi)星的控制力矩隨時(shí)間變化曲線。在初始控制階段,由于狀態(tài)量幅值較大,因此所需的控制力矩也較大,隨著狀態(tài)量幅值的不斷減小,所需控制力矩也逐漸減小。
圖5 微衛(wèi)星控制力矩曲線
為了驗(yàn)證該方法的容錯(cuò)性,設(shè)計(jì)如下仿真場(chǎng)景。采用三顆微衛(wèi)星對(duì)失效航天器進(jìn)行姿態(tài)接管控制時(shí),微衛(wèi)星2在第6 s執(zhí)行機(jī)構(gòu)失效,無(wú)法提供控制力矩,則前6 s姿態(tài)接管控制所需控制力矩由三顆微衛(wèi)星提供,在6 s之后僅由微衛(wèi)星1和微衛(wèi)星2提供。其他仿真參數(shù)與4.1節(jié)仿真參數(shù)相同。
圖6為以歐拉角表示的姿態(tài)角和角速度隨時(shí)間變化曲線,圖7為三顆微衛(wèi)星的控制力矩變化曲線。從圖6可以看出,在存在一顆微衛(wèi)星失效的情況,其他的微衛(wèi)星將失效微衛(wèi)星視為不參與,更新參與者個(gè)數(shù),解算控制力矩使組合航天器的狀態(tài)趨于穩(wěn)定。從圖7可以看出,前6 s的仿真結(jié)果和4.1節(jié)中前6 s的仿真結(jié)果一致。在第6 s,微衛(wèi)星3無(wú)法提供控制力矩,微衛(wèi)星1和微衛(wèi)星2在更新參與者個(gè)數(shù)后計(jì)算各自的控制力矩,因此在圖7中可以看到6 s時(shí)微衛(wèi)星1和微衛(wèi)星2的控制力矩會(huì)有突變。6 s之后的微衛(wèi)星3的控制力矩為0,微衛(wèi)星1和微衛(wèi)星2的控制力矩逐漸趨于0。仿真結(jié)果表明本文提出的微分博弈方法具有容錯(cuò)性。
圖6 部分微衛(wèi)星失效的姿態(tài)角和角速度變化曲線
圖7 部分微衛(wèi)星失效的微衛(wèi)星控制力矩曲線
本文采用SDRE微分博弈方法研究了多顆微衛(wèi)星接管姿態(tài)控制系統(tǒng)失效的航天器的控制問(wèn)題,通過(guò)引入SDC矩陣將多顆微衛(wèi)星的非線性微分博弈轉(zhuǎn)化為狀態(tài)相關(guān)線性二次型微分博弈。多顆微衛(wèi)星通過(guò)獨(dú)立優(yōu)化各自的性能指標(biāo)函數(shù)得到各自的控制策略,實(shí)現(xiàn)了多顆微衛(wèi)星接管姿態(tài)控制失效的航天器的分布式控制。該方法在保留非線性特性的同時(shí),通過(guò)推導(dǎo)得到耦合的狀態(tài)相關(guān)黎卡提方程組來(lái)逼近微分博弈的納什均衡并得到控制策略的閉環(huán)表達(dá)式,采用李亞普諾夫迭代法進(jìn)行求解,簡(jiǎn)化了納什均衡的求解過(guò)程。數(shù)值算例的結(jié)果表明,SDRE微分博弈方法可以實(shí)現(xiàn)多顆微衛(wèi)星對(duì)失效航天器的分布式姿態(tài)接管控制,具有較高的控制精度和容錯(cuò)性。