馬鳴宇, 董朝陽, 王青, 周敏
(1. 北京航空航天大學(xué)航空科學(xué)與工程學(xué)院, 北京 100083; 2. 北京電子工程總體研究所, 北京 100854;3. 北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院, 北京 100083; 4. 航天系統(tǒng)仿真重點實驗室 北京仿真中心, 北京 100854)
多航天器姿態(tài)協(xié)同是指通過設(shè)計恰當(dāng)?shù)膮f(xié)同控制律,利用航天器之間的信息交互使得各航天器姿態(tài)保持一致。在航天器控制領(lǐng)域,姿態(tài)協(xié)同具有廣泛的應(yīng)用前景。多顆小衛(wèi)星通過對衛(wèi)星間的相對姿態(tài)進行協(xié)調(diào),可以協(xié)同工作完成復(fù)雜的任務(wù),具有成本低、研制周期短、應(yīng)用方式靈活等優(yōu)點[1];在航天器交會對接、衛(wèi)星捕獲等航天作業(yè)中,姿態(tài)協(xié)同也是一項關(guān)鍵技術(shù),具有重要的研究意義[2-3]。因此,多航天器系統(tǒng)的協(xié)同控制問題得到越來越多的重視和研究[4-6]。
對于單個航天器的姿態(tài)控制問題,國內(nèi)外學(xué)者采用自適應(yīng)控制[7]、魯棒控制[8]、滑??刂芠9]等多種方法進行了研究,取得了豐富的研究成果。在上述方法中,航天器的姿態(tài)大多采用的是歐拉角、四元數(shù)[10]或羅格里德參數(shù)模型[11],在姿態(tài)運動范圍較小時可以取得良好效果,但仍存在一定的局限性。歐拉角模型在姿態(tài)角全局范圍變化時會出現(xiàn)奇異,導(dǎo)致基于這種方法設(shè)計的控制器也只適用于某個范圍內(nèi);采用四元數(shù)進行姿態(tài)表示的方法能夠避免奇異,但其與旋轉(zhuǎn)矩陣的映射不具有唯一性,用于控制時可能導(dǎo)致姿態(tài)散開,引起系統(tǒng)性能下降[12];羅格里德參數(shù)模型同樣存在非全局與不唯一性。為了解決這些問題,文獻[13-14]提出了基于特殊正交群(Special Orthogonal Group,SO(3))的姿態(tài)建模與控制方法。SO(3)與旋轉(zhuǎn)矩陣是一一對應(yīng)的,滿足姿態(tài)描述的全局性,相比傳統(tǒng)區(qū)分通道分別設(shè)計的方法更為統(tǒng)一,且不存在奇異問題。針對個體控制問題,SO(3)方法已經(jīng)取得了一定的研究和應(yīng)用成果。文獻[14-15]采用旋轉(zhuǎn)矩陣對航天器姿態(tài)進行建模,克服了姿態(tài)展開現(xiàn)象。文獻[16]詳細討論了單剛體的SO(3)姿態(tài)跟蹤控制問題,保證了系統(tǒng)的全局指數(shù)穩(wěn)定性。
另外,在實際復(fù)雜的環(huán)境中,航天器系統(tǒng)不可避免地會受到干擾,而干擾會造成系統(tǒng)的穩(wěn)定性能和協(xié)同效果下降。文獻[17-18]分別考慮了存在執(zhí)行器安裝偏差和不確定性情形,提出了航天器魯棒控制方法,屬于對干擾的被動抑制。針對干擾的主動抑制控制,以擴張狀態(tài)觀測器(Extended State Observer, ESO)為核心的自抗擾控制方法近年來得到越來越多的關(guān)注。ESO將系統(tǒng)的不確定性和干擾等效為總干擾,以其作為擴張狀態(tài)進行實時估計,進而在控制器設(shè)計中可以針對系統(tǒng)的總干擾進行補償,提高系統(tǒng)的抗干擾能力。ESO的穩(wěn)定性分析相對復(fù)雜,目前主要基于Lyapunov理論開展。文獻[19]證明了可以通過嚴(yán)格構(gòu)造Lyapunov函數(shù)完成對常值增益的線性ESO的收斂性分析。而對于非線性ESO則需要假設(shè)Lyapunov函數(shù)存在[20],不便于控制器設(shè)計和穩(wěn)定性分析。因此在后續(xù)研究中,線性ESO已經(jīng)得到了一定的實際應(yīng)用[21-23]。但需要注意的是,線性常值增益ESO在初值和系統(tǒng)初值不一致時,經(jīng)常會出現(xiàn)峰化現(xiàn)象(peaking phenomenon)[24-25],對系統(tǒng)造成不利影響。
相比單個航天器,多航天器控制系統(tǒng)更為復(fù)雜[26]。而對于多航天器系統(tǒng)的SO(3)建模、ESO設(shè)計以及協(xié)同控制問題,目前研究還比較有限。除了個體動力學(xué)外,航天器之間的通信拓撲也會對系統(tǒng)的整體行為產(chǎn)生影響。在多航天器SO(3)控制中,需要根據(jù)拓撲結(jié)構(gòu)設(shè)計恰當(dāng)?shù)腟O(3)形式的協(xié)同指令。同時,由于SO(3)模型中姿態(tài)采用矩陣而非向量表示,因此針對SO(3)模型的ESO也需要重新設(shè)計和分析。
考慮到上述問題,本文將SO(3)姿態(tài)描述引入到多航天器系統(tǒng),結(jié)合航天器之間的有向通信拓撲建立其協(xié)同控制模型。在此SO(3)模型上設(shè)計了一種時變增益ESO對系統(tǒng)的總干擾進行估計,在保證觀測誤差收斂的同時,削弱常值ESO的峰化現(xiàn)象。進一步,利用相鄰航天器的信息構(gòu)造了SO(3)形式的協(xié)同控制指令,并設(shè)計了對應(yīng)的協(xié)同控制器,從理論上證明了閉環(huán)系統(tǒng)的穩(wěn)定性,所提出的方法能夠?qū)崿F(xiàn)干擾情形下多航天器系統(tǒng)的有效協(xié)同。以5個包含不同干擾和不確定性的航天器系統(tǒng)進行了仿真,驗證了理論分析結(jié)果。
在三維空間中,姿態(tài)代表了航天器本體坐標(biāo)系與慣性坐標(biāo)系之間的旋轉(zhuǎn)關(guān)系,而坐標(biāo)系之間的旋轉(zhuǎn)變換可以用一個正交變換矩陣R來表示,所有的正交變換矩陣構(gòu)成了SO(3)群:
SO(3)={R∈R3×3|RRT=I3,detR=1}
(1)
任意姿態(tài)都與特定矩陣R∈SO(3)一一對應(yīng)。因此,可以考慮采用SO(3)中對應(yīng)的元素R來表示航天器的姿態(tài)。令Ω=[ω1ω2ω3]T,定義運算
(2)
為hat映射。hat映射的逆運算∨稱為vee映射,其將任意三維反對稱陣映射為三維向量,即
(3)
(4)
對式(4)進行展開后處理可得
(5)
(6)
對于干擾di,有如下假設(shè)[19-20]。
(7)
(8)
對于式(8)所示系統(tǒng),考慮設(shè)計以下形式的ESO:
(9)
式中:Lki(t)=diag{lki(t),lki(t),lki(t)},lki(t)為時變增益系數(shù),k=1,2,3。
(10)
(11)
為了分析系統(tǒng)式(11)的穩(wěn)定性,將其轉(zhuǎn)換為標(biāo)準(zhǔn)型:
(12)
式中:
其中:aki(t)為與lki(t)有關(guān)的函數(shù),且滿足以下假設(shè)。
假設(shè)3aki(t)有界且三階連續(xù)可導(dǎo),k=1, 2,3。
(13)
同理,與系統(tǒng)式(12)對應(yīng)的可控性矩陣為
(14)
則系統(tǒng)式(11)到系統(tǒng)式(12)的坐標(biāo)變換矩陣為
(15)
(16)
(17)
由Fi(t)、bi和bci的表達式以及式(17)中的第1個式子可以得出:
(18)
由式(18)可知,lki(t)能夠表示為aki(t)的函數(shù),即可以通過設(shè)計aki(t)來保證系統(tǒng)式(12)穩(wěn)定,進而保證ESO的穩(wěn)定性。在確定合適的aki(t)后,ESO的參數(shù)也隨之確定。于是,考慮與系統(tǒng)式(12)對應(yīng)的PD特征值和SD特征值分別為ρki(t)和μki(t)[25,27],定義:
T0i(t)=T1i(t)=1
(19)
(20)
T3i(t)=
(21)
則有如下關(guān)系成立:
(22)
引理1設(shè)ρki(t)為實數(shù)且滿足如下條件:
1)ρki(t)有界且三階連續(xù)可導(dǎo);
2) 由式(19)~式(22)得到的aki(t)滿足假設(shè)3;
3) 存在常數(shù)c>0,使得ρki(t)≤-c<0。
(23)
(24)
考慮χci和χi系統(tǒng)的狀態(tài)轉(zhuǎn)移矩陣分別為Φχci(t,t0)和Φχi(t,t0),同理可得
(25)
(26)
(27)
(28)
從而證明了χi和χci是指數(shù)穩(wěn)定的。
證畢
在此基礎(chǔ)上,關(guān)于觀測誤差的穩(wěn)定性有如下定理成立。
Azi(t)χzi
(29)
式中:
Azi(t)=
(30)
由此可知:
(31)
(32)
易知存在常數(shù)c2>0,使得
(33)
再根據(jù)Pzi(t)的性質(zhì)可知,存在正常數(shù)c3、c4和c5使得:
(34)
從而有
(35)
(36)
(37)
將式(37)代入式(36),則有
(38)
(39)
最終得到
(40)
證畢
注1定理1在引理1的基礎(chǔ)上分析了時變增益ESO的收斂性。若ρki(t)取1/ε的同階量,則觀測誤差有界且趨于ε的同階量。同時,在ρki(t)確定后,通過式(18)和式(22)可以計算得到ESO增益lki(t)。
(41)
(42)
(43)
在姿態(tài)指令信號Rdi的基礎(chǔ)上,定義SO(3)中的相對姿態(tài)誤差和角速度誤差分別為
(44)
(45)
(46)
根據(jù)式(45)和式(46),航天器i的誤差方程可以表示為
(47)
(48)
證明選取閉環(huán)系統(tǒng)的Lyapunov函數(shù)為
(49)
首先證明V4的正定性。易知
(50)
(51)
(52)
(53)
進一步,考慮式(49)中Ψ(Ri,Rdi)對時間t的導(dǎo)數(shù):
(54)
(55)
結(jié)合式(54)、式(55)對V5(ηi)求導(dǎo)可得
(56)
式中:
(57)
同時,根據(jù)前述的分析可知:
(58)
進一步,根據(jù)Young不等式,有
(59)
(60)
將上述結(jié)果代入式(56)中可得
(61)
式中:
(62)
(63)
(64)
(65)
(66)
(67)
證畢
注2通過航天器模型式(4)和控制器式(48)設(shè)計過程可以看出,本文提出的SO(3)協(xié)同控制方法允許各航天器具有不同的總體和控制參數(shù),即適用于航天器異構(gòu)的情況,有利于本文方法在工程中的應(yīng)用。
表1 航天器初始條件和參數(shù)
在協(xié)同控制器設(shè)計與仿真中,均采用R矩陣對航天器姿態(tài)進行描述,并基于SO(3)方法完成上述過程。為了便于結(jié)果呈現(xiàn),本文在仿真結(jié)果圖中將R轉(zhuǎn)換為姿態(tài)角度進行表示。圖2給出了多個航天器的俯仰、偏航、滾轉(zhuǎn)角度隨時間變化曲線。可以看出,在存在干擾的情況下,多航天器系統(tǒng)能夠以較快的速度實現(xiàn)穩(wěn)定的協(xié)同,控制效果良好。
圖1 航天器通信拓撲Fig.1 Communication topology of spacecraft
圖2 多航天器姿態(tài)角變化曲線Fig.2 Variation curves of attitude angles of multiple spacecraft
圖3 考慮干擾補償?shù)目刂屏?航天器4)Fig.3 Control moment with disturbance compensation (Spacecraft 4)
進一步,為了定量描述各航天器姿態(tài)協(xié)同收斂情況,對比說明本文基于SO(3)方法的控制效果,定義:
(68)
式中:qi=ri-r1,ri=[φiψiγi]T,φi、ψi和γi分別為航天器的俯仰角、偏航角和滾轉(zhuǎn)角。
根據(jù)Q的定義可知,若Q趨于0,則表示多航天器實現(xiàn)了姿態(tài)協(xié)同。在相同初始條件與ESO參數(shù)的情況下,文獻[10]采用四元數(shù)模型,文獻[11]使用羅格里德參數(shù)。從圖5可以看出,文獻[10]方法和文獻[11]方法的Q值收斂到1°的時刻分別為10.87 s和7.26 s,而本文方法為5.88 s,驗證了本文方法的有效性和快速性。
圖4 控制力矩范數(shù)對比曲線Fig.4 Comparative curves of norms of control moment
圖5 不同方法Q值變化對比曲線Fig.5 Comparative curves of Q with different methods
本文針對存在干擾情形下的多航天器系統(tǒng),對其協(xié)同控制問題進行了研究。
1) SO(3)能夠從整體的角度對姿態(tài)進行描述,結(jié)合有向通信拓撲建立了多航天器SO(3)控制模型,并以此提出了相應(yīng)的控制策略?;赟O(3)方法的協(xié)同控制是可行的。
2) 模型不確定性和外部干擾可以等效為系統(tǒng)的總干擾。在此情形下,設(shè)計了適用于SO(3)模型的線性時變增益ESO,所提出的時變增益ESO能夠完成對干擾的有效估計。相比常值增益ESO,時變增益ESO可以削弱峰化現(xiàn)象,降低了對控制力矩大小的需求。
3) 設(shè)計了SO(3)形式的協(xié)同指令,結(jié)合ESO可以對干擾進行觀測并在控制器中補償,保證干擾情形下多航天器的協(xié)同控制效果。本文給出了穩(wěn)定性證明過程。
4) 仿真算例結(jié)果表明,多航天器系統(tǒng)能夠?qū)崿F(xiàn)穩(wěn)定協(xié)同,驗證了本文方法的有效性和快速性。