寧 宇,宮經(jīng)剛,曾海波
多衛(wèi)星姿態(tài)協(xié)同控制,常用于編隊飛行衛(wèi)星任務(wù)場景[1].隨著空間技術(shù)和應(yīng)用的發(fā)展,在軌操作與服務(wù)已經(jīng)開始轉(zhuǎn)入實際應(yīng)用階段[2].操控航天器通常需要以非合作目標(biāo)作為服務(wù)對象,在執(zhí)行精細(xì)操作任務(wù)之前或過程中,若使用多個小衛(wèi)星形成長基線多向輔助局部建?;?qū)崟r監(jiān)控,則能夠大幅提升操作的精度和安全性.本文基于該背景,針對多衛(wèi)星姿態(tài)協(xié)同控制進(jìn)行智能控制方法研究.
在航天器編隊協(xié)同控制中,通常使用多智能體系統(tǒng)一致性理論[3].MEI等[4]討論了離散時間一階積分器組成的多智能體系統(tǒng)對于虛擬領(lǐng)導(dǎo)者的一致性跟蹤問題.SCUTARI等[5]研究了固定拓?fù)浣Y(jié)構(gòu)下基于相對狀態(tài)的離散時間線性多智能體系統(tǒng)的一致性協(xié)議設(shè)計問題.WANG等[6]利用反饋線性化方法將一類非線性智能體網(wǎng)絡(luò)化為線性標(biāo)準(zhǔn)型,設(shè)計了一致性協(xié)議,并分析了協(xié)議的性能指標(biāo).LUO等[7]討論了二階多智能體系統(tǒng)在通信時滯存在與否兩種情形中,如何設(shè)計保證編隊成員速度收斂于期望值的協(xié)同算法.近年來,基于神經(jīng)網(wǎng)絡(luò)的智能控制理論也在逐步應(yīng)用于航天器控制[8].劉金琨[9]詳細(xì)介紹了神經(jīng)網(wǎng)絡(luò)監(jiān)督控制、直接逆控制、自校正控制、內(nèi)??刂啤㈩A(yù)測控制、自適應(yīng)控制等方法.曲汝鵬[10]基于神經(jīng)網(wǎng)絡(luò)自校正控制器實現(xiàn)衛(wèi)星姿態(tài)控制,在干擾力矩變化情況下達(dá)到良好的控制效果.ZOU等[11]基于終端滑模和Chebyshev神經(jīng)網(wǎng)絡(luò)設(shè)計了航天器的有限時間姿態(tài)跟蹤算法,可自主在魯棒控制和智能控制算法之間切換.GAO等[12]將指數(shù)趨近律滑模控制與神經(jīng)網(wǎng)絡(luò)控制相結(jié)合,設(shè)計了實時調(diào)節(jié)指數(shù)趨近律參數(shù)的衛(wèi)星編隊飛行控制方法.
本文研究中,面向多衛(wèi)星近距離對空間目標(biāo)協(xié)同觀測任務(wù)中的姿態(tài)指向協(xié)同控制問題,基于神經(jīng)網(wǎng)絡(luò)系統(tǒng)級狀態(tài)預(yù)測,通過對衛(wèi)星模型的預(yù)測控制方法和衛(wèi)星整體輸出狀態(tài)預(yù)測,匹配有時延情況下的理想一致性控制協(xié)議,完成協(xié)同控制.與常規(guī)神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)中,由神經(jīng)網(wǎng)絡(luò)取代控制器或優(yōu)化控制參數(shù)不同,本文使用神經(jīng)網(wǎng)絡(luò)對系統(tǒng)級狀態(tài)預(yù)測,從而對基于理想運(yùn)動模型設(shè)計的控制參數(shù)進(jìn)行修正計算,以適應(yīng)復(fù)雜任務(wù)場景和多變空間環(huán)境.通過仿真驗證了算法的有效性.
在本文控制系統(tǒng)設(shè)計中,不需要對衛(wèi)星運(yùn)動進(jìn)行建模,而是首先建立適用于某個控制方法的系統(tǒng)狀態(tài)模型,以PID控制為例,建立標(biāo)準(zhǔn)的二階運(yùn)動模型,為該模型設(shè)計理想的參數(shù),作為虛擬控制輸出,將控制輸出通過第一個神經(jīng)網(wǎng)絡(luò)環(huán)節(jié)后,直接生成適用于當(dāng)前衛(wèi)星姿態(tài)控制的實際控制輸出.在多衛(wèi)星協(xié)同控制中,各衛(wèi)星互相傳遞姿態(tài)和位置信息,通過一致性控制理論保證各衛(wèi)星間控制一致性.在某衛(wèi)星一致性協(xié)議中使用其他衛(wèi)星狀態(tài)量時,無法保證所接收的信息是實時的,一般具有延時特性,此時使用第二神經(jīng)網(wǎng)絡(luò),對其他衛(wèi)星的運(yùn)動狀態(tài)進(jìn)行預(yù)測,將預(yù)測值輸出至一致性協(xié)議中,從而保證各衛(wèi)星具有高度統(tǒng)一的控制目標(biāo)和控制效果,而該衛(wèi)星本體控制則使用第一神經(jīng)網(wǎng)絡(luò),進(jìn)行系統(tǒng)級預(yù)測,獲得最終控制量輸出.
第一神經(jīng)網(wǎng)絡(luò)選用多隱層神經(jīng)網(wǎng)絡(luò)模型[13]進(jìn)行預(yù)測,神經(jīng)網(wǎng)絡(luò)計算公式如下所示:
z(l+1)=W(l)a(l)+b(l)
(1)
a(l+1)=f(z(l+1))
(2)
(3)
其中,a(l)表示第l層的激活值,z(l)表示第l層的加權(quán)和,W、b為系數(shù).
第二神經(jīng)網(wǎng)絡(luò)需要基于前一步控制中的系統(tǒng)狀態(tài),選用循環(huán)神經(jīng)網(wǎng)絡(luò)模型[14]進(jìn)行預(yù)測,計算公式如下所示:
st=f(Uxt+Wst-1+b)
(4)
ot=Vst
(5)
其中,st為t時刻加權(quán)和,ot為t時刻輸出,U、W、V、b為系數(shù).
所選用的一致性協(xié)議[15]如下所示:
k3(qi-qd)
(6)
其中,下標(biāo)i、j表示第i、j個衛(wèi)星的相應(yīng)參數(shù),下標(biāo)d表示理想值,ui是控制量,pi、pj是姿態(tài)角,qi、qj是角速度,N為航天器數(shù)量,τ為時延,k1、k2、aij為系數(shù).
各衛(wèi)星均使用該一致性系統(tǒng)控制協(xié)議,通過對其他衛(wèi)星運(yùn)動的相互預(yù)測,以及對自身控制能力的預(yù)測,進(jìn)行姿態(tài)協(xié)同控制,保證在動態(tài)情況下迅速達(dá)成一致性并保持穩(wěn)定.
在多衛(wèi)星協(xié)同執(zhí)行任務(wù)中,由于任務(wù)場景環(huán)境復(fù)雜,同時各衛(wèi)星之間信息傳輸延遲問題,會導(dǎo)致一致性控制效果不理想.本文在多衛(wèi)星協(xié)同控制中,基于智能控制理論,采用人工神經(jīng)網(wǎng)絡(luò)方法,建立衛(wèi)星智能控制模型,解決上述問題,保證協(xié)同控制精度.
圖1 單航天器神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)控制與輸出預(yù)測
在多航天器協(xié)同控制過程中,本航天器對其他航天器當(dāng)前時刻的姿態(tài)運(yùn)動情況進(jìn)行預(yù)測后,將預(yù)測值納入至一致性協(xié)同控制協(xié)議中使用.控制模型如圖2~3所示,是基于兩類預(yù)測方式下的協(xié)同控制模型.圖中,方框內(nèi)編號為1或1-1等表示衛(wèi)星1模型;編號為2或2-1等表示衛(wèi)星2模型.模型一采用對其他航天器姿態(tài)和角速度的預(yù)測方式為,對輸入目標(biāo)和實際控制情況的映射關(guān)系進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和預(yù)測;模型二在本航天器中存儲了其他航天器的控制模型和參數(shù),通過對輸入控制量和實際控制情況的映射關(guān)系進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和預(yù)測.對于衛(wèi)星1,一致性控制量表示方式如下所示.
u1=fANN1(fCON(AttR1,fRNN2(AttS2)))
(7)
其中,u1為控制量,fANN1表示第一神經(jīng)網(wǎng)絡(luò),fRNN2表示第二神經(jīng)網(wǎng)絡(luò),fCON表示一致性控制協(xié)議,AttR1表示衛(wèi)星1實際姿態(tài),AttS2表示衛(wèi)星2目標(biāo)姿態(tài).實際控制量是對理想的一致性協(xié)議理想控制量的跟蹤,同時二者共同用于訓(xùn)練跟蹤模型.
兩種模型都能夠達(dá)到理想的協(xié)同控制效果.模型一在實現(xiàn)上更為簡明、穩(wěn)定性好;模型二對實際系統(tǒng)還原性更強(qiáng),但建模復(fù)雜.在模型二的基礎(chǔ)上,還可以進(jìn)一步對其他航天器進(jìn)行詳細(xì)的建模,完全和其他航天器的控制系統(tǒng)架構(gòu)保持一致,并對不可知部分進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測.圖中,實線框代表衛(wèi)星1,虛線框代表衛(wèi)星2.
圖2 多衛(wèi)星智能協(xié)同控制模型一
圖3 多衛(wèi)星智能協(xié)同控制模型二
各衛(wèi)星對協(xié)同姿態(tài)控制都進(jìn)行實時解算,但各衛(wèi)星只能保證實時獲取自身的觀測量,而其他衛(wèi)星的觀測量具有一定延遲性,需要使用神經(jīng)網(wǎng)絡(luò)預(yù)測量.對于預(yù)測模型的訓(xùn)練和使用,分為兩級運(yùn)算,第一級為實時預(yù)測與控制,使用當(dāng)前預(yù)測模型預(yù)測信息和本衛(wèi)星測量信息;第二級在當(dāng)前時刻獲取之前時刻的其他衛(wèi)星測量信息之后,對預(yù)測模型進(jìn)行訓(xùn)練,完成參數(shù)更新后,超實時預(yù)測姿態(tài)信息,將本級數(shù)據(jù)在時間上達(dá)到與第一級數(shù)據(jù)同步,然后取代第一級數(shù)據(jù),從而保證所使用的數(shù)據(jù)為最新精確數(shù)據(jù).時序示意圖如圖4所示.
各衛(wèi)星運(yùn)動模型選用剛性本體并帶有撓性轉(zhuǎn)動部件的模型[16];觀測器輸出衛(wèi)星姿態(tài)和角速度;使用等效姿態(tài)角評價控制情況,等效姿態(tài)角指某衛(wèi)星指向在目標(biāo)上的投影點,反向解算至另一衛(wèi)星指向的角度;控制模型中對衛(wèi)星轉(zhuǎn)動慣量裝訂參數(shù),相比于實際衛(wèi)星放大1/3,并由仿真結(jié)果可知,智能控制系統(tǒng)不受影響.
圖4 預(yù)測模型訓(xùn)練和使用時序示意圖
使用神經(jīng)網(wǎng)絡(luò)智能控制方法對單衛(wèi)星進(jìn)行姿態(tài)機(jī)動控制.選用場景為對目標(biāo)近距離詳察衛(wèi)星視線方向,在目標(biāo)衛(wèi)星本體落點,沿直線軌跡運(yùn)動情況.無觀測誤差理想控制情況下,姿態(tài)角在經(jīng)過神經(jīng)網(wǎng)絡(luò)初期訓(xùn)練收斂后,能夠有效跟蹤理想控制情況;在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中加入觀測誤差情況下的控制情況如圖5~6所示,其中訓(xùn)練數(shù)據(jù)衛(wèi)星姿態(tài)角加速度利用陀螺觀測角速度差分獲得,陀螺角速度隨機(jī)誤差為3×10-7rad/s,姿態(tài)角和姿態(tài)角速度能夠快速收斂,具有微小誤差.
圖5 姿態(tài)控制跟蹤曲線
對衛(wèi)星的輸出狀態(tài)預(yù)測情況,在無測量誤差情況下,神經(jīng)網(wǎng)絡(luò)預(yù)測誤差在1urad附近震蕩,當(dāng)有針對性的進(jìn)行模型架構(gòu)調(diào)整后,能夠持續(xù)提高精度,對此本文不做詳細(xì)討論;當(dāng)對觀測量加入10urad(1σ)隨機(jī)觀測噪聲后,如圖7~8所示,預(yù)測值的噪聲特性和所加入的觀測噪聲特性一致.因此,輸出狀態(tài)預(yù)測是有效的.
圖6 姿態(tài)控制誤差曲線
圖7 姿態(tài)預(yù)測曲線
圖8 姿態(tài)預(yù)測誤差曲線
通過神經(jīng)網(wǎng)絡(luò)對其他衛(wèi)星姿態(tài)控制情況進(jìn)行預(yù)測,帶入本航天器的協(xié)同控制協(xié)議中使用,輸出協(xié)同控制量的控制情況如圖9至圖14中所示.其中,假設(shè)監(jiān)測衛(wèi)星距空間目標(biāo)200 m;兩個監(jiān)測衛(wèi)星與空間目標(biāo)連線夾角約90°;監(jiān)測衛(wèi)星視場指向在空間目標(biāo)表面交點移動長度為20 m,移動速度為0.01(°)/s.
圖9 姿態(tài)協(xié)同控制曲線一
圖10 姿態(tài)協(xié)同控制比較曲線一
圖11 姿態(tài)協(xié)同控制曲線二
(1)無觀測誤差控制情況
圖9表示協(xié)同控制軌跡,圖10表示協(xié)同控制和獨(dú)立控制比較.由圖10可知,通過協(xié)同控制能夠使多航天器之間姿態(tài)控制情況快速統(tǒng)一,協(xié)同控制使協(xié)同時間相比于獨(dú)立控制縮短了約50%.
圖11~12是將獨(dú)立控制系統(tǒng)調(diào)整為較差控制參數(shù)情況下的控制曲線,以便于更有效地展示協(xié)同控制效果.無協(xié)同控制時,系統(tǒng)長期大幅震蕩;在協(xié)同控制下,控制誤差迅速收斂.
圖12 姿態(tài)協(xié)同控制比較曲線二
圖13 姿態(tài)協(xié)同控制比較曲線三
圖14 姿態(tài)協(xié)同控制比較曲線四
(2)有觀測誤差控制情況
加入觀測誤差后,協(xié)同控制系統(tǒng)的控制情況如圖13~14所示,控制情況基本與前文無觀測誤差一致,只是增加了受觀測噪聲影響的控制誤差.其中,姿態(tài)測量隨機(jī)噪聲10urad(1σ)、陀螺角速度隨機(jī)噪聲3×10-7rad/s情況下.
針對空間操控任務(wù)中多衛(wèi)星近距離協(xié)同對目標(biāo)監(jiān)測任務(wù)的復(fù)雜執(zhí)行環(huán)境,研究了基于神經(jīng)網(wǎng)絡(luò)系統(tǒng)的智能姿態(tài)協(xié)同控制.采用循環(huán)神經(jīng)網(wǎng)絡(luò)對其他衛(wèi)星姿態(tài)控制情況進(jìn)行預(yù)測,引入至理想模型下的一致性控制協(xié)議后,采用另一神經(jīng)網(wǎng)絡(luò)將理想控制量轉(zhuǎn)變?yōu)閷嶋H系統(tǒng)控制量,完成協(xié)同控制.本方法對各類型干擾及模型誤差有良好的適應(yīng)性.仿真結(jié)果驗證了方法的有效性.