梁紅利,孟中杰
(西北工業(yè)大學(xué)航天學(xué)院,西安 710072)
在空間通信任務(wù)中,為保證天線有效傳輸信號,帶有大型天線的通信衛(wèi)星需要保持姿態(tài)穩(wěn)定[1]。但是天線振動與衛(wèi)星姿態(tài)運動緊密耦合,給衛(wèi)星姿態(tài)穩(wěn)定控制造成了極大的困難[2]。
文獻(xiàn)[3]將天線振動視為外界干擾,通過狀態(tài)觀測器對擾動進(jìn)行預(yù)估和前饋補(bǔ)償實現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定。文獻(xiàn)[4]采用動態(tài)補(bǔ)償器抵消天線振動帶來的未知干擾,設(shè)計了一種基于輸出反饋的多目標(biāo)魯棒極點配置方法。文獻(xiàn)[5]將天線振動視為外界干擾,利用變結(jié)構(gòu)控制對擾動不敏感的優(yōu)點實現(xiàn)姿態(tài)穩(wěn)定。以上方法均有效削弱了天線振動對姿態(tài)的影響,但是沒有兼顧控制性能的需求。
最優(yōu)控制能夠兼顧響應(yīng)快、超調(diào)小、抗干擾能力強(qiáng)、控制輸入能量少等多種性能需求,實現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定[6]。文獻(xiàn)[7]采用動態(tài)規(guī)劃求解衛(wèi)星單軸姿態(tài)最優(yōu)穩(wěn)定控制問題。文獻(xiàn)[8]融合動態(tài)規(guī)劃、自適應(yīng)控制和強(qiáng)化學(xué)習(xí),解決了衛(wèi)星姿態(tài)最優(yōu)穩(wěn)定控制問題??紤]外界干擾和系統(tǒng)不確定性,文獻(xiàn)[9]設(shè)計神經(jīng)網(wǎng)絡(luò)算法估計外界干擾,構(gòu)建性能指標(biāo)函數(shù)實現(xiàn)最優(yōu)控制。文獻(xiàn)[10]基于干擾估計建立非線性擾動的上界函數(shù),設(shè)計了基于神經(jīng)網(wǎng)絡(luò)的最優(yōu)控制方法。考慮外界干擾引起系統(tǒng)不確定性,文獻(xiàn)[11]基于神經(jīng)網(wǎng)絡(luò)模型建立性能指標(biāo)函數(shù)并求解哈密頓-雅各比-貝爾曼(Hamilton Jacobi Bellman,HJB)方程實現(xiàn)最優(yōu)控制。以上方法都通過構(gòu)建基于干擾估計的性能指標(biāo)函數(shù)實現(xiàn)最優(yōu)控制,但需要假設(shè)外界干擾滿足與控制輸入相關(guān)的匹配條件。文獻(xiàn)[12]針對具有非匹配干擾的非線性不確定系統(tǒng),設(shè)計了基于干擾觀測器的最優(yōu)滑??刂品椒āN墨I(xiàn)[13]設(shè)計非線性觀測器在線估計非匹配干擾,提出一種魯棒最優(yōu)滑??刂品椒āN墨I(xiàn)[14]針對具有非匹配擾動的非線性不確定系統(tǒng),設(shè)計了基于干擾估計的最優(yōu)保性能滑??刂品椒?。這些方法不需要假設(shè)外界干擾滿足匹配條件,但是需要提前預(yù)知干擾的上界信息。
帶有大型天線的衛(wèi)星在軌運行時會受熱環(huán)境干擾。尤其當(dāng)它進(jìn)出地球軌道陰影區(qū)時,環(huán)境溫度劇烈變化使天線產(chǎn)生熱變形與熱應(yīng)力并激發(fā)熱振動,這會給衛(wèi)星姿態(tài)控制系統(tǒng)帶來上界未知的非匹配干擾[15-18]。針對上述難題,本文重點考慮外界干擾的未知非匹配特性,設(shè)計一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法,實現(xiàn)熱環(huán)境影響下帶大型天線衛(wèi)星的姿態(tài)穩(wěn)定控制。
本文的研究對象是由3顆衛(wèi)星和2個大型桁架式的天線組合而成的天線衛(wèi)星系統(tǒng)。由于天線具有類似于梁的動力學(xué)特性,基于能量互等原理[1]可將天線等效為連續(xù)梁,將衛(wèi)星視為剛體。此時,系統(tǒng)可簡化為“剛體—撓性梁”模型[19-20],如圖1所示。
圖1 帶大型天線衛(wèi)星的簡化模型Fig.1 Simplified model of the satellite with large antenna
設(shè)oxyz為慣性系,原點o位于中心剛體質(zhì)心,ox軸指向初始時刻梁的伸展方向,oy軸垂直于初始時刻梁的伸展方向,oz軸按右手定則確定。ox1y1z1為梁上的浮動坐標(biāo)系,原點o位于中心剛體與梁的連接點,ox1軸指向梁的伸展方向,oy1軸垂直于梁的伸展方向,oz1軸按右手定則確定。為了便于建立系統(tǒng)動力學(xué)模型,提出以下4個假設(shè)。
假設(shè)1.忽略軌道運動,將兩端衛(wèi)星視為剛體,以中心衛(wèi)星姿態(tài)代表系統(tǒng)整體姿態(tài)[1]。
假設(shè)2.圍繞oz軸的偏航運動和圍繞ox軸的滾轉(zhuǎn)運動耦合不明顯,忽略耦合作用,重點研究偏航運動[2,21]。
假設(shè)3.由于梁的彎曲剛度遠(yuǎn)小于軸向剛度和扭轉(zhuǎn)剛度,重點研究彎曲運動[19]。
假設(shè)4.由于系統(tǒng)為對稱構(gòu)型,建模與分析時只考慮右半部分[19,22]。
假設(shè)右側(cè)衛(wèi)星控制力為fc(t),中心衛(wèi)星控制力矩為2T(t),右側(cè)等效梁的熱應(yīng)力為dc(x1,t)。梁的長度、線密度和抗彎剛度分別為l0,ρA和EI。梁橫向變形位移為w(x1,t),衛(wèi)星質(zhì)量為m,半徑為r0。中心衛(wèi)星轉(zhuǎn)動慣量為2J,繞oz軸轉(zhuǎn)角為θ。等效梁上的任意點P在浮動坐標(biāo)系的位置矢量為r1,它在慣性系的位置矢量為rg。浮動坐標(biāo)系原點o在慣性系的位置矢量為ro。
在軌道熱環(huán)境影響下,溫度的劇烈變化會激發(fā)天線產(chǎn)生熱應(yīng)力與熱振動,給系統(tǒng)帶來未知干擾。參考文獻(xiàn)[15],考慮軌道熱環(huán)境影響,利用Hamilton變分法建立系統(tǒng)的剛?cè)狁詈蟿恿W(xué)模型。其姿態(tài)動力學(xué)方程和撓性振動方程分別為:
fcφ(l0)ηsinθ+s9χcosθ-χTs10η·
sinθ+T
(1)
(φ(l0))T+s11χ+s11χcosθ
(2)
聯(lián)立式(1)和(2),將撓性動力學(xué)視為姿態(tài)動力學(xué)的外界干擾,衛(wèi)星姿態(tài)動力學(xué)模型為:
(3)
(4)
將式(3)整理為如下形式:
(5)
(6)
由于控制輸入矩陣和干擾輸入矩陣不相等,控制量u和干擾Δ(x)不匹配,該衛(wèi)星的姿態(tài)控制問題是一個具有未知非匹配干擾和不確定性的非線性系統(tǒng)控制問題。
sTQs+uTPu)dτ
(7)
最優(yōu)性能指標(biāo)即為J(s)的極小值:
(8)
式中:ψ是容許控制集合。
根據(jù)Bellman最優(yōu)控制理論[17],最優(yōu)性能指標(biāo)J*(s)和最優(yōu)控制律u*(x)滿足HJB方程,求解HJB方程可得最優(yōu)控制律為:
(9)
但是非匹配干擾Δ(x)的上界α(t)未知和系統(tǒng)模型不確定,導(dǎo)致HJB方程不確定,無法直接獲得最優(yōu)解u*(x)。
針對上述姿態(tài)最優(yōu)控制問題,本文設(shè)計一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法。首先采用基于滑模面的單層評價神經(jīng)網(wǎng)絡(luò)[17]逼近最優(yōu)性能指標(biāo)函數(shù),解決HJB方程求解困難的問題;然后設(shè)計基于狀態(tài)觀測器的干擾估計算法在線估計非匹配干擾的上界α(t),解決未知非匹配干擾問題;最后與滑??刂坡山Y(jié)合提高響應(yīng)速度??刂瓶驁D如圖2所示。
圖2 基于滑模面的自適應(yīng)近似最優(yōu)控制器Fig.2 Adaptive approximate optimal controller based on sliding mode surface
利用神經(jīng)網(wǎng)絡(luò)的萬能逼近性,最優(yōu)性能指標(biāo)函數(shù)J*(s)可表示為
(10)
式中:W*∈Rm,σ(s)∈Rm和ε(s)分別為理想權(quán)重矢量、激活函數(shù)矢量和神經(jīng)網(wǎng)絡(luò)逼近誤差。m是隱含層神經(jīng)元個數(shù)。
J*(s)關(guān)于滑模變量s的偏導(dǎo)數(shù)為:
(11)
HJB方程可表示為:
(12)
由于沒有逼近誤差項ε(s)的信息,無法確定理想權(quán)重矢量W*。
(13)
(14)
HJB方程可表示為:
(15)
(16)
其中,εα范數(shù)有界,即||εα||≤εM,εM是未知非負(fù)常數(shù)。
(17)
(18)
式中:k1>0是學(xué)習(xí)率??梢钥闯?更新律(17)、(18)是一組嵌套更新律。
定理1.針對該衛(wèi)星系統(tǒng)的姿態(tài)最優(yōu)控制問題,采用基于滑模面的單層評價神經(jīng)網(wǎng)絡(luò)逼近HJB方程的最優(yōu)解,若網(wǎng)絡(luò)權(quán)重更新律為嵌套更新律(17)、(18),則權(quán)重矢量的逼近誤差動力學(xué)漸近穩(wěn)定。
證.定義李雅普諾夫函數(shù)為
(19)
對式(19)求導(dǎo),再將嵌套更新律(17)、(18)代入,得:
(20)
式中:|·|為矩陣的1范數(shù)。
聯(lián)立式(14)和式(9),得到近似最優(yōu)控制律為
(21)
但是非匹配干擾上界α(t)未知,導(dǎo)致該近似最優(yōu)控制律無法獲得。
本節(jié)主要通過設(shè)計狀態(tài)觀測器估計非匹配干擾的上界α(t)。
(22)
(23)
式中:lη>0是學(xué)習(xí)率。
聯(lián)立式(22)和式(5),得到狀態(tài)觀測誤差系統(tǒng)為
(24)
由于α在線更新,根據(jù)式(7)可知,性能指標(biāo)函數(shù)J(s)可根據(jù)干擾實時在線更新。
為了加快響應(yīng)速度,引入滑模控制律,設(shè)計基于滑模面的自適應(yīng)近似最優(yōu)控制律為:
(25)
(26)
定理2.針對系統(tǒng)(5),基于滑模面的自適應(yīng)近似最優(yōu)控制律(25)和魯棒項更新律(26)可以保證閉環(huán)系統(tǒng)(5)最終一致有界。
(27)
對上式求導(dǎo),再聯(lián)立式(5)、(25)和(26)得:
(28)
式中:0<||B(x)||≤Dg,Dg是未知正常數(shù);κ=||Λ||Dg;λmin(K1)是矩陣K1的最小特征值。
根據(jù)式(7)和式(5)可得:
(29)
聯(lián)立式(28)和式(29),得:
(30)
選擇控制參數(shù)K1,Q,P使得:
(31)
那么根據(jù)李雅普諾夫穩(wěn)定判據(jù)可知該系統(tǒng)的狀態(tài)最終一致有界。證畢。
為了驗證設(shè)計方法的有效性,本節(jié)在典型應(yīng)用場景下同時利用兩種方法進(jìn)行仿真。1) 本文設(shè)計的方法;2) 基于自適應(yīng)動態(tài)規(guī)劃的魯棒最優(yōu)滑模控制[23]。
dc(x,t)=Θ(x)β(t)
(32)
式中:函數(shù)Θ(x)反映了熱應(yīng)力沿天線軸線的分布情況;x是天線上的點沿軸線的位置坐標(biāo);函數(shù)β(t)反映了熱應(yīng)力隨時間的變化趨勢。文獻(xiàn)[18]采用有限元軟件模擬了天線在該溫度變化情況下函數(shù)Θ(x)和β(t)的變化情況,如圖3所示。
圖3 天線熱應(yīng)力的變化趨勢Fig.3 Changing trend of the antenna thermal stresses
在上述仿真場景下進(jìn)行仿真,系統(tǒng)仿真結(jié)果如圖4~7所示。
圖4 衛(wèi)星姿態(tài)運動Fig.4 Satellite attitude motion
圖4是衛(wèi)星姿態(tài)運動曲線,可以看出:兩種方法均可實現(xiàn)衛(wèi)星姿態(tài)穩(wěn)定,且穩(wěn)態(tài)誤差相當(dāng)。但是,利用本文方法,姿態(tài)角和角速度的收斂時間都明顯小于方法2,因此本文設(shè)計的方法具有更好的快速性。圖5是天線彈性振動曲線,可以看出:利用本文方法,天線中間位置的振動位移和末端的振動位移都明顯小于方法2。但由于未對天線振動實施主動控制,天線殘余振動主要依靠自身阻尼衰減。由于空間天線極小的振動阻尼,殘余振動衰減很慢。圖6是該系統(tǒng)的控制力與控制力矩曲線,可以看出:本文設(shè)計方法的控制力與力矩都小于方法2。說明本文方法的控制輸入能量更少。同樣,由于天線的殘余振動,衛(wèi)星姿態(tài)仍受到一定影響。為保持衛(wèi)星姿態(tài),在仿真末端仍需要輸出一定的控制力與力矩,以抵消天線殘余振動對姿態(tài)運動的干擾。圖7是性能指標(biāo)函數(shù)曲線,可以看出:本文方法的性能指標(biāo)函數(shù)值遠(yuǎn)小于方法2,由于性能指標(biāo)反映了外界未知非匹配干擾對姿態(tài)控制系統(tǒng)的影響,可知本文方法使外界未知非匹配干擾對姿態(tài)控制的影響更小,體現(xiàn)了更好的抗干擾能力。
圖5 天線彈性振動Fig.5 Antenna flexible vibration
圖6 控制力與控制力矩Fig.6 Control force and control torque
圖7 性能指標(biāo)函數(shù)J(s)Fig.7 Performance index function J(s)
針對地球軌道熱環(huán)境下帶大型天線衛(wèi)星的姿態(tài)穩(wěn)定問題,本文設(shè)計了一種基于滑模面的自適應(yīng)近似最優(yōu)控制方法。首先考慮外界未知非匹配干擾,構(gòu)造了基于干擾估計、具有在線更新能力的性能指標(biāo)函數(shù)。然后考慮系統(tǒng)不確定性,采用基于滑模面的單層評價神經(jīng)網(wǎng)絡(luò)逼近HJB方程最優(yōu)解,并與滑??刂平Y(jié)合加快響應(yīng)速度。仿真結(jié)果表明:在衛(wèi)星從軌道陰影區(qū)向日照區(qū)運行,溫度大幅變化的任務(wù)場景中,本文方法能以較少的控制能量更快速地實現(xiàn)衛(wèi)星的姿態(tài)穩(wěn)定控制。但由于天線阻尼較小且本文未對天線進(jìn)行主動控制,在控制末期,天線仍然保持小幅振動,給衛(wèi)星姿態(tài)帶來一定影響,這也是下一步研究工作的重點。