徐琳, 代睿, 殷春武, 段中興
(1.西安建筑科技大學(xué) 信息與控制工程學(xué)院, 陜西 西安 710055;2.西北工業(yè)大學(xué) 自動化學(xué)院, 陜西 西安 710129)
隨著人類空天活動的增加,漂浮在太空中的空間碎片對在軌航天器的威脅也與日俱增,因此清除空間碎片(或其他非合作目標(biāo))成為航天領(lǐng)域可持續(xù)發(fā)展必須解決的問題。最常用的清除方式是采用機(jī)械臂捕獲并回收空間碎片,在此過程中航天器會因機(jī)械臂運動而出現(xiàn)質(zhì)心偏移和姿態(tài)偏差,因此設(shè)計出具有較強魯棒性的自適應(yīng)控制器,從而保證抓捕航天器的安全運行,具有重要的工程應(yīng)用價值。
無序飛行的空間碎片其質(zhì)量與速度均未知。航天器在抓捕空間碎片過程中,航天器的質(zhì)心必定發(fā)生偏移,從而導(dǎo)致轉(zhuǎn)動慣量攝動量變化規(guī)律不可預(yù)知。因此,必須采用自適應(yīng)控制技術(shù)或智能逼近系統(tǒng)對轉(zhuǎn)動慣量攝動部分進(jìn)行補償,提升系統(tǒng)對參數(shù)攝動的魯棒性。文獻(xiàn)[1-5]主要是設(shè)計自適應(yīng)律實時估計未知轉(zhuǎn)動慣量,并基于不同的應(yīng)用環(huán)境構(gòu)建包含轉(zhuǎn)動慣量估值的自適應(yīng)姿態(tài)控制算法;文獻(xiàn)[6-8]則主要將轉(zhuǎn)動慣量分離為名義部分和攝動部分,并采用諸如極限學(xué)習(xí)機(jī)、神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)等智能逼近系統(tǒng)逼近由轉(zhuǎn)動慣量攝動引起的攝動部分,并將其作為控制器的補償性輸入。以上研究工作雖然都解決了參數(shù)攝動問題,但所用算法均存在轉(zhuǎn)動慣量估計精度不足、智能逼近系統(tǒng)結(jié)構(gòu)復(fù)雜等缺陷。
在抓捕空間碎片過程中,不僅存在轉(zhuǎn)動慣量攝動問題,還存在導(dǎo)航帶寬和角速率陀螺量程的限制問題,因此航天器的角速度必須限制在有界范圍內(nèi)。早期學(xué)者重點關(guān)注的是航天器控制輸入飽和約束的解決方案[9-13]。近些年,航天器角速度有界約束的研究才被重視[14-17]。文獻(xiàn)[14]在考慮航天器角速度有界和轉(zhuǎn)動慣量攝動條件下,設(shè)計了一種反演自適應(yīng)控制算法;文獻(xiàn)[15]基于抗退繞控制方法提出了角速度和控制輸入有界的控制算法;文獻(xiàn)[16]給出了一種L2增益控制算法,文獻(xiàn)[17]設(shè)計了一種改進(jìn)的非線性反饋控制器。
本文以航天器捕獲非合作目標(biāo)過程中的姿態(tài)穩(wěn)定控制為應(yīng)用背景,在考慮航天器角速度有界約束條件下,采用雙環(huán)遞歸跟蹤控制方法,設(shè)計出航天器自適應(yīng)跟蹤控制器。設(shè)計思路如下:對航天器外環(huán)系統(tǒng)的姿態(tài)運動學(xué)方程預(yù)設(shè)了一個有界虛擬角速度作為外環(huán)虛擬控制的輸入,使得外環(huán)系統(tǒng)姿態(tài)角能夠平穩(wěn)快速收斂至期望角度;對于航天器內(nèi)環(huán)系統(tǒng),本算法基于矩陣變換算子將轉(zhuǎn)動慣量矩陣轉(zhuǎn)換成關(guān)于轉(zhuǎn)動慣量元素向量的回歸方程,構(gòu)建自適應(yīng)更新律在線估計上界未知的轉(zhuǎn)動慣量;根據(jù)包含角速度跟蹤誤差的障礙李亞普諾夫函數(shù)(barrier Lyapunov function,BLF),設(shè)計出自適應(yīng)姿態(tài)控制器,驅(qū)動實際角速度快速跟蹤外環(huán)預(yù)設(shè)虛擬角速度,同時保持角速度的有界性。
剛體航天器在抓捕非合作目標(biāo)過程中,質(zhì)心偏移導(dǎo)致的主轉(zhuǎn)動慣量的變化規(guī)律可描述為:
1) 在抓捕過程最初階段,主轉(zhuǎn)動慣量會隨著機(jī)械臂伸展而逐漸增加;
2) 在捕獲非合作目標(biāo)瞬間,非合作目標(biāo)的無序運動反作用于航天器,導(dǎo)致主轉(zhuǎn)動慣量產(chǎn)生一個未知的突增;
3) 在機(jī)械臂回收階段,主轉(zhuǎn)動慣量則會逐步遞減。
令航天器在捕獲非合作目標(biāo)瞬間受到的瞬時強干擾為d1。再考慮外部環(huán)境干擾d2,則抓捕航天器的實際外部干擾為
d=d1+d2
(1)
基于單位四元數(shù){q0,q}={q0,q1,q2,q3}的航天器姿態(tài)運動學(xué)的方程式為[2]
(2)
(3)
式中:I3為單位矩陣;R為單位正交矩陣。
剛體航天器姿態(tài)動力學(xué)方程為[2]
(4)
式中:d∈R3為(1)式中的有界外部干擾,且‖d‖∞≤D,常數(shù)D為干擾最大值;u∈R3為控制輸入矢量。轉(zhuǎn)動慣量矩陣J分解為名義矩陣J0和攝動矩陣ΔJ,即J=J0+ΔJ。由于非合作目標(biāo)的動力學(xué)特性不可預(yù)知,所以轉(zhuǎn)動慣量J的上界未知。ω×為矢量ω=[ω1,ω2,ω3]T的反對稱矩陣
(5)
那么可以把航天器在軌抓捕非合作目標(biāo)時的姿態(tài)控制問題轉(zhuǎn)換為:當(dāng)存在外部干擾d和轉(zhuǎn)動慣量J攝動的復(fù)雜條件下,基于航天器動力學(xué)系統(tǒng)(2)與(4)設(shè)計魯棒控制器u,使閉環(huán)系統(tǒng)漸近穩(wěn)定。即當(dāng)t→∞時有
q(t)→0,ω(t)→0
(6)
且角速度滿足約束‖ω‖∞≤ωmax。
1) 當(dāng)x∈Ω趨近于Ω的邊界時(如‖x‖→kb),有V(x)→∞;
則定義函數(shù)V(x)為障礙李亞普諾夫函數(shù)。
(7)
則對于t∈[0,∞)有‖e1(t)‖ 定義2令向量a=(a1,a2,a3)T,定義線性回歸算子 (8) 令ξ=(J11,J22,J33,J12,J13,J23)T,則有 (9) 本文采用雙環(huán)遞歸跟蹤控制方法設(shè)計航天器的姿態(tài)跟蹤控制器,并分別對閉環(huán)系統(tǒng)的穩(wěn)定性以及角速度的全程有界性進(jìn)行理論推導(dǎo)。 考察以角速度作為輸入量的外環(huán)運動學(xué)方程。一方面,過大的角速度會破壞航天器的平穩(wěn)性,另一方面,受航天器物理硬件設(shè)備的限制,角速度難以達(dá)到較大的理論數(shù)值,因此,為設(shè)計更符合工程應(yīng)用的姿態(tài)跟蹤控制器,必須要求角速度有界。為了限定外環(huán)系統(tǒng)中角速度的輸入范圍,本文設(shè)計有界虛擬角速度輸入 ωv=-ωTtanh(k1q) (10) 式中,ωT>0為外環(huán)運動學(xué)方程中可允許的最大虛擬角速度值,常數(shù)k1>0。圖1反映了ωv某一分量的變化特性。 圖1 虛擬角速度分量的變化特性 如前文所述,為了確保外環(huán)系統(tǒng)(2)的漸近穩(wěn)定性,本文預(yù)設(shè)了虛擬角速度ωv。由此構(gòu)造出Lyapunov函數(shù) V1(q)=(q0-1)2+qTq (11) 對V1(q)關(guān)于時間t求導(dǎo) (12) 可見,當(dāng)實際角速度ω為虛擬角速度ωv時,有 (13) 根據(jù)Lyapunov第二穩(wěn)定性理論可知,當(dāng)t→∞時,q0→±1,q→0。 設(shè)ω為內(nèi)環(huán)系統(tǒng)(4)輸出的實際角速度。內(nèi)環(huán)自適應(yīng)控制器u的設(shè)計目標(biāo)為:能夠?qū)崿F(xiàn)ω快速跟蹤預(yù)設(shè)有界虛擬角速度ωv。 設(shè)e為ω與ωv的跟蹤誤差 e=ω-Rωv (14) 構(gòu)造如下BLF函數(shù) (16) (17) 式中 (18) 將(17)式代入(16)式得到 (19) 當(dāng)轉(zhuǎn)動慣量J已知時,設(shè)計姿態(tài)控制器 u=-Yξ-Dsign(e)-k2e (20) 式中,常數(shù)k2>0,sign(·)為符號函數(shù)。將(20)式的控制輸入表達(dá)式代入(19)式得到 (21) 根據(jù)(21)式可知,在轉(zhuǎn)動慣量矩陣J已知時,若t→∞,則有e→0,即 (22) 證畢 至此,內(nèi)環(huán)子系統(tǒng)和外環(huán)子系統(tǒng)在其各自控制輸入下,各閉環(huán)系統(tǒng)的穩(wěn)定性得證。接下來證明雙環(huán)遞歸控制下閉環(huán)系統(tǒng)的穩(wěn)定性。 定理1當(dāng)轉(zhuǎn)動慣量J已知時,姿態(tài)控制器(20)式能保證航天器姿態(tài)控制系統(tǒng)(2)式,(4)式漸近穩(wěn)定,且當(dāng)t→∞時有q(t)→0,ω(t)→0。 -ωTqTRq+qTe= qTe=-ωT‖q‖2+qTe≤ (23) (24) 對(24)式在[0,∞]上積分,并將V1(q)=(q0-1)2+qTq=2-2q0(t)代入,得 (25) 證畢 推論1當(dāng)轉(zhuǎn)動慣量J已知時,在控制器(20)作用下,對于t∈[0,∞),ω與ωv的跟蹤誤差滿足‖e(t)‖∞<ωe。 根據(jù)e=ω-Rωv,‖ωv‖∞≤ωT有‖ω‖∞≤‖e‖∞+‖ωv‖∞,結(jié)合推論1可以得到: 推論2當(dāng)不存在攝動對轉(zhuǎn)動慣量J的擾動時,對于ωe∈[0,∞),ωT∈[0,∞),總可以選擇出適當(dāng)參數(shù),使得ωe+ωT≤ωmax成立。因此在姿態(tài)控制器(20)作用下,實現(xiàn)對航天器角速度的有界約束,即角速度‖ω‖∞≤ωmax。 推論3當(dāng)轉(zhuǎn)動慣量J已知,控制增益k1,k2一定時,控制輸入力矩是有界的,且滿足 (26) 因為 ‖u‖∞≤‖Yξ‖∞+ ‖Dsat(e,ε)‖∞+‖k2e‖∞≤ ‖ω×Jω‖∞+‖Jω×Rωv‖∞+k2ωe+ λJmax‖ω2‖∞+λJmax‖ω‖∞‖ωv‖∞+ (27) 由于符號函數(shù)容易引起抖振,因此控制器中的符號函數(shù)可以用飽和函數(shù)代替,則(20)式修正為 u=-Yξ-Dsat(e,ε)-k2e (28) 其中飽和函數(shù)sat(e,ε)分量元素的定義為 (29) 前文在轉(zhuǎn)動慣量J固定前提下,設(shè)計了航天器姿態(tài)控制器(20),而航天器在軌捕獲非合作目標(biāo)過程中,因受到目標(biāo)本身無序運動的干擾,其轉(zhuǎn)動慣量會出現(xiàn)不同程度攝動。下面針對轉(zhuǎn)動慣量發(fā)生改變的工程應(yīng)用背景,構(gòu)建自適應(yīng)姿態(tài)穩(wěn)定控制器。 (30) (31) 自適應(yīng)姿態(tài)控制器表達(dá)式為 (32) 將(32)式代入(31)式得到 (33) (34) 則有 (35) 當(dāng)自適應(yīng)控制器(32)和自適應(yīng)更新律(34)應(yīng)用于航天器姿態(tài)控制時,根據(jù)Lyapunov穩(wěn)定理論可知,閉環(huán)系統(tǒng)(4)漸近穩(wěn)定。同理,帶飽和函數(shù)的自適應(yīng)姿態(tài)控制器為 (36) 根據(jù)定理1,同樣可得如下定理2。 定理2對存在轉(zhuǎn)動慣量攝動和外部干擾的航天器姿態(tài)動力學(xué)系統(tǒng),自適應(yīng)控制器(32)與自適應(yīng)律(34)可實現(xiàn)閉環(huán)系統(tǒng)的漸近穩(wěn)定性保證,即當(dāng)t→∞時有q(t)→0,ω(t)→0。 定理2證明與定理1相同。同理可得如下推論。 推論4轉(zhuǎn)動慣量J存在未知攝動時,應(yīng)用自適應(yīng)姿態(tài)控制器(32)與自適應(yīng)更新律(34),當(dāng)t∈[0,∞)時,‖e(t)‖∞<ωe,其中e(t)為實際角速度ω與虛擬角速度ωv之間的誤差。 推論5當(dāng)存在未知攝動對轉(zhuǎn)動慣量J的擾動時,對于ωe∈[0,∞),ωT∈[0,∞),總可以選擇出適當(dāng)參數(shù),使ωe+ωT≤ωmax成立。因此在自適應(yīng)控制器(32)與自適應(yīng)更新律(34)的作用下,航天器的角速度有界,即‖ω‖∞≤ωmax。 推論5說明自適應(yīng)姿態(tài)控制器(32)和自適應(yīng)更新律(34)實現(xiàn)了在軌捕獲非合作目標(biāo)過程中的姿態(tài)穩(wěn)定控制和角速度有界約束的目標(biāo)。為保證閉環(huán)系統(tǒng)的收斂性和角速度的有界性,在設(shè)計ωe,ωT時,應(yīng)盡可能地增大角速度追蹤誤差上界ωe,減小虛擬角速度的變化幅度值ωT。 自適應(yīng)控制器(20)和(32)中的增益系數(shù)k1,k2恒定時,為避免當(dāng)姿態(tài)追蹤誤差較大時產(chǎn)生過大控制力矩,本文對自適應(yīng)控制器中的參數(shù)采用如下變增益表達(dá)式 ki=ρieαiarctan(βit)i=1,2 (37) 式中,參數(shù)ρi,αi,βi>0(i=1,2)。其中,控制增益增長速度的參數(shù)為αi;用來控制增益取值范圍的參數(shù)為ρi;控制增益收斂速度的參數(shù)為βi。 在抓捕非合作目標(biāo)的過程中,假設(shè)在時刻T0=10 s時成功捕獲無序運動的非合作目標(biāo),此時會對抓捕航天器產(chǎn)生一個瞬間強干擾d1(其中r為方波),外部太陽輻射等環(huán)境干擾力矩記為d2(單位:N·m,ωΔ=0.1) 在T1=25 s時刻,非合作目標(biāo)被抓捕航天器成功回收。結(jié)合實施抓捕的機(jī)械臂的動作過程,轉(zhuǎn)動慣量各元素變化規(guī)律可以表示為 采用Matlab進(jìn)行數(shù)值仿真,圖2~4為數(shù)值仿真結(jié)果。 圖2 姿態(tài)角變化趨勢(雙環(huán)) 圖2中的曲線反映了航天器姿態(tài)角變化趨勢。從圖2可以看出,基于本文所設(shè)計的變增益自適應(yīng)姿態(tài)控制器(36),航天器的姿態(tài)角呈指數(shù)漸近收斂到0,且整個收斂軌跡沒有震蕩。即便在第10 s抓捕非合作目標(biāo)時出現(xiàn)一個瞬時強干擾,且整個抓捕過程中轉(zhuǎn)動慣量J的元素呈非線性攝動,但航天器的姿態(tài)角收斂趨勢并沒有受到干擾和參數(shù)攝動影響。說明自適應(yīng)控制器(36)具有較強的魯棒性,能夠使抓捕非合作目標(biāo)過程中航天器姿態(tài)快速穩(wěn)定。 圖3為抓捕過程中的控制力矩變化曲線。圖3顯示即便初期姿態(tài)角偏差較大,但由于變增益函數(shù)提供較小的控制增益,使得剛開始的控制力矩在保證姿態(tài)角收斂的前提下,控制力矩較小;后期雖然控制增益較大,但是姿態(tài)角追蹤誤差減小了,使得控制力矩也較小,整個控制過程中,除第10 s外,其他時間段的控制力矩均保持在-8~5 N·m內(nèi),且力矩的頻繁震蕩相對較少。在第10 s出現(xiàn)瞬間強干擾時,控制力矩產(chǎn)生了一個較大的控制輸入力矩來抑制外部強干擾,并在強干擾消失后,控制輸入力矩迅速減小。 圖3 三軸控制力矩曲線(雙環(huán)) 圖4反映了實際角速度ω跟隨預(yù)設(shè)虛擬角速度ωv變化的跟蹤效果。在控制初期,ω與ωv存在追蹤誤差,但在本文設(shè)計控制器下,ω很快收斂到ωv,并按照ωv的軌跡收斂到0 rad/s。在整個抓捕非合作目標(biāo)過程中,航天器的角速度滿足有界約束條件‖ω‖∞≤0.03 rad/s≤0.1 rad/s,且角速度追蹤誤差滿足‖e‖∞<0.05 rad/s。在第10 s出現(xiàn)外部強干擾時,真實角速度ω受到微弱干擾,隨著干擾消失,真實角速度會快速收斂到ωv。 圖4 ω和ωv軌跡曲線 仿真結(jié)果表明,在存在外部干擾和轉(zhuǎn)動慣量矩陣各元素呈非線性攝動的情況下,控制力矩根據(jù)實際角速度ω與虛擬角速度ωv之間的誤差,控制ω快速追蹤上ωv,并按照ωv的軌跡變化。當(dāng)姿態(tài)角較大時,ωv以較大的輸入驅(qū)動姿態(tài)角迅速減小,并隨著姿態(tài)角的收斂而逐漸收斂到0 rad/s。仿真結(jié)果顯示,本文設(shè)計的魯棒姿態(tài)控制器具有理想的控制效果,能保障抓捕過程中航天器的角速度滿足有界限制和航天器的姿態(tài)快速機(jī)動。 4.2 對比仿真分析 為驗證本文的雙環(huán)跟蹤控制器與反演控制器的區(qū)別,在相同控制器設(shè)計思路下,設(shè)計反演控制器。設(shè)計Lyapunov函數(shù)為V4(e)=V1(e)+V3(e),對V4(e)求導(dǎo),有 反演自適應(yīng)控制器為 (38) 當(dāng)控制器為反演控制器(38)時,其他控制參數(shù)不變,得到仿真結(jié)果如下: 圖5 姿態(tài)角變化趨勢(反演) 圖6 三軸控制力矩曲線(反演) 通過對比圖2和圖5,圖3和圖6可以看出,姿態(tài)跟蹤軌跡和控制力矩的變化趨勢幾乎相同,說明在相同仿真條件和控制參數(shù)下,反演控制與雙環(huán)跟蹤控制器的控制效果相同。但相對于反演控制器的復(fù)雜結(jié)構(gòu),本文設(shè)計的雙環(huán)跟蹤控制器結(jié)構(gòu)更為簡單。 本文以存在角速度有界約束的抓捕非合作目標(biāo)航天器的姿態(tài)穩(wěn)定控制為研究對象,結(jié)合雙環(huán)遞歸追蹤控制思想,在轉(zhuǎn)動慣量固定和轉(zhuǎn)動慣量攝動2種環(huán)境下,設(shè)計了航天器姿態(tài)魯棒控制器,并分析了所設(shè)計控制器能保證航天器角速度的有界性。 1) 將航天器的二階姿態(tài)動力學(xué)系統(tǒng)分解為外環(huán)、內(nèi)環(huán)2個一階子系統(tǒng),并分別為這2個子系統(tǒng)設(shè)計各自的軌跡跟蹤控制器,進(jìn)而構(gòu)建出一種雙環(huán)遞歸跟蹤控制器。通過理論分析和推導(dǎo),證明此二階系統(tǒng)的漸近穩(wěn)定性。相比于反演控制器,雙環(huán)追蹤控制器具有結(jié)構(gòu)更簡單,其控制器設(shè)計的自由度更高等優(yōu)點。 2) 對于轉(zhuǎn)動慣量固定和轉(zhuǎn)動慣量存在未知攝動的2種情況,應(yīng)用BLF函數(shù)分別設(shè)計了相應(yīng)的航天器姿態(tài)穩(wěn)定控制器。通過理論分析和推導(dǎo),證明該閉環(huán)系統(tǒng)具有漸近穩(wěn)定性以及角速度有界性。數(shù)值仿真了捕獲非合作目標(biāo)過程中的姿態(tài)穩(wěn)定控制情況,結(jié)果顯示在本文設(shè)計的自適應(yīng)姿態(tài)控制器作用下,抓捕航天器的姿態(tài)角與角速度實現(xiàn)了平緩收斂且無振蕩,展示出良好的動態(tài)品質(zhì)。 3) 通過推論3可以看出,針對轉(zhuǎn)動慣量上界已知的航天器姿態(tài)控制,可以估算出基于本控制器的最大控制輸入力矩,對航天器執(zhí)行機(jī)構(gòu)的設(shè)計具有一定的指導(dǎo)作用。 4) 航天器在受較大瞬間沖擊力矩時,航天器姿態(tài)沒有改變,說明本文所設(shè)計控制器對瞬間強干擾不敏感。3 控制器設(shè)計
3.1 外環(huán)控制器設(shè)計
3.2 內(nèi)環(huán)魯棒追蹤控制器設(shè)計
3.3 雙環(huán)追蹤控制穩(wěn)定性分析
3.4 內(nèi)環(huán)自適應(yīng)追蹤控制器設(shè)計
4 數(shù)值仿真分析
4.1 驗證仿真分析
5 結(jié) 論