竇立謙 田曉笛
天津大學(xué)電氣與自動化工程學(xué)院,天津 300072
?
基于自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)的可重復(fù)使用運(yùn)載器再入段姿態(tài)控制*
竇立謙 田曉笛
天津大學(xué)電氣與自動化工程學(xué)院,天津 300072
針對再入段可重復(fù)使用運(yùn)載器(Reusable Launch Vehicles, RLV)姿態(tài)控制問題,提出一種基于自適應(yīng)徑向基函數(shù)(Radial Basis Function,簡稱RBF)神經(jīng)網(wǎng)絡(luò)(ARBFNN)的姿態(tài)控制方法。首先,建立RLV的6-DOF非線性動態(tài)模型,并將旋轉(zhuǎn)動力學(xué)模型變成嚴(yán)反饋形式。然后,設(shè)計(jì)了一種自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制(ARBFNN)結(jié)構(gòu),可以減少神經(jīng)網(wǎng)絡(luò)逼近誤差的影響。同時(shí),通過李雅普諾夫和自適應(yīng)控制的結(jié)合消除了控制器設(shè)計(jì)過程中的不確定影響,并驗(yàn)證了系統(tǒng)的穩(wěn)定性。最后,通過仿真驗(yàn)證了所提算法在解決再入段RLV姿態(tài)控制問題上的有效性。
姿態(tài)控制;RBF神經(jīng)網(wǎng)絡(luò)控制;可重復(fù)使用運(yùn)載器
可重復(fù)使用運(yùn)載器(簡稱RLV)是指可以多次重復(fù)使用,并自主往返地球與太空之間的多用途飛行器[1-2]。RLV再入過程的飛行馬赫數(shù)和飛行高度跨度范圍大,飛行條件惡劣,導(dǎo)致其模型具有強(qiáng)耦合、強(qiáng)非線性以及氣動參數(shù)不確定性等特點(diǎn)[3]。因而,如何采用有效的控制方法,確保RLV能夠在復(fù)雜的飛行環(huán)境下,擁有穩(wěn)定的飛行特性以及良好的姿態(tài)跟蹤控制性能,成為一個(gè)極具挑戰(zhàn)性的問題。
近年來,飛行器再入過程的非線性控制方法取得了一定進(jìn)展,一些先進(jìn)的非線性控制技術(shù)開始在飛行器控制中使用。如文獻(xiàn)[4]中針對再入飛行器, 設(shè)計(jì)了一種基于高階滑模觀測器的自適應(yīng)時(shí)變滑??刂破?。文獻(xiàn)[5]提出了用神經(jīng)網(wǎng)絡(luò)自適應(yīng)動態(tài)逆的方法控制飛行器,根據(jù)收斂誤差和跟蹤誤差等性能提出了一種新的姿態(tài)角控制器,并采用自適應(yīng)神經(jīng)網(wǎng)絡(luò)補(bǔ)償模型誤差。文獻(xiàn)[6]提出了基于擴(kuò)張狀態(tài)觀測器(ESO)的模糊自適應(yīng)姿態(tài)控制方法,采用模糊自適應(yīng)機(jī)制逼近姿態(tài)角動態(tài)的耦合不確定性,并采用ESO在線觀測角速率動態(tài)中的綜合不確定項(xiàng),減輕計(jì)算負(fù)擔(dān)。
神經(jīng)網(wǎng)絡(luò)具有大規(guī)模并行性的優(yōu)點(diǎn),對于任何復(fù)雜的非線性系統(tǒng),它都具有快速適應(yīng)能力和精確的近似能力,被廣泛應(yīng)用于飛行器姿態(tài)控制中[7]。文獻(xiàn)[8]采用自適應(yīng)神經(jīng)網(wǎng)絡(luò)與PID控制器相結(jié)合的方法,補(bǔ)償系統(tǒng)的不確定性,同時(shí)對飛行狀態(tài)的改變和飛行故障進(jìn)行自適應(yīng)調(diào)節(jié)。文獻(xiàn)[9]以單輸入單輸出非線性系統(tǒng)為被控對象的基于神經(jīng)網(wǎng)絡(luò)的直接自適應(yīng)控制方法,采用模糊推理系統(tǒng)估計(jì)控制誤差,沒有任何額外的控制神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器,所有涉及到的信號都是指數(shù)穩(wěn)定的,從而保證系統(tǒng)的穩(wěn)定。文獻(xiàn)[10]采用了自適應(yīng)和反步相結(jié)合的控制方法使可重構(gòu)飛行器具有更好的魯棒性和穩(wěn)定性。
本文在再入段RLV模型簡化為嚴(yán)反饋形式的基礎(chǔ)上,基于自適應(yīng)方法和 RBFNN 相結(jié)合的思想提出了一種 ARBFNN 的控制系統(tǒng)。該系統(tǒng)由神經(jīng)網(wǎng)絡(luò)估計(jì)器和神經(jīng)網(wǎng)絡(luò)補(bǔ)償器組成。其中,神經(jīng)網(wǎng)絡(luò)估計(jì)器由 ARBFNN充當(dāng),通過 ARBFNN估計(jì)飛行器的非線性動態(tài)模型;神經(jīng)網(wǎng)絡(luò)補(bǔ)償器用來補(bǔ)償神經(jīng)網(wǎng)絡(luò)估計(jì)值的誤差。神經(jīng)網(wǎng)絡(luò)估計(jì)器和補(bǔ)償器都通過自適應(yīng)律調(diào)整相應(yīng)參數(shù)的變化,消除了控制器設(shè)計(jì)過程中的不確定影響,并利用 Lyapunov 函數(shù)驗(yàn)證了系統(tǒng)的穩(wěn)定性。
1.1 RLV的動態(tài)模型
本文考慮類X-37B結(jié)構(gòu)飛行器6自由度模型。模型在再入階段為無動力飛行器,即推力為0,通過姿態(tài)調(diào)整逐漸減小飛行器馬赫數(shù)。
飛行器的運(yùn)動方程組為:
(1)
飛行器力矩方程組為:
(2)
(3)
(4)
(5)
(6)
(7)
其中,α為攻角,β為側(cè)滑角,δa,δe,δr分別表示副翼偏轉(zhuǎn)角、升降舵偏轉(zhuǎn)角和方向舵偏轉(zhuǎn)角,C*表示后邊項(xiàng)對應(yīng)的氣動系數(shù)。
1.2RLV模型化簡
為了便于后面控制器的設(shè)計(jì), 需要化簡RLV模型為嚴(yán)反饋形式。將式(3)~(5)代入式(2),可將式(2)化為如下標(biāo)準(zhǔn)形式:
(8)
其中,fp,fq,fr分別表示為:
fp=(c1r+c2p)q+c3Mx+c4Mz
fq=c5pr-c6(p2-r2)+c7My
fr=(c8p-c2r)q+c4Mx+c9Mz
(9)
而Mx,My,Mz分別表示為:
(10)
Gu可以表示為:
(11)
對式(1)進(jìn)行二次微分,得到:
(12)
其中
(13)
(14)
將式(8)代入式(12)中,得到:
(15)
上式可以寫成如下的二階非線性系統(tǒng):
(16)
(17)
(18)
(19)
1.3 問題描述
再入段RLV的姿態(tài)控制目標(biāo):通過控制舵偏u實(shí)現(xiàn)對期望姿態(tài)角指令yd的漸進(jìn)穩(wěn)定跟蹤,即
(20)
(21)
將式(21)代入式(19)中,得到:
(22)
為了保證系統(tǒng)穩(wěn)定性,選取如下李雅普諾夫函數(shù)
(23)
將式(23)對時(shí)間求導(dǎo),并將式(22)代入,可得:
(24)
2.1 基于RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)系統(tǒng)的設(shè)計(jì)
基于ARBFNN的系統(tǒng)由神經(jīng)網(wǎng)絡(luò)估計(jì)器和神經(jīng)網(wǎng)絡(luò)補(bǔ)償器構(gòu)成,見圖1,即
(25)
其中,fnn代表神經(jīng)網(wǎng)絡(luò)估計(jì)器的輸出,fsc代表補(bǔ)償器的輸出。將式(25)代入式(21)可得控制律如下:
(26)
圖1 控制系統(tǒng)的結(jié)構(gòu)圖
本文采用RBFNN與自適應(yīng)相結(jié)合的控制方法,由神經(jīng)網(wǎng)絡(luò)估計(jì)器和神經(jīng)網(wǎng)絡(luò)補(bǔ)償器組成,神經(jīng)網(wǎng)絡(luò)估計(jì)器用來估計(jì)飛行器的非線性動態(tài)模型,神經(jīng)網(wǎng)絡(luò)補(bǔ)償器用來補(bǔ)償神經(jīng)網(wǎng)絡(luò)估計(jì)值的誤差,從而保證誤差值最小,進(jìn)而更為準(zhǔn)確、快速地求解出飛行器的舵偏角控制量。利用ARBFNN充當(dāng)估計(jì)器,只有確定系統(tǒng)的參數(shù)值和隱含層結(jié)點(diǎn)個(gè)數(shù),才能確定ARBFNN的結(jié)構(gòu)。隱含層節(jié)點(diǎn)數(shù)過多,則計(jì)算復(fù)雜;節(jié)點(diǎn)數(shù)過少,則精確度降低[12]。經(jīng)過多次實(shí)驗(yàn)驗(yàn)證,選取3-12-3的結(jié)構(gòu)。通過ARBFNN來估計(jì)fnn,ARBFNN的輸出可以表示:
fnn=WTΦ(c,σ)
(27)
其中,W為隱含層輸出的權(quán)值,W=[w1,w2,…,wn]=[w11,w12,…,w1n;w21,…,w2n,…,wmn];c為隱含層神經(jīng)元的高斯函數(shù)中心,c=[c11…,cn1,…,c1m,…,cnm]T;σ為徑向基的寬度,σ=[σ11…,σn1,…,σ1m,…,σnm]T;Φ為徑向基隱含層輸出,Φ=[Φ1,Φ2,…,Φm]T(其中,m=12,n=3)。
設(shè)神經(jīng)網(wǎng)絡(luò)的期望輸出為f*,神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出為f,由于神經(jīng)網(wǎng)絡(luò)估計(jì)器的輸出是有誤差的,所以它們的關(guān)系可以寫成如下形式[13]:
f=f*+Δ=W*TΦ(c*,σ*)+Δ
(28)
(29)
(30)
(31)
(32)
(33)
其中,
(34)
(35)
將式(31)代入式(30)得:
(36)
由式(21)~ (22),(25)可得:
(37)
神經(jīng)網(wǎng)絡(luò)補(bǔ)償器主要用來補(bǔ)償神經(jīng)網(wǎng)絡(luò)的估計(jì)誤差,設(shè)神經(jīng)網(wǎng)絡(luò)補(bǔ)償器輸出為fsc
(38)
ΛTP+PΛ=-Q
(39)
其中,Q為已知的正定矩陣。
2.2 穩(wěn)定性分析
如果神經(jīng)網(wǎng)絡(luò)估計(jì)器選取自適應(yīng)律為:
(40)
神經(jīng)網(wǎng)絡(luò)補(bǔ)償器的誤差估計(jì)律為:
(41)
自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)是穩(wěn)定的,即當(dāng)t→∞時(shí),e(t)→0。選取正定的Lyapunov函數(shù)為:
(42)
其中,η1,η2,η3,η4是已知的正數(shù),表示學(xué)習(xí)效率。對式(42)求一階微分,并將式(33)代入,可得:
(43)
其中,
(44)
(45)
將式(40)代入(43),則式(43)可寫成
(46)
(47)
對式(47)積分可得:
(48)
(49)
采用基于自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)控制RLV的姿態(tài),該控制系統(tǒng)的參數(shù)可以通過自適應(yīng)律得到。為了驗(yàn)證系統(tǒng)良好的跟蹤特性進(jìn)行仿真,RLV的參數(shù)如表1所示。
表1 RLV參數(shù)值
在仿真中,再入段RLV高度和速度的初始值分別為50km , 15Ma,初始空氣動力學(xué)角度、姿態(tài)角和角速率包括β,φ,ψ,p,q和r為0,α=θ=25°,初始舵偏量等其他參數(shù)均為0。
如圖2,系統(tǒng)的期望姿態(tài)角為
ARBFNN的輸入為俯仰角,滾轉(zhuǎn)角和偏航角的偏差。在Matlab下進(jìn)行仿真,參數(shù)分別為k1=30,k2=5,η1=1,η2=η3=η4=0.2,采樣時(shí)間為Ts=0.01s,舵面偏轉(zhuǎn)角限制為±20°。實(shí)際RLV再入過程會根據(jù)需要調(diào)整姿態(tài)角,這里為了驗(yàn)證姿態(tài)角跟蹤性能,仿真選擇了正弦跟蹤信號,仿真結(jié)果如圖2~3。
圖2 姿態(tài)角跟蹤曲線
圖3 舵偏角控制量輸出曲線
仿真采用了ARBFNN 和傳統(tǒng)的PID 控制方法,圖2表明ARBFNN和傳統(tǒng)的PID控制方法都能跟蹤姿態(tài)角指令,但是,ARBFNN 的姿態(tài)角跟蹤誤差均小于PID的跟蹤誤差,跟蹤性能更為優(yōu)越。圖3表明舵偏角的控制量均在可允許的范圍內(nèi)。
綜上所述,本文所設(shè)計(jì)的控制器可確保RLV再入過程中控制系統(tǒng)具有良好的跟蹤性和穩(wěn)定性。
針對再入RLV姿態(tài)控制問題,提出了一種基于自適應(yīng)RBF神經(jīng)網(wǎng)絡(luò)的控制方法。以RBFNN為控制器,同時(shí)利用神經(jīng)網(wǎng)絡(luò)補(bǔ)償器補(bǔ)償系統(tǒng)的估計(jì)誤差,其中控制器參數(shù)由自適應(yīng)律得到,消除了控制器設(shè)計(jì)過程中的不確定影響,并利用李雅普諾夫驗(yàn)證了系統(tǒng)的穩(wěn)定性。仿真結(jié)果表明本文所提出的控制方法能夠?qū)崿F(xiàn)對指令的實(shí)時(shí)跟蹤。
[1] Shtessel Y B, Hall C E, Jackson M. Reusable Launch Vehicle Control in Multiple-time-scale Sliding Modes[J]. AIAA Journal of Guidance Control and Dynamics. 2000, 23 (6): 1013-1020.
[2] Jiang B, Gao Z F, Shi P, et al. Adaptive Fault Tolerant Tracking Control of Near Space Vehicle Using Takagi-Sugeno Fuzzy Models[J]. IEEE Transaction on Fuzzy Systems, 2010, 18(5): 1000-1007.
[3] 程志浩, 孫秀霞, 劉樹光, 等.高超聲速飛行器自適應(yīng)神經(jīng)網(wǎng)絡(luò)動態(tài)面控制[J].飛行力學(xué), 2013, 31(5): 425-428.(Cheng Zhihao, Sun Xiuxia, Liu Shu-guang, et al. Self-adaptive NNDynamic Surface Control of Hypersonic Vehicle [J]. Flight Dynamics, 2013,31 (5): 425-428.)
[4] 王亮, 劉向東, 盛永智. 基于高階滑模觀測器的自適應(yīng)時(shí)變滑模再入姿態(tài)控制[J]. 控制與決策, 2014, 29(2):281-286.(Wang Liang, Liu Xiangdong, Sheng Yongzhi. High-order Sliding Mode Observer Based Adaptive Time-varying Sliding Mode for Re-entry Attitude Control [J]. Control and Decision, 2014, 29(2):281-286.)
[5] Gai W D, Wang H L, Zhang J, et al. Adaptive Neural Network Dynamic Inversion with Prescribed Performance for Aircraft Flight Control[J].Journal of Applied Mathe matics ,2013: 1-12.
[6] 胡超芳,劉運(yùn)兵. 基于ESO的高超聲速飛行器模糊自適應(yīng)姿態(tài)控制術(shù)[J]. 航天控制, 2015, 33(3): 45-51.(Hu Chaofang, Liu Yunbing. Fuzzy Adaptive Attitude Control Based on ESO for Hypersonic Vehicles [J]. Aerospace Control, 2015, 33(3): 45-51.)
[7] 曾志峰, 湯一華, 徐敏, 等. 基于神經(jīng)網(wǎng)絡(luò)的飛行器再入制導(dǎo)研究[J]. 飛行力學(xué), 2011, 29(3):64- 67.(Zeng Zhifeng, Tang Yihua, Xu Min, et al. Study of Reentry Guidance Based on Neural Network [J]. Flight Dynamics, 2011,29(3):64-67.)
[8] Savran A, Tasaltin R, Becerikli Y. Intelligent Adap- tive Nonlinear Flight Control for a High Performance Aircraft with Neural Network[J]. ISA Transactions, 2006, 45(2): 225-247.
[9] Chemachema M. Output Feedback Direct Adaptive Neural Network Control for Uncertain SISO Nonlinear Systems Using a Fuzzy Estimator of the Control Error[J]. Neural Networks,2012, 36: 25-34.
[10] Shin D H, Kim Y. Reconfigurable Flight Control System Design Using Adaptive Neural Networks[J]. IEEE Transactions on Control Systems Technology, 2004, 1(12):87-100.
[11] 吳森堂,費(fèi)玉華. 飛行控制系統(tǒng) [M]. 北京:北京航空航天大學(xué)出版社, 2005.(Wu Sentang, Fei Yuhua. Flying Control System [M]. Beijing: Press of Beijing University of Aeronautics & Astronautics, September, 2005.)
[12] Fan T, Wen R P. MEA For Designing Neural Network Weight and Structure Optimization[J].Computer Science and Information Engineering. 2009, 6: 111-115.
[13] Hsu C F. Adaptive Backstepping Elman-based Neural Control for Unknownn Onlinear Systems[J]. Neurocomputing, 2014,136: 170-179.
[14] Hus C F, Lin C M, Li M C. Adaptive Dynamic RBF Fuzzy Neural Controller Design with a Constructive Learning[J]. International Journal of Fuzzy Systems,2011, 13(3): 175-184.
Research on Attitude Control of Reentry for Reusable Launch Vehicles Based on Adaptive RBF Neural Network
Dou Liqian, Tian Xiaodi
School of Electrical and Automation, Tianjing University, Tianjin 300072, China
Anadaptiveradialbasisfunctionneuralnetworkcontrol(ARBFNNC)methodispresentedtoaddresstheattitudecontrolproblemofreentryforreusablelaunchvehicles(RLV).Firstly,the6-DOFnonlineardynamicmodelofRLVisestablishedandtherotationaldynamicsandrotationalkinematicaretransformedintostrict-feedbacksystem.Hence,anARBFNNCsystemstructureisestablishedwhichcanbenefittoreducetheeffectsoftheapproximationerrorofneuralnetwork.Then,bycombiningtheadaptivemethodwithLyapunovfunction,thestabilityofsystemisguaranteedandtheuncertaineffectintheprocessofcontrollerdesigniseliminated.Finally,anumericalsimulationisemployedtoillustratetheeffectivenessoftheproposedstrategybysolvingproblemofattitudecontrolaccuracyandthesystemrobustness.ThesimulationresultsdemonstratethattheARBFNNCsystemcanachievefavorablecontrolperformanceaftertheparameterlearningoftheARBFNN.
Attitudecontrol; RBFneuralnetwork;Reusablelaunchvehicles
* 國家自然基金項(xiàng)目(91016018,61074064)
2016-04-21
竇立謙(1976-),男,河北人,博士,副教授,主要研究方向?yàn)閺?fù)雜系統(tǒng)建模與控制、飛行器建模與控制;田曉笛(1991-),女,河北人,碩士研究生,主要研究方向?yàn)轱w行器控制。
TP273
A
1006-3242(2017)01-0025-06