李帥, 李新國(guó)
(1.西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072;2.西北工業(yè)大學(xué) 航天飛行動(dòng)力學(xué)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室, 陜西 西安710072)
?
基于MPSP的次優(yōu)滑模制導(dǎo)律
李帥1,2, 李新國(guó)1,2
(1.西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072;2.西北工業(yè)大學(xué) 航天飛行動(dòng)力學(xué)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室, 陜西 西安710072)
針對(duì)導(dǎo)彈攔截機(jī)動(dòng)目標(biāo)的問(wèn)題,提出了一種能滿足多終端約束的次優(yōu)滑模制導(dǎo)律(Sub-OSMG)。該算法將模型預(yù)測(cè)靜態(tài)規(guī)劃(MPSP)與滑??刂?SMC)相結(jié)合,解決了MPSP在系統(tǒng)模型不精確時(shí)由于依賴模型預(yù)測(cè)而導(dǎo)致的控制量發(fā)散問(wèn)題;基于三自由度相對(duì)運(yùn)動(dòng)方程建立所提出的制導(dǎo)律,其魯棒性通過(guò)Lyapunov穩(wěn)定性理論進(jìn)行了證明;在滑??刂频脑O(shè)計(jì)中引入一種較為新穎的滑模面,巧妙地繼承了兩種方法的優(yōu)點(diǎn),其區(qū)別于傳統(tǒng)擴(kuò)展比例導(dǎo)引(APN),在僅知機(jī)動(dòng)幅值的情況下,能精確地?fù)糁心繕?biāo)。仿真結(jié)果表明,所提出的Sub-OSMG能夠有效地抵消外部擾動(dòng),具有更高的精度、更好的魯棒性、更小的控制代價(jià)。
制導(dǎo); 最優(yōu)控制; 多終端約束; 滑??刂? 模型預(yù)測(cè)靜態(tài)規(guī)劃; 魯棒性
到目前為止,由于在求解兩點(diǎn)邊值問(wèn)題和高維系統(tǒng)上依賴梯度法或打靶法等,最優(yōu)控制理論在制導(dǎo)方面的應(yīng)用中需要大量的計(jì)算,一般僅應(yīng)用于離線計(jì)算,作為指令存儲(chǔ)在計(jì)算機(jī)中。而能夠在線應(yīng)用的最優(yōu)制導(dǎo)律大部分都基于線性二次最優(yōu)控制理論,獲得反饋形式的控制量修正。然而,該方法一般需要參考軌跡,這在有些情況下并不可取。文獻(xiàn)[1]提出了針對(duì)時(shí)變速度的一種閉環(huán)最優(yōu)制導(dǎo)律,文獻(xiàn)[2]將加速度指令與時(shí)間不確定項(xiàng)聯(lián)系起來(lái)設(shè)計(jì)了最優(yōu)制導(dǎo)律。而基于狀態(tài)黎卡提方程(SDRE)的制導(dǎo)算法[3],需要在線反復(fù)求解黎卡提方程,系統(tǒng)維數(shù)較高時(shí)求解就變得很費(fèi)力,甚至不可解。一個(gè)較為高效的方法即動(dòng)態(tài)規(guī)劃,類似SDRE需要求解HJB方程[4],然而HJB方程是一個(gè)非線性的偏微分方程組,求解亦是一個(gè)難點(diǎn)。
針對(duì)上述求解費(fèi)力、耗時(shí)等問(wèn)題,文獻(xiàn)[5]將模型預(yù)測(cè)控制(Model Perdictive Control,MPC)與近似動(dòng)態(tài)規(guī)劃(Approximate Dynamic Programming,ADP)技術(shù)相結(jié)合,提出了模型預(yù)測(cè)靜態(tài)規(guī)劃 (Model Predictive Static Programming,MPSP)算法,該算法兼顧了計(jì)算效率與求解的難易程度,將傳統(tǒng)的動(dòng)態(tài)規(guī)劃轉(zhuǎn)化為靜態(tài)規(guī)劃問(wèn)題求解,成功地將最優(yōu)控制理論引入制導(dǎo)體系。在求解兩點(diǎn)邊值問(wèn)題時(shí),通過(guò)遞歸求解協(xié)狀態(tài)變量以更新控制量,滾動(dòng)修正誤差。這樣大大提高了計(jì)算效率,降低了計(jì)算復(fù)雜度。
然而,該最優(yōu)制導(dǎo)算法(MPSP)需要精確的模型信息完成預(yù)測(cè)環(huán)節(jié),若系統(tǒng)存在未知擾動(dòng)或建模不確定項(xiàng),預(yù)測(cè)部分將不能提供準(zhǔn)確的反饋值,導(dǎo)致誤差會(huì)隨著系統(tǒng)運(yùn)行積累,相當(dāng)多的情況下便會(huì)發(fā)散。針對(duì)這一問(wèn)題,很多學(xué)者利用滑模控制(Sliding Mode Control,SMC)對(duì)外部擾動(dòng)的不敏感性,將最優(yōu)控制與SMC相結(jié)合,提出了制導(dǎo)律。如文獻(xiàn)[6]基于此,根據(jù)視線角變化率推導(dǎo)出了最優(yōu)魯棒制導(dǎo)律;文獻(xiàn)[7]針對(duì)機(jī)動(dòng)目標(biāo)提出了一種最優(yōu)滑模制導(dǎo)律;之后文獻(xiàn)[8]進(jìn)一步提出了有速度及終端約束的制導(dǎo)律;文獻(xiàn)[9]在前人研究的基礎(chǔ)上,利用SDRE獲得最優(yōu)解,通過(guò)設(shè)計(jì)滑模面進(jìn)而獲得另一種形式的制導(dǎo)律。
但是,上述方法依然存在計(jì)算復(fù)雜度過(guò)高、在線求解困難等問(wèn)題。本文將MPSP與SMC相結(jié)合,充分利用MPSP的效率優(yōu)勢(shì)和SMC的抗干擾特性,設(shè)計(jì)了一種新穎的制導(dǎo)律,其在結(jié)構(gòu)上兼顧了最優(yōu)性與魯棒性,將其應(yīng)用于攔截機(jī)動(dòng)目標(biāo)制導(dǎo)中,驗(yàn)證了算法的有效性。
圖1給出了追蹤問(wèn)題彈目相對(duì)運(yùn)動(dòng)幾何關(guān)系。以導(dǎo)彈初始位置建立慣性坐標(biāo)系(x,y,z),根據(jù)相對(duì)關(guān)系建立彈目視線坐標(biāo)系(r,θ,φ)。其中,r為導(dǎo)彈與目標(biāo)的相對(duì)距離;θ和φ分別為視線方向角和高低角。
圖1 三維相對(duì)運(yùn)動(dòng)幾何關(guān)系Fig.1 3-D relative motion geometry
(1)
對(duì)上式兩端再求導(dǎo)并整理,可得到3個(gè)方向的動(dòng)力學(xué)方程:
(2)
(3)
式中:f(x)為狀態(tài)函數(shù);B為控制矩陣;u,w 分別為導(dǎo)彈和目標(biāo)的加速度,具體定義如下:
式中:視目標(biāo)加速度w為系統(tǒng)擾動(dòng)項(xiàng)。
2.1MPSP算法簡(jiǎn)述
考慮一非線性系統(tǒng),離散化如下:
(4)
(5)
式中:dUk為控制量增量;Rk為加權(quán)矩陣。根據(jù)MPSP理論[5],控制增量為:
(6)
2.2帶補(bǔ)償項(xiàng)的MPSP算法
在MPSP算法基礎(chǔ)上,設(shè)計(jì)補(bǔ)償項(xiàng)結(jié)構(gòu)??紤]一帶擾動(dòng)的仿射非線性系統(tǒng):
(7)
(8)
(9)
假設(shè)初始控制量猜測(cè)值為up,du 為控制增量,末端約束為xd,性能指標(biāo)為:
(10)
將其離散化,按照上一節(jié)MPSP算法可得控制量為:
(11)
為了補(bǔ)償系統(tǒng)的不確定或外部擾動(dòng),將控制量設(shè)計(jì)為如下形式:
(12)
式中:后一項(xiàng)為補(bǔ)償項(xiàng),選擇形式等價(jià)于SMC中等效控制ueq與udis。前者保證系統(tǒng)在滑動(dòng)面上時(shí)滿足約束并使能量最省;后者使系統(tǒng)對(duì)擾動(dòng)保持不敏感。下文將基于SMC對(duì)ucomp進(jìn)行設(shè)計(jì)。
基于前文的設(shè)計(jì),對(duì)式(3)設(shè)計(jì)如下的滑模面:
(13)
式中:G(x)∈Rm×n為系數(shù)矩陣,其保證G(x)B(x)非奇異。
由上式可知,在t=0時(shí),s=0,即初始狀態(tài)在滑模面上。對(duì)上式兩邊求導(dǎo)并結(jié)合式(3),可得:
(14)
(15)
(16)
式中:DL,DU為擾動(dòng)上下界且已知。結(jié)合式(13)得補(bǔ)償項(xiàng)為:
ucomp=-(GB)-1[ks+εsgn(s)]-Dc
(17)
其中:
根據(jù)Lyapunov穩(wěn)定性理論,考慮如下李亞普諾夫函數(shù):
(18)
(19)
(20)
(21)
式中:δ為很小的正常數(shù)。由此便可得到一種能滿足多終端約束的次優(yōu)滑模制導(dǎo)律:
(22)
首先將本文的算法應(yīng)用于一線性受擾系統(tǒng),完成受擾動(dòng)時(shí)的狀態(tài)轉(zhuǎn)移,其次將該方法應(yīng)用于制導(dǎo)問(wèn)題,視目標(biāo)機(jī)動(dòng)為系統(tǒng)擾動(dòng),假設(shè)按正弦曲線機(jī)動(dòng),在僅已知機(jī)動(dòng)幅值情況下完成仿真,說(shuō)明本文算法的有效性。
4.1考慮帶擾動(dòng)線性系統(tǒng)
系統(tǒng)方程如下:
(23)
式中:I3為三維單位矩陣;ν為控制量(標(biāo)量);d為擾動(dòng)項(xiàng),假設(shè)d=Asinωt,其中A=5為幅值,ω=1 s-1為頻率。初始狀態(tài)x0=[1,1,1]T,終端約束xf=[0,-1,2]T,仿真時(shí)間t=10 s,初始控制量ν=0,仿真結(jié)果如圖2、圖3及表1所示。表1中,∞表示相對(duì)誤差不存在(真值為0)。
圖2 狀態(tài)量曲線Fig.2 State variables
圖3 控制量曲線Fig.3 Control variables
終端值x1x2x3MPSP末端-0.015-1.1151.278Sub-OSMG末端-0.003-1.0011.993期望值0-12MPSP相對(duì)誤差/%∞11.536Sub-OSM相對(duì)誤差/%∞0.10.35
可以看出,Sub-OSMG由于有補(bǔ)償項(xiàng),其狀態(tài)量幅值較MPSP小很多,且MPSP在有未知擾動(dòng)時(shí)未能滿足終端約束。表1表明:其終端誤差在受擾動(dòng)時(shí)較后者大;控制量上,Sub-OSMG除初始時(shí)刻由于滑模的切換作用有抖振外,其值保持穩(wěn)定,而MPSP控制量振幅逐漸在增大。
4.2考慮攔截機(jī)動(dòng)目標(biāo)問(wèn)題
(24)
式中:χ為正常數(shù);ξi=e-rkβ(i=1,2,3;β為正常數(shù))。仿真結(jié)果如圖4~圖10所示。
圖4 相對(duì)距離Fig.4 Relative distance
圖5 方向角Fig.5 Azimuth angle
圖6 高低角Fig.6 Angular altitude
圖7 方向角變化率Fig.7 Variation rate of azimuth angle
圖8 高低角變化率Fig.8 Variation rate of angular altitude
圖9 控制量uθFig.9 Control variable uθ
圖10 控制量uφ Fig.10 Control variable uφ
從圖4~圖6中可以看出:三種算法并非均滿足多終端距離及角度約束,APN本身無(wú)滿足約束的能力;MPSP算法由于預(yù)測(cè)誤差累計(jì),最終未能擊中目標(biāo);所提出的Sub-OSMG能夠有效地抵抗外部干擾,實(shí)現(xiàn)了較高的精度。由圖7和圖8可知,除所提出的算法外,APN和MPSP角度變化率逐漸在增大,MPSP末端發(fā)散。由圖9和圖10可知,Sub-OSMG算法的控制量幅值最小,且較為平滑,在末端時(shí)均接近0。
本文在綜合分析MPSP及SMC基本理論的基礎(chǔ)上,將兩者結(jié)合提出了一種較為新穎的次優(yōu)制導(dǎo)算法。經(jīng)仿真驗(yàn)證表明:該算法對(duì)系統(tǒng)不確定性或存在干擾時(shí)具有魯棒性,且保持了MPSP的解析性及次優(yōu)性的優(yōu)點(diǎn),能滿足多終端約束,制導(dǎo)精度較高,并且具有一般性,對(duì)兩點(diǎn)邊值問(wèn)題或狀態(tài)轉(zhuǎn)移問(wèn)題同樣適用。綜合分析表明,所提出的制導(dǎo)律是一種較為有效的算法。
[1]Cho H,Ryoo C K,Tahk M J.Closed-form optimal guidance law for missiles of time-varying velocity[J].Journal of Guidance,Control,and Dynamics,1996,19(5):1017-1023.
[2]Yaesh I,Ben-Asher J Z.Optimal guidance with a single uncertain time lag[J].Journal of Guidance,Control,and Dynamics,1995,18(5):981-988.
[3]Mracek C P,Cloutier J R.Control designs for the nonlinear benchmark problem via state-dependent Riccati equation method[J].International Journal of Robust and Nonlinear Control,1998,8(4/5):401-433.
[4]Bryson J A E,Ho Y C.Applied optimal control: optimization,estimation and control[M].USA:N J,New York Press,1975:128-147,177-211.
[5]Padhi R,Kothari M.Model predictive static programming:a computationally efficient technique for suboptimal control design[J].International Journal of Innovative Computing,Information,and Control,2009,5(2):399-411.
[6]Zhou D,Mu C,Ling Q,et al.Optimal sliding-mode guidance of homing-missile[C]//Proceedings of the 38th IEEE Conference Decision and Control.Phoenix,AZ,1999:5131-5136.
[7]Bahrami M,Ebrahimi B,Roshanian J.Optimal sliding-mode guidance law for fixed-interval propulsive maneuvers[C]//Proceedings of IEEE Conference on Control Application.Munich,Germany,2006:1014-1018.
[8]Ebrahimi B,Bahrami M,Roshanian J.Optimal sliding mode guidance with terminal velocity constraint for fixed interval propulsive maneuvers[J].Acta Astronautica,2008,62(10):556-562.
[9]Seyyed Sajjad Moosapour,Ghasem Alizadeh,Sohrab Khanmohammadi,et al.A novel nonlinear robust guidance law design based on sdre technique[J].Journal of Aeronautical and Space Sciences,2012,13(3):369-376.
(編輯:姚妙慧)
Sub-optimal sliding mode guidance law based on MPSP
LI Shuai1,2, LI Xin-guo1,2
(1.School of Astronautics, NWPU, Xi’an 710072, China;2.National Key Laboratory of Aerospace Flight Dynamics, NWPU, Xi’an 710072, China)
A sub-optimal sliding mode guidance law(Sub-OSMG) which can satisfy the multiple terminal constraints is proposed for missile to intercept maneuvering target. By combining sliding-mode control(SMC) and model predictive static programming(MPSP), the results divergence problem of MPSP due to excessive dependence on model prediction when system model is inaccuracy can be solved successfully. The guidance law is established based on three degree of freedom motion equation and its robustness against disturbance is proved by Lyapunov theory. In sliding mode control a new sliding surface is introduced, so the proposed guidance law can inherit the merits of the two methods, it is therefore different from the conventional guidance law like APN and can accurately hit the target with only the maneuvering amplitude. Simulation results show that the Sub-OSMG is of higher accuracy, better robustness and lower control cost, and could effectively counteract the external disturbance.
guidance; optimal control; multiple terminal constraints; sliding-mode control; model predictive static programming; robustness
2015-11-19;
2016-03-30; 網(wǎng)絡(luò)出版時(shí)間:2016-04-22 09:52
李帥(1989-),男,陜西西安人,博士研究生,研究方向?yàn)轱w行器制導(dǎo)與控制。
TJ765.3
A
1002-0853(2016)05-0054-05