夏 川, 董朝陽, 王 青, 程昊宇
(1. 北京航空航天大學(xué)航空科學(xué)與工程學(xué)院, 北京 100191; 2. 北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院, 北京 100191; 3. 西北工業(yè)大學(xué)航天學(xué)院, 陜西 西安 710072)
傳統(tǒng)的導(dǎo)彈制導(dǎo)與控制系統(tǒng)分別設(shè)計(jì)制導(dǎo)回路和控制回路,在此框架下,需要反復(fù)設(shè)計(jì)兩個回路,無法達(dá)到最優(yōu)性能,且未考慮兩個回路間的耦合,全局穩(wěn)定性不能在數(shù)學(xué)上得到嚴(yán)格證明[1]。制導(dǎo)與控制一體化(integrated guidance and control, IGC)[2-3]方法根據(jù)彈目相對運(yùn)動狀態(tài)直接產(chǎn)生控制指令,能夠提高導(dǎo)彈機(jī)動能力、作戰(zhàn)響應(yīng)速度及攻擊精度。
國內(nèi)外已有學(xué)者對此進(jìn)行了許多有意義的研究,文獻(xiàn)[4]選取合適的二次加權(quán)函數(shù)將制導(dǎo)與控制問題轉(zhuǎn)化為仿射動態(tài)約束下的離散時間有限時域二次優(yōu)化問題。文獻(xiàn)[5]基于反步滑??刂圃O(shè)計(jì)模糊逼近器,對內(nèi)外不確定性進(jìn)行補(bǔ)償,但由控制器直接求解出的控制量較大,響應(yīng)劇烈。文獻(xiàn)[6]將一類高速旋轉(zhuǎn)導(dǎo)彈線性化為一個線性參數(shù)時變(linear parameter-varying,LPV)系統(tǒng),并設(shè)計(jì)IGC算法,消除了旋轉(zhuǎn)引起的橫向耦合。文獻(xiàn)[7]針對一類舵機(jī)具有開關(guān)特性的導(dǎo)彈,設(shè)計(jì)滑模控制器,實(shí)現(xiàn)了對不精確建模和目標(biāo)機(jī)動的誤差抑制。文獻(xiàn)[8]建立了高超聲速飛行器再入段IGC嚴(yán)反饋模型,通過自適應(yīng)動態(tài)面將10階非線性不確定系統(tǒng)的控制器設(shè)計(jì)問題轉(zhuǎn)化為輸出調(diào)節(jié)問題,證明了系統(tǒng)一致最終有界。
現(xiàn)代戰(zhàn)爭中目標(biāo)機(jī)動性越來越高,入侵空天領(lǐng)域越來越大,例如對臨近空間高機(jī)動性目標(biāo)進(jìn)行攔截和打擊時,空氣稀薄,氣動舵面甚至失效。直接力/氣動力復(fù)合控制技術(shù)可有效解決這一問題,提高導(dǎo)彈動態(tài)性能。然而,橫側(cè)向噴流與空氣流場發(fā)生的復(fù)雜干擾效應(yīng)將會出現(xiàn)于脈沖發(fā)動機(jī)作動時,導(dǎo)彈飛行氣動區(qū)域內(nèi)會出現(xiàn)分離激波和分離渦等復(fù)雜的氣動現(xiàn)象[9],對控制系統(tǒng)的抗干擾設(shè)計(jì)提出了更高的要求。文獻(xiàn)[10]基于擴(kuò)張狀態(tài)觀測器(extended state observer,ESO)為反射鏡穩(wěn)定平臺設(shè)計(jì)了一類自適應(yīng)魯棒控制器,對模型誤差和外界干擾力矩具有魯棒性。文獻(xiàn)[11]設(shè)計(jì)了一類具有誤差補(bǔ)償?shù)木€性ESO,但自適應(yīng)滑模控制器的參數(shù)切換會引起觀測器輸出小幅抖動現(xiàn)象。文獻(xiàn)[12]提出一種模糊逼近方法,用以逼近未知不確定性,但需假設(shè)狀態(tài)的范圍,模糊基函數(shù)選取較為隨意。文獻(xiàn)[13]為吸氣式高超聲速飛行器設(shè)計(jì)了非線性誤差觀測器,保證了在輸入限幅、氣動參數(shù)不確定情況下的誤差觀測效果。
針對直接力/氣動力復(fù)合導(dǎo)彈,在發(fā)動機(jī)約束、舵偏約束等多約束條件下,如何發(fā)揮多執(zhí)行機(jī)構(gòu)優(yōu)勢,使得控制達(dá)到最優(yōu)是需要解決的問題。控制分配是解決這類問題的有效方法[14-16]。傳統(tǒng)方法先設(shè)計(jì)氣動控制回路,再進(jìn)行直接力分配設(shè)計(jì),這樣兩步分開的做法避免了控制系統(tǒng)綜合設(shè)計(jì)的困難,但設(shè)計(jì)經(jīng)驗(yàn)性很強(qiáng),且需要反復(fù)設(shè)計(jì)才能獲得較好的控制策略[17]。文獻(xiàn)[18]在執(zhí)行機(jī)構(gòu)不對稱性和飽和約束情況下,基于凸優(yōu)化和非線性規(guī)劃,設(shè)計(jì)回歸神經(jīng)網(wǎng)絡(luò)控制分配器,但通過實(shí)驗(yàn)獲取分配器,缺乏理論依據(jù)效率較低。文獻(xiàn)[19]提出一種修正的廣義逆矩陣方法,將控制分配問題抽象為約束條件下的參數(shù)化輸入矩陣歸零問題,但推導(dǎo)復(fù)雜,難以運(yùn)用于工程實(shí)踐。
本文在以上研究的基礎(chǔ)上,使用ESO對氣動參數(shù)攝動、噴流干擾、建模誤差等復(fù)合干擾進(jìn)行觀測,并設(shè)計(jì)自適應(yīng)律對觀測誤差進(jìn)行補(bǔ)償;使用反步法設(shè)計(jì)滑??刂破?通過自適應(yīng)補(bǔ)償來抑制復(fù)合干擾對系統(tǒng)的影響;隨后定義了一個虛擬控制力矩,規(guī)避了在控制器中直接求解控制量,并基于梯度下降法和混合整數(shù)線性規(guī)劃提出一種自適應(yīng)控制分配策略,充分使用了控制系統(tǒng)中誤差信息,在誤差增長快時能夠提高解算的實(shí)時性和精度,使系統(tǒng)快速收斂,誤差不再增長。最后仿真驗(yàn)證了IGC控制器設(shè)計(jì)方法、控制分配策略的有效性。
以導(dǎo)彈俯仰通道為例來說明直接力/氣動力復(fù)合控制導(dǎo)彈的IGC問題,偏航、滾轉(zhuǎn)通道可以通過設(shè)計(jì)協(xié)調(diào)通道與俯仰通道解耦[20-21],在此不再贅述。
彈目相對運(yùn)動關(guān)系如圖1所示,XOY為慣性系,M和T分別代表導(dǎo)彈和目標(biāo),R為彈目相對距離,λ為視線角,VM、VT分別為導(dǎo)彈和目標(biāo)速度,θM、θT分別為導(dǎo)彈和目標(biāo)的彈道傾角。
圖1 彈目相對運(yùn)動關(guān)系圖Fig.1 Missile and target relative motion geometry
由圖1可得導(dǎo)彈和目標(biāo)在縱向平面的相對運(yùn)動方程為
(1)
(2)
對式(2)求導(dǎo)可得
(3)
(4)
控制系統(tǒng)的設(shè)計(jì)目標(biāo)是使相對速度Vr→0,相對距離R→0。
當(dāng)氣動舵效率不足時,為提高導(dǎo)彈動態(tài)響應(yīng),使用脈沖發(fā)動機(jī)產(chǎn)生側(cè)向力和力矩,如圖2所示,脈沖發(fā)動機(jī)共有10環(huán),每環(huán)18個,相鄰的兩環(huán)間隔10°交錯排列,令e為圈號,e=1,2,…,10,p為脈沖發(fā)動機(jī)在各自圈內(nèi)的編號。
圖2 脈沖發(fā)動機(jī)示意圖Fig.2 Diagram of pulse engine
彈體坐標(biāo)系下不同位置的脈沖發(fā)動機(jī)產(chǎn)生的力矩[22]為
式中,當(dāng)e為奇數(shù)時,e*=2;當(dāng)e為偶數(shù)時,e*=1。
脈沖發(fā)動機(jī)一般成對使用,當(dāng)導(dǎo)彈載重有限時,僅使用位于z軸和y軸上的4個脈沖發(fā)動機(jī)就能產(chǎn)生所需要的控制力矩。本文在縱向平面內(nèi)僅使用位于正y軸方向5個和負(fù)y軸方向5個共10個脈沖發(fā)動機(jī)。脈沖發(fā)動機(jī)安裝緊湊,忽略不同脈沖發(fā)動機(jī)與質(zhì)心的間距差別。
已知單個脈沖發(fā)動機(jī)的推力F隨時間的變化規(guī)律可近似為
(5)
式中,Fm為穩(wěn)態(tài)推力;τ為推力延遲時間;由于τ值較小,發(fā)動機(jī)較快達(dá)到穩(wěn)態(tài)噴流,關(guān)閉發(fā)動機(jī)時推力迅速衰減,通過近似將脈沖發(fā)動機(jī)特性描述為矩形脈沖,總的直接力Fc可表示為
Fc=nF
(6)
式中,n為一個噴流周期內(nèi),使用的脈沖發(fā)動機(jī)個數(shù),0≤n≤5;上次噴流后不能馬上再次使用標(biāo)號相同的脈沖發(fā)動機(jī),最小噴流間隔時間為t0。
縱向平面內(nèi)導(dǎo)彈動力學(xué)模型[23]為
(7)
式中,m為導(dǎo)彈質(zhì)量;α為攻角;ωz為俯仰角速度;?為俯仰角;Jz為導(dǎo)彈對z軸的轉(zhuǎn)動慣量;MZ為俯仰力矩,表示為
MZ=M0+Mδzδz+Mf
(8)
δz為升降舵偏角;Mδz為舵偏角力矩系數(shù);Mf=LTFc為脈沖發(fā)動機(jī)產(chǎn)生的力矩;LT為脈沖發(fā)動機(jī)到導(dǎo)彈質(zhì)心的距離,取平均值;M0=M0(α,M,h,Vt,ωz)為攻角,馬赫數(shù)和高度等因素引起的力矩,通常線性化[24]為
M0=Mαα+Mωzωz
(9)
其余力和力矩可寫為
δz)
(10)
(11)
末制導(dǎo)段導(dǎo)彈速度近似為常值不變[5],假設(shè)有界復(fù)合干擾為dv、dα、dωz,復(fù)合干擾包括模型誤差、脈沖噴流干擾及目標(biāo)機(jī)動和氣動參數(shù)不確定性等,推導(dǎo)得到IGC模型為
(12)
(13)
(14)
(15)
式中
|di|≤di,max,i=1,2,3
系統(tǒng)受到噴流干擾產(chǎn)生的附加未知干擾力和力矩的影響,并且氣動參數(shù)存在攝動,目標(biāo)存在機(jī)動。在復(fù)合干擾條件下,進(jìn)一步設(shè)計(jì)控制器及控制分配策略。
設(shè)計(jì)控制律使式(15)表述的存在復(fù)合干擾的嚴(yán)格反饋非線性系統(tǒng)的狀態(tài)變量x1收斂至零,利用反步法分3步進(jìn)行IGC設(shè)計(jì)。
步驟1對式(15)中子系統(tǒng)1
(16)
進(jìn)行外環(huán)設(shè)計(jì),設(shè)計(jì)滑動模態(tài)面為
s1=x1
(17)
當(dāng)系統(tǒng)在該滑模面滑動時,狀態(tài)將快速下降,使得狀態(tài)x1→0,將s1對時間t求導(dǎo)得
(18)
由于d1為系統(tǒng)內(nèi)外干擾,無法預(yù)知,設(shè)計(jì)式(19)所示的二階ESO對其進(jìn)行觀測[25]。
(19)
式中,β11,β12為觀測器增益;函數(shù)fal(·)可以避免高頻震蕩,定義為
(20)
(21)
定義
觀測器的輸出滿足
Z11→x1,Z12→d1
(22)
為消除逼近誤差E12的影響,引入自適應(yīng)律對觀測誤差進(jìn)行補(bǔ)償,以提高制導(dǎo)精度,減小脫靶量。定義x2為外環(huán)控制量,則虛擬控制指令x2c可寫為
(23)
(24)
式中,c1>0,γ1>0,ρ1>0為待設(shè)計(jì)的參數(shù)。自適應(yīng)律可以對系統(tǒng)誤差進(jìn)行補(bǔ)償,減小系統(tǒng)控制誤差。
為避免下一步設(shè)計(jì)中對虛擬控制量求導(dǎo),避免反步法設(shè)計(jì)中存在的“計(jì)算膨脹”問題,設(shè)計(jì)一階低通濾波器對虛擬控制量x2c進(jìn)行濾波,即
(25)
(26)
將式(26)求導(dǎo)可得
(27)
與步驟1類似,采用ESO對未知復(fù)合干擾d2進(jìn)行觀測
(28)
為補(bǔ)償觀測器的觀測誤差,將虛擬控制指令x3c寫為
(29)
(30)
(31)
步驟3對式(15)中的子系統(tǒng)3進(jìn)行內(nèi)環(huán)設(shè)計(jì),定義復(fù)合虛擬控制力矩為
v=bu
(32)
其與真實(shí)力矩的關(guān)系為
(33)
(34)
對時間t求導(dǎo)可得
(35)
同理,采用ESO對未知復(fù)合干擾d3進(jìn)行觀測,即
(36)
為補(bǔ)償干擾觀測誤差,復(fù)合虛擬力矩v可以寫為
(37)
(38)
綜上所述,給出完整的一體化控制律為
(39)
由式(39)可看出,通過引入復(fù)合虛擬控制力矩項(xiàng),規(guī)避了直接在控制器中求解控制量,通過控制分配策略,即可求解出所需的舵偏量和使用的脈沖發(fā)動機(jī)個數(shù)。
定義整體精度為
χ=v-bu
(40)
v為虛擬控制力矩,b∈R1×2為控制效率矩陣,u∈R2×1為控制量。操縱面偏轉(zhuǎn)位置和偏轉(zhuǎn)速率滿足
(41)
假設(shè)計(jì)算機(jī)離散系統(tǒng)控制周期為T,操縱面偏轉(zhuǎn)的位置約束集合為凸集,表示為
(42)
(43)
脈沖發(fā)動機(jī)的使用約束集合為
(44)
s.t.δ∈Ωδ,n∈Ωn
式中,Wn和Wδz為脈沖發(fā)動機(jī)和舵機(jī)使用懲罰權(quán)重,均為正常值,為適應(yīng)分配實(shí)時性要求,減少控制分配中的抖振現(xiàn)象,使得控制量平穩(wěn),減少不必要的控制量飽和,取整體精度權(quán)值Wu為變權(quán)值,其更新策略為
Wu(k+1)=Wu(k)+ηΔWu(k)
(45)
控制目標(biāo)是使誤差滑模面趨于0,使用梯度下降法進(jìn)行在線自適應(yīng)調(diào)整,即
(46)
式中,si為誤差滑模面;η為自適應(yīng)調(diào)節(jié)因子,表示為
(47)
整個控制系統(tǒng)如圖3所示。
圖3 控制系統(tǒng)結(jié)構(gòu)圖Fig.3 Structure of control system
控制分配算法本質(zhì)上屬于迭代算法,由于控制系統(tǒng)實(shí)時性要求較高,設(shè)計(jì)迭代終止條件為分配權(quán)值限制和迭代次數(shù)限制,即
(48)
式中,β為容忍的權(quán)值限;M0為最大迭代次數(shù)。若系統(tǒng)以增大的速度遠(yuǎn)離滑模面,則按照梯度法增大整體精度權(quán)重Wu,此時使得權(quán)值變化大,系統(tǒng)更易達(dá)到權(quán)值限制,從而提高實(shí)際控制力矩對虛擬控制力矩的跟蹤精度,并使算法易收斂,提高實(shí)時性,使系統(tǒng)快速趨于滑模面;若誤差面增長較緩慢,則對實(shí)時性要求不高,可充分尋優(yōu)。控制分配策略能使系統(tǒng)逼近所要求的虛擬控制力矩。
定理1對于不確定系統(tǒng)式(15),采用ESO對復(fù)合干擾d1、d2和d3進(jìn)行觀測,使用在線自適應(yīng)律式(24)、式(30)和式(38)對觀測誤差進(jìn)行補(bǔ)償,并取滑??刂坡墒?39),則閉環(huán)系統(tǒng)的狀態(tài)跟蹤誤差將在有限時間內(nèi)收斂至原點(diǎn)附近任意小的緊集,x1趨于0。
取準(zhǔn)Lyapunov函數(shù)
(49)
式(49)對時間求導(dǎo)得
(50)
將式(22)、式(23)、式(26)、式(28)、式(29)、式(34)、式(36)、式(37)代入式(50),得
(51)
將在線自適應(yīng)律式(24)、式(30)和式(38)代入式(51),并由觀測誤差有上界可得
(52)
(53)
必存在非負(fù)的連續(xù)函數(shù)ξj(j=1,2)使得
(54)
將式(54)代入到式(53)可得
(55)
由式(53)和式(55),可得
(56)
應(yīng)用Young不等式ab (57) 將式(56)和式(57)代入到式(52)可得 (58) 取濾波器時間常數(shù)τi足夠小,則 此時有 則式(58)退化為 (59) (60) 將式(60)代入到式(59)可得 這意味著系統(tǒng)跟蹤誤差si最終有界穩(wěn)定,并滿足 至此,可以證明閉環(huán)系統(tǒng)一致最終有界,誤差收斂至距離原點(diǎn)任意小的鄰域,且此鄰域大小與有界復(fù)合干擾無關(guān),僅由控制器設(shè)計(jì)參數(shù)決定,最終使得x1→0。 證畢 為驗(yàn)證本文提出了控制方法及分配策略的正確性、高精度,針對如下模型進(jìn)行仿真驗(yàn)證。 導(dǎo)彈速度初始速度1 197 m/s,初始彈道傾角θM0為30°,初始攻角α(0)為10°,俯仰角速率ωz(0)為0,導(dǎo)彈初始位置為(xM,yM)=(0 m,11 000 m);目標(biāo)初始速度為926 m/s,初始彈道傾角θT0為160°,目標(biāo)初始位置為(xT,yT)=(23 000 m,28 000 m)。導(dǎo)彈標(biāo)稱氣動力參數(shù)為 設(shè)計(jì)控制器參數(shù)k1=29,k2=1.6,k3=1.6,自適應(yīng)律參數(shù)為 c1=c2=c3=1.5;γ1=γ2=1 γ3=0.01;ρ1=ρ2=ρ3=0.000 1 ESO參數(shù)為 β11=β21=β31=5;β12=β22=β32=30 μ11=μ21=μ31=0.25;δ1=δ1=δ1=0.2 分配策略權(quán)重取為:Wn=1,Wδz=0.1,Wu初值取Wu(0)=100,其他參數(shù)取κ=-0.1,權(quán)值限β=1.2,最大迭代次數(shù)M0=500。 對本文提出的方法在標(biāo)稱情況下和存在復(fù)合干擾情況下分別進(jìn)行仿真。標(biāo)稱情況綜合擾動信號d1=d2=d3=0;復(fù)合干擾包括氣動參數(shù)存在±20%不確定性,目標(biāo)以6g振幅、周期3/π正弦機(jī)動,噴流干擾d11=0.1sin(πt/2),d21=0.2sin(πt/2)和d31=0.1sin(πt/2)。 使用文獻(xiàn)[5]中的無控制分配的自適應(yīng)反步滑模控制設(shè)計(jì)方法作為對比,表1和圖4~圖14為結(jié)果對比。 表1 脫靶量和攔截時間 圖4 彈目相對距離RFig.4 History of missile and target relative distacnce R 圖5 復(fù)合干擾d1Fig.5 History of disturbance d1 圖6 復(fù)合干擾d2Fig.6 History of disturbance d2 圖7 復(fù)合干擾d3Fig.7 History of disturbance d3 圖8 攻角αFig.8 History of attack angle α 圖9 俯仰角速率ωzFig.9 History of pitch rate ωz 圖10 升降舵偏角δzFig.10 History of deflection δz 圖11 直接脈沖力Fig.11 History of pulse engine 圖13 滑模面s2Fig.13 History of surface s2 圖14 滑模面s3Fig.14 History of surface s3 由表1和圖4可以看出,本文提出的一體化控制及控制分配策略具有較小的脫靶量,并能快速攔截目標(biāo)。 圖5~圖7為復(fù)合干擾觀測曲線,可以看出,本文設(shè)計(jì)的ESO能夠準(zhǔn)確估計(jì)系統(tǒng)中存在的隨機(jī)擾動,說明ESO對隨機(jī)擾動觀測較為精確且具有魯棒性。 圖8~圖10分別為攻角、俯仰角速率、升降舵偏角響應(yīng)曲線,可看出文獻(xiàn)[5]無控制分配的滑模反步設(shè)計(jì)方法響應(yīng)量大,變化劇烈,且舵面存在飽和現(xiàn)象;而本文提出的方法,攻角、俯仰角速率、舵偏角響應(yīng)明顯減小且變化平緩,無飽和現(xiàn)象;圖11為直接力使用情況,直接脈沖力在存在復(fù)合干擾時動作頻繁,而文獻(xiàn)[5]直接求解出的控制量未充分利用直接力,導(dǎo)致舵偏飽和。 圖12~圖14為設(shè)計(jì)的滑模面響應(yīng)曲線,本文設(shè)計(jì)方法快速收斂且無增長,最終趨近于零。 綜上,本文設(shè)計(jì)方法能夠使得導(dǎo)彈快速精確打擊到目標(biāo),自適應(yīng)干擾補(bǔ)償能夠使系統(tǒng)對復(fù)合干擾具有魯棒性,自適應(yīng)控制分配避免了反復(fù)設(shè)計(jì),減小了舵偏量,使得系統(tǒng)狀態(tài)量響應(yīng)小,變化平滑,滑模誤差面無震蕩較快收斂。 本文針對直接力/氣動力復(fù)合控制導(dǎo)彈的IGC問題,設(shè)計(jì)ESO對系統(tǒng)復(fù)合干擾進(jìn)行觀測,構(gòu)造自適應(yīng)誤差滑模面補(bǔ)償觀測誤差,并使用反步法設(shè)計(jì)控制器,實(shí)現(xiàn)對復(fù)合干擾的抑制。 本文提出一種自適應(yīng)控制分配方法,綜合考慮控制的實(shí)時性和精度要求,使用滑模誤差對控制分配權(quán)值進(jìn)行在線自適應(yīng)調(diào)整,設(shè)計(jì)算法迭代終止條件,在誤差增大時提高實(shí)時性和分配精度,加快系統(tǒng)收斂。 仿真結(jié)果表明,所設(shè)計(jì)的廣義控制律和控制分配策略可以對復(fù)合干擾進(jìn)行補(bǔ)償,使得動態(tài)過程較為平滑,控制量較小,提高了系統(tǒng)魯棒性,脫靶量較小。3 仿真驗(yàn)證
4 結(jié) 論