常曉飛,孫 博,閆 杰,符文星
(西北工業(yè)大學 航天學院,陜西 西安 710072)
高超聲速飛行器飛行馬赫數(shù)可達5[1],能夠主動持續(xù)機動,對現(xiàn)有防御體系構(gòu)成嚴重威脅[2]。由于高超聲速飛行器紅外特征顯著,當前多采用紅外導引頭對其攔截防御。受導引頭工作條件等因素的限制,導彈相對于目標不再具備速度優(yōu)勢,故工程上只能采用相對速度高、制導時間短的迎頭攔截模式[3],這對導彈機動能力提出了較高要求。臨近空間大氣稀薄,僅靠氣動力無法滿足過載需求,必須輔以直接力控制,這使得直接力燃料消耗成為需要考慮的因素。另一方面,隨著科技的發(fā)展,進攻武器將裝有主動探測和攔截告警裝置,能夠進行主動機動突防[4],使攔截過程構(gòu)成復雜博弈問題。因此,有必要開展針對高超聲速目標的制導律研究設(shè)計工作。
微分對策制導律(differential game-based guidance law,DGL)有效結(jié)合博弈論的基本思想和最優(yōu)控制的基本原理[5],將攔截過程視為一類二人零和博弈模型,目標和導彈作為博弈雙方,分別使各自的性能指標達到最優(yōu),適用于主動機動目標的攔截防御。由于微分對策問題的非線性和復雜性,大量工作集中于數(shù)值求法。文獻[6]以捕獲時間為性能指標,使用梯度直接法尋求鞍點并設(shè)計制導律,但模型過于復雜。文獻[7]針對彈道導彈攔截問題求解鞍點,但無法攔截主動持續(xù)機動目標。非線性模型預測控制(nonlinear model predictive control,NMPC)可以考慮高度非線性系統(tǒng)動力學固有的物理約束和其他苛刻的性能要求,已被廣泛應(yīng)用于航空航天領(lǐng)域的各種制導控制問題[8]。因此,將NMPC和DGL各自優(yōu)點相結(jié)合成為新的研究方向。文獻[9]從一類實際的空地追逃問題出發(fā),驗證了NMPC實時求解微分對策問題的可行性。文獻[10]將梯度迭代法與NMPC結(jié)合,設(shè)計了二維平面的DGL,但僅針對低速弱機動目標進行分析,無法直接推廣到高速機動目標的三維攔截問題。
本文通過分析高超聲速目標的攔截模式以及制導律設(shè)計需求,在所建立的三維末制導模型基礎(chǔ)上,將NMPC和微分對策理論相結(jié)合,提出了一種基于NMPC的微分對策制導律(NMPC-DGL)。該制導律以視線角速率和燃料消耗量為性能指標,利用梯度下降法實時求解決策約束型有限時域微分對策(decision-constrained finite-horizon differential game,DCFDG),得到滿足精度、過載限制和燃料消耗要求的制導策略,實現(xiàn)對高速機動目標的精確攔截。
導彈與目標相對運動關(guān)系如圖1所示。以末制導起始時導彈位置為原點,速度方向為X軸正向,按右手準則建立慣性坐標系OXYZ;MX′Y′Z′為固聯(lián)在彈體上的與OXYZ平行的坐標系。以彈體為原點,以導彈指向目標的視線方向為r軸正向,按右手準則建立視線坐標系Mrεβ。
圖1中,(X,Y,Z)為飛行器在慣性系下的坐標位置,R為導彈與目標的相對距離,qβ和qε分別為視線的偏航角和俯仰角。在Mrεβ坐標系下,假設(shè)導彈和目標的加速度及其在3個坐標軸的投影分別為aM=(aMraMεaMβ)T和aT=(aTraTεaTβ)T,則彈目相對加速度為[11]
(1)
考慮自動駕駛儀一階動態(tài)響應(yīng):
(2)
(3)
式中:nMc,nTc分別為導彈和目標的過載指令;g為重力加速度常數(shù);τM,τT分別為雙方自動駕駛儀時間常數(shù),并假設(shè)對于每個飛行器各通道時間常數(shù)相同。
(4)
(5)
(6)
從而得到三維空間制導模型的狀態(tài)變量和輸入量:
x=(vrωεωβaMεaMβaTεaTβ)T
(7)
nMc=(nMεcnMβc)T∈NMc
(8)
nTc=(nTεcnTβc)T∈NTc
(9)
式中:NMc,NTc分別為nMc,nTc的定義域。
受熱防護和超燃沖壓發(fā)動機工作條件等限制,高超聲速飛行器的機動能力有限,但其機動時刻、機動模式不能預測。而DGL不需要對目標未來的機動做任何假設(shè),僅考慮目標的機動能力[12],在性能指標J要求下考慮最壞的情況求取鞍點,并以之為控制策略,使目標機動的潛在作用達到最小。
針對1.2節(jié)建立的攔截過程的系統(tǒng)狀態(tài)方程,基于離散序列,博弈雙方分別采用NMPC實時求解DCFDG得到鞍點,算法流程如圖2所示。
在預測時域內(nèi),設(shè)計零和DCFDG,根據(jù)彈目相對運動關(guān)系進行模型預測遞推,采用梯度下降法尋求雙方最優(yōu)決策,在迭代過程中將對方最優(yōu)決策加以考慮。在控制時域內(nèi),導彈根據(jù)最優(yōu)決策進行機動,在時域內(nèi)保持不變,完成滾動優(yōu)化過程。將實際局勢引入下一預測時域,構(gòu)成閉環(huán)反饋。需要注意的是,該制導律根本上仍是導彈對J的最優(yōu)化,同時考慮了目標機動能力可能對攔截過程造成的最壞影響,而不依賴于目標的機動,目標機動方式可以獨立。
在導彈結(jié)構(gòu)參數(shù)確定的情況下,制導律的性能將完全依賴于性能指標。在一個預測時域內(nèi),以視線角速度為終端指標,并考慮直接力燃料消耗和過載平滑變化的要求,可構(gòu)造如下復合型性能指標:
(10)
式中:函數(shù)G為終端約束函數(shù);t0,tf分別為預測時域的初始時間和末端時間;Q1,Q2,γ為相應(yīng)的權(quán)系數(shù)。對權(quán)系數(shù)Q1和Q2,只需考慮主對角線上第2個元素和第3個元素,其余元素可設(shè)為0。
nMc和nTc滿足如下飽和函數(shù)約束:
(11)
式中:下標i為M時代表導彈,為T時代表目標。下標j表示物理量在ε軸或β軸的投影。
在一個預測時域內(nèi),導彈期望求得最優(yōu)決策使得性能指標J最小,目標則與之相反,以完成突防,雙方構(gòu)成零和DCFDG:
(12)
文獻[13]提出了利用梯度下降法求解DCFDG的方法,并證明了此方法的有效性和收斂性,具體步驟如下。
(13)
式中:H為哈密爾頓函數(shù),λ為協(xié)態(tài)變量。
(14)
(15)
(16)
(17)
式中:α1>0,α2>0,是迭代步長;LM,LT是雙方的控制約束。
(18)
為了考核NMPC-DGL的有效性,對導彈迎頭攔截高超聲速飛行器的末制導段,在目標采用方波機動和博弈突防2種情況下進行數(shù)值仿真,并與比例導引律進行對比。
α1=α2=0.618k+0.001
(19)
仿真校驗中采用真比例導引(true proportional navigation,TPN):
(20)
式中:η為導引系數(shù),仿真中設(shè)為3。
導彈燃料消耗指標為
(21)
式中:ζ為無量綱量;tF為彈目交匯時間;nMj為導彈實際過載;下標j含義與式(11)相同。
設(shè)目標位置為(30 000,300,300)(單位:m),速度方向與導彈相反,方波機動周期為5 s。表1記錄了脫靶量δ、燃料消耗ζ和導彈末端過載大小nMε,F和nMβ,F,結(jié)果表明:NMPC-DGL能夠在與TPN燃料消耗相當?shù)那闆r下完成對目標惡劣機動條件下的有效攔截,且具有更小的終端脫靶量。TPN的終端過載達到飽和,而NMPC-DGL終端過載很小,從而保證末端彈道盡可能平直。
表1 目標方波機動仿真結(jié)果
圖3給出了在目標做方波機動情況下的導彈三維攔截軌跡。結(jié)合圖4、圖5,在攔截過程中,2種制導律都試圖使視線角速度趨于0。與TPN相比,NMPC-DGL在末制導攔截過程前期可以輸出較大的過載,使得視線角速度很快收斂。NMPC-DGL對于目標過載有更好的跟蹤效果,可以使視線角速度始終保持在0值附近。圖3~圖5同時給出了含噪聲時NMPC-DGL的仿真曲線,可以看出噪聲(主要為視線角速度噪聲)使過載輸出震蕩,但飛行軌跡幾乎與無噪聲時重合。
在引入噪聲的情況下,假設(shè)目標能獨立獲取與導彈相同類型的制導信息,并采取使J最大的策略機動突防。目標初始位置為(30000,100,100)(單位:m),彈道傾角和偏角分別為3°和5°。表2考察了導彈對目標機動能力存在κ=±50%的預估偏差時NMPC-DGL的仿真結(jié)果。TPN脫靶量大于2 m,無法通過直接碰撞對目標進行有效毀傷,而存在預估偏差時NMPC-DGL仍能有效命中目標。
表2 目標博弈突防機動仿真結(jié)果
圖6~圖9給出了目標做博弈突防機動時分別采用2種制導律導引的仿真曲線,其中NMPC-DGL無預估偏差。
圖6中的目標軌跡和攔截軌跡都有所差異。結(jié)合圖7~圖9,TPN視線角速度變化緩慢,甚至逐漸增大,使得終端過載飽和。而NMPC-DGL在末制導的中、前期過載較大,能夠快速鎮(zhèn)定視線角速度。此后目標為躲避攔截,改變過載指令符號,導彈可用過載大,能迅速調(diào)整以減小目標機動的影響。但由于超調(diào),雙方過載指令頻繁變號,引起過載震蕩。但過載幅值較小,彈道較TPN更為平直,符合實際工程期望。同時,設(shè)計的NMPC-DGL以快速鎮(zhèn)定視線角速度為手段來命中目標,并非跟蹤目標機動,目標機動能力預估偏差雖干擾了策略求解,但對實際制導結(jié)果影響較小。
通過分析高超聲速飛行器的攔截模式和制導需求,本文結(jié)合NMPC方法,設(shè)計了一種微分對策制導律NMPC-DGL。仿真結(jié)果表明,NMPC-DGL能夠在充分滿足動態(tài)系統(tǒng)高維非線性、機動能力限制和燃料消耗限制等要求下,實現(xiàn)對目標的精確攔截。與TPN相比,NMPC-DGL能夠在保證飛行燃料消耗相當甚至更小的情況下使終端脫靶量更小;且NMPC-DGL克服了比例導引律的主要缺點,末端彈道較為平直;對目標機動能力存在預估偏差時仍能有效攔截,且不需要預估其機動方式。這說明該制導律迎頭攔截高速機動目標時具有良好的制導性能。但微分對策理論以最優(yōu)控制理論為基礎(chǔ),與最優(yōu)制導律相似,NMPC-DGL對噪聲相對敏感,噪聲過大會導致制導性能下降,后續(xù)工作應(yīng)結(jié)合濾波技術(shù)以減小過載輸出震蕩。