方 偉,李富貴,方 君,徐 濤
(1.海軍航空大學(xué)信息融合研究所,山東 煙臺 264001;2.中國運(yùn)載火箭技術(shù)研究院,北京 100076)
最優(yōu)制導(dǎo)律為具有末端約束的在有限時(shí)間內(nèi)最優(yōu),可適用于空空導(dǎo)彈的最優(yōu)制導(dǎo)律主要有5種。比例導(dǎo)引律(PN)是目前廣泛應(yīng)用的一種制導(dǎo)律,它被證明是目標(biāo)不機(jī)動(dòng)以及系統(tǒng)零滯后時(shí)的最優(yōu)制導(dǎo)律[1]。增強(qiáng)比例導(dǎo)引律(APN)是在理想系統(tǒng)下對付常值機(jī)動(dòng)目標(biāo)的最優(yōu)的制導(dǎo)律[1]。而真實(shí)的導(dǎo)彈系統(tǒng)存在諸多的動(dòng)力學(xué),由于動(dòng)力學(xué)滯后,導(dǎo)致PN 和APN 都會有比較大的末端過載需求以及產(chǎn)生較大的脫靶量。PN-M 制導(dǎo)律是在考慮目標(biāo)常值機(jī)動(dòng)的情況下,并把導(dǎo)彈的制導(dǎo)動(dòng)力學(xué)簡化為一階滯后模型的最優(yōu)制導(dǎo)律[3-4]。但實(shí)際上目標(biāo)也具有動(dòng)力學(xué),PN-MT0 制導(dǎo)律是假設(shè)目標(biāo)含有一階動(dòng)力學(xué),目標(biāo)存在機(jī)動(dòng)加速度初值、零指令輸入時(shí)的最優(yōu)制導(dǎo)律[5-6]。PN-MT 制導(dǎo)律是目標(biāo)包含一階動(dòng)力學(xué),目標(biāo)加速度指令為常值最優(yōu)制導(dǎo)律[7]。上述制導(dǎo)律在其各自的假設(shè)條件下均為最優(yōu),但最接近真實(shí)情況的假設(shè)是PN-MT 制導(dǎo)律的推導(dǎo)條件,因此,可在PN-MT 的推導(dǎo)條件下對比各個(gè)最優(yōu)制導(dǎo)律的性能。
任一線性時(shí)變系統(tǒng)都存在一個(gè)伴隨系統(tǒng)[2,7]。如果線性時(shí)變的制導(dǎo)系統(tǒng)存在若干個(gè)確定的輸入或統(tǒng)計(jì)的擾動(dòng)(比如:目標(biāo)機(jī)動(dòng),初始指向偏差,量測噪聲誤差等),利用脈沖激勵(lì)伴隨系統(tǒng)則不僅可以得到關(guān)心的總量(比如總脫靶量,總需用加速度)隨末導(dǎo)時(shí)間的變化趨勢,還可以得到每個(gè)輸入對系統(tǒng)的貢獻(xiàn)。利用伴隨函數(shù)法,既可以求解確定性問題,也可以求解隨機(jī)問題,只需要運(yùn)行一次伴隨系統(tǒng),即可得到對正向系統(tǒng)使用蒙特卡洛運(yùn)行幾百次的結(jié)果,其效率非常高。
符號定義:atc為目標(biāo)加速度指令,at為目標(biāo)加速度,amc為導(dǎo)彈加速度指令,am為導(dǎo)彈加速度,ωt為目標(biāo)一階動(dòng)力學(xué)等效帶寬,ωm為導(dǎo)彈一階動(dòng)力學(xué)等效帶寬,y 為彈目相對橫向位置,為彈目相對橫向速度,為彈目相對橫向加速度,yt為目標(biāo)橫向位置,為目標(biāo)橫向速度,ym為導(dǎo)彈橫向位置,為導(dǎo)彈橫向速度,g 為重力加速度,為彈目視線旋轉(zhuǎn)角速度,vc為彈目接近速度,tgo為剩余飛行時(shí)間。
圖1 給出了攔截幾何關(guān)系圖。LOS 為基準(zhǔn)彈目方向,XOY 為隨理想目標(biāo)勻速直線運(yùn)動(dòng)的慣性坐標(biāo)系。yt和ym為相對XOY 慣性坐標(biāo)系垂直基準(zhǔn)彈目線LOS 方向的運(yùn)動(dòng)。導(dǎo)彈加速度am及目標(biāo)機(jī)動(dòng)加速度at是垂直基準(zhǔn)LOS 的絕對加速度,y,,y··為目標(biāo)相對導(dǎo)彈在垂直基準(zhǔn)LOS 方向的相對運(yùn)動(dòng)。
圖1 攔截幾何關(guān)系圖
在任意給定的初值下極小,其中,tF是最終飛行時(shí)間。在相應(yīng)假設(shè)下,使用最優(yōu)控制方法可以求得相應(yīng)的最優(yōu)制導(dǎo)律。下面給出5 種最優(yōu)制導(dǎo)律的狀態(tài)方程及其表達(dá)形式,這5 種最優(yōu)制導(dǎo)律考慮了重力補(bǔ)償。
假設(shè)系統(tǒng)理想(不存在動(dòng)力學(xué)),目標(biāo)不機(jī)動(dòng)。
根據(jù)圖1 狀態(tài)方程可以寫成:
在式(1)的目標(biāo)函數(shù)下,推導(dǎo)可得最優(yōu)制導(dǎo)律:
式(2)為比例導(dǎo)引律,當(dāng)N=3 時(shí),是對付不機(jī)動(dòng)目標(biāo)的最優(yōu)制導(dǎo)律,但對付機(jī)動(dòng)目標(biāo)時(shí),N 越大越好,由于噪聲的影響,通常取N=3∶5。重力加速度可以認(rèn)為是已知量,如果使用式(2)形式的比例導(dǎo)引律,則需要估計(jì)剩余飛行時(shí)間。因此,需要測量彈目相對橫向位置y、彈目相對橫向速度以及估計(jì)剩余飛行時(shí)間。但在小角時(shí)可把式(2)表示成:
假設(shè)系統(tǒng)理想(不存在動(dòng)力學(xué)),目標(biāo)常值加速度機(jī)動(dòng)。根據(jù)圖1 狀態(tài)方程可以寫成:
在式(1)的目標(biāo)函數(shù)下,推導(dǎo)可得最優(yōu)制導(dǎo)律:
與比例導(dǎo)引律相比,增強(qiáng)比例導(dǎo)引多了目標(biāo)機(jī)動(dòng)修正項(xiàng),使用增強(qiáng)比例導(dǎo)引律除了估計(jì)與比例導(dǎo)引律相同的信息外,還需要估計(jì)目標(biāo)機(jī)動(dòng)加速度at,合理使用卡爾曼濾波器,可以解決這些問題[8]。應(yīng)用增強(qiáng)比例導(dǎo)引律能顯著改善目標(biāo)機(jī)動(dòng)帶來的脫靶量,減輕對導(dǎo)彈末端過載需求。與比例導(dǎo)引律類似,在小角時(shí)可把式(4)表示成:
實(shí)際系統(tǒng)存在諸多動(dòng)力學(xué)滯后,由于動(dòng)力學(xué)滯后導(dǎo)致比例導(dǎo)引律和增強(qiáng)比例導(dǎo)引律有比較大的脫靶量,以及很大的末端過載需求。假設(shè)導(dǎo)彈系統(tǒng)動(dòng)力學(xué)為一階模型,理想目標(biāo)常值加速度機(jī)動(dòng)。
根據(jù)圖1 狀態(tài)方程可以寫成:
在式(1)的目標(biāo)函數(shù)下,推導(dǎo)可得最優(yōu)制導(dǎo)律:
與APN 制導(dǎo)律相比,PN-M 制導(dǎo)律多了導(dǎo)彈動(dòng)力學(xué)修正項(xiàng),但由于導(dǎo)彈動(dòng)力學(xué)信息可以認(rèn)為是已知信息,因此,使用PN-M 制導(dǎo)律需要估計(jì)的信息與使用APN 估計(jì)的信息相同。應(yīng)用PN-M 制導(dǎo)律能動(dòng)態(tài)消除系統(tǒng)動(dòng)力學(xué)滯后,顯著改善由于彈體動(dòng)力學(xué)帶來的脫靶量,減低對末端過載需求。
事實(shí)上目標(biāo)也存在動(dòng)力學(xué)。假設(shè)導(dǎo)彈和目標(biāo)動(dòng)力學(xué)均為一階模型,目標(biāo)具有任意機(jī)動(dòng)加速度初值,零加速度指令輸入。
根據(jù)圖1 狀態(tài)方程可以寫成:
在式(1)的目標(biāo)函數(shù)下,推導(dǎo)可得最優(yōu)制導(dǎo)律:
在推導(dǎo)PN-M 制導(dǎo)律的基礎(chǔ)上,如果假設(shè)目標(biāo)和導(dǎo)彈動(dòng)力學(xué)為一階模型,目標(biāo)在常值加速度指令下機(jī)動(dòng)。
根據(jù)圖1 狀態(tài)方程可以寫成:
在式(1)的目標(biāo)函數(shù)下,推導(dǎo)可得最優(yōu)制導(dǎo)律:
與PN-MT0 制導(dǎo)律相比,PN-MT 制導(dǎo)律的不同之處是對目標(biāo)加速度指令進(jìn)行了修正。當(dāng)目標(biāo)理想時(shí),PN-MT 制導(dǎo)律簡化為PN-M 制導(dǎo)律;當(dāng)目標(biāo)加速度指令為0 時(shí),PN-MT 制導(dǎo)律簡化為PN-MT0 制導(dǎo)律。使用PN-MT 制導(dǎo)律比PN-MT0 需要多估計(jì)目標(biāo)加速度指令項(xiàng),但是由于目標(biāo)加速度指令是常值,在建立估計(jì)狀態(tài)方程時(shí),只需多引入一個(gè)變量即可實(shí)現(xiàn)。
上述制導(dǎo)律在其各自假設(shè)條件下均為最優(yōu)。但更接近真實(shí)情況的目標(biāo)逃逸機(jī)動(dòng)是推導(dǎo)PN-MT制導(dǎo)律的假設(shè)條件,即目標(biāo)在常值加速度指令下機(jī)動(dòng)。
設(shè)典型條件:目標(biāo)加速度指令atc=50 m/s2,飛行時(shí)間tF=5 s,彈體動(dòng)力學(xué)時(shí)間常數(shù)1/ωm=0.3 s,目標(biāo)動(dòng)力學(xué)時(shí)間常數(shù)1/ωt=1 s。圖2 給出了不同制導(dǎo)律需用加速度對比曲線。圖3 給出了不同制導(dǎo)律的彈道曲線對比。
圖2 不同制導(dǎo)律導(dǎo)彈加速度指令對比
從圖2 中可知,PN-MT 制導(dǎo)律加速度曲線為一條直線,末段過載收斂為0,這說明最優(yōu)制導(dǎo)律正好消除了系統(tǒng)動(dòng)力學(xué),同時(shí)完全補(bǔ)償了目標(biāo)機(jī)動(dòng)和重力加速度的影響。PN-M 制導(dǎo)律末端需用加速度也收斂為0,但在飛行中段需付出較大的加速度。PN-MT0 制導(dǎo)律也消除了系統(tǒng)動(dòng)力學(xué)的影響,但由于其沒有消除目標(biāo)機(jī)動(dòng)加速度指令帶來的影響,導(dǎo)致其末端加速度不收斂為0。PN 和APN 制導(dǎo)律在末端需用加速度發(fā)散,這主要是由于系統(tǒng)動(dòng)力學(xué)造成的。從圖3 可知,PN-MT 的彈道最平直,APN 的彈道次之,但末端需付出很大的加速度,PN 的彈道最彎曲。
圖3 不同制導(dǎo)律彈道對比
伴隨函數(shù)法具有非常強(qiáng)大的線性問題分析能力,對伴隨系統(tǒng)只需運(yùn)算一次即可得到正常系統(tǒng)運(yùn)算幾百次才能得到的結(jié)果。每個(gè)線性時(shí)變系統(tǒng)都存在一個(gè)伴隨系統(tǒng),而且可以通過對原系統(tǒng)的框圖變換得到伴隨系統(tǒng)。具體做法如下:
1)把原系統(tǒng)所有輸入等效為脈沖輸入。
2)把原系統(tǒng)中時(shí)變項(xiàng)中包含的時(shí)間t 用tf-t 代替,這里tf是最終飛行時(shí)間。
3)把原系統(tǒng)中的信號流向反向,把信號節(jié)點(diǎn)變?yōu)榍蠛忘c(diǎn),求和點(diǎn)變?yōu)楣?jié)點(diǎn)。如表1 所示。
表1 求和點(diǎn)和節(jié)點(diǎn)變換
伴隨系統(tǒng)h*的脈沖響應(yīng)和原系統(tǒng)h 的脈沖響應(yīng)有下述關(guān)系:
其中,tI為脈沖的作用時(shí)間,tO為脈沖響應(yīng)的觀測時(shí)間。上式表達(dá)的是:在tI時(shí)刻給原系統(tǒng)輸入脈沖,而在tO時(shí)刻觀測脈沖響應(yīng),與在tF-tO時(shí)刻給伴隨系統(tǒng)輸入脈沖而在tF-tI時(shí)刻觀測伴隨系統(tǒng)的脈沖響應(yīng)是等價(jià)的。當(dāng)對原系統(tǒng)在不同時(shí)間處應(yīng)用脈沖輸入,而在最終時(shí)間tF處觀查脈沖響應(yīng)時(shí),上述關(guān)系就顯得特別重要。對于原系統(tǒng)需要在每個(gè)脈沖作用時(shí)間重復(fù)運(yùn)行系統(tǒng)以得到h(tf,tI),如圖4 所示。但是對于伴隨系統(tǒng)來說,只需要運(yùn)行一次就可得到等價(jià)的脈沖響應(yīng)。把觀察時(shí)間置為最終飛行時(shí)間,則式(10)可變?yōu)椋?/p>
除了脈沖響應(yīng)是反向產(chǎn)生的之外,伴隨系統(tǒng)脈沖響應(yīng)與原系統(tǒng)完全相同。伴隨系統(tǒng)與原系統(tǒng)的等價(jià)關(guān)系如圖5 所示。
圖4 原系統(tǒng)產(chǎn)生h(tF,tI)的示意圖
圖5 伴隨系統(tǒng)產(chǎn)生h(tF,tI)的示意圖
基于攔截方程可得到線性的閉合回路。圖6 給出了最簡化形式的PN-MT 制導(dǎo)閉合回路。末端脫靶量是制導(dǎo)律性能的一個(gè)重要指標(biāo)。
圖6 最簡化的PN-MT 制導(dǎo)閉合回路
基于圖6 根據(jù)前面的變換規(guī)則可以得到PN-MT 制導(dǎo)律的脫靶量的伴隨系統(tǒng),如圖7 所示。圖7 中的系數(shù)C1*、C2*、C3*、C4*、C5*、C6*可從PN-MT制導(dǎo)律中相應(yīng)狀態(tài)量的系數(shù)通過伴隨轉(zhuǎn)換得到。MNT 是由于目標(biāo)機(jī)動(dòng)造成的脫靶量,MHE 是由于初始指向偏差造成的脫靶量,MG 是由于重力加速度造成的脫靶量。對于其他制導(dǎo)律,只需改變圖7中制導(dǎo)律的系數(shù)即可得到相應(yīng)的伴隨系統(tǒng)。
圖8 給出了典型條件下各制導(dǎo)律由目標(biāo)機(jī)動(dòng)引起的脫靶量隨末導(dǎo)時(shí)間變化曲線。圖中實(shí)線為運(yùn)行一次伴隨系統(tǒng)得到的仿真結(jié)果,圓圈為對原系統(tǒng)使用蒙特卡洛方法得到的結(jié)果。從圖中可知,蒙特卡洛法和伴隨伴隨函數(shù)法的結(jié)果完全一致,但是蒙特卡洛法運(yùn)行了500 次才得到了需要的結(jié)果,而伴隨函數(shù)法只需運(yùn)行1 次便可得到精確結(jié)果。
圖7 PN-MT 制導(dǎo)律脫靶量伴隨框圖
圖8 由目標(biāo)機(jī)動(dòng)引起的脫靶量隨末導(dǎo)時(shí)間變化
由于系統(tǒng)動(dòng)力學(xué)的影響,APN 和PN 制導(dǎo)律有比較大的脫靶量。而PN-MT0 的脫靶量很小,為1個(gè)小常值,PN-M 制導(dǎo)律的脫靶量隨末導(dǎo)時(shí)間逐漸衰減,末導(dǎo)時(shí)間足夠時(shí)也衰減為零。PN-MT 制導(dǎo)律的脫靶量始終為零。
圖9 PN-MT 制導(dǎo)律需用加速度伴隨框圖
除了脫靶量之外,在制導(dǎo)回路中也應(yīng)關(guān)注制導(dǎo)律的末端需用過載,如果需用過載過大,則容易產(chǎn)生過載飽和,引起較大脫靶量。同樣使用伴隨函數(shù)法可以很方便得到制導(dǎo)律需用加速度隨末導(dǎo)時(shí)間變化規(guī)律。與脫靶量伴隨系統(tǒng)類似,圖9 給出了PN-MT 制導(dǎo)律的加速度伴隨系統(tǒng)框圖。與脫靶量伴隨系統(tǒng)不同之處在于,加速度伴隨系統(tǒng)更加復(fù)雜,需要經(jīng)過大量框圖等效變換之后,才能把伴隨系統(tǒng)的脈沖輸入等效為階躍輸入。在PN-MT 制導(dǎo)律中,需要對6 個(gè)變量賦初值才能使伴隨系統(tǒng)運(yùn)行,其他制導(dǎo)律的加速度伴隨系統(tǒng)框圖只需要改變相應(yīng)的系數(shù)即可得到。
圖10 由目標(biāo)機(jī)動(dòng)引起的加速度需求隨末導(dǎo)時(shí)間變化
圖10 給出了典型條件下由于目標(biāo)機(jī)動(dòng)造成的末端需用加速度隨末導(dǎo)時(shí)間變化曲線。對于每一個(gè)制導(dǎo)律只運(yùn)行一次伴隨法的結(jié)果與運(yùn)行500 次蒙特卡洛法的結(jié)果完全一致,由此可見伴隨法的強(qiáng)大效果。
PN-MT 制導(dǎo)律的末端需用加速度始終為0,PN-M 制導(dǎo)律的末端需用加速度小于目標(biāo)機(jī)動(dòng)加速度指令值,隨末導(dǎo)時(shí)間呈現(xiàn)衰減趨勢,當(dāng)末導(dǎo)時(shí)間足夠時(shí),末端需用加速度衰減為0。PN-MT0 制導(dǎo)律的末端需用加速度小于目標(biāo)機(jī)動(dòng)指令加速度,為一個(gè)常值。APN 和PN 制導(dǎo)律的末端需用加速度遠(yuǎn)遠(yuǎn)大于PN-MT、PN-MT0 以及PN-M 制導(dǎo)律。當(dāng)末導(dǎo)時(shí)間很短或很長時(shí),APN 和PN 的需求加速度會減小,這是由于在末導(dǎo)時(shí)間很小時(shí),目標(biāo)機(jī)動(dòng)的影響還沒有完全體現(xiàn),而末導(dǎo)時(shí)間很長時(shí),導(dǎo)彈已使用了足夠的時(shí)間去修正偏差。
結(jié)合圖8 和圖10 的結(jié)果可知,PN-MT 制導(dǎo)律的性能最好,而PN-M 制導(dǎo)律當(dāng)末導(dǎo)時(shí)間足夠時(shí),性能接近PN-MT 制導(dǎo)律。PN-MT0 制導(dǎo)律需求信息比PN-M 制導(dǎo)律多,但性能次于PN-M 制導(dǎo)律。APN和PN 制導(dǎo)律因沒有充分利用已知的信息(如導(dǎo)彈動(dòng)力學(xué)時(shí)間常數(shù)),性能最差。
通過對5 種制導(dǎo)律的脫靶量和末端需用加速度的蒙特卡洛結(jié)果與伴隨函數(shù)結(jié)果對比可知,伴隨函數(shù)法的結(jié)果與蒙特卡洛結(jié)果完全一致,這說明伴隨函數(shù)法的結(jié)果完全準(zhǔn)確可信,但伴隨函數(shù)法的計(jì)算效率卻是蒙特卡洛法的數(shù)百上千倍。這說明伴隨函數(shù)法具有非常驚人的效率,尤其在初步設(shè)計(jì)分析中具有非常高的價(jià)值。
通過典型條件的仿真結(jié)果,PN-MT 制導(dǎo)律的性能最優(yōu),具有零脫靶量和末端零加速度需求的優(yōu)點(diǎn)。當(dāng)目標(biāo)動(dòng)力學(xué)時(shí)間常數(shù)為零時(shí),PN-MT 制導(dǎo)律退化為PN-M 制導(dǎo)律。在目標(biāo)存在動(dòng)力學(xué)時(shí),如果末導(dǎo)時(shí)間足夠,PN-M 制導(dǎo)律的性能與PN-MT 制導(dǎo)律的性能很接近。PN-MT0 制導(dǎo)律在導(dǎo)彈目標(biāo)遭遇時(shí),趨近于PN-M 制導(dǎo)律,其末端需用過載不隨末導(dǎo)時(shí)間變化,是一個(gè)比目標(biāo)機(jī)動(dòng)指令加速度小的常值。PN 和APN 制導(dǎo)律沒有使用已知的導(dǎo)彈動(dòng)力學(xué)時(shí)間常數(shù)信息,末端得付出很大的過載。綜合可知,PN-MT 和PN-M 制導(dǎo)律能滿足空空導(dǎo)彈攔截大機(jī)動(dòng)目標(biāo)的需求,其中PN-M 制導(dǎo)律在使用與APN 制導(dǎo)律同等信息的條件下,獲得接近PN-MT 制導(dǎo)律的性能,其工程應(yīng)用價(jià)值很高。
因此,在現(xiàn)代空空導(dǎo)彈中,應(yīng)該選擇使用PN-M或PN-MT 制導(dǎo)律以提高導(dǎo)彈的性能。使用先進(jìn)制導(dǎo)律還存在一系列工程問題,比如:目標(biāo)機(jī)動(dòng)估計(jì),剩余飛行時(shí)間估計(jì),動(dòng)力學(xué)時(shí)間常數(shù)誤差的裝訂等,但隨著彈載計(jì)算機(jī)性能的不斷提高,這些問題都可以解決。