毛 寧,范軍芳,李 斌
(1.北京信息科技大學(xué) 自動化學(xué)院, 北京 100192;2.現(xiàn)代測控技術(shù)教育部重點實驗室(北京信息科技大學(xué)), 北京 100192;3.北京理工大學(xué) 宇航學(xué)院, 北京 100081; 4.北京理工大學(xué) 無人機自主控制技術(shù)北京市重點實驗室, 北京 100081)
一般來說,制導(dǎo)律主要是使導(dǎo)彈能根據(jù)當(dāng)前其相對于目標(biāo)運動的信息決定如何改變當(dāng)前的速度和方向,控制導(dǎo)彈以最少或零脫靶量攻擊指定目標(biāo)。在過去的幾十年中,比例導(dǎo)引制導(dǎo)律由于其易于實現(xiàn)和對非機動目標(biāo)的有效性而得到了廣泛的研究和應(yīng)用[1-3]。近年來,多飛行器協(xié)同制導(dǎo)吸引了越來越多的關(guān)注,多個飛行器通過空間以及時間上的相互配合能夠?qū)崿F(xiàn)更高的作戰(zhàn)效率同時實現(xiàn)更高的性價比。同時針對具有良好防御能力的重點目標(biāo)來說,利用群體優(yōu)勢對敵防御體系和目標(biāo)進行多層次、全方位的打擊,實現(xiàn)突防能力的整體提升[4]。
一個實現(xiàn)齊射攻擊的有效方法是攻擊時間控制,通過對攻擊時間的控制可實現(xiàn)多個導(dǎo)彈同時擊中目標(biāo),從而提高打擊效果[5]。攻擊時間控制的制導(dǎo)律設(shè)計實際上是一種以最終攻擊時間誤差為跟蹤誤差的跟蹤問題。在定義了攻擊時間誤差后,許多系統(tǒng)控制理論,如帶誤差反饋的偏置比例導(dǎo)引、滑模控制、李雅普諾夫函數(shù)等,都可以用來使跟蹤誤差為零[6-8]。文獻[9]提出了基于傳統(tǒng)最優(yōu)控制理論的攻擊時間控制制導(dǎo)律,證明了該制導(dǎo)律的封閉解是經(jīng)典比例導(dǎo)引制導(dǎo)律與攻擊時間誤差反饋項的組合。在文獻[9]的基礎(chǔ)上,文獻[10]研究了攻擊角度和攻擊時間制導(dǎo)律,文獻[11]提出了一種針對平面內(nèi)的靜止目標(biāo)的導(dǎo)引系數(shù),只根據(jù)導(dǎo)彈的彈目距離和相對剩余時間誤差(其余導(dǎo)彈剩余時間均值與導(dǎo)彈剩余時間之差)來調(diào)整,使得導(dǎo)彈集群剩余時間方差為零的變系數(shù)比例導(dǎo)引協(xié)同制導(dǎo)方法。文獻[12]利用李雅普諾夫函數(shù)法,對二維和三維情形提出了一種新的攻擊時間制導(dǎo)律,但當(dāng)初始航向誤差等于零時,該制導(dǎo)律是不可行的。
雖然上述內(nèi)容被證明在多枚導(dǎo)彈同時攻擊時是可行的,攻擊時間控制通常需要剩余飛行時間信息。文獻[13-14]研究表明:在大的初始航向誤差下,傳統(tǒng)的剩余飛行時間估計方法不夠準(zhǔn)確。為了解決這個問題,利用比例導(dǎo)引制導(dǎo)律的性質(zhì)和概念,在無剩余飛行時間信息時,相等的路徑長度能保證同時攻擊的精度。
本文研究基于二階連續(xù)時間多智能體系統(tǒng)一致性理論,利用兩段式制導(dǎo)實現(xiàn)多彈一致的協(xié)同制導(dǎo)策略。該方法不需要提前裝定協(xié)同時間和剩余飛行時間信息,避免了剩余飛行時間估計誤差對協(xié)同時間和制導(dǎo)精度的影響。所提出的一種兩階段制導(dǎo)律來實現(xiàn)多枚導(dǎo)彈同時攻擊的方法中,在第一階段,采用線性分布一致性控制律為后段生成有利的初始條件,在第二階段,所有導(dǎo)彈由具有相同導(dǎo)航比的比例導(dǎo)引制導(dǎo)律控制。提出的方法只需要兩個額外的量測量:一個是導(dǎo)彈目標(biāo)相對距離,另一個是導(dǎo)彈航向誤差或目標(biāo)視角,這些信號可以直接從主動雷達導(dǎo)引頭獲得。由于不需要剩余飛行時間信息,在實際應(yīng)用中,特別是對于較大的初始航向誤差,本文提出的制導(dǎo)律更加有效。
建立彈目相對運動的三維數(shù)學(xué)模型,圖1為慣性坐標(biāo)系下導(dǎo)彈攻擊靜止目標(biāo)的三維示意圖。其中,M、T分別表示導(dǎo)彈和目標(biāo),VM、R和σ分別為導(dǎo)彈速度、彈目相對距離和導(dǎo)彈速度方向誤差角,θλ和ψλ分別為視線高低角和視線方位角,θM和ψM分別為速度矢量相對視線系的高低角和方位角。當(dāng)導(dǎo)彈攻角很小時,θM和ψM近似為體視線角,可由導(dǎo)引頭的框架角間接得到。
圖1 彈目運動關(guān)系三維示意圖
彈目相對運動三維數(shù)學(xué)模型的方程為
(1)
速度方向誤差角
σ=arccos(cosθMcosψM)
(2)
導(dǎo)彈在比例導(dǎo)引制導(dǎo)律下的過載指令為
(3)
其中,N為導(dǎo)航比。
當(dāng)導(dǎo)彈初始彈目距離R(0)、初始速度方向誤差角σ(0)和導(dǎo)航比N相同時,采用比例導(dǎo)引制導(dǎo)律的彈道形狀一致。
證明:對式(2)求導(dǎo)可得速度方向誤差角變化率
(4)
由于σ∈[0,π),式(4)簡化為
(5)
式(1)中的第一式除以式(5)得:
(6)
解式(6)得:
(7)
由式(7)可以看出,比例導(dǎo)引制導(dǎo)律的彈道特性與當(dāng)導(dǎo)彈初始彈目距離R(0)、初始速度方向誤差角σ(0)和導(dǎo)航比N有關(guān)。
將式(7)代入式(5)得:
(8)
由式(8)可得,為了使速度方向誤差角收斂,應(yīng)選擇導(dǎo)航比N≥2。
引理1:設(shè)第i枚導(dǎo)彈的速度為VMi,導(dǎo)彈和目標(biāo)的相對距離為Ri,當(dāng)導(dǎo)彈初始剩余飛行時間tgoi(0)、初始速度方向誤差角σi(0)和導(dǎo)航比N相同時,采用比例導(dǎo)引的彈道形狀一致,剩余飛行時間相同。
證明:將式(7)兩邊同時除以導(dǎo)彈速度VMi得:
(9)
由式(9)可以看出,引理成立。
用無向圖ζ(A)={v,ε,A}來代表多導(dǎo)彈之間的通訊拓撲,v和ε分別表示圖的節(jié)點和連接節(jié)點的邊,vi代表第i枚導(dǎo)彈。矩陣A=[aij]∈Rn×n為圖的加權(quán)鄰接矩陣,若導(dǎo)彈i和導(dǎo)彈j可以相互通訊,則(vi,vj)∈ε?aij>0,反之則aij=0,假設(shè)節(jié)點之間沒有連通性,即aii=0,i=1,2,…,n,由于ζ(A)是無向圖,有aij=aji。
引理2[15]:定義圖ζ(A)的Laplacian矩陣定義為L(A)=[lij]∈Rn×n,其中
(10)
L(A)有以下性質(zhì):
1) 0是L(A)的一個特征值,1=[1,1,…,1]T∈Rn是對應(yīng)的特征向量;
3)L(A)的第二小特征值表示為λ2(L(A)),如果圖是連通的,則它大于0;
一致性算法的收斂性與通信網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖的Laplacian矩陣和它的譜性質(zhì)有密切的關(guān)系。對于一個給定無向圖ζ(A)={v,ε,A},當(dāng)且僅當(dāng)該圖連通時,其Laplacian矩陣的秩滿足rank(L(A))=n-1,其特征值:0=λ1<λ2≤λ3≤…≤λm=λmax。λ2(L(A))表示圖的連通度,決定了一致性算法的收斂速度,λ2(L(A))越大,系統(tǒng)收斂到一致的速度越快。
考慮由m個二階智能體組成的多智能體系統(tǒng)。每個智能體的動態(tài)方程為
(11)
其中,ηi(t)和ξi(t)是第i個智能體的狀態(tài);ui(t)為控制輸入。
如果存在分布式控制輸入ui(t),i=1,2,…,m,使得對任意初始條件ηi(0)和ξi(0),多智能體系統(tǒng)(11)的狀態(tài)滿足
(12)
其中,i≠j,i∈v,j∈v。
則稱多智能體系統(tǒng)式(11)在控制輸入ui(t)作用下獲得漸近期望一致性。
經(jīng)典的標(biāo)準(zhǔn)一致性算法:
(13)
其中,β>0,c>0,α=cβ。
為了提高系統(tǒng)的收斂速度,提出一種快速一致性算法:
c(ξi-ξd)
(14)
對于一個穩(wěn)定的閉環(huán)控制系統(tǒng)而言,系統(tǒng)的閉環(huán)極點離虛軸越遠,系統(tǒng)的收斂速度越快。
定理1:具有m個智能體的多智能體系統(tǒng),在其通信拓撲結(jié)構(gòu)圖無向且連通時,當(dāng)時間區(qū)間的長度κ∈(0,κ*)時,系統(tǒng)式(11)在快速一致性算法式(14)下狀態(tài)收斂到一致且滿足式(12),系統(tǒng)最大時間區(qū)間的長度κ*滿足式(15)。
(15)
定理2:當(dāng)時間區(qū)間的長度κ∈(0,κτ)時,相比系統(tǒng)在標(biāo)準(zhǔn)一致性算法式(13)下,系統(tǒng)的狀態(tài)在快速一致性算法式(14)下收斂到一致的速度更快,κτ滿足式(16)。
(16)
當(dāng)時間區(qū)間長度κ∈(0,κτ)時,在標(biāo)準(zhǔn)一致性算法和快速一致性算法下的系統(tǒng)除了有相同的1個s=0和m個s=-c的極點外,在快速一致性算法下系統(tǒng)的剩余閉環(huán)極點在標(biāo)準(zhǔn)一致性算法下系統(tǒng)的剩余閉環(huán)極點的左邊。系統(tǒng)的狀態(tài)收斂到一致的速度與選取的過去平均狀態(tài)信息的時間區(qū)間有關(guān)。
多智能體系統(tǒng)協(xié)同控制中的通訊延遲是實際存在的,會對系統(tǒng)的穩(wěn)定性造成影響,對系統(tǒng)的最大允許延遲進行分析。
考慮不變延遲時的快速一致性算法:
c(ξi-ξd)
(17)
具有m個智能體的多智能體系統(tǒng),在其通信拓撲結(jié)構(gòu)圖無向且連通時,系統(tǒng)允許的延遲為τ∈(0,τ*),τ*為系統(tǒng)允許的最大延遲并滿足式(18)。
(18)
證明:考慮延遲時的快速一致性算法式(17)可寫為
c(ξi-ξd)
(19)
系統(tǒng)在考慮延遲時的快速一致性算法式(19)下的閉環(huán)極點滿足方程
(20)
為了保證系統(tǒng)狀態(tài)的收斂性,式(20)的根需要全部在左半平面。
等效為式(21)的根全部在左半平面。
(21)
其中i=1,2,3,…,m。
化簡式(21)得
(22)
即
(23)
由于c>0,可知式(23)有m個極點在s=-c處,有1個極點在s=0處。
式(23)的第二式變?yōu)?/p>
(24)
下面計算保證式(24)有一根在虛軸上的最大延遲。
將s=jω,e-jωτ=cos(ωτ)-jsin(ωτ),e-jω(κ+τ)=cos(ω(κ+τ))-jsin(ω(κ+τ))代入式(24),有
jsin(ω(κ+τ))]=0
(25)
即
(26)
利用三角函數(shù)的和差化積公式
(27)
式(26)可寫為
(28)
由式(28)的第二式解得
(29)
-ω2=0
(30)
(31)
(32)
此時,
(33)
將式(33)代入式(32)有
(34)
化簡得
(35)
(36)
此時,
(37)
式(37)代入式(36)有
(38)
化簡得
(39)
系統(tǒng)允許的最大延遲τ*滿足
(40)
由式(40)看出系統(tǒng)的最大允許延遲與系統(tǒng)通信網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖的Laplacian矩陣的特征值和選取的過去狀態(tài)的時間區(qū)間有關(guān)。當(dāng)系統(tǒng)的延遲τ∈(0,τ*)時,存在不變延遲系統(tǒng)的狀態(tài)在快速一致性算法下收斂到一致的速度更快,原因是除了有相同的1個s=0和m個s=-c的極點外,在快速一致性算法下系統(tǒng)的剩余閉環(huán)極點在標(biāo)準(zhǔn)一致性算法下系統(tǒng)的剩余閉環(huán)極點的左邊。
對m枚導(dǎo)彈攻擊同一靜止目標(biāo)的情況,將飛行彈道分為兩段,第一段制導(dǎo)段控制剩余飛行時間和目標(biāo)視角趨于一致,當(dāng)剩余飛行時間和目標(biāo)視角滿足要求后,第二段制導(dǎo)段切換為相同的比例導(dǎo)引制導(dǎo)律。整個飛行過程不需要準(zhǔn)確的剩余飛行時間信息。
利用二階連續(xù)時間系統(tǒng)一致性理論,定義協(xié)調(diào)變量
(41)
其中,i=1,2,…,m表示導(dǎo)彈編號。
(42)
為了保證在中制導(dǎo)段所有導(dǎo)彈的剩余飛行時間和目標(biāo)視角趨于一致,第一段控制律設(shè)計為
(43)
將式(43)代入式(42)有
(44)
當(dāng)名義剩余飛行時間和目標(biāo)視角一致后,切換為比例導(dǎo)引制導(dǎo)律
(45)
綜上,分段協(xié)同制導(dǎo)律可表示為
(46)
其中ε1和ε2是足夠小的正數(shù)。
通過仿真驗證三維分段協(xié)同制導(dǎo)律的性能,考慮由3枚導(dǎo)彈組成的系統(tǒng),假定各導(dǎo)彈只與相鄰導(dǎo)彈通信,如圖2所示。
圖2 3枚導(dǎo)彈協(xié)同攻擊通訊拓撲結(jié)構(gòu)圖
對快速一致性算法和考慮延遲的快速一致性算法進行仿真驗證。
通信網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖的Laplacian矩陣L(A)為
(47)
矩陣L(A)的特征值為:λ1=0,λ2=1,λ3=3。
導(dǎo)彈的初始參數(shù)由表1所示,期望的狀態(tài)ξd=-0.5,中制導(dǎo)段控制律參數(shù)選取β=1,c=0.25,α=cβ=0.25末制導(dǎo)段比例導(dǎo)引制導(dǎo)律導(dǎo)航比N=4,導(dǎo)彈最大可用加速度amax=100 m/s2。
表1 導(dǎo)彈仿真參數(shù)
系統(tǒng)在標(biāo)準(zhǔn)一致性算法下的仿真結(jié)果如圖3所示,分別給出彈目距離、彈道曲線、協(xié)調(diào)變量變化曲線和加速度指令曲線。仿真結(jié)果表明,3枚導(dǎo)彈在兩段式協(xié)同制導(dǎo)律下同時命中目標(biāo),協(xié)同時間約為57.0 s。由圖3(c)、圖3(d)可看出:中制導(dǎo)段初始需要較大的加速度指令控制各導(dǎo)彈的名義剩余飛行時間和目標(biāo)視角趨于一致,在28.3 s滿足切換條件|ηi-ηj|≤ε1,|ξi-ξj|≤ε2后,進入末制導(dǎo)段,各導(dǎo)彈在相同的三維比例導(dǎo)引制導(dǎo)律下同時到達目標(biāo)。
圖3 標(biāo)準(zhǔn)一致性算法下協(xié)同攻擊的仿真曲線
對系統(tǒng)在快速一致性算法下的情況進行仿真,根據(jù)定理2可求得快速一致性算法下的時間區(qū)間長度κτ=1.05 s,仿真結(jié)果如圖4所示。仿真結(jié)果表明:3枚導(dǎo)彈同時達到時間約為54.7 s。由圖4(c)、圖4(d)可看出,在快速一致性算法下各導(dǎo)彈名義剩余飛行時間和目標(biāo)視角趨于一致的速度加快,在23.5 s 就滿足了切換條件,然后進入末制導(dǎo)段切換為三維比例導(dǎo)引制導(dǎo)律,協(xié)同時間與標(biāo)準(zhǔn)一致性算法下的情況相比也縮短。
對考慮系統(tǒng)延遲的情況進行仿真,快速一致性算法的時間區(qū)間長度κτ=1.05 s,根據(jù)式(18)可求得系統(tǒng)允許的最大延遲τ*=0.48 s,分別對延遲τ*=0.4 s和τ*=0.49 s的兩種情況進行仿真,仿真結(jié)果如圖5和圖6所示。由協(xié)調(diào)變量變化曲線和加速度指令曲線可看出,當(dāng)系統(tǒng)延遲超過允許的最大延遲時,系統(tǒng)失穩(wěn)。
圖4 快速一致性算法下協(xié)同攻擊的仿真曲線
圖5 快速一致性算法下τ*=0.4 s時協(xié)同攻擊的仿真曲線
圖6 快速一致性算法下τ*=0.49 s時協(xié)同攻擊的曲線
研究通過控制導(dǎo)彈的狀態(tài)達到一致以實現(xiàn)協(xié)同的分段協(xié)同制導(dǎo)律,基于一致性理論提出一種兩段式協(xié)同制導(dǎo)策略,同時為了加快狀態(tài)趨于一致的速度,設(shè)計了一種快速一致性算法,給出了系統(tǒng)在快速一致性算法下的最大允許延遲。將快速一致性算法應(yīng)用到協(xié)同制導(dǎo)中,通過與標(biāo)準(zhǔn)一致性算法的仿真對比,發(fā)現(xiàn)快速一致性算法下的各導(dǎo)彈狀態(tài)趨于一致的時間縮短,彈間需要通訊的時間減少,使各導(dǎo)彈更快的進入末制導(dǎo)段,增強了抗敵方電子干擾的能力。