黃 偉, 徐建城, 吳華興, 李俊兵
(1. 空軍工程大學(xué)航空航天工程學(xué)院, 陜西 西安 710038; 2. 西北工業(yè)大學(xué)電子信息學(xué)院, 陜西 西安 710072)
導(dǎo)彈協(xié)同編隊是未來局部戰(zhàn)爭的主戰(zhàn)模式,各軍事強國都不遺余力的開展相關(guān)技術(shù)的研究工作[1-2],導(dǎo)彈編隊控制的主要任務(wù)是有效地生成和保持預(yù)定的編隊幾何形態(tài),韋常柱[3]等采用小擾動線性化方法設(shè)計了導(dǎo)彈編隊保持控制器;穆曉敏[4]等建立了由編隊隊形控制及編隊離入隊管理等模塊組成的編隊控制系統(tǒng);周慧波[5]等將編隊控制問題轉(zhuǎn)化為跟蹤問題,所提出的制導(dǎo)律算法具有一定的魯棒性。以上成果主要基于單枚從彈與領(lǐng)彈的相對位置關(guān)系,未將導(dǎo)彈編隊作為整體考慮,各枚從彈控制算法的收斂時間存在較大差異,不適用于大規(guī)模導(dǎo)彈編隊的隊形控制。近些年來,一致性算法[6-7]成為解決大規(guī)模編隊控制問題的有效方法,林志云[8]等基于相對坐標(biāo)系,應(yīng)用圖拉普拉斯方法建立了隊形控制一致性算法;文獻(xiàn)[9-10]提出基于二階運動學(xué)模型的飛行器編隊一致性算法,并將虛擬結(jié)構(gòu)法、領(lǐng)從法、行為法等標(biāo)準(zhǔn)化在一致性算法框架內(nèi)。然而,以上基于一致性理論的編隊控制算法在設(shè)計過程中均假設(shè)導(dǎo)彈自動駕駛儀是非慣性系統(tǒng),無遲滯的響應(yīng)由制導(dǎo)系統(tǒng)生成的制導(dǎo)指令。實際中,外環(huán)制導(dǎo)回路生成的制導(dǎo)指令是通過內(nèi)環(huán)自動駕駛儀實現(xiàn)的,受自動駕駛儀動態(tài)特性的影響[11-12],可能導(dǎo)致控制算法的發(fā)散,影響編隊閉環(huán)系統(tǒng)的穩(wěn)定性;其次,現(xiàn)有一致性算法中的參數(shù)僅限定了其取值范圍,未經(jīng)參數(shù)優(yōu)化過程,不能實現(xiàn)在某種性能指標(biāo)下的編隊最優(yōu)控制。
鑒于此,針對領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊隊形控制問題,提出一種基于參數(shù)優(yōu)化并考慮自動駕駛儀動態(tài)特性的一致性編隊控制算法。首先,將導(dǎo)彈自動駕駛儀等效為一階慣性環(huán)節(jié),基于坐標(biāo)變換得到了制導(dǎo)指令與所需控制力的關(guān)系模型;其次,建立了導(dǎo)彈編隊一致性控制算法,構(gòu)建了編隊閉環(huán)制導(dǎo)控制系統(tǒng)方程,應(yīng)用代數(shù)圖論證明了閉環(huán)系統(tǒng)的穩(wěn)定性;最后,以編隊各成員位置和速度的累計誤差建立指標(biāo)泛函,基于最優(yōu)控制提出了算法中待定系數(shù)的優(yōu)化方法,從而進(jìn)一步提高了導(dǎo)彈編隊系統(tǒng)的性能。
為便于描述導(dǎo)彈編隊相對運動關(guān)系,選取地面某點為坐標(biāo)原點建立地理坐標(biāo)系(OXYZ)e,如圖1所示。導(dǎo)彈編隊由1枚領(lǐng)彈和2枚從彈組成。編隊過程中,要求各枚從彈在制導(dǎo)控制系統(tǒng)的作用下與領(lǐng)彈生成并保持既定的相對位置關(guān)系和速度關(guān)系。
圖1 導(dǎo)彈編隊示意Fig.1 Missile formation in 3D space
將導(dǎo)彈簡化為質(zhì)點,并僅考慮導(dǎo)彈的彈道傾角和彈道偏角,導(dǎo)彈所需的控制力矢量F=[FxFyFz]T定義在以導(dǎo)彈質(zhì)心為原點、以速度矢量方向為X軸向的彈道坐標(biāo)系(OXYZ)m中,其分量分別為導(dǎo)彈軸向、俯仰方向和偏航方向的控制力。由此,導(dǎo)彈在三維空間中的運動可描述為
(1)
圖2 導(dǎo)彈制導(dǎo)控制系統(tǒng)Fig.2 Control system of missile guidance
如圖2所示,根據(jù)編隊指標(biāo)要求,假設(shè)控制器輸出的制導(dǎo)指令為Vd=[VexdVeydVezd]T,即地理坐標(biāo)系中3個軸向的理想速度,導(dǎo)彈控制系統(tǒng)響應(yīng)制導(dǎo)指令,計算所需的控制力矢量F,從而控制導(dǎo)彈的飛行狀態(tài)??傮w設(shè)計階段,導(dǎo)彈自動駕駛儀可以等效為一階慣性環(huán)節(jié),即
(2)
式中,V=[vxvyvz]T表示導(dǎo)彈在地理坐標(biāo)系中飛行速度矢量;τ為等效環(huán)節(jié)時間常數(shù);s為拉普拉斯算子。式(2)的微分方程形式為
(3)
式中,各項運動參數(shù)均定義在地理坐標(biāo)系下,而導(dǎo)彈控制力矢量F定義在彈道坐標(biāo)系下,為了建立F與Vd之間的關(guān)系式,通過坐標(biāo)變換,可得地理坐標(biāo)系下控制力矢量Fe與F之間的變換式為
(4)
式中,Tem為彈道坐標(biāo)系到地理坐標(biāo)系的轉(zhuǎn)換矩陣,由此可得
(5)
再由式(3)可得導(dǎo)彈控制力F與制導(dǎo)指令Vd之間的關(guān)系式為
(6)
由式(6)可知,根據(jù)導(dǎo)彈制導(dǎo)系統(tǒng)計算得到的Vd,控制系統(tǒng)即可得到所需的控制力矢量F,在導(dǎo)彈編隊過程中,設(shè)計滿足編隊要求的控制算法,得到制導(dǎo)指令Vd是編隊控制的關(guān)鍵。
領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊過程中,領(lǐng)彈一般配置有高性能通信和探測裝置[13],實現(xiàn)對遠(yuǎn)距離目標(biāo)的探測,其運動狀態(tài)不受從彈的影響。由此,控制算法的設(shè)計目標(biāo)為:得到編隊各從彈的制導(dǎo)指令Vd,使編隊各成員趨于理想位置的同時,速度與領(lǐng)彈趨于一致?;谝恢滦岳碚?所設(shè)計的從彈i制導(dǎo)控制算法式為
(7)
結(jié)合導(dǎo)彈自動駕駛儀等效式(3),可得從彈i閉環(huán)制導(dǎo)控制系統(tǒng)方程為
(8)
(9)
將導(dǎo)彈編隊作為整體考慮,應(yīng)用代數(shù)圖論知識,編隊閉環(huán)制導(dǎo)控制系統(tǒng)方程矩陣形式為
(10)
定理1導(dǎo)彈編隊各成員在控制算法式(7)的作用下,若參數(shù)γ的取值滿足下式,即
可保證式(10)所表示的編隊閉環(huán)制導(dǎo)控制系統(tǒng)方程的收斂,即各枚導(dǎo)彈趨于理想位置的同時,速度趨于一致。
證明式(10)是齊次線性方程標(biāo)準(zhǔn)形式,其解
(11)
將矩陣Σ寫為Jordan型Σ=SJS-1,即
exp(Σt)=Sexp(Jt)S-1
(12)
矩陣Σ的特征方程為
det(λI2n-Σ)=det((λ2+τ-1λ+γ)In+(τ-1λ+γ)L)
(13)
負(fù)拉普拉斯矩陣-L的特征方程為
(14)
式中,μi是-L的第i個特征值,將式(13)重寫為
det(λI2n-Σ)=
(15)
比較式(14)和式(15),式(13)的根可求解為
λ2+τ-1(1-μi)λ+γ(1-μi)=0
(16)
則矩陣Σ的特征值為
(17)
根據(jù)普拉斯矩陣L的性質(zhì),有Re(μi)≤0,則Re(μi-1)<0。令ηi=μi-1,根據(jù)復(fù)數(shù)輻角縮放原理[10],當(dāng)γ的取值滿足下式時,即
(18)
式(16)的所有根具有負(fù)實部,即Re(λ)<0,由式(11)和式(12)可得
(19)
即式(10)收斂,從而保證位置誤差和速度誤差趨于零,即
(20)
證畢
將導(dǎo)彈編隊控制算法的設(shè)計過程描述為最優(yōu)控制問題,在假設(shè)導(dǎo)彈自動駕駛儀為一階慣性環(huán)節(jié)的前提下,式(3)所描述的系統(tǒng)狀態(tài)方程標(biāo)準(zhǔn)形式為
(21)
式中,X=V;A=-τ-1;U=Vd;B=τ-1。在控制算法式(7)的作用下,閉環(huán)編隊制導(dǎo)控制系統(tǒng)方程形如式(10),其收斂性得到了證明。然而,式(7)僅給出了控制算法的結(jié)構(gòu),其中還包含待定系數(shù)γ,式(18)給出了保證算法收斂時,γ的取值范圍。本節(jié)對待定系數(shù)γ進(jìn)一步優(yōu)化,使之在某一指標(biāo)泛函下達(dá)到最優(yōu)。
基于導(dǎo)彈編隊過程中各成員位置和速度的累計誤差,所建立的指標(biāo)泛函為
(22)
結(jié)合式(10)和式(11)可得
(23)
由此,將指標(biāo)泛函J轉(zhuǎn)換為參數(shù)方程J(γ),在式(18)的約束下,待定系數(shù)γ的最優(yōu)值可由下式得出[14],即
(24)
(25)
在上述假設(shè)條件下,式(10)所表示的閉環(huán)系統(tǒng)方程簡化式為
(26)
式(26)為二階微分方程形式,為了保證閉環(huán)系統(tǒng)的穩(wěn)定性,消除非周期性規(guī)律變化的起始誤差,待定系數(shù)γ應(yīng)滿足
(27)
式(26)的解為
(28)
式中
將式(28)代入式(25),可得參數(shù)化指標(biāo)函數(shù)為
(29)
由于K1<0和K2<0,僅考慮穩(wěn)態(tài)過程,則
(30)
進(jìn)而待定系數(shù)γ的最優(yōu)值可由式(24)得出。
結(jié)構(gòu)優(yōu)化和參數(shù)優(yōu)化是解決最優(yōu)控制問題的基本過程,在式(7)給出控制算法結(jié)構(gòu)的基礎(chǔ)上,通過上述方法即可實現(xiàn)對控制算法的參數(shù)優(yōu)化,從而進(jìn)一步提高了導(dǎo)彈編隊系統(tǒng)的性能。
下面仿真驗證控制算法式(7)的有效性。仿真條件如下:
條件1假設(shè)領(lǐng)彈裝備有合成孔徑雷達(dá)導(dǎo)引頭(synthetic aperture radar seeker, SARS),受成像分辨率和脫靶量約束,其制導(dǎo)律算法[13]為
(31)
式中,jh和jv分別為領(lǐng)彈水平面控制量和垂直面控制量;V和R分別為彈目相對速度和相對距離;φ和ω分別為導(dǎo)彈前置角和目標(biāo)線角速度;β為彈目高低角;q11/k1和q22/k1均為權(quán)值系數(shù),其他與SARS相關(guān)的仿真參數(shù)詳見文獻(xiàn)[13]。領(lǐng)彈的初始位置坐標(biāo)為(0, 5 km,0),初始速度為(500 m/s, 0, 200 m/s);目標(biāo)位置坐標(biāo)為(40 km, 5 km, 40 km)。
條件2從彈1的初始位置坐標(biāo)為(2 km, 7 km, 0),初始速度為(800 m/s, 0, 300 m/s);從彈2的初始位置坐標(biāo)為(0, 3 km, 2 km),初始速度為(700 m/s, 0, 200 m/s)。
≤εξ
條件4設(shè)導(dǎo)彈自動駕駛儀慣性環(huán)節(jié)時間常數(shù)τ=0.3 s,經(jīng)參數(shù)優(yōu)化取γ=9。
在式(7)作用下,導(dǎo)彈編隊運動軌跡如圖3所示。
圖3 三維空間導(dǎo)彈軌跡Fig.3 Missiles trajectory in 3D space
如圖3可知,由于算法式中一致性項的作用,可實現(xiàn)編隊隊形的快速收斂,仿真t=48 s時收斂至預(yù)期的隊形,仿真時間48~97 s,算法實現(xiàn)了對預(yù)期隊形的保持。
圖4給出了從彈1和從彈2與預(yù)期位置的相對誤差隨制導(dǎo)時間的變化規(guī)律。
圖4 從彈相對位置誤差Fig.4 Followers relative position error
在式(7)的作用下,隨著制導(dǎo)時間的增加,從彈1及從彈2的相對位置誤差趨于零。圖5給出了從彈1與領(lǐng)彈相對速度的變化情況。
圖5 從彈與領(lǐng)彈相對速度Fig.5 Relative velocity between leader and follower
由圖5可知,在控制算法的作用下,導(dǎo)彈編隊可實現(xiàn)位置和速度收斂。圖6給出了地理坐標(biāo)系下從彈1加速度矢量隨制導(dǎo)時間的變化規(guī)律。
圖6 從彈1加速度Fig.6 Follower1 acceleration
各軸向加速度分量在制導(dǎo)初始階段較大,隨著編隊隊形的逐步收斂而不斷減小。
圖7給出了編隊控制過程中,在以從彈1質(zhì)心為坐標(biāo)原點建立的彈道坐標(biāo)系下,從彈1所需的控制力矢量隨制導(dǎo)時間的變化規(guī)律,與空氣阻力X相關(guān)的參數(shù)為:空氣密度ρ=1.2 kg/m3導(dǎo)彈的質(zhì)量為m=200 kg;阻力系數(shù)c=0.1;導(dǎo)彈的特征面積為S=0.15 m2。
圖7 從彈1需用控制力Fig.7 Follower1 required control force
由圖7可知,從彈1各軸向控制力分量隨制導(dǎo)時間的增加不斷減小,結(jié)合某型導(dǎo)彈裝備實際,令導(dǎo)彈極限過載nmax=38g,所需控制力分量均在限定范圍之內(nèi)。
圖8給出了在未經(jīng)參數(shù)優(yōu)化情況下,從彈位置誤差的變化規(guī)律,令γ=7,仿真t=88 s時生成了既定的編隊隊形,88~97 s為隊形保持階段。
圖8 未參數(shù)優(yōu)化的位置誤差Fig.8 Position errors without parameter optimization
對比參數(shù)優(yōu)化情況(見圖4),隊形收斂時間增加,位置和速度累計誤差增大。
為了進(jìn)一步說明本文算法的創(chuàng)新性,下面對文獻(xiàn)[9]所提出的編隊控制算法進(jìn)行仿真,算法[9]式為
ζi
(32)
式中,ξi和ζi分別表示導(dǎo)彈編隊成員i的位置和速度;ξ*和ζ*分別表示理想位置和理想速度;β和γ均為算法系數(shù),設(shè)定β=1和γ=1。導(dǎo)彈編隊由3枚導(dǎo)彈組成,編隊拓?fù)渚W(wǎng)絡(luò)中含有一棵以領(lǐng)彈為根節(jié)點的有向生成樹,其領(lǐng)彈的運動狀態(tài)不受從彈影響,領(lǐng)彈和從彈的初始位置和初始速度如前所述;設(shè)定理想位置ξ*=ξl以及理想速度ζ*=ζl,ξl和ζl分別表示領(lǐng)彈位置和領(lǐng)彈速度。各枚導(dǎo)彈在三維空間的運動軌跡如圖9所示。
圖9 應(yīng)用算法式(32)的編隊軌跡Fig.9 Formation trajectory based on equation (32)
由圖9可知,在式(32)的作用下,3枚導(dǎo)彈的位置收斂且速度趨于一致。然而,由于式(32)中不能設(shè)定導(dǎo)彈各成員間的相對位置關(guān)系參數(shù),相比本文提出的控制算法,不能實現(xiàn)既定位置關(guān)系的生成和保持,僅能使編隊各成員的位置收斂至同一平衡點;再者,式(32)在設(shè)計過程中未涉及自動駕駛儀動態(tài)特性和參數(shù)優(yōu)化過程,實際應(yīng)用過程中,閉環(huán)制導(dǎo)控制系統(tǒng)不能保證漸進(jìn)穩(wěn)定性和優(yōu)性。綜合上述分析,本文提出的導(dǎo)彈編隊控制算法相比文獻(xiàn)[9],更加適用于導(dǎo)彈編隊隊形控制過程。
基于多智能體一致性理論,設(shè)計適用于領(lǐng)從結(jié)構(gòu)導(dǎo)彈編隊控制過程的制導(dǎo)律算法,研究總結(jié)如下:①將導(dǎo)彈自動駕駛儀簡化為一階慣性環(huán)節(jié),基于坐標(biāo)變換,得到了導(dǎo)彈控制力與制導(dǎo)指令之間的關(guān)系模型;②建立了基于一致性理論的導(dǎo)彈編隊控制算法,實現(xiàn)編隊成員趨于理想位置的同時,速度趨于一致,適用于編隊隊形的生成與保持;③提出了參數(shù)優(yōu)化方法,實現(xiàn)待定系數(shù)的取值在某一指標(biāo)泛函下達(dá)到最優(yōu)。該算法對于導(dǎo)彈編隊系統(tǒng)的總體設(shè)計具有一定的理論參考價值。