郭志強,周紹磊,于運治,李曉寶
(1. 海軍航空大學,煙臺 264001;2. 海軍潛艇學院,青島 266199)
多個攔截彈通過信息共享[1-2]、功能互補[3]的群體優(yōu)勢可以實現(xiàn)攔截能力的提高和任務范圍的拓寬。但在應對多彈協(xié)同制導問題時,經(jīng)典制導律如比例導引等在攔截機動目標時往往難以取得理想效果,而最優(yōu)制導律由于要對目標的機動規(guī)律進行假設也導致其實用性被大大限制。微分對策制導律由于對目標信息的依賴性小且適用于機動目標的攔截而引起了相關學者的重視和研究。這類制導方法將攔截彈和目標視作正在進行博弈的雙方,分別得出所有對策參與者的最優(yōu)策略[4-6],無需對目標的機動規(guī)律做任何形式的假設,可將目標機動對制導性能產(chǎn)生的影響降到最小。
目前關于協(xié)同攔截問題的研究,包括文獻[4-6],大多是在小角度偏差假設的基礎上,將系統(tǒng)模型線性化之后進行制導律的設計。但是現(xiàn)實中的系統(tǒng)其本質(zhì)上是非線性的,當小角度偏差的假設不能滿足或者目標在其當前速度下具有很強的機動能力時,則需考慮借助其它方法來解決非線性的制導問題。
基于狀態(tài)相關黎卡提方程(State-dependent Riccati-Equation,SDRE)的方法是求解非線性系統(tǒng)反饋控制律的一種有效方法,具有很好的實時性和靈活性。文獻[6-7]均指出,當小角度偏差假設不成立時可采用基于SDRE的方法解決制導律設計問題,但二者都未給出推導過程。文獻[8]首次基于SDRE方法和微分對策理論對帶有角度約束的一對一追逃問題進行了研究。文獻[9-10]進一步對一對一的攔截問題進行了研究,并利用SDRE方法分別推導得出了不帶角度約束和帶角度約束的非線性追逃對策制導律。
上述文獻[4-10]均未對非線性的協(xié)同對策問題展開討論,目前也尚未檢索到采用SDRE方法對協(xié)同微分對策制導律展開研究的文獻?;诖朔N現(xiàn)狀,本文考慮在末制導階段攔截彈與目標不滿足初始小角度偏差假設的情況下,在微分對策理論的基礎上結(jié)合SDRE方法,將難以求解的最優(yōu)化問題轉(zhuǎn)化為方便求解的次優(yōu)問題,提出了一種非線性的協(xié)同制導律。該制導律具有解析形式,可在線應用且不依賴于剩余時間,避免了剩余時間的估計精度不足對制導律性能造成的影響。
為簡單計,本文考慮兩枚攔截彈M1和M2(追蹤者)攔截單個機動目標T(逃逸者)的工況。該追逃對策(Pursuit-Evasion Strategy)問題的狀態(tài)方程可寫為
式中,x∈n為系統(tǒng)狀態(tài)向量;u=[uu]T,u∈n1121和u∈n2分別為攔截彈M1和M2的控制向量;2v∈nv為目標T的控制向量;t0為系統(tǒng)初始時間。
攔截彈和目標的控制向量滿足邊界條件:
本文所討論的攔截過程屬于有限時間的范疇,但文獻[11]的結(jié)果表明,在無限時間條件下推導得出的制導律依然適用。故選擇性能指標泛函如下:
如果f(x)∈C1,且有f(0)=0,則系統(tǒng)狀態(tài)方程(1)可寫成狀態(tài)相關系數(shù)形式:
為使該問題可解,系統(tǒng)需滿足可控性和可觀性。下面在討論該對策問題的解之前先給出鞍點策略的定義。
定義1 如果對策雙方采取的策略u*和v*存在且滿足
則稱(u*,v*)為該對策問題的鞍點策略(Saddle Point Strategy,SPS)。
本文研究的微分對策問題本質(zhì)上是一種雙邊優(yōu)化問題,是對策雙方(兩枚攔截彈作為一方而目標作為另一方)之間的一種動態(tài)博弈過程,目的是求得雙方的最優(yōu)機動策略(鞍點),假如某一方不按其最優(yōu)策略進行機動,則它將因此而受損,同時另一方因此而獲益,這種對策又稱二人零和微分對策。由于求解微分對策問題的鞍點策略要涉及到哈密頓-雅克比-貝爾曼-艾薩克斯(Hamilton-Jacobi-Bellman-Isaacs,HJBI)偏微分方程的求解,而求此類問題解析解的過程往往是十分復雜的,甚至是不可能的。此時可以考慮將系統(tǒng)狀態(tài)方程表達成如式(3)所示的形式,利用SDRE方法使難以求解的最優(yōu)問題轉(zhuǎn)化為方便求解的次優(yōu)問題。下面對求解非線性對策問題的SDRE方法進行討論。
如果上述微分對策問題的狀態(tài)相關黎卡提方程
存在唯一的正定對稱解P(x)∈n×n,則攔截彈和目標基于SDRE的控制策略可分別寫成狀態(tài)相關的形式:
引理1[10]對于一般的多變量系統(tǒng),式(6)(7)給出的SDRE控制滿足:
式中,H為系統(tǒng)的哈密頓函數(shù)。
引理2[10]對于多變量系統(tǒng),在漸近穩(wěn)定條件下,若A(x)、B(x)、C(x)、P(x)、Q(x)、R1(x)、R2(x)及其梯度在原點的Ω鄰域內(nèi)有界,則當x趨近于0時,基于SDRE的非線性控制滿足如下伴隨方程:
式中,λ為伴隨狀態(tài)。
引理3[10]假設在原點的Ω鄰域內(nèi),?x∈Ω,則:
1)A(.)∈C1,且{A(x),B(x)}、{A(x),C(x)}滿足可控性,{Q12(x),A(x)}滿足可觀性;
2)對于給定ρ,式(5)存在唯一對稱正定解P(x),則當v=0或v=v*=ρ-2CT(x)P(x)x時,由式(6)可得系統(tǒng)的局部漸近穩(wěn)定閉環(huán)解。
引理4[12]若狀態(tài)相關系數(shù)具有可控性和可觀性,則式(6)所示控制使得平衡點全局漸近穩(wěn)定的充分條件是對于任意x,下列關系式成立:
假設彈目相對運動可在兩個正交平面內(nèi)解耦,雙方的二維相對運動關系如圖1所示。圖1中:XI-OI-YI表示笛卡爾慣性坐標系,Mi表示第i(i=1,2)個攔截彈,T表示目標;V、a、γ分別表示速度、側(cè)向加速度和航向角,下標i和T分別對應于攔截彈Mi和目標;ri表示攔截彈Mi與目標T之間的距離;φi表示攔截彈Mi與目標T之間的視線角。
圖1 對策雙方的平面相對運動關系Fig.1 Planar engagement geometry of the players
極坐標下攔截彈與目標之間的運動方程為
式(11)中,Vci表示彈目接近速度。式(13)中,aj為攔截彈和目標的加速度,假設雙方自動駕駛儀均具有理想動態(tài)特性,則有a1=u1,a2=u2,aT=v。
將攔截彈的視線角速度表示為θi,即
對式(14)求導則有:
定義 2 從當前時刻t起,攔截彈和目標均不再施加任何控制,以當前狀態(tài)運行至命中時刻tf時的脫靶量稱為零控脫靶量,它與視線角速度的關系為[10]
從式(16)可以看出,攔截彈為了命中目標,可采取控制使視線角速度趨近于零且使彈目相對速度Vci<0從而達到攔截目的,而對于目標而言則要盡可能使視線角速度增大以擺脫攔截。
本文暫不考慮其它約束條件,以碰撞攔截為目的,選取視線角速度x=[θ1θ2]T作為對策問題的狀態(tài)變量,則系統(tǒng)狀態(tài)方程可寫成如式(3)所示的狀態(tài)相關系數(shù)形式,其中,
為了后面討論方便,將A(x)、B(x)、C(x)中的元素分別記為
根據(jù)引理 3,{A(x),B(x)}、{A(x),C(x)}應滿足可控性,其可控性矩陣為
根據(jù)系統(tǒng)可控性秩判據(jù),在彈目接近速度Vc1、Vc2和彈目距離r1、r2均不為零的條件下,系數(shù)矩陣應滿足
令
式中,q1>0、q2>0分別為狀態(tài)變量θ1和θ2的加權(quán)系數(shù)。根據(jù)引理3,矩陣對{Q12(x),A(x)}應滿足可觀性,其可觀性矩陣為
由系統(tǒng)可觀的秩判據(jù)易知式(27)滿足可觀性要求。
由式(6)可知,欲求基于SDRE的反饋控制律,需先求出黎卡提方程式(5)的解P(x)。假設R1(x)、R2(x)均為單位陣,下面基于SDRE的舒爾解法求解P(x)。
系統(tǒng)的哈密頓矩陣為
式中,F(xiàn)(x)=BBT-ρ-2CCT,A(x)、B(x)、C(x)分別如式(17)~(19)所示。對稱陣F(x)的元素分別為
則可求得哈密頓矩陣H的特征值為
式中,
系統(tǒng)的SDRE存在對稱正定解P(x)的條件是哈密頓矩陣在虛軸上無特征值,這就需要選取合適的權(quán)值q1、q2使得下面的關系成立:
將哈密頓矩陣H的兩個負特征值和對應的特征向量組成的新矩陣V:
根據(jù)舒爾方法將矩陣V分割成兩個方陣:
可得對稱矩陣P(x):
式中,
由于P為正定陣,則權(quán)值q1、q2和系數(shù)ρ的選取還應使下面的關系成立:
根據(jù)式(6)(7),對策雙方解析形式的制導律為
對于本文所研究的二對一追逃對策問題,由于目標需要綜合考慮兩枚攔截彈的狀態(tài)信息(即視線角速度θi)來尋求自身的最優(yōu)逃逸策略(使兩個彈目視線角速度最大的策略),而兩枚攔截彈又要根據(jù)各自相對于目標的視線角速度分別尋求自身的最優(yōu)追蹤策略(使各自的彈目視線角速度最小的策略),在這一過程中,兩枚攔截彈的控制量通過目標的控制量產(chǎn)生耦合,因此所求得的兩枚攔截彈的制導策略式(43)(44)也具有耦合形式。從式(43)等號右邊第二項和式(44)等號右邊第一項可以看到,攔截彈一方面追求自身視線角速度趨近于零,同時也對另一枚攔截彈的視線角速度產(chǎn)生影響,以期達到與目標完全相反的目的,體現(xiàn)了一種顯式的協(xié)同關系。
注釋1由于采用SDRE方法的微分對策制導律不需討論剩余時間的估計問題,但作為協(xié)同制導問題,需要對整個對策過程的結(jié)束時間做出定義。為了下節(jié)仿真的方便,本文將對策的結(jié)束時間規(guī)定為目標被其中一枚攔截彈首先命中的時間,即
式中,tf1、tf2分別為攔截彈M1和M2的終端時刻。
本節(jié)將對前面所設計的制導律進行仿真驗證。為了方便敘述,以下將本文提出的基于SDRE方法的非線性協(xié)同微分對策制導律(Nonlinear Cooperative Differential Games Guidance Law Based on SDRE)簡稱為SDRE-NCDG制導律。這里假設攔截彈和目標自動駕駛儀均具有理想動態(tài)特性,不計重力影響,且彈目各自速度均為常值,仿真參數(shù)如表1所示。
表1 仿真參數(shù)Tab.1 Simulation parameters
為了驗證所提制導律性能,下面根據(jù)目標機動與否將彈目運動情況分為如表2所示的四種情況,然后對制導律性能進行分析。
表2 彈目初始位置和目標機動情況Tab.2 Initial positions and target maneuvers
3.1.1 目標不機動
在表2中的情況Ⅰ、情況Ⅱ下,兩枚攔截彈從不同距離對目標進行攔截的仿真結(jié)果分別如圖2、圖3所示。
圖2 目標不機動時的彈目軌跡Fig.2 Trajectories of interceptors and target in case I and II
圖3 目標不機動時的攔截彈加速度指令Fig.3 Acceleration profiles of interceptors in case I and II
由圖2可以看出,當目標不機動時,采用SDRENCDG方法,攔截彈在兩種初始彈目距離下均能對目標進行攔截(脫靶量均小于0.5 m)。在兩種彈目距離下,攔截彈完成攔截所需側(cè)向加速度指令如圖3所示,從圖中可以看出,當初始彈目距離較近時,攔截彈需要更大的側(cè)向加速度來克服航向誤差帶來的影響。
3.1.2 目標機動
當目標以v=50 m/s2進行機動時,攔截彈從不同距離對目標進行攔截的結(jié)果如圖4、圖5所示。
圖4 目標機動時的彈目軌跡Fig.4 Trajectories of interceptors and target in case III and IV
圖5 目標機動時的攔截彈加速度指令Fig.5 Acceleration profiles of interceptors in case III and IV
由圖4可以看出,當目標以v=50 m/s2進行機動時,攔截彈在情況Ⅲ、情況Ⅳ下均能對目標實施攔截(脫靶由量均小于0.7 m)。在情況Ⅲ、情況Ⅳ下,攔截彈完成攔截所需加速度如圖5所示。與情況Ⅰ、情況Ⅱ相比可以看出,在情況Ⅲ、情況Ⅳ下,由于目標機動,在攔截末期攔截彈所需加速度較大,但這一現(xiàn)象符合預期。
為了進一步驗證本文制導律的性能,下面將本文的 SDRE-NCDG制導律與文獻[4]所提出的線性二次型微分對策協(xié)同(CLQDG)制導律進行對比。
仿真對比的背景條件如下:
1)SDRE-NCDG制導方法相關參數(shù)的選取仍如表1所示;
2)CLQDG制導方法相關參數(shù)的選取為:α=105,αE=105,βE=1.5;
3)攔截彈和目標的初始航向角、速度仍如表1所示;
4)攔截彈和目標的初始位置以及目標機動如表2中的情況Ⅲ、情況Ⅳ所示。
兩種制導方法的仿真結(jié)果如圖6~7所示。圖6為兩種制導方法在情況Ⅲ、情況Ⅳ下的彈目運動軌跡,從圖中可以看出,兩種制導方法均能對目標實施攔截(實現(xiàn)攔截的攔截彈均為攔截彈M1),但相較而言,CLQDG方法下的攔截彈彈道則更為彎曲。
圖7為兩種制導方法下的加速度指令,可以看出,SDRE-NCDG方法中的攔截彈M1完成攔截所需最大加速度均小于采用CLQDG方法的情況。在情況Ⅲ、情況Ⅳ下,攔截彈利用兩種方法完成協(xié)同攔截所消耗控制能量如表3所示。由表3可以看出,本文SDRENCDG方法可以有效降低攔截彈所消耗的控制能量(約降低了25%的能量消耗)。
圖6 兩種制導方法下的彈目運動軌跡Fig.6 Trajectories of interceptors and target in two methods
圖7 兩種制導方法下的攔截彈加速度指令Fig.7 Acceleration profiles of interceptors in the two methods
表3 兩種制導方法消耗的控制能量Tab.3 Control energy of two guidance laws
注釋 2 本文提出的制導律本質(zhì)上不同于以同時到達或同時命中為目的的制導律。由于本文規(guī)定對策的結(jié)束時間為首先命中目標的攔截彈的終端時間,故在圖4和圖6中,雖可看到在攔截彈M1首先命中目標時攔截彈M2與目標之間仍然存在一段距離,但這段距離這并不代表攔截彈M2的最終脫靶量。此時,仍可進一步利用微分對策理論分析僅存在攔截彈M2與目標時的情況,只是對策問題已由二對一的協(xié)同對策轉(zhuǎn)變成一對一的非協(xié)同對策,而一對一的微分對策問題可參閱文獻[8-10]等。
本文針對非線性協(xié)同制導問題,基于SDRE方法提出了一種微分對策制導律。該方法將SDRE和微分對策理論結(jié)合應用于多彈協(xié)同制導,不需對剩余時間估計的精度進行考慮,避免了剩余時間估計誤差對制導性能的影響。仿真結(jié)果表明本文方法能夠?qū)C動目標進行攔截,并可降低攔截彈的加速度要求以及控制能量的消耗,對于不滿足小角度假設等線性化條件的協(xié)同制導問題具有一定的參考意義。