楊 明,趙恩嬌,晁 濤,王松艷
(哈爾濱工業(yè)大學(xué) 控制與仿真中心,哈爾濱 150080)
隨著空戰(zhàn)環(huán)境日益復(fù)雜,作戰(zhàn)武器性能日益提高,多飛行器協(xié)同作戰(zhàn)已成為當今復(fù)雜空戰(zhàn)中主要的作戰(zhàn)方式[1]。為了進一步擴大防御面積,提高防御能力,很多國家將多飛行器協(xié)同攔截作為一種新式的防御戰(zhàn)術(shù)[2],其中,協(xié)同攔截機動目標技術(shù)是現(xiàn)代飛行器防御系統(tǒng)研究的熱點,更是未來防御技術(shù)發(fā)展必須解決的關(guān)鍵技術(shù)之一。信息交換與共享是多飛行器協(xié)同作戰(zhàn)策略能否有效實施的關(guān)鍵,也是協(xié)同控制技術(shù)面臨的難題之一。在信息共享的基礎(chǔ)上,飛行器以保證整體任務(wù)性能為前提,調(diào)整個體行為實現(xiàn)協(xié)同。協(xié)同攔截的關(guān)鍵技術(shù)是通過某種協(xié)調(diào)機制實現(xiàn)飛行器間的高度配合,精確攔截高價值的機動目標。
要實現(xiàn)多飛行器對機動目標的協(xié)同攔截,首先要利用飛行器各自對目標的估計信息,并通過機間數(shù)據(jù)鏈網(wǎng)絡(luò)完成對目標的協(xié)同估計,以滿足協(xié)同攔截的要求。在這一過程中,目標狀態(tài)估計算法是核心和關(guān)鍵。在復(fù)雜的戰(zhàn)場環(huán)境中,網(wǎng)絡(luò)通信條件易受到電磁干擾,網(wǎng)絡(luò)拓撲結(jié)構(gòu)會不斷發(fā)生變化,傳統(tǒng)的集中式融合估計方法已不再適用于這種情況。由于多智能體一致性理論在信息交換、分布式協(xié)調(diào)等方面表現(xiàn)出色,近年來在分布式狀態(tài)估計方法中得到廣泛的應(yīng)用[3-5]。分布式估計算法能夠綜合利用多個傳感器的觀測信息,提高傳感器網(wǎng)絡(luò)參數(shù)估計的精確度和系統(tǒng)的魯棒性,并且這種算法僅使用局部信息,不需融合中心,最終所有傳感器的估計值趨于一致,因此成為傳感器網(wǎng)絡(luò)應(yīng)用中所廣泛采用的信息處理技術(shù)之一[6]。
隨著一致性估計算法的廣泛應(yīng)用,發(fā)展具有分布式結(jié)構(gòu)的協(xié)同估計算法在多飛行器協(xié)同制導(dǎo)和控制中都具有重要的意義。
在飛行器的末制導(dǎo)過程中,尤其是在制導(dǎo)的末段,目標的逃逸機動是影響制導(dǎo)精度的主要因素。針對機動目標的跟蹤,卡爾曼濾波技術(shù)是一種常用的方法,但其需要精確知道系統(tǒng)模型和特性,不利于在飛行器攻防對抗過程中使用,需要探索不依賴于目標機動模型的目標信息估計新方法。擴張狀態(tài)觀測器(Extended state observer, ESO)可對系統(tǒng)中的不可測狀態(tài)以及未知擾動進行觀測,是自抗擾控制等非線性控制技術(shù)的重要組成部分,在干擾估計[7]、故障診斷中發(fā)揮著重要作用,在很多工程領(lǐng)域得到應(yīng)用[8-10]。由于擴張狀態(tài)觀測器理論日趨成熟以及其表現(xiàn)出的種種優(yōu)勢,進一步探索擴張狀態(tài)觀測器在多飛行器協(xié)同估計中的應(yīng)用具有重要的工程意義。
針對上述討論中存在的問題,本文提出了一種適用于多飛行器攔截機動目標的一致性協(xié)同估計方法?;跀U張狀態(tài)觀測器的工作原理,將目標的狀態(tài)視作擾動,并擴張成為新的一階狀態(tài),再利用特定的非光滑非線性誤差反饋,選擇適當?shù)挠^測器參數(shù),得到系統(tǒng)所有狀態(tài)的觀測值。在此基礎(chǔ)上利用一致性理論為各飛行器設(shè)計一致性估計協(xié)調(diào)控制量,通過局部信息交換使得各飛行器得到一致的估計量,將得到的機動目標的一致性估計值在制導(dǎo)律中進行相應(yīng)的補償,從而保證各飛行器能夠同時攔截機動目標。最后驗證了本文方法的有效性。
多個飛行器的間通信關(guān)系可以用圖來描述,非空節(jié)點的集合為其節(jié)點數(shù)目稱為階,邊的集合為加權(quán)鄰接矩陣其中aij表示以i為起點,j為終點的邊的權(quán)值。根據(jù)邊有無方向,圖分為有向圖和無向圖。無向圖的鄰接矩陣是對稱的,從節(jié)點i到節(jié)點j之間有一條邊,也就是說有向圖的鄰接矩陣一般是不對稱的,且節(jié)點之間的邊是有方向的。節(jié)點j稱作節(jié)點i的鄰居,而節(jié)點i的所有鄰居用集合可以表示為
本文利用多智能體一致性理論解決多飛行器的協(xié)同估計問題,這里先給出一致性理論的相關(guān)概念。
考慮由n個多智能體組成的一組多智能體系統(tǒng)。智能體的動力學(xué)模型為:
式中,為狀態(tài),為控制輸入。
定義1 如果對于任意初值,智能體的狀態(tài)都滿足:則稱多智能體系統(tǒng)(1)實現(xiàn)漸近一致。
定義2如果對于任意初值,任意智能體的狀態(tài)都能收斂到所有初始動態(tài)的平均值,即:
則稱多智能體系統(tǒng)實現(xiàn)平均一致性。
本文的研究目的是為多飛行器網(wǎng)絡(luò)中的各個飛行器設(shè)計一個分布式協(xié)同估計策略。假設(shè)通信網(wǎng)絡(luò)由n個飛行器組成,并將飛行器序號順序標記為從1到n,各個飛行器配備主動雷達導(dǎo)引頭。
考慮平面內(nèi)多個飛行器協(xié)同攔截單個高價值機動目標的情況,平面幾何關(guān)系如圖1所示。XOY為慣性參考坐標系;M代表飛行器,下角標為飛行器的編號,即Mi代表第i個飛行器;T為目標;帶有下腳標i和t的變量分別表示第i個飛行器和目標的狀態(tài)量;V、a、分別代表飛行器的速度、法向加速度、彈道傾角、視線高低角、彈目相對距離。
由圖1中的飛行器和目標間的相對運動關(guān)系,以第i個飛行器為例,可以得到如下第i個飛行器與目標的相對運動關(guān)系:
圖1 多飛行器與目標的相對運動關(guān)系Fig.1 Relative motion between multi-aircraft and target
為便于推導(dǎo),令個飛行器與目標的相對運動方程求導(dǎo)可以得到飛行器與目標的相對運動模型:
式中:分別是目標加速度和第i個飛行器加速度在視線方向上的分量;分別是目標加速度和第i個飛行器加速度在視線法向上的分量。
在多飛行器協(xié)同作戰(zhàn)過程中,當多個飛行器協(xié)同攔截空中來襲機動目標時,需要對目標狀態(tài)進行分布式估計和跟蹤。構(gòu)建多飛行器分布式協(xié)同估計系統(tǒng)原理框圖,如圖2所示。首先,各飛行器利用導(dǎo)引頭采集觀測目標的數(shù)據(jù)信息;然后,根據(jù)導(dǎo)引頭信息,采用擴張狀態(tài)觀測器實現(xiàn)局部的目標狀態(tài)估計,并通過飛行器網(wǎng)絡(luò)間估計信息的交互協(xié)調(diào)實現(xiàn)目標的聯(lián)合估計,而不是將這些數(shù)據(jù)信息傳送到融合中心。相對于傳統(tǒng)集中式目標狀態(tài)估計,分布式估計方法不會過分依賴系統(tǒng)特定的融合控制中心。通信網(wǎng)絡(luò)中各飛行器的分布式計算能夠加快數(shù)據(jù)的處理速度,因此目標狀態(tài)跟蹤的實時性會得到很大的提高,并且系統(tǒng)的可靠性也會有所增強。此外,在目標狀態(tài)的估計中,分布式方法可以很好地適應(yīng)網(wǎng)絡(luò)中的很多干擾,如丟包、時延等。
在分布式一致性估計器中,每個飛行器各自對目標狀態(tài)進行估計,并只與其鄰居飛行器進行通信。因為各飛行器估算得到的狀態(tài)值是各自視線坐標系下的目標狀態(tài),所以需要經(jīng)過坐標轉(zhuǎn)換而轉(zhuǎn)換到統(tǒng)一坐標系下進行一致性估計。
圖2 多飛行器協(xié)同估計原理Fig.2 Cooperative estimation principle
由圖2的多飛行器協(xié)同估計原理框圖可知,基于一致性的協(xié)同估計器設(shè)計包括以下兩方面內(nèi)容:單個飛行器對目標機動加速度的估計;與鄰居飛行器進行信息交互,使各飛行器的估計值趨于一致。假設(shè)飛行器攜帶主動雷達導(dǎo)引頭并具有通信能力,可實時與鄰接的飛行器進行信息交換。
在采用協(xié)同制導(dǎo)律的前提下,為每枚飛行器設(shè)計ESO估計機動目標加速度,實現(xiàn)對機動目標的跟蹤。
本節(jié)根據(jù)前文建立的非線性彈目相對運動學(xué)方程,將系統(tǒng)中的機動目標加速度當作不確定性并擴張成新的一階狀態(tài),然后設(shè)計二階擴張狀態(tài)觀測器來觀測系統(tǒng)狀態(tài),從而得到機動目標加速度的估計值,為后續(xù)協(xié)同估計算法的設(shè)計提供必要條件。
根據(jù)式(2)所描述的彈目相對運動關(guān)系,依然以第i個飛行器為例,對式(2)求導(dǎo)可得:
式(4)即為含有飛行器和目標機動信息的彈目相對運動模型。在協(xié)同攔截問題的研究中,假設(shè)目標只在視線法向進行機動。各飛行器提高制導(dǎo)精度的關(guān)鍵在于通過控制視線角速率令其趨近于零,從而實現(xiàn)協(xié)同攔截,這里需要估計的是的值。
取狀態(tài)變量則上述彈目相對運動方程可化為一個一階線性時變微分方程:
令為模型中的已知分量,為模型中的未知分量,并設(shè)則式(5)可以寫為:
將模型中的未知分量fi1擴張為一階狀態(tài),即并設(shè)這里的ψi也是未知量,那么式(6)可寫為
根據(jù)ESO理論,對式(7)設(shè)計如下的ESO:
式中:為ESO參數(shù);z1i是x1i的觀測值,z2i是x2i的觀測值,這樣就可得到模型中未知分量的估計值進而得到機動目標加速度的估計值
在2.1節(jié)設(shè)計的通過ESO來實時估計目標加速度的方法基礎(chǔ)上,本節(jié)給出分布式一致性估計器的設(shè)計方法,實現(xiàn)多枚飛行器對來襲機動目標加速度的協(xié)同估計。
利用擴張狀態(tài)觀測器估計得到的是視線坐標系下的目標加速度。在設(shè)計一致性估計算法時,需要將各飛行器估算的到的結(jié)果統(tǒng)一轉(zhuǎn)換到目標運動的彈道坐標系下。下面給出彈道系下飛行器一致性估計分量:
式中:wqi和wqj分別為在目標彈道系下第i枚飛行器和第j枚飛行器轉(zhuǎn)換得到的的估計值;為一致性控制增益;aij為通信網(wǎng)絡(luò)內(nèi)任意兩飛行器之間的權(quán)值。根據(jù)視線系和彈道系坐標轉(zhuǎn)換關(guān)系,得到視線系飛行器一致性估計分量:
一致性估計分量表達式與一致性控制協(xié)議類似,為了達到多個飛行器的估計狀態(tài)一致,控制增益可以選取為任意的正數(shù)。本文的關(guān)鍵就是設(shè)計合理的一致性估計器,保證各飛行器給出一致性估計值,并且估計值趨近于真實值。下面給出主要定理。
定理 1 如果飛行器網(wǎng)絡(luò)拓撲結(jié)構(gòu)是連通的,那么采用如下一致性估計器:
式中:一致性估計器可使得各飛行器給出一致的估計值,并且趨近于真實值。
下面對本文所設(shè)計的一致性估計器進行誤差分析和估計,并利用Lyapunov函數(shù)方法證明系統(tǒng)的穩(wěn)定性,給出觀測器參數(shù)的選取原則。
證明 記由式(7)(11)可得:
其中,iψ有界,即
以第i枚飛行器的一致性估計器為例,利用將坐標平面分為5個區(qū)域[11],如圖3所示。
圖3 誤差平面分區(qū)圖Fig.3 Division graph of error plane
各區(qū)域可具體表示如下:
根據(jù)以上5個分區(qū),分別構(gòu)造以下分段光滑的正定Lyapunov函數(shù):
由式(13)可知,函數(shù)在除以外的全平面內(nèi)正定且連續(xù)。在固定的情況下,選擇合適的參數(shù)值使得除函數(shù)沿著系統(tǒng)(12)的軌線的導(dǎo)數(shù)有即:
因此系統(tǒng)(12)是穩(wěn)定的,并且估計誤差系統(tǒng)(12)的軌線均被平面區(qū)域Di0所吸引,使得估計誤差最終收斂于區(qū)域Di0。由誤差平面分區(qū)圖3可知,誤差區(qū)域的大小由ri0和βi決定,可以看出,ri0越小,誤差區(qū)域Di0的面積就越小。
以為例,給出滿足約束條件的求解過程。在區(qū)域Di1內(nèi),由于則:
由于存在足夠小的正數(shù)可以得到:
類似地,可以得到區(qū)域內(nèi)對應(yīng)的Lyapunov函數(shù)的導(dǎo)數(shù)分別小于0,即:
對于系統(tǒng)構(gòu)造的分段光滑的正定 Lyapunov函數(shù)式(13),由于除Di0外的每個Lyapunov函數(shù)的導(dǎo)數(shù)分別小于零,因此本文設(shè)計的一致性估計器是穩(wěn)定的,并且收斂到區(qū)域Di0。證畢。
本文研究的分布式目標狀態(tài)估計系統(tǒng)具有固定的拓撲結(jié)構(gòu),并且網(wǎng)絡(luò)拓撲圖是連通的,相鄰飛行器之間都會進行數(shù)據(jù)信息的交換。通過一致性協(xié)調(diào)控制相互傳遞和轉(zhuǎn)化各自的估計信息,最終所有飛行器的估計值逐漸趨于相同,即系統(tǒng)達到了一致,并趨近于真實值。
注1由于擴張狀態(tài)觀測器的非線性函數(shù)采用了完整的分段形式,在區(qū)域的推導(dǎo)過程中,需要對兩種情況分段進行討論,方法類似,這里不再贅述。
為了驗證本文設(shè)計的一致性估計方法的有效性,選取了三種不同的目標機動形式,分別對本文設(shè)計的一致性協(xié)同估計方法進行仿真分析。采用文獻[12]設(shè)計的協(xié)同制導(dǎo)律,將一致性估計值補償?shù)街茖?dǎo)律中,得到第個飛行器的法向加速度指令:
式中:為應(yīng)用本文設(shè)計的一致性估計器估計得到的一致性目標加速度值。
目標的三種機動形式如表1所示,假設(shè)目標只在法向機動,切向不機動,即只改變速度方向不改變速度大小。
表1 目標的機動形式Tab.1 Maneuver forms of the target
仿真中采用三枚飛行器對一枚機動目標進行協(xié)同攔截。飛行器和機動目標的初始狀態(tài)如表2所示。
表2 飛行器和目標的初始狀態(tài)參數(shù)Tab.2 Initial state parameters of flight vehicles and target
假設(shè)三個飛行器間的可以兩兩進行相互通信,在飛行過程中能夠交換彼此的估計信息,從而進行一致性狀態(tài)估計。
一致性估計器中參數(shù)的選取直接影響了對目標狀態(tài)的估計精度,β i1和βi2作為估計器增益影響單個飛行器對目標狀態(tài)的觀測精度,增加β i1和βi2能夠提高估計精度和速度,但是容易造成振蕩。δi的選取決定了式(11)中分段函數(shù)線性區(qū)大小,適當減小δi的取值,減少線性區(qū)的大小,可以提高估計精度,但容易造成振蕩。ki為一致性估計器的協(xié)調(diào)增益,增加ki,可以提高各個飛行器估計值的一致性收斂速度,但過大的容易造成估計值產(chǎn)生較大振蕩從而使估計器失效。因此應(yīng)綜合考慮系統(tǒng)的估計精度、動態(tài)響應(yīng)速度等因素。以第1枚飛行器為例,參數(shù)取值分別為β11=40,其他飛行器的參數(shù)取值原則類似。
采用上述初始條件進行三組仿真,得到的仿真結(jié)果如圖4~11所示。圖4、圖7、圖10為三種仿真實例得到的飛行器一致性估計器對各自視線角轉(zhuǎn)率估計值與真實值曲線,由圖可知各飛行器估計值與真實值曲線幾乎完全重合,從局部放大圖可以看出,視線角轉(zhuǎn)率的估計誤差低于估計精度較高。圖5、圖8、圖10為三種仿真條件下得到的目標加速度估計值與真實值曲線,實線為真實值,各飛行器的估計值能夠達到一致并且趨于真實值,在目標加速度不斷變化的情況下,各飛行器經(jīng)過短暫的調(diào)整依然能夠精確地跟蹤真實值曲線,表明本文所設(shè)計的一致性估計方法具有較強的魯棒性。同時觀察圖3、圖9、圖12法向加速度指令可知,通過對目標狀態(tài)的補償,飛行器狀態(tài)趨于穩(wěn)定,表明本文給出的一致性協(xié)同估計方法是有效的。
對比三組仿真結(jié)果可知:在目標機動能力較小時(仿真實例1),本文設(shè)計的一致性估計器估計精度相對較高,加速度估計誤差小于0.1 m/s2,收斂速度更快,大約15 s左右收斂。隨著目標機動能力的增強(仿真實例2和3),估計器需要調(diào)節(jié)的時間相應(yīng)延長,大約20 s左右收斂,加速度計估計誤差小于0.5 m/s2仍然能夠滿足估計精度的要求。
仿真實例1:目標以固定速率做轉(zhuǎn)彎機動
圖4 轉(zhuǎn)彎機動時的視線角速率估計值與真實值Fig.4 Estimated and true angular rates of line-of-sight during turn maneuver
圖5 轉(zhuǎn)彎機動時的目標加速度估計值與真實值Fig.5 Estimated and true values of target acceleration during turn maneuver
圖6 轉(zhuǎn)彎機動時的法向加速度指令Fig.6 Control command perpendicular to line-of-sight during turn maneuver
仿真實例2:目標做蛇形機動
圖7 蛇形機動時的視線角速率估計值與真實值Fig.7 Estimated and true angular rates of line-of-sight during snake maneuver
圖8 蛇形機動時的目標加速度估計值與真實值Fig.8 Estimated and true values of target acceleration during snake maneuver
圖9 蛇形機動時的法向加速度指令Fig.9 Control command perpendicular to line-of-sight during snake maneuver
仿真實例3:目標進行方波機動
圖10 方波機動時的視線角速率估計值與真實值Fig.10 Estimated and true angular rates of line-of-sight during snake maneuver
圖11 方波機動時的目標加速度估計值與真實值Fig.11 Estimated and true values of target acceleration during square-wave maneuver
圖12 方波機動時的法向加速度指令Fig.12 Control command perpendicular to the line-of-sight during square-wave maneuver
本文提出了一種基于一致性理論的多飛行器協(xié)同估計算法。該算法以擴張狀態(tài)觀測器為基礎(chǔ),設(shè)計對機動目標的估計方法,通過飛行器間的通信網(wǎng)絡(luò)交換彼此的估計信息,將一致性協(xié)調(diào)量引入到各飛行器的狀態(tài)估計協(xié)議中,使通信網(wǎng)絡(luò)內(nèi)的飛行器能夠給出一致的目標狀態(tài)估計值,以實現(xiàn)對機動目標狀態(tài)快速、精確的估計。仿真結(jié)果表明,本文設(shè)計的一致性協(xié)同估計算法精度高,收斂速度快,且在目標進行大機動時仍具有較強的魯棒性。
參考文獻(References):
[1] Jeon I, Lee J. Homing guidance law for cooperative attack of multiple missiles[J]. Journal of Guidance, Control, and Dynamics, 2010, 33(1): 275-280.
[2] Zhou J L, Yang J Y. Distributed guidance law design for cooperative simultaneous attacks with multiple missiles[J].Journal of Guidance, Control, and Dynamics, 2016, 39(10):2436-2444.
[3] Battistelli G, Chisci L. Stability of consensus extended Kalman filter for distributed state estimation[J]. Automatica,2016, 68: 169-178.
[4] Ji H H, Lewis F, Hou Z S, et al. Distributed informationweighted Kalman consensus filter for sensor networks[J].Automatica, 2017, 77: 18-30.
[5] Chai G F, Lin C, Lin Z Y, et al. Single landmark based collaborative multi-agent localization with time-varying range measurements and information sharing[J]. Systems & Control Letters, 2017, 77: 18-30.
[6] Su H S, Chen X, Chen M Z Q, et al. Distributed estimation and control for mobile sensor networks with coupling delays[J]. ISA Transactions, 2016, 64: 141-150.
[7] Guo B Z, Zhao Z L. On the convergence of an extended state observer for nonlinear systems with uncertainty[J].Systems & Control Letters, 2011, 60: 420-430.
[8] Zhu Z, Xu D, Liu J M, et al. Missile guidance law based on extended state observer[J]. IEEE Transaction on Industrial and Electronic, 2013, 60(12): 5882-5891.
[9] Xia Y Q, Pu F, Li S F, et al. Lateral path tracking control of autonomous land vehicle based on ADRC and differrential flatness[J]. IEEE Transaction on Industrial and Electronic, 2016, 63(5): 3091-3099.
[10] Li B, Hu Q L, Ma G F. Extended state observer based robust attitude control of spacecraft with input saturation[J]. Aerospace Science and Technology, 2016, 50: 173-182.
[11] Han J. Active disturbance rejection control technique - the technique for estimating and compensating the uncertainties[M]. Beijing: National Defense Industry Press, 2008.
[12] Zhao E J, Chao T, Wang S Y, et al. Multiple flight vehicles cooperative guidance law based on extended state observer and finite time consensus theory[J]. Proceedings of the Institution of Mechanical Engineers Part G: Journal of Aerospace Engineering, 2018, 232(2): 270-279.