任 章,郭 棟,董希旺,李清東
(1.北京航空航天大學(xué)自動化科學(xué)與電氣工程學(xué)院,北京 100083;2.北京航空航天大學(xué)飛行器控制一體化技術(shù)國防科技重點實驗室,北京 100191; 3. 北京航空航天大學(xué)大數(shù)據(jù)科學(xué)與腦機智能高精尖創(chuàng)新中心,北京 100191)
近年來,美、俄、歐等軍事強國和組織均加大了對導(dǎo)彈防御技術(shù)的重視程度,加快了反導(dǎo)防御系統(tǒng)的建設(shè)步伐,極大影響了進攻型武器的作戰(zhàn)效能。美國的導(dǎo)彈防御系統(tǒng)經(jīng)過多年的發(fā)展,已經(jīng)具備了對來襲目標全射程、多層次的攔截能力,傳統(tǒng)的導(dǎo)彈突防能力進一步下降。隨著日益復(fù)雜的作戰(zhàn)環(huán)境與作戰(zhàn)需求,單枚導(dǎo)彈的作戰(zhàn)樣式已經(jīng)很難完成作戰(zhàn)任務(wù),多飛行器協(xié)同作戰(zhàn)技術(shù)已經(jīng)成為未來武器裝備的重要發(fā)展方向。
多飛行器編隊協(xié)同攻擊是適應(yīng)未來作戰(zhàn)環(huán)境的重要作戰(zhàn)方式。美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)的“拒止環(huán)境中協(xié)同作戰(zhàn)”(Collaborative Operations in Denied Environment, CODE)項目提出了多飛行器應(yīng)采取集群協(xié)同作戰(zhàn)的方案,提高無人飛行器的自主協(xié)同作戰(zhàn)能力和生存率。美國海軍研究局的低成本無人機蜂群技術(shù)(Low-Cost UAV Swarm Technology,LOCUST)已經(jīng)成功完成了多次實驗,實現(xiàn)了多架無人機的編隊飛行與機動。美軍表示,多架無人飛行器集群協(xié)同的作戰(zhàn)樣式能夠很好地滿足未來戰(zhàn)場上的作戰(zhàn)需求。美國空軍研究實驗室提出了忠誠僚機的概念,即通過多駕無人機在有人飛機周圍以特定隊形伴飛來實現(xiàn)多有人/無人群系統(tǒng)間的協(xié)同作戰(zhàn)。多飛行器利用通信鏈路組成一個作戰(zhàn)網(wǎng)絡(luò),打破了傳統(tǒng)單枚飛行器孤立作戰(zhàn)的方式。采用多枚飛行器對目標進行齊射飽和攻擊,可以使對方雷達的探測等功能趨于飽和,減少導(dǎo)彈進入探測區(qū)域的時間間隔,進而提升突防概率。根據(jù)交接班需求設(shè)計合理的中制導(dǎo)段編隊構(gòu)型,可以實現(xiàn)多枚機動性較差的導(dǎo)彈對機動性較強的目標的攔截,有效彌補單枚導(dǎo)彈飛行與探測能力的不足。此外,通過對多枚導(dǎo)彈設(shè)計合理的編隊構(gòu)型,可以實現(xiàn)多飛行器以特定構(gòu)型對目標的關(guān)鍵部位進行重點殺傷,從而大大提升毀傷效果。若編隊中的各枚飛行器能夠保持合適的角度與距離飛行,可以實現(xiàn)對多個方向不同目標的協(xié)同探測,提升對機動目標的觀測精度與識別能力。同時,采用高配置導(dǎo)彈對目標實施探測、低配置導(dǎo)彈利用高配置導(dǎo)彈的導(dǎo)引信息進行打擊的作戰(zhàn)模式,可以在實現(xiàn)對目標飽和打擊的同時有效提高作戰(zhàn)效費比。總之,飛行器集群作戰(zhàn)可以實現(xiàn)各枚飛行器間的作戰(zhàn)性能互補與戰(zhàn)場態(tài)勢信息共享,完成飛行器各自為戰(zhàn)時不能完成的任務(wù),可以有效提升整體的作戰(zhàn)效能。
多飛行器集群協(xié)同作戰(zhàn)將成為未來的主要作戰(zhàn)形式。隨著日益復(fù)雜的作戰(zhàn)環(huán)境與需求,不僅需要根據(jù)各種約束條件為不同飛行器合理地分配任務(wù),還要求各枚飛行器在實現(xiàn)對目標精確打擊的基礎(chǔ)上,配合其他飛行器進行協(xié)同作戰(zhàn),完成協(xié)同探測、編隊飛行和協(xié)同制導(dǎo)等作戰(zhàn)任務(wù),使己方的整體作戰(zhàn)效能最大化。多飛行器協(xié)同制導(dǎo)控制技術(shù)是實施編隊協(xié)同作戰(zhàn)的關(guān)鍵與先決條件。與傳統(tǒng)的制導(dǎo)理論研究不同,多飛行器集群協(xié)同制導(dǎo)控制技術(shù)的實施主要包含以下難點:
1) 如何根據(jù)彈目作戰(zhàn)陣位、飛行器自身機動能力以及目標逃逸方式等,通過動態(tài)任務(wù)規(guī)劃與目標分配,為飛行器集群規(guī)劃合理的作戰(zhàn)任務(wù),以及為每枚飛行器分配最優(yōu)的攔截對象;
2) 如何保持最優(yōu)攻擊隊形,當(dāng)目標機動時,如何及時改變各飛行器在攻擊編隊中的角色,變換攻擊隊形,保證各飛行器按預(yù)定作戰(zhàn)編隊構(gòu)型攻擊目標,滿足中末制導(dǎo)交班要求,即多飛行器時變編隊飛行控制;
3) 多飛行器如何在動力學(xué)約束、通信能力約束和戰(zhàn)場環(huán)境約束等約束條件下,實現(xiàn)對單個或多個目標的協(xié)同攻擊,即多約束條件下的多飛行器協(xié)同制導(dǎo)技術(shù)。
針對以上技術(shù)難點,可以將飛行器集群協(xié)同制導(dǎo)控制問題的關(guān)鍵技術(shù)總結(jié)為:協(xié)同任務(wù)規(guī)劃與動態(tài)目標分配技術(shù)、時變編隊協(xié)同控制技術(shù)和多約束條件下的協(xié)同制導(dǎo)技術(shù),如圖1所示。
圖1 多飛行器協(xié)同制導(dǎo)控制關(guān)鍵技術(shù)Fig.1 The key technologies of cooperative guidance and control for multiple aerial vehicles
下面就近年來國內(nèi)外關(guān)于任務(wù)規(guī)劃與動態(tài)目標分配方法、時變編隊協(xié)同控制方法和多約束條件下的協(xié)同制導(dǎo)方法的研究成果分別進行介紹。
多飛行器的任務(wù)規(guī)劃與目標分配是實施編隊協(xié)同作戰(zhàn)的首要和關(guān)鍵任務(wù)。通過對戰(zhàn)場環(huán)境、作戰(zhàn)需求以及各種約束條件的綜合分析與計算,在任務(wù)決策層面對多枚飛行器的作戰(zhàn)任務(wù)進行合理規(guī)劃,為多枚飛行器分配合理的目標,可以加倍提升對目標的攻擊效能。目前,多飛行器的任務(wù)規(guī)劃方法主要有集中式任務(wù)規(guī)劃方法和分布式任務(wù)規(guī)劃方法。集中式任務(wù)規(guī)劃方法,顧名思義,即系統(tǒng)中存在一個中心節(jié)點,通過中心節(jié)點對系統(tǒng)中的其他節(jié)點進行任務(wù)層面的協(xié)調(diào)與調(diào)度。文獻[1]設(shè)計了一種考慮最小轉(zhuǎn)彎半徑約束的多無人機集中式任務(wù)規(guī)劃方法,并通過實物進行了驗證。文獻[2]以多無人機察打一體作戰(zhàn)為背景,在多約束條件下建立了無人機編隊的任務(wù)規(guī)劃模型,并運用遺傳算法設(shè)計了相應(yīng)的求解策略。文獻[3]針對多無人機任務(wù)規(guī)劃問題進行了集中式建模,并采用混合整數(shù)規(guī)劃方法進行了求解。集中式任務(wù)規(guī)劃方法經(jīng)過近幾十年的發(fā)展,已經(jīng)較為成熟,其全局特性較好,但收斂性與魯棒性稍顯不足。分布式任務(wù)規(guī)劃方法不存在中心節(jié)點,能夠很好地適應(yīng)系統(tǒng)內(nèi)節(jié)點數(shù)量的變化,且具備較強的魯棒性與收斂性。文獻[4]基于合同網(wǎng)拍賣算法,針對多無人機協(xié)同控制問題,設(shè)計了一種分布式任務(wù)規(guī)劃方法。文獻[5]基于組合拍賣算法,設(shè)計了一種協(xié)同空戰(zhàn)決策方法。分布式任務(wù)規(guī)劃方法原理簡單,計算效率高且易于實現(xiàn),針對系統(tǒng)節(jié)點數(shù)目變化以及其他動態(tài)不確定性的適應(yīng)性較強,目前正在成為任務(wù)規(guī)劃的重點研究方向。文獻[6]針對對抗環(huán)境下的多無人機在線搜索攻擊任務(wù)規(guī)劃問題,提出了一種分布式算法,將每架無人機作為獨立單元解決局部優(yōu)化問題,然后通過無人機之間的信息交互,實現(xiàn)多無人機系統(tǒng)的優(yōu)化決策。文獻[7]提出了一種智能自組織算法,用于解決多無人機的搜索-攻擊任務(wù)規(guī)劃問題,該方法采用分布式控制架構(gòu),將全局優(yōu)化問題分為幾個局部優(yōu)化問題,搜索-攻擊任務(wù)規(guī)劃過程包括航路點生成和路徑生成兩部分。文獻[8]針對衛(wèi)星的任務(wù)規(guī)劃問題,提出了一種改進的混合整數(shù)線性規(guī)劃算法,該方法將規(guī)劃過程變?yōu)閯討B(tài)組合優(yōu)化問題,能夠滿足在線任務(wù)規(guī)劃的實時性要求?;诨旌蟿討B(tài)突變遺傳算法,文獻[9]提出了一種分布式在線任務(wù)規(guī)劃算法,用于解決多衛(wèi)星系統(tǒng)的任務(wù)規(guī)劃問題。文獻[10]針對敏捷衛(wèi)星任務(wù)規(guī)劃問題,比較了多種多目標優(yōu)化算法,提出了交互式框架用于幫助決策者調(diào)整參數(shù)。
完成對多飛行器的任務(wù)規(guī)劃后,需要根據(jù)實時變化的戰(zhàn)場環(huán)境與作戰(zhàn)需求為某個或某一組飛行器實時確定要打擊的目標,即進行動態(tài)武器目標分配。武器目標分配是多飛行器打擊多目標作戰(zhàn)的重要組成部分,目標分配結(jié)果的好壞直接影響到整體的作戰(zhàn)效能。武器目標分配問題的解空間規(guī)模會隨著飛行器數(shù)與目標數(shù)的增加呈指數(shù)級增長,屬于典型的多約束離散NP完全問題。目前求解武器目標分配問題的方法主要有兩類。第一類是整數(shù)規(guī)劃方法等傳統(tǒng)方法的改進。文獻[11]考慮到目標分配問題的復(fù)雜性與計算時間約束,運用拉格朗日松弛法設(shè)計了一種目標分配方法。文獻[12]針對協(xié)同空戰(zhàn),設(shè)計了一種帶時間序列約束的武器目標分配策略,并采用整數(shù)規(guī)劃方法進行求解。以上的傳統(tǒng)求解方法的改進方法可以有效地解決小規(guī)模的武器目標分配問題。當(dāng)飛行器與目標的數(shù)目比較多時,或者存在其他約束條件時,求解效率會急劇下降。第二類是啟發(fā)式優(yōu)化算法,也是目前研究與應(yīng)用的熱點。文獻[13]基于分布式協(xié)同拍賣算法,設(shè)計了有中心彈和無中心彈情況下的動態(tài)目標分配方法。文獻[14]針對多無人機目標分配問題,分別采用遺傳算法與市場競爭法進行了求解,并比較了兩種方法下的分配結(jié)果。文獻[15]針對多枚導(dǎo)彈攔截多枚飛行器,提出了一種帶有分組約束的武器目標分配方法,可以保證每個目標被分配到數(shù)量合適的攔截彈,為后續(xù)的分組協(xié)同作戰(zhàn)提供了良好的初始條件。文獻[16]針對動態(tài)武器目標分配問題,設(shè)計了一種改進形式的人工蜂群方法,并和多種優(yōu)化方法進行了對比,驗證了所設(shè)計方法的有效性。
多飛行器編隊控制是協(xié)同控制的核心和重要基礎(chǔ)。在很多任務(wù)和復(fù)雜環(huán)境中,需要多飛行器系統(tǒng)中的個體之間形成和保持預(yù)定的隊形,同時適應(yīng)外部環(huán)境的需求。當(dāng)多飛行器形成特定編隊時,與單枚飛行器相比,更有利于對目標的搜索與跟蹤,群系統(tǒng)的魯棒性會得到增強,任務(wù)可拓展性也會得到延伸[17]。目前編隊控制問題在多機器人與多飛行器領(lǐng)域中的研究已經(jīng)取得了很多成果,積累了大量的采用集中式、分散式和分布式編隊控制結(jié)構(gòu)的研究成果[18]?;诩惺浇Y(jié)構(gòu)的編隊控制方法計算復(fù)雜度高,依賴于可靠的通信系統(tǒng),且魯棒性較差?;诜稚⑹浇Y(jié)構(gòu)的編隊控制方法需要進行分層混合控制器的設(shè)計,在面對復(fù)雜環(huán)境時容易出現(xiàn)決策層狀態(tài)爆炸的缺點。基于分布式結(jié)構(gòu)的編隊控制方法僅需要系統(tǒng)內(nèi)部各個分個體的信息,具有計算簡單、魯棒性強等特點,已經(jīng)廣泛運用于多機器人和多飛行器的編隊控制問題中[19]。在分布式編隊控制策略研究方面,目前主要分為基于行為的編隊控制策略、基于虛擬結(jié)構(gòu)的編隊控制策略、基于領(lǐng)導(dǎo)者-跟隨者的編隊控制策略以及基于一致性的編隊控制策略。
基于行為的編隊控制策略主要是針對多飛行器的預(yù)先期望行為集合進行加權(quán)分配,根據(jù)行為的重要程度分配相應(yīng)的權(quán)值,每個行為具有相應(yīng)的控制作用,通過加權(quán)獲取最終的控制作用和期望。在預(yù)先期望行為集合中包括如編隊形成、障礙避碰、個體避碰、編隊保持和目標跟蹤等期望行為。文獻[20]將編隊行為分解為異常情況處理、項目標點運動、隊形保持和障礙運動四種子行為。對于這種方法,每個個體動作的輸出都可作為其他個體的輸入,個體自身傳感器獲得的敏感信息也可作為輸入,然后根據(jù)行為選擇模塊對信息進行綜合處理。設(shè)計基于行為的編隊控制策略的關(guān)鍵是設(shè)計各種基本行為和有效的協(xié)調(diào)機制,或者說如何獲得各個個體之間的相對位置和狀態(tài)等信息,然后根據(jù)上述信息來設(shè)計基本行為和相應(yīng)的協(xié)調(diào)機制。然而基于行為的編隊控制策略需要兼顧多種期望行為,沒有基于實際物理系統(tǒng)的動力學(xué)模型,僅能通過仿真分析來進行驗證,無法使用嚴格的理論工具對系統(tǒng)編隊行為的穩(wěn)定性進行證明,且隨著系統(tǒng)復(fù)雜度與規(guī)模的增大,行為融合的難度與計算復(fù)雜度也會進一步增大。
基于虛擬結(jié)構(gòu)的編隊控制策略利用一種剛性的虛擬結(jié)構(gòu)來描述多智能體系統(tǒng),虛擬結(jié)構(gòu)上的每一個點代表多智能體系統(tǒng)中的每個個體。針對每個個體預(yù)先設(shè)計了能夠產(chǎn)生吸力、斥力和全局最小值的勢能場,勢場力的方向取勢能場的負梯度方向。在勢場力的作用下,虛擬結(jié)構(gòu)代表了系統(tǒng)中每個個體產(chǎn)生期望的運動,個體之間保持一定的幾何形狀。在整個勢能場達到全局最小值時,整個系統(tǒng)達到期望的編隊。基于虛擬結(jié)構(gòu)法的編隊控制策略可以分為3個子過程:第1個子過程,定義虛擬結(jié)構(gòu)期望的動力學(xué)特性;第2個子過程,轉(zhuǎn)化期望運動目標,將整體目標的實現(xiàn)轉(zhuǎn)化為多智能體系統(tǒng)各自實現(xiàn)目標;第3個子過程,獲得多智能體系統(tǒng)軌跡控制跟蹤控制方法[21]。虛擬結(jié)構(gòu)法主要用于多智能體系統(tǒng),尤其在多飛行器系統(tǒng)的編隊控制和隊形控制等鄰域運用較為廣泛?;谔摂M結(jié)構(gòu)的編隊控制策略具有魯棒性好和控制精度高等特點,但虛擬結(jié)構(gòu)的設(shè)計會引入較大的通信量和復(fù)雜的計算量,同時需要多體系統(tǒng)個體能夠?qū)崟r跟蹤虛擬結(jié)構(gòu)的對應(yīng)期望位置,對實時性要求較高。
領(lǐng)導(dǎo)者-跟隨者方法以其簡單的控制思想得到了許多學(xué)者的青睞,國內(nèi)外許多學(xué)者對其進行了深入的研究。文獻[22]考慮了領(lǐng)導(dǎo)者-跟隨者方法的分布式控制策略,設(shè)計了一階控制律,在控制律中加入了一個積分項,起到對領(lǐng)導(dǎo)者速度進行觀察的作用,通過選取李雅普諾夫函數(shù)證明了編隊的穩(wěn)定性。文獻[23]針對領(lǐng)導(dǎo)者可能會出現(xiàn)故障的情況,提出了一種解決方法,即在編隊中配置2個領(lǐng)導(dǎo)者,當(dāng)前領(lǐng)導(dǎo)者出現(xiàn)問題時,備用的領(lǐng)導(dǎo)者立即生效,起到領(lǐng)航的作用。這種編隊控制策略簡單且易于實現(xiàn),但其魯棒性較差。整個系統(tǒng)的編隊對領(lǐng)導(dǎo)者依賴性較高,同時整個系統(tǒng)缺少編隊信息反饋。當(dāng)領(lǐng)導(dǎo)者與跟隨者之間的性能差異很大或者信息傳輸線路復(fù)雜,跟隨者跟不上領(lǐng)導(dǎo)者時,較大的編隊誤差可能會使得整個系統(tǒng)無法實現(xiàn)期望的編隊構(gòu)型。
隨著多體一致性控制問題取得越來越多的成果,很多學(xué)者嘗試將一致性理論引入到編隊控制問題中,形成了一種新的基于一致性的編隊控制策略。其主要思想是通過分布式協(xié)議的作用,讓多體系統(tǒng)中所有個體的狀態(tài)或者輸出相對于某個共同的編隊參考保持一致的偏差,最后達到期望的編隊。此外,相比于定常編隊,時變編隊更具有一般性。在很多實際的工程運用中,由于外部條件約束,多體系統(tǒng)的編隊結(jié)構(gòu)需要改變。例如在多飛行器執(zhí)行打擊任務(wù)時,需要執(zhí)行目標區(qū)域搜索和目標跟蹤等任務(wù)。當(dāng)外部環(huán)境存在障礙物使前進空間受限時,多飛行器的編隊構(gòu)型需要改變,同時各枚飛行器之間的通信結(jié)構(gòu)也可能隨之改變。因此針對多飛行器集群協(xié)同控制問題,對時變編隊控制方法的研究尤為重要。文獻[24]針對多飛行器編隊形成和變換過程中個體避碰的需求,基于一致性理論和基于人工勢場法設(shè)計了一種具有避碰功能的時變編隊控制方法。文獻[25]基于反步控制方法,設(shè)計了一種時變編隊控制器。文獻[26]將多無人機系統(tǒng)視為二階積分器,運用深度增強學(xué)習(xí)控制方法設(shè)計了相應(yīng)的時變編隊控制器。文獻[27]采用非奇異終端滑??刂品椒ㄔO(shè)計了適用于多架無人飛行器的時變編隊控制方法。對于無人機、導(dǎo)彈以及某些航天器來說,某些情形下其線速度和角速度等狀態(tài)變量并不能通過測量裝置直接測量。因此在多飛行器時變編隊控制器中引入這些狀態(tài)變量作為反饋信息進行控制時可能會導(dǎo)致設(shè)計成本高,實際操作困難。此時運用個體的輸出變量作為反饋,進行自適應(yīng)狀態(tài)時變編隊控制器的設(shè)計更加具有一般性和實用價值。文獻[28]在只有輸出信息可用的情況下,為了適應(yīng)無向通信拓撲和有向通信拓撲兩種情況,設(shè)計了一種基于輸出反饋的自適應(yīng)狀態(tài)時變編隊控制方法。由于飛行環(huán)境等因素的變化,多枚飛行器進行編隊飛行時的通信拓撲可能會發(fā)生改變。針對這一問題,文獻[29]設(shè)計了在多體系統(tǒng)的通信拓撲發(fā)生切換的條件下,基于狀態(tài)反饋和輸出反饋的自適應(yīng)狀態(tài)時變編隊控制器。文獻[30]通過引入自適應(yīng)輸出反饋的方法,基于動態(tài)輸出反饋構(gòu)造了自適應(yīng)輸出時變編隊控制器,并提出了分布式設(shè)計自適應(yīng)輸出時變編隊控制器的算法。該方法僅需要傳遞維數(shù)較低的控制器輸出信息,便可以實現(xiàn)對群系統(tǒng)的時變編隊控制,大大節(jié)約了通信成本,適用于通信條件受限情況下的多飛行器編隊控制。
為了有效突破反導(dǎo)防御系統(tǒng),目前國內(nèi)外對于多飛行器協(xié)同制導(dǎo)技術(shù)的研究,主要集中在對目標實施同時打擊(或者同時進入對方防區(qū))的層面。從實現(xiàn)手段上來看,可以分為兩大類:基于攻擊時間可控的獨立導(dǎo)引方法和基于彈間通信拓撲的協(xié)同導(dǎo)引方法。傳統(tǒng)的制導(dǎo)方法以收斂彈目距離或收斂視線角速率為設(shè)計制導(dǎo)律時的目標。而考慮攻擊時間控制的目的是在規(guī)定時間內(nèi)把彈目相對距離減小到0,即在傳統(tǒng)三維制導(dǎo)的基礎(chǔ)上疊加時間為第4個維度,稱為四維制導(dǎo)。為了實現(xiàn)多枚導(dǎo)彈對目標的協(xié)同攻擊,提升突防能力,攻擊時間控制需要預(yù)先為各枚導(dǎo)彈設(shè)定一個或者分組設(shè)定不同的攻擊時間,然后各枚導(dǎo)彈按照指定的攻擊時間獨立完成攻擊任務(wù)。換而言之,攻擊時間可控的獨立導(dǎo)引方法在實施過程中,各枚導(dǎo)彈之間是沒有通信聯(lián)絡(luò)的。文獻[31]對于反艦導(dǎo)彈面對艦空防御系統(tǒng)時突防概率不足的問題,提出了一種同時命中的策略來提高突防概率:發(fā)射前為每一枚反艦導(dǎo)彈裝定相同的攻擊時間,通過設(shè)計攻擊時間可控的制導(dǎo)律來保證多枚反艦導(dǎo)彈對軍艦的同時命中。基于彈目相對運動學(xué)關(guān)系近似線性化思想,文獻[32]設(shè)計了一種考慮目標探測可觀測性增強的攻擊時間可控制導(dǎo)律。文獻[33]基于傳統(tǒng)比例導(dǎo)引法,設(shè)計了一種考慮導(dǎo)彈視場角約束的攻擊時間可控制導(dǎo)律,該制導(dǎo)律僅需要當(dāng)前彈目距離與航向角信息,便可以求解出有效導(dǎo)航比的解析解。文獻[34]基于滑模變結(jié)構(gòu)控制方法,設(shè)計了一種攻擊時間可控的制導(dǎo)律,該方法適用于導(dǎo)彈初始前置角較大的情形,可以實現(xiàn)對靜止目標與勻速直線運動目標的打擊。文獻[35]在考慮導(dǎo)彈動力學(xué)模型的基礎(chǔ)上,運用滑模變結(jié)構(gòu)控制方法設(shè)計了一種攻擊時間可控的三維制導(dǎo)律。
與攻擊時間控制制導(dǎo)方法不同,協(xié)同制導(dǎo)不需要預(yù)先為每枚導(dǎo)彈設(shè)定相同的攻擊時間,多枚導(dǎo)彈利用數(shù)據(jù)鏈在線傳輸協(xié)調(diào)變量,然后在協(xié)同制導(dǎo)律的導(dǎo)引下,完成攻擊時間的協(xié)調(diào)一致。根據(jù)導(dǎo)彈在通信網(wǎng)絡(luò)中的地位的不同,協(xié)同制導(dǎo)又可以分為基于領(lǐng)彈-從彈架構(gòu)的協(xié)同制導(dǎo)律以及分布式協(xié)同制導(dǎo)律。文獻[36]研究了在二維橫側(cè)向平面下,領(lǐng)彈與從彈協(xié)同攻擊固定目標的問題,領(lǐng)彈采用比例導(dǎo)引法,從彈對領(lǐng)彈進行跟蹤,并給出了從彈的法向過載指令與軸向過載指令表達式。為了減少通信資源的占用,文獻[37]基于協(xié)調(diào)變量的思想設(shè)計了從彈的協(xié)同制導(dǎo)律。文中以目標為領(lǐng)彈,以位置與速度為協(xié)調(diào)變量,給出了分布式協(xié)同制導(dǎo)指令的表達式,通過合理的權(quán)值選取,可以保證從彈對目標的跟蹤,進而完成協(xié)同攻擊任務(wù)。文獻[38]基于一致性理論、代數(shù)圖論以及傳統(tǒng)比例導(dǎo)引法,針對多彈異構(gòu)分布式協(xié)同攻擊問題,設(shè)計了一類領(lǐng)-從分布式協(xié)同制導(dǎo)律。文獻[39]基于高可靠的De Bruijn通信拓撲網(wǎng)絡(luò),設(shè)計了一種領(lǐng)-從式協(xié)同制導(dǎo)律。該方法形式簡單,容錯性與靈活性較好,便于工程實現(xiàn)。上述基于領(lǐng)彈-從彈架構(gòu)的協(xié)同制導(dǎo)律具有攻擊時間控制準確、便于工程實施等優(yōu)點,但必須以領(lǐng)彈與從彈間的正常通信為前提。當(dāng)領(lǐng)彈與從彈間的通信中斷、領(lǐng)彈被攔截或飛行異常,將會導(dǎo)致整個協(xié)同作戰(zhàn)任務(wù)的失敗。與基于領(lǐng)彈-從彈架構(gòu)的協(xié)同制導(dǎo)律不同,分布式協(xié)同制導(dǎo)律網(wǎng)絡(luò)架構(gòu)內(nèi)的成員地位平等。文獻[40]以剩余飛行時間的估計值為協(xié)調(diào)變量,設(shè)計了一種打擊靜止目標與機動目標的分布式協(xié)同制導(dǎo)律。為了降低通信網(wǎng)絡(luò)的資源損耗,文獻[41]基于鄰居信息,設(shè)計了只依賴局部信息交互的協(xié)同制導(dǎo)律,并給出了保證協(xié)同制導(dǎo)有效的參數(shù)選擇方法。文獻[42]基于一致性理論,設(shè)計了一種適用于通信拓撲固定與切換情形下的分布式協(xié)同制導(dǎo)律,并嚴格證明了協(xié)同制導(dǎo)律的穩(wěn)定性。在實際的協(xié)同作戰(zhàn)中,由于作戰(zhàn)環(huán)境與其他約束條件的限制,多飛行器間的通信拓撲可能發(fā)生變化。文獻[42]中的方法可以很好地適應(yīng)這種情況。文獻[43]針對多飛行器分組打擊多個目標的作戰(zhàn)情形,基于組內(nèi)通信與組間通信,設(shè)計了一種分布式分組協(xié)同制導(dǎo)律?;诜答伨€性化的設(shè)計方法與李雅普諾夫穩(wěn)定性理論,給出了分組協(xié)同制導(dǎo)律在固定與切換拓撲下有效的充分條件。文獻[44]針對多飛行器協(xié)同攻擊機動目標的問題,基于主-從飛行器架構(gòu),設(shè)計了一種異構(gòu)體飛行器協(xié)同制導(dǎo)律,主飛行器與從飛行器組成異構(gòu)協(xié)同攻擊編隊,對目標形成多打一的作戰(zhàn)態(tài)勢。該制導(dǎo)律在固定拓撲與切換拓撲情形下,均能實現(xiàn)對機動目標的協(xié)同攻擊,為多飛行器協(xié)同攻擊機動目標提供了一種可能的解決方案。
本文分析了多飛行器集群協(xié)同制導(dǎo)控制問題的關(guān)鍵技術(shù),介紹了任務(wù)規(guī)劃與動態(tài)目標分配方法、時變編隊協(xié)同控制方法和多約束條件下的協(xié)同制導(dǎo)方法的研究成果。目前,多飛行器集群協(xié)同制導(dǎo)控制方法的研究還處于發(fā)展階段,未來研究的主要發(fā)展方向有以下幾點:
1)基于深度學(xué)習(xí)的多約束條件下快速任務(wù)規(guī)劃與動態(tài)目標分配方法
多飛行器系統(tǒng)在執(zhí)行任務(wù)時,會受到諸如地理、氣候等因素的限制。此外,導(dǎo)引頭視場角、探測距離、多飛行器間的通信以及飛行器自身復(fù)雜的動力學(xué)特性也是影響協(xié)同任務(wù)規(guī)劃與目標分配的因素。如果在目前已有的任務(wù)規(guī)劃與目標分配方法上直接添加上述約束條件,可能會大大降低規(guī)劃與分配計算的準確度。深度學(xué)習(xí)作為機器學(xué)習(xí)當(dāng)中一種重要并且較新的方法,具有自主學(xué)習(xí)性強、模型效果好、分配識別精度高等優(yōu)點。因此,在多種約束條件下,運用深度學(xué)習(xí)實現(xiàn)快速任務(wù)規(guī)劃與動態(tài)目標分配,是未來多飛行器協(xié)同作戰(zhàn)技術(shù)的重點研究方向之一。
2)基于強化學(xué)習(xí)的復(fù)雜作戰(zhàn)環(huán)境下多飛行器編隊控制與隊形優(yōu)化
在多飛行器集群協(xié)同作戰(zhàn)過程中,由于作戰(zhàn)環(huán)境、敵我態(tài)勢等因素復(fù)雜多變,多飛行器間的通信會受到較大影響,可能會出現(xiàn)拓撲切換、通信延遲和通信噪聲等情況,對協(xié)同作戰(zhàn)造成一定程度的影響。此外,針對多樣化的作戰(zhàn)需求,需要對多飛行器的編隊構(gòu)型進行優(yōu)化,使多飛行器能夠更好地完成協(xié)同探測、編隊突防以及中末制導(dǎo)交接班等任務(wù),對目標形成更有利的作戰(zhàn)態(tài)勢。強化學(xué)習(xí)具備對未知環(huán)境很強的適應(yīng)能力,能夠在控制與環(huán)境反饋的反復(fù)交互作用中以學(xué)習(xí)的方式不斷優(yōu)化系統(tǒng)的性能指標,非常適合復(fù)雜作戰(zhàn)環(huán)境下的多飛行器編隊控制與優(yōu)化。因此,基于強化學(xué)習(xí)的復(fù)雜作戰(zhàn)環(huán)境下編隊控制與隊形優(yōu)化方法是未來重要的應(yīng)用研究方向。
3)基于博弈理論的協(xié)同制導(dǎo)技術(shù)
相比于現(xiàn)有大多數(shù)制導(dǎo)方法,基于博弈理論的制導(dǎo)律不需要對目標的逃逸加速度進行估計,即可同時得到導(dǎo)彈的最優(yōu)攔截策略與目標的最優(yōu)機動策略。目前,基于博弈理論的協(xié)同制導(dǎo)問題研究處于起步階段,絕大多數(shù)研究成果為單對單的追逃博弈或三體問題,多彈間的協(xié)同作戰(zhàn)策略尚未體現(xiàn)在微分博弈的框架中。若通過在代價函數(shù)中加入?yún)f(xié)同打擊指標或者結(jié)合勢能函數(shù)的思想,將微分博弈理論成功運用到協(xié)同制導(dǎo)方法的設(shè)計中,不僅能夠得到多彈間的最優(yōu)攔截策略,還能實現(xiàn)對目標的協(xié)同打擊,實現(xiàn)某種意義下的最優(yōu)協(xié)同制導(dǎo)。因此,研究基于博弈理論的協(xié)同制導(dǎo)技術(shù),是今后協(xié)同制導(dǎo)方向的工作重點。
總之,在未來高動態(tài)、強對抗、拒止作戰(zhàn)背景下,飛行器集群智能化、自主化、高可靠、強魯棒作戰(zhàn)將成為未來戰(zhàn)場上的主要作戰(zhàn)形式,對多飛行器協(xié)同制導(dǎo)控制技術(shù)進行深入研究具有重要意義。