亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        異構(gòu)MAS下反導作戰(zhàn)多傳感器任務規(guī)劃分層決策框架

        2016-08-15 07:29:30劉進忙高嘉樂
        關(guān)鍵詞:反導分布式共同體

        倪 鵬, 劉進忙, 付 強, 高嘉樂

        (1. 空軍工程大學防空反導學院, 陜西 西安 710051; 2. 中國人民解放軍94921部隊, 福建 晉江 362200)

        ?

        異構(gòu)MAS下反導作戰(zhàn)多傳感器任務規(guī)劃分層決策框架

        倪鵬1,2, 劉進忙1, 付強1, 高嘉樂1

        (1. 空軍工程大學防空反導學院, 陜西 西安 710051; 2. 中國人民解放軍94921部隊, 福建 晉江 362200)

        綜合利用多維傳感器平臺的資源互補優(yōu)勢進行協(xié)同探測和跟蹤是反導作戰(zhàn)的重要問題和難點。為提高傳感器任務規(guī)劃的效能,針對觀測資源的異構(gòu)性和任務的階段性、動態(tài)性,引入任務共同體概念,剖析了反導作戰(zhàn)多傳感器任務規(guī)劃問題的本質(zhì),形式化定了任務共同體下的行為準則和執(zhí)行能力;在分析和建立的異構(gòu)多Agent系統(tǒng)(multi-agent system,MAS)多傳感器任務規(guī)劃體系的基礎(chǔ)上,深入探討了集中式規(guī)劃和分布式動態(tài)調(diào)整下的分層決策框架和求解方法,并通過仿真實驗驗證了所構(gòu)建分層決策框架的有效性和合理性。

        多傳感器任務規(guī)劃; 任務共同體; 異構(gòu)多Agent系統(tǒng); 分層決策; 雙層規(guī)劃

        0 引 言

        復雜對抗環(huán)境、體系對抗特征的反導作戰(zhàn)需求決定了反導作戰(zhàn)必須要求高精確性和強實時性。在多源異構(gòu)的傳感器網(wǎng)中,通過多傳感器任務規(guī)劃實現(xiàn)對彈道目標的快速搜索發(fā)現(xiàn)、連續(xù)穩(wěn)定跟蹤識別是反導作戰(zhàn)首要解決的關(guān)鍵技術(shù)。現(xiàn)階段對于多傳感器任務規(guī)劃的研究,大多集中于傳感器探測能力分配的研究,并且成果較為顯著。例如,傳感器-目標分配的內(nèi)部機理、分配算法以及分配效果等[1-5]。但對于作戰(zhàn)背景和作戰(zhàn)體系結(jié)構(gòu)的改變下的任務規(guī)劃問題涉及較少。針對反導作戰(zhàn)背景下的多傳感器任務規(guī)劃,對其內(nèi)部機理、認識、任務還不夠清晰。研究成果一部分可直接適用于反導作戰(zhàn),一部分無法適用。

        實際上,反導作戰(zhàn)的傳感器體系構(gòu)成了一個多層次多結(jié)構(gòu)的網(wǎng)絡,而多維異構(gòu)的反導傳感器平臺則構(gòu)成了該網(wǎng)絡中的節(jié)點,這是一個混合大尺度異構(gòu)無線傳感器網(wǎng)絡。傳感器任務規(guī)劃首先需要在合理的反導多傳感器任務規(guī)劃體系構(gòu)建的基礎(chǔ)上和網(wǎng)絡配置最優(yōu)的總體要求下進行。因此,有必要對反導作戰(zhàn)傳感器任務規(guī)劃技術(shù)框架展開研究,在合理設計網(wǎng)絡拓撲結(jié)構(gòu)和數(shù)據(jù)分發(fā)模式的基礎(chǔ)上,重點在信息處理層對多維平臺之間的目標交接和指示過程進行優(yōu)化;在規(guī)劃層針對有限的傳感器資源限制和可視化窗口的約束,動態(tài)地確定傳感器對每個彈道目標的探測序列、探測時間窗口以及工作模式,從而使整體的效能達到最優(yōu)。

        1 體系構(gòu)建

        1.1基于MAS的反導傳感器協(xié)同體系整體架構(gòu)

        異構(gòu)多Agent系統(tǒng)(multi-agent system,MAS)是目前分布式人工智能(distributed artificial intelligence,DAI)領(lǐng)域研究的熱點,在供應鏈、無人機任務規(guī)劃、車間調(diào)度等領(lǐng)域有著廣泛的應用[6-8]。

        文獻[1]中指出觀測資源的異構(gòu)性以及觀測任務的多維性、階段性和動態(tài)性,導致了集中式聯(lián)合任務規(guī)劃方法建模難、求解復雜度高、系統(tǒng)魯棒性較差以及可擴展性不足,應當采用基于MAS的分布式協(xié)同規(guī)劃方法。文獻[9]中針對網(wǎng)絡化防空導彈體系(networked air defense missile systems,NADMS)中一體化火力形成問題,從系統(tǒng)組成、個體行為、協(xié)作能力等方面將MAS與NADMS進行了分析比較,指出MAS中Agent的協(xié)同決策方法是實現(xiàn)一體化作戰(zhàn)能力的有效途徑。文獻[10]利用MAS分析、構(gòu)建了一個有限集中統(tǒng)籌、分布式協(xié)同調(diào)整的規(guī)劃機制,采用分布式動態(tài)規(guī)劃算驗證了機制的有效性。因此,構(gòu)建的基于MAS的反導作戰(zhàn)多傳感器任務規(guī)劃體系架構(gòu)[10-12],如圖1所示。

        圖1 反導作戰(zhàn)多傳感器任務規(guī)劃體系

        1.2基于任務共同體的異構(gòu)MAS多傳感器任務規(guī)劃機制

        在反導作戰(zhàn)中,彈道導彈飛行的時空跨度長,會不斷地脫離一個衛(wèi)星或雷達的視野而進入另一個衛(wèi)星或雷達的視野范圍。那么,參與反導作戰(zhàn)的傳感器資源的異構(gòu)性主要體現(xiàn)在類型和功能上的各不相同,具體體現(xiàn)為:一方面,涉及到各類、多維觀測資源的載荷平臺,主要包括天基衛(wèi)星、海/地基雷達,它們無論是在監(jiān)視區(qū)域、機動能力、探測距離、探測精度還是響應時間上,都存在較大差異;另一方面,從多傳感器任務規(guī)劃的角度看,規(guī)劃的任務呈現(xiàn)出復雜性、階段性和動態(tài)性,是一個需要利用多傳感器進行聯(lián)合觀測的多維多階段任務,可分解為多個不同類型、不同要求的子任務。任務規(guī)劃涉及要素多、協(xié)同關(guān)系復雜,若直接進行全局優(yōu)化配置,問題的維數(shù)和復雜度很高,并且受多階段觀測任務動態(tài)調(diào)整的影響大,系統(tǒng)魯棒性差。

        因此,在圖1構(gòu)建的體系架構(gòu)的基礎(chǔ)上引入任務共同體概念,建立一種新的異構(gòu)MAS多傳感器任務規(guī)劃結(jié)構(gòu)和相應的任務規(guī)劃機制。

        任務共同體(community of interest,COI)是指由具有相同知識背景的成員組成,為共同的目標、利益、任務或業(yè)務處理過程進行信息交換的協(xié)作組織或團體,分為制度性和利益性兩種。前者為事先約定的配置,后者是分布式網(wǎng)絡結(jié)構(gòu)下臨時組成的作戰(zhàn)聯(lián)盟。

        在反導作戰(zhàn)中,COI為某種傳感器根據(jù)任務的動態(tài)組成的聚群——由網(wǎng)絡中處于對目標探測的所有傳感器節(jié)點組成,聚群集合來自于指揮控制與作戰(zhàn)管理系統(tǒng)(command, control, battle management and communications,C2BMC)為每個威脅目標制定的傳感器任務計劃(sensor task plannings,STPs)。即假設對于威脅目標ti,C2BMC根據(jù)掌握的戰(zhàn)場態(tài)勢制定的交戰(zhàn)程序組(engage schedule group,ESG)中為威脅目標ti確定的STPsi={S1,S2,…,Sn}。則T時刻,COI定義為:COIi(T)={ti,Sj,Sk…St},其中1

        如圖2所示,相應隨著作戰(zhàn)過程的推進,STPs下的傳感器節(jié)點組成的COI的屬性也會不斷變化(預警—探測—跟蹤—識別—制導)。同樣,由于傳感器探測范圍和部署位置不同,目標飛行過程中,COI中的成員可分為兩類:探測狀態(tài)和待機接力狀態(tài),并且隨著時間而不斷變化的。

        1.3任務共同體的作戰(zhàn)描述

        基于任務共同體的思想,對反導作戰(zhàn)多傳感器任務規(guī)劃問題進行分析和研究,需要為共同體開發(fā)各自的行為準則來形式化描述它們的任務范圍,構(gòu)造任務共同體目錄。下面基于任務共同體的思想,對反導作戰(zhàn)中的新型一體化作戰(zhàn)能力進行描述和分析,部分作戰(zhàn)能力的遂行需調(diào)整體系中的各任務共同體構(gòu)成,因此反導作戰(zhàn)多傳感器中任務共同體執(zhí)行的能力在一定程度上可作為調(diào)整任務規(guī)劃方案的動機和需求。下面分別對3種任務共同體能力進行形式化描述。

        圖2 反導作戰(zhàn)多傳感器任務規(guī)劃過程中COI示意圖

        (1) 預警Agent任務共同體

        假設Tracking(ti,Sk,T)=1表示T時刻傳感器節(jié)點Sk以發(fā)現(xiàn)目標ti并實現(xiàn)跟蹤,Tracking(ti,Sk,T)=0表示未發(fā)現(xiàn)或者尚未穩(wěn)定跟蹤。

        定義 1預警Agent任務共同體

        對于預警COIi(T)={ti,Sj,Sk,…,St},在第一次收到預警信息后,若Tracking(ti,Sk,T)=0,且有Tracking(ti,Sl,T)=1,其中l(wèi)≠k,Sk,Sl∈{Sj,Sk,…,St},基于信息共享,Sk接收到目標信息,使得Tracking(ti,Sk,T+Δ)=1,Δ<σ,σ為Sk自主搜索跟蹤目標的時間間隔。

        若?Si∈{Sj,Sk,…,St},有Tracking(ti,Si,T)=0,則目標丟失,廣播網(wǎng)內(nèi)傳感器節(jié)點,進行自主搜索跟蹤,并發(fā)出末次預警信息,該信息包括:關(guān)機點信息、預測射向、預測發(fā)射點、預測落點等。

        預警Agent任務共同體示例如圖3所示。

        圖3 預警Agent任務共同體示例

        (2) 跟蹤Agent任務共同體

        假設Tr_t(ti,T)=Sk表示T時刻跟蹤目標ti的傳感器為Sk,Tr_a(ti,Sk,T)表示T時刻Sk對目標ti的跟蹤精度。

        定義 2跟蹤Agent任務共同體

        對于跟蹤COIi(T)={ti,Sj,Sk,…,St},有Sk∈{Sj,Sk,…,St},Tr_t(ti,T)=Sk,其中T為目標ti飛行過程的任一時刻。

        若?Tr_t(ti,T+ΔT)=Sl,l≠k,使得Tr_a(ti,Sl,T+ΔT)>Tr_a(ti,Sk,T+ΔT),則由Sl進行目標跟蹤。

        對Tr_t(ti,T)=Sk,?Tr_t(ti,T+1)=Sl,k≠l,則由Sl進行接力跟蹤,Sk為Sl提供高精度引導信息。

        跟蹤Agent任務共同體示例如圖4所示。

        圖4 跟蹤Agent任務共同體示例

        (3) 識別制導Agent任務共同體

        定義 3識別制導Agent任務共同體

        對于Tr_g(ti,wj,T)=Sk,若Tracking(ti,Sk,T)=0,且Tracking(ti,Sl,T)=1,l≠k,則wj可根據(jù)Sl提供的目標信息進行攔截決策解算,wj發(fā)射攔截彈后,Tr_g(ti,wj,T′)=Sl,T′為攔截彈中段或末制導的任意時刻;

        若Tr_g(ti,wj,T)=Sl,?Tr_g(ti,wj,T+1)=St,l≠t,則攔截的控制權(quán)移交給St。

        特別要指出的是,由于跟蹤精度的限制,目前針對彈道目標的目標識別主要是依靠地基X波段雷達和低軌道衛(wèi)星的跟蹤和識別探測器來完成,而其他類型的傳感器(如有需要)主要是以輔助信息支援的形式來參與。制導識別Agent任務共同體示例如圖5所示。

        圖5 識別制導Agent任務共同體示例

        2 基于“周期-事件”的反導作戰(zhàn)多傳感器任務規(guī)劃分層決策框架

        反導作戰(zhàn)多傳感器任務規(guī)劃是指對任意來襲目標,在有限的傳感器資源限制和可視化窗口的約束下,如何動態(tài)地確定傳感器對目標的探測跟蹤序列,進而確定探測時機和工作模式,以實現(xiàn)對多目標的探測、跟蹤和識別。其實質(zhì)是一類非線性組合優(yōu)化決策問題。其作為作戰(zhàn)決策中的關(guān)鍵問題,方案及時效性的優(yōu)劣直接影響武器系統(tǒng)作戰(zhàn)效能的發(fā)揮,已成為軍事運籌領(lǐng)域中的一個研究熱點[13-16]。對此,基于周期-事件的綜合策略能夠同時兼顧調(diào)度方案的魯棒性和適應性問題,是解決此類問題的基本策略。

        2.1問題求解組成框架

        多傳感器任務規(guī)劃的制定到最終被執(zhí)行是一個不斷迭代、更新的過程。因此,根據(jù)反導作戰(zhàn)一體化的方式和特點:多源異類傳感器、多種攔截器、多個可變中心的指控節(jié)點分布式的網(wǎng)絡連接、采用集中指揮與分布式相結(jié)合的指控方式,相應的將反導作戰(zhàn)中的多傳感器任務規(guī)劃問題分解為兩個層次:集中式?jīng)Q策和分布式調(diào)整。集中式?jīng)Q策對應于所構(gòu)建MAS架構(gòu)的規(guī)劃層,而分布式調(diào)整則在處理層與實體層之間展開。

        如圖6所示,在集中式?jīng)Q策生成預規(guī)劃,確保解的質(zhì)量的基礎(chǔ)上,將部分權(quán)力下放,對任務規(guī)劃涉及到的相關(guān)各傳感器節(jié)點能夠協(xié)同決策,實現(xiàn)動態(tài)自同步更新,把不同的組成部分集成到一起,形成適合于當前戰(zhàn)場態(tài)勢的多種組合的傳感網(wǎng)。

        圖6 問題求解組成框架

        2.2基于任務共同體的問題求解過程機制分析

        任務規(guī)劃序列生成是動態(tài)的,既要考慮到空間維度上的延伸性,又要考慮到時間維度上的時效性。一方面,周期性的以集中式方法生成整體的任務序列方案,確保當前全局最優(yōu)解;另一方面,動態(tài)事件觸發(fā)執(zhí)行層傳感器進行分布式調(diào)整,確保對戰(zhàn)場任務動態(tài)變化的自適應。如果序列生成的周期過長,隨著對目標探測跟蹤誤差的增加,將使規(guī)劃失敗的可能性不斷增大;周期選取頻繁,將顯著增加任務共同體內(nèi)部具體方案求解的工作量。因此,對周期的選取應根據(jù)對目標的量測結(jié)果和任務的變化趨勢進行自適應調(diào)整。具體如圖7所示。

        (1) 周期的確定

        周期性序列生成是集中式產(chǎn)生全新序列方案,周期長短的選擇對整個序列方案生成的魯棒性的影響是根本性的。根據(jù)任務共同體的劃分,在各彈道段內(nèi)目標的運動軌跡一般具有可預測性,相對穩(wěn)定。因此,考慮以任務共同體為依據(jù)作為一個選取周期。

        (2) 基于任務共同體的周期調(diào)整

        周期的調(diào)整需要根據(jù)前一次周期內(nèi)對目標的執(zhí)行情況來進行調(diào)整,考慮問題的求解復雜度以及要符合實際情況的客觀要求,以跟蹤精度和攔截區(qū)確定分別作為探測跟蹤任務共同體和識別制導任務共同體周期調(diào)整的兩個主要因素。

        1) 探測跟蹤任務共同體

        對于探測跟蹤任務共同體而言,就是要最優(yōu)化目標的跟蹤性能,因此選擇以探測跟蹤誤差作為確定探測跟蹤任務共同體下周期序列生成的時機。假設預警任務共同體序列生成初始周期為T0,周期終止時刻為et,對目標跟蹤誤差的閾值為εmax,當前任務共同體下t時刻對目標的跟蹤協(xié)方差為Pt。那么探測跟蹤任務共同體周期T′開始時刻,以跟蹤精度比閾值高一個數(shù)量級為依據(jù)來確定,具體見式(1)。

        (1)

        圖7 基于“周期-事件”的傳感器任務規(guī)劃分層決策框架

        2) 識別制導任務共同體

        識別制導是在線控制整個反導作戰(zhàn)過程的關(guān)鍵點,是整個傳感器任務規(guī)劃的落腳點。其與攔截的耦合關(guān)系,必然要求以攔截成功為最終目標進行優(yōu)化。因此,選擇以攔截區(qū)作為確定識別制導任務共同體下周期序列生成的時機。首先跟蹤任務共同體給出的信息可以確定目標的攔截點,進而來倒推目標識別窗口達到優(yōu)化序列的目的。

        假設攔截點“時間-位置”參數(shù)為(tiHit,xiHit,yiHit,ziHit),相應可解算出攔截彈發(fā)射時刻目標“時間-位置”參數(shù)為(tiLaun,xiLaun,yiLaun,ziLaun),目標發(fā)射點到攔截點的時間為Δt1,識別時間窗口為Δt2。跟蹤制導雷達發(fā)現(xiàn)目標時刻tiTrack就是目標開始跟蹤識別的時刻,發(fā)現(xiàn)目標的距離,決定著跟蹤制導雷達開始跟蹤的起始距離。所以調(diào)度時機為

        (2)

        只有在這段時間內(nèi)成功識別目標,才能達到目標的發(fā)射條件。

        3) 分布式更新

        分布式更新問題,要設計與問題匹配的協(xié)同機制,各分配節(jié)點以該協(xié)同機制作為行為規(guī)則,對分配方案進行動態(tài)分布式調(diào)整。這一部分將在第2.4節(jié)進行詳細敘述。

        2.3集中式反導作戰(zhàn)多傳感器任務規(guī)劃方法分析

        集中式反導作戰(zhàn)多傳感器任務規(guī)劃是指對任意來襲目標,在有限的傳感器資源限制和可視化窗口的約束下,如何確定傳感器對目標的探測跟蹤序列、探測時機和工作模式,以實現(xiàn)對多目標的探測、跟蹤和識別。影響反導作戰(zhàn)多傳感器任務規(guī)劃的因素主要包括:傳感器資源的性能、任務的特性與規(guī)劃目標。體現(xiàn)為,不同傳感器對不同類型任務的處理能力各不相同,即使針對同一任務各傳感器間也有所差異。同時,規(guī)劃的目標對規(guī)劃結(jié)果的影響是根本性的,不同的目標會有不同的規(guī)劃結(jié)果,它決定了資源與任務按什么原則去匹配。

        因此,集中式反導作戰(zhàn)多傳感器任務規(guī)劃可歸結(jié)為:任務分配規(guī)劃(missionallocationprogramming,MAP)和任務分配調(diào)度(missionallocationscheduling,MAS)兩個問題。在任務規(guī)劃過程中,MAP和MAS有各自的決策變量和目標函數(shù)。在給定MAP方案后才能進一步確定MAS方案。一方面,MAS方案對其目標函數(shù)的優(yōu)化決策具有決定性的作用;另一方面MAS方案又將對MAP的目標函數(shù)產(chǎn)生影響。綜上所述,反導作戰(zhàn)傳感器任務規(guī)劃實際上是一個以MAP為上層規(guī)劃,MAS為下層規(guī)劃的雙層規(guī)劃模型。

        (1)MAP上層規(guī)劃

        在反導作戰(zhàn)中,傳感器從預警到攔截制導的“任務-時間-空間”線中涉及任務主要包括預警任務、探測跟蹤任務、識別制導任務。進而,MAP的目的是通過優(yōu)化任務分配,以最大化作戰(zhàn)效能、平衡任務契合度為目標,合理匹配各個異構(gòu)多源傳感器的能力,以獲得最佳任務效益的傳感器集合。

        (2)MAS下層規(guī)劃

        MAS的目的是在任務匹配的基礎(chǔ)上,各傳感器間以最大化探測有利度、最小化傳感器節(jié)點數(shù)、平衡全局資源負載為目標,尋求執(zhí)行任務最佳的傳感器節(jié)點時間序列組合,并將規(guī)劃結(jié)果反饋到上層,由上層進行總體權(quán)衡,從而得到最終決策結(jié)果。

        可以看出,MAP和MAS都是組合優(yōu)化問題,存在“維數(shù)災難”的問題。因此這是一個包含復雜約束條件、上下層規(guī)劃問題的非線性雙層規(guī)劃問題。求解該類問題就需要設計一種搜索能力強、收斂速度快的分層遞階的求解算法。在求解算法研究方面,隨著計算機技術(shù)的發(fā)展,智能優(yōu)化算法被大量應用于傳統(tǒng)優(yōu)化算法難以解決的多項式復雜程度的非確定性(non-deterministicpolynomial,NP)問題中,由此發(fā)展起來的群智能是目前研究的熱點。典型的有遺傳算法、差分優(yōu)化算法、粒子群算法、蟻群算法、狼群算法以及混合智能算法等等[17-22],這類算法在計算復雜度上相對于傳統(tǒng)算法表現(xiàn)出的極大優(yōu)勢,使得它們在各個領(lǐng)域都得到了廣泛的應用。

        2.4分布式反導作戰(zhàn)多傳感器任務規(guī)劃方法分析

        分布式反導作戰(zhàn)多傳感器任務規(guī)劃在本質(zhì)上屬于分布式任務分配問題范疇。求解該類問題的核心是設計任務執(zhí)行者之間的協(xié)同機制,各執(zhí)行者以該協(xié)同機制作為行為規(guī)則,實現(xiàn)作戰(zhàn)過程中的動態(tài)更新。主要包括確定問題的目標函數(shù)和約束條件;分析分布式調(diào)整的觸發(fā)時機;根據(jù)問題背景和作戰(zhàn)需求,設計合理的協(xié)同機制,以實現(xiàn)交戰(zhàn)過程中任務規(guī)劃方案分布式調(diào)整后的作戰(zhàn)效能最大化。

        (1) 執(zhí)行時機分析

        在作戰(zhàn)過程中可能由于后續(xù)約束條件滿足、戰(zhàn)場節(jié)點損耗/失效等情況的改變而使得某個周期內(nèi)的集中式方案變得不再是最優(yōu)解,甚至變?yōu)椴豢尚薪?。此時,就需要根據(jù)戰(zhàn)場的實時態(tài)勢進行動態(tài)的分布式調(diào)整。具體執(zhí)行條件如下:

        執(zhí)行條件1:當T時刻,當目標尚未到達傳感器節(jié)點有效威力范圍時,融合Agent(處理層Agent)根據(jù)體系內(nèi)的目標綜合信息,發(fā)現(xiàn)目標實際航跡偏離之前規(guī)劃時采用的預測彈道,使得處理層Agent根據(jù)所轄實體層Agent的部署位置、武器性能、剩余資源等因素的掌握程度,判定“之前由于作戰(zhàn)區(qū)域、系統(tǒng)資源或不滿足其他等原因未能分配到該目標”的傳感器節(jié)點可對其提前作戰(zhàn),則發(fā)出協(xié)同交戰(zhàn)請求,對相應任務規(guī)劃方案進行調(diào)整。這樣做是為了有機會選擇更加有效地傳感器節(jié)點對目標實施作戰(zhàn),提高作戰(zhàn)效能。

        執(zhí)行條件2:當T時刻,實體層Agent判定無法成功完成任務(失跟、傳感器節(jié)點失效、無剩余資源等)或者目標強機動飛出當前傳感器節(jié)點有效范圍,處理層Agent根據(jù)當前其他節(jié)點的部署位置、武器性能等因素判定其他傳感器節(jié)點可對目標繼續(xù)實施作戰(zhàn),則發(fā)出協(xié)同交戰(zhàn)請求,重新調(diào)整任務規(guī)劃序列,盡可能減小目標突防概率。

        (2) 分布式協(xié)同決策方法分析

        不同類型的任務共同體共同構(gòu)成了傳感器任務規(guī)劃,彼此間既存在區(qū)別、又存在耦合,因此相對應的求解的方法也應當是不盡相同的。具體體現(xiàn)為問題解決的目的、分配對象、任務執(zhí)行能力需求,如表1所示。

        表1 不同類型任務體下的求解問題比較

        一方面,目的和分配對象這兩個因素決定了分配問題的建模方式、約束條件和求解的粒度;另一方面,任務執(zhí)行能力需求決定了協(xié)同決策的依據(jù)、機理和過程。從表1中,可以看出預警與探測跟蹤主要關(guān)注目標跟蹤性能上的穩(wěn)定和優(yōu)化,可以用某個或某些具體特性的最優(yōu)度量值(檢測概率、截獲概率、跟蹤精度等)作為目標函數(shù),是實現(xiàn)目標-傳感器之間的動態(tài)調(diào)整;而識別制導任務共同體是要在攔截點規(guī)劃的基礎(chǔ)上對目標-制導節(jié)點-火力節(jié)點的進一步動態(tài)調(diào)整。與前兩者相比,在識別制導任務共同體階段,資源沖突高,約束復雜,實時性要求高。因此,有必要將分布式反導作戰(zhàn)多傳感器任務規(guī)劃問題分為預警探測跟蹤協(xié)同規(guī)劃和識別制導協(xié)同規(guī)劃分別進行研究。

        在求解算法方面,目前對于分布式分配問題的研究可分為以Brown算法為代表的通用算法求解方法和以人工智能為基礎(chǔ)的協(xié)同機制求解方法。前者可實現(xiàn)全局最優(yōu),一致性好,但是對作戰(zhàn)計算資源、數(shù)據(jù)要求以及指控能力的要求極高。一旦對抗體系發(fā)生變化(體系中有節(jié)點加入或者退出),就需要全局進行重新優(yōu)化。而基于人工智能的求解方法,由于其計算復雜度低、體系結(jié)構(gòu)動態(tài)調(diào)整速度快,可擴展性好,局部優(yōu)化能力強等特點,成為了目前研究的熱點。主要包括了基于行為的方法[23],基于拍賣和市場機制的方法[24-25],基于空閑鏈的方法[26]以及如蟻群、狼群等基于群智能[20-21]的方法。

        3 仿真與驗證

        3.1仿真想定

        為了簡化實驗,以驗證本文所述體系框架機制的合理性和有效性,因此借鑒文獻[10]和文獻[18]的求解方法:采用基于粒子群優(yōu)化雙層規(guī)劃的方法進行集中式任務分配,結(jié)合面向任務的合同網(wǎng)協(xié)議法進行序列的分布動態(tài)調(diào)整。由于篇幅限制,本文不再累述。

        引入如下戰(zhàn)局想定:3顆地球同步軌道的預警衛(wèi)星,5部多功能相控陣雷達(其中1部前置部署)1部遠程預警雷達,兩型彈道目標。根據(jù)文獻[11]的性能參數(shù)進行數(shù)學建模。粒子群優(yōu)化算法控制參數(shù)設置:粒子群規(guī)模取100,w=1,c1=c2=2,算法終止條件為最大迭代次數(shù)1 000次,分別采用本文機制和傳統(tǒng)機制(自主搜索+隨機分配)進行仿真分析,具體如圖8所示。

        圖8 戰(zhàn)局想定設置示意圖

        3.2結(jié)果及分析

        某次仿真中得到各型雷達相對兩型導彈的坐標曲線如圖9~圖12所示。

        圖9 彈道相對多功能相控陣雷達S1的坐標曲線

        圖10 彈道相對遠程預警雷達S2的坐標曲線(距離/俯仰角)

        以本文的方法和傳統(tǒng)架構(gòu)下的運行模式進行對比,運行結(jié)果如表2所示。從表2中可以看出預警衛(wèi)星對兩種彈道提供的預警時間分別約為:1 800 s和1 900 s。由于目標對X波段雷達而言有一個過頂?shù)倪^程,前置部署的X波段雷達能力的限制,雷達無法有效、長時間跟蹤彈道目標,因此在彈道目標的中前段失去對彈道目標的跟蹤能力。但由于彈道的可預測性,異構(gòu)MAS體系下,任務共同體快速引導了具備對彈道目標上升跟蹤能力的遠程預警雷達進行截獲跟蹤,相對于自主搜索下提前20 s左右截獲跟蹤目標。

        圖11 彈道相對多功能相控陣雷達S3的坐標曲線

        圖12 彈道相對多功能相控陣雷達S4,S5的坐標(采用地平搜索,搜索俯仰角設在3°)

        目標分別于570 s和650 s飛出系統(tǒng)探測區(qū)域,這時就需要有外部的精確引導信息進行引導截獲搜索。本文機制下,將目標引導給了部署位置相對較好的多功能相控陣雷達1,比傳統(tǒng)模式下的提前190~220 s左右重新截獲跟蹤;針對采用地平搜索,搜索屏俯仰角設在3°的模式下可提前近50 s的時間截獲跟蹤目標,有效保障了預警系統(tǒng)在其最大截獲跟蹤能力范圍上截獲跟蹤目標。具體如圖13所示。

        表2 兩種模式下探測截獲跟蹤區(qū)域時間窗口1)

        注1): 斜體數(shù)據(jù)中第二位數(shù)據(jù)表示在該時刻目標超出雷達最大跟蹤能力,第三位數(shù)據(jù)表示飛出探測區(qū)域。

        圖13 兩種模式下的系統(tǒng)截獲跟蹤時間窗口對比

        4 結(jié) 論

        異構(gòu)MAS下的反導作戰(zhàn)傳感器任務規(guī)劃框架通過將反導作戰(zhàn)傳感器任務規(guī)劃依據(jù)任務性質(zhì)進行分割,不但是為了平衡各傳感器的任務執(zhí)行量,也是為了區(qū)分多源異類傳感器能力帶來的區(qū)域性差異問題。在此基礎(chǔ)上,構(gòu)建了一種基于任務共同體的分層決策框架,并深入探討了基于雙層規(guī)劃的傳感器任務規(guī)劃序列生成模型,以及分布式協(xié)同決策下的動態(tài)更新問題。最后,通過仿真實驗對所構(gòu)建分層決策框架的合理性和有效性進行了驗證,為反導作戰(zhàn)傳感器任務規(guī)劃問題提供了一個新的思路。

        下一步的工作包括兩個方面:一是考慮更符合戰(zhàn)場環(huán)境的目標和約束條件,構(gòu)建多目標規(guī)劃模型,使得模型更貼近作戰(zhàn)應用特點及決策需求;二是構(gòu)建能夠動態(tài)適應戰(zhàn)場攻防對抗態(tài)勢變化的面向多任務分布式智能協(xié)同任務規(guī)劃理論與算法,以進一步提高不確定戰(zhàn)場環(huán)境下,算法求解效率及解的精度。

        [1] Li J, Zhong Z L, Jing N, et al. Space-air resources multi-phase cooperation task planning approach based on heterogeneous MAS model[J].ActaAeronauticaetAstronauticaSinica,2013,34(7):1682-1697.(李軍,鐘志良,景寧,等.異構(gòu)MAS結(jié)構(gòu)下的空天資源多階段協(xié)同任務規(guī)劃方法[J].航空學報,2013,34(7):1682-1697.)

        [2] Br?ring A, Echterhoff J, Jirka S, et al. New generation sensor web enablement[J].Sensors, 2011, 11(3):2652-2699.

        [3] Liu Q, Liu Z. A method of maneuvering target collaboration tracking based on Rényi information gain[J].2012, 27(9):1437-1440. (劉欽, 劉崢. 一種基于Rényi信息增量的機動目標協(xié)同跟蹤方法[J].控制與決策, 2012, 27(9):1437-1440.)

        [4] Wang Y C, Shan G L, Tong J. Solving sensor-target assignment problem based on cooperative memetic PSO algorithm[J].SystemsEngineeringandElectronics, 2013, 35(5):1000-1007. (王一川, 單甘霖, 童俊. 基于協(xié)同memetic PSO算法的傳感器-目標分配問題求解[J].系統(tǒng)工程與電子技術(shù), 2013, 35(5):1000-1007.)

        [5] Maheswararajah S, Halgamuge S. Sensor scheduling for target tracking using particle swarm optimization[C]∥Proc.ofthe63rdIEEEVehicularTechnologyConference, 2006: 573-577.

        [6] Badawy R, Hirsch B, Albayrak S. Agent-based coordination techniques for matching supply and demand in energy networks[J].IntegratedComputer-AidedEngineering, 2010, 17(4):373-382.

        [7] de Jong S, Tuyls K, Verbeeck K. Fairness in multi-agent systems[J].KnowledgeEngineeringReview, 2008, 23(2):153-180.

        [8] Confessore G, Giordani S, Rismondo S. A market-based multi-agent system model for decetralized multi-project scheduling[C]∥Proc.oftheAnnalsofOperationsResearch, 2003: 27-38.

        [9] Tang S Y. Research on dynamic interception coalition formation mechanism and method in networked air defense missile systems[D]. Changsha: National University of Defense Technology,2011.(唐蘇妍.網(wǎng)絡化防空導彈體系動態(tài)攔截聯(lián)盟形成機制與方法研究[D]. 長沙: 國防科學技術(shù)大學, 2011.)

        [10] Ni P, Liu J M, Liu Y L, et al. Research on mission planning for distributed multi-sensors in anti-TBM combat based on multi-agent system[J].SensorLetters, 2014, 12(2):325-331.

        [11] Wu L F, Wang G, Liu C Y, et al. Task programming of anti-ballistic missile sensors based on MAS[J].ModernDefenceTechnology,2012,40(2):88-93.(吳林鋒,王剛,劉昌云,等.基于多智能體的反導傳感器任務規(guī)劃算法[J].現(xiàn)代防御技術(shù),2012, 40(2):88-93.)

        [12] Wang G, He J. The study on multi-sensor system integration of network centric air defense based on Agent[J].FireControlandCommandControl,34(1):19-22.(王剛,何晶.基于Agent的網(wǎng)絡化防空作戰(zhàn)多傳感器集成研究[J].火力指揮與控制,2009,34(1):19-22.)

        [13] Bogdanowicz Z R. A new efficient algorithm for optimal assignment of smart weapons to targets[J].ComputersandMathematicswithApplications, 2009,58(4):1965-1969.

        [14] Chen Y W, Cai H P, Xing L N. An improved algorithm of policies optimization of dynamic weapon target assignment problem[J].SystemsEngineering-Theory&Practice, 2007, 27(7):160-165. (陳英武, 蔡懷平, 邢立寧. 動態(tài)武器目標分配問題中策略優(yōu)化的改進算法[J].系統(tǒng)工程理論與實踐, 2007, 27(7):160-165.)

        [15] Karasakal O. Air defense missile-target allocation models for a naval task group[J].Computers&OperationsResearch, 2008, 35(2):1759-1770.

        [16] Liu X, Liu Z, Hou W S. Improved MOPSO algorithm for multi-objective programming model of weapon-target assignment[J].SystemsEngineeringandElectronics, 2013, 35(2):326-330. (劉曉, 劉忠, 侯文姝. 火力分配多目標規(guī)劃模型的改進MOPSO算法[J].系統(tǒng)工程與電子技術(shù), 2013, 35(2):326-330.)

        [17] Wang W, Cheng S C, Zhang Y Z. Research on approach for a type of weapon target assignment problem solving by genetic algorithm[J].SystemsEngineeringandElectronics, 2008, 30(9):1708-1711. (王瑋, 程樹昌, 張玉芝. 基于遺傳算法的一類武器目標分配方法研究[J].系統(tǒng)工程與電子技術(shù), 2008, 30(9):1708-1711.)

        [18] Liu Y, Li W M, Xing Q H, et al. Cooperative mission assignment optimization of unmanned combat aerial vehicles based on bilevel programming[J].SystemsEngineeringandElectronics, 2010, 32(3):579-583.(劉毅,李為民,邢清華,等.基于雙層規(guī)劃的攻擊無人機協(xié)同目標分配優(yōu)化[J].系統(tǒng)工程與電子技術(shù),2010,32(3):579-583.)

        [19] Fan C L, Xing Q H, Fan H X. Particle swarm optimization and variable neighborhood search algorithm with convergence criterions[J].2014, 29(4):696-700. (范成禮, 邢清華, 范海雄. 帶審斂因子的變鄰域粒子群算法[J].控制與決策, 2014, 29(4):696-700.)

        [20] Li M, Wang D B, Sheng S Z. UAV route planning using multi-heuristic ant colony optimization algorithm[J].JournalofSouthChinaUniversityofTechnology(NaturalScienceEdition), 2011, 39(10):37-43. (李猛, 王道波, 盛守照. 采用多重啟發(fā)蟻群優(yōu)化算法的無人機航跡規(guī)劃[J].華南理工大學學報(自然科學版), 2011, 39(10):37-43.)

        [21] Wu H S, Zhang F M, Wu L S. New swarm intelligence algorithm-wolf pack algorithm[J].SystemsEngineeringandElectronics, 2013, 35(11):2430-2438.(吳虎勝,張鳳鳴,吳廬山.一種新的群體智能算法——狼群算法[J].系統(tǒng)工程與電子技術(shù), 2013, 35(11):2430-2438.)

        [22] Liu C H, Li X H, Zhang J. Co-evolutionary particle swarm optimization algorithm based on elite immune clonal selection[J].ActaElectronicaSinica, 2013, 41(11):2167-2173. (劉朝華, 李小花, 章兢. 精英免疫克隆選擇的協(xié)同進化粒子群算法[J].電子學報, 2013, 41(11):2167-2173.)

        [23] Gage A. Multi-robot task allocation using affect[D]. Tampa: University of South Florida, 2004.

        [24] Jones E G, Dias M B, Stentz A. Learning-enhanced market-based task allocation for disaster response[A]. CMU-RI-TR-06-48. Pittsburgh: Carnegie Mellon University, 2006.

        [25] Dobzinski S, Nisan N, Schapira M. Approximation algorithms for combinatorial auctions with complement-free bidders[J].MathematicsofOperationsResearch, 2010, 35(1):1-13.

        [26] Chase I D, Weissburg M, Dewitt T H. The vacancy chain process: a new mechanism of resource distribution in animals with application to hermit crabs[J].AnimalBehavior, 1998, 36(5):1265-1274.

        Research on layered decision-making of multi-sensor planning based on heterogeneous MAS in anti-TBM combat

        NI Peng1,2, LIU Jin-mang1, FU Qiang1, GAO Jia-le1

        (1. School of Air and Missile Defense, Air Force Engineering University, Xi’an 710051, China;2. Unit 94921 of the PLA, Jinjiang 362200, China)

        It is an important and difficult problem for anti-TBM combat to realize detecting and tracking the TBMs cooperatively by comprehensively utilizing the complementary advantages of multi-dimensional sensor platforms. Aiming at the heterogeneous of sensor resources and the time-phased and dynamism of the mission, the community of interest (COI) is introduced to analyze the essence of multi-sensor mission planning (MSMP). And then the behavior of COI is formally defined as well as its executive capability. On this basis, the architecture of MSMP based on heterogeneous multi-agent system (MAS) is analyzed and established. Finally, both centralized and distributed planning methods are also discussed in detail. Simulation results show the effectiveness and reasonability of the proposed method.

        multi-sensor mission planning; community of interest (COI); heterogeneous multi-agent system; layered decision-making; bi-level programming

        2015-05-25;

        2016-02-21;網(wǎng)絡優(yōu)先出版日期:2016-05-12。

        國家自然科學青年基金(61102109)資助課題

        TP 182

        A

        10.3969/j.issn.1001-506X.2016.08.16

        倪鵬(1985-),男,博士,主要研究方向為智能信息處理、信息融合。

        E-mail:nipeng198509@163.com劉進忙(1958-),男,教授,博士,主要研究方向為信息融合、目標跟蹤。

        E-mail:liujinmang1@163.com

        付強(1988-),男,博士研究生,主要研究方向為智能信息處理、信息融合。

        E-mail:fuqiang_66688@163.com

        高嘉樂(1990-),男,博士研究生,主要研究方向為智能信息處理、軍事運籌。

        E-mail:gaojiale_kgd@163.com

        網(wǎng)絡優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160512.0911.008.html

        猜你喜歡
        反導分布式共同體
        愛的共同體
        共建人與自然生命共同體
        構(gòu)建和諧共同體 齊抓共管成合力
        甘肅教育(2020年17期)2020-10-28 09:01:36
        共同體的戰(zhàn)斗
        小哥白尼(軍事科學)(2020年3期)2020-07-27 01:55:22
        小哥白尼(軍事科學)(2020年4期)2020-07-25 01:25:22
        未來反導陸???下)
        反導大作戰(zhàn)
        分布式光伏熱錢洶涌
        能源(2017年10期)2017-12-20 05:54:07
        分布式光伏:爆發(fā)還是徘徊
        能源(2017年5期)2017-07-06 09:25:54
        亚洲丁香五月天缴情综合| 亚洲精品中文字幕乱码3| 中文字幕在线乱码亚洲| 日本一区二区三区免费播放| 黑人玩弄人妻中文在线| 依依成人影视国产精品| 久久精品国产亚洲av热东京热| 久久久精品国产亚洲av网深田| 欧美黑人群一交| 国产亚洲精品自在久久蜜tv| 国产精东一区二区三区| 亚洲蜜臀av一区二区三区| 97精品一区二区视频在线观看| 国产一极毛片| 色老板在线免费观看视频日麻批| 国产亚洲一区二区三区| 久久久久波多野结衣高潮| 亚洲熟妇在线视频观看| 男女后入式在线观看视频| 久久不见久久见www日本网| 亚洲av无码精品色午夜| 亚洲福利天堂网福利在线观看| 精品国产日产av在线| 欧美人与善在线com| 国产成人精品成人a在线观看 | 少妇人妻偷人精品免费视频| 熟女人妻丰满熟妇啪啪| 国产av精选一区二区| 97久久精品人妻人人搡人人玩| 奇米影视久久777中文字幕| 亚洲免费成年女性毛视频| 午夜免费观看日韩一级视频| 变态 另类 欧美 大码 日韩| 加勒比黑人在线| 日本一区二区三区精品免费| 性生交片免费无码看人| 国产曰批免费视频播放免费s| 亚洲av免费高清不卡| 欧美激情视频一区二区三区免费 | 亚洲丁香婷婷综合久久小说| 手机在线看片在线日韩av|