李尚昊,方 浩
(北京理工大學自動化學院,北京 100081)
伴隨著傳感器技術的發(fā)展與應用,現(xiàn)代戰(zhàn)場上已經出現(xiàn)了越來越多具有高探測率、高分辨率并能快速反應的傳感器。各式各樣的傳感器能夠幫助作戰(zhàn)指揮中心獲取較為全面的情報信息,因而信息的匱乏并不是當下戰(zhàn)場環(huán)境的主要問題,而是如何在數(shù)量龐大、內容繁雜的信息中,提取出準確且有用的戰(zhàn)場信息并能準確、及時地進行處理。正所謂知己知彼百戰(zhàn)不殆,通過態(tài)勢估計能夠獲悉敵軍的作戰(zhàn)情況,并且不僅僅是簡單的、龐雜的信息,而是借助一系列現(xiàn)代手段得到的易于指揮人員理解的數(shù)據(jù),這對實際戰(zhàn)爭中搶占先機、減少損失直至獲取勝利都有著巨大作用。
態(tài)勢估計[1]中涉及到兩大主要問題:一是目標分群,二是規(guī)劃識別。針對目標分群任務,張芬等[2]對目標點、空間群、進攻關系、距離因子及距離差因子做出定義,并基于上述定義提出一種生成功能群的算法。李鏡等[3]針對傳統(tǒng)的目標分群需要預先制定分類數(shù)等參數(shù)的問題,提出一種基于水平集的目標分群方法。詹環(huán)等[4]設計出融合作戰(zhàn)目標的個體屬性以及網絡鄰接關系的相似度模型和基于 K-prototype的作戰(zhàn)目標分群算法。柴慧敏等[5]針對聚類算法對初始中心敏感的問題,提出了一種基于目標特征相似度聚類的分群方法。Bakert等[6]描述了一個為部隊集合、軍事單位分類工具開發(fā)的自適應證據(jù)網絡算法,根據(jù)進化出的所有源情報數(shù)據(jù)的概率證據(jù),自適應地選擇部隊的軍事單元劃分。Looney等[7]結合一種魯棒聚類算法對特征向量進行位置聚類開發(fā)了一種綜合多階段的中高級數(shù)據(jù)融合方法,并將其應用于態(tài)勢和威脅評估。Schubert[8]提出了一種證據(jù)力聚合方法,用于將證據(jù)智能分類為可識別的力結構。Yu等[9]提出一種用于部隊集結與分類的多傳感器決策融合證據(jù)模型,結合D.S證據(jù)理論和模板匹配的方法提出了一種基于證據(jù)理論和理論模板的軍事力量集結與分類方法。Snidaro等[10]研究了基于馬爾可夫邏輯網絡的海上態(tài)勢感知不確定性知識與證據(jù)融合。Oxenham 等[11]研究了網絡中心環(huán)境下共享態(tài)勢感知的異類身份估計融合。
針對規(guī)劃識別問題,Kautz等[12]提出一種通用的規(guī)劃識別模型,將每一個觀測到的行為看作更高層計劃的一個子任務,然后用高層計劃去解釋底層行為,由此計劃識別的過程,也就變成了根據(jù)觀察到的行為,推測其前向目的。Vilain[13]致力于使識別計劃更像是解析文本這一概念變得精確,基于語法分析進行計劃識別。Pynadath等[14]提出了基于概率狀態(tài)獨立語法的計劃識別方法。該方法引入概率狀態(tài)相關文法(PSDGs)來表示代理的計劃生成過程。Kantharaju[15]研究從訓練數(shù)據(jù)自動構建分解模型的學習技術,用于分層規(guī)劃和計劃識別。還有人將規(guī)劃識別過程看作規(guī)劃,有關這類方法Meneguzzi等[16]做了一定總結。姜云飛[17]提出一種基于規(guī)劃知識圖的規(guī)劃識別算法。與Kautz在計劃識別中廣泛應用的形式化方法相比,該方法簡單、直觀。劉奕伶[18]提出一種基于層次化邏輯隱馬爾可夫模型的任務規(guī)劃識別方法,提高模型對復雜層次化任務的描述能力。朱珂等[19]提出基于解釋圖的概率多規(guī)劃識別事故分析方法。劉成龍[20]基于 AdaBoost算法進行改進,并提出了多智能體條件下的多層規(guī)劃識別方法。
本文在目標識別問題中,延續(xù)了基于模板匹配的思想,同時針對此算法對于空間位置有交叉的群體進行分群的局限性,提出一種以模板匹配為基礎,結合通信代價及初次分群屬性的二次分群方法。針對規(guī)劃識別問題,引入概率的思想,采用基于貝葉斯網絡的規(guī)劃識別算法,通過概率計算的方式得到任務規(guī)劃。最后提出將算法集成的框架,并通過仿真驗證其有效性。
目標分群也稱目標聚類或兵力聚合,是目標群的形成過程,也是態(tài)勢估計系統(tǒng)當中一個重要環(huán)節(jié)。其基本思想是使用一級融合提取的態(tài)勢要素(包括各作戰(zhàn)單元信息)根據(jù)空間、功能和相互作用等屬性對目標對象自下而上逐層集合,對作戰(zhàn)單元進行分層分組和抽象,將之由各戰(zhàn)斗實體單元聚合為更高層次的戰(zhàn)斗群體,以揭示目標實體對象之間的相互聯(lián)系,并確定各單位相互協(xié)作的功能,從而形成了對敵方兵力結構在相互關系層級上的軍事體系單元假設。采用基于模板匹配[21]的方法進行目標分群,可以充分借鑒現(xiàn)有的知識儲備和專家經驗,對于戰(zhàn)場目標分群的準確率有了基本保障。
在采用基于模板匹配的目標分群算法時,需要針對空間群構建知識模板,然后根據(jù)實體目標群的群體信息,如位置、速度、航向、目標類型、類型置信度等相關屬性進行模板匹配。而從實體作戰(zhàn)單元到目標群之間還需要一定的操作,那就是聚類。通過綜合比對多種常用的聚類方法,本文最終采用最近鄰聚類法[22]進行目標群聚類,比較過程在此不作贅述。
通過聚類得到了空間意義上的群體,下一步就是要對所得到的群體類型進行識別,這里采用基于模板匹配的算法。其基本思想為:根據(jù)一定的戰(zhàn)場知識,建立符合實際戰(zhàn)斗情景的模板庫,將聚類得到的集群與模板庫中的進行比較,由于戰(zhàn)場中對于特定類型的群體來說,其功能基本確定,各個功能的組成成員數(shù)量及類型也相對固定,因此借助目標類型、目標數(shù)量及類型的置信度計算集群與模板的匹配程度,選取匹配度最高的模板作為集群的類型,從而實現(xiàn)空間群層次的目標分群。
所得的群體可表示為
式中,type表示類型,Bel表示類型的可信度。
構建空間群模板,可表示為
式中,type為部分群體成員的類型,num為成員數(shù)量,w表示所占權重。
接下來,利用模板匹配的思想來確定群體的類型,方法如下:先對目標群體的成員進行一定歸類和表示,把相同類型的成員化為一組,并統(tǒng)計其數(shù)量,得到一種新的表述形式,如式(2)所示。然后從模板庫中選取模板,分別與之進行比較,找到其中成員類型相同的部分,基于數(shù)量關系計算匹配程度。同時,要選取合適的閾值,將所匹配的模板中超過閾值且匹配度最大的模板作為最終得到的結構,從而確定目標群體的類型。
為了與模板進行匹配,要對聚類得到的群體進行組合,將相同類型的放置在一起,可表示為
式中,type表示目標類型,num表示該類型群體數(shù)量,m_Bel表示平均置信度。它的計算為
式中,Belij表示第j個類型為typei的目標的置信度。
然后計算群G中的目標ai與模板T中相同類型成員的匹配度δ(G,T),其匹配算法描述如下。
(1)初始化,令i= 1 ,δ(G,T) = 0 。
(2)如果群中的目標ai與模板中的類型為tj的 組 成 部 分 相 匹 配 , 則δ(G,T) =δ(G,T) +Δi,i=i+1,其中
式中,wj為該成員的權值,m_Beli為平均可信度值,Numi可由式(6)計算
式中,Pnumi和numj分別代表目標群和模板中第i類目標的個數(shù)。
(3)循環(huán)執(zhí)行,直到群中的目標均與模板進行了比較匹配,即i=n。
在實際仿真過程中,采用基于模板匹配的目標分群算法時發(fā)現(xiàn),對于空間分布規(guī)律較為明顯的戰(zhàn)斗機群,該算法的分群效果較為優(yōu)異。但考慮到實際戰(zhàn)場環(huán)境中,部分空間群的戰(zhàn)斗單元之間會有位置的交叉重疊,于是需要修改仿真環(huán)境,更真實地模擬戰(zhàn)場環(huán)境,在某種程度上增加了算法分群的難度。經測試發(fā)現(xiàn),該算法的準確率大大降低,因此需要考慮更為合理的分群方法來應對空間位置交叉的場景。
考慮到實際情景中,集群間的通信成本隨著距離的提高而增大。一方面加大距離會提高通信的難度,另一方面加大距離也會影響通信的準確性,所以集群內戰(zhàn)斗單元的分布必須要考慮到距離帶來的通信成本。因此改進算法,首先采用基于模板匹配的方法進行初次分群,在經過第一次分群后,可以得到每個戰(zhàn)斗單元的位置信息以及所屬集群的中心位置、集群類型、類型置信度,將戰(zhàn)斗單元距集群中心的距離、所屬種群類型和該集群的置信度作為該戰(zhàn)斗單元的新屬性,仍采用模板匹配算法計算匹配度的思想,進行二次分群。
二次分群通過如下步驟實現(xiàn)。
(1)假設根據(jù)初始信息得到了數(shù)量為n的飛機集群,經過一次分群,得到m個clu(聚合群體)。
(2)初始化,設置合理的閾值w1,w2(考慮到計算的簡潔性,接下來的步驟只針對距離集群中心超過閾值w1的戰(zhàn)斗單元做二次分群的檢測,以此體現(xiàn)通信代價的影響,而對于距離超過w2的飛機和群體,認為二者已無法有效通信),令i=1。
(3)計算planei到clui的距離dis,可表示為
(4)若dis<w1,跳過此步驟;否則,利用式(7)找到除自身當前群體外,距離自己最近的群體cluj。如果這個距離大于w2,跳過此步驟;否則,利用上一小節(jié)中計算匹配度的方法,分別計算移除該目標的群clui的匹配度及加入該目標的群cluj的匹配度。比較二者的增長量,如果后者大于前者,則保持這種修改;否則,還原planei。
(5)i=i+1,重復步驟(3),直到i=n。
至此,針對敵方戰(zhàn)斗集群的目標分群任務得以實現(xiàn)。
規(guī)劃識別[23-25]是根據(jù)代理的行為序列來推斷代理所追求的目標的過程,能夠根據(jù)觀察到的片斷、瑣碎的現(xiàn)象,推出具有合理因果關系的、完整而全面的計劃描述。這個問題本身屬于人工智能領域,但隨著不斷的發(fā)展,逐漸應用到了各個領域,并在戰(zhàn)場環(huán)境中對戰(zhàn)場態(tài)勢估計起到了非常重要的作用。
一般而言,一個計劃可以表示成
式中,G表示該計劃所要實現(xiàn)的最終目標,G11, … ,G1m表示要實現(xiàn)該目標所分解出的子目標,G1,… ,Gn則表示實現(xiàn)計劃過程中的約束集。這里的約束包括計劃執(zhí)行時的初始狀態(tài),計劃執(zhí)行后的環(huán)境信息,多個事件間的相等關系以及各種事件、行為間的時間條件約束關系。
常見的計劃識別方法都是以觀測到的行為序列或事件為輸入,輸出的是根據(jù)輸入推測出的進一步行動計劃或其根本目的[26]。
對于戰(zhàn)場環(huán)境而言,目標單元的特性一般較為清楚,常見的戰(zhàn)斗模式也相對固定,也就是說具有一定的該領域內的知識。因此,針對戰(zhàn)場態(tài)勢估計的計劃識別,通常先依據(jù)領域內的知識建立一套盡可能完備的計劃庫。它需要完整地描述實現(xiàn)最終目的的內容,以及實現(xiàn)該目的所要執(zhí)行的全部動作序列。然后針對觀測到的代理的行為,將其轉化成機器所理解的語言,通過一定的算法,將之與計劃庫的內容相匹配,從而獲知敵方的進一步行動,并實施打擊。而計算概率的思想與人類判斷事物的常規(guī)思維模式相符[27]。因此,本文在對規(guī)劃庫進行匹配的基礎上,結合貝葉斯網絡對目標規(guī)劃進行較為精確的概率識別。
貝葉斯網絡的模型如圖1所示。
圖1中,頂層為整體貝葉斯網絡結構,代表了整個計劃;底層為頂層網絡節(jié)點所對應的替換貝葉斯網絡,表示計劃中的子計劃貝葉斯網絡,該結構可以用三元組表示:HBN= {G,T,R},定義如下。
圖1 貝葉斯網絡Fig.1 Bayesian networks
(1)G為整體貝葉斯網絡結構,即頂層網絡;G= {V,A,P}為有向無環(huán)圖,其結點為V={v1,v2,… ,vm};A為弧的集合,表示節(jié)點之間的關系,P為在結構G上的條件概率集合。
(2)T= {t1,t2,… ,tl}為G中節(jié)點所對應的替換貝葉斯網絡集合,即底層的網絡層。若G中的節(jié)點沒有可對應的貝葉斯網絡,則T為空。
(3)R為頂層貝葉斯網絡節(jié)點與T中貝葉斯網絡間的對應關系,關系R可表示為:R= {Rij|i∈ (1 ,2,… ,m) ;j∈ (1,2,… ,l)},V代表了第i個節(jié)點和集合T中第j個元素的對應關系,且要求i節(jié)點的狀態(tài)值與第j個貝葉斯網絡根節(jié)點相同。
基于貝葉斯網絡的計劃識別的實現(xiàn)主要包括以下三部分內容:
(1)根據(jù)領域知識建立合理的貝葉斯網絡庫;
(2)對傳感器收到的信息做一定處理,得到符合系統(tǒng)語言的事件描述,將內容與貝葉斯網絡庫中的模塊相匹配,找到相似度較高的模塊;
(3)根據(jù)進一步的信息完善,確認匹配的模塊內容,判斷出目標的頂層計劃,并對其概率做出計算。
根據(jù)以上步驟,其具體實施過程如下。
首先,利用戰(zhàn)場先驗知識建立一套合理的貝葉斯網絡庫(見圖1),可表示成
根據(jù)戰(zhàn)場上偵查到的信息,可得到一系列事件,表示成
式中,Ei由三部分構成,一是發(fā)生事件的目標實體;二是目標實體的屬性,如類型、位置等;三是具體產生的行為或事件。
在得到戰(zhàn)場事件后,將Evi中的內容與貝葉斯網絡庫中的網絡模塊進行匹配,對于匹配成功的網絡Bi,將其加入到臨時集合Temp中
由于匹配成功的網絡模塊可能不止一種,因此需要先對臨時集合中的網絡模塊進行比較,將事件Ei中的目標、目標屬性、目標行為等對應到網絡模塊的節(jié)點中,通過節(jié)點間的概率關系,計算頂層任務的概率,選取其中概率值最大的網絡模塊,其根節(jié)點內容作為當前事件識別出的計劃。
匹配成功的Bi可以看作新的事件或證據(jù)加入到事件集合Evi中,作為更高層次任務的子計劃,同時需在Evi中刪除已經與iB匹配的事件。對于當前事件集合Evi,繼續(xù)執(zhí)行上述步驟,匹配貝葉斯網絡庫,找到符合當前子計劃的更高級網絡模塊。
重復上述內容,直至找到屬于 END層的規(guī)劃,即可以作為獨立任務看待的敵方計劃,或當前事件集合Evi中只有匹配到的子計劃而沒有新的事件。
通過以上思考得到了基于模板匹配的二次分群法和基于貝葉斯網絡的規(guī)劃識別方法,在實際態(tài)勢估計系統(tǒng)中,將算法結合,得到如圖2所示的系統(tǒng)流程。
圖2 集成系統(tǒng)流程圖Fig.2 Integrated system flow chart
首先,通過各種傳感器收集戰(zhàn)場信息,如目標數(shù)量、位置信息、運動方式、目標間通信情況等。對這些信息進行一定融合分析處理后,將其分別送入目標分群系統(tǒng)和規(guī)劃識別系統(tǒng)。對于進入分群系統(tǒng)的數(shù)據(jù),先利用最近鄰聚類法對目標進行空間層次的聚類,得到目標群,再利用基于模板匹配的分群算法進行初次分群,初步得到目標群的功能,最后,將得到的分群情況送入二次分群算法,得到準確率更高的功能群的判斷;規(guī)劃識別系統(tǒng)則接收來自一級融合的信息和分群系統(tǒng)的結果,將各種信息實例化,得到符合系統(tǒng)要求的事件表示形式,將事件輸入貝葉斯網絡,通過匹配網絡得到符合事件的規(guī)劃作為系統(tǒng)的輸出,并提供概率值;最后,目標分群系統(tǒng)和規(guī)劃識別系統(tǒng)的結果均被輸入態(tài)勢估計系統(tǒng),進行進一步的戰(zhàn)場態(tài)勢分析。
之后,將分別針對目標分群和規(guī)劃識別算法進行仿真驗證,以了解其實際應用效果,并計算其準確率。
仿真使用 Windows 7操作系統(tǒng),處理器為Intel(R) Core(TM) i5-4210U CPU 1.70GHz,64位操作系統(tǒng)。使用Python進行仿真環(huán)境開發(fā)。
設計場景如下:在我國海域內的空中作戰(zhàn)情景,我方在鄰近海岸的一處軍事基地進行演習,敵方派遣多個飛機群體掠過我方領海,并不斷朝著我方軍事基地移動。針對此種情況,我方借助多種傳感器,獲悉敵方飛行群體的部分屬性,包括其空間位置坐標和飛機類型?;诖?,我方需要判斷敵方目標存在幾組機群,并對其機群類型做出合理推測,即對其進行目標分群。
建立一套符合實際情景的模板庫,如表1所示。
表1 目標分群模板庫Table 1 Target clustering template library
實際仿真場景如圖3所示。
圖3 目標識別算法場景示意圖Fig.3 Schematic diagram of the target recognition algorithm scene
以背景圖中的左上角作為我方軍事基地,其余目標為敵方戰(zhàn)斗單元,通過形狀來區(qū)別飛機類型,以顏色區(qū)分所屬的集群。在目標單元的右側通過顏色標識出經我方分群算法劃分出的集群類型,以方便直觀地觀察算法的準確率。
為了統(tǒng)計算法的準確率,針對單個群體、雙群體及多群體分別進行了組合,并對每一種組合做50次測試,得到統(tǒng)計結果如圖4所示。
圖4 準確率柱狀圖Fig.4 Accuracy histogram
從圖4中可以看出,經過150次實驗后,初次分群的準確率為54%。而經二次分群后,其準確率提升至80.7%。
針對規(guī)劃識別的應用場景設計如下情景:空戰(zhàn)環(huán)境下,我方在某區(qū)域進行軍事演習,設置了
4處軍事基地(在仿真中以隨機形式出現(xiàn)),敵方派出飛機,偵察我方演習情況,并實施干擾。我方通過傳感設備獲悉敵方飛機信息,利用規(guī)劃識別系統(tǒng)對敵方計劃進行甄別,以保護我方基地不受干擾,如圖5所示。
圖5 規(guī)劃識別算法場景示意圖Fig.5 Schematic diagram of the plan recognition algorithm scene
通過觀察敵方飛機的類型及動向,借助貝葉斯網絡計算要塞受攻擊的概率,并選擇守護對應要塞。如戰(zhàn)斗機攻擊了我方正在守護的基地,則戰(zhàn)斗機被損毀。反之,我方基地會被摧毀。在進行了102次實驗后,飛機共墜毀100架,我方軍事基地被摧毀了兩處,整體算法準確率約為98.04%。
本文針對態(tài)勢估計中的目標分群和規(guī)劃識別問題分別提出了算法。所提出的目標分群算法,以模板匹配為核心思想,通過初次分群得到的屬性結合通信代價的考量進行二次分群,提高了分群的準確性。所提出的規(guī)劃識別算法以貝葉斯網絡為基礎,通過戰(zhàn)場事件與網絡庫的匹配,得到敵方任務規(guī)劃及其概率。通過集成兩種算法,將其加入態(tài)勢估計系統(tǒng),輸入一系列來自戰(zhàn)場的一級信息。經算法分析,可以輸出敵方作戰(zhàn)單元的特性、空間層次的分群情況、群體間的相互作用(協(xié)作)關系、敵方戰(zhàn)斗目標及下一步作戰(zhàn)計劃等。利用這些信息,可以更好地判斷當前戰(zhàn)場態(tài)勢,從而有效規(guī)避風險,并對敵方實施精準有效打擊,直至取得勝利。
目前,我們的算法仍有很大改進空間,如在目標分群工作中,可以結合最大最小距離的方式,對聚類結果的劃分做出約束,從而提高分群的準確性。同時,目前的群體類型較少,可以考慮加入跨域協(xié)作的單元集群,如無人機與車輛協(xié)作[28]等。而在規(guī)劃識別工作中,隨著規(guī)劃庫的完備和觀察到事件的增加,貝葉斯網絡會迅速增大,從而極大增加計算的復雜度,如何解決這個問題也是我們未來的研究工作之一。同時,在這次規(guī)劃識別任務中,沒有考慮到任務間的時序邏輯關系[29],之后可以從這個角度出發(fā)對算法進行優(yōu)化。