邵太華 陳洪輝 舒振 呂翔 蔡飛 張維明
1.國(guó)防科技大學(xué)信息系統(tǒng)工程重點(diǎn)實(shí)驗(yàn)室湖南長(zhǎng)沙410073 2.國(guó)防大學(xué)政治學(xué)院上海201703
隨著現(xiàn)代信息技術(shù)的快速發(fā)展和廣泛應(yīng)用, 無(wú)人作戰(zhàn)系統(tǒng)作為顛覆未來(lái)戰(zhàn)爭(zhēng)規(guī)則的軍事高科技新型武器裝備, 能夠極大地提高軍隊(duì)遂行作戰(zhàn)任務(wù)的能力,因此,成為各國(guó)軍事力量博弈的關(guān)鍵領(lǐng)域[1].在現(xiàn)代戰(zhàn)爭(zhēng)中, 無(wú)人作戰(zhàn)系統(tǒng)是奪取信息化戰(zhàn)爭(zhēng)信息優(yōu)勢(shì),完成精確打擊、斬首行動(dòng)等作戰(zhàn)任務(wù)的重要手段之一, 美軍先后在中東戰(zhàn)場(chǎng)上部署了大量的無(wú)人作戰(zhàn)系統(tǒng),并取得了顯著的作戰(zhàn)效益[2].
文獻(xiàn)[3] 提出了無(wú)人作戰(zhàn)系統(tǒng)的定義: 無(wú)人作戰(zhàn)系統(tǒng)是由無(wú)人作戰(zhàn)平臺(tái)、任務(wù)載荷、指揮控制(Command and Control, C2) 系統(tǒng)以及信息網(wǎng)絡(luò)組成的一體化作戰(zhàn)系統(tǒng).無(wú)人作戰(zhàn)系統(tǒng)的特點(diǎn)之一是“平臺(tái)無(wú)人, 但系統(tǒng)涉及人”.有人作戰(zhàn)系統(tǒng)與無(wú)人作戰(zhàn)系統(tǒng)的高度集成,可以大大提高作戰(zhàn)效能[4].其中,指揮控制系統(tǒng)通過(guò)人、機(jī)、環(huán)境三者之間的信息交互來(lái)完成各種類(lèi)人認(rèn)知活動(dòng)的處理,并集成海、陸、空、天和網(wǎng)絡(luò)電磁空間等各個(gè)域的作戰(zhàn)能力[5].因此,為最大限度提升無(wú)人作戰(zhàn)系統(tǒng)的作戰(zhàn)效能, 必須將人與無(wú)人作戰(zhàn)平臺(tái)高度融合, 這將會(huì)給指揮控制系統(tǒng)帶來(lái)新的挑戰(zhàn).
2018年, 美國(guó)國(guó)防部發(fā)布了最新的無(wú)人系統(tǒng)集成路線圖(2017–2042), 以指導(dǎo)學(xué)術(shù)和工業(yè)領(lǐng)域無(wú)人系統(tǒng)技術(shù)的發(fā)展與投資.它指出互操作性是無(wú)人系統(tǒng)的發(fā)展基礎(chǔ), 人機(jī)協(xié)作是無(wú)人系統(tǒng)發(fā)展的最終目標(biāo)[6].只有更好地解析出用戶的任務(wù)指令,無(wú)人系統(tǒng)才能更好地為人類(lèi)服務(wù).面向無(wú)人作戰(zhàn)指揮控制的任務(wù)解析能夠基于戰(zhàn)場(chǎng)態(tài)勢(shì)準(zhǔn)確理解作戰(zhàn)任務(wù), 提取出指揮員下達(dá)的指揮控制指令, 為后續(xù)根據(jù)指揮員的戰(zhàn)術(shù)意圖進(jìn)行戰(zhàn)術(shù)行動(dòng)并取得相應(yīng)的作戰(zhàn)效益奠定基礎(chǔ).其本質(zhì)是模擬指揮員的思維過(guò)程,在指揮員與無(wú)人作戰(zhàn)系統(tǒng)之間建立一種高效的指揮控制模式, 使無(wú)人作戰(zhàn)系統(tǒng)能夠進(jìn)行方便的信息傳輸和認(rèn)知活動(dòng)[7?8].
當(dāng)前對(duì)無(wú)人系統(tǒng)任務(wù)解析的研究大多集中在特定類(lèi)型的無(wú)人系統(tǒng),例如在機(jī)器人領(lǐng)域,經(jīng)典的方法是利用分層任務(wù)分解將高級(jí)任務(wù)分解成一系列可由無(wú)人系統(tǒng)執(zhí)行的低級(jí)子任務(wù), 這類(lèi)方法面臨的主要問(wèn)題是知識(shí)庫(kù)資源不足、通用性較差.此外,利用監(jiān)督學(xué)習(xí)的實(shí)體抽取技術(shù)也被較好地應(yīng)用于任務(wù)解析中.然而, 當(dāng)前基于監(jiān)督學(xué)習(xí)的方法大多是針對(duì)固定、單一的作戰(zhàn)任務(wù)描述文本進(jìn)行解析,雖然能根據(jù)任務(wù)描述對(duì)關(guān)鍵要素進(jìn)行提取, 但卻忽視在實(shí)際應(yīng)用中戰(zhàn)場(chǎng)態(tài)勢(shì)對(duì)任務(wù)解析效果的實(shí)時(shí)影響[9].
綜上所述, 對(duì)無(wú)人作戰(zhàn)系統(tǒng)的任務(wù)解析技術(shù)的研究具有極其重要的戰(zhàn)略意義.本文為實(shí)現(xiàn)無(wú)人作戰(zhàn)系統(tǒng)由“手工作業(yè),系統(tǒng)輔助”向“人機(jī)結(jié)合,智能驅(qū)動(dòng)”轉(zhuǎn)變的需求,介紹了任務(wù)解析的基本概念和框架, 對(duì)現(xiàn)有的無(wú)人系統(tǒng)任務(wù)解析方法進(jìn)行了分析和總結(jié), 創(chuàng)新性地提出了基于多跳閱讀理解的任務(wù)智能解析算法, 旨在根據(jù)不同戰(zhàn)場(chǎng)態(tài)勢(shì)和指揮員作戰(zhàn)意圖智能解析任務(wù)描述文本中的關(guān)鍵指令, 為無(wú)人作戰(zhàn)系統(tǒng)智能化指揮控制提供技術(shù)支撐.
任務(wù)解析的概念在多個(gè)領(lǐng)域均有涉及, 為區(qū)別于其他任務(wù)解析, 本文主要討論無(wú)人系統(tǒng)中任務(wù)解析的概念.雖然在現(xiàn)有的無(wú)人作戰(zhàn)系統(tǒng)的研究中沒(méi)有任務(wù)解析的通用定義, 但在無(wú)人系統(tǒng)的民用領(lǐng)域可以找到相關(guān)的表述.文獻(xiàn)[10–11]將面向服務(wù)型機(jī)器人的任務(wù)解析定義為:在人機(jī)交互模式下,自然語(yǔ)言層面的交互往往是受限制的, 而用戶希望機(jī)器人完成的任務(wù)是明確的.因此,需要通過(guò)任務(wù)解析將用戶用自然語(yǔ)言表達(dá)的任務(wù)映射到機(jī)器人可以執(zhí)行的是原子動(dòng)作序列.以上定義雖然針對(duì)的是一種特殊的無(wú)人系統(tǒng)–服務(wù)型機(jī)器人,但同時(shí)也可以遷移到無(wú)人作戰(zhàn)系統(tǒng)中.
文獻(xiàn)[12] 認(rèn)為, 無(wú)人作戰(zhàn)系統(tǒng)的任務(wù)解析是用戶可以通過(guò)人機(jī)交互(其中信息可以通過(guò)自然語(yǔ)言、人機(jī)界面等傳遞)將任務(wù)分配給無(wú)人作戰(zhàn)系統(tǒng).而其中任務(wù)指令通常表達(dá)不充分,任務(wù)目標(biāo)不明確(如無(wú)人系統(tǒng)的操作對(duì)象未指定等),無(wú)人作戰(zhàn)系統(tǒng)通過(guò)對(duì)環(huán)境和情況的感知(即戰(zhàn)場(chǎng)態(tài)勢(shì))以及對(duì)作戰(zhàn)任務(wù)的分析,將作戰(zhàn)任務(wù)關(guān)鍵要素提取,解析出與指揮員意圖一致的作戰(zhàn)指令, 為無(wú)人作戰(zhàn)系統(tǒng)后續(xù)的任務(wù)規(guī)劃和高效準(zhǔn)確地完成指揮員分配的任務(wù)奠定基礎(chǔ).
本文認(rèn)為, 無(wú)人作戰(zhàn)任務(wù)解析的目的是幫助指揮員提取到任務(wù)中的關(guān)鍵指令要素并進(jìn)行標(biāo)注.任務(wù)智能解析是在以大數(shù)據(jù)和人工智能為核心的智能化無(wú)人作戰(zhàn)趨勢(shì)下, 在作戰(zhàn)任務(wù)復(fù)雜、戰(zhàn)場(chǎng)態(tài)勢(shì)多變、聯(lián)合作戰(zhàn)對(duì)象眾多的新時(shí)代作戰(zhàn)環(huán)境中,基于當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)及指揮員作戰(zhàn)意圖決心, 實(shí)現(xiàn)對(duì)作戰(zhàn)任務(wù)的關(guān)鍵指令提取, 如: 任務(wù)目標(biāo)、攻擊時(shí)間、敵方兵力部署、敵方目標(biāo)威脅排序、打擊次序等.
無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析框架如圖1 所示.在實(shí)戰(zhàn)過(guò)程中, 指揮員根據(jù)自己的軍事知識(shí)和作戰(zhàn)經(jīng)驗(yàn),綜合考慮戰(zhàn)場(chǎng)態(tài)勢(shì)、無(wú)人作戰(zhàn)系統(tǒng)的狀態(tài)等信息,制定相應(yīng)的指揮控制戰(zhàn)術(shù)和作戰(zhàn)計(jì)劃, 并向無(wú)人作戰(zhàn)系統(tǒng)下達(dá)相應(yīng)的作戰(zhàn)任務(wù)命令, 這些命令大多以人類(lèi)指揮員可以理解的自然語(yǔ)言命令出現(xiàn).因此,無(wú)人作戰(zhàn)系統(tǒng)收到指揮員下達(dá)的指揮控制命令時(shí), 自動(dòng)觸發(fā)自身的任務(wù)解析功能.通過(guò)相應(yīng)的任務(wù)解析算法,綜合考慮戰(zhàn)場(chǎng)態(tài)勢(shì)、自身狀態(tài)等信息,解析出作戰(zhàn)任務(wù)中的關(guān)鍵指令.指令傳遞至無(wú)人作戰(zhàn)平臺(tái),進(jìn)而根據(jù)指揮員意圖進(jìn)行火力打擊等戰(zhàn)術(shù)行動(dòng).
圖1 無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析框架Fig.1 Mission parsing framework of unmanned combat systems
無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析模塊的輸入包括: 作戰(zhàn)任務(wù)命令、命令和控制代碼;戰(zhàn)場(chǎng)態(tài)勢(shì)信息包括: 雙方的優(yōu)勢(shì)和劣勢(shì),雙方的兵力部署等;戰(zhàn)場(chǎng)環(huán)境信息包括: 戰(zhàn)場(chǎng)地形、戰(zhàn)場(chǎng)天氣等;無(wú)人作戰(zhàn)系統(tǒng)狀態(tài)信息包括: 運(yùn)動(dòng)信息、損傷信息、火力分配信息等.作戰(zhàn)任務(wù)在不同的戰(zhàn)場(chǎng)態(tài)勢(shì)下會(huì)有不同的指揮策略,戰(zhàn)場(chǎng)上任何因素都將對(duì)指揮員的決策造成影響.例如,在典型的聯(lián)合作戰(zhàn)火力打擊場(chǎng)景下,指揮控制系統(tǒng)需要感知的戰(zhàn)場(chǎng)態(tài)勢(shì)信息包括實(shí)時(shí)作戰(zhàn)目標(biāo)、兵力部署、戰(zhàn)場(chǎng)設(shè)施等, 并在空間上覆蓋陸情、海情、空情等多個(gè)維度,數(shù)據(jù)種類(lèi)繁多,不同種類(lèi)數(shù)據(jù)在內(nèi)容上差別較大.其關(guān)鍵要素如圖2 所示.
圖2 戰(zhàn)場(chǎng)態(tài)勢(shì)關(guān)鍵要素Fig.2 Key elements of battlefiel situations
指揮員下達(dá)的典型作戰(zhàn)任務(wù)可能涉及多種類(lèi)型,包括戰(zhàn)略威懾、目標(biāo)搜索、戰(zhàn)術(shù)偵察、火力打擊、損傷評(píng)估等, 而每一類(lèi)作戰(zhàn)任務(wù)中又涉及多種指令要素, 明確理解這些指令要素是無(wú)人系統(tǒng)進(jìn)行戰(zhàn)術(shù)行動(dòng)的前提.以面向聯(lián)合作戰(zhàn)火力打擊的指揮控制系統(tǒng)為例,其作戰(zhàn)任務(wù)涉及關(guān)鍵要素如圖3 所示.
圖3 作戰(zhàn)任務(wù)關(guān)鍵要素Fig.3 Key elements of combat missions
當(dāng)前學(xué)術(shù)界對(duì)無(wú)人系統(tǒng)任務(wù)解析的研究大多集中在特定類(lèi)型的無(wú)人系統(tǒng),它們?cè)谕ㄓ眯浴⒔换シ绞胶途唧w內(nèi)涵上, 都與本文研究的任務(wù)解析有所不同.特定類(lèi)型無(wú)人系統(tǒng)的任務(wù)解析通常在用戶明確具體的任務(wù)需求下, 將用戶指令映射成可執(zhí)行的動(dòng)作序列,進(jìn)而完成特定的動(dòng)作規(guī)劃[11,13].本文定義的任務(wù)解析則通?;诋?dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)以及指揮員作戰(zhàn)意圖,實(shí)現(xiàn)對(duì)作戰(zhàn)任務(wù)的關(guān)鍵指令提取.但對(duì)特定類(lèi)型無(wú)人系統(tǒng)任務(wù)解析的研究對(duì)于本文的研究也具有一定的參考價(jià)值.下面,將概述當(dāng)前主要的任務(wù)解析方法.
無(wú)人系統(tǒng)的任務(wù)解析和規(guī)劃目前集中在機(jī)器人領(lǐng)域[14?15].經(jīng)典的方法是利用分層任務(wù)分解將高級(jí)任務(wù)分解成一系列可由無(wú)人系統(tǒng)執(zhí)行的低級(jí)子任務(wù).分解過(guò)程通?;谙嚓P(guān)領(lǐng)域預(yù)定義的知識(shí)[10], 這些知識(shí)可以來(lái)自開(kāi)放的知識(shí)庫(kù)[16], 也可以基于特定場(chǎng)景的手寫(xiě)任務(wù)分解知識(shí)[15].這些基于任務(wù)分解的方法面臨的主要問(wèn)題是知識(shí)庫(kù)資源不足、通用性較差.此外, 利用監(jiān)督學(xué)習(xí)的實(shí)體抽取技術(shù)也被較好地應(yīng)用于任務(wù)解析中.例如,文獻(xiàn)[13]提出了一種將自然語(yǔ)言導(dǎo)航指令轉(zhuǎn)換成可執(zhí)行動(dòng)作規(guī)劃的方法.早期的監(jiān)督學(xué)習(xí)方法基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)等典型神經(jīng)網(wǎng)絡(luò)在實(shí)體抽取任務(wù)上取得了較好效果.近些年, 相關(guān)研究開(kāi)始使用注意力機(jī)制來(lái)提高模型效果.最后,還有文獻(xiàn)提出利用無(wú)監(jiān)督學(xué)習(xí)來(lái)實(shí)現(xiàn)任務(wù)解析.例如,文獻(xiàn)[11]提出了一種將自然語(yǔ)言指令映射成一系列可執(zhí)行動(dòng)作的強(qiáng)化學(xué)習(xí)方法.在模型學(xué)習(xí)過(guò)程中, 通過(guò)不斷觀察不同動(dòng)作執(zhí)行時(shí)激勵(lì)函數(shù)的變化,選擇合適的動(dòng)作,完成用戶自然語(yǔ)言指令到動(dòng)作序列的映射,從而實(shí)現(xiàn)對(duì)任務(wù)的解析和規(guī)劃.
然而,以上方法大多是針對(duì)固定、單一的作戰(zhàn)任務(wù)描述文本進(jìn)行解析, 雖然能根據(jù)任務(wù)描述對(duì)關(guān)鍵要素進(jìn)行提取, 但卻忽視在實(shí)際應(yīng)用中戰(zhàn)場(chǎng)態(tài)勢(shì)對(duì)任務(wù)解析效果的實(shí)時(shí)影響.例如:在執(zhí)行同樣的針對(duì)某目標(biāo)的聯(lián)合打擊任務(wù)時(shí), 如果與目標(biāo)利益相關(guān)組織的兵力出現(xiàn)異常調(diào)動(dòng), 那么該戰(zhàn)場(chǎng)態(tài)勢(shì)的改變將對(duì)戰(zhàn)局造成影響.另外, 部分作戰(zhàn)任務(wù)要素, 如敵兵力部署、敵威脅單位、可調(diào)動(dòng)兵力等以及無(wú)人作戰(zhàn)系統(tǒng)狀態(tài)都將實(shí)時(shí)變化.因此,在進(jìn)行作戰(zhàn)任務(wù)解析時(shí),就需要綜合考慮戰(zhàn)場(chǎng)態(tài)勢(shì)等信息的實(shí)時(shí)變化.而現(xiàn)有的作戰(zhàn)任務(wù)智能解析技術(shù)并不能滿足未來(lái)無(wú)人作戰(zhàn)系統(tǒng)智能化指揮控制實(shí)時(shí)追蹤戰(zhàn)場(chǎng)態(tài)勢(shì)的需求.基于以上考慮,本文提出以下基于多跳閱讀理解[17]的任務(wù)智能解析方法, 以根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)進(jìn)行實(shí)時(shí)的任務(wù)指令推理解析.
深度學(xué)習(xí)是一種強(qiáng)大的多層特征學(xué)習(xí)方法, 能夠從海量數(shù)據(jù)中學(xué)習(xí)規(guī)則.使用深度學(xué)習(xí)作為無(wú)人作戰(zhàn)系統(tǒng)的任務(wù)解析方法, 需要大量的戰(zhàn)場(chǎng)數(shù)據(jù)作為支撐, 從而訓(xùn)練出一個(gè)模擬指揮員大腦思維的模型, 保證系統(tǒng)能夠輸出與指揮員大腦思維模型相似的任務(wù)解析結(jié)果.一般的學(xué)習(xí)過(guò)程描述如下: 海量標(biāo)注樣本用于訓(xùn)練任務(wù)解析模型.將戰(zhàn)場(chǎng)數(shù)據(jù)中的具體戰(zhàn)斗場(chǎng)景,包括戰(zhàn)場(chǎng)態(tài)勢(shì)信息、戰(zhàn)場(chǎng)環(huán)境信息和無(wú)人作戰(zhàn)系統(tǒng)自身的狀態(tài)信息, 以及指揮員從戰(zhàn)斗場(chǎng)景中下達(dá)的作戰(zhàn)任務(wù)和自己的軍事知識(shí), 作為樣本的輸入.指揮員在該任務(wù)下的關(guān)鍵指令作為樣本的輸出.在實(shí)際作戰(zhàn)過(guò)程中,將訓(xùn)練好的模型作為無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析的核心模塊.該框架能夠處理實(shí)時(shí)、復(fù)雜的戰(zhàn)場(chǎng)信息,具有良好的通用性.
綜合利用多種深度學(xué)習(xí)技術(shù), 提出基于多跳閱讀理解的任務(wù)智能解析算法, 從作戰(zhàn)任務(wù)和戰(zhàn)場(chǎng)態(tài)勢(shì)描述文本中提取關(guān)鍵指令, 發(fā)揮戰(zhàn)場(chǎng)態(tài)勢(shì)信息對(duì)任務(wù)解析的實(shí)時(shí)調(diào)控作用.
在傳統(tǒng)的多跳閱讀理解任務(wù)中, 輸入通常是一個(gè)用戶問(wèn)題q和一組支持文檔集Ω.問(wèn)題q以三元組(el,r,e?) 的形式給出, 其中,el是左實(shí)體,r表示左實(shí)體el與未知右實(shí)體e?(即正確答案) 之間的關(guān)系.此外,以左實(shí)體el所在語(yǔ)句為中心,抽取前后k個(gè)語(yǔ)句中所有單詞作為候選答案集C= {c1,c2,··· ,cZ}, 其中Z為候選答案數(shù).多跳閱讀理解的目標(biāo)是從C中預(yù)測(cè)未知的右實(shí)體e?.
類(lèi)似地,在任務(wù)智能解析任務(wù)中,將作戰(zhàn)態(tài)勢(shì)信息以及作戰(zhàn)任務(wù)文本作為支持文檔集Ω, 將作戰(zhàn)任務(wù)關(guān)鍵指令提取(任務(wù)目標(biāo)、任務(wù)地點(diǎn)、任務(wù)時(shí)間等)轉(zhuǎn)換為一個(gè)個(gè)簡(jiǎn)單問(wèn)答,例如:在對(duì)作戰(zhàn)任務(wù)中的關(guān)鍵要素“攻擊目標(biāo)”進(jìn)行提取時(shí),模型將從預(yù)設(shè)問(wèn)題庫(kù)中選擇問(wèn)題q:“攻擊目標(biāo)包含什么?”.進(jìn)而返回實(shí)體形式的答案,即任務(wù)關(guān)鍵要素,如:“A 島、CVN-73核動(dòng)力航母”.根據(jù)以上分析, 本文提出的基于多跳閱讀理解的任務(wù)智能解析模型結(jié)構(gòu)如圖4 所示.該模型首先進(jìn)行文本表示, 然后進(jìn)行語(yǔ)義推理以構(gòu)建多跳鏈, 最后通過(guò)挖掘多跳鏈信息排序確定針對(duì)當(dāng)前預(yù)設(shè)問(wèn)題的關(guān)鍵指令要素.
圖4 基于多跳閱讀理解的任務(wù)智能解析模型結(jié)構(gòu)Fig.4 Structure of mission intelligent parsing model based on multi-hop reading comprehension
3.1.1 文本表示
介紹文本預(yù)處理和詞嵌入過(guò)程.詞嵌入的目的是將自然語(yǔ)言形式的問(wèn)題q和支持文檔集Ω 表征為神經(jīng)網(wǎng)絡(luò)能處理的數(shù)字向量.首先使用BM25 算法來(lái)計(jì)算問(wèn)題和每個(gè)戰(zhàn)場(chǎng)態(tài)勢(shì)文檔之間的余弦相似度并對(duì)其進(jìn)行排序,以初步篩選支持文檔,以減少計(jì)算資源的消耗.然后,截取前N個(gè)支持文檔以獲得新的支持文檔集T={t1,t2,··· ,tN}.對(duì)el,r和T應(yīng)用相同的詞嵌入和上下文編碼.
在詞嵌入過(guò)程, 使用動(dòng)態(tài)詞向量BERT[18]作為詞表示語(yǔ)言模型來(lái)獲得初始詞向量矩陣elw,rw和Tw,分別對(duì)應(yīng)el,r和T的詞嵌入.
在上下文編碼過(guò)程, 通過(guò)雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)來(lái)處理初始詞表示elw,rw和Tw, 得到elg∈RQel×Nc,rg∈RQr×Nc,Tg∈RN×QT×Nc分別對(duì)應(yīng)el,r和T的上下文表示.其中,Qel,Qr,QT分別為el,r和T中的詞數(shù)量,Nc是雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)中隱藏單元的個(gè)數(shù).由于每個(gè)候選右實(shí)體都存在于T中,將候選要素c在Tg中對(duì)應(yīng)的詞向量矩陣進(jìn)行平均池化操作以獲得c的上下文表示cs,其中cs∈RNc.
在句子編碼過(guò)程, 將支持文檔分為單個(gè)句子和級(jí)聯(lián)句子,由于問(wèn)題和要素均有短語(yǔ)組成,所以不需要進(jìn)行句子編碼.將支持文檔集T中的某一文檔t按句子切分,獲得單個(gè)句子集S= {s1,s2,··· ,sM},其中,si∈RQsi×Nc,M是t中句子的數(shù)量,Qsi是句子si中單詞的數(shù)量,si j是在Tg中對(duì)應(yīng)的詞向量.然后,將文檔中所有兩個(gè)相鄰的句子級(jí)聯(lián)起來(lái), 以獲得級(jí)聯(lián)句子集定義如下:
其中, ⊕表示級(jí)聯(lián)操作.下面, 聯(lián)合S和以完成對(duì)文檔t的句子劃分,并獲得句子集D:
其中,∪指取并集.對(duì)所有支持文檔采用相同的操作,獲得支持文檔集T的上下文表示矩陣Dall:
其中,K是支持文檔集T中的單個(gè)句子和級(jí)聯(lián)句子的總數(shù).采用自注意力機(jī)制來(lái)根據(jù)句子之間的關(guān)系進(jìn)行語(yǔ)義特征的建模,并獲得T的句子表示矩陣X.
3.1.2 句子選擇器
采用分層記憶神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建句子間的推理鏈.設(shè)計(jì)的句子選擇器包含兩個(gè)階段: 選擇節(jié)點(diǎn)和建立跳邊.在選擇節(jié)點(diǎn)階段,模型抽取與網(wǎng)絡(luò)記憶狀態(tài)mmm最相關(guān)的句子作為當(dāng)前跳步的起始節(jié)點(diǎn).在建立跳邊階段,模型更新mmm以準(zhǔn)備跳到下一個(gè)節(jié)點(diǎn),可以看作生成一個(gè)連接相鄰節(jié)點(diǎn)的邊.
以左實(shí)體el作為推理鏈的起始節(jié)點(diǎn),因此,模型中mmm將采用el的上下文表示elg的最后一個(gè)隱向量作為初始化節(jié)點(diǎn)向量, 并采用門(mén)控循環(huán)單元對(duì)其進(jìn)行更新.
1)選擇節(jié)點(diǎn)
在每一跳步h,模型會(huì)計(jì)算X中每個(gè)句子表示xxxi和當(dāng)前記憶狀態(tài)mmmh的雙線性相似度,并獲得節(jié)點(diǎn)選擇概率pi,公式如下:
其中,Wp是可訓(xùn)練的網(wǎng)絡(luò)參數(shù).分布概率選擇最大的句子dk∈Dall作為當(dāng)前跳步的起始節(jié)點(diǎn), 其中,k滿足:
2)建立跳邊
在選擇了跳步h的起始節(jié)點(diǎn)后,模型將計(jì)算mmmh和dddk中每個(gè)單詞編碼dk j的雙線性相似度并將其歸一化以獲得權(quán)重wj,即:
其中,Wm是可訓(xùn)練的網(wǎng)絡(luò)參數(shù).接下來(lái)通過(guò)wj來(lái)計(jì)算dk中所有詞向量的加權(quán)平均值,將其輸入到門(mén)控循環(huán)單元中以更新mmmh如下:
之后,將上述兩個(gè)階段合并為一個(gè)循環(huán)C,C可以通過(guò)更新mmm來(lái)連續(xù)選擇節(jié)點(diǎn):
將C循環(huán)H次,可以獲得一條H個(gè)節(jié)點(diǎn)的推理鏈dchain= {d1,d2,··· ,dH}, 其中每個(gè)句子dh都由C從Dall中迭代選擇.為了降低推理鏈的誤差,重復(fù)句子選擇器以生成多條推理鏈.
3.1.3 要素預(yù)測(cè)器
模型主要根據(jù)句子選擇器中獲得H跳推理鏈預(yù)測(cè)每個(gè)候選要素是正確選項(xiàng)的概率.由于每條鏈都只是實(shí)體到實(shí)體的推理路徑, 并不能滿足左實(shí)體與右實(shí)體之間的關(guān)系.因此,模型還將引入任務(wù)問(wèn)題作為輔助,以選擇滿足問(wèn)題要求的關(guān)鍵要素.答案預(yù)測(cè)器由兩部分組成: 推理鏈信息的集成和候選答案概率分布的計(jì)算.
1)推理鏈信息集成
預(yù)測(cè)要素存在于推理鏈的最后一跳dH中,因此計(jì)算dH中每個(gè)單詞和推理鏈的前H?1 跳以及問(wèn)題q之間的注意力μ.橫向拼接推理鏈dchain的前H?1個(gè)節(jié)點(diǎn)以獲得dbf,即:
采用帶有注意力機(jī)制的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)來(lái)計(jì)算第t步的隱藏向量χt,它集成了dH前t?1 個(gè)詞和dbf的信息,公式如下:
其中,vvvt是LSTM 第t步的隱藏狀態(tài).考慮問(wèn)題q的影響,計(jì)算左實(shí)體、關(guān)系與χt的相似度:
其中, ?代表逐元素相乘.將整合了dchain信息和問(wèn)題信息的λ 用于計(jì)算注意力, 得到經(jīng)過(guò)注意力加權(quán)的dH表示yyy,其中,yyy∈RNc,公式如下:
3) 概率分布計(jì)算至此, 獲取了集成推理鏈和問(wèn)題信息的候選要素向量y.通過(guò)y可以計(jì)算候選要素ci是正確答案的概率Pi,即:
計(jì)算所有推理鏈下的概率P,并獲得候選要素概率分布集其中,R為重復(fù)推理鏈條數(shù).匯總所有推理鏈的結(jié)果,可以得到候選ci的最終分?jǐn)?shù)為:
將作戰(zhàn)任務(wù)關(guān)鍵指令要素提取(任務(wù)目標(biāo)、任務(wù)地點(diǎn)、任務(wù)時(shí)間等)轉(zhuǎn)換為一系列簡(jiǎn)單問(wèn)答,根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)信息和作戰(zhàn)任務(wù)數(shù)據(jù)構(gòu)建一個(gè)龐大的基于作戰(zhàn)任務(wù)關(guān)鍵要素問(wèn)答的多跳機(jī)器閱讀理解數(shù)據(jù)集.每個(gè)樣本平均包含多個(gè)支持文檔, 文檔由戰(zhàn)場(chǎng)態(tài)勢(shì)信息和作戰(zhàn)任務(wù)數(shù)據(jù)信息構(gòu)成.任務(wù)問(wèn)題包含一個(gè)已知實(shí)體和一個(gè)關(guān)系,例如:(任務(wù)目標(biāo),位于,?).在實(shí)戰(zhàn)中, 可以在構(gòu)建的作戰(zhàn)態(tài)勢(shì)信息文本庫(kù)和作戰(zhàn)任務(wù)數(shù)據(jù)集訓(xùn)練并評(píng)估提出的模型.
除了在無(wú)人作戰(zhàn)任務(wù)的數(shù)據(jù)集上檢驗(yàn)?zāi)P偷恼w效果,還可以在通用數(shù)據(jù)集上進(jìn)行模型調(diào)試,以保證模型具有更好的泛化性能并在各種特殊情況下模型均具有優(yōu)異性能.
1) 準(zhǔn)確率, 該指標(biāo)衡量智能解析技術(shù)對(duì)任務(wù)關(guān)鍵指令的提取結(jié)果與專(zhuān)家標(biāo)注結(jié)果一致的比例.
2) 召回率, 該指標(biāo)衡量提取結(jié)果中正確關(guān)鍵指令標(biāo)注與實(shí)際標(biāo)注關(guān)鍵指令總數(shù)的比值.
3)F1 值,指準(zhǔn)確率和召回率的調(diào)和平均數(shù).
為展示本文算法的可行性和優(yōu)越性, 設(shè)計(jì)了一個(gè)應(yīng)用案例對(duì)本文提出的任務(wù)智能解析模型應(yīng)用情況進(jìn)行說(shuō)明.
以某海域突遭R 軍艦船非法駛?cè)霝橄攵ū尘?作戰(zhàn)參謀接收到來(lái)自聯(lián)合指揮部的作戰(zhàn)任務(wù)如下:
{[任務(wù)目標(biāo), 位于,A 坐標(biāo)]; [命你方, 派出,無(wú)人偵察機(jī)];[出動(dòng)時(shí)間,為,B 時(shí)刻];[返回時(shí)間,為,C 時(shí)刻];[作戰(zhàn)效果,為,喊話驅(qū)離]}
在接收到作戰(zhàn)任務(wù)之后, 依據(jù)當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)信息,如天氣情況、武器裝備狀態(tài)等, 由作戰(zhàn)人員和在通用數(shù)據(jù)集上訓(xùn)練得到的任務(wù)解析模型同時(shí)進(jìn)行任務(wù)指令的解析, 并根據(jù)解析出的指令對(duì)無(wú)人作戰(zhàn)系統(tǒng)進(jìn)行相應(yīng)操作.在實(shí)際應(yīng)用過(guò)程中,人工解析時(shí)長(zhǎng)為分鐘級(jí), 而由我們提出的任務(wù)智能解析模型的解析時(shí)長(zhǎng)為毫秒級(jí), 極大地縮短了作戰(zhàn)任務(wù)解析的時(shí)間.由于實(shí)際無(wú)人作戰(zhàn)大數(shù)據(jù)的缺失,模型的準(zhǔn)確率尚無(wú)法達(dá)到人工水平, 還需進(jìn)一步通過(guò)實(shí)際作戰(zhàn)過(guò)程中收集或者人工標(biāo)注的海量數(shù)據(jù)進(jìn)行訓(xùn)練提升.
無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析是推斷人類(lèi)意圖、實(shí)現(xiàn)無(wú)障礙人機(jī)交互的重要環(huán)節(jié), 是提高無(wú)人作戰(zhàn)系統(tǒng)智能化指揮控制水平的必要前提, 可以極大提高有人/無(wú)人系統(tǒng)協(xié)同作戰(zhàn)的智能化指揮控制水平, 并逐漸成為無(wú)人作戰(zhàn)系統(tǒng)領(lǐng)域研究的重點(diǎn).本文通過(guò)對(duì)當(dāng)前任務(wù)解析技術(shù)的分析, 構(gòu)建了無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析框架, 并提出了基于多跳閱讀理解的任務(wù)解析模型, 對(duì)無(wú)人作戰(zhàn)系統(tǒng)任務(wù)解析的研究具有一定的參考意義.隨著無(wú)人作戰(zhàn)系統(tǒng)技術(shù)的進(jìn)一步發(fā)展,任務(wù)解析技術(shù)也將取得突破, 并為無(wú)人作戰(zhàn)系統(tǒng)提供強(qiáng)有力的技術(shù)支撐.