路 威 趙麗君
1陸軍工程大學(xué)通信工程學(xué)院,江蘇 南京,210001
2 32142部隊(duì),河北 保定,071000
兵要是指作戰(zhàn)中利用戰(zhàn)場(chǎng)環(huán)境或地理環(huán)境的“要點(diǎn)”[1]。兵要信息(military topology information)是記錄和描述戰(zhàn)場(chǎng)環(huán)境中客觀存在的,與軍事活動(dòng)緊密相關(guān)的自然地理、人文地理和基礎(chǔ)設(shè)施等要素實(shí)體,并分析評(píng)價(jià)其對(duì)軍事行動(dòng)影響的一種地理環(huán)境研究成果[2,3]。
兵要信息是對(duì)傳統(tǒng)兵要地志的拓展和延續(xù),其不是單純的地理志書,而更強(qiáng)調(diào)實(shí)體和待評(píng)價(jià)內(nèi)容的數(shù)字化、標(biāo)準(zhǔn)化和信息化,并采用信息論、數(shù)據(jù)結(jié)構(gòu)、大數(shù)據(jù)、人工智能等先進(jìn)的數(shù)據(jù)管理與信息挖掘手段,智能化分析實(shí)體在地理空間中的時(shí)空分布、邏輯關(guān)聯(lián)和作戰(zhàn)影響,進(jìn)而給出輔助決策依據(jù)。兵要信息也區(qū)別于地理空間信息(傳統(tǒng)地圖的拓展),兵要信息更強(qiáng)調(diào)各要素實(shí)體的綜合聯(lián)系和對(duì)軍事行動(dòng)的影響,它的產(chǎn)生是在地理空間信息的基礎(chǔ)上進(jìn)行數(shù)據(jù)挖掘、要素度量、環(huán)境分析和行動(dòng)決策,進(jìn)而形成與軍事行動(dòng)相關(guān)聯(lián)的地理環(huán)境研究成果。因此,地理空間信息是兵要信息的基礎(chǔ)信息資源,而兵要信息是綜合分析地理信息和軍事行動(dòng)后產(chǎn)生的一種評(píng)價(jià)成果。
不論是兵要地志、地理空間信息,還是兵要信息,都是對(duì)地理環(huán)境系統(tǒng)的記錄和描述,雖然兵要信息的產(chǎn)生運(yùn)用了知識(shí)綜合、抽象和概括的過程,但其在形式上仍然是地理要素對(duì)軍事行動(dòng)影響的一種客觀評(píng)價(jià),而非抽象和綜合的兵要知識(shí)表達(dá)。如果要將人工智能、大數(shù)據(jù)等技術(shù)引入到兵要信息生產(chǎn)和分析領(lǐng)域,則需要構(gòu)建兵要知識(shí)圖譜。
本文旨在以知識(shí)圖譜的概念和理論為基礎(chǔ),根據(jù)兵要信息的要求和特點(diǎn),提出兵要知識(shí)圖譜(military topology knowledge graph,MTKG)的構(gòu)建方法,目的是構(gòu)建融合語義關(guān)系和時(shí)空關(guān)系的兵要信息智能引擎,服務(wù)兵要信息智能分析,最終為智能化的兵要信息系統(tǒng)建設(shè)提供技術(shù)支撐。本文首先討論了兵要知識(shí)圖譜的內(nèi)涵與特點(diǎn);然后分析了兵要知識(shí)圖譜的構(gòu)建方法和關(guān)鍵技術(shù);最后闡述了兵要知識(shí)圖譜的應(yīng)用領(lǐng)域與方向。
知識(shí)圖譜[4]是人工智能領(lǐng)域的一個(gè)重要分支,其來源于智能化的圖書情報(bào)和信息處理技術(shù),最初的研究是為了解決圖書情報(bào)(主要是文本類)的邏輯關(guān)聯(lián)分析和可視化問題,即將圖書文獻(xiàn)中隱含的信息,通過特征提取、模式識(shí)別、信息關(guān)聯(lián)、信息處理與分析和可視化等手段顯示出來,為研究者確定自己的研究領(lǐng)域在科學(xué)研究中所處的位置[5]。知識(shí)圖譜本質(zhì)上是具備有向結(jié)構(gòu)圖的網(wǎng)狀知識(shí)庫(kù),其中的節(jié)點(diǎn)代表實(shí)體或者概念,是由具有各種屬性的實(shí)體通過信息關(guān)聯(lián)組合而成,而圖的邊代表實(shí)體與概念之間的各種語義關(guān)系。
近年來,人工智能的熱潮帶動(dòng)了知識(shí)圖譜研究的迅猛發(fā)展,并被應(yīng)用于不同的學(xué)科領(lǐng)域,學(xué)者們依據(jù)本領(lǐng)域的特點(diǎn)分別提出了不同類型的知識(shí)圖譜,其中與兵要知識(shí)圖譜較為相近的概念是基于地理信息的地理知識(shí)圖譜[6]和基于軍事情報(bào)的軍事知識(shí)圖譜[7],這兩種知識(shí)圖譜都針對(duì)文本類信息,采用網(wǎng)絡(luò)結(jié)構(gòu)圖的概念,通過圖形方式表達(dá)知識(shí),即將知識(shí)圖譜作為開放語義網(wǎng)的子集,通過實(shí)體抽取、邏輯關(guān)系抽取和圖譜存儲(chǔ)等實(shí)現(xiàn)圖譜構(gòu)建。兵要信息與地理信息和軍事情報(bào)有所不同,兵要信息以地理空間信息為基礎(chǔ),融合影像、視頻、地圖數(shù)據(jù)、地理數(shù)據(jù)和軍事情報(bào)等多元信息,通過圖像解譯、圖形分析、情報(bào)挖掘等技術(shù)提取要素實(shí)體及其關(guān)聯(lián),并用多維數(shù)據(jù)動(dòng)態(tài)可視化技術(shù)展現(xiàn)作戰(zhàn)環(huán)境中各要素的形態(tài)結(jié)構(gòu)與空時(shí)變化規(guī)律。因此,在數(shù)據(jù)類型上,兵要信息已經(jīng)超出了地理信息和情報(bào)信息表達(dá)的范圍,兵要知識(shí)圖譜也不是前兩種知識(shí)圖譜的簡(jiǎn)單概念搬移。
兵要知識(shí)圖譜首先是對(duì)兵要知識(shí)的圖形化表達(dá)方式,在這一點(diǎn)上,兵要知識(shí)圖譜類似于地理知識(shí)圖譜和軍事知識(shí)圖譜;但兵要知識(shí)圖譜不僅是一種圖形表達(dá)方式,它還是一種可定量分析和挖掘知識(shí)的網(wǎng)絡(luò)結(jié)構(gòu),可依據(jù)實(shí)體間的關(guān)聯(lián)和邏輯計(jì)算分析環(huán)境對(duì)軍事行動(dòng)的影響,并進(jìn)一步挖掘輔助決策信息;此外,兵要知識(shí)圖譜還是一種時(shí)空分析方法,具備對(duì)地圖或地理空間信息的時(shí)空分布表現(xiàn)能力,并通過建立時(shí)空模型定性和定量地認(rèn)識(shí)地理現(xiàn)象在戰(zhàn)場(chǎng)環(huán)境中的分布和對(duì)軍事行動(dòng)的影響。
如圖1所示,兵要知識(shí)圖譜的核心是建立與地理空間信息時(shí)空關(guān)聯(lián)的知識(shí)圖形表達(dá),將兵要實(shí)體以及它們之間的聯(lián)系以地理坐標(biāo)和時(shí)間坐標(biāo)之外的另一種空間圖形分布表現(xiàn)在圖上,并在此基礎(chǔ)上形成兵要信息網(wǎng)狀知識(shí)庫(kù),然后通過有向結(jié)構(gòu)圖的圖與邊模型組成知識(shí)語義模型,實(shí)現(xiàn)兵要知識(shí)的信息檢索、專家知識(shí)抽取、邏輯關(guān)系分析等功能,從而具備對(duì)戰(zhàn)場(chǎng)環(huán)境及其對(duì)軍事行動(dòng)的影響進(jìn)行大規(guī)模實(shí)時(shí)關(guān)聯(lián)和因果分析的能力。
圖1 兵要知識(shí)圖譜概念圖Fig.1 Concept Map of Military Topology Knowledge Graph
兵要知識(shí)圖譜是科學(xué)知識(shí)圖譜在兵要信息領(lǐng)域的拓展,是表述地圖、影像等實(shí)體空間分布的空間信息圖,也是表述信息挖掘和知識(shí)推理的圖形化知識(shí)結(jié)構(gòu)圖,其通過知識(shí)圖譜形象化地描述兵要信息的概念、實(shí)體、屬性及其時(shí)空關(guān)聯(lián),進(jìn)而形成空間和網(wǎng)狀相結(jié)合的知識(shí)結(jié)構(gòu)。
兵要知識(shí)圖譜根本特征表現(xiàn)為一種“時(shí)空兵要信息結(jié)合型”的知識(shí)圖譜,其需要針對(duì)戰(zhàn)場(chǎng)環(huán)境信息、作戰(zhàn)行動(dòng)特點(diǎn)和兵要信息的自身特點(diǎn),對(duì)多源信息進(jìn)行綜合和關(guān)聯(lián),進(jìn)而獲得具備時(shí)空關(guān)聯(lián)的兵要知識(shí)譜系圖。
1)兵要知識(shí)圖譜同時(shí)具備“具象信息圖”和“抽象知識(shí)圖”[8,9]的雙重能力。兵要知識(shí)來源于地理空間信息,描述了戰(zhàn)場(chǎng)環(huán)境中地理要素的空間分布,是未經(jīng)概念抽象、邏輯推理、構(gòu)模分析的原始時(shí)空信息表達(dá)模型;另一方面,兵要知識(shí)又是知識(shí)推理和關(guān)聯(lián)分析后獲取的、表示某種認(rèn)知和理解的軍事行動(dòng)知識(shí)。
2)兵要知識(shí)圖譜描述的關(guān)系包括時(shí)空關(guān)系、語義關(guān)系和互作用關(guān)系。兵要知識(shí)圖譜在網(wǎng)絡(luò)結(jié)構(gòu)圖形層面主要描述的關(guān)系是實(shí)體之間的語義關(guān)系;在地理空間信息的時(shí)間關(guān)聯(lián)層面主要描述的地理要素隨時(shí)間的邏輯變化關(guān)系;在地理空間信息的空間關(guān)聯(lián)層面主要描述的地理要素在空間上的分布關(guān)系。另外,戰(zhàn)場(chǎng)環(huán)境和軍事行動(dòng)是一個(gè)動(dòng)態(tài)系統(tǒng),圖譜中還需要表示運(yùn)動(dòng)、變化、過程、相互作用等關(guān)系,而如何構(gòu)建地理信息時(shí)空關(guān)系、邏輯關(guān)聯(lián)及各種實(shí)體相互關(guān)系的映射,是兵要知識(shí)圖譜構(gòu)建的核心關(guān)鍵問題。
3)兵要知識(shí)圖譜具備可計(jì)算性。兵要知識(shí)圖譜需要通過人工構(gòu)建類似于神經(jīng)網(wǎng)絡(luò)的多源信息的網(wǎng)絡(luò)化、圖形化表達(dá)結(jié)構(gòu)圖,并具備圖計(jì)算的特點(diǎn),因此它是可計(jì)算的,并且能夠與其他的形式化表達(dá)方式相互轉(zhuǎn)換,人們可以通過計(jì)算和推理從中獲取更多可用于行動(dòng)決策的新的知識(shí)。
4)兵要知識(shí)圖譜需要描述地理空間和作戰(zhàn)實(shí)體的知識(shí)實(shí)體模型和推力模型。實(shí)體模型主要指地理空間信息中關(guān)于地理空間要素的地理定義、地理分析、空間分布等反映地理實(shí)體外部特征和聯(lián)系的表達(dá)模型,屬于客觀知識(shí)。推理模型是指描述地理空間要素的空時(shí)演變要素、對(duì)作戰(zhàn)行動(dòng)的影響預(yù)測(cè)等需要深度挖掘的內(nèi)容,屬于對(duì)數(shù)據(jù)挖掘型算法要求較高的知識(shí)推理。此外,兵要知識(shí)圖譜應(yīng)該能夠全面描述、存儲(chǔ)和表示地理空間實(shí)體的相關(guān)知識(shí),并建立知識(shí)之間的邏輯關(guān)聯(lián)。
兵要知識(shí)可采用資源描述框架(resource description framework,RDF)[10]表示為三元組形式,即謂詞(Predicate),賓語形成由“點(diǎn)-邊”組成的大規(guī)模有向圖。其中,主體是地理空間要素和作戰(zhàn)實(shí)體,謂詞表示地理空間要素和作戰(zhàn)實(shí)體進(jìn)行知識(shí)推理或信息挖掘的方法或技術(shù),賓語是進(jìn)過推理后形成的具有屬性或資源描述的知識(shí)。標(biāo)準(zhǔn)RDF三元組不易表達(dá)時(shí)空信息,將會(huì)影響兵要知識(shí)的時(shí)空構(gòu)建效果。為此,需要在RDF模型中增加時(shí)空描述方法,例如時(shí)間關(guān)系謂詞、空間類型陳述、時(shí)空關(guān)系謂詞等,以構(gòu)建適于時(shí)空索引和查詢的增強(qiáng)型RDF三元組。
圖2表示了兵要知識(shí)圖譜的構(gòu)建過程,不同的信息來源對(duì)應(yīng)了不同的數(shù)據(jù)類型,再通過時(shí)空關(guān)聯(lián)、知識(shí)抽取、實(shí)體分析、知識(shí)推理等技術(shù)形成兵要知識(shí)圖譜。
圖2 兵要知識(shí)圖譜構(gòu)建流程Fig.2 Construction Process of Military Topology Knowledge Graph
兵要知識(shí)蘊(yùn)含了大量的地理空間信息和邏輯關(guān)聯(lián)信息,需要構(gòu)建一個(gè)存儲(chǔ)知識(shí)圖譜的框架,以提高知識(shí)圖譜的使用效率。
圖3是兵要知識(shí)存儲(chǔ)架構(gòu)圖。兵要知識(shí)圖譜中的地理空間信息包含地圖、影像和多媒體等信息,通常單一的服務(wù)器無法滿足其存儲(chǔ)需求,可采用分布式協(xié)同存儲(chǔ)提高存儲(chǔ)容量。分布式協(xié)同存儲(chǔ)采用先邏輯結(jié)構(gòu)后物理分塊的模式,首先建立基于關(guān)系表和圖結(jié)構(gòu)的增強(qiáng)型RDF數(shù)據(jù)模型,再通過數(shù)據(jù)和信息存儲(chǔ)指向?qū)Y(jié)構(gòu)化的數(shù)據(jù)分塊,提高系統(tǒng)數(shù)據(jù)結(jié)構(gòu)的存儲(chǔ)、調(diào)用和轉(zhuǎn)發(fā)效率。
圖3 兵要知識(shí)圖譜的存儲(chǔ)架構(gòu)Fig.3 Storage Architecture of Military Topology Knowledge Graph
兵要知識(shí)的抽取分為兵要實(shí)體抽取、邏輯拓?fù)潢P(guān)系抽取、時(shí)間關(guān)聯(lián)抽取和語義屬性關(guān)系抽?。?1]。兵要實(shí)體抽取主要是從結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)中構(gòu)建實(shí)體詞典、知識(shí)規(guī)則或知識(shí)特征,抽取出符合某一類的實(shí)體。實(shí)體抽取的知識(shí)規(guī)則較為確定,因而其抽取準(zhǔn)確率較高,亦可以在實(shí)際工程中應(yīng)用。
關(guān)系抽取則需要從非結(jié)構(gòu)化數(shù)據(jù)中挖掘知識(shí),實(shí)體的信息大多隱含于數(shù)據(jù)中,知識(shí)規(guī)則形式多樣,知識(shí)特征不明顯,并且需要考慮各種邏輯關(guān)聯(lián)因素,因此,其實(shí)體抽取難度較大,下面重點(diǎn)討論拓?fù)潢P(guān)系抽取過程。
拓?fù)潢P(guān)系抽取主要完成地理空間分布到計(jì)算機(jī)模型描述與表達(dá)關(guān)系的轉(zhuǎn)換過程,需要建立空間分布關(guān)系到計(jì)算機(jī)描述語言的映射關(guān)聯(lián)[12-13]。如圖4所示,兵要信息中不同的地物要素有不同的對(duì)照關(guān)系。
圖4 拓?fù)潢P(guān)系Fig.4 Relationship of Topological Distribution
例如鐵軌和道路之間有“跨越”和“穿過”動(dòng)作,并且“跨越”動(dòng)作存在上下的方位關(guān)系;河流和村莊之間有“穿過”和“繞行”動(dòng)作等??梢岳玫乩硇畔⑾到y(tǒng)中的點(diǎn)、線、面分布關(guān)系的計(jì)算方法,分析得到兵要實(shí)體的拓?fù)潢P(guān)系與類別。
例如,道路、河流等實(shí)體定義為線狀要素,村莊、湖泊、城市等定義為面狀要素,重要目標(biāo)和獨(dú)立地物定義為點(diǎn)狀要素,再通過語言描述各要素的空間分布關(guān)系。
時(shí)間結(jié)構(gòu)關(guān)系主要用于描述兵要信息隨時(shí)間的變化特征。時(shí)間結(jié)構(gòu)關(guān)系主要描述人文地理變化和自然地理的屬性變化。人文地理變化主要包括國(guó)家、政治、宗教等實(shí)體隨時(shí)間發(fā)展變化關(guān)系,如描述國(guó)家政治局勢(shì)的變化,需要包含“時(shí)間-國(guó)家-地緣-事件-人員”之間的關(guān)系,組成“增強(qiáng)型”的RDF模型。自然地理的屬性變化主要包括地理實(shí)體、空間位置隨時(shí)間的變化關(guān)系,如描述國(guó)家(城市)名稱的變化,則需要包括“國(guó)家(城市)-地理位置-時(shí)間”之間的關(guān)系,組成計(jì)算機(jī)可識(shí)別的語言描述模型。
語義屬性關(guān)系包括邏輯關(guān)聯(lián)關(guān)系、等同關(guān)系、同類關(guān)系、互斥關(guān)系等。邏輯關(guān)聯(lián)關(guān)系主要描述概念或?qū)嶓w間的實(shí)例關(guān)系,例如“海洋”與“太平洋”之間的關(guān)系;同等關(guān)系用來描述同級(jí)別兵要實(shí)體之間的等價(jià)關(guān)系,如“沖繩最大的空軍基地”與“嘉手納空軍基地”;互斥關(guān)系用來描述概念相反的同級(jí)兵要實(shí)體,如“軍事目標(biāo)”與“民用設(shè)施”;相似關(guān)系用來描述概念相近的同級(jí)兵要實(shí)體,如“資本主義國(guó)家”與“發(fā)達(dá)國(guó)家”。
除了上述內(nèi)容外,兵要實(shí)體分析也是建立兵要知識(shí)圖譜不可缺少的部分。兵要實(shí)體分析主要包括實(shí)體關(guān)聯(lián)、實(shí)體關(guān)系消歧和實(shí)體對(duì)齊3部分[14-15]。實(shí)體關(guān)聯(lián)建立兵要實(shí)體之間的相關(guān)性聯(lián)系。實(shí)體對(duì)齊也被稱作實(shí)體匹配,是指對(duì)于多源異構(gòu)的兵要信息中的各個(gè)實(shí)體,挖掘和分析出同一實(shí)體。實(shí)體消歧是專門用于解決同名實(shí)體產(chǎn)生歧義問題的情況,針對(duì)實(shí)際的兵要信息中某個(gè)實(shí)體名稱對(duì)應(yīng)于多個(gè)命名實(shí)體對(duì)象的問題,完成同個(gè)實(shí)體名稱在不同場(chǎng)景中不同意義的統(tǒng)一。
兵要知識(shí)圖譜是實(shí)現(xiàn)兵要信息智能化檢索、決策和分析的重要基礎(chǔ),按照應(yīng)用場(chǎng)景不同,兵要知識(shí)圖譜可分為人工輔助和全智能決策的應(yīng)用。人工輔助應(yīng)用主要通過兵要知識(shí)圖譜建立智能化信息檢索、專家問答系統(tǒng)、知識(shí)挖掘與輔助決策等更好地輔助人員對(duì)作戰(zhàn)環(huán)境的認(rèn)知;全智能決策的兵要信息認(rèn)知,主要使決策系統(tǒng)具備智能化認(rèn)知和機(jī)器學(xué)習(xí)能力,可在海量兵要信息中挖掘和推理作戰(zhàn)行動(dòng)關(guān)聯(lián)因素。
人工輔助的兵要知識(shí)專家問答模式在交互形式上更接近人類的交流習(xí)慣,基于兵要知識(shí)圖譜的智能問答系統(tǒng)可以建立虛擬戰(zhàn)場(chǎng)地理環(huán)境和兵要信息的智能檢索引擎[16],能夠適應(yīng)作戰(zhàn)決策中快速、準(zhǔn)確、啟發(fā)式獲取兵要知識(shí)的需求。由于兵要知識(shí)圖譜具有網(wǎng)絡(luò)圖形化、可計(jì)算化、關(guān)聯(lián)化的特征,兵要知識(shí)圖譜相比純文本資料、結(jié)構(gòu)化數(shù)據(jù)庫(kù)等,具有更豐富的信息表達(dá)、更精確的知識(shí)推理和更高效的檢索方式等優(yōu)勢(shì),基于兵要知識(shí)圖譜的專家問答服務(wù)將是兵要知識(shí)圖譜的一個(gè)重要應(yīng)用方向。
以兵要知識(shí)圖譜為基礎(chǔ),可以建設(shè)兵要信息大數(shù)據(jù)和智能決策平臺(tái),可利用模式識(shí)別、模式聚類、圖計(jì)算、神經(jīng)網(wǎng)絡(luò)、類腦算法等先進(jìn)的人工智能方法,實(shí)現(xiàn)兵要實(shí)體的關(guān)聯(lián)分析、軍事行動(dòng)影響分析等功能[17];并且依據(jù)“增強(qiáng)型”RDF模型,實(shí)現(xiàn)時(shí)空離散分布的目標(biāo)、時(shí)間和環(huán)境的關(guān)聯(lián)分析,增強(qiáng)信息處理能力。兵要知識(shí)圖譜還能進(jìn)一步加深機(jī)器學(xué)習(xí)在兵要信息中的應(yīng)用,使決策系統(tǒng)具備環(huán)境認(rèn)知能力。
未來,人工智能技術(shù)將進(jìn)一步應(yīng)用于各種武器裝備,兵要知識(shí)圖譜技術(shù)可以使作戰(zhàn)機(jī)器人等智能武器具備對(duì)作戰(zhàn)環(huán)境的動(dòng)態(tài)感知能力,為武器平臺(tái)提供相關(guān)知識(shí)庫(kù)的支撐。兵要知識(shí)圖譜可為作戰(zhàn)機(jī)器人等智能平臺(tái)提供兵要信息服務(wù),為武器平臺(tái)的路徑規(guī)劃和打擊評(píng)估提供豐富的知識(shí)推理,使其具備更智能的戰(zhàn)場(chǎng)環(huán)境信息理解能力。
兵要知識(shí)圖譜是智能化兵要系統(tǒng)的基礎(chǔ)工程,其構(gòu)建技術(shù)主要以人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、信息檢索等多學(xué)科交叉技術(shù)為支撐,是兵要信息智能化服務(wù)發(fā)展的新趨勢(shì)。本文重點(diǎn)分析了兵要知識(shí)圖譜的概念和內(nèi)涵,并設(shè)計(jì)了兵要知識(shí)圖譜的基本架構(gòu),總結(jié)分析了兵要知識(shí)圖譜的關(guān)鍵技術(shù),并結(jié)合兵要知識(shí)圖譜的特點(diǎn)分析了未來的應(yīng)用場(chǎng)景。
兵要知識(shí)圖譜作為兵要信息智能化分析的核心技術(shù),具有重要的理論研究和實(shí)際應(yīng)用價(jià)值。隨著人工智能在軍事應(yīng)用中的逐漸深入,兵要知識(shí)圖譜在地理空間信息智能關(guān)聯(lián)、隱含知識(shí)發(fā)現(xiàn)、決策深度問答、智能專家問答系統(tǒng)等作戰(zhàn)運(yùn)用中,必將發(fā)揮越來越重要的作用。