李墈婧,胡建軍,吳迪,禮冬雪,葉亞峰
(北京計(jì)算機(jī)技術(shù)及應(yīng)用研究所,北京 100854)
軍事領(lǐng)域知識(shí)圖譜是建立指揮員、指揮信息系統(tǒng)以及作戰(zhàn)單元之間溝通的重要手段。其中,知識(shí)本體是廣義的領(lǐng)域知識(shí)框架,用于定義事物的類型、用于描述它們的屬性以及事物之間的關(guān)系,是知識(shí)圖譜構(gòu)建的基礎(chǔ)。針對(duì)軍事領(lǐng)域數(shù)據(jù)來(lái)源廣泛、專業(yè)性強(qiáng)、保密性要求高等特點(diǎn),現(xiàn)有的領(lǐng)域本體構(gòu)建多是基于專家知識(shí)的靜態(tài)本體構(gòu)架方法。劉麗等[1]針對(duì)態(tài)勢(shì)感知、作戰(zhàn)籌劃、指揮控制等功能需求,將軍事本體體系分為基礎(chǔ)本體、領(lǐng)域本體和應(yīng)用本體3 層,實(shí)現(xiàn)對(duì)數(shù)據(jù)的統(tǒng)一建模。車金立等[2]通過(guò)挖掘百科數(shù)據(jù)中的裝備類型、裝備型號(hào)及裝備參數(shù)等數(shù)據(jù),構(gòu)建了軍事裝備領(lǐng)域知識(shí)庫(kù)。付雨萌等[3]梳理了軍事活動(dòng)中涉及的事件、軍事人員、武器裝備、戰(zhàn)法等關(guān)鍵要素,完善及擴(kuò)展了軍事活動(dòng)事件本體模型。王震南[4]從兩棲登陸作戰(zhàn)領(lǐng)域場(chǎng)景出發(fā),構(gòu)建了包含裝備體系、作戰(zhàn)事件、作戰(zhàn)能力等實(shí)體的知識(shí)體系模型。劉夢(mèng)超[5]針對(duì)面向海戰(zhàn)場(chǎng)的知識(shí)模型構(gòu)建問(wèn)題,定義了海戰(zhàn)活動(dòng)、海戰(zhàn)裝備、軍事政治事件、專家先驗(yàn)知識(shí)等核心概念的本體模型。趙文正等[6]通過(guò)定義軍事事理模式,開(kāi)發(fā)了基于交互式分析工具的事理圖譜可視化系統(tǒng)。劉朝暢等[7]針對(duì)偽裝方案場(chǎng)景下的兵力、時(shí)間、資源等關(guān)鍵要素進(jìn)行歸類,設(shè)計(jì)偽裝目標(biāo)本體化模型,從而輔助軍事推理。
隨著信息增速、新概念的誕生、概念關(guān)系變化等,傳統(tǒng)基于手動(dòng)構(gòu)建靜態(tài)本體的方式已無(wú)法滿足海量數(shù)據(jù)動(dòng)態(tài)更新的需求,現(xiàn)有的自底向上的本體構(gòu)建方法存在噪聲大、準(zhǔn)確性不高、適應(yīng)性差等問(wèn)題。近年來(lái),國(guó)內(nèi)外學(xué)者開(kāi)始研究動(dòng)態(tài)本體的構(gòu)建問(wèn)題[7-10],在理論上,利用已有資源實(shí)現(xiàn)概念、關(guān)系更新的本體映射技術(shù)受到廣泛關(guān)注;在應(yīng)用上,主要集中在醫(yī)學(xué)領(lǐng)域[11-12]以及制造領(lǐng)域[13]的應(yīng)用研究。目前,在軍事領(lǐng)域,尚缺乏對(duì)戰(zhàn)場(chǎng)數(shù)據(jù)進(jìn)行刻畫(huà)的系統(tǒng)化動(dòng)態(tài)本體更新策略,從而難以指導(dǎo)軍事智能在作戰(zhàn)數(shù)據(jù)上的實(shí)際應(yīng)用。因此,本文在基于動(dòng)態(tài)本體研究的基礎(chǔ)上,設(shè)計(jì)了一種基于軍事領(lǐng)域的動(dòng)態(tài)本體構(gòu)建方法,通過(guò)設(shè)計(jì)領(lǐng)域內(nèi)實(shí)體、關(guān)系及屬性更新方法,改善了傳統(tǒng)知識(shí)建模對(duì)專家知識(shí)依賴性強(qiáng)、可擴(kuò)展性差等缺點(diǎn),并基于該動(dòng)態(tài)本體更新方法,以俄烏沖突知識(shí)圖譜為案例,驗(yàn)證了動(dòng)態(tài)本體在知識(shí)圖譜構(gòu)建、更新和分析上的重要性,為充分挖掘軍事數(shù)據(jù)的價(jià)值提供了基礎(chǔ)。
智能化戰(zhàn)爭(zhēng)形態(tài)下,戰(zhàn)場(chǎng)瞬息萬(wàn)變,作戰(zhàn)數(shù)據(jù)來(lái)源廣、規(guī)模大、更新快,偵察監(jiān)視預(yù)警需求多維全面,需要指揮員對(duì)重大戰(zhàn)略問(wèn)題快速做出響應(yīng),而正確快速的戰(zhàn)略決策前提是必須了解和掌握大量的信息以及進(jìn)行深入的信息挖掘。知識(shí)圖譜作為一個(gè)龐大的語(yǔ)義網(wǎng)絡(luò),能夠?qū)Ω黝愜娛聦?shí)體、關(guān)系進(jìn)行有效鏈接,對(duì)知識(shí)進(jìn)行快速梳理整合并進(jìn)行深層次挖掘,從而輔助指揮人員快速理解實(shí)時(shí)戰(zhàn)事,做出正確的指揮命令。
隨著信息化時(shí)代背景和我軍獲取信息渠道的不斷升級(jí),各種情報(bào)數(shù)據(jù)量呈現(xiàn)指數(shù)級(jí)上升。多源異構(gòu)軍事領(lǐng)域數(shù)據(jù)除結(jié)構(gòu)化數(shù)據(jù)外,還包括作戰(zhàn)指令、文書(shū)、戰(zhàn)場(chǎng)環(huán)境、敵情、我情等文字、圖像、音視頻數(shù)據(jù)。面對(duì)數(shù)據(jù)量和數(shù)據(jù)復(fù)雜度的爆炸式增長(zhǎng),如何從海量數(shù)據(jù)中挖掘關(guān)鍵信息,并進(jìn)行高效組織管理成為軍事領(lǐng)域數(shù)據(jù)處理和分析的關(guān)鍵問(wèn)題。知識(shí)圖譜在多源情報(bào)數(shù)據(jù)的處理方面展現(xiàn)出了極大優(yōu)勢(shì),已經(jīng)發(fā)揮出重要作用。然而隨著戰(zhàn)場(chǎng)新的作戰(zhàn)對(duì)象、裝備的出現(xiàn),其對(duì)應(yīng)的概念體系也會(huì)發(fā)生變化,而同系列的裝備隨著新型號(hào)的研發(fā),其性能和參數(shù)屬性也會(huì)隨之發(fā)生變化,導(dǎo)致知識(shí)圖譜的動(dòng)態(tài)融合更新成為難點(diǎn)。因此,需要建立能夠動(dòng)態(tài)更新的知識(shí)本體建模方法,實(shí)現(xiàn)大規(guī)模軍事情報(bào)知識(shí)圖譜的自動(dòng)融合更新,形成戰(zhàn)場(chǎng)情況綜合態(tài)勢(shì),進(jìn)而解決作戰(zhàn)人員對(duì)知識(shí)的個(gè)性化搜索推薦和隱含知識(shí)的推理需求。
目前,軍事領(lǐng)域重大突發(fā)事件的案例整編和復(fù)盤(pán)反演通常依賴情報(bào)分析人員人工從各類情報(bào)數(shù)據(jù)中梳理關(guān)鍵要素。隨著事件的發(fā)展演化,需要?jiǎng)討B(tài)地從各類情報(bào)中檢測(cè)多維度的各類事件實(shí)體,解析事件要素,構(gòu)建事件從開(kāi)始、發(fā)展到結(jié)束的演化脈絡(luò),形成軍事事件的整體描述。通過(guò)人物、裝備與作戰(zhàn)事件的關(guān)聯(lián)分析,能夠快速分析出其規(guī)律,提供精準(zhǔn)的信息保障。如美國(guó)在抓捕恐怖分子本·拉登的行動(dòng)中,通過(guò)Palantir 公司動(dòng)態(tài)本體技術(shù)和工具,基于世界各基地頭目的通信和事件數(shù)據(jù)構(gòu)建情報(bào)知識(shí)圖譜,并采用人物關(guān)聯(lián)分析、行為分析、事件演化分析等分析方法,最終挖掘出本·拉登的藏身地點(diǎn),實(shí)現(xiàn)戰(zhàn)略目標(biāo),該行動(dòng)突出了知識(shí)圖譜在軍事領(lǐng)域的重大效用。因此,亟需構(gòu)建一套動(dòng)態(tài)更新的軍事領(lǐng)域本體體系,基于該技術(shù)構(gòu)建的知識(shí)圖譜才能夠打通系統(tǒng)底層功能域,根據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)的變化,對(duì)各類數(shù)據(jù)進(jìn)行動(dòng)態(tài)組織,從而完成作戰(zhàn)決策的智能推薦,輔助指揮員對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)進(jìn)行綜合研判。
軍事領(lǐng)域數(shù)據(jù)來(lái)源廣泛,專業(yè)性強(qiáng)。主要包含相關(guān)業(yè)務(wù)系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)、開(kāi)源情報(bào)數(shù)據(jù)(新聞、百科、論壇、社交媒體等)、內(nèi)部軍事情報(bào)數(shù)據(jù)(敵情、我情、戰(zhàn)場(chǎng)環(huán)境等)以及相關(guān)指令問(wèn)答請(qǐng)求數(shù)據(jù)等。其中開(kāi)源情報(bào)數(shù)據(jù)具有傳播速度快、信息多樣化、交互復(fù)雜等特點(diǎn),如何從海量信息中自動(dòng)化篩選出符合要求的信息,并與專有軍事領(lǐng)域知識(shí)進(jìn)行融合更新一直是研究的難點(diǎn)。此外,隨著信息內(nèi)容隨時(shí)間的變化,對(duì)問(wèn)題的關(guān)注點(diǎn)也會(huì)有所不同,提取的語(yǔ)義信息會(huì)發(fā)生較大變化。因此對(duì)于指揮員日常作戰(zhàn)中的指令問(wèn)答請(qǐng)求數(shù)據(jù)的處理也是本研究的關(guān)鍵點(diǎn)。
文本提出一種面向軍事領(lǐng)域的動(dòng)態(tài)本體構(gòu)建方法,實(shí)現(xiàn)知識(shí)本體的動(dòng)態(tài)更新,具體架構(gòu)如圖1 所示。主要包括初始本體設(shè)計(jì)、數(shù)據(jù)映射、形式背景合并、本體更新4 個(gè)部分,其中初始本體設(shè)計(jì)部分主要基于專家知識(shí)、基礎(chǔ)數(shù)據(jù)庫(kù)、歷史案例、軍事領(lǐng)域書(shū)籍或標(biāo)準(zhǔn)等進(jìn)行抽象設(shè)計(jì)形成初始本體O1;數(shù)據(jù)映射部分主要將結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等數(shù)據(jù)進(jìn)行知識(shí)挖掘,映射為易于處理的結(jié)構(gòu)化數(shù)據(jù)D;隨后,形式背景合并部分將初始本體O1轉(zhuǎn)換為形式背景K1,將結(jié)構(gòu)化數(shù)據(jù)D轉(zhuǎn)換為形式背景K2,然后將K1和K2進(jìn)行合并形成形式背景K;最后本體更新部分利用形式概念更新將形式背景K處理形成新的本體O2,實(shí)現(xiàn)本體的動(dòng)態(tài)更新。
圖1 軍事領(lǐng)域動(dòng)態(tài)本體構(gòu)建方法架構(gòu)圖Fig.1 Architecture of dynamic ontology construction method for military field
軍事領(lǐng)域本體的構(gòu)建往往依賴專家經(jīng)驗(yàn)來(lái)完成,本文在總結(jié)前人工作經(jīng)驗(yàn)以及相關(guān)知識(shí)的調(diào)研后,構(gòu)建了軍事領(lǐng)域初始本體。
(1)確定實(shí)體分類體系
本文在借鑒第三方知識(shí)體系[14]的基礎(chǔ)上,通過(guò)綜合專家知識(shí)、基礎(chǔ)數(shù)據(jù)庫(kù)、歷史案例等數(shù)據(jù),并參考相關(guān)行業(yè)標(biāo)準(zhǔn)[15-18]中的軍事分類及基本概念,結(jié)合軍事領(lǐng)域特點(diǎn),完成本體的知識(shí)分類。在本文中,通過(guò)領(lǐng)域分析,把軍事數(shù)據(jù)分為裝備、人物、組織機(jī)構(gòu)、物資、環(huán)境、設(shè)施、理論法規(guī)和軍事事件,具體分類方式如圖2 所示。
圖2 軍事領(lǐng)域數(shù)據(jù)實(shí)體分類體系Fig.2 Entity classification for military field data
(2)定義軍事實(shí)體屬性及實(shí)體間關(guān)系
基于以上實(shí)體分類體系,設(shè)計(jì)對(duì)應(yīng)的實(shí)體屬性,主要有共有屬性以及專有屬性,部分屬性示例如表1 所示。
表1 軍事領(lǐng)域部分實(shí)體屬性示例Table 1 Examples of entity attributes for military field
此外,定義各實(shí)體類之間的關(guān)系,主要有隸屬關(guān)系、部署關(guān)系、參與關(guān)系、指揮和掛載等關(guān)系,對(duì)應(yīng)的主要實(shí)體間關(guān)系如表2 所示。
表2 軍事領(lǐng)域?qū)嶓w之間主要關(guān)系示例Table 2 Examples of relationships between entities for military field
數(shù)據(jù)映射主要是將多源異構(gòu)數(shù)據(jù)進(jìn)行信息抽取后統(tǒng)一映射處理。業(yè)務(wù)系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)映射主要利用關(guān)系型數(shù)據(jù)庫(kù)(包括業(yè)務(wù)數(shù)據(jù)、武器裝備等實(shí)體庫(kù)、同義詞庫(kù)),抽取涉及原始數(shù)據(jù)之間的強(qiáng)語(yǔ)義關(guān)系,將語(yǔ)義信息進(jìn)行關(guān)系映射;內(nèi)部軍事情報(bào)等文本數(shù)據(jù)主要通過(guò)分詞、句法分析、語(yǔ)義分析等自然語(yǔ)言處理技術(shù)完成文本知識(shí)的挖掘,形成結(jié)構(gòu)化數(shù)據(jù)存入關(guān)系型數(shù)據(jù)庫(kù);開(kāi)源情報(bào)數(shù)據(jù)涉及范圍較廣,需要先基于匹配規(guī)則進(jìn)行篩選,去除數(shù)據(jù)噪聲后,再通過(guò)文本知識(shí)挖掘進(jìn)行處理;指令及問(wèn)答請(qǐng)求數(shù)據(jù)主要通過(guò)問(wèn)答查詢理解映射抽取問(wèn)題的關(guān)鍵信息點(diǎn)。
基于構(gòu)建好的初始本體,通過(guò)本體本身的語(yǔ)義信息以及概念之間的推導(dǎo),將其轉(zhuǎn)化為形式背景K1=(G1,M1,I1),其中G1代表對(duì)象,M1代表屬性,I1代表關(guān)系。同理,可以根據(jù)2.2 節(jié)數(shù)據(jù)映射后的結(jié)果,得出形式背景K2=(G2,M2,I2);根據(jù)形式背景合并,求出合并后的形式背景K=(G',M',I')。
形式背景合并算法主要由相似度算法計(jì)算對(duì)象、屬性和關(guān)系間的相似性,判斷生成新的元素或元素合并。由于軍事領(lǐng)域有很多相似的表達(dá),如“航空母艦”可以表達(dá)為“航母”,“殲-15”可以有“殲15”“J-15”等多種相似表達(dá),此處采用基于知網(wǎng)的詞語(yǔ)語(yǔ)義相似度概念[19]來(lái)計(jì)算。知網(wǎng)中,每個(gè)詞語(yǔ)均可以由概念集合來(lái)描述,每個(gè)概念又由相應(yīng)的義原來(lái)定義。
(1)詞語(yǔ)相似度。當(dāng)詞語(yǔ)w1涉及n個(gè)概念:s11,s12,…,s1n,詞語(yǔ)w2涉及m個(gè)概念:s21,s22,…,s2m,則詞語(yǔ)的相似度為各概念相似度的最大值,即
(2)概念相似度。每個(gè)概念由相應(yīng)的義原來(lái)描述其語(yǔ)義,由概念的語(yǔ)義描述包含第一基本義原、其他基本義原、關(guān)系義原、符號(hào)義原,故2 個(gè)概念s1和s2的相似度為
式中:βi為可調(diào)參數(shù),代表不同類型義原的占比。
義原相似度計(jì)算公式為
式中:p1,p2表示2 個(gè)義原;d為兩義原在義原樹(shù)中的距離;α為可調(diào)參數(shù)。
通過(guò)以上計(jì)算可求出形式背景中詞之間的相似度,設(shè)定閾值,判定其大于閾值,代表2 個(gè)詞相似度較高,假設(shè)其中一個(gè)詞已經(jīng)在形式背景中,則不需要添加,如小于閾值則將其添加到新的形式背景中去。
在本體更新部分,文本采用基于形式概念分析[20]的本體更新策略。形式背景合并后得到對(duì)象與屬性之間的聯(lián)系,形式概念分析則是對(duì)實(shí)體、關(guān)系、屬性的泛化后的抽象表達(dá),通過(guò)泛化表達(dá)形成概念格。已知形式概念的相關(guān)定義如下:
定理 1.對(duì)于形式背景K=(G,M,I),G的元素代表對(duì)象,M的元素代表屬性,I代表關(guān)系,gIm表示對(duì)象g和屬性m值之間的關(guān)系為I。
定理 2.假設(shè)A為對(duì)象集合G的子集,則A中對(duì)象共同屬性集合為
假設(shè)B為屬性集合M的子集,則具有B中相同屬性的對(duì)象的集合為
如果f(A)=B且g(B)=A,則稱C={A,B}為形式背景K的形式概念。
形式概念的更新包括對(duì)象的更新和屬性的更新,以屬性更新為例,假設(shè)初始本體對(duì)應(yīng)節(jié)點(diǎn)的形式概念為C={A,B},新增屬性為m',具有該屬性的對(duì)象集合為g(m')。形式概念更新過(guò)程如下:
同理可以完成對(duì)象的更新,本方法基于初始本體構(gòu)造的基礎(chǔ)上,完成初始形式概念的形成,進(jìn)而基于合并后的形式背景完成本體的更新,利用形式概念更新算法,自動(dòng)生成新的本體。
為了更好地驗(yàn)證動(dòng)態(tài)本體對(duì)知識(shí)圖譜構(gòu)建過(guò)程的影響以及本文動(dòng)態(tài)本體構(gòu)建方法的可用性,本節(jié)以俄烏沖突為背景,收集來(lái)自網(wǎng)絡(luò)開(kāi)源新聞數(shù)據(jù)作為樣本集。首先依據(jù)初始本體抽取部分?jǐn)?shù)據(jù)完成初始知識(shí)圖譜構(gòu)建,隨著事件演化,新數(shù)據(jù)也層出不窮,利用本文所提出的動(dòng)態(tài)本體構(gòu)建技術(shù)對(duì)形式概念和本體進(jìn)行判定更新,最終完成圖譜的實(shí)例化構(gòu)建,構(gòu)建結(jié)果使用Neo4j 圖數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)和可視化展示,最后結(jié)合構(gòu)建的知識(shí)圖譜進(jìn)行應(yīng)用分析。
以俄烏沖突為背景,結(jié)合事件背景及第1 次沖突升級(jí)為例,利用爬蟲(chóng)技術(shù)獲取公開(kāi)網(wǎng)頁(yè)新聞、公眾號(hào)等相關(guān)數(shù)據(jù),通過(guò)數(shù)據(jù)預(yù)處理及結(jié)構(gòu)分析,形式化地表達(dá)了事件的發(fā)展脈絡(luò),實(shí)現(xiàn)知識(shí)的結(jié)構(gòu)化展示,部分初始實(shí)例結(jié)果如圖3 所示。
圖3 基于初始本體的知識(shí)圖譜示例Fig.3 Illustration of initial ontology-based knowledge graphs
如圖3 所示,每個(gè)節(jié)點(diǎn)代表一個(gè)實(shí)體。由圖中示例可以看出:“俄軍首次集結(jié)兵力”的背景原因主要包括“克里米亞事件”“新明斯克協(xié)議”和“北約擴(kuò)張”?!岸碥娛状渭Y(jié)兵力”事件的下位事件主要有“頓涅茨克人民共和國(guó)獲準(zhǔn)‘先發(fā)制人摧毀’烏克蘭軍事要地”“俄軍直升機(jī)跨過(guò)烏克蘭邊境”“俄軍從西部及中部調(diào)運(yùn)大量兵力進(jìn)入克里米亞占領(lǐng)區(qū)”和“俄軍準(zhǔn)備‘西部2021’軍演”事件。其對(duì)應(yīng)的相關(guān)事件有“烏克蘭總統(tǒng)簽署‘2021 年第117 號(hào)令’”。根據(jù)第2.1 節(jié)中的初始本體模型可以得到每個(gè)事件關(guān)聯(lián)的時(shí)間、人物、裝備、組織機(jī)構(gòu)等實(shí)體。以上構(gòu)建的知識(shí)圖譜以“俄軍首次集結(jié)兵力”為檢索對(duì)象,展示了相關(guān)事件之間的邏輯關(guān)系,根據(jù)時(shí)間線梳理使得事件的始末更加清晰,對(duì)于今后的事件發(fā)展演化分析具有較大參考價(jià)值。
隨著沖突的進(jìn)一步升級(jí)激化,新聞數(shù)據(jù)也在不斷擴(kuò)充細(xì)化,在實(shí)驗(yàn)中,參考文獻(xiàn)[19]中的參數(shù)值進(jìn)行計(jì)算。參數(shù)設(shè)置為:α=1.6,β1=0.5,β2=0.2,β3=0.17,β4=0.13。
假設(shè)現(xiàn)有形式背景中武器類實(shí)體已有“戰(zhàn)斗機(jī)”元素,對(duì)于新增同類型實(shí)體元素“殲擊機(jī)”、“直升機(jī)”是否要加入該背景進(jìn)行判定,基于2.3 節(jié)形式背景合并算法,查找知網(wǎng)詞庫(kù)[21]“戰(zhàn)斗機(jī)”涉及的概念為:[No.134930|fighter| 戰(zhàn)斗機(jī),No.134931|fighter plane|戰(zhàn)斗機(jī)],“殲擊機(jī)”涉及的概念為:[No.173130|fighter plane|殲擊機(jī),No.173128|fighter|殲擊機(jī),No.173129|fighter aircraft| 殲擊機(jī),No.173127|attack aircraft|殲擊機(jī)],“直升機(jī)”涉及的概念為:[No.212666|chopper|直升機(jī),No.212667|helicopter|直升機(jī)]。
每個(gè)概念由相應(yīng)的義原來(lái)描述其語(yǔ)義,可通過(guò)義原樹(shù)的形式展示概念的層次關(guān)系,如圖4 所示。
圖4 概念對(duì)應(yīng)的義原樹(shù)Fig.4 Semantic trees corresponding to concepts
經(jīng)過(guò)計(jì)算得出“戰(zhàn)斗機(jī)”和“殲擊機(jī)”兩個(gè)詞語(yǔ)之間的相似度為0.865。“戰(zhàn)斗機(jī)”和“直升機(jī)”的相似度為0.486。本實(shí)驗(yàn)中,閾值設(shè)置為0.5,則將“直升機(jī)”判定為新元素加入該形式背景中。同理,可獲得更新后的形式背景。
利用本文動(dòng)態(tài)本體構(gòu)建方法進(jìn)行本體模型的擴(kuò)展更新,實(shí)例化后將新的三元組信息融合到知識(shí)圖譜中,部分示例結(jié)果如圖5 所示。
圖5 基于動(dòng)態(tài)本體的知識(shí)圖譜示例Fig.5 Illustration of dynamic ontology-based knowledge graphs
針對(duì)沖突類事件“烏克蘭海軍炮艇與俄羅斯的一艘艦艇爆發(fā)沖突”,需要抽取烏方和俄方的裝備、組織等實(shí)體信息;針對(duì)戰(zhàn)爭(zhēng)類事件,則需要抽取軍事行動(dòng)、外交談判以及影響等實(shí)體。知識(shí)圖譜不僅可以實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)查詢展示,還可以實(shí)現(xiàn)關(guān)聯(lián)關(guān)系挖掘,事件演化推理?;趫D數(shù)據(jù)庫(kù)的路徑查找算法和圖算法,對(duì)于海量數(shù)據(jù)和關(guān)系的查詢及推理具有極高的效率。在該案例中,根據(jù)俄烏沖突中事件之間的關(guān)聯(lián)關(guān)系所生成的路徑,可以挖掘出揭示事件的演化方向和邏輯線索。
通過(guò)動(dòng)態(tài)本體構(gòu)建的知識(shí)圖譜克服了靜態(tài)本體適應(yīng)性弱、可擴(kuò)展性差的缺點(diǎn),實(shí)現(xiàn)知識(shí)的關(guān)聯(lián)融合更新及擴(kuò)充,使得構(gòu)建大規(guī)模知識(shí)圖譜成為可能。本節(jié)基于動(dòng)態(tài)本體構(gòu)建的俄烏沖突知識(shí)圖譜中包含多條事件演化路徑,且存在順承、并發(fā)、相關(guān)等關(guān)聯(lián)關(guān)系。通過(guò)事件關(guān)聯(lián)分析、事件時(shí)序分析和事件關(guān)聯(lián)實(shí)體對(duì)象分析,可以得出事件演化路徑的特點(diǎn)、演化原因、關(guān)鍵事件以及決策行動(dòng)的底層邏輯。詳細(xì)解讀如下:
(1)基于構(gòu)建的知識(shí)圖譜,提供信息的檢索和基礎(chǔ)計(jì)算功能。首先,對(duì)事件關(guān)聯(lián)的特定裝備(如“Giurza-M”小型裝甲炮艇、伊斯坎德?tīng)柖坛虖椀溃?,可快速?gòu)闹R(shí)圖譜中的裝備信息查詢其服役時(shí)間、裝備屬性、隸屬部隊(duì)、衍生型號(hào)等基礎(chǔ)信息,從知識(shí)圖譜中的歷史行為信息查詢其過(guò)往行動(dòng)記錄,掌握裝備的作戰(zhàn)性能和使用規(guī)律。
(2)可根據(jù)圖算法構(gòu)建包含軍事裝備、時(shí)序(不同事件發(fā)生的時(shí)間)、位置信息(地點(diǎn))的子圖結(jié)構(gòu),依據(jù)這些關(guān)鍵要素進(jìn)行子圖匹配和挖掘,查找歷史相似事件,為后續(xù)行動(dòng)預(yù)測(cè)提供參考。
(3)可發(fā)掘本次事件不同于過(guò)往事件的新模式、新屬性等信息。例如,“烏克蘭海軍炮艇與俄羅斯的一艘艦艇爆發(fā)沖突”判定為沖突事件,則可根據(jù)需要抓取俄烏雙方的裝備、組織等信息;而“入侵烏克蘭”為戰(zhàn)爭(zhēng)類事件,則可挖掘分析軍事行動(dòng)、外交談判和后續(xù)的影響。
(4)可根據(jù)知識(shí)圖譜中的知識(shí)和數(shù)據(jù)進(jìn)行高效關(guān)聯(lián)分析。例如,根據(jù)事件之間的關(guān)聯(lián)度分析,整理出事件主線“暴力活動(dòng)持續(xù)升溫”-“俄軍第2 次集結(jié)”-“俄羅斯承認(rèn)頓巴斯獨(dú)立”-“俄軍第3 次集結(jié)”-“入侵烏克蘭”,根據(jù)當(dāng)前行動(dòng)態(tài)勢(shì)和歷史數(shù)據(jù)并利用圖譜中的大量關(guān)聯(lián)信息進(jìn)行快速實(shí)時(shí)的事件預(yù)測(cè)預(yù)警,同時(shí)為后續(xù)事件發(fā)展提供可解釋依據(jù)。
本文對(duì)軍事領(lǐng)域知識(shí)圖譜本體構(gòu)建的研究現(xiàn)狀和需求進(jìn)行調(diào)研和分析,總結(jié)出目前研究存在的不足,提出一種軍事領(lǐng)域動(dòng)態(tài)本體構(gòu)建方法,同時(shí)利用該方法構(gòu)建了俄烏沖突知識(shí)圖譜并進(jìn)行分析,驗(yàn)證了動(dòng)態(tài)本體在軍事領(lǐng)域知識(shí)圖譜中所發(fā)揮的重要作用,為構(gòu)建大規(guī)模知識(shí)圖譜提供了理論支撐。具體研究?jī)?nèi)容及創(chuàng)新點(diǎn)包括:
(1)考慮軍事領(lǐng)域數(shù)據(jù)量大且專業(yè)化程度高,結(jié)合軍事場(chǎng)景設(shè)計(jì)基于形式概念分析的本體更新算法,提出面向軍事領(lǐng)域的動(dòng)態(tài)本體構(gòu)建完整流程。
(2)結(jié)合目前研究現(xiàn)狀和專家知識(shí)構(gòu)建初始本體模型,使用開(kāi)源情報(bào)數(shù)據(jù)和本體更新算法進(jìn)行動(dòng)態(tài)本體構(gòu)建,驗(yàn)證了本文提出的軍事領(lǐng)域動(dòng)態(tài)本體構(gòu)建方法的可行性。
(3)以俄烏戰(zhàn)場(chǎng)實(shí)例為背景,基于動(dòng)態(tài)本體構(gòu)建俄烏沖突知識(shí)圖譜,進(jìn)行圖譜可視化,并對(duì)圖譜的應(yīng)用場(chǎng)景進(jìn)行詳細(xì)分析,驗(yàn)證了本文提出的軍事領(lǐng)域動(dòng)態(tài)本體構(gòu)建方法的實(shí)用性。
但是由于數(shù)據(jù)的敏感性,本文的實(shí)驗(yàn)數(shù)據(jù)仍顯不足,無(wú)法全面覆蓋所提到的軍事本體模型,未來(lái)需要查找更全面的數(shù)據(jù),擴(kuò)充知識(shí)圖譜規(guī)模,進(jìn)而完善動(dòng)態(tài)本體自動(dòng)更新的流程。