亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜構(gòu)建方法研究

        2022-05-18 11:05:56王小龍劉小朋王磊王宏
        中國(guó)軍轉(zhuǎn)民 2022年3期
        關(guān)鍵詞:知識(shí)圖譜

        王小龍 劉小朋 王磊 王宏

        摘要:為解決作戰(zhàn)試驗(yàn)信息化過(guò)程中出現(xiàn)的信息過(guò)載、知識(shí)搜索效率低下等問(wèn)題,提出將知識(shí)圖譜應(yīng)用于作戰(zhàn)試驗(yàn)知識(shí)庫(kù)的構(gòu)建。利用作戰(zhàn)試驗(yàn)內(nèi)部數(shù)據(jù)源進(jìn)行關(guān)鍵信息的抽取,給出作戰(zhàn)試驗(yàn)知識(shí)圖譜的構(gòu)建流程;知識(shí)圖譜技術(shù)利用海量數(shù)據(jù)建立知識(shí)庫(kù),可有效整合分散的數(shù)據(jù)信息,來(lái)提高作戰(zhàn)試驗(yàn)領(lǐng)域知識(shí)的利用率和使用價(jià)值,具有重要的軍事應(yīng)用前景。

        關(guān)鍵詞:作戰(zhàn)試驗(yàn);知識(shí)圖譜;本體構(gòu)建

        引言

        目前作戰(zhàn)試驗(yàn)還存在很多問(wèn)題需要解決,通過(guò)作戰(zhàn)試驗(yàn)采集、積累了大量的試驗(yàn)數(shù)據(jù),這些海量試驗(yàn)數(shù)據(jù)包括表格、文本文件、音視頻、運(yùn)動(dòng)軌跡等各種類型數(shù)據(jù),其以原始數(shù)據(jù)的形式存儲(chǔ)起來(lái),沒(méi)有進(jìn)行有規(guī)劃地存儲(chǔ)和處理,使數(shù)據(jù)不能成為可以利用的數(shù)據(jù)資源。當(dāng)面對(duì)海量試驗(yàn)數(shù)據(jù)時(shí),相關(guān)業(yè)務(wù)人員無(wú)法從中獲取有用知識(shí),也無(wú)法依據(jù)數(shù)據(jù)進(jìn)行更精準(zhǔn)的分析決策。導(dǎo)致價(jià)值信息繼續(xù)沉睡的首要問(wèn)題是,在海量數(shù)據(jù)中人們還不能找到其關(guān)鍵知識(shí)及相互關(guān)系,導(dǎo)致數(shù)據(jù)挖掘無(wú)從下手。

        知識(shí)圖譜(knowledge graph)提供一種可以從海量文本數(shù)據(jù)中抽取結(jié)構(gòu)化知識(shí)手段,從而成為數(shù)據(jù)分析關(guān)鍵技術(shù),目前在各個(gè)領(lǐng)域均有廣泛應(yīng)用,因此,將知識(shí)圖譜技術(shù)引入到作戰(zhàn)試驗(yàn)領(lǐng)域是解決目前無(wú)法從大量維度的數(shù)據(jù)中獲取關(guān)鍵知識(shí)的創(chuàng)新思路。本文將從作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜構(gòu)建方法開展研究,充分利用現(xiàn)有已采集數(shù)據(jù)資源進(jìn)行知識(shí)圖譜構(gòu)建,并分析其在作戰(zhàn)試驗(yàn)領(lǐng)域的應(yīng)用。

        1 知識(shí)圖譜的定義與架構(gòu)

        1.1 本體的概念

        隨著知識(shí)圖譜技術(shù)的不斷發(fā)展,本體建模技術(shù)已應(yīng)用于眾多領(lǐng)域,準(zhǔn)確地建立本體模型有助于領(lǐng)域知識(shí)的存儲(chǔ)、表達(dá)和管理。由于軍事領(lǐng)域的特殊性,其知識(shí)體系復(fù)雜,要實(shí)現(xiàn)本體模型與領(lǐng)域之間表達(dá)一致,機(jī)器與軍事指揮技術(shù)人員之間理解一致,必須為知識(shí)體系構(gòu)建準(zhǔn)確、專業(yè)的本體。本體定義其中較著名的是由Gruber等人提出的:“本體是概念化的明確的規(guī)范說(shuō)明”。

        對(duì)于本體的形式化定義,得到廣泛認(rèn)可的是Gruber 在1995年提出的本體形式化五元組:

        {C,R,HR,Rel,A}(2.1)

        其中,C代表本體的概念,R代表本體關(guān)系的集合,HR代表概念間的層次關(guān)系,Rel表示概念間的非層次關(guān)系,A為公理。

        結(jié)合作戰(zhàn)試驗(yàn)知識(shí)的自身特點(diǎn)以及未來(lái)知識(shí)體系、知識(shí)庫(kù)的擴(kuò)展和進(jìn)化需求,在本研究中,采用如下形式定義本體模型:

        O={C,A,R,X,TI}(2.2)

        即一個(gè)本體模型O包括了如下5個(gè)方面:C(Concept)表示本體中的概念,A(Attribute)表示概念及其實(shí)例的屬性的集合,R(Relation)表示概念間的關(guān)系集合,X(Axiom)表示本體的公理與規(guī)則集合,TI(TypicalInstance)表示本體的典型實(shí)例集合。

        其中,概念集合C結(jié)合知識(shí)結(jié)構(gòu)與元素與頂層概念模型產(chǎn)生;關(guān)系集合R分為分類關(guān)系Rt和依賴關(guān)系Rd兩大類,分類關(guān)系如繼承關(guān)系(is-a、kind-of)和整體部分關(guān)系(part-of)等,依賴關(guān)系表示概念間存在的其他語(yǔ)義關(guān)系。

        采用這種定義的優(yōu)勢(shì)在于,強(qiáng)化了“本體-屬性-關(guān)系”這種常用于表現(xiàn)事物和事件的整體邏輯關(guān)系,將關(guān)系、屬性和規(guī)則公理劃分為獨(dú)立的方面,使得本體模型中的定義更加模塊化,利于實(shí)際工程化構(gòu)建本體模型。

        1.2 知識(shí)圖譜的概念

        知識(shí)圖譜是結(jié)構(gòu)化的語(yǔ)義知識(shí)庫(kù),用于以符號(hào)形式描述物理世界中的概念及其相互關(guān)系。知識(shí)圖譜從邏輯上可以劃分為2個(gè)層次:數(shù)據(jù)層和模式層。在知識(shí)圖譜的數(shù)據(jù)層,知識(shí)以事實(shí)為單位存儲(chǔ)在圖數(shù)據(jù)庫(kù)中。圖數(shù)據(jù)中主要有“實(shí)體-關(guān)系-實(shí)體”或者“實(shí)體-屬性-屬性值”兩種三元組,所有數(shù)據(jù)構(gòu)成龐大的實(shí)體關(guān)系網(wǎng)絡(luò)。模式層在數(shù)據(jù)層之上,是知識(shí)圖譜的核心。模式層存儲(chǔ)的是經(jīng)過(guò)提煉的知識(shí),通常采用本體庫(kù)來(lái)管理知識(shí)圖譜的模式層。

        知識(shí)圖譜的構(gòu)建過(guò)程是從原始數(shù)據(jù)出發(fā),采用一系列自動(dòng)或半自動(dòng)的技術(shù)手段,從原始數(shù)據(jù)中提取出知識(shí)要素,并將其存入知識(shí)庫(kù)的數(shù)據(jù)層和模式層的過(guò)程。這是一個(gè)迭代更新的過(guò)程,每一輪迭代包含3個(gè)階段:信息抽取、知識(shí)融合以及知識(shí)加工。目前,在這三個(gè)階段的方法研究中,有大量的自然語(yǔ)言智能處理算法,可以支撐信息抽取、知識(shí)融合以及知識(shí)加工。

        2 作戰(zhàn)試驗(yàn)知識(shí)領(lǐng)域構(gòu)建方法

        圍繞作戰(zhàn)試驗(yàn)知識(shí),按照知識(shí)體系構(gòu)建范圍,可將知識(shí)劃分形成6大知識(shí)板塊,分別是:軍事概念知識(shí)、武器裝備知識(shí)、戰(zhàn)場(chǎng)環(huán)境知識(shí)、作戰(zhàn)運(yùn)用知識(shí)以及試驗(yàn)評(píng)估分析知識(shí)。作戰(zhàn)試驗(yàn)知識(shí)結(jié)構(gòu)與要素構(gòu)建,主要是梳理構(gòu)建每個(gè)劃分領(lǐng)域的知識(shí)要素、要素層級(jí)以及要素關(guān)系,最終形成該領(lǐng)域的知識(shí)結(jié)構(gòu),為后續(xù)的概念模型、本體模型設(shè)計(jì)提供專業(yè)化、系統(tǒng)化的基礎(chǔ)知識(shí)。如表1所示。

        以試驗(yàn)評(píng)估要素為例,試驗(yàn)評(píng)估知識(shí)結(jié)構(gòu)與要素主要圍繞試驗(yàn)、評(píng)估與研討分析及相關(guān)業(yè)務(wù)展開,其中,試驗(yàn)評(píng)估分析知識(shí)包括4個(gè)方面的核心要素:仿真試驗(yàn)、實(shí)裝試驗(yàn)、作戰(zhàn)評(píng)估以及試驗(yàn)分析。每一點(diǎn)核心要素下又細(xì)分為多個(gè)子要素。這些要素之間有些相互關(guān)聯(lián),具備一些遞進(jìn)、包含關(guān)系,詳細(xì)結(jié)構(gòu)與要素如表2所示。

        又如武器裝備知識(shí)結(jié)構(gòu)與要素主要圍繞武器裝備分類體系、描述模型展開,形成的知識(shí)結(jié)構(gòu)與要素,其中,武器裝備知識(shí)包括7個(gè)方面的核心要素:裝備分類體系、裝備屬性與能力、裝備戰(zhàn)技指標(biāo)、裝備作戰(zhàn)效能、裝備使用保障要求、裝備編配關(guān)系以及裝備演化關(guān)系。每一點(diǎn)核心要素下又細(xì)分為多個(gè)子要素。這些要素之間有些相互關(guān)聯(lián),具備一些遞進(jìn)、包含關(guān)系,詳細(xì)結(jié)構(gòu)與要素如表3所示。

        3 武器裝備領(lǐng)域本體模型設(shè)計(jì)

        通過(guò)對(duì)武器裝備知識(shí)結(jié)構(gòu)與要素進(jìn)行概念分析,可以發(fā)現(xiàn),武器裝備知識(shí)領(lǐng)域中,存在如下本體概念:武器裝備、裝備能力、裝備戰(zhàn)技指標(biāo)、裝備保障環(huán)境、裝備保障崗位以及裝備使用崗位。其中,武器裝備、裝備能力、裝備戰(zhàn)技指標(biāo)是裝備領(lǐng)域主要的本體,裝備保障環(huán)境、裝備保障崗位以及裝備使用崗位是和組織編制領(lǐng)域、戰(zhàn)場(chǎng)環(huán)境領(lǐng)域交疊的本體。

        下面將以履帶自行榴彈炮為子類本體模型舉例:

        定義:履帶自行榴彈炮本體模型

        O<履帶自行榴彈炮>={ C<履帶自行榴彈炮>,A<履帶自行榴彈炮>,

        R<履帶自行榴彈炮>,X<履帶自行榴彈炮>,TI<履帶自行榴彈炮>}

        其中,各元素詳細(xì)定義如下:

        ① 概念 C<履帶自行榴彈炮>:自行榴彈炮的一種,采用履帶式機(jī)動(dòng)方式。

        ②屬性 A<履帶自行榴彈炮>:

        ③ 關(guān)系 R<履帶自行榴彈炮>:

        ④ 公理規(guī)則 X<履帶自行榴彈炮>:暫無(wú)

        ⑤典型實(shí)例TI<履帶自行榴彈炮>:【155mm自行榴彈炮】等

        4 知識(shí)庫(kù)結(jié)構(gòu)設(shè)計(jì)

        在邏輯上,通常將知識(shí)庫(kù)劃分為兩個(gè)層次:數(shù)據(jù)層和模式層,也可稱為實(shí)體庫(kù)和本體庫(kù)。

        數(shù)據(jù)層:數(shù)據(jù)層主要是由一系列的事實(shí)組成,而知識(shí)將以事實(shí)為單位進(jìn)行存儲(chǔ),通常通過(guò)(頭實(shí)體,關(guān)系,尾實(shí)體),(實(shí)體,屬性,屬性值)這樣的三元組來(lái)表達(dá)事實(shí)。

        模式層:在數(shù)據(jù)層之上,是知識(shí)庫(kù)的核心,存儲(chǔ)經(jīng)過(guò)提煉的知識(shí),通常通過(guò)本體模型來(lái)構(gòu)建這一層(本體模型可以理解為面向?qū)ο罄锏摹邦悺边@樣一個(gè)概念,本體模型形成的本體庫(kù)就儲(chǔ)存著知識(shí)庫(kù)的類)。例如:

        模式層:實(shí)體-關(guān)系-實(shí)體,實(shí)體-屬性-性值;

        數(shù)據(jù)層:斯特賴克步兵營(yíng)-配備-M1127裝甲偵察車 M1127裝甲偵察車-最大公路行駛速度-100km/h。

        4.1知識(shí)庫(kù)構(gòu)建技術(shù)路線

        從原始的領(lǐng)域數(shù)據(jù)到形成知識(shí)庫(kù),必須經(jīng)過(guò)數(shù)據(jù)整合與處理、知識(shí)抽取、知識(shí)融合、知識(shí)加工等步驟。

        對(duì)于領(lǐng)域內(nèi)的結(jié)構(gòu)化、非結(jié)構(gòu)化以及半結(jié)構(gòu)化數(shù)據(jù),通過(guò)一系列自動(dòng)化或半自動(dòng)化的技術(shù)手段,利用對(duì)應(yīng)工具進(jìn)行數(shù)據(jù)整合與處理。然后根據(jù)建立的本體模型以及相應(yīng)的智能模型庫(kù),從整合后的數(shù)據(jù)中提取知識(shí),包括提取實(shí)體、屬性和關(guān)系。接著將對(duì)提取到的知識(shí)進(jìn)行知識(shí)融合,將提取的知識(shí)與知識(shí)庫(kù)進(jìn)行匹配融合,形成可以入庫(kù)的知識(shí)。然后對(duì)可以入庫(kù)的知識(shí)進(jìn)行加工,從中發(fā)現(xiàn)新的本體、推理新的知識(shí)以及校驗(yàn)評(píng)估知識(shí)的質(zhì)量。完成加工后,即可將知識(shí)入庫(kù)存儲(chǔ)。

        4.2知識(shí)庫(kù)構(gòu)建流程

        構(gòu)建知識(shí)庫(kù)是一個(gè)迭代更新的過(guò)程,根據(jù)知識(shí)獲取的邏輯,每一輪迭代包含知識(shí)抽取、知識(shí)融合和知識(shí)加工三個(gè)階段:

        4.2.1知識(shí)抽取

        領(lǐng)域知識(shí)提取是領(lǐng)域知識(shí)圖譜構(gòu)建過(guò)程中最核心的一環(huán),是后續(xù)圍繞領(lǐng)域知識(shí)圖譜開展應(yīng)用研究的重要基礎(chǔ),能夠有效提取領(lǐng)域知識(shí)直接關(guān)系到最終系統(tǒng)應(yīng)用的效果。領(lǐng)域知識(shí)提取主要包含:實(shí)體抽取、關(guān)系抽取和屬性抽取。

        4.2.1.1實(shí)體抽取

        實(shí)體是知識(shí)圖譜中的基本單元,實(shí)體抽取是指從文本數(shù)據(jù)集中自動(dòng)識(shí)別出命名實(shí)體,是自然語(yǔ)言處理中的一個(gè)經(jīng)典問(wèn)題,其目的就是從一段自然語(yǔ)言文本中找出相關(guān)實(shí)體,并標(biāo)注出其位置以及類型。在軍事領(lǐng)域中,命名實(shí)體識(shí)別的作用是識(shí)別出領(lǐng)域內(nèi)各種非結(jié)構(gòu)化文檔中的軍事相關(guān)實(shí)體,具體包括基本軍事概念、作戰(zhàn)運(yùn)用、組織編制、作戰(zhàn)能力、武器裝備、作戰(zhàn)評(píng)估、教育訓(xùn)練、戰(zhàn)場(chǎng)環(huán)境、試驗(yàn)評(píng)估等多類實(shí)體。比如在下面一段文本中,通過(guò)實(shí)體抽取我們可以從其中抽取出實(shí)體——“斯特賴克旅”“旅部”“旅部連”“斯特賴克步兵營(yíng)”“旅保障營(yíng)”和“步兵連”,其類型都為組織架構(gòu)。

        “斯特賴克旅下轄旅部及旅部連,3個(gè)斯特賴克步兵營(yíng)和一個(gè)旅保障營(yíng),斯特賴克步兵營(yíng)由三個(gè)相同編制的步兵連組成,是該旅的作戰(zhàn)主體,保障營(yíng)向作戰(zhàn)營(yíng)提供伴隨保障,向全旅部隊(duì)提供后勤與維修保障?!?/p>

        實(shí)體識(shí)別包括預(yù)處理階段、特征向量的選取、模型訓(xùn)練、結(jié)果評(píng)估和模型改進(jìn)五個(gè)階段:

        ①處理。包括空格處理、字符大小轉(zhuǎn)換、復(fù)雜數(shù)據(jù)結(jié)構(gòu)的解析和格式轉(zhuǎn)換、上下文異構(gòu)的消除等。

        ②特征向量是指能夠識(shí)別實(shí)體的屬性集合。特征向量的選取方法包括領(lǐng)域?qū)<沂止ぶ付ê蜋C(jī)器學(xué)習(xí)方法等。

        ③對(duì)于處理好的數(shù)據(jù)作為輸入,構(gòu)造訓(xùn)練集,進(jìn)行模型的訓(xùn)練,以便能夠?qū)?shí)體進(jìn)行識(shí)別。

        ④對(duì)于提取出的實(shí)體的結(jié)果,主要根據(jù)兩個(gè)評(píng)價(jià)指標(biāo)衡量實(shí)體識(shí)別模型的性能:召回率和準(zhǔn)確率。召回率(REC)等于系統(tǒng)正確識(shí)別的結(jié)果占所有可能正確結(jié)果的比例;準(zhǔn)確率(PRE)等于系統(tǒng)正確識(shí)別的結(jié)果占所有識(shí)別結(jié)果的比例。為了綜合評(píng)價(jià)系統(tǒng)的性能,通常還計(jì)算召回率和準(zhǔn)確率的加權(quán)幾何平均值,即F指數(shù),計(jì)算公式如下:

        其中,β是召回率和準(zhǔn)確率的相對(duì)權(quán)重。β等于1時(shí),二者同樣重要;β大于1時(shí),準(zhǔn)確率更重要一些;β小于1時(shí),召回率更重要一些。

        ⑤根據(jù)實(shí)體識(shí)別結(jié)果的評(píng)估,如果存在指標(biāo)過(guò)低的情況,需要對(duì)模型進(jìn)行改進(jìn)。

        4.2.1.2關(guān)系抽取

        實(shí)體之間的關(guān)系是知識(shí)圖譜中不可或缺的部分,不同的關(guān)系將獨(dú)立的實(shí)體連接在一起編織成知識(shí)圖譜。如何從非結(jié)構(gòu)化的數(shù)據(jù)中識(shí)別出實(shí)體之間的關(guān)系是知識(shí)圖譜構(gòu)建的核心任務(wù)之一。軍事領(lǐng)域?qū)嶓w關(guān)系抽取的主要目的在于通過(guò)各種關(guān)系抽取模型和技術(shù)手段將非結(jié)構(gòu)化文檔中的各類軍事相關(guān)實(shí)體之間的關(guān)系抽取出來(lái),諸如,組織架構(gòu)和武器裝備之間的配備關(guān)系,武器裝備之間的配套關(guān)系,組織架構(gòu)之間的隸屬關(guān)系,武器裝備與軍事環(huán)境之間的適用關(guān)系。通過(guò)關(guān)系抽取技術(shù),將彼此孤立的各類軍事相關(guān)實(shí)體相互連接起來(lái)形成軍事領(lǐng)域知識(shí)圖譜,為之后的智能問(wèn)答,知識(shí)推理,知識(shí)推薦,智能決策輔助等應(yīng)用提供重要的知識(shí)支撐。

        關(guān)系抽取任務(wù)被廣泛應(yīng)用于數(shù)據(jù)簡(jiǎn)化和構(gòu)建知識(shí)圖譜中。在上階段正確識(shí)別實(shí)體的基礎(chǔ)上,抽取它們之間的關(guān)系就是亟待解決的重要問(wèn)題。該任務(wù)的定義是,給定標(biāo)注了兩個(gè)實(shí)體的句子,返回兩個(gè)實(shí)體之間的語(yǔ)義關(guān)系。比如,給定句子“斯特賴克輪式裝甲車是美國(guó)陸軍最新一代主戰(zhàn)裝備,也是陸軍部隊(duì)轉(zhuǎn)型的重要標(biāo)志?!?,其中,“斯特賴克輪式裝甲車”代表武器裝備實(shí)體,“美國(guó)陸軍”代表組織架構(gòu)實(shí)體,返回關(guān)系“武器裝備-配備給-組織架構(gòu)”。關(guān)系抽取任務(wù)得到的結(jié)果常用于問(wèn)答系統(tǒng)和知識(shí)圖譜等應(yīng)用,是基礎(chǔ)且重要的自然語(yǔ)言處理任務(wù)。

        文本語(yǔ)料經(jīng)過(guò)實(shí)體抽取之后,得到的是一系列離散的命名實(shí)體,為了得到語(yǔ)義信息,還需要從相關(guān)語(yǔ)料中提取出實(shí)體之間的關(guān)聯(lián)關(guān)系,通過(guò)關(guān)系將實(shí)體聯(lián)系起來(lái),才能夠形成網(wǎng)狀的知識(shí)結(jié)構(gòu)。

        關(guān)系抽取包括數(shù)據(jù)標(biāo)注、模型訓(xùn)練、結(jié)果評(píng)估和模型改進(jìn)四個(gè)階段:

        ①數(shù)據(jù)標(biāo)注:是對(duì)識(shí)別出的實(shí)體和實(shí)體之間的關(guān)系進(jìn)行標(biāo)注。

        ②模型訓(xùn)練:使用已標(biāo)注好的數(shù)據(jù)集進(jìn)行模型訓(xùn)練。

        ③關(guān)系抽取的結(jié)果,也是根據(jù)兩個(gè)評(píng)價(jià)指標(biāo)衡量關(guān)系抽取模型的性能:召回率和準(zhǔn)確率。為了綜合評(píng)價(jià)系統(tǒng)的性能,通常也計(jì)算召回率和準(zhǔn)確率的加權(quán)幾何平均值,即F指數(shù),計(jì)算公式如式(5.1).

        ④根據(jù)關(guān)系抽取結(jié)果的評(píng)估,如果存在指標(biāo)過(guò)低的情況,需要對(duì)模型進(jìn)行改進(jìn)。

        4.2.1.3屬性抽取

        屬性抽取的目標(biāo)是從不同信息源中采集特定實(shí)體的屬性信息,如針對(duì)美國(guó)陸軍裝備主戰(zhàn)坦克“M1A2主戰(zhàn)坦克”,可以從網(wǎng)絡(luò)公開信息中得到其長(zhǎng)度,高度,行動(dòng)距離,重量,乘員等屬性信息。將實(shí)體的屬性視作實(shí)體與屬性值之間的一種名詞性關(guān)系,將屬性抽取任務(wù)轉(zhuǎn)化為關(guān)系抽取任務(wù),因此可以通過(guò)關(guān)系抽取方法來(lái)進(jìn)行屬性抽取。常見(jiàn)的抽取方法包含:

        ①基于規(guī)則和啟發(fā)式算法,抽取結(jié)構(gòu)化數(shù)據(jù)。

        ②基于百科類網(wǎng)站的半結(jié)構(gòu)化數(shù)據(jù),通過(guò)自動(dòng)抽取生成訓(xùn)練語(yǔ)料,用于訓(xùn)練實(shí)體屬性標(biāo)注模型,然后將其應(yīng)用于對(duì)非結(jié)構(gòu)化數(shù)據(jù)的實(shí)體屬性抽取。

        ③采用數(shù)據(jù)挖掘的方法直接從文本中挖掘?qū)嶓w屬性和屬性值之間的關(guān)系模式,據(jù)此實(shí)現(xiàn)對(duì)屬性名和屬性值在文本中的定位。

        4.2.2知識(shí)融合

        通過(guò)知識(shí)抽取,已經(jīng)能夠?qū)④娛骂I(lǐng)域內(nèi)各種內(nèi)部,外部海量數(shù)據(jù)中的實(shí)體,關(guān)系,屬性抽取出來(lái),但是由于領(lǐng)域數(shù)據(jù)采集的來(lái)源廣泛,知識(shí)質(zhì)量良莠不齊,存在不同數(shù)據(jù)源知識(shí)重復(fù),層次結(jié)構(gòu)缺失等問(wèn)題,必須進(jìn)行知識(shí)的融合,使得不同知識(shí)源的知識(shí)在同一框架規(guī)范下進(jìn)行異構(gòu)數(shù)據(jù)整合,消歧,加工,推理驗(yàn)證,更新等步驟,形成高質(zhì)量的知識(shí)庫(kù)。知識(shí)融合的技術(shù)主要包括共指消解結(jié)束和實(shí)體鏈接技術(shù)。

        4.2.2.1共指消解

        共指消解是自然語(yǔ)言處理的重要問(wèn)題,旨在發(fā)現(xiàn)非結(jié)構(gòu)化文本中指向同一實(shí)體的不同文字表達(dá)(指稱語(yǔ))。

        從軍事領(lǐng)域內(nèi)各種內(nèi)外部文檔中提取出的實(shí)體,在文檔中往往存在不同的指稱語(yǔ),比如,在段落“斯特賴克旅下轄旅部及旅部連,3個(gè)斯特賴克步兵營(yíng)和一個(gè)旅保障營(yíng),斯特賴克步兵營(yíng)由三個(gè)相同編制的步兵連組成,是該旅的作戰(zhàn)主體,保障營(yíng)向作戰(zhàn)營(yíng)提供伴隨保障,向全旅部隊(duì)提供后勤與維修保障?!敝?,對(duì)于組織編制類實(shí)體“斯特賴克旅”,在文中存在另外兩個(gè)不同的指稱:“該旅”,“全旅部隊(duì)”,確定不同指稱語(yǔ)在真實(shí)世界中所指向的同一實(shí)體的過(guò)程稱為共指消解,共指消解對(duì)于知識(shí)圖譜的構(gòu)建十分重要,它能檢測(cè)出同一實(shí)體在文本中的的各種不同或相同的表述,包括普通名詞短語(yǔ),專有名詞和代詞等,豐富了實(shí)體在文本中的上下文環(huán)境,完善了實(shí)體的屬性,關(guān)系等信息,同時(shí)避免了在進(jìn)行知識(shí)圖譜構(gòu)建時(shí),誤將同一實(shí)體的不同指稱當(dāng)做不同的實(shí)體而存儲(chǔ)到知識(shí)圖譜中,保證了知識(shí)圖譜中實(shí)體的唯一性。

        4.2.2.2實(shí)體鏈接

        實(shí)體鏈接是指將文本中的實(shí)體鏈接到指定的知識(shí)庫(kù)。其基本思想是首先根據(jù)給定的實(shí)體指稱項(xiàng),從知識(shí)庫(kù)中選出一組候選實(shí)體對(duì)象,然后通過(guò)相似度計(jì)算將指稱項(xiàng)鏈接到正確的實(shí)體對(duì)象。通過(guò)將外部非結(jié)構(gòu)化文檔中的實(shí)體與現(xiàn)有知識(shí)圖譜中的實(shí)體進(jìn)行鏈接,然后融合二者的屬性關(guān)系到現(xiàn)有的知識(shí)圖譜中,可以幫助現(xiàn)有知識(shí)圖譜的不斷更新和完善。

        4.2.3知識(shí)加工

        4.2.3.1本體自動(dòng)構(gòu)建

        本體可以人工手動(dòng)構(gòu)建,也可以采用數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)化方式構(gòu)建本體。因?yàn)槿斯し绞焦ぷ髁烤薮?,且很難找到符合要求的專家,因此當(dāng)前都是從一些面向特定領(lǐng)域的現(xiàn)有本體庫(kù)出發(fā),采用自動(dòng)構(gòu)建技術(shù)逐步擴(kuò)展得到的。自動(dòng)化本體構(gòu)建過(guò)程包括三個(gè)階段:

        ①實(shí)體并列關(guān)系相似度計(jì)算

        ②實(shí)體上下位關(guān)系抽取

        ③本體的生成

        4.2.3.2知識(shí)推理

        知識(shí)推理,就是根據(jù)已有的數(shù)據(jù)模型和數(shù)據(jù),依據(jù)推理規(guī)則,獲取新的知識(shí)或結(jié)論,新的知識(shí)或結(jié)論應(yīng)該是滿足語(yǔ)義的。知識(shí)推理,依據(jù)描述邏輯系統(tǒng)實(shí)現(xiàn)。一個(gè)描述邏輯系統(tǒng)由四個(gè)基本部分組成:最基本的元素:概念、關(guān)系、個(gè)體;TBox術(shù)語(yǔ)集:概念術(shù)語(yǔ)的公理集合;Abox斷言集:個(gè)體的斷言集合;描述邏輯涉及到的內(nèi)容也比較多,比如,根據(jù)句子中的實(shí)體關(guān)系“M1A2主戰(zhàn)坦克是美國(guó)陸軍裝備的主要的主戰(zhàn)坦克。”,“美國(guó)軍隊(duì)由美國(guó)陸軍,美國(guó)海軍,美國(guó)空軍,美國(guó)海軍陸戰(zhàn)隊(duì),美國(guó)海岸警衛(wèi)隊(duì)所構(gòu)成”可以直接推理出關(guān)系:“美國(guó)軍隊(duì)-武器裝備-M1A2主戰(zhàn)坦克”。通過(guò)推理發(fā)現(xiàn)新的知識(shí),應(yīng)用比較多,說(shuō)明知識(shí)圖譜很多時(shí)候會(huì)應(yīng)用推理。

        4.2.3.3質(zhì)量評(píng)估

        質(zhì)量評(píng)估,就是對(duì)最后的結(jié)果數(shù)據(jù)進(jìn)行評(píng)估,將合格的數(shù)據(jù)放入知識(shí)圖譜中。對(duì)于經(jīng)過(guò)融合的新知識(shí),需要經(jīng)過(guò)質(zhì)量評(píng)估之后(部分需要人工參與甄別),才能將合格的部分加入到知識(shí)庫(kù)中,以確保知識(shí)庫(kù)的質(zhì)量。質(zhì)量評(píng)估的方法,根據(jù)所構(gòu)建的知識(shí)圖譜的不同,對(duì)數(shù)據(jù)要求的差異而有所差別。總的目的是要獲得合乎要求的知識(shí)圖譜數(shù)據(jù),要求的標(biāo)準(zhǔn)根據(jù)具體情況確定。比如對(duì)于公共領(lǐng)域的知識(shí)圖譜,知識(shí)的獲取采用了眾包的方法,對(duì)于同一個(gè)知識(shí)點(diǎn),可能會(huì)有很多人來(lái)完成,如果這個(gè)知識(shí)點(diǎn)只有一個(gè)答案,可以采用的一種策略是,將多人的標(biāo)注結(jié)果進(jìn)行比較,取投票多的結(jié)果作為最終的結(jié)果。當(dāng)然,這是不嚴(yán)謹(jǐn)?shù)?,因?yàn)檎胬硗莆赵谏贁?shù)人的手里,特別是針對(duì)一些行業(yè)的知識(shí)圖譜,表現(xiàn)尤為突出。行業(yè)內(nèi)的一條知識(shí),可能只有行業(yè)專家能夠給出權(quán)威正確的答案,如果讓大眾投票來(lái)決定,可能會(huì)得到一條錯(cuò)誤的知識(shí)。所以,針對(duì)行業(yè)知識(shí)圖譜,可能會(huì)采用不同于公共知識(shí)圖譜的策略,來(lái)進(jìn)行知識(shí)的質(zhì)量評(píng)估。

        5 結(jié)束語(yǔ)

        作戰(zhàn)試驗(yàn)實(shí)施過(guò)程中的海量數(shù)據(jù)帶來(lái)了信息過(guò)載的問(wèn)題,降低了參試人員獲取知識(shí)的效率。作戰(zhàn)試驗(yàn)知識(shí)圖譜提供了一種管理與利用海量異構(gòu)數(shù)據(jù)源的有效方式,大量的作戰(zhàn)試驗(yàn)數(shù)據(jù)能夠得到良好的表達(dá)與組織。將其應(yīng)用到作戰(zhàn)試驗(yàn)領(lǐng)域內(nèi)的智能搜索、深度問(wèn)答、輔助決策等方面,有助于決策和分析人員快速準(zhǔn)確地獲取知識(shí),增進(jìn)知識(shí)的共享,提高信息化條件下的決策分析能力。本文在對(duì)知識(shí)圖譜的定義及架構(gòu)進(jìn)行闡述的基礎(chǔ)上,研究了作戰(zhàn)試驗(yàn)數(shù)據(jù)知識(shí)圖譜的構(gòu)建技術(shù)流程,能夠支撐作戰(zhàn)試驗(yàn)大規(guī)模分析、統(tǒng)一籌劃、輔助決策等多種應(yīng)用,具有重要的軍事應(yīng)用前景。

        參考文獻(xiàn)

        [1]陳乘風(fēng),何宇,趙偉.加強(qiáng)作戰(zhàn)數(shù)據(jù)建設(shè)的思考[J].軍隊(duì)信息化建設(shè),2012,(2):16-17.

        [2]張引, 陳敏, 廖小飛. 大數(shù)據(jù)應(yīng)用的現(xiàn)狀與展望[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(s2):216-233.

        [3]曹會(huì)智, 李沛, 劉俊杰, 等. 大數(shù)據(jù)時(shí)代背景下裝備保障建設(shè)發(fā)展研究[J]. 中國(guó)管理信息化, 2014(17):52-54.

        [4]阮彤, 王夢(mèng)婕, 王昊奮, 等. 垂直知識(shí)圖譜的構(gòu)建與應(yīng)用研究[J]. 知識(shí)管理論壇, 2016(3):226-234.

        [5]徐增林, 盛泳潘, 賀麗榮, 等.知識(shí)圖譜技術(shù)綜述[J].電子科技大學(xué)學(xué)報(bào), 2016, 45(4):589-606.

        [6]劉嶠, 李楊, 楊段宏, 等. 知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展, 2016, 53(3):582-600.

        [7]嚴(yán)紅, 黃穎, 應(yīng)勵(lì)志. 面向軍事信息系統(tǒng)結(jié)構(gòu)化數(shù)據(jù)的信息匯聚方法[J]. 指揮信息系統(tǒng)與技術(shù), 2015, 6(1):29-34.

        [8]李濤, 王次臣, 李華康. 知識(shí)圖譜的發(fā)展與構(gòu)建[J]. 南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版), 2017, 41(1):22-34.

        (作者單位:王小龍,中國(guó)人民解放軍陸軍工程大學(xué);劉小朋,中國(guó)人民解放軍陸軍工程大學(xué)、中國(guó)人民解放軍63861部隊(duì);王磊,中國(guó)人民解放軍63861部隊(duì);王宏,中國(guó)人民解放軍陸軍工程大學(xué)、云南省臨滄軍分區(qū))

        猜你喜歡
        知識(shí)圖譜
        國(guó)內(nèi)外智庫(kù)研究態(tài)勢(shì)知識(shí)圖譜對(duì)比分析
        國(guó)內(nèi)信息素養(yǎng)研究的知識(shí)圖譜分析
        國(guó)內(nèi)圖書館嵌入式服務(wù)研究主題分析
        國(guó)內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)
        近十五年我國(guó)小學(xué)英語(yǔ)教學(xué)研究的熱點(diǎn)、問(wèn)題及對(duì)策
        基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
        基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
        國(guó)內(nèi)酒店品牌管理研究進(jìn)展的可視化分析
        從《ET&S》與《電化教育研究》對(duì)比分析中管窺教育技術(shù)發(fā)展
        專家知識(shí)圖譜構(gòu)建研究
        久久精品国产6699国产精| 国产欧美日韩精品丝袜高跟鞋| 吃奶呻吟打开双腿做受视频 | 国产成人无码综合亚洲日韩| 久久久久久免费毛片精品| 免费高清日本中文| 国产性感主播一区二区| 国产毛片视频一区二区| 久久精品国产精油按摩| 激情另类小说区图片区视频区| 亚洲国产一区二区三区在观看 | 无码熟妇人妻av在线网站| 熟女体下毛毛黑森林| 91精品视品在线播放| 99精品国产av一区二区| 免费黄片小视频在线播放| 精品亚洲成a人片在线观看| 久久香蕉免费国产天天看| 免费人成视频网站在线观看不卡| 亚洲视频一区二区免费看| 天堂中文官网在线| 四虎永久免费一级毛片| 蜜臀av人妻一区二区三区 | 国产在线一区二区av| 精品国产拍国产天天人| 日韩中文网| 中文字幕一区二区三区四区久久| 日本精品一区二区高清| 曝光无码有码视频专区| 在线看片国产免费不卡| 日韩一二三四区在线观看| 国产精品无码久久综合网| 成人区人妻精品一区二区不卡网站| 一本一道久久a久久精品综合蜜桃 成年女人18毛片毛片免费 | 国产精品成人va在线观看| 日韩区在线| 久久青青草原亚洲av| 狠狠色噜噜狠狠狠777米奇| 丰满爆乳无码一区二区三区| 久久国产av在线观看| 电驱蚊液可以插一晚上吗 |