亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于開(kāi)源數(shù)據(jù)的武器裝備知識(shí)圖譜構(gòu)建方法研究*

        2018-04-12 06:08:28丁君怡趙青松夏博遠(yuǎn)鄒志剛
        指揮控制與仿真 2018年2期
        關(guān)鍵詞:詞匯表三元組分詞

        丁君怡, 趙青松, 夏博遠(yuǎn), 鄒志剛

        (1.國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院, 湖南 長(zhǎng)沙 410073;2.復(fù)雜航空系統(tǒng)仿真重點(diǎn)實(shí)驗(yàn)室, 北京 100076)

        武器裝備信息的獲取與存儲(chǔ)對(duì)于裝備論證工作與軍隊(duì)發(fā)展起著重要作用。目前對(duì)于武器裝備信息的存儲(chǔ)主要以傳統(tǒng)的數(shù)據(jù)庫(kù)形式為主,存在著數(shù)據(jù)量大,關(guān)聯(lián)性差,呈現(xiàn)方式不直觀,更新與維護(hù)繁瑣等現(xiàn)象。而新興的知識(shí)圖譜作為基于圖結(jié)構(gòu)的知識(shí)存儲(chǔ)管理模式,具有關(guān)系清晰,結(jié)構(gòu)靈活,可視化程度高的優(yōu)勢(shì)。構(gòu)建基于開(kāi)源數(shù)據(jù)的武器裝備知識(shí)圖譜有利于形成更為高效明確的武器裝備信息管理體系,從而有效改善現(xiàn)有武器裝備信息管理弊端。

        知識(shí)圖譜(Knowledge Graph)[1]的概念是2012年由Google公司公開(kāi)發(fā)布的。其本質(zhì)是由符合RDF技術(shù)標(biāo)準(zhǔn)的“實(shí)體-關(guān)系-實(shí)體”與“實(shí)體-屬性-屬性值”三元組為基本單位相互連接交織形成的知識(shí)網(wǎng)絡(luò)[2]。荊濤,左萬(wàn)利等[3]提出了EPTT算法與DTRE算法,對(duì)中文網(wǎng)頁(yè)文本實(shí)現(xiàn)了較為精確的語(yǔ)義標(biāo)注與關(guān)系抽取,實(shí)現(xiàn)了文本到RDF結(jié)構(gòu)的映射。蔣鍇等[4]對(duì)于知識(shí)圖譜在軍事領(lǐng)域的應(yīng)用進(jìn)行了探索并形成了軍事信息搜索技術(shù)架構(gòu)。Rathachai Chawuthai[5]等通過(guò)將關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)性知識(shí)實(shí)現(xiàn)了RDF的可視化。S.Murugesh和A. Jaya[6]通過(guò)將自然語(yǔ)言的句子表示為RDF格式來(lái)獲取知識(shí)模式并構(gòu)建領(lǐng)域本體。Ze-Qi Lin[7]等人面向軟件領(lǐng)域提出了“智能發(fā)展環(huán)境”與“軟件知識(shí)圖譜”的概念,并對(duì)其構(gòu)建與應(yīng)用的過(guò)程進(jìn)行了詳細(xì)的闡述。Chunhong Zhang等[8]通過(guò)構(gòu)建一種新的TransHR知識(shí)表示模型,將高維關(guān)系轉(zhuǎn)化為實(shí)體對(duì)間獨(dú)立的向量,實(shí)現(xiàn)了對(duì)于高維關(guān)系數(shù)據(jù)的知識(shí)圖譜嵌入。Xiangling Zhang[9]等人推出了一種基于對(duì)三元組中主語(yǔ)與賓語(yǔ)相似度計(jì)算來(lái)推測(cè)知識(shí)圖譜語(yǔ)義相似度的方法,實(shí)現(xiàn)了知識(shí)圖譜的補(bǔ)全。Jay Pujara[10]在利用隱馬爾科夫場(chǎng)模型與概率的基礎(chǔ)上,提出了KGI(Knowledge Graph Identification)方法,實(shí)現(xiàn)了知識(shí)圖譜中知識(shí)的推理與預(yù)測(cè)。

        本文通過(guò)對(duì)中文開(kāi)源網(wǎng)絡(luò)文本的標(biāo)注與識(shí)別,形成RDF三元組,提出構(gòu)建武器裝備領(lǐng)域知識(shí)圖譜的基本思路與方法指導(dǎo)。

        1 基于開(kāi)源數(shù)據(jù)的武器裝備知識(shí)圖譜構(gòu)建框架

        基于開(kāi)源數(shù)據(jù)的武器裝備知識(shí)圖譜構(gòu)建,主要由抽取并準(zhǔn)備相關(guān)信息與繪制知識(shí)圖譜兩大部分組成,具體如圖1所示。

        圖1 武器裝備知識(shí)圖譜構(gòu)建框架

        第一部分是進(jìn)行武器裝備信息的抽取與處理。裝備信息是武器裝備知識(shí)圖譜構(gòu)建的基礎(chǔ)。開(kāi)源的裝備信息主要以文本的形式存在于互聯(lián)網(wǎng)的各類資源中。為了將文本中的信息轉(zhuǎn)化為可服務(wù)于武器裝備知識(shí)圖譜構(gòu)建的結(jié)構(gòu)化知識(shí),需要按照數(shù)據(jù)梳理,對(duì)比識(shí)別,形成RDF三元組的步驟對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行處理。

        第二部分是進(jìn)行武器裝備知識(shí)圖譜的繪制,基于抽取與處理后的結(jié)構(gòu)化知識(shí),以可視化的方式對(duì)武器裝備知識(shí)圖譜進(jìn)行繪制與呈現(xiàn),展示各武器裝備實(shí)體及其關(guān)系。

        2 基于開(kāi)源數(shù)據(jù)的武器裝備信息抽取

        2.1 數(shù)據(jù)梳理

        1)建立武器裝備領(lǐng)域本體

        領(lǐng)域本體(Domain Ontology)是能夠描述特定領(lǐng)域內(nèi)實(shí)體概念及相互關(guān)系領(lǐng)域活動(dòng)以及該領(lǐng)域所具有的特性和規(guī)律的一種形式化描述。構(gòu)建武器裝備領(lǐng)域本體能夠明確知識(shí)結(jié)構(gòu),避免知識(shí)圖譜構(gòu)建中出現(xiàn)過(guò)多冗余與錯(cuò)誤。在初期的本體建模中采取人工建模的形式完成對(duì)武器裝備領(lǐng)域本體概念與屬性的刻畫(huà)與定義。本文針對(duì)武器裝備領(lǐng)域應(yīng)用Protégé軟件工具對(duì)于本體進(jìn)行構(gòu)造。

        圖2 Protégé中武器裝備領(lǐng)域部分本體類的結(jié)構(gòu)

        2)形成武器裝備體系詞匯表

        在包含不同的語(yǔ)法規(guī)則與大量同義詞的復(fù)雜文本環(huán)境中,為了更高效地識(shí)別網(wǎng)絡(luò)文本中的信息,需要進(jìn)一步構(gòu)建武器裝備體系詞匯表,對(duì)武器裝備本體庫(kù)進(jìn)行適當(dāng)補(bǔ)充。

        通過(guò)設(shè)立χ2檢驗(yàn)值評(píng)估所檢驗(yàn)詞匯與武器裝備領(lǐng)域關(guān)聯(lián)程度的方法構(gòu)建武器裝備體系詞匯表。收集與武器裝備領(lǐng)域相關(guān)與不相關(guān)的兩批文本材料作為比對(duì)參照庫(kù),研究同一詞匯在武器裝備相關(guān)領(lǐng)域與不相關(guān)領(lǐng)域的網(wǎng)絡(luò)文本材料中出現(xiàn)頻率的差異,從而決定該詞匯是否應(yīng)當(dāng)被加入到武器裝備體系詞匯表中。

        (1)

        針對(duì)任一詞匯k,公式中ti0表示對(duì)于分類i,不含詞匯k的網(wǎng)絡(luò)文本數(shù)目,ti1表示對(duì)于分類i,包含詞匯k的網(wǎng)絡(luò)文本數(shù)目,n表示包含與不包含該詞匯的兩大類網(wǎng)絡(luò)文本的總數(shù)目,n=(t11+t00+t10+t01)。在具體試驗(yàn)中,運(yùn)用WordSmith軟件完成對(duì)文檔中出現(xiàn)詞頻的分析。通過(guò)計(jì)算詞匯的χ2值,可以體現(xiàn)出被測(cè)詞匯與武器裝備體系領(lǐng)域的相關(guān)程度。χ2值越高的詞匯,說(shuō)明其與武器裝備領(lǐng)域的相關(guān)性越強(qiáng),從而可以考慮將該詞匯納入武器裝備體系詞匯表。

        本文選取互動(dòng)百科為爬蟲(chóng)軟件的爬取對(duì)象,爬取與武器裝備體系相關(guān)的百科詞條124篇,與其不相關(guān)的其他詞條926篇,作為初始庫(kù)對(duì)詞匯進(jìn)行測(cè)試與篩選。其中與武器裝備領(lǐng)域相關(guān)的詞條文本統(tǒng)一稱為正類,與其無(wú)關(guān)的詞條文本統(tǒng)一稱為反類。對(duì)于爬取到的網(wǎng)絡(luò)文本進(jìn)行去HTML標(biāo)簽與分詞處理,得到經(jīng)過(guò)初步處理的正類文本95篇,反類文本821篇。表1為基于以上網(wǎng)絡(luò)文本得出的部分高χ2值的武器裝備領(lǐng)域詞匯。

        表1 部分高χ2值的武器裝備領(lǐng)域詞匯

        得到武器裝備體系詞匯表后,通過(guò)將詞匯表中涉及的詞匯與相應(yīng)概念加入武器裝備分詞詞典,可以擴(kuò)充由人工構(gòu)建的武器裝備體系本體庫(kù),并使得本體庫(kù)更加傾向于武器裝備體系的領(lǐng)域知識(shí),與通用的本體知識(shí)庫(kù)明確地區(qū)分開(kāi),在構(gòu)建相關(guān)領(lǐng)域知識(shí)圖譜時(shí)具有更高的針對(duì)性。

        2.2 對(duì)比識(shí)別

        在比對(duì)識(shí)別時(shí),采取EPTT算法進(jìn)行實(shí)現(xiàn),該算法大致結(jié)構(gòu)如圖3所示。

        圖3 EPTT算法流程示意

        第一步:通用實(shí)體識(shí)別與標(biāo)注。應(yīng)用目前較為成熟的人工設(shè)計(jì)規(guī)則(正則表達(dá)式),對(duì)于時(shí)間、地點(diǎn)等較為通用的實(shí)體開(kāi)展實(shí)體識(shí)別,并標(biāo)注出這些通用實(shí)體的類型。

        第二步:精確詞匯匹配與類型標(biāo)注。通過(guò)對(duì)照武器裝備領(lǐng)域詞匯表,精確匹配出文本中的武器裝備領(lǐng)域?qū)嶓w并對(duì)這些實(shí)體進(jìn)行類型標(biāo)注。

        第三步:近似詞匯匹配與類型標(biāo)注。利用N-gram切分技術(shù),將文本中的句子與武器裝備體系詞匯表中的詞匯進(jìn)行比對(duì)與近似匹配。目的是盡量避免精確匹配時(shí)遺漏可匹配詞匯,對(duì)于近似匹配成功的分詞也進(jìn)行相應(yīng)的類型標(biāo)注。但這種增多匹配次數(shù)的方法在減少匹配遺漏的同時(shí)也有可能導(dǎo)致部分錯(cuò)誤匹配混入,為了平衡這兩種效果,具體實(shí)驗(yàn)時(shí)設(shè)定一個(gè)相關(guān)的參數(shù)對(duì)于是否需要進(jìn)行第三步的近似詞匯匹配進(jìn)行控制。

        第四步:分詞結(jié)果調(diào)整。將匹配到通用類型的實(shí)體按照本體所規(guī)范的形式進(jìn)行處理。對(duì)于指代或表達(dá)同一實(shí)體的分詞,將它們?nèi)亢喜橐粋€(gè)新的詞匯。

        2.3 形成RDF三元組

        1)語(yǔ)法結(jié)構(gòu)分析

        在對(duì)于文本進(jìn)行了類型標(biāo)注的工作基礎(chǔ)上,通過(guò)對(duì)語(yǔ)法結(jié)構(gòu)的分析將這些經(jīng)過(guò)分詞處理與模式匹配的語(yǔ)料詞匯整合為符合RDF技術(shù)標(biāo)準(zhǔn)的三元組,形成構(gòu)建知識(shí)圖譜的基礎(chǔ)資料。

        法國(guó)語(yǔ)言學(xué)家Lucien Tesnière提出語(yǔ)法結(jié)構(gòu)具有較強(qiáng)的層次性,而其建立的根源也是最一般的關(guān)系從屬關(guān)系(或依存關(guān)系)。主導(dǎo)這種從屬關(guān)系的往往是句中的動(dòng)詞,它前后的詞匯因?yàn)閯?dòng)詞的存在常常構(gòu)成支配與被支配的關(guān)系,而這種支配與被支配的方式由這個(gè)動(dòng)詞描述。這一從屬關(guān)系與RDF形式三元組中的主謂賓關(guān)系形成很大程度上的對(duì)應(yīng)關(guān)系,通常來(lái)說(shuō),主語(yǔ)為支配者,而賓語(yǔ)為被支配者。根據(jù)這種基本的從屬形式概念,可以從屬對(duì)R(Gov,Dep)的形式來(lái)表征存在從屬關(guān)系的兩個(gè)詞匯。其中R表示動(dòng)詞表示的關(guān)系,Gov為占支配地位的詞匯,Dep為受到支配的詞匯。將多個(gè)從屬對(duì)以類似樹(shù)狀的形式進(jìn)行堆疊,就可以在一定程度上表示復(fù)雜句子中的詞匯關(guān)系。一般情況下,以Gov詞作為父節(jié)點(diǎn),Dep詞作為子節(jié)點(diǎn),這樣形成的樹(shù)狀結(jié)構(gòu)被稱為從屬樹(shù)。更進(jìn)一步,多個(gè)從屬樹(shù)以各種關(guān)系相互關(guān)聯(lián),可以組成從屬森林,對(duì)應(yīng)表征有多個(gè)子句的復(fù)雜長(zhǎng)句。

        利用Stanford Parser來(lái)識(shí)別分析句子中的從屬結(jié)構(gòu)。這一技術(shù)需要依靠短語(yǔ)結(jié)構(gòu)樹(shù)(phrase structure tree)所提供的規(guī)則與模式進(jìn)行語(yǔ)法成分參考,在參考庫(kù)的領(lǐng)域特征較不明顯時(shí),需要人工對(duì)標(biāo)簽集進(jìn)行一定的修正與篩選。本文選擇應(yīng)用中文賓州樹(shù)庫(kù)(Penn Treebank Chinese)作為中文語(yǔ)法的參考庫(kù),其中包含大量標(biāo)簽對(duì)詞匯之間的從屬關(guān)系進(jìn)行描述。

        例如句子:“殲-20將在對(duì)空作戰(zhàn)中發(fā)揮作用,是先進(jìn)的空軍裝備?!痹诮?jīng)過(guò)分詞與語(yǔ)義解析后,可以得到如圖4所示的從屬樹(shù)。

        圖4 從屬樹(shù)示例

        圖4中連線上的標(biāo)簽表示詞匯間不同的關(guān)系。其中top, attr, nsubj, dobj表示主謂賓關(guān)系,top與nsubj表示主語(yǔ),其余兩個(gè)標(biāo)簽表示賓語(yǔ),它們的從屬關(guān)系依附于與其連線相接的以謂語(yǔ)成分存在的動(dòng)詞;prep與pobj分別代表介詞與介詞賓語(yǔ);ccomp表示從句關(guān)系;nmod表示修飾關(guān)系。

        如果將圖4從屬樹(shù)中的從屬對(duì)全部拆分出來(lái),那么按照上文提到的R(Gov,Dep)表示形式,應(yīng)當(dāng)有:ccomp(發(fā)揮,是),nsubj(發(fā)揮,殲-20),dobj(發(fā)揮,作用),prep(發(fā)揮,在),top(是,殲-20),attr(是,空軍裝備),pobj(在,對(duì)空作戰(zhàn)),nmod(空軍裝備,先進(jìn)的)。

        2)關(guān)系抽取

        在對(duì)分詞結(jié)果進(jìn)行語(yǔ)法分析的基礎(chǔ)上,利用語(yǔ)義解析得到的從屬樹(shù)中進(jìn)行關(guān)系抽取。此處使用 DTRE算法,輸入經(jīng)過(guò)分詞處理之后的文本句子以及進(jìn)行過(guò)類型標(biāo)注的最終結(jié)果,通過(guò)算法處理,最終直接輸出RDF集以及相應(yīng)的文本片段。

        舉例對(duì)DTRE算法的結(jié)果進(jìn)行說(shuō)明:“殲-20將在對(duì)空作戰(zhàn)中發(fā)揮作用,是戰(zhàn)斗裝備和空軍裝備?!?/p>

        DTRE算法抽取文本關(guān)系的模式如圖5所示,存在一定的順序規(guī)律。直接使用DTRE算法對(duì)于分詞文本進(jìn)行關(guān)系抽取時(shí),可以得到三元組:

        (殲-20,發(fā)揮,作用)

        (殲-20,發(fā)揮作用地點(diǎn),對(duì)空作戰(zhàn))。

        之后需要對(duì)從屬樹(shù)進(jìn)行ccomp從句關(guān)系補(bǔ)全,得到三元組:

        (殲-20,是,戰(zhàn)斗裝備)。

        最后還需要針對(duì)conj并列關(guān)系進(jìn)行拓展,進(jìn)一步得到三元組:

        (殲-20,是,空軍裝備)。

        到此關(guān)系抽取完畢,文本信息完成了從自然語(yǔ)言向RDF三元組映射的過(guò)程。

        圖5 DTRE算法形成RDF三元組結(jié)果說(shuō)明

        對(duì)于武器裝備領(lǐng)域的知識(shí)圖譜構(gòu)建,由于其本身具有較強(qiáng)的從屬結(jié)構(gòu)性,可以按照其本身概念的從屬關(guān)系對(duì)于知識(shí)圖譜進(jìn)行建模。本文在進(jìn)行關(guān)系抽取時(shí)著重考慮“包含”“列裝”等表從屬與分類關(guān)系的詞匯,降低了關(guān)系抽取的難度,并保證了知識(shí)圖譜的邏輯性與結(jié)構(gòu)完好性。

        3 武器裝備知識(shí)圖譜繪制

        在完成對(duì)武器裝備領(lǐng)域知識(shí)進(jìn)行本體構(gòu)建、詞匯收集、文本分詞處理、形成備用知識(shí)三元組的基礎(chǔ)上,融合武器裝備領(lǐng)域固有且已在實(shí)踐中被證明正確性并難以從開(kāi)源數(shù)據(jù)中獲取的領(lǐng)域知識(shí)進(jìn)行武器裝備領(lǐng)域知識(shí)圖譜的繪制。

        知識(shí)圖譜是一張由許多三元組以“節(jié)點(diǎn)-邊-節(jié)點(diǎn)”小單元相互連接交錯(cuò)形成的“大網(wǎng)”。在完成三元組收集之后,把這些小單元組織起來(lái),并將重復(fù)的節(jié)點(diǎn)合并,將同一實(shí)體對(duì)應(yīng)的邊連接到知識(shí)圖譜中對(duì)應(yīng)的同一節(jié)點(diǎn)上,完成從RDF數(shù)據(jù)到知識(shí)圖譜的可視化過(guò)程。

        將收集到的三元組數(shù)據(jù)利用Gephi軟件,以實(shí)體為節(jié)點(diǎn),關(guān)系為邊生成武器裝備領(lǐng)域知識(shí)圖譜。

        為了使得武器裝備知識(shí)圖譜具有較為清晰明了的結(jié)構(gòu)從而便于進(jìn)一步的應(yīng)用與挖掘,在繪制武器裝備知識(shí)圖譜的過(guò)程中需要對(duì)其進(jìn)行適當(dāng)?shù)暮?jiǎn)化與去冗余。

        進(jìn)行知識(shí)圖譜簡(jiǎn)化去冗余的工作中應(yīng)遵循以下原則:

        1)融合以Same-as關(guān)系所連接的節(jié)點(diǎn),并以在三元組集合中出現(xiàn)頻率較高的表述來(lái)命名融合節(jié)點(diǎn),其余節(jié)點(diǎn)與融合得到的新節(jié)點(diǎn)之間若存在一條以上同方向的邊,則僅保留一條;

        2)去除可以通過(guò)相互連接的節(jié)點(diǎn)與邊形成通路推理得出的邊;

        3)去除由等級(jí)分類造成的實(shí)例與概念間的邊。

        經(jīng)過(guò)對(duì)武器裝備知識(shí)圖譜的簡(jiǎn)化處理,得到精簡(jiǎn)后的武器裝備知識(shí)圖譜如圖6所示。

        圖6 去冗余后的武器裝備知識(shí)圖譜

        構(gòu)建武器裝備知識(shí)圖譜的最終目的在于應(yīng)用。從技術(shù)層面來(lái)看,知識(shí)圖譜能夠發(fā)揮的最主要作用在于知識(shí)檢索,其中,裝備組合推薦是較為具有代表性的應(yīng)用方式。

        所謂裝備組合推薦,是指在給定一定目標(biāo)或作戰(zhàn)背景的情況下,從武器裝備知識(shí)圖譜中抽取出能夠?qū)崿F(xiàn)目標(biāo)或適應(yīng)作戰(zhàn)環(huán)境的武器裝備組合。以“空戰(zhàn)武器裝備體系超視距空戰(zhàn)能力”為例,從武器裝備知識(shí)圖譜中抽取支撐這一能力所需的裝備知識(shí),結(jié)果如圖7所示。

        圖7 超視距空戰(zhàn)能力裝備支撐體系推薦

        從推薦結(jié)果使用者可以得到,超視距空戰(zhàn)能力的形成需要?dú)灀魴C(jī)、預(yù)警機(jī)、強(qiáng)擊機(jī)、轟炸機(jī)、空空導(dǎo)彈這樣的裝備組合來(lái)共同實(shí)現(xiàn),而對(duì)于每一類別的裝備,都相應(yīng)地查詢出備選的武器裝備型號(hào),可以較好地服務(wù)于武器裝備論證或應(yīng)用工作。

        本文構(gòu)建武器裝備知識(shí)圖譜基于開(kāi)源數(shù)據(jù),但由于武器裝備保密性等要求,開(kāi)源數(shù)據(jù)可能存在精確度較低、錯(cuò)誤率較高等問(wèn)題,在武器裝備知識(shí)圖譜應(yīng)用的過(guò)程中,需要進(jìn)一步添加更為準(zhǔn)確細(xì)致的非開(kāi)源數(shù)據(jù)對(duì)武器裝備知識(shí)圖譜進(jìn)行補(bǔ)充,如具體的武器裝備參數(shù)、屬性、作戰(zhàn)規(guī)則等。但通過(guò)開(kāi)源數(shù)據(jù)構(gòu)建的武器裝備知識(shí)圖譜具有較高的相容性,數(shù)據(jù)更新相對(duì)便利,數(shù)據(jù)量較大,在進(jìn)行粒度較粗的知識(shí)查詢時(shí),能夠起到較好的效果。

        4 結(jié)束語(yǔ)

        本文在了解知識(shí)圖譜構(gòu)建一般流程與方法的基礎(chǔ)上,通過(guò)對(duì)公開(kāi)網(wǎng)絡(luò)武器裝備數(shù)據(jù)的采集與梳理實(shí)現(xiàn)了部分武器裝備知識(shí)圖譜的構(gòu)建。

        面向開(kāi)源數(shù)據(jù),運(yùn)用Protégé軟件進(jìn)行武器裝備本體建模,并通過(guò)采集武器裝備領(lǐng)域文檔與非武器裝備領(lǐng)域文檔分別作為正類與反類,計(jì)算了部分武器裝備領(lǐng)域詞匯的χ2值,并將計(jì)算值較大的詞匯納入武器裝備詞匯表中,綜合武器裝備本體與詞匯表作為基本的知識(shí)模板對(duì)網(wǎng)絡(luò)文本進(jìn)行抽取、比對(duì)與識(shí)別。利用EPTT算法對(duì)網(wǎng)絡(luò)文本中的句子進(jìn)行分詞處理,并參照構(gòu)建的本體與收集的詞匯表進(jìn)行精確與近似的識(shí)別。進(jìn)一步利用賓州樹(shù)庫(kù)(Penn Treebank Chinese)與Stanford Parser工具對(duì)句子分詞與識(shí)別的結(jié)果進(jìn)行語(yǔ)法分析,并利用DTRE算法對(duì)經(jīng)過(guò)類型標(biāo)注與分析處理的文本進(jìn)行關(guān)系的抽取,將網(wǎng)絡(luò)文本中的主體、謂語(yǔ)、賓語(yǔ)信息映射到RDF三元組形式。最終利用Gephi軟件對(duì)武器裝備知識(shí)圖譜進(jìn)行繪制與展現(xiàn),并在此基礎(chǔ)上討論了基于武器裝備知識(shí)圖譜的面向武器裝備組合推薦的應(yīng)用。

        參考文獻(xiàn):

        [1]徐增林, 盛泳潘, 賀麗榮, 等. 知識(shí)圖譜技術(shù)綜述[J]. 電子科技大學(xué)學(xué)報(bào), 2016,45(4):589-606.

        [2]王昊奮. 大規(guī)模知識(shí)圖譜技術(shù)[EB/OL]. http:∥www.tuicool.com/articles/ranqqb.

        [3]荊濤, 左萬(wàn)利, 孫吉貴, 等. 中文網(wǎng)頁(yè)語(yǔ)義標(biāo)注——由句子到RDF表示[J]. 計(jì)算機(jī)研究與發(fā)展, 2008,45(7):1221-1231.

        [4]蔣鍇, 錢(qián)夔, 鄭玄. 基于知識(shí)圖譜的軍事信息搜索技術(shù)架構(gòu)[J]. 指揮信息系統(tǒng)與技術(shù), 2016,7(1):47-52.

        [5]Chawuthai R, Takeda H. RDF Graph Visualization by Interpreting Linked Data as Knowledge: LNCS[C].5th Joint International Conference, JIST, Yichang, 2015.

        [6]Murugesh S, Jaya A. Representing Natural Language Sentences in RDF Graphs to Derive Knowledge Patterns[C]. Proceedings of the International Conference on Data Engineering and Communication Technology, 2017.

        [7]Lin Z, Xie B, Zou Y, et al. Intelligent Development Environment and Software Knowledge Graph[J]. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2017,32(2):242-249.

        [8]Zhang C, Zhou M, Han X. Knowledge graph embedding for hyper-relational data[J]. TSINGHUA SCIENCE AND TECHNOLOGY, 2017,22(2):185-197.

        [9]Zhang X, Du C, Li P. Knowledge Graph Completion via Local Semantic Contexts: DASFAA[C].International Conference on Database Systems for Advanced Applications, 2016

        [10] Pujara J. Probabilistic Models for Scalable Knowledge Graph Construction[D]. University of Maryland, College Park, 2016.

        猜你喜歡
        詞匯表三元組分詞
        基于語(yǔ)義增強(qiáng)雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
        關(guān)于余撓三元組的periodic-模
        結(jié)巴分詞在詞云中的應(yīng)用
        值得重視的分詞的特殊用法
        巧妙提取英文詞匯表的純英文單詞
        電腦迷(2014年16期)2014-04-29 03:32:41
        三元組輻射場(chǎng)的建模與仿真
        高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
        論英語(yǔ)不定式和-ing分詞的語(yǔ)義傳承
        詞匯表
        男女打扑克视频在线看| 亚州精品无码久久aV字幕| 天堂AV无码AV毛片毛| 熟女少妇精品一区二区三区| 欧洲美熟女乱av亚洲一区| 亚洲精品无码不卡在线播放he| 欧美a在线播放| 日本久久精品国产精品| 国产亚洲精品品视频在线| 亚洲精品www久久久| 国产精品 亚洲 无码 在线| 无码任你躁久久久久久| 久久精品国产亚洲一区二区| 国产一区二区美女主播| 国产无套乱子伦精彩是白视频| 无码精品日韩中文字幕| 91最新免费观看在线| 精品人妻午夜中文字幕av四季| 久久不见久久见免费视频6| 国内精品伊人久久久久影院对白| 久久中国国产Av秘 入口| 国产影院一区二区在线| 日本爽快片100色毛片| 色综合无码av网站| 久久中文字幕久久久久91| 久久av粉嫩一区二区| 欧美性色黄大片手机版| 91呻吟丰满娇喘国产区| 青青草视频在线免费观看91| 精品无码国产一区二区三区麻豆| 一区二区三区国产亚洲网站| 免青青草免费观看视频在线| 91乱码亚洲精品中文字幕| 免费女人高潮流视频在线观看| 國产一二三内射在线看片| 女人一级特黄大片国产精品| 99人中文字幕亚洲区三| 国产真实老熟女无套内射| 日韩av二区三区一区| 中文字幕有码在线人妻| 国产午夜成人av在线播放|