亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識(shí)庫(kù)的開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)

        2018-09-19 01:05:10張濤賈真李天瑞黃雁勇
        智能系統(tǒng)學(xué)報(bào) 2018年4期
        關(guān)鍵詞:謂詞三元組分詞

        張濤,賈真,李天瑞,黃雁勇

        (西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756)

        信息檢索是目前互聯(lián)網(wǎng)時(shí)代的一個(gè)熱門(mén)研究方向。搜索引擎則是一種常見(jiàn)的信息檢索手段,它根據(jù)用戶輸入的查詢語(yǔ)句進(jìn)行關(guān)鍵字匹配,并對(duì)結(jié)果進(jìn)行排序,返回包含關(guān)鍵字的頁(yè)面鏈接,并不會(huì)直接給出問(wèn)題的答案,需要用戶自己瀏覽網(wǎng)頁(yè)才能得到想要的答案。但是問(wèn)答系統(tǒng)卻能夠克服這個(gè)缺點(diǎn),用戶輸入問(wèn)句后問(wèn)答系統(tǒng)會(huì)給出一個(gè)準(zhǔn)確簡(jiǎn)潔的答案。

        本文提出了一種基于知識(shí)庫(kù)的開(kāi)放領(lǐng)域自動(dòng)問(wèn)答系統(tǒng)。首先,對(duì)問(wèn)句進(jìn)行實(shí)體識(shí)別,即需要明確問(wèn)句問(wèn)的是關(guān)于哪個(gè)實(shí)體的,實(shí)體識(shí)別是問(wèn)答系統(tǒng)中非常重要的一個(gè)部分,本文提出了自定義詞典分詞與CRF模型相結(jié)合的命名實(shí)體識(shí)別方法來(lái)完成該系統(tǒng)中的命名實(shí)體識(shí)別;其次,對(duì)實(shí)體進(jìn)行鏈接,即用問(wèn)句中識(shí)別出的實(shí)體查詢知識(shí)庫(kù),返回實(shí)體名稱相同或相近的實(shí)體信息,本文采用模糊匹配中后模糊匹配的方法來(lái)進(jìn)行實(shí)體鏈接;然后,對(duì)謂詞進(jìn)行識(shí)別,即需要明確問(wèn)句所問(wèn)內(nèi)容與實(shí)體的哪個(gè)屬性相關(guān),謂詞識(shí)別同樣也是該系統(tǒng)中一個(gè)非常重要的部分,本文采用了直接謂詞匹配、詞匯字面相似度和語(yǔ)義相似度及規(guī)則映射表3種方法來(lái)完成對(duì)問(wèn)句中謂詞的識(shí)別;最后,進(jìn)行實(shí)體消歧、獲取答案,由于知識(shí)庫(kù)中存在很多同名實(shí)體,而且大多數(shù)同名實(shí)體的屬性也相同或者相似,這就會(huì)導(dǎo)致答案會(huì)有多條,所以需要對(duì)包含答案的實(shí)體進(jìn)行消歧,獲取唯一的答案。

        1 相關(guān)研究

        問(wèn)答系統(tǒng)(question answering system, QA)目前已經(jīng)成為人工智能和自然語(yǔ)言處理領(lǐng)域中一個(gè)備受關(guān)注并具有廣泛發(fā)展前景的研究方向[1]?,F(xiàn)有的問(wèn)答系統(tǒng)可以分為:1)基于搜索引擎的問(wèn)答系統(tǒng);2)基于社區(qū)的問(wèn)答系統(tǒng);3)基于知識(shí)庫(kù)的問(wèn)答系統(tǒng);4)基于文本的問(wèn)答系統(tǒng)?;谒阉饕娴膯?wèn)答系統(tǒng)首先需要解析問(wèn)句,獲得問(wèn)句主體及類(lèi)型,然后在搜索引擎返回的檢索結(jié)果中按照問(wèn)句類(lèi)型抽取答案[2]。基于社區(qū)的問(wèn)答主要是問(wèn)句與互聯(lián)網(wǎng)上的社區(qū)中用戶提出的問(wèn)句經(jīng)過(guò)相似度計(jì)算返回結(jié)果[3]。而基于知識(shí)庫(kù)的問(wèn)答系統(tǒng)最主要的工作是進(jìn)行問(wèn)句理解[4-10],提取出問(wèn)句中的主體和謂詞。比如Poon[11]、Yahya[12]和Berant[13-15]分別提出了基于語(yǔ)義分析的問(wèn)答系統(tǒng)構(gòu)建方法,其主要思路是先抽取問(wèn)句中的主體和謂詞,然后轉(zhuǎn)化為SPARQL結(jié)構(gòu)化查詢語(yǔ)言,之后再與知識(shí)庫(kù)交互得到答案。基于自由文本的問(wèn)答系統(tǒng)則是從非結(jié)構(gòu)化文本中抽取問(wèn)句所問(wèn)的答案。例如,Zheng[16]提出了一種從網(wǎng)頁(yè)文本中抽取問(wèn)句答案的方法。

        2 開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)方法概述

        2.1 知識(shí)庫(kù)預(yù)處理

        1)對(duì)subject中的英文大小寫(xiě)進(jìn)行統(tǒng)一

        因?yàn)橹R(shí)庫(kù)中的subject和問(wèn)句中的subject存在英文大小寫(xiě)不統(tǒng)一的問(wèn)題,所以將知識(shí)庫(kù)subject中的英文都轉(zhuǎn)化為小寫(xiě)。

        2)去除subject中的一些特殊的字符

        在知識(shí)庫(kù)subject中存在很多特殊字符比如“-”、“+”、“.”等。這些字符會(huì)影響分詞和實(shí)體鏈接的結(jié)果,所以將subject中的這些特殊字符去掉。

        2.2 實(shí)體識(shí)別

        本文的實(shí)體識(shí)別采用的是自定義詞典分詞和CRF模型相結(jié)合的方法。實(shí)體識(shí)別的詳細(xì)流程如圖1所示。

        圖 1 實(shí)體識(shí)別流程圖Fig. 1 Procedure of entity recognition

        2.2.1 自定義詞典分詞識(shí)別實(shí)體

        本文采用西南交通大學(xué)分詞系統(tǒng),它允許加載自定義分詞詞典進(jìn)行分詞。自定義詞典分詞過(guò)程中,首先是根據(jù)詞典中的詞進(jìn)行組塊分詞,若在自定義詞典中不存在再使用原分詞算法進(jìn)行分詞和詞性標(biāo)注。由此本文將知識(shí)庫(kù)中的subject提取出來(lái)構(gòu)建自定義詞典用于分詞,以識(shí)別問(wèn)句中的subject。但是若將知識(shí)庫(kù)中的所有subject都作為詞典,可能問(wèn)句中的普通詞也被識(shí)別為實(shí)體。所以需要對(duì)subject進(jìn)行篩選后再加入詞典。本文將知識(shí)庫(kù)中的subject進(jìn)行分詞,若subject分詞之后詞的數(shù)目大于2,則將該subject加入詞典。通過(guò)此方法構(gòu)建的詞典中包含2 761 745個(gè)實(shí)體詞,其中部分詞典如表1所示。

        表 1 自定義分詞詞典Table 1 The dictionary of custom segment

        若問(wèn)句中沒(méi)有包含詞典中的詞,則利用分詞系統(tǒng)進(jìn)行實(shí)體識(shí)別。例如,若問(wèn)句中出現(xiàn)詞性為nr、nh、nt等的詞,則將其標(biāo)注為實(shí)體。具體標(biāo)記的詞性和詞性說(shuō)明如表2所示。問(wèn)句中沒(méi)有包含這些詞性,則采用圖1的算法進(jìn)行實(shí)體識(shí)別。

        表 2 詞性和詞性說(shuō)明表Table 2 The part of speech and its instruction

        2.2.2 基于CRF的實(shí)體識(shí)別

        1) CRF模型介紹

        條件隨機(jī)場(chǎng)算法(conditional random field algorithm, CRF)被認(rèn)為是一種基于圖模型的算法,由于該圖是一種無(wú)向圖,因此也是一種無(wú)向圖模型[17]。在圖模型中,其中的結(jié)點(diǎn)表示算法的輸入序列和輸出序列,主要用來(lái)計(jì)算輸出序列的概率問(wèn)題。條件隨機(jī)場(chǎng)算法最主要的功能就是讓無(wú)向圖中的各個(gè)結(jié)點(diǎn)呈現(xiàn)出線性結(jié)構(gòu)。線性的條件隨機(jī)場(chǎng)算法同時(shí)也是一個(gè)有限的狀態(tài)機(jī),該狀態(tài)機(jī)可以進(jìn)行線性數(shù)據(jù)的序列標(biāo)注工作。當(dāng)有限狀態(tài)機(jī)接收到輸入的序列后,線性的條件隨機(jī)場(chǎng)算法可以計(jì)算出輸出序列,并且能夠返回該輸出序列的條件概率。在條件隨機(jī)場(chǎng)算法中,訓(xùn)練模型的主要功能就是得到條件概率最大的模型[18]。

        2) CRF實(shí)體識(shí)別

        由于建立詞典和標(biāo)記特殊詞性的實(shí)體識(shí)別方法不能完全識(shí)別出所有問(wèn)句中的實(shí)體,所以本文采用了CRF算法來(lái)做進(jìn)一步的實(shí)體識(shí)別。CRF是一種常見(jiàn)的命名實(shí)體識(shí)別方法,并取得了比較好的實(shí)驗(yàn)結(jié)果。用CRF做命名實(shí)體識(shí)別的步驟如下:

        1)人工標(biāo)注一些問(wèn)句中的實(shí)體作為訓(xùn)練數(shù)據(jù);

        2)用標(biāo)注好實(shí)體的訓(xùn)練數(shù)據(jù)訓(xùn)練CRF模型;

        3)用CRF模型來(lái)對(duì)未標(biāo)注實(shí)體的問(wèn)句進(jìn)行實(shí)體標(biāo)注。

        本文利用已知實(shí)體回標(biāo)的方式自動(dòng)獲取訓(xùn)練數(shù)據(jù)。即通過(guò)3.2.1中的方法得到實(shí)體所在的問(wèn)句作為實(shí)體識(shí)別的訓(xùn)練數(shù)據(jù)。但是這些訓(xùn)練數(shù)據(jù)中存在少量錯(cuò)誤,需要人工再對(duì)訓(xùn)練數(shù)據(jù)做出修正。我們一共標(biāo)注了約13 000條訓(xùn)練數(shù)據(jù)。

        2.3 實(shí)體鏈接

        命名實(shí)體鏈接是指將文本中已經(jīng)識(shí)別出的命名實(shí)體鏈接到知識(shí)庫(kù)中的一個(gè)具體真實(shí)實(shí)體的過(guò)程。實(shí)體鏈接是目前自然語(yǔ)言處理領(lǐng)域的一種常用技術(shù)。本文采用的是模糊匹配中后模糊匹配的方法進(jìn)行實(shí)體鏈接。具體方法步驟如下:

        1)將問(wèn)句中識(shí)別出的實(shí)體去除其中含括號(hào)的消歧項(xiàng),只保留實(shí)體原名稱,如:“武漢大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)/entity”,去除括號(hào)內(nèi)消歧項(xiàng),只保留“武漢大學(xué)學(xué)報(bào)”。

        2)用去除消歧項(xiàng)的實(shí)體名稱到知識(shí)庫(kù)中進(jìn)行后模糊匹配查找,后模糊匹配即忽略知識(shí)庫(kù)中實(shí)體名稱后面的所有詞,只關(guān)注知識(shí)庫(kù)中subject的前n個(gè)字是否與所要查找的實(shí)體名稱是否一致,n為待查找實(shí)體名稱的長(zhǎng)度。如“武漢大學(xué)學(xué)報(bào)”,只關(guān)注知識(shí)庫(kù)subject的前6個(gè)字是否與“武漢大學(xué)學(xué)報(bào)”完全匹配。

        3)由于后模糊匹配有可能找出一些實(shí)體名稱根本不可能是一個(gè)實(shí)體的subject,如在知識(shí)庫(kù)中用后模糊匹配查找“李明”,這會(huì)返回一下幾個(gè)實(shí)體:“李明 (蘇州大學(xué)教授)”、“李明慧 (大連輕工業(yè)學(xué)院副教授)”、“李明(中醫(yī)藥研究教授)”等。其中“李明慧(大連輕工業(yè)學(xué)院副教授)”就與“李明”不可能是同一個(gè)實(shí)體,這是后模糊匹配忽略了“李明”之后的所有詞才導(dǎo)致了這個(gè)結(jié)果,對(duì)于這種情況本文首先對(duì)查找出來(lái)的實(shí)體去除括號(hào)里面的消歧項(xiàng),然后與原查找名稱進(jìn)行比較,若不相等則刪掉該實(shí)體。

        2.4 謂詞匹配

        謂詞匹配的作用是確定問(wèn)句問(wèn)的是實(shí)體的哪個(gè)屬性(謂詞)。本文采用了多種謂詞匹配方法,其中包括直接謂詞匹配法、詞匯字面相似度和語(yǔ)義相似度相結(jié)合的方法、規(guī)則映射法以及同義詞表映射法。

        2.4.1 直接謂詞匹配法

        在自然語(yǔ)言問(wèn)句中有經(jīng)常會(huì)出現(xiàn)很多問(wèn)句中直接包含謂詞的情況,可以通過(guò)直接謂詞匹配的方法進(jìn)行查找答案。具體方法如下:提取所有鏈接實(shí)體的謂詞作為候選謂詞,然后進(jìn)行直接匹配。若問(wèn)句中除去實(shí)體之外的詞中包含謂詞,則將該謂詞所對(duì)應(yīng)的三元組加入三元組列表中。

        2.4.2 詞匯字面相似度和語(yǔ)義相似度相結(jié)合的方法

        由于語(yǔ)言表達(dá)的多樣性,問(wèn)句中的很多謂詞并不能通過(guò)直接匹配法找到。針對(duì)那些謂詞不是直接包含在問(wèn)句中或謂詞以同義詞的形式出現(xiàn)在問(wèn)句中的情況,本文采用了字面相似度和語(yǔ)義相似度相結(jié)合的方法來(lái)識(shí)別謂詞。字面相似度計(jì)算公式為

        式中:N為鏈接實(shí)體中的某個(gè)謂詞長(zhǎng)度,遍歷謂詞的每個(gè)字w,若w在問(wèn)句中出現(xiàn),則n=n+1(n的初始值為零)。

        本文使用的語(yǔ)義相似度計(jì)算是基于《知網(wǎng)》的相似度算法,該方法是由夏天在《漢語(yǔ)詞語(yǔ)語(yǔ)義相似度計(jì)算研究》[19]一文中所提出的。《知網(wǎng)》是一個(gè)以漢語(yǔ)和英語(yǔ)的詞語(yǔ)所代表的概念為描述對(duì)象,以揭示概念與概念之間以及概念所具有的屬性之間的關(guān)系為基本內(nèi)容的常識(shí)知識(shí)庫(kù)。在《知網(wǎng)》中,詞匯對(duì)應(yīng)于若干概念,而概念是以義原為基礎(chǔ)通過(guò)知識(shí)庫(kù)描述語(yǔ)言進(jìn)行定義的,即概念的義項(xiàng)表達(dá)式,義原又通過(guò)多種關(guān)系進(jìn)行描述,如上下位關(guān)系等,目前大多數(shù)學(xué)者基于《知網(wǎng)》的詞匯語(yǔ)義相似度計(jì)算,其思想是整體相似度可由部分相似度加權(quán)平均進(jìn)行計(jì)算。

        本文字面相似度和語(yǔ)義相似度結(jié)合匹配謂詞的步驟如下:

        1)計(jì)算謂詞和問(wèn)句的字面相似度,若字面相似度等于1,則表示謂詞直接出現(xiàn)在問(wèn)句中,并將該謂詞所對(duì)應(yīng)的三元組加入三元組列表中;

        2)計(jì)算謂詞與問(wèn)句中去除實(shí)體后的每個(gè)詞的語(yǔ)義相似度,若存在與謂詞語(yǔ)義相似度等于1的詞,則表示謂詞出現(xiàn)在問(wèn)句中,并將該謂詞所對(duì)應(yīng)的三元組加入三元組列表中;

        3)若步驟1)、2)后,問(wèn)句中都沒(méi)有謂詞,則取步驟1)中的字面相似度sim在0.5~1的謂詞,計(jì)算這些謂詞與問(wèn)句中去除實(shí)體后的每個(gè)詞的語(yǔ)義相似度,取其中之最大的謂詞所對(duì)應(yīng)的三元組加入三元組列表中。

        2.4.3 規(guī)則映射法

        由于2.4.1和2.4.2都是以詞為單位進(jìn)行謂詞查找的,但是有些屬性是多個(gè)詞共同表達(dá)的,如問(wèn)句“·· · ···什么時(shí)候去世”,謂詞“去世地點(diǎn)”和“去世時(shí)間”都包含“去世”,但“什么時(shí)候”表達(dá)了時(shí)間。我們制定了規(guī)則解決這一類(lèi)問(wèn)句的謂詞識(shí)別問(wèn)題。例如,對(duì)于“什么時(shí)候”后接一個(gè)動(dòng)詞的,可將其映射為動(dòng)詞+(時(shí)間|日期)。如“什么時(shí)候去世”,“去世”是動(dòng)詞,什么時(shí)候表示時(shí)間,就可以映射為“去世時(shí)間”或“去世日期”。表3列出了規(guī)則示例。

        表 3 規(guī)則映射表Table 3 Examples of rule set

        若經(jīng)過(guò)步驟2.4.1和2.4.2后,仍然還未找到謂詞,則驗(yàn)證問(wèn)句中是否包含表3中的規(guī)則,若包含則用規(guī)則映射后的詞語(yǔ)去匹配鏈接實(shí)體在知識(shí)庫(kù)中的每個(gè)謂詞,匹配謂詞的方法為步驟2)中的詞匯字面相似度和語(yǔ)義相似度相結(jié)合的方法,若找到相同或相似的謂詞則將該謂詞所對(duì)應(yīng)的三元組加入三元組列表中。

        2.4.4 同義詞表映射法

        在常見(jiàn)問(wèn)句中還有一些問(wèn)句中的謂詞是以同義詞的形式存在,或者每個(gè)問(wèn)句格式可以對(duì)應(yīng)一些特定的謂詞。如問(wèn)句中存在“有多高”這種疑問(wèn)詞,則可以將謂詞映射為“高度”。對(duì)于這些問(wèn)句本文采用建立同義詞表的方法來(lái)做謂詞映射。如“什么意思”其同義詞表可為“含義|意義|解釋”。本文建立了同義詞映射表,部分同義詞表如表4所示。

        表 4 同義詞映射表Table 4 Examples of synonym list

        同樣,問(wèn)句如果經(jīng)過(guò)2.4.1、2.4.2和2.4.3這3個(gè)步驟后還沒(méi)有找到相應(yīng)的答案,則驗(yàn)證問(wèn)句中是否包含表4中的詞匯,若包含則用同義詞表中的詞語(yǔ)去匹配實(shí)體的每個(gè)謂詞,若找到相同或相似的謂詞則將該謂詞所對(duì)應(yīng)的三元組加入三元組列表中。

        2.5 獲取答案

        在完成謂詞匹配后就能夠得到謂詞所對(duì)應(yīng)的三元組列表,三元組列表中每個(gè)對(duì)應(yīng)object都是問(wèn)題的答案。三元組列表包含一個(gè)或多個(gè)答案。這是因?yàn)橹R(shí)庫(kù)中存在很多同名實(shí)體,而且同名實(shí)體其謂詞基本上是相同或相似的,導(dǎo)致有些問(wèn)句就會(huì)出現(xiàn)一個(gè)或多個(gè)答案。需要從答案列表中選擇一個(gè)作為最終的答案,即答案篩選。本文采用的方法是對(duì)所有答案對(duì)應(yīng)的實(shí)體名稱進(jìn)行實(shí)體消歧,消歧后得到三元組中的object作為該問(wèn)題的答案。

        本文實(shí)體消歧的方法如下:

        1)取分詞后問(wèn)句中所有名詞(實(shí)體詞除外);

        2)對(duì)三元組列表中的subject進(jìn)行分詞并去除其中的標(biāo)點(diǎn)符號(hào);

        3)將所有subject分詞后的所有詞與步驟1)中的所有名詞計(jì)算詞匯語(yǔ)義相似度,取其中語(yǔ)義相似度最大的subject所對(duì)應(yīng)的object作為問(wèn)句的答案。

        如“西游記屬于什么類(lèi)型的書(shū)呢”,完成實(shí)體識(shí)別和分詞后的句子為“西游記/entity屬于/v 什么/ry 類(lèi)型/n 的/ude1 書(shū)/n 呢/y”。該問(wèn)句中,“西游記”被識(shí)別為實(shí)體詞,即主體subject。經(jīng)過(guò)上述步驟 1),取問(wèn)句中的名詞 “類(lèi)型/n 書(shū)/n”,其他詞過(guò)濾掉。而經(jīng)過(guò)謂詞識(shí)別后得到知識(shí)庫(kù)三元組如表5所示。其中“西游記(吳承恩等著作小說(shuō))”,經(jīng)過(guò)步驟2)的結(jié)果為“西游記/nz 吳承恩/nr 等/v著/uzhe 作/v 小說(shuō)/n”。然后將步驟1)和2)進(jìn)行交叉計(jì)算語(yǔ)義相似度,取其中最大的語(yǔ)義相似度作為該實(shí)體與問(wèn)句的相似度。由于“小說(shuō)”和“書(shū)”的語(yǔ)義相似度為1,所以該實(shí)體與問(wèn)句的語(yǔ)義相似度為1。由于其他subject與問(wèn)句的語(yǔ)義相似沒(méi)有比1大的,所以該問(wèn)句的答案為subject為“《西游記》(吳承恩等著作小說(shuō))”所對(duì)應(yīng)的object,即“古典神魔小說(shuō)”。

        表 5 “西游記”實(shí)體鏈接和謂詞匹配后的三元組列表Table 5 Triple list of “Journey to the West” after entity link and predicate matching

        3 實(shí)驗(yàn)結(jié)果及分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)集描述

        1)知識(shí)庫(kù)

        本文中使用的知識(shí)庫(kù)是NLPCC2016測(cè)評(píng)中發(fā)布的知識(shí)庫(kù)[19]。知識(shí)庫(kù)是以三元組的形式給出的,三元組格式為 總共有43 063 796條三元組,其示例數(shù)據(jù)如表6所示。

        2)數(shù)據(jù)集

        ①訓(xùn)練數(shù)據(jù)集:本文采用的訓(xùn)練數(shù)據(jù)集是NLPCC2016測(cè)評(píng)提供的數(shù)據(jù)[19],其中包含14 609測(cè)試問(wèn)句。

        ②測(cè)試數(shù)據(jù)集,本文采用的測(cè)試數(shù)據(jù)集也是NLPCC2016測(cè)評(píng)提供的數(shù)據(jù)[19-20],其中包括9 870條測(cè)試問(wèn)句。

        表 6 知識(shí)庫(kù)三元組Table 6 Triples in knowledge base

        3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

        此次評(píng)測(cè)使用了F-Measure值來(lái)衡量開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)的性能。其相應(yīng)的計(jì)算公式為

        3.3 實(shí)驗(yàn)評(píng)測(cè)結(jié)果

        本文根據(jù)謂詞識(shí)別方法的不同做了幾組實(shí)驗(yàn),分別為直接匹配、直接匹配+組合謂詞、直接匹配+詞語(yǔ)相似度、以及所有方法組合即本文最終采用的方法,其中詞語(yǔ)相似度包含詞語(yǔ)字面相似度以及詞語(yǔ)語(yǔ)義相似度。實(shí)驗(yàn)結(jié)果如表7所示,可見(jiàn)本文最終采用的方法的F值比其他幾種方法的F值都要好。

        表 7 評(píng)測(cè)結(jié)果Table 7 Evaluation results in the task

        4 結(jié)束語(yǔ)

        針對(duì)NLPCC2016開(kāi)放領(lǐng)域問(wèn)答測(cè)評(píng)提供的問(wèn)句,本文提出了一種基于知識(shí)庫(kù)的開(kāi)放領(lǐng)域問(wèn)題的問(wèn)答系統(tǒng)構(gòu)建方法,該方法首先對(duì)問(wèn)句進(jìn)行實(shí)體識(shí)別,即提取出問(wèn)句中的實(shí)體,在識(shí)別出問(wèn)句實(shí)體之后則進(jìn)行謂詞匹配,將謂詞匹配度高的object作為問(wèn)句的答案返回。為了提高問(wèn)答系統(tǒng)的準(zhǔn)確率,本文還對(duì)知識(shí)庫(kù)進(jìn)行了適當(dāng)清理。實(shí)驗(yàn)表明基于本文所提出的方法的平均F值為0.695 6,充分證明了本文所提出方法的可行性。

        猜你喜歡
        謂詞三元組分詞
        基于語(yǔ)義增強(qiáng)雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
        被遮蔽的邏輯謂詞
        ——論胡好對(duì)邏輯謂詞的誤讀
        黨項(xiàng)語(yǔ)謂詞前綴的分裂式
        西夏研究(2020年2期)2020-06-01 05:19:12
        關(guān)于余撓三元組的periodic-模
        結(jié)巴分詞在詞云中的應(yīng)用
        值得重視的分詞的特殊用法
        也談“語(yǔ)言是存在的家”——從語(yǔ)言的主詞與謂詞看存在的殊相與共相
        三元組輻射場(chǎng)的建模與仿真
        高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
        国产 无码 日韩| 亚洲日本在线电影| 911精品国产91久久久久| 2022AV一区在线| 人妻经典中文字幕av| 免费人成年激情视频在线观看| 无码国产精品一区二区vr老人| 久久青青草原国产精品最新片| 精品蜜桃av免费观看| 男女18禁啪啪无遮挡激烈网站 | 一本一道av中文字幕无码| 揄拍成人国产精品视频| 国产少妇一区二区三区| 中文字幕av久久亚洲精品| 国产成人精品一区二区不卡| 国产精品久久综合桃花网| 女同重口味一区二区在线| 久久亚洲精品国产亚洲老地址| 国产香蕉尹人在线观看视频| 久久国产精品免费一区二区| 亚洲中文字幕在线第六区| 国产无套粉嫩白浆在线| 久久国产精品久久精品国产| 色偷偷亚洲av男人的天堂| 亚洲国产性夜夜综合另类| 久久综合国产乱子伦精品免费 | 久久久精品亚洲一区二区国产av| 中文无码熟妇人妻av在线| 久久99精品免费一区二区| 国产精品午夜福利天堂| 高清午夜福利电影在线| 亚洲欧洲巨乳清纯| 东京热无码人妻中文字幕| 午夜国产精品视频在线观看| 亚洲精品国产av天美传媒| 亚洲制服无码一区二区三区| 在线观看视频亚洲一区二区三区| 久人人爽人人爽人人片av| 国产精品-区区久久久狼| 亚洲中文字幕熟女五十| 久久精品免费一区二区喷潮|