亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于事件語義特征的中文文本蘊(yùn)含識(shí)別

        2013-04-23 07:39:00劉茂福姬東鴻
        中文信息學(xué)報(bào) 2013年5期
        關(guān)鍵詞:子圖正確率語義

        劉茂福,李 妍,姬東鴻

        (1. 武漢科技大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,湖北 武漢 430065; 2. 智能信息處理與實(shí)時(shí)工業(yè)系統(tǒng)湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430065; 3. 武漢大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430072)

        1 引言

        文本蘊(yùn)含[1]通常定義為一個(gè)連貫文本T與一個(gè)假設(shè)文本H之間的一種關(guān)系,即如果假設(shè)文本H的意義可以從文本T的意義中推斷出來,那么T蘊(yùn)含H,可以記為T→H。語義表達(dá)多樣性為自然語言的一個(gè)基本特征,即同樣的意義可以用多種不同的文本進(jìn)行表達(dá),文本蘊(yùn)含的研究目的之一就是解決語義表達(dá)多樣性的問題。文本蘊(yùn)含的識(shí)別實(shí)際上是語言基礎(chǔ)研究,它在自然語言處理的很多應(yīng)用中起著關(guān)鍵作用,如問答系統(tǒng)、多文檔自動(dòng)摘要、信息抽取、語義檢索以及機(jī)器翻譯評測等[2]。

        近年來,文本蘊(yùn)含識(shí)別研究已經(jīng)從早期的純理論研究轉(zhuǎn)換為較大規(guī)模理論研究和經(jīng)驗(yàn)性平臺(tái)建設(shè),在自然語言處理領(lǐng)域備受關(guān)注。日本國立情報(bào)學(xué)研究所NII(National Institute of Informatics)組織的NTCIR(NII Test Collection for IR Systems)在2011年開始了文本蘊(yùn)含識(shí)別RITE(Recognizing Inference in TExt)方面的評測任務(wù)。RITE的目的是評測系統(tǒng)識(shí)別特定語句“關(guān)系”的能力。NTCIR參與RITE評測的語言有日文JA(Japanese)、簡體中文CS(Simplified Chinese)以及繁體中文CT(Traditional Chinese),每種語言都包含兩類子任務(wù),即二分類BC(Binary-Class)子任務(wù)與多分類MC(Multi-Class)子任務(wù)。參與評測的系統(tǒng)需要辨識(shí)給定的兩個(gè)文本之間的關(guān)系,輸出二選一(2-way)或五選一(5-way)的關(guān)系標(biāo)記(Label)。圖1是BC子任務(wù)和MC子任務(wù)的概覽。

        圖1 NTCIR-9 RITE概覽

        蘊(yùn)含關(guān)系識(shí)別通常采用有監(jiān)督機(jī)器學(xué)習(xí)方法,也就是說,首先對大量已有正確蘊(yùn)含關(guān)系標(biāo)簽的文本對進(jìn)行訓(xùn)練,生成分類模型,然后由分類模型決定測試文本對是否具有蘊(yùn)含關(guān)系。采用有監(jiān)督機(jī)器學(xué)習(xí)方法的蘊(yùn)含識(shí)別系統(tǒng),通常為了提高正確率會(huì)混合多種特征。在NTCIR-9中,哈爾濱工業(yè)大學(xué)[3]、復(fù)旦大學(xué)[4]、國立臺(tái)灣大學(xué)[5]、北京郵電大學(xué)[6]、武漢大學(xué)[7]和臺(tái)灣朝陽科技大學(xué)[8]紛紛采用有監(jiān)督機(jī)器學(xué)習(xí)方法解決文本蘊(yùn)含問題,采用的特征包括統(tǒng)計(jì)特征、句法特征以及語義特征等。本文作者參與了NTCIR-9的RITE任務(wù),并提交了基于統(tǒng)計(jì)與詞匯語義特征的中文文本蘊(yùn)含識(shí)別系統(tǒng)WUST;而后的改進(jìn)系統(tǒng)WUST-SLS在WUST-ES系統(tǒng)的基礎(chǔ)上又增加了句法特征。

        本文在統(tǒng)計(jì)特征、句法特征和詞匯語義特征的基礎(chǔ)上增加了事件語義特征。事件是一個(gè)由謂詞以及與其相關(guān)的語義角色所構(gòu)成。事件標(biāo)注后的文本易于進(jìn)行深層語義分析與推理,并能生成事件圖,將文本間的語義關(guān)系轉(zhuǎn)換為事件圖之間的語義關(guān)系。本文采用基于最大公共子圖的事件圖相似度算法來計(jì)算事件語義特征,與統(tǒng)計(jì)特征、詞匯語義特征和句法特征一起作為支持向量機(jī)的分類特征,得到初步實(shí)驗(yàn)結(jié)果,再經(jīng)過基于事件語義規(guī)則集合的修正處理得到最后的識(shí)別結(jié)果。實(shí)驗(yàn)表明,基于事件語義特征的蘊(yùn)含識(shí)別方法適用于中文文本蘊(yùn)含關(guān)系識(shí)別。

        2 WUST-ES框架模型

        WUST-ES模型由預(yù)處理、事件語義特征計(jì)算、SVM分類器和修正模塊四個(gè)部分組成,具體的模型結(jié)構(gòu)圖如圖2所示。

        圖2 WUST-ES模型結(jié)構(gòu)圖

        圖2中,事件預(yù)處理模塊對測試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集進(jìn)行事件語義標(biāo)注,具體的標(biāo)注方法見文章[9],表1列舉了訓(xùn)練數(shù)據(jù)集中的一對文本的標(biāo)注結(jié)果。表1中,T1可以分為三個(gè)事件T1_E1、T1_E2和T1_E3,H1則包含一個(gè)事件H1_ E1。

        表1 事件語義標(biāo)注結(jié)果

        事件語義標(biāo)注完成之后,可以基于標(biāo)注的事件語義,生成事件圖,將文本相似度計(jì)算轉(zhuǎn)化為圖相似度計(jì)算,圖3(a)和圖3(b)為T1和H1的事件圖。

        圖3中,矩形框?yàn)槭录^詞,圓角矩形框?yàn)槭录Z義成分,其語義角色在邊線上,事件謂詞的數(shù)量即文本中包含事件的數(shù)量,T1由三個(gè)原子事件組成, H1只有一個(gè)原子事件。從圖3可發(fā)現(xiàn),即使T1和H1的文本結(jié)構(gòu)不同,但H1的事件圖基本上為T1事件圖的一部分,且T1與H1正向蘊(yùn)含;可以假設(shè),如果兩個(gè)事件圖相似度越高,則文本對間具有蘊(yùn)含關(guān)系的可能性就越大。

        在生成的事件圖基礎(chǔ)上,使用基于最大公共子圖的圖相似度算法計(jì)算生成事件語義特征,將統(tǒng)計(jì)特征、詞匯語義特征、句法特征與事件語義特征組合,利用SVM分類模塊,生成圖2中的“初步結(jié)果”;在“初步結(jié)果”的基礎(chǔ)上進(jìn)行修正,生成圖2中的“最終結(jié)果”。

        圖3 T1與H1的事件圖

        3 事件語義特征

        基于事件圖,將文本對之間的蘊(yùn)含關(guān)系轉(zhuǎn)換為事件圖之間的蘊(yùn)含關(guān)系。事件語義特征由基于最大公共子圖的圖相似度算法計(jì)算得到。

        3.1 事件圖結(jié)構(gòu)

        圖結(jié)構(gòu)表示為一個(gè)三元組,即G=(Node,Edge,Weight),其具體計(jì)算步驟如下:

        (1) 從事件標(biāo)注文本對(T, H)生成的事件圖中提取所有的節(jié)點(diǎn)組成節(jié)點(diǎn)集合NodeT和NodeH,集合NodeT和NodeH是由節(jié)點(diǎn)的內(nèi)容詞w組成,如式(1)所示。

        (2) 從事件標(biāo)注文本對(T,H)生成的事件圖中提取所有邊組成邊集合EdgeT和EdgeH,集合EdgeT和EdgeH是一個(gè)三元組集合,每條邊Eij由兩個(gè)節(jié)點(diǎn)wi和wj以及邊語義角色標(biāo)簽labelij組成,如式(2)所示。

        (2)

        (3) 根據(jù)節(jié)點(diǎn)集和邊集,求邊的權(quán)重集合WeightT和WeightH,集合WeightT和WeightH是二元組集合,由邊Eij和邊權(quán)重wt(Eij)組成,如式(3)所示,其中權(quán)重wt(Eij)的計(jì)算見式(4)。

        式(4)中,freq(wi)為節(jié)點(diǎn)wi出現(xiàn)在文本中的頻率,freq(wi,wj)為節(jié)點(diǎn)wi和wj在文本中的共現(xiàn)頻率。

        (4) 將事件圖G轉(zhuǎn)化為三元組(Node,Edge,Weight),如式(5)所示。

        G={g1,g2,…,gk,…},

        gk=> (5)

        3.2 最大公共子圖

        根據(jù)圖結(jié)構(gòu)GT和GH求解最大公共子圖GC的步驟如下所示:

        (1) 分別遍歷圖結(jié)構(gòu)GT和GH,若GT和 GH之間存在相同的節(jié)點(diǎn)集合,則將相同的節(jié)點(diǎn)集合作為最大公共子圖的節(jié)點(diǎn)集合NodeC;判斷節(jié)點(diǎn)相同,只需判斷wi=wj,其中wi∈NodeT,wj∈NodeH。

        (2) 如果集合NodeC中任兩個(gè)節(jié)點(diǎn)之間存在一條邊Eij,且Eij等于某一條既屬于EdgeT又屬于EdgeH的邊,則將Eij加入GC邊集合EdgeC中。

        (3) 根據(jù)得到的NodeC和EdgeC計(jì)算WeightC,其中WeightC中的二元組集合Wij的計(jì)算見式(6)。

        式(6)中,WT(Eij)為邊Eij在圖GT中存在一條相等的邊Exy的權(quán)重wt(Exy);同理,WH(Eij)為邊Eij在圖GH中存在一條相等的邊Eab的權(quán)重wt(Eab)。

        以上求解最大公共子圖的偽代碼如下所示:

        算法1求解最大公共子圖

        輸入:GT=(NodeT, EdgeT, WeightT)

        GH=(NodeH, EdgeH, WeightH)

        輸出:GC=(NodeC, EdgeC, WeightC)

        //初始化NodeC,EdgeC,WeightC為空

        1: NodeC=EdgeC=WeightC=Φ

        //wi∈NodeT(NodeT含有n個(gè)節(jié)點(diǎn))

        //wj∈NodeH(NodeH含有m個(gè)節(jié)點(diǎn))

        //求NodeC

        2:for(i=0; i < n; i++) {

        3:for(j=0; j < m; j++) {

        4:if(wi==wj) NodeC={wi}∪NodeC

        5: }

        6: }

        //求EdgeC與WeightC

        7: for(i=0; i < n; i++) {

        8: for(j=0; j < m; j++) {

        9: if(wi, wj∈NodeC&& Eij∈(EdgeT∩EdgeH)){

        10: EdgeC={Eij}∪EdgeC

        11: WeightC={wij}∪WeightC

        12: }

        13: }

        3.3 圖相似度計(jì)算

        根據(jù)求得的最大公共子圖,計(jì)算圖相似度的如式(7)所示。

        sim(GT,GH)=

        其中,sizeof(NodeT)為GT中節(jié)點(diǎn)數(shù),sizeof(EdgeT)為GT中邊數(shù),WC(Eij)為圖GC中邊Eij的權(quán)重wt(Eij);β為綜合加權(quán)因子,當(dāng)β=0.5時(shí),圖GT和圖GH中節(jié)點(diǎn)和邊對圖相似度的影響程度相同,當(dāng)β=0時(shí),不考慮節(jié)點(diǎn)對圖相似度的影響,當(dāng)β=1時(shí),不考慮邊對圖相似度的影響。本文β取值0.6,綜合考慮了邊和節(jié)點(diǎn)對圖相似度的影響。

        4 基于事件語義特征的修正

        基于事件語義規(guī)則的修正目的是從標(biāo)注文本對中提取時(shí)間、地點(diǎn)和數(shù)字等語義成分,修正被分類器誤判為雙向蘊(yùn)含關(guān)系的矛盾關(guān)系。

        4.1 數(shù)字語義特征

        在SVM的分類結(jié)果中,絕大部分通過數(shù)字判斷為矛盾的文本對都被判斷為了雙向蘊(yùn)含,表2中列舉了一些會(huì)被判斷錯(cuò)誤的典型例子。

        表2 數(shù)字相關(guān)SVM輸出錯(cuò)誤文本對

        在SVM的判斷結(jié)果中,表2中的三種句子均被判斷錯(cuò)誤,且因?yàn)橛?jì)算出的句子相似度非常高,都被判斷為了雙向蘊(yùn)含關(guān)系,經(jīng)過分析發(fā)現(xiàn),通常根據(jù)數(shù)字認(rèn)定為矛盾的句子分為三種,一種是數(shù)值不同,例如,T2中的“700萬”和H2中“600萬”的數(shù)值不同,導(dǎo)致了最后文本對矛盾;第二種是單位不同,例如,T3中數(shù)字的單位“噸”和H3中數(shù)字的單位“公斤”不同,使句子對互相矛盾;最后一種為數(shù)字的范圍,例如,T4中和H4中數(shù)字都是四分之一,但T4中是“近四分之一”而H4中是“超過四分之一”,于是T4和H4互相矛盾。經(jīng)過上述分析,可以得到基于數(shù)字修正SVM分類結(jié)果的規(guī)則,記為規(guī)則1。

        規(guī)則1: 如果文本對(T, H)中都含有數(shù)字信息且該文本對被SVM判斷為雙向蘊(yùn)含,那么檢查文本T和文本H中所有事件中數(shù)字的數(shù)值、單位和范圍,若其中有一項(xiàng)或多項(xiàng)不同時(shí),則將SVM輸出標(biāo)簽更正為矛盾關(guān)系。

        4.2 地點(diǎn)語義特征

        對于被分類為雙向蘊(yùn)含的涉地點(diǎn)語義成分的文本對,主要是兩種形式的文本結(jié)構(gòu),表3列舉了這兩種文本結(jié)構(gòu)。

        表3 涉地點(diǎn)的分類錯(cuò)誤文本對

        在表3中,T5和H5涉地點(diǎn)事件的謂語動(dòng)詞都是“爆炸”,并考慮到因?yàn)榫渥酉嗨贫雀?,被SVM判斷為雙向蘊(yùn)含,則認(rèn)為T5和H5要表達(dá)同一個(gè)事件;但是實(shí)際上事件地點(diǎn)不同,則T5和H5矛盾。T6和H6都含有三個(gè)地點(diǎn),分別為“北平”、“湖南長沙”和“江西德安”,雖然表面上看,T6和H6相似,但是T6和H6中“湖南長沙”和“江西德安”的謂語動(dòng)詞不同,即其所處事件不同,則事件表達(dá)的意義不同,因此T6和H6矛盾。根據(jù)以上兩種文本類型,可以總結(jié)出規(guī)則2。

        規(guī)則2: 如果文本對(T, H)中都含有地點(diǎn)信息且該文本對被SVM判斷為雙向蘊(yùn)涵,那么檢查文本T和文本H中所有事件的地點(diǎn)和對應(yīng)的謂語動(dòng)詞,若T和H中存在一對事件謂語動(dòng)詞相同但事件謂詞動(dòng)詞對應(yīng)地點(diǎn)不同,則更改為矛盾關(guān)系。

        4.3 時(shí)間語義特征

        在文本結(jié)構(gòu)類似的文本對中,若時(shí)間不同,可以直接判斷為矛盾,但是在SVM判斷中,因?yàn)榫渥酉嗨贫冗^高,導(dǎo)致錯(cuò)誤判斷為雙向蘊(yùn)含,表4列舉了這樣的一個(gè)例子。

        表4 時(shí)間相關(guān)SVM分類錯(cuò)誤文本對

        表4中,文本T7中的時(shí)間為“2008年8月8日20時(shí)”,文本H7的時(shí)間為“2008年8月8日22時(shí)”,時(shí)間不同,則文本對相互矛盾。根據(jù)這種特征,設(shè)計(jì)規(guī)則3。

        規(guī)則3: 如果文本對(T, H)中都含有時(shí)間信息且該文本對被SVM判斷為雙向蘊(yùn)涵,那么檢查文本T和文本H中所有事件的時(shí)間語義成分并比較,若不同,則修正為矛盾關(guān)系。

        5 實(shí)驗(yàn)結(jié)果

        實(shí)驗(yàn)語料來自于NTCIR-9 RITE任務(wù),其中訓(xùn)練集與測試集的文本對數(shù)都是407,系統(tǒng)的整體性能使用平均準(zhǔn)確率(Accuracy)指標(biāo)來進(jìn)行度量,如式(8)所示。

        式(8)中,#pair指RITE測試集中文本對的數(shù)目。

        針對具體的文本蘊(yùn)含關(guān)系的類別,該文給出每一類別的準(zhǔn)確率(Precision)、召回率(Recall)和F-measure來進(jìn)行度量,其具體計(jì)算如式(9)、(10)和(11)所示。

        上式中,TP(True Positives)和FP(False Positives)分別指測試集中該類所有正例被正確和錯(cuò)誤分類的數(shù)目;而FN(False Negatives)則指測試集中該類所有負(fù)例被錯(cuò)誤分類的數(shù)目。

        本文中的基于統(tǒng)計(jì)與詞匯語義特征的中文文本蘊(yùn)涵關(guān)系識(shí)別系統(tǒng)標(biāo)記為WUST,該系統(tǒng)利用BC和MC任務(wù)的訓(xùn)練集對分類器進(jìn)行訓(xùn)練。在兩個(gè)任務(wù)的訓(xùn)練中,懲罰因子C的log值都為10,而核函數(shù)因子γ的log值皆為-9;BC任務(wù)的訓(xùn)練正確率為76.9%,MC任務(wù)訓(xùn)練正確率為57.74%。WUST系統(tǒng)給出了對BC和MC任務(wù)測試集的分類結(jié)果,RITE組織方最終的評測結(jié)果如表5所示。

        表5 系統(tǒng)的BC和MC任務(wù)評測結(jié)果

        表5中,UIOWA系統(tǒng)結(jié)果明顯高于其他系統(tǒng),最主要的原因是UIOWA系統(tǒng)使用了眾包(Crowdsourcing)技術(shù),有人工參與其中。WUST和其他很多參與者的系統(tǒng)在BC任務(wù)的表現(xiàn)不如基準(zhǔn)測試(Baseline),其中最可能的原因是基準(zhǔn)測試使用的是字符重疊度特征[2],而考慮到是對中文進(jìn)行處理,WUST系統(tǒng)自然而然的使用了詞重疊度特征。

        WUST-ES系統(tǒng)是基于WUST-SLS系統(tǒng)和WUST系統(tǒng)的改進(jìn)版,WUST-SLS系統(tǒng)在WUST系統(tǒng)的基礎(chǔ)上增加了句法特征,而WUST-ES系統(tǒng)在WUST-SLS系統(tǒng)基礎(chǔ)上增加了事件語義特征和基于事件語義規(guī)則的修正模塊。WUST-ES系統(tǒng)實(shí)驗(yàn)效果最為理想,與WUST系統(tǒng)和WUST-SLS系統(tǒng)結(jié)果比較圖如圖4所示。

        圖4 WUST、WUST-SLS與WUST-ES的對比評測結(jié)果

        圖4中,WUST-ES實(shí)驗(yàn)系統(tǒng)的效果最優(yōu),主要是采用了事件語義特征的結(jié)果,兩個(gè)文本即使文本順序不同,但是同一個(gè)事件的事件圖是一樣的,增加了蘊(yùn)含關(guān)系判斷的效果。且WUST-ES實(shí)驗(yàn)系統(tǒng)為了提高矛盾關(guān)系的判斷效果,增加了基于事件語義規(guī)則的修正模塊,彌補(bǔ)了WUST-SLS系統(tǒng)和WUST系統(tǒng)上的不足,提升了系統(tǒng)性能。

        與ICRI_HITSZ系統(tǒng)相比,WUST-ES的BC與MC任務(wù)評測結(jié)果已經(jīng)優(yōu)于ICRI_HITSZ系統(tǒng);當(dāng)然,同采用眾包技術(shù)的UIOWA系統(tǒng)還有一定差距。本文后面的內(nèi)容主要針對WUST-ES系統(tǒng)進(jìn)行分析,以期發(fā)現(xiàn)WUST-ES系統(tǒng)優(yōu)劣的原因,有利于系統(tǒng)的后續(xù)改進(jìn)。

        WUST-ES系統(tǒng)的混淆矩陣如圖5(a)和(b)所示。

        圖5 WUST-ES系統(tǒng)輸出的混淆矩陣

        使用混淆矩陣計(jì)算每個(gè)類別的準(zhǔn)確率、召回率和F-measure,BC任務(wù)的結(jié)果在表6中,MC任務(wù)的結(jié)果見表7。

        表6 WUST-ES系統(tǒng)BC任務(wù)

        表6中,WUST-ES系統(tǒng)正確率比WUST-SLS系統(tǒng)正確率高6%左右,比WUST系統(tǒng)正確率高10%左右,說明WUST-ES能夠較好地識(shí)別2-way文本蘊(yùn)含關(guān)系。WUST-ES系統(tǒng)蘊(yùn)含關(guān)系識(shí)別的F-measure達(dá)到86.94%,說明WUST-ES系統(tǒng)對蘊(yùn)含關(guān)系識(shí)別的有效性;WUST-ES系統(tǒng)非蘊(yùn)含關(guān)系識(shí)別的F-measure為74.82%,相比WUST-ES對蘊(yùn)含關(guān)系判斷的高效性稍有不足。

        表7 WUST-ES系統(tǒng)MC任務(wù)

        表7中,WUST-ES系統(tǒng)正確率比WUST-SLS系統(tǒng)正確率高6%左右,比WUST系統(tǒng)正確率高12%左右,說明WUST-ES判斷5-way文本蘊(yùn)含關(guān)系效果較好。WUST-ES系統(tǒng)正向蘊(yùn)含關(guān)系判斷F-measure達(dá)到79.81%,逆向蘊(yùn)含關(guān)系判斷達(dá)到79.80%,說明WUST-ES系統(tǒng)能夠高效地識(shí)別正向蘊(yùn)含關(guān)系和逆向蘊(yùn)含關(guān)系;WUST-ES系統(tǒng)雙向蘊(yùn)含關(guān)系識(shí)別的F-measure為69.01%,矛盾關(guān)系識(shí)別的F-measure為62.71%,獨(dú)立關(guān)系識(shí)別的F-measure為50.41%。

        相比WUST-ES對正向蘊(yùn)含關(guān)系和逆向蘊(yùn)含關(guān)系判斷的高效性,WUST-ES對其他類語義關(guān)系的判斷稍有不足,尤其是矛盾關(guān)系判斷和獨(dú)立關(guān)系。通過分析圖4(b)可以發(fā)現(xiàn),WUST-ES系統(tǒng)將22個(gè)矛盾關(guān)系判斷成了雙向蘊(yùn)含關(guān)系,說明WUST-ES系統(tǒng)將一部分矛盾和雙向蘊(yùn)含混淆了;除此之外,WUST-ES系統(tǒng)獨(dú)立關(guān)系判斷并不理想,說明獨(dú)立關(guān)系也需要重點(diǎn)研究。

        6 結(jié)論

        以NTCIR-9的RITE任務(wù)為背景,本文設(shè)計(jì)并實(shí)現(xiàn)了基于簡體中文文本的蘊(yùn)含識(shí)別系統(tǒng)。系統(tǒng)基于SVM構(gòu)建分類器,以統(tǒng)計(jì)特征、詞匯語義特征、句法特征以及事件語義特征生成特征文件,其中詞匯語義特征是基于同義詞詞林、反義詞表、否定詞表、《知網(wǎng)》等語義資源計(jì)算的,本文將RITE問題作為單純的分類問題進(jìn)行處理。實(shí)驗(yàn)表明,基于事件語義特征的中文文本蘊(yùn)含識(shí)別方法對中文文本蘊(yùn)含識(shí)別的高效性。

        該系統(tǒng)存在兩點(diǎn)不足,首先是混淆了部分矛盾和雙向蘊(yùn)含關(guān)系,其次是用于獨(dú)立關(guān)系判斷的特征存在不足,導(dǎo)致獨(dú)立關(guān)系判斷效果不佳;未來研究將致力于解決這兩個(gè)問題。

        [1] 袁毓林,王明華.文本蘊(yùn)含的推理模型與識(shí)別模型[J].中文信息學(xué)報(bào), 2010, 24(2): 3-13.

        [2] Hideki Shima, Hiroshi Kanayama, Cheng-Wei Lee, et al. Overview of NTCIR-9 RITE: Recognizing Inference in TExt[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 291-301.

        [3] Yaoyun Zhang, Jun Xu, Chenlong Liu, et al. ICRC_HITSZ at RITE: Leveraging Multiple Classifiers Voting for Textual Entailment Recognition[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 325-329.

        [4] Ling Cao, Xipeng Qiu, Xuanjing Huang. FudanNLP at RITE 2011: a Shallo w Semantic Approach to Textual Entailment[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 335-338.

        [5] Hen-Hsen Huang, Kai-Chun Chang, Haver II J.M.C. et al. NTU Textual Entailment System for NTCIR 9 RITE Task[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 349-352.

        [6] Ranxu Su, Sheng Shang, Pan Wang, et al. ZSWSL Text Entailment Recognizing System at NTCIR-9 RITE Task[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 394-399.

        [7] Han Ren, Chen Lv, Donghong Ji. The WHUTE System in NTCIR-9 RITE Task[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 373-378.

        [8] Shih-Hung Wu, Wan-Chi Huang, Liang-Pu Chen, et al. Binary-class and Multi-class Chinese Textual Entailment System Description in NTCIR-9 RITE[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 422-426.

        [9] Maofu Liu, Yan Li, Donghong Ji, et al. Atomic Event Semantic Roles and Chinese Instances Analysis[C]//Proceedings of Donghong Ji & Guozheng Xiao (Eds.). Chinese Lexical Semantics. Berlin, Heidelberg: Springer-Verlag, 2013: 110-121.

        [10] Maofu Liu, Yan Li, Yu Xiao, et al. WUST SVM-Based System at NTCIR-9 RITE Task[C]//Proceedings of National Institute of Informatics. The 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access. Tokyo, Japan: National Institute of Informatics, 2011: 318-324.

        [11] Malakasiotis P. Paraphrase recognition using machine learning to combine similarity measures[C]//Proceedings of Association for Computational Linguistics. Proceedings of the ACL-IJCNLP 2009 Student Research Workshop. Stroudsburg, PA, USA: Association for Computational Linguistics, 2009: 27-35.

        猜你喜歡
        子圖正確率語義
        門診分診服務(wù)態(tài)度與正確率對護(hù)患關(guān)系的影響
        語言與語義
        臨界完全圖Ramsey數(shù)
        生意
        品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
        基于頻繁子圖挖掘的數(shù)據(jù)服務(wù)Mashup推薦
        生意
        “上”與“下”語義的不對稱性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語義模糊
        不含2K1+K2和C4作為導(dǎo)出子圖的圖的色數(shù)
        玩弄丝袜美腿超短裙校花| 少妇装睡让我滑了进去| 77777亚洲午夜久久多人| 欧美性xxx久久| 三个黑人插一个女的视频| 亚洲午夜无码毛片av久久| 男女爽爽无遮挡午夜视频| 免费AV一区二区三区无码| 国产女主播视频一区二区三区| 人妻少妇精品专区性色anvn| 国内精品伊人久久久久网站| 最新四色米奇影视777在线看| 久久aⅴ无码av高潮AV喷| 毛茸茸的女性外淫小视频| 国产suv精品一区二区四| 国产av一区二区精品久久凹凸| 狠狠色狠狠色综合网老熟女| 亚洲蜜臀av一区二区三区漫画| 日日麻批免费40分钟无码| 精品国产aⅴ无码一区二区| 伊人婷婷色香五月综合缴激情| 国产精品亚洲一区二区三区久久 | 亚洲欧美成人一区二区在线电影 | 韩国主播av福利一区二区| 少妇熟女天堂网av天堂| 帅小伙自慰videogay男男| 男女18禁啪啪无遮挡| 亚洲色AV天天天天天天| 日本a爱视频二区三区| 极品少妇小泬50pthepon| 国产福利免费看| 亚洲日本一区二区在线观看| 精品人妻一区二区三区浪人在线| 国语自产偷拍精品视频偷| 国产精品美女黄色av| 国产成人精品一区二区三区av| 天堂а在线中文在线新版| 日本一区二区三区高清千人斩| 少妇被日到高潮的视频| 色婷婷av一区二区三区久久| 亚洲欧美日韩人成在线播放|