?
基于Tri-Training的事件關(guān)系分類(lèi)方法研究*
通信地址:215000 江蘇省蘇州市蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院Address:School of Computer Science and Technology,Soochow University,Suzhou 215000,Jiangsu,P.R.China
丁思遠(yuǎn),洪宇,朱珊珊,姚建民,朱巧明
(蘇州大學(xué)江蘇省計(jì)算機(jī)信息處理重點(diǎn)實(shí)驗(yàn)室,江蘇 蘇州 215006)
摘要:事件關(guān)系分類(lèi)是一項(xiàng)研究事件之間存在何種邏輯關(guān)系的自然語(yǔ)言處理技術(shù)。針對(duì)事件關(guān)系分類(lèi)任務(wù)中訓(xùn)練語(yǔ)料不足的問(wèn)題,提出了基于Tri-Training的事件關(guān)系分類(lèi)方法。該方法首先根據(jù)已標(biāo)注的語(yǔ)料訓(xùn)練三個(gè)不同的分類(lèi)器,以多數(shù)投票的方式從未標(biāo)注集中抽取置信度較高的樣本對(duì)訓(xùn)練集進(jìn)行擴(kuò)充,然后利用新的訓(xùn)練集重新訓(xùn)練分類(lèi)器,反復(fù)迭代,不斷完善分類(lèi)模型,最終達(dá)到提升事件關(guān)系分類(lèi)性能的目的。實(shí)驗(yàn)結(jié)果表明,以F1值為評(píng)價(jià)標(biāo)準(zhǔn),基于Tri-Training的事件關(guān)系分類(lèi)方法在四大類(lèi)事件關(guān)系上的分類(lèi)性能為64.36%。
關(guān)鍵詞:事件關(guān)系;框架語(yǔ)義;半監(jiān)督學(xué)習(xí);Tri-Training
doi:10.3969/j.issn.1007-130X.2015.12.023
中圖分類(lèi)號(hào):TP391
文獻(xiàn)標(biāo)志碼:A
基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(61003152,61272259,61272260)
收稿日期:修回日期:2015-11-03
文章編號(hào):1007-130X(2015)12-2345-07