亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        神經(jīng)網(wǎng)絡(luò)事件抽取技術(shù)綜述

        2018-09-05 10:19:04秦彥霞張民鄭德權(quán)
        關(guān)鍵詞:論元實(shí)體神經(jīng)網(wǎng)絡(luò)

        秦彥霞 張民 鄭德權(quán)

        文章編號(hào): 2095-2163(2018)03-0001-06中圖分類號(hào): 文獻(xiàn)標(biāo)志碼: A

        摘要: 關(guān)鍵詞: (1 School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China;

        2 School of Computer Science & Technology, Soochow University, Suzhou Jiangsu 215006, China)

        Abstract: Event extraction is one important research task in information extraction, which shows great value to information retrieval, question answering and opinion analysis. Traditional event extraction methods manually design features and use Maximum Entropy classifier or Support Vector Machine classifier for trigger classification and argument role identification. Recently, neural network-based methods have shown their effectiveness in image classification, speech recognition and natural language processing areas. The advantage of neural network-based methods is automatic feature learning, thus avoid laborious feature engineering. This article will introduce recent neural network-based methods proposed for event extraction and discuss future work in this area.

        Key words:

        基金項(xiàng)目:

        作者簡(jiǎn)介:

        收稿日期: 引言

        事件作為信息的一種表現(xiàn)形式,其定義為特定的人、物在特定時(shí)間和特定地點(diǎn)相互作用的客觀事實(shí)。事件抽取是從自由文本中識(shí)別事件的發(fā)生并抽取事件的各元素的任務(wù)。本文將會(huì)探討介紹基于ACE2005評(píng)測(cè)(http://projects.ldc.upenn.edu/ace/)的事件抽取任務(wù)及方法。根據(jù)ACE2005評(píng)測(cè),組成事件的各元素包括:觸發(fā)詞、事件類型、論元及論元角色。事件抽取任務(wù)可分解為4個(gè)子任務(wù):觸發(fā)詞識(shí)別、事件類型分類、論元識(shí)別和角色分類任務(wù)。其中,觸發(fā)詞識(shí)別和事件類型分類可合并成事件識(shí)別任務(wù)。論元識(shí)別和角色分類可合并成論元角色分類任務(wù)。事件識(shí)別判斷句子中的每個(gè)單詞歸屬的事件類型,是一個(gè)基于單詞的多分類任務(wù)。角色分類任務(wù)則是一個(gè)基于詞對(duì)的多分類任務(wù),判斷句子中任意一對(duì)觸發(fā)詞和實(shí)體之間的角色關(guān)系。

        傳統(tǒng)事件抽取方法[1-11]均采用人工構(gòu)建特征的方法表示每個(gè)候選觸發(fā)詞或每個(gè)觸發(fā)詞-實(shí)體對(duì),然后借助基于統(tǒng)計(jì)的分類模型進(jìn)行分類。以往方法重點(diǎn)在于研究有效的特征來(lái)捕捉候選觸發(fā)詞、候選論元的詞法、句法、語(yǔ)義信息,以及觸發(fā)詞-觸發(fā)詞之間的依賴關(guān)系、和同一觸發(fā)詞相關(guān)的多個(gè)實(shí)體之間的依賴關(guān)系、和同一實(shí)體相關(guān)的多個(gè)觸發(fā)詞之間的關(guān)系。此外,還有若干工作研究跨句子和跨文檔的事件一致性特征[9]、跨事件的一致性特征[10]和跨實(shí)體的事件一致性特征[11]來(lái)提高事件抽取的性能。

        近年來(lái)興起的神經(jīng)網(wǎng)絡(luò)方法,能夠自動(dòng)學(xué)習(xí)有效特征。不同于傳統(tǒng)的離散型特征,神經(jīng)網(wǎng)絡(luò)特征多是連續(xù)型向量特征,除了能夠建模語(yǔ)義信息外,還能自動(dòng)組合構(gòu)建更上層的特征。這些特征的高效性已經(jīng)在自然語(yǔ)言處理眾多任務(wù)中屢獲驗(yàn)證,并帶來(lái)突破性進(jìn)展。在事件抽取任務(wù)中也陸續(xù)涌現(xiàn)出一些基于神經(jīng)網(wǎng)絡(luò)的事件抽取方法,使得研究人員免于繼續(xù)從事繁瑣的特征工程。本文將全面剖析論述已有的神經(jīng)網(wǎng)絡(luò)事件抽取方法,并對(duì)以后的研究方向給出預(yù)期展望。

        1事件抽取定義

        本節(jié)將圍繞自動(dòng)內(nèi)容抽?。ˋutomatic Content Extraction, ACE)評(píng)測(cè)中的英文事件抽取任務(wù)涉及的相關(guān)術(shù)語(yǔ)及任務(wù),對(duì)其展開(kāi)如下的研究闡釋。

        (1)實(shí)體(Entity)。屬于某個(gè)語(yǔ)義類別的對(duì)象或?qū)ο蠹?。其中包括:人(PER)、地理政治區(qū)域名(GPE)、組織機(jī)構(gòu)(ORG)、地名(LOC)、武器(WEA)、建筑設(shè)施(FAC)和交通工具(VEH)。

        (2)事件觸發(fā)詞(Event Trigger)。表示事件發(fā)生的核心詞,多為動(dòng)詞或名詞。

        (3)事件論元(Event Argument)。事件的參與者,主要由實(shí)體、值、時(shí)間組成。值是一種非實(shí)體的事件參與者,例如工作崗位(Job-Title)。和實(shí)體一樣,ACE05也標(biāo)記出了句子中出現(xiàn)的值和時(shí)間。下文中,即將實(shí)體、值、時(shí)間統(tǒng)稱為實(shí)體。

        (4)論元角色(Argument Role)。事件論元在事件中充當(dāng)?shù)慕巧?。共?5類角色,例如,攻擊者(Attacker)、受害者(Victim)等。

        ACE2005定義了8種事件類型和33種子類型。其中,大多數(shù)事件抽取均采用33種事件類型。事件識(shí)別是基于詞的34類(33類事件類型+None)多元分類任務(wù),角色分類是基于詞對(duì)的36類(35類角色類型+None)多元分類任務(wù)。這里,參考文獻(xiàn)[8]可得如下例句:

        In Baghdad, a cameraman died when an American tank fired on the Palestine hotel. (在Baghdad, 當(dāng)一個(gè)美國(guó)坦克對(duì)著Palestine酒店開(kāi)火時(shí)一個(gè)攝影師死去了)

        以上例句中出現(xiàn)的事件解析可見(jiàn)表1。

        作為一種有監(jiān)督多元分類任務(wù),事件抽取方法包括2個(gè)步驟:特征選擇和分類模型。本文根據(jù)使用特征的范圍不同、模型學(xué)習(xí)方式不同和外部資源的使用與否對(duì)不同的事件抽取方法進(jìn)行分類。各類方法的研究?jī)?nèi)容可詳見(jiàn)如下。

        (1)根據(jù)所使用特征的范圍,事件抽取方法可以分為句子級(jí)的事件抽取方法和篇章級(jí)的事件抽取方法??偟貋?lái)說(shuō),句子級(jí)的事件抽取方法只使用句子內(nèi)部獲取的特征。而篇章級(jí)的事件抽取方法則包含了跨句、跨文檔抽取的特征信息。一般情況下,句子級(jí)特征是所有事件抽取方法通用的特征,而篇章級(jí)特征則屬于面向?qū)嶋H任務(wù)挖掘的特效特征。

        (2)根據(jù)學(xué)習(xí)方式不同,可以分為基于流水線模型的事件抽取方法和基于聯(lián)合模型的事件抽取方法。事件抽取任務(wù)分為事件識(shí)別和論元角色分類任務(wù)。其中,后者輸入依賴于前者輸出。論元角色分類任務(wù)的輸入是識(shí)別出的觸發(fā)詞和所有候選實(shí)體。大部分事件抽取方法都是流水線模型學(xué)習(xí)方式,先進(jìn)行事件識(shí)別模型的學(xué)習(xí),再轉(zhuǎn)入論元角色分類模型的學(xué)習(xí)。而經(jīng)仿真驗(yàn)證基于聯(lián)合模型的學(xué)習(xí)方式的效果要優(yōu)于流水線模型學(xué)習(xí)方式,故而也隨即產(chǎn)生了基于聯(lián)合模型的事件抽取工作。

        (3)ACE05數(shù)據(jù)是現(xiàn)有的為數(shù)不多的有標(biāo)記事件數(shù)據(jù)之一,是在新聞、博客、訪談等數(shù)據(jù)上進(jìn)行人工標(biāo)注得到的。ACE數(shù)據(jù)的標(biāo)注質(zhì)量不高以及規(guī)模較小的問(wèn)題,也在很大程度上影響了事件抽取任務(wù)的發(fā)展。為此很多工作嘗試借助外部資源輔助事件抽取任務(wù)的功能達(dá)成。根據(jù)是否使用外部資源,可以分為基于同源數(shù)據(jù)(即ACE數(shù)據(jù))的事件抽取方法和融合外部資源的事件抽取方法。

        2.1句子/篇章級(jí)的事件抽取方法

        傳統(tǒng)方法中,句子級(jí)別的特征可以分為基于詞的特征和基于詞對(duì)的特征。其中,基于詞的傳統(tǒng)離散特征包括:

        (1)詞法特征。例如當(dāng)前詞及周邊詞的一元/二元語(yǔ)法、詞性標(biāo)簽、詞干、同義詞等。

        (2)句法特征。例如當(dāng)前詞的依存詞和核心詞、涉及的依存關(guān)系、是否是未被引用的代詞、句法分析樹中路徑等。

        (3)實(shí)體信息。例如實(shí)體類型、距離最近的實(shí)體類型、是否是相同類型論元候選中距離觸發(fā)詞最近的等等。

        基于詞對(duì)的特征有:觸發(fā)詞-觸發(fā)詞之間的共現(xiàn)關(guān)系和觸發(fā)詞-論元的多種依賴關(guān)系等。

        而篇章級(jí)事件抽取方法則額外考慮了跨句子或跨文檔的特征輔助任務(wù)實(shí)現(xiàn)。例如,相同/類似事件對(duì)應(yīng)的論元一致性,同一文檔內(nèi)的相同單詞觸發(fā)的事件類型一致性特征,相同類型的實(shí)體參與的事件一致性特征。

        本小節(jié)將主要討論現(xiàn)有的句子級(jí)神經(jīng)網(wǎng)絡(luò)事件抽取方法[12-16]。不同于傳統(tǒng)離散特征,神經(jīng)網(wǎng)絡(luò)方法以連續(xù)型向量為特征,并通過(guò)不同的神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)更抽象的特征。以事件識(shí)別任務(wù)為例,神經(jīng)網(wǎng)絡(luò)事件抽取方法的流程為:首先用初始化的特征向量表示候選觸發(fā)詞,然后通過(guò)神經(jīng)網(wǎng)絡(luò)模型自動(dòng)更新學(xué)習(xí)特征以及組合更高級(jí)別特征,最后通過(guò)Softmax模型來(lái)輸出分類。除了特征表示和學(xué)習(xí)方式的不同外,傳統(tǒng)方法和神經(jīng)網(wǎng)絡(luò)方法在分類模型上亦有不同。傳統(tǒng)方法使用不同的分類模型進(jìn)行分類,例如常用的最大熵模型和支持向量機(jī)模型。神經(jīng)網(wǎng)絡(luò)方法則采用Softmax模型來(lái)設(shè)計(jì)確定分類。

        Chen等人[12]和Nguyen等人[13]率先嘗試將神經(jīng)網(wǎng)絡(luò)方法分別應(yīng)用于事件抽取、識(shí)別任務(wù)中,并取得了很好的效果,驗(yàn)證了神經(jīng)網(wǎng)絡(luò)特征的有效性。初始特征表示方面,二者均采用了預(yù)訓(xùn)練的詞向量作為每個(gè)單詞的初始表示,而且還融入了單詞的語(yǔ)義和語(yǔ)法信息的建模研究[17-18]。特殊而必要地,二者還都使用了位置信息來(lái)建模當(dāng)前詞和候選觸發(fā)詞的距離。受傳統(tǒng)特征啟發(fā),常用的特征還包括當(dāng)前詞的事件類型向量和實(shí)體類型向量。Nguyen等人利用實(shí)體類型特征來(lái)輔助事件識(shí)別任務(wù),而Chen等人使用事件類型特征用于角色分類任務(wù)。

        在上層特征學(xué)習(xí)模型方面,研究中均使用了卷積神經(jīng)網(wǎng)絡(luò)模型[19](Convolutional Neural Network, CNN)來(lái)自動(dòng)抽取有效特征進(jìn)行事件抽取或識(shí)別任務(wù)。更進(jìn)一步地,Chen等人改進(jìn)了傳統(tǒng)的CNN模型,增配了動(dòng)態(tài)多池機(jī)制(dynamic multi-pooling)來(lái)提高事件抽取任務(wù)性能。研究認(rèn)為,相比于最大池機(jī)制,通過(guò)候選觸發(fā)詞和候選實(shí)體位置分割成3部分的動(dòng)態(tài)多池機(jī)制,能夠獲取更為精細(xì)、有效的特征用于角色分類。Nguyen等人[14]則提出了一種基于離散短語(yǔ)(skip-gram)的卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)輔助事件識(shí)別。相比于傳統(tǒng)的連續(xù)詞袋模型,基于離散短語(yǔ)的卷積神經(jīng)網(wǎng)絡(luò)模型能夠獲取更豐富的非連續(xù)短語(yǔ)上特征,而無(wú)需再限定于局部連續(xù)短語(yǔ)特征。

        除了基于卷積神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)模型外,還有研究者采用遞歸神經(jīng)網(wǎng)絡(luò)[20-21](Recurrent Neural Network, RNN)對(duì)文本中的序列信息進(jìn)行建模,從而為事件抽取任務(wù)提供助益支持。Feng等人[15]采用一個(gè)基于RNN的模型來(lái)獲取文本中的序列信息,并采用一個(gè)卷積層來(lái)獲取文本中的短語(yǔ)塊信息,將2種信息合并后進(jìn)行事件觸發(fā)詞識(shí)別。由于沒(méi)有使用額外特征,該混合模型是語(yǔ)言無(wú)關(guān)模型,在多種語(yǔ)言的事件識(shí)別任務(wù)中取得了良好效果。

        以往的傳統(tǒng)事件抽取工作和上述神經(jīng)網(wǎng)絡(luò)事件抽取方法均嘗試了將觸發(fā)詞的相關(guān)特征,如事件類別信息、位置信息等用于輔助論元角色分類任務(wù),但卻尚未探索論元的信息對(duì)觸發(fā)詞識(shí)別任務(wù)的作用。借助于注意力模型(Attention),Liu等人[16]獨(dú)家采用了有監(jiān)督的論元注意力模型將論元信息輸入至事件識(shí)別模型中,其效果驗(yàn)證了論元信息能夠高效地輔助事件觸發(fā)詞識(shí)別任務(wù)。不同于聯(lián)合模型中觸發(fā)詞和論元信息相互輔助的間接方式,該方法提出的論元注意力模型最直接地將論元信息用于輔助識(shí)別觸發(fā)詞。

        猜你喜歡
        論元實(shí)體神經(jīng)網(wǎng)絡(luò)
        前海自貿(mào)區(qū):金融服務(wù)實(shí)體
        神經(jīng)網(wǎng)絡(luò)抑制無(wú)線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
        兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
        振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
        成分重量和粵方言雙及物結(jié)構(gòu)的論元語(yǔ)序
        基于論元結(jié)構(gòu)和題元指派對(duì)漢語(yǔ)處置義“把”字句的句法語(yǔ)義分析
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        中文字幕人妻丝袜美腿乱| 亚洲中文字幕精品久久久久久直播 | 米奇777四色精品人人爽| 真实单亲乱l仑对白视频| 国产AV无码专区亚洲AV桃花庵| 在线精品亚洲一区二区三区| 久久中文字幕人妻淑女| 挺进朋友人妻雪白的身体韩国电影| 国内精品一区视频在线播放 | 久久天天躁夜夜躁狠狠| 亚洲精品人成无码中文毛片| 亚洲成aⅴ人片在线观看天堂无码| 日本中文字幕乱码中文乱码| 午夜亚洲av日韩av无码大全| 国产精品ⅴ无码大片在线看 | 国产激情久久99久久| 欧美综合自拍亚洲综合百度| 久久人妻中文字幕精品一区二区| 狠狠色欧美亚洲狠狠色www| 亚洲精品久久一区二区三区777| 欧美疯狂做受xxxx高潮小说| 欧美性猛交xxxx乱大交蜜桃| 97人妻蜜臀中文字幕| 美女视频在线观看亚洲色图 | 亚洲成av人片在线观看www| 国产在线成人精品| 亚洲国内精品一区二区在线| 亚洲最新无码中文字幕久久| 狠狠综合久久av一区二区| 日本a在线看| 韩国女主播一区二区三区在线观看| 国产欧美va欧美va香蕉在线| 欧美日韩中文国产一区发布 | 亚洲人成影院在线高清| 中文字幕一区二区三区在线看一区| 青青手机在线观看视频| 天堂а√在线中文在线新版 | 日本草逼视频免费观看| 三级国产精品久久久99| 白又丰满大屁股bbbbb| 亚洲区精选网址|