王元龍,劉曉敏,張虎
基于事件表示的機器閱讀理解模型
王元龍*,劉曉敏,張虎
(山西大學 計算機與信息技術(shù)學院,太原 030006)( ? 通信作者電子郵箱ylwang@sxu.edu.cn)
要真正理解一段語篇,在閱讀理解過程對原文主旨線索的把握是非常重要的。針對機器閱讀理解中主旨線索類型的問題,提出了基于事件表示的機器閱讀理解分析方法。首先,通過線索短語從閱讀材料中抽取篇章事件圖,其中包括事件的表示、事件要素的抽取和事件關(guān)系的抽取等;然后,綜合考慮事件的時間要素、情感要素以及每個詞在文檔中的重要性,采用TextRank算法選出線索相關(guān)的事件;最后,依據(jù)所選出的線索事件構(gòu)建問題的答案。在收集了339道線索類題組成的測試集上,實驗結(jié)果表明所提方法在BLEU和CIDEr評價指標上與基于TextRank算法的句子排序方法相比均有所提升,具體來說,BLEU-4指標提升了4.1個百分點,CIDEr指標提升了9個百分點。
自然語言處理;閱讀理解;主旨線索類型問題;事件表示;篇章事件圖
機器閱讀理解(Machine Reading Comprehension, MRC)任務旨在讓機器閱讀理解給定的文檔,能夠從文檔中尋找答案用于回答用戶提出的問題,其目標是通過綜合運用文本的表示、理解、推理等自然語言處理與理解技術(shù),使計算機具有和人類一樣理解文章的能力。由于文章和問題均采用人類語言的形式,其背后涉及到詞法、句法、語法和語義等多方面的信息,因此這一任務的評價效果成為衡量機器對自然語言理解能力的重要指標。
目前,針對機器閱讀理解中的問題類型分為不同的任務:完型填空類問題,問句是將文檔中一個句子中的某個實體抽掉所產(chǎn)生,要求機器能正確預測被抽掉的實體,如數(shù)據(jù)集包括CNNDM(Cable News NetworkDailyMail)[1]和訊飛、哈工大的中文完形填空數(shù)據(jù)集HFL-RC(joint laboratory of HIT and iFLYTEK research-Reading Comprehension)[2]等;選擇類問題,每篇文章對應多個問題,每個問題有多個候選答案,機器需要在候選答案中找到最合適選項,如數(shù)據(jù)集MCTest(Machine Comprehension of Test)[3]、RACE(ReAding Comprehension dataset collected from English Examinations)[4]等;片段抽取類問題,通常給定文章和問題,機器需要在文章中找到答案對應的區(qū)域,給出開始位置和結(jié)束位置,如數(shù)據(jù)集SQuAD(Stanford Question Answering Dataset)[5]、TriviaQA[6]等;自由形式問題,該類問題是來自搜索引擎或社區(qū)問答,其問題和答案是由人工整理的,需要理解多個段落回答問題,如DuReader[7]、HotpotQA[8]、NarrativeQA[9]等。
從上述機器閱讀理解任務的問題可以感受到人工智能技術(shù)正在為計算機賦予閱讀、分析和歸納文本的能力。為了反映機器更深的理解能力,很多學者針對高考語文閱讀理解任務進行了研究。針對選擇類型題,郭少茹等[10]提出了基于多維度的投票方法,該方法將不同維度的語義相關(guān)性作為度量標準,運用投票算法的思想選取問題的最佳選項。王元龍等[11]先把選項按不同的特征分為4類,并針對因果關(guān)系類選項提出了相應的解決方案,該方法僅是對選項的因果關(guān)系支持度分析做了一些探索,沒有考慮文檔中的篇章關(guān)系。針對問答類題型,王智強等[12]利用篇章框架語義分析方法抽取答案句,該方法能夠從相似性與相關(guān)性兩方面獲得更好的答案句抽取結(jié)果。譚紅葉等[13]對抽取的答案句提出了句子融合方案,使得答案更加簡潔、流暢。張兆濱等[14]提出了基于多任務層級長短時記憶網(wǎng)絡(luò)的問題擴展建模方法用于回答觀點類問題。譚紅葉等[15]提出了一種基于BERT(Bidirectional Encoder Representation from Transformers)的多任務閱讀理解模型,利用注意力機制獲得豐富的問題與篇章的表示,實現(xiàn)了問題的多樣性解答。楊陟卓等[16]針對閱讀理解中概括型問答題提出了基于詞語相似度匹配、框架匹配、篇章主題同時抽取候選句的方法,該方法可以有效抽取與問題相關(guān)的內(nèi)容要點以及作者的觀點態(tài)度句,但仍缺乏對原文的句間關(guān)系分析以及對背景材料進行深層語義理解。
本文關(guān)注高考語文中的文學作品閱讀理解任務,重點解決主旨線索類型的問答類型題。該任務中問題的答案是原文中的主旨線索,需要先對原文進行深度理解,包括整體語篇結(jié)構(gòu)、作者情緒變化等。該類任務的問題形式如例1和例2所示:
例1 [北京/2016]:作者對老腔的認識經(jīng)歷了怎樣的變化過程?請結(jié)合全文作簡要說明。
線索:很難產(chǎn)生驚詫之類的反應→生出神秘感來→因相見恨晚而覺得懊喪自責→老腔具有強烈的呼應和感染力,觸動了當代人的神經(jīng)→觀眾與老腔應該是融為一體的,自己這種拉開間距尋求客觀欣賞的舉措是多余的
例2 [北京/2018]:本文題目“水缸里的文學”意蘊豐富,綜觀全文,你如何理解其中的寓意?以此為題有怎樣的表達效果?
線索:水缸與我童年密切相伴,是我童年認識世界,體味人生,引發(fā)文學夢的主要對象→水缸引發(fā)了關(guān)于河蚌故事的論述,激發(fā)了作者詩意的想象,是作者閱讀和體會世界的方式→因為小時候物質(zhì)所限,作者渴望但無法閱讀兒童書,水缸刺激作者的想象、智力→水缸是作者童年時期的記憶,保留了作者的好奇心,保留了奇跡般的創(chuàng)造力
為了更好地理解原文的主旨線索,本文借助Zwann等[17]提出的事件索引假設(shè)理論,該理論指出在語篇閱讀中人們會根據(jù)不同的索引來整體地建構(gòu)所閱讀過的信息。文獻[17]中認為,閱讀故事時,讀者監(jiān)控情境模型并更新之,情境模型有5個維度:時間、空間、因果、意圖和實體(客體、主角、主角的情緒等)。因此本文提出基于事件表示的閱讀理解模型,以事件作為篇章的基本單元和處理單位,存儲組成事件的概念及其之間的關(guān)系,進而回答閱讀理解中主旨線索類型的問題。首先,構(gòu)建原文的事件結(jié)構(gòu)圖,需要考慮適合文學作品的事件表示;然后,根據(jù)重要度選出線索相關(guān)的事件;最后,依據(jù)線索相關(guān)事件整理出主旨線索答案。
不同領(lǐng)域?qū)κ录亩x存在差異,并且體現(xiàn)了該領(lǐng)域所關(guān)注的實際問題。信息領(lǐng)域則更關(guān)注事件在信息處理中的應用,包括事件的識別以及事件應用。事件識別也稱作事件抽?。╡vent extraction),是信息抽取領(lǐng)域中重要的一個組成部分,包括事件要素識別及事件關(guān)系識別。
在事件抽取的過程中,一個事件往往被更形式化地定義為包含了事件觸發(fā)器(event trigger)、事件類型(event type)、事件元素(event argument)和事件元素角色(event argument role),因此事件抽取的任務就是識別出上述事件要素并且進行結(jié)構(gòu)化組織[18]。ACE(Automatic Content Extraction)2015定義了8種事件類別(life,movement,conflict,contact等)和33種子事件類別(born,marry,injury,transport,attack等),每種事件類別對應唯一的事件模板,如子事件born,事件模板(template)包括person、time-within、place等。
目前,時序關(guān)系和因果關(guān)系是最重要的事件關(guān)系。Chambers等[19]提出腳本敘事性事件鏈(narrative event chain)概念,認為這是一種新的知識結(jié)構(gòu)化表示方式,敘事性事件鏈由一系列的敘事性事件按照時序組合形成,并進一步在這個工作的基礎(chǔ)上,組織了相關(guān)的評測TimeML(Time Markup Language)。TimeML評測主要還是集中在對時序關(guān)系事件的識別,大致任務分成兩部分:一是識別兩個事件實體,其次是判定兩個事件之間的時序關(guān)系。之后,事件之間的因果關(guān)系(Causality)也被人們提出,具有代表性的因果關(guān)系標注語料庫有Palmer等[20]提出的PropBank 以及Prasad等[21]提出的PDTB (Penn Discourse TreeBank),前者標注了動詞與動詞、動詞與從句之間的因果關(guān)系,后者標注了從句之間的因果關(guān)系,兩個因果關(guān)系標注語料庫進一步推動了事件因果關(guān)系抽取技術(shù)的發(fā)展。Kruengkrai等[22]用 MCNNs(Multi-Column Neural Networks)從海量語料中尋找一個事件對的因果關(guān)系路徑,從而判斷事件對之間是否有因果關(guān)系。Kang等[23]也是從文本中挖掘因果特征來對時序事件的因果關(guān)系進行判斷。
本文借鑒上述事件要素和事件關(guān)系識別的思想,進一步提出了適合文學作品的事件表示、事件要素和關(guān)系類型定義及其抽取方法,進而構(gòu)建篇章事件結(jié)構(gòu)圖,用于回答閱讀理解中主旨線索類型的問題。
要真正地理解一個語篇,對原文主旨線索的把握是非常重要的閱讀理解過程。文章主旨線索是在文章的不同段落中都可見的詞、句子或是情節(jié)等,是文章結(jié)構(gòu)的紅線。它能貫穿全文,使文章渾然一體,使結(jié)構(gòu)完整嚴謹。為了讓機器能夠以一種更為接近于人腦的知識結(jié)構(gòu)體系去理解語篇,本文提出了基于事件表示的閱讀理解模型。
本文借助事件標記模型來構(gòu)建閱讀理解模型,給出了主旨線索類問題的解決方案。首先,通過事件要素抽取和多粒度事件表示構(gòu)建原文的事件結(jié)構(gòu)圖,需要考慮適合文學作品的事件表示;然后,基于TextRank算法選取關(guān)鍵事件;最后,依據(jù)關(guān)鍵事件構(gòu)建線索答案。
本文以事件作為基本單位把閱讀理解中的原文表示成事件圖。事件圖的構(gòu)建包括事件表示以及事件間關(guān)系的表示。
2.1.1事件表示
文學作品閱讀理解中的事件是指發(fā)生在一段時間內(nèi),由若干實體參與,表現(xiàn)出某些情緒或動作的描述,通常是一個句子或句群。因此本文將情境模型的五維事件進行整合,給出了適合文學作品的事件形式化定義,具體為:
(,,)
其中:表示動作;表示實體(包括主體和客體);表示時間;表示情緒。
2.1.2事件要素抽取方法
本文對不同的事件要素采用了不同的抽取方法,其中動作和實體要素采用基于規(guī)則的方法,時間要素采用基于漢語框架網(wǎng)(Chinese FrameNet, CFN)的方法,情緒要素采用基于詞典的方法。具體抽取方法如下:
1)基于規(guī)則的動作和實體要素抽取。本文借助哈工大的LTP(Language Technology Platform)的語義角色標注和語義依存句法標注來抽取動作和實體要素。具體規(guī)則如下:①在語義角色標注結(jié)果中如果有明確的論元,即有A0、A1的標注,就采用語義角色標注的結(jié)果;②否則基于語義依存標注提取句子中的動詞短語表示事件要素,動詞短語的關(guān)系類型包括主謂關(guān)系(SuBject-Verb, SBV)、動賓關(guān)系(Verb-OBject, VOB)以及動補關(guān)系(ATTribute, ATT)。另外,動詞前的程度詞和否定詞對事件抽取起到重要的作用,因此,本文構(gòu)建了程度詞和否定詞表,將其并入動作要素中。
2)基于CFN的時間要素抽取。
本文采用與時間相關(guān)的框架識別時間要素,其中包括時間測量、時間向量、時間跨度、歷法單位、時量場景、時間亞區(qū)以及相對時間框架。每個框架包括若干與時間相關(guān)的詞元,如表1所示。
表1 時間相關(guān)框架描述
3)基于詞典的情緒要素抽取。
情緒要素抽取采用大連理工大學自然語言處理課題組發(fā)布的情感詞典[24],在原文中出現(xiàn)的情感詞當作該事件的情緒要素,該詞典包含27 466個情感詞。
2.1.3多粒度事件關(guān)系表示
為了更好地表達原文中的線索,本文依據(jù)句內(nèi)事件關(guān)系和句間事件關(guān)系,提出了多粒度事件關(guān)系表示。首先,掃描文本,按句號分割原文,識別句間的事件關(guān)系;然后,按照上述方法識別句子中的單個事件,依據(jù)事件關(guān)系線索詞識別事件與事件之間的關(guān)系。目前有因果、轉(zhuǎn)折和時序三種事件關(guān)系。例:[朋友跟我說老腔如何如何,我卻很難產(chǎn)生驚詫之類的反應。因為我在關(guān)中地區(qū)生活了幾十年,卻從來沒聽說過老腔這個劇種。]表示為如圖1所示的多粒度事件關(guān)系表示。
圖1 多粒度事件關(guān)系表示
在提取原文的主旨線索時,通常需要考慮以下幾個特點:1)時間連“線”,用時空詞語連接線索;2)以物作“線”和反復出“線”,高頻詞和關(guān)鍵詞經(jīng)常出現(xiàn)在線索中;3)以情導“線”,情感詞有助于分析材料之間的內(nèi)在聯(lián)系,理清感情發(fā)展變化的軌跡?;谏鲜鎏攸c,本文提出了將事件中的四種要素當作事件排序的重要要素成分,提出了基于TextRank算法的事件選取方法,具體如算法1所示。
算法1 重要事件選取。
輸入 原文事件關(guān)系圖;
輸出 重要事件所在的句子。
步驟1 為每個事件找到向量表示(四種要素的詞向量);
步驟2 計算事件向量間的相似性并存放在矩陣中;
步驟3 將相似矩陣轉(zhuǎn)換為以事件為節(jié)點、相似性得分為邊的圖結(jié)構(gòu);
步驟4 利用TextRank算法,將排名最高的6個事件輸出構(gòu)成最后的重要事件;
步驟5 基于識別的重要事件檢索出其所在的句子。
本文按照原文句子順序?qū)⑵渌槿〉闹匾录诰渥舆M行排序。為了使答案更加合理,對事件句子進行了融合。如果抽取出的兩個事件為轉(zhuǎn)折關(guān)系,只保留后面的事件(轉(zhuǎn)折后的事件更重要)。如果抽取出的兩個事件為因果關(guān)系,只保留結(jié)果的事件。而對于時序關(guān)系的事件放在一個片段描述,具體格式如下:
其中,表示事件,小括號()表示時序關(guān)系的事件集合。另外,為了讓答案更加合理,將答案中的第一人稱代詞用“作者”代替。
本文采用了BLEU-(BiLingual Evaluation Understudy)(=1,2,3,4)[17]和CIDEr(Consensus-based Image Description Evaluation)[19]5個評價指標對抽取的答案進行評價。其中,BLEU-指標更關(guān)注抽取答案的準確性和流暢度,用于分析抽取答案中有多少元詞組出現(xiàn)在參考答案中。CIDEr指標主要評價模型有沒有抓取到關(guān)鍵信息,計算參考譯文和候選譯文之間的TF-IDF(Term Frequency- Inverse Document Frequency)向量余弦距離,以此度量二者的相似性。
為了驗證本文方法的效果,采用基于TextRank算法的句子排序方法作為基線方法,把文本分割成若干組成單元(單詞、句子)建立圖模型, 利用投票機制對文本中的重要成分進行排序, 利用單篇文檔本身的信息實現(xiàn)重要句排序,TextRank算法輸出Top-6的句子作為主旨線索。
表2給出了本文方法與句子排序方法在5個評價指標上實驗結(jié)果比較。從表2可以看出,本文方法相較直接采用TextRank算法的句子排序在5個評價指標上均有所提升,表明本文方法答案的準確性和流暢度以及抓取到關(guān)鍵信息的能力均優(yōu)于直接采用TextRank算法的句子排序方法。另外,本文還測試了文獻[16]中基于詞語相似度匹配、框架匹配、篇章主題匹配同時抽取候選句的方法用在線索類題型的效果,如表2所示。實驗結(jié)果表明,文獻[16]所提方法在5個評價指標上比基線方法略高,低于本文方法,進一步驗證了本文方法的有效性。
表2不同方法對比實驗結(jié)果 單位:%
Tab.2 Experimental results comparison of different methods unit:%
例3 [北京/2016]:作者對老腔的認識經(jīng)歷了怎樣的變化過程?請結(jié)合全文作簡要說明。
參考答案:作者從沒有聽過老腔,認為老腔影響小。認為老腔演出者不過是民間演出班社。到后來聽過一次老腔,深深地被老腔震撼。為自己的小說《白鹿原》中沒有加入老腔的表演而遺憾,到最后在中山音樂堂再次領(lǐng)悟了老腔的震撼力。對老腔的理解更加深入了。
本文方法抽取的答案句:
2)因為我在關(guān)中地區(qū)生活了幾十年[時間測量],卻從來沒聽說過老腔這個劇種,可見其影響的寬窄了。
構(gòu)建答案:
1)作者第一次看老腔演出,是前兩三年的事,朋友跟作者說老腔如何如何,作者卻很難產(chǎn)生驚詫之類的反應。2)開幕演出前的等待中,這是華陰縣的老腔演出班社,老腔是了不得的一種唱法,也就能想到他們是某個劇種的民間演出班社,作者對老腔便刮目相看了。3)直到后來小說《白鹿原》改編成話劇,讓作者有了一種釋然的感覺。4)后來還想再聽老腔,卻難得如愿。
為了驗證本文抽取的線索句是否容易聚集在原文中的某個段落或片段內(nèi),本文統(tǒng)計了原文前50句被抽取到作為文中線索句的文章數(shù)量,具體如圖2所示。其中,橫坐標為文中句子編號,縱坐標為某句作為抽取結(jié)果的文章數(shù)量。從圖2中可以看出,與基于TextRank算法的句子排序方法相比,本文方法抽取到的句子分散在原文,更符合作者的線索思路。
圖2 線索句抽取結(jié)果比較
本文關(guān)注高考語文中的文學作品閱讀理解任務,重點研究解決主旨線索類型的問題。借助事件標記模型,本文提出了基于事件表示的閱讀理解模型,以事件作為篇章的基本單元和處理單位,存儲組成事件的概念及其之間的關(guān)系,進而回答閱讀理解中主旨線索類型的問題。實驗結(jié)果表明,本文方法可以抽出答案要點,較好地反映出原文的線索及行文思路。
但是本文還存在如下不足:1)答案為從原文中抽取的結(jié)果,缺乏歸納能力;2)時間片段識別不夠準確,造成抽取的線索片段不均勻。這些不足是我們未來需要改進的方向,以期在原來基礎(chǔ)上進一步研究探索出性能更優(yōu)的線索抽取方 法。
[1] CHEN D Q, BOLTON J, MANNING C D. A thorough examination of the CNN/Daily Mail reading comprehension task[C]// Proceeding of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: Association for Computational Linguistics, 2016: 2359-2367.
[2] CUI Y M, LIU T, CHEN Z P, et al. Consensus attention-based neural networks for Chinese reading comprehension[C]// Proceeding of the 26th International Conference on Computational Linguistics: Technical Papers. [S.l.]: The COLING 2016 Organizing Committee, 2016:1777-1786.
[3] RICHARDSON M, BURGES C J C, RENSHAW E. MCTest: a challenge dataset for the open-domain machine comprehension of text[C]// Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2013: 193-203.
[4] LAI G K, XIE Q Z, LIU H X, et al. RACE: large-scale Reading comprehension dataset from examinations[C]// Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2017:785-794.
[5] RAJPURKAR P, ZHANG J, LOPYREV K, et al. SQuAD: 100,000+ questions for machine comprehension of text[C]// Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2016: 2383-2392.
[6] JOSHI M, CHOI E, WELD D S, et al. TriviaQA: a large scale distantly supervised challenge dataset for reading comprehension[C]// Proceeding of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: Association for Computational Linguistics, 2017: 1601-1611.
[7] HE W, LIU K, LIU J, et al. DuReader: a Chinese reading comprehension dataset from real-world applications[C]// Proceedings of the 2018 Workshop on Machine Reading for Question Answering. Stroudsburg, PA: Association for Computational Linguistics, 2018:37-46.
[8] YANG Z L, QI P, ZHANG S Z, et al. HotpotQA: a dataset for diverse, explainable multi-hop question answering[C]// Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2018:2369-2380.
[9] KO?ISKY T, SCHWARZ J, BLUNSOM P, et al. The NarrativeQA reading comprehension challenge[J]. Transactions of the Association for Computational Linguistics, 2017, 6:317-328.
[10] 郭少茹,張虎,錢揖麗,等. 面向高考閱讀理解的句子語義相關(guān)度[J]. 清華大學學報(自然科學版), 2017, 57(6):575-579, 585.(GUO S R, ZHANG H, QIAN Y L, et al. Semantic relevancy between sentences for Chinese reading comprehension on college entrance examinations[J]. Journal of Tsinghua University (Science and Technology), 2017, 57(6):575-579, 585.)
[11] 王元龍,李茹,張虎,等. 閱讀理解中因果關(guān)系類選項的研究[J]. 清華大學學報(自然科學版), 2018, 58(3):272-278.(WANG Y L, LI R, ZHANG H, et al. Causal options in Chinese reading comprehension[J]. Journal of Tsinghua University (Science and Technology), 2018, 58(3):272-278.)
[12] 王智強,李茹,梁吉業(yè),等. 基于漢語篇章框架語義分析的閱讀理解問答研究[J]. 計算機學報, 2016, 39(4): 795-807.(WANG Z Q, LI R, LIANG J Y, et al. Research on question answering for reading comprehension based on Chinese discourse frame semantic parsing[J]. Chinese Journal of Computers, 2016, 39(4): 795-807.)
[13] 譚紅葉,趙紅紅,李茹. 面向閱讀理解復雜問題的句子融合[J]. 中文信息學報, 2017, 31(1):8-16.(TAN H Y, ZHAO H H, LI R. Sentence fusion for complex problems in reading comprehension[J]. Journal of Chinese Information Processing, 2017, 31(1):8-16.)
[14] 張兆濱,王素格,陳鑫,等. 閱讀理解中觀點類問題的擴展研究[J]. 中文信息學報, 2020, 34(6): 89-96, 105.(ZHANG Z B, WANG S G, CHEN X, et al. Question expansion for machine reading comprehension of opinion[J]. Journal of Chinese Information Processing, 2020, 34(6): 89-96, 105.)
[15] 譚紅葉,屈保興. 面向多類型問題的閱讀理解方法研究[J]. 中文信息學報, 2020, 34(6): 81-88.(TAN H Y, QU B X. An approach to multi-type question machine reading comprehension[J]. Journal of Chinese Information Processing, 2020, 34(6):81-88.)
[16] 楊陟卓,李春轉(zhuǎn),張虎,等. 基于CFN和篇章主題的概括型問答題的解答[J]. 中文信息學報, 2020, 34(12): 73-81.(YANG Z Z, LI C Z, ZHANG H, et al. Question answering for overview questions based on CFN and discourse topic[J]. Journal of Chinese Information Processing, 2020, 34(12): 73-81.)
[17] ZWANN R A, RADVANSKY G A, HILLIARD A E, et al. Constructing multidimensional situation models during reading[J]. Scientific Studies of Reading, 1998, 2(3):199-220.
[18] HUANG L F, JI H, CHO K, et al. Zero-shot transfer learning for event extraction[C]// Proceeding of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: Association for Computational Linguistics, 2018: 2160-2170.
[19] CHAMBERS N, JURAFSKY D. Unsupervised learning of narrative event chains[C]// Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA: Association for Computational Linguistics, 2008:789-797.
[20] PALMER T, GILDEA D, KINGSBURY P. The proposition bank: an annotated corpus of semantic roles[J]. Computational Linguistics, 2005, 31(1): 71-106.
[21] PRASAD R, MILTSAKAKI E, DINESH N, et al. The Penn Discourse TreeBank 2.0 annotation manual[R/OL]. (2007-12-17) [2021-02-12].https://www.seas.upenn.edu/~pdtb/PDTBAPI/pdtb-annotation-manual.pdf.
[22] KRUENGKRAI C, TORISAWA K, HASHIMOTO C, et al. Improving event causality recognition with multiple background knowledge sources using multi-column convolutional neural networks[C]// Proceedings of the 31st AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2017:3466-3473.
[23] KANG D, GANGAL V, LU A, et al. Detecting and explaining causes from text for a time series event[C]// Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: Association for Computational Linguistics, 2017:2758-2767.
[24] 徐琳宏,林鴻飛,潘宇,等. 情感詞匯本體的構(gòu)造[J]. 情報學報, 2008, 27(2): 180-185.(XU L H, LIN H F, PAN Y, et al. Constructing the affective lexicon ontology[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(2): 180-185.)
WANG Yuanlong, born in 1983, Ph. D., associate professor. His research interests include natural language processing, machine learning.
LIU Xiaomin, born in 2000, M. S. candidate. Her research interests include natural language processing.
ZHANG Hu, born in 1979, Ph. D., associate professor. His research interests include natural language processing.
Machine reading comprehension model based on event representation
WANG Yuanlong*, LIU Xiaomin, ZHANG Hu
(,,030006,)
In order to truly understand a piece of text, it is very important to grasp the main clues of the original text in the process of reading comprehension. Aiming at the questions of main clues in machine reading comprehension, a machine reading comprehension method based on event representation was proposed. Firstly, the textual event graph including the representation of events, the extraction of event elements and the extraction of event relations was extracted from the reading material by clue phrases. Secondly, after considering the time elements, emotional elements of events and the importance of each word in the document, the TextRank algorithm was used to select the events related to the clues. Finally, the answers of the questions were constructed based on the selected clue events. Experimental results show that on the test set composed of the collected 339 questions of clues, the proposed method is better than the sentence ranking method based on TextRank algorithm on BiLingual Evaluation Understudy (BLEU) and Consensus-based Image Description Evaluation (CIDEr) evaluation indexes. In specific, BLEU-4 index is increased by 4.1 percentage points and CIDEr index is increased by 9 percentage points.
natural language processing; reading comprehension; question of main clues; event representation; textual event graph
This work is partially supported by National Natural Science Foundation of China (61806117, 62176145).
1001-9081(2022)07-1979-06
10.11772/j.issn.1001-9081.2021050719
2021?05?07;
2022?02?21;
2022?02?25。
國家自然科學基金資助項目(61806117, 62176145)。
TP391.1
A
王元龍(1983—),男,山西大同人,副教授,博士,CCF會員,主要研究方向:自然語言處理、機器學習; 劉曉敏(2000—),女,山西朔州人,碩士研究生,主要研究方向:自然語言處理; 張虎(1979—),男,山西大同人,副教授,博士,CCF會員,主要研究方向:自然語言處理。