亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對話式論辯研究綜述

        2024-01-20 02:22:04魏忠鈺丁佳玙沈晨晨梁敬聰紀(jì)程煒林嘉昱黃萱菁
        中文信息學(xué)報 2023年10期
        關(guān)鍵詞:文本質(zhì)量模型

        魏忠鈺,丁佳玙,沈晨晨,高 源,梁敬聰,紀(jì)程煒,林嘉昱,黃萱菁

        (1. 復(fù)旦大學(xué) 大數(shù)據(jù)學(xué)院,上海 200433;2. 復(fù)旦大學(xué) 計算機(jī)科學(xué)技術(shù)學(xué)院,上海 200433)

        0 引言

        論辯(Argumentation)[1-3]以人的邏輯論證過程作為研究對象,是一個涉及邏輯、哲學(xué)、語言、修辭、計算機(jī)科學(xué)和教育等多學(xué)科的研究領(lǐng)域,相關(guān)研究工作可以追溯到亞里士多德時期[4]。近年來,論辯研究引起計算語言學(xué)的關(guān)注,并催生了一個新的研究領(lǐng)域,即計算論辯學(xué)(Computational Argumentation)[5-6]。學(xué)者試圖將人類關(guān)于邏輯論證的認(rèn)知模型與計算模型結(jié)合起來,以提高人工智能自動推理的能力[7-8]。根據(jù)參與論辯過程的人數(shù)不同,計算論辯學(xué)的研究可以分成兩類,即,單體式論辯(Monological Argumentation)和對話式論辯(Dialogical Argumentation)。單體式論辯[6]的研究對象是僅有一個參與者的辯論性文本,如議論文和主題演講等。相關(guān)的研究包括論辯部件檢測[9]、論辯結(jié)構(gòu)預(yù)測[10-11]、論辯策略分類[12-13]和議論文評分[14-15]等。對話式論辯[16-17]的研究對象是針對某一個特定議題進(jìn)行觀點(diǎn)交互的論辯過程, 一般有多個參與者。相關(guān)的研究包括論辯結(jié)果預(yù)測[18-19]和論辯邏輯鏈抽取[20-21]等。近年來,相關(guān)學(xué)者在單體式論辯研究中取得了一定程度的進(jìn)展,包括任務(wù)類型的確定、數(shù)據(jù)集合的構(gòu)建以及基線模型的提出等。但對于對話式論辯的相關(guān)研究還停留在初步階段,缺乏對相關(guān)場景和任務(wù)的系統(tǒng)化梳理與建模。

        多參與者的論辯交互過程在現(xiàn)實(shí)世界中廣泛存在,如社交網(wǎng)絡(luò)[22-23]、司法領(lǐng)域[24-26]、教育領(lǐng)域[27-30]等。隨著社交媒體(微博、微信、知乎、臉書等)在世界范圍內(nèi)的影響力不斷擴(kuò)大,人們交流信息的方式也發(fā)生了革命性的變化。很多話題的討論都從“餐桌對話”的形式擴(kuò)展到在線平臺,大量積累的用戶討論文本也因此成為大家對公眾議題進(jìn)行搜索的重要信息來源[31]。在法庭的案件審理過程中,控訴方和辯護(hù)方會針對一個特定案件的不同側(cè)面進(jìn)行觀點(diǎn)的交換,而法官和陪審團(tuán)則會基于這樣的交互信息,對案件的結(jié)果進(jìn)行最終的判決。每一場庭審記錄都包含大量控辯雙方的交互文本,成為法官和陪審團(tuán)解讀案件需要進(jìn)行深度理解的材料。在教育領(lǐng)域,議論文寫作是學(xué)生在語言課程學(xué)習(xí)中的必修科目,學(xué)生需要對于給定主題給出自己的觀點(diǎn),而針對不同立場進(jìn)行論點(diǎn)的建構(gòu)和陳述是很常用的議論文寫作手法。收集和利用現(xiàn)有的針對某特定議題的討論文本對于論文的寫作至關(guān)重要。

        隨著不同領(lǐng)域的對話式論辯性文本的積累,針對對話式論辯文本的自動化理解工具和算法有越來越大的實(shí)際需求。經(jīng)典的對話式論辯分析任務(wù)以兩段論辯性文本作為輸入(原始論辯文本和回復(fù)論辯文本),在經(jīng)過針對每一個論辯性文本的論點(diǎn)抽取之后,深入的分析還包括三個子任務(wù),即,交互論點(diǎn)對抽取,交互策略識別以及論辯質(zhì)量評估。交互論點(diǎn)對抽取模塊旨在將來自兩段論辯性文本的論點(diǎn)進(jìn)行自動化的匹配,交互策略識別則進(jìn)一步研究觀點(diǎn)對的交互性質(zhì)(贊成、反對、駁斥等),論辯質(zhì)量評估(有說服力、欠說服力等)。除了文本理解型的任務(wù)之外,生成式任務(wù)也在近年引起學(xué)界的廣泛關(guān)注,研究主題包括總結(jié)性論點(diǎn)生成和目標(biāo)論點(diǎn)生成。本綜述將覆蓋對話式論辯文本理解和生成兩部分的研究內(nèi)容,并介紹智能論辯應(yīng)用的研究進(jìn)展。最后,本文總結(jié)了當(dāng)前的研究進(jìn)展并展望了未來的發(fā)展方向。

        1 交互式論點(diǎn)對抽取

        1.1 交互式論點(diǎn)對識別

        在對話式論辯中,一個核心的任務(wù)在于自動識別出論辯雙方(或多方)關(guān)于某個特定議題、論點(diǎn)、或論據(jù),產(chǎn)生邏輯語義交互關(guān)系的論點(diǎn)對,即交互式論點(diǎn)對識別。從一方面來看,該任務(wù)是理解對話式論辯文本結(jié)構(gòu)和內(nèi)容的基礎(chǔ),只有識別出雙方存在交互關(guān)系的論點(diǎn)對,才能進(jìn)一步劃分整場論辯中雙方觀點(diǎn)的相互作用和演化過程,從而推進(jìn)更多對話式論辯中的下游任務(wù)的建模理解,如辯論摘要和論點(diǎn)說服力質(zhì)量評估等;而從另一方面來說,該任務(wù)也是對話式論辯中最具有實(shí)際應(yīng)用前景的方向,不論是在線論壇亦或是內(nèi)容平臺,識別出雙方的觀點(diǎn)交互后,有助于快速理解用戶之間或買家賣家之間的核心爭論點(diǎn),從而幫助人們迅速捕捉討論中涉及的多方訴求,精確定位到人們的真實(shí)意圖和根本分歧。

        交互式論點(diǎn)對識別任務(wù)最早由Ji 等人在2019年提出。所謂交互式論點(diǎn)對,便是指在對話式論辯的場景中(如辯論賽或在線辯論論壇等),參與的雙方就某一共同話題所產(chǎn)生的邏輯或語義上存在相關(guān)的論點(diǎn)對。圖1給出了ChangeMyView論壇中的兩條討論帖的示例,其中,帖A為該主題下的原始帖(Original Post),即“樓主”所發(fā)。而帖B為A的回復(fù)帖(Reply Post)。這兩篇帖子都旨在討論聯(lián)合養(yǎng)老制度的合理性,其中帖A支持聯(lián)合養(yǎng)老保險制度,共分為五個論點(diǎn)句A1~A5,并從三個角度闡述了發(fā)帖者所認(rèn)為的合理性;而帖B反對該制度,也分為五個論點(diǎn)句B1~B5,并通過舉例論證的方式論證了自己的核心觀點(diǎn)“人們退休后的收入需求通常會隨著年齡的增長而下降”。通過分析這兩篇帖子的文本,可以發(fā)現(xiàn)B1和A1之間存在直接的反對關(guān)系,因而這是一對交互式論點(diǎn)對,相似地,B2和A5也共同成為一對交互式論點(diǎn)對。

        圖1 CMV論壇中兩條發(fā)帖的內(nèi)容及其中論點(diǎn)交互的示例

        Ji等人通過觀察分析Tan等人所爬取的CMV論壇數(shù)據(jù),發(fā)現(xiàn)在該論壇數(shù)據(jù)中,一些回復(fù)帖中存在對于原始帖(被回復(fù)的帖子)的直接引用(Quotation)。圖2是聯(lián)合養(yǎng)老保險制度合理性討論下的示例,可以發(fā)現(xiàn)帖B對帖A中“你把錢放在信托里,信托把錢投資出去,然后它就會和其他所有人的錢混在一起。”這句話進(jìn)行了引用,且引用后緊跟的一句話便是在回復(fù)該被引用句。在論壇數(shù)據(jù)里,這樣的引用由特殊符號“>”所標(biāo)識。基于該發(fā)現(xiàn),Ji 等人認(rèn)為回復(fù)貼中關(guān)于原始帖引用后的第一句話便是對于原始帖被引用句的交互論點(diǎn),即被引用句(Quotation Argument)和該回復(fù)句(Reply Argument)構(gòu)成交互式論點(diǎn)對。因此,Ji等人通過將CMV的文本數(shù)據(jù)進(jìn)行規(guī)則篩選,共獲得了13 046組引用回復(fù)論點(diǎn)對,即交互式論點(diǎn)對,并以此為正樣本,按照1∶4的比例在同一回復(fù)帖中采集其他句子作為負(fù)樣本,最終形成在五句候選回復(fù)論點(diǎn)句中找出正確的與被引用論點(diǎn)存在交互關(guān)系的論點(diǎn)句。

        圖2 CMV論壇中回復(fù)帖關(guān)于原始帖存在引用現(xiàn)象示例

        特別地,針對該交互式論點(diǎn)對識別任務(wù),Ji 等人[32]提出了通過離散變分自編碼器(Discrete Variational Auto Encoder)來對給定論點(diǎn)進(jìn)行離散化表示,意在從糅合的論點(diǎn)文本表示中分離出論辯主題、辯手行為特點(diǎn)等不同層面的特征,在所提數(shù)據(jù)集上的實(shí)驗(yàn)顯示該模型相比其他的文本編碼及匹配的基準(zhǔn)模型有著較大的性能提升。隨著該任務(wù)的提出,越來越多的研究者意識到交互式論點(diǎn)對任務(wù)在對話式論辯中的重要地位,并提出了相關(guān)改進(jìn)方法來提升模型性能[33]。Yuan等人[34]通過對該任務(wù)數(shù)據(jù)集的分析,發(fā)現(xiàn)對該任務(wù)的建模不止需要對文本相似度進(jìn)行計算,還需要對討論中包含的概念實(shí)體和推理過程進(jìn)行建模?;谠摪l(fā)現(xiàn),作者基于CMV數(shù)據(jù)集構(gòu)建了一個包含20余萬節(jié)點(diǎn)和80余萬條邊的論辯領(lǐng)域知識圖譜,將這一外部知識庫引入模型增強(qiáng)上下文理解能力,并提出了基于Transformer編碼器對推理路徑進(jìn)行建模來增強(qiáng)交互式論點(diǎn)對識別任務(wù)的方法。 Devlin等人[35]提出了大規(guī)模預(yù)訓(xùn)練模型BERT,憑借其龐大的參數(shù)和先進(jìn)的多頭自注意力機(jī)制,一時間在幾乎所有的自然語言處理相關(guān)的任務(wù)上都取得了最優(yōu)性能,在該任務(wù)上的表現(xiàn)也超過了Ji等人;Wu等人[36]使用混合提升(Mixup)方法,通過對訓(xùn)練樣本中的引用回復(fù)論點(diǎn)對及其訓(xùn)練目標(biāo)進(jìn)行線性插值,生成了大量的新的人造樣本,同時作者還增強(qiáng)了所提模型對于給定引用論點(diǎn)和候選回復(fù)論點(diǎn)對上下文的建模,基于上述數(shù)據(jù)增強(qiáng)以及額外信息建模的改進(jìn)使得其在該任務(wù)上模型的性能得到進(jìn)一步的提升。

        1.2 論點(diǎn)對抽取

        論點(diǎn)對抽取(Argument Pair Extraction,APE)是對話式論辯領(lǐng)域的一個新任務(wù),目的是從兩篇相關(guān)的文章中成對抽取那些具有互動關(guān)系的論點(diǎn)。圖3是同行評議場景下一個論點(diǎn)對抽取的例子,來自 Review-Rebuttal 數(shù)據(jù)集,左圖是論文的審稿意見(Review),右圖則是作者的回復(fù)(Rebuttal)。兩篇文章在句子級別上被劃分為論點(diǎn)和非論點(diǎn)。有陰影的為論點(diǎn),沒有陰影的為非論點(diǎn)。Review 中的論點(diǎn)可以與Rebuttal中的論點(diǎn)形成論點(diǎn)對,表示它們在討論同一問題。在這個例子中,兩個論點(diǎn)對分別用淺色陰影和深色陰影標(biāo)注出。

        圖3 同行評議場景下論點(diǎn)對抽取的示例[37]

        圖4 破壞論證的基本邏輯結(jié)構(gòu)

        Cheng等人[38]指出,論點(diǎn)對抽取是一項非常有挑戰(zhàn)的任務(wù),其挑戰(zhàn)性主要體現(xiàn)在以下兩個方面: 第一,從數(shù)據(jù)的層面看,不同于常見的抽取任務(wù),該任務(wù)所面對的文本非常長,并且是兩篇文章;第二,從任務(wù)定義的層面看,不同于傳統(tǒng)的論辯關(guān)系預(yù)測任務(wù),論辯對抽取首先需要從文本中抽取出各個論點(diǎn),然后再判斷論點(diǎn)間的關(guān)系。

        Bao等人[37]認(rèn)為之前在APE任務(wù)中的方法通過兩個分解的任務(wù)隱式地抽取出論點(diǎn)對,缺乏論點(diǎn)對之間參數(shù)級交互的顯式建模,因而作者通過一個相互引導(dǎo)的框架來處理該論點(diǎn)對抽取任務(wù),該框架可以利用一篇文章中的一個論點(diǎn)的信息來指導(dǎo)識別另一篇文章中與該論點(diǎn)成對的論點(diǎn),以此方式使得兩篇文章可以在任務(wù)過程中相互引導(dǎo),此外作者還引入了一個句子間關(guān)系圖來描述評審和反駁文本句子之間的復(fù)雜交互作用,從而顯式地利用論點(diǎn)級語義信息更精確地提取論點(diǎn)對。

        Cheng等人[39]則認(rèn)為以往APE任務(wù)上的研究將其看作是對直接連接在一起的兩篇文章的序列標(biāo)注問題和二分類問題,其局限性是沒有充分利用兩篇不同文章的獨(dú)特特征和內(nèi)在關(guān)系,從而提出了一種新的注意引導(dǎo)多層多交叉編碼方案來解決這一問題,所提新模型處理兩個獨(dú)立序列編碼器的兩個段落,并通過注意相互更新它們的表示。此外,作者還通過更新兩個序列的笛卡爾積表示,將預(yù)測部分表述為一個表填充問題,并引入了一個輔助注意力損失,以引導(dǎo)每個論點(diǎn)對齊成對的論點(diǎn)。

        2 論辯立場分析

        立場是指一個人對某個目標(biāo)(如物體、陳述或問題)的總體觀點(diǎn)。對一個目標(biāo)采取一種立場意味著支持或反對它。論辯立場分析是對文本給定目標(biāo)的立場的分類。通常輸入是一種論辯性文本,是問題或主張的某個目標(biāo),輸出是這段文本的觀點(diǎn)是贊成還是反對,有時也會考慮諸如中立或不相關(guān)的類型。論辯立場分析這個任務(wù)具有挑戰(zhàn)性的原因在于: 一是立場可以不提及話題本身就被表達(dá);二是需要考慮所討論的概念的對比性;三是積極的立場可以用消極的情緒來表達(dá),反之亦然。但是立場和情緒的極性又往往是相關(guān)的。

        對立場分類進(jìn)行計算建模有兩種方式: 一是標(biāo)準(zhǔn)文本分類,用針對特定話題的文本進(jìn)行訓(xùn)練;二是類似關(guān)系分類,以話題作為一個輸入。常用文本特征如下: 詞袋,單詞或單詞n-grams的分布;核心詞匯,主體性詞匯的術(shù)語;POS,詞性標(biāo)簽的分布;話語,論元間的連接詞關(guān)系;情緒,以主題導(dǎo)向的情緒極性[40-41]。

        大多數(shù)立場分析方法是利用各種上下文信息,如相關(guān)論辯、討論帖的文本等,使用有監(jiān)督機(jī)器學(xué)習(xí)算法來學(xué)習(xí)主題,具體的立場分類方法如下: 利用對話中作者的知識[42]、利用對話中的對立觀點(diǎn)[41]、利用文本和話題目標(biāo)的情感和對比[43]、基于總體結(jié)構(gòu)的立場識別路由核[44]。

        2010年,Somasundaran和Wiebe[40]探討了情感和爭論意見在意識形態(tài)辯論中分類立場的效用,建立了以情緒和爭論觀點(diǎn)及其目標(biāo)為特征的有監(jiān)督系統(tǒng)。2013年,Hasan和Ng[41]在辯論論壇上論辯雙方的辯論文本的立場標(biāo)簽上建立用戶交互約束和意識形態(tài)約束,從而檢測辯手所表達(dá)的立場。2016 年,Sobhani等人[45]開發(fā)了一個立場檢測系統(tǒng),分析了包括情緒特征在內(nèi)的各種特征對于立場檢測的影響,并且在競賽(SemEval-2016 task #6)中取得了優(yōu)異的結(jié)果。2017年,Bar-Haim等人[43]提出從情感和對比中得出立場,基于與給定話題相關(guān)的主張,對該主張在該問題上的立場進(jìn)行分類。采用的方法過程如下: 第一步,確定話題和主張的目標(biāo);第二步,針對每個目標(biāo)的情緒極性進(jìn)行分類;第三步,確定目標(biāo)是否具有對比性;第四步,從情感和對比中得出立場。

        前文介紹的立場檢測,可以簡單理解為是將文本中所表達(dá)的對給定目標(biāo)的態(tài)度分類為“積極”“消極”或“中性”。這類立場檢測工作大多是假設(shè)文中提到給定的目標(biāo),或者給出每個目標(biāo)的訓(xùn)練數(shù)據(jù)。接下來介紹一些目標(biāo)或主題未知情況下的立場分析工作。

        2016年,Augenstein等人[46]提出考慮立場檢測任務(wù)中目標(biāo)未知的情況,方法是: 首先,需要學(xué)習(xí)一個模型,來解釋文本對一個在文本中可能沒有提到的目標(biāo)的立場;其次,需要學(xué)習(xí)這樣一個沒有標(biāo)記的目標(biāo)的訓(xùn)練數(shù)據(jù)的模型。例如,一條推特“特朗普是共和黨唯一誠實(shí)的聲音”表達(dá)了對目標(biāo)唐納德·特朗普的積極立場。然而,當(dāng)以希拉里·克林頓為隱含目標(biāo)時,這條推特表達(dá)了一種負(fù)面的立場,因?yàn)橹С忠粋€政黨的候選人意味著對其他政黨的候選人的負(fù)面立場。在這個例子中,我們需要通過只使用其他目標(biāo)的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)希拉里·克林頓的模型。雖然這使得任務(wù)更具挑戰(zhàn)性,但這是一個更現(xiàn)實(shí)的場景,因?yàn)椴惶赡苡嗅槍γ總€感興趣的目標(biāo)的標(biāo)記訓(xùn)練數(shù)據(jù)。

        2017年,Wachsmuth等人[44]提出基于總體結(jié)構(gòu)的立場識別核方法,給定一個單一的論辯性文本,在不知道所討論的主題的情況下,對立場和偏見進(jìn)行分類。假設(shè)論辯性文本的整體結(jié)構(gòu)是決定立場和偏見的決定性因素,采用的方法是: 從文本的論證結(jié)構(gòu)開始,建模整體結(jié)構(gòu)的路由核(樹核的一個變體,可以捕獲順序結(jié)構(gòu)和層次結(jié)構(gòu)[47]),再根據(jù)整體結(jié)構(gòu)對立場和偏見進(jìn)行分類。2020年,Kobbe等人[48]提出了一個獨(dú)立于主題的方法,其主要關(guān)注事件后果,即我們在表達(dá)觀點(diǎn)時,經(jīng)常提及某個事件發(fā)生的后果來支持我們的觀點(diǎn)或反對他人的觀點(diǎn)。該篇工作提出一種模式來匹配/建模這種表達(dá)方式,并直接根據(jù)模式的結(jié)果推理出其所表達(dá)的立場,實(shí)現(xiàn)無監(jiān)督判斷一個句子對于目標(biāo)的立場。

        當(dāng)有足夠的帶標(biāo)簽的訓(xùn)練數(shù)據(jù)時,立場檢測任務(wù)很容易取得成功。然而,注釋足夠的數(shù)據(jù)會耗費(fèi)大量人力,這為將立場分類器泛化到具有新目標(biāo)的數(shù)據(jù)設(shè)置了顯著的障礙,且立場檢測有不同的任務(wù)變體,任務(wù)定義也各不相同,包括標(biāo)簽類型(如有些標(biāo)簽既包括同意、不同意和不相關(guān)的變體,又包括難以交叉映射的變體,如討論和問題)、數(shù)據(jù)集和標(biāo)注規(guī)范不同。這些激發(fā)了跨目標(biāo)立場檢測的研究[49],它通過利用來自源目標(biāo)的大量注釋數(shù)據(jù)來推斷最終目標(biāo)的態(tài)度。跨目標(biāo)立場檢測的方法一般是利用不同目標(biāo)共享的常用詞匯或概念級知識來彌合不同目標(biāo)之間的知識差距。2020年,Zhang等人[50]提出了一種用于語義-情感知識轉(zhuǎn)移(SEKT)模型用于跨目標(biāo)立場檢測,解決了基于概念的方法可能無法區(qū)分隱式帶有術(shù)語和上下文信息的立場的問題。2021年,Hardalov等人[51]設(shè)計了一個針對端到端的跨領(lǐng)域的標(biāo)簽自適應(yīng)立場檢測框架,模型基于來自預(yù)訓(xùn)練語言模型的輸入表示,并使用混合專家和領(lǐng)域?qū)褂?xùn)練來適應(yīng),用于預(yù)測看不見的、用戶定義的域外標(biāo)簽。

        3 論辯質(zhì)量評估

        3.1 論辯質(zhì)量和論辯質(zhì)量評估

        論辯質(zhì)量反映了一個單元、一個論點(diǎn)或論證有多好。例如,前提是否可接受、語言上是否清楚、文字是否與討論有關(guān)、論證是否有說服力、說服是否有效、或論辯是否合理等。論辯質(zhì)量評估需要考慮以下幾點(diǎn): 一是目標(biāo)導(dǎo)向性,哪個方面重要取決于論證的目標(biāo);二是顆粒度,質(zhì)量評估可以在不同的文本顆粒度上進(jìn)行處理;三是維度,評估時可能要綜合多個質(zhì)量維度。

        論辯質(zhì)量維度的分類有三個主要的方面,分別是邏輯性、修辭性、辯證性。邏輯性,指的是一個有說服力的論點(diǎn)要具有可接受的、相關(guān)的和充分的前提: 局部可接受性,給出的前提值得被相信是真實(shí)的;局部相關(guān)性,該前提與結(jié)論相關(guān);局部充分性,有這個前提就足以得出結(jié)論了。修辭性,指的是有效的論證,能夠說服目標(biāo)受眾,包括如下幾點(diǎn): 可信度,使作者值得被信任;情感吸引力,讓聽眾愿意被說服;清晰度,語言上清晰,盡可能簡單;適當(dāng)性,語言上與聽眾和話題匹配;順序性,以正確的行文順序呈現(xiàn)內(nèi)容。辯證性,指的是合理的論證,包括可接受的、相關(guān)的和充分的: 全局可接受性,值得以陳述的方式加以考慮;全局相關(guān)性,有助于解決給出的話題或問題;全局充分性,充分反駁了潛在的反面意見[6]。

        論辯質(zhì)量評估是識別論證中無可爭辯的缺陷或要求,是對論證中某些質(zhì)量維度的判斷,確定論證是否成功地達(dá)到了其目標(biāo)。例如,語言上是否清楚,說服是否有效。通常來說,論辯質(zhì)量評估具有可選擇性和主觀性,即可以絕對地或相對地進(jìn)行質(zhì)量評估,且感知的質(zhì)量取決于讀者(聽眾)或作者(發(fā)言者)的看法。論辯質(zhì)量評估的輸入是有論證性的文本、元數(shù)據(jù)、外部知識等,現(xiàn)有的評估方法有有監(jiān)督的分類/回歸、基于圖模型的分析等。

        理論上,論辯質(zhì)量評估要在一致性、合理性或相似性方面給出對論辯質(zhì)量的標(biāo)準(zhǔn)觀點(diǎn),建議使用絕對質(zhì)量評級。而在實(shí)踐中,論辯質(zhì)量是由對某些群體的有效性決定的,這意味著通常相對質(zhì)量評級更合適。正所謂“一個有力的論據(jù)是一個有效的論據(jù),可以贏得聽眾的支持,還是一個有效論據(jù),應(yīng)該贏得觀眾的支持?”[52]

        在某種意義上,關(guān)于論辯質(zhì)量的問題是論辯挖掘的終極問題[53]。這說明了論辯質(zhì)量評估的重要性。那么為什么要評估論辯的質(zhì)量呢?第一,在實(shí)踐中我們對論辯挖掘和對論斷的理解還不夠充分;第二,對于成功的論辯,我們需要找出“最佳”的論點(diǎn);第三,論辯質(zhì)量評估對任何計算論辯的應(yīng)用都至關(guān)重要。常見的應(yīng)用有: 論點(diǎn)搜索,哪個論點(diǎn)排名最高;寫作支持,一個論辯文本有多好,是否存在什么缺陷;自動決策,哪些論點(diǎn)比其他論點(diǎn)更重要。

        3.2 絕對質(zhì)量評估和相對質(zhì)量評估

        絕對質(zhì)量評估是從一個預(yù)定義的量表中分配一個分?jǐn)?shù)作為評估結(jié)果。相對質(zhì)量評估是給定兩個實(shí)例,比較哪一個質(zhì)量更好。相對質(zhì)量評估通常要更容易,但絕對質(zhì)量評估傳播廣泛,而且通常效果很好。

        絕對質(zhì)量評估要解決的問題是預(yù)測一個論點(diǎn)是否好(或有說服力、有效等)并給它的好壞評分。這里可以將質(zhì)量評估視為一個標(biāo)準(zhǔn)的分類或回歸任務(wù),主要是學(xué)習(xí)哪項特征或元數(shù)據(jù)代表了論辯的質(zhì)量?,F(xiàn)有的方法有: 支持力度,基于支持結(jié)論的證據(jù)數(shù)量[54];說服力,基于參與者的交互作用來預(yù)測[55];組織性和力度,基于結(jié)構(gòu)的評估[56];充分性,使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類[57],基于生成的結(jié)論進(jìn)行分類[58]。

        2016年,Tan等人[55]提出基于交互作用的質(zhì)量評估,分析語言特征和交互特征與說服的相關(guān)性,并根據(jù)說服是否會發(fā)生的特征進(jìn)行預(yù)測,以研究在討論中究竟是什么能說服那些愿意被說服的人。2016年,Wachsmuth等人[56]提出基于論辯挖掘的質(zhì)量評級,給出一篇有說服力的文章,給予論證相關(guān)的質(zhì)量維度評分,以研究能否利用論辯挖掘來評估有說服力的論文的論證質(zhì)量。該工作采用的質(zhì)量維度包括: 組織性,論證順序安排得多有條理;論證的清晰度,即論文有多容易理解;一致性,文章與討論的問題關(guān)系有多緊密;論證強(qiáng)度,支持這篇論文的論點(diǎn)有多有力[59-62]。

        然而,獨(dú)立地評價一個論點(diǎn)的質(zhì)量可能是困難的,甚至是不夠可信的。相對質(zhì)量評估就是一種更簡單或更現(xiàn)實(shí)來評估質(zhì)量的方法,因?yàn)橥ǔN覀冎粚捎玫淖罴颜擖c(diǎn)感興趣,那么僅僅比較一個論點(diǎn)與其他論點(diǎn)的質(zhì)量就足夠了。目前的挑戰(zhàn)是還無法確定選出的最好的論點(diǎn)是否足夠好。現(xiàn)有的方法有: 獲勝方,從辯論流中預(yù)測辯論獲勝方[63],從內(nèi)容和風(fēng)格中預(yù)測獲勝方[64];說服力,SVM和Bi-LSTM的論辯質(zhì)量評估比較[65];支持力度,根據(jù)支持主張對論點(diǎn)進(jìn)行排名[66]。

        2016年,Zhang等人[63]提出基于辯論流的質(zhì)量比較,通過挖掘正反方的支持點(diǎn),建?!皶捔鳌?即一方什么時候提出自己的論點(diǎn),什么時候攻擊對方的論點(diǎn)),并用基于會話流特征的邏輯回歸分類器,預(yù)測一場完整的牛津式辯論的哪一方會贏。2016年,Habernal和Gurevych[65]提出基于SVM和Bi-LSTM的論辯質(zhì)量比較,用各種語言特征的非線性核支持向量機(jī)和雙向長短時記憶神經(jīng)網(wǎng)絡(luò),對給定的兩個具有相同主題和立場的論點(diǎn),預(yù)測哪一個更有說服力。

        2017年,Wachsmuth等人[6]提出代表理論的絕對質(zhì)量評估數(shù)據(jù),包含絕對專家評級、規(guī)范指南、15個預(yù)定義的質(zhì)量維度。2016年,Habernal和Gurevych[65]提出代表實(shí)踐的相對質(zhì)量評估數(shù)據(jù),包含相對層面比較和17+1個結(jié)果標(biāo)簽,沒有指南。2017年,Wachsmuth等人[6]用736個帶有評級和標(biāo)簽的論點(diǎn)對計算所有維度和結(jié)果的Kendall相關(guān)系數(shù),對理論與實(shí)踐的質(zhì)量評估進(jìn)行實(shí)證比較,結(jié)果表明,理論與實(shí)踐的匹配程度大于預(yù)期;理論可以在實(shí)踐中指導(dǎo)質(zhì)量評估;實(shí)踐指出了要注意哪些重點(diǎn)來簡化理論。

        3.3 客觀質(zhì)量評估和主觀質(zhì)量評估

        質(zhì)量評估具有主觀性。首先,在許多維度上質(zhì)量評估本質(zhì)上都是主觀的;其次,質(zhì)量取決于一個問題的不同方面的主觀權(quán)重。同時,質(zhì)量評估也依賴于先入之見。如關(guān)于死刑的兩個論點(diǎn),“死刑使一種不可逆轉(zhuǎn)的暴力行為合法化。只要人類的判斷仍然容易出錯,處決無辜者的風(fēng)險就永遠(yuǎn)無法消除?!薄八佬滩⒉荒茏柚谷藗兎赶聡?yán)重的暴力犯罪。只有被抓住并受到懲罰才令人沮喪。”哪個與主題更相關(guān)呢?有兩種方法可以解決這個問題,一是關(guān)注可以被評估為“客觀”的屬性,二是在質(zhì)量評估中包括一個讀者或聽眾的模型。

        客觀質(zhì)量評估要解決的問題是如何在不學(xué)習(xí)主觀注釋的情況下評估質(zhì)量,以及什么是客觀的質(zhì)量指標(biāo)。其主要思想是基于所有論點(diǎn)所產(chǎn)生的結(jié)構(gòu)來評估質(zhì)量,適用于絕對評估和相對評估。其面臨的一大挑戰(zhàn)是對主觀注釋的評價的處理,可能的解決方案是依賴于對許多注釋者的多數(shù)評估?,F(xiàn)有的方法有: 可接受性,基于攻擊關(guān)系的評估[67];相關(guān)性,基于單元重復(fù)利用的評估[68];突出性,基于論點(diǎn)頻率的評估[69]。

        2012年,Cabrio和Villata[67]提出基于攻擊關(guān)系的客觀評估,給定一組論點(diǎn),對攻擊進(jìn)行識別,并根據(jù)Dung提出的框架[70]評估論點(diǎn)的可接受性。Dung于1995年提出的抽象論證框架是一個有向圖,其中節(jié)點(diǎn)表示論點(diǎn),邊表示論點(diǎn)之間的攻擊關(guān)系,揭示了是否接受一個論點(diǎn)。2017年,Wachsmuth等人[68]提出基于單元重復(fù)利用的客觀評估,研究給定一組論點(diǎn),哪一個與某些話題最相關(guān),然而相關(guān)性是高度主觀的,即尋找一個“客觀”的相關(guān)性度量。該工作假設(shè)一個結(jié)論的相關(guān)性取決于網(wǎng)絡(luò)上的其他論點(diǎn)將其作為前提,暫時忽略論點(diǎn)的內(nèi)容和推理,從網(wǎng)絡(luò)規(guī)模上的結(jié)論重用中獲得結(jié)構(gòu)上的相關(guān)性。

        主觀質(zhì)量評估要考慮的問題是,有效的論證最終都需要考慮目標(biāo)受眾。如果不這樣做,人類幾乎不需要辯論。其主要思想是在質(zhì)量評估過程中建模目標(biāo)受眾,包括特定于受眾的正確標(biāo)注。然而,到目前為止,受眾模型很少被明確地包括在研究方法內(nèi),且一些帶標(biāo)注的語料庫實(shí)際上可能代表特定的受眾?,F(xiàn)有的方法有: 不同的個性,感性論證與理性論證的有效性[71];不同的意識形態(tài),新聞社論的有效性[72]。

        2017年,Lukin等人[71]提出基于個性的有效性評估,假設(shè)不同個性的人愿意接受不同類型的論點(diǎn),研究五大個性(開放性、自覺性、外向性、一致性和精神性)對感性論證與理性論證有效性的影響。2018年,El Baff等人[72]提出基于意識形態(tài)(分為保守派和自由派)的有效性評估,假設(shè)先驗(yàn)立場取決于政治意識形態(tài)(和人格),研究意識形態(tài)(和人格)對新聞社論有效性的影響,即是否挑戰(zhàn)或加強(qiáng)立場。

        4 對話式論辯生成

        對話式論辯另一個分支的研究則偏向于提出自動化模型在對話式領(lǐng)域?qū)崿F(xiàn)對話生成任務(wù)。對話生成任務(wù)是人機(jī)交互中機(jī)器實(shí)現(xiàn)輸出的一個重要組成部分,如何讓機(jī)器按照我們預(yù)先設(shè)定的范式實(shí)現(xiàn)有效輸出是重中之重。具體的,對話生成任務(wù)大致可以分為總結(jié)性論點(diǎn)生成和目標(biāo)論點(diǎn)生成兩類。

        4.1 總結(jié)性論點(diǎn)生成

        最簡單的對話式論辯生成任務(wù)之一是根據(jù)給定的觀點(diǎn)或論點(diǎn)文本集合,生成對應(yīng)的總結(jié)性句子,相當(dāng)于生成了一個特定的論點(diǎn)句。從別人那里收集意見是我們?nèi)粘;顒拥囊粋€組成部分。發(fā)現(xiàn)別人的想法可以幫助我們在生活的不同方面導(dǎo)航,從日常任務(wù)的決定到判斷基本的社會問題和形成個人意識形態(tài)。為了有效地吸收大量固執(zhí)己見的信息,迫切需要自動化系統(tǒng)對一個實(shí)體或話題生成簡潔流暢的意見總結(jié)。盡管在意見總結(jié)方面有大量的研究,但最突出的方法主要是采用抽取式摘要方法,即從原始文獻(xiàn)中選擇短語或句子納入摘要[73]。

        Wang等人[74]從爛番茄網(wǎng)站上爬取影評并據(jù)此構(gòu)建了一個影評數(shù)據(jù)集,其中包括了3 731部電影和246 164條評論,同時每部電影都額外包含一句評價作為基準(zhǔn)。作者研究了為固執(zhí)己見的文本生成摘要的問題。本文提出了一種基于注意力的神經(jīng)網(wǎng)絡(luò)模型,能夠從多個文本單元中吸收信息,構(gòu)建信息豐富、簡潔、流暢的摘要。一種基于重要性的采樣方法被設(shè)計用來允許編碼器集成來自輸入的一個重要子集的信息。自動評估表明,作者設(shè)計的系統(tǒng)在兩個新收集的電影評論和論點(diǎn)數(shù)據(jù)集上的性能優(yōu)于最先進(jìn)的抽象和提取摘要系統(tǒng)。而作者的系統(tǒng)摘要在人類評價中也被評為信息量更大、語法更規(guī)范的。

        Li等人[75]重點(diǎn)研究了綜述總結(jié)的方法。不同于以往大多數(shù)采用語言規(guī)則或統(tǒng)計方法的研究,作者將審查挖掘任務(wù)定義為一個聯(lián)合結(jié)構(gòu)標(biāo)注問題,提出了一種基于條件隨機(jī)場(CRFs)的機(jī)器學(xué)習(xí)框架。它可以利用豐富的特征聯(lián)合提取復(fù)習(xí)句的積極觀點(diǎn)、消極觀點(diǎn)和客體特征。語言結(jié)構(gòu)可以自然地融入到模型表示中。除了線性鏈結(jié)構(gòu),作者還研究了連接結(jié)構(gòu)和句法樹結(jié)構(gòu)。對電影評論和產(chǎn)品評論數(shù)據(jù)集的廣泛實(shí)驗(yàn)表明,結(jié)構(gòu)感知模型優(yōu)于許多當(dāng)時最先進(jìn)的論辯挖掘方法。

        Syed等人[76]為了進(jìn)一步實(shí)現(xiàn)長文本總結(jié),構(gòu)建了一個“論辯文本+中心論點(diǎn)”的大型語料庫WebisConcluGen-21。作者研究了兩種生成結(jié)論的范式;一種是提煉的,另一種是抽象的。后者利用論證知識,通過控制代碼來增加數(shù)據(jù),并在語料庫的幾個子集上微調(diào)BART模型。作者深入分析了語料庫對任務(wù)的適用性、兩代范式之間的差異、信息性和簡便性之間的權(quán)衡以及編碼論證知識的影響。其語料庫、代碼和訓(xùn)練的模型都是公開的。

        4.2 目標(biāo)論點(diǎn)生成

        針對特定的話題生成支持或反對的高質(zhì)量論點(diǎn)文本,則是更為實(shí)際的論點(diǎn)生成任務(wù)。針對生成任務(wù)的早期工作,通常是先從語料庫中提取文本,然后按特定順序輸出,缺少綜合不同語料內(nèi)容的能力。產(chǎn)生高質(zhì)量的論點(diǎn)在決策和推理過程中起著至關(guān)重要的作用。許多最終決策都是在爭論或反駁中不斷推進(jìn)發(fā)展的,而當(dāng)這種爭論來到人機(jī)交互場景時,生成高質(zhì)量論點(diǎn)的重要性就體現(xiàn)出來了。例如,立法機(jī)構(gòu)經(jīng)常進(jìn)行辯論,以確保法案獲得足夠的票數(shù)通過;網(wǎng)上審議則是另一個常見的場景,它已經(jīng)成為征求公眾意見的一種流行方式。盡管如此,構(gòu)建有說服力的論點(diǎn)對人類和計算機(jī)來說都是一項艱巨的任務(wù)。

        Hua等人[77]首先提出了目標(biāo)論點(diǎn)生成這一任務(wù),任務(wù)被構(gòu)建為建立這樣一個模型: 能夠針對給定的論述,自動化生成不同立場的論點(diǎn)。作者提出了一個基于神經(jīng)網(wǎng)絡(luò)和編碼-解碼器結(jié)構(gòu)的論點(diǎn)生成模型,豐富了從維基百科外部檢索的論據(jù)。在Reddit上收集的大規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)表明,根據(jù)自動評估和人工評估,提出的模型比流行的序列到序列生成模型構(gòu)建了更多與主題相關(guān)的內(nèi)容。

        Alshomary等人[78]重點(diǎn)關(guān)注了反論點(diǎn)的生成任務(wù)。此前的方法主要集中在反駁一個給定的結(jié)論,而他們研究的場景并不局限于此??紤]到識別論點(diǎn)的薄弱前提是有效反擊的關(guān)鍵,作者探索了破壞論證任務(wù),也就是通過攻擊一個論證的前提來反駁一個論證。下圖是破壞論證的一個基本邏輯結(jié)構(gòu),機(jī)器首先識別論證結(jié)構(gòu)中的弱前提,再針對弱前提生成反論點(diǎn)。具體的,作者提出了一種管道方法,首先評估這些前提的強(qiáng)度,然后針對較弱的前提提出反論點(diǎn)。一方面,人工評估和自動評估都證明了識別弱前提在反論證生成中的重要性。另一方面,在考慮正確性和內(nèi)容豐富性時,相比傳統(tǒng)方法,人工仲裁更喜歡這種基于弱前提檢索的反論點(diǎn)生成方法。

        Hua等人[79]為了解決傳統(tǒng)論點(diǎn)生成模型中經(jīng)常產(chǎn)生與輸入不連貫和不忠實(shí)的輸出的問題,提出了一個端對端訓(xùn)練的兩步生成模型,該模型能夠?qū)崿F(xiàn)句級別的內(nèi)容規(guī)劃和風(fēng)格規(guī)范。其中句子級別的內(nèi)容規(guī)劃首先決定要涵蓋的關(guān)鍵短語以及所需的語言風(fēng)格,然后是一個表面實(shí)現(xiàn)解碼器,生成相關(guān)和連貫的文本。模型主要考慮了三個不同維度上的子任務(wù)——Reddit中有說服力的論點(diǎn)構(gòu)建,維基百科的簡介生成以及科學(xué)文章的摘要生成。自動評估表明,作者提出的系統(tǒng)可以大大超過競爭比較。不僅如此,與不考慮語言風(fēng)格的變體相比,人工仲裁認(rèn)為該系統(tǒng)生成的文本更合理,表達(dá)更流暢。

        有時我們不僅要限制目標(biāo)論點(diǎn)的主題,還會限制論點(diǎn)討論的具體角度。Schiller等人[80]提出了一個論點(diǎn)生成模型Arg-CTRL。這一模型可以為給定的主題、立場和角度生成句子級別的論點(diǎn)。作者定義了論證角度檢測問題,并認(rèn)為這一問題是實(shí)現(xiàn)針對論證角度的細(xì)粒度控制的必要方法,并將5 032個帶論證角度注釋的論辯文本集合為一個數(shù)據(jù)集。實(shí)驗(yàn)表明,Arg-CTRL模型能夠生成高質(zhì)量的、從特定角度切入的論點(diǎn),尤其適用于自動生成反論點(diǎn)。

        考慮到知識圖在支持一般文本生成任務(wù)中的有效性,Al-Khatib等人[81]研究了論證相關(guān)知識圖在控制論證生成中的應(yīng)用。在該研究中,作者構(gòu)建并填充了三個知識圖,利用它們的幾個組成部分將各種知識編碼到辯論門戶的文本和維基百科的相關(guān)段落中。具體操作上,作者使用編碼知識的文本來微調(diào)預(yù)先訓(xùn)練的文本生成模型GPT-2。模型有效性實(shí)驗(yàn)涵蓋了論證環(huán)境中的幾個重要維度,包括論證性和似是而非性,手動和自動地評估新創(chuàng)建的論證。結(jié)果表明,從編碼圖表的知識到辯論門戶文本產(chǎn)生的積極影響比那些沒有知識產(chǎn)生的論點(diǎn)質(zhì)量更好。

        Wachsmuth等人[82]探究了語法修辭策略。好的論證不能僅有嚴(yán)密的邏輯結(jié)構(gòu),還需要有合理的語言結(jié)構(gòu)以及有溫度的表達(dá)。作者研究了在論點(diǎn)生成時,如何將邏輯推理與對倫理和情感的訴求結(jié)合起來。這一策略意味著如何選擇和安排機(jī)器抽取的論點(diǎn)并將它們有效地串聯(lián)起來。在建模時,作者讓26位專家針對10個主題,用不同的策略合成議論文本。研究發(fā)現(xiàn),當(dāng)采用相同的策略時,專家對選擇的同意程度明顯更高。這意味著作者采用的語法修辭策略是成功的,因?yàn)殡m然不同文章的文本有顯著差異,但它們的安排保持穩(wěn)定,也即遵循了同一套語法修辭策略。

        5 智慧論辯應(yīng)用

        IBM于2019年公開發(fā)布了人工智能辯手Project Debater[83]。Project Debater是全世界首個能與人類進(jìn)行復(fù)雜辯論的自動化論辯系統(tǒng)。該項目由IBM團(tuán)隊自2012年啟動開發(fā),2021年3月登上了《Nature》雜志的封面。2019年2月11日Project Debater與H. Natarajan(納塔拉揚(yáng),世界大學(xué)生辯論賽冠軍)圍繞“是否應(yīng)當(dāng)補(bǔ)貼學(xué)前教育”展開了一場公開辯論,人類辯手持正方,AI辯手持反方。比賽采用簡化后的議會制辯論,含15分鐘持題準(zhǔn)備時間,三輪交替發(fā)言環(huán)節(jié)。賽前,79%的聽眾同意學(xué)前教育應(yīng)該得到補(bǔ)貼,13%的人不同意。賽后,62%的人同意,30%的人不同意。最終,人類辯手H. Natarajan獲得勝利。 如圖5所示,Project Debater系統(tǒng)包含論辯挖掘、論辯知識庫、論點(diǎn)反駁和論辯組織四個模塊[84]。論辯挖掘模塊從大的文本語料庫中找尋到議題相關(guān)的論點(diǎn)和駁論點(diǎn)。論辯知識庫包含論點(diǎn)、駁論點(diǎn)以及其他辯題下的相關(guān)文本;一旦給定辯題,系統(tǒng)在其中找到最相關(guān)的論辯語料。論點(diǎn)反駁模塊將前兩個模塊中潛在的相反論點(diǎn)與實(shí)際對手的陳詞做匹配,由此生成可能的回應(yīng)。最后,論辯組織模塊從其他模塊提供的文本中選擇性地組織出一則連續(xù)的發(fā)言。 圖6展示了Project Debater的性能評估結(jié)果。左圖展示了Project Debater與其他基線系統(tǒng)的對比。條形表示平均分?jǐn)?shù),其中5表示對“這篇演講是支持該主題的良好開場演講”的觀點(diǎn)“非常同意”,1表示“非常不同意”。帶斜線的條形圖表示該系統(tǒng)中的語音是由人類生成的或依賴于人工編寫的論點(diǎn)。右圖展示了最終系統(tǒng)的評估結(jié)果。“Project Debater”描述了Project Debater生成S1和S3時的結(jié)果。在“混合辯論者控制”中,第三次演講是由Project Debater在另一個辯題生成下的 S3。在“基線控制”中,S1和S3都是從全自動基線系統(tǒng)之一中選擇的開場白。條形表示平均分?jǐn)?shù),其中,5表示對于“第一個發(fā)言者在這場辯論中表現(xiàn)得不錯”的觀點(diǎn)“非常同意”,1表示“非常不同意”。Project Debater的結(jié)果明顯優(yōu)于其他所有基準(zhǔn),并且非常接近人類專家的分?jǐn)?shù)。

        圖5 IBM Project Debate 框架圖[83]

        圖6 IBM Project Debater 評測結(jié)果[83]

        為支撐該系統(tǒng)的搭建,項目團(tuán)隊在論辯挖掘、語音理解與生成、文本生成等多項子任務(wù)方面進(jìn)行了探索研究,構(gòu)建了大量優(yōu)質(zhì)論辯子任務(wù)數(shù)據(jù)集,研究成果公開發(fā)表在ACL、EMNLP等權(quán)威會議中。項目公開了用于論辯系統(tǒng)構(gòu)建的API以及大量子任務(wù)數(shù)據(jù)集,包括主張檢測、主張邊界檢測、證據(jù)檢測、論點(diǎn)質(zhì)量評估、立場識別、關(guān)鍵點(diǎn)評估及立場生成等,廣泛用于學(xué)界研究[84]。

        6 總結(jié)和展望

        用語言和邏輯的角度分析辯論,一直是人們探尋辯論背后人類智慧規(guī)律的重要方法;而計算機(jī)、機(jī)器學(xué)習(xí)、人工智能等新技術(shù)的不斷發(fā)展,無疑讓計算論辯走上了發(fā)展的快車道,也讓越來越多的計算論辯成果落地成為可能。

        面臨的挑戰(zhàn)作為一個源遠(yuǎn)流長但直到最近才以一個整體為人們所關(guān)注的研究領(lǐng)域,目前計算論辯仍然存在一些挑戰(zhàn),有待后續(xù)研究攻堅克難。

        (1)缺乏通用的大型標(biāo)準(zhǔn)數(shù)據(jù)集近年來,不斷有新的計算論辯任務(wù)涌現(xiàn)出來,擴(kuò)充著這一子領(lǐng)域的譜系。這些新興任務(wù)的相關(guān)工作通常都缺乏既有的數(shù)據(jù)集,因此不得不自行標(biāo)注并構(gòu)建用于訓(xùn)練、測試的小型數(shù)據(jù)集。大規(guī)模標(biāo)準(zhǔn)評測數(shù)據(jù)集的空缺,使有關(guān)研究提出的模型無法在大型語料上驗(yàn)證效果,同時又導(dǎo)致更多的小數(shù)據(jù)集出現(xiàn),卻難以將它們統(tǒng)合為一個大型數(shù)據(jù)集。

        (2)尚未形成一套完整的研究范式計算論辯的研究扎根于論辯分析理論,然而正如前文所述,目前與論辯相關(guān)的背景理論繁多,相互之間各有所長,卻并沒有形成能覆蓋絕大多數(shù)論辯場景的統(tǒng)一理論。采用不同理論基礎(chǔ)的研究工作往往會發(fā)展出不同的研究范式,這就為特定方向上各個研究的橫向?qū)Ρ扰c融合增添了阻礙。

        發(fā)展趨勢當(dāng)下計算論辯也展現(xiàn)出一些有趣的發(fā)展趨勢,其中的一個或多個有可能成為未來這一領(lǐng)域的研究主流。

        (1) 基準(zhǔn)評測數(shù)據(jù)出現(xiàn),為計算論辯提供數(shù)據(jù)基石。雖然我們還沒能構(gòu)建出一個普適的大型基準(zhǔn)數(shù)據(jù)集,但如今人們每天都在生產(chǎn)大量論辯語料。在許多研究人員和標(biāo)注人員的不懈努力下,它們也在不斷衍生出各類數(shù)據(jù)量大、任務(wù)齊全、語種齊全的計算論辯專用數(shù)據(jù)。這些工作使得將來大型基準(zhǔn)評測數(shù)據(jù)集的構(gòu)建成為可能。

        (2) 小樣本學(xué)習(xí)、領(lǐng)域遷移方法成為研究熱點(diǎn)。作為自然語言處理的一個分支,在各種NLP任務(wù)中受到關(guān)注的小樣本學(xué)習(xí)和領(lǐng)域遷移方法自然也不會缺席計算論辯相關(guān)研究。事實(shí)上,許多特殊形式的論辯語料(如庭審記錄)并不容易大量獲取,而且在相似的論辯框架下可以蘊(yùn)含千萬種語義信息,因此如何利用有限且有局限的論辯數(shù)據(jù)學(xué)習(xí)背后的論辯框架,是目前值得研究的熱點(diǎn)課題。

        (3) 在邏輯判定之外,價值屬性開始凸顯。過去的計算論辯研究多數(shù)注重論點(diǎn)本身蘊(yùn)含的語義和邏輯,對論點(diǎn)背后辯方的價值取向關(guān)注不多。但在社交媒體高度發(fā)達(dá)的今天,社交平臺上的許多交鋒實(shí)質(zhì)上體現(xiàn)了不同群體之間的價值觀與意識形態(tài)沖突。因此,越來越多的研究開始探討論辯文本中蘊(yùn)含的價值屬性,即所謂的價值觀辯論或意識形態(tài)建模。

        (4) 多模態(tài)信息的相關(guān)研究正在引起人們的關(guān)注。大多數(shù)的辯論信息都以論辯文本或語料的形式呈現(xiàn),但在許多情景(特別是線下的面對面辯論)中,辯論雙方的聲學(xué)特征、面部表情、肢體語言等非文本信息實(shí)際上都蘊(yùn)含一定的信息量,并且會影響辯論的質(zhì)量與結(jié)果。基于上述觀察,最近的一些研究開始建立利用多模態(tài)信息的計算論辯技術(shù),并在論辯質(zhì)量評估等任務(wù)上取得了一定成果。

        此外,還有許多新的方向與課題,例如,論辯信息的圖譜表示、群體語境下的自主論辯等,它們都有機(jī)會在接下來的數(shù)年時間里發(fā)展為計算論辯的又一個閃光點(diǎn)。無論如何,在如今這個充滿著觀點(diǎn)對立與信息繭房的社交媒體時代,已然發(fā)展出多種新的辯論形式,而計算論辯在這個時代迸發(fā)的無窮潛力,依然等待著人們的努力挖掘。

        猜你喜歡
        文本質(zhì)量模型
        一半模型
        “質(zhì)量”知識鞏固
        質(zhì)量守恒定律考什么
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        在808DA上文本顯示的改善
        做夢導(dǎo)致睡眠質(zhì)量差嗎
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        3D打印中的模型分割與打包
        質(zhì)量投訴超六成
        汽車觀察(2016年3期)2016-02-28 13:16:26
        亚洲中文字幕乱码在线视频| 中国精品视频一区二区三区| 亚洲欧美另类精品久久久| 在线看亚洲十八禁网站| 杨幂二区三区免费视频| 女人天堂国产精品资源麻豆| 成人av在线久色播放| 国产日本精品一区二区| 国产精品毛片极品久久| 亚洲 另类 小说 国产精品| 国产日韩精品欧美一区喷水| 男人激烈吮乳吃奶视频免费 | 亚洲国产一区中文字幕| 久久日本视频在线观看| 丝袜人妻一区二区三区| 男女做爰猛烈啪啪吃奶动 | 免费人成毛片乱码| 性做久久久久久久| 人妻熟女中文字幕av| 国产av天堂亚洲av刚刚碰| 久久精品中文字幕无码绿巨人| 亚洲成在人网站av天堂| 无码一区二区波多野结衣播放搜索| √最新版天堂资源在线| 日本视频精品一区二区| 暴露的熟女好爽好爽好爽| 极品人妻少妇av免费久久 | 亚洲小说区图片区另类春色| 怡春院欧美一区二区三区免费| 日本特黄a级高清免费大片| 中文字幕人妻一区色偷久久| 久久精品国产亚洲av一般男女| 久久亚洲精品成人无码| 国产精品美女久久久久久久久| 免费看国产成年无码av| 日本草逼视频免费观看| 亚洲综合中文日韩字幕| 熟妇熟女乱妇乱女网站| 久久天天躁狠狠躁夜夜爽蜜月| 国产韩国精品一区二区三区| 亚洲av极品尤物不卡在线观看|