周可艷,宗成慶
(中國科學(xué)院 自動化研究所 模式識別國家重點(diǎn)實(shí)驗(yàn)室,北京 100190)
對話行為(Dialog Act)是指對話語句(Utterance)的言外力(Illocutionary force)[1],屬于淺層話語結(jié)構(gòu)的范疇[2]。具體地講,對話行為反映了對話語句及對話人的意圖,例如陳述、疑問、許諾、解釋等。對話行為為口語對話的理解提供了語用方面的重要信息,因此在自然語言處理領(lǐng)域有著廣泛的應(yīng)用,如自動語音識別[3],口語對話系統(tǒng)[4],自動摘要[5]和口語翻譯系統(tǒng)[6-10]等。
從20世紀(jì)90年代以來,陸續(xù)有一些研究人員試圖將對話行為信息應(yīng)用到口語翻譯系統(tǒng)中,并取得了一定的成果。在語音翻譯系統(tǒng)中,文獻(xiàn)[7]將對話行為信息應(yīng)用于語音識別和信息抽取模塊,從而間接地提高了翻譯系統(tǒng)的性能。在基于中間語言的翻譯系統(tǒng)中,源語言首先被解析為抽象的語義概念,繼而被轉(zhuǎn)化為目標(biāo)語言[6]。對話行為信息作為語義概念的表示形式之一,既參與到口語解析,也涉及到口語句子的生成[8-9]。在目前主流的統(tǒng)計(jì)機(jī)器翻譯中,如何將包括對話行為在內(nèi)的語義和語用信息與翻譯模型相融合,也一直是研究人員試圖解決的難點(diǎn)之一。Sridha 等人提出了一種基于對話行為的短語翻譯對抽取方法[10],將其應(yīng)用到基于短語的統(tǒng)計(jì)翻譯系統(tǒng)中。但是受對話行為自動識別正確率的限制,Sridha的方法在實(shí)驗(yàn)結(jié)果上只獲得了有限的提高。
我們認(rèn)為,在口語翻譯系統(tǒng)中,對話行為信息不僅可以通過優(yōu)化翻譯引擎來提高翻譯系統(tǒng)的性能,也可以輔助人來理解機(jī)器翻譯的結(jié)果。源語言和目標(biāo)語言的對話行為標(biāo)簽應(yīng)該是一致的。但是在翻譯過程中,由于翻譯方法本身的局限性,常常造成部分信息的缺失。如表1中所示,如果不能識別出對話行為標(biāo)簽為“是非問”,而翻譯引擎又未能正確的構(gòu)造疑問句式,那么翻譯結(jié)果將成為陳述句,就不能準(zhǔn)確地表達(dá)源語言句子的含義。因此,對話行為標(biāo)簽所傳遞的信息是對翻譯結(jié)果的有益補(bǔ)充。
表1 對話行為與翻譯結(jié)果
本文首先對對話行為理論進(jìn)行簡要的介紹,并介紹了一個中文對話行為標(biāo)注語料庫CASIA-CASSIL。然后給出我們利用對話行為信息提高口語機(jī)器翻譯系統(tǒng)性能的方法。在漢英口語翻譯評測數(shù)據(jù)上的實(shí)驗(yàn)證明,對話行為信息的加入使翻譯系統(tǒng)的性能得到了有效的提高。
言語行為(Speech Act)理論首先由Austion提出[1],后經(jīng)Searle[11]等人的完善逐漸成熟[12]。言語行為,即話語的言外之力體現(xiàn)了說話人的意圖,是人類交際的基本單位。言語行為的分類劃分通常以下面三點(diǎn)為依據(jù):1)言語行為的目的; 2)言語行為帶來的后果; 3)言語行為所反映的說話人的態(tài)度及信息狀態(tài)。例如,Searle給出的基本分類包括“闡述”、“指令”、“承諾”、“表達(dá)”、“宣告”。
在計(jì)算語用學(xué)的研究中,通常把某些類別的言語行為稱為對話行為(Dialog Act),例如請求、主張等類別[13]。對話行為的識別被認(rèn)為是對話語句解析的關(guān)鍵問題。雖然對話行為已經(jīng)成功應(yīng)用于多個系統(tǒng),但是其定義的細(xì)化以及跨領(lǐng)域標(biāo)準(zhǔn)化問題一直沒有得到解決。目前對話行為的標(biāo)注并沒有統(tǒng)一的標(biāo)注規(guī)范,而是由標(biāo)注人員根據(jù)對話語料的領(lǐng)域及研究的目的進(jìn)行制定。表2中給出了一種層次化的對話行為標(biāo)注形式。其第一層標(biāo)注普通標(biāo)注(是非問、陳述等)反映對話語句的基本形式;第二層標(biāo)注特殊標(biāo)注(詢問、肯定答案、請求確認(rèn)等)反映話語的功能或特性,是對普通標(biāo)注的補(bǔ)充。
表2 對話行為標(biāo)注例子
20世紀(jì)90年代,統(tǒng)計(jì)自然語言處理技術(shù)興起以后,對話行為理論的研究和應(yīng)用也得到了飛速發(fā)展,帶動了大規(guī)模真實(shí)口語對話語料的收集和標(biāo)注工作。目前國際上已經(jīng)有若干成熟的英文口語對話行為標(biāo)注語料庫,如Switchboard-DAMSL電話錄音語料[2]、ICSI-MRDA多人會議[3]和AMI Meeting Corpus[14]等。
Switchboard-DAMSL語料由1 115段平均時長約5分鐘的電話錄音組成,每段對話平均有144個話輪(Turn),271個語句(Utterance),共包含約205 000個語句,140萬詞匯。其中,共有220個對話行為標(biāo)注標(biāo)簽。由于其中多數(shù)標(biāo)注出現(xiàn)次數(shù)較少,因此研究人員通常在前期處理中將其聚類為42種。
ICSI-MRDA多人會議語料是由美國ICSI(The International Computer Science Institute)收錄并標(biāo)注的真實(shí)多人會議語料,包括75個會議,平均每個會議有6人參與,平均長度大約為一小時。其對話行為的標(biāo)注信息包括語句邊界的切分、對話行為和鄰接對(Adjacency Pairs, APs)的標(biāo)注。ICSI-MRDA將Switchboard-DAMSL的單層標(biāo)注標(biāo)簽擴(kuò)展為多層標(biāo)注標(biāo)簽。即每個語句對話行為標(biāo)注的包含且僅包含一個普通標(biāo)簽,用于描述語句的基本形式;同時可以包含若干個特殊標(biāo)簽,作為普通標(biāo)簽的補(bǔ)充,用于描述語句的功能或特性。ICSI-MRDA的標(biāo)注集包括11個普通標(biāo)簽和40個特殊標(biāo)簽。
AMI Meeting Corpus包含約100小時的多媒體會議數(shù)據(jù)。其標(biāo)注集不僅包括對話行為標(biāo)注、命名實(shí)體標(biāo)注、主題切分和摘要提取,也包括基于FeelTrace*http://www.dfki.de/~schroed/feeltrace/標(biāo)注工具所標(biāo)注的二維情感表示,以及對話人的手勢、姿態(tài)等信息。
目前國際上還沒有公開的中文對話行為標(biāo)注語料。口語語料標(biāo)注的任務(wù)存在很多困難,一方面,口語對話語料的收集需要消耗大量的人力物力,并且真實(shí)場景下的口語語料往往噪聲很大,更增加了語料挑選和整理工作的難度;另一方面,國際上沒有統(tǒng)一的對話行為標(biāo)注規(guī)范,標(biāo)注規(guī)范的制定要結(jié)合所收集語料的領(lǐng)域特點(diǎn)。
在對已有英文口語標(biāo)注語料充分調(diào)研的基礎(chǔ)上,我們創(chuàng)建了中文口語對話標(biāo)注語料庫CASIA-CASSIL[16]。CASIA-CASSIL是一個基于旅游信息領(lǐng)域的大規(guī)模真實(shí)場景電話錄音語料庫,包含語音、情感、對話行為、口語現(xiàn)象、主題等多層標(biāo)注信息。本文中,我們用到的385段中文口語對話語料,涵蓋五個領(lǐng)域,各領(lǐng)域語料的規(guī)模統(tǒng)計(jì)見表3。其中,旅館預(yù)訂領(lǐng)域?yàn)槿斯まD(zhuǎn)寫的真實(shí)電話錄音語料,其他領(lǐng)域的語料摘錄自旅游手冊。在制定對話行為標(biāo)注規(guī)范的過程中,我們參考了ICSI-MRDA語料標(biāo)注規(guī)范[3],并針對所收集的中文語料中的特殊現(xiàn)象進(jìn)行了修改,修改內(nèi)容主要涉及兩方面:1)增加了中文對話中常用的語句類型,如祈使、感嘆。2)對口語現(xiàn)象進(jìn)行了歸類處理,如增加了插入語類。最終制定的對話行為標(biāo)注規(guī)范包括普通標(biāo)注集、中斷標(biāo)注集和特殊標(biāo)注集。普通標(biāo)注集描述話語的基本形式,如陳述、疑問、感嘆等,共有10種標(biāo)簽。中斷標(biāo)注集描述口語中的中斷現(xiàn)象,包括話語被打斷或省略,共3種標(biāo)簽。特殊標(biāo)注集描述話語的功能或特性,是對普通標(biāo)注的補(bǔ)充,如贊同、感謝、命令等,共38種標(biāo)簽。普通標(biāo)注與特殊標(biāo)注以“^”隔開。每一個對話行為的標(biāo)注包括一個普通標(biāo)注,可能包括一個或多個特殊標(biāo)注,當(dāng)話語不完整時,對話行為的標(biāo)注包含中斷標(biāo)注。表4給出了CASIA-CASSIL的一段標(biāo)注實(shí)例。表5給出了普通標(biāo)注集和中斷標(biāo)注集在CASIA-CASSIL中的統(tǒng)計(jì)數(shù)據(jù)。
表3 各領(lǐng)域?qū)υ捳Z料規(guī)模統(tǒng)計(jì)
表4 CASIA-CASSIL標(biāo)注實(shí)例
表5 CASIA-CASSIL對話行為標(biāo)注集統(tǒng)計(jì)數(shù)據(jù)
隨著對話行為理論的發(fā)展和成熟,先后有一些學(xué)者試圖將這種對對話意圖的描述應(yīng)用到機(jī)器翻譯中去。相關(guān)的研究工作分別以JANUS系統(tǒng)[6]、Verbmobil系統(tǒng)[7]和Sridhar等的研究[10]為代表。
JANUS是基于中間語言的翻譯系統(tǒng),用于實(shí)現(xiàn)德語到英語以及德語到日語的翻譯。在基于中間語言的翻譯系統(tǒng)中,源語言的語義首先被解析成獨(dú)立的中間語言,然后再從中間語言轉(zhuǎn)換成目標(biāo)語言,從而實(shí)現(xiàn)多種語言之間的互譯。JANUS系統(tǒng)采用C-STAR*http://www.c-star.org/(Consortium for Speech Translation Advanced Research international)所定義的中間轉(zhuǎn)換格式(interchange format, IF),而對話行為正是IF格式的重要組成之一。因此,對基于中間語言的翻譯系統(tǒng)來說,對話行為作為語義表示之一直接參與到翻譯過程中。文獻(xiàn)[16-17]也曾進(jìn)行過面向IF的口語理解工作研究。近年來隨著統(tǒng)計(jì)翻譯方法的快速發(fā)展,由于IF定義、轉(zhuǎn)換、生成等具體實(shí)現(xiàn)問題的復(fù)雜性,基于IF的翻譯方法正在逐漸被冷落[18]。
Verbmobil是上世紀(jì)90年代德國聯(lián)邦教育部(BMBF)所資助的語言技術(shù)研究項(xiàng)目。在其研發(fā)的Verbmobil語音翻譯系統(tǒng)中,對話行為主要應(yīng)用在三個模塊中:(1)語音識別模塊,通過對話行為的預(yù)測,對語言模型進(jìn)行動態(tài)的過濾,從而提高詞匯的語音識別正確率。(2)語義評價(jià)模塊,通過已知的對話行為信息聚焦算法以確定下一語句的對話行為。(3)上下文信息抽取模塊,用于為Verbmobil各模塊提供上下文信息,以取得更好的翻譯結(jié)果。實(shí)際上在Verbmobil里,對話行為并未直接應(yīng)用于翻譯模塊本身。
Sridhar等[10]提出了一種對話行為與基于短語的統(tǒng)計(jì)翻譯模型相結(jié)合的方法。其基本思路是首先基于源語言的對話行為將訓(xùn)練語料分為若干類,然后對每類語料分別訓(xùn)練翻譯模型。出于對數(shù)據(jù)稀疏問題的考慮,Sridhaer等人將基線系統(tǒng)所訓(xùn)練出的短語翻譯概率表也加入到基于對話行為分類語料訓(xùn)練出的短語翻譯概率表中,并加入?yún)?shù)對短語概率進(jìn)行數(shù)據(jù)平滑操作。最終的短語對翻譯概率表即為基于對話行為的翻譯模型。這種方法通過對短語概率表的分類訓(xùn)練,實(shí)現(xiàn)了對話行為信息在統(tǒng)計(jì)翻譯系統(tǒng)中的應(yīng)用。
綜上所述,在翻譯系統(tǒng)中,對話行為信息既可應(yīng)用于語音識別等模塊以間接提高翻譯系統(tǒng)的性能,也可直接應(yīng)用于基于中間語言和基于短語的統(tǒng)計(jì)翻譯模型。在目前流行的基于短語的統(tǒng)計(jì)翻譯系統(tǒng)中,文獻(xiàn)[10]只給出了一種應(yīng)用形式,其他的應(yīng)用,比如:基于對話行為的開發(fā)集選取、n-best翻譯結(jié)果的重排序等,包括對話行為分類本身所涉及的諸多問題,比如分類器和特征選取等,文獻(xiàn)[10]中沒有進(jìn)行研究。
本文的基本思路是通過對話行為的分類,使訓(xùn)練語料—測試語料、開發(fā)集—測試集、源語言—目標(biāo)語言的一致性得到提高,從而提高翻譯系統(tǒng)的性能。
基于短語的翻譯系統(tǒng)其主要翻譯過程包括:根據(jù)均勻分布的假設(shè)將源語言句子劃分為短語,利用預(yù)先抽取的短語翻譯對表將每一個源語言短語翻譯成目標(biāo)語言短語,然后利用重排序模型對目標(biāo)語言短語進(jìn)行重排序得到目標(biāo)語言句子。
其中,短語翻譯對表的構(gòu)建關(guān)系到翻譯知識的獲取,是基于短語的翻譯系統(tǒng)研究的關(guān)鍵技術(shù)。此外,為實(shí)現(xiàn)翻譯結(jié)果的自動打分最優(yōu),翻譯系統(tǒng)還引入了最小錯誤率訓(xùn)練,以獲得相對于開發(fā)集最優(yōu)的n-best列表。受各種因素的干擾,n-best列表排名第一的結(jié)果并不一定是最優(yōu)結(jié)果,因此翻譯n-best結(jié)果的重排序也是影響翻譯結(jié)果的問題之一。
我們在以下三個階段引入對話行為信息:A. 短語翻譯概率表及調(diào)序表的獲取,保證訓(xùn)練語料與測試語料的一致性;B. 基于開發(fā)集的最小錯誤率參數(shù)訓(xùn)練,保證開發(fā)集與測試集的一致性;C.n-best翻譯候選結(jié)果的重排序,保證源語言與目標(biāo)語言的一致性。參見圖1。
圖1 對話行為與基于短語的翻譯過程
我們以“DAi”表示經(jīng)過對話行為分類后屬于第i類的語料,“ALL”表示未經(jīng)分類的全部語料集合。這三種應(yīng)用形式的具體實(shí)現(xiàn)如下:
A.對全部訓(xùn)練集進(jìn)行訓(xùn)練得到短語翻譯概率表P(ALL)和調(diào)序表R(ALL)。對訓(xùn)練集進(jìn)行對話行為分類后,分別訓(xùn)練得到短語翻譯概率表P(DAi) 和調(diào)序表R(DAi)。若P(ALL)中存在與P(DAi)相同的短語對,則以P(DAi)中該短語對的概率替換P(ALL)。同樣地,實(shí)現(xiàn)R(ALL)與R(DAi)的替換。
B.基于對話行為的開發(fā)集選取。由于開發(fā)集與測試集的一致性可能影響到最小錯誤率訓(xùn)練的效果。因此,針對DAi類別的測試集,我們采用相應(yīng)類別的開發(fā)集為其訓(xùn)練參數(shù)。
C.n-best翻譯候選結(jié)果的重排序。我們認(rèn)為一對源語言和目標(biāo)語言其對話行為標(biāo)簽應(yīng)保持一致。因此對于n-best翻譯候選結(jié)果我們選取與源語言對話行為標(biāo)簽最為接近的翻譯結(jié)果。
中文對話行為分類的訓(xùn)練語料采用我們收集標(biāo)注的CASIA-CASSIL對話行為標(biāo)注語料,英文對話行為分類的訓(xùn)練語料我們采用Switchboard-DAMSL[2]。
翻譯系統(tǒng)所采用的語料為IWSLT’07的訓(xùn)練集開發(fā)集和測試集[19]。基于短語的統(tǒng)計(jì)翻譯系統(tǒng)采用Moses工具包*http://www.statmt.org/moses/。翻譯結(jié)果的評價(jià)采用BLEU打分。
對話行為識別是典型的分類問題,通過學(xué)習(xí)對話語句的韻律、詞法、句法及上下文結(jié)構(gòu)信息等知識,采用最大熵、決策樹、圖模型、支持向量機(jī)(SVM)等方法進(jìn)行自動分類。其中SVM的方法易用性強(qiáng),正確率高,是目前最為流行的機(jī)器學(xué)習(xí)方法之一,在對話行為的識別中效果也優(yōu)于其他模型[20]。文獻(xiàn)[21]采用SVM方法進(jìn)行對話行為的分類,而文獻(xiàn)[22]基于SVM分類器從詞匯層、句法層和約束信息的角度探討了各種特征對對話行為分類的影響。在本文中,我們采用SVM分類器進(jìn)行對話行為的分類,SVM分類器采用libsvm工具*http://www.csie.ntu.edu.tw/~cjlin/libsvm。本文采用的特征包括unigram、bigram以及頻率FQ=200的約束條件。采用SVM分類器及五組交叉驗(yàn)證,這一特征在中文對話行為標(biāo)注語料上的識別正確率為87.11%,而僅采用unigram特征的識別正確率僅為77.05%[22]。
以CASIA-CASSIL部分對話行為標(biāo)注語料為訓(xùn)練語料,我們分別對IWSLT07的訓(xùn)練集、開發(fā)集和測試集進(jìn)行了分類。雖然訓(xùn)練標(biāo)注集包括普通標(biāo)注集和中斷標(biāo)注集共計(jì)13類,由于IWSLT’07測試集上的自動分類結(jié)果僅包括其中的5類,所以最終的分類結(jié)果為5類,分別是DA1(陳述),DA2(是非問),DA3(特指問),DA4(感嘆),DA5(祈使)。分類結(jié)果見表6。在分類過程中,我們認(rèn)為一對源語言和目標(biāo)語言共享同一個對話行為標(biāo)簽?;诜诸惡蟮腎WSLT訓(xùn)練集,我們分別進(jìn)行了短語對的抽取,所抽取的短語對個數(shù)見表6。
表6 IWSLT07語料的對話行為分類結(jié)果
對于生成的10-best翻譯候選結(jié)果,我們以Switchboard-DAMSL為訓(xùn)練語料對齊進(jìn)行對話行為分類。因CASIA-CASSIL語料與Switchboard-DAMSL語料的對話行為標(biāo)注規(guī)范存在差異,我們對于英文的分類結(jié)果,只選取中英文定義一致的DA3類別的數(shù)據(jù)。
表7給出了對訓(xùn)練集和開發(fā)集進(jìn)行分類并分別訓(xùn)練后,翻譯結(jié)果的BLEU打分?;€系統(tǒng)指采用全部訓(xùn)練集和開發(fā)集訓(xùn)練出的翻譯模型。A(短語表)、A(調(diào)序表)分別指對短語翻譯概率表和調(diào)序表進(jìn)行概率替換。B指對開發(fā)集進(jìn)行對話行為分類。以對話行為類別為單位,我們分別給出了每一類測試集的BLEU得分?!癉Ai”表示屬于第i類對話行為的測試集,“ALL”表示全部測試集集合。
表7 翻譯結(jié)果的BLEU得分
由實(shí)驗(yàn)結(jié)果可以看出,A(短語表)對短語翻譯概率表進(jìn)行替換以后,總測試集ALL的BLEU得分有所提高。對每個類別測試集的實(shí)驗(yàn)結(jié)果進(jìn)行研究,我們發(fā)現(xiàn)BLEU得分的提高與否和分類后訓(xùn)練集的大小有關(guān)。分類后若訓(xùn)練集規(guī)模過小,則按類別訓(xùn)練出的短語概率表概率值的可信度降低,從而影響到替換以后的翻譯效果。參照表6,規(guī)模最小的DA2和DA4經(jīng)過短語概率替換以后,BLEU值有所下降;而規(guī)模較大的DA1、DA3、DA5均得到了不同程度的提高。
開發(fā)集進(jìn)行對話行為分類(B)以后,對于DA2~DA5,由于開發(fā)集規(guī)模的大幅減小,BLEU得分也明顯下降,從而引起了ALL得分的下降。但是DA1類別分類后開發(fā)集規(guī)模變化不大,翻譯結(jié)果得分最終有所提高。這說明提高開發(fā)集和測試集的吻合程度,即使開發(fā)集規(guī)模略微減小,也會對系統(tǒng)的性能有所幫助。
同時對短語表和調(diào)序表的概率進(jìn)行替換,BLEU得分較基線系統(tǒng)有了明顯提高提高,提高較大的為中英文語序差異較大的對話行為類別,如DA2(是非問),DA3(特指問),DA4(感嘆)。
在C(n-best翻譯候選結(jié)果的重排序)的實(shí)驗(yàn)中,只針對源語言分類為DA3的語句,若10-best翻譯候選的分類結(jié)果中存在類別為DA3的翻譯結(jié)果,則選取DA3概率最大者為最終的翻譯結(jié)果。若10-best翻譯候選分類的分類結(jié)果類別為DAi且i≠3,則按以下兩種情況分別討論:(1)始終選取DA3概率最大者(SVM- DA3);(2)選取DAi概率最大者(SVM-TOP)。
C的實(shí)驗(yàn)結(jié)果見表8。兩種方法的實(shí)驗(yàn)結(jié)果均較基線系統(tǒng)有大幅提高,SVM-DA3的方法使翻譯結(jié)果與源語言的對話行為盡量保持一致,而SVM-TOP的方式有助于修正源語言端的分類錯誤,使BLEU得分有了進(jìn)一步的提高。如表9所示,源語言的對話行為原本為DA1,卻被錯誤地識別為DA3,而SVM-TOP的方法成功修正了這一錯誤,得到了正確的翻譯結(jié)果。而這兩種方法不能解決的問題是當(dāng)存在多個翻譯結(jié)果對話行為標(biāo)簽相同時,概率最大者并不一定是最優(yōu)結(jié)果,如果再引入詞性、長度、詞語對齊等信息,將會有助于得到更好的重排序結(jié)果。
表8 DA3 n-best翻譯結(jié)果的重排序
表9 不同重排序方法的翻譯結(jié)果
本文介紹對話行為理論和口語標(biāo)注語料的基礎(chǔ)上,提出了將對話行為這一語用信息應(yīng)用于統(tǒng)計(jì)機(jī)器翻譯過程的三種方式。以基于短語的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)為應(yīng)用對象,本文提出的方法利用對話行為的自動分類,使訓(xùn)練語料—測試語料、開發(fā)集—測試集、源語言—目標(biāo)語言的一致性得到提高,提高了系統(tǒng)的性能,使最終的翻譯結(jié)果可以更準(zhǔn)確地反映源語言所要表達(dá)的對話意圖。
在訓(xùn)練集和開發(fā)集上的實(shí)驗(yàn)結(jié)果表明,通過對話行為的分類,使訓(xùn)練語料—測試語料的一致性得到了提高,從而提高了系統(tǒng)的BLEU值,而分類后的訓(xùn)練集、開發(fā)集的規(guī)模大小也與系統(tǒng)的得分有關(guān)。在n-best結(jié)果重排序的實(shí)驗(yàn)上,我們在使翻譯結(jié)果與源語言保持一致的基礎(chǔ)上,也避免了源語言端的分類錯誤,使BLEU值得到了較大的提高。
此外,我們認(rèn)為基于n-gram正確率的BLEU打分并不能完全反映對話行為對翻譯結(jié)果的影響。因此,下一步工作中我們將嘗試在真實(shí)口語對話中,以人工打分的評價(jià)方式進(jìn)一步研究對話行為在口語翻譯中的應(yīng)用。
[1] J. L. Austin. How to do Things with Words[M]. Oxford:Clarendon Press, 1962.
[2] D. Jurafsky, L. Shriberg, and D. Biasca. Switchboard SWBD-DAMSL Labeling Project Coder’s Manual, Draft 13[R]. Technical Report 97-02, University of Colorado Institute of Cognitive Science. 1997.
[3] R. Dhillon, S. Bhagat, H. Carvey, et al. Meeting Recorder Project:Dialog-act Labeling Guide[R]. ICSI Technical Report TR-04-002. International Computer Science Insitute. 2004.
[4] M. Walker, and R. Passonneau. DATE:A Dialog Act Tagging Scheme for Evaluation of Spoken Dialog Systems[C]//Proceedings of HLT 2001, San Diego. 2001.
[5] A. Stolcke, K. Ries, N. Coccaro, et al. Dialog Act Modeling for Automatic Tagging and Recognition of Conversational Speech[J]. Computational Linguistics, 2000. 26(3):339-373.
[6] M. Woszczyna, N. Coccaro, A. Eisele, et al. Recent Advances in Janus:A Speech Translation System[C]//Third European Conference on Speech Communication and Technology. 1993.
[7] N. Reithinger, and E. Maier. Utilizing Statistical Dialog Act Processing in Verbmobil[C]//Proceedings of the 33rdAnnual Meeting of the Association for Computational Linguistics (ACL)MIT, Cambredge, MA. 1995:116-121.
[8] Wenjie Cao, Chengqing Zong, and Bo Xu. Approach to Interchange-Format Based Chinese Generation[C]//Proceedings of the International Conference on Spoken Language Processing (ICSLP). Jeju, Korea. 2004:4-8.
[9] Yuncun Zuo, Yu Zhou and Chengqing Zong, Multi-Engine Based Chinese-to-English Translation System[C]//Proceedings of International Workshop on Spoken Language Translation, Japan, 2004:73-76.
[10] V. K. R. Sridhar, S. Narayanan, et al. Enriching Spoken Language Translation with Dialog Acts[C]//Proceedings of ACL 2008, Short Papers(Companion Volume). Columbus, Ohio, USA, June, 2008:225-228.
[11] JR Searle. Speech Acts:an Essay in the Philosophy of Language[M]. Cambridge University Press:Cambridge, England. 1969.
[12] 何兆熊. 新編語用學(xué)概要[M]. 上海:上海外語教育出版社. 2000.
[13] G. Leech and M. Weisser. Pragmatics and Dialogue. The Oxford Handbook of Computational Linguistics[M]. Oxford University Press. 2003:136-156.
[14] J. Carletta, S. Ashby, S. Bourban, et al. The AMI Meeting Corpus:A Pre-Announcement. In Steve Renals and Samy Bengio, editors. Machine Learning for Multimodal Interaction II[M]. Springer-Verlag, Berlin/Herdelberg. 2006. LNCS 3869, Pages 28-39.
[15] Keyan Zhou, Aijun Li, Zhigang Yin, et al. CASIA-CASSIL:a Chinese Telephone Comversation Corpus in Real Scenarios with Multi-leveled Annotation[C]//Proceedings of the seventh International Conference on Language Resources and Evaluation(LREC). May 2010, Malta.
[16] 解國棟, 宗成慶, 徐波. 面向中間語義表示格式的漢語口語解析方法[J]. 中文信息學(xué)報(bào). 2002. 17(1):1-6.
[17] 左云存, 宗成慶. 基于語義分類樹的漢語口語理解方法[J]. 中文信息學(xué)報(bào). 2005. 20(2):8-15.
[18] 宗成慶. 統(tǒng)計(jì)自然語言處理[M]. 北京:清華大學(xué)出版社, 2008.5.
[19] Y. Zhou, Y. He, and C. Zong. The CASIA Phrase-Based Statistical Machine Translation System for IWSLT 2007[C]//Proceedings of the International Workshop on Spoken Language Translation (IWSLT), Trento, Italy. October 15-16, 2007.
[20] Dinoj Surendran, and Gina-Anne Levow. 2006. DA Tagging with Support Vector Machines and Hidden Markov Models[C]//Proceedings of Interspeech, Pittsburgh, PA.
[21] K. Zhou, C. Zong, H. Wu, et al. Predicting and Tagging DA with SVM and MDP[C]//Proceedings of ISCSLP 2008. Kunming, China. 2008: 293-296.
[22] K. Zhou, C, Zong. Dialog-act Recognition Using Discourse and Sentence Structure Information[C]//Proceedings of IALP 2009. Singapore, 2009: 11-16.