亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

第七屆全國機(jī)器翻譯研討會機(jī)器翻譯評測總結(jié)

2012-06-28 08:52:40趙紅梅呂雅娟賁國生

中文信息學(xué)報(bào) 2012年1期

趙紅梅,呂雅娟,賁國生,黃云,劉群

(中國科學(xué)院計(jì)算技術(shù)研究所中國科學(xué)院智能信息處理重點(diǎn)實(shí)驗(yàn)室，北京 100190)

1 概述

中國中文信息學(xué)會主辦的第七屆全國機(jī)器翻譯研討會(CWMT2011)于2011年9月23～24日在廈門召開。為了全面了解國內(nèi)外機(jī)器翻譯技術(shù)的現(xiàn)狀，促進(jìn)機(jī)器翻譯技術(shù)的研究，按照慣例，本屆機(jī)器翻譯研討會繼續(xù)組織了統(tǒng)一的機(jī)器翻譯評測，以推進(jìn)參評單位的實(shí)質(zhì)性交流和機(jī)器翻譯技術(shù)的發(fā)展。

本次評測由中國科學(xué)院計(jì)算技術(shù)研究所組織，評測重點(diǎn)關(guān)注各種語言(包括我國蒙古族、藏族、維吾爾族、哈薩克族、柯爾克孜族的民族語言)到漢語的翻譯，評測共包含7個語言對，9個評測項(xiàng)目和4個評測領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。在漢英—英漢新聞方向的評測中，除了英漢新聞的當(dāng)前(current)評測外，還設(shè)置了英漢和漢英新聞的進(jìn)展(progress)評測。

本次評測采用以下流程：通過網(wǎng)絡(luò)，評測組織方在評測前一個月向參評單位提供評測訓(xùn)練語料和開發(fā)語料，評測時(shí)再統(tǒng)一發(fā)放測試語料，參評單位在測試語料發(fā)放后約三天之內(nèi)提交系統(tǒng)翻譯結(jié)果，組織方對翻譯結(jié)果進(jìn)行統(tǒng)一測評后，向所有參評單位公布評測結(jié)果。

此次評測主要的自動評測指標(biāo)為BLEU-SBP(Chiang et al.,2008)，在漢英方向還采用了WoodPecker評測(Zhou et al.,2008)。

本次評測吸引了國內(nèi)外19家教育科研機(jī)構(gòu)和企業(yè)單位參加，在9個評測項(xiàng)目上共提交了165個系統(tǒng)的翻譯結(jié)果。為了加強(qiáng)技術(shù)交流的效果，評測要求每個參評單位撰寫一份評測技術(shù)報(bào)告。技術(shù)上有特點(diǎn)的參評單位在CWMT2011研討會上就本單位的評測技術(shù)情況進(jìn)行了口頭報(bào)告。另外，研討會還設(shè)置了評測的海報(bào)展示環(huán)節(jié)，每個參評單位都以海報(bào)的形式展示了自己參評系統(tǒng)的技術(shù)情況。評測組織方的總結(jié)報(bào)告(包括各參評單位主系統(tǒng)的系統(tǒng)描述)、各參評單位的技術(shù)報(bào)告以及研討會錄用的其它論文都被收錄進(jìn)研討會的論文集并發(fā)放給大家。

本次評測在語料提供方面得到了新疆大學(xué)等多家單位(詳細(xì)語料提供單位參見表4.1和表4.2)的鼎立支持。多名業(yè)內(nèi)專家在評測準(zhǔn)備會上為CWMT2011評測提出了很多很好的設(shè)想和建議。

本文給出了此次評測的組織準(zhǔn)備過程、評測結(jié)果和分析。文中將列出所有參評單位的名稱，但在評測結(jié)果中，不會給出對應(yīng)的單位名稱，而是代之以單位的匿名代號。

本文內(nèi)容僅供研究使用，可以在研究論文中引用，但不可用于任何出于商業(yè)目的的宣傳活動。在研究論文中引用時(shí)，如果沒有得到其他單位的許可，不得公開其他單位的評測結(jié)果。

2 評測項(xiàng)目

CWMT2011評測項(xiàng)目的設(shè)置如表2.1所示。

表2.1 CWMT2011評測項(xiàng)目

本次評測共設(shè)置了9個評測項(xiàng)目，涉及到7個語言對，4個評測領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。與往屆評測不同的是，本次評測重點(diǎn)關(guān)注了各種語言到漢語的翻譯，除了漢英、英漢、日漢三個曾經(jīng)評測過的語言對以外，評測首次增加了民族語言(藏語、蒙語、維語、哈薩克語、柯爾克孜語)到漢語的翻譯評測。在漢英—英漢新聞方向的評測中，除了英漢新聞的當(dāng)前(current)評測外，還設(shè)置了英漢和漢英新聞的進(jìn)展(progress)評測。

3 參評單位和系統(tǒng)

本次評測共有19個單位報(bào)名參加，其中國內(nèi)單位15家，國外單位4家，教育和科研機(jī)構(gòu)16家，企業(yè)單位3家。參評單位名單如下：

CNGL,School of Computing,Dublin City University

NTT Communication Science Laboratories

SYSTRAN Software,Inc.

北京航空航天大學(xué)計(jì)算機(jī)學(xué)院智能所

北京交通大學(xué)

東北大學(xué)自然語言處理實(shí)驗(yàn)室

富士通研究開發(fā)中心有限公司

哈爾濱工業(yè)大學(xué)機(jī)器智能與翻譯研究室

內(nèi)蒙古師范大學(xué)

南京大學(xué)

西安理工大學(xué)

廈門大學(xué)

新疆大學(xué)

中國科學(xué)技術(shù)信息研究所

中國科學(xué)院合肥物質(zhì)科學(xué)研究院智能機(jī)械研究所

中國科學(xué)院計(jì)算技術(shù)研究所智能信息重點(diǎn)實(shí)驗(yàn)室

中國科學(xué)院軟件研究所基礎(chǔ)軟件國家工程研究中心

中國科學(xué)院新疆理化技術(shù)研究所

中國科學(xué)院自動化研究所

19家單位在9個不同的項(xiàng)目和語言方向共提交了165個系統(tǒng)的翻譯結(jié)果。表3.1給出了本次評測每個項(xiàng)目的參評單位和系統(tǒng)的數(shù)量。

表3.1 參評單位和系統(tǒng)數(shù)量

4 評測組織

4.1 評測方法

評測采用目前國際上普遍采用的評測方式：由評測的組織方提供訓(xùn)練和測試數(shù)據(jù)，參評單位在給定時(shí)間內(nèi)返回翻譯結(jié)果，再由評測組織方進(jìn)行評價(jià)。

所有評測項(xiàng)目都是對譯文質(zhì)量進(jìn)行評測，采用自動評測方法。主要評測指標(biāo)為BLEU-SBP (Chiang et al.,2008)，其他自動評測指標(biāo)包括：BLEU、NIST、GTM、mWER、mPER、ICT，漢英方向還采用了Woodpecker評測 (Zhou et al.,2008)。自動評測的算法(包括WoodPecker)都是大小寫敏感的，中文的評測是基于字的，而不是基于詞的。

對于每個評測項(xiàng)目，參評單位必須提交一個基本結(jié)果(Primary Result)，最多可以提交三個對比結(jié)果(Contrast Results)。產(chǎn)生基本結(jié)果的系統(tǒng)稱為參評單位的基本系統(tǒng)或主系統(tǒng)(Primary System)，產(chǎn)生對比結(jié)果的系統(tǒng)稱為參評單位的對比系統(tǒng)(Contrast System)。基本系統(tǒng)中，對于采用基于實(shí)例的機(jī)器翻譯技術(shù)或者統(tǒng)計(jì)機(jī)器翻譯技術(shù)實(shí)現(xiàn)的模塊或系統(tǒng)，所使用的訓(xùn)練數(shù)據(jù)必須限制在評測組織方指定的數(shù)據(jù)范圍之內(nèi)，不允許使用任何外部數(shù)據(jù)；對于采用基于規(guī)則的機(jī)器翻譯技術(shù)實(shí)現(xiàn)的模塊或系統(tǒng)，允許采用通過人工方式構(gòu)造的翻譯知識(例如，規(guī)則、模板、詞典等)，但是要在系統(tǒng)描述和技術(shù)報(bào)告中對于所使用的翻譯知識的規(guī)模、構(gòu)造和使用方式等進(jìn)行說明。對比系統(tǒng)則可以使用任何數(shù)據(jù)進(jìn)行訓(xùn)練。參評系統(tǒng)也可以采用系統(tǒng)融合技術(shù)，但要求在系統(tǒng)描述中進(jìn)行明確說明，并在技術(shù)報(bào)告中給出系統(tǒng)融合前單系統(tǒng)的運(yùn)行結(jié)果。評測組織方在發(fā)布評測結(jié)果時(shí)，也會對采用了系統(tǒng)融合技術(shù)的系統(tǒng)進(jìn)行標(biāo)注。

4.2 測試數(shù)據(jù)準(zhǔn)備

本次機(jī)器翻譯的評測語料涉及8個語言方向(漢英、英漢、日漢、蒙漢、藏漢、維漢、哈漢和柯漢)、4個領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。根據(jù)國外相關(guān)評測及具體分析，我們制訂了相應(yīng)的語料規(guī)模。在評測中輸入輸出文件均采用UTF-8編碼(有BOM)以及嚴(yán)格的XML格式。

訓(xùn)練語料中，英文單語語料為路透社的RCV1語料，漢語單語語料為搜狗實(shí)驗(yàn)室的搜狗全網(wǎng)新聞?wù)Z料庫SogouCA，雙語語料情況見表4.1；開發(fā)和測試語料情況見表4.2。

測試語料包括真實(shí)測試集及干擾集兩部分，干擾集的結(jié)果在評判時(shí)被舍棄。

所有開發(fā)集和測試集均為一份原文、四份參考答案。每份參考答案的原始文本均由四名經(jīng)驗(yàn)豐富的專業(yè)翻譯人員各自獨(dú)立翻譯而成。

表4.2 CWMT2011機(jī)器翻譯評測開發(fā)集和測試集情況

為了了解各參評單位的系統(tǒng)進(jìn)步情況，今年漢英新聞和英漢新聞方向均設(shè)置了進(jìn)展(progress)項(xiàng)目(使用的是CWMT2009的評測語料)，另外，英漢新聞方向還設(shè)置了當(dāng)前(current)項(xiàng)目(使用的是2011年新制作的語料)，我們在評測結(jié)果中對比了進(jìn)展項(xiàng)目中兩年評測的系統(tǒng)變化情況。另外，在漢英新聞方向，我們繼續(xù)進(jìn)行了WoodPecker評測，該評測全部采用CWMT2009中WoodPecker評測的測試數(shù)據(jù)和相關(guān)參數(shù)。有關(guān)WoodPecker評測的詳細(xì)情況，請參見CWMT2009機(jī)器翻譯評測報(bào)告，該評測報(bào)告以及計(jì)算所組織的歷屆全國機(jī)器翻譯評測的相關(guān)資料可參考以下評測網(wǎng)頁及相關(guān)鏈接：

http://nlp.ict.ac.cn/new/CWMT/index.php

本次評測中所有項(xiàng)目的參考譯文均不提供給參評單位，而是留到下次評測時(shí)繼續(xù)使用，以便了解各參評單位在這一段時(shí)間間隔內(nèi)的技術(shù)進(jìn)步。在參評單位提交評測結(jié)果之后、研討會開始之前這段時(shí)間，我們向各參評單位開放了在線評測打分網(wǎng)站，供參評單位進(jìn)行機(jī)器翻譯實(shí)驗(yàn)時(shí)打分使用。

4.3 評測流程

本次CWMT評測采用了網(wǎng)上評測的方式，表4.3 給出了此次評測的流程。

表4.3 CWMT2011評測流程

續(xù)表

5 評測結(jié)果與分析

本節(jié)給出各評測項(xiàng)目主系統(tǒng)在主要評測指標(biāo)BLEU-SBP上的評測結(jié)果，并對評測結(jié)果進(jìn)行了分析。我們在BLEU-SBP的基礎(chǔ)上，針對各主系統(tǒng)的翻譯結(jié)果，進(jìn)行了結(jié)果之間差異的顯著性檢驗(yàn)——符號檢驗(yàn)(Collins et al.,2005)，總的做法是：分別以每個主系統(tǒng)為基準(zhǔn)系統(tǒng)，測試了所有其他主系統(tǒng)與基準(zhǔn)系統(tǒng)結(jié)果差異的顯著性程度，以此構(gòu)造了所有主系統(tǒng)翻譯結(jié)果的差異顯著性矩陣，因篇幅有限，本文僅顯示漢英新聞進(jìn)展(progress)評測的差異顯著性結(jié)果(圖1)。詳細(xì)的評測結(jié)果參見CWMT2011機(jī)器翻譯評測報(bào)告(http://nlp.ict.ac.cn/new/CWMT/CWMT2011.php)。

在下面評測結(jié)果的圖表中，橫坐標(biāo)是該項(xiàng)目各參評單位提交的主系統(tǒng)(用各單位代號來表示)，縱坐標(biāo)是主要評測指標(biāo)的得分。橫坐標(biāo)中出現(xiàn)的“◆”代表其左邊的系統(tǒng)采用了系統(tǒng)融合技術(shù)。

5.1 漢英新聞(progress)

圖1 CWMT2011漢英新聞(progress)評測結(jié)果

表5.1.1 漢英新聞(progress)各主系統(tǒng)2009年與2011年評測結(jié)果對比

表5.1.2 漢英新聞(progress)各主系統(tǒng)BLEU4-SBP差異顯著性檢驗(yàn)結(jié)果表(顯著標(biāo)志●,不顯著標(biāo)志○，p<0.05)

分析：從表5.1.1中可以看出，既參加了CWMT2009又參加了CWMT2011漢英新聞評測的單位中，有一半單位的成績有所提高，例如S5的BLEU-SBP值提升了2.3個百分點(diǎn)，有一半單位因各種緣故成績有所下降?？偟膩碚f，參加評測的漢英新聞評測系統(tǒng)的差異性不大，排在第1名和第9名的系統(tǒng)的BLEU-SBP值的差異只有3個百分點(diǎn)，很多系統(tǒng)間的差異性不顯著(表5.1.2)。從評測報(bào)告和評測結(jié)果來看，絕大多數(shù)參評單位采用的漢英機(jī)器翻譯技術(shù)差異不大，各單位系統(tǒng)之間的差距在逐漸縮小。

5.2 英漢新聞

表5.2.1 英漢新聞(progress)各主系統(tǒng)2009年與2011年評測結(jié)果對比

分析：從表5.2.1可以看出，在進(jìn)展(progress)項(xiàng)目中，與2009年相比，2011年英漢新聞領(lǐng)域的BLEU值除個別單位(S7)略有下降外，其他四個單位均有提高。當(dāng)前(current)項(xiàng)目的評測結(jié)果中，橫坐標(biāo)上，除了前兩個單位和后兩個單位外，中間單位的BLEU值差異基本上不明顯(詳情可參考CWMT2011評測報(bào)告中的顯著性檢驗(yàn)結(jié)果，如圖2、圖3所示)。

圖2 CWMT2011英漢新聞(progress)評測結(jié)果(BLEU5-SBP)

圖3 WMT2011英漢新聞(current)評測結(jié)果(BLEU5-SBP)

5.3 英漢科技

圖4 CWMT2011英漢科技評測結(jié)果(BLEU5-SBP)

分析：從圖4可以看出，英漢科技領(lǐng)域的BLEU值比較高，這可能與領(lǐng)域比較集中(主要集中在計(jì)算機(jī)和通訊兩個領(lǐng)域)，測試集與開發(fā)集、訓(xùn)練集的語料內(nèi)容比較一致，訓(xùn)練語料規(guī)模比較大(表4.1)有關(guān)。

5.4 日漢新聞

圖5 CWMT2011日漢新聞評測結(jié)果(BLEU5-SBP)

分析：從上圖可以看出，日漢新聞領(lǐng)域的BLEU值比較高，各系統(tǒng)間的差異比較顯著。此次日漢新聞項(xiàng)目提供的訓(xùn)練語料規(guī)模比較大，但內(nèi)容比較龐雜，與開發(fā)集和測試集語料(內(nèi)容都集中在新聞領(lǐng)域)的相似度并不高，然而，筆者通過對比原文和參考譯文發(fā)現(xiàn)：日文和中文這兩種語言的相似程度非常高，這可能是該項(xiàng)目BLEU值較高的主要原因。

例如，原文：國家開発銀行が今回香港で発行したCDは、主に機(jī)関投資家を?qū)澫螭趣筏郡猡韦恰€人投資家は購入できない。

參考譯文之一：中國開發(fā)銀行這次在香港發(fā)行的CD,主要以集團(tuán)投資家為對象,個人投資家不得購入。

5.5 藏漢政府文獻(xiàn)和蒙漢日常用語

分析：

從圖6可以看出，藏漢政府文獻(xiàn)領(lǐng)域的BLEU值很高，各系統(tǒng)間的差異很顯著。我們分析BLEU值偏高的原因，發(fā)現(xiàn)：1)評測語料主要來源于政府文獻(xiàn)，領(lǐng)域相對集中，固定表達(dá)多，且使用頻率高；2)相對于其它民語來說，訓(xùn)練語料較多(表4.1)。這兩個原因有可能是藏漢政府文獻(xiàn)BLEU值偏高的主要原因。

從圖7可以看出，蒙漢日常用語領(lǐng)域的BLEU值很低，各系統(tǒng)間的差異不太顯著。我們考察了一下各參評單位提交的翻譯結(jié)果，從翻譯質(zhì)量上來看，各個系統(tǒng)還很不成熟，譯文中漏譯現(xiàn)象比較嚴(yán)重，命名實(shí)體普遍沒有翻譯出來，譯文長度偏短。

5.6 維漢新聞

圖8 CWMT2011維漢新聞評測結(jié)果(BLEU5-SBP)

分析：從圖8可以看出，維漢新聞領(lǐng)域的BLEU值較高，各系統(tǒng)間的差異比較顯著。我們考察了評測語料及翻譯結(jié)果，發(fā)現(xiàn)和藏漢政府文獻(xiàn)翻譯的情形類似，維漢新聞的測試語料和訓(xùn)練語料主要來源于中國政府發(fā)布的官方新聞，領(lǐng)域比較集中，固定表達(dá)多且使用頻率高，而且測試語料與訓(xùn)練語料相似程度高，從而導(dǎo)致系統(tǒng)譯文的質(zhì)量比較好，BLEU值比較高。

5.7 哈漢和柯漢新聞

分析：從圖9和圖10可以看出，哈漢和柯漢新聞領(lǐng)域的BLEU值也比較高，各系統(tǒng)間的差異不太顯著。與維漢新聞翻譯的情形類似，哈漢新聞和柯漢新聞的測試語料和訓(xùn)練語料主要來源于中國政府發(fā)布的官方新聞，而且測試語料與訓(xùn)練語料相似程度比較高，所以得分較高，而且柯漢新聞更有相當(dāng)一部分(超過1/3)的測試語料和訓(xùn)練語料來源于政府頒布的一些法規(guī)和條例，領(lǐng)域更加集中，這也許可以說明為什么柯漢新聞的翻譯效果更好。

5.8 各評測項(xiàng)目情況對比及總體分析

圖11 CWMT2011各評測項(xiàng)目對比

圖10橫坐標(biāo)中從左至右分別對應(yīng)著表2.1中從上到下九個評測項(xiàng)目，其中英漢新聞包括兩個子項(xiàng)目：英漢新p代表進(jìn)展(progress)項(xiàng)目，英漢新c代表當(dāng)前(current)項(xiàng)目?？v坐標(biāo)為BLEU-SBP的數(shù)值，其中漢英的評測指標(biāo)是BLEU4-SBP，其他是BLEU5-SBP。

總的來看，評測BLEU-SBP得分比較高的項(xiàng)目有：臧漢政府文獻(xiàn)、維漢新聞、日漢新聞、柯漢新聞、英漢科技和哈漢新聞；評測得分比較低的項(xiàng)目有：漢英新聞和蒙漢新聞。

通過對參評系統(tǒng)所采用的技術(shù)以及翻譯結(jié)果的分析，我們發(fā)現(xiàn)：

1)統(tǒng)計(jì)機(jī)器翻譯技術(shù)在本次參評的系統(tǒng)中占主流地位。參評系統(tǒng)絕大多數(shù)采用了統(tǒng)計(jì)機(jī)器翻譯技術(shù)(66個主系統(tǒng)中有62個采用的是純統(tǒng)計(jì)機(jī)器翻譯技術(shù))。與以往相比，本次評測更多單位采用了基于句法的統(tǒng)計(jì)機(jī)器翻譯模型(包括基于形式句法的層次短語模型)，這表明更多的單位掌握了這項(xiàng)技術(shù)。

2)規(guī)則和統(tǒng)計(jì)相結(jié)合的系統(tǒng)在評測中表現(xiàn)出一定的優(yōu)勢。參評系統(tǒng)中只有少量系統(tǒng)(4個主系統(tǒng))結(jié)合了規(guī)則式方法和統(tǒng)計(jì)式方法，但是均取得了不錯的效果。例如，S18采用的是在比較成熟的規(guī)則式系統(tǒng)的翻譯結(jié)果上運(yùn)用統(tǒng)計(jì)式方法進(jìn)行后編輯，在漢英新聞的評測項(xiàng)目中其BLEU值排名第一；S11采用的方法是，在基于統(tǒng)計(jì)和基于規(guī)則這兩類機(jī)器翻譯多引擎的翻譯輸出的基礎(chǔ)上，進(jìn)行系統(tǒng)融合，其在英漢科技領(lǐng)域提交的翻譯結(jié)果BLEU值排名第一。(另外還有一個單純的規(guī)則系統(tǒng)作為對比系統(tǒng)，在其所在的評測項(xiàng)目組中成績不太理想。)

3)系統(tǒng)的翻譯質(zhì)量取決于多種因素。總體來說，源語言與目標(biāo)語言相似程度越高(如日漢新聞)，評測的領(lǐng)域越集中，測試語料與訓(xùn)練語料/開發(fā)語料的相似程度越高(如藏漢政府文獻(xiàn)、維漢新聞、柯漢新聞、英漢科技等)，訓(xùn)練語料規(guī)模越大(如英漢科技、藏漢政府文獻(xiàn))，參評系統(tǒng)采用的技術(shù)越先進(jìn)，參評系統(tǒng)的成熟度越好(包括對一些細(xì)節(jié)問題的處理，如：對評測語料的前期處理、對翻譯結(jié)果的譯后處理、對命名實(shí)體的處理，以及系統(tǒng)開發(fā)者的技術(shù)熟練程度等)，系統(tǒng)表現(xiàn)越好。

6 總結(jié)

CWMT2011評測主要側(cè)重于其他語種到漢語的評測，共設(shè)立了9個評測項(xiàng)目，其中包括漢英雙向的進(jìn)展性評測，新增了五個語言對的評測，新增的評測主要是民族語言到漢語的評測。此次評測的評測項(xiàng)目和參評單位的數(shù)量都位居歷屆全國機(jī)器翻譯評測之首。

從評測結(jié)果來看，雖然一些項(xiàng)目的語種和領(lǐng)域是參評單位從未接觸過的，但不論是從自動評測的結(jié)果(BLEU值等)還是從筆者人工考察的譯文質(zhì)量來看，機(jī)器翻譯的效果都超過了我們的預(yù)期，這充分證明了統(tǒng)計(jì)式機(jī)器翻譯技術(shù)強(qiáng)大的適應(yīng)性。但是也存在著一些問題，例如，漢英新聞的翻譯，通過進(jìn)展性評測，我們發(fā)現(xiàn)結(jié)果喜憂參半(大約有一半單位成績有所提高，還有大約一半的單位在后退或者止步不前)，希望這個問題引起大家的重視。

評測的成績?nèi)Q于多種因素，包括源語言與目標(biāo)語言的相似程度、評測領(lǐng)域的集中程度、測試語料與訓(xùn)練/開發(fā)語料的相似程度、訓(xùn)練語料的規(guī)模以及參評系統(tǒng)采用的技術(shù)和成熟度等。但是評測的結(jié)果不是我們評測的真正目的，我們的目的是通過評測這個手段，給大家提供一個技術(shù)交流的平臺，讓大家及時(shí)發(fā)現(xiàn)問題，跟蹤最新的機(jī)器翻譯技術(shù)，互幫互學(xué)，共同前進(jìn)，推動我國機(jī)器翻譯事業(yè)穩(wěn)步向前發(fā)展，最終達(dá)到利益大眾的目的。

CWMT2011機(jī)器翻譯評測能得以順利進(jìn)行，得益于各同行單位和同仁的大力支持，沒有大家在評測語料上的無私奉獻(xiàn)和在評測組織上的寶貴意見，這么大規(guī)模評測的實(shí)施是無法想象的。我們在此對所有為CWMT2011評測提供評測語料、參加CWMT2011評測、關(guān)心和支持CWMT2011評測的單位和同仁表示最誠摯的感謝！

CWMT2011研討會已初步確定了以后CWMT機(jī)器翻譯評測每隔兩年舉行一次，下一次機(jī)器翻譯評測的時(shí)間定在2013年，我們熱忱地歡迎各同行單位屆時(shí)踴躍報(bào)名參加評測，也期待著各參評單位在CWMT2013中再創(chuàng)佳績，將我國機(jī)器翻譯的研究和開發(fā)應(yīng)用推向一個新的高潮！

[1]劉群，趙紅梅.第五屆全國機(jī)器翻譯研討會(CWMT2009)評測報(bào)告[R].第五屆全國機(jī)器翻譯研討會(CWMT2009)，2009年10月16～17日，南京.

[2]趙紅梅，呂雅娟，賁國生，等.第七屆全國機(jī)器翻譯研討會(CWMT2011)評測報(bào)告[R].第七屆全國機(jī)器翻譯研討會(CWMT2011)，2011年9月23～24日，廈門.

[3]David Chiang,Steve DeNeefe,Yee Seng Chan,et al.2008.Decomposability of translation metrics for improved evaluation and efficient algorithms[C]//Proc.EMNLP 2008,pages 610-619.

[4]Michael Collins,Philipp Koehn,Ivona Kuerová.2005.Clause restructuring for statistical machine translation[C]//Proc.ACL 2005,pages 531-540.

[5]Ming Zhou,Bo Wang,Shujie Liu,et al.2008.Diagnostic Evaluation of Machine Translation Systems Using Automatically Constructed Linguistic Check-Points[C]//Proc.Coling 2008,pages 1121-1128.