亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        第七屆全國機(jī)器翻譯研討會機(jī)器翻譯評測總結(jié)

        2012-06-28 08:52:40趙紅梅呂雅娟賁國生
        中文信息學(xué)報(bào) 2012年1期
        關(guān)鍵詞:漢英評測英漢

        趙紅梅,呂雅娟,賁國生,黃 云,劉 群

        (中國科學(xué)院 計(jì)算技術(shù)研究所 中國科學(xué)院 智能信息處理重點(diǎn)實(shí)驗(yàn)室,北京 100190)

        1 概述

        中國中文信息學(xué)會主辦的第七屆全國機(jī)器翻譯研討會(CWMT2011)于2011年9月23~24日在廈門召開。為了全面了解國內(nèi)外機(jī)器翻譯技術(shù)的現(xiàn)狀,促進(jìn)機(jī)器翻譯技術(shù)的研究,按照慣例,本屆機(jī)器翻譯研討會繼續(xù)組織了統(tǒng)一的機(jī)器翻譯評測,以推進(jìn)參評單位的實(shí)質(zhì)性交流和機(jī)器翻譯技術(shù)的發(fā)展。

        本次評測由中國科學(xué)院計(jì)算技術(shù)研究所組織,評測重點(diǎn)關(guān)注各種語言(包括我國蒙古族、藏族、維吾爾族、哈薩克族、柯爾克孜族的民族語言)到漢語的翻譯,評測共包含7個語言對,9個評測項(xiàng)目和4個評測領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。在漢英—英漢新聞方向的評測中,除了英漢新聞的當(dāng)前(current)評測外,還設(shè)置了英漢和漢英新聞的進(jìn)展(progress)評測。

        本次評測采用以下流程:通過網(wǎng)絡(luò),評測組織方在評測前一個月向參評單位提供評測訓(xùn)練語料和開發(fā)語料,評測時(shí)再統(tǒng)一發(fā)放測試語料,參評單位在測試語料發(fā)放后約三天之內(nèi)提交系統(tǒng)翻譯結(jié)果,組織方對翻譯結(jié)果進(jìn)行統(tǒng)一測評后,向所有參評單位公布評測結(jié)果。

        此次評測主要的自動評測指標(biāo)為BLEU-SBP(Chiang et al.,2008),在漢英方向還采用了WoodPecker評測(Zhou et al.,2008)。

        本次評測吸引了國內(nèi)外19家教育科研機(jī)構(gòu)和企業(yè)單位參加,在9個評測項(xiàng)目上共提交了165個系統(tǒng)的翻譯結(jié)果。為了加強(qiáng)技術(shù)交流的效果,評測要求每個參評單位撰寫一份評測技術(shù)報(bào)告。技術(shù)上有特點(diǎn)的參評單位在CWMT2011研討會上就本單位的評測技術(shù)情況進(jìn)行了口頭報(bào)告。另外,研討會還設(shè)置了評測的海報(bào)展示環(huán)節(jié),每個參評單位都以海報(bào)的形式展示了自己參評系統(tǒng)的技術(shù)情況。評測組織方的總結(jié)報(bào)告(包括各參評單位主系統(tǒng)的系統(tǒng)描述)、各參評單位的技術(shù)報(bào)告以及研討會錄用的其它論文都被收錄進(jìn)研討會的論文集并發(fā)放給大家。

        本次評測在語料提供方面得到了新疆大學(xué)等多家單位(詳細(xì)語料提供單位參見表4.1和表4.2)的鼎立支持。多名業(yè)內(nèi)專家在評測準(zhǔn)備會上為CWMT2011評測提出了很多很好的設(shè)想和建議。

        本文給出了此次評測的組織準(zhǔn)備過程、評測結(jié)果和分析。文中將列出所有參評單位的名稱,但在評測結(jié)果中,不會給出對應(yīng)的單位名稱,而是代之以單位的匿名代號。

        本文內(nèi)容僅供研究使用,可以在研究論文中引用,但不可用于任何出于商業(yè)目的的宣傳活動。在研究論文中引用時(shí),如果沒有得到其他單位的許可,不得公開其他單位的評測結(jié)果。

        2 評測項(xiàng)目

        CWMT2011評測項(xiàng)目的設(shè)置如表2.1所示。

        表2.1 CWMT2011評測項(xiàng)目

        本次評測共設(shè)置了9個評測項(xiàng)目,涉及到7個語言對,4個評測領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。與往屆評測不同的是,本次評測重點(diǎn)關(guān)注了各種語言到漢語的翻譯,除了漢英、英漢、日漢三個曾經(jīng)評測過的語言對以外,評測首次增加了民族語言(藏語、蒙語、維語、哈薩克語、柯爾克孜語)到漢語的翻譯評測。在漢英—英漢新聞方向的評測中,除了英漢新聞的當(dāng)前(current)評測外,還設(shè)置了英漢和漢英新聞的進(jìn)展(progress)評測。

        3 參評單位和系統(tǒng)

        本次評測共有19個單位報(bào)名參加,其中國內(nèi)單位15家,國外單位4家,教育和科研機(jī)構(gòu)16家,企業(yè)單位3家。參評單位名單如下:

        CNGL,School of Computing,Dublin City University

        NTT Communication Science Laboratories

        SYSTRAN Software,Inc.

        北京航空航天大學(xué)計(jì)算機(jī)學(xué)院智能所

        北京交通大學(xué)

        東北大學(xué)自然語言處理實(shí)驗(yàn)室

        富士通研究開發(fā)中心有限公司

        哈爾濱工業(yè)大學(xué)機(jī)器智能與翻譯研究室

        內(nèi)蒙古師范大學(xué)

        南京大學(xué)

        西安理工大學(xué)

        廈門大學(xué)

        新疆大學(xué)

        中國科學(xué)技術(shù)信息研究所

        中國科學(xué)院合肥物質(zhì)科學(xué)研究院智能機(jī)械研究所

        中國科學(xué)院計(jì)算技術(shù)研究所智能信息重點(diǎn)實(shí)驗(yàn)室

        中國科學(xué)院軟件研究所基礎(chǔ)軟件國家工程研究中心

        中國科學(xué)院新疆理化技術(shù)研究所

        中國科學(xué)院自動化研究所

        19家單位在9個不同的項(xiàng)目和語言方向共提交了165個系統(tǒng)的翻譯結(jié)果。表3.1給出了本次評測每個項(xiàng)目的參評單位和系統(tǒng)的數(shù)量。

        表3.1 參評單位和系統(tǒng)數(shù)量

        4 評測組織

        4.1 評測方法

        評測采用目前國際上普遍采用的評測方式:由評測的組織方提供訓(xùn)練和測試數(shù)據(jù),參評單位在給定時(shí)間內(nèi)返回翻譯結(jié)果,再由評測組織方進(jìn)行評價(jià)。

        所有評測項(xiàng)目都是對譯文質(zhì)量進(jìn)行評測,采用自動評測方法。主要評測指標(biāo)為BLEU-SBP (Chiang et al.,2008),其他自動評測指標(biāo)包括:BLEU、NIST、GTM、mWER、mPER、ICT,漢英方向還采用了Woodpecker評測 (Zhou et al.,2008)。自動評測的算法(包括WoodPecker)都是大小寫敏感的,中文的評測是基于字的,而不是基于詞的。

        對于每個評測項(xiàng)目,參評單位必須提交一個基本結(jié)果(Primary Result),最多可以提交三個對比結(jié)果(Contrast Results)。產(chǎn)生基本結(jié)果的系統(tǒng)稱為參評單位的基本系統(tǒng)或主系統(tǒng)(Primary System),產(chǎn)生對比結(jié)果的系統(tǒng)稱為參評單位的對比系統(tǒng)(Contrast System)。基本系統(tǒng)中,對于采用基于實(shí)例的機(jī)器翻譯技術(shù)或者統(tǒng)計(jì)機(jī)器翻譯技術(shù)實(shí)現(xiàn)的模塊或系統(tǒng),所使用的訓(xùn)練數(shù)據(jù)必須限制在評測組織方指定的數(shù)據(jù)范圍之內(nèi),不允許使用任何外部數(shù)據(jù);對于采用基于規(guī)則的機(jī)器翻譯技術(shù)實(shí)現(xiàn)的模塊或系統(tǒng),允許采用通過人工方式構(gòu)造的翻譯知識(例如,規(guī)則、模板、詞典等),但是要在系統(tǒng)描述和技術(shù)報(bào)告中對于所使用的翻譯知識的規(guī)模、構(gòu)造和使用方式等進(jìn)行說明。對比系統(tǒng)則可以使用任何數(shù)據(jù)進(jìn)行訓(xùn)練。參評系統(tǒng)也可以采用系統(tǒng)融合技術(shù),但要求在系統(tǒng)描述中進(jìn)行明確說明,并在技術(shù)報(bào)告中給出系統(tǒng)融合前單系統(tǒng)的運(yùn)行結(jié)果。評測組織方在發(fā)布評測結(jié)果時(shí),也會對采用了系統(tǒng)融合技術(shù)的系統(tǒng)進(jìn)行標(biāo)注。

        4.2 測試數(shù)據(jù)準(zhǔn)備

        本次機(jī)器翻譯的評測語料涉及8個語言方向(漢英、英漢、日漢、蒙漢、藏漢、維漢、哈漢和柯漢)、4個領(lǐng)域(新聞、科技、政府文獻(xiàn)和日常用語)。根據(jù)國外相關(guān)評測及具體分析,我們制訂了相應(yīng)的語料規(guī)模。在評測中輸入輸出文件均采用UTF-8編碼(有BOM)以及嚴(yán)格的XML格式。

        訓(xùn)練語料中,英文單語語料為路透社的RCV1語料,漢語單語語料為搜狗實(shí)驗(yàn)室的搜狗全網(wǎng)新聞?wù)Z料庫SogouCA,雙語語料情況見表4.1;開發(fā)和測試語料情況見表4.2。

        測試語料包括真實(shí)測試集及干擾集兩部分,干擾集的結(jié)果在評判時(shí)被舍棄。

        所有開發(fā)集和測試集均為一份原文、四份參考答案。每份參考答案的原始文本均由四名經(jīng)驗(yàn)豐富的專業(yè)翻譯人員各自獨(dú)立翻譯而成。

        表4.2 CWMT2011機(jī)器翻譯評測開發(fā)集和測試集情況

        為了了解各參評單位的系統(tǒng)進(jìn)步情況,今年漢英新聞和英漢新聞方向均設(shè)置了進(jìn)展(progress)項(xiàng)目(使用的是CWMT2009的評測語料),另外,英漢新聞方向還設(shè)置了當(dāng)前(current)項(xiàng)目(使用的是2011年新制作的語料),我們在評測結(jié)果中對比了進(jìn)展項(xiàng)目中兩年評測的系統(tǒng)變化情況。另外,在漢英新聞方向,我們繼續(xù)進(jìn)行了WoodPecker評測,該評測全部采用CWMT2009中WoodPecker評測的測試數(shù)據(jù)和相關(guān)參數(shù)。有關(guān)WoodPecker評測的詳細(xì)情況,請參見CWMT2009機(jī)器翻譯評測報(bào)告,該評測報(bào)告以及計(jì)算所組織的歷屆全國機(jī)器翻譯評測的相關(guān)資料可參考以下評測網(wǎng)頁及相關(guān)鏈接:

        http://nlp.ict.ac.cn/new/CWMT/index.php

        本次評測中所有項(xiàng)目的參考譯文均不提供給參評單位,而是留到下次評測時(shí)繼續(xù)使用,以便了解各參評單位在這一段時(shí)間間隔內(nèi)的技術(shù)進(jìn)步。在參評單位提交評測結(jié)果之后、研討會開始之前這段時(shí)間,我們向各參評單位開放了在線評測打分網(wǎng)站,供參評單位進(jìn)行機(jī)器翻譯實(shí)驗(yàn)時(shí)打分使用。

        4.3 評測流程

        本次CWMT評測采用了網(wǎng)上評測的方式,表4.3 給出了此次評測的流程。

        表4.3 CWMT2011評測流程

        續(xù)表

        5 評測結(jié)果與分析

        本節(jié)給出各評測項(xiàng)目主系統(tǒng)在主要評測指標(biāo)BLEU-SBP上的評測結(jié)果,并對評測結(jié)果進(jìn)行了分析。我們在BLEU-SBP的基礎(chǔ)上,針對各主系統(tǒng)的翻譯結(jié)果,進(jìn)行了結(jié)果之間差異的顯著性檢驗(yàn)——符號檢驗(yàn)(Collins et al.,2005),總的做法是:分別以每個主系統(tǒng)為基準(zhǔn)系統(tǒng),測試了所有其他主系統(tǒng)與基準(zhǔn)系統(tǒng)結(jié)果差異的顯著性程度,以此構(gòu)造了所有主系統(tǒng)翻譯結(jié)果的差異顯著性矩陣,因篇幅有限,本文僅顯示漢英新聞進(jìn)展(progress)評測的差異顯著性結(jié)果(圖1)。詳細(xì)的評測結(jié)果參見CWMT2011機(jī)器翻譯評測報(bào)告(http://nlp.ict.ac.cn/new/CWMT/CWMT2011.php)。

        在下面評測結(jié)果的圖表中,橫坐標(biāo)是該項(xiàng)目各參評單位提交的主系統(tǒng)(用各單位代號來表示),縱坐標(biāo)是主要評測指標(biāo)的得分。橫坐標(biāo)中出現(xiàn)的“◆”代表其左邊的系統(tǒng)采用了系統(tǒng)融合技術(shù)。

        5.1 漢英新聞(progress)

        圖1 CWMT2011漢英新聞(progress)評測結(jié)果

        表5.1.1 漢英新聞(progress)各主系統(tǒng)2009年與2011年評測結(jié)果對比

        表5.1.2 漢英新聞(progress)各主系統(tǒng)BLEU4-SBP差異顯著性檢驗(yàn)結(jié)果表(顯著標(biāo)志●,不顯著標(biāo)志○,p<0.05)

        分析:從表5.1.1中可以看出,既參加了CWMT2009又參加了CWMT2011漢英新聞評測的單位中,有一半單位的成績有所提高,例如S5的BLEU-SBP值提升了2.3個百分點(diǎn),有一半單位因各種緣故成績有所下降??偟膩碚f,參加評測的漢英新聞評測系統(tǒng)的差異性不大,排在第1名和第9名的系統(tǒng)的BLEU-SBP值的差異只有3個百分點(diǎn),很多系統(tǒng)間的差異性不顯著(表5.1.2)。從評測報(bào)告和評測結(jié)果來看,絕大多數(shù)參評單位采用的漢英機(jī)器翻譯技術(shù)差異不大,各單位系統(tǒng)之間的差距在逐漸縮小。

        5.2 英漢新聞

        表5.2.1 英漢新聞(progress)各主系統(tǒng)2009年與2011年評測結(jié)果對比

        分析:從表5.2.1可以看出,在進(jìn)展(progress)項(xiàng)目中,與2009年相比,2011年英漢新聞領(lǐng)域的BLEU值除個別單位(S7)略有下降外,其他四個單位均有提高。當(dāng)前(current)項(xiàng)目的評測結(jié)果中,橫坐標(biāo)上,除了前兩個單位和后兩個單位外,中間單位的BLEU值差異基本上不明顯(詳情可參考CWMT2011評測報(bào)告中的顯著性檢驗(yàn)結(jié)果,如圖2、圖3所示)。

        圖2 CWMT2011英漢新聞(progress)評測結(jié)果(BLEU5-SBP)

        圖3 WMT2011英漢新聞(current)評測結(jié)果(BLEU5-SBP)

        5.3 英漢科技

        圖4 CWMT2011英漢科技評測結(jié)果(BLEU5-SBP)

        分析:從圖4可以看出,英漢科技領(lǐng)域的BLEU值比較高,這可能與領(lǐng)域比較集中(主要集中在計(jì)算機(jī)和通訊兩個領(lǐng)域),測試集與開發(fā)集、訓(xùn)練集的語料內(nèi)容比較一致,訓(xùn)練語料規(guī)模比較大(表4.1)有關(guān)。

        5.4 日漢新聞

        圖5 CWMT2011日漢新聞評測結(jié)果(BLEU5-SBP)

        分析:從上圖可以看出,日漢新聞領(lǐng)域的BLEU值比較高,各系統(tǒng)間的差異比較顯著。此次日漢新聞項(xiàng)目提供的訓(xùn)練語料規(guī)模比較大,但內(nèi)容比較龐雜,與開發(fā)集和測試集語料(內(nèi)容都集中在新聞領(lǐng)域)的相似度并不高,然而,筆者通過對比原文和參考譯文發(fā)現(xiàn):日文和中文這兩種語言的相似程度非常高,這可能是該項(xiàng)目BLEU值較高的主要原因。

        例如,原文:國家開発銀行が今回香港で発行したCDは、主に機(jī)関投資家を?qū)澫螭趣筏郡猡韦恰€人投資家は購入できない。

        參考譯文之一:中國開發(fā)銀行這次在香港發(fā)行的CD,主要以集團(tuán)投資家為對象,個人投資家不得購入。

        5.5 藏漢政府文獻(xiàn)和蒙漢日常用語

        分析:

        從圖6可以看出,藏漢政府文獻(xiàn)領(lǐng)域的BLEU值很高,各系統(tǒng)間的差異很顯著。我們分析BLEU值偏高的原因,發(fā)現(xiàn):1)評測語料主要來源于政府文獻(xiàn),領(lǐng)域相對集中,固定表達(dá)多,且使用頻率高;2)相對于其它民語來說,訓(xùn)練語料較多(表4.1)。這兩個原因有可能是藏漢政府文獻(xiàn)BLEU值偏高的主要原因。

        從圖7可以看出,蒙漢日常用語領(lǐng)域的BLEU值很低,各系統(tǒng)間的差異不太顯著。我們考察了一下各參評單位提交的翻譯結(jié)果,從翻譯質(zhì)量上來看,各個系統(tǒng)還很不成熟,譯文中漏譯現(xiàn)象比較嚴(yán)重,命名實(shí)體普遍沒有翻譯出來,譯文長度偏短。

        5.6 維漢新聞

        圖8 CWMT2011維漢新聞評測結(jié)果(BLEU5-SBP)

        分析:從圖8可以看出,維漢新聞領(lǐng)域的BLEU值較高,各系統(tǒng)間的差異比較顯著。我們考察了評測語料及翻譯結(jié)果,發(fā)現(xiàn)和藏漢政府文獻(xiàn)翻譯的情形類似,維漢新聞的測試語料和訓(xùn)練語料主要來源于中國政府發(fā)布的官方新聞,領(lǐng)域比較集中,固定表達(dá)多且使用頻率高,而且測試語料與訓(xùn)練語料相似程度高,從而導(dǎo)致系統(tǒng)譯文的質(zhì)量比較好,BLEU值比較高。

        5.7 哈漢和柯漢新聞

        分析:從圖9和圖10可以看出,哈漢和柯漢新聞領(lǐng)域的BLEU值也比較高,各系統(tǒng)間的差異不太顯著。與維漢新聞翻譯的情形類似,哈漢新聞和柯漢新聞的測試語料和訓(xùn)練語料主要來源于中國政府發(fā)布的官方新聞,而且測試語料與訓(xùn)練語料相似程度比較高,所以得分較高,而且柯漢新聞更有相當(dāng)一部分(超過1/3)的測試語料和訓(xùn)練語料來源于政府頒布的一些法規(guī)和條例,領(lǐng)域更加集中,這也許可以說明為什么柯漢新聞的翻譯效果更好。

        5.8 各評測項(xiàng)目情況對比及總體分析

        圖11 CWMT2011各評測項(xiàng)目對比

        圖10橫坐標(biāo)中從左至右分別對應(yīng)著表2.1中從上到下九個評測項(xiàng)目,其中英漢新聞包括兩個子項(xiàng)目:英漢新p代表進(jìn)展(progress)項(xiàng)目,英漢新c代表當(dāng)前(current)項(xiàng)目??v坐標(biāo)為BLEU-SBP的數(shù)值,其中漢英的評測指標(biāo)是BLEU4-SBP,其他是BLEU5-SBP。

        總的來看,評測BLEU-SBP得分比較高的項(xiàng)目有:臧漢政府文獻(xiàn)、維漢新聞、日漢新聞、柯漢新聞、英漢科技和哈漢新聞;評測得分比較低的項(xiàng)目有:漢英新聞和蒙漢新聞。

        通過對參評系統(tǒng)所采用的技術(shù)以及翻譯結(jié)果的分析,我們發(fā)現(xiàn):

        1)統(tǒng)計(jì)機(jī)器翻譯技術(shù)在本次參評的系統(tǒng)中占主流地位。參評系統(tǒng)絕大多數(shù)采用了統(tǒng)計(jì)機(jī)器翻譯技術(shù)(66個主系統(tǒng)中有62個采用的是純統(tǒng)計(jì)機(jī)器翻譯技術(shù))。與以往相比,本次評測更多單位采用了基于句法的統(tǒng)計(jì)機(jī)器翻譯模型(包括基于形式句法的層次短語模型),這表明更多的單位掌握了這項(xiàng)技術(shù)。

        2)規(guī)則和統(tǒng)計(jì)相結(jié)合的系統(tǒng)在評測中表現(xiàn)出一定的優(yōu)勢。參評系統(tǒng)中只有少量系統(tǒng)(4個主系統(tǒng))結(jié)合了規(guī)則式方法和統(tǒng)計(jì)式方法,但是均取得了不錯的效果。例如,S18采用的是在比較成熟的規(guī)則式系統(tǒng)的翻譯結(jié)果上運(yùn)用統(tǒng)計(jì)式方法進(jìn)行后編輯,在漢英新聞的評測項(xiàng)目中其BLEU值排名第一;S11采用的方法是,在基于統(tǒng)計(jì)和基于規(guī)則這兩類機(jī)器翻譯多引擎的翻譯輸出的基礎(chǔ)上,進(jìn)行系統(tǒng)融合,其在英漢科技領(lǐng)域提交的翻譯結(jié)果BLEU值排名第一。(另外還有一個單純的規(guī)則系統(tǒng)作為對比系統(tǒng),在其所在的評測項(xiàng)目組中成績不太理想。)

        3)系統(tǒng)的翻譯質(zhì)量取決于多種因素。總體來說,源語言與目標(biāo)語言相似程度越高(如日漢新聞),評測的領(lǐng)域越集中,測試語料與訓(xùn)練語料/開發(fā)語料的相似程度越高(如藏漢政府文獻(xiàn)、維漢新聞、柯漢新聞、英漢科技等),訓(xùn)練語料規(guī)模越大(如英漢科技、藏漢政府文獻(xiàn)),參評系統(tǒng)采用的技術(shù)越先進(jìn),參評系統(tǒng)的成熟度越好(包括對一些細(xì)節(jié)問題的處理,如:對評測語料的前期處理、對翻譯結(jié)果的譯后處理、對命名實(shí)體的處理,以及系統(tǒng)開發(fā)者的技術(shù)熟練程度等),系統(tǒng)表現(xiàn)越好。

        6 總結(jié)

        CWMT2011評測主要側(cè)重于其他語種到漢語的評測,共設(shè)立了9個評測項(xiàng)目,其中包括漢英雙向的進(jìn)展性評測,新增了五個語言對的評測,新增的評測主要是民族語言到漢語的評測。此次評測的評測項(xiàng)目和參評單位的數(shù)量都位居歷屆全國機(jī)器翻譯評測之首。

        從評測結(jié)果來看,雖然一些項(xiàng)目的語種和領(lǐng)域是參評單位從未接觸過的,但不論是從自動評測的結(jié)果(BLEU值等)還是從筆者人工考察的譯文質(zhì)量來看,機(jī)器翻譯的效果都超過了我們的預(yù)期,這充分證明了統(tǒng)計(jì)式機(jī)器翻譯技術(shù)強(qiáng)大的適應(yīng)性。但是也存在著一些問題,例如,漢英新聞的翻譯,通過進(jìn)展性評測,我們發(fā)現(xiàn)結(jié)果喜憂參半(大約有一半單位成績有所提高,還有大約一半的單位在后退或者止步不前),希望這個問題引起大家的重視。

        評測的成績?nèi)Q于多種因素,包括源語言與目標(biāo)語言的相似程度、評測領(lǐng)域的集中程度、測試語料與訓(xùn)練/開發(fā)語料的相似程度、訓(xùn)練語料的規(guī)模以及參評系統(tǒng)采用的技術(shù)和成熟度等。但是評測的結(jié)果不是我們評測的真正目的,我們的目的是通過評測這個手段,給大家提供一個技術(shù)交流的平臺,讓大家及時(shí)發(fā)現(xiàn)問題,跟蹤最新的機(jī)器翻譯技術(shù),互幫互學(xué),共同前進(jìn),推動我國機(jī)器翻譯事業(yè)穩(wěn)步向前發(fā)展,最終達(dá)到利益大眾的目的。

        CWMT2011機(jī)器翻譯評測能得以順利進(jìn)行,得益于各同行單位和同仁的大力支持,沒有大家在評測語料上的無私奉獻(xiàn)和在評測組織上的寶貴意見,這么大規(guī)模評測的實(shí)施是無法想象的。我們在此對所有為CWMT2011評測提供評測語料、參加CWMT2011評測、關(guān)心和支持CWMT2011評測的單位和同仁表示最誠摯的感謝!

        CWMT2011研討會已初步確定了以后CWMT機(jī)器翻譯評測每隔兩年舉行一次,下一次機(jī)器翻譯評測的時(shí)間定在2013年,我們熱忱地歡迎各同行單位屆時(shí)踴躍報(bào)名參加評測,也期待著各參評單位在CWMT2013中再創(chuàng)佳績,將我國機(jī)器翻譯的研究和開發(fā)應(yīng)用推向一個新的高潮!

        [1]劉群,趙紅梅.第五屆全國機(jī)器翻譯研討會(CWMT2009)評測報(bào)告[R].第五屆全國機(jī)器翻譯研討會(CWMT2009),2009年10月16~17日,南京.

        [2]趙紅梅,呂雅娟,賁國生,等.第七屆全國機(jī)器翻譯研討會(CWMT2011)評測報(bào)告[R].第七屆全國機(jī)器翻譯研討會(CWMT2011),2011年9月23~24日,廈門.

        [3]David Chiang,Steve DeNeefe,Yee Seng Chan,et al.2008.Decomposability of translation metrics for improved evaluation and efficient algorithms[C]//Proc.EMNLP 2008,pages 610-619.

        [4]Michael Collins,Philipp Koehn,Ivona Kuerová.2005.Clause restructuring for statistical machine translation[C]//Proc.ACL 2005,pages 531-540.

        [5]Ming Zhou,Bo Wang,Shujie Liu,et al.2008.Diagnostic Evaluation of Machine Translation Systems Using Automatically Constructed Linguistic Check-Points[C]//Proc.Coling 2008,pages 1121-1128.

        猜你喜歡
        漢英評測英漢
        次時(shí)代主機(jī)微軟XSX全方位評測(下)
        次時(shí)代主機(jī)微軟XSX全方位評測(上)
        攻坡新利器,TOKEN VENTOUS評測
        Canyon Ultimate CF SLX 8.0 DI2評測
        中國自行車(2017年1期)2017-04-16 02:54:06
        話題鏈在漢英篇章翻譯中的統(tǒng)攝作用
        從目的論看環(huán)保公示語的漢英翻譯
        商務(wù)英語翻譯中英漢褒貶義詞的應(yīng)用探討
        淺談英漢習(xí)語的文化差異及翻譯方法
        英漢文化中的委婉語應(yīng)用對比分析
        漢英文字的幽默修辭功能淺探
        語言與翻譯(2014年1期)2014-07-10 13:06:14
        日本少妇比比中文字幕| 成年无码aⅴ片在线观看| 久久久日韩精品一区二区三区| 免费a级毛片出奶水| 99久久久无码国产精品动漫| 久久久免费精品国产色夜| 日韩在线 | 中文| 少妇性l交大片| 日本a在线播放| 日本高清在线播放一区二区| 国产一区二区三区在线蜜桃| 成年美女黄的视频网站| 亚洲午夜福利在线视频| 国产色诱视频在线观看| 亚洲五月激情综合图片区| 国产真实二区一区在线亚洲| 午夜免费观看一区二区三区| 99噜噜噜在线播放| 国产日产欧产精品精品 | 四虎影视永久在线精品| 无码无在线观看| 国产一区二区在线中文字幕| 男人的天堂一区二av| 潮喷大喷水系列无码久久精品| 成人白浆超碰人人人人| 久久久久久人妻精品一区百度网盘| 国产三级三级三级看三级日本| 日韩美腿丝袜三区四区| 无码人妻精品一区二区三区9厂 | 欧美老肥婆牲交videos| 爱情岛论坛亚洲品质自拍hd| 人妻丰满熟妇AV无码片| 在线免费观看亚洲毛片| 五月激情综合婷婷六月久久| 日产亚洲一区二区三区| 蜜臀av免费一区二区三区| 国产成人aa在线观看视频| 日本精品少妇一区二区| 欧美牲交a欧美牲交aⅴ| 亚洲国产精品久久久久久久| 国内精品视频成人一区二区|