王 強,杜 權(quán),肖 桐,朱靖波
(東北大學(xué) 自然語言處理實驗室,遼寧 沈陽 110819)
基于Transfer和Triangulation融合的中介語統(tǒng)計機器翻譯方法
王 強,杜 權(quán),肖 桐,朱靖波
(東北大學(xué) 自然語言處理實驗室,遼寧 沈陽 110819)
為了解決在構(gòu)建統(tǒng)計機器翻譯系統(tǒng)過程中所面臨的雙語平行數(shù)據(jù)缺乏的問題,該文提出了一種新的基于中介語的翻譯方法,稱為Transfer-Triangulation方法。該方法可以在基于中介語的翻譯過程中,結(jié)合傳統(tǒng)的Transfer方法和Triangulation方法的優(yōu)點,利用解碼中介語短語的方法改進短語表。該文方法是在使用英語作為中介語的德-漢翻譯任務(wù)中進行評價的。實驗結(jié)果表明,相比于傳統(tǒng)的基于中介語方法的基線系統(tǒng),該方法顯著提高了翻譯性能。
統(tǒng)計機器翻譯; 基于中介語的統(tǒng)計機器翻譯;中介語;質(zhì)量控制因子
Abstract: This paper presents a transfer-triangulation method for pivot-based translation between two languages with poor bilingual data. It takes the best of both typical transfer method and triangulation method for pivot-based translation, and decodes pivot phrases to improve phrase table. Evaluated on German-Chinese translation task with English as the pivot language, results show that our method achieves significant improvement over baseline pivot-based methods.
Key words: statistical machine translation; pivot-based statistical machine translation; pivot language; quality control factor
收稿日期: 2015-08-26 定稿日期: 2016-03-25
基金項目: 國家自然科學(xué)基金青年基金(61300097);國家自然科學(xué)基金(61272376);國家自然科學(xué)基金(61432013)
構(gòu)建性能優(yōu)異的統(tǒng)計機器翻譯系統(tǒng)通常需要數(shù)百萬乃至更多的雙語平行數(shù)據(jù)進行訓(xùn)練。然而在實際應(yīng)用時,除少量數(shù)據(jù)資源豐富的語言對外(如英漢、英阿),大多數(shù)語言對往往面臨雙語平行數(shù)據(jù)資源缺乏的問題(如德漢)。
為此,研究人員提出了基于中介語的統(tǒng)計機器翻譯方法,其核心思想是: 通過與源語和目標(biāo)語均存在大規(guī)模平行語料的第三方語言,間接地滿足源語-目標(biāo)語的平行數(shù)據(jù)的要求。兩個典型的基于中介語的統(tǒng)計機器翻譯方法分別為Transfer方法[1]和Triangulation[2-3]方法。Transfer方法是句子級的中介語方法,核心思想是先將源語句子翻譯為中介語句子,再將中介語句子翻譯為目標(biāo)語句子。其缺點是翻譯過程需要解碼兩次,不但更耗時,而且存在翻譯錯誤蔓延的問題。而Triangulation方法是短語級的中介語方法,核心思想是分別訓(xùn)練源語-中介語短語翻譯表Ts-p、中介語—目標(biāo)語的短語翻譯表Tp-t,再利用相同的中介語短語進行短語表融合,構(gòu)建出源語-目標(biāo)語的短語表Ts-t。Triangulation方法能夠利用推導(dǎo)出的源語-目標(biāo)語短語表直接進行翻譯,避免了Transfer方法的兩次解碼的不足,并且其處理對象是短語,相比于句子有更大的靈活性,成為了目前中介語統(tǒng)計機器翻譯的研究熱點。然而,在Triangulation方法中,只考慮了在Ts-p和Tp-t中共現(xiàn)的中介語短語,忽略了非共現(xiàn)的中介語短語(本文稱這種類型的中介語短語為中介語斷點)。這將導(dǎo)致產(chǎn)生大量的互譯性不高的噪聲翻譯規(guī)則,干擾解碼器的譯文選擇過程,并且還存在源語短語丟失的問題。
針對上述問題,本文提出一種基于Transfer和Triangulation融合的中介語方法,其核心思想是利用短語級而不是句子級的Transfer方法,將原本被忽略的中介語斷點翻譯成目標(biāo)語,形成中介語-目標(biāo)語的翻譯規(guī)則,從而將中介語斷點轉(zhuǎn)化成非斷點。本文提出的方法能夠利用傳統(tǒng)Triangulation方法中忽略的中介語斷點信息改善推導(dǎo)出的短語表,從而提高整體翻譯性能。在以英文作為中介語的德-漢翻譯任務(wù)中,本文的方法相比于傳統(tǒng)的Transfer方法和Triangulation方法,BLEU-4分別提高4.74和0.84。
2.1 Transfer方法 Transfer方法是一種句子級的中介語方法。首先分別利用源語—中介語、中介語—目標(biāo)語雙語平行數(shù)據(jù)訓(xùn)練出源語—中介語翻譯系統(tǒng)Ss-p以及中介語—目標(biāo)語的翻譯系統(tǒng)Sp-t。給定源語句子s,當(dāng)進行源語—目標(biāo)語的翻譯任務(wù)時,利用Ss-p先將s翻譯成m(m≥1)個中介語結(jié)果,記作p1,p2,…,pm,再通過Sp-t將每一個中介語結(jié)果pi(1≤i≤m)翻譯為n(n≥1)個目標(biāo)語譯文,記作ti1,ti2,…,tin,共產(chǎn)生m×n個翻譯結(jié)果,最后從中選擇1best作為最終的翻譯結(jié)果。由于Transfer方法中需要解碼兩次(s→p和p→t),所以整體的解碼時間更長,更關(guān)鍵的是,連續(xù)的解碼將造成翻譯錯誤的蔓延。
2.2 Triangulation方法
Triangulation方法是短語級的中介語方法。首先分別訓(xùn)練源語—中介語短語翻譯表Ts-p、中介語—目標(biāo)語的短語翻譯表Tp-t,再利用相同的中介語短語進行短語表融合,構(gòu)建出源語—目標(biāo)語的短語表Ts-t,該過程如圖1所示。在德—英短語表中,存在翻譯規(guī)則“drastisch zurückgegangen→fallen dramatically”,同時在英-漢短語表中,存在翻譯規(guī)則“fallen dramatically→急劇下降”,通過共現(xiàn)的英文短語“fallen dramatically”,能夠推導(dǎo)出德—漢翻譯規(guī)則“drastisch zurückgegangen→急劇下降”。同理,還可以推導(dǎo)出“drastisch zurückgegangen→戲劇性地衰退”、“drastisch zurückgegangen→已經(jīng)大幅下滑”。
圖1 使用Triangulation方法進行源語—目標(biāo)語翻譯規(guī)則推導(dǎo)
Triangulation方法中最關(guān)鍵的問題是: 如何給推導(dǎo)出的短語翻譯規(guī)則進行特征打分,主要包括雙向的短語翻譯概率、雙向的詞匯化權(quán)重。給定源語短語s,目標(biāo)語短語t,則在Triangulation方法中[2],使用式(1)對基于中介語的短語翻譯概率?進行建模。
(1)
使用式(2)對基于中介語的源語—目標(biāo)語的詞對齊推導(dǎo)。
(2)
其中,As-p、Ap-t、As-t分別表示源語-中介語、中介語—目標(biāo)語、源語—目標(biāo)語之間的詞對齊信息。使用式(3)計算詞匯化權(quán)重[4]。
(3)
其中,
(4)
在基于中介語的統(tǒng)計機器翻譯中,可以使用式(5)[2]對源語詞匯和目標(biāo)語詞匯共現(xiàn)次數(shù)進行建模。
(5)
其中,K表示被推導(dǎo)出的規(guī)則總數(shù);當(dāng)x=y時,δ(x,y)=1,否則δ(x,y)=0。
使用上述的公式對推導(dǎo)出的短語規(guī)則進行特征打分后,便得到了完整的源語-目標(biāo)語的短語翻譯表。然后按照標(biāo)準(zhǔn)的基于短語的統(tǒng)計機器翻譯方法,直接進行源語到目標(biāo)語的翻譯。
雖然Triangulation方法能夠直接把源語翻譯為目標(biāo)語,避免了Transfer方法中多次解碼造成的翻譯錯誤蔓延問題。但是,該方法也面臨其他的問題:
(1) 產(chǎn)生互異性不高的噪聲翻譯規(guī)則。如圖2(a)所示,源語短語s翻譯為中介語p1的概率為0.9,表示為?(p1|s)=0.9,同時?(p2|s)=0.1。在應(yīng)用Triangulation方法時,由于高翻譯概率的p1無法翻譯為任何目標(biāo)語短語,則s只能通過低翻譯概率的p2推導(dǎo),從而形成互譯性不高的翻譯規(guī)則s→t2,而這些噪聲翻譯規(guī)則將干擾解碼器的譯文選擇過程。
(2) 源語短語丟失。如圖2(b)所示,源語短語s對應(yīng)的全部中介語短語p1和p2都無法翻譯成任何目標(biāo)語短語,導(dǎo)致s無法推導(dǎo)出目標(biāo)語翻譯規(guī)則,所以在應(yīng)用Triangulation方法時,s將在被構(gòu)建的源語-目標(biāo)語短語表中丟失。
圖2 傳統(tǒng)Triangulation方法存在的問題(直線上的數(shù)值表示短語翻譯概率)
本文定義圖2(a)中的p1,以及圖2(b)中的p1和p2為中介語斷點,稱這種現(xiàn)象為中介語斷路。以上兩個問題產(chǎn)生的主要原因都是由于中介語斷路,所以本文的出發(fā)點就是通過解碼中介語斷點的方式將其轉(zhuǎn)化成非斷點,利用更多的中介語信息改善短語翻譯表質(zhì)量。
3.1 中介語斷點 對于任意源語短語s,本文定義滿足下列條件的中介語短語為中介語斷點條件:
在本文實驗數(shù)據(jù)中,我們發(fā)現(xiàn)約75%的中介語短語是斷點。這說明大量的中介語短語無法在Triangulation方法中用來推導(dǎo)源語-目標(biāo)語短語規(guī)則,造成可用規(guī)則的丟失,同時影響已推導(dǎo)出的翻譯規(guī)則的概率估計。而出現(xiàn)中介語斷路的原因是由于源語到中介語的雙語訓(xùn)練語料和中介語到目標(biāo)語的雙語訓(xùn)練語料中,不可避免地存在如領(lǐng)域、語言習(xí)慣、表達方式等各種差異,最終反映到訓(xùn)練得到的短語翻譯表中。所以,可以說中介語斷路現(xiàn)象難以避免,而且會隨著語料的相關(guān)性差異增大而越來越嚴重,而中介語斷路現(xiàn)象本身也將影響Triangulation方法的性能。
圖3 利用解碼中介語短語緩解上述問題示意圖
3.2 解碼中介語斷點
(1) 如何計算p→t′的短語翻譯概率和詞對齊?
(2) 應(yīng)該解碼哪些中介語斷點?
本小節(jié)主要解決的是問題(1)。給定D是將中介語斷點p翻譯為目標(biāo)語t′的完整推導(dǎo)過程,則使用式(6)計算短語規(guī)則p→t′的短語翻譯概率φ(t′|p)。
(6)
p→t′的詞對齊推導(dǎo)算法描述如圖4所示。算法核心思想是根據(jù)翻譯推導(dǎo)的過程,依次將與推導(dǎo)對應(yīng)的span[i,j](j>i≥0)、span[j+1,k](k>j+1)拼接,根據(jù)目標(biāo)語拼接方向(正向或反向),更新span[i,k]的詞對齊信息。圖4中的Step2就是更新兩個span詞對齊的過程,Step3是進行span拼接,得到更新詞對齊后的更大的span,并利用翻譯推導(dǎo)信息繼續(xù)更新詞對齊。圖5展示了使用本算法更新兩個span詞對齊結(jié)果的示例。
圖4 解碼結(jié)果的詞對齊推導(dǎo)算法
圖5 解碼結(jié)果的詞對齊推導(dǎo)算法示例
3.3 質(zhì)量控制因子
本小節(jié)描述的是如何解決判斷哪些中介語斷點應(yīng)該被解碼的問題。直覺上,并不是所有中介語斷點都對完善短語表有幫助。我們期望捕獲的是在不可靠的短語推導(dǎo)過程中,沒有被利用的高質(zhì)量中介語斷點。
本文引入質(zhì)量控制因子ψ的概念,利用推導(dǎo)產(chǎn)生的包含最大正向短語翻譯概率的翻譯規(guī)則所使用的中介語信息,衡量在給定源語短語s的推導(dǎo)過程的質(zhì)量,其定義如下:
(7)
利用質(zhì)量控制因子計算出的推導(dǎo)過程可靠性,本文將所有推導(dǎo)分為如下三類:
(8)
所以,本文解碼中介語斷點的定位是: 通過解碼Discard型推導(dǎo)中的中介語斷點緩解源語短語OOV問題,通過解碼Low型推導(dǎo)中低于λ的高質(zhì)量中介語斷點產(chǎn)生更多優(yōu)質(zhì)的翻譯規(guī)則。
4.1 實驗設(shè)置 德-英、英-漢系統(tǒng)使用的數(shù)據(jù)如表1所示。
表1 雙語訓(xùn)練數(shù)據(jù)/開發(fā)集/測試集 數(shù)據(jù)說明
我們采用基于短語模型的NiuTrans開源工具[5]完成以英語為中介語的德-漢翻譯任務(wù)。使用GIZA++[6]工具獲得雙向詞對齊結(jié)果,再使用“grow-diag-final-and”方法[4]進行詞對齊對稱化。抽取德-英短語對的長度設(shè)置為3-3,英-漢短語對的長度設(shè)置為3-5,則最終被推導(dǎo)出的德-漢短語長度為3-5。對所有抽取的短語翻譯表進行取Top-N處理,這里設(shè)置N=30,即每一個源語短語對應(yīng)的翻譯候選最多為30個。分別使用66 522 497句和42 946 518句單語句子訓(xùn)練5元英文和中文的語言模型,均使用修正的Kneser-Ney平滑方法[7]。需要注意的是,在解碼中介語斷點時,使用的仍是上述語言模型,并沒有因為解碼結(jié)果是短語而做針對性優(yōu)化。所有的特征采用最小錯誤率訓(xùn)練MERT[8]進行參數(shù)調(diào)優(yōu)。使用基于詞的BLEU-4[9]評價最終的翻譯性能。
4.2 實驗結(jié)果及分析
實驗一 中介語斷點比例
應(yīng)用本文的實驗數(shù)據(jù)及設(shè)置,得到德-英、英-漢短語翻譯表信息如表2第一行及第二行所示。然后使用Triangulation方法得到被推導(dǎo)出的德-漢短語翻譯表,其信息如表2第三行所示??梢钥吹?,德—英短語表中包含1 915萬唯一的英文短語;英-漢短語表中包含3 969萬唯一的英文短語,但只有495萬條英文短語在Triangulation方法中被使用。
表2 系統(tǒng)訓(xùn)練得到的短語翻譯表及Triangulation方法推導(dǎo)出的短語翻譯表(M表示百萬)
這里,我們以德—英的英文短語條數(shù)為參考,則斷路的英文短語數(shù)為1 915-495=1 420萬條,比例達(1 420萬/1 915萬)×100%=74.15%。也就是說,在德-英短語表中,有74.15%的英文短語存在斷路情況,這是一個在基于Triangulation的中介語統(tǒng)計機器翻譯中普遍存在的問題。而本文的出發(fā)點正是想緩解中介語短語斷路的問題。
實驗二 質(zhì)量控制因子閾值λ對翻譯結(jié)果的影響
由于不同的質(zhì)量控制因子閾值的設(shè)置,對判斷需要解碼的中介語短語數(shù)目有關(guān),從而對改善短語翻譯表產(chǎn)生影響,這里我們做了下列實驗: 在開發(fā)集上,通過改變閾值λ的取值,觀察其對翻譯結(jié)果的影響。實驗結(jié)果如圖6所示。
圖6 質(zhì)量控制因子閾值λ在開發(fā)集上對翻譯結(jié)果的影響
之所以呈現(xiàn)先增后減的趨勢,本文分析結(jié)果是: 如果質(zhì)量控制因子閾值設(shè)置得過小,只有較少的高質(zhì)量斷路中介語短語被重新解碼利用起來,對整體的翻譯性能幫助并不明顯。但如果設(shè)置質(zhì)量控制因子的閾值過大,將會引入一些低質(zhì)量的中介語短語,從而對翻譯性能造成損害。這里我們看到λ=0.4時翻譯性能達到最高,所以后續(xù)的實驗?zāi)J設(shè)置λ=0.4。
實驗三 不同推導(dǎo)類型對翻譯性能的影響
我們對比了傳統(tǒng)的Transfer方法、Triangulation方法和本文提出的Transfer-Triangulation方法中處理不同推導(dǎo)類型的翻譯性能結(jié)果,如表3所示。
表3 Baseline及處理不同推導(dǎo)類型在測試集上的翻譯性能(*表示顯著高于Baseline)
由第一行和第二行可以看到,Triangulation方法比Transfer方法翻譯性能更好,BLEU值上升了3.9個點。對于+Discard方法,在2 000句的測試集上僅僅減少了八個未登錄詞,并沒有如設(shè)想地緩解了未登錄詞問題。分析其中原因發(fā)現(xiàn),對于大多數(shù)的包含源語未登錄詞的源語-中介語短語,相應(yīng)的中介語短語也包含未登錄詞,從而導(dǎo)致解碼的結(jié)果中也包含未登錄詞,造成解碼失敗。對于+Low方法,由于傳統(tǒng)的Triangulation方法丟失了一些高質(zhì)量的中介語短語,而本文方法能夠有效利用這部分高質(zhì)量的中介語短語進行短語翻譯表改善,最終實驗結(jié)果也證實了該想法的有效性。對于+Discard&Low方法同只+Low的方法在BLEU上沒有太多差異,且對OOV現(xiàn)象緩解的作用很小。
基于中介語的統(tǒng)計機器翻譯的典型方法有兩種: Transfer方法和Triangulation方法。
對于Transfer方法,由2.1節(jié)分析可知,給定一個源語句子,最終會產(chǎn)生m×n個目標(biāo)語的翻譯結(jié)果。González-Rubio 和Duh等人[10-11]提出使用基于最小貝葉斯風(fēng)險的系統(tǒng)融合方法去選擇最優(yōu)的翻譯結(jié)果。
對于Triangulation方法,Kholy等人[12]提出從詞對齊信息中抽取兩個與語言獨立的特征,該特征指示了被推導(dǎo)出的源語-目標(biāo)語翻譯規(guī)則的可靠性。Tofigh等人[13]提出利用基于中介語的上下文向量,從而計算被推導(dǎo)出的源語-目標(biāo)語翻譯規(guī)則間的短語相似度,并依據(jù)該相似度進行短語表過濾,從而起到過濾噪聲規(guī)則的目的。朱曉寧等人[14]提出使用隨機漫步方法獲取潛在的源語-目標(biāo)語短語路徑,從而緩解源語未登錄詞問題。而后,朱曉寧等人[15]又提出在融合短語表前直接對源語-目標(biāo)語的短語對共現(xiàn)次數(shù)進行估計的方法,避免了在短語推導(dǎo)時由于中介語斷點導(dǎo)致破壞短語翻譯概率空間的問題。Miura等人[16]提出在進行短語規(guī)則推導(dǎo)時記錄所使用的中介語信息,在進行源語-目標(biāo)語的翻譯過程中額外考慮中介語的語言模型特征。
另外,Michael等人[17]探索了不同中介語的選擇對系統(tǒng)的影響,英文更適合作為印歐語系及部分亞洲語言(如泰語、越語)之間的中介語。
不同于上述方法,本文提出的Transfer-Triangulation方法是將Transfer方法應(yīng)用于短語級,利用解碼中介語短語的方法改善被推導(dǎo)出的短語表。
本文提出Transfer和Triangulation融合的中介語統(tǒng)計機器翻譯方法,通過應(yīng)用短語級的Transfer方法,將高質(zhì)量的中介語斷點解碼成相應(yīng)的目標(biāo)語短語,從而將中介語斷點轉(zhuǎn)換為非斷點,使得Triangulation方法能夠利用更多中介語信息,達到改善短語表、提高翻譯性能的目的。其中,本文解決了計算解碼結(jié)果短語翻譯概率和詞對齊問題,并提出了質(zhì)量控制因子的概念,將使用Triangulation方法推導(dǎo)過程分為三類: 丟棄型、低可信、高可信,利用質(zhì)量控制因子閾值挑選Triangulation方法中無法使用的高質(zhì)量中介語短語信息。實驗結(jié)果表明,中介語短語斷路現(xiàn)象是在應(yīng)用Triangulation方法時普遍存在的問題,本實驗中斷路的中介語短語比例達74.15%;隨著質(zhì)量控制因子閾值λ增大,翻譯性能呈先上升后下降的趨勢,原因在于: 如果λ過小,只有較少的高質(zhì)量斷路中介語短語被解碼,而如果λ過大,將會引入低質(zhì)量的斷路中介語短語,損害翻譯性能;對低可信推導(dǎo)中的高質(zhì)量中介語斷點重新解碼產(chǎn)生的推導(dǎo)規(guī)則,能夠有效改善傳統(tǒng)Triangulation方法推導(dǎo)出的短語表,減少了噪聲翻譯規(guī)則,并且擴大了短語表的覆蓋度,BLEU值提高了0.86個點。但是對丟棄型推導(dǎo)的重解碼處理并沒有如預(yù)期有效緩解OOV問題,其原因在于源語如果包含OOV,其相應(yīng)的中介語短語也往往包含OOV,從而造成解碼失敗。未來我們將探索如何將中介語的解碼結(jié)果作為翻譯特征,幫助解碼器選擇正確的翻譯選項。
[1] Masao Utiyama, Hitoshi Isahara. A comparison of pivot methods for phrase-based statistical machine translation[C]//Proceedings of Human Language Technology: the Conference of the North American Chapter of the Association for Computational Linguistics, 2007: 484-491.
[2] Hua Wu, Haifeng Wang. Pivot language approach for phrase-based statistical machine translation[C]//Proceedings of 45th Annual Meeting of the Association for Computational Linguistics, 2007: 856-863.
[3] Trevor Cohn, MirellaLapata. Machine translation by triangulation: make effective use of multi-parallel corpora[C]//Proceedings of 45th Annual Meeting of the Association for Computational Linguistics, 2007: 828-735.
[4] Philipp Koehn, Franz Och, Daniel Marcu. Statistical phrase-based translation[C]//Proceedings of the 2003 Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics(HLT: NAACL), 2003: 48-54, Edmonton, Canada, June.
[5] Tong Xiao, Jingbo Zhu, Hao Zhang, et al. NiuTrans: An open source toolkit for phrase-based and Syntax-based machine translation[C]//Proceedings of ACL: System Demonstrations, 2012: 19-24, Jeju Island, Korea, July.
[6] Franz Josef Och, Hermann Ney. A comparison of alignment models for statistical machine translation[C]//Proceedings of the 18th International Conference on Computational Linguistics, 2000: 1086-1090.
[7] Stanley F. Chen, Joshua Goodman. An empirical study of smoothing techniques for language modeling[J]. Computer Speech & Language, 1999(13): 359-393.
[8] Franz Och. Minimum error rate training in statistical machine translation[C]//Proceedings of ACL, 2003: 160-167, Sapporo, Japan, July.
[9] Kishore Papineni, Salim Roukos, Todd Ward, et al. BLEU: a method for automatic evaluation of machine translation[C]//Proceedings of the 40th Annual Meeting of the Association for Computation Linguistics, 2002: 311-319.
[10] Jesús González-Rubio, Alfons Juan, Francisc Casacuberta. Minimum bayes-risk system[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, 2011: 1268-1277.
[11] Kevin Duh, Katsuhito Sudoh, Xianchao Wu, et al. Generalized minimum bayes risk system combination[C]//Proceedings of the 5th International Joint Conference on Natural Language Processing, 2011: 1356-1360.
[12] Kholy A E, Habash N, Leusch G, et al. Language independent connectivity strength features for phrase pivot statistical machine translation[J]. Proc of Acl, 2013.
[13] Samira Tofighi Zahabi, Somayeh Bakhshaei, Shahram Khadivi. Using context vectors in improving a machine translation system with bridge language[C]//Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, 2013: 318-322.
[14] Xiaoning Zhu, Zhongjun He, Hua Wu, H et al.2013. Improving pivot-based statistical machine translation using random walk[C]//Proceedings of the 2013 Conference on Empirical Methods in Natural Language Processing, 2013: 524-534.
[15] Xiaoning Zhu, Zhongjun He, Hua Wu, et al.2014. Improving pivot-based statistical machine translation by pivoting the co-occurrence count of phrase pairs[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing(EMNLP), 2014: 1665-1675.
[16] Akiva Miura, Graham Neubig, Sakriani Sakti, et al.2015. Improving pivot translation by remembering the pivot[C]//Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing, 2015: 573-577.
[17] Michael Paul, Hirofumi Yamamoto, Eiichiro Sumita? et al. On the importance of pivot language selection for statistical machine translation[C]//Proceedings of NAACL HLT 2009: Short Papers, 2009: 221-224.
王強(1990—),博士研究生,主要研究領(lǐng)域為機器翻譯。
E-mail: wangqiang@gmail.com
杜權(quán)(1989—),博士研究生,主要研究領(lǐng)域為機器翻譯。
E-mail: duquanneu@126.com
肖桐(1982—),博士,副教授,主要研究領(lǐng)域為機器翻譯。
E-mail: xiaotong@mail.neu.edu.cn
Transfer-Triangulation Method for Pivot-Based Statistical Machine Translation
WANG Qiang, DU Quan, XIAO Tong, ZHU Jingbo
(NLP Lab,Northeastern University, Shenyang, Liaoning 110819, China)
1003-0077(2017)04-0036-08
TP391
A