王珂
摘要:隨著互聯(lián)網(wǎng)的發(fā)展,機(jī)器翻譯成為翻譯活動中的重要的輔助工具。而機(jī)器翻譯錯譯、死譯頻出,給翻譯工作帶來諸多不便。近年來,“大數(shù)據(jù)”的出現(xiàn)為機(jī)器翻譯帶來了新希望,其獨(dú)特的“4V”特點(diǎn)將對機(jī)器翻譯產(chǎn)生革命性的影響。本文希望通過探究大數(shù)據(jù)在機(jī)器翻譯中的應(yīng)用,推動機(jī)器翻譯的發(fā)展。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)庫;機(jī)器翻譯
一、大數(shù)據(jù)的概念及優(yōu)勢
大數(shù)據(jù),即大量的數(shù)據(jù),在一定程度上可以理解為多個大語料庫的結(jié)合體。維克托·邁爾提出大數(shù)據(jù)有容量大、種類多、速度快和價值高四大特征。容量大、種類多保證了它為譯者提供一個包含各種資源的巨型共享資料庫;速度快、價值高可提高翻譯的效率和精確度。譯者要意識到大數(shù)據(jù)共享資源的重要性,充分利用其來查找翻譯所需的相關(guān)資源。
二、輔助翻譯工具
大數(shù)據(jù)時代,利用信息技術(shù)進(jìn)行輔助翻譯是翻譯工作者一項(xiàng)必備技能。經(jīng)濟(jì)全球化快速發(fā)展帶來各國交流頻繁,各種翻譯應(yīng)接不暇,利用信息技術(shù)進(jìn)行輔助翻譯是大勢所趨。下面主要圍繞兩種輔助翻譯工具展開:塔多思與谷歌。
Trados是一種翻譯記憶軟件。它將譯員做過的工作用Trados提供的工具存儲起來,放到兩個主要的數(shù)據(jù)庫中:句料庫和術(shù)語庫。Trados 基于數(shù)據(jù)庫原理,利用翻譯記憶,將已譯資源以句子為單位存入數(shù)據(jù)庫,翻譯時系統(tǒng)自動對源語言文本進(jìn)行分析,與數(shù)據(jù)庫中的翻譯記憶進(jìn)行匹配,100%匹配的句子可自動替換;部分匹配的句子根據(jù)匹配度提出翻譯建議;全新的句子可通過系統(tǒng)提供的建議進(jìn)行人工翻譯;而每一次翻譯又作為新翻譯記憶積累入數(shù)據(jù)庫。這樣將機(jī)器與人工相結(jié)合就幫助譯者提高了翻譯效率和準(zhǔn)確性。Trados能夠自動替換日期、時間和度量單位等,如句料庫中有2008年5月,譯文中出現(xiàn)May,2017時就會自動替換為2017年5月。
谷歌翻譯使用的是基于統(tǒng)計(jì)的翻譯方法,所有語言知識都是從語料庫中自動獲取,通過概率模型對語料庫中的句子進(jìn)行概率計(jì)算后生成。來自互聯(lián)網(wǎng)的幾乎所有語言文本,構(gòu)成了谷歌的龐大的語料庫。谷歌翻譯還利用網(wǎng)絡(luò)資源不斷補(bǔ)充和更新。所以在谷歌翻譯中輸入源語言文本后,系統(tǒng)會根據(jù)概率模型對語料庫中的句子進(jìn)行概率計(jì)算搜索出最優(yōu)化和使用頻次最高的譯文,如輸入“No pains,no gains.”,便會生成譯文“不勞則無獲。”
三、大數(shù)據(jù)背景下機(jī)器翻譯的發(fā)展
(一)優(yōu)勢
大數(shù)據(jù)時代,基于平行語料庫,翻譯多樣性和準(zhǔn)確性成為可能。語料庫幫助提供真實(shí)語料、提供統(tǒng)計(jì)數(shù)據(jù)、驗(yàn)證現(xiàn)行的理論、構(gòu)建新的理論。例如,紅樓夢中前 80回出現(xiàn)了1219個“某某笑道”,該如何翻譯呢?全譯為 smiled and said,不僅重復(fù),而且抹去了經(jīng)典名作的文學(xué)特色。這時譯者可以借助大數(shù)據(jù)的優(yōu)勢,查詢smile的平行詞找到chuckle,giggle,grin等或通過網(wǎng)絡(luò)向英語母語朋友和高人請教,再根據(jù)人物特點(diǎn)和上下文選擇適當(dāng)譯文。使用翻譯記憶軟件可以讓眾多譯員共享網(wǎng)絡(luò)術(shù)語庫,避免重復(fù)工作,降低翻譯成本,節(jié)省時間和精力,保持上下文術(shù)語前后一致,從整體上提高了翻譯效率和質(zhì)量。而且谷歌本身作為搜索引擎,為其語料庫內(nèi)容的充實(shí)和更新提供了便利條件。
(二)局限
大數(shù)據(jù)時代下的機(jī)器翻譯給人們帶來了諸多便利,但也有其局限性。一,譯文好壞受到平行語料庫數(shù)據(jù)大小和領(lǐng)域的制約。由于語言規(guī)則復(fù)雜,樣本信息必須足夠大才能有好的效果。二,運(yùn)用Trados進(jìn)行翻譯時極大地依賴于翻譯記憶,若翻譯記憶資源中有誤,翻譯記憶的質(zhì)量和數(shù)量都會影響譯文準(zhǔn)確度。三,基于大數(shù)據(jù)的翻譯方法并不涉及規(guī)則,尤其是語法規(guī)則,機(jī)器翻譯不能識別語法信息,降低了譯文的可理解度。如輸入A horse stumbles that has four legs時,谷歌翻譯給出的譯文是“馬絆倒有四條腿”。四,基于大數(shù)據(jù)的翻譯抑制了譯者的創(chuàng)新思維,譯者只會搜索而不是自己思考,或許會有更好的譯文也說不定。五,在翻譯帶有情感的源語言時,機(jī)器并不能像人那樣發(fā)揮譯者的主體性,給出合適的最符合語境的翻譯,體現(xiàn)不出原文人物內(nèi)心的感情色彩,在描寫人物的心理變化方面明顯不足。六,機(jī)器翻譯無法處理多義詞。輸入的源語言文本內(nèi)容并不一定能夠百分之百地在語料庫中匹配到對應(yīng)的內(nèi)容。七,機(jī)器不能考慮源語言的文化背景上下文等,不能選擇最恰當(dāng)?shù)淖g法。
三、結(jié)語
盡管已取得巨大進(jìn)步,機(jī)器翻譯也有不足之處??傊诖髷?shù)據(jù)時代下,計(jì)算機(jī)翻譯工具只是一種輔助工具,最根本的還是要發(fā)揮譯員的主體性作用,在不斷改善翻譯記憶庫中所儲譯文質(zhì)量和數(shù)量情況下,機(jī)譯結(jié)合人譯,才能更好地做好翻譯工作。
參考文獻(xiàn):
[1]劉沖亞.淺談計(jì)算機(jī)輔助翻譯TRADOS的優(yōu)勢[J].科技視界,2015(2):216-217.
[2]維克托·邁爾-舍恩伯格,肯尼思·庫克耶,邁爾-舍恩伯格,等.與大數(shù)據(jù)同行:學(xué)習(xí)和教育的未來[M].華東師范大學(xué)出版社,2015.
[3]曾光湖.論大數(shù)據(jù)時代對大學(xué)生翻譯能力的培養(yǎng)[J].老區(qū)建設(shè),2015(22):54-55.