鄧良艷
摘 ? ?要: 近年來,隨著人工智能技術(shù)的進(jìn)步,作為人工智能一部分的機(jī)器翻譯取得了突飛猛進(jìn)的發(fā)展,特別是基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,與以往機(jī)器翻譯相比,具有更快速、效率更高、更準(zhǔn)確等優(yōu)點(diǎn)。本文通過對(duì)當(dāng)前常用的幾款機(jī)器翻譯軟件對(duì)文學(xué)作品譯文質(zhì)量進(jìn)行分析和對(duì)比,了解機(jī)器翻譯的發(fā)展現(xiàn)狀與水平,探討機(jī)器翻譯在文學(xué)類作品方面存在的不足,展望人工智能背景下機(jī)器翻譯的發(fā)展趨勢(shì)和方向。
關(guān)鍵詞: 人工智能 ? ?機(jī)器翻譯 ? ?對(duì)比研究 ? ?《雙城記》
隨著《新一代人工智能發(fā)展規(guī)劃》的出臺(tái),人工智能的不同領(lǐng)域取得了爆發(fā)式發(fā)展,作為其子領(lǐng)域的機(jī)器翻譯得到了飛速的進(jìn)步,從基于規(guī)則的機(jī)器翻譯發(fā)展到現(xiàn)在的基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,功能越來越強(qiáng)大,譯文質(zhì)量越來越高。面對(duì)機(jī)器翻譯的迅猛發(fā)展,人們不禁會(huì)問,機(jī)器翻譯是否會(huì)完全取代人工翻譯?本文以經(jīng)典文學(xué)作品《雙城記》為例,從中選取一些經(jīng)典的例子進(jìn)行機(jī)譯和人譯的對(duì)比,分析現(xiàn)有發(fā)展水平下機(jī)器翻譯存在的不足之處,同時(shí)展望在人工智能背景下機(jī)譯發(fā)展的前景和方向。
1.人工智能
1.1人工智能(Artificial Intelligence,簡(jiǎn)稱AI)的概念
人工智能(AI),也叫機(jī)器智能,屬于計(jì)算機(jī)科學(xué)的一個(gè)分支,它是用于描述模仿與人類思維相關(guān)的認(rèn)知功能的機(jī)器,本質(zhì)是利用計(jì)算機(jī)做只有人能做的工作,與人的自然智能形成鮮明的對(duì)比。
1.2人工智能的發(fā)展歷程
“人工智能”一詞最早由資深計(jì)算機(jī)科學(xué)家John McCarthy在1956年夏天在達(dá)特茅斯學(xué)院舉辦的研討會(huì)上提出,這次會(huì)議被認(rèn)為是人工智能成立的標(biāo)志。作為一門學(xué)科,人工智能的發(fā)展歷程主要經(jīng)歷三個(gè)階段:人工智能的黃金歲月、人工智能的寒冬和人工智能的快速發(fā)展。
1.2.1人工智能的黃金歲月
1956年—1974年是人工智能學(xué)科發(fā)展的黃金歲月,對(duì)于大多數(shù)人來說,在這段時(shí)間內(nèi)開發(fā)的程序無疑是令人驚訝的:計(jì)算機(jī)正在解決代數(shù)詞問題、證明幾何定理和學(xué)習(xí)說英語。當(dāng)時(shí)很少有人相信機(jī)器的這種“智能”行為是可能的。研究人員表現(xiàn)出強(qiáng)烈的樂觀態(tài)度,預(yù)測(cè)將在不到二十年的時(shí)間內(nèi)建成一臺(tái)全智能機(jī)器。
1.2.2人工智能的寒冬
在二十世紀(jì)七十年代后期,人工智能受到了批評(píng)和金融挫折。由于當(dāng)時(shí)計(jì)算機(jī)的存儲(chǔ)空間有限及計(jì)算能力的不足,人工智能程序只能解決一些十分簡(jiǎn)單的問題。同時(shí),由于研究人員的盲目樂觀情緒,一些人工智能項(xiàng)目并未達(dá)到人們的預(yù)期,以失敗告終。于是,美國國防部高級(jí)研究計(jì)劃局終止對(duì)人工智能項(xiàng)目的資金支持,人工智能進(jìn)入第一次寒冬。到了八十年代,世界各地的企業(yè)采用一種稱為“專家系統(tǒng)”的人工智能程序,給人工智能研究帶來新一輪發(fā)展。然而,人們很快發(fā)現(xiàn)“專家系統(tǒng)”維護(hù)成本太高且更新困難,同時(shí),政府撥給人工智能的研究經(jīng)費(fèi)越來越少。于是,人工智能又陷入第二次寒冬。
1.2.3人工智能的快速發(fā)展
自二十世紀(jì)九十年代中后期以來,由于計(jì)算機(jī)能力的提高,人工智能開始再次復(fù)蘇。谷歌公司研發(fā)的人工智能圍棋軟件Alpha Go戰(zhàn)勝了世界圍棋冠軍李世石,引起了全球?qū)τ谌斯ぶ悄艿年P(guān)注。此外,大數(shù)據(jù)的發(fā)展,深度學(xué)習(xí)的算法推動(dòng)了人工智能在圖像識(shí)別和語音識(shí)別方面的發(fā)展,人工智能進(jìn)入快速發(fā)展階段。
2.機(jī)器翻譯
2.1機(jī)器翻譯(Machine Translation,簡(jiǎn)稱MT)的概念
機(jī)器翻譯,俗稱機(jī)翻,是計(jì)算機(jī)語言學(xué)的一個(gè)子領(lǐng)域,本質(zhì)是利用計(jì)算機(jī)程序?qū)⑽淖謴囊环N自然語言(源語言, target language)翻譯成另一種自然語言(目標(biāo)語言, source language)。機(jī)器翻譯試圖用計(jì)算機(jī)模擬人的翻譯能力,是人工智能的重要研究領(lǐng)域。
2.2機(jī)器翻譯的發(fā)展類型
機(jī)器翻譯這一想法最早由法國科學(xué)家阿爾楚尼(G.B.Artsouni)在二十世紀(jì)三十年代初明確提出。經(jīng)過幾十年的長(zhǎng)足發(fā)展,大致經(jīng)歷以下三個(gè)發(fā)展類型:基于規(guī)則的機(jī)器翻譯、基于語料庫的機(jī)器翻譯和基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯。
2.2.1基于規(guī)則的機(jī)器翻譯
規(guī)則法(Rule-based method)機(jī)器翻譯主要有三種類型:辭典法(Dictionary-based)、轉(zhuǎn)化法(Transfer-based)及中間語法(Interlingua-based)機(jī)器翻譯。辭典法翻譯即直接翻譯,將源語言與目標(biāo)語言之間的詞匯進(jìn)行一一對(duì)應(yīng)翻譯;轉(zhuǎn)化翻譯對(duì)源語言的分析獨(dú)立于目標(biāo)語言,在對(duì)目標(biāo)語言的轉(zhuǎn)化過程中,會(huì)考慮與源語言的上下文、結(jié)構(gòu)的差別;中間語言翻譯即假定存在有中間語言(interlingua),先把源語言翻譯成中間語言,再把中間語言按照目標(biāo)語言的規(guī)范翻譯出來。
2.2.2基于語料庫的機(jī)器翻譯
基于語料庫(Corpus-based)的機(jī)器翻譯可以分為基于范例的方法(Example-based)和基于統(tǒng)計(jì)的方法(Statistics-based)。所謂范例法,即基于實(shí)例的翻譯方法?;舅悸肥请娔X模擬大量翻譯實(shí)例(翻譯語料庫),進(jìn)行有效替換的翻譯策略。統(tǒng)計(jì)機(jī)器翻譯的基本思想是通過對(duì)大量的平行語料庫進(jìn)行統(tǒng)計(jì)分析,構(gòu)建統(tǒng)計(jì)翻譯模型,使用此模型進(jìn)行翻譯。
2.2.3基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯
神經(jīng)機(jī)器翻譯(Neural Machine Translation,簡(jiǎn)稱NMT),它使用人工神經(jīng)網(wǎng)絡(luò)提高翻譯的流暢度和準(zhǔn)確性。自2013年以來,隨著深度學(xué)習(xí)的研究取得較大進(jìn)展,相比較前面兩種機(jī)器翻譯類型,基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯具有明顯的優(yōu)勢(shì)。它可以自動(dòng)從語料庫中學(xué)習(xí)翻譯知識(shí),實(shí)現(xiàn)“理解語言,生成譯文”的翻譯方式,使譯文更加符合語法規(guī)范、流暢,容易理解。
3.A Tale of Two Cities簡(jiǎn)介
A Tale of Two Cities(《雙城記》)是英國作家查爾斯·狄更斯創(chuàng)作的一部長(zhǎng)篇?dú)v史小說,首次出版于1859年。故事以法國大革命為背景,情節(jié)感人肺腑,是世界文學(xué)經(jīng)典名著之一。雙城指的是巴黎和倫敦,故事將這兩大城市連接起來,講述了巴黎醫(yī)生曼奈特的故事。他因打抱不平,受到埃夫雷蒙侯爵兄弟的迫害,在巴士底監(jiān)獄被關(guān)押了18年。出獄后,曼奈特之女露西卻與仇家的兒子達(dá)尼墜入情網(wǎng)。于是,在法國大革命的漩渦中,一幕幕家族的恩怨情仇隆重上演。善惡生死在沖突中交融,在轉(zhuǎn)瞬間變換。在斷頭臺(tái)上,卡爾登為了愛情,從容獻(xiàn)身。
A Tale of Two Cities結(jié)構(gòu)嚴(yán)謹(jǐn),語言凝練,狄更斯對(duì)革命與人性的深刻思考和令人嘆為觀止的寫作才華,在其中得到淋漓盡致的展現(xiàn)。本文選取文中極具代表性的經(jīng)典語句進(jìn)行翻譯對(duì)比分析,研究神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯軟件是否對(duì)經(jīng)典文學(xué)作品進(jìn)行準(zhǔn)確的翻譯,探討人工智能背景下神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯是否取代人工翻譯。
4.機(jī)器翻譯A Tale of Two Cities質(zhì)量對(duì)比研究與思考
4.1基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯軟件
目前市場(chǎng)上口碑較好的幾款人工智能機(jī)器翻譯軟件有谷歌翻譯、百度翻譯和有道翻譯。這幾款翻譯均采用基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng),實(shí)現(xiàn)多個(gè)語言的隨時(shí)互譯,因此本文將采用這三種機(jī)器翻譯系統(tǒng)樣本進(jìn)行分析和研究。
4.2三款機(jī)器翻譯軟件譯文與人工譯文對(duì)比
4.2.1源語言文本
句子1:
A day wasted on others is not wasted on ones self.
句子2:
Never frown, even when you are sad, because you never know who is falling in love with your smile.
句子3:
It is a far, far better thing that I do, than I have ever done; It is a far, far better rest that I go to than I have ever known.
句子4:
A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.
句子5:
It was the best of times, it was the worst of times. It was the age of wisdom, it was the age of foolishness. It was the epoch of belief, it was the epoch of incredulity. It was the season of light, it was the season of darkness. It was the spring of hope, it was the winter of despair.
4.2.2人工譯文
句子1:
在別人身上浪費(fèi)一日,并非在自己身上浪費(fèi)一天。
句子2:
縱然傷心,也不要愁眉不展,因?yàn)槟悴恢勒l會(huì)愛上你的笑容。
句子3:
我現(xiàn)在已做的遠(yuǎn)比我所做過的一切都美好;我將獲得的休息遠(yuǎn)比我所知道的一切都甜蜜。
句子4:
每個(gè)人對(duì)別的人都是個(gè)天生的奧秘和奇跡——此事細(xì)想起來確實(shí)有些玄妙。
句子5:
那是最美好的時(shí)代,那是最糟糕的時(shí)代;那是智慧的歲月,那是愚昧的歲月;那是信仰的年代,那是懷疑的年代;那是光明的季節(jié),那是黑暗的季節(jié);那是希望的春天,那是失望的冬天。
4.2.3谷歌翻譯譯文
句子1:
浪費(fèi)在別人身上的一天不會(huì)浪費(fèi)在自己身上。
句子2:
縱然傷心,也不要愁眉不展,因?yàn)槟阌肋h(yuǎn)不知道誰會(huì)愛上你的笑容。
句子3:
這比我做過的事情要好得多;這比我所知道的要好得多。
句子4:
一個(gè)很好的事實(shí)要反思,每個(gè)人類的生物都構(gòu)成了彼此深刻的秘密和神秘。
句子5:
這是最好的時(shí)代,它是最糟糕的時(shí)代,它是智慧的時(shí)代,它是愚蠢的時(shí)代,它是信仰的時(shí)代,它是不可思議的時(shí)代,它是光明的季節(jié),它是黑暗的季節(jié),它是希望的春天,是絕望的冬天。
4.2.4百度翻譯譯文
句子1:
浪費(fèi)在別人身上的一天不是浪費(fèi)在自己身上的。
句子2:
縱然傷心,也不要皺眉,因?yàn)槟悴恢朗钦l愛上了你的笑容。
句子3:
這是我做過的一件遠(yuǎn)比我做過的好得多的事情;這是我去的一個(gè)遠(yuǎn)比我所知道的好得多的休息。
句子4:
一個(gè)值得反思的奇妙事實(shí)是,每一個(gè)人類生物都被構(gòu)成了彼此之間那種深?yuàn)W的秘密和神秘。
句子5:
那是最好的時(shí)代,那是最壞的時(shí)代,那是智慧的時(shí)代,那是愚蠢的時(shí)代,那是信仰的時(shí)代,那是懷疑的時(shí)代,那是光明的季節(jié),那是黑暗的季節(jié),那是希望的春天,那是絕望的冬天。
4.2.5有道翻譯譯文
句子1:
浪費(fèi)在別人身上的一天并不等于浪費(fèi)在自己身上。
句子2:
縱然傷心,也不要愁眉不展,因?yàn)槟悴恢钦l會(huì)愛上你的笑容。
句子3:
這是我做過的一件比以往任何時(shí)候都好的事情;我所得到的休息比我所知道的要好得多。
句子4:
一個(gè)值得深思的奇妙事實(shí)是,每一個(gè)人的生命都是如此的神秘莫測(cè)。
句子5:
這是最好的時(shí)代,這是最壞的時(shí)代,這是智慧的時(shí)代,這是愚蠢的時(shí)代,這是信仰的時(shí)期,那是懷疑的時(shí)期,這是光明的季節(jié),這是黑暗的季節(jié),這是希望的春天,這是絕望的冬天。
4.3對(duì)上述三款機(jī)器翻譯軟件的譯文質(zhì)量分析
對(duì)句子1“A day wasted on others is not wasted on ones self.”的翻譯,三款軟件的譯文都與人工譯文基本相同。
第二句話“Never frown, even when you are sad, because you never know who is falling in love with your smile.”中,谷歌翻譯和有道翻譯與人工譯文意思相近,frown一詞都翻譯成“愁眉不展”,百度翻譯直接譯為“皺眉”,缺少文采,后半句“because you never know who is falling in love with your smile”,百度譯為“因?yàn)槟悴恢朗钦l愛上了你的笑容”,與人工譯文稍有區(qū)別。
句子3“It is a far, far better thing that I do, than I have ever done; it is a far, far better rest that I go to than I have ever known.”對(duì)這句話的翻譯,三款軟件的翻譯雖然都有不足之處,但是把原文的基本意思都傳達(dá)出來。有道翻譯的譯文質(zhì)量要更好一點(diǎn),谷歌和百度對(duì)后半句話中的rest一詞翻譯不夠準(zhǔn)確。
對(duì)句子4“A wonderful fact to reflect upon, that every human creature is constituted to be that profound secret and mystery to every other.”的翻譯,人工譯文采用語序調(diào)換的策略,把前半句話放到后面進(jìn)行一個(gè)解釋說明,三款機(jī)器翻譯均未對(duì)語序進(jìn)行處理,不過從直譯的角度看,百度翻譯和有道翻譯的譯文要比谷歌翻譯的譯文更為順暢和符合中文的表達(dá)習(xí)慣。后半句對(duì)“every human creature”一詞的翻譯,谷歌和百度都直接譯成“每個(gè)人類生物”,讀起來明顯很奇怪,而有道翻譯為“每一個(gè)人的生命”,略微準(zhǔn)確一些。總體來看,三款機(jī)器翻譯對(duì)這句話的翻譯均不是特別準(zhǔn)確,譯文看后有種不知所云的感覺。
句子5的內(nèi)容是《雙城記》中的經(jīng)典開頭段落,可謂是膾炙人口,總體來看,因?yàn)檫@段話的結(jié)構(gòu)簡(jiǎn)單,三款機(jī)器翻譯的譯文都很準(zhǔn)確地表達(dá)了原文的內(nèi)容,但是一個(gè)缺憾就是,三款機(jī)器翻譯對(duì)原文特有的節(jié)奏美、韻律美卻很難表達(dá)出來。
4.4人工智能時(shí)代機(jī)器翻譯對(duì)文學(xué)作品翻譯的思考
通過對(duì)目前市場(chǎng)上常用的三款機(jī)器翻譯軟件譯文與人工譯文的分析可以知道,對(duì)于文學(xué)作品的翻譯,如果是一些簡(jiǎn)單的句子表達(dá),那么機(jī)器翻譯能夠做到準(zhǔn)確地表達(dá)原文的意思,甚至與人工翻譯不分伯仲。面對(duì)一些句式比較復(fù)雜、語法結(jié)構(gòu)比較難的句子,機(jī)器翻譯的質(zhì)量還有待提高,因此,機(jī)器翻譯對(duì)文學(xué)作品的翻譯處理還是任重而道遠(yuǎn)。
5.結(jié)語
雖然在目前的人工智能背景下,機(jī)器翻譯的譯文質(zhì)量仍存在一些不足之處,但是不能否認(rèn)與傳統(tǒng)的機(jī)器翻譯系統(tǒng)相比,當(dāng)前基于神經(jīng)網(wǎng)絡(luò)的神經(jīng)機(jī)器翻譯的譯文質(zhì)量已經(jīng)有質(zhì)的提升。誠然,就目前來看,人工翻譯仍然占據(jù)主導(dǎo)地位,但是,未來翻譯的發(fā)展必然是人工翻譯和機(jī)器翻譯相結(jié)合,機(jī)器翻譯輔助人工翻譯,提高翻譯效率。因此,隨著人工智能的進(jìn)一步發(fā)展,機(jī)器翻譯的質(zhì)量一定會(huì)取得新的突破和提升,使人類更快更便捷地溝通和交流。
參考文獻(xiàn):
[1]馮志偉.機(jī)器翻譯研究[M].北京:中國對(duì)外翻譯出版公司,2004.
[2]Charles Dickens. A Tale of Two Cities[M].上海:上海外語教育出版社,2018.
[3]陳海峰.谷歌——人工智能引領(lǐng)未來[J].互聯(lián)網(wǎng)天地,2017(1):38-41.
[4]劉洋.神經(jīng)機(jī)器翻譯前沿進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2017(54):1147.
[5]胡開寶,李翼.機(jī)器翻譯特征及其與人工翻譯關(guān)系的研究[J].中國翻譯,2016(5):10-14.