張一寧,徐林熇
(1.長春理工大學外國語學院,吉林長春,130022;2.吉林省科技外語人才培養(yǎng)創(chuàng)新研究中心,吉林長春,130022)
作為“宇宙進化以來最為復雜的人類活動”,翻譯一直被冠以“人工”、“很難被機器所取代”等標簽。數字化時代的互聯網、大數據、人工智能等信息技術給人類社會的發(fā)展帶來了深刻的變革,當然翻譯也毫無例外地被影響著。人工智能悄然地改變著翻譯的過程和譯者的身份。2016年谷歌基于神經網絡翻譯引擎的論文發(fā)表后,機器翻譯又一次宣布走出低潮,朝氣蓬勃地發(fā)展起來。隨后,谷歌、微軟、百度、阿里、騰訊等公司相繼推出號稱可以模仿人腦“理解語言,生成譯文”的人工智能翻譯軟件產品。人工智能的不斷發(fā)展不禁引發(fā)了這樣的思考:機器翻譯是否會對專業(yè)譯員造成沖擊并完全取代人工翻譯呢?本文以機器翻譯為例,探討人工智能背景下機器翻譯的發(fā)展、現存的問題以及譯者的職業(yè)發(fā)展。
機器翻譯最早出現于上世紀三四十年代。從早期的詞匯型、語法型和語義型的規(guī)則翻譯到基于語料庫的統(tǒng)計機器翻譯,再到神經機器翻譯,計算機技術、信息論、語言學等學科的發(fā)展助推了機器翻譯技術的發(fā)展。隨著互聯網的發(fā)展與應用,以及全球一體化進程的推進,人工作業(yè)的跨語言翻譯活動早已無法滿足時代的需要。據中國翻譯協會統(tǒng)計數據顯示,2011-2016年間中國語言服務行業(yè)產值年均增長率接近19.7%,翻譯市場巨大的紅利給機器翻譯帶來了新的發(fā)展機遇。
2016年初,騰訊基于短語的機器翻譯產品的翻譯效果并不理想。同年年底谷歌在機器翻譯領域取得重大突破,其神經網絡機器翻譯系統(tǒng)(Google Neural Machine Translation,簡稱 GNMT)實現了迄今為止機器翻譯質量的最大提升。GNMT可以通過現有的、大規(guī)模的語料庫來實現深度學習,從而做到從語料庫中自動地獲取語言特征和規(guī)則(馮志偉,2018)。“神經網絡機器翻譯”技術能夠克服原有的基于短語的翻譯,可以實現基于語料庫對于上下文信息進行充分比較。人工智能翻譯以大量語料為基礎,經過分析后能諳熟這些公式、套路、模板,從而翻譯出譯文。源語句子通過多層復雜的傳導運算,轉化為計算機可以“看懂”、“理解”的表達形式;系統(tǒng)對語言進行語碼處理,完成句子的整體編碼和解碼,最終產出基本符合目的語語法的譯文。在翻譯全過程中整體建模,利用深度神經網絡機器翻譯技術自動學習語料庫中的翻譯知識,從而在一定程度上提升了翻譯結果的準確性。
雖說語言結構的復雜性和語義理解的多樣性影響了人工智能的迭代升級速度,但是機器翻譯的成長,尤其是其深度學習能力遠遠超出了常人的想象。近年來,人工智能技術在機器翻譯領域確實表現出了不俗的水準。從出國旅游到留學辦公,一些語音翻譯軟件基本能夠滿足簡單的日常短語交流;另外一些具有實用功能的智能手機軟件可以實時地通過攝像頭的取景框來翻譯外文景點指示牌、菜單、說明書和實物等,極大地滿足了普通用戶對于基本翻譯的需求,大大提升了其跨語言溝通效率。2017年國際機器翻譯會議(WMT)對于新聞文本的機器翻譯進行了評測,漢英和英漢互譯翻譯質量已經達到70%以上。但是,就人工智能機器翻譯的質量而言,我們認為其所謂的譯文“較為流暢”,只能說是與之前的機器翻譯系統(tǒng)產出的譯文相比流暢度有所提高。整體而言,相比高質量的人工翻譯,機器翻譯依然存在很大的差距。
各大公司對于自身技術充滿信心,騰訊翻譯君出現在了2018年博鰲亞洲論壇會議現場,微軟神經機器翻譯實時口譯系統(tǒng)于2018年在北京語言大學舉行的“翻譯自動化用戶協會(TAUS)亞洲峰會”上與人工同聲傳譯全程同步進行較量。下面以網絡上熱傳的博鰲亞洲論壇中的翻譯為例:
例1.
原文:We know that in China there is the rrooaadd and bbeelltt and a visit there is some corporation,just like the structure from him to have in the area of infrastructure.
騰訊譯文:我們知道中國有一條公路和一條腰帶。訪問那里有一些公司,就像他在基礎設施方面的結構一樣。
例2.
原文:But as a technology from a what can you do in the road and belltt and so maybe I think we have something to do for your company,thank you.
騰訊譯文:但是作為一項技術,你在道路和傳送帶上能做些什么,所以我想我們可以為你的公司做點什么,謝謝。
博鰲亞洲論壇分論壇“新一輪技術革命”會場上發(fā)言者在即席講話中把“One Belt One Road”說成了“the road and belt”。如果是人工翻譯,譯員會根據上下文語境知識加以判斷并譯為“一帶一路”,但是機器翻譯更多的是基于算法的傳導運算,還無法靈活處理此類表達,因此將其誤譯為“一條公路和一條腰帶”、“道路和傳送帶”。人工同傳譯員會自己判斷并主動糾正發(fā)言者明顯的口誤,而機器則很難做到這一點。
此會場英譯中部分的“Yes,please.”被譯成“是的,求你了”,大多是基于數據庫的語符匹配的結果。機器在運算過程中根據交際場景判斷詞義乃至會話含義的能力還有待提高。人工智能更擅長于程序化高、重復率高、計算速度快的工作。而人工譯員具有的在交際中熟練處理跨文化跨領域問題的能力,以及根據主題、交際場合、講話雙方、口音和口吻、手勢與面部表情等處理信息的能力,是人工智能需要為之努力的更高要求。
在博鰲論壇“未來的生產”會場同傳中出現了“when when when”、“but but but”、“And and and have and max and”等令聽眾難以接受的譯文版本。分析其原因不難發(fā)現,無論是傳統(tǒng)的機器翻譯還是基于語料庫的神經網絡翻譯技術,更多的是嚴格遵循各種語言的語法規(guī)則的傳導運算,更擅長書面語翻譯,對未加處理的碎片式口語束手無策。
兩次嘗試,無論是語音識別,還是機器翻譯的結果,整體上都差強人意。業(yè)內人士的結論是:基于語音識別和機器翻譯的實時口譯系統(tǒng)要替代專業(yè)的人工同傳翻譯,還有很長的路要走。
機器翻譯的迅猛發(fā)展在促進國際交流合作的同時也凸顯了翻譯市場的巨大需求。但是,令人哭笑不得的“sign everywhere”(簽到處)、“Slip carefully”(小心地滑)和“Chinese dream,fly nine days”(中國夢,飛九天),都或多或少體現著人工智能機器翻譯不夠“智能”的一面。又如,機器翻譯處理“Jane Zhang became the first Chinese singer to perform for Victoria's Secret,joining the ranks of Taylor Swift and Katy Perry.”一句時,由于語境知識的欠缺,把“Jane Zhang”(張靚穎的英文名)翻譯成了“簡·張”,這種譯文很難符合中國讀者的理解需求。下面以2017年浙江大學建校120周年開幕式幕布翻譯為例,對比分析機器翻譯軟件的不同譯本。
例3.
原文:向為人類未知領域探索,為國家和民族作出重大貢獻的前輩先賢致以最崇高的敬意。
校慶譯文:Let’s express our highest respect to those predecessors explored the unknown field of mankind,and to those predecessors made significant contributions to the country and people!
浙大校慶譯本的語法錯誤一石激起千層浪,網友發(fā)起了此譯本與機器翻譯版本的對比,認為機器翻譯雖說存在各種問題,但是和這種各種語法錯誤的版本比起來還是略勝一籌。時隔一年有余,筆者將原文分別輸入百度翻譯、有道翻譯和谷歌翻譯,進行翻譯測試。下表為2017年百度翻譯、有道翻譯和谷歌翻譯譯本的對比以及2019年三大翻譯軟件的譯本對比。通過對比不難發(fā)現,2017年的機譯質量很難令人滿意,不同的機器翻譯版本存在著句法、詞法和語義的問題。僅就2017版譯文而言,機器翻譯的前景并不像大多數人所想象的那么樂觀??上驳氖?,隨著神經網絡機器翻譯技術的快速發(fā)展,機器翻譯譯文質量不斷提升,綜合統(tǒng)計機器翻譯、神經機器翻譯等技術,現行的輔助翻譯軟件全面綜合互聯網海量數據,從中挖掘數千萬的專業(yè)術語翻譯和億級雙語例句提供給用戶作為翻譯參考信息。因為計算能力增強、機器翻譯模型創(chuàng)新、語料規(guī)模大幅提升,2019版譯本質量較之前已有明顯改善,初步實現了“理解語言,生成譯文”,因此譯文更加符合語法規(guī)范,貼近自然語言,容易理解。有別于2017版譯文中詞匯的識別性錯誤、漏翻以及譯文的中式表達,2019版的3個譯本基本符合了嚴復翻譯三字標準的第一個標準——“信”。
表1 三大機器翻譯軟件譯本對比
作為檢驗機器翻譯譯文質量的一個標準,業(yè)界人士堅持譯本必須保障在語義上與目標語言意義保持一致,也就是說,無論是人工翻譯還是機器翻譯一定要堅持把源語所要表達的意義準確無誤地表達出來,達到“信”的標準。因此,許多神經網絡機器翻譯技術突出對于語序的處理,追求與自然語序的接近度以及譯文的整體流暢度。隨著機器翻譯的深度學習,上述3個機器翻譯軟件在盡量向“信”這一標準靠攏,或已經基本達到這一標準。
但是問題在于,機器翻譯的譯本是否達到了嚴復翻譯三字標準的第二個標準——“達”,即語言的通順暢達。如果就嚴復的“達”的字面意義而言,3個機器翻譯軟件均達到了“達”的標準。但是,我們認為翻譯中的“達”不僅是通順,更強調功能的暢達和實現。浙大校慶典禮展板標語的作用是致敬浙大校友和先賢,而百度翻譯和有道翻譯的第一人稱代詞“I”的使用淡化了浙大的群體意識,谷歌翻譯的第三人稱代詞“they”的使用使得原文中強烈的融入感蕩然無存,拉開了交際的心理距離。此類機器翻譯雖將原文譯為目的語,但是其譯文并未達到原文所表達的效果?!邦櫺乓硬贿_,雖譯猶不譯也,則達尚焉?!毕啾葯C器翻譯,網絡上流行的幾個人工翻譯譯本則更加清晰地傳達了校慶典禮展示板的語用功能。筆者結合網絡上的幾個英譯版,嘗試做出如下翻譯:
例4.
Salute to the predecessors of Zhejiang University who have explored the unknown and have made great contributions to our country and people.
通過深度學習、基于算法的傳導運算,機器翻譯的各個版本中補充了人稱指示語“I”和“they”作為句子的主語,譯本看上去更符合漢語的語法,但是這種譯法只考慮到了語法的完整性,卻忽略了語句的交際功能??紤]到原文宣傳標語的特點,我們省略了句子的主語,將其譯為“salute to”引導的動詞短語,并且根據相關語境信息將“前輩先賢”譯為“the predecessors of Zhejiang University”,以突出校慶標語的信息功能和表情功能。上述對于語境和體裁的考量均為人工智能翻譯系統(tǒng)短時間內難以達到的。
機器翻譯的優(yōu)勢在于其速度和數量,但是優(yōu)秀的譯文更體現在其傳達功能。翻譯不僅是字符的轉換,其精妙之處在于意境的暢達與功能的奏效。紐馬克(1981)認為:“語境在所有翻譯中都是最重要的因素,其重要性都大于任何法規(guī)、任何理論和任何基本詞義?!痹凑Z語義的深層理解以及目標語語境知識的掌握決定了譯文的可接受性,語境知識的認知以及如何參照其文化語境確定包含在字面意義中的語用意義將成為機器翻譯技術的重要突破點?,F有機器翻譯能夠短時間內迅速深度學習翻譯所需要的詞法、語法和語義信息,甚至是固定搭配、語義特征、單詞間的約束條件等知識,但是語境的分析則是機器翻譯最關鍵的難題所在。隨著人工智能的迅猛發(fā)展,值得深思的不是機器翻譯是否可為人工譯者所用,而是如何利用人工智能助力我們的翻譯實踐,如何在人工智能很難達到的語境順應的領域避免誤譯,提高譯文質量。
人工智能時代,翻譯技術的迅猛發(fā)展是一種必然,機器翻譯成為了語言翻譯必不可少的一種模式。海德格爾(1996)曾指出,現代技術使人和物失去了自我意志……淪為了功能性的存在。人類如何處理自身與技術之間的關系成為了我們必須回答的問題。面對現代技術,擺在譯者面前的問題是如何處理翻譯與技術之間的關系,如何做一名人工智能時代的譯者。做一名沉湎于技術帶給我們的舒適,漸漸喪失個性和批判性思維的“單向度”譯者?亦或將機器翻譯技術拒之門外?
答案當然都是否定的。如果只做被技術限定的“單向度”譯者,莎士比亞口中那一千個人的眼里不會再出現一千個哈姆雷特。流水線上缺乏批判性思維的“單向度”低端譯者將很快被機器所取代。也許有人會為了避免被取代,而拒絕機器翻譯技術,事實上這也是不可取的。無論我們接受與不接受,技術都存在并迅猛發(fā)展著。機器翻譯可以每天提供億級翻譯次數,有快速深度學習的能力,這是人工翻譯難以企及的。機器翻譯可幫助譯者完成相對機械的打字、查詞等低效勞動,以便有精力從事譯后編輯和更高層次翻譯創(chuàng)作,進而提升翻譯效率和質量。藍紅軍(2017)透過傅雷的個案研究指出機器能取代的只不過是譯者作為翻譯實踐重復性的、缺乏精神內涵的翻譯工作,并不能取代譯者作為翻譯精神主體的作用。譯者強大的語境知識聯想、認知能力以及應變能力是機器翻譯在很長一段時間內都很難深度學習得到的。機器翻譯不能替代人工翻譯,但卻給人工翻譯帶來了變革,重構了人工翻譯的過程。機器翻譯與人工翻譯相結合的翻譯方法,在提高翻譯效率的同時,也在一定程度上促進了翻譯質量的提高。大數據時代人工譯者更應該具有踏踏實實和精益求精的工匠精神,廣泛開展人機合作模式。不但要身懷譯技,還要善用譯器。在積極擁抱技術、享受技術成果的同時,更應該積極發(fā)揮主觀能動性和創(chuàng)造性,譯出一千個人眼中的那一千個哈姆雷特。
作為三大底層基礎設施之一的人工智能是未來智能時代的“水電煤”,是后互聯網時代的重要技術推動力。雖然目前人工智能技術已經發(fā)展到一定程度,但是距離機器翻譯完全取代人工翻譯的那一天還很遙遠,即便是神經網絡機器翻譯技術也只能在較為日常和機械的翻譯活動中大顯身手,機器翻譯是否真正能夠取代人工翻譯依然是一個暫無答案的問題。作為傳統(tǒng)的復雜人工活動,翻譯需要在人工智能技術的推動下進行變革和創(chuàng)新。期待技術能代替繁重、重復單調的工作,幫助譯者們進行更富有創(chuàng)造性和更高效率的工作,通過機器翻譯與人工翻譯更好地人機協同,發(fā)揮各自所長,創(chuàng)造出更多更好的翻譯作品。