張姝雯
(上海大學 外國語學院,上海 200000)
機器翻譯是國家語言開發(fā)能力的評價指標之一[1],經過了從傳統(tǒng)的統(tǒng)計機器翻譯向神經機器翻譯的發(fā)展,機器翻譯與人工翻譯相輔相成,各具優(yōu)勢。前者更適用于規(guī)范化和信息性文本[2],而對于具有表現(xiàn)性質的文本則需人工翻譯介入。因為機器翻譯主要專注于字面內容,無法準確傳達文字背后所蘊含的思想、情感和觀點[3],再現(xiàn)文史經典中蘊含的哲理與美感[4]。此外,機器翻譯仍面臨一些難以解決的技術障礙,生成的譯文無法達到出版質量,還需要人或編輯器對機器翻譯系統(tǒng)生成的目標語言進行編輯操作[5],即譯后編輯。
在分析機器譯文的詞匯時,當前以語言學為背景的研究通常只關注術語翻譯[6]或詞匯計量特征[7]。術語翻譯通常只涉及專業(yè)詞匯和有限的結構;詞匯計量特征也尚不能充分說明譯文的詞匯使用是否符合目標語的表達習慣。英語中的詞(word)和漢語中的詞并不完全對應,漢語中還有字的單位,這會對詞匯豐富度和密度、詞長、詞性和詞頻的計算結果產生干擾。
詞匯使用根植于一門語言的語音文字系統(tǒng)特點、母語者的思維方式和美學心理,不同語言文化之間存在根本差異。為了使譯文更易于接受和傳播,機器翻譯的譯后編輯需要回溯目標語言和源語言的根本差異,以此指導譯文詞匯潤色。因此,本文以英漢詞匯對比為理論基礎,考察機器翻譯對漢語中重復詞匯的處理效果,并提供相應的譯后編輯策略。本文的研究結論有助于為進一步改善機器翻譯系統(tǒng)的性能提供詞匯處理方面的思路,進一步提升譯文的質量和可讀性。同時,本文還提供了譯后編輯人員在潤色機器譯文時的策略,幫助機器翻譯的用戶提升翻譯體驗,獲得更優(yōu)質的譯文。
漢語在句子和篇章中會頻繁地重復使用同一詞語,以滿足節(jié)奏、構詞方式和篇章連貫性的需要,常通過重疊、重復以及對偶排比得以實現(xiàn)。相比之下,英語中雖然也存在重復的現(xiàn)象,但多處于修辭、慣用語或疊音詞中,遠不及漢語普遍。英文中通常避免出現(xiàn)音節(jié)、詞語、句式和意義的重復,在口語和書面表達中常使用替代、省略和變換的手段[8]。
由于英語和漢語對重復的不同態(tài)度,英漢互譯時也需要考慮這種差異的轉化。漢譯英時,可以使用顯性的形態(tài)變化替換源語言中重復的詞語,以符合英語作為形合語言的特點;還可以使用復合詞、代詞、同義詞、上下義詞、抽象詞等減少源語言帶來的重復。如果忽視這些處理,漢譯英的譯文就會冗余過多,降低可讀性。特別在中國公開發(fā)表的工作報告和政論性文章中,諸如“堅持”“加強”“充分”等詞經常重復出現(xiàn),起強調作用或增加氣勢,而譯成英文時就可能出現(xiàn)問題。機翻是否完全無法處理漢語中的用詞重復?不同機翻軟件的處理是否存在差異?人機合作翻譯時應遵循怎樣原則對譯文詞匯使用進行潤色?為了思考這些問題,本文以英漢詞匯對比理論為研究框架,觀察一篇中國外宣文本的各種機器英譯本對漢語中詞匯重復現(xiàn)象的處理情況及效果。
采取案例分析的定性研究方法,本文聚焦于中國出席第77屆聯(lián)合國大會立場文件,分析了機器翻譯如何處理重復,處理是否妥當,并給出譯后編輯策略。具體研究對象由該文件的中文原文和三篇英文譯文構成,三篇譯文分別來自于百度翻譯、Deep L翻譯以及ChatGPT(基于GPT-3.5架構)。在對比分析各機器譯本時,本文以中華人民共和國常駐聯(lián)合國代表團官網的譯文為參考,以避免研究者個人的翻譯偏好對分析過程產生影響。
對于重復的處理在翻譯中起著重要的作用,能夠提升譯文的質量和可讀性。有效地處理重復可以使文本更加流暢、清晰,并幫助讀者更好地理解內容。本文就漢語中三種常見的重復現(xiàn)象,討論不同機器翻譯的處理及效果。
通過重疊,可以使得漢語音節(jié)勻稱,或者賦予新意義和感情色彩。“一帶一路”是數量詞的重疊,官方將這個術語翻譯為the Belt and Road Initiative(BRI),而并沒有保留數字“一”的重復。因為漢語中的數字可以用來表示每個、許多、或某種感情色彩,如一草一木,而英文中的數字強調數量而淡化屬性,所以One Belt,One Road的譯法只突出狹義上的兩條線路,使讀者忽略絲綢之路更寬廣的外延。如例(1)所示,三個機翻版本中,只有Deep L保留數字重復,其他版本都能按照規(guī)范翻譯。但是當這個術語在同一句話中重復出現(xiàn)時,只有ChatGPT使用代詞it進行替代,官方譯文則是使用縮寫形式,避免重復。
(1)截至2022年7月,已有149個國家簽署共建“一帶一路”合作文件,“一帶一路”已成為當今世界規(guī)模最大、廣受歡迎的國際合作平臺。(原文-16)
As of July 2022, 149 countries have signedthe “the Belt and Road”cooperation document, andthe “the Belt and Road”has become the world’s largest and popular international cooperation platform.(百度)
As of July 2022, 149 countries have signedthe “Belt and Road”cooperation document, andthe “Belt and Road”has become the largest and most popular international cooperation platform in the world today.(Deep L)
As of July 2022, 149 countries have signed cooperation agreements related tothe Belt and Road Initiative, makingitthe world’s largest and most popular platform for international cooperation.(Chat GPT)
As of July 2022, 149 countries had signedBelt and Roadcooperation documents with China, makingthe BRIthe largest and widely welcomed platform for international cooperation in the world.(官方)
“共商共建”“互聯(lián)互通則屬于并列式的重疊”。幾個譯本在翻譯后者時都只用一個單詞connectivity或interconnection表示,規(guī)避重復。而翻譯“共商共建”時,卻出現(xiàn)了分歧。這個短語在立場文件中出現(xiàn)了三次,其中兩次以“一帶一路”的原則“共商共建共享”出現(xiàn),是固定術語。詞匯重復最少的是Deep L,但對兩次固定術語的翻譯都不一致,易造成理解混亂。而ChatGPT既確保了術語前后一致,又在非術語的地方有所變化,用抽象名詞effort替換“商”和“建”的意思。百度翻譯重復最多,幾近死板地將“共”對應joint,“商”對應consultation,“建”對應construction,缺少變化,在同一個短語中還出現(xiàn)兩次joint,最不符合英語的表達習慣。官方譯本由于追求在節(jié)奏上盡量貼合漢語原文,也存在術語不一致、重復過多的問題。綜合來看,ChatGPT的處理最值得參考。
立場文件的語體風格正式,原文用漢語書寫時已經盡量規(guī)避語法重復,不過出于修辭目的的重復現(xiàn)象仍有很多。例(1)就是回環(huán)(chiasmus)反復,前一個句子的末尾和后一個句子的開頭重復,形成語義的接續(xù)連貫,在翻譯成英文時要使用代詞或其他形態(tài)變化替換重復。例(2)中體系、秩序、規(guī)則分別形成了間隔反復,一是為了制造押韻,二是以不變的部分強調變化的部分。
(2)世界只有一個體系,就是以聯(lián)合國為核心的國際體系;只有一個秩序,就是以國際法為基礎的國際秩序;只有一套規(guī)則,就是以聯(lián)合國憲章宗旨和原則為基礎的國際關系基本準則。(原文-3)
There is only onesystemin the world,whichis the internationalsystemwith the United Nations at its core; There is only oneorder,whichis based on international law; There is only one set ofrules,whichis the fundamentalnormsof international relations based on the purposes and principles of the United Nations Charter.(百度)
The world has only onesystem, the internationalsystemwith the United Nations at its core; only oneorder, the internationalorderbased on international law; only one set ofrules, the basicnormsof international relations based on the purposes and principles of the UN Charter.(Deep L)
There is only one globalsystem, centered around the United Nations; only oneorder, based on international law; and only one set ofrules, founded on the purposes and principles of the United Nations Charter.(ChatGPT)
In the world, there is only one internationalsystem, i.e. the internationalsystemwith the United Nations at its core. There is only one internationalorder, i.e. the internationalorderunderpinned by international law. And there is only one set ofrules, i.e. the basicnormsgoverning international relations underpinned by the purposes and principles of the UN Charter.(官方)
但如果翻譯成英文還保留這個重復,就會讓句子包含無用信息。從這個視角來看,ChatGPT的譯文最簡潔明了,不僅沒有重復原詞,還進一步省略了后置定語的標志which,用非謂語結構充當后置定語。
相較于前兩種重復,立場文件更多地使用對偶和排比。如例(3)中“以……為”構成句式重復,“根本遵循”和“重要原則”構成意義重復,兩者一起組成了對偶的修辭。三個版本的機器譯文都重復使用了principle,不僅沒有規(guī)避意義重復,還增加了形態(tài)重復。官方譯本則用requirement代替其中一個principle,但仍未解決信息的冗余問題。因此,本文認為更為合適的譯文應為take/with mutual respect and indivisible security as the fundamental principle。
(3)以相互尊重為根本遵循,以安全不可分割為重要原則,(原文-7)
withmutual respectasthefundamental principle, and the indivisibility of securityastheimportant principle,(百度)
takesmutual respectasthefundamental principleand the indivisibility of securityasanimportant principle,(Deep L)
followsthefundamental principleof mutual respect, andregardsinseparable securityasanimportant principle.(ChatGPT)
takesmutual respectasthefundamental requirementand indivisible securityastheimportant principle,(官方)
例(4)也證明了相同的結論,即機器翻譯尚不能準確識別漢語中的同義異形詞語,在翻譯時不能做到省略同義近義表達來避免重復。“不是……,才是……”構成句式重復,這一點機器可以識別;“解決問題”與“化解分歧”“根本之道”與“有效途徑”構成意義重復,機器翻譯卻沒有做到語義的合并。此外,這個對偶結構的使用突出了非重復的部分,即“戰(zhàn)爭和制裁”“對話協(xié)商”,英文中則可以用強調句式來體現(xiàn)原文的意圖。因此,更合適的譯本可以是It is dialogue and consultation,not war or sanctions,that are fundamental solutions to differences。
(4)戰(zhàn)爭和制裁不是解決問題的根本之道,對話協(xié)商才是化解分歧的有效途徑。(原文-8)
War and sanctions are not thefundamental waystosolve problems, but dialogue and consultation are theeffective waystoresolve differences.
War and sanctions are not thefundamental waytosolve problems; dialogue and consultation are theeffective waytoresolve differences.
it is essential to recognize that war and sanctions are not thefundamental solutions, and that dialogue and negotiation areeffective meanstoaddress differences.
Wars and sanctions are notfundamental pathstoresolving problems; only dialogue and consultation offereffective waystoaddressing differences.
由上文可知,機器翻譯在處理漢語對偶句中的意復現(xiàn)象時差強人意,那在排比句中是否亦是如此。如例句(5)所示,機器譯本在處理“而不”的重復時,均拘于源語言,缺少變化。而官方譯文則使用“replace A,B,C with D,E,F”,將三個短語的意思融合起來,減少用詞的冗余,最具有參考價值。例句(6)中機器譯本將三個“以對話”重復呈現(xiàn),弱化了其他關鍵信息的視覺存在感,像官方譯文那樣合并翻譯為佳。
(5)走一條對話而不對抗、結伴而不結盟、共贏而非零和的新型安全之路。(原文-7)
... follows a new path of security that is dialoguewithoutconfrontation, partnershipwithoutalliance, and win-winrather thanzero sum.(百度)
... follows a new security path of dialoguerather thanconfrontation, partnershiprather thanalliance, and win-winrather thanzero-sum.(Deep L)
It seeks to forge a new path of security featuring dialogueinstead ofconfrontation, partnershipinstead ofalliance, and win-win cooperationinstead ofzero-sum games.(ChatGPT)
... in order to foster a new type of security thatreplacesconfrontation, alliance and a zero-sum approachwithdialogue, partnership and win-win results.(官方)
(6)以對話建互信,以對話解紛爭,以對話促安全(原文-8)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(百度)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(Deep L)
build mutual trustthrough dialogue, resolve disputesthrough dialogue, and promote securitythrough dialogue(ChatGPT)
build trust, resolve disputes and enhance securitythrough dialogue(官方)
例(7)所展示的排比現(xiàn)象則是關于漢語中的一個常用的名詞或形容詞后綴“-化”,表示屬性或狀態(tài)。英語中同樣有-ize/-ise、-ify、-ate、-en等。因此,可以擇取合適的英語后綴直接翻譯。百度翻譯試圖確保四個詞組都是“修飾語+名詞”的結構,于是“多極化”和“多樣化”并沒有使用合適的英文詞綴來翻譯。Deep L雖然實現(xiàn)了詞綴的統(tǒng)一,但主語部分過長,句子頭重腳輕。ChatGPT則經過更加復雜的思考,為英譯文提煉出了一個無靈主語the world。同樣把world提為主語,官方譯文則將“……化”理解為形容詞后綴,在形式上相較ChatGPT版更簡潔,也沒有完全拘泥于漢語原文的音律節(jié)奏。
(7)世界多極化、經濟全球化、社會信息化、文明多樣化持續(xù)深入發(fā)展(原文-2)
the world’smultipolarity, economicglobalization, socialinformatization, and culturaldiversitycontinue to deepen,(百度)
themultipolarizationof the world, economicglobalization, socialinformatizationanddiversificationof civilizations continue to develop in depth,(Deep L)
the world continues to experience deepeningmultipolarity, economicglobalization, socialinformatization, and culturaldiversity.(ChatGPT)
the world is becoming increasinglymulti-polar, economicallyglobalized,digitizedand culturallydiversified.(官方)
總體而言,不同的機器翻譯系統(tǒng)在處理漢語原文中重復用詞時存在差異。新興的ChatGPT翻譯相較于已廣泛使用的百度和Deep L翻譯,在處理重疊詞和形態(tài)重復的詞時已經展現(xiàn)出明顯的優(yōu)勢。然而,機器翻譯系統(tǒng)難以準確識別并處理對偶排比句中形態(tài)上不同但意義相同的重復表達,無法進行同義合并和省略操作。當重復出現(xiàn)在詞匯的內部結構,如詞綴的重復時,機器翻譯系統(tǒng)無法靈活地轉換詞性和詞形,以使得句法和詞法層面都符合目標語言的表達習慣。因此,機翻譯文還需要人或編輯器進一步提升對重復用詞的處理。
譯后編輯的首要任務是,識別機器翻譯中不符合目標語言習慣的錯誤和問題。為此,譯后編輯者需要結合機器翻譯普遍存在的不足,尋找提升譯文質量的切入點。
其一,依據詞匯的具體語境轉變去重復方式。英語中規(guī)避重復的手段有很多種,而機器翻譯只能有限地調動這些經驗。由于漢語的詞形變化較少,許多語義或者用法上的差異并不會通過形態(tài)變化直接體現(xiàn),機器就無法判斷兩個形態(tài)相同的詞是否發(fā)揮了不同的社會文化功能。如,當在文本中多次出現(xiàn)某個專業(yè)術語時,一般使用約定俗成的翻譯,使讀者快速理解術語的含義。例如,沒有規(guī)范譯文,則須確保術語使用前后一致。為了避免重復,可以使用代詞將該術語替換為it或this,或使用縮略詞。在讀者可以通過上下文理解的情況下,可以直接省略該詞。然而,當該詞在其他語境中作為通用詞匯出現(xiàn)時,如仍使用術語譯法,則會使譯文生硬,也增加了不必要的重復(表1)。此時,譯后編輯應根據需要使用同義詞、上義詞或抽象詞替代來代替原詞,以實現(xiàn)表達的多樣性和豐富性。不過選擇替代詞時需要謹慎,確保其準確性和適用性。
其二,融合或省略對偶排比句中的重復語義。對漢語來說,對偶和排比中的重復不僅涉及同一個字、同一個詞,還包括字數相等、結構相似,以及意義的相類、相似、相反。在處理漢語原文的對偶句和排比句時,應注意融合或省略那些互相補充、互相映襯、互相對照的成分,以簡化譯文。特別是本文所分析的政治類外宣文本,非常依賴重復的詞語、重復的結構和重復的意義來體現(xiàn)獨特的中國氣場。如果在英文中直接保留這些結構,不僅失去了氣場,反而干擾了信息傳遞的流暢性。
其三,處理漢語詞綴的重復時發(fā)揮英語的派生優(yōu)勢。中文中的具有形態(tài)學變化的派生詞雖然不多,但也存在一些詞綴,如表示對立的前綴“反-”,表示使……變化的后綴“化”等。特別是在現(xiàn)代漢語和政治性文本中,并列短語中同一詞綴的重復,能夠直觀地捆綁幾個詞語。比如,“單邊主義、保護主義、霸權主義抬頭”這句話中,“單邊”“保護”“霸權”原本是三個獨立的現(xiàn)象,借助“……主義”這個結構有了共生共現(xiàn)之感。要想在英文譯文中也傳達這種感覺,就必須要使用統(tǒng)一的派生詞綴。這種做法并不會增加譯文中的重復,因為對兩個英語派生詞來說,詞綴只決定詞性,而詞根才決定詞義。機器翻譯一般無法兼顧句法和詞法結構。有時候為了語法正確,機器翻譯會把相同的漢語詞綴翻譯成不同的英語詞綴,這種做法反而破壞了意義的黏合性。因此,譯后編輯者需要靈活運用英語中的派生詞,盡可能統(tǒng)一漢語詞綴的翻譯。
機器翻譯和譯后編輯時需要對重復詞匯進行處理。本文以英漢詞匯對比為理論指導,分析四個常見機翻系統(tǒng)處理重復詞匯時的方法、效果和問題,并提出相應的譯后編輯策略。通過對案例的分析討論,本文發(fā)現(xiàn)機器翻譯系統(tǒng)在處理重疊、反復現(xiàn)象方面取得了進步,但在處理對偶和排比現(xiàn)象時仍存在局限性。通過依據詞匯的具體語境轉變去重復方式、融合或省略對偶排比句中的重復語義、處理漢語詞綴的重復時發(fā)揮英語的派生優(yōu)勢,譯后編輯可以有效提升譯文的質量和可讀性。在處理重復詞匯時,機器翻譯系統(tǒng)和譯后編輯人員需要相互配合,結合語言特點和文化差異,以提供準確、流暢和可讀的譯文。