亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器翻譯過程中詞匯層面的譯前編輯方法

        2021-03-14 02:48:52樊飛飛
        西安郵電大學學報 2021年5期
        關鍵詞:原文譯文詞匯

        陳 蓉,樊飛飛,王 曉

        (西安郵電大學 人文與外國語學院,陜西 西安 710121)

        機器翻譯是指無需人工翻譯,借助機器將源語言翻譯成目標語言。早期機器翻譯基于規(guī)則與統(tǒng)計模型,隨著人工智能的發(fā)展,基于深度學習的神經(jīng)網(wǎng)絡機器翻譯開始有了突破性的進展,提高機器翻譯的質(zhì)量成為數(shù)字經(jīng)濟時代迫切的需求。

        國外研究方面,提出了在使用機器翻譯前對源文本進行譯前編輯的想法,并總結(jié)出簡化寫作的十條規(guī)則[1],但其中的大部分建議是基于句子層面的考慮。對研究英語新聞標題的機器翻譯,提出可在機器翻譯系統(tǒng)中添加譯前編輯模塊。將英語新聞標題自動改寫成普通文本后再進行機器翻譯,以提高翻譯質(zhì)量[2],但這一過程的譯前編輯主要是對文本進行改寫,操作較為復雜。文獻[3]提出以人工評估方法發(fā)現(xiàn)翻譯錯誤,創(chuàng)建自動的譯前編輯模式。文獻[4]對基于日語和英語的機器翻譯譯前編輯系統(tǒng)進行了研究。此外,還從行業(yè)和學術研究的角度描述了源文本機器翻譯的譯前編輯和譯后編輯[5]。上述研究雖然就譯前編輯做了一些探討,但是都沒有提出較為具體和可行的譯前編輯方法。

        相比之下,國內(nèi)研究更注重譯前編輯策略的研究。文獻[6]以真實的項目案例,結(jié)合理論分析了人工干預對機器翻譯的重要性,總結(jié)出人機共譯可以提高翻譯效率和質(zhì)量,通過案例分析了譯前編輯策略[7-10]。以上研究都認為譯前編輯對提升譯文質(zhì)量有幫助,但其案例分析樣本有局限性,并且多采用主觀分析對譯文效果進行評價。

        傳統(tǒng)的機器翻譯在設計模型時通常根據(jù)語言學知識進行架構(gòu),而端到端的神經(jīng)機器翻譯,其內(nèi)部全部使用向量表示,從語言學的角度看可解釋性較差。因此,在設計新結(jié)構(gòu)時融入語言學知識成為新的問題。針對機器翻譯過程中譯前編輯的有效性缺乏客觀評價,譯前編輯策略與方法的研究較為籠統(tǒng)等問題,擬提出基于詞匯層面的譯前編輯方法。采用雙語評估替換方法(Bilingual Evaluation Understudy,BLEU)對基于詞匯層面的譯前編輯效果進行質(zhì)量評估。以Google在線翻譯為工具,通過BLEU對原始的機器翻譯譯文與譯前編輯后的機器翻譯譯文進行比較,從而驗證譯前編輯方法的有效性。

        1 問題描述

        隨著神經(jīng)網(wǎng)絡與人工智能的飛速發(fā)展,機器翻譯的譯文質(zhì)量得到提高,翻譯速度和效率遠超傳統(tǒng)的人工翻譯。在充分利用文本特征,借助人工干預,并用客觀有效的設計提高譯文質(zhì)量方面,人工智能和深度學習為實現(xiàn)這一目標提供了切實可行的思路。

        1.1 機器翻譯

        利用機器進行翻譯的想法最早出現(xiàn)于20世紀30年代早期,受當時技術發(fā)展水平和條件限制,翻譯機器未能被成功開發(fā)。1949年,美國科學家韋弗正式提出機器翻譯的思想[11]。2013年提出了機器翻譯的“解碼-編碼框架”[12],其以遞歸神經(jīng)網(wǎng)絡作為解碼器,卷積神經(jīng)網(wǎng)絡作為編碼器。先將源語言映射為一個連續(xù)、稠密的向量,再將此向量轉(zhuǎn)化為目標語言。神經(jīng)機器翻譯在2016年取得重大突破,翻譯性能和翻譯質(zhì)量大幅提高,取代了統(tǒng)計機器翻譯的優(yōu)勢地位。同年,Google推出神經(jīng)機器翻譯系統(tǒng),將句子而非短語作為翻譯單元,提高翻譯的準確度和流暢度[13]。

        然而,機器翻譯也存在著諸多弊端和問題。文獻[14]通過對機器翻譯譯文中出現(xiàn)的錯譯進行標注和統(tǒng)計,歸納分析了各類句法錯譯的典型形式,如動詞錯譯、短語錯譯及從句錯譯等,減輕了對語言進行形式化處理的工作。文獻[15]以科技文本為例,整理出11種機器翻譯錯誤類型,包括術語翻譯錯誤、形式錯誤、格式錯誤、短語順序錯誤、過譯和欠譯等。文獻[16]歸納總結(jié)出基于實例的機器翻譯尚且存在3類典型錯誤,分別是語內(nèi)詞項、語內(nèi)結(jié)構(gòu)性關系以及語外因素導致的識別錯誤。以上研究均表明機器翻譯存在缺陷,譯文效果未能達到預期目標,并且都從譯后編輯的角度提出關于提高譯文質(zhì)量的相應策略,對關注譯前編輯在提高譯文質(zhì)量方面的應用方面欠缺。

        1.2 譯前編輯

        譯前編輯,即在人工干預、編輯和修改源語文本的前提下,運用機器翻譯軟件對源語文本進行翻譯處理,最終生成目的語譯文文本的過程[7]。具體而言,在譯前編輯工作中,需要對源文本中不易識別和理解的詞匯、句型表達方式等進行處理,使機器能夠正確地識別和理解。文獻[7]先通過人工評測的方法選擇機器翻譯引擎,再對源語文本進行詞級和句級的譯前編輯,以提升譯文質(zhì)量。文獻[8]對源文本分別進行了譯前編輯、譯后編輯以及譯前譯后結(jié)合等3種人工干預,在結(jié)論部分未能提供明確的數(shù)據(jù)支撐,雖然表明了譯文質(zhì)量的提高,但缺乏科學性。文獻[9]設計的翻譯質(zhì)量對比實驗也是通過人工評測進行結(jié)果詮釋,缺乏客觀性。

        綜上所述,聚焦詞匯層面,借助BLEU,嘗試探索機器翻譯的譯前編輯方法在提高機器翻譯譯文質(zhì)量方面的應用。

        2 研究工具和語料選取

        譯前編輯方法有助于機器翻譯得到質(zhì)量更高的譯文。具體來看,文獻[7]中提出常見的譯前編輯工作包括對原文進行格式轉(zhuǎn)換、拼寫、標點符號檢查、語法檢查、句子調(diào)整及使用受控自然語言等。文獻[17]提到譯前編輯通常涉及格式處理和語言處理兩部分。文獻[18]總結(jié)出的譯前編輯方法包括對原文進行結(jié)構(gòu)調(diào)整、增減、提前翻譯術語、歧義消解以及補充標點符號。文獻[19]中主要的譯前編輯指導包括詞法與句法層次的切分,離合詞的語義整合,語素詞的語義切分,名詞性短語、動詞性短語、形容詞性短語、主謂短語等的短語切分,長句的意群切分和斷句等。此外,ACCEPT(Automated Community Content Editing PorTal)系統(tǒng)的譯前編輯方法在文獻[20]中主要涉及對語體的拼寫、語法、形態(tài)變化、格式以及專有名詞等的調(diào)整。經(jīng)上述文獻比對研究之后,總結(jié)出詞匯的增刪、替代以及術語提前是詞匯層面較為理想的譯前編輯方法。

        2.1 研究工具

        目前,主流的翻譯評測方法主要是人工評測和機器自動評測??紤]譯文的表達沒有絕對正確或絕對錯誤的標準,人工評測時,其評測結(jié)果會因不同的人在認知、經(jīng)驗和思維方式等方面存在差異而帶有很強的主觀性,為避免這一影響,采用機器自動評測方法。BLEU是一種基于N元語法的機器翻譯自動評測方法[21],其基于文本相似度對譯文質(zhì)量進行評估,結(jié)果較為客觀,總體評價表達式為

        其中:B表示懲罰因子;pn是指出現(xiàn)在參考譯文中的n元詞組占機器翻譯譯文中n元詞語組總數(shù)的比例,ωn=1/N,N為最大的n元語法階數(shù)。

        采用BLEU對譯文進行評價,用譯文中出現(xiàn)的N元組和參考譯文中出現(xiàn)的N元組相比,計算匹配的N元組個數(shù)與機器翻譯譯文的N元組總個數(shù)的比例,即將機器翻譯產(chǎn)生的譯文與人工譯者提供的參考譯文相比較,越接近,則機器翻譯譯文的正確率越高。

        2.2 語料選取

        在使用BLEU工具對譯前編輯方法進行有效性驗證時,需要選取權(quán)威可靠的參考譯文對機器翻譯結(jié)果進行比對。何剛強的《筆譯理論與技巧》以及武峰的《十二天突破英漢翻譯》是通用筆譯培訓教材,其中的翻譯實例堪作范例。典型多元的翻譯實例也便于根據(jù)其機器翻譯結(jié)果選擇適合的譯前編輯方式展開有效性研究。

        2.3 研究過程

        Google翻譯是一款基于瀏覽器的翻譯軟件,兼容性很強,是目前業(yè)內(nèi)使用最廣泛的翻譯引擎,其基本翻譯原理如圖1所示。

        圖1 GNMT處理英漢翻譯的原理

        Google翻譯采用了一種可以進行深度學習的神經(jīng)網(wǎng)絡翻譯系統(tǒng)(Google’s Neutral Machine Translation,GNMT),通過對句子進行整體翻譯,提高了翻譯的準確性和流暢度。與此同時,Google還在其中建立了一個端到端的學習系統(tǒng),使整個翻譯系統(tǒng)能夠獨立地進行學習和訓練,從而提高了翻譯水平。

        采用Google翻譯作為機器翻譯引擎,具體翻譯步驟如下。

        步驟1將原文輸入到Google翻譯引擎中,得到第一組譯文。

        步驟2針對第一組譯文所出現(xiàn)的問題,對原文進行基于詞匯層面的譯前編輯,包括詞類增補、刪除、替代以及術語提前等4個方面。

        步驟3將經(jīng)過譯前編輯的文本輸入到Google翻譯引擎中,得到第二組譯文。

        步驟4通過對比兩組譯文的BLEU值,判斷基于詞匯層面的譯前編輯效果是否顯著。

        3 應用結(jié)果與分析

        漢語與英語屬于不同的語系,二者在書寫規(guī)則、語義對比及句法結(jié)構(gòu)等方面有很大的差別。根據(jù)以往的實踐經(jīng)驗來看,機器翻譯的結(jié)果對譯者只能起到輔助性的作用,譯者的有效介入是譯文翻譯過程中的重要環(huán)節(jié)。譯前編輯方法在輸入原文之前,譯者可以根據(jù)原文的特征對其進行增補、刪減、替代和術語提前等相應的處理,從而使機器翻譯能夠更好地識別原文的內(nèi)容,提高譯文質(zhì)量。

        3.1 增補

        翻譯時,譯者可以根據(jù)英漢兩種語言的邏輯結(jié)構(gòu)和表達方式的不同,添加一些詞句,使譯文的意思表述更準確。因此,在對原文本進行詞匯層面的譯前編輯時,在原文中增添詞語也是提高譯文質(zhì)量的方法之一。

        例1原文:Man,was,is and always will be trying to improve his living conditions.

        參考譯文:無論是在過去、現(xiàn)在還是將來,人們總是在盡力改善生活條件。

        譯文:過去,現(xiàn)在,將來將永遠努力改善他的生活條件。

        譯前編輯后:Man,no matter was,is and always will be trying to improve his living conditions.

        譯前編輯后譯文:人,無論過去,現(xiàn)在還是將來都將努力改善他的生活條件。

        第一組譯文的BLEU值為22.01,第二組為38.21,在經(jīng)過譯前編輯之后,BLEU值提高了16.2。在例1中,過去、現(xiàn)在和將來包含一種條件關系,第一組譯文不僅沒有翻譯出這種條件關系,而且主語也被忽略。因此,在譯前編輯時對這種條件關系進行補充,得到的第二組譯文就更為完善和精確。

        此外,在英文原文中沒有表達邏輯關系的詞語,但根據(jù)上下文可以判斷出其隱含的邏輯關系,如轉(zhuǎn)折、假設、讓步和因果關系等。在譯前編輯時,也可以適當?shù)卦诰渲谢蚓渥又g補充關聯(lián)詞,如例2所示。

        例2原文:Ice is not as dense as water and it floats.

        參考譯文:冰的密度比水小,因此能浮在水面上。

        譯文:冰的密度不如水,它會漂浮。

        譯前編輯后:Ice is not as dense as water and so it floats.

        譯前編輯后譯文:冰的密度不及水,因此它會漂浮。

        在例2中,譯前編輯時增加了隱含的因果關系詞“so”,機器翻譯結(jié)果就得到了改善,BLEU值由16.91增長到22.77。

        例3原文:These concepts,values and objectives provide a solid foundation and clear guidance for our mutually beneficial and pragmatic cooperation.

        參考譯文:這些理念、價值觀和目標為我們的互利務實合作奠定了堅實的基礎,并給予明確的指導。

        譯文:這些概念,價值觀和目標為我們互利,務實的合作奠定了堅實的基礎和明確的指導。

        譯前編輯后:These concepts,values and objectives provide a solid foundation and give clear guidance for our mutually beneficial and pragmatic cooperation.

        譯前編輯后譯文:這些概念,價值觀和目標為我們互利,務實的合作奠定了堅實的基礎,并提供了明確的指導。

        在未進行譯前編輯時,所獲得的譯文中出現(xiàn)了動賓搭配不當?shù)那闆r,如“奠定明確的指導”,在譯前編輯時就需要添加相應的動詞“give”,BLEU值也隨之增長了5.04,表明譯文質(zhì)量得到改善。因此,在譯前編輯時,根據(jù)上下文的具體意義,需要在某些名詞之前或之后增加相應的動詞搭配。這里所說的動詞不僅指的是句子前面出現(xiàn)過而后省略的動詞,還包括原文中沒有的動詞,才能使譯文的意思明確完整,讀起來也較通順自然,符合漢語的表達習慣。

        例4原文: We don’t retreat,we never have and never will.

        參考譯文:我們不后退,我們從沒有后退,將來也絕不會后退。

        譯文:我們不撤退,我們永遠也不會。

        譯前編輯后:We don’t retreat,we never have retreated and never will.

        譯前編輯后譯文:我們不撤退,我們從未撤退,也永遠不會撤退。

        第一組譯文中,機器翻譯未完全傳達出原文的全部內(nèi)容,影響原文理解。同時,漢語常使用重復性的表述增強語氣,例4便是如此。在譯前編輯時,對原文句意中重復的內(nèi)容進行添加,得到的第二組譯文便表達出了原文中的含義,BLEU值也相應增加了10.93。在例4中,詞匯增補使譯文在內(nèi)容表達上與原文相同,避免了翻譯錯誤。同樣,采用此類譯前編輯方法還可以使翻譯出來的句子在文化背景、詞語聯(lián)想方面與原文本保持一致,不影響原文理解。

        例5原文:To explore the moon’s surface,rockets were launched again and again.

        參考譯文:為了探測月球的表面,人們一次又一次地發(fā)射火箭。

        ◎益生菌 金雙歧、培菲康、媽咪愛都可以。培菲康,膠囊的便宜,和袋裝的劑量一樣。媽咪愛,相對來說有點怪味道,寶寶不反對的話也可以用。

        譯文:為了探索月球表面,火箭一次又一次地發(fā)射出去。

        譯前編輯后:To explore the moon’ surface,rockets were launched again and again by people.

        譯前編輯后譯文:為了探索月球表面,人們一次又一次地發(fā)射了火箭。

        在例5中,“火箭發(fā)射”這一動作是被動發(fā)生的,但在未經(jīng)譯前編輯時,譯文中缺少相應的邏輯主語,對主語進行添加后,譯文的BLEU值從46.54增長到68.36,句子成分也變得相對完整,具有邏輯性。此外,考慮表達習慣的不同,漢語語言表達與分析重意不重形,句子中即使沒有人稱或非人稱,沒有主語或動詞,讀者也可以意會到主動或被動[22]。

        在譯前編輯時,可以根據(jù)不同的語境情況對原句進行補充,增補類BLEU值如圖2所示。

        圖2 增補類BLEU值

        3.2 刪減

        刪減與增補法相對應,是指將原文中不符合目的語表達習慣以及重復贅余等詞匯刪去,或者不在譯文中進行翻譯,但譯文給讀者的感受和原文相同。刪減的原則是不能影響原文意思的完整性,并且要符合漢語表達規(guī)范。在此原則下,凡違反漢語表達習慣的詞語都應予以刪去,使譯文簡潔。

        例1原文:The more he tried to hide his mistakes,the more he revealed them.

        譯文:他越想隱藏自己的錯誤,就越能揭示它們。

        譯前編輯后:The more he tried to hide his mistakes,the more he revealed.

        譯前編輯后譯文:他越想掩飾自己的錯誤,就越能揭示出來。

        第一組譯文將“them”翻譯成“它們”,而例1中想表達的“越能揭示出來”的內(nèi)容就是他自己的錯誤。因此,譯文中不必再用“它們”體現(xiàn),其語意在譯文中是不言而喻的。在譯前編輯時將代詞“them”刪去,機器翻譯就可以獲得不違背漢語語言習慣的譯文。其中,第一組譯文的BLEU值為34.78,第二組為51.12,譯前編輯效果顯著。此外,機器翻譯譯文中均使用了“揭示”這一動詞,完整的動賓搭配即為“揭示錯誤”,而“揭示”是使人看清原來不易看出的事理,一般不和錯誤搭配使用。因此,此處需要譯后編輯進行調(diào)整。

        例2原文:I had many wonderful ideas,but I only put a few into practice.

        參考譯文:我有很多美妙的想法,但只有少數(shù)付諸實踐了。

        譯文:我有很多很棒的主意,但我只付諸實踐。

        譯前編輯后:I had many wonderful ideas,but only put a few into practice.

        譯前編輯后譯文:我有很多很棒的想法,只有一些付諸實踐。

        在例2中,未經(jīng)譯前編輯時,“a few”被忽略,沒有翻譯,造成整個句子意思表示的不完整。根據(jù)漢語的表達習慣,前句出現(xiàn)一個主語,后句如果仍為同一主語,就不必再次出現(xiàn)。第一組譯文的表述違背了這一原則,而在譯前編輯時,將“I”刪去,得到的第二組譯文在內(nèi)容表達上基本與原文本一致,且符合漢語的表達習慣,BLEU值也從26.71增長到37.15。

        例3原文:We have made some achievements,and we must guard against complacency.

        參考譯文:我們?nèi)〉昧艘恍┏煽儯€要防止自滿情緒。

        譯文:我們已經(jīng)取得了一些成就,我們必須防止自滿。

        譯前編輯后:We have made some achievements,and must guard against complacency.

        譯前編輯后譯文:我們?nèi)〉昧艘恍┏删?,必須謹防自滿。

        未經(jīng)譯前編輯的譯文與例2一樣,同屬于不符合漢語的表達習慣。因此,將后半句的主語“we”刪去,得到的第二組譯文BLEU值就得到提升,由38.09增長為40.52。

        例4原文:A domestic appliance,for instance,a domestic refrigerator or a household smoke exhaust ventilator,can electrify itself.

        參考譯文:家用電器可能帶電,比如電冰箱或抽油煙機等。

        譯文:家用電器,如家用冰箱或家用排煙呼吸機可以使自己通電。

        譯前編輯后:A domestic appliance,for instance,a domestic refrigerator or a household smoke exhaust ventilator,can electrify.

        譯前編輯后譯文:家用電器,例如家用冰箱或家用排煙通風機,可以帶電。

        在英語中,有些作賓語的代詞,不論前文是否提到過,翻譯時往往可以省略不譯。在例4中,“itself”作為“electrify”的賓語,在第一組譯文中被機器翻譯處理成有實際意義的成分,從而造成了翻譯錯誤。因此,在譯前編輯時將其刪去,原文的內(nèi)容在第二組譯文中被忠實表達。第一組譯文的BLEU值為13.85,第二組譯文的BLEU值為17.27,經(jīng)過譯前編輯翻譯質(zhì)量得到了提高。

        例5原文:Cold rolling enables the operators to produce rolls of accuracy and uniformity,and with a better surface finish.

        參考譯文:冷軋可以生產(chǎn)出精度高、均勻性好、表面光潔度高的軋制品。

        譯文:冷軋使操作員能夠生產(chǎn)出準確而均勻的軋輥,并具有更好的表面光潔度。

        譯前編輯后:Cold rolling enables to produce rolls of accuracy and uniformity,and with a better surface finish.

        譯前編輯后譯文:冷軋能夠生產(chǎn)出準確,均勻且具有更好表面光潔度的軋輥。

        在例5中,“enable”的賓語“operators”,在原文中的前后邏輯關系被暗含在句意中,翻譯時可以不必翻譯出來,目的是在不改變原文思想內(nèi)容的基礎上使譯文更加通順流暢。因此,在譯前編輯時可以將其刪去,第二組譯文的BLEU值也相應增加了3.8,表明譯前編輯有效。在前后兩組譯文中的“accuracy”都被譯為“準確”,但在這個語境中其要表達的含義是“精度高”,需要譯者在譯后編輯時加以調(diào)整。刪減類BLEU值如圖3所示。

        圖3 刪減類BLEU值

        3.3 替代

        用替代的形式代替上文或句子中已出現(xiàn)過的詞語或內(nèi)容,以避免重復連接上下文,這是英語說話或者寫作的一項重要原則[18]??紤]英文多用代詞或具有引申用法的詞匯,在翻譯時要靈活還原文中所表示的內(nèi)容。在一些語境中,機器很難區(qū)分代詞所指代的內(nèi)容究竟是哪一部分,翻譯時容易出錯,而且不能翻譯出詞匯的引申含義。因此,在譯前編輯時,可以對相應的指代詞進行替換,消除歧義。

        例1原文:I chose three modules in the first year because I also had a part-time job.

        參考譯文:我第一年選擇了三門課程,因為我還有一份兼職。

        譯文:第一年我選擇了三個模塊,因為我也有一份兼職工作。

        譯前編輯后:I chose three courses in the first year because I also had a part-time job.

        譯前編輯后譯文:第一年我選擇了三門課程,因為我也有一份兼職工作。

        在例1中,未經(jīng)譯前編輯時,機器翻譯將“modules”譯為“模塊”,根據(jù)對原文的理解,此處應該表示“課程”。因此,在譯前編輯時將其替換為“course”。如果在上下文中多次出現(xiàn),在譯者熟悉原文這一步驟時,亦可將其都進行替換,從而減少了譯后編輯的工作。第一組譯文的BLEU值為40.57,第二組譯文的BLEU值為64.33,增加了23.76。

        例2原文:Your analysis of current political situation really hits the nail on the head.

        參考譯文:你對當前政治局勢的分析真是一針見血。

        譯文:您對當前政治局勢的分析確實觸動了頭腦。

        譯前編輯后:Your analysis of current political situation is really sharp.

        譯前編輯后譯文:您對當前政治局勢的分析確實很敏銳。

        例2中,“hit the nail on the head”的引申義為正中要害、說得中肯恰當,而機器翻譯未能正確理解其引申的含義。第一組譯文也只是根據(jù)字面逐字進行翻譯,和原文所要表達的內(nèi)容相差甚遠。在譯前編輯時,直接對這一詞組指代的引申含義進行整體替換,得到的第二組譯文的表述符合這個語境,BLEU值相應提高了3.22。

        例3原文:The radio wasn’t working because of a loose connection in the wires.

        參考譯文:因線路接觸不良,收音機不響了。

        譯文:由于電線連接松動,收音機無法正常工作。

        譯前編輯后:The radio wasn’t working because of a bad connection in the wires.

        譯前編輯后譯文:由于電線接觸不良,收音機無法正常工作。

        在例3中,“l(fā)oose connection”在未經(jīng)譯前編輯時機器翻譯將其譯為“連接松動”,而在漢語中,一般使用接觸不良泛指家用電器中由于電路連接而出現(xiàn)的故障。根據(jù)第一組譯文的表述,機器翻譯側(cè)重于“l(fā)oose”的含義。因此,在譯前編輯時將其替換為“bad”,從而獲得符合漢語表達習慣的第二組譯文,BLEU值由14.58增長到38.76。

        例4原文:This standard does not purport to address all of the safety concerns,if any,associated with its use.

        參考譯文:本標準未提及同標準使用有關的所有安全問題。

        譯文:本標準并非旨在解決與使用相關的所有安全問題。

        譯前編輯后:This standard does not purport to address all of the safety concerns,if any,associated with its standard use.

        譯前編輯后譯文:本標準并不旨在解決與標準使用有關的所有安全問題。

        例4中,未經(jīng)譯前編輯時,機器翻譯將“its”指代的內(nèi)容漏譯,造成句意缺失,甚至改變了整個免責條款的適用范圍。譯前編輯時對“its”的指代含義進行補充,從而限定了句意范圍,得到的第二組譯文內(nèi)容更加準確,BLEU值也提高了16.19。

        例5原文:Everybody has a responsibility to the society of which he is a part and through this to mankind.

        參考譯文:每個人都對他所屬的社會負有責任,并且通過對社會負責任,而對人類負有責任。

        譯文:每個人都應對他所參與的社會負責,并由此對人類負責。

        譯前編輯后:Everybody has a responsibility to the society of which he is a part and through taking a responsibility to mankind.

        譯前編輯后譯文:每個人都有責任對他所參與的社會負責,并通過社會對人類負責。

        例5中的“this”指代前面的“a responsibility to the society”,如果只是譯成“這個”,則會造成語義不明。譯前編輯時將“it”替換成“taking a responsibility”,并添加動詞,使語意更加連貫、通順。其中,第一組譯文的BLEU值為26.20,第二組譯文的BLEU值為32.41,譯前編輯效果顯著。替代類BLEU值如圖4所示。

        3.4 術語提前

        機器翻譯的程序規(guī)則是根據(jù)語言的基本規(guī)則,通過語料庫中的數(shù)據(jù)計算出相應的譯文,對于某些新詞匯、新技術及新政策等術語的收集未必完全。因此,譯者可在譯前編輯時直接翻譯出術語,以降低機器翻譯的誤出率。

        例1原文:Non-equilibrium is always fluctuating around the centerline of the equilibrium,thus promoting the economy to move forward and to be infinitely close to the goal of balanced growth.

        參考譯文:非均衡始終圍繞均衡的中心線上下波動,推動經(jīng)濟不斷向前發(fā)展,無限接近均衡增長的目標。

        譯文:非平衡總是在平衡的中心線附近波動,從而促進經(jīng)濟向前發(fā)展并無限接近平衡增長的目標。

        譯前編輯后:Non均衡is always fluctuating around the centerline of the 均衡,thus promoting the economy to move forward and to be infinitely close to the goal of balanced growth.

        譯前編輯后譯文:非均衡總是圍繞均衡的中心線波動,從而促進經(jīng)濟向前發(fā)展并無限接近平衡增長的目標。

        “equilibrium”指的是經(jīng)濟活動中的均衡,是一種相對穩(wěn)定的狀態(tài),而“平衡”從某種意義上來說是一種數(shù)學概念,二者存在明顯的區(qū)別。因此,在譯前編輯時將其直接翻譯替換,得到的第二組譯文BLEU值增長了10.43。

        例2原文:While the new plant manager has extensive experience improving productivity,many of the workers aren’t ready to hand him a blank check.

        參考譯文:雖然新廠長在提高生產(chǎn)力方面很有經(jīng)驗,但是很多工人還是不愿意凡事由他全權(quán)處理。

        譯文:新任工廠經(jīng)理在提高生產(chǎn)力方面擁有豐富的經(jīng)驗,但許多工人還沒有準備好給他一張空白支票。

        譯前編輯后:While the new plant manager has extensive experience improving productivity,many of the workers aren’t ready to hand him 全權(quán)處理.

        譯前編輯后譯文:新來的工廠經(jīng)理在提高生產(chǎn)率方面擁有豐富的經(jīng)驗,但許多工人還沒有準備好交給他全權(quán)處理。

        例2中的“a blank check”是一種英文的慣常表示方式,字面意思就是一張空白支票。經(jīng)過意義延伸,“a blank check”又可以解釋為全權(quán)授命、全權(quán)處理的意思。根據(jù)理解,在這個語境中便是如此,經(jīng)過譯前編輯,兩組譯文的BLEU值由29.38增長到32.39。

        例3原文:Valve regurgitation was assessed according to American Society of Echocardiography recommendations.

        參考譯文:按照美國超聲心動描記術學會的建議評價心臟瓣膜返流。

        譯文:瓣膜返流是根據(jù)美國超聲心動圖學會的建議進行評估的。

        譯前編輯后:Valve regurgitation was assessed according to American Society of超聲心動描記術 recommendations.

        譯前編輯后譯文:根據(jù)美國超聲心動描記術協(xié)會的建議評估瓣膜返流。

        “Echocardiography”指的是“超聲心動描記術”,在譯前編輯時,提前進行翻譯替換,得到的第二組譯文的BLEU值增加了16.56。

        例4原文:Science only learnt why in the 1940s with the discovery of rejection. When human organs are transferred from person to person,the immune system attacks and destroys what it sees as a foreign substance.

        參考譯文:直到20世紀40年代發(fā)現(xiàn)了排異反應后,科學家才明白了導致器官移植失敗的原因。當人體器官從一個人移植到另一個人時,受體的免疫系統(tǒng)即將其視作外來物質(zhì)進行攻擊和破壞。

        譯文:科學直到1940年代才發(fā)現(xiàn)排斥的原因。人體器官在人與人之間轉(zhuǎn)移時,免疫系統(tǒng)會攻擊并摧毀被視為異物的物質(zhì)。

        譯前編輯后:Science only learnt why in the 1940s with the discovery of 排異反應 When human organs are transferred from person to person,the immune system attacks and destroys what it sees as a foreign substance.

        譯前編輯后譯文:科學只是在1940年代發(fā)現(xiàn)了排異反應,才了解了為什么當人體器官在人與人之間轉(zhuǎn)移時,免疫系統(tǒng)會攻擊并破壞他視為異物的物質(zhì)。

        “rejection”具有一詞多義的特征,被廣泛應用于不同的專業(yè)領域,其含義及表達均有所不同。在本例的語境中屬于醫(yī)學術語,意為“排斥反應”。因此,在譯前編輯時進行替換翻譯,第一組譯文的BLEU值為13.97,第二組譯文的BLEU值為23.36,譯文質(zhì)量得到提升。

        例5原文:The calculation result shows that the maximum stress appeared at the edge weld seam.

        參考譯文:根據(jù)計算結(jié)果顯示,最大應力預計在端接焊縫處。

        譯文:計算結(jié)果表明,最大應力出現(xiàn)在邊緣焊縫處。

        譯前編輯后:The calculation result shows that the maximum stress appeared at the 端接焊縫.

        譯前編輯后譯文:計算結(jié)果表明,最大應力出現(xiàn)在端接焊縫處。

        “edge weld seam”在未經(jīng)譯前編輯時被機器翻譯譯為邊緣焊縫,與其實際含義存在較大差異。因此,譯前編輯時將其替換譯為“端接焊縫”,BLEU值相應提高了15.06。術語提前類BLEU值如圖5所示。

        圖5 術語提前類BLEU值

        4 結(jié)語

        機器翻譯過程中,采用譯前編輯對源文本進行預處理,能夠有效地提升機器翻譯譯文質(zhì)量。運用BLEU自動評測方法對基于詞匯層面的譯前編輯方法的有效性進行了驗證。根據(jù)BLEU自動評測方法的計算,經(jīng)過譯前編輯之后,BLEU值均有不同程度的提升。其中,增補方法平均提高了11.97,刪減為7.28,替代效果最為顯著,平均提高了14.71,術語提前則為10.89。

        通過對英譯漢文本詞匯層面譯前編輯策略的4個方面各選取5個例句進行具體分析,結(jié)論如下。

        1)詞匯增補方面。當把隱含的邏輯關系詞、動賓搭配的動詞和主語補充到原文中時,可以提高機器翻譯的譯文質(zhì)量,得到更標準、通順、忠實的譯文。

        2)詞匯刪減方面。刪去原文中可有可無或影響句意表達的冗余詞語,使譯文更通順流暢,符合漢語的譯文習慣。

        3)詞匯替代方面。把影響機器理解原文的詞匯替換成其指代不清或存有歧義的原文本,將便于翻譯,從而提高翻譯質(zhì)量。

        4)術語提前方面。在譯前編輯時直接將術語翻譯出來,可以減少機器翻譯的錯誤率。但是研究發(fā)現(xiàn),在涉及到視角轉(zhuǎn)換的情況下,也存在使用不符合語境的動詞或名詞搭配的情況,此時,仍需要譯后編輯進行調(diào)整。

        高效的訓練文本可以用于翻譯引擎進行深度學習。盡管深度學習已在自然語言處理等諸多領域得到了廣泛的應用,然而神經(jīng)機器翻譯對訓練文本的利用程度還有很大的提升空間?;谠~匯層面的譯前編輯方法,將文本詞匯方面的特征信息與端對端的神經(jīng)機器翻譯有效結(jié)合,使用經(jīng)過譯前編輯的文本作為訓練語料,提升了神經(jīng)機器翻譯系統(tǒng)的性能。

        考慮所選文本存在著一定的局限性,數(shù)量有限且僅適用于沒有視角差異的情況下基于詞匯層面的譯前編輯策略,無法對譯前編輯策略進行較詳盡且全面的探討。因此,有必要緊跟機器翻譯和其他相關科技的發(fā)展動態(tài),不斷更新對這一議題的研究。

        猜你喜歡
        原文譯文詞匯
        Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
        本刊可直接用縮寫的常用詞匯
        一些常用詞匯可直接用縮寫
        譯文摘要
        本刊可直接用縮寫的常用詞匯
        讓句子動起來
        I Like Thinking
        嘗糞憂心
        賣身葬父
        Performance of a double-layer BAF using zeolite and ceramic as media under ammonium shock load condition
        亚洲日韩精品无码专区网址| 久久久精品国产亚洲av网| 亚洲综合中文日韩字幕| 欧美奶涨边摸边做爰视频| 精品一区二区三区免费播放| 中文人妻无码一区二区三区信息| 日韩精品一级在线视频| 亚洲国产高清精品在线| 中文字幕一区二区人妻性色| 91综合在线| 国产黄色一级到三级视频| 国产女人好紧好爽| 国产日韩精品中文字无码| 一本一本久久a久久精品综合| 免费蜜桃视频在线观看| 人妻中文字幕乱人伦在线| 日韩无套内射视频6| 无码超乳爆乳中文字幕| 国产夫妻自偷自拍第一页| 欧美三级不卡在线观看| 精品国精品国产自在久国产应用| 中日韩字幕中文字幕一区| 日本久久久免费观看视频| 国内精品卡一卡二卡三| 亚洲另类欧美综合久久图片区| 国产美女冒白浆视频免费| 亚洲线精品一区二区三区| 性大片免费视频观看| 亚洲一区不卡在线导航| 亚洲中文字幕日韩综合| 黑色丝袜秘书夹住巨龙摩擦| 久久av无码精品人妻糸列| 亚洲精品女人天堂av麻| 成人爽a毛片免费视频| 黄 色 人 成 网 站 免 费| 日本一区二区三区在线观看免费| 久久精品国产亚洲av麻豆瑜伽| 婷婷五月综合丁香在线| 亚洲欧美日韩中文综合在线不卡| 亚洲天堂久久午夜福利| 朝鲜女人大白屁股ass|