皇甫偉
摘 ? ?要: 本研究通過(guò)Translog鼠標(biāo)鍵盤記錄法分析了不同水平譯者的譯后編輯過(guò)程,從停頓和編輯操作兩個(gè)方面分析了影響譯后編輯效率的主觀因素。結(jié)果表明,兩組譯者在停頓總時(shí)間和編輯操作總量上不存在顯著性差異,但是高級(jí)學(xué)生譯者的平均停頓率顯著高于初級(jí)學(xué)生譯者。本研究發(fā)現(xiàn)在譯后編輯策略的類型特征上,兩組譯者有明顯不同,在翻譯教學(xué)中如何從主觀因素角度指導(dǎo)學(xué)生提高譯后編輯效率有一定意義。
關(guān)鍵詞: 譯后編輯 ? ?主觀因素 ? ?鼠標(biāo)鍵盤記錄法
譯后編輯的工作對(duì)象是機(jī)器翻譯的譯文。譯者在譯后編輯(Post-editing,PE)工作模式下的翻譯與以往的翻譯不一樣,他們需要對(duì)機(jī)器翻譯(Machine Translation, MT)的譯文進(jìn)行替換、刪除、移動(dòng)和添加等操作。此時(shí),譯后編輯效率與諸多主客觀因素有關(guān),比如文本難度、翻譯的語(yǔ)言對(duì)及譯者的翻譯能力等。本文主要探討影響譯后編輯效率的主觀因素。
一、影響譯后編輯效率的主觀因素
主觀因素主要指的是譯者因素。根據(jù)Vieira(2014)[1]譯者在譯后編輯中的認(rèn)知因素主要體現(xiàn)在三個(gè)方面,即時(shí)間、認(rèn)知努力和技術(shù)操作。其中,譯后編輯的時(shí)間因素屬于客觀,認(rèn)知努力和技術(shù)操作屬于主觀。
譯者認(rèn)知努力的測(cè)量難度較大。目前主要有出聲思維(Think Aloud Protocal, TAP)的方法和鍵盤行為記錄技術(shù),以及眼動(dòng)試驗(yàn)三種。一般認(rèn)為,作為一種心理活動(dòng),認(rèn)知努力付出的越多,翻譯效率越低。比如譯者停頓行為體現(xiàn)了譯者發(fā)現(xiàn)MT譯文中的錯(cuò)誤和對(duì)其進(jìn)行修正,這是影響翻譯效率的重要因素。停頓動(dòng)作越多,表明譯文中可譯性負(fù)面指標(biāo)(Negative Translatability Indicator, NTI)越多,所需認(rèn)知努力越大(OBrien,2007) [2]。因此測(cè)量停頓行為就能在一定程度上體現(xiàn)譯者的認(rèn)知努力。本項(xiàng)研究所用測(cè)量影響效率的停頓行為的指標(biāo)是停頓時(shí)間和平均停頓率。
技術(shù)操作是譯者對(duì)譯文的編輯操作。OBrien(2014)[3]發(fā)現(xiàn)譯后編輯效率的提高往往伴隨譯者利用鍵盤或鼠標(biāo)編輯操作的減少,即譯者對(duì)MT譯文的編輯操作與編輯效率負(fù)相關(guān)。必須指出的是他們的研究發(fā)現(xiàn)其實(shí)是不言自明的道理,但同時(shí)他們沒(méi)有證明編輯操作的數(shù)量與譯后編輯的時(shí)間之間存在顯著的因果關(guān)系,即前者的增加并不能必然導(dǎo)致更多的譯后編輯時(shí)間,換句話說(shuō)更低的譯后編輯效率。比如,在編輯操作較少的情況下,如果停頓行為增加,譯后編輯時(shí)間就會(huì)增加,引起譯后編輯效率的降低。此外,高效的譯后編輯操作策略是可以提高編輯效率的。本研究要驗(yàn)證譯者編輯操作的整體數(shù)量和編輯操作的類型和方式對(duì)效率有何影響。
二、研究方案
首先對(duì)試驗(yàn)對(duì)象、試驗(yàn)工具、翻譯材料和實(shí)施步驟等變量進(jìn)行有效的控制。本研究選取的譯者根據(jù)翻譯經(jīng)驗(yàn)劃分為初級(jí)學(xué)生譯者和高級(jí)學(xué)生譯者。前者為6名BTI翻譯專業(yè)本科大四的學(xué)生,已經(jīng)通過(guò)專業(yè)四級(jí)和完成1萬(wàn)字左右的翻譯量。后者為6名MTI翻譯專業(yè)碩士研三的學(xué)生,全部有CATTI三級(jí)筆譯證書和完成了10萬(wàn)字左右的翻譯量。試驗(yàn)工具采用Translog鍵盤記錄工具。在完成相關(guān)的試驗(yàn)前工具應(yīng)用和試驗(yàn)程序和內(nèi)容培訓(xùn)后,讓所有試驗(yàn)對(duì)象使用Translog II-user為一段335個(gè)漢字的電力建設(shè)項(xiàng)目合同的Google機(jī)器翻譯英譯文進(jìn)行譯后編輯。該Google機(jī)器翻譯譯文是經(jīng)過(guò)在SDL Trados 2007(試用版)平臺(tái)與參考譯文的匹配度測(cè)試,與百度、必應(yīng)機(jī)器翻譯譯文比較后,譯文質(zhì)量最佳,由此盡量控制MT譯文質(zhì)量這個(gè)客觀因素對(duì)譯后編輯的影響。
另外,為了再現(xiàn)譯后編輯的真實(shí)工作場(chǎng)景,為所有試驗(yàn)對(duì)象提供英漢術(shù)語(yǔ)表一份。并根據(jù)英語(yǔ)翻譯專業(yè)對(duì)學(xué)生翻譯能力一般/較高/更高的每小時(shí)翻譯字?jǐn)?shù)250/300/350的要求,以及聯(lián)合國(guó)翻譯標(biāo)準(zhǔn)對(duì)譯員每分鐘5個(gè)詞的要求,也考慮到學(xué)生譯者對(duì)機(jī)輔編輯的熟練程度,本研究限定譯后編輯的時(shí)間為45分鐘完成335個(gè)漢語(yǔ)原文的MT譯文的譯后編輯。
然后,在試驗(yàn)中主要測(cè)量不同水平的譯者的譯后編輯時(shí)間和停頓時(shí)間。此兩項(xiàng)數(shù)據(jù)通過(guò)Translog自動(dòng)收集得到,并通過(guò)線性表示(Linear View)和停頓圖(Pause Plot)展現(xiàn),整理后就可用于SPSS數(shù)據(jù)分析。試驗(yàn)中所采集的譯者譯后編輯操作數(shù)據(jù),都保存在一個(gè)翻譯過(guò)程數(shù)據(jù)XML文檔中??梢酝ㄟ^(guò)觀看Translog的錄屏回放功能,加載這個(gè)XML文檔再現(xiàn)譯者的鼠標(biāo)和鍵盤操作。譯后編輯的譯文質(zhì)量評(píng)價(jià)使用SDL Trados 2007(試用版)平臺(tái)計(jì)算與參考譯文的相似度判定,最大限度地避免采用人工評(píng)價(jià)可靠性差所帶來(lái)的干擾。
三、研究結(jié)果
首先觀察來(lái)自Translog自動(dòng)采集的統(tǒng)計(jì)數(shù)據(jù)信息,以及在各測(cè)量指標(biāo)上的組間方差t檢驗(yàn)結(jié)果。
如表1所示,兩組受試對(duì)象的譯后編輯時(shí)間(PED, Post-editting Time)均值都小于任務(wù)規(guī)定完成時(shí)間,而譯后編輯速度(Speed)均值都超過(guò)聯(lián)合國(guó)標(biāo)準(zhǔn)(每分鐘5個(gè)詞)兩倍多。該研究未設(shè)置人工翻譯對(duì)照組,并不能推斷出兩組學(xué)生譯者的譯后編輯效率比人工翻譯的高。從表1中不考慮有效停頓時(shí)間的前7項(xiàng)指標(biāo)均值和t檢驗(yàn)結(jié)果看,表1反映出高級(jí)學(xué)生譯者的表現(xiàn)優(yōu)于初級(jí)學(xué)生譯者,分別是以分鐘為單位的譯后編輯時(shí)間,以分鐘為單位的停頓總時(shí)間(PD, Pause Duration),以詞/分鐘為單位的譯后編輯速度,以百分比表示的譯后編輯譯文和參考譯文的相似度(SPR, Similarity Between PE Version and Reference),鼠標(biāo)和鍵盤操作總量(KMS, Key and Mouse Stroke),以秒/詞為單位的平均編輯用時(shí)(PED.W, PED per Word),以秒/詞為單位的平均停頓用時(shí)(PD.W, PD per Word)。但是,兩組譯者在這7項(xiàng)指標(biāo)上的獨(dú)立樣本t檢驗(yàn)結(jié)果又表明,他們的表現(xiàn)沒(méi)有顯著性差異,即自由度為10時(shí)|t■|小于雙尾檢驗(yàn)的t■值2.228,以及概率值均大于0.05。
不考慮有效停頓,只觀察譯后編輯總時(shí)間和停頓總時(shí)間等指標(biāo)并不能全部揭示譯者的真實(shí)譯后編輯水平,因?yàn)橹挥性谧g后編輯時(shí)間達(dá)到一定長(zhǎng)度的停頓才是有效的認(rèn)知過(guò)程。而且為了得出質(zhì)量最佳的修改方案,認(rèn)知難度大的要比難度小的目標(biāo)文本耗費(fèi)更長(zhǎng)的停頓時(shí)間。Jakobsen (1998)最早提出要以1秒停頓時(shí)作為標(biāo)準(zhǔn),而Rydning(2002)則以5秒為分界。本研究采用5秒作為判定有效停頓的依據(jù)。表1反映出兩組譯者在有效停頓的數(shù)量(No.P, Number of Effective Pause),以秒/次為單位的有效停頓次數(shù)在停頓總時(shí)長(zhǎng)中的占比(PD_No.P, Effective Pause per Pause Duration),以及平均停頓率(P.Ratio, Ratio of PD_No.P and PD_W)這三項(xiàng)指標(biāo)上都存在統(tǒng)計(jì)學(xué)上的顯著性差異,即自由度為10時(shí)|t■|大于雙尾檢驗(yàn)的t■值2.228,以及概率值均小于0.05。
再對(duì)譯者譯后編輯總時(shí)間、停頓總時(shí)間、編輯速度、鼠標(biāo)鍵盤編輯操作數(shù)量、譯文相似度和平均停頓率5項(xiàng)指標(biāo)做Spearman等級(jí)相關(guān)檢驗(yàn),結(jié)果如表2:
從表2可以看出,編輯速度與編輯操作量這兩項(xiàng)指標(biāo)與其他各項(xiàng)指標(biāo)都存在強(qiáng)相關(guān),只是前者與PED、PD和KMS是強(qiáng)負(fù)相關(guān),與SPR和P.Ratio強(qiáng)正相關(guān)。這表明譯后編輯用時(shí)越多,編輯操作的量隨之增多,速度也降低。編輯操作數(shù)量與PED和PD呈強(qiáng)正相關(guān),與P.Ratio強(qiáng)負(fù)相關(guān),即擊鍵數(shù)伴隨用時(shí)的增加而增加,平均停頓率高的反而編輯操作數(shù)量少。另外一個(gè)有意義的發(fā)現(xiàn)是速度與譯文相似度的正相關(guān),盡管不是很高,但也達(dá)到0.626。這點(diǎn)再次驗(yàn)證了表1的數(shù)據(jù),即盡管翻譯能力高、低兩組學(xué)生譯者之間的編輯速度和編輯操作數(shù)量等7項(xiàng)指標(biāo)之間沒(méi)有顯著性差異,但是高級(jí)學(xué)生譯者組的譯后編輯質(zhì)量較高,速度較高。表2數(shù)據(jù)分析結(jié)果驗(yàn)證了一個(gè)很顯見(jiàn)但是容易被忽視的一個(gè)道理,即譯后編輯速度與編輯操作數(shù)量的強(qiáng)相關(guān)達(dá)到了負(fù)0.860,即如要提高速度,可以線盡力把編輯操作總量降下來(lái)。下一部分還會(huì)詳細(xì)討論和解釋表1和表2的發(fā)現(xiàn)。
四、停頓時(shí)間與效率相關(guān)性討論
高級(jí)與初級(jí)譯者在停頓時(shí)間內(nèi)所做的編輯操作的層級(jí)有差別。高級(jí)譯者具有對(duì)原文全局理解和能力,會(huì)用大量的停頓對(duì)機(jī)器翻譯譯文及原文做總體分析,決定下一步的修改行為。初級(jí)譯者雖然每次的停頓時(shí)間比較短,但普遍缺乏整體意識(shí),所以高級(jí)譯者的譯后編輯多發(fā)生在宏觀層級(jí),如對(duì)從句和句法的修改,初級(jí)譯者的譯后編輯行為多發(fā)生在微觀層級(jí),如詞匯和短語(yǔ)的修改。因此,初級(jí)譯者會(huì)用停頓的時(shí)間修改機(jī)器譯文中的各種錯(cuò)誤,高級(jí)譯者在改正錯(cuò)誤的同時(shí)還會(huì)停頓一下思考如何潤(rùn)色譯文,以便譯文質(zhì)量盡力同時(shí)達(dá)到“準(zhǔn)確、簡(jiǎn)潔、客觀和通暢”。這種停頓行為會(huì)反映到譯后編輯的效率上,即初級(jí)譯者需要更多次數(shù)的修改和頻繁的停頓思考如何才能生成合格的譯文,而且多數(shù)修改缺乏整體意識(shí),很少有兼顧高層級(jí)的句子、段落和篇章的調(diào)整,多是字詞語(yǔ)法錯(cuò)誤和拼寫錯(cuò)誤的修改。
如表1和表2所證實(shí)的,兩類譯者的停頓時(shí)間總體無(wú)顯著性差異,但是有效停頓次數(shù)、在停頓總時(shí)長(zhǎng)中有效停頓次數(shù)的占比和平均停頓率三項(xiàng)指標(biāo)上都呈現(xiàn)顯著性差異。通過(guò)查看Translog的線性表示后,發(fā)現(xiàn)高級(jí)學(xué)生譯者對(duì)問(wèn)題解決方案的甄選過(guò)程比較復(fù)雜,而初級(jí)學(xué)生譯者則明顯缺乏統(tǒng)籌兼顧的元策略意識(shí)。以下表3所展示的是高級(jí)與初級(jí)譯者對(duì)同一句機(jī)器翻譯譯文編輯過(guò)程的線性表示,可以直觀揭示這一現(xiàn)象。漢語(yǔ)原文是:“發(fā)包方協(xié)助承包方進(jìn)行施工現(xiàn)場(chǎng)總平面管理,確?,F(xiàn)場(chǎng)文明施工”。
從表3可以看出,盡管兩者的譯后編輯質(zhì)量都可算合格水平,但高級(jí)學(xué)生譯者卻用時(shí)較少(44′′258 Vs 1′03″228),刪除操作明顯較少(2次 Vs 12次),增加文本量較少(17個(gè)字符 Vs 19個(gè)字符),每分鐘的編輯速度也較快(51.516次 Vs 47.2次)。仔細(xì)查看Translog回放后發(fā)現(xiàn),高級(jí)學(xué)生譯者從一開始就有一個(gè)較長(zhǎng)的停頓,后來(lái)還有一段與其他程序互動(dòng)的過(guò)程。但是,初級(jí)學(xué)生譯者一開始就急于刪除機(jī)器譯文中增譯的“shall”,以至于此后馬上發(fā)現(xiàn)產(chǎn)生了主謂不一致錯(cuò)誤,只能在“assist”后加“s”后綴修正。而且在發(fā)現(xiàn)第二個(gè)“ensure確?!睉?yīng)和“assist協(xié)助”同是并列謂語(yǔ)后,刪除了“to”,卻又帶來(lái)了主謂不一致錯(cuò)誤,只能再次在“ensure”后加“s”修正。這一切都是初級(jí)學(xué)生譯者缺乏經(jīng)驗(yàn)和沒(méi)有整句意識(shí)的表現(xiàn)。與此相反,高級(jí)學(xué)生譯者不但糾正了機(jī)器譯文中明顯屬于多義詞誤用的錯(cuò)誤,把“plane”修改為“l(fā)ayout”,還把最后的“on site”重復(fù)成分省譯處理。再反觀初級(jí)學(xué)生譯者,不但缺乏對(duì)“plane”一詞的誤用做深入思考和求證的過(guò)程,而且未發(fā)現(xiàn)“on site”這個(gè)英語(yǔ)應(yīng)該省譯的重復(fù)成分。
五、譯后編輯操作與效率相關(guān)性討論
學(xué)者一般認(rèn)為鼠標(biāo)和鍵盤操作反映了譯者的編輯策略,但是是否與效率構(gòu)成一對(duì)因果關(guān)系看法不一(Arenas, 2014) [4]。本研究的發(fā)現(xiàn)支持譯后編輯操作的總量與譯后編輯時(shí)間呈強(qiáng)正相關(guān),與譯后編輯速度呈強(qiáng)負(fù)相關(guān),即編輯操作越多,耗費(fèi)的時(shí)間變長(zhǎng),速度變慢,效率降低。另外,本研究同時(shí)發(fā)現(xiàn)譯者的平均停頓率與譯文相似度的相關(guān)系數(shù)大于譯后編輯操作數(shù)量與譯文相似度的相關(guān)系數(shù)(|0.513|>|-0.4501|)。這意味著高級(jí)譯者組的編輯操作的絕對(duì)數(shù)量上不顯著高于初級(jí)譯者組的情況下,兩組之間在編輯操作的類型特征上必定存有差異。
根據(jù)Translog錄屏回放,可以看出效率差異的決定因素并不局限于編輯操作的數(shù)量,主要是由于編輯操作的類型,即編輯的策略。本研究中的譯者編輯策略主要指的是使用鼠標(biāo)和鍵盤對(duì)譯文內(nèi)容的修改方式,可分為拖拽、復(fù)制粘貼內(nèi)容、增加或刪除內(nèi)容、替換內(nèi)容和修正打字錯(cuò)誤。表3中所示的例子典型地反映了兩種不同的編輯策略。高效的策略會(huì)伴隨有較少的打字行為,增刪內(nèi)容不重復(fù),經(jīng)常使用鼠標(biāo)先選中待編輯內(nèi)容后再進(jìn)行刪除、移動(dòng)和替換的操作。初級(jí)學(xué)生譯者的編輯策略伴隨有較多的重復(fù)打字行為,添加和刪除內(nèi)容等操作多有重復(fù),而且缺乏整體規(guī)劃,經(jīng)常難以高效利用既有的機(jī)器譯文。兩組譯者的打字失誤雖然沒(méi)有統(tǒng)計(jì)學(xué)上的顯著性差異,但初級(jí)譯者往往由于語(yǔ)言能力不夠或元策略缺乏而出現(xiàn)打字失誤。意味著同時(shí)會(huì)出現(xiàn)增刪內(nèi)容的重復(fù)編輯動(dòng)作,降低效率。
六、結(jié)語(yǔ)
該研究對(duì)影響譯后編輯效率的主觀因素進(jìn)行分析,采用Translog的技術(shù)路徑,從譯者停頓和編輯操作兩個(gè)方面進(jìn)行定量分析。研究結(jié)果表明,在兩組譯者中,高級(jí)學(xué)生譯者的停頓時(shí)間更少,并與初級(jí)學(xué)生譯者組無(wú)顯著性差異,但是平均停頓率前者顯著高于后者。在編輯操作總數(shù)量上,高級(jí)學(xué)生譯者更少,兩組無(wú)顯著差異,但錄屏回放揭示出高級(jí)學(xué)生譯者的編輯策略更高效。
參考文獻(xiàn):
[1]Vieira L. N.. Indices of cognitive effort in machine translation post-editing[J]. Machine Translation, 2014,28(3-4):187-216.
[2]OBrien S.. An Empirical Investigation of Temporal and Technical Post-Editing Effort[J]. Translation & Interpreting Studies, 2007,2(1):83-136.
[3]OBrien, L. W., Balling, M. Carl, M. Simard, & L. Specia (red.). Post-Editing of Machine Translation: Processes and Applications[M]. Newcastle upon Tyne: Cambridge Scholars Publishing, 2014:147-169.
[4]Arenas A. G.. Correlations between productivity and quality when post-editing in a professional context[J]. Machine Translation, 2014,28(3-4):165-186.
本研究由華北電力大學(xué)2018—2019年度教育教學(xué)改革項(xiàng)目基金支持。