肖塵依萱 王麗霞
(湖南工程學(xué)院,湖南 湘潭 411104)
近年來,語音識別與轉(zhuǎn)寫技術(shù)及神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)逐漸進(jìn)入視聽翻譯領(lǐng)域,改變了傳統(tǒng)的人工翻譯字幕模式。自動字幕翻譯技術(shù)能夠從影片中提取數(shù)據(jù),創(chuàng)建機(jī)器翻譯語料庫[1],字幕翻譯與技術(shù)的不斷融合成為視聽翻譯領(lǐng)域的重要的趨勢[2]。“網(wǎng)易見外”工作臺成為評估機(jī)器翻譯字幕質(zhì)量的重要實驗平臺[3],然而卻自2020年3月停運(yùn)至今。因而要了解當(dāng)前漢英雙向語言對應(yīng)的機(jī)器翻譯字幕技術(shù),需關(guān)注市場上使用規(guī)模廣、發(fā)展速度快的字幕翻譯工具。因此,文章選取Arctime Pro,人人譯視界、百度視頻翻譯平臺翻譯了習(xí)近平總書記2021年的新年賀詞視頻,并基于FAR模型對比了機(jī)器翻譯與人工翻譯的字幕質(zhì)量。
文章的源語文本為習(xí)近平總書記在2020年12月31日晚7時發(fā)表的2021年新年賀詞。視頻時長10分14秒,總計1264字,語言為標(biāo)準(zhǔn)普通話,語速適中,語法規(guī)范,邏輯清晰且結(jié)構(gòu)完整。在央視網(wǎng)(www.cctv.com)上可下載“習(xí)近平總書記2021新年賀詞”高清視頻,音質(zhì)清晰無雜音,畫面清楚無卡頓且聲畫同步。
1.機(jī)器翻譯組選取了Arctime Pro、人人譯視界和百度視頻翻譯平臺三個軟件對源語文本進(jìn)行翻譯,具體步驟如下:
(1)Arctime Pro(AP):導(dǎo)入視頻,選擇“全自動整段語音識別”,設(shè)定媒體語言(中文普通話)和引擎,約5分鐘后獲取中文字幕,選擇“批量翻譯字幕”,設(shè)定目標(biāo)語言為“英語”,約2分鐘后翻譯完成。
(2)人人譯視界(人人):導(dǎo)入視頻,點擊AI聽譯,選擇識別語言為“中文”,翻譯語言為“英語”,口音分別選擇“普通話(中國大陸)”“美音”,約8分鐘后聽譯完成。
(3)百度視頻翻譯平臺(百度):在網(wǎng)站上傳視頻,填寫翻譯需求,選擇源語言為“中文”,口音為“普通話(中國大陸)”,目標(biāo)語言為“英文”,交稿格式為“SRT字幕文件”,確認(rèn)訂單信息,約3分鐘后翻譯完成。
2.人工翻譯組對譯者身份進(jìn)行了進(jìn)一步細(xì)分:
(1)A組是中國國際電視臺(CGTN)的視頻直播字幕。在電視臺官網(wǎng)上找到2021年新年賀詞的視頻,按時間軸整理出字幕文本。
(2)B組是三名擁有三年以上從業(yè)經(jīng)驗的民間譯員的譯本。他們都接受過專業(yè)的翻譯理論和實踐訓(xùn)練,持有英語專業(yè)八級證書、翻譯專業(yè)資格證書等英語語言能力證明。
(3)C組譯本來自國內(nèi)本科院校英語專業(yè)的大四本科生6名(英語專業(yè)四級考試成績?yōu)榱己眉耙陨?,分為C1組(三人)和C2組(三人),要求C1組以團(tuán)隊協(xié)作的方式翻譯字幕,C2組學(xué)生獨(dú)自翻譯,分別得到譯文。
本次評估依據(jù)的是斯德哥爾摩大學(xué)翻譯學(xué)教授讓·彼得森(Jan Pederson)在2017年提出的FAR模型?!癋AR”代表功能對等(Functional Equivalence)、接受程度(Acceptability)和閱讀體驗(Readability)三個評估緯度。該模型以單句字幕為單位,采用錯誤分析和扣分制來判定字幕的翻譯準(zhǔn)確度。依據(jù)錯誤程度設(shè)置扣分權(quán)重為輕微(Minor)、中等(Standard)和嚴(yán)重(Serious)三個等級,輕微錯誤是指類似詞匯拼寫、標(biāo)點遺漏等小錯誤,中等錯誤則會影響到大部分觀眾閱讀體驗,嚴(yán)重錯誤會影響到觀眾對多句字幕的理解。其中語義類錯誤因影響更大,在三個等級的扣分比其他類錯誤要多。依據(jù)肖維青、高佳暉[3]和王建華、李靜[4]對FAR模型中各項標(biāo)準(zhǔn)的翻譯,此處將具體扣分標(biāo)準(zhǔn)整理如下:
表1 “FAR字幕評估模型”評分標(biāo)準(zhǔn)
續(xù)表
為進(jìn)一步量化得分,此次規(guī)定在“切分與同步”類錯誤中,聲畫與字幕同步誤差不到1秒為輕微錯誤,1秒到2秒為中等錯誤,2秒以上為嚴(yán)重錯誤。在“閱讀速度與句長”類錯誤中,15~20個字符/秒為輕微錯誤,20~25個字符/秒為中等錯誤,25~30個字符/秒為嚴(yán)重錯誤。在“標(biāo)點與字體”類錯誤中,根據(jù)“網(wǎng)飛”(Netflix)[5]的英文字幕標(biāo)點符號使用規(guī)范,規(guī)定兩句字幕之間時間少于2秒可以根據(jù)語義不使用標(biāo)點,單句字幕內(nèi)標(biāo)點符號錯誤1個為輕微錯誤,2個為中等錯誤,2個以上為嚴(yán)重錯誤。
FAR模型的評分計算基于NER模型,計算單個字幕翻譯樣本的準(zhǔn)確率公式為N-Errors/N×100=%[6]。此處N為單位數(shù)量(字幕條數(shù)),Errors包含F(xiàn)類(功能對等),A類(接受程度)和R類(閱讀體驗)三種錯誤。本次視頻素材的字幕共151條,提供給譯員的字幕同樣為151條。但是機(jī)器所識別的字幕條數(shù)為156條(AP)和160條(百度與人人)。因字幕總條數(shù)相差較小,對最終準(zhǔn)確率的影響較小,為真實反映機(jī)器翻譯的字幕識別與翻譯情況,此處不做統(tǒng)一。
從依據(jù)FAR模型對機(jī)器翻譯譯的質(zhì)量評估來看(見表2),Arctime Pro、百度視頻翻譯和人人譯視界都能迅速轉(zhuǎn)寫視頻的語音內(nèi)容,Arctime Pro的識別水平較高,能轉(zhuǎn)寫出“天問一號”“十四五”“大道不孤”等文化負(fù)載詞,而百度視頻翻譯和人人譯視界表現(xiàn)較差,如兩者都將“擘畫”識別為“破壞”,錯誤嚴(yán)重。
表2 機(jī)器翻譯樣本組質(zhì)量評估扣分匯總表
從譯文質(zhì)量來看,機(jī)器翻譯的功能對等類錯誤扣分最多,尤其是語義錯誤。其中百度視頻翻譯扣分最多,人人譯視界其次,Arctime Pro相對較少,與語音識別水平基本符合。百度視頻翻譯和人人譯視界無法譯出“中國共產(chǎn)黨”“嫦娥5號”等專有名詞和“生氣勃勃”“風(fēng)雨同舟”等成語,甚至將“咬定青山不放松”譯為“Qingshan does not relax”。相較而言,Arctime Pro的處理明顯更細(xì)致,如百度視頻翻譯與人人譯視界都將“人類命運(yùn)共同體”譯為“the community of human destiny”,而 Arctime Pro處理為“a community with a shared future for mankind”,語義更精準(zhǔn)。
在接受程度類錯誤上,Arctime Pro扣分最少,人人譯視界其次,百度視頻翻譯扣分最多。機(jī)器翻譯傾向于將跨越多行的長句拆分為獨(dú)立的短句。如將“2021年的腳步”與后半句“越來越近”譯為“The footsteps of 2021”和“closer and closer”,將“絢麗多姿的黃浦江畔”和“令人百感交集”譯為“The gorgeous Huangpu River bank”和“Mixed Feelings”,這處理會使得全句缺少了謂語動詞,導(dǎo)致前后句脫節(jié)。
在閱讀體驗方面,機(jī)器翻譯的少數(shù)句子譯文過長。如“歷久彌堅”一句時間軸為2秒,百度視頻翻譯譯為“remain unshakable and become even firmer as time goes by”,共47個字符,遠(yuǎn)超彼得森建議的每秒15個字符。而Arctime Pro處理為“It lasts for a long time”,更為簡練。另外,三個機(jī)器譯本都只在寒暄語中加了標(biāo)點,后文都幾乎沒有標(biāo)點。在中文字幕中,有時會省略標(biāo)點,以空格表示斷句,而在英文字幕中,每個單詞之間以空格間隔,沒有標(biāo)點標(biāo)注斷句,將會影響觀眾對字幕邏輯的把握。
從對人工翻譯的評估來看(見表3),A組字幕語義精準(zhǔn),無語法、拼寫錯誤,語句切分得當(dāng),標(biāo)點完整,只有少數(shù)字幕內(nèi)容過長,可能會影響閱讀速度。B組民間譯員的譯文標(biāo)點規(guī)范,語義完整。有幾處表達(dá)不夠精準(zhǔn),如“站在‘兩個一百年’的歷史交匯點”一句中,“兩個一百年”作為強(qiáng)調(diào)的重點,不宜模糊處理為“Standing at the cross point of history”;C組學(xué)生譯文的質(zhì)量則相對較差。C1組進(jìn)行團(tuán)隊翻譯但是并未對譯文質(zhì)量進(jìn)行統(tǒng)一把控。C2組譯文中出現(xiàn)嚴(yán)重語義錯誤,如將“邁上百萬億元新臺階”譯為“to reach a new level of one trillion yuan”。同時,學(xué)生有時會對多句字幕進(jìn)行合并處理,引起字幕與音畫的嚴(yán)重錯位。
表3 人工翻譯樣本組質(zhì)量評估扣分匯總表
從測評結(jié)果來看(見表4),CGTN字幕和民間譯文的質(zhì)量要高于學(xué)生譯文和機(jī)器翻譯。機(jī)器翻譯組中Arctime Pro的翻譯質(zhì)量要優(yōu)于人人譯視界和百度視頻翻譯,但是仍然很難超過普通高校英語專業(yè)大四學(xué)生的水平。
表4 機(jī)器翻譯與人工翻譯樣本組最終得分匯總表
由于機(jī)器識別能力有限,機(jī)器在識別視頻語音文本的誤差導(dǎo)致了譯文的語義錯誤、語法錯誤和切分錯誤。其中,Arctime Pro識別誤差較少,人人譯視界其次,百度視頻翻譯的準(zhǔn)確率較低,中國特色詞匯儲備明顯不足。機(jī)器翻譯無法為譯文添加標(biāo)點符號,使得字幕每句相互獨(dú)立,上下句銜接不夠連貫,將會影響觀眾的閱讀體驗。而人工翻譯中CGTN視頻翻譯與專業(yè)譯員能做到基本沒有語法錯誤,偶爾有拼寫錯誤,標(biāo)點較為完整,方便觀眾閱讀。
然而,在翻譯時間上,機(jī)器翻譯比起人工翻譯有著更大優(yōu)勢(見表5)。百度視頻翻譯、人人譯視界和Arctime Pro都能在10分鐘內(nèi)完成視頻文本的語音識別與自動翻譯,而人工翻譯組中,除了A組翻譯時間無法得知外,無論是B組還是C組完成翻譯都需要數(shù)小時。所以盡管當(dāng)前機(jī)器翻譯的質(zhì)量與人工翻譯相比有待提升,但其工作效率是譯員難以匹敵的。
表5 人工翻譯和機(jī)器翻譯時間對比
續(xù)表
依據(jù)對機(jī)器翻譯字幕的評估結(jié)果,文章從完善評估方法以及提高機(jī)器翻譯質(zhì)量兩方面提出了建議。
1.增加對機(jī)器翻譯語音識別水平的評估標(biāo)準(zhǔn)
FAR模型的評估對象主要為字幕譯文的準(zhǔn)確度和與音畫的匹配度。但機(jī)器在識別文本中出現(xiàn)了錯別字、語義錯誤、切分錯誤等問題,進(jìn)而導(dǎo)致譯文的翻譯錯誤。所以可以考慮增加標(biāo)準(zhǔn)首先評估機(jī)器軟件的語音識別水平,然后再測評譯文質(zhì)量和聲畫同步水平。
2.客觀反映觀眾閱讀體驗
此次基于FAR模型的人工測評結(jié)果會受到測評者能力水平的影響??梢钥紤]播放不同版本的字幕譯本,通過現(xiàn)場觀察和問卷調(diào)查了解觀眾的閱讀體驗評價。甚至可以對觀眾在年齡、性別、受教育背景等方面細(xì)分,為評估字幕質(zhì)量提供更加客觀的參考。
1.優(yōu)化機(jī)器翻譯字幕技術(shù)
機(jī)器的語音識別能力和翻譯水平是影響字幕質(zhì)量的兩個重要因素。在語音識別方面,機(jī)器需要提高識別能力,如要能根據(jù)語境區(qū)別中文中的同音詞和近音詞。同時,機(jī)器要擴(kuò)大語料庫,尤其是對中國文化負(fù)載詞的識別與翻譯。機(jī)器翻譯在切分句子時要注意上下句字幕的連貫性,保證語義流暢,語法完整。另外,還可以考慮依照不同主題為機(jī)器設(shè)定相應(yīng)的詞匯記憶庫。如設(shè)定“時政”“醫(yī)學(xué)”“法律”等多種類別,在識別和翻譯視頻文本時選擇相應(yīng)類別,提高譯文的準(zhǔn)確度。
2.人工編輯與機(jī)器翻譯相結(jié)合
譯員可以在機(jī)器識別與翻譯視頻字幕的過程中發(fā)揮更為積極的作用,在機(jī)器對視頻進(jìn)行語音識別與轉(zhuǎn)寫之后,譯者可以先核對和修正源語文本,在機(jī)器翻譯后,譯員同樣可對譯文字幕進(jìn)行語言、格式的編輯與校對。
從對Arctime Pro,百度視頻翻譯和人人譯視界的測評來看,當(dāng)前機(jī)器翻譯字幕的效率高、功能強(qiáng)大且使用方便,對視頻語言識別轉(zhuǎn)寫水平的高低直接影響了字幕翻譯的質(zhì)量,且對句子切分的獨(dú)立處理使得上下文不夠連貫,整體質(zhì)量與人工翻譯仍然存在較大差距。為進(jìn)一步提升漢英語言對的機(jī)器翻譯字幕水平,可以考慮在測評上增添對識別能力的評估標(biāo)準(zhǔn),參考更多的觀眾觀看體驗,譯者可以在機(jī)器翻譯的譯前與譯后進(jìn)行編輯,在利用機(jī)器提升翻譯效率的同時,改善字幕質(zhì)量,讓機(jī)器翻譯為中國文化作品的海外傳播做出更大貢獻(xiàn)。