安帥飛 邵楨貽
當(dāng)前,隨著計(jì)算能力的增長(zhǎng)、算法的改進(jìn)完善,經(jīng)驗(yàn)主義導(dǎo)向下的機(jī)器翻譯取得了顯著的成就。Google等在線翻譯平臺(tái)對(duì)傳統(tǒng)翻譯行業(yè)造成了很大的沖擊,甚至有取代翻譯職業(yè)的輿論狂潮。但大規(guī)模的計(jì)算能力和不斷升級(jí)的算法并非萬(wàn)能,在口語(yǔ)題、小說(shuō)題等非規(guī)范本文上的翻譯處理上,效果仍不理想。本文使用小說(shuō)體裁對(duì)Google翻譯在線和多語(yǔ)種即時(shí)在線翻譯_百度翻譯兩大在線翻譯平臺(tái)進(jìn)行評(píng)測(cè)實(shí)驗(yàn),分析實(shí)驗(yàn)結(jié)果,力求提出改進(jìn)翻譯效果的芻議。
實(shí)驗(yàn)所用語(yǔ)句選自金庸所著《笑傲江湖》和《倚天屠龍記》共6句,體裁為小說(shuō)。列舉如下:
1.莫非是田伯光?又莫非是不戒和尚?
2.劉師叔金盆洗手大事,請(qǐng)暫行押后。
3.劉姑娘,請(qǐng)你在這里稍待片刻。
4.嵩山派來(lái)了多少弟子,大家一齊現(xiàn)身罷!
5.天下英雄在此,你膽敢動(dòng)我兒一根寒毛,你數(shù)十名嵩山弟子盡皆身為肉泥。
6.多謝姑娘。
①Google翻譯在線http://translate.google.cn/
②多語(yǔ)種即時(shí)在線翻譯_百度翻譯 http://fanyi.baidu.com/?aldtype=16047#auto/zh
將《笑傲江湖》和《倚天屠龍記》中所選的20句小說(shuō)句放在兩大在線翻譯平臺(tái)進(jìn)行測(cè)試,得到結(jié)果如下:
1.Google:Could it be Tian Bo light? Is it not a monk?
百度:Could it be Tian Boguang?Is it possible not to quit monks?
2.Google:Liu Shishu gold basin wash your hand, please temporarily postponed.
百度:Uncle Liu wash event,please postpone the interim.
3.Google:Liu girl, please stay here for a moment.
百度:Liu Guniang, please stay here for a while.
4.Google:Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
5.Google: The world heroes in this, you dare to move me a cold hair, you dozens of Songshan disciples as all as mud.
百度:Hero in the world here, you dare to move a finger on my son, you dozens of Songshan disciples all being minced meat.
6.Google:Thank the girl.
百度:Thank you girl.
經(jīng)過(guò)觀察分析,上述翻譯大致出現(xiàn)了6類錯(cuò)誤,分別如下:
①中文分詞錯(cuò)誤,導(dǎo)致錯(cuò)誤斷句,句子結(jié)構(gòu)分析不正確。
例:嵩山派來(lái)了多少弟子,大家一齊現(xiàn)身罷!
Google:Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
根據(jù)翻譯結(jié)果可以判斷得到,Google和百度翻譯系統(tǒng)在處理該例句時(shí),將專有名詞“嵩山派”斷句為:嵩山|派,誤將‘派’處理為動(dòng)詞,譯為‘sent’。詞庫(kù)中,專有名詞“嵩山派”出現(xiàn)次數(shù)過(guò)少或缺失。
②人名等專有名詞的翻譯錯(cuò)誤。
以例句1來(lái)進(jìn)行說(shuō)明。
例:莫非是田伯光?又莫非是不戒和尚?
Google:Could it be Tian Bo light? Is it not a monk?
百度:Could it be Tian Boguang?Is it possible not to quit monks?
例句中,‘田伯光’、‘不戒和尚’在小說(shuō)中是人名,屬于專有名詞,在Google翻譯平臺(tái)中被錯(cuò)誤翻譯 為 ‘Tian Bo ligh’,‘not a monk(不一個(gè)和尚)’?!唤浜蜕小诎俣确g中被譯為‘not to quitmonks(不去放棄和尚)’。
③隱喻、比喻等被直譯成字面意義。
例:天下英雄在此,你膽敢動(dòng)我兒一根寒毛,你數(shù)十名嵩山弟子盡皆身為肉泥。
Google:The world heroes in this, you dare to move me a cold hair, you dozens of Songshan disciples as all as mud.
百度:Hero in the world here, you dare to move a finger on my son, you dozens of Songshan disciples all being minced meat.
例句中‘一根寒毛’、‘肉泥’皆為隱喻用法,而在Google和百度翻譯平臺(tái)中被直譯為‘a(chǎn) cold hair’、‘minced meat’等,明顯偏離真實(shí)語(yǔ)義。
④成語(yǔ)、慣用語(yǔ)等被直譯成字面意義。
例:劉師叔金盆洗手大事,請(qǐng)暫行押后。
Google:Liu Shishu gold basin wash your hand, please temporarily postponed.
百度:Uncle Liu wash event,please postpone the interim.
例句中,成語(yǔ)‘金盆洗手’在Google翻譯平臺(tái)中被直譯為‘gold basin wash your hand’,明顯偏離真實(shí)語(yǔ)義。在百度翻譯平臺(tái)被漏譯為‘wash’,也是錯(cuò)誤的。
⑤在處理一詞多義時(shí),選擇了錯(cuò)誤的詞義。
例:劉姑娘,請(qǐng)你在這里稍待片刻。
Google:Liu girl, please stay here for a moment.
百度:Liu Guniang, please stay here for a while.
例句中,‘姑娘’為多義詞,可以表示女孩,也可以用作稱謂詞。Google翻譯平臺(tái),在詞義優(yōu)選過(guò)程中,選擇了錯(cuò)誤的詞義‘girl’。百度翻譯平臺(tái)則是直接給出了漢語(yǔ)拼音。
⑥復(fù)句的分句主語(yǔ)判斷錯(cuò)誤。
例:嵩山派來(lái)了多少弟子,大家一齊現(xiàn)身罷!
Google:Songshan sent a number of disciples, everyone came together!
百度:Songshan sent a number of disciples, we all come together!
例句中的第二個(gè)小句主語(yǔ)‘大家’指嵩山派弟子,Google將其翻譯為‘everyone’,勉強(qiáng)可以接受,百度將其譯為‘we’,則明顯是錯(cuò)誤的。
對(duì)非規(guī)則文本處理上,詹衛(wèi)東(2017)引入構(gòu)式語(yǔ)法,提出通過(guò)構(gòu)建構(gòu)式知識(shí)庫(kù)來(lái)搭建基礎(chǔ)的語(yǔ)料資源。本文結(jié)合對(duì)實(shí)驗(yàn)結(jié)果的分析,根據(jù)對(duì)錯(cuò)誤結(jié)果的特征分析,對(duì)改善小說(shuō)題機(jī)器翻譯提出三點(diǎn)建議。
在專門領(lǐng)域翻譯平臺(tái)上,針對(duì)不同的領(lǐng)域,使用不同的知識(shí)庫(kù)。這樣,進(jìn)行諸如例6一詞多義的優(yōu)先選擇時(shí),可能會(huì)出現(xiàn)不同的結(jié)果。在領(lǐng)域知識(shí)庫(kù)中,‘姑娘’一詞中各個(gè)詞義的優(yōu)先級(jí)不一定等同于通用知識(shí)庫(kù)。一般來(lái)看,在通用知識(shí)庫(kù)中,‘姑娘’的優(yōu)先級(jí)應(yīng)是:女孩(girl)>稱謂詞(Miss),而在小說(shuō)體裁的知識(shí)庫(kù)中,‘姑娘’的優(yōu)先級(jí)更可能是:稱謂詞(Miss)> 女孩(girl)。
在增設(shè)領(lǐng)域翻譯平臺(tái)的基礎(chǔ)上,豐富知識(shí)庫(kù)。主要有兩個(gè)方面:
①是要增加人名、地名等專有名詞,以解決分詞錯(cuò)誤、專名翻譯錯(cuò)誤等問(wèn)題。
②是要增設(shè)成語(yǔ)、慣用語(yǔ)対譯資源庫(kù),以避免字面直譯,偏離真實(shí)含義。
指代消解問(wèn)題是自然語(yǔ)言處理不可回避的部分,漢語(yǔ)中的回指主要有三種形式:零形回指、代詞回指和名詞回指(陳平,1987)。其中,零形回指的出現(xiàn)頻率最高,使用最廣泛(黃嫻,2009)。需要特別注意,回指的消解問(wèn)題,不只出現(xiàn)在句間,也出現(xiàn)在單個(gè)句子內(nèi)部(例句7)。在領(lǐng)域翻譯平臺(tái)上,增加指代消解機(jī)制,以判定代詞等指示詞的指示對(duì)象,明晰句子成分,消除歧義。