三峽大學(xué) 田緒軍
如果要消除專(zhuān)業(yè)譯者對(duì)于機(jī)器翻譯偏見(jiàn)和擔(dān)憂(yōu),機(jī)器翻譯系統(tǒng)需要一種新的形象,包括對(duì)其性能的現(xiàn)實(shí)看法。人們采用機(jī)器翻譯的不同目的關(guān)系重大,因?yàn)檫@種多樣性將保證機(jī)器翻譯研究的繼往開(kāi)來(lái)。此外,一些大學(xué),如卡內(nèi)基梅隆大學(xué)、馬里蘭大學(xué),京都大學(xué)、艾塞克斯大學(xué),蒙特利爾大學(xué)和韓國(guó)高等科技學(xué)院等和一些私營(yíng)公司,如美國(guó)電話(huà)電報(bào)公司、IBM、微軟、日本電話(huà)電報(bào)公共公司、全錄復(fù)印機(jī)、Systran和索尼等,一直都積極參與機(jī)器翻譯研究。
但是,如我們所見(jiàn),許多項(xiàng)目仍然處在起始或?qū)嶒?yàn)階段,因此對(duì)大眾的吸引力不強(qiáng)。由于系統(tǒng)很初始,其結(jié)構(gòu)和翻譯出來(lái)的作品只能供研究人員討論、參考,目前還不能為大眾服務(wù)。
當(dāng)前,我們?cè)谝恍┓g工作站或者是大公司內(nèi)部網(wǎng)客戶(hù)服務(wù)器系統(tǒng)上可以看到可操控性機(jī)器翻譯系統(tǒng)。專(zhuān)業(yè)譯者以及一般用戶(hù)都能夠使用機(jī)器翻譯系統(tǒng)和在線(xiàn)機(jī)器翻譯服務(wù)。但是在未來(lái),帶有翻譯功能的集成商業(yè)翻譯系統(tǒng)和在線(xiàn)機(jī)器翻譯系統(tǒng)很會(huì)變得更為普遍。當(dāng)前試驗(yàn)的交互式機(jī)器翻譯系統(tǒng)經(jīng)過(guò)發(fā)展,將成為商業(yè)翻譯系統(tǒng),這些商業(yè)翻譯系統(tǒng)通過(guò)發(fā)展和演變,能夠讓譯者完全控制其翻譯過(guò)程。機(jī)器翻譯系統(tǒng)翻譯出來(lái)的作品通常需要大量的譯后編輯才能出版,而這些系統(tǒng)將會(huì)讓譯者更加容易操控。(Macklovitch,Valderrabanos2001)。由于可以進(jìn)行人機(jī)交互,譯者可以在翻譯過(guò)程中進(jìn)行修改,因此,人機(jī)交互機(jī)器翻譯系統(tǒng)可以減少譯后編輯的工作量。另外,人們重新對(duì)機(jī)器翻譯產(chǎn)生興趣的背后的一個(gè)主要原因是人工翻譯不能滿(mǎn)足翻譯市場(chǎng)的需要。這將緩解“翻譯瓶頸”,同時(shí)為翻譯市場(chǎng)提供了巨大的機(jī)會(huì)。(Macklovitch:2001)。
數(shù)據(jù)驅(qū)動(dòng)法的誕生帶動(dòng)了自然語(yǔ)言處理領(lǐng)域的更多研究。目前可以通過(guò)像Google這樣的搜索引擎從網(wǎng)絡(luò)上檢索信息。(Macklovitch:2001)但是,為了獲得大量信息,我們需要更加強(qiáng)勁的跨語(yǔ)種的信息檢索方法。其中一個(gè)叫做多語(yǔ)種信息檢索(MLIR)。多語(yǔ)種信息檢索是指通過(guò)輸入一種語(yǔ)言查詢(xún),能夠從網(wǎng)絡(luò)或者是存儲(chǔ)的數(shù)據(jù)庫(kù)中檢索相關(guān)多語(yǔ)種文本和非文本(例如,聲音和圖象)材料的能力。如果終端用戶(hù)要閱讀收集來(lái)的多語(yǔ)種材料,這些材料隨即被翻譯成終端用戶(hù)所使用的語(yǔ)言。使用機(jī)器翻譯系統(tǒng)就能達(dá)到這個(gè)目的。但是,它不能翻譯所有語(yǔ)言。機(jī)器翻譯系統(tǒng)依賴(lài)于語(yǔ)言,因?yàn)樗菫榱颂囟ǖ哪承┱Z(yǔ)言和翻譯方向所設(shè)計(jì)的。即使在線(xiàn)機(jī)器翻譯系統(tǒng)也一樣,雖然它們能翻譯很多種語(yǔ)言,但是大多數(shù)仍然只能翻譯幾種常用的語(yǔ)言。因此,不是所有材料都能翻譯成終端用戶(hù)所使用的語(yǔ)言。而且,有些語(yǔ)言為了區(qū)別相似的詞,而在詞的前后、上下等作出各種各樣不同的標(biāo)記,來(lái)標(biāo)示其差別、口音和音調(diào),機(jī)器翻譯系統(tǒng)在處理這些標(biāo)記的時(shí)候特別容易犯錯(cuò)誤。結(jié)果,也許翻譯出來(lái)的譯文反而對(duì)終端用戶(hù)毫無(wú)用處。近年來(lái),關(guān)于多語(yǔ)種信息檢索和機(jī)器翻譯系統(tǒng)作為翻譯工具的研究和實(shí)驗(yàn)已經(jīng)在進(jìn)行。目前,雖然前景很可觀(guān),但是還有更多的工作要做---如何優(yōu)選收集的材料,尤其是從網(wǎng)絡(luò)上優(yōu)選收集的材料;如何使用終端用戶(hù)能理解的在線(xiàn)或者脫機(jī)系統(tǒng)提供足夠的翻譯。
對(duì)于機(jī)器翻譯研究未來(lái),Schaler,Way和Carl將翻譯質(zhì)量分為三個(gè)級(jí)別:高、中和低,對(duì)應(yīng)三種不同的文本類(lèi)型。最高級(jí),采用人工翻譯而不是機(jī)器翻譯,通常翻譯一些富含創(chuàng)作靈感的文本,比如,含有很多比喻的文本。廣告和戲劇屬于這種文本類(lèi)型。中等級(jí)別,人工翻譯和機(jī)器翻譯相結(jié)合,用來(lái)翻譯大量的不同領(lǐng)域的文本,對(duì)于這些文本,準(zhǔn)確性和格式相當(dāng)重要,尤其是圖表。這類(lèi)文本包括實(shí)驗(yàn)室報(bào)告和使用指南。最低級(jí)別,采用機(jī)器翻譯而不是人工翻譯來(lái)進(jìn)行大致意思的翻譯,通?;ㄙM(fèi)很小甚至沒(méi)有。譬如,那些在線(xiàn)機(jī)器翻譯系統(tǒng)翻譯的東西。Schaler,Way,Carl(2003)認(rèn)為,像這樣質(zhì)量要求不高的文本包括一些產(chǎn)品、服務(wù)和一般信息網(wǎng)頁(yè)。隨著翻譯技術(shù)研究與開(kāi)發(fā)的不斷進(jìn)步和更加可靠的翻譯系統(tǒng)的開(kāi)發(fā),預(yù)計(jì)機(jī)器翻譯的作用將象表中箭頭指示的那樣逐步增加。
機(jī)器翻譯的遠(yuǎn)景是樂(lè)觀(guān)的,但同時(shí)不僅需要公眾改變對(duì)翻譯的困難和自動(dòng)化局限方面的看法,而且要知道需要有不同類(lèi)型的翻譯(Macklovitch:2001)。此外,大多數(shù)機(jī)器翻譯系統(tǒng)詞匯量大,覆蓋范圍廣,而且能生成較低或中等質(zhì)量的翻譯。為了生成優(yōu)質(zhì)翻譯,機(jī)器翻譯系統(tǒng)必須僅限于一個(gè)非常小的具體領(lǐng)域---詞匯量和語(yǔ)法基于一種控制語(yǔ)言(住田和今村2002)。相應(yīng)地,許多商業(yè)系統(tǒng)專(zhuān)門(mén)設(shè)計(jì)為某些主題領(lǐng)域或有具體要求用戶(hù)服務(wù)(哈瓊斯1994)。在十年前,分析復(fù)雜句子、選擇最佳對(duì)等譯文和生成慣用語(yǔ)譯文等問(wèn)題都待解決,哈瓊斯(Hutchins:1994)指出,目前的情形和當(dāng)時(shí)一樣(Somers2003)。作為這個(gè)解決問(wèn)題的進(jìn)程一部份,研究人員們意識(shí)到翻譯自動(dòng)化決非易事。盡管擁有所需的知識(shí)、專(zhuān)家和技術(shù),仍然有許多問(wèn)題克服----處理那些經(jīng)常用不同的方式表達(dá)同意一個(gè)事物的不同語(yǔ)言。我們將在本章節(jié)的最后部分看到,計(jì)算機(jī)是遵循人們?cè)O(shè)定的程序規(guī)則的重要設(shè)備,并且它們很難處理這些“不一致”。此外,語(yǔ)言分析、轉(zhuǎn)化和綜合、學(xué)習(xí)和常識(shí)推理等問(wèn)題,特別是機(jī)器翻譯系統(tǒng),仍然需要充分解決。
我們可能還記得曾經(jīng)企圖用新一代基于語(yǔ)科庫(kù)的機(jī)器翻譯系統(tǒng)取代舊的基于規(guī)則的系統(tǒng),但成效不是很顯著。在這個(gè)問(wèn)題上,有一點(diǎn)很重要,那就是基于語(yǔ)科庫(kù)的方法不應(yīng)該被當(dāng)成另外一種選擇,而是為對(duì)基于規(guī)則的方法的補(bǔ)充完善。雖然基于語(yǔ)科庫(kù)的方法的優(yōu)點(diǎn)是他們先前翻譯的材料中生成新的翻譯,但是要讓基于語(yǔ)科庫(kù)的機(jī)器翻譯系統(tǒng)更加功能強(qiáng)大,仍然需要語(yǔ)言學(xué)知識(shí)。因而當(dāng)前機(jī)器翻譯的研究方向傾向于綜合基于語(yǔ)科庫(kù)的機(jī)器翻譯系統(tǒng)和基于規(guī)則的方法,這就是“綜合法”。結(jié)果,隨著時(shí)間的推移,許多機(jī)器翻譯系統(tǒng)改變了,有的改變了結(jié)構(gòu),有的變成了綜合體,還有的繼續(xù)保留他們各自不同的方法。
技術(shù)上的變化也引起了觀(guān)點(diǎn)上的變化,甚至包括那些對(duì)機(jī)器翻譯持懷疑態(tài)度的人,主要是因?yàn)榻?jīng)濟(jì)方面的可行性和在某些方面使用機(jī)器翻譯系統(tǒng)更有優(yōu)勢(shì)。實(shí)際上,一些專(zhuān)家指出:在一個(gè)多語(yǔ)種世界里,機(jī)器翻譯是形形色色的多功能自然語(yǔ)言處理程序世界的一個(gè)重要的工具(Bell:2001)。
[1]Archer,J.(2002)’Internationalisation,Technology and Translation’,in Perspectives:Studies in Translatology,10(2):87-117.
[2]Bell,R.(1991)Translation and Translating:Theory and Practice,London:Longman.
[3]Baker,M.(2001)’Investigating the Language of Translation:A Corpus-based Approach’,in Patfmays of Translation Studies,P.Fernandez Nistal andJ.M.Bravo Gozalo(eds).Spain:Centre Buendia,Universidad de Valladolid.
[4]Catford,J.C.(1965)A Linguistic Theory of Translation.London:Oxford University Press.
[5]Gamper,J.and P.Dongilli(1999)’Primary Data Encoding of a Bilingual Corpus’,Proceedings of GLDV,Germany,http://www.inf.unibz.it/~dongilli/papers/gldv-99.pdf.November 2004.
[6]Godwin-Jones,B.(2001)’Emerging Technologies:Tools and Trends in Corpora use for Teaching and Learning’,Language Learning and Technology,55(3):7-12.
[7]Hutchins,W.J.and H.L.Somers(1994)An Introduction to Machine Translation.London:Academic Press Limited.
[8]Macklovitch,E.(1999)’Regional Survey:M(A)T in North America’,Proceedings of MT Summit VII,Singapore:73-9.
[9]Schaler,R.,A.Way and M.Carl(2003)’EBMT in a Controlled Environment’,in Recent Advances in Example-based Machine Translation:Text,Speech and Language Technology,Vol.21,M.Carl and A.Way(eds)(2003a).Dordrecht:Kluwer Academic:83-114.