亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于翻譯項(xiàng)目的計(jì)算機(jī)輔助翻譯工具述評

        2015-01-08 06:19:22廖志華
        重慶與世界(教師發(fā)展版) 2015年1期
        關(guān)鍵詞:電子詞典術(shù)語語料庫

        廖志華

        (電子科技大學(xué)中山學(xué)院,廣東中山 528402)

        計(jì)算機(jī)輔助翻譯(Computer-aided Translation or Computer Assisted Translation)是借助于計(jì)算機(jī)強(qiáng)大的記憶功能來進(jìn)行翻譯的一種人機(jī)互動技術(shù)。CAT和MT是兩個(gè)經(jīng)常被人誤解的概念,筆者以為它們的區(qū)別在于一個(gè)是機(jī)器自動翻譯,另一個(gè)是機(jī)器輔助人工進(jìn)行翻譯。在機(jī)器翻譯的基礎(chǔ)中進(jìn)行人工翻譯,在某些條件下也是切實(shí)可行的,比如用機(jī)器翻譯天氣預(yù)報(bào)。實(shí)踐證明,CAT技術(shù)對于非文學(xué)文本那種重復(fù)率很高或者相似度很高的文本,具有非常好的效果。作為21世紀(jì)的譯者,都應(yīng)該掌握好這樣的技術(shù),提高自己的生產(chǎn)效率,把自己的精力專注在更具創(chuàng)意的翻譯上面。國內(nèi)對CAT的研究都很多,通過搜索中國最大的學(xué)術(shù)搜索平臺,就可以得知大量CAT文章,很多文章在爭論CAT應(yīng)用的必要性,如蘇明陽分析了翻譯記憶,并提出一些學(xué)習(xí)的啟示[1];把MT和CAT進(jìn)行多方比較,如梁三云(2004)多方位分析比較了機(jī)器翻譯和計(jì)算機(jī)輔助翻譯;有的從CAT教學(xué)的角度來進(jìn)行研究,探討CAT教學(xué)的翻譯模式,比如郭紅提出了計(jì)算機(jī)輔助翻譯教學(xué)的模式,探討計(jì)算輔助翻譯的新模式[2],劉澤權(quán)等提出從語料庫和計(jì)算機(jī)技術(shù)結(jié)合起來的角度來進(jìn)行[3]。從理論和實(shí)踐結(jié)合來看,錢多秀提出了計(jì)算機(jī)輔助翻譯課程教學(xué)的一些思考,全方位地展現(xiàn)了計(jì)算機(jī)輔助翻譯[4]。從這些文章來看,更多地側(cè)重理論方面,顯得略顯宏觀,對于指導(dǎo)CAT軟件翻譯實(shí)踐,作用比較有限。本文擬從翻譯流程中的譯前、譯中和譯后來對翻譯工具進(jìn)行分類,歸納出一些實(shí)用的CAT工具,并結(jié)合自身翻譯實(shí)踐,對翻譯中所涉及到的翻譯進(jìn)行評點(diǎn),提供一些CAT學(xué)習(xí)應(yīng)該注意的地方,為CAT翻譯實(shí)踐提供一條便捷的途徑。

        一、關(guān)于計(jì)算機(jī)輔助翻譯工具

        計(jì)算機(jī)輔助翻譯工具有廣義和狹義之分,廣義上的計(jì)算機(jī)輔助翻譯是指譯者在翻譯過程中所運(yùn)用到各種工具,如計(jì)字計(jì)時(shí)軟件、文字處理軟件、電子詞典、搜索引擎、在線工具、格式轉(zhuǎn)換工具等。而狹義上的計(jì)算機(jī)輔助翻譯工具指的是翻譯記憶工具、術(shù)語提取工具、項(xiàng)目管理工具等[5]。在本文中,主要指廣義上的計(jì)算機(jī)輔助翻譯工具。翻譯工具可以按照翻譯流程,即譯前工具、譯中工具和譯后工具來進(jìn)行劃分。

        (一)譯前工具

        根據(jù)筆者在翻譯實(shí)踐中所獲取的經(jīng)驗(yàn),“譯前工具”指的是在翻譯預(yù)處理前的工具,一般用到的譯前工具會有計(jì)時(shí)計(jì)字軟件和格式轉(zhuǎn)換軟件。如果原文的排版格式不是很復(fù)雜,一般用MS Word計(jì)算字?jǐn)?shù)就可以。在實(shí)際的翻譯過程中,翻譯經(jīng)常碰到一個(gè)頭疼的問題就是格式轉(zhuǎn)換的問題,尤其是PDF,尤其是某些PDF由于版權(quán)的原因還有可能使用了加密設(shè)置,在這樣的情況之下,翻譯還必須去掉PDF密碼,根據(jù)筆者測試,去掉密碼比較好的軟件有Passware_Acrobat Key,Adult PDF Password Recovery v2.2.0 和 PDF Password Remover v2.2.細(xì)心的讀者都可以在網(wǎng)上找到這樣的軟件。用過PDF的人都知道,PDF有兩種形式,即文本格式,另一種則是圖片格式。鑒于PDF是由adobe公司開發(fā)的軟件,具有自己獨(dú)立的操作系統(tǒng),當(dāng)它置放到我們最常用的Window系統(tǒng)之中的時(shí)候,經(jīng)常就會出現(xiàn)這樣或那樣的問題。對于文本格式的,我們一般可以采用一些PDF轉(zhuǎn)化工具,常用的有 Nitro Pro 7,ABBYY FineReade,Solid Converter PDF,PDFConverter和Adobe Acrobat Pro,在它們的官方網(wǎng)站都可以找到其試用版本,轉(zhuǎn)化過來之后,它們都能夠較好地保持原文格式。為了測試文字版PDF的效果,筆者對幾款常見的PDF轉(zhuǎn)換工具的效果進(jìn)行了測試,得出表1結(jié)果。

        表1 幾款常見的PDF轉(zhuǎn)換工具的效果

        但對于圖片格式的PDF,一般排版格式會比較復(fù)雜,穿插很多圖片,圖片中又有文字,這樣就會顯得比較棘手。因此,先要采用文字識別軟件把它們轉(zhuǎn)變?yōu)槲淖中问?,常見的文字識別軟件有ABBYY FineReader、清華紫光OCR、漢王OCR和尚書七號等。目前而言,西文識別率最好的應(yīng)該是ABBYY FineReader,基本上能夠?qū)υ谋3州^好的格式;中文識別較好比較而言還是清華紫光OCR。此外,還有一些在線的OCR軟件,用戶把自己的文檔發(fā)送到它指定的網(wǎng)站,就可以進(jìn)行轉(zhuǎn)換,這些在線的OCR軟件有OnlineOCR和FreeOCR等,不過這些在線的OCR軟件文件的大小有限制。對于譯者而言,推薦使用ABBYY和清華紫光OCR軟件。至于計(jì)字軟件,文本預(yù)處理之后,采用Trados、Déjà Vu X、MemoQ和Wordfast等軟件就可以了。不過需要說明的是,譯員為了給客戶報(bào)價(jià),對于那些頁眉和頁腳都含有較多字?jǐn)?shù)的文件來說,可能還需要估算或者采用AnyCount、PractiCount and Invoice和Worddog來進(jìn)行處理。這對涉及到多人參與的大型翻譯項(xiàng)目中,體現(xiàn)得更為重要,因?yàn)橥谶@樣的項(xiàng)目中,按照文件的個(gè)數(shù)來分配翻譯任務(wù)大多數(shù)情況下是不可靠的。一個(gè)團(tuán)隊(duì)里面,少則幾百字,多則幾萬字的差別都可能存在,因此為保證任務(wù)的完成,根據(jù)統(tǒng)計(jì)的字?jǐn)?shù)來進(jìn)行統(tǒng)計(jì),相對而言會顯得比較科學(xué)。

        另外需要指出的是,在某些翻譯項(xiàng)目還有可能會用到術(shù)語抽取技術(shù),用來統(tǒng)一某些關(guān)鍵的術(shù)語,比較流行的術(shù)語抽取軟件有SDL Trados Extract。

        (二)譯中工具

        “譯中工具”指的是翻譯過程中會用到的工具,一般都會用到翻譯記憶(TM)工具、術(shù)語管理工具、術(shù)語查詢工具、電子詞典、機(jī)器翻譯、百科全書等。

        翻譯記憶(Translation Memory,TM),EAGLES(Expert Advisory Group on Language Engineering Standards)評估工作小組將其理解為包含了經(jīng)過分割、匹配、分析和分類后的(segmented,aligned,parsed and classified)多語文本 (multilingual text)的多語文本庫(multilingual text archive)。(EAGLES,1995:140,EAGLES,1999:106)

        在進(jìn)行翻譯記憶之前,TM工具通過復(fù)雜的數(shù)學(xué)計(jì)算就可以自動給源語(SL)進(jìn)行分詞,并通過標(biāo)點(diǎn)符號進(jìn)行斷句。比如這是筆者做過項(xiàng)目中的一句話,通過分詞,計(jì)算機(jī)把這句話分詞為:“本專業(yè)旨在培養(yǎng)系統(tǒng)掌握材料科學(xué)與工程的基本知識與研究方法,了解材料先進(jìn)制備方法與現(xiàn)代分析技術(shù)。掌握一門外語,了解材料化學(xué)在電化學(xué)、催化與材料分析等方面的發(fā)展動態(tài);在材料的化學(xué)制備與處理、結(jié)構(gòu)表征、化學(xué)分析、理化測試方面受到良好訓(xùn)練,具備初步的材料設(shè)計(jì)與研發(fā)能力,在科研院所與跨國公司勝任材料研發(fā)與生產(chǎn)、分析測試及質(zhì)量控制等方面的工作,具有在國內(nèi)外知名學(xué)府繼續(xù)讀研與直接攻博的潛質(zhì)與學(xué)識,能在材料科學(xué)與工程及與其相關(guān)的領(lǐng)域從事研究、教學(xué)、科技開發(fā)及相關(guān)管理工作的材料高級專門人才。”從這個(gè)例子,可以明顯地看到詞句已經(jīng)進(jìn)行了分割。這樣TM軟件根據(jù)SL跟新文件之間的匹配關(guān)系,就可以計(jì)算出相似度,相似度越高,TM起的作用就越大。這樣分詞的結(jié)果,機(jī)器也能夠較好地把里面的術(shù)語較好地處理。

        在筆者看來,翻譯記憶庫可以通過圖1表示出來。

        圖1 翻譯記憶庫

        國外常見的翻譯記憶軟件有 SDL Trados,SDLX,Déjà Vu X,MemoQ,Wordfast,Heartsome和 Transit等,中國國內(nèi)近年來發(fā)展起來的TM軟件有雅信CAT、雪人、優(yōu)譯、東方快車、Transmate和華建等。除非客戶指定了用什么翻譯軟件,一般來說只需要掌握其中一兩種最常見的即可。

        術(shù)語是翻譯中最頭疼的問題之一,這在大型翻譯項(xiàng)目中體現(xiàn)得更為明顯,比如翻譯《湖南大學(xué)本科教學(xué)計(jì)劃(2010版)》中一個(gè)叫做“高等數(shù)學(xué)”的術(shù)語,在一個(gè)100萬字的翻譯項(xiàng)目中,第一個(gè)譯者可能翻譯成“Advanced Mathematics”,第二個(gè)譯者可能翻譯成“Higher Mathematics”。如果術(shù)語的譯法更加多一點(diǎn),那無疑會增加統(tǒng)一的難度,因此在這里就要用到術(shù)語管理平臺。一般的大公司也會有自己的術(shù)語管理平臺,比如微軟要在全球范圍內(nèi)發(fā)行Window 8系統(tǒng),那么微軟公司必定在其公司內(nèi)部把自己的術(shù)語全部統(tǒng)一,不然到全球各地就有可能出現(xiàn)內(nèi)部術(shù)語不統(tǒng)一的現(xiàn)象。就翻譯項(xiàng)目來說,上面提到的TM軟件都會具有術(shù)語管理的功能。推薦使用SDL Trados Multiterm和Déjà Vu X的術(shù)語管理工具。這兩者可以互為補(bǔ)充,尤其是后者對于支持前者做得比較好。比如筆者做過的一個(gè)翻譯項(xiàng)目,客戶提供筆者一個(gè)英漢對照的術(shù)語表,有1000多條,很明顯這樣的格式,對于譯員來說還需要整理,筆者采用運(yùn)用一個(gè)叫做FanE Changer的工具,把它進(jìn)行轉(zhuǎn)換,使之中文與英文用“”進(jìn)行分離,然后復(fù)制到 word里面,通過“Ctrl+H”把“||”替換成“^p”或者“^t”就可以很很漂亮地把這樣的格式轉(zhuǎn)變?yōu)閑xcel格式,很簡單地就制作成了TM或者術(shù)語庫。如果是雙語對齊的文章,也可以這樣操作,只需要把對齊的術(shù)語導(dǎo)入到 Déjà Vu X中,選擇 excel 97/2000/xp把它們導(dǎo)出為雙語或單語文件。這個(gè)方法對于那些做平行語料庫的人來說,同樣適用,可以說是一個(gè)非常好的方法。當(dāng)然,如果譯者還具有一點(diǎn)編程水平,對于簡單的,還可以通過在excel中進(jìn)行解決,方式是,把中英對照的術(shù)語復(fù)制到excel里面作為A列,在B列輸函數(shù)公式“=B1=IF(ISERROR(FIND("(",A76)),LEFT(A76,LENB(A76)-LEN(A76)),LEFT(A76,LENB(A76)-LEN(A76)+2))”復(fù)制公式就可以得到中文,在C列輸入函數(shù)“=RIGHT(A1,LEN(A1)-LEN(B1))”,然后復(fù)制公式就可以得到英文。

        術(shù)語查詢一直都是譯者很棘手的問題,一個(gè)術(shù)語可能都使得譯者絞盡腦汁,在這樣的情況下,學(xué)習(xí)一些術(shù)語查詢工具的技巧就顯得非常有必要了,對于譯者來說,最有用的莫過于平行文本,比如句酷、海詞、詞都、愛詞霸等都能夠較好地提供雙語對照的文本,常用的術(shù)語查詢工具有谷歌、百度、必應(yīng)、雅虎、搜搜等搜索軟件,還有諸如中國的CNKI、一本詞等網(wǎng)站。就搜索而言,最強(qiáng)悍的莫過于谷歌、百度和必應(yīng),尤其是谷歌的搜索功能非常強(qiáng)大,對于譯者來說,較好地掌握好谷歌的高級搜索功能,對查詢術(shù)語大有益處。比如,筆者在翻譯《中國天主教史人物傳》的時(shí)候,碰到一個(gè)詞,“宗座代牧”,這對于一個(gè)對天主教不是非常熟悉的人來說,肯定會有難度,我們在谷歌里面輸入這個(gè)詞,然后再輸入“catholic”這樣,很快就可以得知這個(gè)詞的翻譯“Apostolicus Vicariatus de Phnom-Penh”。如果對于不太確定的東西,還可以采用“*”來代替,排除可以用“—”來進(jìn)行表示(更多高級搜索,請看各自搜索的官方解釋)。

        在我們這個(gè)電子化的時(shí)代,電子詞典在我們翻譯過程中也是非常重要的工具,好點(diǎn)的電子詞典一次性可以查詢幾十部甚至上百部詞典,相對傳統(tǒng)的紙質(zhì)詞典而言,其優(yōu)勢不言而喻。比較好的電子詞典有有道桌面詞典、必應(yīng)詞典、金山詞霸(含牛津和谷歌合作版本)、靈格斯翻譯家、巴比倫詞典和Collins COBUILD on CD-ROM。目前,靈格斯翻譯家處于免費(fèi)階段,跟巴比倫一樣,可以添加上百本字典,應(yīng)該可以作為電子詞典的首選。必應(yīng)、有道和金山都各有自己的特色,功能都比較強(qiáng)大,而Collins COBUILD on CD-ROM作為免費(fèi)的單語詞典,能夠提供譯者海量的例句,在詞語的使用方面幫助比較大。這些提到的電子詞典,都可以在官方網(wǎng)站上免費(fèi)下載試用。

        機(jī)器翻譯在查詢某些術(shù)語方面有其獨(dú)到的地方,最值得推薦的是google的機(jī)器翻譯,借助于谷歌公司強(qiáng)大的技術(shù)力量,通過海量信息的搜索,谷歌推出了譯者工具包,使得譯者可以像trados一樣進(jìn)行翻譯。其他的主要有微軟的MT,Systran,還有MyMemory,以及SDL公司的Language Weaver等。一般來說,這些機(jī)器翻譯通常作為插件放到CAT工具里面,它們對于一些不是很復(fù)雜的術(shù)語查詢準(zhǔn)確率還是比較高,可以作為參考使用。從CAT的幾個(gè)著名大公司來看,它們都把谷歌、微軟和Systran做成了插件,集成到它們的工作平臺,只要付費(fèi)就可以獲得API進(jìn)行使用。

        百科全書在翻譯中的作用也是不可估量的,比如維基百科、百度百科、互動百科、大英百科全書等。此外,一些著名的語料庫也可以作為譯者的重點(diǎn)參考對象,比如英國國家語料庫(BNC)、美國當(dāng)代語料庫(COCA)和北外的英漢雙語在線(CEO)。這些網(wǎng)站能夠提供十分豐富的例句,而且具有權(quán)威性。

        (三)譯后工具

        譯后工具可以分為質(zhì)量保證(QA)工具和桌面排版(DTP)工具,在譯文翻譯完之后,譯者還需要對譯文進(jìn)行檢查和查驗(yàn),無論是從語法、拼寫還是術(shù)語統(tǒng)一方面,都需要逐一檢驗(yàn),這里推薦使用Trados2011和Déjà Vu X2里面的QA功能,只要設(shè)置一下,語法、拼寫、空格等就可以很輕易地查找出來。尤其是Trados 2011還支持譯文先導(dǎo)出雙語版進(jìn)行檢查,然后再導(dǎo)入進(jìn)來更新TM,這極大地方便了譯者。國外流行的桌面排版軟件有FrameMaker,InDesign,QuarkXpress和 Coreldraw 等,國內(nèi)的有WPS和方正騰飛等。譯者可以根據(jù)客戶需要來進(jìn)行選擇。

        二、計(jì)算機(jī)輔助翻譯工具對譯者的要求和學(xué)習(xí)建議

        隨著電子化文件的越來越普及,譯者應(yīng)該增強(qiáng)對各類軟件的熟悉程度,熟練掌握格式轉(zhuǎn)換的轉(zhuǎn)換軟件,比如PDF轉(zhuǎn)換工具。就狹義上的翻譯軟件,掌握 Trados,Déjà Vu X,MemoQ 等主流軟件就可以了。最好不要一味追求軟件的更新,因?yàn)橛械能浖鲁鰜砜赡懿皇呛芊€(wěn)定,這可能造成譯者倒不出譯文,甚至丟失譯文。CAT工具的學(xué)習(xí)是一件需要參與的過程,動手操作才是最重要的,遇到問題,最好是及時(shí)參與到各類CAT論壇中,畢竟CAT工具的使用會出現(xiàn)很多技術(shù)性的問題,比如譯客加油站、譯網(wǎng)情深、一本詞、象群網(wǎng)、本地化人等網(wǎng)站,上面會有很多板塊很集中地展現(xiàn)了各類軟件出現(xiàn)的各類問題。就CAT的初學(xué)者而言,通過優(yōu)酷、土豆、酷6等網(wǎng)絡(luò),用戶也可以很容易搜索到各類軟件的專門教程,一邊看著視頻,一邊使用翻譯軟件,效果應(yīng)該是最好的。等到入門CAT軟件入門之后,可以學(xué)習(xí)一些稍微高級一點(diǎn)的東西,把各個(gè)軟件的使用說明書用好,并學(xué)會使用一些編程,比如VBA,有時(shí)候就能夠幫上大忙。比如筆者在翻譯《湖南大學(xué)本科教學(xué)計(jì)劃》的時(shí)候,在檢查的后期,經(jīng)過研究決定把“term”改為“Semester”,當(dāng)時(shí)的 WORD 文檔有 164個(gè),每個(gè)WORD至少會含有4個(gè)“term”,如果是單純的查找替換,工作量就會很大,如果不是很小心翼翼,犯錯(cuò)誤的概率非常大,但是如果是采用VBA代碼來更改,不用打開WORD,一次性就可以完成,而且十分準(zhǔn)確。

        盡管CAT軟件對譯者的幫助很大,但是譯者也不能把CAT視為翻譯的全部,畢竟提高譯者自身的翻譯水平才是提高翻譯生產(chǎn)效率的王道。

        [1] 蘇明陽.翻譯記憶系統(tǒng)的現(xiàn)狀及其啟示[J].外語研究,2007(5):70-74.

        [2] 郭紅.計(jì)算機(jī)輔助翻譯教學(xué)的一種嘗試[J].外語界,2004(5):54-61.

        [3] 劉澤權(quán),劉鼎甲.多媒體計(jì)算機(jī)技術(shù)與語料庫方法運(yùn)用于翻譯教學(xué)改革的嘗試[J].外語與外語教學(xué),2009(8):27-30.

        [4] 錢多秀.“計(jì)算機(jī)輔助翻譯”課程教學(xué)思考[J].中國翻譯,2009(4):49-53.

        [5] 徐彬,郭紅梅,國曉立.21世紀(jì)的計(jì)算機(jī)輔助翻譯工具[J].山東外語教學(xué),2007(4):79-86.

        猜你喜歡
        電子詞典術(shù)語語料庫
        《語料庫翻譯文體學(xué)》評介
        把課文的優(yōu)美表達(dá)存進(jìn)語料庫
        基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        淺談“搞”字的翻譯技巧
        有感于幾個(gè)術(shù)語的定名與應(yīng)用
        從術(shù)語學(xué)基本模型的演變看術(shù)語學(xué)的發(fā)展趨勢
        開學(xué)最值得購買的電子詞典
        語料庫語言學(xué)未來發(fā)展趨勢
        國內(nèi)雙語電子詞典現(xiàn)狀簡論
        奧運(yùn)術(shù)語
        av一区二区三区人妻少妇| 亚洲午夜福利在线视频| 一区二区三区在线日本视频 | 国产精品女老熟女一区二区久久夜| 亚洲中文字幕黄色小视频| 久久天天躁夜夜躁狠狠躁2022| 亚洲成av人在线播放无码| 男女激情视频网站在线| 青青草视频在线视频播放| 黑人巨大videos极度另类| 成人精品视频一区二区| 不卡av网站一区二区三区| 亚洲av免费高清不卡| 97人妻碰免费视频| 国产精品免费观看久久 | 久久99精品免费一区二区| 欧美性受xxxx白人性爽| 久久国产劲爆∧v内射| 亚洲av本道一本二本三区| 亚洲乱码一区AV春药高潮 | 亚洲综合久久久| 国产乱色精品成人免费视频| 亚洲国产一二三精品无码| 日本二区在线视频观看| 一道本中文字幕在线播放| 无码人妻精品一区二区三区下载| 日日躁夜夜躁狠狠躁超碰97| 久久精品无码av| 九九综合va免费看| 亚洲日本中文字幕乱码在线| 久久精品国产亚洲av调教| 国产在亚洲线视频观看| 宝贝把腿张开我要添你下边动态图 | 中文字幕丰满人妻av| 操老熟妇老女人一区二区| 四虎国产精品免费久久麻豆| 婷婷综合久久中文字幕蜜桃三电影 | 午夜桃色视频在线观看| 亚洲第一区无码专区| 国产亚洲美女精品久久久| 少妇下蹲露大唇无遮挡|