劉克強(qiáng),沈映梅
(紅河學(xué)院外語(yǔ)學(xué)院,云南蒙自661100)
基于漢英平行語(yǔ)料庫(kù)對(duì)漢語(yǔ)詞匯的英譯研究
——以漢語(yǔ)常用動(dòng)詞“發(fā)展”為例
劉克強(qiáng),沈映梅
(紅河學(xué)院外語(yǔ)學(xué)院,云南蒙自661100)
語(yǔ)料庫(kù)語(yǔ)言學(xué)與語(yǔ)言學(xué)習(xí)的結(jié)合已有時(shí)日,但如何使用平行語(yǔ)料庫(kù)進(jìn)行翻譯的研究才剛剛開(kāi)始。對(duì)于漢英翻譯來(lái)說(shuō),漢英平行語(yǔ)料庫(kù)對(duì)漢英詞匯對(duì)等系統(tǒng)的建立能夠提供很大的幫助。在自建漢英平行語(yǔ)料庫(kù)的基礎(chǔ)上,本文通過(guò)提取漢語(yǔ)的高頻動(dòng)詞“發(fā)展”,從而發(fā)現(xiàn)和總結(jié)其在不同文本中的英語(yǔ)翻譯規(guī)律。旨在為今后翻譯與之相關(guān)的句子時(shí)提供真實(shí)、可靠的譯例,同時(shí)也表明平行語(yǔ)料庫(kù)在翻譯當(dāng)中有廣闊的使用前景和潛在的開(kāi)發(fā)價(jià)值。
發(fā)展;平行語(yǔ)料庫(kù);翻譯
目前,國(guó)際上建立了為數(shù)不少的平行語(yǔ)料庫(kù),加拿大是最早建立的國(guó)家之一,研究者收集加拿大議會(huì)辯論的英法雙語(yǔ)建立了Hansard平行語(yǔ)料庫(kù)[3],以研究英法雙語(yǔ)詞匯和句型翻譯。但一般認(rèn)為,Mona Baker[2]發(fā)表的論文是推動(dòng)語(yǔ)料庫(kù)翻譯研究發(fā)表的開(kāi)山之篇,此后一批學(xué)者利用語(yǔ)料庫(kù)探討翻譯方面的諸多問(wèn)題。在國(guó)內(nèi),北京外國(guó)語(yǔ)大學(xué)建成了規(guī)模約2,000萬(wàn)字詞的大型句對(duì)齊英漢平行語(yǔ)料庫(kù)[7],基于此語(yǔ)料庫(kù),該校研究人員已展開(kāi)了翻譯領(lǐng)域的相關(guān)研究,不過(guò)大眾能接觸到的很少,且他們研究的大多是翻譯的普遍性問(wèn)題,對(duì)于詞匯、句子層次的研究相對(duì)比較少。然而,詞匯的翻譯在翻譯具體實(shí)踐中往往起著很大的作用,因此研究詞匯,尤其是常用詞匯的對(duì)應(yīng)翻譯顯得尤為重要。
《現(xiàn)代漢語(yǔ)常用詞表(草案)》[5]將“發(fā)展”這個(gè)詞排在其詞表的第一百七十一位,Xiao[4]著的《漢語(yǔ)詞頻詞典》中,基于漢語(yǔ)語(yǔ)料庫(kù),按照詞頻編排了漢語(yǔ)常用的五千詞,“發(fā)展”作為動(dòng)詞位于第一百零九位,而在所有的動(dòng)詞中居第二十二位。這本詞典是基于七千三百萬(wàn)漢字約合五千萬(wàn)詞的漢語(yǔ)語(yǔ)料統(tǒng)計(jì)分析出來(lái)的,而且這些語(yǔ)料包括四大語(yǔ)域:口語(yǔ),新聞,小說(shuō),非小說(shuō)。因此我們可以斷定,“發(fā)展”這個(gè)動(dòng)詞確確實(shí)實(shí)為漢語(yǔ)常用動(dòng)詞。作為漢語(yǔ)常用動(dòng)詞,在漢語(yǔ)中出現(xiàn)如此頻繁,在翻譯過(guò)程當(dāng)中如何根據(jù)上下文情況翻譯“發(fā)展”呢?是不是一碰見(jiàn)“發(fā)展”就翻譯成“develop”,“development”呢?下面我們通過(guò)自建的漢英平行語(yǔ)料庫(kù)來(lái)展示如何分析“發(fā)展”的翻譯情況。
要利用漢英平行語(yǔ)料庫(kù)來(lái)進(jìn)行翻譯研究,就必須建立相應(yīng)的漢英平行語(yǔ)料庫(kù),在選擇漢語(yǔ)譯文時(shí),根據(jù)樸松林、王克非[7]的經(jīng)驗(yàn),首先必須注意翻譯質(zhì)量問(wèn)題,其次是選擇語(yǔ)料的問(wèn)題和取樣問(wèn)題。為了保證翻譯質(zhì)量,本研究選擇的漢語(yǔ)譯文都是在國(guó)內(nèi)外權(quán)威出版社出版,有很高質(zhì)量的譯文;在語(yǔ)料的選擇方面,盡量多地選擇各種體裁的語(yǔ)料。著眼于實(shí)際研究的需要,所有語(yǔ)料都是全文收錄。此語(yǔ)料庫(kù)分為三部分:小說(shuō)部分,非小說(shuō)部分,科學(xué)技術(shù)部分。
其中小說(shuō)部分包括:《魯迅小說(shuō)集》、《子夜》、《圍城》、《春蠶》、《駱駝祥子》、《青春之歌》、《暴風(fēng)驟雨》、《芙蓉鎮(zhèn)》等小說(shuō)及其英語(yǔ)譯文,其中漢語(yǔ)以字計(jì)算,英語(yǔ)以詞計(jì)算,共計(jì)約250萬(wàn)字詞。
非小說(shuō)部分包括:《毛澤東選集》、《鄧小平文選》、政府白皮書(shū)、政府工作報(bào)告及一些法律文件及其英語(yǔ)譯文等。計(jì)算方法同上,共計(jì)約包含300萬(wàn)字詞。
科技部分大多是電腦、工程方面的資料及其英語(yǔ)譯文,計(jì)算方法同上,共計(jì)約有50萬(wàn)字詞。
如前所述,本研究的目的是為了找出“發(fā)展”對(duì)應(yīng)的翻譯,即提取語(yǔ)言間對(duì)譯轉(zhuǎn)換的信息。因此,我們首先需要確立每對(duì)詞匯翻譯在各自語(yǔ)言的相應(yīng)語(yǔ)境,如段落、句子,為實(shí)現(xiàn)這個(gè)目標(biāo),必須借助于軟件幫助對(duì)齊局部單位,根據(jù)研究需要,本文使用Trados的WinAlign。下面以2009溫家寶總理所做的政府工作報(bào)告的漢語(yǔ)版本及其英譯版本的部分段落為例來(lái)說(shuō)明如何進(jìn)行句子層次的對(duì)齊。限于篇幅,表1是政府工作報(bào)告的一小部分。實(shí)際操作時(shí),應(yīng)當(dāng)將報(bào)告的漢、英全文進(jìn)行對(duì)齊。
表12009 政府工作報(bào)告部分漢語(yǔ)及其英語(yǔ)翻譯
這里使用的是TRADOS 7.0,在安裝此軟件后,點(diǎn)擊TRADOS 7.0,在其下菜單中選擇“WinAlign”,雙擊“WinAlign”,進(jìn)入對(duì)齊工作界面,在文件菜單下選擇“new project”后,再依次選擇待對(duì)齊語(yǔ)料的語(yǔ)言,選擇的source language為漢語(yǔ),target language為英語(yǔ)。在進(jìn)行相關(guān)切分的標(biāo)點(diǎn)設(shè)置后,載入待對(duì)齊的漢、英語(yǔ)料,就可以進(jìn)行對(duì)齊了,運(yùn)行后的界面如圖1所示:
圖1 TRADOS WinAlign將語(yǔ)料對(duì)齊后的界面
由于是軟件輔助對(duì)齊語(yǔ)料,不可能做到百分之百正確,好在此軟件提供了人工干預(yù)的很多命令,點(diǎn)擊認(rèn)為對(duì)齊不盡如意的地方,可以進(jìn)行合并、切分等等,限于篇幅,此處不再深入。最后將滿(mǎn)意的對(duì)齊語(yǔ)料保存并導(dǎo)出,然后整理該文件,就生成漢、英平行語(yǔ)料庫(kù)了。
為了實(shí)現(xiàn)對(duì)動(dòng)詞“發(fā)展”的提取,從而發(fā)現(xiàn)對(duì)應(yīng)的翻譯,必須給漢語(yǔ)語(yǔ)料添加某種符號(hào),以便軟件識(shí)別和提取,利用中科院開(kāi)發(fā)的ICTCLAS 1.0(漢語(yǔ)詞法分析系統(tǒng)1.0版)[8]可以給漢語(yǔ)語(yǔ)料的每個(gè)詞加上對(duì)應(yīng)的詞性符號(hào),為了便于分析,從該報(bào)告中選擇下面一句:“按照出手要快、出拳要重、措施要準(zhǔn)、工作要實(shí)的要求,迅速推出進(jìn)一步擴(kuò)大內(nèi)需、促進(jìn)經(jīng)濟(jì)增長(zhǎng)的十項(xiàng)措施,爭(zhēng)分奪秒地加以落實(shí);接連出臺(tái)金融支持經(jīng)濟(jì)發(fā)展、促進(jìn)輕紡工業(yè)健康發(fā)展、促進(jìn)房地產(chǎn)市場(chǎng)健康發(fā)展、搞活流通擴(kuò)大消費(fèi)和保持對(duì)外貿(mào)易穩(wěn)定增長(zhǎng)、穩(wěn)定就業(yè)等政策措施,加快制定重點(diǎn)產(chǎn)業(yè)調(diào)整振興規(guī)劃?!崩肐CTCLAS標(biāo)注后,本句話就變成:
按照/p出手/v要/v快/a、/w出/v拳/n要/v重/a、/w措施/n要/v準(zhǔn)/a、/w工作/vn要/v實(shí)/a的/u要求/n,/w迅速/ad推出/v進(jìn)一步/d擴(kuò)大/v內(nèi)需/n、/w促進(jìn)/v經(jīng)濟(jì)/n增長(zhǎng)/vn的/u十/m項(xiàng)/q措施/n,/w爭(zhēng)分奪秒/i地/u加以/v落實(shí)/v;/w接連/d出臺(tái)/v金融/n支持/vn經(jīng)濟(jì)/n發(fā)展/vn、/w促進(jìn)/v輕紡/j工業(yè)/n健康/ad發(fā)展/v、/w促進(jìn)/v房地產(chǎn)/j市場(chǎng)/n健康/ad發(fā)展/v、/w搞活/v流通/vn擴(kuò)大/v消費(fèi)/vn和/c保持/v對(duì)外貿(mào)易/l穩(wěn)定/a增長(zhǎng)/vn、/w穩(wěn)定/ad就業(yè)/v等/u政策/n措施/n,/w加快/vd制定/v重點(diǎn)/n產(chǎn)業(yè)/n調(diào)整/vn振興/vn規(guī)劃/n。
觀察經(jīng)過(guò)標(biāo)注后的語(yǔ)料,可以發(fā)現(xiàn)原來(lái)的漢語(yǔ)語(yǔ)料進(jìn)行了詞切分,并且對(duì)切分后的詞附上詞性碼,如“發(fā)展”一詞,就被標(biāo)上“/v”和“/vn”兩種詞性,前者表示動(dòng)詞,也就是我們所要分析的;后者相當(dāng)于動(dòng)名詞。這樣我們將對(duì)齊并標(biāo)注的語(yǔ)料載入ParaConc軟件(Barlow,2003),檢索“發(fā)展/v”就可以將所有的動(dòng)詞“發(fā)展”所在的句子提取出來(lái),而這些句子所對(duì)應(yīng)的英語(yǔ)翻譯也相應(yīng)的顯示出來(lái)。圖2就是載入語(yǔ)料后,在該軟件的search框中輸入“發(fā)展/v”,得到的結(jié)果。
在圖2中點(diǎn)擊上框中每一句漢語(yǔ),下框就有是它對(duì)應(yīng)的譯文,這樣就可以進(jìn)行“發(fā)展”的翻譯分析。為了方便閱讀漢語(yǔ)句子,在下面的例子當(dāng)中,須將進(jìn)行標(biāo)注的漢語(yǔ)句子進(jìn)行整理,去掉詞的詞性標(biāo)注。
(一)在小說(shuō)文體中的典型翻譯
1.現(xiàn)在訂了婚,彼此間還留著情感發(fā)展的余地,這是樁好事。
In the case of their engagement now,there was still room left between them for their feelings to develop,and that was a very good thing.
2.他們發(fā)展企業(yè)的一場(chǎng)大夢(mèng)!現(xiàn)在快到夢(mèng)醒了罷?
They had dreamed of giving industry a new lease of life,but now-now it looked as if they would soon be brought back to earth with a jolt!
3.外圍組織也幾乎都被破壞;剩下的,情緒不安,也很難發(fā)展。
Most of the organizations close to the Party have broken up,the rest are so disorganized that it is equally hard for them to expand.
4.他不斷化裝,不斷地變化著職業(yè),因此,他來(lái)到定縣雖然半年多了,可是敵人并沒(méi)有發(fā)覺(jué)他,而定縣農(nóng)村中的革命組織卻一天天地恢復(fù)并發(fā)展了。
He changed his disguise and occupation so often that he was able to work in Tinghsien for more than half a year without being discovered.The revolutionary bodies in that area gained strength with every passing day.
5.有志之士被壓迫得慢慢像西洋大都市的交通路線,向地下發(fā)展,地底下原有的那些陰毒曖昧的人形爬蟲(chóng),攀附了他們自增聲價(jià)。
Men of good will were so depressed that,like the transportation lines in major Western cities,they slowly began to go underground,while the dark,insidious reptiles in human form,which had been underground all along,boosted their prestige by latching on to them.
(二)在非小說(shuō)文體中的典型翻譯
1.進(jìn)一步發(fā)展高中階段教育、高等教育和各類(lèi)職業(yè)教育。
Efforts should be made to further develop senior secondary school education,higher education and all types of vocational education.
2.重點(diǎn)培育和發(fā)展要素市場(chǎng),尤其是資本市場(chǎng)。
We need to focus our efforts on the development of markets for production factors,especially capital.
3.積極發(fā)展多種形式的產(chǎn)學(xué)研結(jié)合。
Efforts should be made to promote the integration of production,teaching and research in a variety of ways.
4.繼續(xù)發(fā)展對(duì)外承包工程和勞務(wù)合作。
Overseas contracted projects and labor services should be further expanded.
5.大力發(fā)展經(jīng)濟(jì)適用住房,建立廉租房供應(yīng)保障體系。
We need to build more affordable and functional housing and establish a system to ensure an adequate supply of low rent housing.
(三)在科技文體中的典型翻譯
1.發(fā)展高強(qiáng)度扭桿,大幅度提高車(chē)輛的懸掛性能
To Develop the High Strength Torsion-ber for Highly Improving the Performances of the Vehicle Suspension
2.一項(xiàng)當(dāng)前的應(yīng)用--通過(guò)個(gè)人通信器查民航機(jī)票價(jià)的能力--將繼續(xù)擴(kuò)大和發(fā)展,最終把個(gè)人通信器轉(zhuǎn)化成綜合的公務(wù)出差的計(jì)劃工具。
One current application,the ability to check airline fares via personal communicator--will continue to expand and develop,eventually transforming the personal communicator into a comprehensive business tripplanning tool.
3.在1995年間,語(yǔ)音識(shí)別和輸入及管理聲音和數(shù)據(jù)的功能也取得了大的發(fā)展。
Speech recognition and the capability to input and manipulate voice and data also have been big advancements during 1995.
4.短短的幾年中,Internet以指數(shù)的速度發(fā)展著,從科學(xué)與學(xué)術(shù)界用的網(wǎng)絡(luò)成長(zhǎng)為一種通用的系統(tǒng),給數(shù)百萬(wàn)計(jì)的人員和單位提供簡(jiǎn)單但有效的通信服務(wù)和信息訪問(wèn)。
In a few years,the Internet has grown exponentially from a network for the scientific and academic community into a universal system providing millions of people and organizations with simple but effective communications services and information access.
5.由于全雙工和干線方案可用于將以太網(wǎng)帶寬推向更高,以太網(wǎng)的發(fā)展將會(huì)繼續(xù)下去。
But the story doesn't stop there,since full-duplex and trunking schemes can be used to push Ethernet bandwidth even higher.
通過(guò)建設(shè)平行語(yǔ)料庫(kù)的方法,可以發(fā)現(xiàn)“發(fā)展”在不同的文體中有很多種對(duì)應(yīng)的翻譯,它們既有相同的,也就是三種文體共享的翻譯方法,更加重要的是,還有大量的根據(jù)上下文的理解和文體的不同翻譯成其他的形式。這樣為研究提供了真實(shí)、可靠的示例,對(duì)外語(yǔ)教育工作者的教學(xué)和科研都有十分重要的意義,同時(shí)也表明了雙語(yǔ)平行語(yǔ)料庫(kù)在翻譯教學(xué)和科研上有著廣闊的使用前景。
[1]Barlow M.ParaConc:A Concordancer for Parallel Texts.Paraconc Help,2003.
[2]Baker,Mona.Corpus Linguistics and Translation Studies: Implications and Applications[A].In Mona Baker,Gill Francis,and Elena Tognini-Bonelli(eds)Text and Technology:In Honor of John Sinclair.Amsterdam-Philadephia: John Benjamins,1993.
[3]Brown P,et al.Aligning Sentences in Parallel Corpora[A].In Proceedings of the 29th Annual Meetings of the Association for Computational Linguistics[C].Berklery,Ca,1991.
[4]Xiao,Richard,Paul Rayson,Tony McEnery.A Frequency Dictionary of Mandarin Chinese:Core Vocabulary for Learners.[M].London:Routledge,2009.
[5]《現(xiàn)代漢語(yǔ)常用詞表》課題組.現(xiàn)代漢語(yǔ)常用詞表(草案)[M].北京:商務(wù)印書(shū)館,2008.
[6]樸松林,王克非.國(guó)內(nèi)外雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)研制現(xiàn)狀[A].王克非等著.雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)研制與應(yīng)用[C].北京:外語(yǔ)教學(xué)與研究出版社,2004.
[7]王克非.英漢/漢英語(yǔ)句對(duì)應(yīng)的語(yǔ)料庫(kù)考察[J].外語(yǔ)教學(xué)與研究,2003(6).
[8]張華平.ICTCLAS 1.0,2002.
[責(zé)任編輯張燦邦]
On the Translations of Chinese Words Based on a Parallel Corpus——take"Fazhan"as an Example
LIU Ke-qiang,SHEN Ying-mei
(School of Foreign Languages,Honghe University,Mengzi 661100,China)
Corpus has been acclaimed recently as a new resource for language teaching.But the use of parallel corpus in translation has barely started,especially for Chinese-English translation;parallel corpus can facilitate the extraction of equivalent lexical system between Chinese and English.Based on the self-built Chinese-English parallel corpora(about 6 million characters/words in size),this paper probes into the application of parallel corpora to translation equivalent extraction with the frequent Chinese verb"Fazhan"as an example.It shows that a parallel corpus can provide rich parallel samples for the verb in different texts and its use in translation awaits widening and its potentiality awaits exploiting.
fazhan;parallel corpora;translation
book=3,ebook=62
H159
A
1008-9128(2009)02-0091-04
2010-02-22
云南省教育廳科學(xué)研究基金項(xiàng)目:“漢語(yǔ)常用動(dòng)詞及英譯的類(lèi)聚研究”(07C40184)
劉克強(qiáng)(1971-),男,陜西西安人,講師,在讀博士生。研究方向:應(yīng)用語(yǔ)言學(xué)、語(yǔ)料庫(kù)語(yǔ)言學(xué)。