戴麗琴
摘要:隨著語(yǔ)料庫(kù)的普及與發(fā)展,專(zhuān)門(mén)用途語(yǔ)料庫(kù)已經(jīng)成為外語(yǔ)教育與翻譯的重要工具。中醫(yī)雙語(yǔ)小型語(yǔ)料庫(kù)的建立為本校中醫(yī)教學(xué)與中醫(yī)的對(duì)外交流提供一個(gè)重要平臺(tái)。中醫(yī)英語(yǔ)語(yǔ)料庫(kù)的建立要從語(yǔ)料庫(kù)的目標(biāo)入手,確定其規(guī)模與用途、進(jìn)行初步的設(shè)計(jì)和規(guī)劃以及解決相關(guān)技術(shù)問(wèn)題。
關(guān)鍵詞:中醫(yī)英語(yǔ);雙語(yǔ)語(yǔ)料庫(kù);中醫(yī)英語(yǔ)教學(xué);中醫(yī)翻譯
在高度信息化的當(dāng)今世界,翻譯已成為了解全球信息、擴(kuò)大對(duì)外交流、獲取國(guó)際資源的重要手段。雙語(yǔ)平行語(yǔ)料庫(kù),則為外語(yǔ)教學(xué)、翻譯研究、跨語(yǔ)言信息檢索、詞典編撰等提供了最好的平臺(tái),具有廣闊的應(yīng)前景。
近十多年來(lái),國(guó)內(nèi)雙語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)取得了很大進(jìn)步,如漢英平行語(yǔ)料庫(kù)(北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所)、英漢雙語(yǔ)語(yǔ)料庫(kù)(哈爾濱工業(yè)大學(xué))。國(guó)內(nèi)近年來(lái)也建成些專(zhuān)用語(yǔ)料庫(kù),如莎士比亞戲劇英漢平行語(yǔ)料庫(kù)(上海交通大學(xué))、《紅樓夢(mèng)》譯本平行語(yǔ)料庫(kù)(燕山大學(xué))等,這些語(yǔ)料庫(kù)規(guī)模小但是各有特色各有重點(diǎn)。
一、中醫(yī)英語(yǔ)語(yǔ)料庫(kù)建設(shè)的意義
1.1 在中醫(yī)英語(yǔ)教學(xué)方面的意義
中醫(yī)英語(yǔ)語(yǔ)料庫(kù)在中醫(yī)英語(yǔ)教學(xué)的師資培訓(xùn)、教材建設(shè)等方面都可以發(fā)揮充分作用。通過(guò)雙語(yǔ)平行語(yǔ)料庫(kù),可以對(duì)中醫(yī)英語(yǔ)教學(xué)中的常用語(yǔ)言結(jié)構(gòu)、教學(xué)中的難點(diǎn)、對(duì)難點(diǎn)的分級(jí)排列(gradation)等問(wèn)題做出梳理和判斷。
1.2在中醫(yī)英語(yǔ)翻譯研究方面的意義
1.2.1語(yǔ)料庫(kù)不僅為翻譯批評(píng)研究提供了新的工具,而且擴(kuò)展了翻譯批評(píng)的研究范圍,提出了新的研究思路。
1.2.2中醫(yī)雙語(yǔ)語(yǔ)料庫(kù)為中醫(yī)英譯翻譯批評(píng)提供了諸多可能性,對(duì)這些可能性予以充分開(kāi)發(fā)利用,有助于翻譯批評(píng)的“審美評(píng)價(jià)”和“科學(xué)判斷”跳出經(jīng)驗(yàn)和直覺(jué)的內(nèi)省栓桔,達(dá)到有機(jī)的統(tǒng)一。
1.2.3基于語(yǔ)料庫(kù)的中醫(yī)翻譯研究以哲學(xué)上的經(jīng)驗(yàn)主義和理性主義為認(rèn)識(shí)論基礎(chǔ),把經(jīng)驗(yàn)主義的量化描寫(xiě)和理性主義的推理解釋相結(jié)合,以客觀的語(yǔ)言現(xiàn)象為依據(jù),揭示語(yǔ)言?xún)?nèi)在的本質(zhì)和規(guī)律。
二、語(yǔ)料庫(kù)的設(shè)計(jì)與建立
2.1 語(yǔ)料庫(kù)的設(shè)計(jì)
語(yǔ)料庫(kù)的設(shè)計(jì)與規(guī)劃是直接影響語(yǔ)料庫(kù)質(zhì)量和功能的重大環(huán)節(jié),在此階段,設(shè)計(jì)者需要考慮建庫(kù)的規(guī)模、語(yǔ)料選擇等方面。
2.1.1 就本語(yǔ)料庫(kù)的規(guī)模而言,需要考慮建庫(kù)目的能否實(shí)現(xiàn)及語(yǔ)料是否容易獲得等,并不是越大越好。一般來(lái)說(shuō),專(zhuān)門(mén)語(yǔ)料庫(kù)要比通用語(yǔ)料庫(kù)的規(guī)模要小。根據(jù)本庫(kù)自身的特點(diǎn),50萬(wàn)字左右的規(guī)模即可滿(mǎn)足教學(xué)與翻譯的需要,但是語(yǔ)料的篩選很重要,要求建庫(kù)者和管理員有較高的專(zhuān)業(yè)知識(shí),并且熟悉中醫(yī)醫(yī)學(xué)相關(guān)領(lǐng)域。
2.1.2本庫(kù)中醫(yī)英語(yǔ)的語(yǔ)料可以從可靠的網(wǎng)站、電子掃描儀、現(xiàn)有的中醫(yī)英語(yǔ)語(yǔ)料庫(kù)(如:《新編使用中醫(yī)文庫(kù)》)等途徑收集。中醫(yī)英語(yǔ)語(yǔ)料庫(kù)的收集以醫(yī)學(xué)教材和醫(yī)學(xué)論文為主,文本選用的標(biāo)準(zhǔn)為國(guó)外權(quán)威出版機(jī)構(gòu)出版的英語(yǔ)醫(yī)學(xué)教材或國(guó)內(nèi)影印的英語(yǔ)醫(yī)學(xué)教材,論文從國(guó)際流行的一流期刊中收集。中醫(yī)英語(yǔ)語(yǔ)料庫(kù)的文本收集按學(xué)科、的種類(lèi)等進(jìn)行,涵蓋中醫(yī)基礎(chǔ)理論、中醫(yī)診斷學(xué)、中藥學(xué)、方劑學(xué)、中醫(yī)內(nèi)科學(xué)、中醫(yī)外科學(xué)、中醫(yī)兒科學(xué)、中醫(yī)針灸、中醫(yī)推拿等學(xué)科。參照《新編實(shí)用中醫(yī)文庫(kù)》建設(shè)的平行語(yǔ)料庫(kù),在建庫(kù)過(guò)程中參考 T.McEneryA.Hardie(2012)的做法,收集的數(shù)據(jù)主要用于科學(xué)研究,要防止語(yǔ)料泄露和侵權(quán)現(xiàn)象出現(xiàn)。
2.2語(yǔ)料庫(kù)的建立
2.2.1語(yǔ)料處理
在選取了合適的語(yǔ)料后,要將語(yǔ)料轉(zhuǎn)化為T(mén)XT文檔保存,本庫(kù)由英漢兩個(gè)句級(jí)對(duì)齊文本組成,分別命名為“中醫(yī).EN.txt”和“中醫(yī).CH.txt”。期間要審核并修改原始文檔中存在的一些錯(cuò)誤與冗余信息,以免影響隨后標(biāo)注和檢索的準(zhǔn)確性。我們使用PowerGREP為檢索軟件,運(yùn)用文本整理器對(duì)單個(gè)文本進(jìn)行整理。
2.2.2標(biāo)注
標(biāo)注指對(duì)語(yǔ)料進(jìn)行分類(lèi)與詞類(lèi)劃分,分為詞性標(biāo)注與篇頭標(biāo)注。英語(yǔ)文本可以通過(guò)CLAWS軟件完成,中文文本則通過(guò)中科院計(jì)算所的ICTCLAS軟件完成。篇頭標(biāo)注能夠提供文本的基本信息。本庫(kù)中,篇頭標(biāo)注包含出版信息、譯者信息、文本字?jǐn)?shù)和所屬等內(nèi)容。
2.2.3 對(duì)齊
在完成對(duì)語(yǔ)料的數(shù)字化、中文文本的分詞、去噪等相關(guān)整理后,可用Paraconc軟件實(shí)現(xiàn)漢英文本的句級(jí)粗略對(duì)齊,然后再進(jìn)行人工檢查調(diào)整對(duì)齊,最后確定并保存。
三、雙語(yǔ)語(yǔ)料庫(kù)建設(shè)中碰到的困難與對(duì)策
3.1.國(guó)內(nèi)英語(yǔ)語(yǔ)料與西方英語(yǔ)語(yǔ)料的選擇問(wèn)題。中醫(yī)英語(yǔ)資料包括西方英語(yǔ)語(yǔ)料與國(guó)內(nèi)英語(yǔ)語(yǔ)料,兩種語(yǔ)料各有不足與優(yōu)勢(shì)。結(jié)合本語(yǔ)料庫(kù)的功能與特點(diǎn),本庫(kù)應(yīng)該從中國(guó)國(guó)內(nèi)英語(yǔ)語(yǔ)料與西方英語(yǔ)語(yǔ)料分界,其比例各為百分之五十。只有如此,中
醫(yī)英語(yǔ)在中西方的差異點(diǎn)及差異的規(guī)律性才有可能反映出來(lái)。
此外,為了對(duì)比分析具有統(tǒng)一的基礎(chǔ),中西方資料應(yīng)盡量做到一致,也就是說(shuō),同一中醫(yī)資料,在中西方各具備一份英語(yǔ)語(yǔ)料,此時(shí)從理論上講,中西語(yǔ)料應(yīng)該在數(shù)量上相等、結(jié)構(gòu)上相同。
3.2平行語(yǔ)料庫(kù)的建立可能非常耗時(shí)耗力。在標(biāo)注的過(guò)程中,受研究者的主觀影響比較多, 甚至可能會(huì)出現(xiàn)標(biāo)注錯(cuò)誤, 從而影響到語(yǔ)料庫(kù)的統(tǒng)計(jì)分析結(jié)果。為了彌補(bǔ)這些不足,需要研究者不斷探索努力,統(tǒng)一語(yǔ)料庫(kù)的標(biāo)注, 提高語(yǔ)料庫(kù)的通用性以節(jié)省重新建庫(kù)的時(shí)間和精力。
[參考文獻(xiàn)]
[1]Koehn,P.Europarl:Aparallel corpus for statistical machine translation [A]. MT Summit 2005.
[2]Lüdeling, A. & M. Kyt. Corpus linguistics :An International Handbook [C]. New York:Walter deGruyter, 2008.
[3]德超, 王克非. 新型雙語(yǔ)旅游語(yǔ)料庫(kù)的研制和運(yùn)用 [J]. 現(xiàn)代外語(yǔ),2010(1): 46-54.
[4]秦洪武, 王克非. 基于語(yǔ)料的翻譯語(yǔ)言考察 [J].現(xiàn)代外語(yǔ), 2004(1):44-52.
[5〕桂詩(shī)春. 發(fā)展我國(guó)應(yīng)用語(yǔ)言學(xué)的幾點(diǎn)想法[J].語(yǔ)言文字應(yīng)用,1998,(7)4-6.
[6]李文中. 語(yǔ)料庫(kù)索引工具[A].楊慧中語(yǔ)料庫(kù)語(yǔ)言學(xué)導(dǎo)論[C].上海:上海外語(yǔ)教育出版社,2002,67-68.