亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中藥漢英雙語平行語料庫的設(shè)計及構(gòu)建

        2014-03-10 04:06:14蘭彩玉
        亞太傳統(tǒng)醫(yī)藥 2014年8期
        關(guān)鍵詞:中醫(yī)藥中藥文本

        蘭彩玉

        (廣東藥學(xué)院 外國語學(xué)院,廣東 廣州 510006)

        ?

        中藥漢英雙語平行語料庫的設(shè)計及構(gòu)建

        蘭彩玉

        (廣東藥學(xué)院 外國語學(xué)院,廣東 廣州 510006)

        雙語平行語料庫的構(gòu)建為當前翻譯研究的一個新熱點,同時是ESP翻譯研究的新視角。介紹了語料庫翻譯研究方法,通過分析中醫(yī)藥英語語料庫的研究現(xiàn)狀闡述了構(gòu)建中藥漢英平行語料庫的重要性及必要性,并就語料庫構(gòu)建的具體步驟——語料庫的設(shè)計、語料的選擇、語料的采集和加工以及雙語語料庫的平行等進行了詳細描述。

        平行語料庫;中藥英語;中藥漢英平行語料庫

        隨著中醫(yī)國際化的發(fā)展,人們逐漸認識到中醫(yī)藥翻譯的重要性,從中醫(yī)最初于17世紀(明代)被介紹到西方,翻譯作為兩種文化交流的媒介,其發(fā)展狀況便對中醫(yī)的國際化水平起著至關(guān)重要的作用。因此目前對中醫(yī)藥翻譯的實踐和研究均日益蓬勃,而相關(guān)的雙語平行語料庫建立將無疑為中醫(yī)藥翻譯實踐和研究提供新的平臺和視角。

        1 平行語料庫——翻譯研究新視角

        語料庫是為了某一特定的目標,按照明確的設(shè)計標準而收集起來的電子文本庫。憑借計算機的強大檢索和統(tǒng)計功能,通??梢园l(fā)現(xiàn)和解釋用常規(guī)方法無法解決的問題。語料庫語言學(xué)的三大功能為:檢索(concordance)用于查詢和統(tǒng)計某個或某些詞匯或短語在指定文本中出現(xiàn)的頻數(shù);單詞列表(wordlist)用于創(chuàng)建語料庫中詞匯使用頻率列表,確定哪些詞匯或詞塊最常用,哪些相對比較少用;主題詞(keyword)用于研究文本內(nèi)容和文本語言特征差異,為語言學(xué)研究開啟了全新的視角[1]。

        翻譯研究的描述性研究理論和方法為語料庫研究融入翻譯研究奠定了基礎(chǔ)。Laviosa指出:“語料庫研究從90年代初期已經(jīng)徹底融入翻譯研究,不止如此,隨著語料庫研究的迅速發(fā)展,它對我們的翻譯思維、學(xué)習(xí)和教學(xué)方式也產(chǎn)生著巨大的影響[2]”。自此語料庫語言學(xué)已從基于單語文本的一般語言研究發(fā)展到基于雙語或多語的平行語料庫的翻譯研究。歐洲學(xué)者已建立了多個平行語料庫進行翻譯研究,其中伯明翰大學(xué)的圖伊波特(Wolfgang Tuibert)和曼徹斯特大學(xué)的貝克(Mona Baker)已開始基于平行語料庫的英漢互譯研究,香港大學(xué)進行了基于平行語料庫的英漢法律術(shù)語翻譯研究,北京外國語大學(xué)的王克非等人[3]開始了基于平行語料庫的文學(xué)翻譯研究等。

        譯學(xué)語料庫是指專門為翻譯學(xué)研究而建設(shè)的語料庫,有平行語料庫(parallel corpus)和可比語料庫兩種,其中平行語料庫是收集某種語言的原創(chuàng)文本和另一種文字的翻譯文本[4],是語料庫翻譯研究中比較適用且常用的一種。平行語料庫的最大特點是平行語料的對齊,即“源語文本和目的語文本在具體單位之間的對應(yīng)關(guān)系或翻譯關(guān)系”[5]。因此其最大的優(yōu)勢在于能夠?qū)⒃次谋九c其譯語文本進行對照檢索并顯示,通過分析對比兩種文體在詞匯、句子和文體上的差異,可以研究譯者所采取的翻譯策略和方法,探討翻譯轉(zhuǎn)換規(guī)律,便翻譯研究從規(guī)約性研究向描述性研究過渡。同時平行語料庫的構(gòu)建還將翻譯研究從最初的直覺式形式變?yōu)榫唧w可操作的研究模式;將小規(guī)模的、人工的、只針對兩種語言并且局限于個別文本類型的研究變成大規(guī)模、系統(tǒng)的、比較性的和目標明確的研究。這必將為語言對比研究和翻譯研究提供新的視角,同時為外語教學(xué)課程設(shè)計、教科書、參考書以及雙語詞典的編撰提供詳實的素材并改進教學(xué)方法,提高翻譯的水平和質(zhì)量。

        2 中醫(yī)藥語料庫研究現(xiàn)狀

        自20世紀60年代,傳統(tǒng)的EGP(English for general purposes)為主的模式開始向ESP (English for specific purpose) 轉(zhuǎn)變,語料庫構(gòu)建方面也從通用型轉(zhuǎn)往ESP型,如1987年中國石油大學(xué)建設(shè)的廣州石油語料庫,20世紀90年代以來廣州外語外貿(mào)大學(xué)與香港科技大學(xué)共建的科技英語語料庫等。

        中醫(yī)英語( ETCMP)作為ESP的一個分支,目前利用語料庫對其進行的研究也不乏其數(shù),但大多數(shù)為單語語料庫的構(gòu)建研究,如劉耀、周揚[6]探討了中醫(yī)藥古文獻語料庫詞語標識標準,對中醫(yī)藥英語語料庫的詞語標識起到了很好的借鑒作用;聞永毅、樊新榮[7]分析了中醫(yī)英語特點,強調(diào)語料采集時應(yīng)考慮中醫(yī)英語語料時間跨度;薛學(xué)彥[8]則分析了中醫(yī)英語語料庫在語法研究、詞典編寫和詞匯率信息等方面的建庫意義,同時在語料收集、標注、檢索軟件的選擇等方面闡述了建立中醫(yī)英語語料庫的方法;倪傳斌[9]在“中醫(yī)英語語料庫的建庫原則” 中從語料庫的用途、語料的代表性、語料庫的結(jié)構(gòu)與容量、采樣方法等幾個方面提出了具體的實施原則;另外還有一些從中醫(yī)英語語料庫對教學(xué)的意義方面著手的研究,如“淺談中醫(yī)英語語料庫及其教學(xué)意義”、“基于語料庫和多媒體計算機技術(shù)的中醫(yī)翻譯教改的嘗試”等。

        從國內(nèi)研究現(xiàn)狀來看,中醫(yī)藥英語語料庫研究受到越來越大的重視,在建庫意義、語料采集、標注、應(yīng)用等方面均有詳細闡述,但用于中醫(yī)藥翻譯的中醫(yī)藥雙語平行語料庫方面的研究相對滯后貧乏,目前主要有南京中醫(yī)藥大學(xué)施蘊中[10]的“黃帝內(nèi)經(jīng)” 漢英語料庫建設(shè)研究。另外還有陳滟、施蘊中[11]提出的中醫(yī)英語漢英口語語料庫的建設(shè),但我們注意這兩個漢英語料庫都沒有做到平行對齊,目前只是將漢英語料匯總而已。而在中藥方面,目前則并未出現(xiàn)過專門的英語語料庫,只是在中國藥科大學(xué)的藥學(xué)英語語料庫中含有一小部分內(nèi)容[12],而對中藥翻譯研究有著重要意義的中藥漢英雙語平行語料庫方面的研究更是尚未涉足。中藥學(xué)作為中醫(yī)的一個重要分支,具有不可或缺的地位,因此筆者認為構(gòu)建一個中藥漢英雙語語料庫勢在必行。

        3 中藥漢英雙語語料庫的構(gòu)建

        中藥漢英雙語語料庫的構(gòu)建一方面可滿足當前大規(guī)模的翻譯之需,另一方面可對中藥英譯的各方面研究提供客觀、真實、生動的數(shù)據(jù);同時也可應(yīng)用于中藥學(xué)教學(xué)課程設(shè)計及與中藥名相關(guān)的教科書、參考書及雙語術(shù)語詞典的編撰等工作,因此建立一個適用的中藥漢英雙語語料庫具有重大意義。

        雙語語料庫的構(gòu)建是語料庫翻譯學(xué)研究至關(guān)重要的第一步,主要有以下幾方面的工作:語料庫的設(shè)計、語料的選擇、語料的采集和加工以及雙語語料庫的平行等。

        3.1 語料庫設(shè)計

        語料庫的設(shè)計是指對語料庫進行總體建設(shè)規(guī)劃,包括明確語料庫的建庫目的、建庫意義和語料庫的類型,確定語料庫的規(guī)模和結(jié)構(gòu),并決定語料加工的程度等。本語料庫的建庫目的和意義已經(jīng)非常明確,即主要為中藥的英語筆譯研究和教學(xué)所用。語料庫的建設(shè)目的在很大程度上決定了語料庫的類型、規(guī)模、結(jié)構(gòu)和加工程度[13]。因此本語料將建成的漢英雙語平行語料庫的類型、規(guī)模則主要取決于中藥學(xué)本身學(xué)科的分類情況,擬依照學(xué)科分類將語料庫分為7類,即中藥學(xué)原理、中藥鑒定學(xué)、中藥方劑學(xué)、中藥藥理學(xué)、中藥炮制學(xué)、中藥化學(xué)及中藥學(xué)其他學(xué)科等,所占比例如下:中藥學(xué)原理20%、中藥鑒定學(xué)20%、中藥方劑學(xué)20%、中藥藥理學(xué)10%、中藥炮制學(xué)10%、中藥化學(xué)10%、中藥學(xué)其他學(xué)科10%。

        語料的加工主要是語料的平行對齊和標注處理等。平行語料對齊分為段落對齊和語句對齊兩種。為研究便利,本庫擬做到語句對齊。標注工作則主要在篇體信息標注方面,標注所屬分科目、譯者、出版社及出版時間等。

        3.2 語料選擇

        語料的選擇直接影響語料庫的代表性和可信性,國內(nèi)學(xué)者柏曉靜等[14]指出在選擇語料時需考慮兩個因素,即語料庫的應(yīng)用目標和原始語料本身的質(zhì)量。筆者認為雙語語料庫語料的選擇則應(yīng)特別考慮譯文文本的質(zhì)量和影響力,同時注意文本的獲得渠道、譯者及出版或發(fā)表時間等。為確保本庫語料的代表性,我們選擇的語料必須涵蓋中藥學(xué)的幾個重要領(lǐng)域,同時能夠盡可能地反映中藥英語的真實性。因此我們選擇的語料主要是三套不同正規(guī)權(quán)威出版社出版的相關(guān)漢英雙語的學(xué)術(shù)刊物、教科書及科普讀物等。

        3.3 語料采集

        語料采集是指將書面語料和口語語料以電子文檔的形式儲存在電腦中。本庫涉及的是書面語料,采集方法有三種,即人工輸入、掃描輸入和利用現(xiàn)有電子文本。由于正規(guī)權(quán)威中藥雙語電子文本比較難以獲得,因此本庫的語料采集第一步主要為印刷版書籍,擬采集三套共21本中藥英漢書籍,我們采納的方法為掃描輸入法。首先利用掃描儀 OCR 技術(shù)識別英漢語文本,然后將識別后的文本保存為 Microsoft Word 2003 文檔。每本書保存為一個 Microsoft Word 2003 的“. doc”文件,共計21個文檔。為保證語料的正確性,我們對掃描后的文檔錯誤進行人工除噪,并進行至少兩次人工校正。

        3.4 語料加工及對齊

        語料的加工是語料庫系統(tǒng)性構(gòu)建中的一個重要環(huán)節(jié)。語料的整理加工一般是分詞和標注并最終達到平行對齊的效果。雙語語料的平行對齊是指將源語語料與目的語語料在篇章、段落、詞句或詞匯四個層面建立對應(yīng)關(guān)系。我們首先要做的是實現(xiàn)語料的篇章、段落對齊。但鑒于我們的語料為一本雙語書籍掃描為一個word文檔,一個文檔中往往包含了中英文兩種文體,因此首先要做的是對漢英語文本進行切分及漢英語料分存。

        漢英語文本的切分工作將采納陳瀟瀟、葛詩利[15]的做法,而語料的標注采納的是柏曉靜等介紹的XML標記集。首先將所有的word文檔格式轉(zhuǎn)換為txt文本格式,之后利用Python程序,從每個文件中識別和提取英語和漢語文本,每個段落保存為一行,段落與段落之間保留一個空行,并且在行首和行尾添加段落標記“

        ”。 同時賦予該標記一個屬性 id,表示段落的編號,取值范圍為1~n,n 是文件的段落總數(shù)。最后,將整理得到純文本格式的篇章級對齊單位21個,每個篇章級對齊單位中的原文文件與譯文文件的翻譯關(guān)系用相同的文件名即書名來體現(xiàn),但附加不同的文件名后綴:原文文件為S,英語文件為T。篇章級對齊單位的基本屬性,即書籍的出版信息、作者、譯者等都在其原文文件和譯文文件中采用XML標記“”標記出來。根據(jù)陳瀟瀟等[15]的介紹,程序可以自動識別匹配絕大部分漢語段落與相應(yīng)的英語段落,同時給予同一屬性id號碼。只有少量不對等的多段落漢語和英語文本,程序無法識別并報告異常,這時需要人工檢查,視情況拆分漢語或者英語段落,做到1∶1段對齊。

        接下來要做的是實現(xiàn)句級層面對齊,因為目前軟件的開發(fā)上并沒能實現(xiàn)短語或詞匯的相互對應(yīng),一是因為漢英語言結(jié)構(gòu)本身的巨大差異,另外便是在翻譯過程中譯者往往靈活處理,并非一一對應(yīng),因此計算機難以做到自動識別。而目前雙語平行語料的對齊基本上都在句級別上,而且句子對齊的平行語料庫已經(jīng)具有相當大的利用價值,為翻譯研究和教學(xué)、雙語詞典的編撰提供了大量科學(xué)的數(shù)據(jù)。早在2002年柏曉靜等便已開發(fā)出實現(xiàn)句級對齊的軟件,也就是在段落對齊的基礎(chǔ)上,進一步進行基于句長的句子對齊。自動對齊前,可對一本書籍的部分抽樣語料人工對齊,調(diào)查本書籍英語單詞與漢語漢字的比例如1∶1.7左右,然后利用程序?qū)R時,對該本書籍設(shè)定合理的參數(shù)。陳瀟瀟等[15]指出如果遇到英語和漢語句子長度比例超過設(shè)定閾值時,尤其是非一對一的對齊匹配時,程序暫時終止運行,人工介入,檢查核實該句的情況,確保對齊準確,必要時人工調(diào)整對齊順序,然后繼續(xù)運行程序,完成整本書的對齊。英漢語句子對齊后,同樣在句子邊界采用 XML 格式進行標記。具體操作方法參照柏曉靜等的論文:句子級對齊單位(記作AS):一個句子級對齊單位是一個二元組,記作AS=,其中Si由一個或多個自然的句子組成;Ti由一個或多個自然的句子組成。Si與Ti之間具有“翻譯關(guān)系”。標記嵌套在標記內(nèi)部,標記又嵌套在

        標記內(nèi)部。為了保證語料句子對齊的質(zhì)量,人工輔助的計算機對齊語料仍然需要人工校對至少一遍以上。

        語料的平行對齊處理完之后,中藥漢英平行語料庫的創(chuàng)建工作基本完成,后續(xù)的研究工作是選擇一個合適的相關(guān)檢索分析軟件,從不同角度對語料進行數(shù)據(jù)分析(如ParaConc, Antcorc 或Wordsmith等),為中藥的英語翻譯研究及教學(xué)提供了一個新的平臺和視角。

        4 結(jié)語

        雙語平行語料庫的構(gòu)建為當前翻譯研究的一個新熱點,同時也必將為ESP翻譯研究提供新的視角。本文簡單介紹了語料庫翻譯研究方法,通過分析中醫(yī)藥英語語料庫的研究現(xiàn)狀證實構(gòu)建中藥漢英平行語料庫的重要性及必要性,并對語料庫構(gòu)建的具體步驟——語料庫的設(shè)計、語料的選擇、語料的采集和加工以及雙語語料庫的平行等進行了詳細介紹。建庫之后將開展一系列基于語料庫的中藥翻譯研究,中藥英語教學(xué)研究必將為提高中醫(yī)藥英語的翻譯水平以及改善中醫(yī)藥英語教學(xué)添磚加瓦。

        [1] 何安平.語料庫輔助教學(xué)英語入門[M]. 北京:外語教學(xué)與研究出版社,2010:12.

        [2] SARA LAVIOSA.Corpus-based translation studies:theory,findings,applications[M].Amsterdam:Editions Rodopi B.V.,2002:1.

        [3] 王克非.雙語對應(yīng)語料庫研制與應(yīng)用[M].北京:外語教學(xué)與研究出版社,2005:12.

        [4] MAEVE OLOHAN.Introducing corpora in translation studies[M].London and New York: Routledge Taylor & Francis Group, 2004: 25.

        [5] 胡開寶.語料庫翻譯學(xué)研究導(dǎo)引[M].南京:南京大學(xué)出版社,2012:45.

        [6] 劉耀,周揚.中醫(yī)藥古文獻語料庫詞語標識標準探討[J].中國中醫(yī)藥信息雜志,2002,9(3): 85-87.

        [7] 聞永毅,樊新榮.醫(yī)英語語料庫建設(shè)可行性探討[J].上海中醫(yī)藥雜志, 2003,37(4): 45-46.

        [8] 薛學(xué)彥.醫(yī)英語語料庫建設(shè)的設(shè)想[J]. 廣州中醫(yī)藥大學(xué)學(xué)報, 2004, 21(6): 482-485.

        [9] 倪傳斌.醫(yī)英語語料庫的建庫原則[J].上海中醫(yī)藥大學(xué)學(xué)報, 2009,19(3):5-6.

        [10] 李蘋,施蘊中.料庫語言學(xué)和《黃帝內(nèi)經(jīng)》漢英語料庫[J].中國科技信息,2009(2):259-261.

        [11] 陳滟,施蘊中.語料庫語言學(xué)和中醫(yī)漢英口語語料庫[J].江西中醫(yī)學(xué)院學(xué)報,2005, 17(5):67-69.

        [12] 路露,張桂軍.藥學(xué)英語語料庫的構(gòu)建及其應(yīng)用研究[J].今日藥學(xué),2010,20(11):63-66.

        [13] 胡開寶.語料庫翻譯學(xué)研究導(dǎo)引[M].南京:南京大學(xué)出版社,2012:46.

        [14] 黃河燕.2002 全國機器翻譯研討會文集:機器翻譯研究進展[M].北京:電子工業(yè)出版社,2002:124-131.

        [15] 陳瀟瀟,葛詩利.醫(yī)學(xué)著作英漢雙語平行語料庫的構(gòu)建[J].外語藝術(shù)教育研究,2012(1):33-36.

        (責任編輯:尹晨茹)

        Designing and Building of Bilingual Chinese-English Database of Traditional Chinese

        Lan Caiyu

        (College of Foreign Languages,Guangdong Pharmaceutical University,Guangdong 510006,China)

        Parallel corpus has made great influence on language studies and translation studies, and it is also a new perspective for ESP translation studies. This paper starts with an introduction to parallel corpus. On analyzing the status of CTM English corpus, it is necessary to construct a CTM Chinese-English Parallel Corpus. Finally, the paper makes a detailed study on the steps of constructing a CTM Chinese-English Parallel Corpus.

        Parallel Corpus; CTM English; CTM Chinese-English Parallel Corpus Construction

        2013-10-05

        2013年廣東省高等學(xué)校學(xué)科與專業(yè)建設(shè)專項基金科研類項目(2013WYXM0064)

        蘭彩玉(1978-),女,廣東藥學(xué)院外國語學(xué)院講師,研究方向為翻譯理論與實踐。

        H09

        A

        1673-2197(2014)08-0001-03

        猜你喜歡
        中醫(yī)藥中藥文本
        中藥久煎不能代替二次煎煮
        中老年保健(2021年4期)2021-12-01 11:19:40
        您知道嗎,沉香也是一味中藥
        中老年保健(2021年4期)2021-08-22 07:08:32
        中醫(yī)藥在惡性腫瘤防治中的應(yīng)用
        中醫(yī)藥在治療惡性腫瘤骨轉(zhuǎn)移中的應(yīng)用
        中醫(yī),不僅僅有中藥
        金橋(2020年7期)2020-08-13 03:07:00
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        中藥貼敷治療足跟痛
        從《中醫(yī)藥法》看直銷
        中醫(yī)藥立法:不是“管”而是“促”
        国产一区二区三区视频大全| av一区二区三区人妻少妇| 亚洲成人小说| 99精品国产第一福利网站| 麻豆成年人视频在线观看| 国产麻花豆剧传媒精品mv在线| 亚洲av最新在线网址| 亚洲最新版无码AV| 日本一道高清在线一区二区| 日本高清一级二级三级| 久久er99热精品一区二区| 亚洲成人免费观看| 亚洲色图在线视频观看| 亚洲国产精品一区二区久久恐怖片| 337p日本欧洲亚洲大胆精品| 久久艹影院| 亚洲中文字幕第二十三页| 漂亮丰满人妻被中出中文字幕 | 日本在线看片免费人成视频1000| 久久无码人妻一区=区三区| 亚洲一区有码在线观看| 偷拍一区二区视频播放器| 国产av无码专区亚洲av极速版| 国产精品 精品国内自产拍| 日韩精品视频av在线观看| 国产婷婷色一区二区三区| 久久棈精品久久久久久噜噜| 久久精品午夜免费看| 亚洲成人精品在线一区二区| 无码国内精品久久人妻| 狠狠色狠狠色综合久久第一次| 久久午夜伦鲁鲁片免费| 蜜桃视频国产一区二区| 2021久久精品国产99国产精品 | 国产一区二区三区小说| 国产亚洲精品综合一区二区| 欧美丰满少妇xxxx性| 又黄又爽又色又刺激的视频| 亚洲日韩精品AⅤ片无码富二代| 久久精品国产亚洲av成人文字| 99精品国产一区二区三区|