傅 順,羅永勝
(廣東醫(yī)學(xué)院 外語教學(xué)部,廣東 東莞 523808)
教學(xué)型醫(yī)學(xué)英語語料庫(kù)的界定及其建庫(kù)原則
傅 順,羅永勝
(廣東醫(yī)學(xué)院 外語教學(xué)部,廣東 東莞 523808)
教學(xué)型醫(yī)學(xué)英語語料庫(kù)是用于醫(yī)學(xué)英語教學(xué)及相關(guān)研究的專用語料庫(kù),可以根據(jù)不同的應(yīng)用目的來收集,處理和存儲(chǔ)語料,從而產(chǎn)生不同類型子庫(kù)。建庫(kù)的過程中應(yīng)該考慮語料的真實(shí)性、代表性、適應(yīng)性、共時(shí)性、分層性和不侵權(quán)性,以此來保證發(fā)揮其在醫(yī)學(xué)英語教學(xué)中應(yīng)有的作用。
醫(yī)學(xué)英語;語料庫(kù);建庫(kù)原則;定義;教學(xué)
語料庫(kù)語言學(xué)是最近40年才發(fā)展起來的一門新興學(xué)科,醫(yī)學(xué)英語語料庫(kù)建設(shè)和研究則是最近10年內(nèi)才出現(xiàn)。教學(xué)型醫(yī)學(xué)英語語料庫(kù)屬于專門用途語料庫(kù),盡管語料庫(kù)語言學(xué)發(fā)展迅速,然而醫(yī)學(xué)英語語料庫(kù)的建設(shè)和應(yīng)用研究在我國(guó)卻才剛剛起步。在中國(guó)期刊網(wǎng)和萬方數(shù)據(jù)上能夠搜索到的醫(yī)學(xué)英語語料庫(kù)相關(guān)論文不到10篇,真正涉及到醫(yī)學(xué)英語語料庫(kù)及其應(yīng)用研究才5篇。這些研究大多只停留在理論設(shè)想階段,如聞?dòng)酪?、樊新榮(2003),薛學(xué)彥(2004)提出了建立中醫(yī)英語語料庫(kù)的設(shè)想,張文清(2008)則提出了建立醫(yī)學(xué)英語寫作語料庫(kù)的設(shè)想,王連柱(2009)探討了醫(yī)學(xué)英語語料庫(kù)的建庫(kù)原則。當(dāng)然也有一些基于醫(yī)學(xué)英語相關(guān)語料庫(kù)的應(yīng)用研究,如王京(2006)利用100萬詞次的醫(yī)學(xué)研究論文語料庫(kù)構(gòu)建了醫(yī)學(xué)學(xué)術(shù)詞表,王連柱等(2008)探討了醫(yī)學(xué)英語語料庫(kù)在醫(yī)學(xué)英語詞匯教學(xué)中的應(yīng)用。這些研究雖然取得了一定的成果,但是還是處于摸索階段,并沒有對(duì)醫(yī)學(xué)英語語料庫(kù)的建設(shè)和應(yīng)用提出系統(tǒng)的理論分析。隨著醫(yī)學(xué)英語(EMP,English for Medical Purpose)在我國(guó)的興起,用于教學(xué)目的的醫(yī)學(xué)英語語料庫(kù)建設(shè)成為了一項(xiàng)迫切任務(wù)。本文主要探討教學(xué)型醫(yī)學(xué)英語的界定和建庫(kù)原則。
從語源的角度來看,語料庫(kù)(corpus,源于拉丁語,復(fù)數(shù) corpora)意為“a human or animal body”(人或動(dòng)物的軀體),后來發(fā)展為“a measurable whole”(可以測(cè)量的整體),現(xiàn)在主流意義為“a collection of written or spoken texts”(書面或口語文本的集合)??梢姡ǔR饬x上的語料庫(kù)可以理解為“文本的集合”,也就是說只要把某一類型的文本集合在一起就可以稱之為一個(gè)語料庫(kù)。然而,現(xiàn)代語言學(xué)意義上的語料庫(kù)并不是完全如此,而是指“按照一定的采樣標(biāo)準(zhǔn)采集而來的,能夠代表一種或者某語言的一種變體或文類的電子文集”(梁茂成等 2010)。從該定義來看,語料庫(kù)至少應(yīng)該包含有以下特征:首先語料庫(kù)應(yīng)該是一個(gè)電子文集,這就意味著語料庫(kù)可以采用計(jì)算機(jī)技術(shù)來進(jìn)行批量處理,不能用電腦軟件來進(jìn)行批量處理的紙版文集難以稱之為語料庫(kù)。其次,語料庫(kù)必須有一定的代表性,不是隨便收集一些電子文檔堆砌在一起就可以說是語料庫(kù),而是要按照一定的抽樣原則采集而來的有代表性的能夠?qū)崿F(xiàn)一定研究和應(yīng)用目的的電子文檔集合,否則應(yīng)用價(jià)值就會(huì)大打折扣。最后,語料庫(kù)所采集的文本應(yīng)該為真實(shí)的自然文本,不能夠是采集者編造的語料,自然真實(shí)性是語料庫(kù)研究的一個(gè)根本屬性,正是這一點(diǎn)決定了語料庫(kù)語言學(xué)的實(shí)證性。概括來說,語料庫(kù)就是自然文本構(gòu)成的,能夠用計(jì)算機(jī)軟件處理的,有一定代表性的、電子文本資源庫(kù)。因而,語料庫(kù)通常以TXT文本形式儲(chǔ)存于計(jì)算機(jī)存儲(chǔ)器中。
不同的學(xué)者對(duì)語料庫(kù)的分類有不同的看法,如楊惠中(2002)把語料庫(kù)分為通用語料庫(kù)、專用語料庫(kù)、監(jiān)控語料庫(kù)、口語語料庫(kù)、學(xué)生英語語料庫(kù)、平行語料庫(kù)等6種類型,何安平(2004)則把語料庫(kù)分為原始語料庫(kù)、附碼語料庫(kù)、平行語料庫(kù)、學(xué)習(xí)者語料庫(kù)和網(wǎng)格式語料庫(kù)等5種。而梁茂成等(2010)在其合著的《語料庫(kù)應(yīng)用教程》中列出了通用語料庫(kù)、專用語料庫(kù)、共時(shí)語料庫(kù)、歷時(shí)語料庫(kù)、口語語料庫(kù)、筆語語料庫(kù)、本族語語料庫(kù)、學(xué)習(xí)者語料庫(kù)、單語語料庫(kù)、平行/雙語語料庫(kù)、多語語料庫(kù)等12種語料庫(kù)??梢娔壳斑€沒一個(gè)學(xué)界所公認(rèn)的語料庫(kù)分類標(biāo)準(zhǔn)。為了準(zhǔn)確地界定何為教學(xué)型醫(yī)學(xué)英語語料庫(kù),有必要對(duì)語料庫(kù)分類標(biāo)準(zhǔn)進(jìn)行探討。
任何事物的分類都是一個(gè)范疇化的過程,范疇化就是要找出事物的相似之處和不同之處,無論是尋找相似之處還是不同之處都必須有一個(gè)更高的范疇作為基礎(chǔ)。語料庫(kù)的分類也是如此。從語料庫(kù)的建庫(kù)目的和用途來看,可以分為通用語料庫(kù)和專用語料庫(kù);從語料庫(kù)語料的來源來看,可以分為本族語者語料庫(kù)和學(xué)習(xí)者語料庫(kù);從語料庫(kù)的處理方式來看可以分為人工標(biāo)注語料庫(kù)和自動(dòng)標(biāo)注語料庫(kù);從語料處理的程度來看,可以分為原始語料庫(kù)和附碼語料庫(kù);從語料存儲(chǔ)的介質(zhì)來看可以分為單機(jī)版語料庫(kù)和網(wǎng)絡(luò)語料庫(kù);從語料的語言構(gòu)成來看,可以分為單語語料庫(kù),雙語語料庫(kù)和多語語料庫(kù);從語料存在的時(shí)空坐標(biāo)來看,可以分為歷時(shí)語料庫(kù)和共時(shí)語料庫(kù);從語料庫(kù)的狀態(tài)來看可以分為靜態(tài)閉合語料庫(kù)和動(dòng)態(tài)開放語料庫(kù)??偠灾Z料庫(kù)可以在自身的范疇之內(nèi),依照不同的標(biāo)準(zhǔn)進(jìn)行分類,同一個(gè)語料庫(kù)在不同的標(biāo)準(zhǔn)之下可以屬于不同的語料庫(kù)類型。本文主要依照以上標(biāo)準(zhǔn)來對(duì)教學(xué)型醫(yī)學(xué)英語語料庫(kù)進(jìn)行界定。
教學(xué)型醫(yī)學(xué)英語語料庫(kù)具備語料庫(kù)的基本特征,即代表性、真實(shí)性、集成性和可自動(dòng)處理性。從其主要建庫(kù)目的和用途來看,屬于專用語料庫(kù),主要用于醫(yī)學(xué)英語的教學(xué)活動(dòng),當(dāng)然也可以用于醫(yī)學(xué)英語教材的編寫和醫(yī)學(xué)英語詞典編纂。從語料來源來看,主要是來自于英語本族語的醫(yī)學(xué)相關(guān)文章和教材,屬于本族語語料庫(kù)。當(dāng)然為了適應(yīng)教學(xué)的需要,也可以將我國(guó)醫(yī)學(xué)生的英語論文制作成子庫(kù)用于分析二語習(xí)得者的醫(yī)學(xué)英語掌握情況,從這一點(diǎn)來看,教學(xué)型醫(yī)學(xué)英語語料庫(kù)可以稱之為混合英語語料庫(kù)。從語料的處理方式來看,教學(xué)型醫(yī)學(xué)英語語料庫(kù)可以根據(jù)具體的需要采用軟件自動(dòng)標(biāo)注和人工標(biāo)注相結(jié)合的形式進(jìn)行,以自動(dòng)標(biāo)注為主,人工標(biāo)注為輔,因此可以稱之為混合標(biāo)注語料庫(kù)。從語料處理程度來看,教學(xué)型醫(yī)學(xué)英語語料庫(kù)可以分成兩部分,用于不同的研究和教學(xué)目的。一部分以原始語料的形式存儲(chǔ),可以命名為教學(xué)型醫(yī)學(xué)英語原始語料庫(kù)。另一部分以標(biāo)注好的形式存儲(chǔ),稱之為教學(xué)型醫(yī)學(xué)英語附碼語料庫(kù)。從語料存儲(chǔ)的介質(zhì)來看,可以存儲(chǔ)在電腦硬盤中,也可以刻錄成光盤,也可以發(fā)布在教學(xué)網(wǎng)站上。從語料存在的時(shí)空坐標(biāo)來看,教學(xué)型醫(yī)學(xué)英語語料庫(kù)收集語料一般是當(dāng)代的醫(yī)學(xué)英語,因而屬于共時(shí)語料庫(kù)。從語料庫(kù)的狀態(tài)來看,教學(xué)型醫(yī)學(xué)英語語料庫(kù)應(yīng)該與時(shí)俱進(jìn),隨時(shí)更新,以適應(yīng)教學(xué)的需要,因此可以歸屬于動(dòng)態(tài)語料庫(kù)。此外,從語料的語言構(gòu)成來看,主要由英語構(gòu)成,屬于單語語料庫(kù)的范疇。然而為了特殊的教學(xué)需要,也可以收集中英兩種語言相對(duì)應(yīng)的語料,制作成雙語平行語料庫(kù),比如用于醫(yī)學(xué)英語翻譯教學(xué),就需要平行語料庫(kù)??傊?,教學(xué)型醫(yī)學(xué)英語語料庫(kù),可以根據(jù)不同的標(biāo)準(zhǔn)來進(jìn)行界定,也可以根據(jù)不同教學(xué)目的來劃分子范疇??偠灾?,教學(xué)型醫(yī)學(xué)英語語料庫(kù)就是用于醫(yī)學(xué)英語教學(xué)及相關(guān)研究的專用語料庫(kù),可以根據(jù)不同的應(yīng)用目的來收集,處理和存儲(chǔ)語料,從而產(chǎn)生不同類型子庫(kù)。
任何語料庫(kù)在建庫(kù)之前都應(yīng)該考慮建庫(kù)的原則。建庫(kù)原則一般根據(jù)語料庫(kù)的目的和語料庫(kù)將要實(shí)現(xiàn)的功能以及其應(yīng)用對(duì)象來確定。建庫(kù)原則可以分為兩種類型。一類是語料庫(kù)建庫(kù)的一般原則,另一類是專用語料庫(kù)的特殊原則。一般原則是語料的真實(shí)性原則,代表性原則和采集語料時(shí)的不侵權(quán)原則。特殊原則根據(jù)語料庫(kù)的具體建庫(kù)目的而定(Kennedy,2000)。我們認(rèn)為教學(xué)型醫(yī)學(xué)英語語料庫(kù)應(yīng)該包括適應(yīng)性原則,共時(shí)性原則和分層性原則,以利于在醫(yī)學(xué)英語教學(xué)中的應(yīng)用。
(1)真實(shí)性原則。語料庫(kù)語言學(xué)是基于體驗(yàn)哲學(xué)的基礎(chǔ)之上的,語料的真實(shí)性是保證基于語料庫(kù)研究實(shí)證性的根本原則。為了讓學(xué)生和教師接觸到真實(shí)自然語言材料,原汁原味的醫(yī)學(xué)英語文本是必要的前提。因此在收集語料時(shí),務(wù)必要保證文章是真實(shí)自然的文本,最好是由本族語作者完成。
(2)代表性原則。語料庫(kù)之所以能夠受到廣大語言研究者青睞,很大一部分原因是因?yàn)檎Z料庫(kù)具有很強(qiáng)的代表性,用大量的語言事實(shí)和數(shù)據(jù)來說明問題,因而具備較為強(qiáng)大的說服力。盡管教學(xué)型醫(yī)學(xué)英語語料庫(kù)的主要目的是用于醫(yī)學(xué)英語教學(xué),但是選取的語料也應(yīng)該具備有一定的代表性,否則就不能反映醫(yī)學(xué)英語的普遍規(guī)律,不能把典型醫(yī)學(xué)英語語言特征展現(xiàn)出來,從而不能達(dá)到良好的教學(xué)效果。
(3)適應(yīng)性原則。教學(xué)型醫(yī)學(xué)英語語料庫(kù)主要是為醫(yī)學(xué)英語教學(xué)服務(wù),因此所收集的語料應(yīng)該適應(yīng)教學(xué)的需要。過于深?yuàn)W和淺顯的文章都不適宜采集,應(yīng)該采集難度適中,趣味性強(qiáng),并且?guī)в幸欢ㄖR(shí)性的文章作為語料以適應(yīng)醫(yī)學(xué)英語教學(xué)和學(xué)習(xí)的需要。因此最好是醫(yī)學(xué)科普類文章,以及醫(yī)學(xué)通識(shí)教材和健康雜志上的文章。過于陳舊和前沿的醫(yī)學(xué)研究論文要慎重考慮。
(4)共時(shí)性原則。出于交際的需要,我們所學(xué)習(xí)的英語基本上都是當(dāng)代英語。醫(yī)學(xué)英語教學(xué)也應(yīng)該是建立在當(dāng)代英語的基礎(chǔ)之上,因此在選取語料時(shí),時(shí)間跨度不能太大。時(shí)間跨度太大,一方面會(huì)造成語料收集的困難,另一方面無法保證語料的共時(shí)性,因而最好選取最近20年以內(nèi)的文章作為語料。這樣就不會(huì)給醫(yī)學(xué)英語教學(xué)帶來不必要的困惑。
(5)分層性原則。選取的語料,難度應(yīng)該有一定的層級(jí)性。即不同難易程度的語料應(yīng)該分別儲(chǔ)存于不同的子庫(kù),這樣有利于針對(duì)不同英語水平和醫(yī)學(xué)教育層次的學(xué)生選取不同的語料。為了方便操作,可以嘗試針對(duì)普通群眾的科普類醫(yī)學(xué)文獻(xiàn)歸為一類,基礎(chǔ)的醫(yī)學(xué)英語教材以及相應(yīng)讀物分為一類,醫(yī)學(xué)權(quán)威雜志上的論文分為一類。前兩類可以用于本科生教學(xué)。第三類可以用于研究生教學(xué)。
(6)不侵權(quán)原則。任何語料庫(kù)在收集語料的過程中,都要考慮所收集的語料是否會(huì)侵犯到著作所有人的版權(quán)。因此當(dāng)有可能侵犯版權(quán)的時(shí)候,語料采集者應(yīng)該通過協(xié)商、購(gòu)買等方式征得版權(quán)所有者的同意。這樣可以避免出現(xiàn)一些不必要的麻煩。當(dāng)然一般不用于商業(yè)用途的教學(xué)研究性語料庫(kù),可以不必要考慮這個(gè)問題。但是至少應(yīng)該對(duì)版權(quán)所有者表示感謝。
語料庫(kù)語言學(xué)已經(jīng)成為語言學(xué)及其應(yīng)用研究的主流,“讓語料庫(kù)說話”已經(jīng)成為了學(xué)界廣泛達(dá)成的共識(shí),越來越多的語言學(xué)家和教育工作者認(rèn)識(shí)到了語料庫(kù)在各種語言研究的重要性。作為專門用途英語的重要分支醫(yī)學(xué)英語,理應(yīng)順應(yīng)時(shí)代潮流的發(fā)展,建立各種有特殊用途的醫(yī)學(xué)英語語料庫(kù),并將它們應(yīng)用于醫(yī)學(xué)英語研究和教學(xué)中去。本文只是對(duì)教學(xué)型醫(yī)學(xué)英語語料庫(kù)的界定和原則進(jìn)行一個(gè)粗略的探討,希望能夠拋磚引玉。我們相信在不久的將來,醫(yī)學(xué)英語語料庫(kù)及其應(yīng)用研究也會(huì)成為醫(yī)學(xué)英語研究的主流,并發(fā)展成為獨(dú)立的醫(yī)學(xué)語料庫(kù)語言學(xué),為醫(yī)學(xué)教育的發(fā)展貢獻(xiàn)自己特有的力量。
[1] Graeme Kennedy.An introduction to Corpus Linguistics[M].顧曰國(guó)導(dǎo)讀,北京:外語教學(xué)與研究出版社,2000.
[2] 楊惠中.語料庫(kù)語言學(xué)教程[M].上海:上海外語教育出版社,2002.
[3] 何安平.語料庫(kù)語言學(xué)與英語教學(xué)[M].北京:外語教學(xué)與研究出版社,2004.
[4] 薛學(xué)彥.中醫(yī)英語語料庫(kù)建立的設(shè)想[J].廣州中醫(yī)藥大學(xué)學(xué)報(bào),2004(6):482-485.
[5] 聞?dòng)酪悖聵s.中醫(yī)英語語料庫(kù)建設(shè)可行性探討[J].上海中醫(yī)藥雜志,2003(4):45-46.
[6] 張文青.醫(yī)學(xué)英語寫作語料庫(kù)建設(shè)的構(gòu)想[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2008(7):61-63.
[7] 王連柱.醫(yī)學(xué)英語語料庫(kù)的建庫(kù)原則探析[J].新鄉(xiāng)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2009(4):131-132.
[8] 王京.基于醫(yī)學(xué)研究論文語料庫(kù)的醫(yī)學(xué)學(xué)術(shù)詞表的構(gòu)建[D].第四軍醫(yī)大學(xué),2006.
[9] 王連柱,王蘭英.語料庫(kù)及檢索工具在醫(yī)學(xué)英語詞匯教學(xué)實(shí)踐中的應(yīng)用研究[J].中國(guó)醫(yī)學(xué)教育技術(shù),2008(10):427-430.
[10] 梁茂成.語料庫(kù)應(yīng)用教程[M].北京;外語教學(xué)與研究出版社,2010.
Definition of Medical English Corpus for Teaching and the Principles for Building the Database
FU Shun,LUO Yong-sheng
(Foreign Languages Department,Guangdong Medical College,Dongguan 523808,China)
Medical English corpus for teaching purpose is a special corpus used for medical English teaching and related researches.Different types of branches can be produced by collection,process and storage of corpus according to various purposes.Authenticity,representation,adaptability,synchronicity,hierarchy and non-infringement should be considered in the process of building a database,in order to guarantee its due role in medical English teaching.
medical English;corpus;principles of building a database;definition;teaching
G642
A
1009-3907(2012)09-1164-03
2012-04-20
中華醫(yī)學(xué)會(huì)醫(yī)學(xué)教育研究立項(xiàng)課題(ZHYXJY1034);廣東醫(yī)學(xué)院高等教育教學(xué)成果項(xiàng)目(YJG201139211)
傅順(1980-),女,湖南湘潭人,講師,主要從事外國(guó)語言學(xué)及應(yīng)用語言學(xué)研究;羅永勝(1979-),男,湖南邵陽人,講師,博士研究生,主要從事語言與研究。
責(zé)任編輯:劉 琳