宋亞軍
(河南工學(xué)院 外語(yǔ)系,河南 新鄉(xiāng) 453003)
小型旅游英漢雙語(yǔ)平行語(yǔ)料庫(kù)的創(chuàng)建及教學(xué)應(yīng)用
宋亞軍
(河南工學(xué)院 外語(yǔ)系,河南 新鄉(xiāng) 453003)
當(dāng)今語(yǔ)料庫(kù)已經(jīng)應(yīng)用在多個(gè)學(xué)科領(lǐng)域,也得到學(xué)者們?cè)絹?lái)越多的重視,但是具有地方特色,能夠服務(wù)地方發(fā)展的小型雙語(yǔ)平行語(yǔ)料庫(kù)的獨(dú)特優(yōu)勢(shì)和應(yīng)用價(jià)值還需繼續(xù)挖掘。文章以一個(gè)小型旅游英漢雙語(yǔ)平行語(yǔ)料庫(kù)的創(chuàng)建及其在教學(xué)中的應(yīng)用表明,雙語(yǔ)平行語(yǔ)料庫(kù)在專門用途英語(yǔ)教學(xué)上也有著廣闊的使用前景。關(guān)鍵詞:專門用途英語(yǔ);雙語(yǔ)平行語(yǔ)料庫(kù);英語(yǔ)教學(xué)
毋庸置疑,語(yǔ)料庫(kù)語(yǔ)言學(xué)的持續(xù)發(fā)展不僅加強(qiáng)了學(xué)科之間的聯(lián)系,如語(yǔ)料庫(kù)翻譯學(xué)、語(yǔ)料庫(kù)與二語(yǔ)習(xí)得、話語(yǔ)研究、機(jī)器翻譯等,同時(shí)它也提供了獨(dú)具特色的量化研究方法,使得計(jì)算機(jī)技術(shù)可快速、準(zhǔn)確、高效地處理大批量數(shù)據(jù),來(lái)幫助人們解決多維度、深層次的語(yǔ)言問(wèn)題。
盡管有些國(guó)際學(xué)者對(duì)平行語(yǔ)料庫(kù)和可比語(yǔ)料庫(kù)的概念還存在爭(zhēng)議[1]19,但國(guó)內(nèi)普遍認(rèn)為平行語(yǔ)料庫(kù)是指收錄某一源語(yǔ)語(yǔ)言文本及其對(duì)應(yīng)的目的語(yǔ)文本的語(yǔ)料庫(kù)[2]33。王克非也指出平行語(yǔ)料庫(kù)是由源語(yǔ)文本及其平行對(duì)應(yīng)的譯語(yǔ)文本構(gòu)成的雙語(yǔ)語(yǔ)料庫(kù)[3]6。而專門用途雙語(yǔ)平行語(yǔ)料庫(kù)是依據(jù)某一特定學(xué)科或?qū)I(yè)領(lǐng)域而建立的雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù),其立足點(diǎn)是語(yǔ)料來(lái)源于某一學(xué)科或者專業(yè)[4]。相比通用語(yǔ)料庫(kù),專門用途語(yǔ)料庫(kù)在專業(yè)詞典編撰、學(xué)科語(yǔ)言研究及教學(xué)方面的優(yōu)勢(shì)是很明顯的,但是受限于語(yǔ)料庫(kù)資源的匱乏、語(yǔ)料庫(kù)建設(shè)困難等原因,專門用途語(yǔ)料庫(kù)的建設(shè)和研究發(fā)展緩慢,而且面臨很多的問(wèn)題和挑戰(zhàn)。本文在梳理國(guó)內(nèi)專門用途平行語(yǔ)料庫(kù)研究現(xiàn)狀基礎(chǔ)上,詳細(xì)描述建設(shè)專門用途語(yǔ)料庫(kù)的具體方法及專門用途語(yǔ)料庫(kù)的教學(xué)應(yīng)用。
自從20世紀(jì)90年代世界上第一個(gè)雙語(yǔ)平行語(yǔ)料庫(kù)——加拿大議會(huì)會(huì)議錄英法平行語(yǔ)料庫(kù)建成后,經(jīng)過(guò)20多年的發(fā)展,雙語(yǔ)平行語(yǔ)料庫(kù)在技術(shù)開(kāi)發(fā)、詞典編撰及語(yǔ)言研究方面都取得了很大的發(fā)展。國(guó)內(nèi)在平行語(yǔ)料庫(kù)建設(shè)方面也有不少建樹(shù),建成了不少大型平行語(yǔ)料庫(kù),如:北京外國(guó)語(yǔ)大學(xué)王克非等創(chuàng)建的3000萬(wàn)字/詞通用漢英平行語(yǔ)料庫(kù),上海交通大學(xué)胡開(kāi)寶等學(xué)者創(chuàng)建的1000萬(wàn)字/詞英漢醫(yī)學(xué)平行語(yǔ)料庫(kù)[5],以及香港理工大學(xué)和北京外國(guó)語(yǔ)大學(xué)學(xué)者共同創(chuàng)建的約100萬(wàn)字/詞的英漢旅游文本語(yǔ)料庫(kù)等[6]。
但這些雙語(yǔ)語(yǔ)料庫(kù)出于建庫(kù)類型、研究目的及最終用戶等因素的影響,在具體學(xué)科教學(xué)方面尚有限制,筆者在中國(guó)知網(wǎng)以“平行語(yǔ)料庫(kù)”為主題詞查詢發(fā)現(xiàn),近些年關(guān)于平行語(yǔ)料庫(kù)研究雖呈增長(zhǎng)趨勢(shì),尤其從2015開(kāi)始每年論文發(fā)表篇數(shù)都已過(guò)百,但和通用語(yǔ)料庫(kù)研究相比還存在許多不足之處:(1)語(yǔ)料庫(kù)建設(shè)過(guò)多,口語(yǔ)及專門領(lǐng)域研究很少;(2)學(xué)科領(lǐng)域分布不均勻,尚有很多學(xué)科沒(méi)有適合的語(yǔ)料庫(kù);(3)資源共享困難,存在重復(fù)建設(shè)現(xiàn)象;(4)關(guān)于文學(xué)和翻譯的研究較多,具體學(xué)科教學(xué)實(shí)踐的應(yīng)用研究較少。
本課題組地處河南,河南省旅游資源豐富,省政府也十分重視旅游資源的開(kāi)發(fā)和利用,在河南省國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展“十三五”規(guī)劃綱要中也強(qiáng)調(diào)要依托建設(shè)鄭汴洛焦國(guó)際文化旅游名城,打造一批文化旅游、鄉(xiāng)村旅游、生態(tài)旅游、紅色旅游、特色旅游精品線路和品牌景區(qū),塑造國(guó)際國(guó)內(nèi)旅游形象品牌。但河南旅游外宣資料還有不足之處,語(yǔ)言使用還有很多問(wèn)題[7]?;诖?,本研究依托地方資源和優(yōu)勢(shì),試圖建設(shè)適合地方發(fā)展的小型專門旅游雙語(yǔ)平行語(yǔ)料庫(kù),探討面向教學(xué)的平行語(yǔ)料庫(kù)建設(shè),以期幫助河南旅游事業(yè)培養(yǎng)更多的后備人才。
雙語(yǔ)平行語(yǔ)料庫(kù)建設(shè)不同于單語(yǔ)語(yǔ)料庫(kù)建設(shè),在收集語(yǔ)料、語(yǔ)料對(duì)齊及整理方面比較復(fù)雜,本研究歷時(shí)半年建成了25萬(wàn)字/詞小型旅游英漢雙語(yǔ)平行語(yǔ)料庫(kù)。語(yǔ)料庫(kù)的建設(shè)經(jīng)歷了語(yǔ)料庫(kù)設(shè)計(jì)、語(yǔ)料收集和語(yǔ)料整理三個(gè)步驟,現(xiàn)將語(yǔ)料庫(kù)建設(shè)情況介紹如下:
2.1 語(yǔ)料庫(kù)的總體設(shè)計(jì)
語(yǔ)料庫(kù)的建設(shè)規(guī)模要依據(jù)研究目的來(lái)確定,并非越大越好,小型但具有較強(qiáng)針對(duì)性的語(yǔ)料庫(kù)也能達(dá)到應(yīng)有的研究目的。Tribble認(rèn)為大型語(yǔ)料庫(kù)由于其范圍較廣、數(shù)據(jù)龐雜而并不適合專門用途英語(yǔ)學(xué)習(xí),也無(wú)法對(duì)教師和學(xué)生提供直接有效的幫助。Flowerdew認(rèn)為一般的小型語(yǔ)料庫(kù)規(guī)模達(dá)到25萬(wàn)字/詞就夠了[8]67。由于本語(yǔ)料庫(kù)設(shè)計(jì)目的主要是為了研究當(dāng)?shù)芈糜挝谋镜恼Z(yǔ)言特點(diǎn)、揭示翻譯方法和策略,以幫助學(xué)生和教師了解并熟悉行業(yè)用語(yǔ)并提高他們的語(yǔ)言應(yīng)用水平,從而為旅游事業(yè)發(fā)展提供語(yǔ)言支持和幫助。在加上地域和時(shí)間的限制,本語(yǔ)料庫(kù)所定的初始規(guī)模25萬(wàn)字/詞應(yīng)該可以滿足教學(xué)需求。
2.2 語(yǔ)料收集
語(yǔ)料收集最主要的問(wèn)題就是語(yǔ)料的代表性。語(yǔ)料庫(kù)的代表性指的是一個(gè)語(yǔ)料庫(kù)在多大程度上代表一種語(yǔ)言或語(yǔ)言變體中各種不同的語(yǔ)言現(xiàn)象[9]7?;诖?,本語(yǔ)料庫(kù)語(yǔ)料來(lái)源主要是教材資料、正式出版物及互聯(lián)網(wǎng)資源。紙質(zhì)采集方法主要為掃描輸入,使用的工具為ABBYY FINEREADER12。
2.3 語(yǔ)料處理和加工
語(yǔ)料處理和加工主要包括語(yǔ)料降噪清理、元信息標(biāo)記、分詞處理及語(yǔ)料對(duì)齊。語(yǔ)料降噪處理一般包括編碼轉(zhuǎn)換、格式規(guī)范及拼寫(xiě)檢查等,目的是為了讓計(jì)算機(jī)準(zhǔn)確地讀取數(shù)據(jù)。同時(shí)每個(gè)文本也會(huì)添加元信息,以方便記錄、了解文本屬性,如作者、主題、體裁、譯者、時(shí)間等信息。語(yǔ)料庫(kù)分詞處理和語(yǔ)料對(duì)齊對(duì)建設(shè)平行語(yǔ)料庫(kù)至關(guān)重要,目的是為了讓源語(yǔ)和目的語(yǔ)一一對(duì)應(yīng)起來(lái),以方便存儲(chǔ)和提取語(yǔ)言間的對(duì)譯轉(zhuǎn)換信息[3]22。
平行語(yǔ)料庫(kù)常見(jiàn)的對(duì)齊方式是句級(jí)對(duì)齊,因?yàn)閷?duì)翻譯意義單位提取仍存在技術(shù)困難[10],而分詞處理及句級(jí)對(duì)齊技術(shù)相對(duì)比較成熟。本語(yǔ)料庫(kù)所采用的對(duì)齊軟件為ABBYY Aligner,并輔助以人工校對(duì),以TMX格式保存。平行語(yǔ)料庫(kù)檢索軟件用的是北京外國(guó)語(yǔ)大學(xué)中國(guó)外語(yǔ)與教育研究中心語(yǔ)料庫(kù)團(tuán)隊(duì)開(kāi)發(fā)的ParaConc軟件,為了適應(yīng)軟件需要,還要對(duì)生成的TMX文件進(jìn)行分割處理,即利用正則表達(dá)式,把TMX文件分割成ASCII編碼的英語(yǔ)和漢語(yǔ)兩個(gè)TXT文本,并確保雙語(yǔ)對(duì)齊,以便ParaConc軟件后期檢索使用。
數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)(Data-driving Learning,簡(jiǎn)稱DDL)是伯明翰大學(xué)學(xué)者Tim Johns提出來(lái)的,它的主要理念是引導(dǎo)學(xué)生基于大量的語(yǔ)料庫(kù)數(shù)據(jù),觀察、概括和歸納語(yǔ)言使用現(xiàn)象,自我發(fā)現(xiàn)語(yǔ)法規(guī)則、意義表達(dá)及語(yǔ)用特征[11]25。也就是說(shuō)通過(guò)語(yǔ)料庫(kù)索引軟件,以“發(fā)現(xiàn)式”方法學(xué)習(xí)英語(yǔ),再通過(guò)歸納總結(jié)的方法達(dá)到語(yǔ)言知識(shí)的建構(gòu)。同傳統(tǒng)外語(yǔ)教學(xué)相比,數(shù)據(jù)驅(qū)動(dòng)教學(xué)模式具有以下主要優(yōu)勢(shì):以學(xué)生的自主學(xué)習(xí)為主要的過(guò)程特征,以真實(shí)語(yǔ)言為主要語(yǔ)言輸入,強(qiáng)調(diào)探索和發(fā)現(xiàn)的學(xué)習(xí)過(guò)程,主張自下而上的歸納式的學(xué)習(xí)。同時(shí)在教學(xué)過(guò)程中驅(qū)動(dòng)學(xué)習(xí)也會(huì)以學(xué)生自身需求為導(dǎo)向,鼓勵(lì)學(xué)生間的互助合作和共同探索。而對(duì)于旅游專業(yè)的學(xué)生而言,雙語(yǔ)平行語(yǔ)料庫(kù)可以在專業(yè)詞匯學(xué)習(xí)、翻譯實(shí)踐、寫(xiě)作及口語(yǔ)學(xué)習(xí)方面發(fā)揮一定的作用。本課題研究中所使用的教學(xué)軟件是用于平行語(yǔ)料庫(kù)檢索的ParaConc軟件和單語(yǔ)語(yǔ)料庫(kù)檢索的PowerConc軟件,二者都是北京外國(guó)語(yǔ)大學(xué)中國(guó)外語(yǔ)與教育研究中心語(yǔ)料庫(kù)團(tuán)隊(duì)開(kāi)發(fā)的可免費(fèi)使用的軟件。
3.1 平行語(yǔ)料庫(kù)用于專業(yè)詞匯學(xué)習(xí)
語(yǔ)料庫(kù)的資源和技術(shù)為學(xué)生們提供了一種自下而上的歸納式學(xué)習(xí)方法,學(xué)生首先可以接觸大量的真實(shí)語(yǔ)言,然后自己總結(jié)某些專業(yè)詞匯的主要用法和常見(jiàn)含義,并配以翻譯文本,從而達(dá)到雙語(yǔ)詞匯能力提高的目的。比如可以利用主題詞分析的方法,把旅游英語(yǔ)文本語(yǔ)料庫(kù)和本族語(yǔ)者的通用語(yǔ)料庫(kù)進(jìn)行比對(duì)就可以提取旅游文本主題詞,并對(duì)重點(diǎn)主題詞進(jìn)行語(yǔ)料庫(kù)驅(qū)動(dòng)的學(xué)習(xí),即學(xué)生們可以自行觀察索引行,通過(guò)不同例句猜測(cè)其不同意義和用法。如圖1所示。
教師還可以利用ParaConc軟件向大家展示中英同詞不同義或不同譯的情況,利用這些直觀的方式從視覺(jué)和聽(tīng)覺(jué)上不斷刺激,達(dá)到讓學(xué)生積累詞匯的目的。
3.2 平行語(yǔ)料庫(kù)用于翻譯實(shí)踐
由于平行語(yǔ)料庫(kù)具有雙語(yǔ)對(duì)應(yīng)的特點(diǎn),對(duì)翻譯教學(xué)有著得天獨(dú)厚的優(yōu)勢(shì)。如利用ParaConc和ABBYY Aligner軟件可以呈現(xiàn)許多真實(shí)對(duì)譯例句,教師可以讓學(xué)生們觀察例句并發(fā)現(xiàn)和總結(jié)翻譯特點(diǎn),待學(xué)生們理解后,教師再對(duì)翻譯中出現(xiàn)的對(duì)譯、增譯、減譯和分譯等情況加以講解,這樣學(xué)生們理解起來(lái)就比較容易,再加以練習(xí),就能達(dá)到熟練使用翻譯策略的目的。同樣,平行語(yǔ)料庫(kù)還可以起到詞典的作用,學(xué)生有什么不確定的翻譯,可以在語(yǔ)料庫(kù)中進(jìn)行查詢,看相同或類似的問(wèn)題是如何翻譯的,長(zhǎng)期使用和學(xué)習(xí)就能提高旅游英語(yǔ)的實(shí)際翻譯能力。
圖1 主題詞檢索分析
圖2 同詞不同譯
3.3 平行語(yǔ)料庫(kù)用于口語(yǔ)練習(xí)和英語(yǔ)寫(xiě)作
由于語(yǔ)料庫(kù)能提供海量的信息,同時(shí)針對(duì)本地區(qū)具體實(shí)際情況和參照本地區(qū)旅游文本,可以先為學(xué)生布置口語(yǔ)話題,如介紹新鄉(xiāng)市八里溝風(fēng)景區(qū)的概況,讓學(xué)生自行尋找資料進(jìn)行景區(qū)導(dǎo)游詞創(chuàng)作,待學(xué)生完成后再到語(yǔ)料庫(kù)中尋找該景區(qū)的介紹資料,并據(jù)此對(duì)自己創(chuàng)作的導(dǎo)游詞加以比對(duì)和修改,形成相對(duì)準(zhǔn)確和適合學(xué)生的英語(yǔ)導(dǎo)游詞,再加以背誦和記憶,學(xué)生的語(yǔ)言功底和英語(yǔ)表達(dá)能力自然會(huì)提高,這種能力的提高也會(huì)體現(xiàn)在漢語(yǔ)的表達(dá)水平上。
同時(shí)導(dǎo)游詞的創(chuàng)作也是提高學(xué)生寫(xiě)作水平的路徑之一。教師可以首先向?qū)W生介紹旅游文本的體裁特點(diǎn)、寫(xiě)作原理和技巧,然后通過(guò)語(yǔ)料庫(kù)對(duì)文本在詞匯、語(yǔ)法和語(yǔ)篇層面的發(fā)現(xiàn),達(dá)到熟悉旅游寫(xiě)作的句法和結(jié)構(gòu)特征的目的。然后進(jìn)入寫(xiě)作實(shí)踐階段,仍以某一地區(qū)景點(diǎn)為話題,通過(guò)學(xué)生寫(xiě)作、自評(píng)(與語(yǔ)料庫(kù)文本比對(duì))、學(xué)生互評(píng)、修正、評(píng)估的五個(gè)階段實(shí)現(xiàn)學(xué)生寫(xiě)作水平的逐漸提高。
本文介紹了具有地方特色的小型旅游專門雙語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)和教學(xué)應(yīng)用的情況,涉及語(yǔ)料庫(kù)建設(shè)的具體實(shí)施步驟和具體的教學(xué)應(yīng)用,其優(yōu)勢(shì)在于為科研工作者的建庫(kù)工作提供參考,同時(shí)又可以幫助學(xué)生提高詞匯學(xué)習(xí)的效率、掌握翻譯的技巧及策略、提高口譯和翻譯寫(xiě)作實(shí)踐的能力,為地方旅游事業(yè)發(fā)展提供技術(shù)指導(dǎo)和人才服務(wù)支持。當(dāng)然本研究還處于語(yǔ)料庫(kù)的初始使用階段,后期還可增加學(xué)生翻譯語(yǔ)料和全國(guó)旅游語(yǔ)料,同時(shí)還可以對(duì)具體翻譯現(xiàn)象,如錯(cuò)誤翻譯進(jìn)行標(biāo)注,對(duì)語(yǔ)料庫(kù)進(jìn)行詞性賦碼等,以探討更深層次的語(yǔ)法和翻譯問(wèn)題,從而更好地服務(wù)日常教學(xué)和地方旅游事業(yè)的發(fā)展。
(責(zé)任編輯 楊文忠)
[1] Tony McEnery and Andrew Hardie. Corpus Linguistics: Method, Theory and Practice [M]. Oxford: Cambridge University Press,2012.
[2] 胡開(kāi)寶.語(yǔ)料庫(kù)翻譯學(xué)概論[M].上海:上海交通大學(xué)出版社,2011.
[3] 王克非.雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù):研制與應(yīng)用[M].北京:外語(yǔ)教學(xué)與研究出版社,上海:上海交通大學(xué)出版社,2004 .
[4] 崔維霞,王均松.國(guó)內(nèi)學(xué)科專業(yè)語(yǔ)料庫(kù)研究現(xiàn)狀及發(fā)展趨勢(shì)[J].西安外國(guó)語(yǔ)大學(xué)學(xué)報(bào),2013,01(55).
[5] 管新潮,胡開(kāi)寶,張冠男.英漢醫(yī)學(xué)平行語(yǔ)料庫(kù)的創(chuàng)建與初始應(yīng)用研究[J].當(dāng)代外語(yǔ)研究,2011,09(36).
[6] 李艷輝.面向教學(xué)的化工類英漢雙語(yǔ)平行語(yǔ)料庫(kù)的構(gòu)建[J].吉林化工學(xué)院學(xué)報(bào),2016,12(58).
[7] 宋亞軍.河南旅游英語(yǔ)外翻資料的語(yǔ)料庫(kù)分析[J].河南機(jī)電高等專科學(xué)校學(xué)報(bào),2016,02(64).
[8] Anne O’Keeffe and Michael McCarthy The Routledge Handbook of Corpus Linguistics[M]. London:Routledge,2010.
[9] 梁茂成.什么是語(yǔ)料庫(kù)語(yǔ)言學(xué)[M].上海:上海外語(yǔ)教育出版社,2016.
[10] 李文中.平行語(yǔ)料庫(kù)設(shè)計(jì)及對(duì)應(yīng)單位識(shí)別[J].當(dāng)代外語(yǔ)研究,2010,09(26).
[11] 衛(wèi)乃興,李文中,濮建忠,等.語(yǔ)料庫(kù)應(yīng)用研究[M].上海:上海外語(yǔ)教育出版社,2005.
The Construction and Application of Small Specialized Bilingual Paralleled Corpus
SONG Ya-jun
(Foreign Languages Department of Henan Institute of Technology, Xinxiang 453003, China)
Nowadays corpus technology has been applied in many areas and more and more scholars have found its value, but the unique advantage and application value of small bilingual paralleled corpus which has local characteristics and can serve local development are still being needed. Many facts indicate that bilingual paralleled corpus has more broadened application and potential value in specialized English teaching.
specialized English; bilingual paralleled corpus; English teaching
H319.3
A
1008–2093(2017)03–0070–04
2017-03-01
河南省教育廳人文社會(huì)科學(xué)研究項(xiàng)目(2017-ZDJH-035)
宋亞軍(1980―),男,山東德州人,講師,碩士,主要從事語(yǔ)料庫(kù)語(yǔ)言學(xué)及外語(yǔ)教學(xué)研究。