【摘要】當(dāng)今世界,信息技術(shù)突飛猛進(jìn),日新月異的大數(shù)據(jù)方法和人工智能已悄然滲入人類活動(dòng)的各個(gè)角落。在此背景下,將信息技術(shù)用于語言研究是必然趨勢(shì),語料庫語言學(xué)作為現(xiàn)代語言學(xué)、計(jì)算機(jī)科學(xué)與教育學(xué)跨學(xué)科互動(dòng)的新興學(xué)派,已經(jīng)進(jìn)入了當(dāng)今科研的主流,為語言教學(xué)提供了大量?jī)?yōu)質(zhì)教學(xué)資源。但就語言研究這一學(xué)術(shù)活動(dòng)而言,如何有效地將信息技術(shù)的產(chǎn)物——語料庫運(yùn)用到英語教學(xué)中是極具挑戰(zhàn)性的問題。本文針對(duì)語料庫在外貿(mào)英語教學(xué)中的構(gòu)建及應(yīng)用進(jìn)行分析,探討語料庫在外語教學(xué)中的獨(dú)特功能,以促進(jìn)外貿(mào)英語教學(xué)的高質(zhì)量發(fā)展。
【關(guān)鍵詞】語料庫;檢索;語料加工;英語教學(xué)
【作者簡(jiǎn)介】王梅笑,南陽廣播電視大學(xué)。
【基金項(xiàng)目】本文系河南省2021年科研發(fā)展計(jì)劃課題“基于深度學(xué)習(xí)的河南省特色外貿(mào)行業(yè)開放式漢英雙語語料庫建設(shè)及應(yīng)用研究”(課題編號(hào):212400410453)。
隨著國家對(duì)外開放、信息技術(shù)發(fā)展,社會(huì)對(duì)專業(yè)外貿(mào)復(fù)合型應(yīng)用人才的需求日益增加,為加強(qiáng)對(duì)外貿(mào)實(shí)用性人才的培養(yǎng),更好地服務(wù)當(dāng)?shù)亟?jīng)濟(jì)發(fā)展,各高職院校加大了對(duì)外貿(mào)英語教學(xué)的投入,利用語料庫進(jìn)行外貿(mào)英語課堂教學(xué)也逐漸被越來越多的教師接受,可以說語料庫構(gòu)建及應(yīng)用是未來語言學(xué)習(xí)和研究的一種趨勢(shì),能夠極大地提高學(xué)習(xí)效率和教學(xué)質(zhì)量。
語料庫是指按照一定的語言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語言運(yùn)用文本或話語片段而建成的具有一定容量的大型電子文庫。語料庫中的語言是真實(shí)使用的語言實(shí)例,如實(shí)地反映了語言現(xiàn)象,克服了“坐在扶手椅的語言學(xué)家”憑借自己頭腦里的語言直覺和智慧,通過主觀臆斷來撰寫語言規(guī)范的不足(何安平,2017)。所以,“語料庫的出現(xiàn)不僅標(biāo)志著語言研究手段的技術(shù)進(jìn)步,而且還標(biāo)志著語言研究思想的重大轉(zhuǎn)變”(于連江,2004)。
由于語料規(guī)模大、話題和語境種類繁多、標(biāo)注體系復(fù)雜等原因,且多數(shù)外貿(mào)英語術(shù)語和通用英語詞匯有重合,但在不同語境中,意思大相徑庭,查找起來費(fèi)時(shí)費(fèi)力,要想解決這個(gè)問題,除了平時(shí)大量閱讀,在具體語境中體會(huì)單詞的含義、語域、感情色彩外,可以適當(dāng)運(yùn)用一些權(quán)威詞典和語料庫,幫助我們更加準(zhǔn)確地領(lǐng)會(huì)單詞、句子的意思及在不同語境中的用法。因此,有必要在外貿(mào)英語教學(xué)中構(gòu)建小型專門外貿(mào)平行語料庫,以便提高外貿(mào)英語教學(xué)質(zhì)量和學(xué)習(xí)效率。
一、外貿(mào)中英雙語平行語料庫的建構(gòu)
語料的采集。在進(jìn)行語料采集時(shí),需要考慮兩個(gè)因素:一是原始語料本身的質(zhì)量,二是語料庫的應(yīng)用目標(biāo)。語料的質(zhì)量主要就其語言質(zhì)量、翻譯質(zhì)量以及語料保存的規(guī)范性而言(柏曉靜,2002)。原始語料的收集是一項(xiàng)較為復(fù)雜且繁重的工作,其中包括對(duì)該語料庫規(guī)模的設(shè)計(jì),對(duì)不同類型語料的分類,對(duì)樣本大小的明確,通過實(shí)證調(diào)查對(duì)原始語料及目標(biāo)語料資源的收集,劃分標(biāo)注標(biāo)準(zhǔn)(包括調(diào)查語料使用頻率的統(tǒng)計(jì)、是否使用該原始語料的評(píng)估等)。同時(shí)要將語料的代表性、平衡性、一致性、標(biāo)簽性和描述元語言等納入考慮范疇。
1. 語料分庫類型,在把握定性定量的標(biāo)準(zhǔn)下通過調(diào)查分層抽樣,在遵循平衡原則下更加關(guān)注應(yīng)用目標(biāo),即是否高頻被外貿(mào)行業(yè)使用,收集高質(zhì)量具有代表性的有效語料。語料素材主要來源有三個(gè)方面:語料大部分從在線語料庫下載,通過檢索將外貿(mào)術(shù)語提取到語料庫;人工錄入外貿(mào)專業(yè)術(shù)語詞典;語料來自實(shí)際外貿(mào)活動(dòng),包括文本和口語,語料來源不限于口頭采訪、文本、問卷等形式(原始語料語種可為中文或英文)。
2. 語料的保存和分類。通過對(duì)前期語料的收集,將未分析處理的原始語料按照分庫類型保存至保密性高的網(wǎng)絡(luò)云盤和大容量的本地存儲(chǔ)設(shè)備,保存方式按照相關(guān)約定設(shè)置為PDF和MASK兩個(gè)版本文件(分庫標(biāo)準(zhǔn)主要從語料來源行業(yè)、位于供應(yīng)鏈的所屬環(huán)節(jié)、常用語境范圍等三個(gè)框架進(jìn)行分類,每個(gè)語料在不同框架內(nèi)可重復(fù)收錄處理)。
二、語料加工
1. 擬采用雙語對(duì)齊技術(shù),通過互聯(lián)網(wǎng)、相關(guān)文本、現(xiàn)有語料庫以及通過對(duì)以英語為母語的外貿(mào)行業(yè)從業(yè)人員的訪問中轉(zhuǎn)譯,對(duì)收集到的原始語料進(jìn)行對(duì)齊處理得到目標(biāo)語料。每個(gè)雙語語料的對(duì)齊工作應(yīng)包括但并不僅限于對(duì)漢語部分進(jìn)行切詞、詞性標(biāo)注及注音,對(duì)英語語料進(jìn)行分詞、形態(tài)還原和詞性標(biāo)注。該語料常用于語境,使用頻率較高的中英文例句,部分語料在中外兩種經(jīng)濟(jì)活動(dòng)中的使用區(qū)別。
2. 擬借鑒國內(nèi)較成熟的雙語語料庫編碼體系,例如北京大學(xué)漢英雙語語料庫所采用的XML編碼,對(duì)語料進(jìn)行描述和標(biāo)記。將編碼描述后的內(nèi)容上傳至服務(wù)器,按照框架和所在框架內(nèi)的類別進(jìn)行分庫(XML語言作為編碼的元語言是目前編碼體系中最容易獲得廣泛軟件支持的編碼語言)。
3. 擬使用穩(wěn)定性較高的語料庫編撰軟件,如Concapp04、Antconc等對(duì)編碼后的加工語料進(jìn)行輸錄,主要提供語料檢索功能。
三、平行語料庫在外貿(mào)英語教學(xué)中的應(yīng)用
外貿(mào)英語語料規(guī)模大、話題和語境種類繁多,而且多數(shù)外貿(mào)英語術(shù)語與普通詞匯相重合。如圖1(語料來源COCA)所示,單詞“order”在英語中一般是“命令”“秩序”等意思,但在外貿(mào)術(shù)語中意為“訂單”“訂購”,在通用語料庫中很難快速準(zhǔn)確地查到目標(biāo)語,加之外貿(mào)標(biāo)注體系復(fù)雜等原因,通用語料庫往往難以直接走進(jìn)課堂教學(xué)。正如任何語言教學(xué)理念和教育技術(shù)的實(shí)施和應(yīng)用都必須結(jié)合日常教學(xué)實(shí)際情況一樣,語料庫的資源和技術(shù)要走進(jìn)課堂教學(xué)也必須經(jīng)歷一番教學(xué)加工(McCarthy,2006)。教學(xué)加工的定義可歸納為:將大型語料庫的語料、調(diào)查結(jié)果乃至語料庫技術(shù)轉(zhuǎn)化為有利于實(shí)現(xiàn)日常語言教學(xué)目標(biāo)的學(xué)習(xí)資源和教學(xué)手段的加工過程(何安平,2017)。其過程有兩個(gè)層面:一是對(duì)語料庫作為教學(xué)資源的加工,側(cè)重于如何讓語料庫輔助教學(xué)設(shè)計(jì);二是對(duì)語料庫作為教學(xué)手段的加工,側(cè)重于語料庫輔助課堂教學(xué)的實(shí)施技術(shù)和教學(xué)效果評(píng)估等,這里主要分析前者在教學(xué)中的應(yīng)用。
1. 語料庫輔助的語音教學(xué)。(1)探究單詞的發(fā)音和拼寫規(guī)律。使用通配符“*”和“?”來批量提取共享某些字母的單詞或某類音節(jié)結(jié)構(gòu),運(yùn)用不同顏色凸顯字母而非單詞輔助英語發(fā)音規(guī)律或拼寫規(guī)則的教學(xué)(何安平,2017)。如圖2(語料來自COCA)中的單音節(jié)詞拼寫的規(guī)律,即都在元音字母i后面有一個(gè)輔音字母再加一個(gè)不發(fā)音的e,這個(gè)結(jié)構(gòu)中元音字母通常發(fā)其字母音。但也有少數(shù)單詞live, give中的元音字母并沒有發(fā)其字母音。而且在觀察檢索結(jié)果的過程中不斷發(fā)現(xiàn)不合乎規(guī)則的新問題,如where, here, are等,從而設(shè)置新一輪檢索,繼而發(fā)現(xiàn)新的規(guī)律。這種方法有利于將已有將新學(xué)到的語音知識(shí)應(yīng)用于批量的而非單個(gè)的語言事實(shí)。
2. 語料庫輔助的詞匯教學(xué)。(1)辨析同形異義詞。以單詞like為例,如圖3所示的上傳like,提取所有帶like的例句,發(fā)現(xiàn)該圖顯示這批高頻動(dòng)詞基本屬于感官類動(dòng)詞,如feel, look, smell, taste, sound, seem等,主要用于表達(dá)“感覺像……”這類意義,這里like用作介詞,意思是“像……”。圖4中,通過檢索獲得like前面的單詞是人稱代詞,如you, I, we, 可以得出like 在人稱代詞后面用作動(dòng)詞,表示“喜歡”。學(xué)生可以通過“l(fā)ike”在語料庫不同句子中的表達(dá)快速準(zhǔn)確掌握一詞多義的用法。除了詞義辨析外,還可以通過語料庫學(xué)習(xí)構(gòu)詞法、詞語搭配等,這里不再一一贅述,教師可以通過語料庫清晰系統(tǒng)地進(jìn)行詞匯歸納講解。
當(dāng)然,語料庫除了可以輔助語音、詞匯教學(xué)外,還可以輔助閱讀、翻譯及寫作等教學(xué),只是檢索錄入的工作量很大,本語料庫建設(shè)的主要目的是幫助學(xué)生快速準(zhǔn)確查找外貿(mào)專業(yè)術(shù)語及用法,語料量有限,僅供內(nèi)部使用。
四、結(jié)語
小型英漢雙語平行語料庫在英語教學(xué)中的應(yīng)用,不僅能夠輔助教師在課堂上進(jìn)行語音、詞匯及翻譯寫作等全方位教學(xué),幫助教師歸納知識(shí)點(diǎn),增強(qiáng)了知識(shí)的系統(tǒng)性、邏輯性,使學(xué)生更容易理解接受,而且為學(xué)生提供了人機(jī)互動(dòng)的學(xué)習(xí)工具,大大縮短了檢索信息的時(shí)間,提高了學(xué)習(xí)效率,同時(shí)也培養(yǎng)了學(xué)生的自主學(xué)習(xí)能力??梢哉f,語料庫在英語課堂上的應(yīng)用,有效提高了英語教學(xué)質(zhì)量,相信隨著信息技術(shù)和人工智能的發(fā)展,語料庫在英語教學(xué)中的應(yīng)用會(huì)更加廣泛,教學(xué)效果也會(huì)更加突出。
參考文獻(xiàn):
[1]何安平.語料庫輔助英語教學(xué)入門[M].北京:外語教學(xué)與研究出版社,2017.
[2]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.
[3]于連江.基于語料庫的翻譯教學(xué)研究[J].外語電化教學(xué),2004(2):40-44.