王蓮涔
(西南大學(xué) 外國語學(xué)院,重慶 400715)
語料庫應(yīng)用于大學(xué)俄語詞匯教學(xué)的探索
王蓮涔
(西南大學(xué) 外國語學(xué)院,重慶 400715)
詞匯教學(xué)是語料庫資源和研究手段應(yīng)用于外語教學(xué)時(shí)間最早和成果最多的一個(gè)領(lǐng)域。國內(nèi)學(xué)者對語料庫應(yīng)用于外語教學(xué),主要是英語教學(xué)進(jìn)行了深入細(xì)致的研究。然而迄今為止,俄語語料庫在國內(nèi)高校俄語專業(yè)教育中的應(yīng)用并不普遍,甚至“幾乎空白”,這對功能強(qiáng)大的語料庫而言無疑是極大的資源浪費(fèi)。本文采用語料庫方法,通過調(diào)查同義詞在不同語體中的分布,發(fā)現(xiàn)同義詞在不同語體中的優(yōu)先用詞原則,運(yùn)用語義韻律方法,從新的維度反映詞語的搭配特征,揭示其不同的類聯(lián)接。基于語料庫的詞匯教學(xué),注重量化分析,能揭示一些單純靠直覺分析不能發(fā)現(xiàn)的規(guī)律,為大數(shù)據(jù)時(shí)代的大學(xué)俄語教學(xué)提供新的視角,促進(jìn)俄語教學(xué)。
語料庫;詞匯教學(xué);詞頻;詞語搭配;語義韻律1
在俄羅斯,現(xiàn)代計(jì)算機(jī)語料庫的起步比較晚。但是,世界上并非沒有俄語語料庫,近些年來,俄語語料庫的發(fā)展呈現(xiàn)出加速發(fā)展的勢頭,國內(nèi)外先后出現(xiàn)了不同類型的俄語語料庫。語料庫(корпус)和語料庫語言學(xué)(корпусная лингвистика)從理論、內(nèi)容和方法等方面對語言教學(xué)與研究產(chǎn)生重要的影響。首先,它可以直接影響俄語教學(xué)的內(nèi)容、側(cè)重點(diǎn)以及教學(xué)內(nèi)容的編排順序等,繼而對教學(xué)大綱和教材的編寫產(chǎn)生影響;其次,它也對語言教學(xué)的思想和方法產(chǎn)生直接的影響。
近二十年來,英語學(xué)界在語料庫語言學(xué)應(yīng)用方面的研究碩果累累,相對而言,俄語界對語料庫的應(yīng)用研究還很缺乏,研究成果不多。但可喜的是,近十年來,國內(nèi)俄語界學(xué)者已經(jīng)開始關(guān)注俄語語料庫和基于語料庫的俄語研究,也有了些許的研究成果,如,《俄語語料庫的新發(fā)展》(許漢成,2005);《基于俄漢熟語語料庫的俄語熟語模式化及自動(dòng)識(shí)別》(秦立東,2007);《俄語語料庫和基于語料庫的語法研究》(李紹哲,2012),《俄語國家語料庫與俄語專業(yè)教學(xué)》(于金玲趙娜,2013);《基于語料庫的俄語同義詞語義韻研究》(孫敏慶,2013)等,研究動(dòng)態(tài)呈現(xiàn)出上升的趨勢。但是,總的來說, 俄語語料庫的研究和基于俄語語料庫的應(yīng)用研究還有待進(jìn)一步深入。①
首先,本文對俄語語料庫的研究和創(chuàng)建作簡要回顧;其次,闡述基于語料庫的詞匯教學(xué)的理據(jù);再次,從詞頻統(tǒng)計(jì)分析、詞語搭配、語義韻律和詞語辨析等方面探討語料庫在大學(xué)俄語詞匯教學(xué)中的應(yīng)用模式;最后,對基于語料庫的俄語詞匯教學(xué)的發(fā)展趨勢進(jìn)行預(yù)測與展望。
語料庫,顧名思義就是存放語言材料的倉庫, 但是這個(gè)倉庫里的語言材料不是雜亂無章地堆砌在一起的。語料庫是一個(gè)由大量在真實(shí)情況下使用的語言信息集成的專供研究使用的資料庫(Leech & Michael, 1981)。確切地說, 語料庫是指存放在計(jì)算機(jī)里的大量原始語料文本或經(jīng)過加工后帶有語言學(xué)信息標(biāo)注的文本。它是一個(gè)龐大的語言素材的集合體,主要用于觀察、分析和研究目標(biāo)語的各種特征(唐潔儀 何安平,2004)。
語料庫的建設(shè)發(fā)軔于歐美,20世紀(jì)60年代建立的第一代布朗語料庫(Brown Corpus)和80年代建立的倫敦—隆德英語口語語料庫(London-Lund Corpus of Spoken English)為現(xiàn)代語料庫語言學(xué)奠定了堅(jiān)實(shí)的基礎(chǔ)。20世紀(jì)80-90年代是語料庫建設(shè)快速發(fā)展的時(shí)期,建立了一批具有世界影響力的語料庫, 如主要用于詞典學(xué)研究的COBUILD英語語料庫、朗文語料庫(Longman Corpus Network)、英語國家語料庫(BNC)、國際英語語料庫(ICE)。語料庫是語言學(xué)和計(jì)算機(jī)科學(xué)交叉的一個(gè)學(xué)科,隨著計(jì)算機(jī)技術(shù)的發(fā)展,建立特大型語料庫已經(jīng)不再是很困難的事,2001年開始建設(shè)全球英語監(jiān)測語料庫(The Global English Monitor Corpus)。監(jiān)測語料庫的規(guī)模沒有最終限制,它像語言一樣,處于不斷發(fā)展之中。
相對于西歐和北美語料庫研究的蓬勃發(fā)展,其他國家的語料庫研究處于相對落后的狀態(tài)。但,近年來,俄語、漢語、日語及東歐國家的語料庫建設(shè)成績斐然。中國的語料庫建設(shè)開始于20世紀(jì)80年代,已經(jīng)建立的語料庫有:現(xiàn)代漢語語料庫(MCLC)、科研英語語料庫(JDEST)、石油英語語料庫(GPEC)、國家現(xiàn)代漢語語料庫。日語方面有代表性的語料庫有:EDR語料庫、青空文庫、現(xiàn)代日語書面語語料庫、日語口語語料庫、近代女性雜志語料庫等。
現(xiàn)代俄語語料庫的建立與研究相對較晚,直至21世紀(jì)之前,俄語方面還沒有一個(gè)可供世界俄語研究者訪問的俄語語料庫。俄羅斯國內(nèi)外的研究者都意識(shí)到了建立俄語語料庫的必要性,于是,在幾個(gè)國家?guī)缀跬瑫r(shí)出現(xiàn)了關(guān)于建立可供網(wǎng)上訪問的俄語語料庫的科研項(xiàng)目。俄語語料庫的建設(shè)大體可分為兩種:俄羅斯自建的語料庫和其他國家建立的語料庫。在俄羅斯,20世紀(jì)70年代,Л.Засорина主持建立了一個(gè)語料庫,依據(jù)該語料庫1977年Л.Засорина編纂出版了《俄語頻率詞典》。但該語料庫和基于語料庫的詞典沒有電子版,限制了語料庫的使用范圍和功能。20世紀(jì)70年代末80年代初,俄羅斯數(shù)學(xué)家А.Ершов在建立自然語言處理系統(tǒng)過程中,通過總結(jié)所積累的知識(shí)和技術(shù)后,得出一個(gè)結(jié)論:只要建立俄語知識(shí)庫(машинный фонд русского языка),就可以解決用自然語言與計(jì)算機(jī)交流,并且讓計(jì)算機(jī)完成某些通常由人承擔(dān)的語言工作,如機(jī)器翻譯這樣的問題。俄語知識(shí)庫可以理解為計(jì)算機(jī)化俄語知識(shí)庫。該項(xiàng)目曾計(jì)劃建立若干個(gè)子庫和相關(guān)軟件:俄語總詞表、文本庫、詞典庫、術(shù)語庫、語法庫、歷史俄語庫、語音庫、方言庫等。這樣的知識(shí)庫一旦完成,一方面可以提高俄語語言學(xué)各學(xué)科的現(xiàn)代化水平,另一方面也會(huì)成為建立各種以俄語為界面的人機(jī)交互系統(tǒng)以及以俄語為載體的信息處理系統(tǒng)的基礎(chǔ)。遺憾的是由于蘇聯(lián)解體,項(xiàng)目沒有完成。但在近20年的研發(fā)過程中,積累了大量的資源,包括文本語料庫、詞典和軟件,這是俄語工作者一筆寶貴的財(cái)富。90年代,俄語研究所詞典編纂實(shí)驗(yàn)部(Отдел экспериментальной лексикографии Института РЯ)在А.Н. Баранов、М.Н. Михайлов和Х.Томмола的主持下建立了現(xiàn)代政論文本語料庫(Корпус текстов по современной публицистике);圣彼得堡大學(xué)在В.Б. Касевич主持下建立了圣彼得堡大學(xué)俄語語料庫。20世紀(jì),在俄羅斯基礎(chǔ)研究基金的支持下,莫斯科大學(xué)語文系普通和計(jì)算機(jī)詞匯學(xué)及詞匯編撰學(xué)實(shí)驗(yàn)室在2000-2002年期間建立了俄語報(bào)紙計(jì)算機(jī)文本語 料 庫(компьютерный корпус текстов русских газет конца ХХ века,簡稱КГТ)。КГТ的建設(shè)由實(shí)驗(yàn)室主任А.А. Поликарпов和實(shí)驗(yàn)室人員共同完成。當(dāng)前,КГТ對公眾僅部分開放,未來將開放全部內(nèi)容。從2002年起,俄羅斯的語料庫建設(shè)呈現(xiàn)出加速發(fā)展的趨勢。В.Плугян, Е.Рахилина在Яндекс公司的支持下建成了標(biāo)準(zhǔn)俄語文學(xué)文本語料庫(50萬詞次);俄羅斯信息傳遞問題研究所建成了詞法和句法信息語料庫(10萬詞次);С.Шаров建立了4千萬詞次的代表性的俄語語料庫,在此基礎(chǔ)上,通過網(wǎng)絡(luò)發(fā)布了一部新的俄語詞頻詞典。
語料庫的出現(xiàn)改變了語言學(xué)的研究方式,但是俄語語料庫在20世紀(jì)一直落后于世界語料庫的發(fā)展,缺乏系統(tǒng)的理論研究和先進(jìn)的實(shí)踐成果。俄語國家語料庫(Национальный корпус русского языка--НКРЯ)的出現(xiàn),改變了這一狀況。俄語國家語料庫計(jì)劃建設(shè)規(guī)模2億詞次,至2012年規(guī)模達(dá)到3.64億詞次,標(biāo)注信息包括元文本標(biāo)注、詞法標(biāo)注、句法標(biāo)注、語義標(biāo)注和重音標(biāo)注。該語料庫包括一個(gè)主庫和9個(gè)子庫,除11-14世紀(jì)的古代俄語文本語料庫外,其他部分都對外開放,俄語國家語料庫是迄今規(guī)模最大的俄語代表性學(xué)術(shù)語料庫。
俄語國家語料庫的建設(shè)主要參照了英語語料庫(特別是布朗語料庫和英國國家語料庫)的建設(shè)經(jīng)驗(yàn),最重要的特征有兩個(gè):
第一,國家語料庫具有代表性和語料庫文本類型的平衡性。只有語料庫的規(guī)模達(dá)到一定程度,才能談得上具有代表性。俄語國家語料庫建設(shè)之初設(shè)計(jì)規(guī)模為2億詞次。語料庫必須盡量包括各種類型的書面語和口語文本類型(各種體裁的文藝作品、政論文、學(xué)術(shù)著作、商務(wù)信函、口語會(huì)話、方言等等),而且所有這些類型的文本在語料庫里所占的比例要大體相當(dāng),基本一致。文本要按照一定的比例選取,文藝作品(包括劇本和回憶錄)約占40%。俄語國家語料庫包括的文本類型有:不同文體和流派的散文作品、劇本、回憶錄-自傳、雜志政論文、文藝評論、報(bào)紙政論文、新聞、科技文章、科普文本和教材、宗教和宗教哲學(xué)文本、正式公文和法律文本、日常生活文本(包括私人信件、日記等)等。
第二,國家語料庫具有語料標(biāo)注信息。是否有標(biāo)注信息是語料庫區(qū)別于其他類型電子數(shù)據(jù)的重要特征,只有對語料進(jìn)行標(biāo)注,才能更好地滿足語言研究的需要,語料庫標(biāo)注的信息越豐富,它的學(xué)術(shù)研究價(jià)值和使用價(jià)值就越高。俄語國家語料庫目前進(jìn)行了四種標(biāo)注:元文本標(biāo)注、詞法標(biāo)注、重音標(biāo)注和語義標(biāo)注。詞法標(biāo)注是借助專門自動(dòng)詞法分析軟件進(jìn)行的。俄語詞形的同形異義現(xiàn)象相當(dāng)普遍,自動(dòng)詞法分析軟件對輸出的部分文本進(jìn)行了人工消歧和校對,這部分文本構(gòu)成了標(biāo)注詞法語料庫,還有一些語料進(jìn)行了句法標(biāo)注。
另外,俄語國家語料庫還建立了俄語平行文本語料庫,在翻譯理論和實(shí)踐、外語教學(xué)、機(jī)器翻譯等方面具有特殊的應(yīng)用價(jià)值。俄語國家語料庫的建成徹底改變了俄語語料庫發(fā)展落后的現(xiàn)狀。
除了上述俄羅斯自己建立的俄語語料庫外,還有一些其他國家建立的俄語語料庫,這些語料庫是世界背景下俄語語料庫的重要補(bǔ)充。它們有瑞典烏普薩拉—圖賓根語料庫(Upssala-Tubingen)和芬蘭赫爾辛基大學(xué)俄語文本標(biāo)注語料庫ХАНКО。2002年,我國學(xué)者提出開展俄語語料庫研究的問題,介紹了瑞典烏普薩拉—圖賓根語料庫和莫斯科大學(xué)報(bào)紙文本語料庫(許漢成,2005),近幾年關(guān)于俄語語料庫和基于語料庫的研究已經(jīng)成為國內(nèi)外俄語學(xué)界研究的熱點(diǎn)。目前國內(nèi)建立的俄語語料庫有俄漢平行語料庫。語料庫語言學(xué)作為一種新興的經(jīng)驗(yàn)主義研究方法或者語言學(xué)學(xué)科將會(huì)影響到語言研究的各個(gè)方面,包括構(gòu)詞學(xué)、詞匯學(xué)、詞法學(xué)、句法學(xué)、語義學(xué)、語用學(xué)及篇章語言學(xué)等,不僅如此,語料庫也為語言教學(xué)帶來許多的思想和方法 (Sinclair, 1988 ;Thomas, 2005 )。
一定的教學(xué)法總是依據(jù)一定的語言學(xué)說,比如,聽說法之所以在外語教學(xué)中強(qiáng)調(diào)模仿與記憶,就是因?yàn)樗邮芰私Y(jié)構(gòu)主義語言學(xué)關(guān)于語言是一套習(xí)慣的觀點(diǎn);語法—翻譯法之所以重視有關(guān)語言知識(shí)的講解和分析,是因?yàn)樗杉{了關(guān)于語言是代碼的理論;圖式理論強(qiáng)調(diào)人已有知識(shí)和知識(shí)結(jié)構(gòu)對當(dāng)前認(rèn)知活動(dòng)的決定作用,是“人們用已有的結(jié)構(gòu)來記住新資料的一種方法”(桂詩春,2003: 5),認(rèn)知圖式構(gòu)建的關(guān)鍵因素是有一批“具體的語境(context-specif i c)”和“復(fù)現(xiàn)的語境(contextual repetitions)”(Aston, 1997:56)。
語料庫語言學(xué)與從圖式建構(gòu)的角度看待語言發(fā)展的觀點(diǎn)在理念上有相似之處,兩者都認(rèn)為,語言使用者都是在不斷地接觸和體驗(yàn)相同或相似的形式結(jié)構(gòu)在不同語境中是如何表達(dá)語義內(nèi)涵與概念之后,才逐步形成抽象的語言知識(shí),發(fā)展起語言能力的。建構(gòu)語言圖式的條件是在自然語境下的大量和重復(fù)性的接觸語料,而語料庫的資源極其豐富,語料信息的提取更方便快捷,可以滿足這個(gè)語料庫所提供的大量在形式及語義上相近而又稍有差別的檢索行,能夠?yàn)檎J(rèn)知圖式的建構(gòu)、確認(rèn)、擴(kuò)展和重構(gòu)提供良好的語言環(huán)境和基礎(chǔ)。G.Aston 指出新圖式的習(xí)得過程其實(shí)是不斷對已有圖式的組構(gòu)和解構(gòu),這個(gè)建構(gòu)過程有兩種相輔相成的途徑:一是“從具體到抽象”,二是“從抽象到具體”。在這兩個(gè)過程中,最關(guān)鍵的因素是要由大批在不同語境中反復(fù)的東西。而語料庫特有的語境共現(xiàn)功能正好能夠在相對同質(zhì)的大量語料中反復(fù)呈現(xiàn)不同語境里的同一語言現(xiàn)象,語境共現(xiàn)界面有助于學(xué)生在一批相同的、相類似的語境信息刺激下,形成知識(shí)的圖式化進(jìn)入大腦記憶。研究表明,語料庫的語境共現(xiàn)可以為建構(gòu)和重構(gòu)圖式提供合適的語言材料。
另外,語料庫的工具特別有利于設(shè)計(jì)教學(xué)任務(wù),引導(dǎo)學(xué)習(xí)者建構(gòu)外語學(xué)習(xí)的陳述性和程序性知識(shí)。使用語料庫不僅可以幫助設(shè)計(jì)各類教學(xué)任務(wù),更可以引導(dǎo)學(xué)習(xí)者進(jìn)行甄別、選擇、分類、歸納總結(jié)與各層次結(jié)構(gòu)相匹配的、較典型的語言表達(dá)形式,加強(qiáng)詞匯學(xué)習(xí)的針對性,改善教學(xué)效果,提高教學(xué)質(zhì)量。
語料庫集中了大量真實(shí)的語言素材,這一特性決定了語料庫的基本用途就是向?qū)W習(xí)者提供語言輸入。Ellis(1994)認(rèn)為,輸入的頻率是影響語言發(fā)展的因素之一。Gass和Selinker(2001)指出,輸入中頻率很高的那部分內(nèi)容比較容易引起注意。此外,對于語言水平較高的學(xué)習(xí)者,某些不常出現(xiàn)的內(nèi)容也會(huì)由于其頻率之低而引起注意。語料庫在其檢索工具的配合下,使得頻率的集中體現(xiàn)不再是一件難事,通過語料庫索引行這種特殊的呈現(xiàn)方式,學(xué)習(xí)者毫不費(fèi)力就能夠注意到出現(xiàn)頻率較高的語言現(xiàn)象,從而了解操本族語者經(jīng)常使用的語言形式,這樣就可以在實(shí)際使用中減少誤用。
無論是教學(xué)還是研究,使用語料庫的最根本出發(fā)點(diǎn)是索引(concordance), 這是一種以呈現(xiàn)詞條索引的方式來描述詞條的方法。最為廣泛采用的索引方式是“關(guān)鍵詞的語境共現(xiàn)”(Key Word In Context, 縮略為KWIC),針對某一事先設(shè)定的檢索詞,計(jì)算機(jī)在語料庫中迅速搜索出包含檢索詞的所有句子,并將他們以檢索詞居中的形式排列出來。這種呈現(xiàn)方式提供了有關(guān)檢索詞使用的語境,根據(jù)需要,語境的范圍小至檢索詞左右的幾個(gè)詞,大至包含檢索詞的整個(gè)句子甚至整個(gè)段落。語料庫索引成功地解決了通過多語境學(xué)習(xí)詞匯這一難題。Cobb(1997)的研究證明,當(dāng)多個(gè)語境通過索引行的形式同時(shí)呈現(xiàn)時(shí),學(xué)習(xí)者可以從中獲得有變通性的詞匯知識(shí)。索引式詞匯學(xué)習(xí)的效果在某種程度上可與自然語境中的學(xué)習(xí)效果媲美。
詞匯教學(xué)是語料庫資源和研究手段應(yīng)用于外語教學(xué)時(shí)間最早和成果最多的一個(gè)領(lǐng)域。外語教學(xué)界長期都在討論兩個(gè)重要問題: 一是教什么, 二是怎么教?;谡Z料庫的詞匯教學(xué)不僅有助于解決 “教什么”的問題,而且有助于解決“怎么教”的問題。
Sinclair早在20世紀(jì)80年代就提出外語教學(xué)可以從學(xué)習(xí)詞匯入手。他認(rèn)為,以往的詞匯教學(xué)僅僅是語法教學(xué)的附屬品,詞的選擇缺乏代表性和科學(xué)性(Sinclair, 1988)。他和同事聯(lián)合調(diào)查了9套對外英語教材,通過統(tǒng)計(jì)研究發(fā)現(xiàn),教材中的高頻詞缺少最基本的描述。為此,他提出以詞匯為綱的外語教學(xué)就是:首先從大型自然語料庫中選擇最常見的詞型,然后,學(xué)習(xí)這些詞的最基本的使用模式,繼而,學(xué)習(xí)與這些詞最常見的搭配詞。
1997年出版的俄羅斯大科學(xué)詞典中收錄的詞匯有131257個(gè)。在俄語學(xué)習(xí)過程中, 要全部掌握這樣海量的詞匯是不可能的, 也是沒有必要的。人們學(xué)習(xí)外語也通常不是因?yàn)槟康恼Z里有什么就學(xué)什么, 而是首先學(xué)習(xí)那些目的語本族語者最常用,也就是說最有使用價(jià)值的詞匯和表達(dá)方式(何安平,2001)。外語學(xué)習(xí)是一個(gè)由易到難,循序漸進(jìn)的過程,在俄語詞匯教學(xué)方面首先應(yīng)該讓初級(jí)和中級(jí)學(xué)習(xí)者學(xué)習(xí)和掌握俄語本族語者最常用的詞語。但是詞匯的選取應(yīng)該客觀、準(zhǔn)確和科學(xué), 不能完全憑借我們的主觀判斷、經(jīng)驗(yàn)和直覺。統(tǒng)計(jì)語料庫可以得到一種新的信息—語言特征的頻數(shù)和頻率。這種新的信息遠(yuǎn)比語言學(xué)家的一般感覺重要,詞頻和頻率信息不僅說明了語言現(xiàn)象的普遍性,同時(shí)也是各種語言統(tǒng)計(jì)模型的基礎(chǔ)數(shù)據(jù)(傅興尚等,2009: 293)。“基于俄語國家語料庫衍生的詞典”網(wǎng)站是俄語國家語料庫在詞典編撰方面做出的一大貢獻(xiàn)。網(wǎng)站包含4類詞典,分別是:《俄語新詞語法詞典》、《新俄語詞匯頻率詞典》、《俄語成語詞典》、《俄語非物質(zhì)名詞動(dòng)詞搭配詞典》。表1列出了俄語國家語料庫中前10個(gè)使用頻率最高的名詞、動(dòng)詞、代詞和形容詞,我們發(fā)現(xiàn)這些詞匯在語言運(yùn)用中具有必不可少的價(jià)值,說明學(xué)生應(yīng)該優(yōu)先學(xué)習(xí)并掌握這些詞匯?;谡Z料庫的詞頻統(tǒng)計(jì)能夠?yàn)樵~匯大綱的設(shè)計(jì)與教材詞匯的編排提供可靠的依據(jù), 可以用于解決詞匯教學(xué)中“教什么”的問題。因此,在俄語教學(xué)中應(yīng)優(yōu)先教授基于語料庫的高頻詞匯及其常用搭配。
表1 НКРЯ中前10個(gè)使用頻率最高的詞語
在詞匯教學(xué)中使用語料庫還可以有助于解決“怎么教”的問題。同義詞、近義詞辨析是俄語詞匯教學(xué)的難點(diǎn)和重點(diǎn),有時(shí)甚至連本族語使用者都很難講清楚其差別。如果我們借助于從語料庫中提取的語言信息作為證據(jù),通過對大量真實(shí)的語言實(shí)例進(jìn)行系統(tǒng)分析來揭示語言運(yùn)用的特征和規(guī)律,那么對同義詞、近義詞的講解就會(huì)更有說服力。于丹紅(2007)采用語料庫方法區(qū)分了同義詞одеть和 надеть,孫敏慶(2013)通過語料庫對同義詞вызвать—пробудить—привлечь進(jìn)行了語義韻研究。本文以задача和задание為例探討在俄語詞匯教學(xué)中如何使用НКРЯ進(jìn)行同義詞辨析。.
同義詞由于其內(nèi)在意義的差異,在不同的語體中往往呈現(xiàn)出不同的分布特征,所以統(tǒng)計(jì)它們在不同語體中的頻率差異,有助于將它們區(qū)分開來。語言用于社會(huì)活動(dòng)的不同領(lǐng)域,便產(chǎn)生不同類型的文體。Кожина(2003)把語體分為一般語體和個(gè)別語體。一般語體包括:科學(xué)語體、公文語體、報(bào)刊政論語體、文藝語體和日??谡Z體。本文的語料取自俄語國家語料庫的書面文本基礎(chǔ)語料庫和口語語料庫。書面文本基礎(chǔ)語料庫又稱現(xiàn)代俄語標(biāo)準(zhǔn)語料庫,收集的是俄語書面標(biāo)準(zhǔn)語,書面語篇的時(shí)間跨度是從18世紀(jì)中葉至21世紀(jì)初,而口語語料庫語篇的創(chuàng)作時(shí)間僅為1900-2000年,因此,我們首先在自建庫頁面將書面語篇的時(shí)間也設(shè)定為1900-2000年,然后分別選擇文學(xué)語篇及非文學(xué)語篇中的公文事務(wù)、政論、生產(chǎn)技術(shù)、學(xué)術(shù)科研領(lǐng)域進(jìn)行建庫。這樣我們得到了與五大功能語體大致對應(yīng)的五類子庫:文學(xué)庫、公文事務(wù)庫、政論庫、科技庫和口語庫。
具體操作如下:首先進(jìn)入檢索界面,如圖:
在詞匯—語法檢索欄輸入要檢索的詞 задача 檢索條件設(shè)為單詞頻數(shù),語法和語義選項(xiàng)不選。
得到檢索結(jié)果如下:
由于各子庫的詞數(shù)從100萬到6000萬不等,為使統(tǒng)計(jì)更為科學(xué),需要計(jì)算出同等詞數(shù)下各子庫中這兩個(gè)詞的出現(xiàn)頻次。我們將子庫的詞數(shù)均設(shè)定為100萬,得到的頻次如下:
總頻數(shù) 每百萬詞頻數(shù)задача 16943 63.8 задание 3036 13.25
表2 задание 和задача 在不同語體中的每百萬詞的詞頻分布
上述數(shù)據(jù)表明,在各個(gè)語體中,задача 的使用頻率均高于задание,尤其在口語中更是經(jīng)常使用задача,而不是задание。由此可見,通過調(diào)查同義詞在不同語體中的分布,可以發(fā)現(xiàn)同義詞在不同語體中的優(yōu)先用詞原則,這是傳統(tǒng)的只從概念意義或句法功能方面辨析近義詞所無法做到的。
另外,語義韻律的提出也為同義詞辨析提供了新的維度。下面我們借助俄語國家語料庫對同義詞 произойти/(發(fā)生), случиться/(發(fā)生)的搭配情況進(jìn)行考察、量化分析,以揭示出它們的語義韻。具體操作如下:
第一步,在俄語國家語料庫基礎(chǔ)庫頁面,建立類聯(lián)接。通過查閱詞典可知,兩個(gè)詞在用于“發(fā)生”之意時(shí),均支配非動(dòng)物名詞第四格形式,因此,在基礎(chǔ)庫檢索頁面,分別輸入關(guān)鍵詞的同時(shí),將其支配詞的語法特征限定為существительные/(名詞),винительные/(四格),неодушевленное/(非動(dòng)物性),這樣得到相應(yīng)的類聯(lián)接即為V+N,且N被限定為非動(dòng)物名詞第四格形式。為便于數(shù)據(jù)提取,我們將расстояниe項(xiàng)設(shè)置為от 1 до 1,即要求節(jié)點(diǎn)詞后邊的第一個(gè)名詞要符合上述語法限制條件。
第二步,將索引行到的語例保存為TXT,以利于語料庫軟件進(jìn)行檢索。
第三步,借助檢索軟件AntConc 3.2.1對搭配詞進(jìn)行檢索統(tǒng)計(jì)。將文本文件導(dǎo)入AntConc3.2.1 中,在searchterm 中勾選words 框, 輸入相應(yīng)的檢索詞,同時(shí)將右跨距設(shè)置為1,左跨距設(shè)置為0,點(diǎn)擊collocates 和start,便可得到動(dòng)詞的搭配詞表。通過對315條索引行進(jìn)行觀察、統(tǒng)計(jì)其所支配的名詞發(fā)現(xiàn)(不計(jì)重復(fù)),與случиться搭配的詞語按順序?yàn)?,событи?(事件),пожар/(火災(zāi)),факт/(事實(shí)),время/(時(shí)間), скандал/(丑聞),жизнь/(生活),инцидент, случай/(事情),既和消極意義的詞匯(火災(zāi),事件等)搭配,又和傾向于中性涵義的詞匯搭配(如生活、時(shí)間、故事)等。與произойти搭配的名詞按順序?yàn)椐讧侑蕨支擐支擐讧?(改變),перемены/(替換),событие/(事件),вследствие(后果),теракты/(恐怖活動(dòng))等,其詞匯多為具有消極傾向意義的詞語。語義韻律作為語料庫語言學(xué)的一個(gè)重要術(shù)語,從新的維度反映詞語的搭配特點(diǎn)??梢哉f,揭示同義詞語義韻差異是辨析它們的一個(gè)有效途徑。同時(shí)還發(fā)現(xiàn),這兩個(gè)詞最常見的形式是случившийся/(發(fā)生的,陽性形式),случившиеся/(發(fā)生的,復(fù)數(shù)形式), произошедшие/(發(fā)生的,復(fù)數(shù)形式)。
綜上所述,使用語料庫的檢索方法進(jìn)行的同義詞或近義詞辨析,主要是通過考察同義詞或近義詞在不同語域中的詞頻分布差異,統(tǒng)計(jì)各搭配詞與關(guān)鍵詞共現(xiàn)的顯著程度,觀察檢索行中呈現(xiàn)的同義詞或近義詞的搭配特征,揭示其不同的類聯(lián)接、搭配關(guān)系和語義韻等語言特征。這種基于語料庫的研究方法,注重量化分析,通過所呈現(xiàn)的數(shù)據(jù)挖掘潛在的語言特征,揭示一些單純靠直覺分析不能發(fā)現(xiàn)的規(guī)律。
本文是對語料庫應(yīng)用于俄語詞匯教學(xué)的一種探索性研究。根據(jù)近年來對語料庫及語料庫語言學(xué)研究動(dòng)態(tài)的觀察,筆者認(rèn)為,基于語料庫的詞匯教學(xué)是大勢所趨。因?yàn)榛谡Z料庫的詞匯教學(xué)方法符合以學(xué)生為中心的教學(xué)理念,這使得教師不再是知識(shí)的傳授者, 而是教學(xué)活動(dòng)的組織者和設(shè)計(jì)者, 學(xué)生是研究者和參與者,學(xué)生通過探索了解語言的特征,有利于提高學(xué)生的自主學(xué)習(xí)能力。我們有理由認(rèn)為,越來越多的師生將接受基于語料庫的課堂詞匯教學(xué)、詞語搭配學(xué)習(xí)、詞匯測試等新的學(xué)習(xí)理念和方法,基于語料庫的教學(xué)方法將越來越受到重視。隨著語料庫、語料檢索工具的不斷發(fā)展,語料庫的研究方法和技術(shù)手段將會(huì)不斷地運(yùn)用到俄語詞匯教學(xué)實(shí)踐中,在編寫詞匯大綱和教材等方面也會(huì)得到廣泛應(yīng)用,基于語料庫的教學(xué)研究也將進(jìn)一步深化。
[1] Aston, G. 1997. Enriching the learning environment: Corpora in ELT [A].Teaching and Language Corpora [C]. In A. Wichmann et al. (eds.). London: Addison Wesley Longman Limited.
[2] Cobb, T. 1997. Is there any measurable learning from hands-on concordancing? [J]. System, (3):301 -315.
[3] Ellis, R. 1994. The Study of Second Language Acquisition [M]. Oxford: Oxford University Press.
[4] Gass, S. & L. Selinker. 2001. Second Language Acquisition: An Introductory Course (2nd Edition) [M]. New Jersey: Lawrence Erlbaum Associates.
[5] Leech, G. & H. Michael. 1981. Short Style in Fiction. A Linguistic Introduction to English Fictional Prose [M]. New York: Longman.
[6] Sinclair, J. 1988. A lexical syllabus for language learning [A]. In R. Carter & & M. McCarthy (eds.). Vocabulary аnd Language Teaching[C]. Harlow: Longman.
[7] Thomas, J. 2005. The use of L1 in an L2 on line chatactivity [J]. Canadian Modern Language Review, (1):161-182
[8] Кожина М.Н. 2003. Стилистический энциклопедический словарь русского языка[M]. М.:Флинта.
[9] 傅興尚 許漢成 易綿竹等 .2009 .俄羅斯計(jì)算語言學(xué)與機(jī)器翻譯[M]. 北京:語文出版社.
[10] 桂詩春. 2003.記憶與英語學(xué)習(xí)[J].外語界, (3):2-8.
[11] 何安平. 2001.語料庫與外語教學(xué)[J]. 國外外語教學(xué), (3):15-19.
[12] 李紹哲.2012.俄語語料庫和基于語料庫的語法研究[D]. 哈爾濱:黑龍江大學(xué).
[13] 秦立東.2007. 基于俄漢熟語語料庫的俄語熟語模式化及自動(dòng)識(shí)別[D]. 哈爾濱:黑龍江大學(xué).
[14] 孫敏慶. 2013.基于俄語國家語料庫的同義詞差異研究[J].天津外國語大學(xué)學(xué)報(bào), (3):17-22.
[15] 唐潔儀 何安平. 2004.語料庫在外語教學(xué)中的應(yīng)用 [J].外語電化教學(xué), (5):42-45 .
[16] 許漢成. 2005 .俄語語料庫的新發(fā)展[J]. 中國俄語教學(xué),(1):21-26.
[17] 于丹紅.2007.俄語國家語料庫與俄語詞匯教學(xué)——以одеть和надетъ為例[J].俄語學(xué)習(xí),(6):84-86.
[18] 于金玲 趙娜. 2013.俄語國家語料庫與俄語專業(yè)教學(xué)[J].黑河學(xué)院學(xué)報(bào), (2):12-15.
Application of Corpus in College Russian Vocabulary Teaching
Vocabulary teaching is an area wherein corpus resources and research methods are applied earliest and achieve the most fruits. Researchers in China have conducted intensive and thorough investigations into the application of corpora in foreign language teaching, mainly in English teaching. Nevertheless, so far Russian corpora are scarcely applied to the teaching of Russian majors in colleges, which is undoubtedly a big waste of corpus resources. Using corpus-based research methodology, this paper discovers the priority principle of the use of synonyms in different genres through looking into the distribution of synonyms in texts of different genres, and with the method of semantic prosody, this paper reveals collocational features of vocabulary and uncovers their linkages between different parts of speech. Corpus-based vocabulary teaching attaches importance to quantitative analysis and, therefore, is able to discover rules that always escape intuitive analysis. Thus, it can provide a new perspective for college Russian teaching in the Big Data Era and promote Russian teaching.
corpus; teaching vocabulary; word frequency; collocation; semantic prosody
H08
A
2095-4948(2016)02-0079-06
本文為中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“基于語料庫的中國學(xué)習(xí)者俄語錯(cuò)誤分析”(swu1609007)的階段 性成果。
王蓮涔,女,西南大學(xué)外國語學(xué)院副教授,博士,研究方向?yàn)閼?yīng)用語言學(xué)、詞典學(xué)、教學(xué)法。