薛紅勤
摘 要: 文章主要介紹了語料庫的概念及其發(fā)展歷程,就語料庫在外語教學(xué)與研究中的應(yīng)用進行了介紹。語料庫不僅在技術(shù)層面上豐富了外語教學(xué)的手段,而且使原來停留在理論和空想中的教學(xué)理念變?yōu)楝F(xiàn)實。隨著語料庫研究的不斷發(fā)展,人們已經(jīng)在語言研究、語言教學(xué)、語言測試、詞典編撰、人工智能等領(lǐng)域應(yīng)用了語料庫。
關(guān)鍵詞: 語料庫 語料庫語言學(xué) 教學(xué)應(yīng)用
1.語料庫概念及發(fā)展史
語料庫(Corpus)是一個由大量在真實情況下使用的語言信息經(jīng)過科學(xué)的收集和組織而集成的專供研究使用的資料庫。語料庫中的語料是某種語言中自然出現(xiàn)的,可以是書面的,也可以是口頭的。語料庫語言學(xué)就是在文本語料的基礎(chǔ)上進行語言研究的一門學(xué)科。語言學(xué)家把這種材料作為研究語言的素材。由于電腦語料庫容量大,資料真實,信息提取準(zhǔn)確,因此,語言學(xué)家借助語料庫可以多方面多層次地描寫語言并驗證各種語言理論和假設(shè),甚至建立新的語言模式和語言觀。
在沒有出現(xiàn)計算機之前,建設(shè)語料庫是一項十分繁重而成效甚微的工作。Samuel Johnson花了八年時間(1747—1755)才編成了世界上第一部英語詞典,其中大部分時間都用在尋找、整理語料與建立語料庫上。強調(diào)運用語料分析和描寫語言的美國結(jié)構(gòu)主義語言學(xué)家Sapir和Baos在上個世紀(jì)初,為了搜集語料走訪一些印第安部落。但是到了上個世紀(jì)50年代后期,隨著Chomsky的生成語法學(xué)派的興起,“基于語料”的描寫語言學(xué)受到抨擊。因為Chomsky認(rèn)為語料只不過是對語言行為的取樣,不能直接反映存在于人的大腦中的語言能力,因此不能作為語言研究的依據(jù)和材料。上世紀(jì)60年代初,很少有人對真實的語言素材進行研究。而基于語言學(xué)家的語感和直覺所得到的“可能的句子”及“不可能的句子”成了語言研究及語法教學(xué)的主要數(shù)據(jù)來源。
Quirk在1959年宣布建立英語用法調(diào)查語料庫(SEU),要對英語語法進行全面準(zhǔn)確的描寫,提出新的語料庫語言學(xué)研究。隨著計算機的出現(xiàn),不久之后,美國的Francis和Kucera等人利用計算機建立了布朗語料庫。在Quirk提出的語料庫語言學(xué)中,他強調(diào)研究自然語言材料的重要性,并引用Aldous Huxley的話說:“我們最精到的理論,我們最細致的描寫,都不過是對實際情況極度粗糙而又不講理的簡化,實際情況的每個最簡單的實例都是無比復(fù)雜的。”同時他指出,實際情況的這種復(fù)雜性正是語料庫語言學(xué)所需要研究的。從Quirk建立SEU語料庫開始,五十多年時間來,語料庫語言學(xué)的研究范圍不斷擴大,并取得很大的研究成果,語料庫語言學(xué)在語言學(xué)界的地位越來越重要。近些年借助計算機技術(shù)建立的語料庫,規(guī)模大、功能多、檢索方便,使語言研究的手段和方法更豐富,對語言的理論探索也產(chǎn)生深遠影響。
2.語料庫的作用
語料庫最直接的用途就是為編纂字典提供大量真實準(zhǔn)確的例句,例如,根據(jù)COBU ILD語料庫編寫的詞典就有七種。除此之外,Leech(1993)還列出語料庫的十幾種用途,包括語言理論﹑語法﹑語義研究、語篇分析、兒童語言習(xí)得、語言學(xué)習(xí)、語言測試等。隨著計算機網(wǎng)絡(luò)的發(fā)展,基于網(wǎng)絡(luò)的語料庫為外語教學(xué)提供了大量新鮮的語言原料, 同時為編寫辭典、語法書及各種教材的提供了重要語料。事實上,現(xiàn)在一些對外語教學(xué)有重要影響的辭典和語法書都是以基于語料庫的方式編寫的。除此之外,語料庫在外語教學(xué)的思想、理論、方法、內(nèi)容及手段等方面都起著十分重要的作用。為了更好地說明語料庫在外語教學(xué)和研究中的應(yīng)用,筆者從下面幾個方面介紹語料庫的應(yīng)用。
2.1語料庫與詞匯教學(xué)
在傳統(tǒng)外語教學(xué)中,詞匯教學(xué)往往只是“單”詞的教學(xué),大部分語言教師都把單詞教學(xué)作為首位。但是,語言中的詞與詞之間經(jīng)常存在音、形、義等各方面的聯(lián)系,如果單純地只學(xué)習(xí)一個詞,則是無法看到這種聯(lián)系的?,F(xiàn)在我們可以通過計算機技術(shù),迅速從包含上千萬個詞的語料庫中,把某個在這個語料庫中出現(xiàn)的詞或短語全部實例檢索出來,并同時統(tǒng)計出該詞或短語出現(xiàn)的頻率。這樣更準(zhǔn)確更全面地建立詞匯之間的關(guān)系,從而認(rèn)識到各語言形式在實際交際中的意義和用法。例如:桂詩春教授主持的國家“九五”社科規(guī)劃項目“中國英語學(xué)習(xí)者語料庫”項目,她通過收集5個組別(中學(xué)﹑大學(xué)英語四級﹑大學(xué)英語六級﹑專業(yè)英語低年級和專業(yè)英語高年級)的學(xué)生作文語料,共計100多萬個詞,并按詞形﹑動詞詞組、名詞詞組、代詞、形容詞詞組、副詞、介詞詞組、連詞、詞匯、搭配和句法制定了一個有61個細目的言語失誤標(biāo)注表,然后對整個語料庫進行標(biāo)注。從兩個方面對中國學(xué)生英語進行分析:一是對比其他以英語為母語的語料庫分析學(xué)習(xí)者的語料特征;二是對失誤特征進行分析。這個項目屬于國際上第一部公開發(fā)布的學(xué)習(xí)者語料庫,它對研究中國學(xué)生的語言應(yīng)用和使用失誤等特征,以及它們與外語學(xué)習(xí)之間的關(guān)系等都具有十分重要的指導(dǎo)作用。
2.2語料庫與句法研究
句法與在其他方面的研究一樣,越來越多地依賴語料庫,并成為目前利用語料開展研究最多的語言層面。其原因首先是語料標(biāo)和計算機檢索手段的發(fā)展,使得對語言中有代表性的語法現(xiàn)象加以量化分析更容易。其次是通過量化具備代表性的語法現(xiàn)象檢測根據(jù)語法理論所提出的假設(shè)。五十年代以來形成注重理論的理性學(xué)派(rationalistic)與注重實際語料的經(jīng)驗學(xué)派(empirical),從八十年代中期以來呈現(xiàn)出前所未有的交匯,即很難判斷兩大研究傳統(tǒng)的研究者到底屬于哪個學(xué)派。他們開始用客觀的自然語料庫檢測理性的語法理論。而不只是純粹地通過描寫歸納客觀語言現(xiàn)象生成新的語法理論。羅芒( Romaine 1996)以British National Corpus (BNC)為依據(jù),研究了雙重比較級現(xiàn)象。荷蘭的Njmegen 大學(xué)以J.Aarts為首的研究者,首先根據(jù)語言學(xué)家的內(nèi)省及現(xiàn)有的語法描述設(shè)計了一套形式語法,將其輸入電腦在語料庫中運行,檢測該語法對語料庫數(shù)據(jù)的解釋程度,其次根據(jù)語料分析結(jié)果修訂語法,通過這種研究方法,他們認(rèn)為語料庫使理論得到檢驗和進一步發(fā)展。
2.3語料庫與心理語言學(xué)
語料庫是心理語言學(xué)家對其收設(shè)進行測試研究的有力工具,尤其在語言病理分析方面能幫助研究人員準(zhǔn)確確定問題到底發(fā)生在語言發(fā)展的哪一階段。
2.4語料庫與語言和語言教學(xué)
迅猛發(fā)展起來的電腦語料庫語言學(xué)近年來出現(xiàn)從純語言研究發(fā)展到語料庫與語言教學(xué)相結(jié)合研究的新趨勢。語料庫在語言教學(xué)方面得到直接或間接的應(yīng)用。學(xué)生可以從語料庫中得到現(xiàn)實生活中真正會碰上的語言材料,并且現(xiàn)有許多專家已經(jīng)開始利用語料庫對現(xiàn)有教學(xué)材料進行批評性研究。他們把從課本中發(fā)現(xiàn)的問題與語料庫中的真實語料進行比較,以此了解英語本族語的人們是如何表達這些意義的。另外,一批研究人員已開始建立“特定用途英語”語料庫提供特定領(lǐng)域的語言學(xué)習(xí)材料,如廣州石油英語語料庫(約411,000個詞)。語料庫同時在歷史語言學(xué)、方言等領(lǐng)域發(fā)揮重要作用,這種作用將隨著計算機的不斷發(fā)展而變得更顯著。
3.語料庫語言學(xué)的發(fā)展方向及前景
目前,計算機正以驚人的速度向前發(fā)展,語料庫語言學(xué)研究在國外開展得如火如荼。面對碩果累累的國外語料庫語言學(xué)研究,我們應(yīng)該轉(zhuǎn)換觀念,更新思路,充分認(rèn)識到語料庫研究對我國語言研究的重要意義,密切注意國外語料庫語言學(xué)發(fā)展的最新動態(tài),充分利用一切語料庫資源和語料庫研究成果,并結(jié)合我國的語言教學(xué)和研究現(xiàn)狀,進行更深入的語言研究和語言應(yīng)用研究。總之,計算機的發(fā)展使得用語料庫開展研究的人越來越多,從而擴展到研究的各個領(lǐng)域,同時語料庫中所收內(nèi)容也會更廣泛、豐富。
參考文獻:
[1]陳建生.關(guān)于語料語言學(xué)[J].當(dāng)代語言學(xué),1997(1).
[2]C.J.F illmore(1992).Corpus Linguistics.J.Starvic(ed),1992, Directions in Corpus Linguistics, Berlin: Moutonde Gruyter.
[3]杜秉正,董眉君(1991).大學(xué)英語語法與練習(xí)[M ].上海:上海外語教育出版社;章振邦.(1989)新編英語語法(修訂本)[M]上海:上海譯文出版社.
[4]Johansson, S.Times change,and so do corpora[A].In Ajmer,K.&Altenberg ,B.(eds.)English Corpus Linguistics:Studies in Hon our of Jan Svartvik [C] .London and New York : Longman,1991.
[5]曾國強.語料庫在外語教學(xué)與研究中的應(yīng)用.福建外語,2004(2).
[6]武和平,王秀秀.基于網(wǎng)絡(luò)的語料庫及其在英語教學(xué)中的應(yīng)用.電化教育學(xué)院,2002(10).