劉燕華
摘要:學(xué)習(xí)者語(yǔ)料研究起源于20世界80年代后期。它的起源是基于語(yǔ)料語(yǔ)言學(xué)的理論和方法論模式。語(yǔ)料語(yǔ)言學(xué)是利用語(yǔ)料來(lái)研究語(yǔ)言的,也就是說(shuō),研究經(jīng)電腦處理過(guò)的書面或口語(yǔ)文本數(shù)據(jù)。盡管該領(lǐng)域還是一個(gè)非常新的領(lǐng)域,但是該領(lǐng)域已經(jīng)對(duì)語(yǔ)言理論和語(yǔ)言描述做出了巨大的貢獻(xiàn)。
關(guān)鍵詞:第二外語(yǔ)學(xué)習(xí);語(yǔ)料庫(kù)
1.學(xué)習(xí)者語(yǔ)料數(shù)據(jù)的特異性
學(xué)習(xí)者語(yǔ)料屬于一種更加開(kāi)放的二語(yǔ)習(xí)得類型的數(shù)據(jù)。Ellis將其區(qū)分出來(lái),并且命名為自然語(yǔ)言使用數(shù)據(jù)和診療數(shù)據(jù)。自然語(yǔ)言數(shù)據(jù)是由學(xué)習(xí)者產(chǎn)生,并且這類學(xué)習(xí)者是抱著真實(shí)交流的目的才使用第二語(yǔ)言的。原則上講,只有自然語(yǔ)言數(shù)據(jù)可以稱之為好的,且合格的學(xué)習(xí)者語(yǔ)料數(shù)據(jù),因?yàn)檎Z(yǔ)料本身就應(yīng)是真實(shí)的,它包含的數(shù)據(jù)必須來(lái)源于日常交際的真實(shí)對(duì)話。然而,完全自然的學(xué)習(xí)者語(yǔ)料很難收集,尤其是在外語(yǔ)環(huán)境中學(xué)習(xí)者沒(méi)有什么機(jī)會(huì)在真實(shí)的日常交際中使用第二語(yǔ)言。
2.學(xué)習(xí)者語(yǔ)料研究的主要階段
學(xué)習(xí)者語(yǔ)料研究的主要階段有:
1.方法論的選擇
2.學(xué)習(xí)者語(yǔ)料的選擇和編譯
3.數(shù)據(jù)注釋
4.數(shù)據(jù)提取
5.數(shù)據(jù)分析
6.數(shù)據(jù)解讀
7.教學(xué)實(shí)施
3.方法論的選擇
從事語(yǔ)料研究的研究人員一般會(huì)從這兩種方法論中選擇一種。根據(jù)研究問(wèn)題,這兩種方法論分別為基于語(yǔ)料的方法和語(yǔ)料驅(qū)動(dòng)的方法?;谡Z(yǔ)料的方法主要是通過(guò)語(yǔ)料數(shù)據(jù)來(lái)檢測(cè)一個(gè)假設(shè)或者一個(gè)規(guī)則。因此這很明顯是一個(gè)演繹式的方法,其中語(yǔ)料并不是主人,語(yǔ)料的角色是服務(wù)于證實(shí)或是推翻之前的一個(gè)理論框架。語(yǔ)料驅(qū)動(dòng)的方法挖掘了語(yǔ)料全部的能力。這是一種歸納式的方法,它可以逐步的將觀察到的語(yǔ)料普遍化,使其最終可以建立理論或規(guī)則。
4.數(shù)據(jù)分析
給予學(xué)習(xí)者數(shù)據(jù)的研究的一個(gè)特點(diǎn)就是所研究的語(yǔ)言現(xiàn)象的廣泛性。除了那些在二語(yǔ)習(xí)得研究當(dāng)中有明顯標(biāo)志的語(yǔ)言現(xiàn)象,比如屈折變化詞素或者詞序,學(xué)習(xí)者語(yǔ)料研究也詳細(xì)考察了其他許多語(yǔ)言現(xiàn)象,這些語(yǔ)言現(xiàn)象如果不是完全被忽視了也是不被重視的研究對(duì)象,列舉數(shù)例:派生語(yǔ)素,搭配,詞匯豐富性,模糊限制語(yǔ),語(yǔ)域,拼寫或是標(biāo)點(diǎn)。
5.數(shù)據(jù)解讀
目前為止,LCR對(duì)語(yǔ)言的描述強(qiáng)于對(duì)語(yǔ)言的解讀。這在一定程度上很好理解,因?yàn)檠芯康拇蠖鄶?shù)專注于中介語(yǔ)的變體,這些中介語(yǔ)是急需被描述的,尤其是中上水平或者是高水平中介語(yǔ)。由學(xué)習(xí)者語(yǔ)料提供的豐富的數(shù)據(jù)為解讀二語(yǔ)數(shù)據(jù)提供了堅(jiān)實(shí)的基礎(chǔ)。Granger(1996)所提到的,整合多種語(yǔ)言的學(xué)習(xí)者數(shù)據(jù)的整合對(duì)比模式,和Jarvis提出的嚴(yán)謹(jǐn)?shù)姆椒ㄕ摽蚣?,這兩種方法轉(zhuǎn)變了研究方向以從多層語(yǔ)料庫(kù)中有所收獲。一語(yǔ)對(duì)二語(yǔ)由遷移影響的實(shí)證證據(jù)完全依賴于學(xué)習(xí)者一語(yǔ)當(dāng)中存在一些與二語(yǔ)類似的特征。例如,Zhang將中國(guó)的英語(yǔ)學(xué)習(xí)者把連詞的初始位置的過(guò)度使用這一問(wèn)題歸因于“在中文當(dāng)中,與英文有相同意思的連詞總是放在句子的開(kāi)頭?!蓖瑯樱瑢?duì)于短語(yǔ)more and more的過(guò)度使用是由于一語(yǔ)對(duì)二語(yǔ)遷移的影響,在漢語(yǔ)當(dāng)中有相類似的說(shuō)法“越來(lái)越”。由于其他一些語(yǔ)料庫(kù)的缺乏,所以我們暫定為這種解釋。雙語(yǔ)語(yǔ)料庫(kù)是由二語(yǔ)以及學(xué)習(xí)者一語(yǔ)共同組成的。在在這種情況下,英語(yǔ)和漢語(yǔ)就需要證實(shí)和拒絕他們之間存在的相似性。除此之外,來(lái)自于不同母語(yǔ)學(xué)習(xí)者的語(yǔ)料庫(kù)有必要去除其他其他效應(yīng)帶來(lái)的遷移影響。Zhang在ICEL里提出的兩個(gè)現(xiàn)象,這兩個(gè)現(xiàn)象表明遷移造成的影響會(huì)在大量的學(xué)習(xí)者中存在,因此很有可能逐步發(fā)展而不是與遷移相關(guān)。Osborne(2008)在其關(guān)于副詞位置的研究中表明,這兩種影響經(jīng)常是共存的,而且過(guò)度使用和不足使用的程度是與學(xué)習(xí)者母語(yǔ)當(dāng)中語(yǔ)言現(xiàn)象的使用頻頻相關(guān)的。
6.教學(xué)實(shí)施
盡管以純理論的角度去研究學(xué)習(xí)者語(yǔ)料是可以的,但是許多的LCR研究目的都是想要最終提高教學(xué)工具和方法。得益于學(xué)習(xí)者語(yǔ)料庫(kù)的觀點(diǎn)最多的領(lǐng)域是詞匯學(xué),課件以及語(yǔ)言評(píng)估。Runden和Granger告訴我們應(yīng)該如何使用學(xué)習(xí)者及本族語(yǔ)者語(yǔ)料去挖掘資料這些資料包括錯(cuò)誤標(biāo)記,這些錯(cuò)誤標(biāo)記目的是為了讓學(xué)習(xí)者把注意力放在常規(guī)的語(yǔ)言陷阱上。擴(kuò)大的“提升寫作技巧”部分目的是為了幫助學(xué)生寫學(xué)術(shù)文本將正在學(xué)習(xí)中等程度英語(yǔ)的中國(guó)學(xué)生的寫作錯(cuò)誤標(biāo)記出來(lái)并且分析了其寫作文本。他們還設(shè)計(jì)了在線的補(bǔ)救自學(xué)系統(tǒng),稱為:GrammarTalk,這個(gè)軟件針對(duì)于那些高頻率的錯(cuò)誤,比如說(shuō)冠詞錯(cuò)誤。第三個(gè)受益于LCR的領(lǐng)域是語(yǔ)言評(píng)估。經(jīng)過(guò)仔細(xì)的分析學(xué)習(xí)者語(yǔ)料可以就某種程度幫助參與者篩選并且排列測(cè)試資料。加之與自然語(yǔ)言處理技巧的配合,它們可以用來(lái)去自動(dòng)顯示出學(xué)習(xí)者的學(xué)習(xí)水平。