董 艷,柯應根
(巢湖學院 a.外語系;b.大外部,安徽 巢湖 238000)
中國英語學習者英語詞塊使用情況縱向研究
——基于語料庫的實證研究
董 艷a,柯應根b
(巢湖學院 a.外語系;b.大外部,安徽 巢湖 238000)
從準確性、多樣性和使用頻率三個維度考察中國英語學習者大學四年來詞塊使用情況的變化,并比較了不同類型詞塊,其發(fā)展路線的異同。結(jié)果顯示:中國英語專業(yè)學生經(jīng)過四年大學學習,其筆語詞塊的運用呈現(xiàn)出整體向上的趨勢。但不同類別詞塊在準確率、多樣化和使用頻率不同層面變化模式互不相同,各有特點。
詞塊;中國英語學習者;語料庫;二語習得
在日常生活和教學中,筆者發(fā)現(xiàn)學齡前兒童在學習漢字的時候,往往會識得兒歌中的詞語,卻認不出其中的每個字,會說幾句英語日常用語,但卻不懂得其中包含的單詞的含義。這有悖于傳統(tǒng)的由字母到單詞,單詞到短語再到句子的語言學習思想,似乎不合常理。同時,中國英語學習者花費在英語上的時間不可謂不多,精力不可謂不大,但是在流利性和地道性上卻難以收獲對等的績效,這也有違中國人一向秉承的“一份耕耘,一份收獲”的信念?!霸~塊”概念的提出和詞塊理念的傳播給上述現(xiàn)象提供了合理性解答,這也是筆者此項研究的最初動力和緣由。
國外對“詞塊”或類似詞塊的概念的提出和現(xiàn)象的研究可追溯到20世紀70年代中期,Becker和Bolinger率先指出了英語中類似“預制板塊”的多詞詞匯現(xiàn)象,提出了“詞塊”(prefabricated chunks)的概念;而Sinclair明確提出了“詞匯大綱”(lexical syllabus)的概念,認為任何英語學習者的學習重點都應當是:語言中最常用的詞形;這些詞形的核心用法形式;由這些詞形構(gòu)成的典型詞語組合[1]。Lewis指出,語言知識的獲得和交際能力的提高是通過擴大學生的詞匯塊、搭配能力和有效掌握最基本詞匯和語言結(jié)構(gòu)而實現(xiàn)的,由此,他提出了詞匯法教學 (lexical approach),即幫助學生通過有效地整體使用預制語塊而無需理解其組成部分,實現(xiàn)流利表達[2]。國外學習者二語預制語塊習得和加工的研究取得一些進展,但仍處于初級階段。當前的研究主要集中在3個問題上:a)二語預制語塊發(fā)展的過程;b)不同二語學習者語塊習得的差異;c)二語預制語塊的教學。[3]
國內(nèi)有關二語習得過程中詞塊知識習得和運用的研究也剛剛起步,基本發(fā)端于本世紀,而大多數(shù)的研究是對國外詞塊理論的梳理和肯定,以及在國內(nèi)二語教學中的提倡,實證研究較少。(羅鳳文等2002;丁言仁和戚焱 2005;石本俊 2007;周超英 2008);其中,詞塊使用的縱向研究更不多見,而研究中也基本不包括句子層面的詞塊。 針對以上研究背景,筆者基于中國英語專業(yè)大學生筆語語料庫SWECCL(南京大學建設),探討英語專業(yè)大學生筆語中詞塊的使用特點及發(fā)展規(guī)律。
本研究主要試圖回答兩大問題:
1.中國學生筆語中詞塊使用在大學四年中是如何變化的(準確率、多樣化和頻率)?
2.不同類型的詞塊發(fā)展變化的規(guī)律和特點如何(準確率、多樣化和頻率)?
1.語料庫和語料的選取
本研究中使用的語料選自南京大學文秋芳等建設的中國英語專業(yè)大學生口筆語語料庫SWECCL的筆語部分。SWECCL語料庫的設計總規(guī)模為200萬詞,所有的語料收集自南京大學英語專業(yè)的學生。本研究從筆語語料庫的發(fā)展語料中抽取120篇是一到四年級學生的筆語語料,每個年級各30篇做具體分析。
2.詞塊的界定和分類
由于涵蓋范圍及研究側(cè)重點的不同,對詞塊的定義各有不同,本研究關注的是學習者在語言輸出中是否將其視為一個詞塊,是否整體記憶、保留和提取,因此采用Wray的定義“一串預制的連貫或不連貫的詞或其它意義單位,它整體存儲在記憶中,使用時直接提取,無需語法生成和分析”。[4]由于對詞塊定義和名稱的表述不一,給詞塊的分類也造成了一定的困難。研究者從不同角度對詞塊進行了眾多分類,其中有些過于繁瑣,有些很局限,操作性不強,而Lewis和 Nattinger& DeCarrico[5]的分類相對比之下簡潔實用,更易操作。本研究根據(jù)學習者心理詞庫特點,揉合了兩種分類并做修改,做出以下分類:Polywords:固定多詞 (不可替換,詞義模糊)Collocations:搭配組合詞Institutionalized utterances:慣用話語Sentence frames and heads:句子框架(包括句子層面或篇章層面的銜接詞如:firstly---secondly---last but not least)
3.數(shù)據(jù)收集和分析
(1)將文本文件轉(zhuǎn)換為word文檔以便于后期標注與操作;
(2)對語料中所有詞塊做人工標注,以若干本權(quán)威字典為依據(jù),依據(jù)上述定義和分類進行認定和正誤判斷;
(3)對所有詞塊進行分類;
(4)收集待分析的數(shù)據(jù),即每篇語料中各類詞塊的數(shù)量,形符、類符,錯誤詞塊數(shù);
?
(5)數(shù)據(jù)分析,首先通過excel工具,將上述數(shù)據(jù)進行計算,得出實驗對象詞塊使用的頻率,準確性和多樣性,variance、accuracy和每一種詞塊的使用 variance和 accuracy,frequency,計算方式為
準確率=每篇文章正確使用詞塊的類符/每篇文章使用詞塊的總量
多樣性=每篇文章的形符/每篇文章使用詞塊的總量
使用頻率=每篇文章使用詞塊的總量
將結(jié)果輸入SPSS軟件(15.0),并使用其中的Wilcoxon工具進行統(tǒng)計匯報平均數(shù)、方差、平均數(shù)差和P值,看學生詞塊使用總體情況四年來的變化及各類詞塊四年來的變化。
(一)詞塊使用四年來總的發(fā)展情況
1.詞塊準確率發(fā)展情況
如表1所示,中國英語學習者詞塊使用準確率從大一到大二迅速提高,第三年繼續(xù)增長并達到最高值,第四年有所下降,但仍然高于一年級的準確率。學習者詞塊使用準確率呈現(xiàn)升——升——降的趨勢。表1為Wilcoxon統(tǒng)計結(jié)果,顯示一年級到二年級,三年級到四年級的P值分別為0.012 和 0.014( <0.05),有顯著差異。
?
2.詞塊多樣性發(fā)展情況
詞塊多樣性的發(fā)展和正確率十分相似,同是升——升——降的趨勢,一年級到二年級增長最為顯著,并持續(xù)增長到三年級達到頂峰,而后開始下跌。Wilcoxon統(tǒng)計(見表2)顯示一年級到二年級的P值為0 .037(<0.05),有顯著差異。
?
3.詞塊使用頻率發(fā)展情況
詞塊使用頻率四年來的變化和其它兩個指標不同,在前三年里,學習者作文里的詞塊數(shù)量相差無幾,但在最后一年,詞塊使用數(shù)量飛速提高,Wilcoxon統(tǒng)計 (見表 3)P值為 0.012( <0.05),差異顯著。
?
4.原因討論與分析
中國學習者英語詞塊使用情況四年來的變化可能的原因如下:首先,前三年準確率和多樣性的近線性發(fā)展可歸因為學習者二語能力的發(fā)展。英語專業(yè)學生入學后接觸各類詞塊的機會大大增多,方式多樣。因此,寫作中詞塊能力的某種提高是合理的。準確率和多樣性的提高可以看作是語言進展的兩個標志。雖然在前三年詞塊使用的數(shù)量變化不大,但準確率和多樣性進展顯著,并在第三年達到最高值,可能的原因是學生側(cè)重準確率和多樣性,而在數(shù)量上不夠關注的折衷效應(trade-off effect)。其次,三年級到四年級,學習者的詞塊數(shù)量急劇上升,可能的情況是學習者在前三年在準確率和多樣性上投入較多,并得到了很大的進展,這樣在最后一年他們有足夠的精力來擴充詞塊的數(shù)量。而詞塊數(shù)量的急速增長也可能是準確率和多樣性在最后一年有所下降的原因。根據(jù)計算公式,數(shù)量是分母,分子不變,分母越大,得數(shù)越小。另外,其它一些內(nèi)在和外在因素也可能導致了四年級的變化趨勢,如:學習者的態(tài)度和課程設置等。一方面,大四學生可能覺得話題過于簡單而不愿花費氣力,或者他們忙于找尋工作無暇顧及該任務。另一方面,課程設置也很有可能是導致四年級詞塊準確率和多樣性的下降的原因。我國英語專業(yè)聽說讀寫等技能課通常開設在低年級,高年級通常減少或免除了這些旨在提高語言能力的課程,這樣的教學安排可能會導致上述詞塊能力在四年級的下降。
(二)不同類型詞塊使用四年來發(fā)展情況比較
1.不同類型詞塊準確率變化比較
從以上數(shù)據(jù)中可以看到一個有趣的現(xiàn)象,四類詞塊無一例外的以升——升——降的模式發(fā)展變化,一年級到三年級準確率呈線性上升,最高值都在三年級,第四年準確率下降較多,但都比一年級時有所上升。也就是說,盡管有所反復,四年級學生的使用各類詞塊的準確率都要高于一年級學生。數(shù)字顯示,四類詞塊的準確率發(fā)展大致相同,三年級最佳。因此,可以推斷,三年級和二年級是詞塊學習的黃金期。而三年級升到四年級,學習者會遭遇詞塊學習的高原期,詞塊能力踟躇不前。二語習得的高原現(xiàn)象不僅在本研究中得到驗證,也在其他研究者的研究中多次反映[6]。另外,諸多研究證明,隨著學習者二語水平的提高,學習者的某種語言能力也會得到相應提高。本研究中這種能力表現(xiàn)為詞塊使用能力。 另外一個值得關注的現(xiàn)象是第二類詞塊也就是搭配組合詞的準確率無論哪一年都是四類詞塊中最低的。這是因為,跟其它類別詞塊不同,搭配一直是被學習者所忽視的。而且搭配組合詞既有靈活性,又有一定的搭配限制,其迷惑性給中國英語學習者帶來了困難。因此,筆者建議學習者要更多關注這個層面的學習。
2.不同類型詞塊多樣性變化比較
數(shù)據(jù)分析結(jié)果顯示第三類詞塊也就是慣用話語的多樣性最高,也就是說中國英語學習者在作文中使用慣用話語的重復率最低。原因很簡單,慣用話語包括諺語、格言、社交套話以及所有使用者作為整體存儲和使用詞塊。這些詞塊可能是完整的句子,可無需更改直接使用,具有確定的語用意義;也可能是句頭,需添加其它詞條使其完整。這類詞塊的特點決定了在一篇約三百五十字的短文里,重復的可能性較小。
就多樣性發(fā)展路線而言,第一類詞塊即固定多詞四年內(nèi)的進展頗少,甚至有些許的退步。這符合語言學習中某些語言結(jié)構(gòu)習得不受時間和包括教學干預在內(nèi)的外在環(huán)境影響而“石化”的現(xiàn)象。造成這種石化可能還有一種原因,中國英語學習者從中學起就非常關注包括成語在內(nèi)的這類詞塊,大學期間已經(jīng)沒有太多提升的空間。第三類搭配組合詞多樣性的發(fā)展模式升——升——降為本研究中最為普遍的模式,前面已經(jīng)解釋,不再贅述。
第四類詞塊句子框架的多樣性從一年級到二年級發(fā)展較快,三年級有些許下降,但四年級又較快回升并達到最高值。由于這類詞塊涉及到句子的框架和結(jié)構(gòu),甚至包括篇章結(jié)構(gòu),對于初學者來說,比較困難,因此一年級的多樣性較低。而隨著學習者語言水平的提升,該類詞塊的多樣性也得到了相應發(fā)展。三年級是其高原期,越過高原期,四年級的多樣性得到了最大提高,這說明了四年級學生能夠用更多不同的詞塊來組織句子和篇章。
3.不同類型詞塊使用率變化比較
不同類別詞塊的使用頻率差異較大。其中二類詞塊(搭配組合詞)相比之下使用頻率最高,并且在第四年大大提高。 第一類詞塊(固定多詞)使用頻率次之,但也遠低于二類詞塊的使用頻率。中國學習者使用三、四類詞塊的數(shù)量最低。
二類詞塊使用頻率呈線性發(fā)展,即升——升——升的模式。其它類別詞塊使用頻率四年內(nèi)變化不大,究其原因,可能是詞塊能力不同方面的“折衷效應”。學習者在線注意力資源有限,對詞塊使用某個維度的重視會以犧牲另一個維度為代價。
正如Lewis所指出的,搭配是“某些單詞在自然文本中以大于隨機的頻率共同出現(xiàn)”(the readily observable phenomenons where by certain words co-occur in natural text with greater than random frequency)[7]。跟其它類別詞塊不同,搭配組合詞可以也應該在寫作中廣泛使用來表達必要的思想。這也是為什么它的使用頻率最高的原因。而且,幾年的積累,四年級學生掌握了更多搭配,這也驗證了詞塊能力和語言發(fā)展的同步。
總而言之,不同類別的詞塊由于其特性不同,發(fā)展也不盡相同。也就是說,在準確率、多樣性和使用頻率三個指標上,不同類別詞塊的發(fā)展模式并不一定相同,它們各有其最佳時期和起伏。這給詞塊教學提供了指導和啟示。
本研究以若干本權(quán)威字典為依據(jù),對學生語料中的詞塊進行手工標注、辨誤、分類和計算,并將取得的數(shù)據(jù)輸入SPSS統(tǒng)計軟件進行分析。根據(jù)分析結(jié)果,本研究得出如下結(jié)果:中國英語專業(yè)學生經(jīng)過四年大學學習,其筆語詞塊的運用呈現(xiàn)出整體向上的趨勢。其準確率和多樣性上呈升——升——降路線發(fā)展,而使用頻率呈降——升——升路線發(fā)展??偟脕碚f,詞塊習得的黃金期在二、三年級,特別是三年級,這也驗證了其它研究(文秋芳 2006)關于“學習黃金期”[8]的假設。與此同時,不同種類的詞塊,在準確率、多樣化和使用頻率不同層面變化模式互不相同,各有特點;在詞塊學習和應用的發(fā)展過程中,學習者群體的進步、停滯,甚至退步表現(xiàn)不一,沒有統(tǒng)一的規(guī)律,在教學中要充分認識到這種差異性,提高學習者的詞塊意識,根據(jù)學習內(nèi)容的特點,因材施教,從而達到最好的學習效果。
本研究對詞塊研究的主要貢獻在于:1)為先前有關詞塊的較為豐富的理論研究提供了必要的實證性證據(jù);2)對中國英語學習者的詞塊能力進行了調(diào)查,揭示了詞塊能力和學習者語言水平的關系;3)對詞塊進行了嘗試性的劃分,涵蓋了句子層面的詞塊,并研究了不同類型詞塊的發(fā)展規(guī)律。同時,本文所采用的研究方法也可用于英語中其它語言現(xiàn)象的研究以及其它語種的類似研究。
此外,由于受到樣本規(guī)模、語料庫類型等因素的影響,本研究結(jié)論的可推廣性受到了一定程度的限制,還需要有更大樣本、多種類型語料對本研究的結(jié)果加以補充和驗證,應用語料庫對詞塊的實證研究還有待加深和完善。本研究為結(jié)果導向而非過程導向,建議在今后的研究中將二者結(jié)合起來,提高研究的信度。
最后筆者呼吁,我們不僅要在今后的教學中滲透詞塊理論,同時也可以在原有大綱詞表的基礎上,嘗試利用語料庫等工具創(chuàng)建“詞塊表”,使詞塊“登堂入室”,正式列入學習者學習的對象,將詞塊理論落入實處,從而提高學習者英語使用的地道性和流利性,這也是對本篇之初所提困惑之嘗試性解答,有待商榷。
[1]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.
[2]Lewis,M.The Lexical Approach[M] .Hove:Teacher Training Publications,1993:9 - 21.
[3]王立非,張大鳳.國外二語預制語塊習得研究的方法進展與啟示[J].外語與外語教學,2006(5):17.
[4]Wray,A.Formulaic Language and the Lexicon[M].Cambridge:Cambridge University Press,2002:9.
[5]Nattinger & DeCarrico.Lexical Phrases and Language Teaching[M].Oxford:Oxford University Press,1992.
[6]文秋芳.英語專業(yè)學生口語詞匯變化的趨勢與特點[J].外語教學與研究,2006(5):193-194.
[7]Lewis, M.The Lexical Approach[M] .Hove:Teacher Training Publications,1993:9 - 21.
[8]文秋芳.英語專業(yè)學生口語詞匯變化的趨勢與特點[J].外語教學與研究,2006(5):193.
H314.2
A
2095-0683(2011)02-0144-04
2011-03-18
安徽省教育廳人文社會科學研究計劃項目“基于語料庫的詞塊研究與‘詞塊表’創(chuàng)建”(2008 sk371);巢湖學院教研課題“詞塊理念在英語教學中的應用”(JYXM2009-06)
董艷(1977-),女,安徽無為人,巢湖學院外語系講師,碩士;柯應根(1973-),男,安徽巢湖人,巢湖學院體育系講師,碩士。
責任編校秋晨