陳乾峰 宋 倩
(杭州師范大學(xué)錢(qián)江學(xué)院,浙江 杭州 310016)
基于語(yǔ)料庫(kù)的《綜合教程》詞匯廣度和深度分析
陳乾峰 宋 倩
(杭州師范大學(xué)錢(qián)江學(xué)院,浙江 杭州 310016)
本研究運(yùn)用語(yǔ)料庫(kù)的研究方法,以英語(yǔ)專業(yè)四級(jí)詞匯表為參照詞表,對(duì)英語(yǔ)專業(yè)教材《綜合教程》的詞匯進(jìn)行廣度和深度分析。結(jié)果表明,教材中的詞匯密度、詞匯類型呈現(xiàn)逐冊(cè)遞增趨勢(shì),但是新增詞匯類型的復(fù)現(xiàn)率偏低,不利于學(xué)習(xí)者習(xí)得。此外,整套教材詞匯基本覆蓋了專業(yè)四級(jí)詞表,適合學(xué)習(xí)者學(xué)習(xí)。
詞匯 語(yǔ)料庫(kù) 詞表
“沒(méi)有語(yǔ)法,人們可以表達(dá)的事物寥寥無(wú)幾;而沒(méi)有詞匯,人們則無(wú)法表達(dá)任何事物”(胡壯麟,李戰(zhàn)子,2004:47),因此可見(jiàn)英語(yǔ)學(xué)習(xí)中詞匯學(xué)習(xí)的重要性。英語(yǔ)教材對(duì)于專業(yè)學(xué)習(xí)者的重要性不言而喻,但是教材兼顧單元、話題、主題、任務(wù)、結(jié)構(gòu)等因素,系統(tǒng)合理地選擇和呈現(xiàn)詞匯確非易事,“常常缺乏系統(tǒng)性”(Sheldon,1988:239)。因此,分析和評(píng)估教材中課文涵蓋的詞匯選擇、詞匯特點(diǎn)及詞匯分布等是一項(xiàng)意義重大的研究課題。
但是,以前的教材詞匯評(píng)估大多通過(guò)人工閱讀、統(tǒng)計(jì)和分析,不僅耗盡人力和物力,而且收效甚微。更有學(xué)者憑借經(jīng)驗(yàn)和印象,進(jìn)行主觀分析和片面臆斷,其信度和效度很難得到保證。近年來(lái),隨著語(yǔ)料庫(kù)技術(shù)的發(fā)展,通過(guò)大量的真實(shí)語(yǔ)料,一次性批量統(tǒng)計(jì)和分類,能更加全面、客觀、高效地呈現(xiàn)教材中的詞匯特點(diǎn),成為教材詞匯評(píng)估的一種重要手段和方法。國(guó)內(nèi)外學(xué)者也逐漸開(kāi)始進(jìn)行此類研究,Koprowski(2005)對(duì)英國(guó)三套英語(yǔ)中級(jí)教材(New Headway,Innovations,Inside Out)的詞塊做了研究;謝家成(2010)評(píng)估了中學(xué)英語(yǔ)教材詞匯。為了更好地培養(yǎng)英語(yǔ)人才,提高其英語(yǔ)綜合能力,進(jìn)行符合本專業(yè)特點(diǎn)的教材詞匯評(píng)估研究迫在眉睫,意義重大,但到目前為止,鮮有相關(guān)實(shí)證性量化研究。
本研究以何兆熊主編的《綜合教程》四冊(cè)128篇課文(包括Text 1和2)為研究語(yǔ)料,借助語(yǔ)料庫(kù)技術(shù)對(duì)它們進(jìn)行批量導(dǎo)入、提取和分析,客觀和直觀地呈現(xiàn)出教材中的詞匯分冊(cè)分布特點(diǎn),并將這套教材課文詞匯和《大綱》規(guī)定的英語(yǔ)專業(yè)四級(jí)詞匯(參見(jiàn)姚乃強(qiáng)等學(xué)者的《英語(yǔ)專業(yè)四級(jí)詞匯表》)進(jìn)行覆蓋率測(cè)試,以檢測(cè)本系列教材詞匯與大綱詞匯的相關(guān)性。
本研究基于《綜合教程》(1-4冊(cè)),每一單元涉及Text A和Text B兩篇課文,共收集到了128篇課文,總字?jǐn)?shù)為128975。隨后,對(duì)所有語(yǔ)料進(jìn)行了*txt純文本處理和標(biāo)記,以便于計(jì)算機(jī)軟件檢索、識(shí)別和統(tǒng)計(jì),如B1U1T1表示第一冊(cè)第一單元Text A。我們將每?jī)?cè)課文放入單獨(dú)的文件夾,這樣便于進(jìn)行冊(cè)與冊(cè)和整體的對(duì)比分析。
傳統(tǒng)的課文閱讀勢(shì)必會(huì)占據(jù)研究者太多的時(shí)間和精力,且往往存在片面性和主觀性,而采用語(yǔ)料庫(kù)技術(shù)提取語(yǔ)料的方法恰恰能彌補(bǔ)傳統(tǒng)閱讀的缺陷。本研究采用AntConc語(yǔ)料庫(kù)檢索軟件一次性地檢索和提取所有文本。提取好語(yǔ)料后,可以通過(guò)軟件的基本程序,檢索和分析每?jī)?cè)教材的詞匯特點(diǎn),并探究教材詞匯與大綱詞匯之間的覆蓋率。
3.1類符、詞次和類符/詞次比
利用檢索軟件AntConc對(duì)《綜合教程》教材四冊(cè)進(jìn)行單詞列表(WordList)統(tǒng)計(jì),從而得出每一冊(cè)書(shū)出現(xiàn)的類符、詞次和它們之間的比值。從理論層面來(lái)講,隨著年級(jí)的上升和學(xué)習(xí)時(shí)間的增加,學(xué)生對(duì)于英語(yǔ)詞匯學(xué)習(xí)的能力和大綱對(duì)其要求的高度逐步遞增,因此每一冊(cè)的課文難度應(yīng)該逐步遞增,也就是說(shuō),第二冊(cè)要比第一冊(cè)難,第三冊(cè)要比第二冊(cè)難,第四冊(cè)要比第三冊(cè)難。這種難度可以體現(xiàn)為類符數(shù)的增加,詞次的增加,以及類符/詞次比的增加。我們將詞表統(tǒng)計(jì)的數(shù)據(jù)列入表1,并針對(duì)這些數(shù)據(jù)稍作探討和分析。
表1 類符/詞次(TTR)的統(tǒng)計(jì)結(jié)果
3.1.1類符數(shù)的統(tǒng)計(jì)從表1
來(lái)看,《綜合教程》1-4冊(cè)的單詞類型(類符)總數(shù)分為:第一冊(cè)共5171類;第二冊(cè)為5885類;第三冊(cè)為6095類;第四冊(cè)為6623類。從中可以發(fā)現(xiàn),第二冊(cè)比第一冊(cè)增加714個(gè);第四冊(cè)比第三冊(cè)增加528個(gè);第三冊(cè)比第二冊(cè)略微增加120個(gè)。這種學(xué)期之間的高梯度增加及學(xué)年之間的低梯度增加恰恰反映了學(xué)生的學(xué)習(xí)規(guī)律:寒假較暑假時(shí)間短1個(gè)月,學(xué)生的寒假詞匯遺忘率比暑假要低,所以難度可以適度增加;相反,過(guò)了一個(gè)暑假,學(xué)生需要更長(zhǎng)的時(shí)間來(lái)恢復(fù)遺忘的詞匯。因此,這種類符數(shù)在每一冊(cè)的體現(xiàn)是比較科學(xué)的,也是值得提倡的。
3.1.2詞次的統(tǒng)計(jì)
從表1來(lái)看,1-4冊(cè)的單詞詞次總數(shù)分為為:27377、32018、34414及35166;每?jī)?cè)每篇課文的平均長(zhǎng)度為:27377/ 32=856個(gè);32018/32=1001個(gè);34414/32=1075個(gè);35166/32= 1099個(gè)??梢?jiàn),隨著學(xué)期的推移、年級(jí)的上升、學(xué)習(xí)時(shí)間的增加,綜合教程教材的課文總字?jǐn)?shù)逐學(xué)期增加,每篇課文的平均長(zhǎng)度也相應(yīng)遞增。當(dāng)然,這種遞增反映在每一冊(cè)的總數(shù)和平均數(shù)上,冊(cè)內(nèi)的32篇課文各篇的長(zhǎng)度并非一定逐漸遞增,同一單元中有時(shí)Text B要比Text A要長(zhǎng),有時(shí)要短;后一單元有時(shí)比前一單元要短。這些需要根據(jù)課文的題材、類符數(shù)、教學(xué)目的、教學(xué)內(nèi)容和教學(xué)效果等而定。
3.1.3類符/詞次比統(tǒng)計(jì)
類符/詞次比這個(gè)指標(biāo)反映出了所選課文中詞匯出現(xiàn)的難度和密度?!毒C合教程》教材的類符/詞次比按照第一到第四冊(cè)分別為:18.9、18.4、17.7和18.8,可見(jiàn),它們都基本維持在18.5左右,就第三冊(cè)的比值低于18.0。當(dāng)然,這個(gè)指標(biāo)無(wú)法很好地反映出詞匯的復(fù)雜度。
3.2課文詞匯與專四大綱詞匯對(duì)比
詞匯是英語(yǔ)學(xué)習(xí)中的一個(gè)重要部分,詞匯出現(xiàn)的類型、出現(xiàn)的次數(shù),以及其在每篇文章及每?jī)?cè)書(shū)中的分布都直接關(guān)系到英語(yǔ)專業(yè)學(xué)生對(duì)于詞匯的習(xí)得。本研究主要探討一套廣泛使用的《綜合教程》四冊(cè)的詞匯特點(diǎn),并與姚乃強(qiáng)、鄒申等主編的《英語(yǔ)專業(yè)四、八級(jí)詞匯表》中的四級(jí)詞匯表進(jìn)行對(duì)比分析,主要探討兩個(gè)問(wèn)題:第一,《綜合教程》冊(cè)與冊(cè)之間的詞匯類型特點(diǎn);第二,《綜合教程》詞匯與專四大綱詞匯對(duì)比。
要進(jìn)一步探討以上兩個(gè)問(wèn)題,首先要提取《綜合教程》各冊(cè)詞匯表。具體是用AntConc工具從自建語(yǔ)料庫(kù)中提取出詞匯表并進(jìn)行削尾處理(如had/has/have/having/'ve就 會(huì)自動(dòng)歸到同一個(gè)詞簇have里面),在進(jìn)行詞頻統(tǒng)計(jì)后生成頻率詞表,作為目標(biāo)詞表。其次將英語(yǔ)專業(yè)四級(jí)大綱詞表作為參考詞表,與目標(biāo)詞表進(jìn)行對(duì)比分析。
3.2.1《綜合教程》冊(cè)與冊(cè)之間的詞匯類型特點(diǎn)通過(guò)
上述步驟,共計(jì)生成目標(biāo)詞匯表5個(gè),分別為每?jī)?cè)目標(biāo)詞表1個(gè),以及四冊(cè)總詞表1個(gè)。具體如表2
表2 目標(biāo)詞表中的詞簇統(tǒng)計(jì)結(jié)果
從表2可以看到,《綜合教程》第一冊(cè)有詞簇共計(jì)3827個(gè),第二至第四冊(cè)則分別為4286、4546和4846個(gè),每?jī)?cè)分別增加詞簇為:459個(gè),260個(gè)和300個(gè),呈現(xiàn)逐冊(cè)遞增趨勢(shì)。這一趨勢(shì)較符合學(xué)生的學(xué)習(xí)規(guī)律,因?yàn)殡S著學(xué)期的推進(jìn),年級(jí)的上升,專業(yè)學(xué)生習(xí)得詞匯的能力和實(shí)力理應(yīng)逐年、逐學(xué)期遞增。
但是,純粹從每?jī)?cè)詞簇的數(shù)量來(lái)判斷教材詞匯編排的科學(xué)性和合理性還顯得比較牽強(qiáng),缺乏一定的說(shuō)服力。我們應(yīng)該看冊(cè)與冊(cè)之間詞簇類型的重復(fù)性和差異性。通過(guò)關(guān)鍵詞統(tǒng)計(jì)(Keyword List),分別以前一冊(cè)的詞簇為參照詞表,得出如下數(shù)據(jù):第二冊(cè)要比第一冊(cè)新增詞簇2254個(gè),如abound(B2U14T1),abundant(B2U13T1),abut(B2U13T2),accommodate(B2U2T2),adamant(B2U15T1)等;第三冊(cè)比第二冊(cè)新增2395個(gè),如abatement(B3U4T2),abhor(B3U14T2),abolish(B3U5T2),abridge(B3U10T1),accomplice(B3U16T2)等;第四冊(cè)比第三冊(cè)多2528個(gè),如ablaze(B4U12T1、B4U16T2),accessory(B4U5T1),accrue(B4U10T2),adhere(B4U4T2),aggression(B4U11T2),alienate(B4U3T1)等。這個(gè)顯著的增加很客觀和直觀地反映了《綜合教程》冊(cè)與冊(cè)之間詞匯難度編排的梯度性、科學(xué)性和合理性。
此外,英語(yǔ)教材中詞匯的重復(fù)率和重復(fù)模式直接影響學(xué)生的詞匯習(xí)得(陳瀟瀟,2011:9)。詞匯重復(fù)頻率是語(yǔ)言習(xí)得的關(guān)鍵(Ellis 2002:145-148)。因此,我們有必要檢測(cè)每一冊(cè)新增的詞匯在后面幾冊(cè)中的出現(xiàn)頻率。從上文可以看出,第二冊(cè)新增的2254個(gè)新詞,有1663個(gè)沒(méi)有出現(xiàn)在第三冊(cè)、1308個(gè)未出現(xiàn)在第四冊(cè)中,復(fù)現(xiàn)率分別為26.2%和42.0%,如afflict,aftermath,altruistic,ammunition,anonymous等都未出現(xiàn)在后面兩冊(cè)中;第三冊(cè)新增的2395個(gè)詞匯中有1786個(gè)未再次出現(xiàn),復(fù)現(xiàn)率也僅為25.4%,如adrift,advent,aesthetic,affluent等。從這個(gè)低復(fù)現(xiàn)率或重復(fù)率來(lái)看,《綜合教程》還不能完全為英語(yǔ)學(xué)習(xí)者提供足量的語(yǔ)言輸入,也較難幫助學(xué)習(xí)者將短時(shí)記憶的詞匯轉(zhuǎn)化為長(zhǎng)期記憶,容易導(dǎo)致詞匯量不足。
3.2.2《綜合教程》詞匯與專四大綱詞匯對(duì)比
本研究所使用的語(yǔ)料為全國(guó)諸多高校英語(yǔ)專業(yè)采用的精讀教材,具有很強(qiáng)的代表性。英語(yǔ)專業(yè)四級(jí)詞匯是教育部對(duì)英語(yǔ)專業(yè)低段學(xué)習(xí)的詞匯要求,具有很強(qiáng)的指導(dǎo)性。那么比較教材詞匯與專四詞匯表具有很強(qiáng)的教學(xué)實(shí)踐意義。
對(duì)目標(biāo)詞表與專四詞表的相關(guān)性統(tǒng)計(jì)后可以看到,教材第一冊(cè)有詞簇3827個(gè),其中461個(gè)超出專四大綱詞匯,如abstinence,anguish,animate,assortment等;第二冊(cè)有523個(gè)超出專四大綱詞匯,如abut,afflict,appendix,atonement等;第三冊(cè)和第四冊(cè)分別超出587和622個(gè),如abatement,accomplice,admixture,anthology等,共計(jì)有2193個(gè)詞簇超出專四詞表。反過(guò)來(lái),我們有必要探究專四大綱詞匯在本研究語(yǔ)料中的出現(xiàn)頻率,經(jīng)過(guò)關(guān)鍵詞表對(duì)比,共計(jì)有2397個(gè)詞簇未出現(xiàn)在四冊(cè)教材中,如sprout,abdomen,abolition,acupuncture等。
但是細(xì)細(xì)分析,我們發(fā)現(xiàn)兩個(gè)詞表之間的差異可以進(jìn)一步縮小,如allotment出現(xiàn)在目標(biāo)詞表,而allot出現(xiàn)在專四詞表,但是統(tǒng)計(jì)時(shí)分別為兩個(gè)不同的詞;還有目標(biāo)詞表中的differently和專四詞表中的different分別被視為兩個(gè)詞。因此,有必要更進(jìn)一步地分析它們的詞綴,進(jìn)一步“去噪”,使得對(duì)比更加具有信服力。但是就本研究而言,我們可以發(fā)現(xiàn)目標(biāo)詞表超出專四詞表2193個(gè)單詞,而專四詞表超出目標(biāo)詞表2397個(gè)詞,兩者相差不大,具有一定的互補(bǔ)性。因此,從很大程度上而言,四冊(cè)教材詞匯基本覆蓋了大綱所要求的專四詞匯,覆蓋率高達(dá)87.0%。
本研究基于《綜合教程》四冊(cè)教材對(duì)其進(jìn)行詞匯量化分析,并通過(guò)與英語(yǔ)專四大綱詞匯表對(duì)比,檢驗(yàn)其詞匯的覆蓋率。結(jié)果顯示,四冊(cè)詞匯的密度和數(shù)量、詞簇的類型等都是逐冊(cè)遞增,符合學(xué)習(xí)者詞匯習(xí)得規(guī)律。但是,通過(guò)冊(cè)際詞類對(duì)比分析后發(fā)現(xiàn)詞匯的復(fù)現(xiàn)率和重復(fù)率偏低,不利于學(xué)生重復(fù)學(xué)習(xí),加深印象,真正習(xí)得詞匯。此外,通過(guò)與專四大綱詞表對(duì)比后發(fā)現(xiàn),教材詞匯基本覆蓋了大綱所要求的詞匯,并有少數(shù)詞匯超出專四詞表。因此,學(xué)習(xí)者能通過(guò)學(xué)習(xí)本套教材來(lái)認(rèn)識(shí)專四詞匯,但是要真正習(xí)得詞匯還需要教材編寫(xiě)者在詞匯的重復(fù)率上再下工夫。
[1]Ellis,N.2002.Frequency effects in language processing:A review with implications for theories of implicit and explicit language acquisition[J].Studies in Second Language Acquisition,24:143-188.
[2]Kennedy,G.1998.An Introduction to Corpus Linguistics[M].London:Addison Wesley Longman.
[3]Koprowski,M.2005.Investigating the usefulness of lexical phrases in contemporary coursebooks[J].ELT Journal 59:322-332.
[4]Sheldon,L.1988.Evaluating ELT textbooks and materials[J].ELT Journal 42/4.
[5]陳瀟瀟.大學(xué)英語(yǔ)教材課文詞匯分布特征實(shí)證研究[J].外語(yǔ)電化教育,2011(3):9-14.
[6]何兆熊.綜合教程(第一冊(cè)至第四冊(cè))[M].上海:上海外語(yǔ)教育出版社,2005.
[7]胡壯麟,李戰(zhàn)子.語(yǔ)言學(xué)簡(jiǎn)明教程(中文版)[M].北京:北京大學(xué)出版社,2004.
[8]謝家成.基于語(yǔ)料庫(kù)的英語(yǔ)教材虛化動(dòng)詞對(duì)比研究[J].外語(yǔ)教學(xué)理論與實(shí)踐,2010(3):13-17.
[9]姚乃強(qiáng),吳古華,鄒申.英語(yǔ)專業(yè)四八級(jí)詞匯表[M].上海:上海外語(yǔ)教育出版社,2004.
本論文為杭州師范大學(xué)錢(qián)江學(xué)院2015年度科研項(xiàng)目研究成果,項(xiàng)目編號(hào):2015QJJW02。