王 晶
(河南大學(xué)大學(xué)外語教研部/二語寫作研究中心,河南 開封 475001)
雅思考試(International English Language Test System,IELTS),即國際英語語言測試系統(tǒng),是中國學(xué)生走進(jìn)世界名校的必備考試,全面考查學(xué)生的英語聽、說、讀、寫能力。其中,閱讀是學(xué)生望而生畏的科目,尤其是在雅思閱讀中有大量的生僻詞。詞匯是閱讀的基石,考生經(jīng)常反映雅思閱讀文章詞匯量大且難度高,但究竟雅思閱讀詞匯的豐富度如何?雅思閱讀詞匯比大學(xué)英語四六級(jí)閱讀詞匯的復(fù)雜度高多少?這些問題通過教師的肉眼觀察和經(jīng)驗(yàn)分析很難得到準(zhǔn)確答案。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,語料庫技術(shù)被越來越多地運(yùn)用在教學(xué)和研究中。語料庫是按照一定的采樣標(biāo)準(zhǔn)采集而來的、能代表一種語言或者某語言的一種變體或文類的電子文本集(梁茂成,2010)[1]。由于語料庫基于大量的真實(shí)語言,正日益成為語言研究和外語教學(xué)的重要方法,近年來國內(nèi)外基于語料庫的研究方興未艾。近年來國內(nèi)基于語料庫的研究主要集中以下三個(gè)方面:第一,基于語料庫的教材研究,如張軍,劉艷紅(2022)[2]基于語料庫研究《大學(xué)思辨英語教程》的文化內(nèi)容特征,分析了其文化配置及語篇選擇。第二,基于語料庫的學(xué)術(shù)英語研究,如陸小飛,劉穎穎(2019)[3]基于語料庫研究學(xué)術(shù)英語程式語及其在教學(xué)中的應(yīng)用。第三,針對(duì)學(xué)習(xí)者語料庫的研究,如梁茂成,鄧海龍(2020)[4]設(shè)計(jì)和構(gòu)建了適用于建設(shè)大規(guī)模英語學(xué)習(xí)者語料庫的自動(dòng)拼寫檢查系統(tǒng)。目前基于語料庫的研究主要集中于教材研究、學(xué)術(shù)英語研究及學(xué)習(xí)者語料庫研究。
本研究通過自建小型語料庫,運(yùn)用語料庫統(tǒng)計(jì)方法對(duì)比分析雅思、大學(xué)英語四級(jí)及六級(jí)閱讀文章的詞匯特點(diǎn),試圖得出雅思閱讀文章在詞匯豐富度、詞匯復(fù)雜度、平均詞長和平均句長等方面的特點(diǎn),并根據(jù)分析對(duì)比結(jié)果為雅思閱讀教學(xué)提供建議,以期助力學(xué)生提升雅思成績。
劍橋雅思是由劍橋大學(xué)考試委員會(huì)從之前的雅思考試真題中抽取出來的一些真題集,是最權(quán)威的雅思考試備考書籍[5]。由于《劍橋雅思真題1~3》出版時(shí)間早,且考試題型已經(jīng)發(fā)生較大改革,故本研究采用《劍橋雅思真題4~16》中的閱讀文章。將雅思閱讀文章電子版轉(zhuǎn)換為TXT文本文件,并將轉(zhuǎn)換過程中出現(xiàn)的亂碼及識(shí)別不準(zhǔn)確的地方進(jìn)行人工校對(duì),以保證文章的準(zhǔn)確性。之后,對(duì)所有的文件進(jìn)行整理,建成雅思閱讀文章小型語料庫,庫容156篇。
大學(xué)英語四六級(jí)考試于2016年改革,故本研究收集了大學(xué)英語四級(jí)2017至2020年閱讀真題和大學(xué)英語六級(jí)2016至2020年閱讀真題,用同樣的方式分別建成大學(xué)英語四級(jí)閱讀文章語料庫和大學(xué)英語六級(jí)閱讀文章語料庫,庫容分別為96篇和120篇。
衡量文本的詞匯豐富度的常用方法是類符/形符比,又稱形次比(梁茂成,李文中,許家金,2010)。形符(token)即我們?nèi)粘Kf的“詞”,類符(type)作為一個(gè)統(tǒng)計(jì)量,是指語料庫中任何一個(gè)獨(dú)特的詞形,即在一個(gè)文本中重復(fù)出現(xiàn)的形符只能記作一個(gè)類符。由于英語中有大量的功能詞,故文本越長,功能詞重復(fù)的次數(shù)也越多,類符/形符比就會(huì)越低,若單純以類符/形符比來測量不同長度文本的詞匯豐富度難免不夠準(zhǔn)確。故本研究采用標(biāo)準(zhǔn)化類符/形符比(每千詞的類符/形符比的均值),利用軟件WordSmith來測量雅思及四級(jí)、六級(jí)閱讀文章的詞匯豐富度,所得數(shù)據(jù)見表1。
表1 三個(gè)語料庫的詞匯豐富度分析結(jié)果
在表1中,Tokens used for word list是形符,即三個(gè)語料庫以詞為單位的庫容,可見雅思閱讀文章語料庫的庫容為136,487詞;四級(jí)閱讀文章語料庫的庫容為52,162詞;六級(jí)閱讀文章語料庫的庫容為77,219詞。Types是類符;type/token ratio(TTR)是類符/形符比;Standardised TTR(STTR)是標(biāo)準(zhǔn)化類符/形符比,即標(biāo)準(zhǔn)化形次比。可見,六級(jí)閱讀的標(biāo)準(zhǔn)化形次比最高,為47.66%;雅思閱讀的標(biāo)準(zhǔn)化形次比稍次之,為47.04%;四級(jí)閱讀的標(biāo)準(zhǔn)化形次比最低,為46.07%。標(biāo)準(zhǔn)化形次比也說明了三個(gè)語料庫的詞匯豐富度,可見六級(jí)閱讀與雅思閱讀的詞匯豐富度不相上下,四級(jí)閱讀的詞匯豐富度稍次之。
詞匯復(fù)雜度,也稱為詞匯罕見度,指的是文本中相對(duì)不尋?;蚋呒?jí)詞匯的比例(Read 2000)。為了比較雅思閱讀與四六級(jí)閱讀的詞匯復(fù)雜度,本研究以目前較常用的分級(jí)詞表GSL通用英語詞表[6](West,M.P.1953)和AWL學(xué)術(shù)英語詞表[7](Coxhead Averil 2000)為判定詞語難度的基礎(chǔ)詞表,也稱底表。GSL通用英語詞表是英語中最常用的2000詞族的詞表,它又分為兩個(gè)詞表:英語中最常用的前1000詞,被認(rèn)為是難度最低的1000詞,即底表1;其次最常用的1000詞,即底表2。AWL學(xué)術(shù)英語詞表為底表3。通過對(duì)比雅思和四六級(jí)閱讀文章的詞匯在三個(gè)底表中的比例以及超出底表的高級(jí)詞匯的比例,可以直觀地對(duì)比出它們的詞匯復(fù)雜度。
本研究利用軟件AntWordProfiler1.4.0對(duì)比三個(gè)語料庫的類符和詞族(同時(shí)包含屈折和派生形式的組合)在分級(jí)詞表中的比例來對(duì)比雅思閱讀文章與四、六級(jí)閱讀文章的詞匯復(fù)雜度,融合三個(gè)語料庫所得數(shù)據(jù)繪制表2。
表2 三個(gè)語料庫的詞匯復(fù)雜度對(duì)比
由表2可以看出,在LEVEL 1一級(jí)詞表中,雅思閱讀語料庫的類符比例(TYPE%)和詞族比例(GROUP%)分別為21.81%和10.31%;四級(jí)閱讀語料庫為31.47%和19.18%;六級(jí)閱讀語料庫為26.15%和14.32%。一級(jí)詞表是GSL通用英語詞表的前1000詞,即生活中最常用的1000詞,可以認(rèn)為是簡單詞匯??梢姡募?jí)閱讀包含的常用詞匯最多,其次是六級(jí)閱讀,雅思閱讀包含的常用詞匯最少。
在LEVEL 2二級(jí)詞表中,四級(jí)閱讀的類符比例和詞族比例依然最大,分別為15.04%和12.44%;雅思閱讀的類符比例次之,為12.9%,而其詞族比例為三者中最低8.4%;六級(jí)閱讀的類符比例稍小于雅思閱讀語料庫,為12.7%,而詞族比例為9.55%。二級(jí)詞表是GSL通用英語詞表的后1000詞,即生活中次常用的1000詞。結(jié)果依然顯示:四級(jí)閱讀包含的次常用詞匯最多,而六級(jí)和雅思閱讀文章包含的次常用詞匯差別不大,其中六級(jí)閱讀使用的次常用詞族更多一些。
在LEVEL 3三級(jí)詞表中,四級(jí)閱讀語料庫的類符比例和詞族比例也最大,分別為13.65%和9.57%;六級(jí)閱讀語料庫次之,為13.42%和7.66%;雅思閱讀語料庫的類符比例和詞族比例最低,為12.21%和5.73%。可見,四級(jí)閱讀包含的學(xué)術(shù)英語常用詞匯最多,其次是六級(jí)閱讀,雅思閱讀包含的學(xué)術(shù)英語常用詞匯最少。
最后,在LEVEL 0四級(jí)詞表(超出三級(jí)詞表的超綱詞匯)中,雅思閱讀語料庫的類符比例和詞族比例占比最大,分別為53.08%和75.56%;其次是六級(jí)閱讀文章語料庫,為47.72%和68.47%;占比最小的是四級(jí)閱讀語料庫,類符比例和詞族比例為39.85%和58.81%??梢?,雅思閱讀的超綱詞匯最多,六級(jí)閱讀次之,四級(jí)閱讀的超綱詞匯最少。
綜合以上表格的數(shù)據(jù)不難看出,整體上雅思閱讀的詞匯復(fù)雜度最高,六級(jí)閱讀次之,四級(jí)閱讀的詞匯復(fù)雜度最低。
將雅思及四級(jí)、六級(jí)閱讀文章三個(gè)語料庫導(dǎo)入WordSmith軟件,得出三個(gè)語料庫的平均詞長、平均句長等信息,所得數(shù)據(jù)見表3。
表3 三個(gè)語料庫的平均詞長、平均句長
在表3中,mean word length是三個(gè)語料庫的平均詞長,可見雅思閱讀詞匯的平均詞長最長,為4.97個(gè)字母,其次是六級(jí)閱讀的平均詞長為4.82個(gè)字母,四級(jí)閱讀的平均詞長最短,是4.6個(gè)字母。表3中的sentences是三個(gè)語料庫的句子數(shù)量,mean(in words)是三個(gè)語料庫的平均句長。平均句長是一個(gè)語篇中句子的平均長度,以詞數(shù)為統(tǒng)計(jì)單位。結(jié)果依然顯示,雅思閱讀文章的平均句長最長,為22.25個(gè)單詞,其次是六級(jí)閱讀文章,為17.89個(gè)單詞,四級(jí)閱讀文章的平均句長最短,為17.6個(gè)單詞。
此表可以看出,雅思閱讀文章的平均詞長和平均句長均為最長,其次為六級(jí)閱讀文章,四級(jí)閱讀文章的平均詞長和平均句長最短。平均詞長也在一定程度上反映了詞匯的難度,平均句長反映出句子的復(fù)雜程度。同時(shí)也可以推斷出雅思閱讀的詞匯難度更高,句子的復(fù)雜程度更大,長難句更多。
根據(jù)AntWordProfiler對(duì)三個(gè)語料庫的詞匯復(fù)雜度的分析對(duì)比結(jié)果:雅思閱讀的詞匯復(fù)雜度最高??梢娧潘奸喿x考試所需的詞匯量大于大學(xué)英語六級(jí)閱讀。詞匯是閱讀的基礎(chǔ),因此在雅思閱讀教學(xué)中,教師應(yīng)注重幫助學(xué)生擴(kuò)大單詞量,儲(chǔ)備雅思詞匯。
當(dāng)然,雅思閱讀中的一些生僻詞可以通過文章上下文推斷詞義或找出答案,不需要學(xué)生專門背誦和記憶,因此教師在雅思教學(xué)中還要注重培養(yǎng)學(xué)生根據(jù)上下文推斷詞義的能力,加強(qiáng)詞義推測的練習(xí)。
通過WordSmith對(duì)三個(gè)語料庫的標(biāo)準(zhǔn)化形次比分析得出:六級(jí)閱讀與雅思閱讀的詞匯豐富度不相上下,四級(jí)閱讀的詞匯豐富度稍次之。可見雅思閱讀詞匯的多樣性高、重復(fù)率低,在考查學(xué)生閱讀理解能力的基礎(chǔ)上,還加入了對(duì)閱讀內(nèi)容概括和轉(zhuǎn)述能力的考查,學(xué)生在解答雅思閱讀題目時(shí)需要充分理解文章內(nèi)容,并儲(chǔ)備大量的同近義詞,才能輕松得出正確答案。這就要求教師在雅思閱讀教學(xué)中,幫助學(xué)生積累同近義詞,理解句子意思,并加強(qiáng)句子轉(zhuǎn)述和改寫的練習(xí),以幫助學(xué)生在雅思考試中快速識(shí)別題目中的同近義詞轉(zhuǎn)換,提高做題效率和正確率。
根據(jù)WordSmith軟件對(duì)三個(gè)語料庫的平均句長分析:雅思閱讀文章的平均句長最長。這與教師平時(shí)教學(xué)的發(fā)現(xiàn)是一致的,在雅思閱讀文章中的長難句不勝枚舉。這對(duì)學(xué)生的閱讀和理解造成了較大影響,也是學(xué)生對(duì)雅思閱讀考試望而生畏的原因之一,尤其是在短時(shí)間內(nèi)既要完成閱讀任務(wù),又要準(zhǔn)確解題,給學(xué)生帶來了很大壓力。故教師在雅思閱讀教學(xué)中要注重語法分析,幫助學(xué)生正確分析句子結(jié)構(gòu)和成分,關(guān)注句子的重要成分和主要內(nèi)容,略讀或跳讀次要成分或內(nèi)容,熟練運(yùn)用閱讀技巧,以高效、準(zhǔn)確解答試題。
教師憑借個(gè)人經(jīng)驗(yàn)和肉眼觀察總結(jié)雅思閱讀詞匯的特點(diǎn)難免不夠客觀或準(zhǔn)確,通過客觀科學(xué)的語料庫分析方法分析總結(jié)雅思閱讀詞匯的特點(diǎn),并與大學(xué)英語四六級(jí)閱讀詞匯進(jìn)行直觀比較,再結(jié)合教師多年的雅思教學(xué)經(jīng)驗(yàn),可以科學(xué)準(zhǔn)確地為雅思閱讀教學(xué)提供有針對(duì)性的教學(xué)建議,進(jìn)而幫助學(xué)生提高雅思成績,實(shí)現(xiàn)留學(xué)夢想。