徐 晶
(新華學(xué)院 外國語學(xué)院,安徽 合肥 230088)
閱讀作為聽說讀寫四項(xiàng)基本技能,在語言學(xué)習(xí)中占有十分重要的地位。從某種程度上講,提高閱讀能力,是提高聽、說、讀、寫、譯的關(guān)鍵(陶加輝、鄔小琴,2009:134)。作為大規(guī)模標(biāo)準(zhǔn)化考試的英語專業(yè)四級考試(Test for English Majors-Band 4,簡稱TEM-4),是我國最具影響力的考試之一,引發(fā)了外語教學(xué)研究領(lǐng)域的專家學(xué)者從各個(gè)角度對其進(jìn)行深入研究。閱讀理解作為TEM-4的重要題型之一,其命題質(zhì)量也備受關(guān)注。為了適應(yīng)我國高等教育新的發(fā)展形勢,深化教學(xué)改革,提高教學(xué)質(zhì)量,考試委員會以《高等學(xué)校英語專業(yè)英語教學(xué)大綱》(以下簡稱《教學(xué)大綱》)為指導(dǎo),于2004年修改了《高校英語專業(yè)四級考試大綱》(以下簡稱《考試大綱》),其中“閱讀理解”部分不再分快速閱讀和一般閱讀,“閱讀理解”部分考試時(shí)間由30分鐘縮短為25分鐘(2004:1)。這反映了《考試大綱》對“閱讀理解”的重視。那么,改革后的英語專業(yè)四級考試,其“閱讀理解”部分的考試內(nèi)容效度究竟如何?這就是本文亟待分析和解決的問題。
測試效度是衡量語言測試最重要的指標(biāo),或者說是語言測試的基本出發(fā)點(diǎn)。“根據(jù)評價(jià)方法的不同,效度是指測試是否靠了考試大綱規(guī)定要考的,或者說考試的題目在多大程度上能代表它所要測量的內(nèi)容。 ”(Heaton,2000:159)Alderson 等人將效度分為三種類型:(1)內(nèi)部效度(internal validity),包括內(nèi)容效度(content validity)和構(gòu)卷效度(construct validity);(2)外部效度(external validity),又稱標(biāo)準(zhǔn)效度(criterion validity);(3)使用效度(use validity)(Alderson,1995:164)。 由于篇幅的限制,本文僅從內(nèi)容效度的角度來分析TEM-4“閱讀理解”測試的有效性,總結(jié)其成功與不足,并在此基礎(chǔ)上提出一些建議,旨在提高命題的科學(xué)性和有效性,促進(jìn)其對教學(xué)的積極反撥作用。
本研究選取了《考試大綱》修訂后的2006~2010年五年的TEM-4試題“閱讀理解”部分為樣本,共計(jì)5套試卷,20篇文章,100道題目。
內(nèi)容效度指測試內(nèi)容包含了它意欲測試的語言技能、語言結(jié)構(gòu)等方面有代表性的因素(Hughes,1989:132)。“一項(xiàng)測試的內(nèi)容效度越大,它就越可能達(dá)到它意欲測試的目的?!保℉ughes,1989:132)本研究分析采用的是根據(jù) Bechman和Palmer提出的考試任務(wù)特點(diǎn)框架,并結(jié)合閱讀考試的實(shí)際情況進(jìn)行綜合評析。Bechman和Palmer認(rèn)為,任務(wù)特征包括情景特征、測試指令特征、語篇輸入特征和預(yù)期回答特征,其中涉及語篇內(nèi)容分析的是后兩個(gè)特征,即語篇輸入(包括體裁、題材、文章長度、文章閱讀速度和篇章難度)和預(yù)期回答(閱讀能力的考查、題項(xiàng)的設(shè)計(jì))(辜向東,2008:106)。結(jié)合《教學(xué)大綱》和《考試大綱》在閱讀方面的要求,對TEM-4閱讀理解部分的內(nèi)容效度進(jìn)行了分析。
1.體裁
《考試大綱》明確規(guī)定了閱讀理解部分的選材原則:體裁多樣,包括記敘文、描寫文、說明文、議論文、廣告、說明書、圖表等。筆者在統(tǒng)計(jì)時(shí)將其歸納為敘述文、說明文、議論文、應(yīng)用文。部分文章夾敘夾議,在此統(tǒng)計(jì)為議論文。統(tǒng)計(jì)結(jié)果見表1。
表1反映了2006~2010年TEM-4試卷閱讀理解部分體裁的分布情況。從整體上來看,閱讀材料的體裁主要以議論文為主,敘述文和說明文較少,未出現(xiàn)應(yīng)用文。從單卷來看,體裁的分布存在不平衡的狀況。在同一試卷中各體裁篇數(shù)比例不一,呈現(xiàn)單一的特點(diǎn),甚至某一種體裁比例達(dá)到75%,如2007年卷、2008年卷及2010年卷。這與《考試大綱》體裁多樣的原則不太相符。建議在今后的命題中,應(yīng)考慮選擇應(yīng)用文體裁,并注意各體裁在同一試卷中的比例分配,做到體裁的多樣性和分布的合理性。
2.題材
《考試大綱》規(guī)定,閱讀材料的選擇應(yīng)題材廣泛,包括社會、科技、文化、經(jīng)濟(jì)、日常知識、人物傳記等。綜觀2006~2010年TEM-4的閱讀理解材料,其題材涉及科普知識、社會、文化、教育及個(gè)人經(jīng)歷的小故事等。在此,為了便于統(tǒng)計(jì),將教育歸入文化中,將日常生活中的個(gè)人經(jīng)歷和小故事納入日常知識中。統(tǒng)計(jì)結(jié)果如表2所示。
表2 :2006~2010年TEM-4試卷閱讀理解題材統(tǒng)計(jì)表
從表2可以看出,TEM-4試卷的閱讀理解部分的題材涉獵廣泛,基本涵蓋了社會、科技、文化等方面,符合《考試大綱》的規(guī)定。同時(shí),由于題材廣泛,涉及領(lǐng)域較多,在考查考生閱讀能力的同時(shí),又體現(xiàn)了《教學(xué)大綱》的要求:“向?qū)W生提供廣泛的語言和文化素材,擴(kuò)大學(xué)生的知識面,增強(qiáng)學(xué)生的英語語感,培養(yǎng)學(xué)生的閱讀興趣。”(2000:10)其中,文化類的題材最多,如2006年卷TEXT A論述了手機(jī)對文化的影響;2008年卷TEXT A介紹了阿姆斯特丹的文化、TEXT B介紹了幾個(gè)來源于神話傳說的詞語的詞源故事;2009年卷TEXT D的“節(jié)日小費(fèi)”的故事等。社會、科普和個(gè)人經(jīng)歷的小故事等在整個(gè)選材中的比例差別不大。從單卷來看,每一套試卷的閱讀材料選材基本涵蓋了幾個(gè)不同的方面(除了2010年只涉及了科技和文化)。但是,經(jīng)濟(jì)題材,這五年的試卷中都未涉及,因此,在今后的選材中,可以適當(dāng)融入經(jīng)濟(jì)類的閱讀材料,并注意平衡各題材在同一份試卷中的比例。
3.篇章長度及閱讀速度
根據(jù)《考試大綱》對測試形式的要求,TEM-4閱讀理解部分應(yīng)采用多項(xiàng)選擇題,由數(shù)篇閱讀材料構(gòu)成,閱讀材料共長1800個(gè)單詞左右。而由表3的統(tǒng)計(jì)數(shù)據(jù)可知,2007~2010年的篇章長度超出標(biāo)準(zhǔn)單詞量的比例基本控制在-10%~10%之間,符合《考試大綱》(1800詞)的要求。且2007年和2009年的超出標(biāo)準(zhǔn)單詞量比例分別為-0.5%和0.5%,詞數(shù)控制非常準(zhǔn)確。但是2006年的單詞量是五年中最少的,超出標(biāo)準(zhǔn)單詞量的比例達(dá)-17.6%,這表明,2006年卷的閱讀理解部分在單詞量上沒有嚴(yán)格遵照《考試大綱》的規(guī)定。
表3 :2006~2010年TEM-4試卷閱讀理解篇章長度及閱讀速度分析表
閱讀速度方面,從表3我們可以看出,2007年、2008年、2009年三年的閱讀速度差不多持平,分別為102詞/分鐘、103詞/分鐘、104詞/分鐘,這三年的閱讀速度控制得較為穩(wěn)定,但是這與《考試大綱》規(guī)定的“閱讀速度為每分鐘120個(gè)單詞”還有一定的差距。特別是2006年和2010年平均閱讀速度為86詞/分鐘、92詞/分鐘,與大綱規(guī)定相差甚遠(yuǎn)。由此可知,這五年的閱讀理解在閱讀速度的設(shè)計(jì)上偏低,沒有達(dá)到《考試大綱》的要求。在今后的命題中,應(yīng)注意提高試卷整體的閱讀速度。
4.篇章難度
在閱讀材料的難度方面,《考試大綱》規(guī)定,“閱讀材料的語言難度中等”。閱讀材料的難度是抽象的概念,受多種因素的影響,目前沒有直接的辦法來測量。語言研究者一般使用SMOG指數(shù),F(xiàn)ry易讀度估算和Flesch易讀度公式等來計(jì)算。本文采取Flesch易讀度來衡量閱讀材料的難度。在Flesch易讀度的測量上,筆者借助Microsoft Office Word 2003對文章進(jìn)行“完成拼寫和語法檢查”,然后選擇顯示有關(guān)文檔的可讀性級別信息的方法獲取Flesch易讀度數(shù)據(jù)。統(tǒng)計(jì)結(jié)果見表4。
表4 :2006~2010年TEM-4試卷閱讀理解篇章易讀度統(tǒng)計(jì)表
表5為易讀度參考量表。
表5 :易讀度參考量表
參照表5,分析表4的統(tǒng)計(jì)結(jié)果可知,易讀度30~50、50~60、60~70、70~80 即屬于“Difficult”、“Fairly difficult”、“Standard”、“Fairly Easy”的篇章各占 25%、25%、20%、25%,2007年的 TEXT C的易讀度竟為82.2,屬于“Easy”的范圍。整體來說,低于《考試大綱》“難度中等”的要求,但易讀度的平均值比較接近,如此可見TEM-4命題的科學(xué)性和嚴(yán)謹(jǐn)性。同時(shí),我們也可以看出各單卷的易讀度相差較大,2006年的四篇文章易讀度波動(dòng)幅度達(dá)到了38.9之高。根據(jù)理想模式,每一篇閱讀材料都應(yīng)該符合一定的易讀度,差距過大會影響測試的真實(shí)性,從而降低測試的效度。因此,在控制易讀度方面,還需要進(jìn)一步努力。根據(jù)《考試大綱》的要求,對照表5,建議易讀度在50~70之間,即“Fairly Difficult”和“Standard”之間比較合適,屬于難度適中的文章。
預(yù)期回答主要指閱讀技能方面。閱讀理解測試旨在測試學(xué)生的閱讀能力。李筱菊認(rèn)為:“閱讀理解測試考核的應(yīng)該是受試對材料傳達(dá)的多層次、多范疇信息的理解能力?!保ɡ铙憔?,1999:86)《考試大綱》要求:“能掌握所讀材料的主旨大意,了解說明主旨大意的事實(shí)和細(xì)節(jié);既理解字面意思,又能根據(jù)所讀材料進(jìn)行判斷和推理;既能理解個(gè)別句子的意義,也理解上下文的邏輯關(guān)系”。據(jù)此,筆者將TEM-4考查的閱讀技能分為細(xì)節(jié)辨認(rèn)、判斷推理、主旨分析、語義理解,并以此對2006~2010年TEM-4試卷閱讀理解材料后的題目進(jìn)行分類統(tǒng)計(jì),結(jié)果見表6。
表6 :2006~2010年TEM-4試卷閱讀理解材料考查能力統(tǒng)計(jì)表
從表6我們可以看出,TEM-4的閱讀理解部分對閱讀能力的考查是全面且符合大綱要求的,具有較高的內(nèi)容效度。綜合這五年的試卷,細(xì)節(jié)辨認(rèn)題和判斷推理題共有86題,占整個(gè)閱讀理解考查部分的86%。從整體來看,細(xì)節(jié)辨認(rèn)和判斷推理是TEM-4閱讀理解部分對閱讀能力考查的主要內(nèi)容。而主旨分析題和語義理解題則每卷只占1或2題??傮w來說,各種能力的考查在試卷中所構(gòu)成的比例是合理的。但是,個(gè)別年份的單卷其考查的能力有缺失,如2009年卷并未出現(xiàn)明確考查主旨分析的題目。
本文通過對2006~2010年TEM-4試題中閱讀理解部分的統(tǒng)計(jì)與分析發(fā)現(xiàn),其閱讀材料的體裁以議論文為主,敘述文和說明文較少,未出現(xiàn)應(yīng)用文;題材涉獵廣泛,基本涵蓋了社會、科技、文化等方面,但經(jīng)濟(jì)題材并未涉及,部分單卷題材選擇較為集中;篇章長度超出標(biāo)準(zhǔn)單詞量的比例基本控制在-10%~10%之間,但2006年卷單詞量偏低程度較大;在閱讀速度和易讀度的控制上有待加強(qiáng);閱讀能力的考查較為全面,結(jié)構(gòu)合理,但部分單卷能力考查有缺失??傮w來說,這五套閱讀理解試題基本符合《教學(xué)大綱》和《考試大綱》的要求,其測試具有一定的內(nèi)容效度,對英語專業(yè)教學(xué)具有很好的導(dǎo)向作用,其命題是比較成功的。
針對命題中存在的一些不足之處,為了更好地提高TEM-4考試的內(nèi)容效度,筆者提出以下建議:(1)材料選擇上應(yīng)注意題材和體裁的多樣性和分布的合理性,適當(dāng)考慮經(jīng)濟(jì)類閱讀材料和應(yīng)用文體裁的選擇,并注意平衡各題材體裁在同一份試卷中的比例;(2)注意個(gè)別單卷的單詞量控制,提高試卷整體的閱讀速度;(3)在閱讀難度的控制方面也需要進(jìn)一步努力,將易讀度的波動(dòng)幅度控制在較小范圍內(nèi),盡量使每篇閱讀材料的易讀度在50~70之間;(4)閱讀能力考查上要平衡考查技能,使閱讀測試能考查受試者全面的閱讀能力。
[1]陶加輝,鄔小琴.大學(xué)英語新四級閱讀理解內(nèi)容效度研究[J].重慶交通大學(xué)學(xué)報(bào)(社科版),2009,(12):136-140.
[2][8][10][12]高校英語專業(yè)四級考試大綱修訂小組.高校英語專業(yè)四級考試大綱(2004年新版)[M].上海外語教育出版社,2004.
[3]Heaton,J.B.Writing English Language Tests[M].Beijing:Foreign Language Teaching and Research Press,2000.
[4]Alderson,J.C.,Clapham,Caroline,Wall,Dianne.Language Test Construction and Evaluation[M].Cambridge University Press,1995.
[5][6]Hughes,A.Testing for Language Teachers[M].Cambridge University Press,1989.
[7]辜向東.高考英語全國卷與各省市自主命題卷共時(shí)與歷時(shí)研究[M].成都:四川大學(xué)出版社,2008.
[9]高等學(xué)校外語專業(yè)教學(xué)指導(dǎo)委員會英語組.高等學(xué)校英語專業(yè)英語教學(xué)大綱[M].上海外語教育出版社,2000.
[11]李筱菊.語言測試科學(xué)與藝術(shù)[M].長沙:湖南教育出版社,1999.