侯艷萍
(上海外國(guó)語(yǔ)大學(xué) 英語(yǔ)學(xué)院 ,上海 200083)
近七年英語(yǔ)專業(yè)四級(jí)閱讀理解內(nèi)容效度評(píng)估
侯艷萍
(上海外國(guó)語(yǔ)大學(xué) 英語(yǔ)學(xué)院 ,上海 200083)
從考試任務(wù)特征的角度,對(duì)英語(yǔ)專業(yè)四級(jí)考試改革后近七年(2005-2011)的閱讀理解部分的內(nèi)容效度進(jìn)行了探究。研究范疇包括輸入語(yǔ)篇特征(語(yǔ)篇篇幅、生詞數(shù)量、題材、體裁、易讀度)和預(yù)期回答特征(閱讀技能覆蓋),并將結(jié)果與英語(yǔ)專業(yè)教學(xué)大綱和考試大綱的要求進(jìn)行了比較。研究發(fā)現(xiàn),改革后專業(yè)四級(jí)閱讀理解部分內(nèi)容效度較高,所測(cè)試內(nèi)容基本符合大綱要求,并體現(xiàn)出較好的連續(xù)性。對(duì)今后的專業(yè)四級(jí)閱讀命題提出了一些建議,并對(duì)今后的閱讀測(cè)試進(jìn)行展望。
英語(yǔ)專業(yè)四級(jí);閱讀理解;內(nèi)容效度
作為國(guó)內(nèi)唯一一種專為英語(yǔ)語(yǔ)言文學(xué)專業(yè)學(xué)生基礎(chǔ)階段設(shè)計(jì)實(shí)行的大規(guī)模標(biāo)準(zhǔn)化的語(yǔ)言測(cè)試,英語(yǔ)專業(yè)四級(jí)(以下簡(jiǎn)稱TEM4)的目的是推動(dòng)高校英語(yǔ)專業(yè)教學(xué)大綱的貫徹與執(zhí)行,對(duì)英語(yǔ)專業(yè)學(xué)生的英語(yǔ)實(shí)際運(yùn)用能力進(jìn)行客觀和準(zhǔn)確的測(cè)量,從而為提高我國(guó)英語(yǔ)教學(xué)的質(zhì)量而服務(wù)。
從1990年開(kāi)考至今,TEM4一直致力于不斷完善和規(guī)范施考程序和內(nèi)容。2005年4月,為了更好地體現(xiàn)出教學(xué)大綱和考試大綱對(duì)于英語(yǔ)專業(yè)人才培養(yǎng)目標(biāo)、教學(xué)要求等方面的任務(wù)變化,在廣泛調(diào)研和科學(xué)統(tǒng)計(jì)的基礎(chǔ)上,考試項(xiàng)目組對(duì)考試的部分項(xiàng)目也進(jìn)行了重新修訂,考試形式和能力要求等均有所變動(dòng)。其中,變動(dòng)較大的閱讀部分取消了快速閱讀題型,總時(shí)間不變的情況下將閱讀理解的文字處理量大幅提升,題目也由15題增至20題。新的考試形式實(shí)施至今已經(jīng)7年時(shí)間了,改革幾年來(lái)該部分題目的內(nèi)容效度如何?是否真正反映出變化了的能力要求?本文將重點(diǎn)對(duì)改革后的專四閱讀題目進(jìn)行分析,以期對(duì)以上問(wèn)題做出解答。
外語(yǔ)測(cè)試作為心理測(cè)試或教育測(cè)量學(xué)的一個(gè)分支,其中效度概念的重要性毋庸置疑。隨著人們對(duì)于效度這一科學(xué)概念內(nèi)涵的不斷認(rèn)識(shí),效度也成為了心理測(cè)試和教育測(cè)量學(xué)中發(fā)展最快、內(nèi)涵變化最大的概念之一。在長(zhǎng)達(dá)半個(gè)多世紀(jì)的探索過(guò)程中,隨著教育和心理測(cè)量界對(duì)于效度這個(gè)概念內(nèi)涵的研究的進(jìn)一步深入,以及對(duì)于效度外延研究的進(jìn)一步擴(kuò)大,人們對(duì)效度概念的認(rèn)識(shí)經(jīng)歷了單一概念階段,種類概念階段進(jìn)而發(fā)展到了今天的整體概念階段:
1999年,美國(guó)教育研究協(xié)會(huì)、美國(guó)心理學(xué)協(xié)會(huì)和國(guó)家教育測(cè)量委員會(huì)聯(lián)合頒發(fā)的《教育和心理測(cè)試標(biāo)準(zhǔn)》(Standards for Educational and Psychological Testing)(以下稱《標(biāo)準(zhǔn)》)最新版中,對(duì)效度做了這樣的定義:效度指的是證據(jù)及理論對(duì)于根據(jù)指定用途對(duì)測(cè)試分?jǐn)?shù)進(jìn)行解釋時(shí)的支持程度[1]9。
可見(jiàn),根據(jù)這一最新認(rèn)識(shí),效度是一個(gè)整體性的概念(unitary concept),而不是一個(gè)組合式概念(componential concept),它指得是所收集的憑證能夠在多大程度上來(lái)幫助闡釋測(cè)驗(yàn)的分?jǐn)?shù)所希望說(shuō)明的測(cè)驗(yàn)的目的。效度不再是不同種類的效度,對(duì)效度的解釋也被認(rèn)為是收集、積累不同側(cè)面的效度證據(jù)的過(guò)程。以前沿用多年的某些傳統(tǒng)術(shù)語(yǔ)如內(nèi)容效度、預(yù)測(cè)效度等將不再被應(yīng)用,它們被看作是效度憑證的不同來(lái)源。這也是對(duì)傳統(tǒng)組合式、種類式效度概念的根本性改變。
但是,無(wú)論效度概念如何變化,不變的是它的本質(zhì)和內(nèi)涵。其中重要的效度憑證之一就是基于測(cè)驗(yàn)內(nèi)容的憑證,可通過(guò)分析測(cè)驗(yàn)的內(nèi)容和測(cè)試的范疇獲得。所謂測(cè)驗(yàn)內(nèi)容,指的是測(cè)驗(yàn)的主題、用字、題型、學(xué)生的任務(wù)以及考題等等,而測(cè)試的范疇指的是測(cè)試的能力結(jié)構(gòu)和具體技能。
Bachman認(rèn)為,基于測(cè)驗(yàn)內(nèi)容的效度證據(jù)研究,應(yīng)包含兩部分:內(nèi)容相關(guān)性以及內(nèi)容覆蓋性。前者指的是將試卷與權(quán)威理論規(guī)范相比較,從而得出兩部分的相異同程度,二者越接近,則試卷的內(nèi)容效度越高;后者則是考察該試卷是否涵蓋了應(yīng)該考察的技能范圍[2]。
本文擬對(duì)專業(yè)四級(jí)2005至2011年的共28篇閱讀理解篇章和相應(yīng)的140道試題根據(jù)源自測(cè)驗(yàn)內(nèi)容的效度證據(jù)進(jìn)行分析和評(píng)價(jià),本研究中對(duì)效度證據(jù)分析采用的是Bachman和Palmer[3]提出的考試任務(wù)特點(diǎn)框架,并結(jié)合TEM-4閱讀考試規(guī)范和閱讀考試的實(shí)際情況加以一定的改進(jìn),主要從TEM4閱讀任務(wù)特征因素的角度開(kāi)展分析,包括輸入語(yǔ)篇特征(語(yǔ)篇篇幅、生詞數(shù)量、題材、體裁、易讀度)和預(yù)期回答特征(閱讀技能覆蓋、問(wèn)題類型)。
在進(jìn)行以上分析的同時(shí),結(jié)合權(quán)威理論規(guī)范《高等學(xué)校英語(yǔ)專業(yè)英語(yǔ)教學(xué)大綱》(2000年版)和《高校英語(yǔ)專業(yè)四級(jí)考試大綱》(修訂本)(2004年版)進(jìn)行對(duì)比。從而分析TEM4閱讀理解測(cè)試自2005年修訂后的內(nèi)容效度特征,明確該部分與相應(yīng)教學(xué)大綱和考試大綱的吻合程度,并對(duì)今后的TEM-4閱讀測(cè)試方向進(jìn)行展望。
1.語(yǔ)篇篇幅:各年份閱讀理解部分輸入文字總字?jǐn)?shù)(篇章字?jǐn)?shù)和題目字?jǐn)?shù)總數(shù))見(jiàn)表1:
表1 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解輸入文字總數(shù)
考試大綱規(guī)定:閱讀材料長(zhǎng)1800個(gè)單詞左右,閱讀速度要求為每分鐘120個(gè)單詞。
英語(yǔ)專業(yè)教學(xué)大綱規(guī)定:閱讀速度為每分鐘120-180個(gè)詞,理解準(zhǔn)確率不低于70%。
從上表中可以看出,該七年中以2005年字?jǐn)?shù)為最多,2006年的字?jǐn)?shù)最少。其他年份多較為平均:篇章字?jǐn)?shù)多為1800詞左右,閱讀總字?jǐn)?shù)為2500詞左右。需要注意的是,考試大綱是對(duì)四篇文章的總長(zhǎng)度做出了規(guī)定,而教學(xué)大綱制定閱讀速度時(shí)考慮的卻是將所有的文字讀完答題所需的時(shí)間。120個(gè)詞的速度標(biāo)準(zhǔn)是包括了閱讀文章,閱讀題目和思考答題的所有時(shí)間。從這個(gè)意義上講,25分鐘的閱讀量應(yīng)該是25×120=3000詞左右。所以,這幾年年試題對(duì)大綱要求的總的把握是基本準(zhǔn)確的,篇章長(zhǎng)度完全符合考綱要求,總閱讀量上還可以有適當(dāng)增加的空間。
2.生詞數(shù)量:理論上講,閱讀材料中不應(yīng)出現(xiàn)教學(xué)大綱中不包括的超綱單詞。但是經(jīng)過(guò)與考綱的比較,我們確實(shí)發(fā)現(xiàn)有些生詞出現(xiàn)其中。實(shí)際上,在閱讀材料中出現(xiàn)適當(dāng)少量的生詞是可以接受的。本調(diào)查中,凡未列入《英語(yǔ)專業(yè)四、八級(jí)詞匯表》(《高等學(xué)校英語(yǔ)專業(yè)英語(yǔ)教學(xué)大綱》詞匯表工作組編寫(xiě))中基礎(chǔ)階段規(guī)定的8000個(gè)詞表中的詞被歸為“生詞”。
考試大綱規(guī)定:語(yǔ)言難度中等,所用詞匯基本上不超出教學(xué)大綱詞匯表對(duì)四級(jí)規(guī)定的范圍。
事實(shí)上,該七年文章中的生詞比例(見(jiàn)表2)大大低于3%。
表2 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解生詞數(shù)及比例
續(xù)表
之所以可以容許一定生詞出現(xiàn),有以下三個(gè)原因:第一,從閱讀理論的角度來(lái)講,這一層次的讀者會(huì)在閱讀中自動(dòng)使用交互式閱讀模式(interactive model)[4][5]。也就是說(shuō),他們可以自如地利用自上而下(top-down)和自下而上(bottomup)這一雙重結(jié)構(gòu)進(jìn)行解碼[6]。前者指讀者在閱讀過(guò)程中主要根據(jù)所讀材料的單位所構(gòu)成的意義進(jìn)行理解,而后者則指讀者在閱讀時(shí)主要利用先行存入知識(shí)結(jié)構(gòu)處理新的信息。在一個(gè)層次上的知識(shí)不足以有效解碼時(shí),其他層次的知識(shí)會(huì)自動(dòng)加以協(xié)助。所以,閱讀考試中,如果學(xué)生個(gè)別單詞不認(rèn)識(shí),完全可以通過(guò)上下文語(yǔ)境和已有知識(shí)進(jìn)行一定的猜測(cè),基本不會(huì)影響文章的理解程度。第二,從第二語(yǔ)言習(xí)得的角度來(lái)講,Krashen曾提出要對(duì)學(xué)生輸入比目前掌握的難度稍高一點(diǎn)層次的材料[7],這就是著名的i+1理論。其目的在于始終為學(xué)生提供一個(gè)合適的空間去刺激他們知識(shí)水平的不斷提高。所以,英語(yǔ)學(xué)習(xí)者要始終注意利用上下文語(yǔ)境和圖式知識(shí)來(lái)達(dá)到對(duì)新知識(shí)的理解。第三,從交際法教學(xué)的角度來(lái)講,為了盡可能的讓學(xué)生接觸到原汁原味的英語(yǔ),從而消除課堂中所學(xué)的英語(yǔ)與現(xiàn)實(shí)生活中實(shí)際使用的英語(yǔ)的區(qū)別,一般提倡使用真實(shí)的英語(yǔ)材料。Wilkins給真實(shí)材料下的定義是:“不是專門(mén)給外國(guó)人編寫(xiě)和錄制的材料,而原來(lái)就是給本國(guó)人的材料。”[8]他提出不對(duì)文章作編輯加工,不把語(yǔ)言方面的難點(diǎn)去掉,但對(duì)語(yǔ)言的內(nèi)容作不同的開(kāi)發(fā)利用。所以,只要根據(jù)材料長(zhǎng)度語(yǔ)言難度精心選擇,再加以合理利用,含有少量生詞的真實(shí)材料是完全可以作為考試材料的。
在這點(diǎn)上,該七年題目都符合大綱要求,考生基本不會(huì)感覺(jué)到生詞對(duì)閱讀造成的困難,生詞量屬于可接受范圍。尤其是2009年和2011年的試卷對(duì)于生僻詞匯加以中文注釋,極大的降低了考生因詞匯不熟而導(dǎo)致的閱讀障礙。
3.題材:對(duì)近七年修訂前后的閱讀材料的題材分析見(jiàn)表3:
表3 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解題材分布
考試大綱規(guī)定:題材廣泛,包括社會(huì)、科技、文化、經(jīng)濟(jì)、日常知識(shí)、人物傳記等。
教學(xué)大綱規(guī)定:教材應(yīng)選用題材廣泛的閱讀材料,以便向?qū)W生提供廣泛的語(yǔ)言和文化素材。
從上表可以看出,近幾年所選文章全部在大綱規(guī)定范圍之內(nèi),一般題材的文章占了絕大部分。2005年和2006年的文章題材分配更加均衡合理,除了常見(jiàn)的社會(huì)和文化題材外,各有一篇科普和人物傳記/小說(shuō)節(jié)選的文章??梢?jiàn)剛剛修訂后的題目更為全面地貫徹了大綱的要求,更為側(cè)重對(duì)學(xué)生知識(shí)面的考察。之后幾年的題目相對(duì)集中在社會(huì)文化范疇之內(nèi),所以還可以再適當(dāng)增加其他題材文章的比重,以便更好地考察考生的知識(shí)面和閱讀技能。
4.體裁:體裁指的是文章的文體風(fēng)格。在這里,對(duì)文章的分析見(jiàn)表4:
表4 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解體裁分布
考試大綱規(guī)定:題材多樣,包括記敘文、描寫(xiě)文、說(shuō)明文、議論文、廣告、說(shuō)明書(shū)、圖表等。
通過(guò)對(duì)這些閱讀材料的分析,不難發(fā)現(xiàn),七年中體裁分布最平衡的是2008和2011年。其他年份的考察中多以說(shuō)明文和議論文為主。應(yīng)該說(shuō),這是符合專業(yè)英語(yǔ)的教學(xué)要求的。說(shuō)明文要求客觀的闡述原理、事實(shí)和方法等,議論文則重在強(qiáng)調(diào)對(duì)個(gè)人的觀點(diǎn)加以論證,這些都是應(yīng)該掌握的較高層次的寫(xiě)作體裁。值得一提的是,由于改革后取消了快速閱讀項(xiàng)目,所以之前常常出現(xiàn)在快速閱讀中的廣告、圖表等也被列入了閱讀理解新的體裁中。雖然目前還沒(méi)有在試卷中得以應(yīng)用,但是我們相信,隨著以后體裁范圍的擴(kuò)大,這些形式也必將會(huì)在以后的考試中占有一席之地。
5.易讀度:一定層次的閱讀考試,應(yīng)當(dāng)有與之難易適合的文章材料。國(guó)外許多語(yǔ)言學(xué)家和心理學(xué)家都提出了量化計(jì)算閱讀材料易讀度的公式,如SMOG系數(shù)、Fry估量法、Flesh公式等等,都力求通過(guò)簡(jiǎn)單可行的方法對(duì)易讀度進(jìn)行實(shí)際測(cè)算。此處,筆者試用Flesh的易讀公式進(jìn)行測(cè)算。公式如下:
RE=206.84-0.85wl-1.02sl(wl指每100詞所含的音節(jié)數(shù),sl指每句平均詞數(shù))
用這個(gè)公式對(duì)近七年閱讀材料用Flesh公式測(cè)算后的結(jié)果見(jiàn)表5:
表5 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解易讀度數(shù)據(jù)
表6 Flesh閱讀能量表
考試大綱規(guī)定:能讀懂英美國(guó)家出版的中等難度的文章和材料,讀懂難度相當(dāng)于美國(guó)Newsweek的國(guó)際新聞報(bào)道和相當(dāng)于Sons and Lovers的文學(xué)原著。
教學(xué)大綱規(guī)定:同考試大綱。
根據(jù)以上要求再結(jié)合閱讀能量表(見(jiàn)表6),不難看出,大綱對(duì)“中等難度”的規(guī)定是相當(dāng)于大致50至70的標(biāo)準(zhǔn)難度,即相當(dāng)于美國(guó)國(guó)內(nèi)7、8年級(jí)或某些高中的閱讀水平,美國(guó)大概有40%到75%左右的成年人可以達(dá)到這種閱讀水平。對(duì)近七年28篇文章的分析結(jié)果顯示,絕大多數(shù)文章的易讀度在50至70之間,基本符合Flesh表格中中等難度的要求——即介于standard和fairly difficult之間。整體說(shuō)來(lái),2005年的文章難度相對(duì)稍大,基本高于standard檔次而處于quality一檔,這符合修訂考題提升對(duì)學(xué)生能力要求的目的。從易讀度上看其后幾年的閱讀材料難度似有趨易的特征。但我們也應(yīng)該指出,易讀度公式的測(cè)算僅從平均詞數(shù)和音節(jié)數(shù)的角度進(jìn)行,并不能絕對(duì)說(shuō)明問(wèn)題,因?yàn)榫唧w一篇文章的難度還受到其他一些重要因素的制約,比如題材、體裁、詞匯、專業(yè)背景知識(shí)、母語(yǔ)/非母語(yǔ)、語(yǔ)法結(jié)構(gòu)等等,具體到每個(gè)閱讀者的難度可能也是不一致的,但是,F(xiàn)lesh的公式可以給我們一個(gè)較為客觀的衡量參照尺度,確定大致的比較標(biāo)準(zhǔn)。
對(duì)預(yù)期回答的研究主要集中在對(duì)閱讀題目的分析上,即此7年共140個(gè)題目是從哪些角度來(lái)考核了學(xué)生的哪些閱讀能力。具體來(lái)看:
閱讀技能覆蓋 在TEM4考試內(nèi)容規(guī)范中,將閱讀理解能力分為以下幾方面:
1.辨別理解文章主旨和重要細(xì)節(jié)
(1)尋找文章主旨和重要細(xì)節(jié) (對(duì)文章進(jìn)行概括,提綱挈領(lǐng);對(duì)語(yǔ)篇中的不同觀點(diǎn)加以區(qū)分);(2)區(qū)分事實(shí)與觀點(diǎn),分辨作者態(tài)度;(3)理解文中隱含的意思 (通過(guò)理解字里行間的意義,通過(guò)運(yùn)用外界知識(shí)如背景知識(shí)等)。
2.運(yùn)用有助于理解的語(yǔ)言技能來(lái)理解文章
(1)理解句與句間語(yǔ)法關(guān)系(如因果、對(duì)比、目的等);(2)理解句子或從句的句法結(jié)構(gòu);(3)猜測(cè)單詞和短語(yǔ)的意思;(4)認(rèn)知連貫和照應(yīng)。
在我們進(jìn)行實(shí)際操作時(shí),為方便起見(jiàn),又將以上能力細(xì)分為以下7種(見(jiàn)表7):
01代表理解明確表達(dá)的概念或細(xì)節(jié);02代表理解隱含表達(dá)的概念或細(xì)節(jié) (如下結(jié)論、作判斷和進(jìn)行推論等);03代表辨別文章的中心思想;04代表理解作者的觀點(diǎn)和態(tài)度;05代表猜測(cè)詞和短語(yǔ)的意思;06代表句層次的理解 (理解句子表達(dá)的原因、結(jié)果、目的、比較等);07代表篇章層次的理解 (運(yùn)用詞匯的、語(yǔ)法的承接手段來(lái)理解文章各部分的關(guān)系)。
表7 2005-2011年英語(yǔ)專業(yè)四級(jí)考試閱讀理解各年具體閱讀技能考核表
新舊專業(yè)四級(jí)考試大綱均規(guī)定:(1)掌握材料的主旨和大意;(2)了解說(shuō)明主旨和大意的事實(shí)和細(xì)節(jié)。(3)既理解字面的意思,也能根據(jù)所讀材料進(jìn)行一定的判斷和推論。(4)既理解個(gè)別句子的意義,也理解上下文的邏輯關(guān)系。
英語(yǔ)專業(yè)教學(xué)大綱規(guī)定:要求在理解的基礎(chǔ)上抓住要點(diǎn),并能運(yùn)用正確觀點(diǎn)評(píng)價(jià)思想內(nèi)容。
我們對(duì)以上結(jié)果分析如下:
七年的試題包括了考試大綱及內(nèi)容規(guī)范所規(guī)定的全部?jī)?nèi)容。盡管每年的比例各有不同,但幾乎每一年都會(huì)全面考察到這7種技能。
七年試題考察側(cè)重點(diǎn)一脈相承,均為總體理解(global understanding),比率均為60%左右,而考察局部理解(local understanding)的約占40%。技能01每年考察的比例都約在30%左右,技能02、03、04是歷來(lái)考察的重點(diǎn)。這一點(diǎn)告訴我們,作為最基本的一種技能,對(duì)于字面意義的單純理解不可缺少,這也是理解全文的基礎(chǔ)。但是,僅作到淺層次的理解還是遠(yuǎn)遠(yuǎn)不夠的。理解隱含信息,掌握材料主旨和大意,以及領(lǐng)會(huì)作者意圖等技能是對(duì)英語(yǔ)專業(yè)二年級(jí)學(xué)生的最主要的要求。也就是說(shuō),學(xué)生們應(yīng)該透過(guò)現(xiàn)象領(lǐng)會(huì)本質(zhì),這才是閱讀理解的精髓所在。對(duì)英語(yǔ)專業(yè)學(xué)生而言,應(yīng)側(cè)重于在全局上對(duì)深層次意義做出正確理解,即著眼于對(duì)高層次能力的培養(yǎng)。
技能05、06和07占的比例都不大。他們分別代表了對(duì)詞匯層次/短語(yǔ)層次、句子層次和篇章層次的理解,但在本質(zhì)上都屬于有助于閱讀的語(yǔ)言技能。前兩種屬于較低層次技能,后一種屬于高層次技能。他們都是閱讀必不可少的技巧,但又不是重點(diǎn)考察的要點(diǎn)。所以,近幾年試題對(duì)他們既有所涉及,又把握了很好的比例。
綜上所述,改革后的閱讀試題不僅全面的綜合了各項(xiàng)技能,又在分值的分配上取得了很好的控制,完全符合大綱的要求。在對(duì)閱讀能力考察的策略和技能及其重點(diǎn)方面,近七年的題目體現(xiàn)出出題思路的連貫性和系統(tǒng)性。
通過(guò)以上分析,我們看到,改革后七年間閱讀考試無(wú)論是材料選擇還是題目設(shè)置基本都符合了其對(duì)應(yīng)指導(dǎo)大綱的要求,在大綱明確提出需變動(dòng)的地方(如文章長(zhǎng)度、難度)等方面體現(xiàn)出了增加的梯度,而對(duì)于大綱修訂前后要求不變的內(nèi)容則體現(xiàn)出了較強(qiáng)的連續(xù)性和銜接性。分析表明,2004年至2011年專業(yè)四級(jí)考試試題所選測(cè)量工具內(nèi)容(材料、題材、體裁、題目)具有較高的代表性,而且內(nèi)容樣本較為充分,就其基于測(cè)驗(yàn)內(nèi)容的憑證而言,都體現(xiàn)出較高的效度。
但是,我們同時(shí)也注意到以下有待改進(jìn)的問(wèn)題。
應(yīng)重視交際性的考察,重點(diǎn)測(cè)試學(xué)生在一定語(yǔ)境中運(yùn)用語(yǔ)言進(jìn)行有效交際的能力。由于TEM4是一項(xiàng)全國(guó)范圍的大規(guī)模考試,為了保證閱卷的質(zhì)量,考試分?jǐn)?shù)的客觀性和公正性、考試水平的穩(wěn)定性,閱讀考試全部采用多項(xiàng)選擇題,保證了測(cè)試信度的同時(shí),也不可避免的忽視了大量真正語(yǔ)言輸入和交際能力的檢測(cè)。建議有選擇的增加一些諸如信息轉(zhuǎn)換,匹配等題型,近幾年的IELTS和PETS中的一些綜合性的閱讀題型也是非常好的嘗試。但是,我們也要看到,對(duì)于這樣一個(gè)大規(guī)模的考試,更改題型也確有一定難度,只能耐心的逐步加以改進(jìn)。
題目難度有待更好控制,且建議四篇文章按易讀度由易到難排列,循序漸進(jìn)。同時(shí),在文章選材時(shí),應(yīng)考慮在合理的范圍內(nèi)適當(dāng)拉開(kāi)文章難度層次,并按照由易到難的順序逐步推進(jìn),給學(xué)生一個(gè)心理緩沖的過(guò)程,從而有利于更好的發(fā)揮他們的水平。
文章選材面可以更加廣泛。只要是背景知識(shí)不過(guò)于專業(yè),以至于造成對(duì)個(gè)別專業(yè)學(xué)生十分有利或不利的情況,其他的文章題材都可以考慮。尤其是諸如一些科普知識(shí)、史地知識(shí)等方面的文章以后出題都可以有所涉及。體裁也可更加多樣化,如廣告、圖表、說(shuō)明書(shū)等也可以作為材料選擇時(shí)的體裁。
選材盡可能使用真實(shí)材料。為了能更好的激活學(xué)生的圖式知識(shí)儲(chǔ)備和已有知識(shí)、背景知識(shí),建議在每篇文章前配以標(biāo)題,以利于學(xué)生更快的熟悉題材,進(jìn)入狀態(tài)。
[1]American Psychological Association,American Educational Research Association,National Council on Measurement in Education.Standards for Educational and Psychological Testing[M].Washington:American Educational Research Association,1999.
[2]BACHMAN L F.Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990:244
[3]BACHMAN L F,PALMER A S.Language Testing in Practice[M].Oxford:Oxford University Press,1996:49
[4]RUMELLHART D E.Toward an Interactive Model of Reading[A].S Dornic.Attention and Performance,Vol.6:537 - 603.New York: Academic Press,1977.
[5]STANOVICH K E.Toward an Interactive-Compensatory Model of Individual Differences in the Development of Reading Fluency[J].Reading Research Quarterly,1980,15(1):10-29.
[6]CARRELL P.Some Causes of Text-boundedness and Schema Ingterfrence in ESL Reading[C].Carrell P,J Devine,D Eskey.Interactive Approaches to Second Language Reading.Cambridge:Cambridge University Press,1988:101-113
[7]KRASHEN S.The Input Hypothesis:Issues and Implications[M].London:Longman,1985.
[8]WILKINS D.Notional Syllabus[M].Oxford:Oxford University Press,1976.
[9]聶丹.普通話水平測(cè)試體裁難度層級(jí)探析[J].湖南大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012(2):103-106.
Evaluating the Content Validity of the Innovated TEM4 Reading in Recent Seven Years
HOU Yan-ping
(College of English Language and Literature,Shanghai International Studies University,Shanghai 200083,China)
This article explores the content validity of TEM-4reading(2005-2011)from the perspective of task characteristics.The study covers input characteristics(length,new words,topic area,genre,readability)and expected response characteristics(reading skills coverage).and later makes a comparative study between the research results with the teaching syllabus and testing syllabus.The results are rather satisfactory in terms of the content validity,the conformity with the syllabi,and its consistency.Recommendations and suggestions are put forward for further improvement.
TEM4;reading comprehension;content validity
H310.1
A
1005-6378(2012)04-0142-06
2011-12-01
上海外國(guó)語(yǔ)大學(xué)重大科研項(xiàng)目《外語(yǔ)學(xué)科系統(tǒng)評(píng)估與評(píng)價(jià)體系》(QJTD11WXM01)
侯艷萍(1977-),女,山東沂南人,上海外國(guó)語(yǔ)大學(xué)英語(yǔ)學(xué)院教師,博士,主要研究方向:英語(yǔ)語(yǔ)言教學(xué)與測(cè)試。
[責(zé)任編輯 周云逸]