桂敏
摘要:進入21世紀人們對大學(xué)英語四、六級考試(以下簡稱為CET)的爭議從未停止。本文通過剖析CET的測量學(xué)屬性,分析了它的多重功能,即CET具有很強的選拔和區(qū)分功能,一定的判斷學(xué)生是否達到課程教學(xué)要求的功能,以及測量學(xué)生實際運用英語能力。從分析中得到的啟示是CET復(fù)雜的測量學(xué)屬性和多重功能有可能是引起人們對CET爭議的原因之一,為了讓CET更好地發(fā)揮它的作用,CET應(yīng)該使其功能單一化。
關(guān)鍵詞:大學(xué)英語四、六級考試;常模參照的測試;尺度參照的測試;學(xué)業(yè)考試;水平考試
中圖分類號:G640 文獻標志碼:A 文章編號:1674-9324(2012)12-0110-03
一、引言
大學(xué)英語四、六級考試對中國英語教學(xué)和學(xué)生英語水平的提高起了較大作用,但是進入21世紀后對它的爭議從未停止(如韓寶成,2002;劉潤清,2003;錢冠連,2003;陳祖芳,2004;韓寶成 戴曼純等,2004;王初明,2006)。有學(xué)者質(zhì)疑CET是否準確地測量學(xué)生的英語水平(如蔡基剛,2007;韓寶成、戴曼純等,2004)。有學(xué)者關(guān)注CET對大學(xué)英語教育和學(xué)習(xí)是否有促進作用。有些研究表明CET對大學(xué)英語教育和學(xué)習(xí)帶來負面影響(如井升華,1999;牛強,2001;肖云南 羅曉英,2002;李炯英,2002;高遠,2003);有的研究結(jié)果表明它的正面反撥效應(yīng)大于其負面反撥效應(yīng)(如辜向東,2007;葉菊仙,1998)。對CET進行改革已是大勢所趨,教育決策者、CET研究開發(fā)單位和語言教育專家都從不同的視角提出CET的改革發(fā)展方向(張堯?qū)W,2003,2008;金艷,2004,2006;王初明,2006;蔡基剛,2007)。基于分析CET復(fù)雜的測量學(xué)屬性和它的多重功能,本文探討了對CET爭議的原因。
二、CET的測量學(xué)屬性
分析CET的性質(zhì)是理解對CET爭議的重要視角之一。它本身是一個什么性質(zhì)的考試,考試研發(fā)者期望它能滿足什么樣的功能,而質(zhì)疑者認為它應(yīng)該是什么樣的考試,它應(yīng)該在社會和教育界起什么樣的作用,角度不同,答案也不一樣,因此分析他們之間的偏差可以更好地理解對CET的爭議。用來描述語言考試和評估的專有名詞很多。根據(jù)不同的解釋測試結(jié)果的參照系,心理測量研究人員通常把測試分為標準參照(criterion-referenced)和常模參照(norm-referenced)考試;根據(jù)考試內(nèi)容選取的依據(jù),考試通常分為學(xué)業(yè)考試(achievement test)和水平考試(proficiency test)(Bachman,1990;徐強,2000;束定芳 莊智象,1996);根據(jù)不同的評估型式,考試分為形成性(formative)和終結(jié)性(summative)評估。下文將以測試的不同分類方法為視角對CET的測量學(xué)屬性進行剖析。
1.CET是常模參照-尺度相關(guān)的考試。心理測量理論認為如果測試的結(jié)果是參照某一標準進行解釋(語言能力等級量表或教學(xué)大綱標準),該考試被稱之為標準參照。比如雅思把語言能力分為十個等級,每一個等級用語言進行定性的描述,達到某個等級就表示該考生能用語言完成所描述的功能。根據(jù)雅思的能力等級量表如果一個考生“有能力運用英語,雖然在某些情況有時會發(fā)生不準確、不適當(dāng)和誤解,基本上能很好地掌握復(fù)雜的英語句子,也能理解推理的細節(jié)”,該考生的語言能力為七級。而常模參照考試是以某一常模作為參照系來解釋考生的成績。常模是由測試單位選取的,呈正態(tài)分布的用均值和標準差來進行描述的標準化樣組??忌某煽兪且运诔DV兴幍奈恢脕斫忉尩摹H绻骋豢忌脑挤謹?shù)與常模的均值大一個標準差,他的能力就可以解釋為比84.13%的考生強。因此,從分數(shù)解釋的參照系的角度出發(fā),CET是常模參照性的考試。常模是由北京大學(xué),清華大學(xué),上海交通大學(xué),復(fù)旦大學(xué),中國科技大學(xué)和西安交通大學(xué)本科生組成。這樣選取常模是因為考試的最初設(shè)計測量對象是重點大學(xué)本科生。后來CET擴展到全國普通高校,并用小于常模均值一個標準差作為及格線(楊惠中&Weir,1998;楊惠中 金艷,2001;蔡基剛,2007)。CET也是尺度相關(guān)的考試。楊惠中和Weir(1998:30)認為“這一常模的建立和某種事先確定的標準密切相關(guān)”因而稱之為尺度相關(guān)。CET研發(fā)中心按照國家教育委員會頒布的《大學(xué)英語教學(xué)大綱》(1985)中的要求:“重點大學(xué)經(jīng)過一定時期的努力,基本上達到大綱所規(guī)定的四級要求”,把“基本上”理解為85%的學(xué)生達到要求。這樣常模累計比例85%,比平均分小一個標準差的分數(shù)就定為及格分。經(jīng)過線性轉(zhuǎn)換,100制的60分就成為及格分;得60分的考生就達到了大綱所規(guī)定的四級要求。但是,自2005年起,CET總分改為710,平均分為500,標準差為70的常模正態(tài)分數(shù),它的尺度相關(guān)的測量學(xué)屬性逐漸淡化。
2.CET是學(xué)業(yè)考試和水平考試的結(jié)合體。根據(jù)考試內(nèi)容選取的依據(jù),考試分為學(xué)業(yè)考試(achievement test)和水平考試(proficiency test)。前者的測試內(nèi)容以教學(xué)大綱為依據(jù),后者的測試內(nèi)容以語言理論為基礎(chǔ)(Bachman,1990;徐強,2000;束定芳 莊智象,1996)。CET考試的內(nèi)容基本上以大學(xué)英語教學(xué)大綱為基礎(chǔ)。比如教學(xué)大綱對聽、說、讀、寫、譯的速度和難度有量化的要求,CET也基本上是按教學(xué)大綱的量化標準考察學(xué)生的五項技能。所以,CET能對學(xué)生學(xué)完大學(xué)英語課程的結(jié)果進行一定的考核。從這個意義上講CET是學(xué)業(yè)考試。CET也是水平考試。CET是基于分立語言測試、綜合語言測試和交際語言測試理論的測試(楊惠中 金艷,2001)?;谖鍌€分項(聽力、閱讀、詞匯與結(jié)構(gòu)、完型填空和寫作)的相關(guān)系數(shù)分析以及因素分析,CET研發(fā)中心歷時三年的效度研究證明CET“能夠準確而有效地反映學(xué)生總的語言水平”(楊惠中 & Weir,1998:61)。因此,CET也是建立在語言能力理論和語言測試理論研究的基礎(chǔ)之上的水平測試。
3.CET是終結(jié)性的考試。根據(jù)考試的型式,教學(xué)考試或教學(xué)評估一般分為形成性和終結(jié)性評估。形成性評估是對學(xué)生的學(xué)習(xí)進展的評估,是在教學(xué)過程中為改進教與學(xué)而進行的評價。形成性評價注重對學(xué)習(xí)過程的指導(dǎo)和改進,強調(diào)評價信息的及時反饋,旨在通過經(jīng)常性的測評,提高學(xué)生的學(xué)習(xí)效果,并改進教師的教學(xué)(Black & William,2003)。它的形式多種多樣,譬如學(xué)生自我評估,學(xué)生相互間的評估,教師對學(xué)生的評估。終結(jié)性評價是指在一個學(xué)習(xí)階段末,對學(xué)生的表現(xiàn)與能力所做的評價,它關(guān)注的是學(xué)習(xí)的結(jié)果。前者被稱作是為了學(xué)習(xí)而進行的評價(Assessment for learning),后者是對學(xué)習(xí)進行的評價(Assessment of learning)。CET是在學(xué)生完成一段時間的課程學(xué)習(xí)(一般為四個學(xué)期)對他們進行英語綜合能力的評價,所以它是終結(jié)性評估。綜上所述,CET是常模參照-尺度相關(guān),融合了學(xué)業(yè)考試和水平考試的特點,對大學(xué)生的綜合英語水平進行終結(jié)性評價的考試。
三、CET的多重功能
一個測評系統(tǒng)能夠發(fā)揮什么樣的功能是與它的性質(zhì)密切相關(guān)的。首先,CET是常模參照的考試,所以它具有很強的選拔和區(qū)分功能。它是標準相關(guān)的考試,所以它對考生是否達到大學(xué)英語教學(xué)大綱的基本要求或較高要求能進行判斷。其次,CET融合了學(xué)業(yè)考試和水平考試的特點,因此它能在一定程度上判斷學(xué)生是否達到課程教學(xué)要求,滿足教育管理者對督促教師貫徹教學(xué)要求和對教學(xué)效果進行評價的目的。它也能從一定程度上評定學(xué)生的英語水平,滿足社會對畢業(yè)生求職者的英語水平進行量化評判的要求,也滿足了打造“中國的民族品牌”與其他國家的大型標準化英語考試競爭的目的。最后,CET能對學(xué)生學(xué)完大學(xué)英語課程后進行終結(jié)性的測評??傊?,目前的CET身兼多重功能。這種多功能的考試在上個世紀對教學(xué)和社會都起到了積極的作用。但是隨著人們對測評系統(tǒng)的專業(yè)化程度和精確度要求越來越高,這種多功能的考試引起了越來越大的爭議。
四、CET多重功能的局限性
對CET的爭議與其性質(zhì)和功能是密切聯(lián)系的。有些爭議是由它的多重功能之間的矛盾性引起的。下面討論對CET的兩個主要的爭論:CET對大學(xué)英語教育和學(xué)習(xí)的影響;CET是否能準確測評學(xué)生修完大學(xué)英語四、六級課程后的英語語言水平。CET對大學(xué)英語教育和學(xué)習(xí)影響的研究結(jié)果并不一致。有的研究結(jié)果表明它的正面反撥效應(yīng)大于其負面反撥效應(yīng)(如辜向東,2007;葉菊仙,1998)。有的調(diào)查結(jié)果顯示它有很大的負面效應(yīng)(如韓寶成 戴曼純等,2004)。雖然對CET的反撥效應(yīng)的調(diào)查研究不多,但認為CET對大學(xué)英語教育和學(xué)習(xí)帶來負面影響的人卻不少(如井升華,1999;牛強,2001;肖云南 羅曉英,2002;李炯英,2002;高遠,2003)。對CET的質(zhì)疑部分是由它的功能之間的矛盾性引起的:為英語教學(xué)服務(wù)和為社會對語言能力測評需要服務(wù)。這兩者之間雖然有統(tǒng)一性,但隨著社會對專業(yè)化需要越來越強,他們之間的矛盾日漸突出。他們之間的統(tǒng)一性在于能力高低的相關(guān)性:如果某個學(xué)生能很好地完成教學(xué)要求,他在學(xué)業(yè)考試中就會獲得高分,他在水平考試中也很可能得高分,雖然兩種考試的目的和內(nèi)容不一樣。不同考試之間的相關(guān)性往往會掩蓋他們的差異性。但人們對測試標準的要求越來越高,他們之間的差異性就會逐漸顯現(xiàn)。首先,為教學(xué)服務(wù)的學(xué)業(yè)考試內(nèi)容和重點可變性強,而基于能力結(jié)構(gòu)的水平測試是相對穩(wěn)定的。教育政策對教學(xué)要求和教學(xué)重點有很強的指導(dǎo)性,而教育政策是經(jīng)常變化的,這樣基于教學(xué)要求的學(xué)業(yè)考試重點和內(nèi)容也會不斷地變化。比如,1999年的大學(xué)英語教學(xué)大綱和2004年頒布的大學(xué)英語教學(xué)要求差異很大。前者強調(diào)培養(yǎng)學(xué)生較強的閱讀能力,后者突出要求學(xué)生的聽說能力。教學(xué)大綱和要求的改變使得CET的內(nèi)容和比重作出相應(yīng)的改變。張堯?qū)W(2008)明確指出CET必須隨著教學(xué)大綱的改變而改變。若干年之后,由“聽說領(lǐng)先”改為“讀寫領(lǐng)先”也不是沒有可能的,因為能讀會寫才不是文盲。但是基于能力結(jié)構(gòu)的水平測試卻依然對聽、說、讀、寫有全面的要求。然而水平測試的內(nèi)容相對穩(wěn)定,雖然也會變化,但變化的依據(jù)是人們對于語言能力的認識,即語言理論。其次,為教學(xué)服務(wù)的學(xué)業(yè)考試的主要服務(wù)對象是學(xué)生,教師和教育管理者,而為社會服務(wù)的水平考試的主要服務(wù)對象是求職者和用人單位。形成性的學(xué)業(yè)考試對學(xué)生的學(xué)習(xí)過程進行評估,以幫助學(xué)生認清自己的強項和弱項,調(diào)整學(xué)習(xí)重點??荚嚱Y(jié)果也可以幫助教師調(diào)整教學(xué)方法、進度和教學(xué)重點。終結(jié)性的學(xué)業(yè)考試可以對一段時間的學(xué)習(xí)和教學(xué)進行總的評估,為教育管理者提供信息。而為社會服務(wù)的水平考試是對應(yīng)試者的英語進行測評,為用人單位甄選人才提供信息。學(xué)業(yè)考試可以對學(xué)習(xí)的過程或者學(xué)習(xí)結(jié)果進行考評,而為社會服務(wù)的水平考試只關(guān)注考試結(jié)果。王初明(2006)認為CET改革的根本問題是考試如何實用和對誰使用的問題。再次,為教學(xué)服務(wù)的學(xué)業(yè)考試的構(gòu)念(construct)是測評學(xué)生的“一般語言能力”,或“是否學(xué)會了自主學(xué)習(xí)和掌握了不斷提高英語實用水平的英語學(xué)習(xí)可持續(xù)發(fā)展能力”(金艷,2009),而為社會服務(wù)的水平考試的構(gòu)念是測試應(yīng)試者的“實用英語能力”。學(xué)業(yè)考試的主要內(nèi)容是人文、社會、科普,而為社會服務(wù)的水平考試的主要內(nèi)容是日常交際、國際交流、商務(wù)、旅游等。學(xué)業(yè)考試關(guān)注學(xué)生的“可持續(xù)發(fā)展能力”,而為社會服務(wù)的水平考試的主要使用者更關(guān)注應(yīng)聘者此時此刻具有的實用英語的熟練程度和英語應(yīng)用能力,他們對學(xué)生過去的學(xué)習(xí)過程和將來的發(fā)展可能并不十分關(guān)注??傊疄榻虒W(xué)服務(wù)的學(xué)業(yè)考試和為社會服務(wù)的水平考試之間的矛盾性使得CET這樣一個兼?zhèn)鋵W(xué)業(yè)考試和水平考試性質(zhì)的測評系統(tǒng)很難充分發(fā)揮其為教學(xué)和為社會服務(wù)的雙重功能。
從測量學(xué)屬性來看,CET是常模參照-尺度相關(guān)、融合了學(xué)業(yè)考試和水平考試的特點、對大學(xué)生的綜合英語水平進行終結(jié)性評價的考試。因此,CET具有多重功能,如:很強的選拔和區(qū)分功能,判斷學(xué)生是否達到課程教學(xué)要求的功能,測量學(xué)生實際運用英語能力的功能。同時,CET打造了“中國的民族品牌”,與其他國家的大型標準化英語考試進行競爭,為社會對求職者的英語水平進行量化評判提供依據(jù)。但是,CET的多重功能性也使其難以滿足人們對語言測試系統(tǒng)的專業(yè)化程度和準確度的要求日益提高的要求。如果CET能夠使其功能更加單一化,目的更加明確,就可以更好地發(fā)揮它的作用。
參考文獻:
[1]Bachman, L. F. Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.
[2]Black,P.&William,D.Assessment for learning:Putting it into practice(Inside the black box)[M].New York: McGraw-Hill House,2003.
[3]蔡基剛.大學(xué)英語四級考試新大綱目標定位修正及其意義[J].外語界,2007,(4):76-82.
[4]陳祖芳.學(xué)術(shù)討論要尊重事實——就四、六級考試問題與劉潤清先生商榷[J].外語界,2004,(1):74-77.
[5]方緒軍.楊惠中,朱正才.制定全國統(tǒng)一的語言能力等級量表的原則和方法[J].現(xiàn)代外語,2008,(4):380-387.
[6]高遠.外語教學(xué)改革要科學(xué)論證和放開搞活[J].外語教學(xué)與研究,2003,(3):222-223.
[7]辜向東.大學(xué)英語四、六級考試對中國大學(xué)英語教學(xué)的反撥效應(yīng)實證研究[J].重慶大學(xué)學(xué)報(社會科學(xué)版),2007,(4):119-125.
[8]韓寶成.高校學(xué)生英語能力測試改革勢在必行[J].外語教學(xué)與研究,2002,(6):410-411.
[9]韓寶成,戴曼純,楊莉芳.從一項調(diào)查看大學(xué)英語考試存在的問題[J].外語與外語教學(xué),2004,(2):17-23.
[10]金艷.大學(xué)英語四、六級網(wǎng)考的設(shè)計原則[J].外語界,2009,(4):61-68.
[11]金艷.提高考試效度,改進考試后效——大學(xué)英語四、六級考試后效研究[J].外語界,2006,(6):65-73.
[12]金艷.改革中的大學(xué)英語四、六級考試[J].中國外語,2004,(1):27-29.
[13]井升華.我國大學(xué)英語教學(xué)費時低效的原因[J].外語教學(xué)與研究,1999,(1):21-23.
[14]李炯英.中國現(xiàn)行大學(xué)英語四、六級考試的問題與思考——兼評國內(nèi)外相關(guān)研究[J].外語教學(xué),2002,(5):33-38.
[15]劉潤清.高校英語教學(xué)改革筆談之二[J].外語教學(xué)與研究,2003,(3):221.
[16]牛強.現(xiàn)行高校英語測試中的問題[J].外語教學(xué)與研究,2001,(2):140-143.
[17]錢冠連.還是要整合性考試——談純分析性考試為何是失誤[J].外語教學(xué)與研究,2003,(5):379-380.
[18]束定芳,莊智象.現(xiàn)代外語教學(xué)——理論、實踐與方法[M].上海:上海外語教育出版社,1996.
[19]王初明.外語學(xué)習(xí)的必要條件與大學(xué)英語四、六級考試改革的反思[J].中國大學(xué)教學(xué),2006,(11):48-51.
[20]肖云南,羅曉英.關(guān)于英語測試的改革[J].外語教學(xué)與研究,2002,(4):294-299.
[21]葉菊仙.大學(xué)英語考試對教學(xué)反撥作用的調(diào)查和思考[J].外語界,1998,(3):40-43.