呂生祿
(西安外國語大學(xué) 學(xué)報編輯部,陜西 西安 710061)
英語科目進(jìn)入高考考查范圍已有半個多世紀(jì),自1977年恢復(fù)高考以來,高考英語測試歷經(jīng)四十年的改革與發(fā)展,在命題立意、測試目標(biāo)、考試內(nèi)容和考試形式上出現(xiàn)多次調(diào)整,成就不容贅述,我們必須承認(rèn)高考英語在高校招生錄取以及專業(yè)外語人才選拔中的貢獻(xiàn)。新課程改革實施多年,我國基礎(chǔ)教育階段英語教學(xué)理念有了很大變化,但從測試實踐來看,考試的內(nèi)容和方式并沒有實質(zhì)性的改變,依然未擺脫傳統(tǒng)的觀念。高考英語的發(fā)展史可以說是一部題型衍變的編年史。某時期某一題型的使用總會反映人們對語言、語言學(xué)習(xí)、心理測量、教育心理等理論的當(dāng)下認(rèn)識,認(rèn)識的變遷通常帶來題型的更替。[1]本文基于語言測試的學(xué)理,對1978-2017年全國高考英語試題從測試目標(biāo)和內(nèi)容、測試形式、測試題型及測試任務(wù)等方面進(jìn)行分析,呈現(xiàn)我國高考英語測試的發(fā)展特征,探究試題背后的測試?yán)砟詈蛯嶋H效用,并從考試性質(zhì)、測試目標(biāo)、測試任務(wù)、質(zhì)量評價、考試的專業(yè)性以及測試工作者的測評素養(yǎng)等方面,提出高考英語測試體系的優(yōu)化思路與建議。
多年來,我國高考英語改革一直在解決“考什么”“怎么考”以及“考試效果如何”的問題,也就是測試的內(nèi)容、形式和有效性,它們處在人們接受高考英語科目的最前沿,也是改革的重點和難點。恢復(fù)高考至今,高考英語走過了從逐步恢復(fù)、探索改革到不斷完善的發(fā)展歷程,從宏觀上大致分為兩個時期:經(jīng)驗期(1977-1984年)和標(biāo)準(zhǔn)化時期(1985年至今)。受條件所限,經(jīng)驗期的高考英語在測試?yán)碚搼?yīng)用、命題的科學(xué)性以及考試結(jié)果的解釋與使用等方面經(jīng)驗不足。1985年引進(jìn)標(biāo)準(zhǔn)化考試后,高考英語從理論研究、試題編寫、試題使用、效度驗證,到新測試?yán)碚摵头椒ǖ膰L試等,努力追求科學(xué)化和標(biāo)準(zhǔn)化?;诟呖加⒄Z的測試重點和題型特點,我們又將這一時期高考英語的發(fā)展劃分為四個時期:探索期(1985-1988年)、推廣期(1989-1993年)、發(fā)展期(1994-2000年)和分省命題期(2001-2017年)。1977年高考英語恢復(fù)初期,各地分省命題,試卷結(jié)構(gòu)各有不同,不便統(tǒng)計。通過梳理1978-2017年的考卷,我們發(fā)現(xiàn)高考英語測試的發(fā)展呈現(xiàn)以下特點:
第一,從測試的目標(biāo)和內(nèi)容上看,高考英語的測試重點雖在不斷調(diào)整,但仍偏重離散性語言知識和語言形式的考查,忽視基于篇章的綜合語言運用能力的考查。高考英語經(jīng)驗化時期和標(biāo)準(zhǔn)化考試探索期(1978-1988年),受結(jié)構(gòu)主義語言學(xué)的影響,“把語言看作一套知識,是這個時期外語教學(xué)和測試體系的語言觀的內(nèi)涵”[2],測試中分析法占主流,重詞句和語法識記,輕語篇分析,對語音、詞匯、語法等孤立離散性知識(Isolated and Discrete Points)的考查比重較大(見表1)。
表1 1978-1988年全國高考英語試卷結(jié)構(gòu)一覽 單位:分值
進(jìn)入標(biāo)準(zhǔn)化考試階段(1989年至今),高考英語一直秉承“在考查語言知識的基礎(chǔ)上,注重考查語言應(yīng)用能力”的原則,考試內(nèi)容雖有所變化,但從歷年考卷來看,仍在重復(fù)結(jié)構(gòu)主義的測試模式,因為結(jié)構(gòu)主義語言測試學(xué)派認(rèn)為,語言測試只要考了語言要素和語言技能就有了內(nèi)容效度。整體來說,我國高考英語的改革借鑒了世界語言測試的發(fā)展模式,但仍停留在結(jié)構(gòu)主義語言測試階段,離交際語用測試和基于任務(wù)的測試模式有明顯差距,不符合現(xiàn)代語言測試的發(fā)展方向(見表2)。
表2 1989-2017年高考英語試題結(jié)構(gòu)一覽 單位:分值
第二,從測試的形式看,隨著測試重點的變化,高考英語的題型也隨之發(fā)生更替,但以分離式、客觀類選擇題為主,很少涉及綜合性、主觀類題型。高考恢復(fù)初期和標(biāo)準(zhǔn)化考試探索期(1977-1988年),測試題型、試題分量以及難易度均不穩(wěn)定,除單項選擇和閱讀理解這兩種題型延續(xù)使用,其他題型逐年均有更替,試題以離散性語法分析題為主,多項選擇題成為主流題型。1989年標(biāo)準(zhǔn)化考試全面推開,書面表達(dá)(1988年)、短文改錯(1994年)、補(bǔ)全對話(1996年)、單詞拼寫(1996年)、聽力理解(2001年)等題型分別進(jìn)入高考測試范圍。2001年教育部推出高考英語全國卷I,2002年起逐步實行部分省市自主命題,但試題結(jié)構(gòu)主要以全國卷I為框架,多數(shù)省份只在閱讀理解和書面表達(dá)部分做微調(diào),取消補(bǔ)全對話、短文改錯或單詞拼寫,代之以新的題型,而未獲自主命題權(quán)的省份大多采用全國卷和新課標(biāo)卷(見表3)。
表3 2000-2017年各省份高考英語試卷新題型
從總體來看,試卷的主客觀比例在不斷變化,分離式測試和綜合技能測試一并出現(xiàn),但以客觀選擇類題目為主。以2015年全國大綱卷為例,全卷150分,共86個題目,其中,選擇性題目有75個,共計115分,占全卷77%;而非選擇性題目僅11個(短文改錯題10個和寫作題目1個),僅35分,占全卷23%。這些客觀類題目基本以考查孤立語言點為主,偏重對考生語言形式領(lǐng)會能力的考核,對綜合語言能力的考查很有限。
第三,從測試題目和任務(wù)特點來看,高考英語開始重視綜合測試法,先后出現(xiàn)動詞填空、完型填空、閱讀理解、英譯漢、短文改錯以及書面表達(dá)等基于語篇的試題,但從考點來說,離散型語言知識題較多,題目仍偏重詞匯和句子的質(zhì)量,強(qiáng)調(diào)語言的準(zhǔn)確性,多涉及發(fā)音、拼寫、構(gòu)詞特征、句法特征、語義特征、搭配等分析性成分。新課程改革后的高考英語,雖力求考查考生在真實語境中對語言的靈活運用能力,但考查面較小,測試任務(wù)的真實性和綜合性仍然有限。
第四,從試卷的結(jié)構(gòu)來看,自1985年起,高考英語試題結(jié)構(gòu)變化較大,1994年總分增加到150分后,試卷框架包括題型、分值、題量等沿用至今,發(fā)展到“分省命題、一綱多卷”的格局。1994-2000年,試卷結(jié)構(gòu)基本穩(wěn)定;2001年高考英語增加聽力測試,加之部分省份自主命題,試卷版本較多。根據(jù)題型、分值以及題量的變化特征,我們將2001-2015年高考英語全國卷歸類為5個版本(見表2之“卷1-5”)。(1)卷1:2001年全國卷;(2)卷2:2001年和 2003年全國卷、2004年全國卷(I,II,III)、2005年全國卷(I,II)、2006-2012年全國卷I、2003年全國大綱卷;(3)卷3:2005年全國卷III、2006-2012年全國卷II;(4)卷4:2013-2017年新課標(biāo)卷I;(5)卷5:2013-2017年新課標(biāo)卷II,滿分120分,聽力測試未列入。自主命題省份的試卷結(jié)構(gòu)基本采用全國卷模式,主要在閱讀理解和寫作部分增加或替換了個別題型,所占比重較?。?0-20分不等)。以聽力考試為例,近年全國高考英語聽力測試共有三種模式:(1)聽力缺考卷,如全國卷II、陜西卷和四川卷;(2)獨立命題卷,如全國卷I、北京、上海、天津、重慶、廣東、湖南、湖北,其中,廣東卷和天津卷聽力和筆試分期進(jìn)行;(3)嫁接合成卷,如新課標(biāo)全國卷、遼寧、江蘇、江西、安徽、福建、山東等版本聽力,采用全國卷I的聽力材料,浙江和云南采用PETS(二級)的聽力材料,且與筆試分期進(jìn)行??梢?,各省份在聽力考試的設(shè)計上差異較大。
高考英語在發(fā)揮其高校選拔和基礎(chǔ)英語教學(xué)導(dǎo)向功能的同時,因歷史因素等造成的不足也愈發(fā)凸顯,高考英語費時低效已成不爭之實,社會對高考英語的改進(jìn)訴求日益增多。可要改革就得拿出科學(xué)、可操作的優(yōu)化方案。高考英語改革的影響面較大,關(guān)乎考生前途,對高校、中學(xué)、教師乃至與其利益相關(guān)者影響深遠(yuǎn),因此改革必須從教育的本質(zhì)性、英語的學(xué)科性、測量的技術(shù)性、考試的社會性、高校的需求性、考生的發(fā)展性等方面來考慮。
高考英語改革是一個龐大的系統(tǒng)工程,首先對高考英語考試的性質(zhì)要有明晰的認(rèn)識。我國高考英語考試到底是水平考試、課程考試還是選拔性考試?從我國高校招生政策文件可以看出,高考英語考試屬于高校選拔性考試,那么考試設(shè)計就應(yīng)該是基于高校學(xué)業(yè)需求的。從高考英語考試現(xiàn)狀來看,高考英語考試主要以《高中英語課程標(biāo)準(zhǔn)》[3](下稱《課標(biāo)》)規(guī)定的內(nèi)容為命題依據(jù),從這一點來說則屬于基于課程內(nèi)容的高中英語課程考試。如果說高考英語屬于英語水平考試,那就應(yīng)該以英語語言能力標(biāo)準(zhǔn)為依據(jù),可是我國并沒有統(tǒng)一的英語能力標(biāo)準(zhǔn)。綜合來看,我國高考英語考試屬于高校選拔性考試,那么高考英語的考試設(shè)計就要考慮到高校的學(xué)業(yè)需求。本文建議構(gòu)建適合我國中小學(xué)教學(xué)學(xué)情和高校選才多元化需求的《NMET測評框架》(National Matriculation English Test,全國普通高等學(xué)校招生統(tǒng)一考試英語試題),是完善我國招生考試制度的戰(zhàn)略涵需。我們應(yīng)根據(jù)我國高考的獨特實踐,基于高校選才和學(xué)業(yè)發(fā)展進(jìn)行需求分析,并借鑒先進(jìn)的教育測量學(xué)和語言測試學(xué)理論,運用科學(xué)的效度檢驗和質(zhì)量論證方法,從測試目標(biāo)和測試內(nèi)容的重構(gòu)、測試任務(wù)的確定和任務(wù)參數(shù)描述,到測試任務(wù)的效度檢驗,再到考試結(jié)果解釋模型的構(gòu)建,制定一個能夠指導(dǎo)高考英語測試的開發(fā)、操作和質(zhì)量評價的《NMET測評框架》,構(gòu)建一個全方位的高考英語測試體系。
我國高考英語采用的是入圍封閉式命題模式,命題者根據(jù)《課標(biāo)》,結(jié)合當(dāng)年《考試說明》,依靠已有經(jīng)驗命題,課標(biāo)的教學(xué)目標(biāo)比考試的目標(biāo)和內(nèi)容要更寬泛,這就需要在考試內(nèi)容開發(fā)時對課標(biāo)的內(nèi)容進(jìn)行解析,形成作為考試的測量目標(biāo)和行為目標(biāo)??墒菑奈覈鴼v年公布的考試文件看,對測試目標(biāo)和行為目標(biāo)的界定與表述還存在不足,或者說混淆了二者。為了增加主觀題的分量,強(qiáng)化能力性測試,一些省份增加翻譯測試,可是翻譯能力和語言能力是否是一回事?這都需要在設(shè)置考試目標(biāo)時加以界定和說明。還有,如果說閱讀和寫作是在學(xué)生掌握詞匯、語法等基礎(chǔ)性知識的前提下進(jìn)行全面考查,為何還要單獨考查語法、詞匯等零散性知識?再者,新課標(biāo)強(qiáng)調(diào)對考生綜合語言運用能力的培養(yǎng)和考查,但是聽、說、讀、寫等語言技能的分模塊考查以及對分技能成績的計量相加,不足以體現(xiàn)考生的綜合語言運用能力。因此說,高考英語不僅要評價學(xué)生“認(rèn)知類”的學(xué)習(xí)成果,更應(yīng)關(guān)注其“行為類”和“實踐類”的學(xué)習(xí)成果。
目前,我國現(xiàn)行的英語課程標(biāo)準(zhǔn),存在明顯不足,主要表現(xiàn)在:其一,內(nèi)容標(biāo)準(zhǔn)中的認(rèn)知要求表述不明確;其二,缺失對表現(xiàn)水平標(biāo)準(zhǔn)的表述。一線教師對語言能力到底是什么、如何培養(yǎng)這些能力以及怎樣衡量和評價這些能力等缺乏明確的認(rèn)識和深刻理解,進(jìn)而在具體的操作上找不到抓手,可以說普遍缺乏必要的英語學(xué)科素養(yǎng)和測評素養(yǎng)。新修訂的高中英語課程標(biāo)準(zhǔn)將“核心素養(yǎng)”列為主要培養(yǎng)目標(biāo),那么對這些目標(biāo)的評價和考量以及在高考中如何體現(xiàn),都是在設(shè)定高考英語測試目標(biāo)時重點考慮的問題。高考英語測試目標(biāo)的設(shè)置,既要考慮到語言能力框架對外語能力的定義,也要參照教育目標(biāo)分類學(xué)對教育目標(biāo)認(rèn)知各層次的基本要求,還應(yīng)基于新課標(biāo)對“核心素養(yǎng)”的界定和內(nèi)容要素,根據(jù)高校對外語人才的選拔需求,通盤考慮和全面界定。
通過比對歷年高考英語試卷的內(nèi)容結(jié)構(gòu),不難發(fā)現(xiàn),現(xiàn)行高考英語試題缺少具體的英語能力框架作為命題的依據(jù),題型陳舊,仍偏重語言知識層面的考查。希望新修訂的《課標(biāo)》,能對測試內(nèi)容和目標(biāo)進(jìn)一步細(xì)化,對目標(biāo)做到具體化以便分層落實,同時也便于英語測試相關(guān)人員的全面理解和具體操作。但我們首先要避免其內(nèi)容的模糊性,不能留有不該有的闡釋空間。因此,與其說上述問題是我國高考英語測試目標(biāo)的執(zhí)行和操作層面出現(xiàn)的問題,還不如說是標(biāo)準(zhǔn)和大綱本身的模糊性和不嚴(yán)密性造成的后果。我們反觀美國的《州共同核心標(biāo)準(zhǔn)》,明確提出以College and Career Readiness“為大學(xué)學(xué)習(xí)和職業(yè)生涯做準(zhǔn)備”作為高中教育目標(biāo)。課標(biāo)和大綱除了規(guī)定測試的目標(biāo)以外,每一個一級指標(biāo)下面還對應(yīng)有更詳細(xì)的二級、三級指標(biāo)。這些成功經(jīng)驗都可為我國高考英語測試目標(biāo)的設(shè)置提供借鑒之處。
明確了高考英語的測試目標(biāo)和測試內(nèi)容,就要考慮測試的途徑和形式,也就是測試題型的選擇和測試任務(wù)的設(shè)計。在題型開發(fā)、語料選取和任務(wù)設(shè)計時,我們考慮語言在實際使用過程中表現(xiàn)出來的交際性、互動性、真實性和綜合性,即題型的實用性要強(qiáng),語料的真實性要高,測試任務(wù)要盡量基于需求又貼近學(xué)習(xí)和工作實際,盡量保證測試內(nèi)容效度。首先,根據(jù)語言使用的特點,注重測試任務(wù)設(shè)計的綜合性。我們可以將語言測試任務(wù)劃分為聽、說、讀、寫四個模塊,其中聽說考試和讀寫考試分開進(jìn)行。在題型設(shè)計和任務(wù)開發(fā)時,可以考慮采用綜合型測試任務(wù),如聽后說、讀后寫、聽和讀后再寫等,其主要特點是語言技能的綜合運用,注重考生在篇章層次上對聽說讀寫等技能和認(rèn)知策略的綜合運用能力,對語言輸入和輸出綜合考查;其次,注重測試任務(wù)的交互性。以讀寫結(jié)合測試任務(wù)為例,該類型測試任務(wù)中閱讀文本是考生參與討論和解釋的觀點源,在讀和寫的過程,考生和原作者共同參與了意義的協(xié)商和生成。聽說考試任務(wù)的設(shè)計,應(yīng)最大限度地考慮考生在任務(wù)完成時體現(xiàn)出的交互性;還有,測試任務(wù)的設(shè)計要有針對性,應(yīng)能滿足考生進(jìn)入大學(xué)后的學(xué)業(yè)需要。學(xué)術(shù)英語(Academic English Language)是高中畢業(yè)生必須重視的提升語言能力的核心專業(yè)素養(yǎng),是學(xué)習(xí)學(xué)科內(nèi)容的語言媒介,具有一定的專門性和針對性。高中階段的英語教學(xué)和學(xué)習(xí)必須重視對學(xué)術(shù)語言能力的培養(yǎng),同時高考英語測試任務(wù)的設(shè)計也應(yīng)充分考慮到學(xué)生未來的學(xué)業(yè)發(fā)展需求。
效度是判斷考試整體質(zhì)量及其有用性的重要指標(biāo)。效度是一個有效程度問題,也是一個實證問題,它需要經(jīng)過反復(fù)試測、修改以及定期的系統(tǒng)論證。一項考試,尤其是大規(guī)??荚?,如果不進(jìn)行嚴(yán)格的效度驗證,則難以重復(fù)使用與推廣。越是高水平考試,越要對考試的技術(shù)和使用方面進(jìn)行評價,對考試效度驗證的要求也就越高。[4]高考英語測試屬于大規(guī)模英語測試,要確保其效度,既要做好考后的數(shù)據(jù)解釋和驗證,還要做好考試設(shè)計的縝密規(guī)劃和論證?;谧C據(jù)(Evidence-Based)和社會認(rèn)知的效驗方法[5]、基于論證(Argument-Based)的效驗?zāi)J絒6][7]以及測試使用論證模式 AUA(Assessment Use Aargument)[8][9],可為開展高考英語測試效度論證提供范式,本文建議采用“效果驅(qū)動—證據(jù)支撐”的論證模式,借鑒AUA框架從設(shè)計論證和考后評價兩個方面,構(gòu)建高考英語測試的效度論證框架,探索適合我國高考英語考試實踐的解釋性論證文本,論證結(jié)果有利于高考英語測試任務(wù)優(yōu)化、機(jī)考環(huán)境建設(shè)、評分標(biāo)準(zhǔn)研制和評分員培訓(xùn),可為優(yōu)化高考英語測試改革和后續(xù)研究提供參考。
優(yōu)化高考英語測試模式,做好頂層設(shè)計,需要命題工作者具備較高的測評素養(yǎng)。有研究表明[10],教師要花費三分之一甚至一半的專業(yè)時間用于與考試評價相關(guān)的活動。新一輪基礎(chǔ)英語教育改革和高考英語改革能否起到實效,離不開廣大英語工作者及英語教師測評素養(yǎng)的提升。語言測試是個專業(yè)性極強(qiáng)的工作,因此語言測試工作者必須明了所肩負(fù)的社會責(zé)任,盡最大的努力,保證考試的科學(xué)性、客觀性和公正性。[11]全國部分省份雖成立了地方教育考試研究院,但仍有好多省份負(fù)責(zé)考試研發(fā)的機(jī)構(gòu)是招生辦公室,這些機(jī)構(gòu)在測評方面的專業(yè)性問題值得思考。許多英語教師甚至英語考試工作者,“缺乏對考試的理論認(rèn)識,對考試的類型、功能以及考試信息的使用認(rèn)識模糊不清,造成普遍存在的對考試結(jié)果誤用”[12]。測評工作者不能只是外語測評工作的“技術(shù)員”(Technician),而要成為測評的“工程師”(Engineer),做到“考試目標(biāo)具體化、考試說明標(biāo)準(zhǔn)化、試題設(shè)計科學(xué)化、考務(wù)工作規(guī)范化、評分環(huán)節(jié)合理化、后效研究長效化”[13]。對于高考英語而言,應(yīng)規(guī)范高考英語的開發(fā)主體,以英語學(xué)科和語言測試學(xué)方面的專家為核心,也可以邀請教育和心理測量學(xué)專家,共同參與高考英語考試設(shè)計和開發(fā)過程,同時要考慮到高考英語改革目標(biāo)和考試技術(shù)的相容性(Technical Compatibility),在考后試題質(zhì)量評價、試題等值處理和跨年份、跨地區(qū)試題數(shù)據(jù)庫的建立等方面及時跟進(jìn)。
高考英語發(fā)展至今,從英語科目在高考中的地位,到測試目標(biāo)的設(shè)置調(diào)整,再到考試形式以及考試成績權(quán)重的變化等,都在不同時期發(fā)生變化,在盡可能反映不同時期的教育思想、教學(xué)理念、測評觀念以及學(xué)科先進(jìn)理論和方法。作為高校選拔合適外語人才的一個主要參考指標(biāo),我們都知道高考英語十分有必要對學(xué)生語言能力進(jìn)行系統(tǒng)、全面考查的考試方式,應(yīng)根據(jù)學(xué)生發(fā)展特點和認(rèn)知規(guī)律,體現(xiàn)以學(xué)生的發(fā)展為出發(fā)點和落腳點,不能再走“新瓶裝舊酒”的老路,看似從試卷結(jié)構(gòu)、題型、分值、素材等方面有了不少改進(jìn)和創(chuàng)新,但是考查的內(nèi)容仍停留在過去的認(rèn)識上。正如謝小慶[14]所言,對于高考改革,“優(yōu)化機(jī)制”比“最佳方案”更重要。許國璋先生在高考恢復(fù)初期就撰文指出,要把“培養(yǎng)各行各業(yè)既懂專業(yè)又懂外語的科學(xué)文化大軍擔(dān)當(dāng)起來,在未來的五年內(nèi),做到在重點大學(xué)內(nèi)學(xué)生入學(xué)時的外語水平就能看專業(yè)外語書刊,在畢業(yè)時做到讀聽說寫俱會,真正能夠使用外語作為研究與國際交流的工具”[15]。四十年過去了,從當(dāng)下高校外語人才培養(yǎng)現(xiàn)狀來看,許老的愿望并未完全實現(xiàn)。因此,我國高考英語改革應(yīng)體現(xiàn)“用戶意志”,樹立“考以致用”的觀念,注重考試的有效性,為考試引入優(yōu)化機(jī)制,使那些能激發(fā)學(xué)生興趣、高質(zhì)量的考試得到鼓勵。當(dāng)下,中國外語教育發(fā)展進(jìn)入新時代,重構(gòu)高考英語的考試?yán)砟睢⒖荚噧?nèi)容和考試形式,是非常必要的,也具備現(xiàn)實可能性,不能只是增加考試次數(shù)、改變分值權(quán)重、調(diào)整試卷結(jié)構(gòu)或是重新劃分命題歸屬權(quán),而應(yīng)理性審視高考英語測試高校人才選拔的性質(zhì),基于“核心素養(yǎng)”理念和高校外語人才專業(yè)導(dǎo)向需求科學(xué)設(shè)置高考英語測試目標(biāo)和內(nèi)容,采用聽說、讀寫、聽寫、讀說等技能綜合型方式設(shè)計考試任務(wù)和優(yōu)化測試題型,注重考后的效度論證和動態(tài)質(zhì)量監(jiān)控,切實為基礎(chǔ)和高等英語教育提供有價值的反饋信息和正面反撥作用,真正發(fā)揮其高校人才選拔的甄別效用和激發(fā)學(xué)習(xí)者學(xué)習(xí)興趣的促學(xué)功能。
[1]王初明,亓魯霞.讀后續(xù)寫題型研究[J].外語教學(xué)與研究,2013,(5):707-718.
[2]劉潤清,韓寶成.語言測試和它的方法[M].北京:外語教學(xué)與研究出版社,2000.
[3]教育部.普通高級中學(xué)英語課程標(biāo)準(zhǔn)(實驗)[M].北京:北京師范大學(xué)出版社,2003.
[4]Hamilton,L.S.,Brain,M.S.&Klein,S.P.Making Sense of Test-Based Accountability in Education[M].Pittsburgh:RND,2002.
[5]Weir,C.Language Testing and Validation:An Evidence-Based Approach[M].Beijing:Foreign Language Teaching and Research Press,2004.
[6]Kane,M.T.Validating high-stakes testing programs[J].Educational Measurement:Issues and Practices,2002,(1):31-41.
[7]Messick,S.Validation of psychological assessment:validation of inferences from person’s responses and performance as scientific inquiry into scoring meaning[J].American Psychologist,1995,(9):741-749.
[8]Bachman,L.F.Building and supporting a case for test use[J].Language Assessment Quarterly,2005,(1):1-34.
[9]Bachman,L.F.&Palmer,A.S.Language Assessment in Practice:Development Language Assessments and Justifying their Use in the Real World[M].Oxford,England:Oxford University Press,2010.
[10]Stiggins,R.J.Relevant classroom assessment training for teachers[J].Educational Measurement:Issues and Practice,1991,(1):7-12.
[11]楊惠中.語言測試與語言教學(xué)[J].外語界,1991,(1):16-25.
[12]周群,雷新勇.從單純考試向全面評價發(fā)展——考試機(jī)構(gòu)應(yīng)對新課程改革的必然選擇[J].上海教育科研,2008,(1):29-32.
[13]呂生祿.中國外語能力測評體系建設(shè)的實現(xiàn)路徑與思考[J].全球教育展望,2005,(8):114-122.
[14]謝小慶.高考改革:“機(jī)制”比“方案”更重要[N].中國青年報,2006-04-18.
[15]許國璋.談?wù)勑滦蝿菹峦庹Z教學(xué)的方針[J].人民教育,1978,(10):21-25.