亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對(duì)我國新高考方案高中學(xué)業(yè)水平考試的思考與政策建議——浙江、上海2014年高考改革學(xué)業(yè)水平考試方案商榷

        2015-07-06 00:36:46陶百強(qiáng)
        中國考試 2015年8期
        關(guān)鍵詞:標(biāo)準(zhǔn)改革

        陶百強(qiáng)

        1 引言

        2014年9 月,國務(wù)院以國發(fā)[2014]35號(hào)文件頒布《關(guān)于深化考試招生制度改革的實(shí)施意見》,最新一輪高考改革啟動(dòng),浙江省和上海市2014年啟動(dòng)高考綜合改革試點(diǎn),兩地相繼出臺(tái)高考綜合改革試點(diǎn)方案。

        既然是試點(diǎn),就應(yīng)廣開言路,允許爭論,博采眾謀。《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》在研制過程中也曾深入調(diào)研、廣納民意。提出商榷的目的絕非反對(duì)改革,而是讓改革更趨理性。中共中央總書記、國家主席、中央軍委主席、中央全面深化改革領(lǐng)導(dǎo)小組組長習(xí)近平2014年1月22日下午主持召開中央全面深化改革領(lǐng)導(dǎo)小組第一次會(huì)議并發(fā)表重要講話時(shí)指示“對(duì)改革進(jìn)程中已經(jīng)出現(xiàn)和可能出現(xiàn)的問題……既敢于出招又善于應(yīng)招,做到‘蹄疾而步穩(wěn)’”。[1]雖高考改革是高度復(fù)雜的改革項(xiàng)目,難以兼顧每個(gè)方面而必然是折中產(chǎn)物,但因高考改革對(duì)整個(gè)國民教育系統(tǒng)(含基礎(chǔ)教育和高等教育)影響周期長、影響面廣,高考改革是我國教育改革中至關(guān)重要的改革項(xiàng)目,故高考改革更應(yīng)“蹄疾而步穩(wěn)”,因“高考關(guān)系到千百萬青年學(xué)子的前途和千家萬戶的切身利益,關(guān)系到高等教育的質(zhì)量和基礎(chǔ)教育的改革,承載著廣大學(xué)生、家長和教師的期望,承載著維護(hù)社會(huì)公平和社會(huì)穩(wěn)定的重任,承載著太多的社會(huì)輿論壓力”。[2]

        教育部部長袁貴仁2015年3月7日參加全國政協(xié)教育界聯(lián)組討論會(huì)時(shí)表示“對(duì)于(考試招生制度)改革不可能一蹴而就,出現(xiàn)不同意見有助于方案改進(jìn),全社會(huì)共同關(guān)注會(huì)推進(jìn)改革落實(shí)”。[3]

        本文主要針對(duì)浙江、上海高考試點(diǎn)方案中的學(xué)業(yè)水平考試(下文可簡稱學(xué)考)制度進(jìn)行探討。

        2 探討的意義

        盡管任何改革方案都不可能盡善盡美,但盡量減少改革負(fù)面效應(yīng),在改革方案實(shí)施過程中,仍有必要從理論和實(shí)踐出發(fā)進(jìn)行不斷修正完善,使改革收益最大化。教育領(lǐng)域的改革如高考改革,具有改革周期長,對(duì)整個(gè)國民教育具有反撥作用,以及背負(fù)樹人興國之重任,教育改革的負(fù)面影響不可逆轉(zhuǎn),這些特殊性導(dǎo)致高考改革方案盡量完善,從前瞻性和系統(tǒng)思維角度出發(fā)以盡量避免可能出現(xiàn)的問題。

        2.1 扭轉(zhuǎn)傳統(tǒng)學(xué)考的弊端

        《教育部關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見》對(duì)學(xué)考進(jìn)行強(qiáng)調(diào),且被納入高校招生原則兩依據(jù)之一。[4]由于制度設(shè)計(jì)的原因,原來的學(xué)考普遍不受重視,甚至舞弊叢生,重要性和口碑遠(yuǎn)低于高考統(tǒng)一考試,新一輪改革方案應(yīng)竭力避免重蹈傳統(tǒng)學(xué)考名存實(shí)亡的命運(yùn)。

        2.2 引導(dǎo)示范作用

        試點(diǎn)省市高考改革方案嚴(yán)謹(jǐn)科學(xué)對(duì)后續(xù)改革省份具有示范作用,《國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》要求“2014年上海市、浙江省分別出臺(tái)高考綜合改革試點(diǎn)方案,從2014年秋季新入學(xué)的高中一年級(jí)學(xué)生開始實(shí)施。試點(diǎn)要為其他?。▍^(qū)、市)高考改革提供依據(jù)。”[5]試點(diǎn)省份的方案會(huì)被后續(xù)跟進(jìn)高考綜合改革的省市區(qū)借鑒,甚至被直接移植以減少?zèng)Q策風(fēng)險(xiǎn)。

        教育部官網(wǎng)公布了2015年40項(xiàng)工作要點(diǎn):教育部還表示將深入推進(jìn)考試招生制度改革。指導(dǎo)督促各省(區(qū)、市)和有關(guān)高校研究制訂考試招生制度改革實(shí)施方案,指導(dǎo)上海、浙江做好高考綜合改革試點(diǎn)。[6]教育部部長袁貴仁在2015年全國教育工作會(huì)議上要求“各地都要制訂改革方案,按照國務(wù)院和教育部等有關(guān)要求,明確改革的內(nèi)容、目標(biāo)、措施和時(shí)間表,經(jīng)省委省政府同意后于2015年6月30日前報(bào)教育部備案”,[7]故試點(diǎn)省份的改革方案和經(jīng)驗(yàn)將為后續(xù)改革省份提供寶貴參考。

        綜合來看,上海的學(xué)考方案某些方面似更妥,雖也有一些值得商榷之處,如除了英語國家方案明確要求給予考生兩次考試機(jī)會(huì)外,其他科目暫未給予多次考試機(jī)會(huì),“一年提供兩次機(jī)會(huì),每個(gè)學(xué)生可參加兩次考試,有利于弱化一次考試偶然性因素的影響,同時(shí)有利于分散緩解考生的考試壓力”[8]此外,等級(jí)考中理想化的原始成績分布預(yù)期是對(duì)命題工作的挑戰(zhàn)。

        3 對(duì)學(xué)考方案的思考

        3.1 學(xué)考的定義與分?jǐn)?shù)解釋

        3.1.1 學(xué)考的定義

        中文的學(xué)業(yè)水平測試來源于英文中的achievement test,也被譯為學(xué)業(yè)成績測驗(yàn),指測量學(xué)生學(xué)習(xí)效果的測驗(yàn),可為評(píng)價(jià)學(xué)生的學(xué)習(xí)效果提供反饋,為診斷學(xué)習(xí)困難提供幫助,對(duì)于教師調(diào)整教學(xué)目標(biāo)與改進(jìn)教學(xué)均有重要作用,一般分為標(biāo)準(zhǔn)化測驗(yàn)與教師自編測驗(yàn);[9:286]或被譯為成就測驗(yàn),旨在測量個(gè)人在接受教育后的學(xué)業(yè)成就,含學(xué)科成就測驗(yàn),測量受教育者在某一科目上的學(xué)習(xí)成就;以及綜合成就測驗(yàn),測量受教育者在各學(xué)科上的綜合學(xué)業(yè)成就。[10:12]此外,還被譯為學(xué)業(yè)測驗(yàn)、學(xué)績測驗(yàn)等。

        國外學(xué)界對(duì)學(xué)考多從測試命題范圍或目的進(jìn)行定義,如學(xué)考用來測量預(yù)定內(nèi)容范圍的學(xué)習(xí)程度,[11:6]旨在測量取得的成績或測量某個(gè)學(xué)習(xí)階段后的學(xué)得程度(the degree of learning),可在國家、地區(qū)或本學(xué)區(qū)進(jìn)行標(biāo)準(zhǔn)化操作,或不進(jìn)行標(biāo)準(zhǔn)化處理,[12]學(xué)考必然基于課程標(biāo)準(zhǔn)評(píng)估課標(biāo)學(xué)習(xí)目標(biāo)是否達(dá)到(Bailey,1998;Brown,2004;Brown&Hudson,2002;Cheng,Watanabe&Curtis,2004;Hughes,2003;Weir,1990)。[13]學(xué)考測量的對(duì)象包括經(jīng)過學(xué)習(xí)或培訓(xùn)后是否掌握特定的知識(shí)、技能等。[14]學(xué)考命題者依據(jù)學(xué)科專家或政府制定的內(nèi)容標(biāo)準(zhǔn)(content standards)命題。[15]學(xué)考毫無疑問是必要的,用以評(píng)定學(xué)業(yè)等級(jí)或決定學(xué)生是否通過某門課程。[16:107]

        3.1.2 學(xué)考的分?jǐn)?shù)解釋

        從分?jǐn)?shù)解釋角度,測驗(yàn)多被分為常模參照測驗(yàn)和標(biāo)準(zhǔn)參照測驗(yàn)。隨著教育改革和人本主義思潮的發(fā)展,傳統(tǒng)的常模參照測驗(yàn)無法提供基于學(xué)習(xí)者學(xué)習(xí)內(nèi)容的測驗(yàn),無法為教學(xué)反饋和教學(xué)決策提供信息,基于教學(xué)標(biāo)準(zhǔn)的標(biāo)準(zhǔn)參照測驗(yàn)應(yīng)時(shí)而生……Cronbach(1970)認(rèn)為,“測試界過分重視建立在考生之間進(jìn)行比較的成績解釋(關(guān)注個(gè)體差異),而過分輕視標(biāo)準(zhǔn)參照測驗(yàn)”。[17]標(biāo)準(zhǔn)參照測驗(yàn)這一術(shù)語由Glaser&Klaus引入(Glaser&Klaus,1962),該理念廣受教育界歡迎,因其特別有益于形成性評(píng)估(Hambleton,Swaminathan,Algina&Coulson,1978),有時(shí)也被稱為目標(biāo)參照測驗(yàn)(objective-referenced),課標(biāo)導(dǎo)向測驗(yàn)(curriculum-oriented measurement)(Linn,1994)。[18]

        對(duì)于分?jǐn)?shù)解釋,國內(nèi)外學(xué)界傳統(tǒng)或習(xí)慣上采取二元分?jǐn)?shù)解釋,如標(biāo)準(zhǔn)參照和常模參照測驗(yàn)基于明顯不同的目的而進(jìn)行測驗(yàn)設(shè)計(jì)(Gronlund,1985)[19]“……測試設(shè)計(jì)為常模參照或標(biāo)準(zhǔn)參照測試”[12:235]。但是早在20世紀(jì)70年代就有學(xué)者認(rèn)為標(biāo)準(zhǔn)化水平測試成績可同時(shí)使用常模參照或標(biāo)準(zhǔn)參照解釋。[20]有學(xué)者持連續(xù)體觀點(diǎn),如圖1所示:

        圖1

        持連續(xù)體觀點(diǎn)者認(rèn)為,標(biāo)準(zhǔn)參照評(píng)估和常模參照評(píng)估最好被視為一個(gè)連續(xù)體的兩極,而非涇渭分明的二分法(clear-cut dichotomy)。如圖1所示,標(biāo)準(zhǔn)參照測驗(yàn)強(qiáng)調(diào)成績描述,常模參照測驗(yàn)強(qiáng)調(diào)區(qū)分考生;為了充分利用兩種評(píng)估的長處,測試開發(fā)方給常模參照測驗(yàn)增加描述性元素以融合常模參照和標(biāo)準(zhǔn)參照解釋;同理,將常模參照解釋元素增加到基于標(biāo)準(zhǔn)參照解釋的測驗(yàn)中,雙重解釋觀似呈上升趨勢,將許多測驗(yàn)引向上述連續(xù)體的中心,盡管此舉導(dǎo)致命題中的一些妥協(xié)以及成績解釋應(yīng)謹(jǐn)慎有加,但是測驗(yàn)的多用途有助于測驗(yàn)使用更加高效。[21:41]

        美國伊利諾伊大學(xué)教育心理學(xué)教授、世界著名語言測試專家Fred Davidson認(rèn)為,從歷史角度,標(biāo)準(zhǔn)參照測量路子從未達(dá)到其“早期承諾”,標(biāo)準(zhǔn)參照測驗(yàn)思想的主要貢獻(xiàn)是大大加強(qiáng)了分?jǐn)?shù)報(bào)告的詳細(xì)程度,常模參照測驗(yàn)思想仍然主導(dǎo)著大規(guī)模測試。[22]與常模參照思想相比,美國著名應(yīng)用語言學(xué)家Antony Kunnan個(gè)人更傾向于標(biāo)準(zhǔn)參照測驗(yàn)思想。[23]

        國內(nèi)也有研究者建議告別“標(biāo)準(zhǔn)參照測驗(yàn)”和“常模參照測驗(yàn)”二元?jiǎng)澐址ǎJ(rèn)為常模參照測驗(yàn)和標(biāo)準(zhǔn)參照測驗(yàn)非兩種對(duì)立測驗(yàn),二元?jiǎng)澐謱?dǎo)致很多誤解,如測驗(yàn)開發(fā)者可能會(huì)為了不同目的開發(fā)不同測驗(yàn),建立不同題庫,花費(fèi)更多人力、財(cái)力和時(shí)間。[24]

        美國中小學(xué)廣泛推行的標(biāo)準(zhǔn)化學(xué)考旨在測試學(xué)生在不同內(nèi)容和技能領(lǐng)域的學(xué)業(yè)水平,一般基于某州或地區(qū)制定的內(nèi)容標(biāo)準(zhǔn)命題,通常為常模參照測驗(yàn),將學(xué)生與參照組(如在同年級(jí)全國范圍取樣)的成績進(jìn)行比較。[21:387]雖然常模參照測驗(yàn)和標(biāo)準(zhǔn)參照測驗(yàn)有區(qū)別,但測試開發(fā)方常在同一測驗(yàn)中混合二者的某些元素,很多新開發(fā)的標(biāo)準(zhǔn)化水平測驗(yàn)提供常模參照和標(biāo)準(zhǔn)參照解釋,某些州定制的測驗(yàn)不僅報(bào)告預(yù)定的學(xué)業(yè)標(biāo)準(zhǔn),而且同時(shí)提供成績的常模參照解釋。[21:398]

        在我國考試實(shí)踐中,也有大規(guī)模測試采用雙重分?jǐn)?shù)解釋模式,如大學(xué)英語考試(CET)是一項(xiàng)大規(guī)模標(biāo)準(zhǔn)化考試,在設(shè)計(jì)上必須滿足教育測量理論對(duì)大規(guī)模標(biāo)準(zhǔn)化考試的質(zhì)量要求,是“標(biāo)準(zhǔn)關(guān)聯(lián)的常模參照測驗(yàn)”。[25]

        綜上所述,筆者建議將我國的學(xué)業(yè)水平考試定義為基于雙重分?jǐn)?shù)解釋的標(biāo)準(zhǔn)化學(xué)業(yè)水平考試,因教育部將學(xué)考分為兩類即不計(jì)入高考招錄的合格考科目學(xué)考以及計(jì)入高考招錄的選考科目學(xué)考,[4]故筆者建議宜將前者定位為基于雙重分?jǐn)?shù)解釋的常模相關(guān)—標(biāo)準(zhǔn)參照測驗(yàn),將后者定位為基于雙重分?jǐn)?shù)解釋的標(biāo)準(zhǔn)相關(guān)—常模參照測驗(yàn)。需要特別注意的是,“當(dāng)考試結(jié)果被使用到不同用途或進(jìn)行多種解釋時(shí),每一種預(yù)期解釋都必須進(jìn)行效度驗(yàn)證”,[26:9]效度指基于考試結(jié)果的解釋的合理性,并非指考試本身,效度驗(yàn)證與考試結(jié)果的解釋或用途相關(guān)。

        附:浙江學(xué)考制度簡述:“浙江實(shí)行高中學(xué)考和高考選考科目一考兩用、學(xué)生可以參加2次考試的結(jié)合方式。高中學(xué)考和高考選考科目一考兩用,同一科目設(shè)計(jì)2種試卷,同時(shí)在不同試場安排考試,一種為總分70分,只有必考題,用于評(píng)定學(xué)生的學(xué)考等級(jí),另一種為總分100分(70+30),其中70分的試題與前一種試卷完全相同,30分為加試題,根據(jù)學(xué)生在70分試題上的得分評(píng)定其學(xué)考等級(jí)(A、B、C、D、E5級(jí)),根據(jù)其在100分(70+30)試題上的得分評(píng)定其高考選考科目等級(jí)(21級(jí)),并賦分,每科計(jì)入高考總分的滿分值為100分,各科目每年安排2次考試,每個(gè)學(xué)生每個(gè)科目都有2次考試機(jī)會(huì),其中30分的加試題只能參加3個(gè)科目的考試”。[8]浙江省教育廳以浙教考[2014]129號(hào)文件序號(hào)發(fā)布的文件包含了兩個(gè)具體實(shí)施辦法,即《浙江省普通高中學(xué)業(yè)水平考試實(shí)施辦法》和《浙江省普通高校招生選考科目考試實(shí)施辦法》,從兩個(gè)文件的并列關(guān)系來推斷,浙江省不認(rèn)為學(xué)考和選考是性質(zhì)相同的考試;而上海市2015年2月15日發(fā)布的《上海市普通高中學(xué)業(yè)水平考試實(shí)施辦法》(征求意見稿)明確說明“高中學(xué)業(yè)水平考試包括合格性考試和等級(jí)性考試兩類”,此處理方式和國家學(xué)考指導(dǎo)文件相同。

        附:上海學(xué)考方案(征求意見稿):“上海實(shí)行高中學(xué)考合格性考試和等級(jí)性考試分兩次考試、學(xué)生各參加1次考試的辦法。把學(xué)考分為合格性考試和等級(jí)性考試,前者以“合格、不合格”呈現(xiàn),后者設(shè)A、B、C、D、E五等11級(jí),每科計(jì)入高考總分的滿分值為70分,學(xué)生須參加全部科目的合格性考試各1次,然后選擇參加3科等級(jí)性考試各1次”。[8]

        3.2 錢學(xué)森之問——學(xué)考制度設(shè)計(jì)應(yīng)為拔尖創(chuàng)新人才培養(yǎng)奠基

        錢學(xué)森之問“現(xiàn)在中國沒有完全發(fā)展起來,一個(gè)重要原因是沒有一所大學(xué)能夠按照培養(yǎng)科學(xué)技術(shù)發(fā)明創(chuàng)造人才的模式去辦學(xué)”,大學(xué)教育起核心作用,而基礎(chǔ)教育起奠基作用,但若高考改革后舉國師生仍基于漲分而非個(gè)人興趣而學(xué),談何興趣驅(qū)動(dòng)的創(chuàng)新人才涌現(xiàn)?

        人具有先天個(gè)體差異,偽木桶理論不宜體現(xiàn)到涉及人才培養(yǎng)大計(jì)的高考改革中,不能誘導(dǎo)或迫使學(xué)生不顧個(gè)體差異和興趣平均發(fā)展,制度制定與執(zhí)行應(yīng)鼓勵(lì)學(xué)生興趣、特長科目發(fā)展。招考改革應(yīng)尊重個(gè)性,讓考生發(fā)揮比較優(yōu)勢,而非盲目全面發(fā)展。美國著名教育工作者George Reavis在1940年寫了一則在世界廣為流傳經(jīng)久不衰的教育寓言故事《寓言學(xué)校》(The Animal School),[27]該寓言傳遞了一條公認(rèn)的重要信息:學(xué)生是獨(dú)特的個(gè)體和獨(dú)特的學(xué)習(xí)者,忽視這點(diǎn)的教育改革毋庸置疑將置學(xué)生于失敗結(jié)局。

        本文作者在《國家中長期教育改革和發(fā)展規(guī)劃綱要的10條建議》(獲教育部辦公廳和中國教育報(bào)舉辦“謀劃教育事業(yè)科學(xué)發(fā)展——我為綱要獻(xiàn)計(jì)獻(xiàn)策”征文二等獎(jiǎng))一文建議高考模式應(yīng)為“達(dá)標(biāo)+特長”(或“共同基礎(chǔ)+個(gè)性發(fā)展”)模式,達(dá)標(biāo)促使學(xué)生達(dá)到課標(biāo)基本要求,如文理分科取消問題可此框架解決,以有效避免嚴(yán)重偏科,達(dá)標(biāo)的保證機(jī)制是實(shí)施高中學(xué)業(yè)水平測試,其中的共同基礎(chǔ)采用標(biāo)準(zhǔn)參照性質(zhì)的學(xué)業(yè)水平處理,個(gè)性發(fā)展采用大學(xué)不同專業(yè)對(duì)科目不同要求,體現(xiàn)考生選擇權(quán)和學(xué)科興趣,以打破目前“模式化人才”的培養(yǎng)思路”。[28]

        本輪高考改革的國家指導(dǎo)文件《國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》[5]和《教育部關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見》[4]都明確提到“實(shí)施學(xué)業(yè)水平考試……避免嚴(yán)重偏科”,而非措辭“避免偏科”,其中的“嚴(yán)重”二字至關(guān)重要,對(duì)具體學(xué)考方案制定意義重大。

        《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》總體戰(zhàn)略提出,要“培養(yǎng)造就數(shù)以億計(jì)的高素質(zhì)勞動(dòng)者、數(shù)以千萬計(jì)的專門人才和一大批拔尖創(chuàng)新人才”。[29]美國在高中階段開設(shè)AP課程鼓勵(lì)學(xué)生先修大學(xué)專業(yè)課程,鼓勵(lì)學(xué)生根據(jù)個(gè)性發(fā)展優(yōu)勢學(xué)科,然而我國傳統(tǒng)高考各科“齊步走”弊端較多,不利于中學(xué)階段拔尖人才培養(yǎng),清華大學(xué)附中校長王殿軍對(duì)我國忽視中學(xué)階段拔尖人才培養(yǎng)也深感憂慮。[30]本輪高考改革國家改革方案設(shè)計(jì)最大的亮點(diǎn)之一就是體現(xiàn)以人為本,體現(xiàn)對(duì)公民個(gè)體選擇權(quán)的尊重,并為此提供招錄制度保障。若地方具體政策制定或執(zhí)行時(shí)出現(xiàn)偏差,可能有損國家意志之初衷,特別有損我國拔尖人才培養(yǎng)大計(jì)。

        對(duì)不計(jì)入高考招錄的非選考學(xué)考科目實(shí)行等第成績報(bào)告,必迫使考生緊盯每門學(xué)科以獲取更多更高等級(jí),以在錄取中獲取優(yōu)勢。學(xué)考等級(jí)在高校錄取中的“門檻要求”導(dǎo)致許多高考高分學(xué)生被剝奪了上理想大學(xué)的機(jī)會(huì),江蘇自2008年開始將學(xué)業(yè)水平測試成績與高校錄取“硬掛鉤”,不同類別高校在錄取時(shí)對(duì)學(xué)考等級(jí)設(shè)報(bào)考門檻,如曾被媒體廣泛報(bào)道的2008年南京高考文科狀元曾因?qū)W業(yè)水平測試兩門選修科目非雙A而失去報(bào)考北京大學(xué)的資格,最終只能被南京大學(xué)以破格形式錄取。[31]若考試方案提供了等級(jí)成績報(bào)告體系,高校招錄新生時(shí)可能要求考生獲取一定的合格性學(xué)考科目等級(jí),若完全不參考,則教育考試部門的等級(jí)成績報(bào)告也失去了任何意義。

        定位不當(dāng)剝奪了學(xué)生自由選擇權(quán)利,廣大學(xué)生被迫在每門學(xué)科進(jìn)行惡性競爭性考試,增加課業(yè)負(fù)擔(dān)和考試焦慮,且考試焦慮感滲透時(shí)間更長,高壓力感持續(xù)時(shí)間可能超原高考方案。若此顯然有違國家高考改革總體設(shè)計(jì)指導(dǎo)思想,有違以人為本的教育改革思想。

        科學(xué)合理的方案應(yīng)引導(dǎo)學(xué)生在不嚴(yán)重偏科的前提下,給學(xué)生偏科的自由,否則何以體現(xiàn)學(xué)生的自由選擇權(quán)?何以鼓勵(lì)學(xué)生發(fā)展自己的興趣和優(yōu)勢學(xué)科以打破我國長期以來基礎(chǔ)教育階段學(xué)生模具化培養(yǎng)之窠臼?

        3.3 學(xué)業(yè)水平考試的定位與功能

        《國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》規(guī)定“完善高中學(xué)業(yè)水平考試。學(xué)業(yè)水平考試主要檢驗(yàn)學(xué)生學(xué)習(xí)程度,是學(xué)生畢業(yè)和升學(xué)的重要依據(jù)”。[5]與“畢業(yè)”和“升學(xué)”相呼應(yīng),國家學(xué)考指導(dǎo)文件將學(xué)考分為兩類即不計(jì)入高考招錄的合格考科目學(xué)考以及計(jì)入高考招錄的選考科目學(xué)考,[4]故嚴(yán)格說來,國家學(xué)考方案實(shí)質(zhì)上囊括了兩類性質(zhì)不同的測試即上海高考試點(diǎn)方案細(xì)化出來的合格性考試和等級(jí)性考試,故國家學(xué)考方案稱呼的“學(xué)業(yè)水平考試”乃泛化概念,計(jì)入高校招生錄取總成績的學(xué)業(yè)水平考試3個(gè)科目成績以等級(jí)呈現(xiàn),其他科目一般以“合格、不合格”呈現(xiàn),其中的“一般”二字為浙江版高考試點(diǎn)的學(xué)考方案定位埋下了伏筆。國家學(xué)考方案中的“等級(jí)”計(jì)分的等級(jí)依據(jù),嚴(yán)格地說,應(yīng)指課標(biāo)約定的學(xué)業(yè)等級(jí),而非取決于考生群體賦級(jí),但浙江和上海學(xué)考方案都將考生的等級(jí)成績與考生群體掛鉤,故同一考生在相同科目不同考次獲得的相同等級(jí)缺乏可比性,這導(dǎo)致一科多考存在成績解釋疑義,嚴(yán)格來說,所謂的等級(jí)考試并非實(shí)質(zhì)上的等級(jí)考試,誠如浙江省教育考試院分管高中學(xué)業(yè)水平考試工作的劉寶劍副院長坦言,“普通高中學(xué)業(yè)水平考試(以下有時(shí)簡稱高中學(xué)業(yè)考試)應(yīng)當(dāng)是一種基于普通高中學(xué)業(yè)標(biāo)準(zhǔn)的水平性考試,學(xué)生通過考試證明達(dá)到了哪一級(jí)標(biāo)準(zhǔn),就可以給予相應(yīng)的水平認(rèn)定!這就完全不同于選拔性考試:高中學(xué)業(yè)考試一是更加注重考試標(biāo)準(zhǔn)的科學(xué)性、客觀性;二是更加注重考試工具(主要是試題)的效度,能夠準(zhǔn)確、清晰地檢測出考生的學(xué)業(yè)水平;三是因?yàn)椴皇菫榱诉x拔,所以雖然也要判定考生的水平等級(jí),但不強(qiáng)調(diào)區(qū)分度,不強(qiáng)化考試的甄別功能!但是,水平性考試是一種標(biāo)準(zhǔn)參照考試,需要有嚴(yán)謹(jǐn)清晰的學(xué)業(yè)標(biāo)準(zhǔn)考試標(biāo)準(zhǔn)和與此相配套的大容量題庫,這在較短時(shí)間內(nèi)是無法做到的,因此,目前的高中學(xué)業(yè)考試只能是“具有一定標(biāo)準(zhǔn)的常模參照考試”。[32]既然如此,上海方案合格考舉措更妥,針對(duì)各科必修部分命題,既然目前等級(jí)標(biāo)準(zhǔn)缺失,可僅分為mastery/non-mastery或pass/fail報(bào)告成績,以達(dá)到高考改革總體方案避免學(xué)生嚴(yán)重偏科的傾向。

        縱觀各省市區(qū)出臺(tái)的傳統(tǒng)學(xué)考方案(注:國家2014高考改革方案頒布前),傳統(tǒng)學(xué)考存在定位模糊或百花齊放的局面,[33]雖學(xué)考定位為標(biāo)準(zhǔn)參照測驗(yàn),但分?jǐn)?shù)解釋并非標(biāo)準(zhǔn)參照解釋。部分省份學(xué)考失控,導(dǎo)致各種學(xué)考亂象,如舞弊叢生,成績報(bào)告體系失范。

        任何測評(píng)的定位問題都是首要問題,這對(duì)后續(xù)的考試大綱研制、命題以及成績報(bào)告與分析等影響深遠(yuǎn),且定位也影響教學(xué),故定位不妥對(duì)測試實(shí)踐和測試結(jié)果的使用都將帶來不良后果。例如,定位影響命題,即使存在分?jǐn)?shù)混合解釋,不同定位(傾向于常模參照或標(biāo)準(zhǔn)參照解釋)仍影響試題命題,[21:42]又如,標(biāo)準(zhǔn)參照測驗(yàn)不考慮分散學(xué)生成績,而常模參照測驗(yàn)會(huì)考慮盡可能分散考生成績。[34:370]

        從浙江學(xué)考方案的成績報(bào)告方法推斷,定位傾向于常模參照考試,因報(bào)告的成績不是與某個(gè)標(biāo)準(zhǔn)進(jìn)行參照,而是參照其他考生的測試表現(xiàn),浙江學(xué)考對(duì)應(yīng)于上海方案的合格考,兩地對(duì)非選考科目學(xué)考進(jìn)行了明顯不同的定位。

        我國學(xué)考制度的功能或目的需要合適定位,合格考的目的是避免學(xué)生嚴(yán)重偏科,選考的目的是鼓勵(lì)學(xué)生自由選擇興趣科目,系選拔性測試,故合格考宜定位傾向于標(biāo)準(zhǔn)參照測驗(yàn),而選考應(yīng)傾向于常模參照測驗(yàn)。

        其實(shí),部分學(xué)者認(rèn)為傳統(tǒng)學(xué)考定位應(yīng)不同于選拔性考試,如高考改革政策研究專家劉海峰認(rèn)為高考是典型的高競爭、高利害、高風(fēng)險(xiǎn)的大規(guī)模選拔性考試,高中學(xué)業(yè)水平考試是檢測高中生學(xué)業(yè)成績的水平性考試,兩者性質(zhì)不同;[2]許多學(xué)者傾向于將學(xué)考定位為標(biāo)準(zhǔn)參照測驗(yàn)。[33][35][36][37][38][39][40]

        綜上所述,我國學(xué)考適宜分為兩類即不計(jì)入高考招錄的合格考科目學(xué)考以及計(jì)入高考招錄的選考科目學(xué)考,前者定位為基于雙重分?jǐn)?shù)解釋的常模相關(guān)—標(biāo)準(zhǔn)參照測驗(yàn),將后者定位為基于雙重分?jǐn)?shù)解釋的標(biāo)準(zhǔn)相關(guān)—常模參照測驗(yàn),命題分別傾向于標(biāo)準(zhǔn)參照解釋和常模參照解釋。

        3.4 學(xué)業(yè)水平考試與減負(fù)精神

        鑒于我國教育內(nèi)外環(huán)境以及部分用人單位畸形重視學(xué)歷文憑等不當(dāng)用人機(jī)制等復(fù)雜原因,我國基礎(chǔ)教育階段學(xué)生普遍負(fù)擔(dān)沉重,各級(jí)政府和教育主管部門對(duì)減負(fù)一直重視,《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》四提“減負(fù)”,綱要提出了指導(dǎo)我國高考的新三原則——“有利于科學(xué)選拔人才、促進(jìn)學(xué)生健康發(fā)展、維護(hù)社會(huì)公平的原則”,[29]而招考制度的減負(fù)元素是促進(jìn)學(xué)生健康發(fā)展的重要維度。高考改革方案制定時(shí)也明確提到減負(fù),如2014年9月4日,國務(wù)院新聞辦公室召開的新聞發(fā)布會(huì)上,教育部副部長劉利民強(qiáng)調(diào),“這次改革我們是努力減輕學(xué)生過重的課業(yè)負(fù)擔(dān)”。

        2014年出臺(tái)的浙滬版高考試點(diǎn)方案已竭力體現(xiàn)減負(fù)精神,如浙江方案合并了滬版方案中的合格性考試和等級(jí)性考試(各科在學(xué)考“必考題”基礎(chǔ)上增加“加試題”,選考與高中學(xué)考同期進(jìn)行),浙江方案此舉意圖通過減少考試次數(shù)來減負(fù)并降低考務(wù)成本;上海方案中,學(xué)生同一科目參加兩次不同用途(合格性考試和等級(jí)性考試)的考試,上海方案規(guī)定各科目合格性和等級(jí)性考試,高中生只能參加一次,此舉緩解了上海方案同一科分合格考和等級(jí)考后考次增加問題,但減少了考生選擇自由,似延續(xù)了傳統(tǒng)高考一考定終身之弊。因高考改革的高度復(fù)雜性,不宜苛求試點(diǎn)方案解決一切問題。

        然而,浙江學(xué)考方案(非選考科)的高中學(xué)考成績采用等級(jí)制,設(shè)A、B、C、D、E 5等,E 為不合格,以卷面得分為依據(jù),A、B、C等按15%、30%、30%最接近的累計(jì)比例劃定,E等比例不超過5%。此舉與國家學(xué)考指導(dǎo)政策不符,“計(jì)入高校招生錄取總成績的學(xué)業(yè)水平考試3個(gè)科目成績以等級(jí)呈現(xiàn),其他科目一般以“合格、不合格”呈現(xiàn)。[4]教育部對(duì)非選考的計(jì)分建議是妥當(dāng)?shù)?,上海方案貫徹了這點(diǎn)。教育部的解讀中,“除了進(jìn)入高校招生錄取總成績的科目以外,其他學(xué)科達(dá)到了國家規(guī)定的基本教學(xué)要求,考試合格即可”,這構(gòu)成了負(fù)擔(dān)減輕的第一條理由。[41]可見,國家高考改革頂層設(shè)計(jì)方案已考慮減負(fù)問題,各省份在細(xì)化操作中是否確保具體高考改革方案吻合國家高考頂層設(shè)計(jì),需要具體分析具體方案才可得出結(jié)論,甚至需要通過至少一輪試點(diǎn)才可得出結(jié)論。

        對(duì)于浙江學(xué)考制度,“對(duì)合格考科目進(jìn)一步細(xì)化等級(jí)是否會(huì)加重負(fù)擔(dān),對(duì)這個(gè)問題的看法仍存在分歧,據(jù)記者了解,從目前全國的普遍情況看,(傳統(tǒng))學(xué)業(yè)水平考試多數(shù)都采取多等級(jí)劃分,[41]由此可知,將合格性考試性質(zhì)的學(xué)考細(xì)分等第報(bào)告成績是傳統(tǒng)的學(xué)考實(shí)踐,若我們延續(xù)傳統(tǒng)的學(xué)考制度的等第成績報(bào)告制度,則減負(fù)無法體現(xiàn)。等級(jí)制報(bào)告分?jǐn)?shù)勢必刺激加重負(fù)擔(dān)的全面平均發(fā)展的傳統(tǒng)傾向,如劉海峰教授擔(dān)憂“全面實(shí)行高中學(xué)業(yè)水平考試,可以解決學(xué)生偏科的問題,但又可能會(huì)出現(xiàn)學(xué)生負(fù)擔(dān)加重的問題”。[2]

        此外,浙版方案合格考科目的等第成績將被高校如何使用?是否會(huì)被高校錄取作為依據(jù)或僅作參考,目前尚無高校方面的官方觀點(diǎn),更無操作實(shí)踐。高考改革歷史上,出現(xiàn)過類似舉措的教訓(xùn),“本來只是達(dá)標(biāo)性的水平考試,就因?yàn)榕c高考有了或硬或軟的掛鉤,考生的學(xué)習(xí)壓力就此被無限放大。學(xué)生除了應(yīng)對(duì)高考,還要應(yīng)對(duì)學(xué)業(yè)水平考。抱著寧缺毋濫的心理,學(xué)校加班加點(diǎn)補(bǔ)課,學(xué)生拼命備考,力爭每科考A”。[42]

        合格考科目定位不當(dāng)導(dǎo)致師生提高備考強(qiáng)度,迫使命題絕對(duì)難度上升,形成惡性循環(huán),不斷強(qiáng)化的備考力度導(dǎo)致測驗(yàn)成績的污染(test-score pollution/score inflation),表面上考生成績雖提高了,但其知識(shí)和技能等卻未必提高,即分?jǐn)?shù)的增長只是一種幻覺(Black,2001)。[43]

        測驗(yàn)分?jǐn)?shù)的常模參照解釋鼓勵(lì)競爭,可能帶來副作用,[44]故將學(xué)考中的非選考科目定位為標(biāo)準(zhǔn)參照考試,有利于降低考試焦慮感,[11:7]若名義上傾向?yàn)闃?biāo)準(zhǔn)參照測驗(yàn),卻實(shí)質(zhì)上實(shí)行常模參照測驗(yàn)的考綱設(shè)計(jì)、命題、計(jì)分等操作模式,毫無疑問,必加劇考試競爭,讓高強(qiáng)度應(yīng)試之風(fēng)愈演愈烈,更壞的結(jié)果是,學(xué)業(yè)負(fù)擔(dān)下移到義務(wù)教育階段含初中、小學(xué)甚至幼兒園階段。

        測試定位欠妥導(dǎo)致學(xué)業(yè)負(fù)擔(dān)加重,這與國家教育改革指導(dǎo)方針和國家招考改革的減負(fù)精神不符。

        3.5 學(xué)業(yè)水平考試試點(diǎn)方案對(duì)命題與計(jì)分的挑戰(zhàn)

        《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》在“完善高等學(xué)??荚囌猩贫取敝刑岢觥巴晟茋铱荚嚳颇款}庫,保證國家考試的科學(xué)性、導(dǎo)向性和規(guī)范性”。[29]高考試題研發(fā)、評(píng)卷、計(jì)分等應(yīng)盡力體現(xiàn)科學(xué)性、導(dǎo)向性和規(guī)范性。在高考改革方面,浙江省于2013年在自主命題省份中首創(chuàng)面向全社會(huì)征題的制度,有利于克服入闈命題的某些先天性缺陷。

        “高考選考科目均采用按較細(xì)的等級(jí)賦分的方式,將卷面分按事先公布的比例確定等級(jí)(浙江設(shè)21級(jí)、上海設(shè)11級(jí)),再轉(zhuǎn)換為百分制分?jǐn)?shù)計(jì)入總分,相鄰等級(jí)的分差均為3分”。浙江3門選考科目成績計(jì)分細(xì)分為21級(jí)(見表1):[8]

        這種賦分方案要求被試群體很大,且原始分?jǐn)?shù)服從正態(tài)或近似正態(tài)分布,測試的原始分?jǐn)?shù)分布是否會(huì)完全符合試題開發(fā)方預(yù)期?特別是在分?jǐn)?shù)區(qū)間(score intervals)多達(dá)21檔的情況下。關(guān)于等第計(jì)分制,9級(jí)計(jì)分制(stanines)是國外常見的等級(jí)計(jì)分方式之一,桑代克認(rèn)為九級(jí)計(jì)分制的目的是減少解釋小分?jǐn)?shù)差異的傾向,[45:131]更多的還有10級(jí)計(jì)分制(Sten scores),然而,對(duì)選拔性目的的選考采取削減分?jǐn)?shù)差異的等第計(jì)分制似欠妥。調(diào)取以前高考原始成績按本計(jì)分方案進(jìn)行多次模擬計(jì)算,以確保命題的原始分?jǐn)?shù)分布能夠滿足這樣的賦分體系且技術(shù)處理措施不至于影響測試公平。

        針對(duì)測評(píng)成績報(bào)告和解釋的研究相對(duì)較少,較全面的一篇綜述論文是Goodman&Hambleton(2004)發(fā)表于Applied Measurement in Education的Student test score reports and interpretive guides:Review of current practices and suggestions for future research,建議成績報(bào)告體系制定時(shí)參考測驗(yàn)的試測流程,也面向成績報(bào)告的預(yù)期接收人進(jìn)行模擬報(bào)告。[46:689]

        命制出考試統(tǒng)計(jì)結(jié)果與預(yù)期一樣的試題是一件非凡的任務(wù)。[21:384]根據(jù)表1所示,命題專家應(yīng)確??忌倲?shù)的1%獲得原始分滿分或某最高分?jǐn)?shù)區(qū)間(如94~98分),比例不能大,也不能小。萬一試題難度不在最理想化的狀態(tài),如試卷偏離理想難度而偏易,若原始分滿分人數(shù)就超過考生總?cè)藬?shù)的1%,此時(shí)如何賦分?同樣,若試卷難度偏離理想難度而偏難,文件規(guī)定的“第21等級(jí)比例不超過1%”如何控制?

        浙江方案中選考科目賦分極差為60分(起點(diǎn)賦分為40分,最高100分),從考試時(shí)間偏短推斷,試卷長度或試卷題量較小,依靠有限的題量拉開分值差距似有不小難度。

        此外,測驗(yàn)的計(jì)分方式應(yīng)服務(wù)于測驗(yàn)?zāi)康暮凸δ?,不宜為了反“分分?jì)較”來迂回計(jì)分方式,浙江版和上海版定位為(選拔性)常模參照測驗(yàn)的選考科目考試的計(jì)分均采取了以下方式:分?jǐn)?shù)(原始分)→百分比區(qū)間→等級(jí)→導(dǎo)出分?jǐn)?shù)(校準(zhǔn)分),此分?jǐn)?shù)導(dǎo)出模式的理據(jù)或意義存疑,導(dǎo)出分?jǐn)?shù)區(qū)分作用降低反而與選拔性測驗(yàn)要求分?jǐn)?shù)差異大以區(qū)分受試的客觀需求矛盾。因常模參照測驗(yàn)主要用于入學(xué)等目的,命題應(yīng)使考試分?jǐn)?shù)差異性最大化;[17]既然選拔性考試的目的是區(qū)分受試,測驗(yàn)成績的差異性非常重要(Shavelson,Baxter&Gao,1993;Yen,2003)。[18]

        命題被視為一門創(chuàng)造性藝術(shù)(Ebel 1951,Wesman 1971,Haladyna,Downing&Rodriguez 2002)。[47]學(xué)考方案對(duì)命題與計(jì)分是很大挑戰(zhàn),加之國情所限導(dǎo)致測驗(yàn)欠專業(yè)化或標(biāo)準(zhǔn)化,使情況復(fù)雜化。國家教育考試改革指導(dǎo)委員會(huì)專家組成員楊慧中教授認(rèn)為“我國的考試項(xiàng)目特別是高利害考試采用的試題幾乎都未經(jīng)試測……大規(guī)模高利害考試的設(shè)計(jì)、開發(fā)與實(shí)施是一項(xiàng)浩大的工程,必須達(dá)到一定的質(zhì)量標(biāo)準(zhǔn)…”[48]國外對(duì)高利害測評(píng)的重視和投入力度多比我國大,盡管我國考生數(shù)量龐大,如美國在大幅改革托??荚嚕═OEFL iBT)前進(jìn)行大量投入,試題從規(guī)劃設(shè)計(jì)到創(chuàng)題、試測以及最后組卷歷時(shí)5年之久。[49]5年周期是指前期托福新題型改革之初研發(fā)耗時(shí)很長,之后的正常命題周期Kunnan認(rèn)為不會(huì)這么長。[23]

        表1 浙江選考科目的成績等級(jí)、計(jì)入總分的分值和人數(shù)比例

        我國應(yīng)盡早引入科學(xué)專業(yè)的考試流程以及制定指導(dǎo)與約束教育測評(píng)實(shí)踐的國家標(biāo)準(zhǔn),大規(guī)模高利害測驗(yàn)命題含基本的測驗(yàn)規(guī)劃、命題、試測、試測數(shù)據(jù)分析、試題修改五大基本程序,[12:234]以提高命題質(zhì)量,讓高利害考試滿足各利益攸關(guān)方需求,如教育質(zhì)量監(jiān)控和人才選拔等。

        4 政策建議或進(jìn)一步討論

        盡管測評(píng)改革的本意是為利益攸關(guān)方帶來有益后效,但可能出現(xiàn)事與愿違的情況,導(dǎo)致“測評(píng)改革可能不會(huì)帶來預(yù)期的后效,甚至給利益攸關(guān)方帶來有害后效”(Bachmann and Palmer 2010)。[50]若建立在科學(xué)民主決策思想上的國家重大教育改革決策從前瞻性以及建立在對(duì)境外相關(guān)理論與實(shí)踐深入研究基礎(chǔ)上,一些本需試點(diǎn)后才能顯現(xiàn)的瑕疵可能盡早凸顯,得到及時(shí)糾偏,有助于改革順利推進(jìn)。下文提供的政策建議僅供讀者或有關(guān)決策方參考或討論。

        4.1 建議科學(xué)定位學(xué)考

        對(duì)非選考性質(zhì)的合格考學(xué)考定位為傾向于常模相關(guān)—標(biāo)準(zhǔn)參照測驗(yàn),按標(biāo)準(zhǔn)參照測驗(yàn)的學(xué)術(shù)規(guī)范進(jìn)行考試大綱研發(fā)、考試命題以及成績報(bào)告和解釋等。提供的成績常模解釋可同時(shí)為國家教育質(zhì)量監(jiān)控體系服務(wù),為國家教育改革提供決策參考。不宜讓本應(yīng)傾向于標(biāo)準(zhǔn)參照測驗(yàn)的學(xué)考承擔(dān)高考選拔功能。建議將非選考性學(xué)考科目成績作為大學(xué)錄取的前提條件,此舉仍符合國家頂層高考制度設(shè)計(jì)提到的“兩依據(jù)一參考”的高校招錄原則。選考則定位為常模參照測驗(yàn),以利科學(xué)選拔人才。

        4.2 建議學(xué)考方案分別設(shè)計(jì)合格性考試和選考性質(zhì)的等級(jí)性考試

        在上述指導(dǎo)思想下,區(qū)分合格考和等級(jí)考即推廣上海方案關(guān)于學(xué)考的舉措。前者不再細(xì)分等第,即僅分為合格/不合格,若合格區(qū)間細(xì)分等第,則涉及國家高中各科課程標(biāo)準(zhǔn)大幅度修訂時(shí)增加不同等級(jí)的內(nèi)容標(biāo)準(zhǔn)以指導(dǎo)教學(xué)與命題,而不宜按考生群體的百分位比例簡單細(xì)分等級(jí),且試點(diǎn)方案中近乎理想化的學(xué)考等第分布要求對(duì)命題是巨大挑戰(zhàn),特別是在我國各地高考命題專業(yè)化程度和命題水平參差不齊以及我國大規(guī)模高厲害測試基本未開展試測采集試題參數(shù)的國情下。從可行性和可操作性出發(fā),將合格性考試定位為高中畢業(yè)標(biāo)準(zhǔn)考試,而讓高考核心科目(語文、數(shù)學(xué)、外語)和3門選考科目考試承擔(dān)高招選拔主要功能。

        4.3 建議加強(qiáng)對(duì)對(duì)學(xué)考命題專業(yè)化提升與資源整合

        非選考科目的學(xué)考命題基于各科課標(biāo)核心和最基礎(chǔ)內(nèi)容,且難度保持年度間相對(duì)恒定,以免分?jǐn)?shù)通脹(score inflation),除非國家課標(biāo)修訂后提高或降低對(duì)學(xué)生的要求。選考科目進(jìn)行等級(jí)賦分的學(xué)考科目試卷單獨(dú)命題,不宜附加到合格性學(xué)考試題后作為加試部分處理,否則有限的考試時(shí)間和題量難以區(qū)分大量考生。

        為維護(hù)高利害國家考試的公平性和權(quán)威性,各科全部試題原創(chuàng)是命題的最基本要求,不宜簡單選用或改編陳題。目前一年一度的高考命題要求命題人員與外界隔離40天(左右),如果一年兩次,勢必影響其正常工作,缺乏可持續(xù)機(jī)制。[51]為了克服我國傳統(tǒng)入闈命題的問題和某些先天性弊端以確保命題質(zhì)量,研究借鑒國外命題機(jī)制。浙江省實(shí)施的面向社會(huì)各界征集高考試題具有重大意義,值得各地高考考務(wù)機(jī)構(gòu)研究借鑒。

        整合命題資源,創(chuàng)新命題機(jī)制,結(jié)合國情借鑒境外措施,確保命題質(zhì)量。對(duì)原來毫無高考自主命題經(jīng)驗(yàn)的省份,更需要資源整合以操作升級(jí)后的學(xué)考,盡早考慮全國劃片區(qū)成立片區(qū)命題中心,整合命題資源,節(jié)省命題成本。[52]

        教育測評(píng)盡早與國際接軌,出臺(tái)測評(píng)倫理和技術(shù)規(guī)范,出臺(tái)命題糾偏機(jī)制科學(xué)處理測評(píng)失誤,如《教育領(lǐng)域公平測試行為準(zhǔn)則》(The Code of Fair Testing Practices in Education(Code))第二部分第6條:“糾正影響成績解釋的錯(cuò)誤,并且及時(shí)溝通糾正后的成績”。[53]

        4.4 建議對(duì)選考科目提升分值并對(duì)多考進(jìn)行等值處理

        對(duì)選考的成績報(bào)告教育部學(xué)考指導(dǎo)文件規(guī)定“以等級(jí)呈現(xiàn)成績的一般分為五個(gè)等級(jí),位次由高到低為A、B、C、D、E”,[4]該文件無再次將等級(jí)轉(zhuǎn)換為數(shù)字分值的內(nèi)容,浙江和上海試點(diǎn)方案都將選考等級(jí)轉(zhuǎn)換為對(duì)應(yīng)分值,且各選考科分值都遠(yuǎn)低于核心科目語數(shù)外的分值,如浙江方案選考科目每科滿分100分,最低分40分;上海等級(jí)考每科滿分70分,最低分40分,三科合計(jì)僅90分的有效區(qū)分分?jǐn)?shù),從技術(shù)上導(dǎo)致考分差異度(test score variance)不高,且極大削弱了選考科目在高考招生錄取中的學(xué)科權(quán)重,不利于部分學(xué)科在基礎(chǔ)教育階段的發(fā)展。筆者認(rèn)為學(xué)考中計(jì)入高考錄取總成績的選考科目的各科轉(zhuǎn)換后的滿分分值宜比照核心科目分值大幅度提高或與核心科目同分值,一是確保大規(guī)??荚嚋y試成績的合適差異度以利大學(xué)選拔人才,二是不至于大幅弱化考生興趣或優(yōu)勢學(xué)科的貢獻(xiàn)度,否則勢必導(dǎo)致大量考生功利性地在占比最大的核心科目進(jìn)行白熱化的競爭,不利于引導(dǎo)學(xué)生充分發(fā)展優(yōu)勢科目,不利于引導(dǎo)學(xué)生在基礎(chǔ)教育階段為大學(xué)繼續(xù)深造成為拔尖人才而打下牢實(shí)的基礎(chǔ)和積累一定的學(xué)科素養(yǎng)。

        根據(jù)浙江學(xué)考方案,學(xué)考等級(jí)的劃分方法決定了考生等級(jí)成績與考生群體和試題難度密切相關(guān),考生有兩次學(xué)考機(jī)會(huì),從測試公平和科學(xué)性考慮,基于原始分和考生群體的成績報(bào)告機(jī)制值得商榷,按理論要求與國際慣例,兩次學(xué)考應(yīng)進(jìn)行等值處理,否則兩次考試成績無可比性,有損測試效度和公平,后果是誘導(dǎo)考生盲目參加某學(xué)考科目的兩次考試機(jī)會(huì)以使利益最大化,必增考試焦慮感,有違高考改革的減負(fù)精神。等值處理方法影響考試公平,等值是測驗(yàn)公平性的保證。[54][55]世界等值研究權(quán)威專家Kolen&Brennan認(rèn)為,為了避免不同考次之間難度不同缺乏分?jǐn)?shù)可比性,大多數(shù)大學(xué)入學(xué)測驗(yàn)應(yīng)用等值處理。[56:2-3]我國大學(xué)英語四六級(jí)考試在等值方面研究較多,可資借鑒,如《大學(xué)英語四、六級(jí)考試分?jǐn)?shù)的機(jī)助百分位等值研究》。[57]

        4.5 建議國家研究預(yù)案避免考生投機(jī)性選考

        對(duì)計(jì)分進(jìn)行科學(xué)化和專業(yè)化處理,如校驗(yàn)選考科目的分?jǐn)?shù)等,[58]否則考生和其他利益攸關(guān)方必然進(jìn)行投機(jī)性選考,那些相對(duì)更易獲取高分的選考科目會(huì)受到追捧。美國的SAT subjects報(bào)考科目也有類似投機(jī)現(xiàn)象。同時(shí),改革主管部門最好組織各高?;蚩蒲性核牟煌瑢I(yè)方向的學(xué)科專家協(xié)同研討,不同專業(yè)對(duì)高中生哪些科目進(jìn)行選考要求,從人才培養(yǎng)的角度考慮,似不應(yīng)賦予考生過大的科目選擇自主權(quán),或某專業(yè)限定考生必考某2門和高校專業(yè)密切相關(guān)的高中學(xué)科,而留下一門學(xué)科由考生自選。給考生的選擇權(quán)主要體現(xiàn)到考生選擇不同的專業(yè)方向,不同專業(yè)方向?qū)?yīng)不同的科目組合。

        4.6 建議國家制定學(xué)考命題依據(jù)的國家統(tǒng)一內(nèi)容標(biāo)準(zhǔn)

        非選考性學(xué)考(如上海方案中的合格考)命題若基于修訂后的各科高中課程標(biāo)準(zhǔn),而因各科課標(biāo)是全國統(tǒng)一的,課標(biāo)對(duì)學(xué)生畢業(yè)最低要求相同,基于同一個(gè)等級(jí)(若出臺(tái)科學(xué)的可指導(dǎo)標(biāo)準(zhǔn)參照測試命題的課標(biāo))的學(xué)考命題絕對(duì)難度和考試命題的內(nèi)容依據(jù)理應(yīng)相同。若學(xué)考不是基于既定標(biāo)準(zhǔn)的測驗(yàn)(criterion-based assessment),受試成績與受試群體相關(guān),因全國各省份教育發(fā)展水平很不均衡,若各省學(xué)考命題絕對(duì)難度各異,可能催生投機(jī)性的學(xué)考移民現(xiàn)象。

        此外,高利害測驗(yàn)性質(zhì)的合格考的合格標(biāo)準(zhǔn)的制定非常重要,不應(yīng)隨意制定,而應(yīng)基于實(shí)證研究,并經(jīng)得起檢驗(yàn)。

        4.7 建議國家加強(qiáng)對(duì)學(xué)考的具體指導(dǎo)、評(píng)估和監(jiān)督

        各省份學(xué)考的命題、施測、評(píng)卷和成績報(bào)告等各個(gè)環(huán)節(jié)應(yīng)專業(yè)化和科學(xué)化。我國各地命題水平不一,建議教育部組建全國高中學(xué)業(yè)水平考試專家委員會(huì),加強(qiáng)指導(dǎo),維護(hù)學(xué)考的權(quán)威性和公平性,同時(shí)負(fù)責(zé)處理考后答案異議的處理機(jī)制如對(duì)瑕疵試題進(jìn)行評(píng)卷技術(shù)操作,避免因命題或考務(wù)失誤危及考生權(quán)益和測試公平。[59]

        4.8 明確學(xué)考為國家級(jí)考試,強(qiáng)化考務(wù)管理,避免學(xué)考“形式化”

        為了避免最新一輪高考方案中的學(xué)考淪落為不受重視的傳統(tǒng)學(xué)考,教育部學(xué)考指導(dǎo)文件已明確學(xué)考按國家級(jí)教育考試嚴(yán)格對(duì)待,[4]教育部督促各地認(rèn)真執(zhí)行國家教育意志,對(duì)學(xué)考加強(qiáng)考務(wù)管理。為徹底扭轉(zhuǎn)傳統(tǒng)學(xué)考的一些負(fù)面印象,建議教育部強(qiáng)化對(duì)各地學(xué)考考場的嚴(yán)格監(jiān)控,并要求考場監(jiān)控視音頻3年存檔期限。只有從考務(wù)上確保各地考場各地考生完全無法作弊,抵消非選考性學(xué)考成績不與高考錄取硬掛鉤的弊端,督促各地認(rèn)真對(duì)待非選考的學(xué)考科目的日常教學(xué)和學(xué)習(xí),才能有效抑制嚴(yán)重偏科現(xiàn)象。

        致謝:江西師范大學(xué)丁樹良教授、北京語言大學(xué)教育測量研究所謝小慶教授、美國伊利諾伊大學(xué)語言學(xué)、教育心理學(xué)等Fred Davidson教授,以及美國應(yīng)用語言學(xué)家Antony John Kunnan教授對(duì)本文亦有貢獻(xiàn),特此致謝。(僅本文作者對(duì)文中疏漏負(fù)責(zé)。)

        [1] 新華社.習(xí)近平:改革要做到“蹄疾而步穩(wěn)”[EB/OL].[2014-01-22].http://news.xinhuanet.com/2014-01/22/c_119087717.htm.

        [2] 劉海峰.高考與高中學(xué)業(yè)水平考試如何掛鉤[EB/OL].中國教育報(bào)2013年12月9日第7版.[2015-03-23].http://paper.jyb.cn/zgjyb/html/2013-12/09/content_335505.htm?div=-1.

        [3] 袁貴仁.高考改革要能接受不同意見[EB/OL].[2015-03-23]http://lianghui.people.com.cn/2015cppcc/n/2015/0308/c393682-26656207.html.

        [4] 教育部.教育部關(guān)于普通高中學(xué)業(yè)水平考試的實(shí)施意見(教基二[2014]10號(hào))[Z].2014.

        [5] 國務(wù)院.國務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見(國發(fā)[2014]35號(hào))[Z].2014.

        [6] 教育部.教育部2015年工作要點(diǎn)[EB/OL].[2015-03-10].http://www.moe.gov.cn/publicfiles/business/htmlfiles/moe/moe_164/201502/183971.html.

        [7] 袁貴仁.全面深化綜合改革 全面加強(qiáng)依法治教加快推進(jìn)教育現(xiàn)代化——袁貴仁部長在2015年全國教育工作會(huì)議上的講話[EB/OL].[2015-03-10].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_176/201502/183984.html.

        [8] 邊新燦.新一輪高考改革浙江、上海方案深度比較研究[J].中國考試,2015(2):3-7.

        [9] 楊學(xué)為.中國考試大辭典[M].上海:上海辭書出版社,2006.

        [10] 戴海琦,張峰,陳雪楓.心理與教育測量(修訂本)[M].廣州:暨南大學(xué)出版社,2007.

        [11] Henning,G.A Guide to Language testing:Development,Evaluation and Research[M].Foreign Language Teaching&Research Press,Heinle&Heinle/Thomson Learning Asia.1987.

        [12] Cohen,R.J.,&Swerdlik,M.E.Psychological testing and assessment:An introduction to tests and measurements(7th ed.)[M].Boston,MA:McGraw-Hill,2010.

        [13] Paker,T.The Backwash Effect of the Test Items in the Achievement Exams in Preparatory Classes[J].Procedia-Social and Behavioral Sciences,2013 Vol.70,1463-1471.

        [14] Achievement tests.[EB/OL].[2015-03-09].http://psychology.ucdavis.edu/faculty_sites/sommerb/sommerdemo/stantests/mental.htm.

        [15] Achievement test.[EB/OL].[2015-03-20].http://en.wikipedia.org/wiki/Achievement_test.

        [16] Brown,J.D.Second language studies:Curriculum development.In K.Brown(Ed.in Chief),Encyclopedia of Language and Linguistics(2nd ed.)[M].2006,Volume 11(pp.102-110).Oxford:Elsevier.

        [17] Hambleton,R.K.,&Gorth,W.P.Criterion-referenced testing:Issues and applications[M].Paper presented at the annual meeting of the Northeastern Educational Research Association,Liberty,New York,1970.

        [18] Wikstro¨m,C.Criterion-Referenced Measurement for Educational Evaluation and Selection[M].Dissertation No 1.Umea°:Umea°University,Department of Educational Measurement,2005.

        [19] Oescher,J.,Kirby,P.C.,&Paradise,L.V.Validating state-mandat-ed criterion-referenced achievement tests with norm-referenced test results for elementary and secondary students[J].Journal of Experimental Education,1992,60(2),141-150.

        [20] Mehrens,W.A.&Ebel,R.L.Some Comments on Criterion-Referenced and Norm-Referenced Achievement Tests[J].NCME Measurement in Education,1979,10(1).

        [21] Miller,M.D.,Linn,R.L.,&Gronlund,N.E..Measurement and assessment in Teaching,10th.Edition[M].Upper Saddle River,NJ:Pearson Education,Inc.2009.

        [22] Davidson,F(xiàn).Personal communication(私人交流).March 17,2015.

        [23] Kunnan,A.Personal communication(私人交流).March 17,2015.

        [24] 羅蓮.告別“標(biāo)準(zhǔn)參照測驗(yàn)”和“常模參照測驗(yàn)”的二元?jiǎng)澐諿J].中國考試(研究版),2007(6):18-22.

        [25] 全國大學(xué)英語四、六級(jí)考試委員會(huì).大學(xué)英語考試的性質(zhì)[EB/OL].[2015-03-21].http://www.cet.edu.cn/cet_concept1.htm.

        [26] American Educational Research Association(AERA),American Psychological Association(APA),&National Council on Measurement in Education(NCME).Standards for educational and psychological testing[M].Washington,DC:American Educational Research Association,1999.

        [27] Reavis,G.The Animal School[M].Crystal Springs Books,1999.

        [28] 陶百強(qiáng).關(guān)于《國家中長期教育改革和發(fā)展規(guī)劃綱要》的10條建議.[2015-3-15]http://blog.sina.com.cn/s/blog_4c6b35860100kvra.html.

        [29] 國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)[M].北京:人民出版社,2010.

        [30] 王殿軍.努力培養(yǎng)拔尖創(chuàng)新人才[J].人民教育,2011(Z1):4-7.

        [31] 劉決生.我國普通高中學(xué)業(yè)水平考試存在的問題對(duì)策[J].上海教育科研,2010(3):39-42.

        [32] 劉寶劍.普通高中學(xué)業(yè)水平考試制度設(shè)計(jì)的十個(gè)關(guān)鍵[J].上海教育科研,2014(1):20-23.

        [33] 李欣.中美高中學(xué)業(yè)水平考試多維比較研究[D].上海:華東師范大學(xué),2011.

        [34] Fulcher,G.&Davidson,F.Language Testing and Assessment:An Advanced Resource Book[M].London and New York:Routledge,2007.

        [35] 雷新勇.我國學(xué)業(yè)水平考試的基本問題及反思[J].教育測量與評(píng)價(jià)(理論版),2010(1):4-14.

        [36] 王煥霞.高中物理內(nèi)容標(biāo)準(zhǔn)和學(xué)業(yè)水平考試的一致性研究[D].重慶:西南大學(xué),2012.

        [37] 王煥霞,廖伯琴.我國高中學(xué)業(yè)水平考試的實(shí)踐困境與制度審思[J].教育學(xué)報(bào),2011(6):77-83.

        [38] 楊向東,課程標(biāo)準(zhǔn)的開發(fā)與基于標(biāo)準(zhǔn)的學(xué)業(yè)水平考試的設(shè)計(jì):美國的經(jīng)驗(yàn)與啟示[J].考試研究,2010(1):109-125.

        [39] 崔允漷,夏雪梅.試論基于課程標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評(píng)價(jià)[J].課程·教材·教法,2007,(27)1:13-18.

        [40] 楊向東,崔允漷.關(guān)于高中學(xué)業(yè)水平考試的比較研究[J].全球教育展望,2010(4):7-14.

        [41] 施久銘.高中學(xué)業(yè)水平考試:面向高利害的挑戰(zhàn)[R].人民教育,2014(19):15-18.

        [42] 李欣.教育公平視域下的高中學(xué)業(yè)水平考試:聚焦與透視[J].中國考試,2012(8):58-64.

        [43] 吳麗君.蘇格蘭與英格蘭小學(xué)階段之國家考試的比較研究[J].國立臺(tái)北師學(xué)院學(xué)報(bào),2001(14):35-56.

        [44] 鄭日昌.標(biāo)準(zhǔn)參照測驗(yàn)的統(tǒng)計(jì)方法[J].中國考試,1991(3).

        [45] Thorndike,R.L.Applied Psychometrics[M].Boston,MA:Houghton Mifflin,1982.

        [46] Downing,S.M.,&Haladyna,T.M.(Eds.).The handbook of test development[M].Mahwah,NJ:Erlbaum.2006.

        [47] Green A.&Hawkey R.An empirical investigation of the process of writing Academic Reading test items for the International English language[M].IELTS Research Reports 2007,Volume 11.

        [48] 楊惠中.關(guān)于我國外語能力測評(píng)體系建設(shè)的幾點(diǎn)思考[J].中國考試,2015(1):12-15.

        [49] Kunnan,A.J.Large scale language assessments.In E.Shohamy&N.Hornberger(Eds.),Encyclopedia of language and education(2nd ed.)[M].Vol.7,Language testing and assessment,pp.135-155.New York:Springer,2008.

        [50] East,M.Coming to terms with innovative high-stakes assessment practice:Teachers'viewpoints on assessment reform[J].Language Testing,2015,32(1):101-120.

        [51] 王守仁.高考改革要從中國國情出發(fā)[J].外國語,2014(6):15-17.

        [52] 陶百強(qiáng).加強(qiáng)高考命題科學(xué)性提高高考命題的質(zhì)量——以2006年分省自主命題失誤為例[J].中小學(xué)英語教學(xué)與研究,2007(3):45-51.

        [53] Code of Fair Testing Practices in Education,Washington,DC:Joint Committee on Testing Practices,2004.

        [54] 謝小慶.考試分?jǐn)?shù)等值的新框架[J].考試研究,2008(2):4-16.

        [55] 謝小慶.對(duì)15種測驗(yàn)等值方法的比較研究[J].心理學(xué)報(bào),2000,32(2):217-223.

        [56] Kolen,M.J.&Brennan,R.L.Test equating,scaling,and linking.Methods and practices(Third Edition)[M].New York,NY.Springer.2014.

        [57] 朱正才,楊惠中.大學(xué)英語四、六級(jí)考試分?jǐn)?shù)的機(jī)助百分位等值研究[J].現(xiàn)代外語,2004(1):70-76.

        [58] 溫忠麟,羅冠中.高考分?jǐn)?shù)的轉(zhuǎn)換、校準(zhǔn)和合成[J].中國考試,2010(11):9-16.

        [59] 陶百強(qiáng),李明楷,李建平.對(duì)我國高考英語命題中建構(gòu)性題型答案可控性的探討[J].中國考試,2014(10):22-34.

        猜你喜歡
        標(biāo)準(zhǔn)改革
        2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
        改革之路
        金橋(2019年10期)2019-08-13 07:15:20
        忠誠的標(biāo)準(zhǔn)
        美還是丑?
        你可能還在被不靠譜的對(duì)比度標(biāo)準(zhǔn)忽悠
        改革備忘
        改革備忘
        改革備忘
        改革創(chuàng)新(二)
        一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長中的煩惱”
        專用汽車(2016年4期)2016-03-01 04:13:43
        日本高清一级二级三级| 欧美精品久久久久久久久| 久久精品成人免费观看97| 国产av午夜精品一区二区入口| 精品少妇无码av无码专区| 亚洲日韩国产一区二区三区| 国产亚洲av手机在线观看 | 国产精品乱码一区二区三区| 欧美伊人久久大香线蕉在观 | 精品亚洲不卡一区二区| 国产精品人伦一区二区三| 疯狂的欧美乱大交| 日韩AV不卡六区七区| 亚洲av粉嫩性色av| 国产三级视频不卡在线观看| 国产精品无码久久久久久| 91老司机精品视频| av在线网站一区二区| 老熟妇乱子交视频一区| 九九99久久精品国产| 亚洲免费一区二区三区视频| 日本免费播放一区二区| 97se亚洲国产综合在线| 中文字幕无码精品亚洲资源网久久 | 精品国产一区二区三区男人吃奶| 精品亚洲第一区二区三区| 国产免费av片无码永久免费| 国产精品理人伦国色天香一区二区| 精品国产麻豆一区二区三区| 最近免费中文字幕中文高清6| 亚洲欧美在线观看| 99在线国产视频| 亚洲一区第二区三区四区| 超级碰碰色偷偷免费视频 | 网友自拍人妻一区二区三区三州| 国产精品视频牛仔裤一区| 国产区高清在线一区二区三区| 日本最新一区二区三区在线视频| 无码吃奶揉捏奶头高潮视频| 亚洲国产精品悠悠久久琪琪| 男男做h嗯啊高潮涩涩|