任 濤 扈 巖 張青華 丁秀濤
自主課程建設(shè)實(shí)驗(yàn)學(xué)校學(xué)業(yè)水平考試試卷評價標(biāo)準(zhǔn)研究
任 濤 扈 巖 張青華 丁秀濤
考試評價研究的科學(xué)、全面發(fā)展,對促進(jìn)基礎(chǔ)教育的均衡發(fā)展、減輕學(xué)生負(fù)擔(dān)、彰顯學(xué)校辦學(xué)特色,提高教育教學(xué)質(zhì)量都將產(chǎn)生重要影響。試卷評價體系是衡量和評估試卷是否公平科學(xué)、準(zhǔn)確規(guī)范,學(xué)生學(xué)業(yè)質(zhì)量是否達(dá)標(biāo)的標(biāo)尺。本文以自主課程建設(shè)實(shí)驗(yàn)學(xué)校學(xué)業(yè)水平考試試卷評價標(biāo)準(zhǔn)的探究為切入點(diǎn),通過建立命題藍(lán)圖評價量表,使試卷藍(lán)圖科學(xué)化;通過建立試卷質(zhì)量評價量表,使評價過程標(biāo)準(zhǔn)化,評價結(jié)果可量化,評價報(bào)告可讀性強(qiáng)。
課程標(biāo)準(zhǔn);學(xué)業(yè)水平考試;命題藍(lán)圖;考試評價標(biāo)準(zhǔn)
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020)》和《國務(wù)院深化考試招生制度改革的實(shí)施意見》提出“建立科學(xué)的教育質(zhì)量評價體系,全面實(shí)施高中學(xué)業(yè)水平考試”。普通高中學(xué)業(yè)水平考試制度作為我國教育制度的重要組成部分,是基礎(chǔ)教育考試評價體系的核心內(nèi)容。開展普通高中課程改革實(shí)驗(yàn),是貫徹國家及北京市中長期教育改革和發(fā)展規(guī)劃綱要,推進(jìn)素質(zhì)教育的根本要求,也是落實(shí)國家及北京市普通高中課程方案,推進(jìn)具有首都特色和充滿活力的普通高中課程體系,促進(jìn)學(xué)生全面而有個性發(fā)展,促進(jìn)教師素質(zhì)整體優(yōu)化和普通高中教育質(zhì)量不斷提高的重要手段。
北京市自2007年開展普通高中自主排課實(shí)驗(yàn)(以下簡稱“自主實(shí)驗(yàn)”),自主實(shí)驗(yàn)學(xué)??筛鶕?jù)課程進(jìn)度安排和學(xué)校實(shí)際能力選擇科目進(jìn)行學(xué)業(yè)水平考試組考(以下簡稱“自主會考”)。允許部分普通高中開展自主實(shí)驗(yàn),賦予學(xué)校合理而充分的課程自主權(quán)是為了更好地落實(shí)課改實(shí)驗(yàn)總目標(biāo),為學(xué)校創(chuàng)造性地實(shí)施國家課程、因地制宜地開發(fā)校本課程,為學(xué)生自主選擇個性課程提供保障,切實(shí)探索一套完整的“以校為本”的新課程實(shí)驗(yàn)體系,為推進(jìn)北京市高中課改起到示范和引領(lǐng)作用。先期進(jìn)入自主課程實(shí)驗(yàn)的學(xué)校共有10所,如北京二中、北京四中、中國人民大學(xué)附屬中學(xué)和北京十一學(xué)校等全國知名的示范性高中。
為推進(jìn)高中課改健康發(fā)展,保證課改質(zhì)量,完善自主實(shí)驗(yàn)學(xué)校學(xué)業(yè)水平考試管理機(jī)制,依據(jù)北京市教委《關(guān)于進(jìn)一步推進(jìn)學(xué)校自主課程建設(shè)實(shí)驗(yàn)有關(guān)事項(xiàng)的通知》(京教基二[2012]20號)精神,以及《北京市自主課程建設(shè)實(shí)驗(yàn)學(xué)校學(xué)業(yè)水平考試(會考)管理方案》,從2013年夏季開始北京市參加自主會考的學(xué)校增加14所,加上先期進(jìn)入的10所,共有24所示范性高中進(jìn)行自主排課實(shí)驗(yàn),自行組織學(xué)業(yè)水平考試,即這24所中學(xué)均要進(jìn)行高中會考語文、數(shù)學(xué)、英語、物理、化學(xué)、生物、思想政治、歷史和地理9個學(xué)科的自主命題工作。
自主會考是開展自主課程實(shí)驗(yàn)的重要組成部分,是落實(shí)課程計(jì)劃、檢驗(yàn)和評價課程實(shí)驗(yàn)、達(dá)成實(shí)驗(yàn)?zāi)繕?biāo)的重要環(huán)節(jié),允許自主考試是北京市教委為實(shí)現(xiàn)自主實(shí)驗(yàn)?zāi)繕?biāo)、課程計(jì)劃、教學(xué)內(nèi)容、保障教學(xué)時間的基本手段。尤其需要指出的是,自主會考是北京市為推進(jìn)普通高中課程改革實(shí)驗(yàn),推進(jìn)具有首都特色和充滿活力的普通高中課程體系,而進(jìn)行的新改革舉措。對自主會考進(jìn)行科學(xué)的、體系化的評價研究,對于北京市建立和完善普通高中教育質(zhì)量監(jiān)測體系具有積極的意義。因此,從省市級層面加強(qiáng)對自主考試的監(jiān)控與評價極其重要和必要。
試卷評價體系是衡量和評估試卷是否科學(xué)公平、準(zhǔn)確規(guī)范,學(xué)生學(xué)業(yè)質(zhì)量是否達(dá)標(biāo)的標(biāo)尺。開展自主會考試卷評價體系研究工作,主要目的是加強(qiáng)對自主會考的監(jiān)控與評價,保證自主考試與自主課程建設(shè)實(shí)驗(yàn)的一致性,確保統(tǒng)一考試的公平性。對24所學(xué)校會考9個學(xué)科進(jìn)行自主命題的評價,意味著北京市每年將有約200份的試卷評價報(bào)告需要撰寫,工作量很大。因此編制評價量表,對試卷評價進(jìn)行系統(tǒng)化處理,將使北京市的自主會考評價研究工作科學(xué)、高效、便捷。
北京市針對全市會考已開展多年試題質(zhì)量、學(xué)生學(xué)業(yè)水平及教學(xué)質(zhì)量分析研究,在對試題評價分析中,已構(gòu)建并逐步完善了考試評價的統(tǒng)計(jì)指標(biāo)和教育測量指標(biāo)體系。
自主會考試卷評價的依據(jù)是:“高中課程標(biāo)準(zhǔn)”、“北京市普通高中會考考試說明”、學(xué)科試卷命題藍(lán)圖,并適當(dāng)參照北京市統(tǒng)一會考試卷的難度水平。因此,自主會考試卷評價量表研究就是結(jié)合教育測量學(xué)中質(zhì)性評價的定量、定性分析方法,在每次考試后對考試試卷進(jìn)行全卷以及題目的分析,并對命題提出有針對性的建議。
3.1 對試卷命題藍(lán)圖的評價
命題藍(lán)圖是試卷命制的計(jì)劃或規(guī)劃,一份“好”的命題藍(lán)圖是命制一份高質(zhì)量試卷的前提,因此對于各校各學(xué)科試卷的命題藍(lán)圖的評價非常重要。根據(jù)學(xué)科課程標(biāo)準(zhǔn)、學(xué)校自主課程實(shí)驗(yàn)方案,參照北京市會考考試說明,從以下幾方面對各學(xué)校提供的自主會考學(xué)科命題藍(lán)圖進(jìn)行評價,見表1。
表1 命題藍(lán)圖評價量表
對于1~5題,請學(xué)科專家進(jìn)行等級評分,最高為10分,最低為0分。8~10分為滿足要求,6~7分為基本滿足要求,3~5分為基本不符合要求,0~2分為完全不符合要求,并用定性化的語言進(jìn)行說明或描述。對第6項(xiàng)給予明確評價意見,簡要概述此命題藍(lán)圖涉及的學(xué)科模塊內(nèi)容和該學(xué)科命題的主要特點(diǎn),并簡述改進(jìn)意見和措施。不同專家“背靠背”的對試卷命題藍(lán)圖進(jìn)行“盲審”,藍(lán)圖是否有問題,有什么樣的問題,該如何改進(jìn),建議和措施等就會顯現(xiàn)在評價量表上,提供給自主會考學(xué)校進(jìn)行改進(jìn)和完善。
3.2試卷質(zhì)量評價標(biāo)準(zhǔn)
不論是常模參照性考試或標(biāo)準(zhǔn)參照性考試,對試卷評價的角度主要有四個方面,即科學(xué)性、準(zhǔn)確性、規(guī)范性和公平性。根據(jù)自主會考的水平性考試性質(zhì)和特點(diǎn),首先聘請一線學(xué)科教師和命題專家等30余人對試卷質(zhì)量標(biāo)準(zhǔn)進(jìn)行訪談,并對訪談記錄進(jìn)行編碼,之后整合為編碼結(jié)果。整理后的結(jié)果共分成兩大類,一類為考查內(nèi)容及要求,主要是對考試試卷所涉及的內(nèi)容范圍進(jìn)行評分;第二類為命題技術(shù)規(guī)范。將這兩類問題進(jìn)行合并整理,選取頻率最高的編制問卷,采用因素分析,從考查內(nèi)容要求、命題技術(shù)規(guī)范、難度設(shè)置和總體質(zhì)性評價四個維度進(jìn)行試卷質(zhì)量評價。
表2 試卷質(zhì)量評價量表
試卷評價專家參考表2中的20個方面來對試卷進(jìn)行評價,并給予分項(xiàng)說明。首先,對表2“試卷質(zhì)量評價量表”進(jìn)行量化打分,共20項(xiàng),每項(xiàng)5分;采用五級評分制,把5分細(xì)化為五檔,即完全滿足要求5分、能夠滿足要求4分、基本滿足要求3分、基本不符合要求2分、完全不符合要求0~1分。同時,對試卷質(zhì)性評價的等級性進(jìn)行描述:優(yōu)秀等級試卷為完全符合表2中列出的所有方面,試卷中大部分試題屬于原創(chuàng)性試題或改編試題,命題有學(xué)校自主方案特色;良好等級為基本符合表2中列出的所有方面,試卷有部分原創(chuàng)試題,具有一定的學(xué)校自主方案特色;合格等級為能夠符合表2中列出的大部分內(nèi)容,試卷具有一定的特點(diǎn);不合格等級為不符合表2中列出的大部分內(nèi)容,或包含以下問題如:試卷未按照命題藍(lán)圖命題,試卷有科學(xué)性“硬傷”,試題無原創(chuàng)性或改編試題,試卷沒有反映學(xué)校自主方案的特點(diǎn),等等。
不同專家“背靠背”對試卷進(jìn)行“盲審”,尤其對低于3分等級的要給出確切原因說明,最后根據(jù)試卷20項(xiàng)總得分,給出試卷質(zhì)量總體評價,見表3。通過這樣定量與定性的評價過程,一份自主會考試卷的特色和不足就完全展現(xiàn)在評價量表上。
3.3 評價報(bào)告內(nèi)容框架設(shè)計(jì)
結(jié)合試卷質(zhì)量評價量表,設(shè)計(jì)試卷質(zhì)性評價報(bào)告,共分為三部分:
第一部分為對試卷的整體評價,內(nèi)容包含三方面:一是對學(xué)科命題質(zhì)量的總體評價,內(nèi)容可結(jié)合表3描述;二是評價試卷與命題藍(lán)圖的一致性,內(nèi)容可結(jié)合表1進(jìn)行說明;三是總體評價結(jié)果(優(yōu)秀、良好、合格和不合格),屬于定性和定量評價相結(jié)合,用表3的結(jié)論。
第二部分為試卷分析,依據(jù)課程標(biāo)準(zhǔn)、會考考試說明和命題藍(lán)圖,并參照北京市會考試卷難度進(jìn)行分析。內(nèi)容包含:試卷特點(diǎn)、試卷結(jié)構(gòu)、難度控制和題目科學(xué)性等方面。主要參考表2中所列出的20個方面的內(nèi)容,突出重點(diǎn)進(jìn)行評價分析。定性評價語言要求體現(xiàn)特色、言簡意賅。
第三部分為建議與改進(jìn),主要根據(jù)表2(評定為3分等級以下的內(nèi)容原因和說明)和表3中的改進(jìn)建議,針對試卷的優(yōu)點(diǎn)及不足,給出改進(jìn)試卷命題的合理化建議。
表3 試卷質(zhì)量總體評價量表(質(zhì)性評價)
經(jīng)過近三年的實(shí)踐,本研究有效控制了自主會考試卷命題質(zhì)量,使不合格試卷的數(shù)量逐步減少,自主排課學(xué)校更加重視試卷的命題工作,到2015年,優(yōu)秀和良好試卷的比例遠(yuǎn)遠(yuǎn)高于標(biāo)準(zhǔn)制定時第一年的數(shù)量,在一定程度上保證了北京市高中畢業(yè)會考的公平公正,同時也使北京市的此項(xiàng)教育改革得到了質(zhì)量監(jiān)控。表4給出了2013年和2014年度試卷不同等級的評價結(jié)果。
通過對自主會考試卷建立評價指標(biāo)標(biāo)準(zhǔn)體系,主要達(dá)成了如下結(jié)論。
4.1 使試卷藍(lán)圖科學(xué)化,命題設(shè)計(jì)規(guī)范化
通過建立命題藍(lán)圖評價量表(表1),使試卷從設(shè)計(jì)和規(guī)劃之初的階段,就有監(jiān)督、有標(biāo)準(zhǔn)和有方向,并且對命題有反饋和改進(jìn)。解決了部分自主命題學(xué)校不能保持優(yōu)質(zhì)的命題水平、部分試卷未按照藍(lán)圖命題的突出問題,降低了命題的隨意性和盲從性。
4.2 使評價過程標(biāo)準(zhǔn)化,評價結(jié)果可量化
通過建立試卷質(zhì)量評價量表(表2)和質(zhì)性總體評價量表(表3),初步建構(gòu)了學(xué)業(yè)水平性考試的評價標(biāo)準(zhǔn)。通過打分量化評價等級和給出定性的評價結(jié)果,不僅監(jiān)控了教師評價的過程,使評價過程標(biāo)準(zhǔn)量化、有據(jù)可依,同時也將試卷的特點(diǎn)和不足完全展現(xiàn)在評價量表上,使教育管理者或命題教師能夠一目了然地知悉試卷診斷反映出的問題,以便下次命題時改進(jìn)。從實(shí)踐效果來看,試卷評價量表指出了試題表述不嚴(yán)謹(jǐn)、存在的科學(xué)性錯誤;試卷存在題目與其答案不匹配、答案不規(guī)范、評分標(biāo)準(zhǔn)不清晰的瑕疵;有的試卷使用歷年會考原題數(shù)量過高,原創(chuàng)或改編試題數(shù)量太少,致使試卷效度差;有的試卷存在排版不規(guī)范,格式不統(tǒng)一;有的試卷沒有反映學(xué)校自主方案的特點(diǎn)等現(xiàn)象或突出問題。
4.3 使評價報(bào)告高效化,可讀性強(qiáng)
每年對24所學(xué)校會考9個學(xué)科進(jìn)行自主命題的評價,有約200份的試卷評價報(bào)告需要撰寫,工作量很大,通過編制試卷評價量表,評價教師撰寫評價報(bào)告就有據(jù)可依,極大地提高了評價工作效率。同時,也減少了評價報(bào)告不客觀、不規(guī)范、不嚴(yán)謹(jǐn),評價語言隨意性的問題,增加了評價報(bào)告的可讀性,使北京市的自主會考評價研究工作科學(xué)、客觀、高效、便捷。
表4 試卷等級評價結(jié)果
面對未來即將進(jìn)行的普通高中學(xué)業(yè)水平考試,進(jìn)行自主課程實(shí)驗(yàn)的學(xué)校要加強(qiáng)對學(xué)業(yè)水平考試命題及命題藍(lán)圖設(shè)計(jì)等的思考和設(shè)計(jì)研究,使教師切實(shí)掌握命題的基本操作程序和規(guī)范要求,同時鼓勵積極命制原創(chuàng)題,通過原創(chuàng)試題體現(xiàn)新一輪考試改革和“走班制”教學(xué)特點(diǎn)以及學(xué)校教學(xué)水平與特色。采取有效措施,提高校本審命題技術(shù)的培訓(xùn),探索考試與教學(xué)良性互動的新型關(guān)系,使自主會考對優(yōu)質(zhì)高中有創(chuàng)意的學(xué)科教學(xué)的診斷評價功能得到更充分的發(fā)揮。
[1]戴家干.教育考試與評價制度創(chuàng)新 理論研究與實(shí)踐探索[M].北京:高等教育出版社,2010,4.
[2]楊向東.關(guān)于高中學(xué)業(yè)水平考試的比較研究[J].全球教育展望,2010(4):7-13.
[3]朱宇.高中學(xué)業(yè)水平考試:功能、命題與成績使用[J].考試研究,2008(4).
[4]雷新勇,周群.從基于標(biāo)準(zhǔn)的基礎(chǔ)教育改革的視角審視課程標(biāo)準(zhǔn)和學(xué)業(yè)水平考試[J].考試研究,2009(5).
[5]劉慶思.建立穩(wěn)定量表 服務(wù)中學(xué)教學(xué)——談高考評價功能的開發(fā)[J].中國考試,2009(5).
Research on Academic Level Test Paper Evaluation Standard in the Independent Course Construction Experimental Schools
REN Tao,HU Yan,ZHANG Qinghua&DING Xiutao
The scientific and all-round development of research in measurement and assessment will be very helpful in promoting the balanced development of basic education,reducing the workload of students, demonstrating the uniqueness of school governance and improving the quality of both education in general and instructions in the classroom in particular.The test paper evaluation system is a promising tool used for assessing not only whether the test paper is scientific,fair,accurate and standard but also whether students have attained the required proficiency level.Using as a starting point discussions of the academic level test paper evaluation standard in the independent course construction experimental schools,the article is intended not only to help to make the test paper design scientific by establishing a scale for assessing the blueprint for test writing,but also to help to make the evaluation process standardized,the evaluation outcomes measurable and the evaluation reports readable.
Curriculum Standard;Academic Level Test;Test Development Blueprint;Test Paper Evaluation Standard
G405
A
1005-8427(2016)05-0031-5
本文系北京教育規(guī)劃重點(diǎn)課題“北京市學(xué)業(yè)水平考試(會考)評價體系研究”(立項(xiàng)編號:AHA14168)的階段性研究成果。
任 濤,男,北京教育考試院,科研辦副主任,副研究員(北京 100083)
扈 巖,男,北京教育考試院,助理研究員(北京 100083)
張青華,女,北京教育考試院,副研究員(北京 100083)
丁秀濤,女,北京教育考試院,科研辦主任,研究員(北京 100083)