任濤 扈巖 張青華 張泉利
(北京教育考試院,北京 100083)
高中學業(yè)水平考試評價標準體系研究
——以北京市為例
任濤 扈巖 張青華 張泉利
(北京教育考試院,北京 100083)
考試評價研究的科學、全面發(fā)展,對促進基礎教育的均衡發(fā)展、減輕學生負擔、提高教育教學質量都將產(chǎn)生重要影響。本文以設計和構建高中學業(yè)水平考試的評價標準為切入點,建立試卷評價量表,使評價過程標準化以及評價結果可量化,并展示了試卷定性評價與定量數(shù)據(jù)分析結果,形成試卷質量評價報告的過程,同時為開展個性化的學生診斷評價提供了參考依據(jù)。對高中學業(yè)水平考試評價標準體系的研究,可以解決招生考試評價標準不足的問題,以期促進新一輪考試招生制度改革順利實施。
考試招生制度改革;高考;學業(yè)水平考試;考試評價;評價體系;試卷質量標準
考試招生制度是國家基本教育制度。2014年12月,教育部出臺《關于普通高中學業(yè)水平考試的實施意見》,是貫徹落實《國務院關于深化考試招生制度改革的實施意見》的4個配套文件之一,主要目標是建立科學的選拔評價體系和培養(yǎng)體系,改變以往應試教育理念,促進學生全方位的素質發(fā)展,培養(yǎng)未來高素質創(chuàng)新性人才[1-2]。自此,普通高中學業(yè)水平考試終于有了國家層面的宏觀“國家標準”[3]。新的學業(yè)水平考試的突出特點是:考試科目全覆蓋,考生可以兩次選考,成績以等級形式呈現(xiàn)等[4]。這無疑對于推進新的《課程標準》的順利實施和高考改革都是大有裨益的[5]。
我國高中學業(yè)水平考試始于1983年的高中畢業(yè)會考制度,在《教育部關于進一步提高普通高中教育質量的幾點意見》中提出,畢業(yè)考試要和升學考試分開進行,有條件的省市可按基本教材命題,試行初、高中畢業(yè)會考[6]。1990年《國家教委關于在普通高中實行畢業(yè)會考制度的意見》首次強調指出會考的性質,普通高中畢業(yè)會考是國家承認的省級普通高中文化課畢業(yè)水平考試,它是檢查、評價普通高中教學質量的一種手段,是與高校招生選拔考試具有不同性質的考試。從1990年開始,普通高中畢業(yè)會考制度有計劃地在全國逐步實行[7]。各省市經(jīng)過10年的實踐和探索,針對普通高中進行素質教育,全面培養(yǎng)高素質能力型人才的需要,2000年《教育部關于普通高中畢業(yè)會考制度改革的意見》指出,各省、自治區(qū)、直轄市對普通高中會考改革具有統(tǒng)籌決策權,不再進行普通高中會考的地方要建立和完善普通高中學校畢業(yè)考試制度,要以全面推進素質教育為宗旨,探索建立對學生多方面能力發(fā)展的評價體系[8]。
針對高中畢業(yè)成績公平有效的問題、考試內容不規(guī)范、評價程序不嚴謹和省級監(jiān)控手段不足的問題,高中會考面臨重新定位[9-10]。結合高中新課程改革和2010年《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》的頒布,提出建立科學的教育質量評價體系,全面實施普通高中學業(yè)水平考試和綜合素質評價。普通高等學校本科招生以統(tǒng)一入學考試為基本方式,結合學業(yè)水平考試和綜合素質評價,擇優(yōu)錄取[11]。自此,高中會考正式轉為學業(yè)水平考試發(fā)展階段。2014年《國務院關于深化考試招生制度改革的實施意見》指出,學業(yè)水平考試由省級教育行政部門按國家課程標準和考試要求組織實施,主要檢驗學生學習程度,是學生畢業(yè)和升學的重要依據(jù)。通過挖掘、分析學業(yè)水平考試數(shù)據(jù)中蘊藏的教育教學信息,發(fā)現(xiàn)中學教學中的問題,對提高普通高中教學質量和學生學習水平大有裨益,因此構建學業(yè)水平考試評價標準體系變得十分重要[12]。
考試是培養(yǎng)選拔人才的復雜系統(tǒng)工程,其所涉及的命題技術、制卷要求和考試評價需要通過一定的標準來進行規(guī)范和指導,以保障教育考試的有序、有效開展[13]。制定學業(yè)水平考試試卷評價標準,作出統(tǒng)一規(guī)定,其目的在于獲得教育考試發(fā)展的最佳秩序并提升教育水平[14]。
高中學業(yè)水平考試的性質和作用,從國家層面看,是按照國家課程標準,在教育部指導下,分別由各省自行組織實施的對普通高中學生學業(yè)水平進行檢測的標準參照考試[15]。北京市目前仍以會考的形式進行,概括地說,其作用主要有以下幾個方面:一是考核普通高中學生相關科目學習是否達到課程標準要求,能否達到各學科課程的畢業(yè)標準;二是反映普通高中學校實施高中課程標準的情況和教育教學質量及辦學水平;三是便于各級教育行政部門進行普通高中課程管理,督促學校認真執(zhí)行課程方案和課程標準,規(guī)范教育教學行為;四是為高等學校招收新生提供依據(jù);五是為高中學生就業(yè)或接受國內外各類教育提供高中學業(yè)水平證明。
2.1 監(jiān)控高中學業(yè)水平,明確考試評價標準
高中學業(yè)水平考試與高考有本質的區(qū)別,就考試內容而言,考試標準主要是強調通過質和量來規(guī)劃高中學段所應達到的具體學業(yè)結果,從而建立高中學業(yè)成績評價標準。明確考試內容所涉及的學生認知水平和能力基礎,對學生能達到課程相應內容及認知水平的具體特征作出明確規(guī)定。
目前正在修訂的“新課程標準”和“學業(yè)水平標準”中,提出了“學科核心素養(yǎng)”,將每門學科的知識和學科能力具體化,并分水平、分類分層描述,這成為今后考試評價的重要依據(jù)。這意味著今后考試評價將通過分析學生的考試成績,為考生提供準確客觀的學業(yè)診斷報告,來鑒別考生在學科知識和能力方面的優(yōu)勢和不足,使考生能夠選擇適合自身未來發(fā)展的高校與專業(yè)。
2.2 建立試卷評價量表,加強考試結果反饋
按照高中教育課程標準的要求制定學業(yè)水平考試的考試內容或內容標準,并著手制定各學科的學業(yè)質量標準。根據(jù)學業(yè)質量標準來命題,并建立試卷的評價量表,及時做好學業(yè)水平考試數(shù)據(jù)統(tǒng)計與分析,以便充分發(fā)揮高中學業(yè)水平考試數(shù)據(jù)信息在學業(yè)評價、質量檢測、教學反饋等方面的影響[10]。分析和反饋不同教師或考生對試卷的評價意見,可以加強對命題的反饋與評價;通過分析預判考生在不同題目上的答題表現(xiàn),可以對閱卷提供必要的參考,以及了解各層次考生的答卷情況與感受;通過訪談調研、試卷評價量表調研和考后對考生學業(yè)水平考試成績的年度分析,以及縱向的年度分析,對比年度間數(shù)據(jù),可以提升試卷命題質量和對教育教學的指導力度。
3.1 統(tǒng)計指標和教育測量指標體系
北京市針對全市會考已開展多年的試題質量、學生水平及教學質量分析研究,在對試卷評價分析中,構建并逐步完善了考試評價的統(tǒng)計指標和教育測量指標體系(見表1)[12]。為了使測量結果較為直接地被一線教師和教研人員所理解,一般采用經(jīng)典測量理論指標來對學生得分進行評價和分析,在一些對學科能力的分析中借鑒了項目反應理論的結果。
3.2 學業(yè)水平考試命題評價表
首先對15名有過高考和會考命題經(jīng)驗的一線教師進行訪談,并對訪談資料進行編碼,對命題的反饋評價,利用因素分析法和頻次分析法[16],考慮的因素見表2。
根據(jù)所得到因素進行細化形成開放性問卷,向北京市1 100余位不同學科的一線教師或教研員發(fā)放問卷作答,將作答結果進行提煉總結,經(jīng)過聚類分析[17]得到8類不同維度的評價內容標準見表3。
3.3 學業(yè)水平考試試卷質量的定量評價指標
學業(yè)水平考試試卷評價量表的建立和使用按照以下思路進行:一是試卷整體評價與個性分析相結合,對學業(yè)水平考試試卷具備的功能進行全面評價,同時關注不同學科試卷的特點;二是第三方評價(非命題者和非被試對象的考生),站在第三方的角度開展評價,客觀分析試卷是否符合學業(yè)水平考試的要求;三是定量評價(客觀數(shù)據(jù))與定性評價結合,評價教師運用自己教學積累的經(jīng)驗分析統(tǒng)計結果,探究影響教學的種種因素和產(chǎn)生問題的原因,提出改進建議[12]。
通過廣泛的專家訪談和10余年的調研論證,得到學科試卷評價量表,評價的維度包括學科《課程標準》的主題與模塊分類、教材分布(如數(shù)學學科有5個模塊)、題型分類(如客觀題或主觀題)、認知層次(知道、了解、理解、掌握、運用或綜合應用)、知識組塊、能力組塊、學科特色分析等(如語文作文,英語聽力,物理、化學和生物實驗,物理、化學和生物科普閱讀題,地理地圖,歷史年表,時事政治等等),以及基礎性或發(fā)展性組塊等。表4列出了2016年北京市春季會考物理學科試卷的評價角度和指標。
表1 學科評價測量指標體系
表2 命題定性評價表考慮的因素
表3 命題定性評價表
表4 2016年北京春季會考物理學科試卷評價表(部分示例)
4.1 進行學業(yè)水平考試試卷定性評價
通過表2、表3所列的宏觀或微觀評價角度,可以設計對學業(yè)水平考試的定性評價報告,在考試后的第一時間,收集教研員或一線教師的客觀評價,這樣對試卷閱卷標準的把控十分有效。
2016年北京市春季會考結束后,編制了初評問卷通過微信和網(wǎng)絡投票的定向調研方式,收集了北京市9個學科教師對試卷的評價,獲得有效問卷1 137份,經(jīng)分析得到圖1,其中對9個學科試卷評價為優(yōu)秀的占62%,良好的占32.1%。了解了一線教師對試卷的評價意見,針對不合格試卷,可以進一步分析評價為不合格的原因,為閱卷標準的把握和撰寫評價報告提供參考。
圖1 對試卷的評價等級
4.2 進行學業(yè)水平考試試卷定量數(shù)據(jù)分析
利用如表4所建立的試卷質量評價指標對試卷進行科學的分類,如課程標準模塊、教材分布、題型分類、認知層次、知識組塊、能力組塊、基礎性和發(fā)展性組塊等,開發(fā)了專業(yè)的統(tǒng)計測量分析程序,也可以用SPSS軟件或EXCEL進行全樣本的考生數(shù)據(jù)分析,得到如表1中所列各類教育測量指標的數(shù)據(jù)或圖表,這樣就獲得了學業(yè)水平考試試卷的數(shù)據(jù)報告(見表5),可以進行基于標準的定量數(shù)據(jù)分析。
4.3 形成學業(yè)水平考試試卷質量評價報告
結合學業(yè)水平考試的定性調研評價報告和定量數(shù)據(jù)分析報告,可以按照如表4、表5所列的不同角度著手撰寫評價研究報告,內容可以參考表2和表3中列出的方面。這樣形成的試卷質量評價報告,不僅對教師評價的過程標準量化、有據(jù)可依,也減少了評價報告不客觀、不規(guī)范、不嚴謹,評價語言隨意性的問題,增加了評價報告的規(guī)范和可讀性,同時也將試卷的特點特色和不足完全地展現(xiàn)在評價量表上,使教育管理者或命題教師能夠一目了然地知悉試卷評價診斷反映出的問題,以便下次命題時改進。
從多年的實踐效果看,試卷評價量表能夠“迅速”地反映出試卷中表述不嚴謹、存在科學性錯誤的試題;存在題目與其答案不匹配、答案不規(guī)范、評分標準不清晰的瑕疵;反映出有的學科試卷使用會考說明原題數(shù)量過高,原創(chuàng)或改編試題數(shù)量太少,致使試卷效度差;有的試卷存在排版不規(guī)范,格式不統(tǒng)一等現(xiàn)象或突出問題。
4.4 為個性化的學生診斷評價報告提供依據(jù)
充分利用考試數(shù)據(jù)資源,向學生提供診斷評價報告,為學生個性化學習提供建議和參考。試卷評價的主要作用就是改進教學和拓展考試服務功能,為考生提供個性化評價,有效發(fā)揮考試在促進教育教學、改善教育管理、幫助學生學習等方面的延伸功能。構建試卷評價指標體系,可以加強對學業(yè)水平考試結果的研究與分析,做好教學反饋與指導,不斷提高教學質量。設計科學的試卷質量評價標準,既能作為教師平時教學中進行學生診斷評估的重要依據(jù),又能作為評價準則,實現(xiàn)對學生、教師、學校乃至區(qū)域教育質量的科學評測,是提升我國教育質量、實現(xiàn)素質教育的重要保障。
[1]羅祖兵,秦利娟.將學業(yè)水平考試納入高考的困境與對策[J].課程·教材·教法,2015(8).
[2]徐遠征.對普通高中學業(yè)水平考試命題技術的初步探討[J].課程·教材·教法,2013(2).
[3]國家教育標準體系研究課題組.國家教育標準體系的發(fā)展與完善[J].教育研究,2015(12).
[4]王蕾.大規(guī)??荚嚭蛯W業(yè)質量評價[J].教育科學研究,2013(8).
[5]鐘秉林.深化綜合改革,應對高考招生制度改革新挑戰(zhàn)[J].教育研究,2015(3).
[6]李凌艷,郭思文.我國基礎教育質量環(huán)境系統(tǒng)監(jiān)測的若干思考[J].教育研究,2014(11).
[7]馬嘉賓,王建,汪明.高中考試招生制度改革的問題與建議[J].教育研究,2014(7).
[8]關松林.我國普通高中學生學業(yè)水平考試問題分析[J].中國教育學刊,2013(11).
[9]雷新勇.我國學業(yè)水平考試的基本問題及反思[J].教育測量與評價,2010(1).
[10]戴家干.教育考試與評價制度創(chuàng)新——理論研究與實踐探索[M].北京:高等教育出版社,2010.
[11]楊向東.關于高中學業(yè)水平考試的比較研究[J].全球教育展望,2010(4).
[12]朱宇.高中學業(yè)水平考試:功能、命題與成績使用[J].考試研究,2008,4(2).
[13]雷新勇,周群.從基于標準的基礎教育改革的視角審視課程標準和學業(yè)水平考試[J].考試研究,2009,5(1).
[14]臧鐵軍.構建考試評價系統(tǒng)的理論與實踐研究[J].考試研究, 2013(3).
[15]葛建中,徐遠征.讓學業(yè)水平考試發(fā)揮正向引導作用[N].中國教育報,2012-05-17(8).
[16]劉菊香,沈霄鳳.用Spss統(tǒng)計軟件對學生綜合成績的因子分析[J].統(tǒng)計教育,2006(1).
[17]武森,俞曉莉,倪宇,等.數(shù)據(jù)挖掘中的聚類技術在學生成績分析中的應用[J].中國管理信息化,2009,12(15).
Criteria for Evaluating the Academic Proficiency Test for High Schools: A Case Study of Beijing
REN Tao,HU Yan,ZHANG Qinghua,ZHANG Quanli
(Beijing Education Examinations Authority,Beijing 100083,China)
Evaluation of educational assessments being one important aspect,scientific and comprehensive development of research in educational assessment helps promote balanced development of quality education as well as reduce the workload for students.Taking Beijing’s Academic Proficiency Test for High Schools as an example,evaluation criteria are designed for the test,so that the evaluation processes are standardized and the evaluation outcomes are quantified.Results of qualitative and quantitative analysis and processes involved in creating test paper quality evaluation reports are exemplified,which in the meantime provide reference for creating individualized diagnostic assessments.As an effort to contribute to literature on test evaluation,this study is made with a view to promoting smooth implementation of the new round of examination and enrollment reform.
Examination and Enrollment System Reform;College Entrance Examination;Academic Proficiency Test;Test Evaluation;Evaluation System;Test Paper Quality Evaluation Criteria
表5 2016年北京春季會考數(shù)學學科數(shù)據(jù)分析表(部分示例)
G405
A
1005-8427(2017)01-0019-7
10.19360/j.cnki.11-3303/g4.2017.01.004
(責任編輯:周黎明)
本文系北京教育科學“十二五規(guī)劃”重點課題“北京市學業(yè)水平考試(會考)評價體系研究”(課題編號:AHA14168)的研究成果。
任 濤(1977—),男,北京教育考試院,副研究員;扈 巖(1977—),男,北京教育考試院,助理研究員;張青華(1975—),女,北京教育考試院,副研究員;張泉利(1964—),男,北京教育考試院黨委副書記,副研究員。