柳夕浪
摘要推動《義務(wù)教育課程方案和課程標(biāo)準(zhǔn)(2022年版)》落地實施,必須破解考試評價這一卡點(diǎn),構(gòu)建基于課程標(biāo)準(zhǔn)的核心素養(yǎng)測評體系。核心素養(yǎng)測評是基于學(xué)生有關(guān)行為表現(xiàn)推斷其內(nèi)在素養(yǎng),對其學(xué)業(yè)成就表現(xiàn)做出解釋的過程,包括把握核心素養(yǎng)測評目標(biāo)、開發(fā)核心素養(yǎng)測評項目、構(gòu)建核心素養(yǎng)測評量規(guī)等重要環(huán)節(jié)。
關(guān)鍵詞 《義務(wù)教育課程方案和課程標(biāo)準(zhǔn)(2022年版)》;核心素養(yǎng)測評;測評目標(biāo);測評項目;測評量規(guī)
中圖分類號G63
文獻(xiàn)標(biāo)識碼B
文章編號1002-2384(2022)06-0013-03
前不久剛剛發(fā)布的《義務(wù)教育課程方案和課程標(biāo)準(zhǔn)(2022年版)》要求學(xué)生從“會做題”轉(zhuǎn)向“會做事”,像學(xué)科從業(yè)者那樣思考和行動,在此過程中形成和發(fā)展核心素養(yǎng)。與此相適應(yīng),必須破解考試評價這一學(xué)校立德樹人工作的卡點(diǎn),構(gòu)建基于課程標(biāo)準(zhǔn)的核心素養(yǎng)測評體系。
核心素養(yǎng)測評是指在可觀察的真實世界的事物與我們關(guān)于事物的構(gòu)念之間建立聯(lián)系,基于學(xué)生有關(guān)行為表現(xiàn)的證據(jù)推斷其內(nèi)在素養(yǎng)狀況,對學(xué)生的學(xué)業(yè)成就表現(xiàn)做出解釋的過程。基于課程標(biāo)準(zhǔn)的核心素養(yǎng)測評主要包括三個密切聯(lián)系的重要環(huán)節(jié)。
測評目標(biāo)即我們所期待的學(xué)生學(xué)習(xí)的結(jié)果。清晰界定、準(zhǔn)確把握測評目標(biāo)的內(nèi)涵,是有效測評的首要任務(wù)。
新修訂的課程標(biāo)準(zhǔn)關(guān)于學(xué)生學(xué)習(xí)結(jié)果的期待和界定,主要體現(xiàn)在“課程目標(biāo)”“課程內(nèi)容”與“學(xué)業(yè)質(zhì)量”等幾個部分。把握測評目標(biāo),要注意厘清這幾部分之間的關(guān)系,形成關(guān)于學(xué)習(xí)結(jié)果的整體性認(rèn)識?!皶鍪隆睆膬?nèi)部條件來看,要有一定的核心素養(yǎng)支撐。這些素養(yǎng)是知識、技能、品格、態(tài)度的有機(jī)整合,是一個人適應(yīng)未來社會發(fā)展和個人終身發(fā)展所需要的正確價值觀、必備品格和關(guān)鍵能力。對這些素養(yǎng)的系統(tǒng)培育,不僅是各門課程也是整個學(xué)校教育的主要任務(wù)。
首先,在“課程目標(biāo)”中,“核心素養(yǎng)內(nèi)涵”是對該課程內(nèi)在育人價值的凝練概括,明確回答這些素養(yǎng)是什么;“目標(biāo)要求”是這些素養(yǎng)在義務(wù)教育階段的培育要求,與學(xué)生年齡特征相適應(yīng),體現(xiàn)出一定的學(xué)段特點(diǎn)。
其次,在“課程內(nèi)容”中,“學(xué)業(yè)要求”明確了各主題或單元核心素養(yǎng)培育的具體要求,強(qiáng)調(diào)通過主題或單元學(xué)習(xí)任務(wù)的完成去培育學(xué)生相關(guān)素養(yǎng),讓學(xué)生學(xué)會運(yùn)用主題或單元知識去解決問題。學(xué)業(yè)要求是課程目標(biāo)的具體化,是融入主題或單元內(nèi)容的素養(yǎng)要求,同時也是這些主題或單元教學(xué)和評價的直接依據(jù)。
最后,各學(xué)科課程標(biāo)準(zhǔn)中的“學(xué)業(yè)質(zhì)量”則是依據(jù)一定的核心素養(yǎng)發(fā)展模型,對學(xué)生完成該門課程階段性學(xué)習(xí)任務(wù)后學(xué)業(yè)成就的典型表現(xiàn)進(jìn)行整體刻畫,為教師在該課程的教學(xué)和評價中分析、解釋學(xué)生的成就表現(xiàn),整體把握學(xué)生的核心素養(yǎng)發(fā)展水平提供了直接依據(jù)。進(jìn)一步說,所謂學(xué)業(yè)成就表現(xiàn),就是在一定情境中像學(xué)科從業(yè)者那樣思考和行動的典型特征。如小學(xué)1~2年級科學(xué)思維的典型表現(xiàn)包括“能在熟悉的日常生活情境中”有“多角度提出觀點(diǎn)的意識”,能夠“嘗試用現(xiàn)象或經(jīng)驗支持自己的想法”“發(fā)現(xiàn)自己作品的問題和可能的解決方案”等。教師在進(jìn)行日常教學(xué)評價時,可以通過觀察學(xué)生在熟悉的日常生活情境中是否具有上述典型表現(xiàn),來分析判斷學(xué)生的科學(xué)思維水平;在學(xué)業(yè)水平考試時則可通過命制相應(yīng)的試題來考查學(xué)生能否用現(xiàn)象或經(jīng)驗支持自己的想法等。
從上述分析可以看出,核心素養(yǎng)是一門課程一以貫之的主線,是該課程的DNA;“目標(biāo)要求”“學(xué)業(yè)要求”“學(xué)業(yè)質(zhì)量”是關(guān)于學(xué)生核心素養(yǎng)發(fā)展的具體期待。如果說平時的教學(xué)評價更多依據(jù)相關(guān)“學(xué)業(yè)要求”的話,那么階段總結(jié)性評價則應(yīng)更多依據(jù)“學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)”,這兩方面的評價又都不能偏離該課程總體性的“目標(biāo)要求”。
由于多方面原因,2022年版課程標(biāo)準(zhǔn)中有些核心素養(yǎng)測評目標(biāo)還不是那么清晰。如歷史課程標(biāo)準(zhǔn)“目標(biāo)要求”中的“初步學(xué)會在歷史唯物史觀的指導(dǎo)下看待歷史”“初步學(xué)會依靠可信史料了解和認(rèn)識歷史”等,其中兩個“初步”的特征及具體要求是什么?這些要求與普通高中階段相比有什么差別?具體測評時還需要結(jié)合學(xué)生的年齡特征和教學(xué)實際情況,進(jìn)一步澄清這些問題,這樣才能保證測評有著更為明確的指向和應(yīng)有的效度。
測評要求考查學(xué)生在測評目標(biāo)上的具體反應(yīng)。這里的考查不僅指日常教學(xué)中隨時隨地觀察、做筆記,還要求在專門的考試考核情境中進(jìn)行考查。核心素養(yǎng)測評的重要任務(wù)之一就是設(shè)計出一些項目,創(chuàng)設(shè)能夠引發(fā)核心素養(yǎng)表現(xiàn)的問題或任務(wù)??疾楹诵乃仞B(yǎng)的項目與考查知識技能的題目有什么不一樣呢?筆者以下列測試項目為例進(jìn)行說明。
2014年9月,6位平均年齡72歲的老人從成都出發(fā),沿川藏公路318國道,歷時19天到達(dá)拉薩(圖略),完成了他們“追尋陽光、倡導(dǎo)環(huán)保、騎行川藏線”的夢想。
(1)川藏線道路艱險,沿途自然環(huán)境復(fù)雜多變。請推測老人們在騎行途中需要克服的不利自然條件。
(2)老人們原打算在7-8月騎行,在查閱氣象資料(表略)后,他們決定避開7-8月出行。簡述老人們這樣可以避開哪些不利于出行的因素。
(3)為應(yīng)對沿途各種自然挑戰(zhàn),老人們在出發(fā)前制定了一個物品清單。請對清單進(jìn)行補(bǔ)充,并說明攜帶這些物品的理由。
(4)近年來,川藏線成為自駕游的熱門線路,這給沿線生態(tài)環(huán)境造成了一定破壞。相對于駕駛汽車,騎行川藏線有哪些優(yōu)點(diǎn)?
上述測試項目沒有考查學(xué)生有關(guān)青藏高原地形、氣候等方面的知識,而是結(jié)合6位老人騎行川藏線的報道,設(shè)計了4個問題讓學(xué)生解答,要求學(xué)生從文字、圖像、表格中獲取關(guān)于地球表層環(huán)境的信息,并以此分析、解釋、評價6位老人的騎行川藏線行為,考查學(xué)生能否從人地關(guān)系的角度思考問題,具有一定的環(huán)境保護(hù)意識和地理實踐力。這便是一個素養(yǎng)立意的測評項目,它從已往以客觀測驗、選擇反應(yīng)為主的是非題和選擇題等測試,轉(zhuǎn)向以考查學(xué)生在一定情境中的建構(gòu)反應(yīng)為主的表現(xiàn)性測評,注重完成任務(wù)的過程和結(jié)果,包括活動作品或制品等;從已往分解性、點(diǎn)對點(diǎn)的碎片式測驗轉(zhuǎn)向關(guān)注學(xué)科知識與學(xué)生經(jīng)驗的聯(lián)系以及學(xué)科知識之間內(nèi)在關(guān)聯(lián)的綜合考查,強(qiáng)調(diào)對事物或現(xiàn)象的整體性思考和行動,改變過于關(guān)注知識點(diǎn)認(rèn)知的狀況;從過去憑個人經(jīng)驗的隨意測驗,轉(zhuǎn)向依據(jù)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)、基于核心素養(yǎng)發(fā)展模型的規(guī)范測評,強(qiáng)調(diào)遵循一定的測評程序,通過專業(yè)人員的審查等改進(jìn)測評項目質(zhì)量。大規(guī)模的測評通常要求選擇適當(dāng)?shù)臏y量模型,把得到的分?jǐn)?shù)與構(gòu)念聯(lián)系起來,對被試的反應(yīng)進(jìn)行測量學(xué)分析,特別是效度、信度檢驗,既改進(jìn)工具質(zhì)量,也便于把握分?jǐn)?shù)的真實含義,指導(dǎo)在實踐中解釋和運(yùn)用分?jǐn)?shù)。
測評項目設(shè)計要在測評目標(biāo)、課程內(nèi)容、情境之間建立內(nèi)在關(guān)聯(lián),至少要考慮這樣幾個問題。
其一,測評項目與測評目標(biāo)的關(guān)系。如果說測評目標(biāo)是課程標(biāo)準(zhǔn)確立的理論預(yù)設(shè)的話,那么測評項目就是選取適當(dāng)方式實現(xiàn)該理論預(yù)設(shè)的過程,兩者本質(zhì)上是一致的。好的測評項目就是用來觀察學(xué)生在測評目標(biāo)上處在哪個水平。
其二,測評項目與課程主題或單元內(nèi)容的關(guān)系。測評項目任務(wù)完成或問題解答所涉及的知識技能不得超過課程內(nèi)容規(guī)定的范圍。素養(yǎng)立意的測評關(guān)注的重心不在具體的知識技能點(diǎn),但又不撇開知識技能,它主要指向?qū)W生在運(yùn)用知識技能完成任務(wù)、解答問題中所表現(xiàn)出來的素養(yǎng)水平。
其三,測評項目與情境的關(guān)系。測評項目開發(fā)關(guān)鍵性的挑戰(zhàn)是找到與課程內(nèi)容相關(guān)的真實情境,讓不同社會文化背景下的學(xué)生都能夠理解和參與。測評項目通常要求適當(dāng)簡化現(xiàn)實背景、相關(guān)情境,使學(xué)生比較容易接近;同時保持情境真實的一面,包括事情要有發(fā)生的可能性,提出的問題應(yīng)與現(xiàn)實情境相一致,解決問題的目的就像實際情境中一樣明確,應(yīng)用的語言要與實際情境相匹配,有關(guān)問題的信息和數(shù)據(jù)應(yīng)該符合實際情況,數(shù)字應(yīng)該真實,等等。
核心素養(yǎng)測評不限于學(xué)年末或?qū)W段末的紙筆測驗,更為重要的是嵌入日常教育教學(xué)過程中,通過設(shè)計綜合性的學(xué)科實踐或跨學(xué)科實踐項目進(jìn)行。各地區(qū)或中小學(xué)??梢罁?jù)課程標(biāo)準(zhǔn),結(jié)合實際情況,設(shè)計主題相對統(tǒng)一、學(xué)生可選的學(xué)科實踐或跨學(xué)科實踐項目,有效反映測評目標(biāo)的內(nèi)涵和結(jié)構(gòu),并組織探究實踐報告交流或作品、制品答辯活動,建立學(xué)生成長檔案,借以考察有關(guān)核心素養(yǎng)形成情況。這應(yīng)成為核心素養(yǎng)測評的常態(tài)。在2022年版課程標(biāo)準(zhǔn)中,有些學(xué)科的課程標(biāo)準(zhǔn)提供了少數(shù)測評項目案例,值得校長和教師仔細(xì)研讀。
核心素養(yǎng)測評項目的限定越少,學(xué)生完成任務(wù)的方式及表現(xiàn)形式就越多,解答問題的思路及答案就越多,測評越具有開放性。為此,在構(gòu)建基于課程標(biāo)準(zhǔn)的核心素養(yǎng)測評體系時,要在預(yù)測的基礎(chǔ)上,依據(jù)學(xué)業(yè)要求、學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和具體測評目標(biāo),對豐富多樣的答案、表達(dá)形式進(jìn)行梳理,建立有限且無遺漏的、有序遞進(jìn)的類別,予以相應(yīng)的分級或賦分,構(gòu)建測評量規(guī)。這是核心素養(yǎng)測評的又一個挑戰(zhàn)。
首先,測評量規(guī)的構(gòu)建要以核心素養(yǎng)發(fā)展進(jìn)階為依據(jù),以相關(guān)實證研究做基礎(chǔ)。義務(wù)教育各學(xué)科課程標(biāo)準(zhǔn)研究提出了該課程應(yīng)重點(diǎn)加以培育的3~6個核心素養(yǎng),如歷史學(xué)科中的唯物史觀、時空觀念、史料實證、歷史解釋、家國情懷。測量學(xué)把它們視為潛在的連續(xù)變量,這些變量有一個由低到高、從消極到積極、由弱到強(qiáng)的發(fā)展過程,存在著有序的質(zhì)性水平。如“歷史解釋”這一核心素養(yǎng)的初級水平如下:能夠區(qū)分歷史敘述中的史實與解釋,把握歷史發(fā)展中的部分聯(lián)系,如古今聯(lián)系,使用相關(guān)術(shù)語對具體歷史事件做出解釋;其發(fā)展水平如下:嘗試從來源、性質(zhì)和目的等多個方面,在正確的歷史觀和方法論的指導(dǎo)下,對系列史事做出解釋,并對不同解釋的原因加以評析;其更高水平如下:在盡可能占有史料的基礎(chǔ)上,嘗試驗證已往的說法或提出新的解釋,在正確的歷史觀和方法論指導(dǎo)下,全面客觀地論述歷史和現(xiàn)實問題。上述發(fā)展進(jìn)階明確指出了核心素養(yǎng)質(zhì)性水平序列及相關(guān)典型表現(xiàn),為構(gòu)建量規(guī)提供了直接依據(jù)。此外,核心素養(yǎng)測評量規(guī)可根據(jù)具體的測評項目做必要的轉(zhuǎn)化和具體化,特別是有遞進(jìn)的類別及相應(yīng)賦分應(yīng)與核心素養(yǎng)進(jìn)階水平保持一致,而不宜在此之外另搞一套評分體系。
其次,好的量規(guī)是綜合考量核心素養(yǎng)發(fā)展規(guī)律及問題或項目任務(wù)場景而做出的專業(yè)判斷,具有鮮明的導(dǎo)向性、科學(xué)性和可操作性。在導(dǎo)向性方面,它指向核心素養(yǎng)典型表現(xiàn)的分級描述,體現(xiàn)正確的育人價值導(dǎo)向,不是對任務(wù)產(chǎn)出作品或制品特征的描述,也不限于認(rèn)知層面;在科學(xué)性方面,它能準(zhǔn)確揭示特定情境中不同素養(yǎng)表現(xiàn)的實質(zhì)性差異,是系統(tǒng)梳理、反復(fù)驗證的結(jié)果,每一種可能的反應(yīng)都能納入對應(yīng)的類別;在可操作性方面,它的用詞用語應(yīng)該清晰準(zhǔn)確、無歧義,不是程度副詞、形容詞的簡單堆積。核心素養(yǎng)測評不像知識技能點(diǎn)測查那么簡單,不是所有素養(yǎng)目標(biāo)都能匹配可直接使用的測評量規(guī)。
最后,各門課程可依據(jù)課程標(biāo)準(zhǔn)和學(xué)段主要教學(xué)活動安排,開發(fā)核心素養(yǎng)測評手冊。該手冊不是單元測試題目匯編,而是分學(xué)段對區(qū)域或?qū)W校范圍內(nèi)的測評活動進(jìn)行規(guī)劃設(shè)計。測評手冊的主要內(nèi)容包括核心素養(yǎng)發(fā)展模型、評價目標(biāo)與量規(guī)、共同的表現(xiàn)性評價項目。其中核心素養(yǎng)發(fā)展模型要對課程標(biāo)準(zhǔn)中的核心素養(yǎng)內(nèi)涵、各要素間的關(guān)系及發(fā)展進(jìn)階等做必要闡釋并舉例說明,讓師生看得明白。評價目標(biāo)與量規(guī)要對期望的學(xué)段學(xué)習(xí)結(jié)果特別是素養(yǎng)發(fā)展水平做必要的界定。測評手冊依據(jù)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)即學(xué)業(yè)成就典型表現(xiàn),制定相應(yīng)的評價量規(guī),使之可把握、可操作;必要時可以主題或單元為單位,進(jìn)一步細(xì)化評價目標(biāo)和量規(guī),以強(qiáng)化其與課程內(nèi)容的連接。測評手冊還需要細(xì)化評價項目、學(xué)生表現(xiàn)證據(jù)收集與梳理、教師評分細(xì)則及反饋數(shù)據(jù)的收集和上傳、時間安排等具體評價活動。當(dāng)然,測評手冊在統(tǒng)一安排之外還應(yīng)為學(xué)?;蚪處熖峁┛蛇x擇的自主空間。
必須強(qiáng)調(diào)的是,比測評技術(shù)更重要的是測評理念的更新。義務(wù)教育階段的所有測評都倡導(dǎo)以評價促發(fā)展,以評價促進(jìn)學(xué)生自我反思、自我教育,營造一種鼓勵學(xué)生從嘗試和錯誤中學(xué)習(xí)的文化。我們知道,越是重要的素養(yǎng)往往越難測評。因此,突破核心素養(yǎng)測評卡點(diǎn),要保持對人的成長規(guī)律應(yīng)有的敬畏態(tài)度。(編輯 崔若峰)
注釋:① 本文系國家社科基金教育學(xué)重點(diǎn)課題“新時代五育融合實踐路徑與評價改革研究”(課題批準(zhǔn)號:AEA200011)的研究成果。本文作者為教育部義務(wù)教育課程修訂綜合組專家。