摘要: 依據(jù)義務教育化學課程標準中的學業(yè)質(zhì)量設計評價目標及要求,并據(jù)此設計原創(chuàng)監(jiān)測試題,探討素養(yǎng)導向的初中化學學業(yè)質(zhì)量監(jiān)測試題設計策略。包括:科學確定評價意圖,精選并合理呈現(xiàn)試題情境,設計多種任務并關注難度進階,科學合理設定評分標準,分級評分調(diào)控題目難度,圍繞核心素養(yǎng)設計命題意圖,多個維度呈現(xiàn)題目考查指標等。建議:科學精準設計試題,確保試題、評分標準和命題意圖的一致性,科學解釋監(jiān)測結果,反饋并改進教學。
關鍵詞: 核心素養(yǎng); 義務教育化學課程標準; 學業(yè)質(zhì)量; 監(jiān)測試題
文章編號: 1005-6629(2023)04-0085-06
中圖分類號: G633.8
文獻標識碼: B
科學精準設計學業(yè)質(zhì)量監(jiān)測試題是開展日常學習監(jiān)測,了解學生階段學習效果,開展增值評價和用好評價結果的基礎。初中化學監(jiān)測試題的設計要圍繞《義務教育化學課程標準(2022年版)》(下文簡稱“課程標準”)中所提出的四類核心素養(yǎng),依據(jù)學業(yè)質(zhì)量要求來制定評價目標及要求,開發(fā)評價工具,包括:(1)題目(2)評分標準(3)命題意圖。本文在研究與實踐的基礎上從上述三個方面來呈現(xiàn)基于課程標準的命題思路,提出素養(yǎng)導向的初中化學監(jiān)測試題設計策略。
1? 核心素養(yǎng)導向的初中化學原創(chuàng)試題呈現(xiàn)
氧氣是初中化學課程學習的重要物質(zhì),課程標準規(guī)定的學習內(nèi)容包括氧氣的性質(zhì)與實驗室制法等[1]。本文以宇航和潛水為試題情境呈現(xiàn)一道經(jīng)過專家論證與經(jīng)大樣本測試的原創(chuàng)試題。
無論是在“天宮空間站”上,還是“蛟龍?zhí)枴鄙顫撈骼?,都設計有載人密封艙環(huán)境控制系統(tǒng),確保乘載人員的正常生命活動。
1-1? 載人密封艙環(huán)境控制系統(tǒng)需要控制哪些環(huán)境因素?? 。
1-2? 實驗室制取氧氣的方法通常是(寫出化學方程式)。該方法是否適合用于“天宮空間站”為宇航員提供氧氣?說明你的理由? 。
1-3? 蛟龍?zhí)柹顫撈饕话闶峭ㄟ^高壓氣態(tài)供氧,從微觀角度分析,當將高壓氧氣減壓為正常大氣壓時,改變的是分子的? ? ? ? ,此過程發(fā)生的是? ? ? ? (填“物理”或“化學”)變化。
1-4? 氧燭(見圖1)是一種緊急供氧設備。使用時,只需按動點火裝置,提供一定熱量后,便開始發(fā)生分解反應,并靠本身的反應熱維持藥塊持續(xù)反應供氧,并有氯化鈉生成。氧燭的供氧原理是? ? ? ? ? ? (寫出化學方程式)。
1-5? “國際空間站”是選用電解水的方法提供氧氣,生成的氫氣通過一系列反應再生成水,請從反應物和反應條件的角度分析選用電解水方法供氧的原因是? 。
2? 試題命制策略
2.1? 科學確定評價意圖
課程標準是確定評價目標及要求的依據(jù),設計或選用題目要基于核心素養(yǎng),根據(jù)學業(yè)質(zhì)量要求來確定要考查的核心概念、探究實踐、學科價值,并設計實踐情境來承載上述三方面的考查。為此,以科學與技術前沿的航天和潛水情境為試題情境,重組課程標準中的學業(yè)質(zhì)量描述,據(jù)此科學確定試題的評價意圖(見表1)。
2.2? 精選并合理呈現(xiàn)試題情境
試題情境指用來呈現(xiàn)題目信息的文字、圖片、圖表和表格等。情境的熟悉程度、直接程度和開放程度均影響學科能力的表現(xiàn)[2]。情境為試題提供新信息,需要學生結合已有知識并聯(lián)系實際,按照常見的、新的、簡單的或復雜的來劃分,進而形成具有不同復雜程度和結構差異的、合理的測試任務[3]。命題時,要注意選取緊密關聯(lián)學科內(nèi)容的情境素材,從不同來源來設計情境,如:日常生活、生產(chǎn)環(huán)保、實驗探究、科學研究、化學史等;從不同角度設計試題情境,如:簡單與復雜、熟悉與陌生、結構良好(封閉)與結構不良(開放)等,并關注其真實性、適用性和包容性,確保信息的權威性,杜絕政治性和科學性錯誤。在選取和篩選情境的時候往往需要查閱大量文獻,反復確認信息的科學性和可靠性,并從中抽取最適宜考查的內(nèi)容,轉化為初中生可以接受的圖文信息。
選用情境素材來命題是多步驟迭代的過程,其中涉及文獻檢索以確定并匹配考查任務,根據(jù)考查的核心內(nèi)容、學生的可接受程度與能力素養(yǎng)水平來精煉與改編,最終確定考查任務,補充必要的素材,修改完善試題等(見圖2)。用于監(jiān)測的試題情境要控制一定的信息量。情境的加工與改編要圍繞評價目標,并注重與考查內(nèi)容、任務緊密關聯(lián)。情境的呈現(xiàn)宜簡明清晰。
2.3? 設計多種任務并關注難度進階
試題任務要根據(jù)評價意圖來設計,監(jiān)測與作業(yè)等課堂評價的任務應有所區(qū)別,國際大型測評的監(jiān)測試題任務大多包括多項選擇與建構反應試題[5,6],即我國中、高考中常見的選擇、填空與簡答,這三種任務適用于標準化測試。任務的呈現(xiàn)可以采用單一題型或多種題型組合的方式。例如,例題第1問“載人密封艙環(huán)境控制系統(tǒng)需要控制哪些環(huán)境因素?? ? ? ? ?!笔褂脝我坏暮喆痤}形式呈現(xiàn)任務,而第2問“實驗室制取氧氣的方法通常是? ? ? ? ? ? ? ? ? ? ? ? (寫出化學方程式)。該方法是否適合用于‘天宮空間站’為宇航員提供氧氣?說明你的理由? ? ? ? 。”則用填空和簡答這兩種題型,分別考查了基礎知識——氧氣的實驗室制法,以及結合情境進行分析——氧氣的實驗室制法不適用于為航天員提供氧氣,因為這些方法需要不斷地提供反應物,空間站物資補給費用非常高。
試題任務的設置要考慮難度的進階。起始的題目可以考查對情境中信息的簡單加工或?qū)A知識的簡單應用。例如第1問考查的是“載人密封艙環(huán)境控制系統(tǒng)需要控制哪些環(huán)境因素”,這需要從情境中提取信息來解決問題,相對簡單。第2問前半部分考查了實驗室制取氧氣的方法,這是對基礎知識的考查,沒有涉及情境的使用,也相對簡單;第2問后半部分和第3問需要進行多步推理,這增加了試題的難度。第4問用圖片和情境的方式給出了“氧燭”的新情境,要求學生從陌生的情境中獲取信息并利用已有知識解決問題。情境的陌生度增加了試題的難度。第5問需要學生根據(jù)情境信息,利用已有知識來分析解釋國際空間站所選的供氧方式的原因。這一問綜合了情境、高水平能力、已有知識來考查,界定為較難的試題。試題難度的設計要考慮問題的復雜程度,據(jù)此來進行調(diào)控。根據(jù)知識的復雜度理論[7],學生解決問題所需要調(diào)用的知識越多,需要經(jīng)歷的解決問題的步驟越多,題目越難,因此從題目的任務設計來看,難度的設計可以源于:是否需要使用情境信息、是否需要調(diào)用多個知識、是否需要調(diào)用高水平能力、是否需要多步驟復雜推理,據(jù)此調(diào)控題目設問的難度。
3? 評分標準的設計策略
3.1? 科學合理設定評分標準
科學合理設定評分標準,是監(jiān)測試題開發(fā)的一部分,與試題本身同樣重要。用作監(jiān)測的試題,評分標準應科學、準確、簡明,便于教師閱讀和使用。本文例題滿分是12分;評分方式按照評分點以“2,1,0”分級評分,即滿分為2分,部分分數(shù)為1分,錯答或空答為0分。具體評分標準如下:
1-1氧氣、二氧化碳、濕度、溫度、氣壓(回答2項給2分,僅回答1項給1分)。
1-2-1寫出雙氧水、二氧化錳制取氧氣或加熱高錳酸鉀制取氧氣的方程式均可(未配平或缺條件給1分)。
1-2-2不適合,因為這些方法需要不斷提供反應物,空間站物資補給費用非常高(判斷和理由各1分)。
1-3間隙或間距;物理(每空1分)
1-42NaClO3催化劑△2NaCl+3O2↑(未配平或缺條件給1分)。
1-5反應物水可以循環(huán)利用;電能可以通過太陽電池板持續(xù)獲得(僅回答1項給1分)。
多人論證與試做來確定答案與評分標準是開展監(jiān)測之前的必做功課。監(jiān)測往往涉及大樣本學生測試,測試前進行專家論證與預測試是避免科學性錯誤與清晰呈現(xiàn)試題的有力保障。學?;騾^(qū)域范圍內(nèi)的監(jiān)測工作,可以請有經(jīng)驗的教學評價專家來審讀和試做題目,并重點考查題目的科學性,呈現(xiàn)形式是否適合初中階段的監(jiān)測,答案設定是否清晰簡明,以及題目考查用時是否合理等問題。預測試可以小范圍開展,請教師或部分學生參與。小樣本的學生預測試可以輔助獲取更多可能的作答,建議用分層抽樣的方法來選擇參與預測試的學生,這樣可以呈現(xiàn)不同層面學生的可能的作答。在預測試的基礎上,最終調(diào)整、確定評分標準,審讀其與題目的一致性。
3.2? 分級評分調(diào)控題目難度
分級評分是當下命題常用的方法。比格斯等根據(jù)學生在解決問題中的反應將學習的結果由低到高分為五個水平:(1)前結構水平,完全錯誤或者不相關的答案;(2)單點結構水平,只用了所給問題涉及的某一個相關信息;(3)多點結構水平,對所給問題的多個相關信息的連續(xù)使用;(4)關聯(lián)結構水平,關注問題的多個要素,并能將這些要素聯(lián)系、整合;(5)拓展抽象結構水平,能進行抽象概括,從理論的高度分析問題,并能深化問題,使問題本身的意義得到拓展[8]。提出SOLO分類理論,強調(diào)知識的聯(lián)系是學生能力發(fā)展的基礎,以它為分類依據(jù)對學習結果做出判斷能夠避免定義等級的隨意性,增加評價的可操作性,這種分級評分常用于開放性試題的評價與編制[9];考慮教師使用的可操作性,評價實踐中常對上述等級劃分進行調(diào)整,例如劃分為3~4水平。韋伯在數(shù)學與科學教育測評標準的討論中認為,要考慮解決問題的復雜程度,提出三水平分級評分標準,這在國際學生評估項目(The Program for International Student Assessment,簡稱PISA)的科學素養(yǎng)測評中已得到應用與推廣。據(jù)此本文呈現(xiàn)的例題將采用三水平分級評分:滿分、部分分數(shù)和零分。例如,例題的第2問第1空考查實驗室制取氧氣的方程式書寫,學生能從關聯(lián)結構水平出發(fā)寫出化學方程式并配平的給滿分,能從多點結構水平(反應物、生成物、條件、箭號等)出發(fā)只書寫方程式但是未配平的給1分。這是分級評分的一個實例,即根據(jù)方程式是否配平來給出分級的標準;第2空要求學生判斷實驗室制取氧氣的方法是否適用于“天宮空間站”為宇航員提供氧氣并說明理由。學生僅判斷準確給1分,能從關聯(lián)結構水平視角給出綜合解釋的給2分。這是分級評分的另一個實例,即根據(jù)學生作答任務的能力類型來給出分級的標準。第2空非常有代表性,學生的學習往往是淺表的,“知其然而不知其所以然”。在學生得出結論之后追問理由,可以考查學生是否真正理解了概念,這是解決問題的基礎。因此在評價中考查學生判斷和推理得出結論之后的解釋與分析[10],可以考查學生的深層次理解,并用于監(jiān)測試題的分級評分。
除了根據(jù)題目考查的知識點、任務的能力類型來設置評分等級之外,按照解決問題的不同角度和步驟設計分級評分等級,也是確定給出滿分和部分分數(shù)的可操作技術手段。例如,例題的最后1問,題目相對綜合而復雜,答案的視角也并不唯一,分級評分的標準是學生答對1項可以得部分分數(shù),答對2項可以得滿分。綜合上述實例的分析,分級評分等級設定的策略是根據(jù)問題解決的復雜程度區(qū)分滿分與部分分數(shù),構成復雜程度的要素包括知識點多少、能力水平高低、是否需對情境信息進行加工、推理和解決問題的步驟多少等。
4? 命題意圖的設計策略
4.1? 圍繞核心素養(yǎng)設計命題意圖
監(jiān)測試題的設計要圍繞考查目標,堅持核心素養(yǎng)立意。一道題往往涉及多類素養(yǎng)的綜合考查,并主要側重考查一類核心素養(yǎng),例如本文中例題主要側重化學觀念的考查:在航空與潛水情境中,學生應用微粒觀、分類觀、元素觀、變化觀解決實際問題。側重核心素養(yǎng)的某一方面,并不是不包含其他素養(yǎng)的考查。例如,例題還考查了學生基于情境信息設計實驗方案的能力:給出國際空間站供氧的方式,讓學生從反應物和反應條件的視角分析該方案的設計;考查了學生的科學思維,特別是在解決問題時運用分析、歸納等科學方法以及基于事實進行證據(jù)推理的能力。
4.2? 多維度呈現(xiàn)題目考查指標
多個維度呈現(xiàn)題目考查指標,是將題目、評分標準與命題意圖進行一致性思考的過程。本文例題對照評價意圖(見表1)分別從核心概念、探究實踐、學科價值、實踐情境這四個維度來系統(tǒng)設計多維細目表,并界定了題型、難度與分值(見表2)。
從核心概念維度來看,例題考查了物質(zhì)結構與性質(zhì)、化學變化,除了書寫氧氣制取的化學方程式等基礎知識外,還結合情境綜合考查了學生的微粒觀(1-3)、元素觀(1-4)、分類觀(1-3)和變化觀(1-5),以及科學思維。例如判斷變化的類型,根據(jù)元素種類與元素守恒書寫陌生反應的化學方程式等分類、分析的科學方法(1-3、1-4);根據(jù)反應條件等來考慮化學反應的實際應用的推測能力(1-5)等。
從探究實踐維度來看,紙筆測試形式的考查主要涉及對于給定的科學問題設計恰當?shù)难芯糠桨傅哪芰Α?/p>
從學科價值維度來看,根據(jù)實踐情境解決問題的設問大多旨在讓學生在閱讀情境提取信息解決問題的過程中,體會物質(zhì)和化學反應的應用價值,感受學科的價值與魅力;整個題目在實踐情境的包裹之下呈現(xiàn),情境選取的是易于激發(fā)學生好奇心與探究欲望的航天、潛水等高科技素材,在完成題目的過程中,學生要通過閱讀復雜、陌生、開放的情境來獲取未知的知識,要分析情境信息并解決問題,在這個過程中較為全面地考查了學生的化學知識與科學思維、探究方案的設計能力,注重讓學生從資料閱讀中感受我國在高科技領域的成就,激發(fā)學生的愛國熱忱與為推動社會進步而勤奮學習的責任感,體現(xiàn)了學科的價值。
從題型和難度來看,題型主要涉及選擇、填空和簡答;難度的分布涉及了低、中、高這三種類型,并呈現(xiàn)出階梯遞進與轉折的特點,既考慮了學生的接受程度,又具有一定的挑戰(zhàn)性。
5? 實踐建議
試題是構成評價工具的基礎,設計素養(yǎng)導向的初中化學監(jiān)測試題,科學精準是第一要義。課程標準的學業(yè)質(zhì)量是科學確定評價目標及要求,是設計試題、確定答案與評分標準、規(guī)劃命題意圖的依據(jù)。在實踐研究的基礎上,我們認為基于一線教師熟悉的話語體系,概括并重組學業(yè)質(zhì)量,據(jù)此來確定評價目標及要求,可以方便教師參照使用;試題命制基于課程標準,簡化而具有可操作性。
試題的情境、任務設計,評分標準的設定,命題規(guī)劃對照評分標準并保持與試題的一致性,三者的邏輯一致與自洽是評價設計的第二要義,也是評價結果解釋有據(jù)可依的前提。本文呈現(xiàn)的原創(chuàng)試題,關注試題、評分與命題意圖的一致性與自洽性,在實踐中可以直接使用來評價學生的學習;教師也可以對題目進行改編,應用于學習的不同階段。
在日常學習監(jiān)測中,應用試題進行評價,對評價結果的解釋也要基于課程標準并力求科學精準,這是評價設計的第三要義。具體而言,對照命題意圖,可以從核心概念、探究實踐、學科價值與實踐情境等不同維度,或者聚焦某一維度當中的評價觀測點來反饋學生的學習效果。學?;騾^(qū)域可以根據(jù)評價的目的來選擇已有題目、改編現(xiàn)有試題或命制原創(chuàng)試題;立足課程標準中的學業(yè)質(zhì)量要求來規(guī)劃監(jiān)測的設計、實施以及結果解釋,發(fā)揮評價的反饋功能,用好評價結果,改進優(yōu)化教學。
[致謝:北京市卓越計劃2020級化學卓越工作室“化學學科核心素養(yǎng)的學習評價研究”項目團隊和北京教育學院“核心素養(yǎng)導向的學科教育評價研究”學科創(chuàng)新平臺(XKCXPT0307)。]
參考文獻:
[1][4]中華人民共和國教育部制定. 義務教育化學課程標準(2022年版)[S]. 北京: 北京師范大學出版社, 2022: 18~23, 49.
[2] 王磊. 學科能力構成及其表現(xiàn)研究——基于學習理解、應用實踐與遷移創(chuàng)新導向的多維整合模型[J]. 教育研究, 2016, (9): 83~92, 125.
[3] 王后雄. 基于“素養(yǎng)為本”的高中化學學業(yè)水平考試命題研究[J]. 中國考試, 2018, (1): 27~38.
[5]Organization for Economic Co-operation and Development. PISA 2015 draft science framework [EB/OL]. [2015-03-17]. https://www.oecd.org/pisa/pisaproducts/Draft%20PISA%202015%20Science%20Framework%20.pdf:45.
[6]Mullis I., Martin O. M. & Foy P. et al. (2020). TIMSS 2019 International Results in Mathematics and Science. Chestnut Hill, TIMSS & PIRLS International Study Center, Lynch School of Education and Human Development, Boston College and International Association for the Evaluation of Educational Achievement (IEA): 216~263.
[7] Webb N.L.. Criteria for Alignment of Expectations and Assessments in Mathematics and Science Education[EB/OL]. [2022-11-16]. https://files.eric.ed.gov/fulltext/ED414305.pdf: 1~39.
[8][澳]約翰·彼格斯, 凱文·柯林斯著. 高凌飚, 張洪巖譯. 學習質(zhì)量評價: SOLO分類理論(可觀察的學習成果結構)[M]. 北京: 人民教育出版社, 2010: 27~35.
[9]張莉娜. 中學化學學習過程研究——理論、技術、案例[M]. 北京: 北京師范大學出版社, 2015: 53.
[10]Treagust D.F.. Development and use of diagnostic tests to evaluate students misconceptions in science [J]. International Journal of Science Education, 1988, 10(2): 159~169.