朱麗華 王凱
摘要 以某區(qū)域21所小學(xué)的樣本為例,探討區(qū)域增值評價的實(shí)施策略。借助多層線性模型,將前測成績和兩次后測成績進(jìn)行平均分、增值分等多重對比,進(jìn)而測量學(xué)校教學(xué)質(zhì)量提升幅度,考查并評價學(xué)?;蚪處煂W(xué)生學(xué)業(yè)成績影響的凈效應(yīng),其評價結(jié)果更能體現(xiàn)教師教學(xué)努力的程度和學(xué)校教學(xué)效能的水平。探討增值評價運(yùn)用給區(qū)域教育發(fā)展帶來的“增值效應(yīng)”,并為進(jìn)一步運(yùn)用評價結(jié)果促進(jìn)學(xué)校及師生發(fā)展提出建議。
關(guān)鍵詞 教育評價;增值評價;發(fā)展性評價;增值效應(yīng);區(qū)域教育發(fā)展
中圖分類號G63
文獻(xiàn)標(biāo)識碼B
文章編號1002-2384(2023)07-0031-04
注釋:① 本文系全國教育科學(xué)“十三五”規(guī)劃2019年度教育部重點(diǎn)課題“基于情緒識別技術(shù)的學(xué)科情感目標(biāo)檢測與教學(xué)設(shè)計(jì)改進(jìn)研究”(立項(xiàng)編號:DHA190365)的研究成果之一。
在深化新時代教育評價改革的背景下,如何以增值評價引領(lǐng)區(qū)域教育高質(zhì)量發(fā)展?如何精準(zhǔn)測量學(xué)校教學(xué)質(zhì)量提升的幅度?這些問題既是區(qū)域教育評價中的重點(diǎn)也是難點(diǎn)?;趥鹘y(tǒng)的終結(jié)性評價方法對學(xué)校教育效能和教師教學(xué)成果進(jìn)行評價,不僅忽略了不同學(xué)校的條件性因素差異,也無法實(shí)現(xiàn)對學(xué)生和學(xué)校發(fā)展的縱向評價,甚至產(chǎn)生“唯升學(xué)”“唯分?jǐn)?shù)”的錯誤育人導(dǎo)向,影響了區(qū)域教育的均衡發(fā)展。當(dāng)前,增值評價已被越來越多的研究者關(guān)注,相關(guān)理論不斷得到完善,相關(guān)實(shí)踐正在學(xué)生、學(xué)校、區(qū)域等不同層面展開。基于此,筆者基于前期工作經(jīng)歷,嘗試以某區(qū)域21所小學(xué)的增值評價樣本為例,探討運(yùn)用多層線性模型開展區(qū)域增值評價的可行路徑。
增值評價包含兩個重要的理念:一是“增值”理念,即一段時間內(nèi),學(xué)生在原有基礎(chǔ)上的進(jìn)步程度,解決因生源差異(起點(diǎn)差異)而導(dǎo)致的評價不公問題;二是“凈影響”理念,即通過統(tǒng)計(jì)手段,排除學(xué)校教育以外因素的影響,獲得較純粹的學(xué)校效能。因此,增值評價能夠較為客觀準(zhǔn)確、公正公平地評價學(xué)校和教師的教學(xué)努力,凸顯了以人為本、尊重每個學(xué)生的教育理念。
增值評價的關(guān)鍵是如何科學(xué)地測量“增值”,對此不同研究者提出了適配于不同場景的增值模型。其中,多層線性模型(見圖1)以嵌套結(jié)構(gòu)使數(shù)據(jù)在不同層次間產(chǎn)生關(guān)聯(lián),評價場景中的變量分層布局、相互影響,模型的評價結(jié)果科學(xué)性更強(qiáng),[1]成為目前較為主流的增值模型。
具體操作中,我們將某區(qū)域21所小學(xué)的全區(qū)第一次語文、數(shù)學(xué)、英語三個學(xué)科的統(tǒng)一監(jiān)測成績作為前測成績即基線分?jǐn)?shù),將后續(xù)開展的兩次階段性監(jiān)測成績作為后測成績即矯正分?jǐn)?shù),實(shí)施兩次增值分析。通過在學(xué)校、學(xué)生等多個層次中輸入各層相關(guān)的協(xié)變量,得到相應(yīng)的效應(yīng)量;不同起點(diǎn)的學(xué)生對應(yīng)不同的預(yù)期成績,學(xué)生增值分代表學(xué)生實(shí)際成績與預(yù)期成績的差。與之相應(yīng),如果某學(xué)生的增值分顯著大于零,則說明該學(xué)生學(xué)業(yè)表現(xiàn)高于預(yù)期;如果某學(xué)生的增值分顯著小于零,則說明該學(xué)生學(xué)業(yè)表現(xiàn)沒有達(dá)到預(yù)期。通過計(jì)算一個學(xué)校所有學(xué)生增值的均值可以進(jìn)一步得出該學(xué)校的整體增值,如果這所學(xué)校的增值顯著大于零,則說明這所學(xué)校效能超過預(yù)期水平;如果顯著小于零,則沒有達(dá)到預(yù)期水平。
1. 從平均分看學(xué)校的變化趨勢:測量學(xué)校教學(xué)質(zhì)量提升幅度
最初,我們采取最常用的觀察平均分?jǐn)?shù)變化的方式,來考查區(qū)域內(nèi)各學(xué)校在兩個教學(xué)階段的成績水平。將第一階段后測分?jǐn)?shù)名次與基線測試分?jǐn)?shù)名次進(jìn)行比較,可以發(fā)現(xiàn)絕大部分學(xué)校的名次發(fā)生了變化。通常我們會認(rèn)為,在階段檢測中學(xué)校的分?jǐn)?shù)名次提升,那么該校的教學(xué)質(zhì)量就有所提升或者說學(xué)生的成績水平在區(qū)域內(nèi)相對提高。但是問題也接踵而來:名次提升幅度相同的兩所學(xué)校,它們的質(zhì)量提升幅度也是相同的嗎?名次提高的學(xué)校與名次下降的學(xué)校相比,二者的辦學(xué)質(zhì)量差距有多大?這些問題的核心在于如何精準(zhǔn)測量學(xué)校教學(xué)質(zhì)量提升的幅度或?qū)W生在一段時間內(nèi)學(xué)業(yè)進(jìn)步的程度。
依據(jù)三次測試成績制作折線圖(見圖2),其中基線測試得到的學(xué)校成績排序具有基本的意義,反映了學(xué)生或?qū)W校的特質(zhì),如學(xué)生原來的學(xué)習(xí)差異、學(xué)校的生源差異等。而在后兩次測試中,各校的成績出現(xiàn)了很多變化,主要表現(xiàn)出兩個特點(diǎn)。其一,從宏觀來看,21所學(xué)校整體的后測成績趨勢依然遵循基線測試的走勢;其二,從微觀來看,各校的后測成績排序出現(xiàn)了上下波動。這也給我們兩點(diǎn)啟示:一是從區(qū)域內(nèi)各校成績的變化趨勢看,學(xué)校測試平均分的高低會受學(xué)業(yè)起點(diǎn)的影響;二是從各校后測成績的變化情況看,排除學(xué)業(yè)起點(diǎn)的影響,后測成績在多大程度上受學(xué)校和教師努力的影響是一個需要重視和研究的問題。因此,亟待探索一種可行的方法實(shí)現(xiàn)教學(xué)質(zhì)量分析結(jié)果的科學(xué)量化。
2. 從增值分看學(xué)校的增值表現(xiàn):考查學(xué)生學(xué)業(yè)成績影響的凈效應(yīng)
針對上述問題,增值評價運(yùn)用統(tǒng)計(jì)分析技術(shù),能夠?qū)W(xué)生成績可能產(chǎn)生影響的非學(xué)校教師因素效應(yīng)與學(xué)校教師因素效應(yīng)分離,從而考查、評價學(xué)校或教師對學(xué)生學(xué)業(yè)成績影響的凈效應(yīng),實(shí)現(xiàn)對學(xué)?;蚪處熜芨鼮榭茖W(xué)、客觀和公平的評價。我們通過多層線性模型計(jì)算增值,學(xué)生實(shí)際后測成績顯著高于預(yù)測成績,為正增值;顯著低于預(yù)測成績,為負(fù)增值;等于預(yù)測成績,為平均增值。學(xué)校增值分是將學(xué)校所有測試學(xué)生增值分的平均值,以“+”代表正增值、“〇”代表平均增值、“-”代表負(fù)增值。這樣處理的優(yōu)勢在于,關(guān)注點(diǎn)從一次考試的評價結(jié)果(某一時刻的表現(xiàn))轉(zhuǎn)變?yōu)橐欢螘r間內(nèi)學(xué)生學(xué)業(yè)的進(jìn)步程度(一段時間的發(fā)展),同時將學(xué)生的學(xué)業(yè)成績與區(qū)域總體平均值的比較轉(zhuǎn)變?yōu)榕c同樣起點(diǎn)的學(xué)生一段時期內(nèi)預(yù)期發(fā)展水平的比較。