● 包頭市教育督導(dǎo)評估中心 董 軍
中共中央、國務(wù)院印發(fā)的《深化新時(shí)代教育評價(jià)改革總體方案》中提出,堅(jiān)持科學(xué)有效,改進(jìn)結(jié)果評價(jià),強(qiáng)化過程評價(jià),探索增值評價(jià),健全綜合評價(jià),充分利用信息技術(shù),提高教育評價(jià)的科學(xué)性、專業(yè)性、客觀性。
2017年9月,包頭市運(yùn)用信息化技術(shù)手段,采用“從入口看出口,從起點(diǎn)看變化”的增值評價(jià)理念,在全市公辦普通高中啟動第一輪學(xué)業(yè)質(zhì)量增值評價(jià)實(shí)踐探索,并于2020年高考結(jié)束后,首次發(fā)布了普通高中學(xué)業(yè)質(zhì)量增值評價(jià)報(bào)告,將評價(jià)結(jié)果納入了高中學(xué)校辦學(xué)質(zhì)量綜合評價(jià)體系中。本文嘗試以包頭市增值評價(jià)組織實(shí)施工作和《2020年包頭市普通高中學(xué)業(yè)增值評價(jià)報(bào)告》的數(shù)據(jù),來探析增值評價(jià)如何推進(jìn)普通高中育人方式的改革,改變唯分?jǐn)?shù)、唯升學(xué)的單一評價(jià)方式,引領(lǐng)社會樹立科學(xué)的教育質(zhì)量評價(jià)觀,進(jìn)而推動教育公平發(fā)展和質(zhì)量提升的積極導(dǎo)向作用。
包頭市普通高中學(xué)業(yè)質(zhì)量增值評價(jià),第一輪監(jiān)測對象為30所公辦普通高中(一批次招生學(xué)校18所,生源條件相對較高;二批次招生學(xué)校12所,生源條件相對較低)2017年秋季高一年級的學(xué)生。監(jiān)測內(nèi)容為學(xué)生的學(xué)業(yè)成績(高考科目)、學(xué)生認(rèn)知能力和學(xué)生、教師、校長相關(guān)影響因素。(如表1)
表1 招生批次與學(xué)校代碼對應(yīng)表
監(jiān)測以統(tǒng)計(jì)分析學(xué)生學(xué)業(yè)成績增值表現(xiàn)為主,輔以學(xué)生認(rèn)知能力測試和學(xué)生、教師、校長在線問卷調(diào)查。監(jiān)測期內(nèi)要形成起點(diǎn)、學(xué)年和高考三個(gè)階段六個(gè)評價(jià)報(bào)告和學(xué)生發(fā)展指數(shù)報(bào)告、兩次問卷調(diào)查數(shù)據(jù)。
不同階段的評價(jià)報(bào)告,主要是基于客觀數(shù)據(jù)呈現(xiàn)的學(xué)業(yè)成績增值變化情況來評價(jià)學(xué)生的進(jìn)步程度,進(jìn)而反映學(xué)校在一定時(shí)間內(nèi)的辦學(xué)效能。學(xué)生發(fā)展指數(shù)報(bào)告和問卷數(shù)據(jù)重點(diǎn)是通過對學(xué)生認(rèn)知能力、學(xué)習(xí)動機(jī)等發(fā)展指數(shù)和學(xué)習(xí)背景因素,以及學(xué)校管理和教師專業(yè)發(fā)展、教學(xué)表現(xiàn)等學(xué)業(yè)影響因素的分析,為學(xué)校和教師提供多維度的教育教學(xué)改進(jìn)視角與思路。
學(xué)業(yè)起點(diǎn)報(bào)告數(shù)據(jù)來源于基線測試(高一學(xué)生認(rèn)知能力紙筆測試)與高考科目對應(yīng)的中考成績,作為評價(jià)的“基準(zhǔn)”(即“前測”),此后又分別采集學(xué)生高一學(xué)年末、高二兩學(xué)期、高三上半學(xué)年和高考成績作為“后測”,用以判斷學(xué)生“后測”結(jié)果相對于“前測”的進(jìn)步程度。
《2020年包頭市普通高中學(xué)業(yè)增值評價(jià)報(bào)告》的數(shù)據(jù)是以30所高中學(xué)生的中考成績?yōu)椤扒皽y”、高考成績?yōu)椤昂鬁y”,對文理科分別統(tǒng)計(jì)分析形成的學(xué)業(yè)評價(jià)報(bào)告。文理科“前測”與“后測”的匹配學(xué)生樣本量分別為5058人和7301人,占有效高考人數(shù)的比例分別為86.31%和92.06%,具有代表性。
本增值評價(jià)各階段學(xué)業(yè)報(bào)告中的總分和各科目均使用多水平線性回歸模型計(jì)算其增值,以學(xué)生個(gè)體的“前測”成績預(yù)測學(xué)生“后測”應(yīng)達(dá)到進(jìn)步值。例如,學(xué)生A和B語文起點(diǎn)成績分別是67分和79分,預(yù)測高考成績分別為87分和92分,實(shí)際高考成績?yōu)?3分和95分,則學(xué)生A和B語文學(xué)科的增值分別為6分和3分,雖然學(xué)生A和B的語文高考成績均高于預(yù)期,但是,學(xué)生A的進(jìn)步幅度更大(示例以分?jǐn)?shù)直觀呈現(xiàn)易于理解,實(shí)際算法較為復(fù)雜,非簡單地直接比較分?jǐn)?shù)高低或差值)。
《2020年包頭市普通高中學(xué)業(yè)增值評價(jià)報(bào)告》從全市、學(xué)校、學(xué)科層面出發(fā),以翔實(shí)的數(shù)據(jù)對不同層次的學(xué)校、不同等級的學(xué)生高考文理科總分和各科目增值表現(xiàn)進(jìn)行了統(tǒng)計(jì)分析,客觀反映出學(xué)校的進(jìn)步程度和辦學(xué)效能。下面筆者以高考文理科總分增值數(shù)據(jù)為例進(jìn)行分析。
從文理科總分成績整體增值趨勢來看,分別有70%的學(xué)校增值達(dá)到或超出預(yù)期,高起點(diǎn)和低起點(diǎn)學(xué)校均實(shí)現(xiàn)不同程度的進(jìn)步(增值)。(如表2)
表2 不同層次學(xué)校增值情況分布
從評價(jià)結(jié)果來看,分?jǐn)?shù)結(jié)果評價(jià)與增值評價(jià)的差異明顯。以分?jǐn)?shù)結(jié)果來衡量學(xué)校時(shí),高起點(diǎn)與低起點(diǎn)學(xué)校的高考成績與招生批次顯著關(guān)聯(lián),生源質(zhì)量相對較好的一批次學(xué)校高考成績也相對靠前,而生源質(zhì)量相對較差的二批次學(xué)校的高考成績普遍靠后;以增值評價(jià)來衡量學(xué)校時(shí),低起點(diǎn)學(xué)校進(jìn)步幅度(增值)與高起點(diǎn)學(xué)校有了“平視”的機(jī)會。例如,高考文科均分相對靠前的學(xué)校都是一批次招生學(xué)校,較中考(起點(diǎn))相對位置沒有顯著的變化;如以進(jìn)步幅度(增值)進(jìn)行比較,則一些二批次招生學(xué)校增幅顯著高于一些一批次的學(xué)校。
從不同等級潛力生的高考表現(xiàn)來看,高分段和低分段學(xué)生群體增值不夠突出。以中高考人數(shù)匹配后的理科為例,660分以上和600分以上(不含660分及以上)兩個(gè)高分段的潛力生分別為47人和399人,其中分別有21人和209人高考成績達(dá)到或超出預(yù)期,占比為44.68%和52.38%,且兩個(gè)高分段的學(xué)生所在學(xué)校的增幅普遍低于市均值;中考處于后端的潛力生,只有48.23%的學(xué)生高考成績達(dá)到二本及以上,增幅普遍未達(dá)到預(yù)期。(如表3)
表3 理科總分不同等級人數(shù)分布比例
從學(xué)生的學(xué)業(yè)進(jìn)步程度來看,各科目不同增值分區(qū)間的學(xué)生比例與其學(xué)校的起點(diǎn)(招生批次)沒有太直接的關(guān)聯(lián)。例如,“學(xué)校2-8”與“學(xué)校1-1”生源差異較大,前者起點(diǎn)和高考成績(總均分)與后者相差都在160以上,而“學(xué)校2-8”文理科總分增值分區(qū)間達(dá)到平均進(jìn)步程度及以上水平的學(xué)生比列卻高于“學(xué)校1-1”(如下圖)。
圖 不同層次學(xué)校增值分區(qū)間學(xué)生比例分布(%)
(注:學(xué)生增值分區(qū)間由高到低分為三類:增值分≥0.75,即學(xué)生增值分區(qū)間為[ 0.75,+∞)。它描述了在某一科目上進(jìn)步程度高于平均水平的學(xué)生所占的比例,比例越高,表示該校在這一科目上的教學(xué)效能越高;-0.75<增值分<0.75,即學(xué)生增值分區(qū)間為( -0.75,0.75 )。它描述了在某一科目上進(jìn)步程度符合平均水平的學(xué)生所占的比例;增值分≤-0.75,即學(xué)生增值分區(qū)間為( -∞,-0.75 ]。它描述了在某一科目上進(jìn)步程度低于平均水平的學(xué)生所占的比例,比例越低,表示該校在這一科目上教學(xué)效能越高。)
基于以上結(jié)果分析,可以發(fā)現(xiàn),增值評價(jià)具有較為合理的評價(jià)理念及科學(xué)的統(tǒng)計(jì)方法,相對單一的分?jǐn)?shù)結(jié)果評價(jià),其在很大程度上對學(xué)校評價(jià)更加客觀公平,同時(shí)也為教學(xué)改進(jìn)提供了一定的導(dǎo)向。
傳統(tǒng)意義上,人們往往僅以高考分?jǐn)?shù)和升學(xué)率來衡量高中學(xué)校辦學(xué)質(zhì)量和學(xué)生學(xué)業(yè)發(fā)展水平。而增值評價(jià)計(jì)算增值需要對每個(gè)學(xué)生的每個(gè)科目的成績增效進(jìn)行運(yùn)算,學(xué)校的增值實(shí)際是由學(xué)生個(gè)體增值“累加”而成,學(xué)生增值越顯著,學(xué)校辦學(xué)效能就越突出。所以,增值評價(jià)可以引導(dǎo)學(xué)校評價(jià)從“關(guān)注高起點(diǎn)學(xué)校和高分段學(xué)生”向“關(guān)注全體學(xué)生的學(xué)業(yè)發(fā)展”轉(zhuǎn)變,由單一的分?jǐn)?shù)結(jié)果評價(jià)向“關(guān)注學(xué)生進(jìn)步幅度”和“學(xué)校對學(xué)生進(jìn)步助益程度”轉(zhuǎn)變。
學(xué)生成績的好壞不僅取決于學(xué)校的教學(xué)質(zhì)量,還有許多不可控的因素在起作用。往往起點(diǎn)條件好、生源質(zhì)量高的學(xué)校一般都具有高考成績好的“天然優(yōu)勢”。例如,在上述30所學(xué)校中,一批次學(xué)校相對擁有較高的起點(diǎn)和較好的生源條件,辦學(xué)條件和師資力量也相對較好,學(xué)生獲得校外資源與培訓(xùn)的機(jī)會更多,如果單純以分?jǐn)?shù)結(jié)果評價(jià),這類學(xué)校排序一般都要靠前。因而使用增值評價(jià)對學(xué)校而言更公平,因?yàn)槠錅p少了學(xué)校起點(diǎn)因素、生源因素和外部條件所帶來的影響,是一種更為公平的評價(jià)方式。
目前,單一的分?jǐn)?shù)結(jié)果評價(jià)機(jī)制過于強(qiáng)調(diào)甄別和選拔功能,忽略了評價(jià)的激勵和改進(jìn)功能。例如,上述30所學(xué)校的中高考成績排序比較,沒有發(fā)生顯著的改變,而采用增值評價(jià)衡量辦學(xué)效益時(shí),“學(xué)校1-1”和“學(xué)校1-2”等一些傳統(tǒng)優(yōu)質(zhì)的學(xué)校排序發(fā)生較大幅度的改變,甚至個(gè)別學(xué)校為負(fù)增值,這必然會讓傳統(tǒng)優(yōu)質(zhì)的學(xué)校產(chǎn)生危機(jī)意識,而諸如“學(xué)校2-8”和“學(xué)校2-9”等生源起點(diǎn)低、相對薄弱學(xué)校則有了信心。因此,增值評價(jià)有助于促進(jìn)學(xué)校良性競爭、優(yōu)化績效考核,更好地激發(fā)學(xué)校的辦學(xué)活力、調(diào)動教師的主動性與積極性。
雖然目前的增值評價(jià)仍然主要是基于分?jǐn)?shù)成績的評價(jià),但在技術(shù)層面完全可以既關(guān)注結(jié)果,也關(guān)注過程。包頭市增值評價(jià)的起點(diǎn)和四個(gè)階段的報(bào)告重點(diǎn)就是關(guān)注過程性評價(jià),發(fā)揮診斷和導(dǎo)向功能,形成學(xué)生學(xué)業(yè)發(fā)展曲線,幫助學(xué)校和教師找準(zhǔn)教學(xué)出發(fā)點(diǎn),發(fā)現(xiàn)學(xué)科增值薄弱點(diǎn)。例如,在高考學(xué)業(yè)增值報(bào)告中,對不同等級潛力生的變化分析,可以引導(dǎo)學(xué)?!坝澹ǜ叻侄螌W(xué)生培養(yǎng))”和“托底(低分段學(xué)生培養(yǎng))”并重。
總之,增值評價(jià)技術(shù)的運(yùn)用,可以引導(dǎo)學(xué)校在原有基礎(chǔ)上努力取得更大的進(jìn)步,這種“因校施評”的評價(jià)方式,使每一所學(xué)校無論起點(diǎn)高低都有了發(fā)展的空間和努力的希望,更有利于推動教育公平和教學(xué)質(zhì)量的提升。