唐 興 肖燃
教師績效評價是教師績效管理的一個重要環(huán)節(jié),是指學(xué)校在一定時期內(nèi),根據(jù)績效管理的需要,針對教師承擔(dān)的工作,運(yùn)用科學(xué)的方法,對教師工作結(jié)果和工作表現(xiàn)進(jìn)行的評價,并根據(jù)評價結(jié)果做出各種人事管理決定,如教師的薪酬、職務(wù)職稱調(diào)整等[1]。 教師績效既包括與工作目標(biāo)相關(guān)的結(jié)果, 也包括教師工作的過程和行為,其中教育教學(xué)結(jié)果尤其是學(xué)生成績相對客觀、可量化,在績效評價過程中受到的關(guān)注較多。 教師績效評價關(guān)乎教師利益和學(xué)校師資隊伍建設(shè),直接影響教師工作行為變化與學(xué)校教學(xué)質(zhì)量。
目前我國中學(xué)教師績效評價普遍存在不夠科學(xué)、客觀的問題,導(dǎo)致中學(xué)教師對績效評價滿意度不高,影響了工作積極性,在一定程度上影響了中學(xué)教育教學(xué)工作質(zhì)量的提升。 由于各科難度和區(qū)分度不同,各個學(xué)科的分?jǐn)?shù)分布不相同,分?jǐn)?shù)不在同一個量尺上,所以需要尋找同一個量尺,以便比較。 近年來中學(xué)陸續(xù)進(jìn)行教育均衡、 中高考改革等一系列教育教學(xué)改革, 原有的教師教學(xué)質(zhì)量評價方法亟需適應(yīng)新的改革趨勢進(jìn)行改進(jìn)完善。 本研究基于學(xué)校管理實際需求, 解決當(dāng)前教學(xué)質(zhì)量評價中使用學(xué)生成績計算教學(xué)增值時存在的典型問題, 有效應(yīng)對區(qū)域均衡、中高考改革等教育教學(xué)改革實際情況,使教學(xué)質(zhì)量評價體系更具科學(xué)性、公平性;探索出相對自動化的評價途徑,使學(xué)校實踐操作更簡便易行。
本方法評價對象為具有考試成績科目的教師,并且適用于采取以年級為評價單元的管理模式,即在同一個年級內(nèi)對各學(xué)科教師進(jìn)行評價。 要計算教學(xué)增值,首先需要收集兩次考試成績,以一學(xué)年為評價周期為例, 要保證第一次考試成績代表該學(xué)年起點成績,第二次考試成績代表該學(xué)年終點成績,盡量保證兩次考試內(nèi)容充分體現(xiàn)該階段教學(xué)和學(xué)習(xí)內(nèi)容,并且在試題難度、結(jié)構(gòu)等方面盡可能等質(zhì),評分標(biāo)準(zhǔn)盡可能一致。
在同一個年級內(nèi)部, 所有學(xué)生均參加各個學(xué)科的考試,使用標(biāo)準(zhǔn)分?jǐn)?shù)統(tǒng)一分?jǐn)?shù)量尺。
1. 如果各個科目為全年級考生參加考試, 考試人數(shù)相同,并且其分布近似正態(tài)分布,通過將分?jǐn)?shù)標(biāo)準(zhǔn)化為 Z 分?jǐn)?shù),即用[(原始分-平均值)/標(biāo)準(zhǔn)差]。 標(biāo)準(zhǔn)化后各科各次考試分?jǐn)?shù)平均值均為0, 標(biāo)準(zhǔn)差均為1,處在同一個量尺上。 在這個量尺上,語文第一次考試的1 分和第二次考試的1 分是等價的, 語文的1 分和數(shù)學(xué)的1 分是等價的。
2. 記標(biāo)準(zhǔn)化后某科起點成績?yōu)閆科1,終點成績?yōu)閆科2, Z科1和Z科2是可比較的, 計算每名考生第二次成績減第一次成績的增值,即P科=Z科2-Z科1。 由于各科目的分?jǐn)?shù)可比較,所以語文成績的增值P語和數(shù)學(xué)成績的增值P數(shù)也是可比較的。
3. 以班級為單位,計算P科的平均值,得到班級平均增值。
4. 根據(jù)教師所教班級, 計算教師所教所有班級的平均增值,得到教師教學(xué)增值。
文理分科和高考改革的情況下,除語文、數(shù)學(xué)、英語外, 其他科目的考生人數(shù)不同, 目前全國已有14 個?。ㄖ陛犑校┻M(jìn)入了高考改革階段,本研究以高考改革后的情況進(jìn)行研究。 高考改革后,語文、數(shù)學(xué)、英語三個科目為全年級學(xué)生參加考試, 考試人數(shù)相同,其教學(xué)質(zhì)量分?jǐn)?shù)計算方法使用標(biāo)準(zhǔn)分?jǐn)?shù)即可,但物理、化學(xué)、生物、歷史、地理、政治為選考科目,考生選擇任意三科,每科考生人數(shù)不同、考生組成不同,并具有對應(yīng)的教學(xué)班級。 如選考物理的450 人,選考政治的100 人,如果選考科目仍然使用標(biāo)準(zhǔn)分,相當(dāng)于認(rèn)為將不同考生群體的能力分布變?yōu)橄嗤?,?50 人的 “物理” 能力分布和 100 人的 “地理” 能力分布相同,這顯然不合理,故需要對選考科目分?jǐn)?shù)進(jìn)行校準(zhǔn),從而實現(xiàn)各學(xué)科分?jǐn)?shù)可比較。 目前大量研究關(guān)注選考科目分?jǐn)?shù)調(diào)整的問題, 本文基于科學(xué)性和實踐操作易行的原則, 根據(jù)溫忠麟提出的分?jǐn)?shù)校準(zhǔn)方法[2],使用語文、數(shù)學(xué)、英語對選考的六科進(jìn)行分?jǐn)?shù)校準(zhǔn),然后計算教師教學(xué)質(zhì)量分?jǐn)?shù)。
1. 將各學(xué)科的分?jǐn)?shù)標(biāo)準(zhǔn)化為Z 分?jǐn)?shù),即用[(原始分-平均值)/標(biāo)準(zhǔn)差],標(biāo)準(zhǔn)化后各科各次考試分?jǐn)?shù)平均值均為0,標(biāo)準(zhǔn)差均為1,處在同一個量尺上,在這個量尺上,語文、數(shù)學(xué)、英語第一次考試中的1 分和第二次考試的1 分是等價的,語文、數(shù)學(xué)、英語三科分?jǐn)?shù)也是等價的。 標(biāo)準(zhǔn)化后的分?jǐn)?shù)記為Z科(為作區(qū)分,后文中選考科目記為Zk科)。
但由于選考科目考生群體不同, 考生能力分布不同,所以標(biāo)準(zhǔn)化后其分?jǐn)?shù)和語文、數(shù)學(xué)、英語是不等價的,需要校準(zhǔn)到同一個量尺上。 校準(zhǔn)的方法是基于選考科目與語文、數(shù)學(xué)、英語三科(合稱 “基礎(chǔ)科”)之間的相關(guān)性, 根據(jù)選考科目分?jǐn)?shù)統(tǒng)計校準(zhǔn)的弱假設(shè)[3],可以使用基礎(chǔ)科建立一個選考科目的分布,該分布和基礎(chǔ)科整體分布一致,即建立[基礎(chǔ)科→選考科目基礎(chǔ)分]的連接,然后通過選考科目考生群體在此分布中的平均值和標(biāo)準(zhǔn)差對選考科目分?jǐn)?shù)進(jìn)行校準(zhǔn),即建立[選考科目基礎(chǔ)分→選考科目分?jǐn)?shù)]的連接,使選考科目分?jǐn)?shù)與基礎(chǔ)科三科可比較,從而選考科目各科分?jǐn)?shù)也可比較。
2. 要將選考科目與語文、數(shù)學(xué)、英語聯(lián)系起來,需要建立一個橋梁, 稱為基于基礎(chǔ)科的選考科目基礎(chǔ)分 Xk科(基礎(chǔ))。 將 Zk科作為因變量,Z語、Z數(shù)、Z英為自變量,使用多元線性回歸得到回歸系數(shù),作為基礎(chǔ)科三科成績合成選考科目基礎(chǔ)分Xk科(基礎(chǔ))的權(quán)重W1、W2、W3。 公式如下:
Xk科(基礎(chǔ))=W1×Z語+W2×Z數(shù)+W3×Z英
其中 Xk科(基礎(chǔ))為該選考科目基礎(chǔ)分,Z語、Z數(shù)、Z英為語文、 數(shù)學(xué)和英語的 Z 分?jǐn)?shù),W1、W2、W3為權(quán)重,不同的k 科不同。 對于所有的考生都可以計算其Xk科(基礎(chǔ)),該分?jǐn)?shù)是用于調(diào)整 k 科分?jǐn)?shù)的基礎(chǔ)。 Xk科與Z語、Z數(shù)、Z英的多重相關(guān)系數(shù)等于Zk科和Xk科(基礎(chǔ))的皮爾遜相關(guān)系數(shù),所以Xk科(基礎(chǔ))可以作為Zk科和Z語、Z數(shù)、Z英轉(zhuǎn)換橋梁。
3. 將選考科目基礎(chǔ)分Xk科(基礎(chǔ))重新標(biāo)準(zhǔn)化為Z 分?jǐn)?shù),即:
{Zk科(基礎(chǔ))=[Xk科(基礎(chǔ))-平均值] /標(biāo)準(zhǔn)差}。
4. 計算選考了k 科的考生群體第3 步中Zk科(基礎(chǔ))的平均值和標(biāo)準(zhǔn)差,記為:Mk科考生(基礎(chǔ))和 Sk科考生(基礎(chǔ))。
5. 通過使用語文、數(shù)學(xué)、英語建立的橋梁Zk科(基礎(chǔ)), 需要將選考科目分?jǐn)?shù)校準(zhǔn)到基于基礎(chǔ)分的量尺上。
①該公式中的1 和2 指第一次考試成績和第二次考試成績。將k 科標(biāo)準(zhǔn)分的平均值校準(zhǔn)到
R是Zk科與Z語、Z數(shù)、Z英的多重相關(guān)系數(shù)(即 k 科與基礎(chǔ)科整體的關(guān)系),也是Zk科和Zk科(基礎(chǔ))的皮爾遜相關(guān)系數(shù)(Zk科與其基礎(chǔ)分之間的關(guān)系),通過此公式將k 科標(biāo)準(zhǔn)分的平均值和基礎(chǔ)分的平均值建立連接。
②將k 科標(biāo)準(zhǔn)分的標(biāo)準(zhǔn)差校準(zhǔn)到
k 科考生的基礎(chǔ)分方差為 Sk科考生(基礎(chǔ)),Zk科的默認(rèn)方差為1,通過使用Zk科與其基礎(chǔ)分之間的關(guān)系R 對二者的方差做了一個加權(quán)平均,通過此公式將k科標(biāo)準(zhǔn)分的標(biāo)準(zhǔn)差和基礎(chǔ)分的標(biāo)準(zhǔn)差建立連接。
③使用第①步計算出的Zk科,和上面計算出的校準(zhǔn)平均值(基礎(chǔ))和標(biāo)準(zhǔn)差(基礎(chǔ))計算校準(zhǔn)分?jǐn)?shù),計算公式如下:
6. 語文、數(shù)學(xué)、英語使用第1 步的Z 分?jǐn)?shù)計算每個考生的增值, 用第二次考試的Z 分?jǐn)?shù)減去第一次考試的 Z 分?jǐn)?shù),即 P科=Z科2-Z科1;選考六科使用第 5步的校準(zhǔn)分?jǐn)?shù)計算每個考生的增值, 使用第二次考試的校準(zhǔn)分?jǐn)?shù)減去第一次考試的校準(zhǔn)分?jǐn)?shù),即Pk科=①該公式中的1 和2 指第一次考試成績和第二次考試成績。。
7. 以教學(xué)班級為單位(語文、數(shù)學(xué)、英語為行政班級),計算 P科(或 Pk科)的平均值,得到教學(xué)班級平均增值。
8. 根據(jù)教師所教班級, 計算教師所教所有班級的平均增值,得到教師教學(xué)增值。
為了驗證該方法的適用性, 使用某中學(xué)的實際數(shù)據(jù)進(jìn)行理論假設(shè)驗證,并計算結(jié)果,將其結(jié)果與該學(xué)校整體教師績效評價體系其他維度指標(biāo)結(jié)果進(jìn)行對比,探討該方案的實用性。
通過結(jié)構(gòu)化訪談, 對該學(xué)校教師績效評價的困境和難點進(jìn)行調(diào)研,訪談的結(jié)果顯示,該學(xué)校主要問題在于使用學(xué)生原始成績和排名計算的教師教學(xué)質(zhì)量通過加權(quán)后, 在整個教師績效評價體系中起到了決定性作用, 這是由于使用原始成績和排名沒有經(jīng)過分?jǐn)?shù)處理,與其他維度如學(xué)生評價教師、教師互評等的量尺尺度差異較大, 如全校教師教學(xué)質(zhì)量分?jǐn)?shù)極差為5,標(biāo)準(zhǔn)差為1,而學(xué)生評價教師的分?jǐn)?shù)極差為1,標(biāo)準(zhǔn)差為0.1,二者在教師績效評價體系中的權(quán)重相當(dāng),教師教學(xué)質(zhì)量分?jǐn)?shù)則起決定性作用,使其他維度無法發(fā)揮有效作用。 并且使用原始成績和排名計算教學(xué)增值本身也存在科學(xué)性問題。 針對該學(xué)校的情況, 使用第二部分的統(tǒng)計處理方法計算教師教學(xué)增值,作為教師教學(xué)質(zhì)量維度。 該中學(xué)初中年級所有學(xué)生均參加各個科目的考試, 適用于標(biāo)準(zhǔn)分?jǐn)?shù)的評價方法, 使用初二年級的數(shù)據(jù)進(jìn)行驗證和計算結(jié)果;高一和高二年級將參加高考改革后的高考,即不進(jìn)行文理分科, 而是從六科等級性考試科目中選擇三科,適用于校準(zhǔn)分?jǐn)?shù)的評價方法,使用高二年級的數(shù)據(jù)進(jìn)行驗證和計算結(jié)果。
使用標(biāo)準(zhǔn)分?jǐn)?shù)計算教學(xué)增值需要滿足分?jǐn)?shù)分布符合正態(tài)分布, 使用初中某年級五個科目的兩次考試成績,各科各次成績的分布基本符合正態(tài)分布,可以使用標(biāo)準(zhǔn)分?jǐn)?shù)進(jìn)行計算。
使用校準(zhǔn)分?jǐn)?shù)計算教學(xué)增值,語文、數(shù)學(xué)和英語三門基礎(chǔ)科的分布需要滿足正態(tài)分布, 選考科目與基礎(chǔ)科的多重相關(guān)系數(shù)要在0.3-0.9 之間。 為了驗證該學(xué)校是否適合使用校準(zhǔn)分?jǐn)?shù)的評價方法, 使用以往多次文理分科的數(shù)據(jù)驗證物理、化學(xué)、生物、政治、歷史和地理六科與三門基礎(chǔ)科的相關(guān)是否穩(wěn)定,結(jié)果顯示:六科與三科基礎(chǔ)科的兩兩相關(guān)基本穩(wěn)定,六科與基礎(chǔ)科的多重相關(guān)穩(wěn)定, 物理與基礎(chǔ)科相關(guān)為0.7,化學(xué)為 0.6-0.7,生物為 0.6-0.7,歷史為 0.4-0.7,地理為0.4-0.5,政治為0.6-0.7。 然后使用高中某年級選課走班后的數(shù)據(jù)驗證也基本符合這種趨勢,說明該學(xué)校分?jǐn)?shù)特征符合校準(zhǔn)分?jǐn)?shù)的弱假設(shè), 可以使用該評價方法。
使用第二部分的數(shù)據(jù)處理方法, 計算出該中學(xué)初中某年級和高中某年級所有教師的教學(xué)增值分?jǐn)?shù)。 通過由學(xué)校管理層和年級部主任參加的座談會討論驗證, 兩個年級的教學(xué)增值分?jǐn)?shù)結(jié)果和主觀預(yù)期基本一致。 該中學(xué)初中某年級教學(xué)增值分?jǐn)?shù)極差(最大值與最小值的差)為0.4,標(biāo)準(zhǔn)差為0.1,高中某年級教學(xué)增值分?jǐn)?shù)極差為0.8,標(biāo)準(zhǔn)差為0.2,將其與教師績效評價的其他維度如學(xué)生評價、教師互評、管理層評價等維度對比,量尺相當(dāng),可以進(jìn)行比較,這樣可以充分發(fā)揮每一個維度的作用, 體現(xiàn)該評價體系多元評價的初衷。 將教學(xué)增值作為教學(xué)質(zhì)量分?jǐn)?shù)應(yīng)用到整個教師績效評價體系中, 還需要根據(jù)教師績效總分和各維度權(quán)重對教學(xué)增值分?jǐn)?shù)進(jìn)行調(diào)整。
本研究從解決目前教師績效評價的難點和關(guān)鍵點的角度, 提出了使用標(biāo)準(zhǔn)分?jǐn)?shù)和校準(zhǔn)分?jǐn)?shù)計算教師教學(xué)增值作為基于學(xué)生成績的教學(xué)質(zhì)量評價方法,該方法具有理論支撐,同時也能夠符合應(yīng)用的實際和需求, 為我國目前教學(xué)質(zhì)量量化評價提供了一條可行途徑。 需要特別指出的是,教師績效評價不能僅關(guān)注于以學(xué)生成績?yōu)橹鞯慕虒W(xué)結(jié)果, 還應(yīng)該關(guān)注教學(xué)過程和教師的思想情感等多個方面, 建立多元的評價體系,克服 “唯分?jǐn)?shù)” 的評價觀。 評價過程中過分強(qiáng)調(diào)結(jié)果產(chǎn)出并不能反映教師的實際投入和真實績效,甚至產(chǎn)生短期行為[4]。 在訪談的過程中,該中學(xué)原有的教學(xué)質(zhì)量評價的影響權(quán)重比較大, 確實導(dǎo)致教師在教學(xué)中過度關(guān)注學(xué)生成績的行為。 也有研究指出,教師的工作量、工作質(zhì)量、外顯工作成果和工作資歷等均對教師分配的公平感有影響, 教師對自身工作績效的認(rèn)知是綜合性的[5],所以學(xué)校不能僅使用一種指標(biāo)來確定教師的績效, 如果某一種指標(biāo)不合理的權(quán)重或計算方法導(dǎo)致其占絕對優(yōu)勢也會產(chǎn)生消極的作用。 改進(jìn)中小學(xué)教師評價應(yīng)從教師發(fā)展的角度出發(fā),建立多維度的教師績效評價體系,包括教師、學(xué)生、管理層甚至家長等多元評價主體應(yīng)參與其中。 有調(diào)查顯示,在義務(wù)教育學(xué)校里,績效考核的指標(biāo)設(shè)置、指標(biāo)權(quán)重等問題均存在一定分歧,考核辦法得不到絕大部分教師認(rèn)可與肯定[6],所以尤其要讓教師在績效評價中發(fā)揮主體作用,加強(qiáng)績效評價培訓(xùn),增強(qiáng)評價程序的透明度, 從而使教師績效評價對教師形成良好的激勵機(jī)制,在促進(jìn)教師專業(yè)發(fā)展上發(fā)揮作用,提升教師滿意度,從而提升學(xué)校教育教學(xué)水平。