楊新平,徐登國,楊成宏
(1,2.楚雄師范學(xué)院,云南 楚雄 675000;3.楚雄市北浦中學(xué),云南 楚雄 675000)
學(xué)生評教成績計算方法的探討*
楊新平1,徐登國2,楊成宏3
(1,2.楚雄師范學(xué)院,云南 楚雄 675000;3.楚雄市北浦中學(xué),云南 楚雄 675000)
摘要:根據(jù)學(xué)生評教數(shù)據(jù),建立列聯(lián)表,并進行一致性檢驗。在此基礎(chǔ)上,提出一種高校教師學(xué)評成績的改進算法,這種算法和傳統(tǒng)算法相比較更加合理,計算結(jié)果更具有說服力,最后進行實證分析。
關(guān)鍵詞:學(xué)生評教;列聯(lián)表;概率矩陣;結(jié)構(gòu)相對數(shù)
學(xué)生評教起源于20世紀(jì)20年代早期的美國,Purdue用于收集學(xué)生評教信息的等級量表的第一次出版,標(biāo)志著學(xué)生定量評價教學(xué)質(zhì)量的誕生[1]。80年代后,學(xué)生評價已成為大學(xué)教學(xué)評價的一個重要組成部分,評價的技術(shù)也越來越現(xiàn)代化[2]。目前學(xué)生評價教師已經(jīng)被美國和西方大多數(shù)國家認為是最基本的教學(xué)質(zhì)量評價方式,我國高校學(xué)生評價授課教師的教學(xué)質(zhì)量始于80年代中期。學(xué)生評教的目的是充分調(diào)動學(xué)生的參與積極性,結(jié)合自己的感受對教師課堂教學(xué)效果進行客觀評價,讓老師能了解自己教學(xué)的優(yōu)點、缺點及不足,進行自我完善[3]。國外學(xué)生評教的研究主要集中在學(xué)生評教的重要性、可靠性和有效性以及影響學(xué)生評教的主要因素和偏差這幾個層面。國內(nèi)高校學(xué)生評教的研究主要集中在學(xué)生評教的意義、作用及組織過程,利弊分析和對策,指標(biāo)體系研究,學(xué)生評教與師生關(guān)系以及學(xué)生評教的有效性和影響因素等各個層面。
國外的研究主要是基于統(tǒng)計與數(shù)據(jù)分析的實證研究,國內(nèi)定性研究居多,缺乏學(xué)生評價數(shù)據(jù)所含有的真實信息作支撐。王海驪以“學(xué)生評教”為檢索詞,檢索了中國期刊網(wǎng)2000年至2010年的論文,共檢索到686篇相關(guān)論文,其中基于數(shù)據(jù)分析的學(xué)生評教有效性研究有11篇,僅占1.6%[4]。筆者研究發(fā)現(xiàn),國內(nèi)學(xué)生評教研究,絕大多數(shù)都是使用方差分析或者回歸分析的方法。如毛豐付用啞變量回歸分析法對浙江某校學(xué)生評教的基礎(chǔ)數(shù)據(jù)進行計量分析,得出高校學(xué)生評教結(jié)果是有效且有偏的結(jié)論[5]。王海驪、劉晶應(yīng)用單因素方差分析和相關(guān)分析的方法得到如下結(jié)論:課程類型、教師職稱、教師性別對學(xué)生評教結(jié)果無顯著影響;學(xué)生年級與學(xué)生評教結(jié)果具有較小的相關(guān)性,課程分數(shù)與學(xué)生評教結(jié)果不相關(guān),督導(dǎo)評教與學(xué)生評教具有一定的相關(guān)性,同一教師同一課程的學(xué)生評教結(jié)果更加趨于穩(wěn)定[6]。張巖,夏秀峰應(yīng)用ERD技術(shù)設(shè)計了數(shù)據(jù)集市的概念模型,并且進一步確定了數(shù)據(jù)集市的數(shù)據(jù)源和各個主題域[7],但該模型只給出一抽象的概念模型框架,沒有進行實證分析和驗證。丁福興[8],楊毅紅[9]從描述統(tǒng)計的角度介紹了一些學(xué)評數(shù)據(jù)的分析方法。還有部分文獻從學(xué)評數(shù)據(jù)中的異常值出發(fā),對學(xué)評數(shù)據(jù)進行分析。如姚成、龔毅等從標(biāo)準(zhǔn)化得分的角度討論了異常數(shù)據(jù)的特點,給出篩選流程,提出了處理方法[10]。這些研究方法均未涉及一個關(guān)鍵的問題,那就是有了學(xué)生評教數(shù)據(jù),且這些學(xué)評數(shù)據(jù)是有效的,如何根據(jù)這些實際的學(xué)評數(shù)據(jù)計算受評教師的學(xué)評成績,并且要求這個成績能真實反映受評教師的實際教學(xué)水平。傳統(tǒng)計算方法是:用各個評價項目的平均成績作為該評價項目得分的估計,再把各個評價項目的得分估計匯總得到一個分數(shù),此分數(shù)就作為受評教師的學(xué)評成績。這種計算方法在每個評價項目沒有異常值,且每個評價項目的評價指標(biāo)的各個類別分布差別不大的情況下是適用的,得到的成績是穩(wěn)定有效的。但實際情況是這兩個條件很難滿足,導(dǎo)致的結(jié)果是學(xué)生評教成績普遍出現(xiàn)虛高的現(xiàn)象。還有一種情況是計算學(xué)生評教成績時,數(shù)據(jù)信息出現(xiàn)重疊統(tǒng)計的情況。比如文中實證部分給出某高校大學(xué)語文的學(xué)生評教成績?yōu)?00.95,這個成績是由學(xué)校教學(xué)管理部門計算出來的,沒有綜合考慮上述兩個條件,且學(xué)評數(shù)據(jù)信息被重復(fù)統(tǒng)計,導(dǎo)致成績明顯偏高。本文針對這種現(xiàn)象,重新構(gòu)造計算學(xué)生評教成績的方法,并給出最后的評價結(jié)果。
(一)傳統(tǒng)算法
將學(xué)生教學(xué)評價卡中評價項目的四個方面:教學(xué)態(tài)度、教學(xué)內(nèi)容、講授能力 (教學(xué)素質(zhì))、教學(xué)方法視為四個總體,分別記為Xk(k=1,2,3,4),每個總體均有數(shù)目不等的評價項目。對于第k個總體Xk的前mk個評價項目,不妨稱之為一般評價項目,最后一個評價項目是總體評價項目,記為第mk+1項。每個總體的評價項目的評價指標(biāo)分成四個等級,分別為優(yōu)、良、中、差,分別用[A]、[B]、[C]、[D]表示 (詳見附件1:教學(xué)評價卡和附件2:教學(xué)評估表)。實際測評時,學(xué)生只需用鉛筆將相應(yīng)的字母涂黑,同時對每個評價事項打分,可以從評價卡計算出各個評價指標(biāo)學(xué)生評定結(jié)果的頻次。
為n份教學(xué)評價卡總體評價項目的學(xué)生評教的最后得分。這是計算學(xué)生評教成績傳統(tǒng)的方法,分別得到一般評價項目得分和總體評價項目得分兩個成績,這兩個分數(shù)不能以任何方式求和,否則信息統(tǒng)計重疊。用各個總體的各個評價項目的平均分表示受評教師的該項目得分,由于內(nèi)部分組的數(shù)據(jù)計算平均值作為總體均值的估計時,各組頻數(shù)會對總平均產(chǎn)生影響[11],所以上述算法存在缺陷,需要進行修正。上述算法未考慮學(xué)生在n份教學(xué)評價卡評價指標(biāo)的各個等級的分布信息,這樣計算得到的分數(shù)作為受評教師的學(xué)評分數(shù),是不合理的,不能真實反映受評教師的真實教學(xué)水平。
(二)列聯(lián)表的建立
假定:(1)各個評價項目是相互獨立的;(2)總體之間的相關(guān)性可忽略;(3)評教數(shù)據(jù)是客觀可信的 (許多文獻的研究已證實這一點);(4)任何兩份教學(xué)評價卡填寫是相互獨立的。
(三)改進算法
表1 n份有效教學(xué)評價卡數(shù)據(jù)匯總表 (一般評價項目)
本文以某高校公共課 (大學(xué)語文)53份教學(xué)評價卡及53份教學(xué)評估表采集的數(shù)據(jù) (詳見附件1,2,涉及的學(xué)校及教師隱去了姓名)作為樣本,展開討論。53份教學(xué)評價卡采用 (二)所述方法,經(jīng)數(shù)據(jù)處理后分別得到一般評價項目和總體評價項目的4×4列聯(lián)表 (表2、表3)。分別對兩個列聯(lián)表進行一致性檢驗得知,四個總體的評價指標(biāo)的分布是有顯箸差異的,因而在計算學(xué)評結(jié)果的最后成績時一定要考慮評價指標(biāo)的分布特征,否則將導(dǎo)致受評教師成績評定不準(zhǔn)確。
表2 53份有效教學(xué)評價卡數(shù)據(jù)匯總表 (一般評價項目)
表3 53份有效教學(xué)評價卡數(shù)據(jù)匯總表 (總體評價項目)
大學(xué)語文四個總體一般評價項目的得分向量為y=(15.11,26.76,19.29,20.22),該得分向量中,得分最高的是教學(xué)內(nèi)容,說明教學(xué)內(nèi)容的確會直接影響到學(xué)生對教師的評教結(jié)果。53名學(xué)生的最后評教得分為s=81.3799分.如果根據(jù)這個分數(shù),受評教師的一般項目的學(xué)生評教成績定為“良”。另外,四個總體的總體評價得分向量為y1=(3.83,3.67,3.77,3.58),最后總體評價得分為 s1=14.8499分,折算成百分制為74.2495分。按總體評價教師學(xué)生評教成績?yōu)椤爸小?,兩者的評價結(jié)果不一致。這兩個分數(shù)是按傳統(tǒng)算法得到的,沒有考慮53名學(xué)生在教學(xué)評價卡中評價指標(biāo)各個等級的分布特征??傮w評價是對各個總體進行總的評價,用加權(quán)平均作為該名教師的學(xué)評成績,存在重復(fù)統(tǒng)計,是不合理的。如果忽略統(tǒng)計信息的重復(fù)應(yīng)用,用兩者的平均分77.8147分作為受評教師的學(xué)生評教成績,則該名教師的學(xué)生評教成績?yōu)椤爸小?,與后文采用改進算法進行計算得到的結(jié)論是一致的。
由z=yp^(49.8140,28.5711,2.9948,0),z的四個分量之和為81.3799分,正是53名學(xué)生最后的一般評價得分。但分數(shù)被分成四個部分,“優(yōu)”得49.8140分,“良”得28.5711分,“中”得2.9948分,“差”得0分。在一般情況下,四個總體中,評價指標(biāo)等級為“差”的頻次接近于0,這是因為高校教師從事的教學(xué)工作專業(yè)性較強,如果教師的教學(xué)能力較差,通常學(xué)生會集體要求更換任課教師,所以等級為“差”的頻次為0是合理的。良以上的得分為78.3851分,未達到80分以上,一般評價項目學(xué)生評教成績定為“中”。通過計算,一般評價項目各等級分數(shù)的結(jié)構(gòu)相對數(shù)向量為r=(0.612117,0.351083,0.0368,0)。
由z1=y1Q^(9.7777,4.8679,0.2043,0)得到z1的四個分量和為14.8499分,正是53名學(xué)生最后的總體評價得分。分數(shù)仍被分成四個部分,“優(yōu)”得9.7777分,“良”得4.8679分,“中”得0.2043分,“差”得0分。良以上得分為14.6453分,折算成百分制為73.2765分,總體評價項目學(xué)生評教成績定為“中”。同樣計算總體評價項目各等級分數(shù)的結(jié)構(gòu)相對數(shù)向量是r1= (0.658435,0.327807,0.013758,0),λ=0.046318較小,說明53名學(xué)生對大學(xué)語文教師的測評是認真的,測評結(jié)論是有效的。一般項目和總體評價項目得到的結(jié)論一致,該名教師最后學(xué)評成績?yōu)椤爸小?。此外,記差值矩陣為?dāng)k≥j時,△pkj共有十個元素,其中不為0的元素有8個。五元素符號為“-”,表明學(xué)生在一般評價項目選擇“良”以上的人數(shù)比總體評價選擇“良”以上的人少,53名學(xué)生在進行總體評價時,所給成績比作一般評價時偏高。r1的第一、第二個分量分別比r的第一、第二個分量大,也證實了這一點。在綜合評定大學(xué)語文的學(xué)生評教成績時,根據(jù)總體評價73.2765分,再結(jié)合一般評價78.3851分綜合考慮,最后受評教師學(xué)生評教成績定為73.2765分合適,等級為“中”。
(一)對學(xué)生評教數(shù)據(jù)進行分析時,首先要防止統(tǒng)計信息的重疊。其次,在計算受評教師的學(xué)生評教成績時,既考慮用各個評價項目的樣本均值來反映教師的教學(xué)水平,又考慮學(xué)生在評價指標(biāo) (或等級量表)的不同等級的分布,形成一種綜合的分析方法,這種分析方法可以彌補傳統(tǒng)學(xué)評成績計算方法的缺陷。此方法從學(xué)生最終評教分數(shù)中剔除了低等級中的分數(shù)成分,最后得到了能真實反映教師教學(xué)水平的學(xué)評得分。
(二)學(xué)評成績所用的計算方法是建立在教學(xué)評價卡及教學(xué)評估表設(shè)計充分合理的基礎(chǔ)之上的。教學(xué)評價卡及教學(xué)評估表設(shè)計原則以及在設(shè)計過程中需要考慮的因素,已經(jīng)有大量的文獻作過研究,也有大量的成功經(jīng)驗可以借鑒,它的合理性毋需置疑。但對于學(xué)評成績的計算,目前可查的文獻非常少,相對合理的學(xué)評成績的計算方法幾乎沒有。本文提供的計算方法還存在一些需要完善的地方,但可以起到拋磚引玉的作用,希望能引起更多的學(xué)者關(guān)注此類數(shù)據(jù)的分析計算方法,開展進一步研究。
(三)學(xué)生評教只是從學(xué)生的層面對授課教師的教學(xué)進行評價,授課教師的最終測評成績至少應(yīng)該從下面三個方面綜合考慮:(1)學(xué)生評教的成績,并且此項成績應(yīng)在最終成績中占較大比重;(2)授課教師的同行通過聽課評定的成績,此項成績在最終成績中占中等比重;(3)授課教師的主管領(lǐng)導(dǎo)評定的成績,此項成績在最終成績只能占較少比重。其中第 (1)項的評定是最復(fù)雜的,也是最值得研究的。文中所提出的分析方法和傳統(tǒng)分析方法相比,克服了傳統(tǒng)方法中的不足,計算結(jié)果更具有說服力,評定的結(jié)果更接近授課教師的真實水平,具有借鑒作用。
×××學(xué)院教學(xué)評價卡
×××學(xué)院大學(xué)語文教學(xué)評估表(教師)
16 38 71.70% 15 28.30% 0 9.40% 0 0.00% 0.8 200 3.77 17 19 35.90% 29 54.70% 5 11.30% 0 0.00% 1.2 271.2 5.12 18 23 43.40% 24 45.30% 6 5.70% 0 0.00% 1.2 274.8 5.18 19 27 50.90% 23 43.40% 3 3.80% 0 0.00% 1.2 283.2 5.34 20 33 62.30% 18 34.00% 2 3.80% 0 0.00% 1 243 4.58 21 27 50.90% 24 45.30% 2 0.00% 0 0.00% 0.8 189.6 3.58 22 38 71.70% 15 28.30% 0 3.10% 0 0.00% 1 250 4.72合計 728 62.40% 402 34.50% 36 1.90% 0 0.00% 22 5351.1 100.95
參考文獻:
[1]Kenneth.A.Feldman.Effctive College Teaching From The Students and Faculty s View:Matched or Mismatched Priorities?[J]Research in Higher Education[Z],Vol.28.1988,(04),291.
[2]陳曉端.大學(xué)學(xué)生評價教學(xué)的理論與實踐[J].比較教育研究,2001(02):29—32.
[3]譚瑩,宋萍.高校學(xué)生評教制度有效性的調(diào)查分析 [J].統(tǒng)計教育,2007(09):62—64.
[4]王海驪.基于數(shù)據(jù)分析的學(xué)生評教研究綜述 [J].中國電力教育,2011(19).
[5]毛豐付.學(xué)生評教,偏差幾何——對某校學(xué)生評教的數(shù)據(jù)分析 [J].高等教育研究,2009(03):88—91.
[6]王海驪,劉晶基于數(shù)據(jù)分析的高校學(xué)生評教研究——以2006-2009年北京某理工科高校為案例的分析[J].北京科技大學(xué)學(xué)報 (社會科學(xué)版),2012(09):155—161.
[7]張巖,夏秀峰.基于學(xué)生評教的教學(xué)分析決策數(shù)據(jù)集市模型的設(shè)計[J].沈陽師范大學(xué)學(xué)報 (自然科學(xué)版),2007(04):197—198.
[8]丁福興.高校學(xué)生評教數(shù)據(jù)的常用定量分析方法 [J].統(tǒng)計教育,2005(12):56—58.
[9]楊毅紅.Excel數(shù)據(jù)分析工具在學(xué)生評教中的應(yīng)用研究 [J].時代教育,2008(08):268—269.
[10]姚成,龔毅,濮光寧,葛文龍.學(xué)生評教異常數(shù)據(jù)的篩選與處理[J].牡丹江師范學(xué)院學(xué)報 (自然科學(xué)版),2012(03):7—8.
[11]朱洪文.應(yīng)用統(tǒng)計[M].北京:高等教育出版社,2004,7:134—135.
(責(zé)任編輯李艷梅)
中圖分類號:G4
文章標(biāo)識碼:A
文章編號:1671-7406(2015)03-0009-07
*基金項目:楚雄師范學(xué)院教學(xué)改革立項研究項目。
收稿日期:2015-01-07
作者簡介:楊新平 (1969—),男,副教授,碩士,主要從事統(tǒng)計應(yīng)用的研究和教學(xué)工作。
Discussion on the Computing Method of the Students'Evaluation of Teaching Performance
YANG Xin-ping1;XU Deng-guo2;YANG Cheng-hong3
(1,2.Chuxiong Normal University Yunnan Chuxiong 675000;3.Chuxiong Beipu Middle School Yunnan Chuxiong 675000)
Abstract:According to the data of evaluted teaching by students,contingencytable is established and the test of consistency is made.On this basis,an improved algorithm for students'evaluation on the teachers in the university is proposed.The algorithm is more reasonable compared to traditional algorithm and the results are more convincing.Finally,the empirical analysis is given.
Key words:evaluation by students;contingencytable;probability matrix;Structural relative number