摘要:學(xué)生評教是高校教學(xué)管理中的一項重要工作,它對教學(xué)質(zhì)量的發(fā)展有積極的促進(jìn)作用。但由于部分學(xué)生的主觀性及隨意性經(jīng)常導(dǎo)致評教數(shù)據(jù)無法客觀地反映教師的教學(xué)水平。將學(xué)生成績作為權(quán)重系數(shù)引入到教師評分中。并結(jié)合數(shù)據(jù)挖掘技術(shù)進(jìn)行統(tǒng)計。能在一定程度上彌補(bǔ)這一不足。
關(guān)鍵詞:學(xué)生評教 學(xué)生成績 權(quán)重系數(shù) 評分模式 數(shù)據(jù)挖掘
1 引言
學(xué)生評教工作已成為我國許多高校的一項常規(guī)教學(xué)管理任務(wù),通過評教能掌握教師的教學(xué)情況,督促教師改正存在的問題并提高教學(xué)質(zhì)量。有利于人才培養(yǎng)工作的進(jìn)行。我國高校開展學(xué)生評教的時間還不是很長,無論在管理經(jīng)驗還是理論研究上都還很欠缺。教師對學(xué)生評教的結(jié)果也存在質(zhì)疑,相關(guān)研究人員對學(xué)生評教可信度的爭議也一直沒有停息過。其中“學(xué)生評教量表”是引起誤差的常見因素:不同類型的課程采用相同的評價指標(biāo);指標(biāo)的權(quán)重系數(shù)設(shè)定不合理;指標(biāo)設(shè)置過于繁瑣,評價內(nèi)容交叉、重疊,學(xué)生不易理解。另外,評教時間也會影響教師評分的可信度。最后,評教的主體,即學(xué)生,是評教最重要的誤差源。
目前,國內(nèi)許多研究者及教學(xué)管理人員對以上問題作了深入思考和探討,并提出了一些解決方案,如建立較為科學(xué)的評教量表,實(shí)踐課和理論課分別建立指標(biāo)體系并進(jìn)行統(tǒng)計;簡化指標(biāo),使學(xué)生易于理解其中的內(nèi)涵;由單一的期末評價轉(zhuǎn)為形成性評價為主、終結(jié)性評價為輔的評教方式,使教師及時得到反饋信息,采用合適的教學(xué)方法。這些嘗試取得了明顯的成效,為我們繼續(xù)深入研究學(xué)生評教這項工作提供了寶貴的經(jīng)驗。但因?qū)W生本身原因而導(dǎo)致評教過程中出現(xiàn)的信度問題到目前為止還沒有比較成熟的解決方案。
2 教師評分引入學(xué)生成績作為權(quán)重系數(shù)的意義
由于學(xué)生的主觀因素而導(dǎo)致誤差是學(xué)生評教過程中最容易遇到也最難解決的問題。主要體現(xiàn)在以下方面:
(1)學(xué)生對評教工作的認(rèn)識不到位,將評教當(dāng)作走形式,存在應(yīng)付、敷衍的現(xiàn)象。部分學(xué)生給所有任課教師都打滿分或零分,甚至有學(xué)生請同學(xué)代為評教,嚴(yán)重影響了統(tǒng)計結(jié)果。
(2)有些學(xué)生存在心理誤差,給教師打分受外部因素的影響。據(jù)調(diào)查,教師職稱對學(xué)生打分有比較明顯的心理暗示。談吐風(fēng)趣的教師能大幅度提升學(xué)生對他的印象,進(jìn)而拉高評分。此外,部分學(xué)生對學(xué)歷高、外表較好的任課教師打分也稍高。
(3)師生關(guān)系也是影響學(xué)生評分的重要因素。不少學(xué)生給上課嚴(yán)格和來往較少的教師打分偏低,而如果班主任或輔導(dǎo)員是任課教師的話,通常會有很高的評分。
(4)很多學(xué)校將學(xué)生評教和教師考核掛鉤,不可避免地出現(xiàn)了部分教師和學(xué)生之間的“互惠”行為。單純以文憑為目的的學(xué)生會給要求寬松、考試容易過關(guān)的教師打高分,而這些教師希望通過這種方式獲得較好的考核結(jié)果。
由此可以看出,學(xué)生評教夾雜了大量非理性因素,一些措施可以提高學(xué)生評分的客觀性,例如統(tǒng)計中按比例去除最高分和最低分;根據(jù)教師職稱、學(xué)生成績段等要素分別統(tǒng)計:擴(kuò)大評教范圍,讓所有的學(xué)生參與評教。經(jīng)過長期的觀察,這些方法只能起到一定程度的作用。并不能完全解決某些學(xué)生評教隨意性、主觀性很強(qiáng)的問題。
從理論上來講,只選擇責(zé)任心強(qiáng)的學(xué)生進(jìn)行評教可以保證評教結(jié)果的客觀性和公正性,但事實(shí)上很難進(jìn)行操作。有些學(xué)校嘗試縮小評教學(xué)生范圍。選擇學(xué)生干部、三好學(xué)生及課代表參與學(xué)生評教,期望用這種方式避免主觀因素的干擾,但沒有取得明顯的效果,甚至出現(xiàn)負(fù)面影響:大部分教師的評分都很高,學(xué)生評教的意義也就不明顯了。
從現(xiàn)有的研究成果看,一般情況下,學(xué)習(xí)成績好的學(xué)生與教師溝通較為頻繁和深入,對教師教學(xué)中的教學(xué)內(nèi)容理解得更為透徹,更能體會教師的敬業(yè)程度。對教學(xué)效果的期望值較高,更愿意通過公正的評價。以期獲得更為優(yōu)勢的教學(xué)資源。因此,學(xué)生學(xué)習(xí)成績與學(xué)生評教客觀性呈正相關(guān),成績越好的學(xué)生,評教越公正客觀。提高一門課程中成績較好的學(xué)生評教分?jǐn)?shù)權(quán)重系數(shù),可以比較客觀地反映該門課任課教師的教學(xué)狀況。
3 以學(xué)生成績作為權(quán)重系數(shù)的評分模式
目前大部分學(xué)生評教系統(tǒng)以算術(shù)平均數(shù)的方式來得出教師的最后評分:
(s:教師總評分;s:單個學(xué)生的評分;n:評分學(xué)生數(shù))
而將學(xué)生成績作為權(quán)重系數(shù)后,教師總分為學(xué)生打分的加權(quán)平均數(shù):
(s:教師總評分;s:單個學(xué)生的評分,z,學(xué)生
評分的權(quán)重系數(shù))
圍繞這個計算方法,需要解決學(xué)生打分的權(quán)重系數(shù)z該如何設(shè)置的問題。每個學(xué)校需要根據(jù)自己的實(shí)際情況來設(shè)定權(quán)重系數(shù)(可以先確定一組系數(shù),判斷采用該組系數(shù)的計算結(jié)果是否符合要求,如果和目標(biāo)相比差距比較大則換一組系數(shù)再重新計算)。筆者參考了本校歷年學(xué)生評教及學(xué)生成績分布的情況后,根據(jù)目前情況劃分了四
個成績區(qū)間并分別設(shè)置了權(quán)重系數(shù)。
為了判斷調(diào)整后的教師評分方式是否有效,筆者從本校2004年:552008年共9個學(xué)期的學(xué)生評教數(shù)據(jù)庫中根據(jù)不同的課程類型、課程性質(zhì)、教師職稱、授課人數(shù)抽取了具有代表性的7組數(shù)據(jù)進(jìn)行測試。
從表2的統(tǒng)計結(jié)果來看,以傳統(tǒng)的方式統(tǒng)計學(xué)生評教得出的結(jié)果和專家對教師的打分相比有較大的差異,使用調(diào)整后的評分模式明顯縮小了專家評分和學(xué)生評分之間的距離。可以得出結(jié)論:對于本校來說,用目前的學(xué)生成績權(quán)重系數(shù)計算評教結(jié)果能更真實(shí)地反映教師的教學(xué)水平及態(tài)度。
需要注意的是,專家及同行的評教不能完全客觀地反映出教師的水平。從理論上講,專家能根據(jù)他們豐富的經(jīng)驗對教師的教學(xué)水平作出比較正確的判斷,但實(shí)際情況不可能要求他們經(jīng)常聽同一位教師的同一門課,教師可以根據(jù)某一堂課作精心準(zhǔn)備來迎合專家的口味:而對于本校的同行教師來說,會受到人際關(guān)系的影響,對同事的打分多少會受到主觀印象的干擾,而且同行評教容易流于形式。筆者采用的同行、專家評教匯總了多種不同源頭的數(shù)據(jù)并進(jìn)行跟蹤、糾正,相對比較客觀。一定程度上能作為判斷學(xué)生評教是否客觀的依據(jù)。但如果要對每個學(xué)期、每個教師的專家、同行評教數(shù)據(jù)作修正,從目前的實(shí)際情況來看是很難實(shí)現(xiàn)的。因此,專家、同行評教可以作為教師評分的參考,但不適合對所有的教師進(jìn)行全程評價,更不能代替學(xué)生評教。
經(jīng)過多次測試,證明一組權(quán)重系數(shù)滿足要求后,可以將它們應(yīng)用于實(shí)際的教師評分統(tǒng)計中,一般來說可以滿足近期的要求。但從長期來看,每個學(xué)校都處于不斷發(fā)展、不斷變化的過程中,學(xué)生素質(zhì)、專業(yè)設(shè)置、教師教學(xué)水平的變動都會影響到學(xué)生評教的誤差源,因此,有必要定期對權(quán)重系數(shù)進(jìn)行檢驗,決定是否進(jìn)行修正。
4 利用數(shù)據(jù)挖掘確定學(xué)生成績的權(quán)重系數(shù)
本文采用的權(quán)重系數(shù)在測試中恰好能滿足需要。使學(xué)生評分基本接近專家、同行評分。但這種巧合的情況并不多見,如果以手工的方式逐一驗證權(quán)重系數(shù)是否符合要求顯然是難以完成的。隨著人工智能的發(fā)展,引入數(shù)據(jù)挖掘技術(shù)能比較方便地解決這個問題。數(shù)據(jù)挖掘能通過分析數(shù)據(jù)庫來獲取隱藏在這些數(shù)據(jù)背后的潛在信息,自動找到、識別、確認(rèn)并預(yù)測存在于數(shù)據(jù)中的模式。這種技術(shù)已經(jīng)廣泛應(yīng)用于金融、保險、電信、零售等行業(yè),取得了令人滿意的效果。
在學(xué)生評教工作中應(yīng)用數(shù)據(jù)挖掘并不困難,大部分學(xué)校的成績管理系統(tǒng)和學(xué)生評教系統(tǒng)的數(shù)據(jù)存放于教務(wù)管理系統(tǒng)中,利用ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、加載)工具可以直接將這兩部分的數(shù)據(jù)提取到數(shù)據(jù)倉庫。通過遺傳算法或神經(jīng)網(wǎng)絡(luò)算法能讓計算機(jī)自動對初始權(quán)重系數(shù)進(jìn)行測試,直到計算出合適的權(quán)重系數(shù),具體操作步驟見圖1。
5 小結(jié)
教師評分中引入學(xué)生成績作為權(quán)重系數(shù)從技術(shù)上來看,可以對學(xué)生評教數(shù)據(jù)進(jìn)行一定程度的糾正,提高評教信度。但需要注意的幾個問題:
(1)將測試數(shù)據(jù)中的同行、專家評教分和調(diào)整后學(xué)生評教分作對比,可以判斷權(quán)重系數(shù)是否適合本校的實(shí)際情況。但就像前面所提到的那樣,同行或?qū)<以u教數(shù)據(jù)本身的信度在多數(shù)情況下是無法滿足要求的。在本測試中,筆者抽取了數(shù)據(jù)后花了大量時間對相應(yīng)的同行、專家評教數(shù)據(jù)作了修正以保證它們的信度。
(2)通過數(shù)據(jù)挖掘算法能讓各個學(xué)校得到適合自己的學(xué)生成績權(quán)重系數(shù),但它們的計算過程通常需要占用大量時間。不僅如此,確定學(xué)生的成績區(qū)間,為不同課程、不同專業(yè)、不同任課教師的每個學(xué)生的評分賦予權(quán)重系數(shù)也是一個非常消耗系統(tǒng)資源的過程,在實(shí)際運(yùn)用過程中可能會對相應(yīng)的系統(tǒng)提出比較高的硬件配置要求。
(3)本文提到的是基本的數(shù)學(xué)模型,并沒有對算法進(jìn)行優(yōu)化,還需要在這方面作深入的研究以便應(yīng)用到實(shí)際的管理工作中。
學(xué)生評教可信度不高是由多方面原因造成的。不僅需要在評價體系、統(tǒng)計算法、評教范圍方面進(jìn)行改革,而且需要完善相應(yīng)的管理制度,加強(qiáng)信息的反饋,從總體上提升評教質(zhì)量,使學(xué)生評教這項工作真正起到對教師的監(jiān)督和激勵作用。
參考文獻(xiàn):
[1]孫崇正,張德忠,肖念.學(xué)生評教活動的理論研究與實(shí)踐[J].高等教育管理,2008,(5).
[2]沈毅俊,孫林,劉慧敏.高校學(xué)生評教客觀性的影響因素研究[J].中國高等教育評估,2008,(2).
[3]陳劍啟,江曉帆.國內(nèi)外關(guān)于學(xué)生評教的相關(guān)研究綜述[J].中國集體經(jīng)濟(jì),2008,(1).
[4]陳良堤.美國大學(xué)的學(xué)生評價教師制度及給我們的啟示[J].中國成人教育,2008,(7).
[5]王建良.提高高職院校學(xué)生評教信度與效度的思考[J]_武漢職業(yè)技術(shù)學(xué)院學(xué)報,2008,(4).
[6]賀永平.高校學(xué)生評教存在的問題與對策fJ].宜賓學(xué)院學(xué)報,2008,(4).
[7]葉宏光.學(xué)生評教的信度研究[J].曲靖師范學(xué)院學(xué)報,2008,(3).