摘要:文章主要介紹了近年來國內(nèi)外高校學生評教的研究重點,并從學生評教的重要性、可靠性、有效性、高校學生評教的偏差、學生評教調(diào)查表指標體系、影響學生評教的主要因素幾個方面對國內(nèi)外高校學生評教的研究重點進行了歸納。
關鍵詞:學生評教;研究綜述
學生評教已經(jīng)成為國內(nèi)外大多數(shù)高校評價教師課堂教學質量的重要組成部分,伴隨著教學改革的不斷深入以及高等教育大眾化的進程,學生評教甚至已經(jīng)開始占據(jù)教師課堂教學評價的主導地位。
一、國外高校學生評教研究重點概述
國外高校學生評教研究中比較成熟的研究成果主要集中在以下幾個方面:
(一)關于學生評教的重要性
美國20世紀80年代興起的第四代教育評價創(chuàng)立者E·枯巴(1977)和Y·S林肯(1977)認為:“評價應當是參與評價的所有人,特別是評價者與其對象雙方交互作用、共同構建統(tǒng)一觀點的過程?!庇逃彝匪购筒既R克斯頓就認為:“應定期進行學生對教師教學狀況的評價”;此外,世界著名教育家馬什、奧弗特爾也充分肯定了學生評教的重要作用。
(二)關于學生評教的可靠性
評估意見本身的可靠性,首先取決于進行評估的學生的總人數(shù)。費爾德曼(1977)和馬什(1984)的研究表明,學生評教的數(shù)量足夠多時(20或20以上),學生評教的可靠性就能勝過最好的客觀測驗??煽啃缘牧硪粋€指標是評價者評價的穩(wěn)定性程度。研究結果表明學生評教在時間上是很穩(wěn)定的,日后的經(jīng)歷不會造成對評價結果的改變。奧弗拉爾(1980)和馬什(1980)在一項跟蹤研究中發(fā)現(xiàn)學生在課程結束時和幾年后(至少是畢業(yè)一年以后)對課程結束時的評估與回顧性評估之間的相關系數(shù)為0.83(此相關系數(shù)接近評估的可靠性),并且每次的中間值幾乎相等。
(三)關于學生評教的有效性
教學效果和學生的成績之間存在顯著的關系??贫鳎?981)發(fā)現(xiàn),學生成績與技能評估值的相關值為0.5,與全課程評估值為0.47。與教師總評估值為0.43。Centra(1979)曾分析了17門課的202個班,有半數(shù)的相關系數(shù)達到0.60或者更高。學生評價和教師自評結果存在很大的一致性,馬什(1979)(1982)在兩項研究中得出,學生評價和教師自我評價之間有相似的相關性。教師自評與學生評價的相結合,比僅僅提供學生對其教學的評價的信息更能有助于教師改進教學。研究還發(fā)現(xiàn)學生評教與教師自評之間不存在實質性的差異,僅僅是對組成有效教學的不同方面的重視有所不同。那些依靠課堂觀察獲得信息的同行評價與學生的評價缺乏一致性,而不通過課堂觀察獲得信息的同行評價與學生評教的相關性卻很高。Murray(1980)比較同行評價和學生評價后認為,同行評價比學生評價信度和效度都較差,更容易受非教學因素的影響。Howard(1997)在比較當前學生、以前學生、同事和八個訓練過的觀察者做出的評價結果后同樣得出:當前學生和以前學生對教學效果的評價比教師自我評價、同事評價和訓練過的觀察者評價更具效度。
(四)關于高校學生評教的偏差
馬什(1980)檢驗了16項“潛在偏差”(學生、課程、教師背景特征)和SEEQ(學生對教育質量的評估)之間的多重關系。發(fā)現(xiàn)學科興趣最能影響評價的好壞,對期望的成績和學生評教之間的關系也有很大的作用。當同一名教師在兩種不同情況下講同一門課程時,打分的寬松度相等,期望得到的較高分數(shù)的班也會對教學效果給予較好的評估。
(五)關于學生評教調(diào)查表指標體系
教學質量評價是一個多維性評價指標體系。有關評價指標體系的研究在學生評教中較多。Marsh(1987)提出了教師教學質量評價問卷(Student’s Evaluation of Educational Quality,SEEQ)。SEEQ包括教學質量的九個維度:學習/價值感、教學熱情、組織/清晰性、群體互動、人際和諧、知識寬度、考試/評分、作業(yè)/閱讀材料、功課量/難度。大量的實踐表明,SEEQ是一項可靠而有效的度量教學質量的工具,并在實踐中已經(jīng)表現(xiàn)出良好的可靠性。Kolitch(1999)提出教學質量包含課程組織、行為管理、學生成績評定和師生關系四個評價維度。Cruickshank(1986)在總結已有的研究基礎上,指出學生評價教師著重于教師的組織能力、教學行為、課堂管理能力等方面。Wayne State University 提出SET問卷(Student Evaluation of Teacher,SET)共包括四個部分:學生基本情況,課程和教師評價,教師反饋-診斷性評價,以及開放式問題。以上這些指標體系設計的問卷對教師的教學都進行了測量,并且表現(xiàn)出了較好的可靠性和有效性。指標體系的確立目前為止并沒有統(tǒng)一的標準,而且在今后的研究中還會出現(xiàn)其他研究結果。
(六)影響學生評教的主要因素
學生評教是一項主觀性的活動,因此受多方面因素的制約,主要集中在以下幾個方面:
課程學科領域的因素,有研究發(fā)現(xiàn)數(shù)學和自然科學的教師在學生評教中的得分較低,而人文學科、語言學科與自然學科、工程學科相比較易得高分,人文學科和藝術學科屬于“高分”組,而經(jīng)濟、商務、計算機、數(shù)學、物理和工程屬于“低分”組。在班級規(guī)模大小和學生評教結果的關系上,大多數(shù)學者的研究表明,班級越小,教師越有可能得到較好的評價。也有學者認為,學生數(shù)在35-100之間教師學生評教的得分最低。在教師職稱與學生評教結果的關系上,教授往往獲得較高的分數(shù),助教尤其是第一年上課的教師評價較低。在關于教師性別和學生評教結果的關系上,結論也有不一致。在課程類型與學生評教結果的關系中,學生給主修課和選修課的評分比必修課評分高,任高年級課的教師較任低年級課的易于得高分。在學生期望得到的學習成績與學生評教結果關系中,研究發(fā)現(xiàn),學生成績與他們給教師評分之間的相關系數(shù)為0.2。在學生評教的結果與目的使用上,結果表明學生的書面被告知評價結果是用于人事的目的和用于教師改進教學目的,這兩種情況下的評價結果不存在顯著差異。但是如果是教師口頭通知學生,特別是暗示希望評分寬松一些,則通知的作用是相當大的。Greenwald和Gillmore提出,學生評教的應用會導致教師的寬厚效應從而降低了教學質量。
二、國內(nèi)高校學生評教研究成果概況
我國高校的學生評教活動已經(jīng)實施了十幾年并取得了初步的成果。理論探討主要集中在學生評教的可靠性,有效性,影響學生評教的因素,學生評教指標體系的設計等方面,這些理論的探討是在實踐中逐步完善和發(fā)展的,我國的學生評教在借鑒國外高校學生評教的過程中,也形成了一定的體系。
在學生評教的可靠性研究方面,國內(nèi)研究者對同一教師,考察其完成教師講授的課程的學生對其教學的評價與正在上該教師課的學生對其教學的評價結果的一致性,得出了與國外學者相似的結論。有學者考察了10名教師的兩次評價結果,其積差相關為0.88,顯著性大于0.001的水平,表明不同時期的學生對同一教師的評價仍然一致,說明學生對教師的評價在時間上具有一定的穩(wěn)定性。
在學生評教的有效性研究方面,南京大學的研究人員以一門課的一名教師作為評價對象,研究學生自評和學生考試成績與學生評價教師教學效果之間的關系,結果表明學生能有效地評價教師的教學效果。
在關于影響學生評教的因素研究發(fā)現(xiàn),不同性別教師之間不存在差異,性別對學生評教結果沒有影響,但是在不同職稱教師間存在明顯差異,其中副教授評價相對較高,助教評價最低,不同年齡段的教師之間存在差異,35至55歲的年齡組的教師得分最高,其次是55歲以上年齡組,最后是35歲以下年齡組。
在參與學生評教的學生方面,不同年級的學生對教師課堂教學效果評價存在差異,大學一年級和大學四年級的學生評教要比大學二年級和大學三年級的學生的評教偏高。同一專業(yè)、同一年級、不同班級的學生對同一組任課教師的評價不存在顯著差異。
在課程上,不同性質的課程之間學生評教不存在差異,從平均分上反映出專業(yè)課得分高于公選課,公選課高于選修課;不同學科類別的課程之間學生評教存在差異,軟學科課程評價低于硬科學類課程的評價;學生評價結果與教師的嚴格要求呈顯著正相關,說明教師對學生的嚴格要求程度越高,學生對其評價分也越高。
在問卷的制定和實施方面,我國高校學生評教采用的主要是問卷法(包括網(wǎng)上調(diào)查)、座談法、和指標體系法。填表一般是采取無記名方式,在時間的選擇上,一般定在每學期期末考試前幾周,由學校相關部門負責發(fā)放和回收。學生評教工作的統(tǒng)計工作一般是由計算機進行讀卡,也有些高校是進行人工統(tǒng)計,也有在網(wǎng)上直接評教的。統(tǒng)計結束后學校一般會給出統(tǒng)計結果,大部分高校不公布具體的總分及名次,只給教師評出“合格”,“優(yōu)秀”,“滿意”,“非常滿意”等,有些高校會給出一些定量的分數(shù),以此希望教師在某一方面進行改進。在學生評教表的名稱上,名稱不盡相同。如,課堂教學質量調(diào)查表(華南師范大學);課程教學質量評估表(復旦大學);教師教風調(diào)查表(上海交通大學);教學質量評估表(北京師范大學);課堂教學評估問卷(中山大學);課堂教學質量評估表(南京師范大學);課堂教學評價標準(上海師范大學)。分析這些評價標準的名稱發(fā)現(xiàn),名稱大部分指向課堂教學,有的指向課程教學,有的則指向教師教風,還有的指向教學質量。在關于學生評教標準的分類的問題上,我國的高校學生評價教師課堂教學的評價標準根據(jù)各個高校的實際情況進行了不同分類,如北京師范大學制定的評價標準根據(jù)課程特點分為通用類,外語類,體育術課類(大學體育課除理論課以外的部分),實驗類,藝術類五大類。華南師范大學制定了文科類學生和理科類學生用的兩大類評價標準。南京師范大學運用一個標準,但對于特殊的課程,如體育、藝術等課程在個別的制表上做出調(diào)整。但是更多的大學目前還是使用統(tǒng)一的評價標準。分析這些評價標準發(fā)現(xiàn),只用一個評價標準的高校,其評價標準的內(nèi)容強調(diào)對各類課程的通用性,并以不同課程課堂教學的通用性為制定準則,因而其評價標準的適用性也很強。而根據(jù)課程特點進行不同程度分類的評價標準突出了不同的課程對課堂教學所提出的不同要求,從而使得評價標準更具針對性;在學生評教標準的具體內(nèi)容方面,國內(nèi)高校的學生評價教師教學的指標體系內(nèi)容主要包括教學態(tài)度、教學內(nèi)容、教學方法、教學效果等幾個方面,然后在每一個一級指標下又分出具體的指標。
參考文獻:
1、瞿葆奎.教育文集[M].人民教育出版社,1989.
2、劉本固.教育評價的理論與實踐[M].浙江教育出版社,2000.
3、陳玉琨.中國高等教育評價論[M].廣東高等教育出版社,1994.
4、泰勒著;施良方譯.課程與教學的基本原理[M].人民教育出版社,1994.
5、黃剛.高等學校教學質量管理系統(tǒng)[M].廣西師范大學出版社,1996.
6、吳剛.現(xiàn)代教育評價基礎[M].學林出版社,1996.
7、季誠鈞.大學教學與管理新論[M].東華大學出版社,2003.
8、徐輝,季誠鈞等.大學教學概論[M].浙江大學出版社,2004.
9、曹夢霞,龔方紅.網(wǎng)上學生評教的嘗試及學生評教的意義[J].理工高教研究,2003(5).
10、楊湘清,胡耀榮,楊健康.學生評教與高等教育質量保障——兼論學生評教的思路[J].高等理科教育,2003(6).
11、王明賓.關于高校教師對學生評教作用的認識及相關因素的調(diào)查研究[J].教育理論與實踐,2003(22).
12、姜國平.論學生評教權的行使[J].教育評論,2003(4).
13、劉振天.學生評教與高等教育教學質量保障[J].現(xiàn)代大學教育,2003(2).
14、安世全,關媛媛.“學生評教”的研究與思考[J].大學教育科學,2003(1).
15、Central.J.A.Determining faculty effectiveness .Jossy-Bass,1979.
16、Overall.J.V.,Marsh.H.W.Students’ Evaluation of Instruction :A longitudinal study of their stability. Journal of Educational Psychology,1980(72).
17、陳國海.學生評教若干問題的實證研究[D].上海高等教育評估研修班研討會,2000.
18、劉紅.高校學生評價教師課堂教學效果的研究[D].華中農(nóng)業(yè)大學,2004.
(作者單位:中國計量學院現(xiàn)代科技學院)