高 巍 毛俊芳 葉 飛 顧鳴洲
(1.華中師范大學(xué) 教育學(xué)院,湖北武漢 430079;2. 華中師范大學(xué) 研究生院,湖北武漢 430079;3.華中師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院,湖北武漢 430079)
學(xué)生評教是高校教學(xué)質(zhì)量監(jiān)測的重要手段,在國內(nèi)外高校得到廣泛應(yīng)用。學(xué)生評教的總結(jié)性功能為教師的評聘、管理以及職業(yè)發(fā)展決策提供了依據(jù),形成性功能讓教師獲得學(xué)生對課堂教學(xué)及課程實施的反饋和建議。我國傳統(tǒng)的學(xué)生評教量規(guī)大多由管理者、教學(xué)論專家開發(fā),學(xué)生依據(jù)現(xiàn)成量規(guī)的評教指標(biāo)打分,完成對授課教師的評價,其優(yōu)點是指標(biāo)體系明確、操作方便、統(tǒng)計簡單,問題是所擬定的教學(xué)評價指標(biāo)是不是學(xué)生認(rèn)可的重要指標(biāo)?所有指標(biāo)的重要性在學(xué)生心目中是否有優(yōu)次之分?針對上述問題,澳大利亞芬恩(Finn)和盧維埃(Louviere)開發(fā)了最大差異量規(guī)(Best-Worst Scaling,簡稱BWS)評教工具,能夠有效提高學(xué)生評教效度,為教師及教學(xué)管理部門提供更全面科學(xué)的教學(xué)診斷與反饋。目前國內(nèi)已有學(xué)者關(guān)注該量規(guī),但對其教育應(yīng)用研究甚少,本文對其研發(fā)過程及在高校學(xué)生評教工作中的應(yīng)用進行系統(tǒng)介紹,為我國高等教育教學(xué)評價提供借鑒。
20世紀(jì)初,美國普渡大學(xué)首次開展學(xué)生評教,研發(fā)出第一份學(xué)生評教量表(Stalniker,1928)。此后,大學(xué)生評教制度在西方確立并延續(xù)了近一個世紀(jì),到1993年,美國已有85.7%的高校開展學(xué)生評教(Centra,1993)。進入21世紀(jì),學(xué)生評教制度日趨成熟,西方學(xué)者開始重新審視學(xué)生評教,其成果主要集中在學(xué)生評教的作用(Onwuegbuzie, 2009)、學(xué)生評教的信度與效度(Feldman,1977;Wachtel,1998)、評教結(jié)果的影響因素(Kenneth,1996)以及評教量規(guī)及其指標(biāo)體系(Marsh,1984)等。我國學(xué)生評教起步較晚,實踐中尚存如下問題:一,學(xué)生評教由高校教學(xué)行政管理者實施,重視其終結(jié)性評價功能,較少兼顧其診斷與反饋功能,最后異化為提高行政效率的工具(孟凡,2010;溫文君,2012);二,評教過程敷衍了事,一方面,學(xué)校對學(xué)生評教意義的宣傳不到位(邢政權(quán),2017),另一方面,學(xué)生評教時間較倉促,欠深思熟慮(薛蕾,2017);三,學(xué)生評教量規(guī)研發(fā)不科學(xué),單一刻板,程式化,未凸顯學(xué)生的主體地位等(汪利,2007;鐘錦文,2007)。
綜觀國內(nèi)外研究,如何通過研發(fā)科學(xué)評教量規(guī)進而提高學(xué)生評教的信效度是當(dāng)前研究的核心問題。隨著研究的不斷深入,我們發(fā)現(xiàn)我國高校普遍采用的學(xué)生評教量規(guī)的李克特量表與綜合評分法的局限愈發(fā)凸顯,現(xiàn)行評教量規(guī)亟待改進。李克特量表作為最具代表性的評教量規(guī),被廣泛應(yīng)用于收集學(xué)生評教數(shù)據(jù)。在李克特量表中,每個問題設(shè)“非常同意” “同意”“不一定”“不同意”“非常不同意”五級,分別記為5分、4分、3分、2分、1分。統(tǒng)計數(shù)據(jù)只需計算所有指標(biāo)項目總分即可。
李克特量表的操作流程簡單清晰,如實施得當(dāng),能夠獲得較真實的學(xué)生評教數(shù)據(jù),但該量表存在較明顯的問題,即答題者易受到一貫應(yīng)答模式的影響。不論實際問題是什么,答題者可能采用以下三種方式作答:默認(rèn)選擇(傾向于選擇同意選項),極端選擇(傾向于選擇量表兩端的選項)和中點選擇(傾向于選擇中立選項)(Baumgartner,2001)。不同的個體對題項理解不同,個人的感知特點也有所不同,學(xué)生在某一題選擇“同意”,代表的程度可能與另一名同學(xué)選擇的“非常同意”的程度相同,這種感知和理解差異降低了李克特量表的準(zhǔn)確性。因此,教育工作者常常難以通過李克特量表獲得真實的教學(xué)及課程評價反饋。此外,綜合評分法是在制定評價指標(biāo)的基礎(chǔ)上,通過打分量化處理劃定等級的指標(biāo)。如某一評價項目包含兩個評價指標(biāo),指標(biāo)一得分30,指標(biāo)二得分20,簡單相加,則此項得50分。
綜合評分法簡潔直觀,學(xué)生僅對細(xì)化的指標(biāo)打分即可,但應(yīng)用于學(xué)生評教存在較大局限。首先,綜合評分法與李克特量表存在相似的缺陷,即學(xué)生對指標(biāo)表述的理解存在較大的感知偏差,導(dǎo)致學(xué)生的內(nèi)在評分標(biāo)準(zhǔn)不一,直接降低綜合評分法的準(zhǔn)確性。另外,學(xué)生對教師評分存在主觀偏見,導(dǎo)致教師的各個指標(biāo)得分受學(xué)生個人傾向的影響,降低了評分客觀性,評價結(jié)果參考性有限。
綜上所述,目前普遍應(yīng)用的兩種學(xué)生評教方法——“李克特量表法”和“綜合評分法”存在共同局限,即評分主觀性強、學(xué)生間的感知方式不同,決定了這兩種方法都無法獲得精準(zhǔn)的評教結(jié)果。20世紀(jì)90年代,澳大利亞學(xué)者芬恩和盧維埃研發(fā)的最大差異量規(guī)彌補了此局限。隨后,盧維埃和加拿大學(xué)者馬利(Marley)共同對其進行詳細(xì)闡釋,最大差異量規(guī)隨即在社會科學(xué)研究領(lǐng)域廣泛應(yīng)用。2013年,新南威爾士大學(xué)堪培拉分校胡伯斯(Huybers,2013)將其應(yīng)用于澳大利亞高校的學(xué)生評教活動。胡伯斯不僅用最大差異量規(guī)進行教學(xué)及課程評價,還關(guān)注評價指標(biāo)在學(xué)生心目中的內(nèi)隱排序,深入挖掘?qū)W生重視的教學(xué)及課程評價維度,同時為評價指標(biāo)的調(diào)整提供依據(jù),提升學(xué)生評教的科學(xué)性。在最大差異量規(guī)中,每個問題相當(dāng)于一個項目組,每個項目組包括三個及以上評教標(biāo)準(zhǔn),學(xué)生在每個問題中指出“最好”(“最適用”或“最重要”)和“最差”(“最不適用”或“最不重要”)的評教標(biāo)準(zhǔn)。此量規(guī)的研發(fā),解決了傳統(tǒng)評教法存在的效度問題,為教師及教學(xué)管理者提供了新的思路。
澳大利亞高校利用最大差異量規(guī)進行學(xué)生評教,既包括對教師教學(xué)及課程績效的評價,也包括對教學(xué)及課程評價標(biāo)準(zhǔn)的績效—重要性程度分析;不僅有傳統(tǒng)評價量規(guī)功能的績效評價機制,還能通過績效—重要性程度分析將實際教學(xué)效果與學(xué)生對教學(xué)評價指標(biāo)的重視程度結(jié)合起來應(yīng)用??冃А匾猿潭确治鼋Y(jié)果表明,學(xué)生十分重視但實際教學(xué)效果欠佳的維度要予以高度關(guān)注,實際教學(xué)績效得分高而學(xué)生認(rèn)為不重要的維度反映了教師努力方向存在偏離。
績效評價包含教學(xué)績效評價和課程績效評價。教學(xué)績效評價是對教師教學(xué)實際效果的評價,課程評價是從學(xué)生角度圍繞課程目標(biāo)、課程內(nèi)容、課程實施方式等對課程作出評價。我們既可以通過分析績效評價改進教學(xué)行為與課程實施問題,也可以將績效評價與指標(biāo)重要性程度評價相結(jié)合,分析績效—重要性程度。使用最大差異量規(guī)進行績效評價,一般遵循訂立指標(biāo)、編制和填寫問卷、處理數(shù)據(jù)等步驟。
1.訂立指標(biāo)
績效評價在最大差異量規(guī)評價機制中承擔(dān)著傳統(tǒng)評價量規(guī)的功能。澳大利亞高校傳統(tǒng)評教量規(guī)由九項獨立指標(biāo)及總體評價構(gòu)成,但最大差異量規(guī)的評價指標(biāo)體系涵蓋教學(xué)績效和課程績效維度,因此可剔除總體評價這一項目(見表一、表二)。
表一 教學(xué)評價標(biāo)準(zhǔn)
表二 課程評價標(biāo)準(zhǔn)
2.編制與填寫問卷
在教學(xué)績效和課程績效評價問卷中,各有十二道題,每道題由對應(yīng)的九個評價指標(biāo)中的三個構(gòu)成。評教時學(xué)生要在表格最左側(cè)指出與指標(biāo)描述最相符的一項指標(biāo),在最右側(cè)指出與指標(biāo)描述最不符的一項指標(biāo),表三、表四即教學(xué)績效評價表和課程績效評價表中四道題的設(shè)計示例。表三列出的十二個問題是與授課教師教學(xué)效果相關(guān)指標(biāo)的不同組合。表四中的十二個問題是與課程評價指標(biāo)的不同組合。
表四 課程績效評價
學(xué)生回答每道問題時,實際上是在完成三次兩兩比較。在上述示例中,“該教師為我的學(xué)習(xí)提供了有用的反饋”在表三中出現(xiàn)四次。在每一題中,該指標(biāo)與兩個不同的教學(xué)績效評價指標(biāo)進行一次兩兩比較,在整套問卷中就能與所有其他指標(biāo)進行一次兩兩比較?!霸撜n程十分具有挑戰(zhàn)性和趣味性”在表四中同樣如此。這種編制題目方式的優(yōu)點在于:研究者能依據(jù)多次兩兩比較的結(jié)果得到各項評價指標(biāo)的準(zhǔn)確排序,所以全套評價表足以反映學(xué)生對所有評價指標(biāo)的內(nèi)隱排序。
3.處理數(shù)據(jù)
研究者收集數(shù)據(jù)后,有多種統(tǒng)計方式(見表五)。就可操作性而言,區(qū)間水平度量和比例度量更適用于教育研究;而就準(zhǔn)確性講,區(qū)間水平度量相較于其他數(shù)據(jù)處理方式,所得到的結(jié)果具有同等程度的科學(xué)性,也是最簡便直觀的方法。在應(yīng)用區(qū)間度量法處理數(shù)據(jù)時,一項指標(biāo)在問卷中出現(xiàn)四次,所以評價數(shù)據(jù)的取值在-4~4之間。例如,表三中“該教師為我的學(xué)習(xí)提供了有用的反饋”被選為最相符一次,被選為最不符兩次,最終的評價數(shù)據(jù)即為-1。計算每個指標(biāo)的評分平均數(shù),即可得到最終評價數(shù)據(jù),得分越高說明教師在該指標(biāo)上表現(xiàn)越好。
表五 最大差異量規(guī)數(shù)據(jù)統(tǒng)計方式
績效—重要性程度分析是在教學(xué)績效和課程績效評價的基礎(chǔ)上進行的。除關(guān)注績效之外,它還關(guān)注對相應(yīng)指標(biāo)的重要性程度評價。研究者完成績效評價與重要性程度分析后,還可將兩者進行綜合分析。
1.重要性程度評價
和績效評價問卷類似,重要性程度評價問卷同樣由十二道題構(gòu)成,每道題也由九個評價指標(biāo)中的三個構(gòu)成。但在指標(biāo)選項的表述上,重要性評價指標(biāo)體現(xiàn)一般性,而非指向某一教師或課程。例如,原指標(biāo)“該教師激發(fā)了我對他所教學(xué)科的興趣”,在重要性程度評價問卷要改為“教師能激發(fā)我對他所教學(xué)科的興趣”。各指標(biāo)做相應(yīng)修改后,形成重要性程度評價問卷指標(biāo)。
在具體操作的過程中,學(xué)生在表格最左側(cè)指出自身認(rèn)為最重要的一項指標(biāo),在最右側(cè)指出三項指標(biāo)中最不重要的一項指標(biāo),表六、表七即為教學(xué)評價指標(biāo)重要程度評價表中三道題的設(shè)計示例。表六中的十二個問題,列出了與教師教學(xué)效果相關(guān)指標(biāo)的不同組合。表七提供的十二個問題中,每題列出了三個課程評價指標(biāo)的不同組合。
表六 教學(xué)評價指標(biāo)重要性程度評價
表七 課程評價指標(biāo)重要性程度評價
2.散點圖分析
完成了績效評價和指標(biāo)重要性程度評價后,可進行績效—重要性程度分析。開展績效—重要性程度分析的原因在于:當(dāng)學(xué)生對教師教學(xué)行為和課程實施作出評價時,教育工作者可能會簡單地假設(shè)所有評價指標(biāo)處在同等重要的位置,但事實往往并非如此,教師極可能會從評估結(jié)果中得出不正確的推論。這就可能導(dǎo)致教師開展錯誤的教學(xué)變革,抑或忽略在表現(xiàn)欠佳方面作出努力。另外,常用的評價標(biāo)準(zhǔn)往往由標(biāo)準(zhǔn)開發(fā)者根據(jù)他們所認(rèn)為的評教重點制定,促進學(xué)生的發(fā)展,但該標(biāo)準(zhǔn)的制定過程沒有學(xué)生參與,簡言之,我們無法確定這些指標(biāo)是否真正反映了學(xué)生學(xué)習(xí)的切實需求。為了彌補評價標(biāo)準(zhǔn)開發(fā)的缺陷,我們需要通過學(xué)生對評價標(biāo)準(zhǔn)本身的重要性程度進行評判。
績效—重要性程度分析十分重要的,因為不同學(xué)生群體的教學(xué)需求不同。例如,學(xué)科基礎(chǔ)知識好的學(xué)生可能希望教師組織多樣化的教學(xué)活動,鼓勵學(xué)生進行知識的實踐應(yīng)用;學(xué)科基礎(chǔ)知識掌握欠佳的學(xué)生可能希望教師呈現(xiàn)清晰的知識結(jié)構(gòu),促進學(xué)生對基礎(chǔ)知識的掌握和技能的提升。因此,通過績效—重要性程度分析,教師可根據(jù)不同學(xué)生群體的需求因材施教??冃А匾苑治鲆运南笙薜男问秸故狙芯砍晒?見圖1)。
圖1 績效—重要性程度分析
調(diào)查得到的評教指標(biāo)數(shù)據(jù)以散點形式分布在圖中。根據(jù)數(shù)據(jù)所在的象限,一方面,學(xué)生認(rèn)為很重要但實際績效評價較低的象限(B部分)值得特別關(guān)注;另一方面,學(xué)生認(rèn)為不重要但實際評價較高的象限(D部分),反映了教師需要調(diào)整的教學(xué)行為。如果對所得數(shù)據(jù)進行深入研究,還可在散點圖上添加45度對角線(Nale,2000)。對角線上的散點意味著答題者認(rèn)為該評價指標(biāo)的重要性程度與績效相符,即任何高于(低于)對角線的點意味著評價指標(biāo)的重要性得分高于(低于)績效得分。例如,處于A1部分的散點意味著,盡管教師在該指標(biāo)績效方面的得分為正向得分,但相對于其重要程度而言,教師仍需要在這一象限付出更多的精力,提高績效;處于A2部分的散點意味著教師在該指標(biāo)上分配了過多的精力,相對于其重要性程度而言,教師需要調(diào)整努力的方向;處于C1和C2部分的散點則意味著學(xué)生認(rèn)為該指標(biāo)不重要,評教標(biāo)準(zhǔn)制定者需要重新考慮該指標(biāo)的合理性,教師也不宜把在此象限的投入置于首位。
3. 數(shù)據(jù)分析
本文以最大差異量規(guī)法說明澳大利亞新南威爾士大學(xué)堪培拉分校實施的學(xué)生評教。參與調(diào)查的學(xué)生共26人,數(shù)據(jù)通過區(qū)間水平度量法處理(Huybers,2013)。
1)教學(xué)評價數(shù)據(jù)及分析
在新南威爾士大學(xué)堪培拉分校的一門課程中,研究者分別進行了教學(xué)評價和課程評價,其中既包含教學(xué)和課程績效評價,也包括教學(xué)和課程的績效—重要性程度分析。教學(xué)評價數(shù)據(jù)見表八。
表八 最大差異量規(guī)學(xué)生評教數(shù)據(jù)
表格中的數(shù)據(jù)經(jīng)過區(qū)間水平度量法處理獲得,括號內(nèi)的數(shù)字列出了各項評價指標(biāo)得分排序。僅對教學(xué)績效數(shù)據(jù)進行分析可看到,教師在教學(xué)過程中需要更好地激發(fā)學(xué)生對所教學(xué)科的興趣,更好地培養(yǎng)學(xué)生的批判性思維能力,更加關(guān)注對學(xué)生學(xué)習(xí)的有效反饋。將績效評價和重要性程度評價的數(shù)據(jù)結(jié)合起來,繪制得到圖2所示的散點圖。
圖2 教學(xué)績效—重要性程度分析
由散點圖分析可知,績效偏低的三項指標(biāo)中,僅指標(biāo)2、4在“非常重要—低績效”這一需要重點關(guān)注的象限邊緣,所以我們認(rèn)為該教師的教學(xué)總體良好,無較大缺陷。然而,值得思考的是,指標(biāo)3(教師鼓勵我進行批判性思考)的兩項得分均為負(fù)值,而批判性思維是高等教育培養(yǎng)人才的基本要求,它的重要程度不容忽視,教師和教學(xué)管理者應(yīng)對其深入探究。而在“高績效”區(qū)域內(nèi),教師在指標(biāo)1和指標(biāo)8的重要程度得分高于績效得分,說明教師在這兩個維度雖然付出了努力,但相對于學(xué)生的需求而言,還需要改善;教師在指標(biāo)7上的重要程度得分低于績效程度得分,這說明教師在課堂上過于關(guān)注知識結(jié)構(gòu)的呈現(xiàn),可適當(dāng)調(diào)整后續(xù)教學(xué)行為;教師在指標(biāo)5、6、9上的績效得分高于重要程度得分,且學(xué)生對這三個評教指標(biāo)評價較低,重要程度得分為負(fù)值,說明教師需要減少此維度的投入。
2)課程評價數(shù)據(jù)及分析
研究者同樣在課堂上進行了課程績效評價和針對評價指標(biāo)的重要性程度評價,所得的評價數(shù)據(jù)見表九。從課程績效評價數(shù)據(jù)進行分析可知,這門課程若要改善績效得分現(xiàn)狀,要著重從指標(biāo)1、2、3、7、9進行改善,且學(xué)生對課程目標(biāo)的了解程度及課程目標(biāo)的實現(xiàn)程度是需要改進的關(guān)鍵。對課程的績效—重要性程度作進一步分析,得到散點圖3。
表九 最大差異量規(guī)課程評價數(shù)據(jù)
圖3 課程績效—重要性程度分析
與教學(xué)評價相比,課程評價得分散點多圍繞45度線附近,而指標(biāo)2、4、6、7在圖中的分布較分散,應(yīng)得到教師和教學(xué)管理者的關(guān)注。指標(biāo)2和指標(biāo)7是學(xué)生認(rèn)為重要的,但其績效得分為負(fù)值,這說明教育者應(yīng)重視課程反饋,也要促進課程評價方法和課程任務(wù)的轉(zhuǎn)變,使其適應(yīng)學(xué)生發(fā)展;指標(biāo)6的績效得分雖為正值,但低于重要性程度得分,教師應(yīng)在闡明課程評價要求方面作出努力;指標(biāo)4的績效得分相對于重要性程度得分較高,且重要性得分為負(fù)值,這表明教師應(yīng)在綜合考慮多方面因素基礎(chǔ)上,適當(dāng)減少該方向的投入。
最大差異量規(guī)采用對比法評估學(xué)生對各評價指標(biāo)的隱性排序,促使學(xué)生在每道題的評價指標(biāo)間進行權(quán)衡,評估各評價指標(biāo)的相對重要性,有效規(guī)避了李克特量表法和綜合評分法的局限。
從實施方式看,最大差異量規(guī)不僅能對教學(xué)及課程實施效果進行績效分析,更關(guān)鍵的是,可根據(jù)績效—重要性程度分析衡量教學(xué)和課程績效滿足學(xué)生學(xué)習(xí)需求的程度。一方面,教師可能忽視某一評價指標(biāo)在課堂上的體現(xiàn),或者教師在某一指標(biāo)上的努力程度不能滿足學(xué)生的實際需求,通過績效—重要性程度分析,教育研究者能夠深入探究這方面存在的問題,為教師實際教學(xué)提供診斷與改進建議。另一方面,教師教學(xué)過程中可能會過于看重某一指標(biāo)的實施效果,而對學(xué)生來說,教師所付出的這些努力不是他們所需要的,教師能夠依據(jù)績效—重要性程度分析結(jié)果,調(diào)整教學(xué)投入。
從評教標(biāo)準(zhǔn)看,最大差異量規(guī)深入探析了學(xué)生對評價指標(biāo)的內(nèi)隱排序,重視學(xué)生對評價量規(guī)本身進行評價,依據(jù)學(xué)生對“權(quán)威”評價指標(biāo)的排序及賦分情況,對當(dāng)前評教量規(guī)做出調(diào)整,充分發(fā)揮學(xué)生評教的主體作用。
從實施結(jié)果看,最大差異量規(guī)可捕捉學(xué)生對評教指標(biāo)的細(xì)微感知差異,使評教結(jié)果更具區(qū)分度,為教師提供更真實、精準(zhǔn)的反饋。學(xué)生在作答過程中需對每道題的評價指標(biāo)進行反復(fù)斟酌比對,選出“最好”和“最差”選項,提高了評教結(jié)果的客觀性。
科學(xué)的教師評價體系能夠促進學(xué)生成長及教師專業(yè)發(fā)展,推動教育改革(高巍等,2017)。最大差異量規(guī)在國際高校評教領(lǐng)域應(yīng)用廣泛,其評價過程操作簡便,且能真實反映學(xué)生或評價主體的訴求,在最大程度上凸顯不同個體對相同評價指標(biāo)的評價差異,對我國高校學(xué)生評教具有借鑒價值。
最大差異量規(guī)的關(guān)鍵突破在于它將課程及教學(xué)評價指標(biāo)的重要性程度分析置于重要地位。通過學(xué)生對重要性程度的分析,結(jié)合課程及教學(xué)的實際成效,研究人員能夠辨明當(dāng)前評價標(biāo)準(zhǔn)制定工作的薄弱點,充分體現(xiàn)以生為本的思想。
很多高校強調(diào)向?qū)W習(xí)范式轉(zhuǎn)型,強調(diào)確立學(xué)生的主體地位,服務(wù)學(xué)生的學(xué)習(xí)需求,挖掘?qū)W生的發(fā)展?jié)摿?高巍,2013),學(xué)生評教的意義也正是通過學(xué)生參與指標(biāo)確立與診斷反饋來改進教育教學(xué)工作,滿足學(xué)生的發(fā)展需求(高巍,2012)。正因如此,我們應(yīng)看到最大差異量規(guī)對學(xué)生學(xué)習(xí)需求的重視,將學(xué)生廣泛納入高校課程及教學(xué)評估標(biāo)準(zhǔn)的制定及完善過程中。
最大差異量規(guī)作為一種新型教學(xué)及課程評價量規(guī),體系完備、指標(biāo)科學(xué)、操作簡單,但在不同的評教背景下,研究者可對評教量規(guī)作出相應(yīng)的改良。本文所討論的評教群體是大學(xué)本科生與研究生,他們自我意識強,認(rèn)知能力高,意愿表達清楚,因此可結(jié)合訪談等法,充分吸納學(xué)生意見。
最大差異量規(guī)在澳大利亞高校的應(yīng)用,使原有學(xué)生評教發(fā)展有了新突破,讓學(xué)生開始認(rèn)真思考各項評價指標(biāo)的意義,權(quán)衡每個問題的各項評價指標(biāo),做出更符合實際的選擇。因此,該量規(guī)讓學(xué)生評教結(jié)果更具差異性,相比傳統(tǒng)的李克特量表和綜合評分法,讓學(xué)生評教的數(shù)據(jù)更具反饋價值。
在我國,學(xué)生評教常被視為教師和學(xué)生的業(yè)外負(fù)擔(dān),評教方式單一,評教過程形式化,致使師生難以積極開展課程及教學(xué)評價,導(dǎo)致評教幾無反饋作用。對于實踐而言,新型評教量規(guī)能夠激發(fā)教師和學(xué)生的評教熱情,能夠提升學(xué)生評教實施效果。
只評分無反饋,是目前我國學(xué)生評教普遍存在的不足。即便有反饋,往往只是簡單地將評價分?jǐn)?shù)轉(zhuǎn)達給教師(高巍等,2019)。其原因是常用的評教量規(guī)本身不能準(zhǔn)確測量學(xué)生的真實想法,無反饋價值;評教結(jié)果也沒有得到足夠的關(guān)注和重視。
最大差異量規(guī)的提出,不僅是評教形式的創(chuàng)新,還讓我們看到了深入分析評教數(shù)據(jù)的重要性。在績效—重要性程度分析時,最大差異量規(guī)采用散點圖分析,直觀地呈現(xiàn)數(shù)據(jù)間的對比關(guān)系,給教育研究工作者帶來了深入的思考。這啟發(fā)我們,不論采用何種評教量規(guī)進行學(xué)生評教活動,在獲得評教數(shù)據(jù)后,不能僅從表面的數(shù)據(jù)分布做簡單判斷,應(yīng)選擇合適的方式呈現(xiàn)數(shù)據(jù),精準(zhǔn)分析數(shù)據(jù),讓教學(xué)與課程更好地服務(wù)于學(xué)生學(xué)習(xí),促進學(xué)生發(fā)展。
最大差異量規(guī)對指標(biāo)數(shù)量和學(xué)生數(shù)量的要求較高。由上文可見,當(dāng)指標(biāo)數(shù)據(jù)為九個時,該量規(guī)效果良好。如需更多指標(biāo),該量規(guī)的問卷則需要增加更多的題目或者每道題匹配更多的選項,學(xué)生填寫及后續(xù)數(shù)據(jù)處理分析的工作量較大。就學(xué)生人數(shù)而言,以1-2個小班為宜,人數(shù)過少會使打特低或特高分的學(xué)生對數(shù)據(jù)平均值影響過大,因為處理數(shù)據(jù)時,每個學(xué)生給指標(biāo)的打分在-4到4之間,存在內(nèi)部差異。而人數(shù)過多則無法兼顧學(xué)生間的差異性,例如文科生和理科生對于某項教學(xué)指標(biāo)的績效存在較大分歧時,我們無法精準(zhǔn)判斷是由于教師教學(xué)的影響還是由文理科差異決定的。另外,最大差異量規(guī)對指標(biāo)表述的準(zhǔn)確性要求較高,如果語言不甚精準(zhǔn),容易造成歧義。例如表二中的一項指標(biāo)“該課程十分具有挑戰(zhàn)性和趣味性”,學(xué)生對同一選項里的“挑戰(zhàn)性”和“趣味性”可能存在困惑,因為挑戰(zhàn)性和趣味性不是一個邏輯維度的概念,存在“有挑戰(zhàn)性但無趣”或“有趣卻無挑戰(zhàn)性”的課程。最大差異量規(guī)選擇適合的指標(biāo),要求語言精準(zhǔn)。
最后需指出的是,最大差異量規(guī)相對于傳統(tǒng)評教量規(guī)有了顯著改進,運用得當(dāng),可改善目前高校學(xué)生評教單一機械、同質(zhì)化問題。但是最大差異量規(guī)系評價量規(guī),要真正發(fā)揮其效能還需高校教學(xué)管理部門科學(xué)制定評價指標(biāo)、規(guī)范師生參評程序、科學(xué)分析評教結(jié)果。我國高校教育教學(xué)模式、教學(xué)方法以及學(xué)情等與國外有差異,不能全然機械照搬他國其經(jīng)驗。后續(xù)對最大差異量規(guī)的研究和應(yīng)用,一方面應(yīng)該關(guān)注最大差異量規(guī)評教后,如何針對學(xué)生認(rèn)為績效低或重要性低的指標(biāo),進行后續(xù)的追蹤與改進;另一方面,需要關(guān)注如何開發(fā)一套適合我國高校的指標(biāo)體系并且切實提高師生的評教參與度,防止出現(xiàn)“為了評教而評教”的簡單化、程式化、功利化傾向。