摘要:本文對收集的北京一所高校2005年以來全部任課教師的學生評教和督導專家評教及其相關數(shù)據(jù)(個案數(shù)899),進行了各種探索性分析和數(shù)學建模,結論是:學生評教與學生的專業(yè)、年級以及課程的特點相關性顯著,而與教師的年齡、性別、學歷和職稱等相關不明顯。學生評教與督導專家評教的相關性較顯著,但不是學生評教的決定性因素,對學生評教分數(shù)起決定作用的是學生的學習收獲及其滿意度這些屬于學生“就讀經(jīng)驗”的因素。這是大學生“就讀經(jīng)驗”評價模式在我國高校內部質量保障體系中的必要性和可行性的有力證明。
關鍵詞:大學生評教;就讀經(jīng)驗;相關系數(shù);數(shù)學模型;解釋度
大學生評價教師教學質量(本文簡稱“大學生評教”),是現(xiàn)在我國高校內部教學質量保障的機制之一,它在促進教學改革、提高教學質量方面發(fā)揮積極作用的同時,其客觀性、科學性也成為廣大教師質疑的焦點問題。怎樣進一步改革大學生評教?筆者認為,對過去學生評教信息的總結分析尤其是量化分析是確定新的學生評教途徑方法的基礎。通過對各院校既往學生評教的相關信息的統(tǒng)計分析,可望發(fā)現(xiàn)學生評教的關鍵問題和內在規(guī)律,針對這些問題并建立在這樣的規(guī)律基礎上的改革才是最科學有效的。
我國各高?;旧隙家逊e累下相當可觀的學生評教數(shù)據(jù),只可惜其研究價值沒有得到充分發(fā)揮,從而沒有充分發(fā)揮其對改革實踐的參考作用。國內現(xiàn)在利用評教數(shù)據(jù)的分析基本上還是停留在對“平均數(shù)”、“方差”和“百分比”等初級參數(shù)的考察上,更深入的挖掘和分析方法則極少見。
國外的大學生評教,例如美澳日英等教育先進國家,往往表現(xiàn)為對學生“就讀經(jīng)驗”的調查分析這種間接評價方式。這些國家的高等教育質量保證體系也是在對這樣的大學生就讀經(jīng)驗調查問卷不斷試用、對相應數(shù)據(jù)的不斷科學分析并構筑和完善模型的過程中逐步建立和發(fā)展起來特征的。[1][2][3] 本文就是借鑒這些國家對學生間接評教數(shù)據(jù)的處理方法,對我國高校學生評教工作中所積累的數(shù)據(jù)進行挖掘和建模分析的結果。筆者期望以此開發(fā)一種利用教育管理實際工作資料來研究我國高等教育規(guī)律的實證研究路線,也是將現(xiàn)代數(shù)據(jù)挖掘與統(tǒng)計分析的思想方法應用于高校教學管理研究的一種嘗試。
一、數(shù)據(jù)來源及分析途徑
(一)數(shù)據(jù)來源與數(shù)據(jù)結構
筆者所在的北京電子科技學院,上世紀90年代初開始學生評教工作,后幾易評價表和評價方式,到2006年春天,發(fā)展成為采用現(xiàn)行“教學質量評價表”,并進行網(wǎng)上評教的學生評教與督導組專家評教相結合的教學質量評價系統(tǒng),只不過專家的評教僅限于針對部分教師對象,學生的評教則是全體學生對全體任課教師的評價。這種評教及其改革情況在我國高校中是有代表性的。所以由該校評教樣本得出的這一研究對我國一般高校也有一定的參考作用。
在“教學態(tài)度”、“教學內容”和“教學方法”這些傳統(tǒng)項目的基礎上,該校新的學生評教表中增加了“教學效果”(學習收獲,“學習這門課,增強了學習興趣,掌握了本課程的主流思想教育內容、當代新知識點”和“學習這門課,知識應用能力和自學能力都有較大提高”)與“對課程的總體評價”(“我對本課程教學質量的整體評價非常滿意”)以及教材評價項目三個項目。評教系統(tǒng)自動將學生在這六大項目上打分的加權平均數(shù)作為該學生對相應教師的“綜合打分”(六大項目的權重依次是0.05、0.25、0.3、0.05、0.25和0.1);所有學生對教師綜合打分的平均數(shù)即為該教師的“綜合得分”;所有學生對該教師在各項目上打分的平均值即作為該教師在這一項目上的得分。顯然,評價表里的“教學效果”和“總體評價”(實際上是滿意度)項目實際上已比較接近調查學生“就讀經(jīng)驗”的問題了。為了便于分析,將這兩個項目的學生打分相加的結果作為學生對相應教師教學的“就讀經(jīng)驗”的自我得分。
從評教表的結構上看,該校2006年以來采用的學生評教表實際上表現(xiàn)為一種“混合型”的評價表模式:既有對“教學態(tài)度”、“教學內容”和“教學方法”的“評”,也有對自己收獲和滿意度這些“就讀經(jīng)驗”因素的“述”。那么,“綜合評分”與“就讀經(jīng)驗”類項目得分有怎樣的關系?同時與督導專家對教師課堂教學的評分又有怎樣的關系?
筆者整理了該校使用新評價表后2006至2009年共七個學期學生評教和教學督導專家聽課評教的資料,并進一步收集了相關教師和課程以及參評學生的信息,做成了一個小型數(shù)據(jù)庫(下文稱數(shù)據(jù)1),包括評教分數(shù)與教師年齡、性別、職稱和學歷與課程學分、必修選修、總課時、實驗課時,以及教學對象(本科學生)的年級、專業(yè)等方面信息,共計30個變量、673個個案。對于其中有教學督導專家聽課評價記錄的226個教師個案,筆者又在上述30個變量之外相應地加上“專家打分”項目,并使其從上述數(shù)據(jù)中相對獨立出來,構成數(shù)據(jù)2,以便于分析學生評價與專家評價的相關性。
(二)分析工具和分析方法
本研究的分析工具是SPSS17.0,具體分析方法如下。
1. 相關性分析包括學生綜合評分與督導組專家評價的相關性,學生綜合評分與教師、學生以及課程三方面各因素的相關性,學生綜合評分與學生“就讀經(jīng)驗”自我打分的相關性。
2. 回歸分析及數(shù)學建模。在相關性分析的基礎上,將與學生評分相關性顯著的因素作為自變量,學生綜合打分作為因變量建立回歸模型;同時以督導專家打分作為“教師課堂教學質量”的量度,建立學生評價關于“教師課堂教學質量”以及“就讀經(jīng)驗”的數(shù)學模型。以此探討學生評價是否主要在評“教師課堂教學質量”還是就自己“就讀經(jīng)驗”的“評價”,從而探討我國大學生評教的內在標準。
二、統(tǒng)計及數(shù)學建模結果及其分析
(一)學生評教的相關因素分析
1. 教師、學生以及課程的一些客觀因素與學生評教的相關性
就數(shù)據(jù)1分析學生評教的綜合打分與下列變量(不是數(shù)值的變量先數(shù)值化)的相關系數(shù):
(1)教師方面:年齡、性別(男記為1,女為2)、學歷(從大專到博士分別用1到4的數(shù)字表示)和職稱(從初級職稱到正高級職稱依次用1到4的數(shù)字表示)四個因素;
(2)學生方面:所處學期(分為第1-8個學期)、所學專業(yè)(文為1、理為3、文理學生都有為2);
(3)課程方面:學分、實驗時數(shù)、授課時數(shù)(“總學時數(shù)”減去“實驗時數(shù)”)、課程的必修-選修性(必修為1,限選為2,任選為3)和課程的基礎-專業(yè)性(公共基礎課為1、全校公選課為2、專業(yè)基礎課為3、專業(yè)課為4)。
檢驗得到相關顯著性情況如表1所示。
可以看出,學生評教的綜合分數(shù)與教師職稱、學生所處年級和專業(yè)類別以及除必修選修之外的課程因素都明顯相關,而與教師的其它客觀因素不相關。越是高年級學生,越是理工科學生,其評分越高;教那些學分高的、課時多的尤其是實驗學時多的、專業(yè)性強的課程的教師,學生評價分數(shù)高。另外,職稱越高,學生評價越高,尤其是教授組的教師的得分顯著高于其他職稱組教師的得分。但是若除去教授只在非教授的教師組(數(shù)據(jù)1中教授個案所占比例不足13%),分析學生評分的差異性會發(fā)現(xiàn),學生評價在這三個職稱組間的差異并不顯著。
“不相關”并不意味著對學生評教沒有影響,對于上表中不相關(相關不顯著)的因素,再用差異性檢驗分析其對學生打分的影響。不同性別教師之間打分差異不顯著。高齡教師中50歲以上教師的得分顯著高于其他年齡組教師的分數(shù),但青年和中年教師之間則差異不大,這與職稱方面的差異相對應。學歷方面,大專(包括文革中的工農兵學員)組的得分顯著高于其它組得分,其它學歷組之間無顯著差異。但大專組個案數(shù)(15個)太少,所以可以認為評教分與教師學歷沒有關系。還有課程分為“必修”、“限選”和“任選”三個組,檢驗得知學生綜合打分在這三個組之間的差異也不顯著。所以上表中“相關不顯著”的因素對學生評教的影響也不顯著。
就數(shù)據(jù)2討論相關性,得知學生綜合打分與學生的文理分科(所屬專業(yè))以及授課時數(shù)有關(相關系數(shù)分別為0.334**和0.148*),與上述11個因素中的其它因素的相關性都不顯著。
所以可以說,學生評教與教師的自然因素和學術等級因素相關性不大;與學生自身所處的專業(yè)群體以及高校學習經(jīng)歷長短因素(年級)有關,與教師所教的課程有關。
2. 學生評教與專家評教的相關性、與學生就讀經(jīng)驗評分的相關性
由數(shù)據(jù)2分析學生評教的綜合分數(shù)與督導專家的評教分數(shù)的相關性,得到相關系數(shù)為0.138*,雖然勉強相關,但相關性也說不上高;若以學生“評課堂教學”的分數(shù)(現(xiàn)行評價表“態(tài)度”、“內容”及“教法”三項目打分之和)分析其與專家打分的相關性,相關性有所提高(0.177**)。而學生綜合打分與學生“就讀經(jīng)驗”分(“教學效果”和“總體滿意度”兩項目打分之和)的相關系數(shù)卻高達0.965**(就數(shù)據(jù)1分析得到的該相關系數(shù)為0.967**)。
為什么學生和督導專家以一致的標準去評價教師的教學尤其是課堂教學,評價分數(shù)的相關性卻如此之低呢?如果把專家評教結果作為教師課堂教學水平的較為客觀的量度,則只能解釋學生并不是按照所謂的評價標準(指標)在評,而主要是以自己的就讀經(jīng)驗、自己的收獲多少及對此的滿意度作為衡量標準去評價教師的教學。
而制約學生的學習收獲和滿意度的因素顯然是多種多樣的,不僅是教師的教學質量,還包括學生對課程設置的意見、教學硬件設備以及學生對大學生活的適應性,甚至于學生自己的學業(yè)期望與教師及課程的沖突等等,它是綜合性的。以此看來學生評教分數(shù)與督導專家的課堂教學評價分數(shù)相關性不高也就不奇怪了。
(二)學生評教及其決定或影響因素的數(shù)學模型
根據(jù)上述相關性分析,把與學生綜合評分相關顯著的各因素作為自變量,分別就數(shù)據(jù)1和數(shù)據(jù)2建立“學生綜合打分”的標準化回歸模型,得到各因素的標準回歸系數(shù)及模型的解釋度如表2所示。
對模型的直觀解釋,比如“模型1”就意味著,學生“就讀經(jīng)驗值”每增加1個標準差值,“學生綜合打分”就增加0.966個標準差值,這個模型可以解釋“學生打分”差異的93.3%。與“學生就讀經(jīng)驗”相比,進入模型的其它因素對“學生綜合打分”所起的作用就顯得很小了。其它為進入模型但與“學生綜合打分”有關的因素,包括“教師職稱”和“課程學分”以及“基礎性-專業(yè)性”,對“學生綜合打分”的作用就更小了。
在所有自變量中,學生就讀經(jīng)驗值對評教起的作用最大,其獨自對評教分數(shù)的解釋度就在93%以上。所以,在學生評教表中的那些對教師“教學態(tài)度”、“教學內容”和“教學方法”等多個讓學生充當“評委”的條目,基本都可以用學生就讀經(jīng)驗條目來代替。
三、結論及進一步討論
根據(jù)對學生評教數(shù)據(jù)的上述分析,我們至少可以得到以下三方面的結論及應用啟示。
(一)大學生就讀經(jīng)驗調查分析是我國大學生評教的必要而且可行的途徑
高校讓學生評價教師是否“嚴謹治學、從嚴執(zhí)教、教書育人”等等從而給教師打分,表面上是把評教的主動權都交給了學生,但是實際上評的這些“項目”還是從教師管理者的立場上提出的,實際上還是我國高校傳統(tǒng)的“行政本位”的體現(xiàn),學生是在替行政管理者“評教”。眾所周知,學生是高等教育的主人,而不是高等教育的工具,學生評教目標在于向教師、管理者反饋教育教學信息,進一步提高教學質量。反饋哪些信息,哪些信息是學生有把握能客觀反饋的?只能是學生的切身體驗,比如,學生對教學的期待、他們在相應課程教學中的收獲和發(fā)展等等。學生的這些活動和體驗是具體的,也直接體現(xiàn)了教師的教學水平和教學質量。所以學生評教必須從學生的學習經(jīng)驗出發(fā),對教師教學質量的評價要轉到對學生就讀經(jīng)驗的評價上來。[4]本文的數(shù)據(jù)挖掘分析結果又表明,學生的評教分數(shù)與督導專家的評教分數(shù)相關性不大。這說明學生“就讀經(jīng)驗”分值在學生綜合打分中起著幾乎全部的決定作用;其它項目分都是由“就讀經(jīng)驗”決定的,并不是學生評教的“獨立的”“標準”,從而在評價表中也是多余的。即使讓學生當“評判員”,給他們定下再清楚的評價標準和評價框框,學生評價教師的內在標準也還是基于學生從教師教學中的收獲以及收獲的滿意度等這些自我性的“打分”。這說明,由學生就讀經(jīng)驗打分替代傳統(tǒng)的學生充當“評判員”評價教師的方式,不僅是必要的,也是可行的。
學生就讀經(jīng)驗打分實際上是向學生收集他們的就讀信息,屬于學生就讀經(jīng)驗調查。所以基于就讀經(jīng)驗調查的學生評教表要按照調查問卷的要求進行科學設計,同時將調查結果應用于教師教學質量的評價中;必須對學生的就讀經(jīng)驗信息進行科學的統(tǒng)計分析,使大學生評教過程不僅是高校管理工作,更成為科學研究的過程。
(二)學生就讀經(jīng)驗調查也是高校教學質量評價的一條有價值的途徑
高校教師群體教學質量的一個綜合表現(xiàn)便是各高校的教學質量。學生就讀經(jīng)驗調查模式不僅是教師個體教學評價的改革方向,而且也有望成為我國高校教學質量評價的途徑。由教育部組織的幾輪高等院校教學評價,其成效不可否認,但也備受爭議,比如一些人稱其為“燒錢”之舉。美英澳等國對大學的評價也采取學生(尤其是畢業(yè)生)就讀經(jīng)驗調查的方式,相應調查問卷和數(shù)據(jù)分析也都已比較成熟,值得我國借鑒。以大學生就讀經(jīng)驗評價高校教學質量替代傳統(tǒng)的專家進??疾煸u價的方式,不僅可以降低評價成本,而且評價本身有望走向進一步的科學化;另一方面也可以給我國的高等教育實證研究提供一條切實可行的途徑,使得教育科學研究、高校教學評價工作以及高等教育管理改革相互融合,以得到更好的實踐和理論效果。
(三)學生評價的結果要科學解釋和應用
現(xiàn)在我國高校,在教學管理中運用學生評教分數(shù)是學校組織學生評教的最主要的目的。不管是傳統(tǒng)評價還是學生就讀經(jīng)驗調查,怎樣認識、解釋來自學生的這些數(shù)據(jù)是最關鍵的,這不僅體現(xiàn)科學性,也與教師個人的利益息息相關。本文上述分析表明,學生評教分數(shù)與諸如實驗時數(shù)、學分以及授課時數(shù)等課程因素、學生的專業(yè)和所處年級等學生因素以及教師的職稱也都相關顯著,所以,若以這些平角數(shù)據(jù)區(qū)分教師教學優(yōu)劣,必須對課程、教學對象等情況分類比較,不加區(qū)別地對教師“得分”直線排序并直接用于教師管理是極不科學、對教師極不公平的管理方法。
不僅是分類比較的問題,來自學生的原始數(shù)據(jù)必須在深入統(tǒng)計分析的基礎上用于教師教學管理和評價以及高校教學管理和評價,那種口口聲聲“今年教師平均得分高出5分,因此教師教學質量普遍提高”的推斷是極為簡單化的,對教學質量的真正提高沒有多大的意義。利用學生評教資料建立各校以至全國的評價常模,利用現(xiàn)代統(tǒng)計分析手段尋找相關因素以及作用模式,并及時反饋給教師,才是實現(xiàn)高校學生評教促進教學發(fā)展的應有之路。
參考文獻:
[1] 陳瓊瓊.大學生參與度評價:高教質量評估的新視角——美國“全國學生參與度調查”的解析[J]. 高教發(fā)展與評估,2009(1):24- 30.