程剛
摘要:教師教學質量評價是高校教學管理中必不可少的組成部分??茖W的教學質量評價體系不僅有助于教學質量檢測,也有助于提高教師的教學水平,促進高等教育的發(fā)展。本文所討論的影響因素是著眼于研究教師的個人特征對教評的影響,同時運用科學的定量方法,分別建立經典線性回歸模型、貝葉斯分層線性模型,比較不同模型中參數的估計與意義,最后證實貝葉斯分層模型的擬合效果較優(yōu)。研究結果顯示:將外貌評分作為隨機效應,可以發(fā)現(xiàn)教師的外貌差異對教學評價有顯著影響。研究結果對于構建科學的教學質量評價體系具有重要的意義。
關鍵詞:教學質量評價;混合效應模型;貝葉斯分層模型;MCMC算法
中圖分類號:G434 文獻識別碼:A 文章編號:1001-828X(2017)007-0-03
一、引言
隨著高等教育的發(fā)展,高校教學質量評估深入展開,教學質量越來越引起人們的重視,而關于大學教師教學評分的研究也越來越受到重視。然而,在實際中對教師的教學效果進行評估時會受到多方面因素的影響,一般認為最主要的因素是教師教學質量的好壞。但不可否認的是,還有一些因素也會影響到學生對教師教學質量的評估,如教師的個人特征、學科的差異、不同年級,以及師生間認知方式等。但是,關于這些因素的影響研究基本上是對教評體系進行定性的,簡單的描述,而定量的實證研究結果較少。而且由于教評的復雜性,采用簡單的定性方法,要做出令人信服、滿意的評價似乎很困難,另一方面,簡單的定量方法則可能更加脫離實際性。
總之,教評的合理性是教評體系中的重中之重,如何設計出一套科學的教評體系是高校教育工作者們所關心的問題。本文在前人的研究基礎上,利用科學的定量模型,試圖找出可能的影響因素,以期進一步分析影響學生教評的關鍵因素,最后根據實證結果進行分析并提供相應的意見與建議。
二、研究方法
1.貝葉斯推斷與MCMC算法
由貝葉斯定理發(fā)展而來的統(tǒng)計理論被許多統(tǒng)計學家發(fā)展為一種全面的統(tǒng)計推斷理論,稱為貝葉斯理論。貝葉斯理論的核心觀點是認為總體的參數服從某一個先驗分布,它是在進行推斷時一個必不可少的信息。貝葉斯推斷的過程是利用樣本的分布以及總體的先驗分布,根據貝葉斯公式計算得到總體的后驗分布,后驗分布則被認為包含了樣本信息以及先驗信息。
但是,貝葉斯統(tǒng)計分析面臨的最大挑戰(zhàn)就是對后驗信息的計算,因為后驗信息的推斷往往涉及到對多維積分的數值計算,如以下形式的積分:
其中f(x)是一個高維空間中的目標函數,而傳統(tǒng)的方法是難以計算多維積分的,這一直限制著貝葉斯方法的發(fā)展。隨著計算機科學的進步,其中馬爾科夫蒙特卡洛算法(MCMC)的應用使得貝葉斯理論在過去的幾十年得以迅速應用。
MCMC的基礎理論為馬爾科夫過程。在MCMC算法中,為了在某一個指定的分布上采樣,根據馬爾科夫原理,首先從任一狀態(tài)出發(fā),模擬馬爾科夫過程,不斷進行轉移,最終收斂平穩(wěn)分布。它的基本思路是,對于一個給定的概率分布P(X),若是要得到其樣本,我們可以構造一個轉移矩陣為 的馬爾科夫鏈,使得該馬爾科夫鏈的平穩(wěn)分布為P(X)?,F(xiàn)如今,MCMC已經是解決高維統(tǒng)計問題時必不可少的工具,它可以獲得一條或許多條收斂的馬爾科夫鏈,該馬氏鏈的極限分布即為總體參數的后驗分布。
2.貝葉斯分層回歸模型
一般的線性混合效應模型假設模型里一部分系數具有隨機效應,另外一部分具有固定效應,考慮到了觀測值不一定來自于同一總體,但是卻沒有充分利用觀測值的先驗信息。貝葉斯分層線性回歸模型即假設所有隨機的系數服從某個分布(一般是正態(tài)分布),并且假設分布中的所有未知參數都服從某個先驗分布,充分利用先驗信息,由此建構更為合理的模型。
一般貝葉斯分層線性回歸模型可以用如下公式表述:
其矩陣形式為:
其中y代表因變量,一共有i組水平,每組水平有ki個觀測值。β0是固定效應截距, b0i是第i組水平的隨機截距,并有p個解釋變量具有固定效應,有q個解釋變量具有隨機效應, εi是每組水平測量誤差(其不必服從獨立同分布條件,即對ε沒有Var(ε)=σ2及Cov(εi,εi)=0的假定)是一個ki維的向量。
在矩陣形式中,X為固定效應矩陣,是一個ki×p維的矩陣, Z為隨機效應矩陣,是一個ki×p維矩陣。貝葉斯混合效應模型要求對所有參數都設置先驗分布,其中
誤差的方差σ2的先驗分布為逆伽馬分布,
假定系數的先驗分布為多元正態(tài)分布,
隨機效應系數的協(xié)方差矩陣Σ服從逆Wishart分布,即:
Σ~IWishart(r,R)
同時假定超參數的先驗值為無信息量的先驗。已知先驗分布和條件概率函數,由貝葉斯公式,可以寫出其后驗分布的密度函數形式,由于篇幅限制,本文不這里進行推導。
三、實證與分析
1.數據說明
本文的數據選取于得克薩斯大學奧斯汀分校(University of Texas at Austin)在2000~2002年的一份針對教職人員教學質量評價影響因素的研究。數據總共包含了463個班級評分(觀測值),分別描述了94個教師(即94個水平),每個教師所教授的班級數有所不同,變量的描述性統(tǒng)計見表1。數據可由R軟件中AER安裝包里的數據集: 獲得。
2.模型建立
(1)經典線性回歸模型
經典線性回歸模型的一般形式為:
其中i=1,2...,94。εi相互獨立同分布,E(εi)=0,且Var(εi)=σ2,則有εi~N(0,σ2)。以上假設保證了各觀測值來自于同一總體,即自變量沒有隨機誤差,它對因變量的作用效應是固定的。擬合簡單線性模型,并用最小二乘法進行估計, 得到模型一的各系數估計如下表所示:
Signif. codes: 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘
分析上表,可以得出:①教學評分與教師外貌評分的統(tǒng)計關系最為顯著,并且呈正相關,即外貌評分越高的教師更易獲得更高的教學評分;②課程學分越低,教師獲得的評分相對較高;③而女性教師,黑人教師,母語非英語的教師以及獲得終身職稱的教師的教學評分相對較低;④年齡差異,學生年級差異則對教評無顯著影響。圖1展示了beauty與eval的關系,直線為回歸擬合曲線,可以直觀的看出隨著教師外貌評分的提高,教學評分也相應提高。
系數保留兩位小數得到的回歸模型如下:
其中i=1,2...,94。
(2)貝葉斯混合效應模型
與線性混合效應模型有所不同,貝葉斯分層回歸模型假設教師的外貌評分變量B1服從正態(tài)分布,并且假設其參數服從某一先驗分布。其先驗分布形式已在前文陳述,并且先驗分布的參數采用無信息先驗,可由R語言安裝包MCMCpack中函數dwish和rwish計算得出。將B1作為隨機效應,將X1,X2,X3,X4,X5,X6,X7作為固定效應,教學評分Y作為因變量,得模型二的表達式如下:
其中i=1,2...,94分別對應94位教師,j=1,2...,nj分別對應于第 i個教師的第j次觀測值,β0為固定效應截距,b1i為隨機效應的系數, b0i為隨機截距, εij為誤差項。
根據上述數據,在R語言中利用安裝包MCMCpack中MCMChregress函數對模型進行估計。由于貝葉分層線性回歸模型對每個水平下的隨機效應變量都進行估計,于是分別得到94個隨機截距和變量B1的估計值和8個固定效應變量估計值,共計192個估計值,即估計出每個教師所在水平下對應的模型。
需要注意的是,在對于任何一個以MCMC為基礎的貝葉斯模型的估計中,關于模型的收斂性的檢驗都是必不可少的。而一個MCMC模型達到收斂,是指模擬的結果來源于所構造的馬爾科夫鏈的平穩(wěn)分布或目標分布。下圖反映了隨著抽樣迭代次數的增加截距項的平穩(wěn)性以及密度函數狀態(tài)。由圖2可以直接看出,在進行抽樣迭代200次之后,馬氏鏈仍未收斂,而在抽樣迭代1000次以后,則可以認為馬氏鏈達到平穩(wěn)收斂狀態(tài),并且截距項的密度函數近似服從正態(tài)分布。
可以得到模型二的表達式如下:
由于模型二得到的估計值太多,在這里便不再一一列出,我們分別計算隨機截距和變量B1的94個估計值平均值來與模型一進行比較。其中: =0.01622,=0.20378。
下圖顯示的是模型二的預測評分與原始評分的擬合情況,可以看出預測評分與原始評分擬合效果較好。
(3)結果分析
下表顯示了模型一,模型二的各參數對比情況:
由上表可以看出:模型二中的beauty系數遠小于模型一。這是由于貝葉斯分層模型將所有教師分別看作94個水平,對于每一層建立模型。即認為同一層次下的觀測值是相互聯(lián)系的,所以對于每一位教師,其beauty系數相同。而不同層次之間的觀測值是相互獨立的,其間的差異性由隨機截距中和,而beauty系數的減小則可以降低因教師外貌評分引起的誤差。
總的來說,由比較結果可以看出,應用貝葉斯分層模型分別對變量B1及其隨機截距進行估計,得到的模型二較優(yōu)。可認為貝葉斯方法綜合了先驗數據和實際教師外貌評分,起到了減小誤差的作用。
四、結論與建議
本文首先簡述了貝葉斯統(tǒng)計分析、MCMC方法的基本思想,以及貝葉斯分層模型的性質和一般形式,隨后分別建立兩個模型進行理論研究及比較,最后進行實證。證明了貝葉斯分層線性回歸方法比經典的線性回歸更加適用于分層數據。本文的意義在于從理論和實證討論了貝葉斯分層線性回歸模型,對教學質量評價影響因素的分析有著重大意義。
通過以上的模型分析與研究,可以得出以下結論:
(1)教師外貌評分對教評有顯著影響,即教師外貌會影響到學生的主觀評分傾向,從而影響教評結果。
(2)課程學分越低,學生對教師的教學評分越高。即課程越重要,學生在給教師評分時會降低教評分數。
(3)總的看來,教師的籍貫會對學生教評產生較大影響。其中母語為英語的教師更加受到學生的喜愛,評分較高。
(4)值得注意的是,黑人教師的相對評分較低。由此可以看出學生對于黑人教師的評分可能存在膚色歧視。
(5)教師的年齡和學生的年級高低對于教評無較大影響。
針對以上結論,本文給出以下建議:
(1)不可否認,教評是一種帶有感情化的評分,學生在教評過程中,難免會受到心理,感情上的主觀因素影響,導致對教師授課質量的評估出現(xiàn)誤差。例如教師的外貌越好看就越容易受到學生的喜愛,而黑人教師可能受到學生的歧視等。為減少學生主觀因素造成的誤差,建議在教評工作前對學生進行培訓,講明評估的意義和重要性,讓學生能真實地反映實際情況。
(2)培養(yǎng)學生的學習興趣。學生傾向于對學分較高的課程打較低的分數,這可能是由于課程的難易程度,考試成績等因素影響的。而如果學生對所學的課程感興趣,那么其相應的學習態(tài)度和學習動力都會對教評產生影響。
(3)選擇有效的評估工具,進行科學的結果分析。有效合理的教評系統(tǒng)是能否真實檢測教學質量的關鍵,開發(fā)或選擇合適的評估工具對提高整個評估系統(tǒng)的精確性具有重要意義??茖W的結果分析避免了結論的主觀性,使得教評結果更加具有說服力。
參考文獻:
[1]黎荊,黎莉,胡平波.普通高校學生評價教師教學質量影響因素的實證分析[J].教育管理,2007(7).
[2]黨晶.高校教師教學績效評價的影響因素分析----基于學生教評的實證研究[J].上海管理科學,2013(6).
[3]曹詩諾,蘇宇楠,田茂再.基于分層線性模型的貝葉斯推斷及其應用[J].統(tǒng)計與決策,2015(3).
[4]陳高.基于MCMC模擬的貝葉斯分層模型及其應用[J].科教導刊電子版,2015(4).
[5]朱麗葉.分層模型與貝葉斯方法[J].暨南大學,2012.
[6]張小樂.貝葉斯統(tǒng)計理論的基本觀點與研究現(xiàn)狀[J].經管視線,2010(33).
[7]Wang S G and Yin Suju. A new estimate of the parameters in linear mixed models. Science in China(Series A) Vol.45,No,10.
[8]Greert Verbeke,Greert Molenberghs. Linear Mixed models for Longitudinal Data.Spring,New York,2000.
作者簡介:程 剛(1995-),男,漢族,四川綿陽人,學生,學位:本科,主要從事統(tǒng)計應用研究。
基金項目:上海市大學生創(chuàng)新活動計劃項目,項目編號:201610273054。