李 碩,劉賀家,劉東來,李 陽
(1.吉林財經(jīng)大學 a.公共管理學院;b.會計學院,長春 130117;2.吉林省會計學會,長春 130021;3.吉林省醫(yī)療保障事業(yè)管理中心,長春 130033)
在統(tǒng)計學中,聯(lián)合分析方法(Conjoint Analysis)經(jīng)常用于量表調(diào)查中,以分析統(tǒng)計總體的偏好,主要是用于模擬和衡量消費者對產(chǎn)品或服務(wù)質(zhì)量的感知[1]。聯(lián)合分析方法可與多種隨機模型一起使用處理聯(lián)合數(shù)據(jù),如普通最小二乘回歸模型,logit,probit,多項概率和嵌套logit或probit模型等。從20世紀90年代開始,貝葉斯層次模型(Hierarchical Bayes Model)與聯(lián)合分析一起使用變得非常流行,因為能提高聯(lián)合分析的可靠性,預(yù)測的有效性并可提供可靠的估計[2]。
目前,越來越多的學者使用此方法在充分考慮到大學生偏好異質(zhì)性的情況下進行教育質(zhì)量評估,如Kuzmanovic,Savic,Popovic和Martic等。由于受聯(lián)合分析方法不能同時對大量的參數(shù)進行變量分析[3]的限制,因此大多數(shù)研究者只測試一部分教育質(zhì)量評估因素,而這些屬性并不能構(gòu)成一個完整的教學過程。
筆者將使用與聯(lián)合分析類似的實驗設(shè)計,要求大學生評估課程教學和內(nèi)容的某些教學因素以及整體的課程質(zhì)量。通過收集數(shù)據(jù),剔除學生對教學變量的權(quán)重設(shè)計,因為不同學生對每個教學因素的重要程度都有不同的看法。然后,構(gòu)建一個貝葉斯β回歸模型(Bayesian Beta Regression Model),其權(quán)重具有均勻Dirichlet分布作為先驗分布以得出屬性權(quán)重的后驗分布,符合實驗設(shè)計的設(shè)定并將構(gòu)造出一個基于學生偏好的教學質(zhì)量指標體系。此模型包含兩個層級,第1層級是在涵蓋先驗信息的基礎(chǔ)上用廣義線性模型對第2層級中的參數(shù)提供可能的概率分布。貝葉斯層次模型借用其他受訪者的信息,使用迭代程序以穩(wěn)定每個個體的最大似然參數(shù)估計,而且可以提供穩(wěn)定和準確的模型,即使所觀察到的結(jié)果小于所估計的參數(shù),該模型也可以通過將模型與干擾分離恢復(fù)異質(zhì)性[4]。
假設(shè)已經(jīng)調(diào)查了nj個學生的隨機樣本,其中j=1,2表示調(diào)查的兩個不同時間段。令n=n1+n2表示總樣本大小,并且yij表示由第i個人在時間j(i=1,…,nj)給出的響應(yīng)變量(總教學/課程評估分數(shù))的觀察值。令Xij=(xij,1,…,xij,k)T表示k個已知屬性的矢量的觀測值。令zij表示未觀測到的隨機變量(潛在變量),其與學生i在時間j對某些未涉及的因素的測量有關(guān)。為不失一般性,假設(shè)數(shù)據(jù)已經(jīng)被縮放,因此所有上述變量都是在區(qū)間[0,1]中取值的分數(shù)。
假設(shè)響應(yīng)變量遵循beta分布,其均值被建模為觀察到的和未觀察到的屬性與更定變量的加權(quán)線性組合。模型的系數(shù)可以被解釋為權(quán)重(所有權(quán)重加和為1),因此其測量學生i在時間j給予不同屬性和潛在變量的相對重要性。
對于因變量的觀察數(shù)據(jù)最初是以百分比呈現(xiàn)的,用于表示總體評估得分。目前對百分比數(shù)據(jù)建模的方法中最常用的是對百分比數(shù)據(jù)進行轉(zhuǎn)化(transform)后對其進行最小二乘回歸。對上述數(shù)據(jù)轉(zhuǎn)化方法,通常使用反正弦平方根和logit函數(shù)。這些方法雖然在相關(guān)的數(shù)據(jù)分析中廣泛應(yīng)用,但通常研究者忽視了方法中的前提條件而使其模型假設(shè)沒有得到滿足[5]。另一種方法是使用基于二項分布的回歸模型[6]。在很多情況下,基于此模型下的百分比結(jié)果被過度分散,造成其顯示出比二項分布預(yù)期更大的可變性。更重要的是百分比的結(jié)果是非二項式的,例如人口未的社區(qū)占總社區(qū)的比例。為克服上述問題和限制,經(jīng)常采用β回歸模型(Beta Regression Model)。這是因為β分布具有高度靈活的形狀,適合表示以百分比尺度測量的任意結(jié)果變量。此外,即使是基礎(chǔ)簡單的β回歸模型也可以通過包含精度參數(shù)調(diào)整百分比結(jié)果的條件方差從而方便地解釋其過度離散現(xiàn)象。在類似的問題中,Carmichael將包括β回歸在內(nèi)的幾個模型通過教育績效數(shù)據(jù)進行了比較,得出基于β分布的線性模型通常是最合適模擬上述類型數(shù)據(jù)的結(jié)論[7]。
基于上述觀點,筆者對兩個不同的時間段(j=1,2),構(gòu)建模型如下
對上述模型進行模擬并且將其與更簡單的(聯(lián)合)模型的預(yù)測能力進行比較。該簡單模型如下
下面筆者將開發(fā)相關(guān)的機器學習算法完成上述所構(gòu)建模型的模擬與抽樣檢驗。上述模型對于響應(yīng)變量的假設(shè)是其應(yīng)大于0且小于1。
該調(diào)查對象選擇具有至少兩年以上學習經(jīng)驗的本科學生,主修公共管理,并選修過20門以上的課程,學習過不同學科的教材,并且由不同的教師授課。有充分表達和分辨教學感受的能力,考慮到調(diào)查質(zhì)量,其中題目應(yīng)答率若低于10%,則刪除該題目。學生無應(yīng)答率低于10%,題目無應(yīng)答率低于10%這兩種情況下可忽略不計。
在調(diào)研中要求學生評價其迄今為止學習所有課程中的一些因素,并要求根據(jù)其上課的經(jīng)驗和感受填寫能做到正面積極質(zhì)量特征的課程/教師的百分比,測量尺度是定序的,對于順序共有11個級別對應(yīng),10%寬度百分比間隔,從0~100。
課程/教師教學模塊的質(zhì)量通過一組14個因素測量,而這14個因素被嵌入到一個具有3級的層次模型中。在第1層,識別了兩組質(zhì)量因素,1組與課程相關(guān),另一組與教師相關(guān)。在這兩組內(nèi)部,是第2層模型,一般因素包含進第2層模型作為主要研究問題,例如,第1組包含課程內(nèi)容,教科書和評分程序等因素,第2組包含教師的教學,知識和行為等元素。在第3層,將之前設(shè)定的14個個體質(zhì)量屬性轉(zhuǎn)化為14個單項問題。最后要求學生在可比較的測量量表中對一般課程/教學模塊進行總體質(zhì)量評估。
調(diào)查問卷的結(jié)構(gòu),內(nèi)容選擇和描述主要基于歐洲高等教育質(zhì)量保證協(xié)會(2009)和希臘質(zhì)量Assura(2007),Feldman類別[8]和SEEQ(Students Evaluation of Education Quality)因素[9]的原型和指南。表1中給出了15個單獨的質(zhì)量問題,其順序與問卷中相應(yīng)問題的順序相同。
表1 變量描述表Tab.1 Variable description table
調(diào)查問卷的初級版本由學生樣本的6名志愿者進行回答和評估,根據(jù)學生的意見和結(jié)果,修改其中問題的措辭和排序并形成最終問卷。
貝葉斯方法在給定先驗分布的條件下,僅需計算后驗分布的概率密度函數(shù)即可。貝葉斯推斷方法的應(yīng)用受到限制的原因在于這些未知參數(shù)的后驗分布大多數(shù)都是高維的、復(fù)雜的、非一般常見的分布,計算過程較難以實現(xiàn)[10]。而通過模擬的方式對高維積分進行計算的MCMC(Markov Chain Monte Carlo)方法出現(xiàn),使原本異常復(fù)雜的高維積分計算問題變得很容易解決,從而為貝葉斯方法的應(yīng)用開辟了新的思路[11]?;谏鲜鰧ω惾~斯層次模型的構(gòu)建,筆者首先對模型1進行擬合。在擬合過程中,對MCMC算法進行3 000次迭代(iteration),其中將前1 000次作為開始階段的樣本(burn-in period sample)。算法流程如下。
Algorithmic Flow of MCMC Based on Bayesian Hierarchical Model
1:
2:iter←3 000?Number of Sampling Iteration
3:burnin←1 000?Sufficiently large burn-in period
4:
5:declarea?Shell of length iter foradraws
6:declareb?Shell of length iter forbdraws
7:declaremu?Shell of length iter formudraws
8:a←b←mu←3?Set arbitrary initial value
9:
10:fori=2:iter do
11:a[i]~p(a|a=a[i-1],b=b[i-1],μ=mu[i-1])
12:b[i]~p(b|a=a[i],b=b[i-1],μ=mu[i-1])
13:mu[i]~p(μ|a=a[i],b=b[i],μ=mu[i-1])
圖1 模型變量權(quán)重的后驗分布箱型圖Fig.1 Box plot of posterior distribution of model variable weights
14:
15:returna[burnin:iter],b[burnin:iter],mu[burnin:iter]
通過模擬結(jié)果可以發(fā)現(xiàn),其中一些變量權(quán)重的后驗分布(posterior)發(fā)生了較為顯著變化,變量2、5、10和12在模型運行過程中表現(xiàn)不同(見圖1)。圖1給出了箱形圖,總結(jié)了不同時間中模型變量權(quán)重的差異的后驗分布。
表2給出了兩個不同時間段模型變量權(quán)重的后驗均值,以及權(quán)重差異(第1個時期~第2個時期)。表2同時給出了權(quán)重差異為0的尾部區(qū)域概率,即后驗概率
π0=min{f(ω1,l-ω2,l>0|y),f(ω1,l-ω2,l<0|y)}
(9)
當數(shù)值0處于后驗分布的中心位置,則上述π0值接近0.5,這表明兩個不同時間段之間的權(quán)重沒有明顯的差異。當π0值低于某個數(shù)值(例如0.2)時,則在兩個不同時間段之間模型變量的權(quán)重存在差異。對變量2、5和14的權(quán)重,π0值都低于0.2,特別是對權(quán)重14,π0值約為0.03。
表2 兩個模型權(quán)重后驗概率均值的差異Tab.2 Differences in the mean values of the posterior probabilities of the weights of the two models
注:最后一列為差異為0的概率。
用相同的迭代次數(shù)以及初始樣本,對模型2進行了MCMC算法模擬。通過結(jié)果對比分析發(fā)現(xiàn),兩個模型的統(tǒng)計量的后驗概率均值均為0.65。這表明處理這個問題不需要使用相對更復(fù)雜的模型(考慮不同的時間段),而使用簡單的模型(聯(lián)合模型)即可。
表3給出了在使用聯(lián)合模型后對模型變量權(quán)重的后驗概率的分析結(jié)果。變量4、6、10、11、14的權(quán)重均具有高于5%的后驗概率均值。
表3 聯(lián)合模型中的權(quán)重的后驗概率分析結(jié)果Tab.3 Summary of the posterior probability of the weights in the joint model
從表3可以看出,學生對變量6給出了更高的權(quán)重(后驗均值為0.139 6),其次是變量14(后驗均值為0.128 7)。此外,隱變量(latent variable),即除這15個變量外還有其他方面的權(quán)重具有約為3%的后驗均值,這說明在進行評估過程中,學生給隱變量的權(quán)重約為3%。
屬性4是指課程內(nèi)容和專業(yè)要求相匹配。屬性6是指考核內(nèi)容與方法和課程內(nèi)容與教學的匹配性。屬性10是指教師講課的感染力和吸引力。屬性11是教師的專業(yè)知識豐富程度。屬性14是指對當前專業(yè)及發(fā)展趨勢的了解與擴展。因此,可見學生們始終高度重視與學術(shù)質(zhì)量相關(guān)的核心問題:教師的專業(yè)背景,教學質(zhì)量,課程與專業(yè)的關(guān)聯(lián)程度。
由于每個評估都應(yīng)該是連續(xù)一致的過程,筆者提出了一個貝葉斯層次模型,其相對于聯(lián)合分析方法具有如下優(yōu)勢:1) 數(shù)據(jù)輸入簡單,即問卷收集后就可帶入到模型中,不用對數(shù)據(jù)進行處理。由于貝葉斯模型不同于傳統(tǒng)的統(tǒng)計模型,所以貝葉斯模型對輸出結(jié)果的解釋非常直觀,簡單自然。2) 貝葉斯模型對所要研究的問題可以包含人們已有的認知與看法,即先驗信息。3) 貝葉斯模型適應(yīng)性很強,可以實時采用新的數(shù)據(jù)對模型參數(shù)進行更換,而其他傳統(tǒng)的統(tǒng)計模型則需要在加入新數(shù)據(jù)后對模型參數(shù)進行重新全盤模擬。
上面所描述的特征表明貝葉斯模型具有很好的靈活性、包容性和適應(yīng)性,其突破了統(tǒng)計中聯(lián)合分析的局限,可以被擴展并應(yīng)用于其他相關(guān)的研究中,除了能持續(xù)性地評估和檢測服務(wù)質(zhì)量外,貝葉斯模型還可以監(jiān)測學生偏好與各種社會經(jīng)濟時間序列的關(guān)聯(lián)性,將研究向更深更廣的領(lǐng)域推進。