李超鋒++胡鵬
摘 要:利用Apriori算法對(duì)1355個(gè)課堂的學(xué)生評(píng)教結(jié)果進(jìn)行了關(guān)聯(lián)規(guī)則挖掘。挖掘結(jié)果表明學(xué)生對(duì)具有碩士學(xué)位職稱(chēng)為正高級(jí)年齡超過(guò)46歲的教師的教學(xué)效果評(píng)價(jià)較差,對(duì)具有副高級(jí)職稱(chēng)年齡在35歲及以下的教師的教學(xué)效果評(píng)價(jià)較好。本文據(jù)此提出了相應(yīng)的教學(xué)建議。
關(guān)鍵詞:學(xué)生評(píng)教;教師特征;關(guān)聯(lián)規(guī)則
0 引言
隨著我國(guó)高校信息化水平的不斷提高,幾乎所有高校的教務(wù)管理或教學(xué)質(zhì)量監(jiān)控部門(mén)都引入學(xué)生評(píng)教系統(tǒng)并開(kāi)展了學(xué)生評(píng)教工作,積累了大量的學(xué)生評(píng)教數(shù)據(jù)。一些高校的教學(xué)管理人員已經(jīng)意識(shí)到了學(xué)生評(píng)教數(shù)據(jù)中蘊(yùn)含著對(duì)提高教學(xué)質(zhì)量有用的潛在信息和知識(shí),并逐步著手開(kāi)展了對(duì)學(xué)生評(píng)教數(shù)據(jù)的分析與挖掘。其中,將數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用到學(xué)生評(píng)教數(shù)據(jù)以發(fā)現(xiàn)教師背景特征與學(xué)生評(píng)教得分之間的內(nèi)在聯(lián)系是一個(gè)研究熱點(diǎn)。如周秀梅、李高菊等通過(guò)關(guān)聯(lián)分析發(fā)現(xiàn)教師的職稱(chēng)和年齡會(huì)影響教學(xué)效果,教師的學(xué)歷和性別對(duì)評(píng)教結(jié)果的綜合分?jǐn)?shù)無(wú)顯著影響[1-2]。張美華等通過(guò)對(duì)300份數(shù)據(jù)進(jìn)行關(guān)聯(lián)挖掘發(fā)現(xiàn)30-40歲之間具有中級(jí)職稱(chēng)的教師容易被學(xué)生接受,學(xué)生對(duì)初級(jí)職稱(chēng)教師反映問(wèn)題較多[3]。楊鈞的關(guān)聯(lián)規(guī)則挖掘結(jié)果表明,專(zhuān)業(yè)技術(shù)職務(wù)為正教授的教師平均得分最高,副教授和講師平均得分相差不多[4]。張硯雪利用分層次法關(guān)聯(lián)挖掘?qū)處煖y(cè)評(píng)系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn),具有副高職稱(chēng)的教師,學(xué)生評(píng)價(jià)分?jǐn)?shù)很高,助教職稱(chēng)的教師則沒(méi)有得到學(xué)生的認(rèn)可[5]。
然而,通過(guò)對(duì)大量的文獻(xiàn)分析發(fā)現(xiàn),目前研究人員在使用關(guān)聯(lián)規(guī)則挖掘?qū)W生評(píng)教數(shù)據(jù)時(shí)基本上只考慮了規(guī)則的有效性,對(duì)規(guī)則實(shí)用性的關(guān)注不夠。另外,所使用的數(shù)據(jù)來(lái)自于部分學(xué)院甚至個(gè)別專(zhuān)業(yè)的少量數(shù)據(jù),數(shù)據(jù)的代表性和證明力略顯單薄。本文利用Apriori算法對(duì)某部屬高校學(xué)生評(píng)教的真實(shí)數(shù)據(jù)進(jìn)行挖掘,找出高校教師自身特征與學(xué)生評(píng)教結(jié)果之間的關(guān)聯(lián)規(guī)則,以期為培養(yǎng)高素質(zhì)的高校教師隊(duì)伍進(jìn)而提升高校教學(xué)質(zhì)量提供實(shí)證研究依據(jù)。
1 數(shù)據(jù)來(lái)源及預(yù)處理
本研究所需要的數(shù)據(jù)包括學(xué)生評(píng)教數(shù)據(jù)和教師自身特征基礎(chǔ)數(shù)據(jù)。學(xué)生評(píng)教數(shù)據(jù)來(lái)自于某部屬高校2014-2015學(xué)年度第2學(xué)期學(xué)生評(píng)教數(shù)據(jù)庫(kù)中的原始數(shù)據(jù),教師自身特征數(shù)據(jù)來(lái)自于該校人事管理系統(tǒng)的基礎(chǔ)數(shù)據(jù)庫(kù)。
學(xué)生評(píng)教數(shù)據(jù)在使用之前進(jìn)行了數(shù)據(jù)篩選、課堂評(píng)教平均得分計(jì)算和離散化、缺失值和異常值去除等預(yù)處理,共得到1399個(gè)課堂評(píng)教數(shù)據(jù)。其中缺失值是由于部分學(xué)生未對(duì)所修課程所有評(píng)分指標(biāo)進(jìn)行評(píng)分造成的。異常值包括因?qū)W生惡意差評(píng)[6]導(dǎo)致總分少于40分的學(xué)生數(shù)據(jù)記錄和評(píng)教人數(shù)少于10人的課堂記錄。評(píng)教得分離散處理時(shí)將全校所有課堂按最終平均得分排名,前三分之一為優(yōu)等級(jí),中間三分之一為中等級(jí),后三分之一為差等級(jí)。
教師自身特征數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)篩選、專(zhuān)業(yè)技術(shù)職務(wù)名稱(chēng)統(tǒng)一和年齡離散化等處理,共得到1490位教師數(shù)據(jù)。其中原始數(shù)據(jù)中的教授和正高級(jí)統(tǒng)一為正高級(jí)職稱(chēng),副教授和其他副高級(jí)統(tǒng)一為副高級(jí)職稱(chēng),講師和其它中級(jí)統(tǒng)一為中級(jí)職稱(chēng),助教和其它初級(jí)統(tǒng)一為初級(jí)職稱(chēng)。年齡的離散化處理將年齡為36歲以下的教師歸為青年教師,36-46歲之間為中年教師,46歲以為老年教師。
最后,將學(xué)生評(píng)教數(shù)據(jù)和教師自身特征基礎(chǔ)數(shù)據(jù)按教師工號(hào)連接合并。因部分外聘教師信息登記不全,連接后的數(shù)據(jù)中有44個(gè)課堂的教師基本信息存在缺失值,去除后剩余1355條記錄為本研究最終使用數(shù)據(jù),結(jié)構(gòu)如表1所示。
2 研究方法及工具
關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的密切程度或關(guān)系,對(duì)于給定的項(xiàng)和事務(wù)集,通過(guò)對(duì)事務(wù)集的分析,挖掘出項(xiàng)集中項(xiàng)之間的相關(guān)性。挖掘出的結(jié)果通常以規(guī)則的形式描述,稱(chēng)為關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的一般表示形式為X→Y。其中X稱(chēng)為規(guī)則的前(左)項(xiàng),可以是一個(gè)項(xiàng)或項(xiàng)集。Y稱(chēng)為規(guī)則的后(右)項(xiàng),一般為一個(gè)項(xiàng),表示某種結(jié)論或事實(shí)。
一般情況下,可以從數(shù)據(jù)中找到很多關(guān)聯(lián)規(guī)則,但并不是所有的關(guān)聯(lián)規(guī)則都有效且實(shí)用。必須采用一定的測(cè)度指標(biāo)篩選出有效且實(shí)用的關(guān)聯(lián)規(guī)則,這些規(guī)則稱(chēng)為強(qiáng)關(guān)聯(lián)規(guī)則。強(qiáng)關(guān)聯(lián)規(guī)則常用的測(cè)度指標(biāo)包括支持度(support)、可信度(confidence)和提升度(lift)。
支持度用于測(cè)度關(guān)聯(lián)規(guī)則應(yīng)用的普適性,其值為前項(xiàng)與后項(xiàng)同時(shí)出現(xiàn)的概率,數(shù)學(xué)公式如式(1)所示,式中|T|表示事務(wù)總數(shù)。
可信度用于測(cè)度關(guān)聯(lián)規(guī)則的準(zhǔn)確性,其值為包含前項(xiàng)的事務(wù)中同時(shí)也包含后項(xiàng)的概率,反映出前項(xiàng)出現(xiàn)的條件下后項(xiàng)出現(xiàn)的可能性,數(shù)學(xué)公式如式(2)所示,式中|T(X)|表示包含項(xiàng)X的事務(wù)數(shù),|T(X∩Y)|表示同時(shí)包含項(xiàng)X和項(xiàng)Y的事務(wù)數(shù)。置信度高說(shuō)明前項(xiàng)出現(xiàn)時(shí)后項(xiàng)出現(xiàn)的可能性高。
置信度和支持度用于測(cè)度規(guī)則的有效性,即那些具有較高置信度和較高支持度的規(guī)則才被認(rèn)為是有效的規(guī)則。實(shí)際挖掘過(guò)程中,通常需要根據(jù)實(shí)際情況指定最小支持度和最小可信度。
有效的關(guān)聯(lián)規(guī)則并不一定實(shí)用。因?yàn)檫@些規(guī)則可能揭示的僅僅是一種隨機(jī)關(guān)聯(lián)關(guān)系,也可能揭示的是反向關(guān)聯(lián)關(guān)系[7]。因此,在進(jìn)行關(guān)聯(lián)規(guī)則挖掘時(shí)不僅要考慮規(guī)則的有效性還要考慮規(guī)則的實(shí)用性。
提升度用于測(cè)度規(guī)則的實(shí)用性,其值為規(guī)則置信度與后項(xiàng)支持度之比,數(shù)學(xué)公式如式(3)所示。
提升度反映了規(guī)則前項(xiàng)的出現(xiàn)對(duì)規(guī)則后項(xiàng)出現(xiàn)的影響程度。有實(shí)用價(jià)值的規(guī)則是那些提升度大于1的規(guī)則,因?yàn)橹挥刑嵘却笥?才能說(shuō)明前項(xiàng)的出現(xiàn)對(duì)后項(xiàng)的出現(xiàn)有促進(jìn)作用。
本研究利用關(guān)聯(lián)規(guī)則挖掘的思想挖掘?qū)W生評(píng)教平均得分等級(jí)與教師自身特征之間的強(qiáng)關(guān)聯(lián)規(guī)則,其前項(xiàng)為教師自身特征即性別、職稱(chēng)、年齡和最高學(xué)位中一項(xiàng)或多項(xiàng)的組合,后項(xiàng)為平均得分等級(jí)。研究過(guò)程利用R語(yǔ)言中的相關(guān)函數(shù)實(shí)現(xiàn)。
3 挖掘過(guò)程及結(jié)果分析
采用R語(yǔ)言軟件,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)中的Apriori挖掘算法,對(duì)預(yù)處理之后的數(shù)據(jù)進(jìn)行挖掘。首先在R語(yǔ)言GUI窗口中安裝和加載Apriori函數(shù)包arules,通過(guò)read.table函數(shù)將預(yù)處理后的數(shù)據(jù)讀入到數(shù)據(jù)框Data中并轉(zhuǎn)換為T(mén)ransaction類(lèi)的實(shí)例格式,調(diào)用apriori函數(shù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,最后去除冗余規(guī)則后利用inspect函數(shù)查看挖掘結(jié)果。用R語(yǔ)言實(shí)現(xiàn)過(guò)程如下:
install.packages("arules")#安裝相關(guān)包
library("arules")#加載相關(guān)包
Data<-read.table(file="data.txt",header=TRUE) #讀取預(yù)處理后數(shù)據(jù)
Trans<-as(Data,"transactions") #轉(zhuǎn)換為稀疏矩陣式,即Transaction類(lèi)的實(shí)例
Rules <- apriori(Trans,parameter=list(support=0.01,confidence=0.5,minlen=2),
appearance=list(rhs=c("平均得分=差","平均得分=優(yōu)","平均得分=中"),
default="lhs"))
SuperSetF<-is.subset(Rules,Rules) #冗余規(guī)則
inspect(Rules[-which(colSums(SuperSetF)>1)]) #查看去除冗余規(guī)則后結(jié)果
挖掘過(guò)程中最小支持度取1%,最小置信度取50%,最終結(jié)果中只選擇后項(xiàng)為平均得分等級(jí)的規(guī)則,結(jié)果如表2所示。
表2中3條規(guī)則的提升度均大于1,說(shuō)明3條規(guī)則均具有實(shí)用性。第一條規(guī)則表明學(xué)生對(duì)具有碩士學(xué)位年齡在46歲以上正高級(jí)教師的評(píng)教結(jié)果并不理想。這一方面說(shuō)明學(xué)生在評(píng)價(jià)教師授課質(zhì)量時(shí)并未受教師職稱(chēng)的影響,另一方面也反映了當(dāng)前高校教學(xué)中的一種現(xiàn)象,即具有正高級(jí)職稱(chēng)的教師由于兼職或只重視科研而并未將主要精力投入到教學(xué)中去。第2和第3條規(guī)則表明年齡在35歲及以下具有副高級(jí)職稱(chēng)的青年教師深受學(xué)生青睞。通過(guò)與部分學(xué)生座談發(fā)現(xiàn)主要有以下幾個(gè)原因:一是這些教師年齡與學(xué)生接近,思維方式相差不大,易于被學(xué)生接受;二是這些教師基本上都是剛剛博士畢業(yè)不久,對(duì)本專(zhuān)業(yè)的知識(shí)掌握程度既有廣度又有深度,而且與現(xiàn)實(shí)比較貼近,容易引起學(xué)生共鳴;三是這些教師信息化教育水平較高,上課過(guò)程中善于利用多種教學(xué)手段,能夠較好地吸引學(xué)生的注意力;四是這些教師經(jīng)過(guò)幾年的實(shí)際教學(xué)經(jīng)歷具備了一定的教學(xué)經(jīng)驗(yàn)。
4 結(jié)論及建議
本研究共得到兩個(gè)主要的研究發(fā)現(xiàn):第一,具有碩士學(xué)位職稱(chēng)為正高級(jí)年齡超過(guò)46歲的教師的學(xué)生評(píng)教結(jié)果較差。第二,具有副高級(jí)職稱(chēng)年齡在35歲及以下的教師的學(xué)生評(píng)教結(jié)果最好。
基于本研究的發(fā)現(xiàn),我們提出了如下的教學(xué)建議。
(1)高校在強(qiáng)調(diào)讓具有正高級(jí)職稱(chēng)的教師必須為本科生上課的同時(shí),還應(yīng)當(dāng)通過(guò)思想教育和制度設(shè)計(jì)讓這些教師真正愿意投入精力為本科生上好課。
(2)教師教學(xué)發(fā)展研究中心應(yīng)有針對(duì)性地多開(kāi)展教師教學(xué)培訓(xùn)與交流,對(duì)教學(xué)效果差的教師深入剖析原因,加強(qiáng)教育與培訓(xùn),對(duì)教學(xué)效果好的教學(xué)方式和手段大力推廣。
(3)組織人事部門(mén)應(yīng)鼓勵(lì)教師攻讀博士學(xué)位或進(jìn)修,進(jìn)一步提高教師的業(yè)務(wù)水平。
總之,希望通過(guò)本文的研究結(jié)果一方面可以為我國(guó)高校建立科學(xué)的人事管理和決策制度提供依據(jù),指導(dǎo)學(xué)校有針對(duì)性地加強(qiáng)對(duì)教師的教育、培養(yǎng)和培訓(xùn)。另一方面可以幫助高校教師審視自己的教學(xué)過(guò)程,調(diào)動(dòng)教師的教學(xué)積極性,提高教師對(duì)教學(xué)工作的重視程度和教學(xué)有效性。
基金項(xiàng)目:本文系湖北省教學(xué)研究項(xiàng)目“基于數(shù)據(jù)挖掘技術(shù)的高校教學(xué)質(zhì)量評(píng)價(jià)研究”(項(xiàng)目編號(hào):2014191)研究成果之一。
參考文獻(xiàn)
[1] 周秀梅,翁家銘,李石君.完全加權(quán)正負(fù)關(guān)聯(lián)規(guī)則算法及其在評(píng)教數(shù)據(jù)中的應(yīng)用[J].內(nèi)蒙古師范大學(xué)
學(xué)報(bào)(自然科學(xué)漢文版), 2016,45(2):242-248.
[2] 李高菊.數(shù)據(jù)挖掘在職業(yè)院校“學(xué)評(píng)教”體系中的應(yīng)用[J].河北軟件職業(yè)技術(shù)學(xué)院,2016,18(3):47-50.
[3] 張美華,歐云. 關(guān)聯(lián)規(guī)則在高校評(píng)教系統(tǒng)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2016,12(1):31-34
[4] 楊鈞,馬鐵明,吳磊,張穎.關(guān)聯(lián)規(guī)則在中醫(yī)院校學(xué)生評(píng)教系統(tǒng)中應(yīng)用[J].遼寧中醫(yī)藥大學(xué)學(xué)報(bào), 2016,18(11):
222-224.
[5] 張硯雪.應(yīng)用關(guān)聯(lián)規(guī)則算法對(duì)高校教師測(cè)評(píng)數(shù)據(jù)進(jìn)行分析]J].科技創(chuàng)新導(dǎo)報(bào),2016(1):105,106,108.
[6] 陳磊,倪天倪.學(xué)生評(píng)教差評(píng)教師的有效性研究[J].高教探索,2012(1):84-90.
[7] 薛薇.基于R的統(tǒng)計(jì)分析與數(shù)據(jù)挖掘[M].北京:中國(guó)人民大學(xué)出版社,2015:323.