常軍林,張 真
(河南交通職業(yè)技術(shù)學(xué)院 交通信息工程系,鄭州 450005)
?
數(shù)據(jù)挖掘在高校教學(xué)評(píng)價(jià)中的應(yīng)用
常軍林,張 真
(河南交通職業(yè)技術(shù)學(xué)院 交通信息工程系,鄭州 450005)
教學(xué)評(píng)價(jià)對(duì)于高等教育的發(fā)展和教育質(zhì)量的提高,起著十分重要的作用。但在日常的教學(xué)管理中,這些數(shù)據(jù)并沒有得到充分的利用,本文將數(shù)據(jù)挖掘引入教學(xué)領(lǐng)域,從教學(xué)評(píng)價(jià)數(shù)據(jù)中提取出隱藏在數(shù)據(jù)之中的有用信息,以便更好地為教學(xué)管理服務(wù)。
數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;教學(xué)評(píng)價(jià)
高等學(xué)校多年來在教學(xué)管理中積累了很多有用的數(shù)據(jù),但目前并沒有得到充分的利用,只是停留在表面信息的分析階段,并以此作為教師評(píng)優(yōu)評(píng)先的重要依據(jù)。而事實(shí)上,這些數(shù)據(jù)中隱藏著重要的內(nèi)在信息,因此,如何深入利用這些數(shù)據(jù),轉(zhuǎn)化為進(jìn)一步可利用的信息為學(xué)校的管理者提供決策支持,已成為教學(xué)領(lǐng)域亟待解決的一個(gè)問題。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。基于此,本文將數(shù)據(jù)挖掘技術(shù)引入到教學(xué),從教學(xué)評(píng)價(jià)的數(shù)據(jù)中提取出隱藏在數(shù)據(jù)中的有用信息,如將關(guān)聯(lián)規(guī)則、粗糙集應(yīng)用于教學(xué)評(píng)價(jià)中,探討影響教學(xué)質(zhì)量的關(guān)鍵因素。
1.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則,是數(shù)據(jù)挖掘的一個(gè)重要課題,用于從大量數(shù)據(jù)中挖掘出有價(jià)值的數(shù)據(jù)項(xiàng)之間的相關(guān)關(guān)系。
關(guān)聯(lián)規(guī)則定義為:假設(shè)I={I1,I2,…,Im}是項(xiàng)的集合。給定一個(gè)交易數(shù)據(jù)庫(kù)D={t1,t2,…,tn},其中每個(gè)事務(wù)(Transaction)t是I的非空子集,即t?I,每一個(gè)交易都與一個(gè)唯一的標(biāo)識(shí)符TID(Transaction ID)對(duì)應(yīng)。關(guān)聯(lián)規(guī)則是形如X?Y的蘊(yùn)涵式,其中X,Y?I且X∩Y=?,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼。
關(guān)聯(lián)規(guī)則X?Y在D中的支持度(Support)是D中事務(wù)包含X∪Y的百分比,即概率P(X∪Y);置信度(Confidence)是包含X的事務(wù)中同時(shí)包含Y的百分比,即條件概率P(Y|X)。如果同時(shí)滿足最小支持度閾值和最小置信度閾值,則認(rèn)為關(guān)聯(lián)規(guī)則是有趣的。這些閾值由用戶或者專家設(shè)定。
1.2 粗糙集
粗糙集理論是近年來才興起的研究不精確、不確定性知識(shí)的表達(dá)、學(xué)習(xí),從中發(fā)現(xiàn)隱含的知識(shí),揭示潛在規(guī)律的理論。它模擬人類的抽象邏輯思維,以各種更接近人們對(duì)事務(wù)表述方式的定性或混合信息為輸入,并且通過簡(jiǎn)單的決策表來簡(jiǎn)化得到輸入內(nèi)容和輸出內(nèi)容的映射關(guān)系。粗糙集理論利用已知的知識(shí)庫(kù),來考察知識(shí)表中不同屬性的重要性,以此確定哪些知識(shí)是冗余的,哪些知識(shí)是有用的。粗糙集理論的運(yùn)用以學(xué)校掌握大量的數(shù)據(jù)信息為前提,以對(duì)觀察和計(jì)量所得數(shù)據(jù)進(jìn)行分類的能力為基礎(chǔ),從中發(fā)現(xiàn)、推理知識(shí)和分辨系統(tǒng)的某些特點(diǎn)、過程等。
教學(xué)評(píng)價(jià)是指依據(jù)一定的教學(xué)規(guī)范標(biāo)準(zhǔn)和教學(xué)目標(biāo),通過對(duì)學(xué)院教與學(xué)等教學(xué)情況的系統(tǒng)檢測(cè)與考核,評(píng)定其教學(xué)效果與教學(xué)目標(biāo)的實(shí)現(xiàn)程度,并作出相應(yīng)判斷和改進(jìn)的一種行為。教學(xué)評(píng)價(jià)包括學(xué)生評(píng)價(jià)、系部評(píng)價(jià)、教師自評(píng)等,由于學(xué)生評(píng)價(jià)是獲取教學(xué)反饋信息的主要方法,所以本文對(duì)數(shù)據(jù)的分析和挖掘主要針對(duì)學(xué)生評(píng)價(jià)數(shù)據(jù)展開,再結(jié)合教師的基本信息(年齡、職稱等)進(jìn)行分析,充分挖掘這些數(shù)據(jù)所隱含的價(jià)值,以進(jìn)一步提高教學(xué)質(zhì)量。
2.1 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)選擇和數(shù)據(jù)預(yù)處理。
2.1.1 數(shù)據(jù)選擇
數(shù)據(jù)選擇的主要目的是確定發(fā)現(xiàn)任務(wù)的操作對(duì)象,即根據(jù)用戶的需要,從原始數(shù)據(jù)庫(kù)提取數(shù)據(jù)形成目標(biāo)數(shù)據(jù)。我們可以從學(xué)院的教務(wù)系統(tǒng)中提取教師的基本信息,如工號(hào)、職稱、學(xué)歷、年齡、教齡等,再?gòu)南到y(tǒng)中提取評(píng)價(jià)數(shù)據(jù)。
2.1.2 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理包括去除噪聲、缺失值的處理以及刪除無效數(shù)據(jù)等。例如,學(xué)生對(duì)教師的評(píng)價(jià)出現(xiàn)極端值0分或者100分,這樣的數(shù)據(jù)應(yīng)當(dāng)被當(dāng)作異常數(shù)據(jù)作一些相應(yīng)處理。另外,還有缺失值的情況,若是學(xué)生的學(xué)號(hào)或者班級(jí)號(hào)等內(nèi)容出現(xiàn)了缺失,可以忽略;若是評(píng)價(jià)結(jié)果出現(xiàn)缺失,則需要進(jìn)行相應(yīng)的處理。
2.2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘就是對(duì)所有得到的經(jīng)過處理數(shù)據(jù)進(jìn)行挖掘。
2.2.1 內(nèi)部挖掘
目前,高校的教學(xué)評(píng)價(jià)體系主要取決于學(xué)生評(píng)價(jià),內(nèi)容上主要是對(duì)“教師水平、教學(xué)內(nèi)容、教學(xué)態(tài)度、教學(xué)模式”等指標(biāo)的評(píng)價(jià),通過對(duì)學(xué)生評(píng)價(jià)數(shù)據(jù)中這些指標(biāo)的挖掘分析,就可確定出關(guān)鍵指標(biāo)。這里以“教師水平”這一指標(biāo)為例,建立關(guān)聯(lián)函數(shù)。
假設(shè)x:某教師該項(xiàng)得分占評(píng)教總分的百分比
b:該項(xiàng)總分值占評(píng)教總分的百分比,0≤x≤b
X0=,X=<0,b>,a為成為關(guān)鍵因素至少應(yīng)到達(dá)的百分比,于是可建立初等關(guān)聯(lián)函數(shù),即
這里由于x0=b,因此g(x,x0,X0)=a-x;
而D(x,X0,X)=g(x,X)-g(x,X0),
通過得到的關(guān)聯(lián)函數(shù)值,可定量的描述“教學(xué)水平”等因素,從而判斷其是否是關(guān)鍵因素,并可根據(jù)關(guān)聯(lián)函數(shù)值的大小區(qū)分出關(guān)鍵程度。
此關(guān)聯(lián)函數(shù)值為正,因此“教學(xué)水平”是一個(gè)關(guān)鍵因素,其關(guān)鍵程度為0.68。
通過以上的關(guān)聯(lián)函數(shù),我們從教學(xué)評(píng)價(jià)數(shù)據(jù)中挖掘出了影響該校教學(xué)評(píng)價(jià)的關(guān)鍵因素有哪些的重要信息,為教學(xué)質(zhì)量控制指明了方向。
2.2.2 內(nèi)部與外部特征之間的關(guān)聯(lián)規(guī)則挖掘
運(yùn)用關(guān)聯(lián)規(guī)則,針對(duì)學(xué)生評(píng)價(jià)數(shù)據(jù)和教師基本信息,我們來探討一下高校教師教學(xué)效果與教師的學(xué)歷、年齡、職稱等特征之間的關(guān)系。
這里,挖掘過程分為三步:
(1)數(shù)據(jù)準(zhǔn)備。如從某校教務(wù)系統(tǒng)中隨機(jī)抽取500份學(xué)生評(píng)教數(shù)據(jù),將職稱、年齡和評(píng)教分?jǐn)?shù)調(diào)入數(shù)據(jù)庫(kù),其他信息忽略不計(jì)。因?yàn)樵u(píng)定分?jǐn)?shù)、年齡屬于數(shù)值型數(shù)據(jù),職稱是文本型數(shù)據(jù),于是要先將它們轉(zhuǎn)換成布爾型。之后進(jìn)行數(shù)據(jù)的離散處理,對(duì)評(píng)定分?jǐn)?shù)和年齡分組,例如將年齡分為M1[23,30], M2[31,40],M3[41,49], M4[50,60]四組;評(píng)定分?jǐn)?shù)分為N1[90,100],N2[80,89],N3[60,79],N4[0,59]四組;將職稱的級(jí)別分為G1初級(jí),G2中級(jí),G3副高,G4正高。數(shù)據(jù)準(zhǔn)備階段為以上三者之間的關(guān)系奠定了基礎(chǔ)。
(2) 關(guān)聯(lián)規(guī)則挖掘。若評(píng)定分?jǐn)?shù) [90,100],表示課堂效果較好,利用挖掘技術(shù),通過關(guān)聯(lián)規(guī)則的算法,挖掘出具有較好課堂效果的教師的基本信息特征。
(3) 模式評(píng)估,即從初步關(guān)聯(lián)規(guī)則挖掘信息。
例如表1是某高校應(yīng)用B/S結(jié)構(gòu),通過網(wǎng)上評(píng)教原始數(shù)據(jù)片段,表2是教師基本情況。
表1 學(xué)生評(píng)教原始數(shù)據(jù)表
其中SID是學(xué)生編號(hào),TID是教師編號(hào),CID是課程編號(hào),A—I是各種評(píng)教指標(biāo),J是總評(píng),數(shù)字代表對(duì)應(yīng)的分?jǐn)?shù)。
這里以表1中的B列指標(biāo)為例,建立關(guān)聯(lián)函數(shù)。
表2 教師基本情況表
依據(jù)于上述所講述的關(guān)聯(lián)函數(shù)的內(nèi)容,不難得出該教師學(xué)生評(píng)教的總分平均為89,該指標(biāo)的平均得分為10,該指標(biāo)的總分為15,規(guī)定關(guān)鍵因素至少應(yīng)達(dá)到的百分比為a=9%,則x=10/89=11%,b=15/89=17%,X0=<9%,11%>,X=<0,17%>代入關(guān)聯(lián)函數(shù),得f(x)=0.48>0,證明此指標(biāo)是影響教學(xué)評(píng)價(jià)的關(guān)鍵因素。
然后,將關(guān)鍵因素與教師基本信息關(guān)聯(lián)。將職稱、年齡和評(píng)教分?jǐn)?shù)調(diào)入數(shù)據(jù)庫(kù),并轉(zhuǎn)化為布爾型。然后,搜索數(shù)據(jù)庫(kù),得到評(píng)定分?jǐn)?shù)大于等于90的記錄總共有5條,假設(shè)最小支持度為5%,最小可信度為18%,經(jīng)過挖掘,可以得到“年齡在M2[31,40]的評(píng)定分?jǐn)?shù)為N1[90,100]的可能性是36%,支持度是9%”,“職稱為G2中級(jí),評(píng)定分?jǐn)?shù)為N1[90,100]的可能性是27%,支持度是10%”初步結(jié)果。
最后進(jìn)行模式評(píng)估,可以挖掘出“年齡在31-49歲的中青年教師具有豐富的課堂教學(xué)經(jīng)驗(yàn),評(píng)定分?jǐn)?shù)的支持度和可信度都較高”,從而為高校的教學(xué)部門提供決策支持信息,有助于班級(jí)排課時(shí)合理有效的配置師資資源,為好為學(xué)生服務(wù)。
將數(shù)據(jù)挖掘用于高校教學(xué)評(píng)價(jià),有助于發(fā)現(xiàn)目前高校通過傳統(tǒng)評(píng)價(jià)所不能完全獲得的有用信息。本文主要是基于學(xué)生評(píng)教信息和教師的基本信息,介紹了如何挖掘內(nèi)部或者內(nèi)部與外部關(guān)聯(lián)性知識(shí)的方法。本文的研究只是數(shù)據(jù)挖掘應(yīng)用與教學(xué)領(lǐng)域的初級(jí)階段,旨在為后續(xù)的深入研究做鋪墊,如何將挖掘方法計(jì)算機(jī)化進(jìn)而以便實(shí)現(xiàn)數(shù)據(jù)的批量處理,將是我們以后的研究重點(diǎn)。
[1]楊永斌.數(shù)據(jù)挖掘技術(shù)在教育中的應(yīng)用研究[J].計(jì)算機(jī)科學(xué),2006(12):284-286.
[2]袁方.實(shí)用數(shù)據(jù)挖掘[M].北京: 電子工業(yè)出版社,2010.
[3]彭玉青.數(shù)據(jù)挖掘技術(shù)及其在教學(xué)中的應(yīng)用[J].河北科技大學(xué)學(xué)報(bào),2009(4):21-29.
[4]曹紅旗.關(guān)于發(fā)展性教學(xué)評(píng)價(jià)的認(rèn)識(shí)與實(shí)踐[J].山東教育科研,2011(5):43-45.
[6]閻四清.數(shù)據(jù)挖掘——概念、模型、方法和算法[M].北京: 清華大學(xué)出版社,2009.
(責(zé)任編輯 趙冰)
The Application of Data Mining in Higher Institution Teaching Evaluation
ZHANG Zhen, CHANG Jun-lin
(Department of Traffic Information Engineering, Henan Vocational and Technical College, Zhengzhou 450005, China)
Teaching evaluation plays a very important role in the development of higher education and the improvement of educational quality.But in the daily teaching management, these data have not been fully utilized.In this paper, the data mining is introduced into teaching field, extracting useful information from the teaching evaluation data, so as to provide better service for teaching management.
data mining; association rules; teaching evaluation
2015-12-22
河南省高等教育教學(xué)改革項(xiàng)目(2014SJGLX434)
常軍林(1973—),男,河南林州人,河南交通職業(yè)技術(shù)學(xué)院交通信息工程系副教授,研究方向?yàn)榫W(wǎng)絡(luò)、數(shù)據(jù)庫(kù)與軟件架構(gòu)。
10.13783/j.cnki.cn41-1275/g4.2016.02.021
TP311
A
1008-3715(2016)02-0105-03