祁瑞麗,郭學(xué)濤,孟軍英,李 瑗
(1.石家莊學(xué)院 計(jì)算機(jī)科學(xué)與工程學(xué)院,河北 石家莊 050035;2.中國(guó)電信集團(tuán)有限公司石家莊分公司,河北 石家莊 050000)
教學(xué)評(píng)價(jià)是衡量高校教學(xué)質(zhì)量的重要指標(biāo),也是教學(xué)環(huán)節(jié)的基礎(chǔ)組成部分,關(guān)系到學(xué)生學(xué)習(xí)效果和就業(yè)質(zhì)量.當(dāng)前的教學(xué)質(zhì)量評(píng)價(jià)大多按照以下程序展開:首先教學(xué)主管部門結(jié)合本校實(shí)際制定評(píng)價(jià)指標(biāo)和評(píng)價(jià)權(quán)重,然后通過網(wǎng)絡(luò)對(duì)評(píng)價(jià)量表進(jìn)行逐項(xiàng)打分,最后,教務(wù)部門根據(jù)網(wǎng)絡(luò)評(píng)分劃分教學(xué)質(zhì)量考核等級(jí),并以此作為重要參考對(duì)教師進(jìn)行評(píng)優(yōu)評(píng)先和年度考核.通常,評(píng)價(jià)主體采用多元化方式,包括學(xué)生評(píng)價(jià)、同行互評(píng)、專家評(píng)價(jià)等[1-4],各個(gè)評(píng)價(jià)部分按重要程度占有不同的比例.網(wǎng)絡(luò)系統(tǒng)評(píng)分后,如何合理地利用數(shù)據(jù)挖掘技術(shù)對(duì)大量的評(píng)教數(shù)據(jù)進(jìn)行處理和分析,尋找其背后隱藏的有價(jià)值信息,更好地為教師和教學(xué)管理部門服務(wù),已成為亟待解決的問題[5-7].
本研究首先對(duì)評(píng)價(jià)的原始數(shù)據(jù)進(jìn)行預(yù)處理,然后選擇關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘算法,找出教師信息和課程信息與教學(xué)評(píng)價(jià)結(jié)果之間的隱藏聯(lián)系,發(fā)現(xiàn)提高教學(xué)質(zhì)量的相關(guān)因素,為今后的課程設(shè)置和教學(xué)改革提供思路和方法.
數(shù)據(jù)挖掘是從大量、未經(jīng)清洗、隨機(jī)的數(shù)據(jù)中,抽取出蘊(yùn)含在其中隱含著有實(shí)用價(jià)值的信息和知識(shí)的過程[8].數(shù)據(jù)挖掘系統(tǒng)利用所挖掘的知識(shí)類型分類包括:關(guān)聯(lián)和相關(guān)分析、分類、預(yù)測(cè)、聚類等[9].
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的一種重要方法,該算法從大規(guī)模數(shù)據(jù)集中尋找項(xiàng)間的隱含關(guān)系.關(guān)聯(lián)規(guī)則挖掘的主要步驟為:
1)找出所有滿足最小支持度的頻繁項(xiàng)集;
2)找出滿足最小支持度和最小置信度的頻繁項(xiàng)集,并產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則.
關(guān)于支持度和置信度有如下定義:
假設(shè)I={I1,I2,…,I m}是項(xiàng)的集合.設(shè)數(shù)據(jù)庫D={T1,T2,…,T n}是數(shù)據(jù)庫事務(wù)的集合,其中每個(gè)事務(wù)T i(1<=i<=n)是項(xiàng)的集合,使得T i?I.每個(gè)事務(wù)有一個(gè)唯一標(biāo)識(shí)符TID.關(guān)聯(lián)規(guī)則是形如A=>B的蘊(yùn)涵式,其中 A?I,B?I,且 A∩B=?.
1)支持度:稱D中事務(wù)包含A∪B的百分比為規(guī)則A=>B的支持度support,即概率P(A∪B).因此有式(1)成立:
2)置信度:稱D中包含A的事務(wù)同時(shí)也包含B的百分比為規(guī)則A=>B的置信度confidence,即條件概率P(B|A).因此有式(2)成立:
通常用百分比表示支持度和置信度,二者的閾值由用戶或領(lǐng)域?qū)<以O(shè)定[10].若一個(gè)規(guī)則既滿足最小支持度閾值又滿足最小置信度閾值,則稱其為強(qiáng)關(guān)聯(lián)規(guī)則.
最常用的關(guān)聯(lián)規(guī)則挖掘算法是Aprioir算法.該算法掃描數(shù)據(jù)庫,搜索滿足最小支持度的項(xiàng),并找出頻繁項(xiàng)的集合.算法多次迭代執(zhí)行,直到不能再找到頻繁K項(xiàng)集為止[10].
將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用到教學(xué)評(píng)價(jià)分析中,試圖發(fā)現(xiàn)教師信息、課程信息與教學(xué)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)性,以便進(jìn)一步提高教學(xué)質(zhì)量,服務(wù)于教學(xué)管理.
為了去掉數(shù)據(jù)中的噪聲和不一致,提高挖掘結(jié)果的質(zhì)量,采用數(shù)據(jù)清理技術(shù)對(duì)源數(shù)據(jù)進(jìn)行處理.本研究提取石家莊學(xué)院計(jì)算機(jī)學(xué)院2014~2018年的學(xué)生評(píng)價(jià)數(shù)據(jù)作為源數(shù)據(jù),對(duì)其中的不完整、噪聲和不一致進(jìn)行消除處理,然后采用數(shù)據(jù)集成方法,將教師信息表、課程信息表和教學(xué)評(píng)價(jià)信息表整合到一起,并對(duì)用戶敏感信息做刪除處理,對(duì)教師工號(hào)和課程代碼做簡(jiǎn)化處理,部分整合后的數(shù)據(jù)如表1所示.
為了提高數(shù)據(jù)挖掘過程的精度和性能[10],首先要對(duì)原始數(shù)據(jù)進(jìn)行必要的轉(zhuǎn)換.結(jié)合上述原始數(shù)據(jù)特點(diǎn)及數(shù)據(jù)轉(zhuǎn)換方法,對(duì)數(shù)值型數(shù)據(jù)主要采用數(shù)據(jù)泛化的辦法,將原本分散的數(shù)值映射到特定的區(qū)間和范圍內(nèi).對(duì)文本型數(shù)據(jù)如職稱,則進(jìn)行離散化處理,將其劃分為不同的類別標(biāo)識(shí).
具體轉(zhuǎn)換方法:將年齡分為 4 組:A1[28,35],A2[36,43],A3[44,51],A4[52,59];評(píng)定分?jǐn)?shù)分為 4 組:S1[87,90],S2[91,92],S3[93,95],S4[96,98];職稱劃分為 4 組:L1 初級(jí),L2 中級(jí),L3 副高,L4 正高;對(duì)學(xué)生人數(shù)進(jìn)行離散化處理,評(píng)價(jià)人數(shù)分為 4 組:N1[10,50],N2[51,100],N3[101,150],N4[151,350];教師學(xué)位劃分為學(xué)士,碩士,博士3個(gè)等級(jí).
表1 部分教學(xué)評(píng)價(jià)信息
將處理后的教學(xué)評(píng)價(jià)數(shù)據(jù)作為源數(shù)據(jù),采用數(shù)據(jù)挖掘工具SPSS Modeler,基于Aprioir算法進(jìn)行數(shù)據(jù)建模,設(shè)置支持度和置信度閾值,尋找滿足條件的頻繁項(xiàng)集,分析評(píng)價(jià)等級(jí)相關(guān)因素與結(jié)果之間的內(nèi)在聯(lián)系.
2.3.1 學(xué)生人數(shù)與評(píng)價(jià)等級(jí)之間的關(guān)系
設(shè)置數(shù)據(jù)流如圖1所示.利用Aprioir算法,對(duì)授課班級(jí)人數(shù)和教學(xué)評(píng)價(jià)等級(jí)進(jìn)行關(guān)聯(lián)分析,得到學(xué)生人數(shù)和評(píng)價(jià)等級(jí)的支持度和置信度. 假設(shè)最小支持度為10%,最小置信度為45%,得到學(xué)生人數(shù)和評(píng)價(jià)等級(jí)的頻繁項(xiàng)集(表2)
圖1 數(shù)據(jù)流圖
從表2可以看出,授課班級(jí)人數(shù)在151~350人時(shí),評(píng)價(jià)等級(jí)處于91~92分的支持度和置信度分別為10.87%和80.0%;學(xué)生人數(shù)在51~100人時(shí),評(píng)價(jià)等級(jí)為93~95分的支持度為39.13%,置信度為47.22%.
2.3.2 教師年齡與評(píng)價(jià)等級(jí)之間的關(guān)系
以教師年齡作為輸入項(xiàng),評(píng)價(jià)等級(jí)作為目標(biāo)項(xiàng),得到教師年齡和評(píng)價(jià)等級(jí)之間的支持度和置信度.設(shè)置最小支持度10%,最小置信度40%,得到教師年齡與評(píng)價(jià)等級(jí)的頻繁項(xiàng)集(表3).
由表3可知,當(dāng)教師年齡處于28~35歲時(shí),評(píng)價(jià)等級(jí)處于91~92分的支持度為16.30%,置信度為53.33%;當(dāng)教師年齡處于44~51歲時(shí),評(píng)價(jià)等級(jí)處于96~98分的支持度和置信度分別為17.39%和43.75%;當(dāng)教師年齡處于36~43歲時(shí),評(píng)價(jià)等級(jí)處于93~95分的支持度為57.61%,置信度為43.40%.
2.3.3 教師職稱與評(píng)價(jià)等級(jí)之間的關(guān)系
以教師職稱作為輸入項(xiàng),評(píng)價(jià)等級(jí)作為目標(biāo)項(xiàng),得到教師職稱和評(píng)價(jià)等級(jí)之間的支持度和置信度.假設(shè)最小支持度20%,最小置信度40%,得到教師職稱與評(píng)價(jià)等級(jí)的頻繁項(xiàng)集(表4).
由表4可以看出,教師職稱為中級(jí)時(shí),評(píng)價(jià)等級(jí)在93~95分的支持度為48.91%,置信度為40.0%;教師職稱為副高,評(píng)價(jià)等級(jí)在93~95分的支持度和置信度分別為27.17%和44.0%.職稱為副高,評(píng)價(jià)等級(jí)在93~95分的支持度和置信度分別為27.17%和44.0%.
表2 學(xué)生人數(shù)和評(píng)價(jià)等級(jí)的頻繁項(xiàng)集
表3 教師年齡與評(píng)價(jià)等級(jí)的頻繁項(xiàng)集
表4 教師職稱與評(píng)價(jià)等級(jí)的頻繁項(xiàng)集
根據(jù)以上數(shù)據(jù)相關(guān)性分析結(jié)果,得出如下結(jié)論:
1)授課班級(jí)的學(xué)生人數(shù)對(duì)評(píng)價(jià)結(jié)果有重要影響,二者之間大致呈反比關(guān)系.學(xué)生人數(shù)較少時(shí),教學(xué)評(píng)價(jià)等級(jí)較高;反之,則教學(xué)評(píng)價(jià)等級(jí)較低.由此可見,授課班級(jí)人數(shù)會(huì)影響到教學(xué)效果與學(xué)習(xí)質(zhì)量,人數(shù)超過一定數(shù)量就會(huì)影響授課方式、教學(xué)組織、課堂互動(dòng)、作業(yè)批改和輔導(dǎo)答疑,造成學(xué)習(xí)體驗(yàn)和學(xué)習(xí)效果的下降.因此,學(xué)院今后在安排課程時(shí),要想提高整體教學(xué)質(zhì)量,就應(yīng)倡導(dǎo)小班授課模式,積極探索人數(shù)較多的公共基礎(chǔ)課和公選課的教學(xué)方法.
2)教師年齡與評(píng)價(jià)等級(jí)之間大致呈反比關(guān)系.年齡為44~51歲的教師,教學(xué)評(píng)價(jià)為96~98分的概率較大;年齡為28~35歲的教師,教學(xué)評(píng)價(jià)為91~92分的概率較大.學(xué)校應(yīng)加大對(duì)青年教師的培養(yǎng)力度,為其提供培訓(xùn)和學(xué)習(xí)的機(jī)會(huì),充分發(fā)揮老教師的優(yōu)勢(shì),形成青年教師導(dǎo)師制,以盡快提高青年教師業(yè)務(wù)能力和專業(yè)素養(yǎng).
3)教師職稱與評(píng)價(jià)等級(jí)之間沒有直接相關(guān)性.無論職稱如何,都不影響教師教學(xué)的積極性.
教學(xué)效果關(guān)系到學(xué)生的成長(zhǎng)和發(fā)展,對(duì)高校人才培養(yǎng)的質(zhì)量起著關(guān)鍵作用.本研究采用關(guān)聯(lián)規(guī)則挖掘技術(shù)對(duì)教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行建模和分析,為高校的教學(xué)組織、人才引進(jìn)和教師培訓(xùn)等管理工作提供思路.進(jìn)一步結(jié)合課程性質(zhì)、專業(yè)特點(diǎn)及學(xué)生情感因素等挖掘評(píng)價(jià)數(shù)據(jù),以及分析評(píng)價(jià)指標(biāo)的維度和權(quán)重設(shè)置,以制定具有個(gè)性化的評(píng)價(jià)系統(tǒng),是未來研究的重要方向.