馬靜
摘要
本文闡述了利用數(shù)據(jù)挖掘軟件clementine將數(shù)據(jù)挖掘技術引入到教學管理工作之中,從教學評價的數(shù)據(jù)中提取出隱藏在數(shù)據(jù)中的有用信息,探討影響教學質(zhì)量的關鍵因素,從而為教學主管部門的管理工作提供決策性參考。
【關鍵詞】數(shù)據(jù)挖掘 高職 評價模型
隨著“教育信息化”的發(fā)展,教務管理的相關數(shù)據(jù)越來越多,但這些數(shù)據(jù)除了作為歷史數(shù)據(jù)外,其有用信息的價值并未充分挖掘和利用,并使其轉化為有用的知識,實現(xiàn)真正的教育信息化。教務管理中的教學評價對于教育質(zhì)量的提高起著十分重要的作用,而利用數(shù)據(jù)挖掘技術從教學評價數(shù)據(jù)中提取出隱藏在數(shù)據(jù)之中的有用信息可為教務管理工作提供決策性參考。數(shù)據(jù)挖掘技術是利用數(shù)據(jù)庫、數(shù)據(jù)倉庫技術存儲管理數(shù)據(jù),利用機器學習和統(tǒng)計方法分析數(shù)據(jù)的一項跨學科技術。通過數(shù)據(jù)挖掘技術我們可以完成數(shù)據(jù)總結、分類、關聯(lián)、聚類等若干主要任務。為了提高數(shù)據(jù)挖掘工作效率,常借用一些工具軟件,clementine是眾多數(shù)據(jù)挖掘軟件之一,它擁有豐富的數(shù)據(jù)挖掘算法,支持與數(shù)據(jù)庫之間的數(shù)據(jù)和模型交換;同時,具有可視化操作界面,簡單易用,分析結果直觀易懂,圖形功能強大等特點。
1 教學評價模型及挖掘算法的選擇
教學評價是學校和教師、教師和學生相互聯(lián)系的一個紐帶。為了更好的完成教學評價,各院校會認真制定學生教學評價指標體系。本文研究的指標體系主要包括教學態(tài)度,基本素質(zhì),教學內(nèi)容,教學方法,教學效果,教學特色六項指標。為了研究六項指標之間,六項指標與評價結果之間的關聯(lián),本文選擇clementine的關聯(lián)分析技術進行數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘中,關聯(lián)分析的主要技術是關聯(lián)規(guī)則(Association Rule),clementine提供了Apriori、GRI、Carma等多種經(jīng)典關聯(lián)規(guī)則算法。本次研究選擇Apriori算法,其主要原因是:研究所涉及數(shù)據(jù)量較大,Apriori算法在提高關聯(lián)規(guī)則分析效率的同時,還能有效揭示數(shù)據(jù)中隱含的關聯(lián)特征。基于Apriori算法模型是無指導學習方法,本次研究采用web網(wǎng)狀圖分析報告與模型比較的方式來評價模型。
2 利用clementine對教學評價進行數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的過程主要包括五個階段:
(1)數(shù)據(jù)準備;
(2)數(shù)據(jù)選擇;
(3)數(shù)據(jù)預處理;
(4)數(shù)據(jù)挖掘;
(5)轉換模型及模式評價,本文研究嚴格按照上述步驟進行。
2.1 數(shù)據(jù)準備及數(shù)據(jù)選擇
數(shù)據(jù)準備主要包含兩點:一是要根據(jù)挖掘對象收集原始數(shù)據(jù),即確立數(shù)據(jù)源,第二是整合數(shù)據(jù)。本文數(shù)據(jù)源來源于教務系統(tǒng)3個學期39位教師的教學評價信息表666078條數(shù)據(jù),其表結構如表1所示,經(jīng)過數(shù)據(jù)表的聯(lián)接與篩選生成了表結構如表2所示的訓練樣本集。
2.2 數(shù)據(jù)預處理
數(shù)據(jù)預處理在數(shù)據(jù)挖掘過程中是很重要的一個環(huán)節(jié),它可以保證數(shù)挖掘所需數(shù)據(jù)集的質(zhì)量。數(shù)據(jù)預處理工作主要是對收集的數(shù)據(jù)進行清理,針對教學評價信息特點,數(shù)據(jù)預處理主要分兩步進行:
2.2.1 數(shù)據(jù)清理
數(shù)據(jù)清理工作主要是對于空缺的屬性,使用數(shù)據(jù)清理技術來填充,當記錄有多個屬性缺少屬性值時,將這些記錄將視為無效記錄并刪除。
2.2.2 屬性歸約
樣本集中用于數(shù)據(jù)挖掘的字段都是連續(xù)型屬性,由于Apriori算法及web網(wǎng)狀圖分析需要離散性屬性數(shù)據(jù)值,本文研究將各項評分和最后得分做了離散性的屬性劃分,其劃分規(guī)則如表3所示。
2.3 關聯(lián)規(guī)則挖掘
(1)本文利用clementine的Apriori算法和web網(wǎng)狀圖對教學評價信息進行了挖掘,創(chuàng)建數(shù)據(jù)流如圖1所示,其中partion結點的Trainingpartionsize和Testing partion size都設置為50%,Apriori算法設置其minmum antecedent support為10%,minimum rule confidence為80%。Apriori算法執(zhí)行結果如圖2所示。
2.4 挖掘結果分析
(1)假設關聯(lián)規(guī)則的最小支持度為10%,最小置信度為80%,進行關聯(lián)規(guī)則挖掘產(chǎn)生3條強關聯(lián)規(guī)則:shuizi=“優(yōu)秀”→zhongping=“優(yōu)秀”(s=l1.256%c=86.519%);taidu=“優(yōu)秀”→zhongping=“優(yōu)秀”(s=l1.256%c=86.519%);fangfa=“優(yōu)秀”→zhongping=”優(yōu)秀”(s=12.1210/0c=85.579%);同時三條規(guī)則的提升值分別為1.319,1.319,1.305都可以接受。因此,基本素質(zhì),教學態(tài)度,教學方法三個指標是最直接影響最后得分評優(yōu)的主要因素。
(2)教學評價的web網(wǎng)狀圖如圖3所示,移動下方滑塊后的網(wǎng)狀圖如圖4所示。可見,關聯(lián)規(guī)則和圖形展示的結論一致。
3 小結
本文主要介紹了基于學生評教信息,如何利用clementine數(shù)據(jù)挖掘工具采用Apriori算法進行建模,再利用Web網(wǎng)狀圖分析進行模型評價的數(shù)據(jù)挖掘過程,探索學生評價各指標與評價結果關聯(lián)性知識的方法。本文的研究只是數(shù)據(jù)挖掘應用與教學領域的初級階段,旨在為后續(xù)的深入研究做鋪墊。
參考文獻
[1]常軍林,張真.數(shù)據(jù)挖掘在高校教學評價中的應用[J].中州大學學報,2016,33(02):105—107.
[2]張超.基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘在高校教學評價中的應用研究[D].安徽:安徽大學,2011.
[3]薛薇,陳歡歌.Clementine數(shù)據(jù)挖掘方法及應用[M].北京:電子工業(yè)出版社,2010:14-14.
[4]鄭靜靜.高校教學評價體系中關于學生評教的思考[J].文教資料,2013(15):162-163.
[5]紀希禹.數(shù)據(jù)挖掘技術應用實例[M].北京:機械工業(yè)出版社,2009:7-8.
[6]鄒立娣.數(shù)據(jù)挖掘技術在教學評價系統(tǒng)中的應用研究[D].安徽:合肥工業(yè)大學,2009:24-25.