劉小桃 林延慶
摘 要: 在高校教務管理工作中,對學生的成績進行管理分析是基礎(chǔ)與核心。通過對學生成績的分析,得出學生實際學習狀況與教師的教學情況,反映高校的教學質(zhì)量。近年來,教育事業(yè)不斷改革與發(fā)展,學生人數(shù)逐年增多,每年高校都將學生的信息進行存放,而這些信息一般只用于核對與備案,造成嚴重的信息浪費。利用數(shù)據(jù)挖掘技術(shù),對學生的成績進行挖掘分析,進而得到潛在影響學生成績的因素,并以其指導高校管理工作,指導教師教學工作,意義重大。本文針對數(shù)據(jù)挖掘在高校學生學習成績分析中的應用進行了探究,旨在提高高校教學質(zhì)量。
關(guān)鍵詞: 數(shù)據(jù)挖掘 成績分析 教務管理工作
在我國高校的教務管理中,采用的基本都是基于數(shù)據(jù)庫的系統(tǒng)軟件。教務軟件中存有大量的學生數(shù)據(jù),但一直沒有發(fā)揮數(shù)據(jù)的作用,可利用數(shù)據(jù)挖掘技術(shù),從中挖掘出隱藏的重要信息,用以指導教學工作。隨著數(shù)據(jù)挖掘技術(shù)的成熟,應用的范圍不斷擴大,越來越多的高校采用數(shù)據(jù)挖掘技術(shù)指導教務的管理工作,為教學工作提供參考。
一、數(shù)據(jù)挖掘技術(shù)涵義
(一)數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘是一種數(shù)據(jù)處理技術(shù),一般是指在大量數(shù)據(jù)中,通過算法發(fā)現(xiàn)數(shù)據(jù)中隱藏信息的過程,從屬于數(shù)據(jù)庫的知識發(fā)現(xiàn)。數(shù)據(jù)庫利用統(tǒng)計、情報檢索、專家系統(tǒng)、在線分析處理、機器學習等方法與工具,對繁雜的數(shù)據(jù)進行分析、歸納與總結(jié),通過搜索數(shù)據(jù)的內(nèi)部信息,為高校的教務管理提供決策依據(jù)。
(二)數(shù)據(jù)挖掘的過程
數(shù)據(jù)挖掘過程是一個需要循環(huán)往復的過程,要做到精益求精,如果經(jīng)過一次的數(shù)據(jù)挖掘沒有得到有效的信息,就要重新進行數(shù)據(jù)的選擇和處理,直到得出對我們有用的信息為止。一般情況下數(shù)據(jù)挖掘分為五個階段:一是了解數(shù)據(jù)挖掘的概念,明確其目的;二是做好數(shù)據(jù)挖掘的準備工作;三是數(shù)據(jù)挖掘有很多種方法,依據(jù)實際情況選擇合適的算法,對要處理的數(shù)據(jù)進行數(shù)據(jù)挖掘;四是對數(shù)據(jù)挖掘得出的信息進行分析,給予用戶能夠接受的知識;五是將通過數(shù)據(jù)挖掘得到的信息運用到對應的領(lǐng)域中,發(fā)揮數(shù)據(jù)挖掘的指導與參考作用。
(三)數(shù)據(jù)挖掘常用的方法
聚類分析法、統(tǒng)計分析法、模糊集方法、關(guān)聯(lián)規(guī)則方法、神經(jīng)網(wǎng)絡方法、決策樹方法、覆蓋正例排斥反例法、粗集理論方法等。
二、成績分析中應用數(shù)據(jù)挖掘的方法
(一)關(guān)聯(lián)規(guī)則算法
1.應用關(guān)聯(lián)規(guī)則算法的內(nèi)容。關(guān)聯(lián)規(guī)則的算法是指在大量的待處理數(shù)據(jù)中找到各事物之間的聯(lián)系,是數(shù)據(jù)挖掘中的重要課題。關(guān)聯(lián)是指在兩個事物或者兩個以上事物之間必然存在著某些規(guī)律性,運用關(guān)聯(lián)規(guī)則就是要獲取數(shù)據(jù)之間隱藏的重要信息。在成績分析中運用關(guān)聯(lián)規(guī)則,查找影響成績的因素,針對試卷得分情況,對學生的成績進行總結(jié),分析得分情況與課程之間的相關(guān)性。
2.運用關(guān)聯(lián)規(guī)則算法的挖掘過程。一是對數(shù)據(jù)庫中的內(nèi)容進行分析與識別,在進行數(shù)據(jù)挖掘之前,首先要定義最小的支持度,在最小支持度的基礎(chǔ)上進行原始數(shù)據(jù)的挖掘,得到的項集應不小于最小支持度;二是產(chǎn)生強關(guān)聯(lián)規(guī)則,利用頻繁項集產(chǎn)生規(guī)則,得到的規(guī)則的置信度與最小置信度相比,要比最小置信度大或者與最小置信度相等。
3.關(guān)聯(lián)規(guī)則的具體應用,下表為應用關(guān)聯(lián)規(guī)則中某專業(yè)成績不及格的挖掘規(guī)則。
依據(jù)上表得出如果最小的支持度為0.55,最小的置信度為0.35,那么1、2、4、5就為強關(guān)聯(lián)規(guī)則,在課程1不及格時,課程3與6不及格的概率就會高,這就說明課程一影響課程3與課程6;課程4也受到課程2的較大影響;課程2受到課程5的影響。
4. Apriori算法的數(shù)據(jù)挖掘。Apriori算法是一種頻繁項集算法,用來發(fā)掘相關(guān)規(guī)則。Apriori算法應用的非常廣泛,核心思想是在候選集生成與情節(jié)向下的封閉檢測的階段下,進行頻繁項集的挖掘。具體內(nèi)容包括:一是依據(jù)數(shù)據(jù)挖掘的要求,建立相應的事物數(shù)據(jù)表,對于優(yōu)秀成績進行保留,其他的做刪除處理;二是建立頻繁項集數(shù)據(jù)表,用A、B表示項目名稱并做相應的記錄;三是刪除表中支持度的計數(shù)小于最小的支持度記錄,從而得到最終的頻繁1項集;四是計算后幾個頻繁項目集的結(jié)果;五是刪除最終的頻繁項集中比最小的置信度閾值小的記錄,進而得到最終的規(guī)則信息。
關(guān)聯(lián)規(guī)則數(shù)據(jù)見下表:
通過置信度的計算,刪除小于最小置信度閾值的記錄,得到最終的關(guān)聯(lián)規(guī)則,見下表。
(二)決策樹算法
應用決策樹算法是將預測的內(nèi)容用樹的模型表現(xiàn)出來,樹的根節(jié)點作為數(shù)據(jù)的結(jié)合空間,樹的分支表現(xiàn)每一個分類問題,作為單一的屬性測試存在,樹的葉子節(jié)點是數(shù)據(jù)分割的分類,從根節(jié)點到葉子節(jié)點的路徑就是相應的類別預測。
應用決策樹算法要收集學生的基本個人資料、學生出勤情況,以及對課程的喜愛程度、上機練習情況與基礎(chǔ)程度等,再結(jié)合學生的成績進行分析,得到的數(shù)據(jù)用來指導教學工作,以提高教學質(zhì)量。
高校中影響學生成績的因素的決策樹如下圖:
依據(jù)決策樹得到:上機情況最為影響學生的成績,造成學生低下。教師可以決策樹得出的結(jié)論為參考,加強學生管理工作,在上機情況上加以重視,重點解決成績不理想的問題。
三、成績分析中應用數(shù)據(jù)挖掘的優(yōu)勢
在學生的成績分析中應用數(shù)據(jù)挖掘技術(shù)可以有效指導教學,提高對教學有益的信息,具體內(nèi)容包括:
(一)幫助學校全面掌握學生的學習情況,通過數(shù)據(jù)挖掘?qū)W生的成績進行深層次的分析,了解學生對課程內(nèi)容的實際掌握情況,便于對學生整體情況的掌握。
(二)有助于對課程相關(guān)性的分析,通過分析不同專業(yè)的核心課程,掌握學生對課程的理解程度、得分情況,進而得到課程之間存在的聯(lián)系,便于學校合理地安排課程。
(三)通過數(shù)據(jù)挖掘得到學生入學時的成績,再依據(jù)學生現(xiàn)在的成績,將二者結(jié)合進行分析,得到學生這一學年的學習狀況,得出課程對學生的影響,便于更好地指導學生學習。
四、結(jié)語
隨著高校的不斷發(fā)展,學生的成績數(shù)據(jù)逐年增多,運用數(shù)據(jù)挖掘技術(shù)分析學生的學習成績非常有必要。通過數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)相關(guān)數(shù)據(jù)間的聯(lián)系,從而提高分析成績效率,也在一定程度上使成績的分析結(jié)果更準確更具科學性。在實際工作中,要將數(shù)據(jù)挖掘的眾多方法結(jié)合起來運用,便于發(fā)現(xiàn)數(shù)據(jù)中的隱藏信息。高校要加強對學生成績的分析,提高教學質(zhì)量,保證教學目標的實現(xiàn)。
參考文獻:
[1]朱明.數(shù)據(jù)挖掘?qū)д揫M].合肥:中國科學技術(shù)大學出版社,2012.
[2]鄭巖.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用[M].北京:清華大學出版社,2011.
[3]范明.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2012.
[4]劉美玲.樹蕨挖掘在高校教學與管理中的應用[J].計算機工程與技術(shù),2010.
[5]王耀.淺談數(shù)據(jù)挖掘在教務管理中的應用[J].電子商務,2013.