湖南省湘西職業(yè)技術(shù)學(xué)院計算機(jī)系 黃 青
數(shù)據(jù)挖掘技術(shù)在學(xué)生成績管理中的應(yīng)用研究
湖南省湘西職業(yè)技術(shù)學(xué)院計算機(jī)系 黃 青
在學(xué)校的管理工作中,學(xué)生成績管理是非常重要的一個環(huán)節(jié)。當(dāng)前我國一些學(xué)校在對學(xué)生成績進(jìn)行管理的過程中,雖然利用了相關(guān)的成績處理系統(tǒng),但是對人工管理的依賴性還比較大,這種管理方法不僅工作效率低, 容易出錯,而且很難有效的對學(xué)生成績進(jìn)行分析,從而獲取更多有價值的信息。如果學(xué)校能夠充分利用數(shù)據(jù)挖掘技術(shù),可以進(jìn)一步完善成績管理系統(tǒng),從而挖掘更多隱秘的信息。因此本文在分析數(shù)據(jù)挖掘技術(shù)應(yīng)用優(yōu)勢的基礎(chǔ)上,還具體分析了如何才能根據(jù)數(shù)據(jù)挖掘技術(shù)設(shè)計一個合理的成績管理系統(tǒng)。
數(shù)據(jù)挖掘技術(shù);學(xué)生;成績管理
我國學(xué)校主要是由教師將學(xué)生的考試成績逐一輸入到成績管理系統(tǒng)中,從而由該系統(tǒng)對分?jǐn)?shù)進(jìn)行分析,從而了解各分?jǐn)?shù)段的人數(shù)等基本信息,但是目前所應(yīng)用的系統(tǒng)不僅不能對得分點與失分點進(jìn)行具體的分析,而且也不能對學(xué)習(xí)情況以及相關(guān)的影響因素進(jìn)行分析。在信息不全面的情況下,教師就很難開展教學(xué)策略的改革,而且單純將成績存儲于系統(tǒng)中造成了資源的浪費,不利于解決成績管理系統(tǒng)問題,更是不利于教學(xué)質(zhì)量的提高。
目前各大學(xué)校使用的成績管理系統(tǒng)存在一定的缺陷,它只能對基礎(chǔ)的信息進(jìn)行統(tǒng)計,而利用數(shù)據(jù)挖掘技術(shù)后,不僅可以對及格率和優(yōu)秀率等信息進(jìn)行統(tǒng)計,而且還能對某個階段的學(xué)習(xí)成績進(jìn)行分析,從而了解學(xué)生在一個時期內(nèi)的學(xué)習(xí)情況以及相關(guān)的影響因素,總之,利用數(shù)據(jù)挖掘技術(shù)可以更客觀、全面的評定學(xué)生成績。同時,利用數(shù)據(jù)挖掘技術(shù)能夠了解學(xué)生在考試中到底存在哪些方面的不足,從而對學(xué)生進(jìn)行針對性的學(xué)習(xí),并了解試題的難易程度是否符合學(xué)生當(dāng)前的學(xué)習(xí)狀況[1]。在此基礎(chǔ)上利用數(shù)據(jù)挖掘技術(shù)可以更合理的進(jìn)行教學(xué)評價,從各個方面挖掘更多的信息,從而給予教師客觀、全面的評價。此外,利用數(shù)據(jù)挖掘技術(shù)能夠真實反映成績影響因素,獲取更多的有價值信息,從而有利于教師做出更合理的課程安排。
3.1 數(shù)據(jù)挖掘過程的設(shè)計
只有合理設(shè)計數(shù)據(jù)挖掘過程,才能創(chuàng)建一個合理的學(xué)生成績管理系統(tǒng),一般來說數(shù)據(jù)挖掘較為復(fù)雜,可分為以下六個步驟:
第一個步驟是確定數(shù)據(jù)源。在整個系統(tǒng)的創(chuàng)建中,數(shù)據(jù)源是重要的基礎(chǔ)部分。對學(xué)生成績進(jìn)行統(tǒng)計與分析的過程中,面向?qū)ο筝^為廣泛, 不僅僅是一個個體,而是不同類型的學(xué)生 ,例如,對于教務(wù)處而言,需要對全校學(xué)生的學(xué)習(xí)成績進(jìn)行分析, 以便了解他們的學(xué)習(xí)情況 ,而對各個系別而言,他們需要對本系學(xué)生的學(xué)習(xí)成績進(jìn)行分析,以掌握更多的相關(guān)信息[2]。他們不僅面向?qū)ο蟛灰粯樱覕?shù)據(jù)挖掘目的也有所差異;第二步驟是選定模型。選定模型主要是指針對挖掘的問題選擇對應(yīng)的方法 ,并為該種挖掘方法,選擇有效的算法,算法的選擇尤其重要,因為它直接影響著挖掘信息的質(zhì)量[3];第三個步驟是采集數(shù)據(jù)。采集數(shù)據(jù)需要投入大量的精力,因此開發(fā)者在對信息進(jìn)行收集的過程中,部分?jǐn)?shù)據(jù)是可以直接獲取的,但是部分?jǐn)?shù)據(jù)需要通過實踐調(diào)查獲??;第四個步驟是數(shù)據(jù)預(yù)處理。開發(fā)者需要對各種數(shù)據(jù)進(jìn)行預(yù)處理,并根據(jù)結(jié)果創(chuàng)建一個分析數(shù)據(jù)模型,這是非常關(guān)鍵的一個環(huán)節(jié),只有做好了數(shù)據(jù)預(yù)處理工作,才能有效提高信息的質(zhì)量;第五個步驟是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘過程中充分體現(xiàn)了算法的具體的應(yīng)用 ,開發(fā)者將通過這一環(huán)節(jié)深入的挖掘已經(jīng)經(jīng)過預(yù)處理的信息[4];第六個步驟是解釋和評價。解釋和評價主要是指對挖掘結(jié)果 進(jìn)行一個綜合的分析、驗證,并從中獲取真正有效的信息 ,從而將根據(jù)數(shù)據(jù)信息改進(jìn)教學(xué)策略,以獲取更好的教學(xué)效果。
3.2 數(shù)據(jù)挖掘的基本方法
系統(tǒng)需要選擇合理的挖掘算法,這是至關(guān)重要的一步,經(jīng)過對不同的算法進(jìn)行比較后發(fā)現(xiàn),最佳的算法有兩種。
第一種算法是關(guān)聯(lián)分析法。應(yīng)用關(guān)聯(lián)分析法,主要是為了能夠挖掘出各種隱含的數(shù)據(jù)關(guān)系。在具體的應(yīng)用中,需要先提供一組集合,進(jìn)而對其進(jìn)行統(tǒng)計與分析,推導(dǎo)出數(shù)據(jù)的關(guān)聯(lián)性 。對數(shù)據(jù)庫系統(tǒng)進(jìn)行建設(shè)的過程中 ,可應(yīng)用的關(guān)聯(lián)規(guī)則有很多,開發(fā)者需要根據(jù)實際需求進(jìn)行合理的選擇。通常情況下 可根據(jù)“可信度”,或者“支持度”這樣的一個閩值,淘汰無效或者意義不大的關(guān)聯(lián)規(guī)則。同時,關(guān)聯(lián)規(guī)則算法需要遵循一定的步驟,首先,有關(guān)人員應(yīng)當(dāng)搜尋所有的頻繁項集,即支持度不超過最小支持度的集合;其次,頻繁項集之間形成的所有關(guān)聯(lián)規(guī)則必須要滿足最小置信度,或者滿足最小支持度[5]。在實際的教學(xué)中,教師應(yīng)用以上這種方法對課程教學(xué)與成績相關(guān)性進(jìn)行分析,可以獲取更多有效的信息,對于教學(xué)質(zhì)量的提高具有重要的意義。
第二種算法是決策樹算法。決策樹算法是建立在實例上的一種有效方法,不僅可以用來對數(shù)學(xué)進(jìn)行預(yù)測與分類,而且還可以用來對數(shù)據(jù)進(jìn)行預(yù)處理與挖掘。一般來說主要由兩大部分組成:一是樹的生成,二是樹的剪枝。有關(guān)人員在利用決策樹算法對數(shù)據(jù)信息的分類規(guī)則進(jìn)行挖掘的時候,主要是以“if—then”的形式表示規(guī)則使用。而且這種具有自身的優(yōu)勢,從數(shù)據(jù)處理的角度來看,它的處理速度非??欤瑥慕Y(jié)果的角度來看 ,分類準(zhǔn)確率也很高,更重要的是算法可以容易轉(zhuǎn)換為 SQL 語句。
學(xué)校將數(shù)據(jù)挖掘技術(shù)應(yīng)用于學(xué)生成績管理管理中,可以對學(xué)成成績進(jìn)行客觀、全面的分析,從而使教師能夠全面掌握學(xué)生的學(xué)習(xí)狀況,了解學(xué)生的知識薄弱環(huán)節(jié),從而加強對學(xué)生進(jìn)行這一方面的培訓(xùn),并為課程開設(shè)提供真實的數(shù)據(jù)依據(jù)。同時,通過數(shù)據(jù)分析結(jié)果,教師可以了解教學(xué)策略存在哪些不足,從而作出相應(yīng)的改變,以此有效改進(jìn)教學(xué)方法??傊?,數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效促進(jìn)教學(xué)水平的提高,而且還能促進(jìn)教學(xué)秩序的穩(wěn)定,以改善學(xué)校的考風(fēng)、學(xué)風(fēng)、教風(fēng)。
[1]劉春陽.數(shù)據(jù)挖掘技術(shù)在高校成績管理中的應(yīng)用研究[D].學(xué)位論文:大連交通大學(xué),2013,07(16):196-198.
[2]趙輝.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績分析中的研究及應(yīng)用[D].學(xué)位論文:大連海事大學(xué),2014,09(16):98-100.
[3]康艷霞.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績分析中的應(yīng)用研究[D].學(xué)位論文:華東師范大學(xué),2014,06(15):109-111.
[4]曲萍.數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績管理中的應(yīng)用研究[J].網(wǎng)絡(luò)與信息,2013,10(25):80-82.
[5]劉軍.決策樹分類算法的研究及其在教學(xué)分析中的應(yīng)用[J].河海大學(xué),2015,02(16):380-383.
黃青(1983—),女,苗族,大學(xué)本科,工程碩士,湖南省湘西職業(yè)技術(shù)學(xué)院計算機(jī)系講師,研究方向:計算機(jī)應(yīng)用、控制工程。