摘 要:通過(guò)依靠學(xué)生綜合數(shù)據(jù)庫(kù)并合理使用高校教務(wù)管理信息系統(tǒng),以數(shù)據(jù)挖掘的含義、原理等方面為基礎(chǔ),通過(guò)分析現(xiàn)在管理系統(tǒng)的弊端,設(shè)計(jì)基于數(shù)據(jù)挖掘的高校學(xué)生學(xué)習(xí)成績(jī)預(yù)警系統(tǒng),來(lái)對(duì)成績(jī)有問(wèn)題的學(xué)生發(fā)出預(yù)警通知,使教務(wù)管理系統(tǒng)得到改善,從而很好的提高學(xué)生學(xué)習(xí)成績(jī)。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則 數(shù)據(jù)挖掘 學(xué)生成績(jī) 預(yù)警系統(tǒng)
中圖分類號(hào):G64 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2013)02(c)-0023-01
高校教學(xué)管理的重心在于不斷提高高校教學(xué)水平,關(guān)鍵在于加強(qiáng)學(xué)生成績(jī)的管理。目前,通過(guò)數(shù)據(jù)挖掘技術(shù)對(duì)教學(xué)數(shù)據(jù)庫(kù)的不斷分析研究,其在教育方面的研究成果越來(lái)越突出。如果設(shè)計(jì)一套高校學(xué)生成績(jī)預(yù)警系統(tǒng),參考高校教務(wù)信息系統(tǒng)數(shù)據(jù)庫(kù),并使用數(shù)據(jù)挖掘技術(shù)對(duì)高校學(xué)生成績(jī)數(shù)據(jù)庫(kù)進(jìn)行分析,系統(tǒng)通過(guò)挖掘各學(xué)生每一課程的成績(jī)數(shù)據(jù),計(jì)算出不同成績(jī)水平的產(chǎn)生概率,通過(guò)原有的成績(jī)數(shù)據(jù)推測(cè)今后的成績(jī)趨勢(shì),進(jìn)而找到與本課程相對(duì)應(yīng)的關(guān)聯(lián)規(guī)則作為預(yù)警因素,建立起預(yù)警系統(tǒng),這樣就能夠及時(shí)評(píng)估學(xué)生的學(xué)習(xí)成績(jī),督促學(xué)生改進(jìn)學(xué)習(xí)方法,以提高其成績(jī)水平。
1 數(shù)據(jù)挖掘含義及基本原理
數(shù)據(jù)挖掘(Data Mining,DM)通俗地說(shuō)就是從數(shù)據(jù)中挖掘信息。由于人類的認(rèn)識(shí)水平有限,很多模糊的、隨機(jī)的、不完全的、有噪聲的數(shù)據(jù)中隱藏的信息就不容易被發(fā)現(xiàn),但是通過(guò)對(duì)一系列有關(guān)數(shù)據(jù)的分析和挖掘,就會(huì)使大量重要的潛在知識(shí)浮現(xiàn)出來(lái)。數(shù)據(jù)挖掘?qū)?shù)據(jù)庫(kù)、數(shù)據(jù)網(wǎng)絡(luò)、統(tǒng)計(jì)數(shù)學(xué)等技術(shù)結(jié)合起來(lái),從而進(jìn)行預(yù)測(cè)、分類、估計(jì)、復(fù)雜數(shù)據(jù)類型挖掘、相關(guān)性分組或關(guān)聯(lián)規(guī)則等處理。在高校教務(wù)管理工作中,高校學(xué)生成績(jī)與成績(jī)的各影響因素之間潛藏著很大的聯(lián)系,而數(shù)據(jù)挖掘技術(shù)可以對(duì)此進(jìn)行全面地分析。所以,各個(gè)從事此項(xiàng)研究的人員開(kāi)始設(shè)計(jì)并逐漸將數(shù)據(jù)挖掘技術(shù)與高校教學(xué)管理系統(tǒng)結(jié)合起來(lái),擴(kuò)展數(shù)據(jù)挖掘技術(shù)應(yīng)用的新領(lǐng)域,并多方面、多角度的定性分析學(xué)生成績(jī)情況。
數(shù)據(jù)挖掘主要是通過(guò)關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法進(jìn)行:根據(jù)所需挖掘出的相符合關(guān)聯(lián)規(guī)則,設(shè)定最低可靠度和最小支持度兩個(gè)閾值,即用來(lái)表示所需的關(guān)聯(lián)規(guī)則一定要符合的最小可信任程度和所需的關(guān)聯(lián)規(guī)則一定要符合一組數(shù)據(jù)量在統(tǒng)計(jì)意義上能達(dá)到最低要求。
2 現(xiàn)在狀況下對(duì)學(xué)生成績(jī)的管理
一般情況下,教務(wù)系統(tǒng)的管理人員雖然能夠在數(shù)量較大的數(shù)據(jù)庫(kù)中作普通的查詢,或?qū)σ欢〝?shù)量學(xué)生的成績(jī)進(jìn)行簡(jiǎn)單統(tǒng)計(jì)處理或數(shù)學(xué)排序,但是如果想進(jìn)行進(jìn)一步的研究,那么這種傳統(tǒng)下管理數(shù)據(jù)庫(kù)的方法就只能望而卻步了。另外,在高校逐漸擴(kuò)大招生人數(shù)的情況下,成績(jī)管理系統(tǒng)也需要處理越來(lái)越多的數(shù)據(jù),解決更加繁瑣的問(wèn)題。因而,在這種數(shù)據(jù)處理壓力較大狀況下,就要求更加強(qiáng)大的數(shù)據(jù)處理系統(tǒng)來(lái)進(jìn)行工作。如果僅僅將計(jì)算機(jī)作為存儲(chǔ)工具而存放大數(shù)量形式不一的數(shù)據(jù),而不去挖掘在其中隱含的具有重要價(jià)值的信息,那么數(shù)據(jù)中潛在的關(guān)聯(lián)和規(guī)則也就不會(huì)被找出或利用,同時(shí)也就不能夠?qū)?shù)據(jù)產(chǎn)生規(guī)律加以把握,在教學(xué)工作中造成一定損失。如果能夠?qū)@些存在的弊端加以解決,那么不僅能夠使現(xiàn)代教學(xué)管理提高到新的層面,而且可以幫助教師有效評(píng)估學(xué)生學(xué)習(xí)成績(jī)狀況,以提高學(xué)生的學(xué)習(xí)成績(jī)。所以說(shuō)盡早建立完善的數(shù)據(jù)挖掘管理信息系統(tǒng)很有必要。
3 高校學(xué)生成績(jī)預(yù)警系統(tǒng)設(shè)計(jì)
我國(guó)的高校成績(jī)預(yù)警設(shè)計(jì)在當(dāng)前水平上,只能對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析。為了滿足需要,以便于更好的管理學(xué)生學(xué)習(xí),針對(duì)學(xué)習(xí)成績(jī)的三個(gè)基本狀態(tài):成績(jī)相對(duì)落后、成績(jī)趨于滑落和成績(jī)潛藏問(wèn)題,依此能夠及時(shí)分析學(xué)生成績(jī)水平,督促學(xué)生改進(jìn)方法,提高學(xué)生成績(jī)。
現(xiàn)在就以成績(jī)潛藏問(wèn)題來(lái)對(duì)系統(tǒng)的基本使用原理進(jìn)行分析,并設(shè)計(jì)出相應(yīng)的基本模型。成績(jī)預(yù)警系統(tǒng)通過(guò)挖掘?qū)W生以往成績(jī)關(guān)聯(lián)規(guī)則,確定成績(jī)的關(guān)聯(lián)規(guī)則范圍,再根據(jù)目前成績(jī)水平在此范圍進(jìn)行搜索,推算學(xué)生今后的學(xué)習(xí)中隱藏問(wèn)題。
(1)對(duì)成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理,首先將學(xué)生所處學(xué)期、學(xué)期所有課程進(jìn)行編號(hào),因?yàn)樗膫€(gè)學(xué)年有八個(gè)學(xué)期,各學(xué)期課程應(yīng)該都在10科以內(nèi),故一般情況下以兩位數(shù)表示,即“學(xué)期+課程”,這樣就有利于后續(xù)的排序。然后把歷史數(shù)據(jù)庫(kù)內(nèi)數(shù)據(jù)的格式“學(xué)號(hào)+姓名+不合格課程”中的“不合格課程”依次編上號(hào)碼,如不合格課程1,不合格學(xué)課程2,…。再將成績(jī)不合格的記錄從需要處理的所有成績(jī)記錄中一一篩選出來(lái)。
(2)挖掘出概率較高的數(shù)據(jù),設(shè)置適當(dāng)?shù)闹С侄龋员阌谡页龅年P(guān)聯(lián)規(guī)則不具特殊性。為了能確保能夠準(zhǔn)確成功預(yù)警,需要排除無(wú)關(guān)規(guī)則,同時(shí)也要避免有管關(guān)預(yù)警規(guī)則被棄用,所以在進(jìn)行合適的置信度定位時(shí),既不能過(guò)于狹隘,也不能范圍太廣,在保證準(zhǔn)確率的同時(shí)不斷提高預(yù)警水平。預(yù)警規(guī)則包括前件和后件,前件和后件分別表示前后學(xué)期的課程,每個(gè)學(xué)科作為一個(gè)項(xiàng),將前件各項(xiàng)和后件的各項(xiàng)之間排好順序,后件始終排在前件之后。規(guī)則的前件和后件不可以用來(lái)表示同一學(xué)期的課程成績(jī),相同學(xué)期課程之間的成績(jī)不能夠相互預(yù)測(cè),只能在前件產(chǎn)生之后對(duì)后件即下一學(xué)期成績(jī)進(jìn)行預(yù)測(cè),隨著歷史學(xué)期成績(jī)的期數(shù)增加,預(yù)測(cè)的準(zhǔn)確率越高。
(3)按照首步的方法預(yù)處理本學(xué)期的學(xué)生成績(jī),在預(yù)警規(guī)則庫(kù)中進(jìn)行搜索,輸出匹配項(xiàng)進(jìn)行分析。
4 結(jié)語(yǔ)
隨著我國(guó)各高校實(shí)行信息化步伐的加快,高校教育中的工作效率不斷提升,管理大量數(shù)據(jù)信息的系統(tǒng)也就充分發(fā)揮了作用。數(shù)據(jù)挖掘的方式能將很多有用的數(shù)據(jù)在繁瑣、量大的數(shù)據(jù)庫(kù)中提取出來(lái),作為評(píng)估教學(xué)水平和學(xué)生學(xué)習(xí)的依據(jù),合理指導(dǎo)高校的管理、教學(xué)工作。成績(jī)預(yù)警系統(tǒng)的目的就是能夠?qū)Τ霈F(xiàn)學(xué)習(xí)問(wèn)題的學(xué)生及時(shí)發(fā)出預(yù)警信息,使學(xué)生在大學(xué)的學(xué)業(yè)成功完成。同時(shí),在信息技術(shù)不斷發(fā)展今天,不斷對(duì)成績(jī)預(yù)警系統(tǒng)進(jìn)行改進(jìn),以使其能更好的為教育事業(yè)服務(wù)。
參考文獻(xiàn)
[1] 李昊,周振華.基于數(shù)據(jù)挖掘的高校學(xué)生成績(jī)預(yù)警系統(tǒng)[J].大慶石油學(xué)院學(xué)報(bào),2011,4(35):91-95.
[2] 董軍凱.數(shù)據(jù)挖掘技術(shù)在成績(jī)分析中的應(yīng)用[J].科技資訊,2009(22):72-74.
[3] 張皓.數(shù)據(jù)挖掘技術(shù)在構(gòu)建學(xué)生成績(jī)預(yù)警系統(tǒng)的應(yīng)用[J].電腦知識(shí)與技術(shù), 2011,19(7):4529-4530.