張瑋
摘 要:近年來(lái),隨著我國(guó)高校招生規(guī)模的不斷擴(kuò)大以及不斷提高的信息化程度,在各學(xué)校的教務(wù)系統(tǒng)中普遍存儲(chǔ)了大量的資料、數(shù)據(jù)等信息。在這些資料和數(shù)據(jù)等信息中,內(nèi)在隱藏了大量的、有價(jià)值的內(nèi)在規(guī)律。數(shù)據(jù)挖掘技術(shù)是從大量的、隨機(jī)的數(shù)據(jù)中找出隱藏在其中的、有價(jià)值的信息的過程。該文提出了一種基于關(guān)聯(lián)規(guī)則挖掘的成績(jī)預(yù)警模型。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則 Apriori算法 成績(jī)預(yù)警模型
中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2013)03(c)-00-01
數(shù)據(jù)挖掘技術(shù)可以在教學(xué)管理過程中應(yīng)用,會(huì)在教學(xué)效果考察、課程設(shè)置安排等方面起到幫助作用。舉一個(gè)例子來(lái)說(shuō),學(xué)校開設(shè)的專業(yè)課之間,如何合理安排課程的先后順序,也就是怎樣安排學(xué)生在學(xué)校中學(xué)習(xí)和知識(shí)增長(zhǎng)的過程。合理的安排可以有效提高學(xué)校管理的提前預(yù)知、教法的合理選擇以及教學(xué)的科學(xué)指導(dǎo),對(duì)高校教育管理、人才創(chuàng)新能力培養(yǎng),具有十分重要的意義。因成績(jī)預(yù)警信息針對(duì)性很強(qiáng),簡(jiǎn)單利用以關(guān)聯(lián)規(guī)則為基礎(chǔ)的數(shù)據(jù)挖掘技術(shù)很難解決成績(jī)預(yù)警問題。該文將關(guān)聯(lián)規(guī)則應(yīng)用于學(xué)生的成績(jī)之中,提出有針對(duì)性的課程成績(jī)預(yù)警模型,為實(shí)踐提供理論依據(jù)。
1 核心原理
在研究和利用關(guān)聯(lián)規(guī)則之前,必須先理清相關(guān)概念。關(guān)聯(lián)規(guī)則定義是在交易數(shù)據(jù)以及信息載體中,對(duì)存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)進(jìn)行查找,通過分析數(shù)據(jù)之間的相關(guān)關(guān)系,找出內(nèi)在的聯(lián)系。說(shuō)得更具體一些,關(guān)聯(lián)規(guī)則就是類似X→Y的表達(dá)式,X、Y分別代表關(guān)聯(lián)規(guī)則的先導(dǎo)、后繼。假設(shè)I是項(xiàng)的集合。一個(gè)給定的交易數(shù)據(jù)庫(kù),標(biāo)記為D,每個(gè)數(shù)據(jù)t都是集合I的非空子集,也就是每個(gè)交易都與唯一的標(biāo)識(shí)符相對(duì)應(yīng),記為TID。
兩個(gè)重要的概念:D中的支持度是D中事務(wù)同時(shí)包含X、Y的百分比,也就是概率;包含X的同時(shí)又包含Y的百分比,即條件概率叫做置信度。關(guān)聯(lián)規(guī)則的挖掘過程包含兩個(gè)重要階段:第一階段,從資料集合中找出所有的高頻項(xiàng)目組;第二階段,由找到的高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則。
該文提出的理論模型基于關(guān)聯(lián)規(guī)則的Apriori算法。Apriori算法是一種基于挖掘關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集算法,通過對(duì)數(shù)據(jù)關(guān)聯(lián)性進(jìn)行分析、挖掘,找出數(shù)據(jù)在決策制定過程中重要的參考價(jià)值。
Apriori算法目前也被應(yīng)用于高校管理中。例如:學(xué)校的管理部門對(duì)于貧困學(xué)生的資助問題,由于貧困生數(shù)量的增多導(dǎo)致工作的難度也逐漸加大。針對(duì)這一問題,Apriori算法可以提出解決方法。該文借鑒了Apriori算法在教學(xué)管理中的具體應(yīng)用,建立了成績(jī)預(yù)警模型。
2 基于關(guān)聯(lián)規(guī)則的成績(jī)預(yù)警模型
在高校的教學(xué)管理中,對(duì)學(xué)生進(jìn)行科學(xué)的學(xué)習(xí)評(píng)價(jià)是十分重要的工作職責(zé),不但能對(duì)學(xué)生起到信息反饋、激發(fā)學(xué)習(xí)動(dòng)力的作用,又能檢查學(xué)校整體的課程安排計(jì)劃是否合理,還能發(fā)現(xiàn)學(xué)生間的個(gè)體差異達(dá)到因材施教。
在我國(guó)目前的教學(xué)管理體系中,成績(jī)是評(píng)價(jià)學(xué)生的最主要指標(biāo)。學(xué)生在學(xué)校學(xué)習(xí)的過程中,各門課程都會(huì)產(chǎn)生成績(jī)數(shù)據(jù),每門課又會(huì)根據(jù)實(shí)際情況,產(chǎn)生諸如平時(shí)成績(jī)、考勤成績(jī)、期末成績(jī)等多項(xiàng)成績(jī)數(shù)據(jù)。面對(duì)如此大量的數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù),對(duì)學(xué)生的學(xué)習(xí)成績(jī)數(shù)據(jù)庫(kù)進(jìn)行科學(xué)的分析處理,可以及時(shí)掌握學(xué)生的評(píng)價(jià)結(jié)果,對(duì)學(xué)生成績(jī)出現(xiàn)的問題及時(shí)預(yù)警、及時(shí)解決,更好的開展教學(xué)工作。
該文提出了以下一種基于關(guān)聯(lián)規(guī)則的成績(jī)預(yù)警的理論模型,目的是對(duì)成績(jī)進(jìn)行系統(tǒng)地預(yù)警分析。本預(yù)警模型試圖通過興趣度約束、預(yù)警項(xiàng)集約束以及項(xiàng)順序關(guān)系約束三種約束關(guān)系,實(shí)現(xiàn)對(duì)數(shù)據(jù)的定向挖掘,使分析結(jié)果具有更強(qiáng)的針對(duì)性。該模型完全可以基于現(xiàn)實(shí)數(shù)據(jù)來(lái)源來(lái)開展實(shí)驗(yàn)研究,具有很強(qiáng)的可操作性。
模型中,預(yù)警工作可以劃分成兩個(gè)階段:訓(xùn)練階段、預(yù)警階段。在訓(xùn)練階段,預(yù)警系統(tǒng)接收學(xué)生成績(jī)的訓(xùn)練數(shù)據(jù),從接收到的數(shù)據(jù)中自動(dòng)形成系統(tǒng)所需的成績(jī)預(yù)警規(guī)則;在預(yù)警階段,系統(tǒng)依照訓(xùn)練階段生成的預(yù)警規(guī)則,結(jié)合輸入的學(xué)生成績(jī)和預(yù)警課程信息,產(chǎn)生預(yù)警信息。
基于關(guān)聯(lián)規(guī)則的成績(jī)預(yù)警模型由以下五部分組成:(1)成績(jī)輸入(輸出)口;(2)預(yù)處理模塊;(3)預(yù)警規(guī)則挖掘模塊;(4)成績(jī)預(yù)警規(guī)則(5)預(yù)警模塊。
預(yù)警規(guī)則的挖掘是成績(jī)預(yù)警系統(tǒng)中最為核心的部分。預(yù)警模塊根據(jù)輸入的學(xué)生成績(jī)數(shù)據(jù)和預(yù)警課程信息,從成績(jī)預(yù)警規(guī)則中提取相應(yīng)的預(yù)警規(guī)則集,根據(jù)所設(shè)計(jì)的預(yù)警策略決定是否生成預(yù)警信息。在實(shí)際的預(yù)警過程中,具體過程如下:
(1)系統(tǒng)處理一個(gè)接收到的學(xué)生成績(jī)數(shù)據(jù);
(2)通過預(yù)處理模塊將數(shù)據(jù)轉(zhuǎn)變成系統(tǒng)規(guī)定的標(biāo)準(zhǔn)格式;
(3)預(yù)警模塊中的預(yù)警課程信息從預(yù)警規(guī)則庫(kù)中提取預(yù)警規(guī)則集,分析成績(jī)數(shù)據(jù),進(jìn)行匹配分析;
(4)匹配預(yù)警時(shí),首先在成績(jī)數(shù)據(jù)中尋找當(dāng)前規(guī)則的前項(xiàng)。如果找不到,則認(rèn)為此條規(guī)則不適用于這條記錄,放棄匹配,轉(zhuǎn)向規(guī)則集中的下一條規(guī)則;如果能夠找到,則認(rèn)為此條規(guī)則適用于這條記錄,通過預(yù)警信息輸出口輸出預(yù)警信息,并退出預(yù)警過程。
通過上述過程,學(xué)生成績(jī)數(shù)據(jù)的預(yù)警工作就可以自動(dòng)完成。通過系統(tǒng)輸出的預(yù)警信息,教師、學(xué)生都可以根據(jù)具體情況,不斷改進(jìn)自身的教學(xué)或?qū)W習(xí)工作,提高整體的學(xué)習(xí)成績(jī)。
3 結(jié)語(yǔ)
該文提出了一種基于關(guān)聯(lián)規(guī)則挖掘的成績(jī)預(yù)警的理論模型,以預(yù)警規(guī)則集為基礎(chǔ),根據(jù)預(yù)警算法生成預(yù)警信息。該理論模型的實(shí)際可操作性極強(qiáng),可直接應(yīng)用于目前的教學(xué)管理中。通過實(shí)際的實(shí)踐過程,還可以不斷充實(shí)、完善該模型,達(dá)到更好的效果。
參考文獻(xiàn)
[1] 張玉林.數(shù)據(jù)挖掘技術(shù)在教學(xué)過程中的指導(dǎo)作用[J].西安通信學(xué)院學(xué)報(bào),2006,5(2):38-40.
[2] 蔣秀英.關(guān)聯(lián)規(guī)則在課堂教學(xué)評(píng)價(jià)中的應(yīng)用[J].山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,18(3):25-28.
[3] 趙丹群.數(shù)據(jù)挖掘:原理、方法及其應(yīng)用[J].現(xiàn)代圖書情報(bào)技術(shù),2000(6):1.
[4] 陶蘭,王保迎,呂建軍.數(shù)據(jù)挖掘技術(shù)在高等學(xué)校決策支持中的應(yīng)用[J].中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2003,8(2):39-41.
[5] 蘆潔,劉志鏡.挖掘關(guān)聯(lián)規(guī)則中對(duì)Apriori算法的一個(gè)改進(jìn)[J].微電子學(xué)與計(jì)算機(jī),2006,23(2):10-12.
[6] 胡吉明,鮮學(xué)豐.挖掘關(guān)聯(lián)規(guī)則中Apriori算法的研究與改進(jìn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,16(4):99-104.
[7] 盧炎生,楊芬,趙棟.帶單調(diào)約束的關(guān)聯(lián)規(guī)則挖掘[J].計(jì)算機(jī)工程,2004,30(15):78-80.