摘 要:隨著數(shù)字信息化的不斷發(fā)展,現(xiàn)代教育的發(fā)展不能被不斷變化的教學(xué)方式所滿足,而數(shù)據(jù)挖掘技術(shù)的出現(xiàn)幫助決策者解決了這些問(wèn)題。本文描述數(shù)據(jù)挖掘的定義及相關(guān)技術(shù),并著重探討了數(shù)據(jù)挖掘在教學(xué)中的應(yīng)用以及取得的良好效果。
關(guān)鍵詞:數(shù)據(jù)挖掘;教學(xué)
中圖分類號(hào):G434
隨著現(xiàn)代化信息技術(shù)的不斷發(fā)展,數(shù)據(jù)量成驚人的速度不斷增長(zhǎng)。這些海量的數(shù)據(jù)蘊(yùn)藏著大量豐富的、潛在的、有價(jià)值的知識(shí)等待我們?nèi)ネ诰?,并以此?lái)解決未知的問(wèn)題,因此,數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)被廣泛地應(yīng)用于商業(yè)領(lǐng)域、科研領(lǐng)域和生活領(lǐng)域等眾多領(lǐng)域。但是,如何能正確地運(yùn)用這些挖掘出來(lái)的有用知識(shí),并且對(duì)經(jīng)濟(jì)創(chuàng)新科技的發(fā)展、教育教學(xué)工作等提供有力的指導(dǎo)和幫助,是數(shù)據(jù)挖掘所面臨的重大挑戰(zhàn)。數(shù)據(jù)挖掘是利用人工智能、機(jī)器學(xué)習(xí)等技術(shù),對(duì)挖掘出來(lái)的數(shù)據(jù)進(jìn)行分析,并且做出歸納總結(jié),然后利用預(yù)測(cè)可行的規(guī)律,從而幫助決策者對(duì)已有的策略進(jìn)行調(diào)整,最終做出正確的決策的過(guò)程。
在實(shí)際教學(xué)過(guò)程中,我們會(huì)遇到許多實(shí)際問(wèn)題,例如學(xué)校中存放著的大量的考試成績(jī)得不到利用。我們就可以通過(guò)對(duì)學(xué)生成績(jī)的數(shù)據(jù)挖掘,得到學(xué)生的學(xué)習(xí)共性,根據(jù)數(shù)據(jù)挖掘的結(jié)果幫助老師更有針對(duì)性的進(jìn)行教學(xué)和輔導(dǎo)。本文就數(shù)據(jù)挖掘在教學(xué)中的實(shí)際應(yīng)用進(jìn)行了研究與分析。
1 數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘(Data Mining)是指從存放在各種大型數(shù)據(jù)庫(kù)等信息庫(kù)中的海量數(shù)據(jù)中獲取有用的、豐富的、潛在的模式的統(tǒng)計(jì)過(guò)程[1]??梢赃@么說(shuō),數(shù)據(jù)挖掘就是從這些海量數(shù)據(jù)中提取知識(shí),數(shù)據(jù)挖掘?qū)?shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行分析、對(duì)比以及規(guī)律化預(yù)測(cè)處理,進(jìn)而取得幫助更好完善決策的決定性數(shù)據(jù),通過(guò)數(shù)據(jù)挖掘可以幫助我們發(fā)現(xiàn)規(guī)律,并且利用規(guī)律,進(jìn)行預(yù)測(cè)評(píng)判以及決策分析。
在數(shù)據(jù)中提取知識(shí)方面來(lái)說(shuō),數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)是有很大區(qū)別的,首先機(jī)器學(xué)習(xí)是針對(duì)特定的數(shù)據(jù)模式的進(jìn)行分析學(xué)習(xí),而數(shù)據(jù)挖掘則是從實(shí)際的存有海量數(shù)據(jù)源的大型數(shù)據(jù)庫(kù)中抽取有用信息。因?yàn)閬?lái)自于數(shù)據(jù)庫(kù)的數(shù)據(jù)的形式規(guī)模都依賴于數(shù)據(jù)庫(kù),所以數(shù)據(jù)挖掘處理的數(shù)據(jù)的一致性、完整性和正確性都難以保證,因此數(shù)據(jù)挖掘算法的有效性和可擴(kuò)展性都顯得非常重要,而且提高現(xiàn)代數(shù)據(jù)庫(kù)技術(shù)優(yōu)勢(shì)也是提高數(shù)據(jù)挖掘的算法效率的有效途徑[2]。
2 在實(shí)踐教學(xué)中數(shù)據(jù)挖掘的相關(guān)技術(shù)
針對(duì)以上對(duì)數(shù)據(jù)挖掘的理解,下面主要介紹幾種在教學(xué)領(lǐng)域中適用的幾種數(shù)據(jù)挖掘技術(shù)。
2.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是指事物與事物之間的相互聯(lián)系,有關(guān)聯(lián)性的關(guān)系。根據(jù)這種多個(gè)事物之間存在的依存性,想得到一個(gè)指定事物就能通過(guò)這種關(guān)聯(lián)性推測(cè)得到。關(guān)聯(lián)規(guī)則技術(shù)在數(shù)據(jù)挖掘的研究領(lǐng)域中起到了重要作用。
2.2 分類
數(shù)據(jù)對(duì)象可被指定分類器劃分到特定類別中的一類,其過(guò)程一般分為兩個(gè)步驟:構(gòu)造分類器與數(shù)據(jù)分類。在數(shù)據(jù)分類過(guò)程中,樣本集是事先給定并且已知的,甚至個(gè)數(shù)也是確定的。在實(shí)踐教學(xué)中,分類技術(shù)主要是對(duì)學(xué)生動(dòng)態(tài)的預(yù)測(cè),利用獲得的分析模型對(duì)其他類別的數(shù)據(jù)對(duì)象進(jìn)行類別預(yù)測(cè)。
2.3 聚類
聚類是將數(shù)據(jù)分為若干組,并且進(jìn)行編號(hào),具有較高的相似度的數(shù)據(jù)被分為同一個(gè)組內(nèi),而不同組中的數(shù)據(jù)具有較低的相似度。聚類與分類是有區(qū)別的,前者是一種無(wú)指導(dǎo)的學(xué)習(xí)過(guò)程,事先不知道樣本集的分類,也不知道分類的個(gè)數(shù)。
2.4 Web挖掘
Web挖掘利用數(shù)據(jù)挖掘的原則和思想,在Web信息上進(jìn)行挖掘,從挖掘的數(shù)據(jù)記錄中尋找潛在有用的,用戶感興趣的信息或知識(shí)的過(guò)程,例如靜態(tài)網(wǎng)頁(yè)、Web數(shù)據(jù)庫(kù)、Web結(jié)構(gòu)等信息都可以被處理。通過(guò)對(duì)這些信息的挖掘進(jìn)行規(guī)律的分析,并且得到通過(guò)簡(jiǎn)單文字檢索所不能得到的信息。
3 數(shù)據(jù)挖掘在教學(xué)中的應(yīng)用
通過(guò)對(duì)數(shù)據(jù)挖掘相關(guān)技術(shù)的總結(jié),我們了解到在教學(xué)中也可以應(yīng)用數(shù)據(jù)挖掘技術(shù)來(lái)解決教學(xué)過(guò)程中出現(xiàn)的問(wèn)題。下面介紹數(shù)據(jù)挖掘在教學(xué)中幾種重要的應(yīng)用。
3.1 課程安排
利用數(shù)據(jù)挖掘中關(guān)聯(lián)分析以及聚類分析等相關(guān)技術(shù),在實(shí)踐教學(xué)過(guò)程中出現(xiàn)的大量教學(xué)數(shù)據(jù)中挖掘出有用的信息。以此來(lái)分析合理的課程內(nèi)容安排,符合教育教學(xué)的規(guī)律,課程內(nèi)容反映學(xué)科的主要知識(shí),并最終找到影響學(xué)生成績(jī)的原因,并可在此基礎(chǔ)上得出符合培養(yǎng)目標(biāo)的要求。
3.2 教學(xué)管理
利用數(shù)據(jù)挖掘的相關(guān)技術(shù)分析學(xué)生的學(xué)習(xí)及生活特征,并且掌握學(xué)生的學(xué)習(xí)狀態(tài)和生活狀況,教學(xué)人員就可以根據(jù)此來(lái)系統(tǒng)地指導(dǎo)學(xué)生,以此來(lái)提高學(xué)生的學(xué)習(xí)效率,并且能夠在最短的時(shí)間內(nèi)取得最有效的學(xué)習(xí)成果。而且教師在幫助學(xué)生修正學(xué)習(xí)行為,提高學(xué)習(xí)能力的過(guò)程中,完善了學(xué)生的品格,因材施教,使得學(xué)生在各方面素質(zhì)都能得到發(fā)展。
3.3 學(xué)生成績(jī)預(yù)測(cè)
可以利用分類技術(shù)來(lái)預(yù)測(cè)學(xué)生的學(xué)習(xí)成績(jī),進(jìn)而可以采取相對(duì)應(yīng)的措施與辦法來(lái)知道學(xué)生的學(xué)習(xí),使得學(xué)生能夠盡可能的避免學(xué)習(xí)成績(jī)的下降,并最大可能地提高學(xué)生的學(xué)習(xí)效率。但是分析結(jié)果如果與現(xiàn)實(shí)出現(xiàn)了偏差,則可以采用偏差檢測(cè)來(lái)分析,檢測(cè)出出現(xiàn)這樣偏差的原因。
3.4 教學(xué)評(píng)價(jià)
數(shù)據(jù)挖掘技術(shù)不但在學(xué)生教學(xué)中可以得到很好的應(yīng)用,在教學(xué)評(píng)價(jià)中也能起到關(guān)鍵作用。利用數(shù)據(jù)挖掘的相關(guān)技術(shù),可以從教師的管理數(shù)據(jù)庫(kù)中挖掘相關(guān)數(shù)據(jù),根據(jù)教師的教學(xué)成績(jī),政治思想品德,學(xué)生工作情況等等進(jìn)行判定,以此評(píng)價(jià)教師全年的教學(xué)成績(jī),綜合以上各指標(biāo)成績(jī)最終評(píng)定教師一年中的工作成績(jī)。
4 數(shù)據(jù)挖掘應(yīng)用于教學(xué)的措施
我們知道了數(shù)據(jù)挖掘在教學(xué)中的應(yīng)用技術(shù)以及領(lǐng)域,下面介紹在實(shí)際應(yīng)用過(guò)程中的具體做法,利用數(shù)據(jù)挖掘中數(shù)據(jù)分析過(guò)程可以分為三個(gè)步驟:
4.1 數(shù)據(jù)的前期準(zhǔn)備
將學(xué)生學(xué)習(xí)的不同階段進(jìn)行分組,并劃分為不同的時(shí)期和層次,然后將每個(gè)時(shí)期得到的數(shù)據(jù)以及其他的數(shù)據(jù)源一并存儲(chǔ)在數(shù)據(jù)庫(kù)中,比如學(xué)生的年齡、性別、考試的各科成績(jī)等。數(shù)據(jù)存儲(chǔ)之后進(jìn)行數(shù)據(jù)集成,數(shù)據(jù)集成之后要對(duì)數(shù)據(jù)進(jìn)行預(yù)分析。
4.2 數(shù)據(jù)的挖掘
在數(shù)據(jù)的前期準(zhǔn)備之后,利用數(shù)據(jù)挖掘的分析方法對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的海量數(shù)據(jù)進(jìn)行綜合分析,提取數(shù)據(jù)中潛在的、有用的信息,例如學(xué)生學(xué)習(xí)情況描述以及生活狀況的評(píng)估等方面,通過(guò)得到的結(jié)果進(jìn)行分析,得出影響教學(xué)效果的原因。
4.3 挖掘結(jié)果的分析
每次的分析結(jié)果都可以利用可視化工具進(jìn)行清晰、準(zhǔn)確的呈現(xiàn),使教學(xué)人員能夠根據(jù)結(jié)果做出正確的判斷,例如某一學(xué)生總體學(xué)習(xí)成績(jī)?cè)谙掳肽晗陆凳且驗(yàn)樾愿裢庀蚨幌矚g學(xué)習(xí)枯燥的專業(yè)課所致,這樣教師就可以優(yōu)化教學(xué)策略并制定更好的學(xué)習(xí)計(jì)劃。
5 結(jié)束語(yǔ)
數(shù)據(jù)挖掘技術(shù)采用相對(duì)成熟有效的分析方法,是人們大量實(shí)踐的結(jié)果,為信息化的發(fā)展做出巨大貢獻(xiàn)。然而隨著實(shí)踐教學(xué)中的信息量的不斷增長(zhǎng)和對(duì)信息提取結(jié)果的更高的需求,傳統(tǒng)的教育方法已經(jīng)很難來(lái)尋找有效決策,然而通過(guò)數(shù)據(jù)挖掘去發(fā)掘數(shù)據(jù)中隱藏的規(guī)律并得到分析結(jié)果,為傳統(tǒng)教學(xué)中很難獲得的分析結(jié)果提供了有效途徑,并且為教育決策提供更有力的幫助。由此我們可以看到數(shù)據(jù)挖掘在教育領(lǐng)域中的應(yīng)用以及技術(shù)的不斷發(fā)展和完善,隨著數(shù)據(jù)挖掘新技術(shù)的發(fā)展,我們可以期待其前景越來(lái)越好,并且開發(fā)出更多、更好的知識(shí)挖掘工具,從而提高教學(xué)質(zhì)量以及學(xué)生素質(zhì),進(jìn)一步完善發(fā)展科學(xué)教育的道路。
參考文獻(xiàn):
[1]薛薇.數(shù)據(jù)挖掘方法及應(yīng)用[M].北京:電子工業(yè)出版社,2010.
[2]譚建豪.數(shù)據(jù)挖掘技術(shù)[M].北京:中國(guó)水利水電出版社,2009.
作者簡(jiǎn)介:黃佳彬(1988-),男,滿族,北京人,工學(xué)碩士,研究方向:數(shù)據(jù)挖掘。
作者單位:北方工業(yè)大學(xué),北京 100144