賈海祎 黃敏
摘 ?要 當(dāng)今社會已經(jīng)進(jìn)入大數(shù)據(jù)時代,只依靠簡單的數(shù)據(jù)處理和統(tǒng)計技術(shù)很難從海量數(shù)據(jù)中提取有效信息。教師遠(yuǎn)程培訓(xùn)是提升教師教學(xué)能力、個人素養(yǎng)的有效手段。介紹數(shù)據(jù)挖掘技術(shù)概況以及該技術(shù)在教師遠(yuǎn)程培訓(xùn)管理中的應(yīng)用與探索,并對遠(yuǎn)程教學(xué)質(zhì)量的提升提出建設(shè)性意見。
關(guān)鍵詞 數(shù)據(jù)挖掘;遠(yuǎn)程培訓(xùn);教學(xué)質(zhì)量;大數(shù)據(jù)
中圖分類號:G645文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2019)12-0034-03
Application of Data Mining in Remote Teacher Training//JIA Haiyi, HUANG Min
Abstract In the context of big data era, it is difficult to extract effec-tive information from mass data only by simple data processing and statistical techniques. Remote teacher training is an effective means to improve teachers teaching ability and personal accomplishment. The general situation of data mining technology and its application in the management of remote teacher training are introduced, then some constructive suggestions on the improvement of remote tea-ching quality are put forward.
Key words data mining; remote training; teaching quality; big data
1 前言
隨著社會對教育的重視程度逐年增強(qiáng),教師的遠(yuǎn)程培訓(xùn)成為促進(jìn)教師專業(yè)發(fā)展、提升專業(yè)素養(yǎng)的一種有效途徑。培訓(xùn)過程中會產(chǎn)生各類素材資源,培訓(xùn)結(jié)束后也要對學(xué)員數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù)以及學(xué)習(xí)評價進(jìn)行處理。對于培訓(xùn)機(jī)構(gòu)來說,有一些亟待解決的問題,例如:課程資源的設(shè)置如何滿足不同學(xué)員的需求?如何調(diào)動學(xué)員的學(xué)習(xí)積極性?如何客觀評價培訓(xùn)效果?
隨著大數(shù)據(jù)時代的到來,信息即資源,培訓(xùn)機(jī)構(gòu)也開始進(jìn)行信息化建設(shè),但是這種信息化常常局限于簡單的查詢、統(tǒng)計。根據(jù)培訓(xùn)開始前的問卷調(diào)查,對部分課程進(jìn)行設(shè)置;培訓(xùn)結(jié)束后評價打分,得到教師對培訓(xùn)效果的評價;根據(jù)培訓(xùn)學(xué)科人數(shù)的基數(shù)大小,決定送培送教的學(xué)科。這些統(tǒng)計是最基礎(chǔ)的,缺乏對數(shù)據(jù)的分析和探索。本文從數(shù)據(jù)挖掘技術(shù)的角度發(fā)現(xiàn)問題,獲取數(shù)據(jù)中隱藏的信息以及存在的規(guī)律。因此,客觀地發(fā)現(xiàn)和解決培訓(xùn)管理過程中出現(xiàn)的問題,切實做出決策,從而增強(qiáng)培訓(xùn)效果。
2 數(shù)據(jù)挖掘技術(shù)簡介
數(shù)據(jù)挖掘技術(shù)的概念 ?數(shù)據(jù)挖掘是數(shù)據(jù)庫領(lǐng)域的研究熱點。該技術(shù)可以為決策者做出正確的判斷提供依據(jù),是一種對知識進(jìn)行發(fā)現(xiàn)探索的過程。
數(shù)據(jù)挖掘技術(shù)的功能 ?數(shù)據(jù)挖掘的功能主要包括概念描述、特征描述、關(guān)聯(lián)分析、分類、聚類和孤立點分析等。概念描述主要用于描述對象的內(nèi)涵并總結(jié)對象的相關(guān)特征。特征描述描述了對象的相同特征,并且區(qū)別描述了對象的不同特征。關(guān)聯(lián)分析是發(fā)現(xiàn)數(shù)據(jù)庫中兩個或多個數(shù)據(jù)項之間的關(guān)系并發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)則。分類是使用模型對未來或未知對象進(jìn)行分類,預(yù)測未知對象類別。聚類是通過根據(jù)相似性將數(shù)據(jù)庫中的數(shù)據(jù)分類為不同的類別來合并具有更高相似性的數(shù)據(jù)。孤立點分析(也稱為偏差分析)檢測數(shù)據(jù)庫中存在的異常記錄。
數(shù)據(jù)挖掘技術(shù)的方法 ?數(shù)據(jù)挖掘通過各種不同的方法實現(xiàn)數(shù)據(jù)挖掘功能。Apriori算法主要使用逐層搜索迭代方法來掃描數(shù)據(jù)庫并找到頻繁項目集來挖掘關(guān)聯(lián)規(guī)則。決策樹方法是一種歸納學(xué)習(xí)方法。貝葉斯分類算法是基于概率和統(tǒng)計知識的統(tǒng)計分類算法。人工神經(jīng)網(wǎng)絡(luò)是一種數(shù)學(xué)模型,應(yīng)用類似于大腦突觸連接結(jié)構(gòu)的信息處理。遺傳算法是一種基于仿生學(xué)的技術(shù)方法,通過參考自然的進(jìn)化規(guī)律演變?yōu)殡S機(jī)搜索方法。
數(shù)據(jù)挖掘技術(shù)的過程 ?數(shù)據(jù)挖掘的步驟[1]:數(shù)據(jù)收集,收集需要處理的原始數(shù)據(jù);數(shù)據(jù)預(yù)處理,選擇、凈化、推測、轉(zhuǎn)換和減少數(shù)據(jù)以形成目標(biāo)數(shù)據(jù);選擇挖掘方法,需要選擇相應(yīng)的挖掘?qū)崿F(xiàn)算法;數(shù)據(jù)挖掘處理,分析數(shù)據(jù)以獲得知識模型;挖掘結(jié)果評估,以確定知識的模型是否有效并獲得結(jié)果。
數(shù)據(jù)挖掘技術(shù)與培訓(xùn)相結(jié)合的成功案例 ?Wang J[2]開發(fā)了一個混合框架,將數(shù)據(jù)挖掘技術(shù)與基于模擬的培訓(xùn)相結(jié)合,以提高培訓(xùn)評估的有效性。基于信念的學(xué)習(xí)概念,從兩個維度評估學(xué)生的學(xué)習(xí)成果:知識/技能水平和置信水平。數(shù)據(jù)挖掘技術(shù)用于分析受訓(xùn)者個人數(shù)據(jù)和基于模擬的培訓(xùn)所產(chǎn)生的數(shù)據(jù),以評估學(xué)生的表現(xiàn)和學(xué)習(xí)行為。所提出的方法是以臺灣基于模擬的步兵射擊訓(xùn)練為例。結(jié)果表明,該方法能夠準(zhǔn)確評估學(xué)生的表現(xiàn)和學(xué)習(xí)行為,并能夠發(fā)現(xiàn)潛在的知識,以提高學(xué)生的學(xué)習(xí)成果。Bodea C N使用數(shù)據(jù)挖掘技術(shù)進(jìn)行培訓(xùn)和學(xué)習(xí)管理,以分析參與在線兩年制碩士學(xué)位課程管理的學(xué)生的表現(xiàn)。系統(tǒng)數(shù)據(jù)源是收集學(xué)生意見、學(xué)生記錄的操作數(shù)據(jù)以及電子學(xué)習(xí)平臺記錄的學(xué)生活動數(shù)據(jù)的調(diào)查數(shù)據(jù)。
3 數(shù)據(jù)挖掘技術(shù)在教師遠(yuǎn)程培訓(xùn)中的應(yīng)用
培訓(xùn)對象方面 ?教師遠(yuǎn)程培訓(xùn)需要對兩組人員進(jìn)行培訓(xùn)[3]。除了學(xué)員,即各學(xué)科培訓(xùn)教師,還有一個重要的組成部分,即班級輔導(dǎo)者。班級輔導(dǎo)者通常是骨干教師,由教育局推薦學(xué)科帶頭人或管理能力較強(qiáng)者擔(dān)任,經(jīng)過班級輔導(dǎo)者的培訓(xùn)后,負(fù)責(zé)一定人數(shù)的班級,對學(xué)員進(jìn)行網(wǎng)絡(luò)指導(dǎo),批改學(xué)科作業(yè),開展校本研究。
培訓(xùn)開始前,班級輔導(dǎo)者的相關(guān)信息由教育局報送,包括其姓名、性別、年齡、學(xué)校、區(qū)域、職稱、學(xué)科、職務(wù)等信息。培訓(xùn)過程中會產(chǎn)生很多過程性資料,比如班級輔導(dǎo)者發(fā)布的公告、簡報、論壇回復(fù)、批改作業(yè)情況。使用數(shù)據(jù)挖掘技術(shù),可以處理上述信息以獲得有價值的培訓(xùn)和資源信息??梢栽诜治鰡栴}之前假設(shè)一些信息之間的關(guān)聯(lián),比如論壇回復(fù)的情況和年齡的關(guān)系、簡報質(zhì)量和職稱的關(guān)系、公告數(shù)和性別的關(guān)系等;然后通過數(shù)據(jù)挖掘,利用足夠的信息迭代,對之前的假設(shè)進(jìn)行作證,并且修正種種問題,特別是班級輔導(dǎo)員和受訓(xùn)人員的行為和需求及其在培訓(xùn)過程中的指導(dǎo),它可以為教師培訓(xùn)決策提供科學(xué)依據(jù),從而提高教師培訓(xùn)的有效性。
課程設(shè)置方面 ?遠(yuǎn)程培訓(xùn)中最重要的環(huán)節(jié)就是課程的設(shè)置[4]。遠(yuǎn)程培訓(xùn)是學(xué)員通過觀看視頻教學(xué)來獲取所需要的知識,通過學(xué)習(xí)得到想要的知識,并將其運用到教學(xué)和工作中且有改善。但是有時由于學(xué)員背景等因素,簡單的分?jǐn)?shù)并不能反映課程的合理性。比如課程安排的順序會對學(xué)員的能力提升造成影響,必修課和選修課之間的聯(lián)系也會對學(xué)員的學(xué)習(xí)造成影響。這些看似沒有什么關(guān)聯(lián)的數(shù)據(jù),通過數(shù)據(jù)挖掘,可以發(fā)現(xiàn)其中都有潛在的強(qiáng)關(guān)聯(lián)性??梢詮臄?shù)據(jù)庫中提取大量學(xué)員的分?jǐn)?shù),并且可以使用諸如相關(guān)分析和時間序列模式分析的功能來分析和獲得與課程之間的規(guī)則相關(guān)的信息。了解不同課程設(shè)置順序?qū)W(xué)員表現(xiàn)的影響,并更合理地安排課程順序。通過使用關(guān)聯(lián)分析和數(shù)據(jù)挖掘技術(shù)的統(tǒng)計分析功能,可以從數(shù)據(jù)庫中提取選修課程和必修課程的學(xué)習(xí)。判斷每個科目的選修課的偏好及其對最終成績的影響,培訓(xùn)機(jī)構(gòu)將制定有利于學(xué)員的合理選修課程。
將數(shù)據(jù)挖掘與時間序列分析和相關(guān)性分析以及其他相關(guān)功能相結(jié)合,從這些海量數(shù)據(jù)信息中挖掘出有用的信息資源,幫助分析這些數(shù)據(jù)信息之間的回歸、相關(guān)性等,并繪制一些相關(guān)的有價值的信息和規(guī)則,在此基礎(chǔ)上對課程進(jìn)行更合理的安排。并且可以進(jìn)一步認(rèn)識到設(shè)計培訓(xùn)內(nèi)容的缺點,也可以找到一些意想不到的數(shù)據(jù)信息,這更有利于后續(xù)培訓(xùn)內(nèi)容的設(shè)計。
培訓(xùn)質(zhì)量評價方面 ?培訓(xùn)質(zhì)量評估分為兩個方面。培訓(xùn)機(jī)構(gòu)對參與者學(xué)習(xí)成果的評估并不簡單,需要對參與者的各個方面進(jìn)行全面評估??梢詫W(xué)員各方面的行為進(jìn)行統(tǒng)計,建立評分項,利用決策樹的挖掘方法將信息分類為一個樹狀結(jié)構(gòu),對每項數(shù)據(jù)進(jìn)行不同權(quán)重的比例分配,如登錄次數(shù)、登錄時長、視頻學(xué)習(xí)時長、論壇發(fā)言情況、提問狀況、工作坊活動數(shù)量、工作坊發(fā)起評論數(shù)量、資源利用情況、作業(yè)成績等。決策樹方法可以幫助預(yù)測數(shù)據(jù)的某些特性,可以用群集算法尋找數(shù)據(jù)中的自然分組??梢曰跀?shù)據(jù)挖掘方法評估和分析學(xué)員的學(xué)習(xí)成果。
參與者對培訓(xùn)效果和培訓(xùn)管理的評估[5],其中大部分是通過評估系統(tǒng)和問卷調(diào)查完成的。數(shù)據(jù)挖掘技術(shù)可用于優(yōu)化評估系統(tǒng)并獲得滿足培訓(xùn)機(jī)構(gòu)實際需求且可操作的評估系統(tǒng),并對數(shù)據(jù)進(jìn)行挖掘和分析,以獲取有價值的信息,提高培訓(xùn)質(zhì)量。在評價方面,不僅要關(guān)注總結(jié)性評價,還要從多個方面、多個階段、多個角度關(guān)注形成性評價。
鑒于評估系統(tǒng)的多因素、模糊性和多樣性,采用數(shù)據(jù)挖掘技術(shù)從教學(xué)評估數(shù)據(jù)中挖掘。分析各種因素之間隱藏的內(nèi)在聯(lián)系,如探索教學(xué)效果與教師年齡結(jié)構(gòu)、學(xué)術(shù)結(jié)構(gòu)、職稱結(jié)構(gòu)等之間的關(guān)系。通過有效地利用這些數(shù)據(jù)來評估教學(xué)質(zhì)量和教學(xué)效果,可以改進(jìn)和建立適合培訓(xùn)機(jī)構(gòu)的有效評估模型。利用數(shù)據(jù)挖掘技術(shù),在保證綜合評價內(nèi)容、多種評價方法的基礎(chǔ)上,通過分析和其他功能,分析和處理收集的海量數(shù)據(jù),包括學(xué)員的成績、學(xué)員的行為以及學(xué)員對教師的評估數(shù)據(jù)等,及時了解培訓(xùn)結(jié)果,及時糾正培訓(xùn)過程中出現(xiàn)的問題,促進(jìn)教學(xué)質(zhì)量的提高。如通過對課程選擇的聚類分析,可以得出結(jié)論,以學(xué)員歡迎哪種類型的選修課程作為選擇課程的參考。數(shù)據(jù)挖掘技術(shù)使培訓(xùn)機(jī)構(gòu)能夠找出影響教學(xué)質(zhì)量的因素以及影響學(xué)員學(xué)習(xí)質(zhì)量的因素。
4 結(jié)語
利用數(shù)據(jù)挖掘技術(shù)應(yīng)用在教師遠(yuǎn)程培訓(xùn)中的各個環(huán)節(jié),可以更加清晰地掌握學(xué)員信息,對學(xué)員信息、學(xué)習(xí)情況等進(jìn)行宏觀把控的同時,找尋有意義的信息,對資源設(shè)置、學(xué)員個性化培養(yǎng)方案[5]的制訂有很大幫助。學(xué)員從中獲取更多有用的、想要獲得的知識,教師從中不斷反思和更新自己的教育方式和講課內(nèi)容,培訓(xùn)機(jī)構(gòu)也會制訂出更加符合學(xué)員和教師要求的實施方案,真正意義上確保教師遠(yuǎn)程培訓(xùn)持續(xù)性和有效性。
參考文獻(xiàn)
[1]呂海燕,周立軍,張杰.大數(shù)據(jù)背景下教育數(shù)據(jù)挖掘在學(xué)生在線學(xué)習(xí)行為分析中的應(yīng)用研究[J].計算技術(shù)與自動化,2017,36(1):136-140.
[2]徐海霞,寇藝儒.數(shù)據(jù)挖掘技術(shù)在教師培訓(xùn)系統(tǒng)中的應(yīng)用研究[J].軟件導(dǎo)刊,2012,11(7):113-114.
[3]蔣紅,朱敏.數(shù)據(jù)挖掘技術(shù)在教師培訓(xùn)需求分析中的應(yīng)用:以寧波市教師培訓(xùn)項目數(shù)據(jù)為例[J].寧波教育學(xué)院學(xué)報,2015,17(3):73-76.
[4]張琳,李小平,張少剛,等.基于遠(yuǎn)程教學(xué)視點下的大數(shù)據(jù)挖掘模式問題研究[J].中國電化教育,2018(4):41-49.
[5]徐鵬飛,鄭勤華,陳耀華,等.教育數(shù)據(jù)挖掘中的學(xué)習(xí)者建模研究[J].中國遠(yuǎn)程教育,2018(6):5-11,79.
[6]李幸,孫力.遠(yuǎn)程教育個性化學(xué)習(xí)支持服務(wù)研究[J].中國教育信息化,2017(17):9-12.