潘青青 王 浩
(1.鎮(zhèn)江心湖高級中學,江蘇 鎮(zhèn)江 212132;2.江蘇省馬壩高級中學,江蘇 盱眙 211751)
當前,很多學者都在積極探索教育數(shù)據(jù)資產(chǎn)的巨大價值。楊現(xiàn)民等人[1]指出教育大數(shù)據(jù)的價值應體現(xiàn)在與教育主流業(yè)務的深度融合和推動教育系統(tǒng)智慧化變革。肖玉敏等人[2]認為教育大數(shù)據(jù)能夠幫助教學者加深對學習者成長過程的認知和理解,實現(xiàn)對人性的洞悉,便于提供更符合內(nèi)需的教育。祝智庭等人[3]把數(shù)據(jù)提煉為不同的類型,提出不同類型的數(shù)據(jù)所處的數(shù)據(jù)價值層級有所差異,解決的問題也分為不同的階段。Siemens G等[4]學者對大數(shù)據(jù)在教育中的應用進行了實踐,試圖通過數(shù)據(jù)分析來促進教育的良構。Darrell M.West[5]指出大數(shù)據(jù)可以通過學生成績和學習方法挖掘更深層的學習信息。Picciano等人[6]認為大數(shù)據(jù)和學習分析已經(jīng)成為整合行政和教學功能的一種解決方案。Matthew M A等人[7]提出數(shù)據(jù)科學、預測分析和大數(shù)據(jù)可以轉變教學設計和管理的應用鏈。
教育數(shù)據(jù)挖掘是從海量的學校數(shù)據(jù)庫中判別、篩選、重組、分析有效的、具有潛在作用的數(shù)據(jù)以獲取教育利益的過程。對教育數(shù)據(jù)資產(chǎn)的深度挖掘可以揭開隱藏在數(shù)據(jù)背后的意義,充分發(fā)揮數(shù)據(jù)對教學和管理的價值,服務教學者、學習者、管理者、軟件開發(fā)者以及教育研究者等。李婷等人[8]開展了教育數(shù)據(jù)挖掘在教育教學和教務管理中的應用研究,指出其在網(wǎng)絡教育中重要的價值在于指導、改善學生學習,提升教師教學質(zhì)量。施佺等人[9]以網(wǎng)絡學習平臺為研究對象,利用統(tǒng)計分析和可視化、關聯(lián)和聚類等數(shù)據(jù)挖掘的技術,解讀了在線學習過程中的數(shù)據(jù),建立了在線學習監(jiān)管的教育數(shù)據(jù)挖掘模型,根據(jù)分析結果對學習過程提出了思考和建議。胡水星[10]基于Moodle網(wǎng)絡日志和微視頻學習案例,利用教育數(shù)據(jù)挖掘技術進行實證分析,發(fā)現(xiàn)了教育現(xiàn)象之間的關聯(lián)和規(guī)則,為教育預測和教育決策提供支持。
教育數(shù)據(jù)是客觀的,其價值的挖掘取決于控制和應用數(shù)據(jù)的人。為了清晰地了解數(shù)據(jù)深度挖掘的思路,本研究將其分為六個方面。如圖1所示。
圖1 數(shù)據(jù)深度挖掘的思路
1.1.1 教學理解
教學人員和研究人員圍繞數(shù)據(jù)進行教學業(yè)務的深入調(diào)研和分析,通過交流合作,明晰需要解決什么樣的教學問題,采取措施有針對性地解決這些問題。教育大數(shù)據(jù)反映的是教育現(xiàn)象外在數(shù)字形式,也體現(xiàn)了具有潛在價值的教與學的信息。
1.1.2 數(shù)據(jù)理解
數(shù)據(jù)是挖掘的原材料和基礎,在數(shù)據(jù)理解環(huán)節(jié)需要做到以下幾點:一是要了解教育中的數(shù)據(jù)類型,即認識學校自身有哪些數(shù)據(jù),按照不同的層次劃分;二是描述數(shù)據(jù)特征,將其存儲到相應數(shù)據(jù)庫中;三是在數(shù)據(jù)間建立聯(lián)系,實現(xiàn)動態(tài)循環(huán)。認清數(shù)據(jù)本身代表的意義,以便于實現(xiàn)對數(shù)據(jù)的調(diào)用和分析。
1.1.3 數(shù)據(jù)準備
數(shù)據(jù)準備是數(shù)據(jù)挖掘和分析的基礎,它可以為數(shù)據(jù)挖掘提供高質(zhì)量的、完整、實時、準確的數(shù)據(jù)。利用高性能的T-SQL語句在數(shù)據(jù)源處進行數(shù)據(jù)準備工作,采用SSIS技術連接多種不同的數(shù)據(jù)源獲取數(shù)據(jù),將數(shù)據(jù)導入到分析工具,通過過濾采樣、清洗數(shù)據(jù)、創(chuàng)建數(shù)據(jù)庫,不斷迭代更新,為后續(xù)研究提供有效的數(shù)據(jù)源。
1.1.4 建立數(shù)據(jù)模型
建立模型分為業(yè)務建模、領域概念建模、邏輯建模和物理建模,用于幫助研究者全面了解教育業(yè)務,改進教學流程。整合全方位的數(shù)據(jù)源能夠消除數(shù)據(jù)孤島和數(shù)據(jù)差異,提高數(shù)據(jù)利用效率。如建立學業(yè)評價模型可以幫助學生改變學業(yè)評價研究中的無序狀態(tài),提高學生能力,獲得個人發(fā)展。
1.1.5 評估模型
研究利用訓練數(shù)據(jù)得到的模型能適應于所研究的實際數(shù)據(jù),觀察模型對數(shù)據(jù)集的測評效果。根據(jù)環(huán)境因素、發(fā)展?jié)摿蛻盟皆u價模型使用效果。如果使用獲得顯著成效,可以繼續(xù)推廣到實際應用中,如果出現(xiàn)問題則需要重新進行教學理解的需求分析,再次建立模型,直至達到預期成效。
1.1.6 教學應用
數(shù)據(jù)挖掘的初衷是為教學提供精準的數(shù)據(jù)服務,向學習者推薦個性化的學習資源、學習活動以及學習路徑,輔助教師更好地調(diào)整和改進教學策略,完善課程設計和開發(fā),幫助管理者進行更科學的管理決策。
教育數(shù)據(jù)挖掘的方法主要包括聚類分析技術、分類技術、離群點檢測技術、關聯(lián)規(guī)則挖掘技術和序列分析技術,本研究主要對這五種技術在教育教學中的應用進行分析和探討,總結各種技術在教育教學中的應用方向,剖析技術應用流程,期望能為數(shù)據(jù)挖掘在教育教學中的應用提供參考。
教育情況復雜多樣,教學者若要實現(xiàn)不同的教學目標,需要準確找到適合的數(shù)據(jù)挖掘方法,以便有針對性地解決問題。在一個班級中,教師想要了解不同學生群體的差異,可對學習者進行聚類分析,應用到的數(shù)據(jù)主要包含標準規(guī)定采集的學習者基礎信息(姓名、學號、成績、專業(yè)、年齡等)、在線學習行為(瀏覽信息、錯題記錄、在線討論、發(fā)帖、答疑等)、在線學習路徑(訪問方式、頁面、時間、瀏覽路徑、資源訪問順序等)、資源使用情況、課堂學習行為等所有與學習者有關的學習和生活數(shù)據(jù)。例如,對學生在網(wǎng)絡學習平臺中的登錄頻次、進入課程頻次、課程討論區(qū)交互頻次、閱讀課程通知頻次、閱讀課程資源頻次等數(shù)據(jù)進行聚類,可以按照網(wǎng)絡學習行為活躍度將學生分為“活躍型”“中度活躍”“非活躍型”三類群體,并對這三類學習群體采用不同的在線教學策略。
利用關聯(lián)規(guī)則技術挖掘各科成績之間以及與總成績的內(nèi)在關系,找出隱藏的課程關聯(lián)規(guī)則,將這些規(guī)則應用于學生成績預警,及時找出可能出現(xiàn)不及格的課程,對部分學生給出警告,加強學習監(jiān)督。王華[11]以計算機專業(yè)相關課程為主,通過關聯(lián)規(guī)則挖掘發(fā)現(xiàn),如果在電路原理課程這門課上取得60~80分的成績,那么大學物理成績可能會不到80分,因此對電路原理成績不理想的學生要加強指導,這樣可以有效預防學生在其他課程中取得較低成績。
通過對不同數(shù)據(jù)挖掘方法的解讀分析,可以找到其共同點,數(shù)據(jù)挖掘整體框架如圖2所示。
圖2 教育數(shù)據(jù)挖掘方法應用框架
首先確定數(shù)據(jù)挖掘的目的,教學研究者需明確要解決什么樣的教學問題,接著確定數(shù)據(jù)挖掘對象,如學習者、教師、學習資源、學校等,然后選擇合適的方法進行挖掘,最后實施教育應用。根據(jù)實踐應用效果,和最初設定的目的對比,反饋成效,改進挖掘過程,效果是對教學目的的反饋,可以了解反饋給教學者設定的挖掘目的,不斷優(yōu)化,實現(xiàn)挖掘效率和教育實踐利益最大化。
多模態(tài)學習分析(Multimodal Learning Analytics,簡稱MLA)是根據(jù)人的多重感知模式,對于同一現(xiàn)象、過程或環(huán)境,采用多種方式獲取學習過程中產(chǎn)生的相關數(shù)據(jù),包括聲音、手勢、關節(jié)動作、視覺注意等同時發(fā)生的多種不同的生理和心理數(shù)據(jù)。利用可穿戴感知設備,教師可以在不影響學習者的情況下研究學習過程和學習軌跡,使研究結果更加客觀翔實。多模態(tài)數(shù)據(jù)采集技術和機器學習分析技術可以在更復雜和開放式的學習環(huán)境中對學生的學習行為進行分析,為深度挖掘數(shù)據(jù)價值提供新的見解[12]。
Xavier Ochoa等[13]人指出教育大數(shù)據(jù)的價值是理解和改進教與學,然而分析不僅僅是通過單一系統(tǒng)中的學生數(shù)字痕跡實現(xiàn)的。隨著在線學習系統(tǒng)的增加和復雜學習環(huán)境的出現(xiàn),學習分析應該捕獲、處理和分析多種數(shù)字信號,以便理解學習過程中參與者的行為和相互作用的痕跡,深入揭示學習規(guī)律。
Ez-Zaouia等[14]人指出學習者的情緒數(shù)據(jù)對提升學習效果有著至關重要的作用,在同步在線學習環(huán)境中,將學習者的情緒可視化處理能夠幫助教師建立和保持與學習者之間的社會情感關系。情感分析可通過學生學習的自我報告、視頻、音頻、交互軌跡四個方面來獲取數(shù)據(jù),建立以教師為導向的多模態(tài)和聯(lián)系上下文的情感儀表板。
表1 不同數(shù)據(jù)挖掘方法的對比
Mitri等人[15]通過運用腕帶、平臺記錄、自我報告等方式獲得的多模態(tài)數(shù)據(jù)來建立自主學習環(huán)境下心跳、步數(shù)、天氣狀況和學習活動等因素與學習成績的線性混合效應模型,以檢驗這些指標對學習成績的預測效果。
機器學習是將信息轉化為智能行為的過程,數(shù)據(jù)挖掘是從海量的數(shù)據(jù)中挖掘出數(shù)據(jù)主體隱藏的信息,數(shù)據(jù)挖掘是指完整地完成一項事務,機器學習是一種方法,可以理解為用機器學習的方法支持數(shù)據(jù)挖掘工作。在教育領域,借助機器學習算法可以實現(xiàn)對學習的預測,挖掘數(shù)據(jù)隱藏的價值。
預測分析是統(tǒng)計分析的子集,是從現(xiàn)有的信息中提取有用的數(shù)據(jù),通過使用各種技術發(fā)現(xiàn)趨勢,實現(xiàn)對未來結果的預測。在教育中,研究者可以利用預測分析提高學生的入學率,降低輟學率。Halde等人[16]學者在大一新生入學時,按照他們的總成績將學生劃分為三個類別,分別是風險級、中級、高級。根據(jù)建立的預測模型,研究表明,處于風險級的學生更有可能失敗。預測是為了識別和幫助有困難的學生,教師和助教在發(fā)現(xiàn)有困難的學生后會及時給予他們相應的建議。任課教師可以在學校門戶系統(tǒng)網(wǎng)站上建立交流平臺,學生可以提交作業(yè),教師可以發(fā)布筆記,師生可以隨時溝通。同時,教師要評價學生的課程表現(xiàn)、學生的作業(yè)、測驗和期末考試成績,然后給出可視化的反饋,為學生提供改進意見,幫助學生發(fā)掘自己的潛能和興趣,推薦給他們最適合的學習路徑和課程,以便提高學習效率。這些過程都是系統(tǒng)聯(lián)機的,便于師生能夠有計劃地完成這些事項,最后實現(xiàn)提升學生成績的目標。對于教育管理者來說,預測分析能夠為其提供客觀的教學反饋,幫助學校管理者制定恰當?shù)慕逃龥Q策,對教學資源、教學計劃、課程體系和師資力量重新評估和分配。
為了保障數(shù)據(jù)挖掘的可用性和高效性,必須開發(fā)多種專業(yè)的數(shù)據(jù)挖掘工具,研究多樣的方法。學校中有多種數(shù)據(jù),但不是每類數(shù)據(jù)都采用同樣的方法。首先要明確數(shù)據(jù)挖掘的初衷,利用數(shù)據(jù)完成什么樣的教學任務。一個學校如果想了解生源分布情況,教學管理者可以讓學生登錄學校教育系統(tǒng),填寫個人的基本信息。若想了解學生的生源質(zhì)量,可以通過記錄學生所有學科的成績、比賽獲獎、技能特長等學習成果,熟悉學生的狀態(tài)和特點。以上數(shù)據(jù)的分析方法屬于對基礎層的數(shù)據(jù)的挖掘,主要目的是能夠宏觀掌握教育發(fā)展的現(xiàn)狀、制定科學的教育政策、完善教育體系以及合理配置資源。精準合適的挖掘方式可以讓數(shù)據(jù)應用更有針對性。
在教育數(shù)據(jù)資產(chǎn)挖掘工具方面,研究者越來越關注使用視覺表示和交互技術傳達學習感知和意識,讓教師和教育決策者能從多個維度,理解和探索學生數(shù)據(jù),可視化工具的設計應該突出指導教師確定學習目標和明確這些目標是否實現(xiàn)。澳大利亞研究者Roberto等[17]人利用LATUX(Learning Awareness Tools—User eXperience,學習意識工具—用戶體驗)可視化學生的思維過程,并建立學習者模型,促進教師深度了解學生,用數(shù)據(jù)支持教學,實現(xiàn)精準決策。
維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》中提出,目前社會各行各業(yè)對數(shù)據(jù)的挖掘如冰山一角,只看到了數(shù)據(jù)最基礎的功能與價值,隱藏在數(shù)據(jù)背后的數(shù)據(jù)價值更值得挖掘。同樣,教育數(shù)據(jù)資產(chǎn)的價值也未被充分挖掘,如何深度挖掘數(shù)據(jù)資產(chǎn)的巨大價值,真正促進教學變革成為教學研究者迫切需要解決的問題,這不僅需要教育領域的專家學者參與,還需要跨學科的數(shù)據(jù)挖掘專業(yè)人員的積極加入,共同為教育事業(yè)的美好明天出謀劃策,獻出智慧和勞動。