薄瑜 夏朝 王璨
摘要:為了讓學生更加直觀的了解自己的個人能力,給學生學習過程改進提供可視化數(shù)據(jù)支持,本文首先探討了基于大數(shù)據(jù)的學生能力畫像系統(tǒng)的背景、意義,接下來明確學生能力畫像系統(tǒng)構建的研究目標、學生能力畫像系統(tǒng)構建過程以及學生能力畫像系統(tǒng)構建需解決的關鍵問題,最后對全文進行了總結?;诖髷?shù)據(jù)技術的學生能力畫像系統(tǒng)對教學評價機制的改革和人才培養(yǎng)水平的提升起到了至關重要的作用。
關鍵詞:學生能力;畫像;大數(shù)據(jù)
1.學生能力畫像系統(tǒng)建立的意義
大數(shù)據(jù)是近年來快速發(fā)展的技術方向,關于大數(shù)據(jù)的研究與應用與日俱增,并不斷深入影響社會生活。在現(xiàn)代教育事業(yè)發(fā)展的過程中,將教育數(shù)據(jù)挖掘與學習分析技術進行有機融合,從而在教育領域建立起有關模型,對影響現(xiàn)代教育的各種因素起到了至關重要的作用。本文利用大數(shù)據(jù)技術,對學生能力畫像系統(tǒng)進行研究,通過多種信息化和數(shù)據(jù)挖掘的手段收集與學生相關的學習和能力數(shù)據(jù),構建合理的信息模型,通過數(shù)據(jù)可視化技術展示相關的結果和信息,為學生生成能力畫像,根據(jù)能力畫像,使學生認識自己在知識能力和綜合能力上的不足,讓學生更加清楚自己所具備的能力,發(fā)現(xiàn)自己的短板并彌補短板。
2.學生能力畫像系統(tǒng)構建的研究目標
學生能力畫像系統(tǒng)構建的研究目標是按照工程教育認證的標準,從八個維度細化出關于學生畫像的特征值,利用特征值結合大數(shù)據(jù)分析技術進行模型建立,構建出學生能力畫像,通過學生能力畫像評判學生的綜合能力。
3.學生能力畫像系統(tǒng)構建過程
(1)學生能力分析
按照工程教育認證的標準,通過對本校不同的專業(yè)的培養(yǎng)方案進行調研,分析出學生應該具有:誠信與決策力、心智習慣、分析與創(chuàng)造力、溝通能力、領導力及團隊合作能力、信息技術及數(shù)理能力、全球視野、適應行和探索能力這八項能力。
(2)學生能力畫像系統(tǒng)架構分析
該系統(tǒng)在功能架構上分為4層,視圖層(也稱用戶應用層)基礎信息、學生能力畫像、能力評價;控制器層(也稱業(yè)務邏輯層)包括數(shù)據(jù)安全、數(shù)據(jù)處理、邏輯處理、身份驗證;模型層包括學生能力畫像模型、能力評價模型;數(shù)據(jù)訪問層(也稱數(shù)據(jù)庫層)包括學生成績庫、學生行為庫、用戶信息庫。
(3)學生能力畫像系統(tǒng)構建思路
前期利用Python爬蟲技術進行教務系統(tǒng)、學習通、慕課等平臺的數(shù)據(jù)爬取,將收集數(shù)據(jù)儲存至數(shù)據(jù)庫,人工分析集成學生的實體作業(yè)成果進行數(shù)據(jù)錄入,構建初階數(shù)據(jù)模型,采用輕型的flask后端框架進行網站平臺的搭建,通過前端UI(echart)進行數(shù)據(jù)顯示,通過Ajax進行前后端的數(shù)據(jù)傳遞或直接通過Python回顯視圖,此時用戶登錄之后,Python后端只進行了簡單的登錄、信息計算、數(shù)據(jù)保存、數(shù)據(jù)顯示等邏輯處理。然后抽取相應的特征值進行分析,使用ID3算法等不斷對初步構建的數(shù)據(jù)模型進行合理優(yōu)化,使學生在使用并平臺的得出的學生能力畫像更加精確,并找出學生畫像的臨界、標準(合格)情況,讓學生更加直觀的了解自己的個人能力。
中期通過JAVA編碼進行實現(xiàn),通過現(xiàn)有數(shù)據(jù),集成Mapreduce對大量的數(shù)據(jù)節(jié)點進行機器學習,強化訓練,不斷地對初構建的數(shù)據(jù)模型進行統(tǒng)計、衡量、優(yōu)化。
后期繼續(xù)完善平臺功能,為學生展示其更多有用的信息,進行數(shù)據(jù)挖掘,讓學生能更加了解自己的能力,同時也可在系統(tǒng)中添加一些顯示課程表、四六級課程推送的這樣方便實用的功能。
4.學生能力畫像系統(tǒng)構建需解決的關鍵問題
(1)學生數(shù)據(jù)的收集
基于大學生現(xiàn)有在校學習信息,通過Python爬蟲進行數(shù)據(jù)收集,囊括學習通、慕課、教務系統(tǒng)等網絡平臺,再通過人工分析的方式將學生作業(yè)、實訓成果等數(shù)據(jù)進行集成轉換,一同利用分布式儲存的方式保存至數(shù)據(jù)庫,通過不同專業(yè)人才培養(yǎng)方案的課程的調查研究課程于能力特征之間的關系,進行課程模型、作業(yè)模型、網課學習模型的初步建立,通過學生對于該平臺的使用,為學生提供登錄接口對其學習數(shù)據(jù)進行收集,并通過初步模型分析計算出得到學生的基本能力和基本特征,并保存其除隱私外的個人信息。
(2)模型算法的建立
通過ID3機器學習算法的分析,進行建立的數(shù)據(jù)模型進行優(yōu)化。其中ID3算法是一種構造決策樹的方式,以信息熵的下降速度為選取測試屬性的標準,即在每個節(jié)點選取還尚未被用來劃分的具有最高信息增益的屬性作為劃分標準,然后繼續(xù)這個過程,直到生成的決策樹能完美分類訓練樣例。決策樹是對數(shù)據(jù)進行分類,然后在通過ID3算法的分析之后得出學生的特征值并生成決策樹,對應每一位大學生的信息選用不同的分析方式得出計算結果,根據(jù)已有數(shù)據(jù)進行機器訓練,使其計算結果更精確合理。
(3)學生能力的可視化
借助以往課程成績信息,基于矩陣分解的降維技術,分析學生對具體基礎知識的掌握程度,并獲得每門課程所含有的知識體系?;谶@些信息,該系統(tǒng)可以分析出每個學生的個人能力,也可以預測出這個學生在未來發(fā)展就業(yè)可能性。是通過分析課程、學習記錄、學習成果在能力體系上的相關性來進行能力預測。
5.結語
學生能力畫像利用學生的在校學習記錄數(shù)據(jù),將分散層次不齊的數(shù)據(jù)進行標準化構建數(shù)據(jù)模型行為,包括課程成績、人才培養(yǎng)課程數(shù)據(jù)、網絡平臺網課學習記錄等,運用大數(shù)據(jù)分析手段,量化學生在理論、實踐、修養(yǎng)等多維度的特性,揭示學生的個人能力,基于其數(shù)據(jù)模型對學生的能力、畢業(yè)水平、就業(yè)優(yōu)勢等進行預測,對教學評價機制的改革和人才培養(yǎng)水平的提升起到了至關重要的作用。
參考文獻:
[1]楊宗凱.數(shù)據(jù)驅動個性化學習[N].中國教育報,2018-11-01(007).
[2]楊現(xiàn)民.教學大數(shù)據(jù):推動教育的科學變革[N].中國信息化周報,2018-10-22(014).
[3]何文珍,蔡躍.基于知識圖譜的國外學習分析可視化研究[J].中國成人教育,2018(13):15-21.
[4]顏磊,祁冰.基于學習分析的大學生深度學習數(shù)據(jù)挖掘與分析[J].現(xiàn)代教育技術,2017,27(12):18-24.
[5]舒忠梅,徐曉東,屈瓊斐.基于數(shù)據(jù)挖掘的學生投入模型與學習分析[J].遠程教育雜志,2015,33(01):39-47.
作者簡介:
薄瑜(1982.01),女,吉林榆樹人,碩士,副教授,研究方向:大數(shù)據(jù)技術,工作單位:大連科技學院數(shù)字技術學院。
夏朝(2001.08),男,專業(yè):軟件工程,大連科技學院數(shù)字技術學院在校生。
王璨(1984.05),女,碩士,副教授,研究方向:計算機推理,工作單位:大連科技學院數(shù)字技術學院。