劉悅 蔡飛 陳怡海 王皙 張博鋒
摘要:本文分析了課程建設(shè)網(wǎng)站采集的日常教學(xué)數(shù)據(jù)的類型和特點(diǎn),并針對(duì)這些數(shù)據(jù),采用統(tǒng)計(jì)分析和Echarts技術(shù),以可視化的形式展現(xiàn)了師生的日常教學(xué)情況,分析了其與教學(xué)效果的關(guān)聯(lián)關(guān)系,進(jìn)而,提出了基于回歸的學(xué)生成績(jī)績(jī)點(diǎn)預(yù)測(cè)方法,綜合考慮了學(xué)生平時(shí)學(xué)習(xí)各方面的表現(xiàn),利用Python實(shí)現(xiàn)了線性回歸來(lái)預(yù)測(cè)學(xué)生的績(jī)點(diǎn)。作者以“程序設(shè)計(jì)方法學(xué)”課程為例,應(yīng)用該方法以發(fā)現(xiàn)學(xué)生平時(shí)表現(xiàn)與教學(xué)效果的關(guān)系,從而為課程的教學(xué)提供良好的決策支持。
關(guān)鍵詞:教學(xué)數(shù)據(jù)分析;可視化;回歸
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A 論文編號(hào):1674-2117(2018)21-0099-04
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,越來(lái)越多的高等學(xué)校及教育機(jī)構(gòu)開(kāi)始通過(guò)互聯(lián)網(wǎng)來(lái)進(jìn)行教學(xué)資源的普及和學(xué)習(xí)。這種教學(xué)方式不僅降低了教學(xué)成本,而且也極大地簡(jiǎn)化了教師的教學(xué)方式。因此,許多高校都在研發(fā)具有自己特色的在線教學(xué)平臺(tái)。[1]同時(shí),在線教學(xué)平臺(tái)上的教學(xué)資源以及學(xué)生的日常行為信息隨著教育范圍的擴(kuò)大也在不斷豐富。這些資源和日常教學(xué)情況信息都可以用來(lái)幫助平臺(tái)管理者改善學(xué)生體驗(yàn)和增進(jìn)學(xué)習(xí)興趣。然而,如何從這些數(shù)據(jù)中提取有用決策信息,是一個(gè)亟待解決的問(wèn)題。針對(duì)以上問(wèn)題,數(shù)據(jù)分析以及可視化方法提供了一種處理方式。數(shù)據(jù)分析是實(shí)現(xiàn)數(shù)據(jù)價(jià)值的重要途徑,通過(guò)數(shù)據(jù)分析可以總結(jié)出數(shù)據(jù)中出現(xiàn)的規(guī)律,從而更好地理解現(xiàn)實(shí),實(shí)現(xiàn)基于數(shù)據(jù)的決策。[2]而數(shù)據(jù)可視化充分利用了人們對(duì)可視模式快速識(shí)別的自然能力,完美地提高人們理解及分析數(shù)據(jù)的速度,幫助人們更有效地對(duì)海量數(shù)據(jù)進(jìn)行挖掘,從而突破教育大數(shù)據(jù)分析的桎梏。[3]
在線教學(xué)平臺(tái)的興起,也引發(fā)了在線學(xué)習(xí)分析的熱潮。強(qiáng)津培等人(2016)[4]實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動(dòng)的教學(xué)數(shù)據(jù)可視化平臺(tái),并將其運(yùn)用到不同學(xué)科的教學(xué)實(shí)例中。該平臺(tái)不僅能夠滿足跨學(xué)科的教學(xué)平臺(tái)功能,而且能夠通過(guò)可視化技術(shù)和交互技術(shù),激發(fā)學(xué)生的學(xué)習(xí)興趣。李嬌嬌等人(2017)[5]在數(shù)據(jù)可視化相關(guān)理論與技術(shù)的基礎(chǔ)之上,以華中師范大學(xué)自主研發(fā)的云課堂為例對(duì)教育數(shù)據(jù)進(jìn)行分析,包括對(duì)用戶的分析、對(duì)數(shù)據(jù)模塊和類型的分析,并基于數(shù)據(jù)類型和可視化技術(shù)分類對(duì)數(shù)據(jù)可視化的布局進(jìn)行分析,針對(duì)教育數(shù)據(jù)中不同數(shù)據(jù)類型來(lái)選擇合適的布局方法。劉海等人(2018)[6]在分析教學(xué)平臺(tái)數(shù)據(jù)特點(diǎn)的基礎(chǔ)上,提出了一系列面向教學(xué)場(chǎng)景的數(shù)據(jù)可視化方法,并結(jié)合自主研發(fā)的師大云課堂,將數(shù)據(jù)可視化方法應(yīng)用到實(shí)際教學(xué)中。另外,國(guó)外在數(shù)據(jù)驅(qū)動(dòng)的可視化在線教學(xué)平臺(tái)技術(shù)方面也有相應(yīng)研究。比利時(shí)魯汶大學(xué)Govaerts等人[7]通過(guò)一個(gè)內(nèi)嵌在網(wǎng)頁(yè)上的應(yīng)用程序記錄學(xué)生在課程中參與活動(dòng)的情況,并將數(shù)據(jù)進(jìn)行可視化分析,以折線圖、平行坐標(biāo)、柱狀圖等方式顯示學(xué)生的學(xué)習(xí)情況,為學(xué)生提供反饋,以促進(jìn)他們更好地學(xué)習(xí)。與之類似,普渡大學(xué)的“警告信號(hào)系統(tǒng)”[8]則通過(guò)從網(wǎng)絡(luò)教學(xué)平臺(tái)以及課程成績(jī)簿中收集信息來(lái)形成學(xué)生學(xué)習(xí)困難的層次,分別用綠色、黃色和紅色標(biāo)示危險(xiǎn)等級(jí),進(jìn)而對(duì)學(xué)習(xí)成績(jī)有“危險(xiǎn)”的學(xué)生進(jìn)行有針對(duì)性的教育。基于數(shù)據(jù)可視化技術(shù)的在線教學(xué)平臺(tái)需要在表現(xiàn)形式、用戶交互體驗(yàn)以及算法支持等方面進(jìn)行研究,根據(jù)不同部分的需求進(jìn)行設(shè)計(jì),從而達(dá)到對(duì)數(shù)據(jù)以及算法的可視化體驗(yàn)。[9]
在上海市教委和上海大學(xué)提供的重點(diǎn)課程建設(shè)項(xiàng)目共同資助下,我們對(duì)“程序設(shè)計(jì)方法學(xué)”進(jìn)行了課程建設(shè),設(shè)計(jì)和實(shí)現(xiàn)了網(wǎng)絡(luò)教學(xué)管理與分析平臺(tái),積累了多年數(shù)據(jù)。本文將以“程序設(shè)計(jì)方法學(xué)”為例,分析課程建設(shè)網(wǎng)站采集的日常教學(xué)數(shù)據(jù)的類型和特點(diǎn),然后針對(duì)這些數(shù)據(jù),分別使用基于Echarts和Python的統(tǒng)計(jì)分析與可視化、基于回歸的學(xué)生成績(jī)績(jī)點(diǎn)預(yù)測(cè)方法對(duì)教學(xué)平臺(tái)積累的數(shù)據(jù)進(jìn)行學(xué)習(xí),以發(fā)現(xiàn)學(xué)生平時(shí)表現(xiàn)與教學(xué)效果的關(guān)系,從而為課程教學(xué)提供良好的決策支持。
日常教學(xué)中的數(shù)據(jù)分類和特點(diǎn)
隨著信息化在教學(xué)中的廣泛應(yīng)用,越來(lái)越多的課程建立了課程網(wǎng)站,網(wǎng)站中匯集了與課程日常教學(xué)相關(guān)的豐富數(shù)據(jù)。這些數(shù)據(jù)大致可以分為以下兩種:第一種是靜態(tài)數(shù)據(jù),主要指網(wǎng)站中存儲(chǔ)的人(教師和學(xué)生的個(gè)人基本信息)、課(課程的基本信息)和物(教學(xué)資源)的數(shù)據(jù)以及日常教務(wù)產(chǎn)生的各種數(shù)據(jù)。這些數(shù)據(jù)通過(guò)手工輸入或批量導(dǎo)入獲得,相對(duì)來(lái)說(shuō)它們一旦產(chǎn)生變化性不大,但將隨著教學(xué)年份的增加而增多。第二種是動(dòng)態(tài)數(shù)據(jù),包括網(wǎng)站通過(guò)在線答疑采集的師生互動(dòng)信息、師生訪問(wèn)網(wǎng)站的日志信息,這些是常常發(fā)生變化的。
這些靜態(tài)和動(dòng)態(tài)相結(jié)合的數(shù)據(jù)具有多源異構(gòu)的特點(diǎn)。靜態(tài)信息中的師、生和課的基本信息、日常產(chǎn)生的作業(yè)與考試成績(jī)等是結(jié)構(gòu)化數(shù)據(jù),教學(xué)課件、實(shí)驗(yàn)指導(dǎo)手冊(cè)、學(xué)生上傳的作業(yè)等是非結(jié)構(gòu)化數(shù)據(jù),而日志數(shù)據(jù)則是半結(jié)構(gòu)化的數(shù)據(jù)。這些結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)都可以為我們進(jìn)行數(shù)據(jù)分析提供良好的數(shù)據(jù)基礎(chǔ),也為我們的分析提出了不同的需求。
基于Echarts的教學(xué)情況統(tǒng)計(jì)分析與可視化
針對(duì)教學(xué)情況數(shù)據(jù)中的某些單項(xiàng)情況,我們采用傳統(tǒng)的統(tǒng)計(jì)方法進(jìn)行分析,并采用了可視化技術(shù)Echarts[10],以圖表的形式展現(xiàn)數(shù)據(jù)分析結(jié)果,主要包括教學(xué)情況總結(jié)、師資分析、作業(yè)提交分析、互動(dòng)分析、成績(jī)分析等。具體如表1所示。
Echarts是一個(gè)純Javascript圖標(biāo)庫(kù),能夠提供直觀、生動(dòng)、可個(gè)性化定制、可交互的數(shù)據(jù)可視化圖表,它支持折線圖、柱狀圖、散點(diǎn)圖等,同時(shí)還支持任意維度的堆積和多圖表混合展現(xiàn)。我們以“程序設(shè)計(jì)方法學(xué)”課程為例,展現(xiàn)Echarts的可視化效果。
如下頁(yè)圖1所示,利用餅狀圖對(duì)師資力量進(jìn)行分析,表明了教師的年齡分布、學(xué)位分布和職稱分布,從中可以很清晰地看到師資分布情況;作業(yè)提交分析采用折線圖,將每一年作業(yè)提交的比例計(jì)算后進(jìn)行展示,從中可以看到同年學(xué)生在不同的作業(yè)題的提交率變化,幫助教師及時(shí)了解學(xué)生知識(shí)掌握情況,同時(shí)也可以看到不同年級(jí)學(xué)生對(duì)同一題的掌握情況不同,從而有針對(duì)性地調(diào)整授課內(nèi)容的進(jìn)度與難度;互動(dòng)分析采用柱狀圖展現(xiàn)了提問(wèn)人數(shù)周平均變化情況,可以清楚地看到每個(gè)學(xué)期中提問(wèn)人數(shù)的波動(dòng)情況;聯(lián)動(dòng)分析將每個(gè)學(xué)期的總評(píng)成績(jī)、平時(shí)成績(jī)和學(xué)生人數(shù)三者進(jìn)行對(duì)比分析,并采用散點(diǎn)圖進(jìn)行了展示,散點(diǎn)圖中的數(shù)據(jù)根據(jù)時(shí)間的不同進(jìn)行動(dòng)態(tài)變化,從而發(fā)現(xiàn)平時(shí)成績(jī)與學(xué)生總評(píng)成績(jī)的關(guān)聯(lián)。
基于線性回歸的學(xué)生成績(jī)績(jī)點(diǎn)預(yù)測(cè)
1.問(wèn)題描述
平均績(jī)點(diǎn)是評(píng)價(jià)本科生學(xué)習(xí)成績(jī)是否優(yōu)秀或者能否順利畢業(yè)的最重要的標(biāo)準(zhǔn),如果平均績(jī)點(diǎn)偏低,會(huì)給即將畢業(yè)的學(xué)生造成種種不便,但平均績(jī)點(diǎn)計(jì)算通常需要一至兩周的時(shí)間,具有滯后性,不能及時(shí)給學(xué)生提供預(yù)警。因此,我們可以通過(guò)對(duì)歷屆學(xué)生的成績(jī)進(jìn)行分析和建模,得出學(xué)生成績(jī)的普遍發(fā)展模式。根據(jù)這些模式建立預(yù)測(cè)模型,根據(jù)學(xué)生現(xiàn)有課程教學(xué)數(shù)據(jù),包括學(xué)生平均出勤、平均作業(yè)得分、平均課外實(shí)踐得分等信息來(lái)事先預(yù)測(cè)其未來(lái)平均績(jī)點(diǎn),為那些學(xué)習(xí)成績(jī)可能不達(dá)標(biāo)的學(xué)生提供學(xué)業(yè)預(yù)警,使其提前采取有效措施進(jìn)行彌補(bǔ),盡可能避免不能順利畢業(yè)的事情發(fā)生;同時(shí)也可以幫助專業(yè)教師針對(duì)不同情況采取不同的策略來(lái)引導(dǎo)學(xué)生完成學(xué)業(yè)。
2.實(shí)驗(yàn)數(shù)據(jù)集
實(shí)驗(yàn)數(shù)據(jù)來(lái)自我校2011年至2018年期間開(kāi)設(shè)的“程序設(shè)計(jì)方法學(xué)”課程五個(gè)學(xué)年學(xué)生成績(jī)的歷史數(shù)據(jù),包括了學(xué)生選課人數(shù)、作業(yè)提交率、學(xué)生平均出勤率、平均作業(yè)得分、平均課外實(shí)踐得分和平均績(jī)點(diǎn),具體如表2所示。
3.實(shí)驗(yàn)結(jié)果和分析
基于線性回歸的學(xué)生成績(jī)績(jī)點(diǎn)預(yù)測(cè)方法主要思想是:首先分析影響學(xué)生績(jī)點(diǎn)的因素主要有哪些,并利用平臺(tái)進(jìn)行采集和數(shù)據(jù)預(yù)處理,獲得學(xué)習(xí)樣本;然后利用Python編程實(shí)現(xiàn)線性回歸方法,模擬學(xué)生平時(shí)學(xué)習(xí)因素和學(xué)生績(jī)點(diǎn)之間的關(guān)系,獲得線性回歸方程;最后通過(guò)構(gòu)建好的回歸預(yù)測(cè)方程對(duì)學(xué)生平均績(jī)點(diǎn)進(jìn)行預(yù)測(cè)。算法的具體流程如圖2所示。
將上述方法用Python實(shí)現(xiàn)后對(duì)表2的數(shù)據(jù)進(jìn)行了學(xué)習(xí),獲得如以下公式所示的回歸預(yù)測(cè)方程。
其中,Y為平均績(jī)點(diǎn),X1為選課人數(shù),X2為作業(yè)提交率,X3為平均出勤率,X4為平均作業(yè)得分,X5為平均課外實(shí)踐得分。通過(guò)公式求出的擬合績(jī)點(diǎn)如表3所示,模型的均方誤差MSE為0.0054??梢钥闯?,利用線性回歸獲得的績(jī)點(diǎn)預(yù)測(cè)模型可以較好地分析出學(xué)生日常學(xué)習(xí)行為(選課人數(shù)、作業(yè)提交率、出勤、作業(yè)得分和課外實(shí)踐得分)與學(xué)生績(jī)點(diǎn)的關(guān)聯(lián)情況。
結(jié)語(yǔ)
信息技術(shù)在教學(xué)中的不斷應(yīng)用積累了越來(lái)越多的教學(xué)數(shù)據(jù)。本文通過(guò)統(tǒng)計(jì)分析和回歸模型對(duì)積累的日常教學(xué)數(shù)據(jù)進(jìn)行了分析與預(yù)測(cè),并采用Echarts數(shù)據(jù)可視化工具對(duì)結(jié)果進(jìn)行了圖形展示,教師可以及時(shí)了解學(xué)生的學(xué)習(xí)狀況,從而根據(jù)學(xué)生水平及時(shí)調(diào)整教學(xué)內(nèi)容、方式與進(jìn)度,進(jìn)一步提高課程的教學(xué)水平,改進(jìn)教學(xué)效果,提高教學(xué)質(zhì)量。在未來(lái)的研究中,我們將不斷積累更多的日常教學(xué)情況數(shù)據(jù),采集更多門課程的日常教學(xué)數(shù)據(jù),獲得學(xué)生在校的多方面更加豐富的數(shù)據(jù)(如圖書(shū)館借閱數(shù)據(jù)、參與課外活動(dòng)數(shù)據(jù)等),這樣就可以引入機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法發(fā)現(xiàn)更多教與學(xué)的規(guī)律和特點(diǎn),為教學(xué)提供更好的智能決策支持。
參考文獻(xiàn):
[1][6]劉海,李姣姣,張維,等.面向在線教學(xué)平臺(tái)的數(shù)據(jù)可視化方法及應(yīng)用[J].中國(guó)遠(yuǎn)程教育,2018(1):37-44.
[2]覃雄派,王會(huì)舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競(jìng)爭(zhēng)與共生[J].軟件學(xué)報(bào),2012,23(1):32-45.
[3]王媛媛,丁毅,孫媛媛,等.數(shù)據(jù)可視化技術(shù)的實(shí)現(xiàn)方法研究[J].現(xiàn)代電子技術(shù),2007,30(4):71-74.
[4][9]強(qiáng)津培,戴松.面向教學(xué)的數(shù)據(jù)可視化圖表交互系統(tǒng)研究[J].系統(tǒng)仿真學(xué)報(bào),2016,28(9):2101-2108.
[5]李姣姣.面向在線學(xué)習(xí)平臺(tái)的數(shù)據(jù)可視化研究[D].上海:華中師范大學(xué),2017.
[7]顧小清,黃景碧,朱元錕,等.讓數(shù)據(jù)說(shuō)話:決策支持系統(tǒng)在教育中的應(yīng)用[J].開(kāi)放教育研究,2010,16(5):79-80.
[8]https://www.itap.purdue.edu/learning/tools/signals.
[10]冀瀟,李楊.采用ECharts可視化技術(shù)實(shí)現(xiàn)的數(shù)據(jù)體系監(jiān)控系統(tǒng)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(6):72-76.
作者簡(jiǎn)介:劉悅,女,副教授,研究方向?yàn)閿?shù)據(jù)挖掘、機(jī)器學(xué)習(xí)。
基金項(xiàng)目:本文工作受上海高校外國(guó)留學(xué)生英語(yǔ)授課示范性課程建設(shè)項(xiàng)目(軟件工程)(上海市教育委員會(huì)文件教外〔2016〕83號(hào))和上海市教委重點(diǎn)課程建設(shè)項(xiàng)目(程序設(shè)計(jì)方法學(xué))(上海市教育委員會(huì)文件滬教委高〔2015〕37號(hào)))共同資助。