孫 笑 微
(沈陽(yáng)師范大學(xué) 科信軟件學(xué)院, 沈陽(yáng) 110034)
基于SPOC平臺(tái)日志數(shù)據(jù)的在線學(xué)習(xí)行為分析及其影響因素研究
孫 笑 微
(沈陽(yáng)師范大學(xué) 科信軟件學(xué)院, 沈陽(yáng) 110034)
MOOCs區(qū)別于傳統(tǒng)的網(wǎng)絡(luò)公開課和遠(yuǎn)程教育,是基于課程與教學(xué)論以及網(wǎng)絡(luò)移動(dòng)通訊技術(shù)發(fā)展起來(lái)的新興在線課程模式。很多全球頂尖學(xué)府如哈佛大學(xué)、加州大學(xué)伯克利分校等也在嘗試一種更加精致的課程類型----SPOC,SPOC教學(xué)模式保證了MOOCs在大學(xué)校園能夠落地生根。利用SPOC的優(yōu)勢(shì)通過對(duì)學(xué)習(xí)者在線行為學(xué)習(xí)分析對(duì)網(wǎng)絡(luò)課程大數(shù)據(jù)進(jìn)行分析和研究,以提高教學(xué)質(zhì)量、完善網(wǎng)絡(luò)課程系統(tǒng),既推動(dòng)了大學(xué)的對(duì)外品牌效應(yīng),也提升了校內(nèi)的教學(xué)質(zhì)量,重新定義了教師的作用,創(chuàng)新了教學(xué)模式,賦予學(xué)生完整、深入的學(xué)習(xí)體驗(yàn),提高了課程的完成率。對(duì)SPOC網(wǎng)絡(luò)課程的在線學(xué)習(xí)行為分析和研究將大大推動(dòng)教育測(cè)量和學(xué)習(xí)分析的發(fā)展, 促進(jìn)教育質(zhì)量的提升,但面臨的挑戰(zhàn)和困難也不容忽視。
MOOCs;SPOC; 大數(shù)據(jù); 學(xué)習(xí)行為分析
大規(guī)模在線開放課程(MassiveOpenOnlineCourse,MOOC)是基于課程與教學(xué)論及網(wǎng)絡(luò)和移動(dòng)智能技術(shù)發(fā)展起來(lái)的新興在線課程模式。2013年,哈佛大學(xué)、加州大學(xué)伯克利分校等全球頂尖名校開始跨越MOOC,嘗試一種小而精的課程類型----SPOC。SPOC(SmallPrivateOnlineCourse小規(guī)模限制性在線課程)是由加州大學(xué)伯克利分校的阿曼德??怂菇淌谧钤缣岢龊褪褂玫摹mall和Private是相對(duì)于MOOC中的Massive和Open而言,Small是指學(xué)生規(guī)模一般在幾十人到幾百人,Private是指對(duì)學(xué)生設(shè)置限制性準(zhǔn)入條件,達(dá)到要求的申請(qǐng)者才能被納入SPOC課程。SPOC平臺(tái)中存有大量的日志文件和真實(shí)可靠的實(shí)時(shí)數(shù)據(jù),這些都為數(shù)據(jù)挖掘提供了保障。
本文所研究的基于SPOC的在線學(xué)習(xí)行為分析和影響因素研究是針對(duì)學(xué)習(xí)者在SPOC網(wǎng)絡(luò)課堂環(huán)境中的各個(gè)學(xué)習(xí)環(huán)節(jié),跟蹤采集詳細(xì)、精確的學(xué)習(xí)行為數(shù)據(jù),包括登錄時(shí)段的分配和登錄時(shí)間的長(zhǎng)短,以及看視頻的時(shí)間長(zhǎng)度、課堂測(cè)驗(yàn)的準(zhǔn)確率和通過率等,這樣的數(shù)據(jù)在傳統(tǒng)實(shí)體課堂中是難以精確采集的?;赟POC網(wǎng)絡(luò)課程數(shù)據(jù)庫(kù)的分析,首先打破了傳統(tǒng)的教育測(cè)量模式,即標(biāo)準(zhǔn)化考試。但教師和未來(lái)的勞動(dòng)力市場(chǎng)雇主并不了解學(xué)習(xí)者在整個(gè)學(xué)習(xí)過程中的表現(xiàn),例如學(xué)習(xí)速度、領(lǐng)悟能力、與其他學(xué)習(xí)者的互動(dòng)與合作等。SPOC網(wǎng)絡(luò)課程所跟蹤的數(shù)據(jù)則可以讓教師更好地了解學(xué)習(xí)者的學(xué)習(xí)行為特征,讓未來(lái)的雇主結(jié)合學(xué)習(xí)行為和學(xué)習(xí)結(jié)果更加全面地評(píng)估學(xué)習(xí)者。因此,SPOC平臺(tái)可以應(yīng)用此類教育測(cè)量結(jié)果為高校的教授和研究機(jī)構(gòu)、業(yè)界的雇主等推薦人才。此外,這種對(duì)學(xué)習(xí)過程的評(píng)估極大的促進(jìn)了學(xué)習(xí)行為分析和教育數(shù)據(jù)挖掘的發(fā)展和應(yīng)用。
學(xué)習(xí)者在線學(xué)習(xí)行為分析主要基于SPOC平臺(tái)對(duì)師生學(xué)習(xí)過程的記錄數(shù)據(jù),針對(duì)行為主體(教師、學(xué)生)的行為方式(登錄、瀏覽資源、觀看視頻、發(fā)帖、做練習(xí)、測(cè)試)、行為客體(各類資源、網(wǎng)絡(luò)課程模塊)的被使用情況以及行為發(fā)生時(shí)間進(jìn)行統(tǒng)計(jì)、可視化和各類挖掘,并結(jié)合師生的人口特征數(shù)據(jù)對(duì)影響在線學(xué)習(xí)行為的因素進(jìn)行挖掘。目前已有的研究多是圍繞在線學(xué)習(xí)行為描述影響因素分析及相關(guān)監(jiān)控軟件開發(fā)應(yīng)用來(lái)展開。
從已有研究來(lái)看,不少研究通過教學(xué)平臺(tái)網(wǎng)絡(luò)日志分析來(lái)描述在線學(xué)習(xí)行為。謝偉奇采用數(shù)據(jù)挖掘方法對(duì)Web服務(wù)器日志和后臺(tái)數(shù)據(jù)庫(kù)進(jìn)行挖掘[1],宋江春、陳文林利用Web使用挖掘技術(shù)來(lái)分析學(xué)生的訪問行為、頻度、內(nèi)容、停留時(shí)間等[2]。袁明、陳偉杰以網(wǎng)絡(luò)教育學(xué)院教學(xué)平臺(tái)學(xué)習(xí)記錄為挖掘?qū)ο筮M(jìn)行分析研究[3]。肖愛平、蔣成鳳指出在線學(xué)習(xí)的影響因素具體包括網(wǎng)絡(luò)環(huán)境、課程資源、網(wǎng)上交互以及學(xué)習(xí)者自身的原因[4]。在線學(xué)習(xí)行為分析的實(shí)際應(yīng)用就是建立在線學(xué)習(xí)行為監(jiān)控系統(tǒng)[5-7]。
基于網(wǎng)絡(luò)日志所作的學(xué)習(xí)行為分析可以從學(xué)習(xí)時(shí)間、學(xué)習(xí)活動(dòng)、學(xué)習(xí)資源、考試成績(jī)等多個(gè)角度發(fā)現(xiàn)更多的學(xué)習(xí)行為特點(diǎn);其影響因素分析還可以更加注重內(nèi)在因素即學(xué)生自身因素的分析。
本文選取沈陽(yáng)師范大學(xué)軟件學(xué)院的專業(yè)必修課“數(shù)據(jù)結(jié)構(gòu)”作為研究對(duì)象?!皵?shù)據(jù)結(jié)構(gòu)”是沈陽(yáng)師范大學(xué)軟件學(xué)院各專業(yè)本科生大二上學(xué)期的一門專業(yè)必修課,該課程配有文字教材和錄像教材等資源,與該課程配套的網(wǎng)絡(luò)課程也處在試點(diǎn)應(yīng)用階段。以2014—2015年度上學(xué)期(根據(jù)沈陽(yáng)師范大學(xué)校歷,2014—2015第1學(xué)期的起止時(shí)間是2014年8月25日—2015年1月18日,前后共計(jì)21周。課程時(shí)間為2014年8月25日—12月28日,共計(jì)126天,從2014年的第35周~第52周,共18周)為例,沈陽(yáng)師范大學(xué)軟件學(xué)院2013級(jí)本科生選修本課程學(xué)生和重修生共計(jì)434人,以這434名學(xué)生為研究樣本,通過獲取這些學(xué)生的在線學(xué)習(xí)行為記錄和基本信息(如年齡、專業(yè))來(lái)開展在線學(xué)習(xí)行為描述與影響因素分析研究。
通過登錄行為后臺(tái)日志數(shù)據(jù)表,可得到學(xué)生登錄的基本情況信息,如表1所示。
表1 登錄基本情況
下面分別以登錄時(shí)間(時(shí)段為統(tǒng)計(jì)單位)作為分類字段,以統(tǒng)計(jì)各個(gè)時(shí)段學(xué)生的登錄人次;以學(xué)生學(xué)號(hào)為分類字段,以統(tǒng)計(jì)各個(gè)時(shí)段學(xué)生的登錄天數(shù)。以“某一時(shí)間登錄平臺(tái)的學(xué)生數(shù)除以學(xué)生總數(shù)”作為登錄率。
1) 以登錄時(shí)間為分類字段的統(tǒng)計(jì)分析
以時(shí)段(分為凌晨00∶00—6∶00、上午6∶00—12∶00、下午12∶00—18∶00、晚上18∶00—24∶00這4個(gè)時(shí)段)為統(tǒng)計(jì)項(xiàng),計(jì)算這四個(gè)時(shí)段的登錄率,得到如表2所示的結(jié)果。
表2 學(xué)習(xí)時(shí)段分布
由表2可知,由于學(xué)校宿舍每晚進(jìn)行斷電管理以保障安全和教學(xué)質(zhì)量,所以在凌晨這個(gè)斷電時(shí)段沒有登錄人數(shù),即登錄率為0。上午的學(xué)習(xí)人數(shù)和登錄率略低,是由于軟件學(xué)院在大二的課程設(shè)置中設(shè)置了較多的其他專業(yè)課,學(xué)生課表幾乎都排在上午時(shí)段,相對(duì)來(lái)說(shuō)使得網(wǎng)絡(luò)課程的登錄率略低。學(xué)生的學(xué)習(xí)時(shí)段主要是下午和晚上,并且晚上時(shí)段的登錄率略高一些,這體現(xiàn)了學(xué)生登錄網(wǎng)絡(luò)課程平臺(tái)大多還是利用了課后的課余時(shí)間。
2) 以學(xué)生學(xué)號(hào)為分類字段的統(tǒng)計(jì)分析
下面以每個(gè)學(xué)生個(gè)體作為分類字段進(jìn)行統(tǒng)計(jì),從而發(fā)現(xiàn)個(gè)體學(xué)習(xí)的一些特點(diǎn)。對(duì)于每個(gè)學(xué)習(xí)個(gè)體來(lái)說(shuō),保證一定的學(xué)習(xí)時(shí)間才能完成必要的學(xué)習(xí)任務(wù)?!皵?shù)據(jù)結(jié)構(gòu)”作為4學(xué)分的課程,其規(guī)定的學(xué)時(shí)是72學(xué)時(shí),如果按照線上考核和線下考核以2∶8的比例進(jìn)行分配的話,將線上學(xué)習(xí)和線下學(xué)習(xí)的學(xué)時(shí)也按照2∶8的比例進(jìn)行分配,那么線上學(xué)習(xí)的學(xué)時(shí)應(yīng)該是14.4學(xué)時(shí)。假設(shè)每個(gè)學(xué)生某天登錄平臺(tái),其學(xué)習(xí)時(shí)間平均為0.5個(gè)學(xué)時(shí)的話,那么一個(gè)學(xué)生應(yīng)該至少有30天登錄平臺(tái)參加學(xué)習(xí),所以首先查詢得到每個(gè)學(xué)生有登錄記錄的天數(shù),然后計(jì)算每類天數(shù)對(duì)應(yīng)的學(xué)生人數(shù),最后建立累計(jì)學(xué)生人數(shù)與登錄天數(shù)的函數(shù),如公式(1)所示。
(1)
其中:S0表示學(xué)生總數(shù),為434名;t表示登錄天數(shù),將所有學(xué)生的登錄天數(shù)按從高到低的順序排列并從1開始編號(hào),ti即第i個(gè)登錄天數(shù);S(ti)表示第i個(gè)登錄天數(shù)對(duì)應(yīng)的學(xué)生人數(shù);RS(ti)則表示截至第i個(gè)登錄天數(shù),累計(jì)學(xué)生人數(shù)占學(xué)生總數(shù)的比例。依照此函數(shù)和實(shí)際數(shù)據(jù),繪制得到如圖1所示的曲線。
圖1 登錄天數(shù)與登錄率的關(guān)系圖
由圖1可知,登陸天數(shù)少于54天的學(xué)生數(shù)不到學(xué)生總數(shù)的20%,有約75%的學(xué)生學(xué)習(xí)天數(shù)在61天以上,只有3%的學(xué)生學(xué)習(xí)天數(shù)在43天以下。這說(shuō)明大部分的學(xué)生(75%)能投入必要的學(xué)習(xí)時(shí)間開展在線學(xué)習(xí)。
3) 影響學(xué)生登錄天數(shù)的影響因素分析
按照性別分組對(duì)學(xué)生的登錄天數(shù)作差異檢驗(yàn),采用獨(dú)立樣本t檢驗(yàn)方法,結(jié)果發(fā)現(xiàn)不同性別學(xué)生之間的登錄天數(shù)存在顯著差異。具體數(shù)據(jù)如表3所示??梢娕牡卿浱鞌?shù)明顯高于男生。
按照專業(yè)層次(軟件工程、網(wǎng)絡(luò)工程、計(jì)算機(jī)科學(xué)與技術(shù)、信息管理、重修)分組對(duì)學(xué)生的登錄天數(shù)作差異分析,結(jié)果發(fā)現(xiàn)不同專業(yè)層次的學(xué)生之間的登錄天數(shù)存在顯著差異。具體數(shù)據(jù)如表4所示??梢姟败浖こ獭薄熬W(wǎng)絡(luò)工程”和“計(jì)算機(jī)科學(xué)與技術(shù)”三個(gè)專業(yè)的學(xué)生在“登錄天數(shù)”方面不存在顯著差異。“信息管理”專業(yè)學(xué)生的登錄天數(shù)是最多的,而“重修”的學(xué)生的登錄天數(shù)是最少的。
表3 不同性別學(xué)生的登錄天數(shù)統(tǒng)計(jì)
表4 不同專業(yè)層次學(xué)生的登錄天數(shù)統(tǒng)計(jì)
4) 使用決策樹對(duì)影響因素進(jìn)行綜合分析
綜合考察上述3種因素對(duì)登錄天數(shù)的影響。由于登錄天數(shù)為連續(xù)值,為了算法運(yùn)算的需要轉(zhuǎn)換為離散值,離散結(jié)果如表5所示。
表5 登錄天數(shù)連續(xù)變量離散化情況
利用數(shù)據(jù)挖掘中的分類方法進(jìn)行教育數(shù)據(jù)挖掘研究已經(jīng)成為當(dāng)前教育決策中的必要手段和有效方法,在前期工作中也進(jìn)行過類似的研究[8-10]。本文采用數(shù)據(jù)挖掘分類決策樹算法,構(gòu)建挖掘結(jié)構(gòu)和挖掘模型,以專業(yè)層次、性別等變量為輸入值,以“登錄天數(shù)”為預(yù)測(cè)值,得到如圖2所示的決策樹。
圖2 用于預(yù)測(cè)登錄天數(shù)的決策樹
由圖2可知,每個(gè)方框旁邊的圓餅圖的淺色部分表示“登錄天數(shù)”“不少于61天”的學(xué)生比例,深色部分表示“登錄天數(shù)”“少于61天”的學(xué)生比例。據(jù)此可以快速了解不同登錄天數(shù)的學(xué)生特征,并在面對(duì)新樣本時(shí),對(duì)他們的登錄天數(shù)多寡作出預(yù)測(cè)。其中,傾向于“登錄天數(shù)”“不少于61天”的學(xué)生有“專業(yè)層次=軟件工程”“專業(yè)層次=網(wǎng)絡(luò)工程”“專業(yè)層次=計(jì)算機(jī)科學(xué)與技術(shù)”“專業(yè)層次=信息管理”4個(gè)群體,傾向于“登錄天數(shù)”“少于61天”的學(xué)生為“專業(yè)層次=重修”一個(gè)群體。其中“專業(yè)層次”和“性別”對(duì)登錄天數(shù)的影響程度是不一樣的,從決策樹節(jié)點(diǎn)的展開順序來(lái)看,“專業(yè)層次”影響最強(qiáng),其次是“性別”。在“軟件工程”和“網(wǎng)絡(luò)工程”2個(gè)專業(yè)層次范圍內(nèi),不同“性別”的學(xué)生之間的“登錄天數(shù)”差異很小;在“計(jì)算機(jī)科學(xué)與技術(shù)”和“信息管理”2個(gè)專業(yè)層次范圍內(nèi),不同“性別”的學(xué)生之間的“登錄天數(shù)”有明顯的差異,其中“計(jì)算機(jī)科學(xué)與技術(shù)”專業(yè)層次范圍內(nèi),性別為“男”的學(xué)生的登錄天數(shù)的比例明顯要低于性別為“女”的學(xué)生,而在“信息管理”專業(yè)層次范圍內(nèi),性別為“男”的學(xué)生的登錄天數(shù)比例明顯要高于性別為“女”的學(xué)生。
本文選擇“數(shù)據(jù)結(jié)構(gòu)”網(wǎng)絡(luò)課程為分析對(duì)象,以2014—2015第1學(xué)期434名學(xué)生學(xué)習(xí)該課程時(shí)所產(chǎn)生的登錄數(shù)據(jù)、資源瀏覽數(shù)據(jù)和形成性測(cè)驗(yàn)數(shù)據(jù)為分析對(duì)象,發(fā)現(xiàn)了基于SPOC平臺(tái)的在線學(xué)習(xí)行為的一些基本特點(diǎn)及影響因素。
從群體角度看,在線學(xué)習(xí)行為在時(shí)間上的分布主要集中在下午時(shí)段和晚上時(shí)段。從個(gè)體角度看,影響學(xué)生在線學(xué)習(xí)時(shí)間投入情況的內(nèi)在因素有性別和專業(yè)層次等,其中女生比男生投入的學(xué)習(xí)時(shí)間多,信息管理的學(xué)生投入時(shí)間比其他專業(yè)投入的學(xué)習(xí)時(shí)間多,重修學(xué)生投入的時(shí)間最短。如何提升學(xué)習(xí)行為分析對(duì)考核方式的導(dǎo)向性和有效度是未來(lái)發(fā)展SPOC在線學(xué)習(xí)的一個(gè)重要命題,同時(shí)如何采用更有效的數(shù)據(jù)挖掘方法進(jìn)行教育數(shù)據(jù)挖掘也是今后研究中非常重要的一個(gè)課題[11-15]。
[ 1 ]謝維奇. 基于“電大在線”遠(yuǎn)程教學(xué)平臺(tái)的Web數(shù)據(jù)挖掘[J]. 教育信息化, 2004(10):56-62.
[ 2 ]宋江春,陳文林.Web使用挖掘及其在遠(yuǎn)程教育教學(xué)支持服務(wù)中的應(yīng)用研究[J]. 中國(guó)遠(yuǎn)程教育, 2005(7):62-64.
[ 3 ]袁明,陳偉杰. 網(wǎng)絡(luò)教育學(xué)習(xí)者在線學(xué)習(xí)行為分析研究[J]. 浙江現(xiàn)代教育技術(shù), 2006,18(4):6-9.
[ 4 ]肖愛平,蔣成鳳. 網(wǎng)絡(luò)學(xué)習(xí)者網(wǎng)上學(xué)習(xí)現(xiàn)狀、影響因素及對(duì)策研究[J]. 開放教育研究, 2009,15(1):75-80.
[ 5 ]邵艷麗,孫麗娜. 基于電子學(xué)檔的在線學(xué)習(xí)行為監(jiān)控[J]. 中國(guó)遠(yuǎn)程教育, 2008(5):38-40.
[ 6 ]楊金來(lái),張翼翔,丁榮濤. 基于網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)的學(xué)習(xí)行為監(jiān)控研究[J]. 計(jì)算機(jī)教育, 2008(11):65-68.
[ 7 ]毛利杰,曹效英. 基于網(wǎng)絡(luò)教學(xué)平臺(tái)的學(xué)習(xí)監(jiān)控功能研究與設(shè)計(jì)[J]. 軟件導(dǎo)刊(教育技術(shù)), 2009(9):79-81.
[ 8 ]孫笑微. 貝葉斯分類技術(shù)在高校教師教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用[J]. 沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014,32(1):98-102.
[ 9 ]孫笑微. 數(shù)據(jù)分類技術(shù)在高校人才識(shí)別系統(tǒng)中的應(yīng)用[J]. 沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2008,26(2):133-136.
[10]陳坤寶. 基于模糊理論的教師教學(xué)質(zhì)量評(píng)價(jià)的研究[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2011,41(6):72-78.
[11]李曉毅,徐兆棣,孫笑微. 貝葉斯網(wǎng)絡(luò)的參數(shù)學(xué)習(xí)研究[J]. 沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào), 2007,38(1):125-128.
[12]SUNXiaowei.AugmentedBANclassifier[C]∥InternationalConferenceonComputationalIntelligenceandSoftwareEngineering, 2009:2113-2117.
[13]孫笑微,趙大宇,李曉毅,等. 用于數(shù)據(jù)挖掘的TAN分類器的研究與應(yīng)用[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2006,16(11):140-142.
[14]孫笑微,李曉毅. 基于Boosting的BAN組合分類器[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2009,39(3):120-125.
[15]RAMONIM,SEBASTIAMIP.Robustbayesclassifiers[J].ArtificialIntelligence, 2001,125(1/2):209-226.
OnlinelearningbehavioranalysisbasedonSPOCplatformlogdataandinfluencingfactors
SUN Xiaowei
(SoftwareCollege,ShenyangNormalUniversity,Shenyang110034,China)
MOOCs,differentfromthetraditionalopenanddistanceeducation,isbasedoncurriculumandteachingtheoryaswellasthedevelopmentofnetworkmobilecommunicationtechnology.Manytopuniversities,suchasHarvardandUCBerkeley,aretryingoutSPOC(SmallPrivateOnlineCourse),amorerefinedcoursethatmixesMOOCswithcampusteaching.Inthispaper,advantageofSPOCforlearner’sonlinelearningbehaviorisanalyzedaswellastheresearchtothenetworkcurriculumbigdata,inordertoimprovethequalityofteachingandthenetworkcurriculumsystem,toimprovethequalityofcampus.SPOCchangestheroleofteachers,andleadstomoreeffectivelearningoutcomes.Finally,itenableslearnerstoexperienceentireanddeeperlearning,raisingthecompletionrate.Asaconclusion,theonlinelearningbehavioranalysisbasedonSPOCwillsignificantlyimprovethedevelopmentofeducationassessmentandlearninganalytics,aswellaseducationquality.Meanwhile,however,thechallengeanddifficultiescannotbeignored.
MOOCs;SPOC;bigdata;learningbehavioranalysis
2016-08-04。
遼寧省教育科學(xué)“十三五”規(guī)劃課題(JG16DB408)。
孫笑微(1980-),女,遼寧本溪人,沈陽(yáng)師范大學(xué)副教授,碩士。
1673-5862(2017)01-0103-05
G
A
10.3969/j.issn.1673-5862.2017.01.020