亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        MOOC中學(xué)習(xí)者流失問題的預(yù)測分析

        2018-06-21 12:18:30范逸洲劉敏歐陽嘉煜汪瓊
        中國遠(yuǎn)程教育 2018年4期
        關(guān)鍵詞:學(xué)習(xí)分析流失率文獻(xiàn)綜述

        范逸洲 劉敏 歐陽嘉煜 汪瓊

        【摘 要】 MOOC(Massive Open Online Course)的核心屬性之一是“課程”(Course),因此“完成率”或“流失率”始終是其發(fā)展中繞不開的話題。借由完成率問題引發(fā)的一系列深入討論和研究,例如流失問題的預(yù)測分析,取得了豐富的研究成果,對于增進(jìn)我們對MOOC研究的認(rèn)識(shí)和相關(guān)教學(xué)理論的理解都具有積極作用。但由于該領(lǐng)域內(nèi)還缺乏對預(yù)測分析的系統(tǒng)綜述,我們對這個(gè)問題的研究全貌、研究局限以及未來的研究方向并不明晰。因此,本文通過綜述24篇最近五年相關(guān)的高質(zhì)量文獻(xiàn),試圖回答三個(gè)問題:哪些預(yù)測指標(biāo)是有效的?哪些算法模型是相對較好的?不同模型的節(jié)儉性和耐用性如何?通過回答這些問題,本文梳理了有效的預(yù)測指標(biāo)體系,對比了不同算法模型的有效性,并檢驗(yàn)了模型的節(jié)儉性和耐用性;更進(jìn)一步,本文通過討論研究的理性觀、實(shí)踐意義和開展跨領(lǐng)域?qū)υ?,指出了未來研究可能的研究取徑、研究方向和研究重點(diǎn)。

        【關(guān)鍵詞】 慕課;學(xué)習(xí)分析;流失率;預(yù)測分析;文獻(xiàn)綜述

        【中圖分類號(hào)】 G420 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1009-458x(2018)4-0005-10

        一、問題引入

        MOOC(Massive Open Online Course)作為當(dāng)今在線教育研究的熱點(diǎn)之一,其發(fā)展一直伴隨著廣泛的贊譽(yù)和質(zhì)疑,而其中最受關(guān)注的話題之一就是完成率問題。相關(guān)研究發(fā)現(xiàn),絕大多數(shù)MOOC的完成率低于10%(Liyanagunawardena, et al., 2014; Hone & Said, 2016),而平均情況則在5%左右(Yousef, et al., 2014; Jordan, 2014)。在MOOC發(fā)展初期,課程完成率較低一度成為人們不看好MOOC的主要原因。但Ho等人很快指出:MOOC情境下,學(xué)習(xí)者的動(dòng)機(jī)是多樣化的、參與情況是差異化的,課程完成率不應(yīng)該成為衡量課程或者學(xué)習(xí)本身是否有意義的指標(biāo),其對MOOCs課程評估的重要程度可能不像對傳統(tǒng)課程那么關(guān)鍵(Ho, et al., 2014)。

        越來越多的課程開發(fā)者、高校管理者和教育研究者開始理性而客觀地看待MOOC的完成率問題,關(guān)注的重點(diǎn)也從“完成率是多少”轉(zhuǎn)向了“完成率受什么影響”。于是,借由完成率問題,一系列相關(guān)的研究話題被引申出來,如學(xué)習(xí)參與和產(chǎn)出、學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)策略、學(xué)習(xí)過程中的社會(huì)化互動(dòng)等(Gasevic, Kovanovic, Joksimovic, & Siemens, 2014)。而這其中,許多學(xué)者試圖通過分析學(xué)習(xí)者的動(dòng)機(jī)水平、知識(shí)水平、參與水平、互動(dòng)水平等指標(biāo),對學(xué)習(xí)者能否通過課程進(jìn)行預(yù)測,并基于這些預(yù)測開展相關(guān)干預(yù)(Greene, Oswald & Pomerantz, 2015; Wentao Li, etc., 2016; 王雪宇, 等, 2013; 陳云帆, 張銘, 2014; 蔣卓軒, 張巖, 李曉明, 2015)??梢哉f,這些研究已經(jīng)取得了較為豐富的研究成果和積極的實(shí)踐效果。

        為了全面了解MOOC中學(xué)員流失預(yù)測研究方面迄今為止所做的工作,本文對最近幾年圍繞MOOC完成率或流失率的預(yù)測研究進(jìn)行匯總、整理和綜述,試圖回答:哪些預(yù)測指標(biāo)是有效的?哪些算法模型是相對較好的?不同模型的節(jié)儉性和耐用性如何?

        在進(jìn)行綜述分析的過程中,我們發(fā)現(xiàn)圍繞預(yù)測分析的研究大多只關(guān)注算法預(yù)測的準(zhǔn)確性,卻忽視了預(yù)測指標(biāo)背后教學(xué)原理以及教師在實(shí)際教學(xué)中的技術(shù)局限性。因此,在本文的綜述過程中,我們一方面對預(yù)測分析的指標(biāo)和算法進(jìn)行了探討,另一方面我們加強(qiáng)了預(yù)測指標(biāo)的理論分析、預(yù)測模型節(jié)儉性和耐用性的比較,并討論了實(shí)際MOOC環(huán)境中可操作的技術(shù)干預(yù)手段和教學(xué)設(shè)計(jì)方法。這也是本文綜述的主要特點(diǎn)與創(chuàng)新之處。

        二、綜述方法

        本研究以 ERIC 電子期刊數(shù)據(jù)庫和中國知網(wǎng)數(shù)據(jù)庫為基礎(chǔ),采納“慕課”“預(yù)測分析”“預(yù)測指標(biāo)”“流失率”“MOOC\MOOCs”“Prediction”“Predictive analytics”“Predictor”“Dropout”等關(guān)鍵詞,進(jìn)行了系統(tǒng)的中英文檢索。檢索階段共收集52篇相關(guān)文獻(xiàn),這些文獻(xiàn)大多發(fā)表在經(jīng)過同行評議的學(xué)術(shù)期刊和國際學(xué)術(shù)會(huì)議(如Computers in Human Behavior、International Conference on Artificial Intelligence in Education;Learning @ Scale和Learning Analytics & Knowledge Conference),并集中在2013年至2017年這五年間。

        為保證文獻(xiàn)綜述的可靠性,我們對檢索到的文獻(xiàn)進(jìn)行了進(jìn)一步的篩選和梳理。文獻(xiàn)篩選的標(biāo)準(zhǔn)主要依據(jù):課程信息是否清晰,研究設(shè)計(jì)是否嚴(yán)謹(jǐn),研究方法是否規(guī)范,數(shù)據(jù)闡述是否準(zhǔn)確。篩選的步驟:首先,我們剔除了沒有介紹研究所分析的課程對象和數(shù)據(jù)來源的文章,如對數(shù)據(jù)集包含的內(nèi)容描述模糊的研究;其次,我們剔除了預(yù)測對象并不是課程完成率或流失率的文章,如研究的目標(biāo)是預(yù)測學(xué)習(xí)者對某知識(shí)技能掌握情況的文章;再次,我們重點(diǎn)剔除了未能明確說明預(yù)測分析訓(xùn)練集和測試集所使用的數(shù)據(jù)情況的研究,包括數(shù)據(jù)分析的時(shí)間跨度、采納的變量、采納的方法等,如沒有介紹使用前幾周數(shù)據(jù)進(jìn)行預(yù)測的文章很難判斷其預(yù)測能力的實(shí)際意義;最后,我們在討論算法預(yù)測能力的部分剔除了在研究發(fā)現(xiàn)部分只展示預(yù)測準(zhǔn)確率的研究,而不討論F1值和AUC值(評價(jià)模型預(yù)測能力的主要指標(biāo))的研究。剔除這部分研究的原因是由于MOOC本身完成率較低,只報(bào)告準(zhǔn)確率的研究意義不大,如課程實(shí)際流失率為95%,即便盲目預(yù)測全體學(xué)生流失,該預(yù)測的準(zhǔn)確率仍高達(dá)95%(后文將詳細(xì)探討)。

        經(jīng)過上述步驟的文獻(xiàn)篩選,我們最終從檢索到的52篇文獻(xiàn)中選擇了24篇符合要求的文獻(xiàn)進(jìn)入文獻(xiàn)綜述階段。這些文獻(xiàn)對于研究中處理的數(shù)據(jù)有詳細(xì)的介紹,對于采納的預(yù)測指標(biāo)有清晰的闡述,對于使用的不同算法模型有系統(tǒng)的說明,對于預(yù)測結(jié)果的分析也具備有效的比較標(biāo)準(zhǔn)。這些文獻(xiàn)的基本信息經(jīng)匯總?cè)绫?所示。

        表1 文獻(xiàn)基本信息

        [年份 文獻(xiàn)來源 數(shù)量和

        比例 國內(nèi)期刊和會(huì)議 國外期刊和會(huì)議 2013年 Balakrishnan, et al., 2013 1篇

        (4.17%) 2014年 陳云帆, 張銘, 2014 Halawa, et al., 2014; Kolft, et al., 2014; Amnueypornsakul, et al., 2014; Alariohoyos, et al., 2014; Taylor, et al., 2014 6篇

        (25.00%) 2015年 蔣卓軒, 等, 2015 Fei & Yeung, 2015; Brinton & Chiang, 2015; Kennedy, et al., 2015; He, et al., 2015; Boyer & Kalyan, 2015; Greene, et al., 2015; 7篇

        (29.17%) 2016年 Xing, et al., 2016; Li, et al., 2016; Ren, et al., 2016; Liang, et al., 2016; 4篇

        (16.67%) 2017年 王雪宇, 等, 2017 ; 伍杰華, 付慧平, 2017; 盧曉航, 等, 2017 ; 牟智佳, 武法提, 2017 Whitehill, et al., 2017; Nagrecha, et al., 2017 6篇

        (25.00%) 數(shù)量和

        比例 6篇(25.00%) 18篇(75.00%) 100% ]

        我們認(rèn)為這24篇文獻(xiàn)符合本文綜述的篩選標(biāo)準(zhǔn),具有一定的代表性,能夠回答本文關(guān)注的研究問題,同時(shí)契合本綜述的重點(diǎn)關(guān)切。

        三、研究發(fā)現(xiàn)

        (一)哪些預(yù)測指標(biāo)是有效的

        在本文綜述的24篇相關(guān)文獻(xiàn)中,每篇文獻(xiàn)都對使用哪些預(yù)測指標(biāo)開展預(yù)測有著較為具體的描述。從文獻(xiàn)采納的預(yù)測指標(biāo)的個(gè)數(shù)來看,50%的文獻(xiàn)采納了6-10個(gè)預(yù)測指標(biāo),22.22%的文獻(xiàn)使用了5個(gè)及以下指標(biāo),另外有27.78%的文獻(xiàn)使用了11個(gè)及以上預(yù)測指標(biāo)。整體而言,MOOC中預(yù)測學(xué)習(xí)者流失率或完成率的研究,單篇文獻(xiàn)平均使用了10個(gè)預(yù)測指標(biāo)。其中,使用預(yù)測指標(biāo)最少的文獻(xiàn)僅采納了4個(gè)預(yù)測指標(biāo),而使用預(yù)測指標(biāo)最多的文獻(xiàn)則使用了37個(gè)預(yù)測指標(biāo)。

        我們對于所有文獻(xiàn)中采納的預(yù)測指標(biāo),按照傾向性指標(biāo)、人機(jī)交互指標(biāo)和人際交互指標(biāo)三個(gè)維度進(jìn)行梳理和歸納。這一指標(biāo)分類延續(xù)了適應(yīng)性學(xué)習(xí)和以往在線學(xué)習(xí)變量和指標(biāo)分類的模型:傾向性指標(biāo)主要是指學(xué)習(xí)者進(jìn)入MOOC時(shí)自身具備的一些屬性;人機(jī)交互指標(biāo)主要是指學(xué)習(xí)者在MOOC中與學(xué)習(xí)平臺(tái)、課程資料、測驗(yàn)作業(yè)等內(nèi)容發(fā)生交互產(chǎn)生的行為;人際交互指標(biāo)主要是指學(xué)習(xí)者在MOOC的課程論壇或討論版中與其他學(xué)習(xí)者或課程團(tuán)隊(duì)之間的交互行為(范逸洲, 汪瓊, 2018)。

        通過分析這24篇文獻(xiàn)采納指標(biāo)的類型分布,我們發(fā)現(xiàn)絕大多數(shù)被采納的預(yù)測指標(biāo)屬于人機(jī)交互指標(biāo),也就是學(xué)習(xí)者在MOOC中留下的客觀行為數(shù)據(jù),這部分預(yù)測指標(biāo)從數(shù)量上看占全部指標(biāo)的66.67%。其中,最普遍被使用的預(yù)測指標(biāo)是學(xué)習(xí)者“觀看視頻的次數(shù)”,共計(jì)11篇文獻(xiàn)采納了這一指標(biāo)(例如,陳云帆, 張銘, 2014; 伍杰華, 付慧平, 2017),另外還有6篇文獻(xiàn)使用了與視頻觀看相關(guān)的指標(biāo),如“觀看視頻的時(shí)長”“觀看視頻的個(gè)數(shù)”“視頻資源的點(diǎn)擊頻次”“視頻觀看的比例”“下載視頻的數(shù)量”等指標(biāo)(例如,F(xiàn)ei & Yeung, 2015; Brinton & Chiang, 2015)。還有一些文獻(xiàn)加入了觀看行為方面的指標(biāo),如“是否在前一個(gè)單元,存在跳過視頻的情況”“完整看完視頻的比例”“視頻觀看中快進(jìn)的次數(shù)”“回放視頻的個(gè)數(shù)或比例”等指標(biāo)(例如,Halawa, Greene, & Mitchell, 2014; Kloft, Stiehler, Zheng, & Pinkwart, 2014; Brinton & Chiang, 2015)。視頻資源作為MOOC的核心資源,其學(xué)習(xí)的頻次和時(shí)長往往能夠很好地表征學(xué)習(xí)者在課程中的參與程度,而在視頻上表現(xiàn)出的行為也往往可以反映出學(xué)習(xí)者關(guān)于課程的動(dòng)機(jī)或態(tài)度。如有研究認(rèn)為在上一個(gè)學(xué)習(xí)單元中大量跳過視頻或快進(jìn)視頻,可能意味著學(xué)習(xí)者對課程內(nèi)容不感興趣,或認(rèn)為視頻難度不適合自己等(Halawa, Greene, & Mitchell, 2014)。因此,圍繞視頻學(xué)習(xí)行為的相關(guān)指標(biāo),往往可以有效地預(yù)測學(xué)習(xí)者是否會(huì)從課程中流失。

        除了視頻學(xué)習(xí)相關(guān)的行為表現(xiàn)指標(biāo),學(xué)習(xí)者在課程學(xué)習(xí)過程中參加的測驗(yàn)次數(shù)、提交的作業(yè)個(gè)數(shù)、訪問學(xué)習(xí)資源(如Wiki頁面)的次數(shù),以及這些行為頻次所覆蓋的課程跨度,也是預(yù)測學(xué)生流失很有用的指標(biāo)(例如,蔣卓軒, 張巖, 李曉明, 2015; 王雪宇, 鄒剛, 李驍, 2017; Amnueypornsakul, Bhat, & Chinprutthiwong, 2014)。同時(shí),有的文獻(xiàn)指出,在諸多不同種類的頁面瀏覽行為中,“課程進(jìn)度頁訪問次數(shù)”表現(xiàn)出了優(yōu)秀的預(yù)測能力(Balakrishnan & Coetzee, 2013)。也就是說,在MOOC這種高度開放的自主學(xué)習(xí)環(huán)境中,學(xué)習(xí)者是否有意識(shí)地對學(xué)習(xí)進(jìn)度進(jìn)行了解和掌控,能夠很好地預(yù)測其最終的學(xué)習(xí)結(jié)果。

        除了人機(jī)交互指標(biāo),人際交互指標(biāo)也被多篇文獻(xiàn)使用。在MOOC預(yù)測流失率和完成率的研究中,近一半的文獻(xiàn)采納了學(xué)習(xí)者的人際交互指標(biāo),從數(shù)量上占全部指標(biāo)的26.67%。其中,“論壇發(fā)帖次數(shù)”得到了最為廣泛的驗(yàn)證,在全部24篇文獻(xiàn)中有6篇文獻(xiàn)使用了這一預(yù)測指標(biāo),并驗(yàn)證了其對預(yù)測流失率的顯著性影響(例如,F(xiàn)ei & Yeung, 2015; Xing, Stein, & Marcinkowski, 2016; 伍杰華, 付慧平, 2017)。圍繞論壇中的交互行為,有學(xué)者認(rèn)為并非所有MOOC學(xué)員都有意愿在論壇中表露自己的觀點(diǎn),也有大量的學(xué)員屬于論壇中的“潛水者”(Alariohoyos, Perezsanagustin, Delgadokloos, Hugo, & Munozorganero, 2014)。因此,有很多學(xué)者采用“論壇的瀏覽或訪問次數(shù)”這個(gè)更寬泛的指標(biāo)來對學(xué)習(xí)者的學(xué)習(xí)結(jié)果進(jìn)行預(yù)測,這些預(yù)測同樣取得了很好的效果(蔣卓軒, 張巖, 李曉明, 2015;Balakrishnan & Coetzee, 2013;Xing, Stein, & Marcinkowski, 2016)。

        除了論壇訪問次數(shù)和發(fā)帖次數(shù),論壇中反映學(xué)習(xí)者社會(huì)網(wǎng)絡(luò)聯(lián)系的行為指標(biāo)也表現(xiàn)出良好的預(yù)測能力,如在人際交互中的“點(diǎn)贊次數(shù)”“回帖評論數(shù)量”“多回合交互頻次”等(陳云帆, 張銘, 2014; Fei & Yeung, 2015)。同時(shí),有學(xué)者將單個(gè)課程外的數(shù)據(jù)信息引入MOOC的流失率預(yù)測,如社交媒體的使用情況或者其他MOOC中的交互頻次等(王雪宇, 鄒剛, 李驍, 2017)。這往往反映了學(xué)習(xí)者的網(wǎng)絡(luò)學(xué)習(xí)習(xí)慣和使用習(xí)慣,而這些習(xí)慣則可能遷移到MOOC的學(xué)習(xí)中幫助學(xué)習(xí)者更好地完成課程。

        在人機(jī)交互和人際交互這兩大類指標(biāo)之外,也有少量的研究(6.67%)檢驗(yàn)了學(xué)習(xí)者傾向性指標(biāo)對學(xué)習(xí)結(jié)果的預(yù)測。得到檢驗(yàn)的指標(biāo)包括學(xué)習(xí)者的年齡、城市、受教育水平、先驗(yàn)知識(shí)和能力基礎(chǔ)等(Whitehill, et al., 2017; Kennedy, et al., 2015)。雖然這些指標(biāo)在單個(gè)研究中都表現(xiàn)出顯著性,但在MOOC預(yù)測分析這一研究領(lǐng)域內(nèi)還沒有得到其他研究的交叉驗(yàn)證。

        在此,我們基于本文綜述的24篇文獻(xiàn),梳理了MOOC情境下最常被用于預(yù)測課程完成率或流失率的10個(gè)指標(biāo),見表2。

        表2 常用預(yù)測指標(biāo)示例

        [類型 預(yù)測指標(biāo) 參考文獻(xiàn) 傾向性

        指標(biāo) 先驗(yàn)知識(shí) Kennedy, et al., 2015 人機(jī)交互指標(biāo) 視頻觀看的次數(shù) Brinton & Chiang, 2015

        Kloft, et al., 2014

        Halawa, Greene, & Mitchell, 2014

        Balakrishnan & Coetzee, 2013 視頻觀看的時(shí)長 跳過視頻或快進(jìn)視頻次數(shù) 測驗(yàn)或作業(yè)完成個(gè)數(shù) 課程進(jìn)度頁訪問次數(shù) 人際交互指標(biāo) 論壇發(fā)帖次數(shù) 蔣卓軒, 張巖, 李曉明, 2015;

        陳云帆, 張銘, 2014

        王雪宇, 鄒剛, 李驍, 2017

        Fei & Yeung, 2015 論壇訪問次數(shù) 回帖評論或點(diǎn)贊次數(shù) 社交網(wǎng)絡(luò)使用情況 ]

        (二)哪些算法模型是相對較好的

        對于流失率或完成率的預(yù)測分析而言,采用哪些預(yù)測指標(biāo)僅僅是研究的第一步,更重要的是如何組織和使用這些預(yù)測指標(biāo),這就涉及算法模型的問題。通過梳理24篇預(yù)測分析的研究文獻(xiàn),我們發(fā)現(xiàn)不同學(xué)者使用的算法模型是多樣化的,包括決策樹、邏輯回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法。

        這些算法在預(yù)測MOOC學(xué)習(xí)者的流失率時(shí),表現(xiàn)出的有效性存在一定的共性,也存在一定的差異。在對比這些共性和差異之前,我們首先需要討論比較不同研究的標(biāo)準(zhǔn)和條件。

        首先,預(yù)測MOOC學(xué)習(xí)者的流失與否本質(zhì)上是一個(gè)二分類問題(流失或保留),而比較二分類問題預(yù)測模型的有效性,常用的指標(biāo)包括精確率(Precision)、召回率(Recall)、F1 值(F-measure)、ROC(Receiver Operating Characteristic)、AUC(Area Under Curve)等。其中,F(xiàn)1值(6篇文獻(xiàn))和AUC值(14篇文獻(xiàn))是文獻(xiàn)中最常使用的調(diào)和參數(shù),一定程度上避免了上文提及的單純追求精確率而導(dǎo)致的過度擬合問題。在本文的綜述分析中,我們采用了AUC值作為衡量不同研究、不同算法預(yù)測能力的指標(biāo)。

        其次,在比較不同研究和不同算法時(shí)需要明確比較的前提條件,那就是所用數(shù)據(jù)的時(shí)間跨度。一般來說,同一個(gè)算法使用時(shí)間跨度越長的數(shù)據(jù)集開展訓(xùn)練其預(yù)測的準(zhǔn)確性(也就是AUC值)越高,因此我們在比較不同研究和不同算法時(shí)需要在同樣時(shí)間跨度的基礎(chǔ)上進(jìn)行。基于對文獻(xiàn)的整理和分析,大多數(shù)文獻(xiàn)中數(shù)據(jù)集的時(shí)間跨度(以周為單位)集中在3周至6周,而大多數(shù)被研究的MOOC的課程持續(xù)周期則集中在6周至12周。綜合衡量后,本文決定使用“第四周”為時(shí)間點(diǎn)比較不同研究和不同算法的預(yù)測能力。一方面是因?yàn)榈谒闹茏鳛榇蠖鄶?shù)MOOC的期中時(shí)間點(diǎn),具備充分的數(shù)據(jù)基礎(chǔ)開展預(yù)測分析,同時(shí)也具備基于預(yù)測分析開展教學(xué)干預(yù)的時(shí)間條件;另一方面因?yàn)槭怯行┪墨I(xiàn)只匯報(bào)了課程前半段的預(yù)測結(jié)果(如2-3-4周),也有些文獻(xiàn)只匯報(bào)了課程后半段的預(yù)測結(jié)果(如4-5-6周),而本文綜述的大多數(shù)研究都報(bào)告了第四周的預(yù)測結(jié)果。因此,最終在開展比較分析時(shí)我們采納了“第四周”這一時(shí)間節(jié)點(diǎn)的數(shù)據(jù)。

        基于上面所闡述的篩選指標(biāo),我們進(jìn)一步從24篇文獻(xiàn)中選出了“報(bào)告第四周AUC值”的文獻(xiàn)共計(jì)13篇。這些文獻(xiàn)累計(jì)分析了89門MOOC,樣本量超過120萬人次的MOOC學(xué)習(xí)者,使用了四大類算法(包括了決策樹算法、邏輯回歸算法、神經(jīng)網(wǎng)絡(luò)算法和支持向量機(jī)算法;對應(yīng)圖中的DT、LR、NN和SVM)。本綜述比較了這13篇文獻(xiàn)的預(yù)測結(jié)果,從數(shù)據(jù)上體現(xiàn)為22個(gè)AUC值(有些文獻(xiàn)檢驗(yàn)了不止一種算法)的對比情況,而圖1中的箱圖綜合呈現(xiàn)了這一比較結(jié)果。

        圖1 四種常見預(yù)測算法在第四周的預(yù)測能力

        通過圖1可以看出,大多數(shù)算法都表現(xiàn)出了較好的預(yù)測能力,這些算法在第四周預(yù)測學(xué)習(xí)者流失的AUC均值都大于0.75。同時(shí),不同算法之間也并不存在巨大的差異,從AUC均值的角度看決策樹算法(AUC均值0.865)、回歸算法(AUC均值0.84)和神經(jīng)網(wǎng)絡(luò)算法(AUC均值0.82)實(shí)際的預(yù)測能力較為接近。

        從相對有效或相對更好的角度而言,決策樹算法的平均表現(xiàn)最好,多個(gè)研究平均取得的AUC值達(dá)到了0.865,同時(shí)決策樹算法在不同文獻(xiàn)中得出的預(yù)測效果也具備較高的穩(wěn)定性(圖1箱圖中箱體較短,方差較小)。從算法AUC值的平均情況而言,支持向量機(jī)算法則表現(xiàn)出相對較差的預(yù)測能力,低于決策樹算法、回歸算法和神經(jīng)網(wǎng)絡(luò)的算法。

        這樣的綜述分析結(jié)果,同樣得到了其他文獻(xiàn)的支持。例如,在一項(xiàng)基于39門學(xué)堂在線MOOC的預(yù)測分析中,梯度提升決策樹算法和隨機(jī)森林算法優(yōu)于邏輯回歸算法和支持向量機(jī)算法(Liang & Zheng, 2016);在另外兩項(xiàng)基于Edx和Coursera平臺(tái)上的多門MOOC的預(yù)測分析中,長短期記憶神經(jīng)網(wǎng)絡(luò)算法(Fei & Yeung, 2015)和邏輯回歸算法(蔣卓軒, 張巖, 李曉明, 2015)都表現(xiàn)出了優(yōu)于支持向量機(jī)算法的預(yù)測能力。

        值得注意的是,雖然采納不同算法會(huì)影響研究的預(yù)測能力,但是同樣的算法在不同的研究中也表現(xiàn)出了不同的預(yù)測能力。例如,在有的研究中邏輯回歸的算法可以在第四周就取得了0.928的AUC值(He, Bailey, Rubinstein, et al., 2015),但同樣類型的算法卻在其他研究中表現(xiàn)較差,僅在第四周取得了低于0.70的AUC值(Liang & Zheng, 2016;Fei & Yeung, 2015)。

        基于上面的分析和闡述我們發(fā)現(xiàn):首先,不同算法的預(yù)測能力雖然存在一定差異,但整體都可以取得讓人滿意的預(yù)測結(jié)果,特別是獲得普遍認(rèn)可的決策樹算法、回歸算法和神經(jīng)網(wǎng)絡(luò)算法并沒有十分顯著的差異;其次,同樣的算法在不同研究之間可能表現(xiàn)出不同的預(yù)測能力,這啟發(fā)研究者更應(yīng)該從教學(xué)研究的角度,而不僅僅是算法層面來思考問題。研究者更應(yīng)該關(guān)注研究情境和具體的預(yù)測過程,如課程的性質(zhì)如何、學(xué)員群體的特征、采納指標(biāo)的含義等。另外,追求算法最優(yōu)化的努力往往并不能取得實(shí)質(zhì)性的突破,大量致力于優(yōu)化算法的研究往往僅能提高0.01至0.05的AUC值。

        因此,本文認(rèn)為以往研究過分關(guān)注算法層面的比較是片面的,特別是致力于提高算法預(yù)測精確性的努力是比較片面的。我們在關(guān)注預(yù)測精確性的同時(shí),也需要關(guān)注MOOC流失率預(yù)測本身的教學(xué)原理,以及模型的節(jié)儉性和耐用性,而這是本綜述的另外一個(gè)關(guān)注點(diǎn)。

        (三)不同模型的節(jié)儉性和耐用性如何

        一個(gè)優(yōu)秀的預(yù)測模型不僅要具備一定的擬合準(zhǔn)確性(Fitting),還應(yīng)該具備足夠的節(jié)儉性(Frugality)和耐用性(Robust)。準(zhǔn)確性決定了模型的有效性,節(jié)儉性則決定了模型的效率和速度,耐用性則決定了模型的推廣能力和推廣成本。

        計(jì)算模型節(jié)儉性的方式有很多,其中最簡單也是最廣受采納的方法即“計(jì)算模型使用的變量數(shù)量”,在有些研究中也被稱為“線索數(shù)量”。而在MOOC預(yù)測分析中,節(jié)儉性指的就是模型中采納的變量個(gè)數(shù)。通過統(tǒng)計(jì)上述13篇使用了四種常見預(yù)測算法的文獻(xiàn)(某些文獻(xiàn)使用了多種算法)中采納的預(yù)測指標(biāo)個(gè)數(shù),得到了表3。

        表3 四種常見預(yù)測算法的節(jié)儉性

        [算法類型 采納預(yù)測指標(biāo)的平均個(gè)數(shù) 文獻(xiàn)數(shù)量 決策樹 10.75 4篇 邏輯回歸 13.12 5篇 神經(jīng)網(wǎng)絡(luò) 10.82 8篇 支持向量機(jī) 9.60 5篇 ]

        結(jié)合表3的數(shù)據(jù)可以看出,不同算法類型采納的平均指標(biāo)數(shù)量存在一定差異,其中邏輯回歸的方法使用指標(biāo)數(shù)量相對較多,而支持向量機(jī)的方法使用指標(biāo)數(shù)量則相對較少。但總的來說,四種常用的預(yù)測算法都平均需要使用10個(gè)左右的預(yù)測指標(biāo)。

        計(jì)算模型耐用性的方式也有很多,其中最直觀的方式即將某個(gè)在課程數(shù)據(jù)集中優(yōu)化后的模型遷移應(yīng)用到其他課程的數(shù)據(jù)集中,并考察模型預(yù)測的能力差異。在本文綜述和分析的24篇文獻(xiàn)中,僅有4篇文獻(xiàn)開展了模型的耐用性檢驗(yàn)。這些文獻(xiàn)并沒有得出具有可比性的研究結(jié)論,有些文獻(xiàn)中預(yù)測模型的耐用性較差,也有些文獻(xiàn)獲得了較好的耐用性檢驗(yàn)結(jié)果。

        例如,Whitehill等人在一項(xiàng)基于哈佛大學(xué)40門MOOC的研究中指出:基于某些課程訓(xùn)練出的預(yù)測模型,在其他課程中遷移應(yīng)用時(shí)往往難以取得理想的結(jié)果,平均來看會(huì)出現(xiàn)0.1-0.15(AUC值)的差距。這樣的差距在課程早期的預(yù)測中表現(xiàn)得更加明顯,也就是說模型的耐用性較差(Whitehill, Mohan, Seaton, et al., 2017);在陳云帆和張銘的研究中,基于隨機(jī)森林的預(yù)測模型在被遷移應(yīng)用到另外一門課程時(shí)表現(xiàn)出了同樣優(yōu)秀的預(yù)測能力(陳云帆, 張銘, 2015)。因此,依據(jù)目前已有的MOOC預(yù)測分析文獻(xiàn)還很難得出哪些模型或算法具備較好的耐用性,也很難分析哪些因素影響了預(yù)測模型的耐用性。圍繞預(yù)測算法準(zhǔn)確性、節(jié)儉性和耐用性的討論,我們將在下文詳細(xì)論述。

        四、討論與未來研究方向

        上面我們綜述了MOOC研究領(lǐng)域中預(yù)測分析的典型研究,也在梳理預(yù)測指標(biāo)有用性和預(yù)測模型準(zhǔn)確性、節(jié)儉性和耐用性的過程中圍繞具體研究進(jìn)行了討論。下面將圍繞本文的三個(gè)核心觀點(diǎn)展開討論。

        (一)引入新的研究取徑:有限理性的理性觀

        “MOOC領(lǐng)域的預(yù)測分析問題需要最優(yōu)解嗎?”這個(gè)問題值得研究者們進(jìn)行思考。結(jié)合本文的分析可以看出,絕大多數(shù)文獻(xiàn)都致力于發(fā)現(xiàn)預(yù)測準(zhǔn)確性最佳的指標(biāo)、模型和算法,但實(shí)際情況是絕大多數(shù)算法都能達(dá)到讓人基本滿意的結(jié)果(前提是高質(zhì)量的研究)。優(yōu)化算法的努力也并沒有取得跨越式的進(jìn)展,與之相關(guān)的是,隨著采納更多的指標(biāo)、使用更復(fù)雜的算法模型的節(jié)儉性和耐用性在下降。這就從另一個(gè)側(cè)面削弱了預(yù)測分析的價(jià)值,使其成為極少數(shù)數(shù)據(jù)分析專家才能發(fā)言的封閉領(lǐng)域。

        針對這個(gè)問題,赫伯特·西蒙于 20 世紀(jì)50年代提出的“有限理性”觀點(diǎn)值得我們深思(Simon, 1956)。他用一把剪刀來比喻有限理性:剪刀的一個(gè)刀片是現(xiàn)實(shí)中人類的“認(rèn)知局限性”,而另一個(gè)刀片是行為或決策所處的“環(huán)境結(jié)構(gòu)”。過去的預(yù)測研究強(qiáng)調(diào)打破認(rèn)知局限性,僅僅是從數(shù)據(jù)中挖掘有價(jià)值的信息,而忽視MOOC特定的環(huán)境結(jié)構(gòu)。例如,MOOC流失問題的一個(gè)特定屬性就是——只有極少數(shù)的學(xué)習(xí)者(平均5%左右)能真正通過課程,絕大多數(shù)的學(xué)習(xí)者都難以完成課程。而針對這樣特殊的環(huán)境屬性,有限理性提供了適合解決這種情景的工具包,如采納最佳(Take the best model)、快估啟發(fā)式(QuickEst heuristic model)等(吉仁澤, 澤爾騰, 2016),而實(shí)證研究也證明簡單模型并不比復(fù)雜模型差。

        Czerlinski等人在20世紀(jì)90年代開展了一系列有限理性的相關(guān)研究,其研究證明:簡單的有限理性模型往往比復(fù)雜的概率模型更加有效,這些研究包括預(yù)測人口規(guī)模、預(yù)測高中失學(xué)率等(Czerlinski, et al., 1999),模型比較如表4。

        表4 跨越20種環(huán)境的模型對比

        [策略 節(jié)儉性 準(zhǔn)確性(%正確) 擬合 耐用性 最少化 2.2 69 65 采納最佳 2.4 75 71 道斯規(guī)則 7.7 73 69 多元回歸 7.7 77 68 ]

        結(jié)合表4的對比可以看出,做出好的預(yù)測分析或行為決策并不需要仰仗搜集所有可用信息或復(fù)雜的算法,恰恰相反的是僅依靠重要的線索或有限的好線索我們就能夠在多種多樣的研究情境中獲得相當(dāng)不錯(cuò)的預(yù)測結(jié)果。

        至此,MOOC預(yù)測分析的研究中還沒有學(xué)者討論和使用有限理性的分析模型,或?qū)σ酝非笞顑?yōu)化的研究取徑進(jìn)行反思。因此,本文認(rèn)為預(yù)測分析的研究領(lǐng)域首先應(yīng)該拋棄追求最優(yōu)解的慣性思維,引入有限理性的理性觀,并以此指導(dǎo)我們開發(fā)“滿意即可”的預(yù)測模型,而這也應(yīng)該成為未來的研究方向之一。

        (二)轉(zhuǎn)換領(lǐng)域的研究重點(diǎn):從預(yù)測分析到教學(xué)干預(yù)

        既然預(yù)測分析“滿意即可”,那么今后領(lǐng)域的研究重點(diǎn)應(yīng)該是什么?本文的觀點(diǎn)認(rèn)為,應(yīng)該將研究重點(diǎn)由優(yōu)化預(yù)測算法轉(zhuǎn)換到教學(xué)干預(yù)相關(guān)的研究中。

        預(yù)測分析與教學(xué)干預(yù)是學(xué)習(xí)分析中緊密結(jié)合的兩個(gè)步驟,本綜述分析的24篇文獻(xiàn)中有17篇或多或少談到了“干預(yù)”的問題,這些文獻(xiàn)從干預(yù)措施、干預(yù)時(shí)機(jī)和干預(yù)對象三個(gè)角度討論干預(yù)問題。

        關(guān)于干預(yù)措施的問題,本文綜述的文獻(xiàn)大致可以分成兩類:基于教師做干預(yù)和基于機(jī)器做干預(yù)。

        在基于教師做干預(yù)的討論中,以往的文獻(xiàn)一方面討論了預(yù)測分析的研究發(fā)現(xiàn)對教學(xué)的啟示,另一方面討論了教師如何使用預(yù)測分析的結(jié)果做出干預(yù)。有些研究指出教師可以利用具體的教學(xué)設(shè)計(jì)技巧開展干預(yù)、降低流失率,如發(fā)送郵件提醒測驗(yàn)時(shí)間、顯性化課程結(jié)構(gòu)和教學(xué)內(nèi)容間的依賴關(guān)系、設(shè)置靈活的作業(yè)截止時(shí)間、利用不同隨機(jī)方法合理控制測驗(yàn)難度、設(shè)計(jì)獎(jiǎng)勵(lì)機(jī)制鼓勵(lì)學(xué)習(xí)者每周訪問論壇并發(fā)帖、開展有組織的線上線下互動(dòng)等方式,引導(dǎo)、支持和鼓勵(lì)學(xué)習(xí)者形成自己的學(xué)習(xí)路徑,進(jìn)而更好地支持MOOC中多樣化的自主學(xué)習(xí)需求、降低流失率(陳云帆, 張銘, 2014; 伍杰華, 付慧平, 2017; 盧曉航, 等, 2017);有學(xué)者認(rèn)為教師可以從系統(tǒng)化教學(xué)設(shè)計(jì)的思路進(jìn)行課程迭代,他們認(rèn)為教師應(yīng)該有意識(shí)地持續(xù)評估選課學(xué)習(xí)者的知識(shí)儲(chǔ)備、學(xué)習(xí)目標(biāo)、自主學(xué)習(xí)能力等關(guān)鍵因素,并提供多樣化的學(xué)習(xí)路徑、教學(xué)支架和拓展資源(盧曉航, 等, 2017);有學(xué)者認(rèn)為教師在MOOC中開展干預(yù)不應(yīng)該太具體,而更應(yīng)該從根本上思考如何采取措施激勵(lì)學(xué)習(xí)者的動(dòng)機(jī)、增強(qiáng)學(xué)習(xí)者的目標(biāo)感、營造積極的歸屬感等,以開展大規(guī)模的整體干預(yù)(Kizilcec & Halawa, 2015)。

        基于機(jī)器做干預(yù)的取徑則與Kizilcec等人的觀點(diǎn)不同,這些文獻(xiàn)延續(xù)了適應(yīng)性學(xué)習(xí)領(lǐng)域的研究傳統(tǒng),強(qiáng)調(diào)精確、及時(shí)、恰當(dāng)個(gè)性化干預(yù)。秉持這種干預(yù)取徑的學(xué)者討論了多樣化的干預(yù)方法,例如:可以通過識(shí)別學(xué)習(xí)者的知識(shí)基礎(chǔ)和需求自動(dòng)化地從海量信息中確定學(xué)習(xí)者需要的知識(shí)點(diǎn)和其掌握情況,隨后由機(jī)器判斷其是否需要輔導(dǎo)或建議,并個(gè)性化地發(fā)送郵件或推薦資源(蔣卓軒, 等, 2015);可以通過識(shí)別學(xué)習(xí)者是否處于高流失風(fēng)險(xiǎn)的狀態(tài)或趨勢,在MOOC學(xué)習(xí)者未流失之前自動(dòng)化地推送詢問郵件(如為什么降低了活躍度等),并通過這些措施激勵(lì)學(xué)習(xí)者持續(xù)地積極參與課程或鼓勵(lì)學(xué)習(xí)者盡快回到課程繼續(xù)學(xué)習(xí)(Whitehill, et al., 2015)。

        除了如何干預(yù)的問題,何時(shí)進(jìn)行干預(yù)的問題同樣重要。大多數(shù)討論干預(yù)時(shí)機(jī)的文獻(xiàn)都認(rèn)為,盡早地發(fā)現(xiàn)或識(shí)別存在高流失風(fēng)險(xiǎn)的學(xué)習(xí)者是重要的(Ren, et al., 2016),特別是當(dāng)學(xué)習(xí)者仍然在課程中有學(xué)習(xí)行為、但已表現(xiàn)出流失傾向時(shí)干預(yù)是最有效的(Whitehill, et al., 2015)。因此有學(xué)者指出,只有在課程早期的預(yù)測才是具有實(shí)際意義的,以往大量的預(yù)測研究都使用了課程半程以上或全程數(shù)據(jù),這些研究難以真正指導(dǎo)現(xiàn)實(shí)MOOCs中的教學(xué)干預(yù),因?yàn)檎n程后半段時(shí)學(xué)習(xí)者已離開課程很久,實(shí)施干預(yù)也為時(shí)已晚(Halawa, Greene, & Mitchell, 2014)。但也有學(xué)者認(rèn)為,過早干預(yù)可能也會(huì)適得其反,只有在學(xué)習(xí)者真正表現(xiàn)出流失風(fēng)險(xiǎn)時(shí)開始干預(yù)才是有效的。因此,有學(xué)者認(rèn)為“實(shí)時(shí)干預(yù)”或“及時(shí)干預(yù)”對于干預(yù)的效果影響巨大,當(dāng)學(xué)習(xí)者表現(xiàn)出高流失傾向時(shí)立即進(jìn)行干預(yù)會(huì)明顯提高學(xué)習(xí)者繼續(xù)學(xué)習(xí)的可能性(Ren, et al., 2016; Whitehill, et al., 2015),而這往往需要機(jī)器干預(yù)或提供給教師及時(shí)的流失預(yù)測報(bào)告。

        延續(xù)上面的討論,學(xué)者們也討論了對誰采取干預(yù)最恰當(dāng)?shù)膯栴}。有學(xué)者認(rèn)為,以往預(yù)測分析的研究過多地關(guān)注如何識(shí)別有高流失風(fēng)險(xiǎn)的學(xué)習(xí)者,但是忽略了一個(gè)事實(shí),那就是這些學(xué)習(xí)者中的大多數(shù)都不會(huì)因?yàn)楦深A(yù)而回到課程,因?yàn)樗麄冸x開課程的原因是深層次的,如課程難度超出接受范圍、找到了更合適的替代性課程、語言障礙的問題等。因此,預(yù)測分析不僅要識(shí)別哪些是有高流失風(fēng)險(xiǎn)的學(xué)習(xí)者,還應(yīng)該識(shí)別那些可以被干預(yù)措施召回的學(xué)習(xí)者(Robinson, et al., 2016),或者重點(diǎn)識(shí)別那些在干預(yù)措施中受益最大的學(xué)習(xí)者(Whitehill, et al., 2015)。另外,也有學(xué)者認(rèn)為我們不應(yīng)該過度打擾那些被錯(cuò)誤識(shí)別為高流失風(fēng)險(xiǎn)而實(shí)際可以自主繼續(xù)學(xué)習(xí)的學(xué)習(xí)者,解決這一問題的方法之一就是按照流失風(fēng)險(xiǎn)的高低對學(xué)習(xí)者進(jìn)行排序,動(dòng)態(tài)、分批次地實(shí)施干預(yù)(Xing, Stein, & Marcinkowski, 2016),這就對動(dòng)態(tài)的臨時(shí)性預(yù)測模型提出要求,也就是說我們只干預(yù)當(dāng)下時(shí)間點(diǎn)表現(xiàn)出高流失風(fēng)險(xiǎn)的學(xué)習(xí)者。

        圍繞教學(xué)干預(yù)的討論可以看出,雖然多數(shù)文獻(xiàn)都提及了教學(xué)干預(yù),但是大多停留在觀點(diǎn)討論和設(shè)想層面,真正基于預(yù)測分析開展教學(xué)干預(yù)的研究較少。另外,考慮MOOC平臺(tái)實(shí)際添加技術(shù)插件的困難性以及大多數(shù)教師難以企及的技術(shù)壁壘,相對于機(jī)器干預(yù)的取徑,本文認(rèn)為教師干預(yù)的取徑具備更大的研究價(jià)值,而在討論教學(xué)干預(yù)問題時(shí)我們應(yīng)該時(shí)刻注意何時(shí)干預(yù)和干預(yù)誰的問題,圍繞這些問題的討論都將成為未來的研究方向。

        (三)超越MOOC的領(lǐng)域?qū)υ挘簛碜詫W(xué)習(xí)分析的啟發(fā)

        MOOC作為學(xué)習(xí)分析這個(gè)大領(lǐng)域中的一個(gè)研究情境,不應(yīng)該只在MOOC相關(guān)研究的小圈子里面進(jìn)行對話,而是應(yīng)該超越MOOC情境,更多地從其他學(xué)習(xí)分析的研究情境中獲得啟發(fā)。

        在學(xué)習(xí)分析領(lǐng)域中,預(yù)測分析作為基礎(chǔ)性的核心問題,在過去十多年的研究中取得了豐富而系統(tǒng)的研究成果。學(xué)習(xí)分析這個(gè)大領(lǐng)域中預(yù)測分析問題的發(fā)現(xiàn),已經(jīng)在以往的一篇文章中進(jìn)行了詳細(xì)的綜述(范逸洲, 汪瓊, 2018)。在這篇綜述中,我們通過系統(tǒng)的文獻(xiàn)檢索和綜述,從預(yù)測指標(biāo)適用的學(xué)習(xí)場所和任務(wù)類型出發(fā)梳理了傾向性指標(biāo)、人機(jī)交互指標(biāo)和人際交互指標(biāo)三種類型的常用預(yù)測指標(biāo)(范逸洲, 汪瓊, 2018)。MOOC中的預(yù)測分析與整個(gè)學(xué)習(xí)分析領(lǐng)域的預(yù)測分析相比,在有些問題上更加聚焦和深入,如具體探討了視頻觀看行為、論壇參與行為等對學(xué)習(xí)結(jié)果的影響。但也有些問題探討得相對較少,如在傾向性指標(biāo)方面學(xué)習(xí)分析領(lǐng)域中備受重視的過往學(xué)習(xí)表現(xiàn)(Bainbridge, et al., 2015)、初始知識(shí)(Alexander, et al., 1988)、技能基礎(chǔ)(Snow, et al., 2003)和學(xué)習(xí)驅(qū)動(dòng)力(Shum, et al., 2012)等概念,在MOOC情境中并沒有得到廣泛的交叉驗(yàn)證,僅有少數(shù)文獻(xiàn)提及了相關(guān)的預(yù)測指標(biāo)。這一方面是由于MOOC學(xué)習(xí)相對于課堂學(xué)習(xí)或傳統(tǒng)在線學(xué)習(xí)的延續(xù)性,學(xué)習(xí)者往往是以課程為單位,而不是以跨學(xué)期或多學(xué)年為線索進(jìn)行學(xué)習(xí)。但也有研究開始嘗試,將學(xué)習(xí)者多門課程的學(xué)習(xí)記錄進(jìn)行關(guān)聯(lián),對某個(gè)特定的課程學(xué)習(xí)進(jìn)行預(yù)測(王雪宇, 鄒剛, 李驍, 2017)。也有研究開始關(guān)注課程伊始的入門測驗(yàn),對于學(xué)習(xí)者學(xué)習(xí)體驗(yàn)和最終學(xué)習(xí)產(chǎn)出的影響(Kennedy, et al., 2015)。但是,如何有效檢驗(yàn)學(xué)習(xí)者知識(shí)基礎(chǔ)與課程的匹配程度?如何為學(xué)習(xí)者提供多樣化的學(xué)習(xí)支架和擴(kuò)展資源?如何激發(fā)或增強(qiáng)學(xué)習(xí)者的學(xué)習(xí)驅(qū)動(dòng)力?這些深層次的問題都還有待未來的研究來解決。

        在人機(jī)交互指標(biāo)方面,目前MOOC的研究大多聚焦在正面的學(xué)習(xí)行為,如觀看視頻、參與論壇、提交作業(yè)等,但是Baker 等人認(rèn)為負(fù)面的學(xué)習(xí)行為對潛在學(xué)習(xí)風(fēng)險(xiǎn)也具備較強(qiáng)的預(yù)測能力 (Baker, et al., 2010)。在MOOC的學(xué)習(xí)過程中,也存在著多種多樣的負(fù)面學(xué)習(xí)行為,如濫用幫助的行為、復(fù)制他人發(fā)帖或作業(yè)的作弊行為、系統(tǒng)性試錯(cuò)的行為或在論壇上尋求答案等行為。這些在Baker等人的研究中稱之為“玩弄系統(tǒng)”(gaming the system)的行為(Baker, et al., 2004),也能夠?qū)W(xué)習(xí)者的最終學(xué)習(xí)結(jié)果和產(chǎn)出起到預(yù)測作用。另外,在學(xué)習(xí)分析領(lǐng)域中普遍關(guān)注學(xué)習(xí)行為模型轉(zhuǎn)變(Turning Track)的情況(Brown, 2012),但這并沒有在MOOC研究中受到普遍的關(guān)注,這就要求我們不僅做時(shí)間點(diǎn)的橫截面研究,也要開展時(shí)間段的時(shí)序研究。通過識(shí)別學(xué)習(xí)行為模式對學(xué)習(xí)者進(jìn)行預(yù)測、聚類,這類分析也應(yīng)成為未來MOOC研究的發(fā)展方向之一。

        而在人際交互指標(biāo)方面,以往的MOOC研究主要關(guān)注了交互的頻次和時(shí)長,但相對較少討論學(xué)習(xí)分析領(lǐng)域中普遍關(guān)注的網(wǎng)絡(luò)鏈接和中心度問題(Dawson, 2010)、社群意識(shí)問題(Gasevic, et al., 2012)、對話模式問題(Ferguson, et al., 2011)。這可能與MOOC論壇的交互更加復(fù)雜、發(fā)帖質(zhì)量差異較大、交互高頻但相對分散等特點(diǎn)有關(guān),但這也同樣為人際交互的相關(guān)研究提供了新的更有價(jià)值的研究情境。本綜述認(rèn)為,MOOC論壇中不同學(xué)習(xí)者扮演了不同的論壇角色,其共同營造的MOOC學(xué)習(xí)生態(tài)可能是未來MOOC研究的方向之一。特別是教師和課程團(tuán)隊(duì)如何在這一生態(tài)中合理地發(fā)揮作用,如何幫助或促進(jìn)這一生態(tài)的形成,都是非常值得研究的問題。當(dāng)然,關(guān)于這些問題的討論也必將引導(dǎo)MOOC領(lǐng)域的研究重點(diǎn)從描述完成率、預(yù)測流失率,進(jìn)一步發(fā)展和轉(zhuǎn)換到嘗試教學(xué)干預(yù)、探討教學(xué)原理以及完善教學(xué)設(shè)計(jì)上。

        五、總結(jié)

        總的來說,本文認(rèn)為MOOC的完成率問題始終會(huì)是MOOC領(lǐng)域的基礎(chǔ)問題和重點(diǎn)問題,而圍繞這一問題的預(yù)測分析和教學(xué)干預(yù)也始終是重要的研究方向。因?yàn)镸OOC的核心屬性是課程(Course),而MOOC的課程屬性決定了“完成課程”始終是繞不開的話題。

        當(dāng)然,我們認(rèn)同很多學(xué)者的觀點(diǎn):MOOC學(xué)習(xí)者秉持著多種多樣的動(dòng)機(jī)、需求和目標(biāo),有些學(xué)習(xí)者可能并不是為了“學(xué)完課程”而來。但正如文章開篇時(shí)闡述的那樣,借由完成率問題引發(fā)的一系列深入討論將豐富我們對MOOC學(xué)習(xí)的認(rèn)識(shí),增進(jìn)我們對大規(guī)模課程教學(xué)設(shè)計(jì)的理解,補(bǔ)足以往研究和學(xué)習(xí)理論的不足。最終這些研究和討論,都會(huì)幫助我們更好地服務(wù)學(xué)習(xí)者,并促進(jìn)教學(xué)研究領(lǐng)域的長足發(fā)展,這也是本綜述的意義和價(jià)值所在。

        [參考文獻(xiàn)]

        陳云帆,張銘. 2014. MOOC課程學(xué)生流失現(xiàn)象分析與預(yù)警[J]. 工業(yè)和信息化教育(9):30-36.

        范逸洲,汪瓊. 2018. 學(xué)業(yè)成就與學(xué)業(yè)風(fēng)險(xiǎn)的預(yù)測——基于學(xué)習(xí)分析領(lǐng)域中預(yù)測指標(biāo)的文獻(xiàn)綜述[J]. 中國遠(yuǎn)程教育(1):5-15.

        吉仁澤,澤爾騰. 2016. 有限理性:適應(yīng)性工具箱[M]. 北京:清華大學(xué)出版社.

        蔣卓軒,張巖,李曉明. 2015. 基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測[J]. 計(jì)算機(jī)研究與發(fā)展,52(3):614-628.

        盧曉航,王勝清,黃俊杰,等. 2017. 一種基于滑動(dòng)窗口模型的MOOCs輟學(xué)率預(yù)測方法[J]. 現(xiàn)代圖書情報(bào)技術(shù),1(4):67-75.

        牟智佳,武法提. 2017. MOOC學(xué)習(xí)結(jié)果預(yù)測指標(biāo)探索與學(xué)習(xí)群體特征分析[J]. 現(xiàn)代遠(yuǎn)程教育研究(3):58-66.

        王雪宇,鄒剛,李驍. 2017. 基于MOOC數(shù)據(jù)的學(xué)習(xí)者輟課預(yù)測研究[J]. 現(xiàn)代教育技術(shù),27(6):94-100.

        伍杰華,付慧平. 2017. MOOC學(xué)習(xí)行為的統(tǒng)計(jì)、預(yù)測與展望[J]. 工業(yè)和信息化教育(2):81-89.

        Alexander, Particia A, Judy, et al. (1988). The Interaction of Domain-Specific and Strategic Knowledge in Academic Performance. Review of Educational Research, (58):375-404.

        Amnueypornsakul B, Bhat S, Chinprutthiwong P. (2014). Predicting Attrition Along the Way: The UIUC Model. EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in Moocs: 55-59.

        Bainbridge, J., Melitski, J., Zahradnik, A., Eitel J. M. Lauría, Jayaprakash, S., & Baron, J. (2015). Using learning analytics to predict at-risk students in online graduate public affairs and administration education. Journal of Public Affairs Education, 21(2), 247-262.

        Baker R S J D, D'Mello S K, Rodrigo M M T, et al. (2010). Better to be frustrated than bored: The incidence, persistence, and impact of learners' cognitive-affective states during interactions with three different computer-based learning environments. International Journal of Human-Computer Studies, 68(4):223-241.

        Baker R S, Corbett A T, Koedinger K R. (2004). Detecting Student Misuse of Intelligent Tutoring Systems. International Conference on Intelligent Tutoring Systems: 531-540.

        Balakrishnan, G., & Coetzee, D. (2014). Predicting student retention in massive open online courses using hidden markov models. Technical Report Retrieved May 17, 2013, from http://www.eecs.berkeley.edu/Pubs/TechRpts/2013/EECS-2013-109.html

        Boyer S, Veeramachaneni K. (2015) Transfer Learning for Predictive Models in Massive Open Online Courses(pp.54-63). Artificial Intelligence in Education. Springer International Publishing.

        Brinton C G, Chiang M. (2015). MOOC performance prediction via clickstream data and social learning networks. Computer Communications. IEEE :2299-2307.

        Brown M. (2012). Learning Analytics Moving from Concept to Practice. EDUCAUSE Learning Initiative:EDUCAUSE, 1-5.

        Corrin L, Corrin L, Corrin L, et al. (2015). Predicting success: how learners' prior knowledge, skills and activities predict MOOC performance. International Conference on Learning Analytics and Knowledge. ACM:136-140.

        Czerlinski J, Gigerenzer G, Goldstein D G. (1999). How good are simple heuristics?. Simple Heuristics That Make Us Smart (pp.97-118). Oxford University Press.

        Dawson S. (2010). ‘Seeing the learning community: An exploration of the development of a resource for monitoring online student networking. British Journal of Educational Technology, 41(5):736-752.

        Fei M, Yeung D Y. (2015). Temporal Models for Predicting Student Dropout in Massive Open Online Courses. IEEE International Conference on Data Mining Workshop. IEEE: 256-263.

        Ferguson R, Shum S B. (2011). Learning analytics to identify exploratory dialogue within synchronous text chat. International Conference on Learning Analytics and Knowledge. ACM: 99-103.

        Gasevic D, Jovanovic J, Kai P, et al. (2012). Self-regulated Workplace Learning: A Pedagogical Framework and Semantic Web-based Environment. Journal of Educational Technology & Society, 15(4):75-88.

        Ga?evic D, Kovanovic V, Joksimovic S, et al. (2014). Where Is Research on Massive Open Online Courses Headed? A Data Analysis of the MOOC Research Initiative. International Review of Research in Open & Distance Learning, 15(5):134-176.

        Greene J A, Oswald C A, Pomerantz J. (2015). Predictors of Retention and Achievement in a Massive Open Online Course. American Educational Research Journal, 52(5).

        Halawa, S., Greene, D., & Mitchell, J. (2014). Dropout prediction in MOOCs using learner activity features. EMOOCS: 3-12.

        He J, Bailey J, Rubinstein B I P, et al. (2015). Identifying At-Risk Students in Massive Open Online Courses. AAAI, 1749-1755.

        Ho A D, Reich J, Nesterko S O, et al. (2014) HarvardX and MITx: The First Year of Open Online Courses, Fall 2012-Summer 2013. Retrieved January 21, 2014, from https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2381263

        Hone K S, Said G R E. (2016). Exploring the factors affecting MOOC retention: A survey study. Computers & Education, 98:157-168.

        Jordan K. (2014). Initial Trends in Enrolment and Completion of Massive Open Online Courses. International Review of Research in Open & Distance Learning, 15(1):133-160.

        Kennedy, G., Coffrin, C., et al. (2015). Predicting success: how learners' prior knowledge, skills and activities predict MOOC performance. International Conference on Learning Analytics and Knowledge. ACM: 136-140.

        Kizilcec, R. F., & Halawa, S. (2015). Attrition and achievement gaps in online learning. Learning@ Scale. ACM: 57-66.

        Kloft M, Stiehler F, Zheng Z, et al. (2014). Predicting MOOC Dropout over Weeks Using Machine Learning Methods. EMNLP 2014 Workshop on Analysis of Large Scale Social Interaction in Moocs: 60-65.

        Li W, Gao M, Li H, et al. (2016). Dropout prediction in MOOCs using behavior features and multi-view semi-supervised learning. International Joint Conference on Neural Networks. IEEE: 3130-3137.

        Liang J, Li C, Zheng L. (2016). Machine learning application in MOOCs: Dropout prediction. International Conference on Computer Science & Education. IEEE: 52-58.

        Liyanagunawardena, Tharindu Rekha Adams, Andrew Alexandar Williams, Shirley Ann. (2014). MOOCs: A Systematic Study of the Published Literature 2008-2012. International Review of Research in Open & Distance Learning, 14(3):202-227.

        Nagrecha S, Dillon J Z, Chawla N V. (2017). MOOC Dropout Prediction: Lessons Learned from Making Pipelines Interpretable. International Conference on World Wide Web Companion: 351-359.

        Ren Z, Rangwala H, Johri A. (2016). Predicting Performance on MOOC Assessments using Multi-Regression Models. Retrieved May 8, 2016, from https://arxiv.org/abs/1605.02269

        Robinson C, Yeomans M, Reich J, et al. (2016). Forecasting student achievement in MOOCs with natural language processing. International Conference on Learning Analytics & Knowledge. ACM: 383-387.

        Shum S B, Crick R D. (2012). Learning dispositions and transferable competencies: pedagogy, modelling and learning analytics. International Conference on Learning Analytics & Knowledge: 92-101.

        Simon H A. (1956). ‘Rational Choice and the Structure of Environments. Psychological Review, 63(2):129-138.

        Snow C E, Biancarosa G. (2003). Adolescent Literacy and the Achievement Gap: What Do We Know and Where Do We Go From Here? New York, NY: Carnegie Corporation.

        Taylor C, Veeramachaneni K, O'Reilly U M. (2014). Likely to stop? Predicting Stopout in Massive Open Online Courses. Retrieved August 14, 2014, from https://arxiv.org/abs/1408.3382

        Whitehill J, Mohan K, Seaton D, et al. (2017). MOOC Dropout Prediction: How to Measure Accuracy?. Proceedings of the Fourth ACM Conference on Learning @ Scale. ACM: 161-164.

        Xing W, Chen X, Stein J, et al. (2016). Temporal predication of dropouts in MOOCs: Reaching the low hanging fruit through stacking generalization. Computers in Human Behavior, (58) 119-129.

        Yang D, Sinha T, Adamson D, et al. (2013). "Turn on, Tune in, Drop out": Anticipating student dropouts in Massive Open Online Courses. NIPS Workshop on Data Driven Education.

        Yousef A M F, Chatti M A, Schroeder U, et al. (2014). What Drives a Successful MOOC? An Empirical Examination of Criteria to Assure Design Quality of MOOCs. International Conference on Advanced Learning Technologies. IEEE: 44-48.

        收稿日期:2017-10-24

        定稿日期:2017-12-29

        作者簡介:范逸洲,博士研究生;劉敏,碩士研究生;歐陽嘉煜,碩士研究生;汪瓊,博士,教授,博士生導(dǎo)師。北京大學(xué)教育學(xué)院(100871)。

        責(zé)任編輯 郝 丹

        猜你喜歡
        學(xué)習(xí)分析流失率文獻(xiàn)綜述
        生鮮豬肉肌細(xì)胞內(nèi)外間隙和水分狀態(tài)與持水性的關(guān)系
        壽險(xiǎn)公司個(gè)人代理人流失的對策研究
        商情(2017年10期)2017-04-30 11:07:24
        美國OTT服務(wù)用戶流失率達(dá)19%
        綜藝報(bào)(2017年4期)2017-03-29 09:45:38
        大數(shù)據(jù)思維下教學(xué)過程數(shù)據(jù)分析及應(yīng)用研究
        在線學(xué)習(xí)過程管理大數(shù)據(jù)的建設(shè)與應(yīng)用
        簡析小學(xué)勞動(dòng)與技術(shù)教育的有效合作學(xué)習(xí)
        現(xiàn)金分紅與掏空文獻(xiàn)綜述
        商情(2016年39期)2016-11-21 08:36:08
        馬克思創(chuàng)新思想研究綜述
        淺析大數(shù)據(jù)在教育中的應(yīng)用
        人間(2016年28期)2016-11-10 23:13:41
        Scratch教學(xué)研究綜述 
        成年无码aⅴ片在线观看| 国产不卡视频在线观看 | 国产亚洲精品第一综合另类| 久久久无码中文字幕久...| a级福利毛片| 国产激情视频在线观看你懂的| 日韩av一区二区不卡| 狠狠色噜噜狠狠狠777米奇小说| 国产精品一区二区 尿失禁| AV中文字幕在线视| 久久久人妻一区二区三区蜜桃d | 夜夜爽夜夜叫夜夜高潮| 人妻丰满熟妇av无码区不卡| 一区一级三级在线观看| 91麻豆精品一区二区三区| 白浆国产精品一区二区| 老司机亚洲精品影院| 欧美在线成人午夜网站| 成年女人午夜特黄特色毛片免| 久久精品国产亚洲超碰av| 久久国产精品-国产精品| 国产成人免费高清激情明星| 亚洲一区久久蜜臀av| 亚洲av中文无码乱人伦在线咪咕| 亚洲国产成人va在线观看天堂 | 亚洲国产一区二区三区在线视频| 国产一区二区三区在线av| 色多多性虎精品无码av| 精品无码专区久久久水蜜桃| 成人特黄特色毛片免费看| 狂插美女流出白浆视频在线观看| 欧美人伦禁忌dvd放荡欲情| 91在线在线啪永久地址| 国产一区二区一级黄色片| 久久婷婷国产综合精品| 欧美日本国产va高清cabal| 亚洲黄片久久| 亚洲乱码av乱码国产精品| 日产无人区一线二线三线乱码蘑菇| 国产va精品免费观看| 久久婷婷综合色一区二区|