亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于二元邏輯回歸模型的MOOC退課預(yù)測(cè)

        2017-12-25 18:55:52郭文鋒樊超郭新東
        計(jì)算機(jī)時(shí)代 2017年12期
        關(guān)鍵詞:學(xué)習(xí)行為相關(guān)性分析

        郭文鋒 樊超 郭新東

        摘 要: MOOC(Massive Open Online Courses)作為一種新的教學(xué)模式正發(fā)展得如火如荼,但學(xué)員退課率一直高居不下,直接影響了MOOC教師以及MOOC平臺(tái)的發(fā)展。本研究以“學(xué)堂在線”平臺(tái)學(xué)員的學(xué)習(xí)行為數(shù)據(jù)為基礎(chǔ),對(duì)影響退課的七種學(xué)習(xí)行為進(jìn)行相關(guān)性分析,為了避免多重指標(biāo)帶來的多重共線性問題,根據(jù)相關(guān)性較小的原則選擇其中的五種學(xué)習(xí)行為。最后采用二元邏輯回歸模型進(jìn)行建模并預(yù)測(cè)學(xué)員的退課情況。實(shí)驗(yàn)表明,選取的五種學(xué)習(xí)行為對(duì)退課影響顯著,預(yù)測(cè)準(zhǔn)確率較高。本研究為MOOC教師盡早采取教學(xué)干預(yù)提供了一定的理論依據(jù)。

        關(guān)鍵詞: MOOC; 學(xué)習(xí)行為; 相關(guān)性分析; 二元邏輯回歸; 退課預(yù)測(cè)

        中圖分類號(hào):G434 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2017)12-50-04

        Predicting the MOOC dropout rate with binary logistic regression model

        Guo Wenfeng1, Fan Chao1, Guo Xindong2

        (1. College of Arts and Sciences, Shanxi Agricultural University, Taigu, Taigu 030801, China;

        2. College of Information Science and Engineering, Shanxi Agricultural University)

        Abstract: Although MOOC develops prosperously as a new teaching model, the dropout rate of trainee remains high all the time. This will directly influence the development of MOOC teachers and MOOC platforms. According to the data from xuetangx.com, this study analyzes the correlation of seven learning behaviors affecting dropout. To avoid multicollinearity generated from multiple indicators between seven learning behavior, five of them are selected based on the rule of little correlation. Binary logistic regression model is used to predict the dropout rate. Experiments demonstrate that the selected five learning behaviors have significant influence to the dropout and the accuracy of prediction is higher. The study offers a theoretic basis for MOOC teachers to take teaching intervention as soon as possible.

        Key words: MOOC; learning behavior; correlation analysis; binary logistic regression; dropout prediction

        0 引言

        MOOC(Massive Open Online Courses),大型開放式網(wǎng)絡(luò)課程,簡(jiǎn)稱“慕課”,是近幾年由美國(guó)一些著名大學(xué)發(fā)起的網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)。與傳統(tǒng)的課堂學(xué)習(xí)相比,MOOC具有如下特點(diǎn):①采用各種社交網(wǎng)絡(luò)工具,形式多樣化;②課程的學(xué)習(xí)不受空間和時(shí)間的限制;③課程對(duì)學(xué)員的學(xué)歷沒有任何限制;④更強(qiáng)調(diào)學(xué)員的學(xué)習(xí)自主性。

        目前對(duì)MOOC的研究基本可以歸結(jié)為三類。

        ⑴ 通過分析學(xué)習(xí)行為發(fā)現(xiàn)規(guī)律,改善MOOC教學(xué)活動(dòng)以及評(píng)價(jià)體系。

        Yousef等通過對(duì)在線課程、遠(yuǎn)程課程和MOOC的相關(guān)文獻(xiàn)分析,提出了一套包含75個(gè)評(píng)價(jià)指標(biāo)的MOOC質(zhì)量保障標(biāo)準(zhǔn)[1]。童小素等在借鑒已有評(píng)價(jià)規(guī)范的基礎(chǔ)上,采用文獻(xiàn)調(diào)研法和專家訪談法,建立了一套質(zhì)量評(píng)價(jià)指標(biāo)體系,其中包括3個(gè)一級(jí)指標(biāo)和26個(gè)二級(jí)指標(biāo)[2]。秦瑾若等通過MOOC與傳統(tǒng)網(wǎng)絡(luò)課程教學(xué)活動(dòng)的對(duì)比,提出基于深度學(xué)習(xí)理論的MOOC學(xué)習(xí)活動(dòng)設(shè)計(jì),并將其應(yīng)用于“現(xiàn)代教育技術(shù)”課程中[3]。樊超等從人類動(dòng)力學(xué)的角度對(duì)MOOC在線學(xué)習(xí)行為進(jìn)行分析發(fā)現(xiàn),用戶的選課量和選課人數(shù)存在很大差異,在線學(xué)習(xí)具有陣發(fā)和重尾的特征,以及在線學(xué)習(xí)時(shí)間和次數(shù)服從冪律分布[4]。

        ⑵ 通過對(duì)學(xué)習(xí)行為進(jìn)行統(tǒng)計(jì)分析,進(jìn)而提出整改意見。

        李帥等以東北大學(xué)MOOC平臺(tái)上的《高級(jí)語言課程設(shè)計(jì)》課程為數(shù)據(jù)集,對(duì)學(xué)生的知識(shí)點(diǎn)學(xué)習(xí)情況、在網(wǎng)站上的逗留時(shí)間以及觀看視頻的行為動(dòng)作(快進(jìn)/退、全屏、跳轉(zhuǎn)課程、暫停、滾動(dòng)條滾動(dòng)、文本模塊間跳轉(zhuǎn))進(jìn)行了統(tǒng)計(jì)分析[5]。吳江等分別從選課、退課、課程參與和成績(jī)四個(gè)方面對(duì)愛課程網(wǎng)絡(luò)平臺(tái)上的一門課程的學(xué)習(xí)者行為進(jìn)行統(tǒng)計(jì)分析[6]。王萍等基于edX平臺(tái)的數(shù)據(jù)集,采用統(tǒng)計(jì)分析方法,對(duì)學(xué)習(xí)者類型、特征、行為進(jìn)行分析研究[7]。徐舜平等借鑒數(shù)據(jù)挖掘中的回歸分析方法,對(duì)“學(xué)堂在線”平臺(tái)的一門課程“電路原理”學(xué)習(xí)行為數(shù)據(jù)進(jìn)行研究[8]。

        ⑶ 通過對(duì)學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系進(jìn)行分析,建立模型對(duì)學(xué)習(xí)效果進(jìn)行預(yù)測(cè)。

        蔣卓軒等針對(duì)北京大學(xué)在Coursera上開設(shè)的6門慕課,通過分析學(xué)習(xí)行為特點(diǎn)將學(xué)習(xí)者進(jìn)行分類,并通過學(xué)習(xí)者的若干典型行為特征對(duì)學(xué)習(xí)成果進(jìn)行預(yù)測(cè)[9]。伍杰華等以edX在線學(xué)習(xí)網(wǎng)站上2012-2013年學(xué)生學(xué)習(xí)的信息為基礎(chǔ),對(duì)學(xué)習(xí)者的性別、學(xué)歷、國(guó)籍、課程交互次數(shù)、課程訪問天數(shù)、播放視頻次數(shù)、學(xué)習(xí)章節(jié)數(shù)做了統(tǒng)計(jì)分析,最后采用機(jī)器學(xué)習(xí)的SVM和KNN算法進(jìn)行建模并對(duì)完課率進(jìn)行了預(yù)測(cè)[10]。李曼麗等以“學(xué)堂在線”平臺(tái)的一門課程的學(xué)習(xí)數(shù)據(jù)為基礎(chǔ),采用Tobit和Logit兩個(gè)定量分析模型,分別對(duì)MOOC學(xué)習(xí)者的課程參與和完成情況進(jìn)行深入分析[11]。Jiang, S.等以學(xué)習(xí)者第一周的MOOC完成課后作業(yè)和在線討論為研究對(duì)象,采用邏輯回歸方法預(yù)測(cè)學(xué)習(xí)者獲得證書的概率[12]。

        綜上所述,目前關(guān)于學(xué)習(xí)行為對(duì)退課影響的研究比較少, MOOC較高的退課率嚴(yán)重影響了MOOC的持續(xù)發(fā)展。本文試圖通過分析學(xué)員的七種學(xué)習(xí)行為與退課的關(guān)系,采用二元邏輯回歸模型對(duì)學(xué)員的退課進(jìn)行預(yù)測(cè),為MOOC的教學(xué)改革提供一定的理論依據(jù)。

        1 邏輯回歸模型

        邏輯回歸模型是機(jī)器學(xué)習(xí)中一種重要的分類模型,由于其算法簡(jiǎn)單、高效且容易被推廣而被廣泛應(yīng)用。例如預(yù)測(cè)用戶點(diǎn)擊某商品后是否會(huì)購(gòu)買,預(yù)測(cè)學(xué)生成績(jī)及格與否等。這些都屬于二分類問題。除此之外,邏輯回歸也被推廣至多類的分類問題。本文主要研究MOOC的學(xué)員是否會(huì)退課,故選擇邏輯回歸模型的二元邏輯回歸方法。

        一般地,線性回歸函數(shù)為:y=f(x)=θTX,其中X=(x1,x2,…,xm)T為樣本點(diǎn),θ=(θ1,θ2,…,θm)T為參數(shù)向量。函數(shù)是樣本X的各個(gè)屬性的線性組合,參數(shù)θ表示了X中各個(gè)屬性對(duì)結(jié)果的影響程度。

        二元邏輯回歸模型可以表示為:,其中y∈{0,1},。決策函數(shù)為:。

        為了找到參數(shù)θ,可以采用最大似然估計(jì),即使得最大。

        2 實(shí)例研究

        本文選取“學(xué)堂在線”MOOC平臺(tái)的學(xué)員學(xué)習(xí)記錄(包括選課記錄和行為記錄)為數(shù)據(jù)集,采用二元邏輯回歸模型對(duì)學(xué)員的退課情況進(jìn)行分析,并對(duì)退課進(jìn)行預(yù)測(cè)。

        2.1 MOOC數(shù)據(jù)描述

        “學(xué)堂在線”MOOC平臺(tái)于2013年10月10日正式向全球發(fā)布,是教育部在線教育研究中心的研究交流和成果應(yīng)用平臺(tái)。本文采用的數(shù)據(jù)集為“學(xué)堂在線”為KDD-2015 CUP競(jìng)賽提供的公開數(shù)據(jù)。

        數(shù)據(jù)記錄了2013年10月27日至2014年8月1日“學(xué)堂在線”MOOC平臺(tái)的部分學(xué)員的選課記錄和行為記錄,其中包括112,448名學(xué)員、39門課程、200,905人次選課記錄和13,545,124條行為記錄,且每個(gè)學(xué)員至少選修過一門課程。

        其中,行為記錄包括七種學(xué)習(xí)行為:完成課后作業(yè)(problem)、觀看課程視頻(video)、訪問課程內(nèi)容(access)、訪問課程wiki(wiki)、參與課程論壇討論(discussion)、訪問課程其他部分(navigation)和關(guān)閉網(wǎng)頁(page_close)。為了研究七種不同學(xué)習(xí)行為對(duì)退課的影響,本文對(duì)每個(gè)學(xué)員在整個(gè)學(xué)習(xí)期間的七種學(xué)習(xí)行為分別進(jìn)行匯總,得到每個(gè)學(xué)員每種行為的總次數(shù),分別記為:X1、X2、X3、X4、X5、X6和X7。

        2.2 變量選擇

        首先研究不同學(xué)習(xí)行為與退課(1表示退課,0表示繼續(xù)學(xué)習(xí))的線性相關(guān)性。七種學(xué)習(xí)行為與退課的皮爾遜積矩相關(guān)系數(shù)如表1所示。

        從表1可以看出,七種學(xué)習(xí)行為與退課的相關(guān)系數(shù)都是負(fù)數(shù),即學(xué)習(xí)行為發(fā)生的總次數(shù)越多,退課率越低,與實(shí)際情況相符。按相關(guān)系數(shù)的絕對(duì)值進(jìn)行排序,X4(wiki)和X5(discussion)與退課相關(guān)性最小,說明訪問課程wiki和參與論壇討論對(duì)退課影響較小。

        其次,為了避免變量之間的多重共線性問題,本文對(duì)七種學(xué)習(xí)行為兩兩計(jì)算皮爾遜積矩相關(guān)系數(shù),將相關(guān)系數(shù)≥0.8認(rèn)定為高度相關(guān)的變量,應(yīng)將高度相關(guān)的一對(duì)變量中的一個(gè)予以排除。七種學(xué)習(xí)行為之間的皮爾遜積矩相關(guān)系數(shù)如表2所示。

        從表2可以看出,X2(video)和X3(access)之間的相關(guān)系數(shù)為0.81,因?yàn)橛^看課程視頻可能會(huì)涉及課程內(nèi)容,如觀看課程視頻與閱讀教材相結(jié)合,所以觀看視頻越多,訪問課程內(nèi)容也會(huì)越多。X2(video)和X7(page_close)之間的相關(guān)系數(shù)為0.82,因?yàn)橛^看課程視頻與關(guān)閉網(wǎng)頁高度相關(guān),課程視頻位于一個(gè)網(wǎng)頁上,觀看完視頻會(huì)關(guān)閉網(wǎng)頁,所以觀看視頻越多,關(guān)閉網(wǎng)頁自然越多。

        這里我們排除X3(access)和X7(page_close)這兩個(gè)變量,下一節(jié)我們將選取X1(problem)、X2(video)、X4(wiki)、X5(discussion)和X6(navigation)這五個(gè)變量(學(xué)習(xí)行為)對(duì)退課進(jìn)行建模。

        2.3 預(yù)測(cè)模型建立

        本文采用二元邏輯回歸模型,預(yù)測(cè)MOOC學(xué)員的退課情況。假設(shè)P(P∈[0,1])為學(xué)員的退課率,則(1-P)為不退課率。P/(1-P)為學(xué)員退課的邏輯回歸比,對(duì)其取自然對(duì)數(shù)為ln[P/(1-P)]。

        假設(shè)自變量為Z1(problem)、Z2(video)、Z3(wiki)、Z4(discussion)和Z5(navigation),因變量為P,則邏輯線性回歸方程為:,其中θi(i=0,1,2,3,4,5)為邏輯回歸系數(shù)。則根據(jù)上式可得,學(xué)員退課發(fā)生的概率為:。根據(jù)決策函數(shù)(見1.邏輯回歸模型)可知,當(dāng)P>0.5時(shí),預(yù)測(cè)為學(xué)員退課(結(jié)果為1);否則,預(yù)測(cè)為學(xué)員不退課(結(jié)果為0)。

        2.4 預(yù)測(cè)結(jié)果

        為了評(píng)價(jià)二元邏輯回歸模型對(duì)MOOC退課的預(yù)測(cè)性能,本文采用的評(píng)價(jià)指標(biāo)有準(zhǔn)確率(accuracy)、查準(zhǔn)率(precision)、查全率(recall)、F1和AUC。

        為了計(jì)算指標(biāo)值,本文引入二分類混淆矩陣。即把退課(1)作為正類,不退課(0)作為負(fù)類。則分類結(jié)果的混淆矩陣如表3所示。

        從表4可以看出,盡管MOOC數(shù)據(jù)集存在類別偏斜的情況,即正例與負(fù)例的數(shù)量之比為95581:24961,但accuray仍然達(dá)到了0.84。同時(shí),precision值與recall值比較接近,所以F1值較接近最大值,說明二元邏輯回歸模型較好地對(duì)MOOC的退課情況進(jìn)行了預(yù)測(cè)。

        為了評(píng)價(jià)預(yù)測(cè)模型的泛化能力,本文引入ROC曲線。ROC曲線的橫坐標(biāo)為假正例率、縱坐標(biāo)為真正例率。ROC曲線下面積(AUC)的大小決定了模型的泛化能力,AUC越大說明模型的泛化能力越強(qiáng)。

        從圖1可以看出,實(shí)線即為二元邏輯回歸模型的ROC曲線(AUC=0.78,即陰影區(qū)域面積),虛線為隨機(jī)模型對(duì)應(yīng)的ROC曲線(AUC=0.5,即虛線下方區(qū)域面積)。由于0.78>0.5,說明二元邏輯回歸模型較好地預(yù)測(cè)了實(shí)例。同時(shí)也說明了本文選取的五個(gè)變量(學(xué)習(xí)行為)是比較合適的,它們較好地反映了數(shù)據(jù)集的特征。

        3 總結(jié)與討論

        本文研究七種不同學(xué)習(xí)行為對(duì)退課的影響,通過相關(guān)分析,選擇其中對(duì)退課影響最顯著的五種,然后建立預(yù)測(cè)模型——二元邏輯回歸模型并對(duì)退課情況作出預(yù)測(cè)。在這五種學(xué)習(xí)行為中,①訪問課程的其他部分(navigation)、觀看課程視頻(video)以及完成課后作業(yè)(problem)對(duì)退課影響最大??梢酝茢?,要完整學(xué)完一門課程,除了觀看課程視頻,還要做課后作業(yè),以及參考課程的其他內(nèi)容。為了提高課程的完課率,MOOC平臺(tái)可以針對(duì)觀看視頻次數(shù)少,完成課后作業(yè)少的學(xué)員實(shí)施教學(xué)干預(yù)。②參與課程論壇討論(discussion)對(duì)退課影響較小,原因可能是MOOC平臺(tái)提供的是文字形式的討論方式,不利于有效交流與溝通。為此,MOOC平臺(tái)可以設(shè)置視頻或語音形式的討論模式。

        本文的不足之處是,MOOC數(shù)據(jù)集對(duì)學(xué)員以及課程信息進(jìn)行隱藏,使得本文無法深入理解學(xué)員的不同學(xué)習(xí)行為對(duì)課程退課的影響以及影響程度。今后將選取不同MOOC學(xué)習(xí)平臺(tái)以及多學(xué)科課程數(shù)據(jù)作為研究對(duì)象,探索學(xué)習(xí)行為對(duì)不同學(xué)科課程退課情況的影響,為MOOC教學(xué)干預(yù)提供借鑒和參考。

        參考文獻(xiàn)(References):

        [1] Yousef A M F, Chatti M A, Schroeder U, et al. What Drives

        a Successful MOOC? An Empirical Examination of Criteria to Assure Design Quality of MOOCs[C]// IEEE, International Conference on Advanced Learning Technologies. IEEE,2014:44-48

        [2] 童小素,賈小軍.MOOC質(zhì)量評(píng)價(jià)體系的構(gòu)建探究[J].中國(guó)遠(yuǎn)

        程教育:綜合版,2017.5:63-71

        [3] 秦瑾若,傅鋼善.基于深度學(xué)習(xí)理論的MOOC學(xué)習(xí)活動(dòng)設(shè)計(jì)

        ——以“現(xiàn)代教育技術(shù)”課程為例[J].現(xiàn)代教育技術(shù),2017.5:12-18

        [4] 樊超,宗利永.MOOC在線學(xué)習(xí)行為的人類動(dòng)力學(xué)分析[J].開

        放教育研究,2016.22(2):53-58

        [5] 李帥,張巖峰,于戈等.MOOC平臺(tái)學(xué)習(xí)行為數(shù)據(jù)的采集與分

        析[J].中國(guó)科技論文,2015.20:2373-2376

        [6] 吳江,馬磐昊.MOOC學(xué)習(xí)者行為分析研究——以愛課程平

        臺(tái)的一門慕課為例[J].知識(shí)管理論壇,2015.3.

        [7] 王萍.基于edX開放數(shù)據(jù)的學(xué)習(xí)者學(xué)習(xí)分析[J].現(xiàn)代教育技

        術(shù),2015.25(4):86-93

        [8] 徐舜平,趙慶剛,許健等.基于數(shù)據(jù)挖掘的MOOC學(xué)習(xí)過程監(jiān)

        測(cè)指標(biāo)分析——以“電路原理”課程為例[J]. 現(xiàn)代教育技術(shù),2017.27(3):119-126

        [9] 蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)

        測(cè)[J].計(jì)算機(jī)研究與發(fā)展,2015.52(3):614-628

        [10] 伍杰華,付慧平.MOOC學(xué)習(xí)行為的統(tǒng)計(jì)、預(yù)測(cè)與展望[J].工

        業(yè)和信息化教育,2017.2:81-89

        [11] 李曼麗,徐舜平,孫夢(mèng)嫽.MOOC學(xué)習(xí)者課程學(xué)習(xí)行為分析

        ——以“電路原理”課程為例[J].開放教育研究,2015.21(2):63-69

        [12] Jiang, S., Warschauer, M., & Williams, A. et al.(2014).

        Predicting MOOC Performance with Week 1 Behavior[A]. Proceedings of the 7th International Conference on Educational Data Mining[C].Worcester: Worcester Polytechnic Institute:273-275

        猜你喜歡
        學(xué)習(xí)行為相關(guān)性分析
        大數(shù)據(jù)思維下教學(xué)過程數(shù)據(jù)分析及應(yīng)用研究
        基于學(xué)習(xí)行為數(shù)據(jù)的在線學(xué)習(xí)時(shí)間規(guī)律探析
        人民幣匯率變動(dòng)與中國(guó)入境旅游相關(guān)性分析(2002—2016)
        上市公司財(cái)務(wù)指標(biāo)與股票價(jià)格的相關(guān)性實(shí)證分析
        淘寶星店成長(zhǎng)中的粉絲力量
        中國(guó)城市化與經(jīng)濟(jì)發(fā)展水平關(guān)系研究
        商(2016年33期)2016-11-24 22:04:19
        網(wǎng)絡(luò)遠(yuǎn)程教育學(xué)習(xí)行為及效果的分析研究
        慕課環(huán)境下的學(xué)習(xí)者
        精品无吗国产一区二区三区av| aaa日本高清在线播放免费观看| 强开小婷嫩苞又嫩又紧视频韩国| 帮老师解开蕾丝奶罩吸乳网站| 人妻久久一区二区三区| 免费a级毛片高清在钱| 欧美性受xxxx狂喷水| www插插插无码视频网站| 国产精品久久久久国产a级| 99国产精品无码专区| 久久狠狠髙潮曰十八女人| 加勒比一区二区三区av| 国产高清在线一区二区不卡| 精品综合久久久久久888蜜芽 | 中文字幕av日韩精品一区二区| 国产免费一级高清淫日本片| 亚洲在线一区二区三区四区| 亚洲一区二区av天堂| 无套内射在线无码播放| 私人毛片免费高清影视院| 欧美性猛交xxxx乱大交蜜桃| 最近亚洲精品中文字幕| 天堂av中文在线官网| 国产影片一区二区三区| 美女露内裤扒开腿让男人桶无遮挡| 丁香六月久久婷婷开心| 精品久久久久久久无码| 波多吉野一区二区三区av| 一区二区久久精品66国产精品| 亚洲精品一区二区三区四区久久| 九九在线中文字幕无码| 国产亚洲精品aaaaaaa片| 无码专区久久综合久中文字幕| 99日本亚洲黄色三级高清网站| 96中文字幕一区二区| 内射干少妇亚洲69xxx| 国产精品免费大片| 久久精品国产只有精品96| 日本成人精品一区二区三区| 日韩精品乱码中文字幕| 欧美变态另类刺激|