亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于決策樹的慕課退課預(yù)測(cè)研究

        2021-07-15 02:28:56林佳慧周寶建廈門大學(xué)嘉庚學(xué)院管理學(xué)院
        現(xiàn)代經(jīng)濟(jì)信息 2021年17期
        關(guān)鍵詞:作業(yè)用戶模型

        林佳慧 周寶建 廈門大學(xué)嘉庚學(xué)院管理學(xué)院

        引言

        慕課即大型開放式網(wǎng)絡(luò)課程,是目前最熱門的線上學(xué)習(xí)方式之一。目前全球范圍內(nèi)的MOOC用戶已經(jīng)超過1億,全球有超過900所大學(xué)提供約有11 400個(gè)慕課課程。2020年是特許的一年,一場(chǎng)新冠疫情的來臨,讓所有人的生活都發(fā)生了巨大的變化,為了在這一特殊時(shí)期也可以順利完成教學(xué)任務(wù),開啟了線上代替線下的教學(xué)模式,不少同學(xué)都開啟了“宅”在家中、網(wǎng)絡(luò)上課的模式,一時(shí)間在線教育用戶得到了快速增長(zhǎng)。

        伴隨國(guó)內(nèi)疫情的逐漸好轉(zhuǎn),國(guó)外的疫情狀況得到了強(qiáng)有力的控制,多地已有序組織開學(xué)復(fù)課。疫情之后,紅極一時(shí)的網(wǎng)上在線教育平臺(tái),應(yīng)該怎樣定位自己呢?

        中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心于2020年4月發(fā)布了《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(第45次),報(bào)告統(tǒng)計(jì),截至2020年3月,我國(guó)已注冊(cè)在線教育用戶數(shù)量已達(dá)4.23億,與2019年相比,用戶量增長(zhǎng)了2.22億,在全部網(wǎng)民總量中占比46.8%。

        MOOC (Massive Open Online Courses),本文將稱之為慕課,是教學(xué)模式借助互聯(lián)網(wǎng)發(fā)展的一種新型教學(xué)模式,具有課程免費(fèi)、內(nèi)容豐富、學(xué)習(xí)自由等特點(diǎn)。在過去的六年里,MOOC平臺(tái)不斷涌現(xiàn),國(guó)內(nèi)外著名高校紛紛在慕課在線學(xué)習(xí)平臺(tái)開設(shè)精品課程,越來越多的學(xué)生群體通過慕課在線平臺(tái)學(xué)習(xí)。[1]

        在文獻(xiàn)調(diào)查前期,通過對(duì)慕課研究相關(guān)文獻(xiàn)調(diào)查分析發(fā)現(xiàn),現(xiàn)今對(duì)于慕課在線學(xué)習(xí)平臺(tái)的相關(guān)國(guó)內(nèi)外研究概括起來大概為三個(gè)方面:首先,在分析用戶學(xué)習(xí)行為發(fā)現(xiàn)規(guī)律的基礎(chǔ)上,優(yōu)化慕課在線學(xué)習(xí)平臺(tái)的教學(xué)活動(dòng);[2]其次,采用數(shù)理統(tǒng)計(jì)方法分析學(xué)習(xí)行為繼而對(duì)慕課在線學(xué)習(xí)平臺(tái)現(xiàn)有措施提出意見建議;[3]三是通過建立模型尋找學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系并對(duì)學(xué)習(xí)效果進(jìn)行預(yù)測(cè)。但目前針對(duì)學(xué)習(xí)行為的退課預(yù)測(cè)研究較少,慕課較高的退課率嚴(yán)重影響了其作為在線學(xué)習(xí)平臺(tái)的持續(xù)發(fā)展,本文利用神經(jīng)網(wǎng)絡(luò)、C5.0決策樹、二元Logistic回歸模型對(duì)學(xué)員的退課進(jìn)行預(yù)測(cè),助力慕課在線平臺(tái)的可持續(xù)發(fā)展。

        一、數(shù)據(jù)來源與處理

        本文的數(shù)據(jù)來源主要是“學(xué)堂在線”的MOOC平臺(tái)的2017年5月1日到2018年7月1日的大部分學(xué)習(xí)用戶的選課記錄和學(xué)習(xí)行為記錄。其中包括完成課后作業(yè)、觀看課程視頻、參與課程論壇討論、訪問課程內(nèi)容和訪問課程其它部分內(nèi)容。

        針對(duì)數(shù)據(jù)集當(dāng)中出現(xiàn)的若干問題,進(jìn)行噪音處理。查找不規(guī)則的數(shù)值,例如空白、極端異常數(shù)值。對(duì)空白的數(shù)據(jù)進(jìn)行插補(bǔ)處理,對(duì)極端異常數(shù)值,采取刪除處理。

        二、數(shù)據(jù)描述

        為了更加直觀地了解已經(jīng)獲取的數(shù)據(jù),首先將數(shù)據(jù)區(qū)分為退課者和未退課者兩種類型,并分別觀察他們的各種學(xué)習(xí)行為的平均次數(shù),這五種學(xué)習(xí)行為分別是:完成課后作業(yè)(problem)、觀看課程視頻(video)、訪問課程內(nèi)容(wiki)、參與課程論壇討論(discussion)和訪問課程其他部分(navigation)完成課后作業(yè)。由表1可知,這五種學(xué)習(xí)行為都是未退課者比退課者的次數(shù)更多,說明學(xué)習(xí)行為與用戶是否選擇退課之間具有關(guān)聯(lián)性,利用這五個(gè)因素來進(jìn)行MOOC的退課預(yù)測(cè)是可行的。

        表1 2017—2018年MOOC用戶學(xué)習(xí)行為退課與未退課者平均次數(shù)比較

        三、因子分析

        對(duì)用戶使用慕課學(xué)習(xí)行為的五個(gè)維度數(shù)據(jù)進(jìn)行置信效度分析和因子分析,并對(duì)相關(guān)數(shù)據(jù)進(jìn)行精簡(jiǎn)和降維。

        計(jì)算得到KMO值為0.946,Bartlett值為2445.352,自由度為45,P值為0.000,說明問卷總體效度居于較高且可接受范圍內(nèi),也就是說數(shù)據(jù)適合做因子分析。同時(shí),根據(jù)總方差解釋圖,當(dāng)取到三個(gè)因子的時(shí)候,累計(jì)方差已經(jīng)達(dá)到85.727%>85%,可以認(rèn)為該解釋程度已經(jīng)達(dá)到所需的標(biāo)準(zhǔn),參見表2。

        表2 KMO和巴特利特檢驗(yàn)

        綜上所述,將五項(xiàng)測(cè)量指標(biāo)轉(zhuǎn)化為得分均值,以因子載荷為權(quán)重,選擇“最大方差法”,縮減成三個(gè)因子影響程度指數(shù),得到以下成分矩陣:

        表3 旋轉(zhuǎn)后的因子成分矩陣

        四、慕課退課行為預(yù)測(cè)研究

        為了探究利用慕課學(xué)習(xí)因素的重要程度,在了解用戶日后是否繼續(xù)上課的基礎(chǔ)上,對(duì)其進(jìn)行分析??紤]到用戶是否愿意繼續(xù)上課是一個(gè)定性二分變量,如果直接套用回歸方程模型,則可能出現(xiàn)許多不嚴(yán)謹(jǐn)?shù)慕Y(jié)論。通過線性回歸分析,可以使得對(duì)P值的回歸預(yù)測(cè)具有實(shí)際意義。為確保模型的準(zhǔn)確率,使用神經(jīng)網(wǎng)絡(luò)、C5.0決策樹、二元Logistic回歸三個(gè)模型對(duì)預(yù)測(cè)正確率進(jìn)行比較,從而挑選出預(yù)測(cè)率最高的模型,對(duì)其因素的重要程度進(jìn)行分析。利用SPSSModeler軟件進(jìn)行分析,分析方法如下圖所示。

        圖1 模型比較方法

        (一)神經(jīng)網(wǎng)絡(luò)法

        BP神經(jīng)網(wǎng)絡(luò)模型主要由三層組成,分別是輸入層、隱藏層及輸出層。隨著網(wǎng)絡(luò)層次的增加,會(huì)降低誤差,加強(qiáng)網(wǎng)絡(luò)的表現(xiàn)力,但網(wǎng)絡(luò)結(jié)構(gòu)的龐大也會(huì)增加訓(xùn)練的時(shí)長(zhǎng)。一般情況下,三個(gè)層級(jí)的神經(jīng)網(wǎng)絡(luò)模型能夠獲得較好的結(jié)果。

        對(duì)于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及測(cè)試同樣將進(jìn)行因子分析篩選以后得到的因子作為分析的樣本。其中選取80%的數(shù)據(jù)部分作為訓(xùn)練基,用來訓(xùn)練模型。另外的20%則作為檢測(cè)基用來對(duì)該模型的樣本進(jìn)行檢測(cè)。

        最后得出各因子的重要程度如表4所示,可以看到,在神經(jīng)網(wǎng)絡(luò)模型中,信息因子相較于其他兩個(gè)因子的重要程度較高,達(dá)到了0.3667。

        表4 神經(jīng)網(wǎng)絡(luò)模型各變量重要度

        (二)C5.0決策樹

        C5.0決策樹是一種經(jīng)典的預(yù)測(cè)模型,是決策樹模型中的經(jīng)典算法。它是一種映射關(guān)系主要針對(duì)于對(duì)象屬性和對(duì)象值,決策樹的分支代表著對(duì)象并且是符合節(jié)點(diǎn)條件的,而葉子節(jié)點(diǎn)則代表則代表對(duì)象所屬的一些預(yù)測(cè)結(jié)果,模型的建立需要特征選擇、決策樹的生成和修剪三個(gè)步驟。[5]

        C5.0算法對(duì)C4.5算法的進(jìn)一步完善,在大數(shù)據(jù)相關(guān)問題處理中C5.0更為合適,而且它能增加強(qiáng)大的Boosting算法提升分類精度。[6]

        圖2 決策樹模型結(jié)果

        在C5.0決策樹模型中,信息因子仍然是重要性最高的變量,達(dá)到了0.39。

        (三)二元線性回歸分析

        對(duì)于Logistic回歸分析,要關(guān)注回歸系數(shù)。一般來說,50%—80%的決定系數(shù)為相當(dāng)高的回歸決定系數(shù)。[4]模型中的回歸系數(shù)達(dá)到了47.2%與64.6%,因而可認(rèn)為該模型的預(yù)測(cè)效果較好。

        表5 回歸系數(shù)

        表6為各個(gè)變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤差、Wald卡方、自由度和P值與OR值。一般來說,P值小于0.05可以認(rèn)為對(duì)因變量有影響??梢钥吹?,三個(gè)因子的顯著性均為0.000,遠(yuǎn)小于0.05,說明三個(gè)因子對(duì)因變量均有顯著影響。同時(shí)根據(jù)B與Exp(B)的數(shù)值來看,信息因子相較于其他兩個(gè)因子來看更為重要一些。其回歸方程為:

        表6 二元Logistic模型各變量重要度

        Logit(P)=0.538+2.125x1+2.086x2+2.041x3

        (四)三個(gè)模型對(duì)比

        如表7所示,神經(jīng)網(wǎng)絡(luò)模型(即$N)的預(yù)測(cè)正確率為83.37%,C5.0決策樹模型(即$C)的預(yù)測(cè)正確率為86.63%,二元Logistic回歸(即$L)的模型正確率為86.14%。由此可以看到,C5.0決策樹模型的預(yù)測(cè)效果相對(duì)來說最好。

        表7 各模型預(yù)測(cè)正確率比較

        由于三個(gè)模型間的差異性較小,因此依舊分別對(duì)三個(gè)變量進(jìn)行分析。

        總的來說,通過三個(gè)模型的分析與對(duì)比可以發(fā)現(xiàn),信息因子相比于其他兩個(gè)因子,對(duì)是否繼續(xù)選課影響更大。

        五、建議

        通過研究用戶使用慕課學(xué)習(xí)時(shí)的五種學(xué)習(xí)行為,利用因子分析將其降維成信息因子,功能因子和社交因子。根據(jù)這個(gè)結(jié)果,采用預(yù)測(cè)模型進(jìn)行預(yù)測(cè),結(jié)果顯示信息因子對(duì)慕課用戶是否退課影響最大。

        經(jīng)過模型數(shù)據(jù)分析發(fā)現(xiàn),三個(gè)因子重,信息因子對(duì)于慕課在線學(xué)習(xí)平臺(tái)用戶的退課行為影響是最大的,從降低慕課在線學(xué)習(xí)平臺(tái)用戶退課行為的角度來看,應(yīng)該重點(diǎn)關(guān)注觀看課程視頻和完成課后作業(yè)這兩種行為??梢园l(fā)現(xiàn),若想完整的完成一門課程的學(xué)習(xí),不僅要觀看課程視頻,還需要完成課后作業(yè),及相關(guān)參考科目的學(xué)習(xí)。為了有效降低課程的退課率,有效完成課程學(xué)習(xí),慕課在線學(xué)習(xí)平臺(tái)可以針對(duì)這對(duì)這兩種學(xué)習(xí)行為重點(diǎn)展開措施,例如針對(duì)一些學(xué)員要開展教學(xué)干預(yù),如學(xué)生觀看課程視頻次數(shù)少,完成作業(yè)次數(shù)不達(dá)標(biāo)等都可以成為干預(yù)對(duì)象。[7]

        當(dāng)教師設(shè)置MOOC課程時(shí),應(yīng)著重考慮視頻的設(shè)置、組織,以及作業(yè)集布置、評(píng)分等環(huán)節(jié)。

        針對(duì)于高校與慕課在線平臺(tái)合作課程的狀況,則可以適當(dāng)建設(shè)相關(guān)制度規(guī)范進(jìn)行干預(yù),例如建立相關(guān)學(xué)生管理誠(chéng)信檔案,對(duì)于有過于頻繁以及惡意退課的同學(xué)進(jìn)行警告處理。

        修改慕課在線學(xué)習(xí)平臺(tái)的評(píng)價(jià)體系,提高觀看課程時(shí)評(píng)以及完成課后作業(yè)行為次數(shù)對(duì)于最終評(píng)價(jià)的影響程度,激勵(lì)更多同學(xué)提高積極學(xué)習(xí)行為,降低退課頻率。

        六、結(jié)語(yǔ)

        對(duì)慕課用戶的五種學(xué)習(xí)行為進(jìn)行因子分析,降維得到信息因子、功能因子和社交因子三個(gè)公共因子。在此基礎(chǔ)上,通過利用神經(jīng)網(wǎng)絡(luò)算法、C5.0決策樹、二元線性回歸模型進(jìn)行模型的建立以及預(yù)測(cè)研究,得到信息因子對(duì)慕課退課行為影響最大。因此,如何提高學(xué)生觀看課程視頻和完成課后作業(yè)的次數(shù),成為慕課改進(jìn)措施的重要切入點(diǎn)。■

        猜你喜歡
        作業(yè)用戶模型
        一半模型
        重要模型『一線三等角』
        快來寫作業(yè)
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        作業(yè)
        故事大王(2016年7期)2016-09-22 17:30:08
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        曰韩少妇内射免费播放| 99RE6在线观看国产精品| 久久狠狠髙潮曰十八女人| 国产一区二区视频免费在| 天堂8在线天堂资源bt| 国产97色在线 | 国产| 激情综合色五月丁香六月亚洲 | 又粗又大又黄又爽的免费视频| 国产精品亚洲综合色区韩国| 黑丝美女喷水在线观看| 亚洲av三级黄色在线观看| 高清偷自拍亚洲精品三区 | 国产午夜毛片v一区二区三区| 色av综合av综合无码网站| 亚洲中文字幕无码不卡电影| 人妻经典中文字幕av| 国产欧美一区二区三区在线看| 国产成人精品无码播放| 香蕉视频免费在线| 久久91精品国产91久久跳舞| 欧美颜射内射中出口爆在线| 亚洲精品无码成人片久久不卡| 欧美性爱一区二区三区无a| 午夜日本理论片最新片| 国产一区二区视频在线免费观看| 国产裸拍裸体视频在线观看| 超碰Av一区=区三区| 亚洲发给我的在线视频| 美国少妇性xxxx另类| 久久亚洲精品ab无码播放| 国产精品久久一区性色a| 一区二区三区在线观看视频精品| 亚洲国产精品无码一线岛国| 久久九九国产精品怡红院| 国产69口爆吞精在线视频喝尿| va精品人妻一区二区三区| 少妇性bbb搡bbb爽爽爽| 婷婷成人亚洲| 日本中文字幕人妻精品| 日韩亚洲欧美久久久www综合| 亚洲成人小说|