亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        慕課平臺用戶學(xué)習數(shù)據(jù)的管理與分析

        2019-01-23 03:50:30
        計算機教育 2019年1期
        關(guān)鍵詞:決策樹數(shù)據(jù)挖掘分類

        李 培

        (1.西安郵電大學(xué) 計算機學(xué)院, 陜西 西安 710121;2.西安郵電大學(xué) 陜西省網(wǎng)絡(luò)數(shù)據(jù)智能處理重點實驗室,陜西 西安710121)

        0 引 言

        隨著互聯(lián)網(wǎng)的發(fā)展,借助網(wǎng)絡(luò)來進行教學(xué)的方式已經(jīng)被廣泛地應(yīng)用于各大高校。最具代表性的就是網(wǎng)絡(luò)視頻授課,更多的學(xué)生可以隨時隨地學(xué)習各大高校的課程,從而促進教育水平,提升學(xué)生的能力。雖然網(wǎng)絡(luò)視頻教學(xué)的興起讓老師的教學(xué)方式和學(xué)生的學(xué)習態(tài)度有了極大的改變,但是缺點也同樣存在,例如,學(xué)生所謂的“刷課”凸顯的最主要的問題就是,老師不能確保學(xué)生是否在學(xué)習前觀看視頻,觀看的視頻是否認真等。因此,關(guān)于網(wǎng)絡(luò)視頻教學(xué)的改革和完善是一個值得關(guān)注的問題,而借助實際的網(wǎng)絡(luò)教學(xué)平臺用戶數(shù)據(jù)進行的研究,將是解決這個問題最有利的工具。

        目前使用最多的網(wǎng)絡(luò)教學(xué)平臺為慕課平臺,很多高校為本校的學(xué)生安排了基于慕課平臺的線上學(xué)習課程,并且還將自己學(xué)校的特色專業(yè)課程制成視頻,放到慕課平臺上供其他人學(xué)習。在校學(xué)生比例占了慕課平臺觀看者相當大的比重,學(xué)生用戶的后臺學(xué)習數(shù)據(jù)很大程度上代表了網(wǎng)絡(luò)學(xué)習者的情況。

        之前對慕課平臺上學(xué)習數(shù)據(jù)的分析僅限于一些客觀因素的簡單統(tǒng)計分析,或依靠分析者的主觀判斷,而本文的研究是以學(xué)生用戶在慕課平臺全程的學(xué)習數(shù)據(jù)作為研究對象,借助數(shù)據(jù)挖掘算法,發(fā)現(xiàn)相關(guān)因素之間的聯(lián)系,特別是分析不同因素對最終學(xué)習效果的影響,通過直觀的圖表和專業(yè)的分析,對慕課平臺的課程建設(shè)者和任課教師使用慕課平臺評估設(shè)置規(guī)則提供客觀準確的參考意見[1-3]。

        1 數(shù)據(jù)挖掘算法

        1.1 決策樹算法

        決策樹是通過對數(shù)據(jù)進行處理,找出最優(yōu)分裂點,形成可以供新數(shù)據(jù)集分類預(yù)測的二叉樹,樹中的每一個節(jié)點代表的就是選取研究數(shù)據(jù)集的屬性,分支代表的是符合節(jié)點的數(shù)據(jù)集,所有的葉子節(jié)點都是一類數(shù)據(jù)集合。

        對一個數(shù)據(jù)集進行決策樹的建立,根節(jié)點是整個數(shù)據(jù)集中最具有代表性的屬性,通常依據(jù)根節(jié)點就可以得出非常大的信息量。當決策樹建立成功之后,就可以用類似于樹的遍歷,從根節(jié)點開始,根據(jù)條件進行遍歷,直到葉子節(jié)點,而葉子節(jié)點正是我們所判定的分類結(jié)果。

        決策樹是數(shù)據(jù)挖掘應(yīng)用中容易實現(xiàn),并且可讀性較高的分類工具。在處理數(shù)據(jù)時速度快,這里也包括前期對數(shù)據(jù)的處理,只需要提供可靠的屬性數(shù)據(jù)集即可,免去了去掉空白的或者多余的屬性。并且它的準確率高,在決策樹完成后對數(shù)據(jù)的分類效果明顯,不需要重復(fù)構(gòu)建二叉樹。

        決策樹建立的基本過程如下[4]:①遍歷所有的數(shù)據(jù)集合,將其看作節(jié)點;②對所有的節(jié)點所屬的屬性進行分裂,找出最優(yōu)分裂點;③依據(jù)所選最優(yōu)屬性的條件,繼續(xù)分裂成兩個或者多個節(jié)點;④重復(fù)上述②—③步,直到每個葉子節(jié)點是純集合為止。

        在這個過程中,關(guān)鍵就是最優(yōu)分裂點的選擇問題,在各種屬性里面找出最適合分裂的點,讓分裂后的分支數(shù)據(jù)集合盡可能單一,這個過程中會遇到3種情況:①離散分布,最終生成的是二叉決策樹,使用劃分的子集X來測試;②離散分布,最終生成的是非二叉決策樹,使用分支Y來測試;③屬性的分布是連續(xù)的,則需要確定一個標準Flag進行劃分。

        在最優(yōu)分裂點的選擇中,決策樹是通過對數(shù)據(jù)集的信息量計算,確定信息熵的大小,進一步求得分裂前后的信息增益,從而找出最適合分裂的那一個屬性,此屬性代表了最高的不確定值。只有數(shù)據(jù)純度較高的時候,不均值才會高,此時信息熵最大。在進行過一次分裂后,如果信息熵的差值大,那么說明分裂后的數(shù)據(jù)集的信息量比分裂前的更均勻。

        通過ID3算法對此次實驗數(shù)據(jù)進行處理,可以確定最優(yōu)分裂點的選擇。

        1.2 ID3算法

        ID3算法是實現(xiàn)構(gòu)造決策樹的算法之一,具有速度快、數(shù)學(xué)性強的特點,核心思想是概率。通過對不同分類的數(shù)據(jù)在此集合中出現(xiàn)的概率與分裂后在子集合中出現(xiàn)的概率進行計算,得出信息增益,從而確定最優(yōu)分裂點。

        學(xué)生在觀看完成所有視頻課程之后進行考試的最終學(xué)習效果,除了根據(jù)考試成績衡量之外,其他的屬性也應(yīng)該起到作用。例如,兩個成績相仿的學(xué)生,一個觀看視頻時間長,另一個少,那么客觀地說,觀看視頻時間長的學(xué)生應(yīng)該得到更優(yōu)異的成績。因此,采用決策樹分類的方法對一個學(xué)生觀看視頻學(xué)習的結(jié)果進行分類評價。

        表1是分類標準。

        表1 成績判定

        2 數(shù)據(jù)管理分析系統(tǒng)設(shè)計和實現(xiàn)

        2.1 需求分析

        在學(xué)生看完慕課平臺的課程,完成相應(yīng)的作業(yè)、測驗以及考試之后,學(xué)生的成績都可以在慕課平臺的后臺查詢并且下載。除了用已有的Excel進行數(shù)據(jù)查看外,并沒有其他方法可以對數(shù)據(jù)進行整理分析。此外,因為學(xué)生都是利用業(yè)余的時間觀看視頻,這種學(xué)習方式對于老師評判平時分是十分不利的。

        因此,此次系統(tǒng)為了方便老師的工作,讓老師對學(xué)生觀看視頻后取得的成績有更清晰的認識和了解,提供圖表方式以查看學(xué)生的成績分布、成績趨勢以及學(xué)生之間的成績對比,在對成績進行決策樹分類后,確定平時分的評分標準[5]。

        2.2 關(guān)鍵技術(shù)

        這次主要采用Python機器學(xué)習庫中的Sklearn中的一個功能來進行數(shù)據(jù)挖掘,從而實現(xiàn)決策樹分類。Sklearn是數(shù)據(jù)挖掘中十分有效且方便的工具[6],它封裝了大部分的機器學(xué)習算法,如分類、回歸、聚合,還包括了監(jiān)督學(xué)習、非監(jiān)督學(xué)習、數(shù)據(jù)交換。它的官方API十分周全,上手容易,內(nèi)置大量數(shù)據(jù)集,處理數(shù)據(jù)的效率極高,是在進行數(shù)據(jù)挖掘時首先考慮的工具之一[7]。本次采用了Classi fication的Sklearn.tree決策樹方法,完成對Spoc的分類,對學(xué)生的成績做進一步的評定,系統(tǒng)運行的后臺框架采用的是Python手下的Flask框架[8]。

        考慮到數(shù)據(jù)的拓展性和半結(jié)構(gòu)化特性,采用的數(shù)據(jù)庫是Mongodb為主[9]。Mongodb是將數(shù)據(jù)存儲成文檔的樣子,類似于字典,一個屬性對應(yīng)一條數(shù)據(jù),方便操作。

        2.3 主要功能

        (1)成績統(tǒng)計與分析。對課程的每一次作業(yè)、測驗以及Spoc成績都進行了數(shù)據(jù)統(tǒng)計,計算其平均分和及格率。

        使用柱狀圖查看分數(shù)的分布情況,點擊某一區(qū)間,即可顯示具體的成績和人數(shù),如圖1;在各區(qū)間的具體成績下,點擊左下角導(dǎo)出成績并下載,可以查看此區(qū)間的學(xué)生成績信息。

        圖1 成績分布

        (2)成績權(quán)重。統(tǒng)計一個學(xué)生某課程的所有情況之后,需要對其成績進行權(quán)重的計算。在下拉框可以選擇作業(yè)與測驗各占的比例,進行計算顯示結(jié)果,并可導(dǎo)出。

        (3)數(shù)據(jù)對比。在作業(yè)、測驗和Spoc成績屬性較多的情況下進行數(shù)據(jù)對比,可以清晰地評價學(xué)生觀看視頻的效果,選擇兩位學(xué)生的成績,點擊對比,作業(yè)測驗和Spoc信息的對比情況如圖2所示,可以看到3個類型的顯示結(jié)果。

        (4)學(xué)生信息管理。學(xué)生信息是在導(dǎo)入成績的時候自動添加的,主要顯示的是學(xué)校、姓名和學(xué)號三大信息。也可以進行查詢。

        圖2 信息對比

        點擊操作中的詳情按鈕,顯示的是這個學(xué)生作業(yè)和測驗的折線圖,得分情況和狀態(tài)起伏一目了然。如圖3所示。

        圖3 學(xué)生詳情

        (5)作業(yè)、測驗和Spoc成績管理。作業(yè)、測驗和Spoc成績數(shù)據(jù)都在系統(tǒng)中存在,在搜索框輸入學(xué)號或者姓名,可查看個人成績。

        系統(tǒng)可對各項數(shù)據(jù)進行導(dǎo)入。在錄入的時候,如果時間和課程名與已有信息完全相同,則不予錄入。

        3 數(shù)據(jù)分析

        借助系統(tǒng)中整合的數(shù)據(jù),采用數(shù)據(jù)挖掘算法完成了數(shù)據(jù)的分析。

        1)成績與視頻觀看時長。

        由圖4可知,從視頻觀看學(xué)習的數(shù)據(jù)分析看,并不是觀看視頻時間越長,成績就越高,二者非線性相關(guān)。

        圖4 成績與時長

        2)視頻觀看個數(shù)與次數(shù)。

        從圖5中可以看到,在進行視頻學(xué)習的過程中,沒有一個學(xué)生會進行視頻的重復(fù)觀看,都是一個視頻只看一遍,完全沒有回顧的現(xiàn)象??赡苓@個學(xué)生會在某一段時間頻繁觀看。但是,知識需要不斷地回顧復(fù)習,在這里視頻學(xué)習并不具備有用性。

        圖5 視頻個數(shù)與觀看次數(shù)

        3)視頻觀看個數(shù)與總時長。

        由圖6可知,并非一個學(xué)生看視頻的個數(shù)越多,總時長就越長。有些雖然看的多,但是總時長卻短。說明這些學(xué)生并沒有認真去觀看,有可能他們只找時間短的視頻,盡量完成視頻學(xué)習的任務(wù)而已。

        圖6 視頻個數(shù)與總時長

        4)平均分標準分類。

        圖7是根據(jù)平均分的分類,可以看到,視頻觀看時長是次于成績的關(guān)鍵影響因素。

        圖7 平均分下的決策樹

        5)中位數(shù)標準分類。

        從圖8中可以看到,中位數(shù)是除了是視頻觀看個數(shù)的第二關(guān)鍵影響因素,可以看到,關(guān)于A標準的數(shù)量要少于平均數(shù)。因此,在更嚴格的給分情況下,可以根據(jù)中位數(shù)來評判。

        4 結(jié) 語

        4.1 優(yōu) 勢

        本文從研究學(xué)生觀看慕課平臺視頻的學(xué)習數(shù)據(jù)出發(fā),選取了學(xué)生的課程觀看時長,學(xué)習期間完成的作業(yè)、測驗以及考試等因素進行研究分析。這些數(shù)據(jù)不僅有成績屬性,還有其他如視頻觀看時長等屬性,因此在分析成績之外,還可以對其他屬性進行研究。

        圖8 中位數(shù)下的決策樹

        實驗數(shù)據(jù)來源真實可靠,選取整班學(xué)生全程學(xué)習數(shù)據(jù),對需要研究分析的數(shù)據(jù)點進行列舉,在Spoc數(shù)據(jù)中,完成了視頻觀看時長與Spoc成績的分析、視頻觀看個數(shù)與次數(shù)的分析,最關(guān)鍵的是,進行決策樹分類之后對Spoc學(xué)習的最終成績判定做了研究;在作業(yè)、測驗數(shù)據(jù)中,完成了查看成績分布、導(dǎo)出對應(yīng)數(shù)據(jù)以及成績權(quán)值的計算。此外,還完成了學(xué)生數(shù)據(jù)對比的研究,可以借助對比結(jié)果進行打分。

        研究對象具有針對性,研究方法多樣,可視化效果好,同時用明確的數(shù)據(jù)說明和解決問題。

        4.2 效 果

        從研究分析的結(jié)果來看,最終學(xué)習的效果評判并不能僅看考試成績,而是需要統(tǒng)一參考視頻觀看以及個數(shù)時長。有的學(xué)生雖然看的視頻多,但是并沒有認真學(xué)習內(nèi)容,那么成績肯定不理想。在決策樹分類的結(jié)果中,有中位數(shù)和平均數(shù)的選取差別。新的學(xué)習方式固然有其優(yōu)勢,但是改進仍然是必不可少的。總的來看,要想真正提高成績,還需要提高視頻質(zhì)量,改進視頻觀看體驗,以避免學(xué)生的視頻學(xué)習流于表面形式。

        本論文的研究意在說明如何提高慕課平臺視頻的質(zhì)量,特別是吸引力,同時采用一些技術(shù)手段,保證對視頻觀看的全程監(jiān)控。保證觀看的實際質(zhì)量是提高慕課平臺學(xué)習效果的重要研究要素,當然,對于選取慕課平臺進行教學(xué)改革的任課教師來說,也明確了對線上視頻學(xué)習所應(yīng)做出的必要要求,建議從考核手段等多方面著手,促進視頻觀看效果的提高。

        猜你喜歡
        決策樹數(shù)據(jù)挖掘分類
        分類算一算
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        分類討論求坐標
        決策樹和隨機森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于決策樹的出租車乘客出行目的識別
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        亚洲一区二区三区久久不卡| 国产毛片黄片一区二区三区| 成年女人免费v片| 欧美人与禽2o2o性论交| 先锋影音最新色资源站| 久久久久中文字幕无码少妇| 好看午夜一鲁一鲁一鲁| 亚洲av天堂一区二区| 精品激情成人影院在线播放| 成人毛片av免费| 精品综合久久久久久97超人| 中文字幕无码免费久久9| 白白色发布视频在线播放| 免费人成视频网站在线不卡| 亚洲国产成人av在线观看| 日本乱子人伦在线视频| 亚洲AV无码一区二区一二区色戒 | 日本一区二区三区精品不卡| 穿着白丝啪啪的av网站| 寂寞少妇做spa按摩无码| 久久久久亚洲av无码专区网站| 亚洲精品日本| 亚洲一区域二区域三区域四| 亚洲精品1区2区在线观看| 欧美精品黑人粗大免费| 四虎影院在线观看| 中文字幕亚洲乱亚洲乱妇| 日韩精品极品系列在线免费视频| 国产av无码专区亚洲精品| 国产在线精品成人一区二区三区| 九九九影院| 久久综合久中文字幕青草| 国产色视频一区二区三区不卡 | 深夜爽爽动态图无遮无挡| 免费人成在线观看视频播放| 国产午夜精品久久久久99| 精品中文字幕久久久人妻| 人妻少妇哀求别拔出来| 亚洲第一se情网站| 国产视频最新| 日韩亚洲一区二区三区在线 |