亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)自適應(yīng)DBSCAN的混合式MOOC視頻觀看模式挖掘

        2023-09-18 02:04:28王若賓耿芳東張永梅王偉鋒
        關(guān)鍵詞:課程學(xué)生

        王若賓,耿芳東,張永梅,宋 威,王偉鋒,徐 琳

        (1.北方工業(yè)大學(xué)信息學(xué)院,北京 100144;2.南澳大學(xué)STEM學(xué)院,澳大利亞 阿德萊德 5095)

        1 引言

        近年來(lái),混合式MOOC教學(xué)快速發(fā)展,已經(jīng)進(jìn)入越來(lái)越多的高校課堂。不同于傳統(tǒng)的課堂教學(xué),混合式MOOC可以記錄大部分學(xué)習(xí)行為,為精準(zhǔn)分析提供了數(shù)據(jù)來(lái)源;也不同于純MOOC學(xué)習(xí),學(xué)習(xí)者異質(zhì)化程度高,導(dǎo)致行為模式差異明顯?;旌鲜組OOC學(xué)習(xí)行為模式的差異往往體現(xiàn)為較高同質(zhì)化程度下更為微妙的區(qū)別,而學(xué)習(xí)模式的精準(zhǔn)分類對(duì)于進(jìn)一步理解和把握翻轉(zhuǎn)課堂情境中基于教師指導(dǎo)的自我調(diào)節(jié)學(xué)習(xí)規(guī)律具有重要的啟迪作用。

        在實(shí)際教學(xué)活動(dòng)中,學(xué)生往往會(huì)因?yàn)椴煌囊曨l觀看行為呈現(xiàn)不同的分布,在部分行為上學(xué)生分布趨于集中,而在另外一些行為上卻差異明顯,尤其是對(duì)于一些難度較高、操作性強(qiáng)以及必修課表以外的課程[1]。因此,混合式MOOC教學(xué)情境對(duì)學(xué)習(xí)行為模式挖掘提出了更高的要求。

        聚類分析是數(shù)據(jù)挖掘中一種重要的技術(shù)方法,也是無(wú)監(jiān)督學(xué)習(xí)中一個(gè)重要的研究方向。它能夠把數(shù)據(jù)劃分為若干簇,同一簇間的數(shù)據(jù)具有較高的相似性,不同簇間具有較低相似性,可實(shí)現(xiàn)無(wú)監(jiān)督模式下的合理劃分,進(jìn)而獲得分類后的數(shù)據(jù)聚合形態(tài)。因此,以聚類算法對(duì)混合式MOOC教學(xué)情境下的視頻觀看模式進(jìn)行挖掘具有一定的適用性。其中基于密度的聚類算法因適應(yīng)性好而得到廣泛應(yīng)用,如DBSCAN(Density-Based Spatial Clustering Applications with Noise)[2],具有抗噪聲和可以處理復(fù)雜數(shù)據(jù)等優(yōu)點(diǎn)。然而DBSCAN也存在參數(shù)依賴以及人工參與度高的缺陷。

        基于此,本文提出一種基于k-dist圖斜率的自適應(yīng)DBSCAN算法KSSA-DBSCAN(Self-Adaptive DBSCAN based on K-dist Slope),可以根據(jù)實(shí)際應(yīng)用場(chǎng)景和數(shù)據(jù)集本身的統(tǒng)計(jì)特征自動(dòng)選擇合適的參數(shù)輸入,不僅實(shí)現(xiàn)了在未知聚類數(shù)情況下對(duì)任意形態(tài)的樣本聚類,而且克服了傳統(tǒng)DBSCAN難以確定參數(shù)以及人工參與度高的不足。本文將其應(yīng)用到混合式MOOC視頻觀看模式挖掘中,可以根據(jù)具體的學(xué)生行為和分布特征,自動(dòng)選取合適的參數(shù)輸入,聚類出視頻觀看行為模式不同的學(xué)生,進(jìn)而實(shí)現(xiàn)混合式MOOC教學(xué)情境下學(xué)生視頻觀看行為模式的自動(dòng)挖掘。

        2 相關(guān)工作

        聚類分析算法一般情況下可分為基于劃分的算法(如K-means)、基于層次的算法(如CURE(Clustering Using REpresentative)、BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies))、基于密度的算法(如DBSCAN)、基于網(wǎng)格的算法(如STING(STatistical INformation Grid))以及基于模型的算法(如EM(Expectation Maximization Algorithm))等。其中基于密度的聚類實(shí)際上是找出數(shù)據(jù)集中不同密度區(qū)域的集合,集合中對(duì)象之間平均距離較小的區(qū)域即為高密度區(qū)域,平均距離較大的即為低密度區(qū)域。DBSCAN就是一種傳統(tǒng)的密度聚類算法,其復(fù)雜度低、抗噪性強(qiáng),且不需要提前指定聚類個(gè)數(shù),能夠發(fā)現(xiàn)任意形態(tài)的高密度區(qū)域,但是其對(duì)于參數(shù)的選擇過(guò)于敏感,且需要人工的參與,這一缺陷限制了其在實(shí)際中的應(yīng)用。

        在算法改進(jìn)方面,近年來(lái),陸續(xù)有學(xué)者提出新的改進(jìn)算法。Rodriguez等[3]提出基于快速搜索和發(fā)現(xiàn)密度峰值的聚類算法,但是算法容噪性低并且需要人工參與。Chen等[4]基于新的局部鄰域搜索技術(shù)提出NQ-DBSCAN(Neighbor Query- DBSCAN)算法,減少了大量不必要的距離運(yùn)算,但是未能解決參數(shù)依賴問題。Brown等[5]基于密度網(wǎng)格提出一種快速聚類算法,雖然縮短了運(yùn)行時(shí)間,但是與DBSCAN相比在精度上未有提升。 Chen等[6]針對(duì)大規(guī)模數(shù)據(jù)提出BLOCK- DBSCAN,雖然優(yōu)化了時(shí)間復(fù)雜度,但是仍需要人工的參與。Ohadi等[7]提出基于網(wǎng)格和局部參數(shù)的SW-DBSCAN(Sliding Window DBSCAN)聚類算法,通過(guò)使用動(dòng)態(tài)Eps和MinPts參數(shù)提升了算法性能,但仍需要人工確定初始參數(shù)。Gholizadeh等[8]基于K-means++提出K-DBSCAN算法,縮短了DBSCAN算法執(zhí)行時(shí)間,但忽視了噪聲的影響,并且沒有解決參數(shù)依賴的問題。周紅芳等[9]基于距離分布矩陣提出自適應(yīng)確定參數(shù)的方法,但是其擬合過(guò)程在理論上存在誤差。李文杰等[10]提出KANN-DBSCAN(K-Average Nearest Neighbor-DBSCAN)算法,利用數(shù)據(jù)集自身分布特性生成候選Eps和MinPts參數(shù),并引入Density概念能夠根據(jù)簇?cái)?shù)變化實(shí)現(xiàn)自適應(yīng)確定最優(yōu)參數(shù),但是不適合處理較大規(guī)模數(shù)據(jù)和高維數(shù)據(jù)。綜上所述,盡管有一系列針對(duì)DBSCAN的改進(jìn)研究,但是難以確定參數(shù)以及人工參與度高的缺陷仍然沒有得到有效解決。

        在實(shí)際應(yīng)用方面,丁兆穎等[11]將改進(jìn)的DBSCAN應(yīng)用在碼頭挖掘場(chǎng)景中,利用改進(jìn)的DBSCAN算法聚類出包含碼頭的停泊區(qū)域,并通過(guò)融合了岸基結(jié)構(gòu)物等的空間數(shù)據(jù)對(duì)臨時(shí)停泊區(qū)域進(jìn)行排除,最終實(shí)現(xiàn)了較好的碼頭位置選擇。于彥偉等[12]基于Cell距離分析理論提出簡(jiǎn)單高效的CDBSCAN(Cell-DBSCAN)算法,解決了面向位置大數(shù)據(jù)的聚類問題。李文昊等[13]通過(guò)DBSCAN算法產(chǎn)生的類來(lái)約束層次聚類的聚類空間,并將其應(yīng)用到了代碼包層次重構(gòu)的問題上,對(duì)軟件進(jìn)行了合理劃分。但是,相比工程問題中的應(yīng)用,把DBSCAN算法用于學(xué)習(xí)行為挖掘的研究仍然比較少。

        基于此,本文提出基于k-dist圖斜率的自適應(yīng)DBSCAN算法KSSA-DBSCAN,不僅實(shí)現(xiàn)了在未知聚類數(shù)情況下對(duì)任意形態(tài)的樣本聚類,而且克服了參數(shù)依賴的缺陷,提高了聚類的準(zhǔn)確率,適用于MOOC視頻觀看行為模式的自動(dòng)挖掘。

        3 相關(guān)概念

        3.1 DBSCAN

        密度聚類算法DBSCAN能夠通過(guò)密度差異劃分出高密度區(qū)域,并能有效發(fā)現(xiàn)任意形狀的簇。該算法定義密度為數(shù)據(jù)集中以某給定對(duì)象為圓心、以給定Eps為半徑的空間區(qū)域內(nèi)的對(duì)象個(gè)數(shù)。下面給出DBSCAN算法中一些必要的定義:

        定義1(鄰域Eps) 以給定某對(duì)象為圓心、以Eps為半徑所確定的區(qū)域。

        定義2(密度閾值MinPts) 以給定的某對(duì)象為圓心、以Eps鄰域?yàn)榘霃剿_定的區(qū)域內(nèi)的對(duì)象數(shù)目。

        定義3(核心點(diǎn)) 如果某一對(duì)象在Eps鄰域中至少包含了MinPts個(gè)對(duì)象,則該對(duì)象為核心點(diǎn)。

        定義4(直接密度可達(dá)) 在給定對(duì)象集合里,如果對(duì)象p是一個(gè)核心點(diǎn),q在p的Eps鄰域內(nèi),則稱p到q直接密度可達(dá)。

        定義5(密度可達(dá)) 如果存在對(duì)象鏈P1,P2,P3,…,Pn,P1=p,Pn=q,如果滿足Pi+1是Pi關(guān)于Eps和MinPts直接密度可達(dá),則稱p到q密度可達(dá)。

        定義6(密度相連) 如果在同一對(duì)象集合里,p和q都是關(guān)于Eps和MinPts密度可達(dá)的,則對(duì)象p和對(duì)象q是密度相連的。

        定義7(噪聲點(diǎn)) 對(duì)象p不屬于數(shù)據(jù)集里的任何一個(gè)簇,則p為噪聲點(diǎn)。

        DBSCAN算法基本步驟:

        (1)給定MinPts=4(針對(duì)二維數(shù)據(jù)),采用k-最近鄰算法kNN(k-Nearest Neighbor)生成候選Eps列表,令k=4,求出所有點(diǎn)的第k個(gè)鄰居距離集合distk作為Eps候選值,并進(jìn)行降序排列,畫出此時(shí)的k-dist圖,通過(guò)人工確定k-dist圖的第1個(gè)“拐點(diǎn)”(Valley)確定Eps的值。

        (2)從數(shù)據(jù)集中依次訪問沒有被標(biāo)記為任意簇的核心點(diǎn),再把該核心點(diǎn)與它密度相連的對(duì)象聚類為同一簇。

        (3)重復(fù)步驟(2),直至所有對(duì)象都被訪問。

        3.2 KSSA-DBSCAN基本思想

        由于DBSCAN算法難以確定輸入?yún)?shù),且需要人工的參與,不僅耗費(fèi)人力,而且在準(zhǔn)確率上也難以保證。因此,本文基于k-dist圖斜率的思想提出了一種KSSA-DBSCAN算法,可以根據(jù)實(shí)際應(yīng)用場(chǎng)景和數(shù)據(jù)集本身的統(tǒng)計(jì)特征自動(dòng)選擇合適的參數(shù)輸入。其基本思想如算法1所示,具體實(shí)現(xiàn)流程如圖 1所示。

        算法1KSSA-DBSCAN算法

        輸入:數(shù)據(jù)Data,數(shù)據(jù)大小N。

        輸出:聚類結(jié)果。

        步驟1計(jì)算k值,k=N/25。

        步驟2遍歷數(shù)據(jù),利用kNN計(jì)算每個(gè)樣本點(diǎn)的第k個(gè)鄰居距離并降序排列,作為候選Eps參數(shù)表。

        步驟3根據(jù)降序的候選Eps列表畫出k-dist圖。

        步驟4確定Slope閾值,并根據(jù)Slope閾值確定k-dist圖的第1個(gè)拐點(diǎn)作為最佳Eps參數(shù)。

        步驟5根據(jù)最佳Eps參數(shù)確定初始MinPts參數(shù),并執(zhí)行第1次聚類DBSCAN(Data,最佳Eps,初始MinPts),記錄聚類數(shù),遞減MinPts參數(shù)值分別與最佳Eps聚類迭代,選取聚類數(shù)目第1個(gè)突變點(diǎn)對(duì)應(yīng)的MinPts值為最佳MinPts參數(shù)。

        步驟6DBSCAN(Data,最佳Eps,最佳MinPts)。

        Figure 1 Flow chart of KSSA-DBSCAN

        3.3 確定Eps參數(shù)

        采用k-最近鄰算法kNN生成候選Eps列表,kNN算法的基本思想是使用輸入數(shù)據(jù)找到距離某數(shù)據(jù)點(diǎn)最近的第k個(gè)鄰居(k=1時(shí),即為最近鄰距離)??紤]k值選擇為所有對(duì)象數(shù)目的1/25(即k=N/25,N為對(duì)象總數(shù)量),求出所有點(diǎn)的第k個(gè)鄰居距離集合distk并進(jìn)行降序排列,作為Eps候選值,畫出此時(shí)的k-dist圖,如圖 2所示。

        Figure 2 k-dist graph

        對(duì)于非平滑的曲線,傳統(tǒng)的數(shù)學(xué)方法難以實(shí)現(xiàn)拐點(diǎn)的選擇,然而經(jīng)過(guò)多次實(shí)驗(yàn)驗(yàn)證,可以認(rèn)為連續(xù)多點(diǎn)的坡度小于某一閾值時(shí),則第1個(gè)點(diǎn)可判定為拐點(diǎn)。對(duì)于該閾值的選擇,可以引入Slope參數(shù)概念,定義Slope為k-dist圖中所有相鄰數(shù)據(jù)點(diǎn)的正切值的均值,如式(1)所示:

        (1)

        (2)

        其中,tanαi表示第i點(diǎn)與第i+1點(diǎn)的正切值,N表示數(shù)據(jù)集中對(duì)象總數(shù)。

        由于式中|xi-xi+1|的值始終等于1,因此式(1)和式(2)可以簡(jiǎn)化為:

        (3)

        tanαi=yi-yi+1

        (4)

        對(duì)于小規(guī)模數(shù)據(jù),可以認(rèn)為如果連續(xù)2點(diǎn)的正切值(即tanαi和tanαi+1)均小于閾值Slope,則判定第i點(diǎn)為拐點(diǎn),選取此點(diǎn)對(duì)應(yīng)的y軸Eps值作為最佳Eps參數(shù),如圖 3所示。但是,如果在確定該拐點(diǎn)之前出現(xiàn)了截?cái)帱c(diǎn)(即tanαi=0),則判定此時(shí)該i點(diǎn)對(duì)應(yīng)y值為最佳Eps參數(shù),如圖 4所示。

        Figure 3 Valley Pi

        Figure 4 Cut-off point Pi

        3.4 確定MinPts參數(shù)

        本文通過(guò)數(shù)學(xué)期望法確定初始MinPts參數(shù)。對(duì)于上述方法確定的最佳Eps參數(shù),計(jì)算每一個(gè)對(duì)象在該鄰域中的鄰域?qū)ο髷?shù)量,并計(jì)算其數(shù)學(xué)期望值作為初始參數(shù)MinPts0,如式(5)所示:

        (5)

        其中,N表示數(shù)據(jù)集中對(duì)象的總數(shù),Ti表示i點(diǎn)在鄰域Eps中的鄰域?qū)ο罂倲?shù)。

        此時(shí)由于MinPts0為所有對(duì)象的鄰域內(nèi)對(duì)象數(shù)量的期望,其中包含了噪聲對(duì)象,因此該值對(duì)于簇內(nèi)對(duì)象來(lái)說(shuō)是偏大的,應(yīng)適當(dāng)縮小該值以排除噪聲對(duì)簇內(nèi)對(duì)象的干擾并保持此時(shí)的聚類簇?cái)?shù)穩(wěn)定,由此得到更加穩(wěn)定緊湊的聚類結(jié)果。首先選取最佳Eps參數(shù)和參數(shù)MinPts0進(jìn)行第1次聚類,記錄此時(shí)的聚類簇?cái)?shù)為ClusterNo_mark。遞減MinPts0值并分別與Eps進(jìn)行聚類,生成ClusterNo列表,找出ClusterNo列表中最后一個(gè)等于ClusterNo_mark的數(shù)據(jù)點(diǎn)i(即第1個(gè)突變點(diǎn)),則選取該i點(diǎn)所對(duì)應(yīng)的MinPts列表值為最佳MinPts參數(shù),如圖 5所示,p點(diǎn)即為突變點(diǎn)。

        Figure 5 Clustering number change diagram

        Figure 6 Performance of two algorithms on three 2D data sets

        3.5 性能對(duì)比

        為測(cè)試KSSA-DBSCAN算法的性能,本節(jié)選取UCI(University of California Irvine Machine Learning Repository)的wine、seeds、iris標(biāo)準(zhǔn)數(shù)據(jù)集以及3個(gè)合成數(shù)據(jù)集DS1、DS2和DS3進(jìn)行實(shí)驗(yàn)分析,并與KANN-DBSCAN和DBSCAN算法進(jìn)行了對(duì)比,測(cè)試數(shù)據(jù)集基本屬性如表 1所示。圖 6展示了KSSA-DBSCAN和DBSCAN在DS1、DS2和DS3這3個(gè)二維數(shù)據(jù)集上的聚類結(jié)果,可以看出DBSCAN算法在3個(gè)二維數(shù)據(jù)集上的劃分簇?cái)?shù)分別為5,12和5,而本文提出的KSSA-DBSCAN算法的劃分結(jié)果為9,15和6,相比之下KSSA-DBSCAN能夠劃分出更多具有細(xì)微差異的不同簇。

        Table 1 Basic information of test data sets

        為更加客觀地對(duì)比KSSA-DBSCAN算法與其他聚類算法的性能差異,本文采用有監(jiān)督的F度量(Fmeasure)方法檢測(cè)準(zhǔn)確率,3種算法在6個(gè)數(shù)據(jù)集上聚類的性能指標(biāo)如表 2所示??梢钥闯?本文所提出的KSSA-DBSCAN算法在wine、seeds、DS2、DS3數(shù)據(jù)集上的準(zhǔn)確率都優(yōu)于其他算法,并且與DBSCAN相比準(zhǔn)確率最大提高了25%。

        4 混合式MOOC視頻觀看模式挖掘?qū)嶒?yàn)

        4.1 實(shí)驗(yàn)場(chǎng)景

        用KSSA-DBSCAN算法對(duì)混合式MOOC視頻觀看行為模式進(jìn)行數(shù)據(jù)挖掘?qū)嶒?yàn),實(shí)驗(yàn)選用某大學(xué)《大學(xué)計(jì)算機(jī)》混合式MOOC視頻學(xué)習(xí)行為數(shù)據(jù)集作為研究對(duì)象。該數(shù)據(jù)集包含12個(gè)班級(jí)301名學(xué)生在該課程169個(gè)視頻上共計(jì)50 119條視頻觀看行為記錄。通過(guò)前期數(shù)據(jù)清洗及記錄合并,最終選定198名學(xué)生在8章共169個(gè)課程視頻上的行為數(shù)據(jù)。根據(jù)課程內(nèi)容性質(zhì)以及學(xué)習(xí)行為特征將聚類指標(biāo)定為視頻觀視比(視頻觀看時(shí)長(zhǎng)/視頻時(shí)長(zhǎng))、次均觀看時(shí)長(zhǎng)(視頻觀看時(shí)長(zhǎng)/觀看次數(shù))和移動(dòng)觀看量(視頻觀看時(shí)長(zhǎng)/視頻時(shí)長(zhǎng)-PC端觀看量)3個(gè)視頻學(xué)習(xí)行為指標(biāo)。具體實(shí)驗(yàn)環(huán)境參數(shù)及數(shù)據(jù)如表 3和表 4所示。

        Table 2 Comparison of accuracy of different clustering algorithms

        Table 3 Experimental configuration

        該課程的第1~第4及第8章為課程內(nèi)必修內(nèi)容,第5~第7章為課程外學(xué)習(xí)內(nèi)容,但是觀看視頻可以得到分?jǐn)?shù),具體信息及特征如表 5所示。

        Table 4 Basic properties of experimental data

        Table 5 Basic characteristics of each chapter

        4.2 實(shí)驗(yàn)及結(jié)果分析

        由于該數(shù)據(jù)集維度高達(dá)507,因此實(shí)驗(yàn)前先用PCA(Principal Component Analysis)進(jìn)行降維,再通過(guò)t-SNE(t-distributed Stochastic Neighbor Embedding)將數(shù)據(jù)降至二維,以便可視化呈現(xiàn),最終原始數(shù)據(jù)分布和聚類實(shí)驗(yàn)結(jié)果如圖 7所示。從實(shí)驗(yàn)結(jié)果可以看到,198個(gè)對(duì)象被清晰地劃分為了3個(gè)集群,并排除了噪聲的干擾,圖中圓圈表示噪聲。

        Figure 7 Original data graph and clustering result graph

        為驗(yàn)證KSSA-DBSCAN算法實(shí)驗(yàn)結(jié)果的合理性,本文將其與其他算法聚類結(jié)果進(jìn)行了對(duì)比,并通過(guò)內(nèi)部評(píng)價(jià)指標(biāo)DBI(Davies-Bouldin Index)進(jìn)行評(píng)價(jià)。DBI計(jì)算如式(6)所示,可以看出DBI越低表示聚類結(jié)果越好。

        (6)

        對(duì)比結(jié)果如表 6所示。從表6中可以看出,DBSCAN未能成功聚類,因此DBI值顯示為NAN,而KANN-DBSCAN雖然能夠聚類,但是其DBI值高于KSSA-DBSCAN的。對(duì)KSSA-DBSCAN算法聚類的3個(gè)集群特征做進(jìn)一步的分析,圖 8展示了3個(gè)集群在169個(gè)視頻3個(gè)維度上的均值,可以看出各個(gè)集群在3個(gè)維度上體現(xiàn)出視頻觀看行為模式的差異。

        Table 6 Comparison of clustering results

        進(jìn)一步地,按照視頻所屬的章合并后取均值,這將進(jìn)一步放大各章觀看行為模式的差異。圖 9展示了在每章的均值,可以看出3個(gè)集群在不同章3個(gè)維度上大多有較為明顯的差異。

        根據(jù)聚類的結(jié)果對(duì)每個(gè)集群特征總結(jié)如下:

        (1)集群1:此類學(xué)生能完成課程內(nèi)的觀看任務(wù),并在難度較大的內(nèi)容上存在反復(fù)觀看行為,且次均觀看時(shí)長(zhǎng)在各章都較長(zhǎng)。基本完成課程外內(nèi)容的觀看,根據(jù)特征,被標(biāo)記為“刻苦型”。

        Figure 8 Performance of three clusters on different videos

        (2)集群2:此類學(xué)生基本能完成課程內(nèi)的任務(wù),但重復(fù)觀看率不高,一定程度上體現(xiàn)為刷課行為,并且有部分課程任務(wù)未能完成,學(xué)習(xí)積極性不高,因此此類學(xué)生被標(biāo)記為“懈怠型”。

        (3)集群3:此類學(xué)生不僅能完成課程內(nèi)的觀看任務(wù),對(duì)難度較大和操作性強(qiáng)的內(nèi)容反復(fù)學(xué)習(xí),而他們的次均觀看時(shí)長(zhǎng)往往更短,顯示出更好的自我調(diào)節(jié)學(xué)習(xí)行為。而且能積極主動(dòng)學(xué)習(xí)課程外的內(nèi)容,學(xué)習(xí)策略較好,因此被標(biāo)記為“策略型”。

        對(duì)3類學(xué)生的平均成績(jī)進(jìn)一步分析,發(fā)現(xiàn)“刻苦型”學(xué)生平均成績(jī)?yōu)?5.047 9,“懈怠型”學(xué)生平均成績(jī)?yōu)?0.041 5,“策略型”學(xué)生平均成績(jī)?yōu)?2.730 3,存在差異,說(shuō)明學(xué)生的課程成績(jī)與學(xué)習(xí)投入存在正相關(guān)關(guān)系,越多的視頻觀看投入越有可能獲得較高的課程分?jǐn)?shù)。由于本課程包含了課外觀看內(nèi)容,觀看課外視頻對(duì)課程成績(jī)有一定的影響,這可能是導(dǎo)致“刻苦型”學(xué)生成績(jī)均值比“策略型”學(xué)生成績(jī)均值更高的一個(gè)原因。但是,單純的視頻觀看時(shí)長(zhǎng)并不能反映學(xué)習(xí)的真實(shí)效果,這一點(diǎn)從“策略型”學(xué)生的學(xué)習(xí)行為可以看出,根據(jù)圖9可知,在觀視比方面,“策略型”學(xué)生在難度較大的章,如第1章和第8章,觀視比高于其他類型學(xué)生的,而在次均觀看時(shí)長(zhǎng)方面并不是最高的,顯示出得當(dāng)?shù)膶W(xué)習(xí)策略在獲得更好的學(xué)習(xí)效果方面具有優(yōu)勢(shì)。

        Figure 9 Performance of three clusters on different chapters

        5 結(jié)束語(yǔ)

        本文提出了一種KSSA-DBSCAN算法,能夠依據(jù)k-dist圖斜率自動(dòng)選擇合適的k-dist圖拐點(diǎn)作為最佳Eps參數(shù),并在聚類迭代過(guò)程中依據(jù)聚類數(shù)目的變化自動(dòng)確定最佳MinPts參數(shù),克服了DBSCAN參數(shù)敏感以及需要人工參與的缺陷。通過(guò)與其他算法在6個(gè)測(cè)試數(shù)據(jù)集上的對(duì)比,驗(yàn)證了該算法在準(zhǔn)確率上的優(yōu)勢(shì),并且通過(guò)對(duì)混合式MOOC視頻觀看模式的挖掘,進(jìn)一步驗(yàn)證了該算法在實(shí)際應(yīng)用中的有效性。為使該算法適用更多應(yīng)用場(chǎng)景,特別是大數(shù)據(jù)應(yīng)用場(chǎng)景,未來(lái)研究將在時(shí)間復(fù)雜度上進(jìn)行優(yōu)化以適應(yīng)大規(guī)模數(shù)據(jù)處理情境。

        猜你喜歡
        課程學(xué)生
        《無(wú)機(jī)化學(xué)》課程教學(xué)改革
        云南化工(2021年6期)2021-12-21 07:31:42
        快把我哥帶走
        數(shù)字圖像處理課程混合式教學(xué)改革與探索
        軟件設(shè)計(jì)與開發(fā)實(shí)踐課程探索與實(shí)踐
        為什么要學(xué)習(xí)HAA課程?
        《李學(xué)生》定檔8月28日
        電影(2018年9期)2018-11-14 06:57:21
        趕不走的學(xué)生
        學(xué)生寫話
        學(xué)生寫的話
        “學(xué)而時(shí)習(xí)之”的課程值得贊賞
        日本一区二区三区女优在线| y111111少妇影院无码| 久久福利青草精品资源| 青青草视全福视频在线| 国产变态av一区二区三区调教| 好男人社区影院www| 国产精品厕所| 蜜桃av观看亚洲一区二区| 日韩中文字幕不卡在线| 国产精品爽爽久久久久久竹菊| 永久免费观看的毛片手机视频| 国产精品国产三级国产AvkTV| av天堂网手机在线观看| 日日躁夜夜躁狠狠躁| 国产色综合天天综合网| 欧美在线观看www| 中文字幕女同人妖熟女| 国产精品中文久久久久久久| 国产av影片麻豆精品传媒| 绿帽人妻被插出白浆免费观看| 那有一级内射黄片可以免费看| 伊人久久大香线蕉综合影院首页| 欧美自拍区| 日本不卡的一区二区三区| 激情综合五月开心婷婷| 三男一女吃奶添下面| 中文乱码字幕高清在线观看| 国产视频一区2区三区| 国产三级精品三级| 亚洲日韩欧美一区二区三区| 丝袜美腿爆炒国产在线观看| 成人免费在线亚洲视频| 天堂国精产品2023年| 亚洲AV成人无码久久精品四虎| 中文字幕手机在线精品| 国产亚洲一区二区在线观看| 精品人妻伦九区久久AAA片69| 穿着白丝啪啪的av网站| 特级a欧美做爰片第一次| 国产午夜亚洲精品不卡福利| 高清国产精品一区二区|