亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多維異步在線討論行為特征分析與學(xué)習(xí)績效預(yù)測

        2022-06-11 20:18:54孫建文胡夢薇劉三女牙李卿沈筱譞
        中國遠程教育 2022年5期
        關(guān)鍵詞:學(xué)習(xí)者預(yù)測特征

        孫建文 胡夢薇 劉三女牙 李卿 沈筱譞

        【摘 要】

        在線討論是數(shù)字教育的重要組成部分。利用豐富多元的討論行為特征開展學(xué)習(xí)績效預(yù)測分析,是揭示在線協(xié)作學(xué)習(xí)機制、提升在線教學(xué)質(zhì)量的有效途徑。本文聚焦在線教學(xué)場景下的學(xué)習(xí)者異步討論行為特征,通過構(gòu)建基于多維特征的學(xué)習(xí)績效預(yù)測模型探究各個特征的預(yù)測效力及其影響機理。以華中師范大學(xué)一門SPOC課程論壇上的164位學(xué)生為實驗對象,實驗結(jié)果表明:移動窗口和回復(fù)關(guān)系兩類社會網(wǎng)絡(luò)特征對學(xué)習(xí)績效的預(yù)測能力存在顯著差異,基于移動窗口網(wǎng)絡(luò)特征的預(yù)測能力優(yōu)于傳統(tǒng)回復(fù)網(wǎng)絡(luò);引入積極性和規(guī)律性兩個隱性時間特征之后,進一步提升了學(xué)習(xí)績效預(yù)測的準(zhǔn)確性;融合人口背景、行為頻數(shù)、社會網(wǎng)絡(luò)和時間信息等多維特征對學(xué)習(xí)績效具有較高的預(yù)測能力,準(zhǔn)確率最高可達87.44%,不僅增加了異步討論行為特征的豐富性,獲得更多對在線教學(xué)有啟示價值的信息,而且有效提升了學(xué)習(xí)績效預(yù)測能力。

        【關(guān)鍵詞】? 在線教學(xué);異步討論;學(xué)習(xí)行為;學(xué)習(xí)績效;預(yù)測模型;多維特征;社會網(wǎng)絡(luò)特征;隱性時間特征

        【中圖分類號】? ?G434? ? ? ? ?【文獻標(biāo)識碼】? A? ? ? ?【文章編號】? 1009-458x(2022)5-0056-08

        一、引言

        隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等信息技術(shù)與教育教學(xué)的不斷融合,以及新冠肺炎疫情防控常態(tài)化,在線教學(xué)正發(fā)展成為未來教育的一種趨勢(Chang, Hsu, Kwon, Kusdhany, & Hong, 2021)。與此同時,支持“師—生”“生—生”甚至“師—生—機”之間有效協(xié)作的異步討論逐漸成為在線教學(xué)的有機組成部分(Han & Ellis, 2019)。異步討論工具支持學(xué)習(xí)者跨時空、跨場景、跨終端開展社會性交互,為實現(xiàn)“人人皆學(xué)、處處能學(xué)、時時可學(xué)”的學(xué)習(xí)場景提供了重要手段?;诋惒接懻摦a(chǎn)生的海量、實時、豐富的交互類大數(shù)據(jù),開展以學(xué)習(xí)者為中心的行為分析與績效預(yù)測,是當(dāng)前在線教學(xué)研究的熱點問題之一(De-Marcos, et al., 2016; Galikyan & Admiraal, 2019; 胡航, 等, 2021; 沈欣憶, 等, 2020)。

        當(dāng)前研究主要圍繞異步討論交互特征提取與學(xué)習(xí)績效預(yù)測模型構(gòu)建兩方面開展,尤其是如何從人口背景、行為頻數(shù)、社會網(wǎng)絡(luò)、時間信息等多維交互數(shù)據(jù)中挖掘出具有較高預(yù)測效力的特征指標(biāo)(Alyahyan & Dü teg?r, 2020; Gitinabard, Xu, Heckman, Barnes, & Lynch, 2019; Li & Baker, 2018)。近年來,盡管已取得了一系列研究成果,但在異步討論交互特征數(shù)據(jù)的多樣化、深層次信息挖掘和利用方面仍存在不足。例如,對于社會網(wǎng)絡(luò)類特征,多數(shù)研究僅局限于探索傳統(tǒng)回復(fù)關(guān)系定義下的行為特征對學(xué)習(xí)績效預(yù)測能力的影響,少有研究從社會關(guān)系多樣性視角考察更具預(yù)測效力的特征(Gitinabard, et al., 2019)。對于時間類特征,現(xiàn)有研究大多聚焦于淺層統(tǒng)計信息(如在線時長、天數(shù)等),缺乏從時間數(shù)據(jù)中挖掘潛在的隱性特征進行學(xué)習(xí)績效預(yù)測(Barbera, Gros, & Kirschner, 2015)。針對此類問題,本文運用數(shù)據(jù)驅(qū)動的研究范式,以華中師范大學(xué)一門SPOC課程論壇中的164位學(xué)生為對象,通過對異步討論交互數(shù)據(jù)的全面、深度分析,構(gòu)建基于多維特征的學(xué)習(xí)績效預(yù)測模型,進一步揭示在線教學(xué)環(huán)境下學(xué)習(xí)者的異步討論行為特征與學(xué)習(xí)績效之間的關(guān)系,以期為后續(xù)研究提供參考。

        二、相關(guān)研究

        (一)學(xué)習(xí)績效預(yù)測

        學(xué)習(xí)績效預(yù)測是學(xué)習(xí)分析領(lǐng)域的核心問題之一,其本質(zhì)是利用學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生的各類數(shù)據(jù),運用以機器學(xué)習(xí)為代表的方法對學(xué)習(xí)績效或效果進行預(yù)測。教師可根據(jù)預(yù)測結(jié)果及時了解學(xué)習(xí)者的學(xué)習(xí)狀態(tài),并對學(xué)習(xí)過程進行及時干預(yù),如改善學(xué)習(xí)者學(xué)習(xí)習(xí)慣、調(diào)整教學(xué)策略等(武法提, 等, 2019)。從任務(wù)角度劃分,學(xué)習(xí)績效預(yù)測可以是分類任務(wù),如預(yù)測學(xué)習(xí)者是否有不及格的風(fēng)險(Gray & Perkins, 2019);可以是回歸任務(wù),如預(yù)測學(xué)習(xí)者關(guān)于某門課程的成績分值或者排名(Soffer & Cohen, 2019)。

        (二)學(xué)習(xí)績效影響因素

        在在線教學(xué)環(huán)境下,以異步討論為代表的數(shù)字化學(xué)習(xí)工具提供了強大的過程性數(shù)據(jù)采集能力,數(shù)據(jù)中蘊含了若干影響學(xué)習(xí)績效的因素。從數(shù)據(jù)挖掘角度看,這些因素可稱之為特征。結(jié)合已有研究,相關(guān)特征可分為以下四類:

        1. 人口背景

        人口背景一般指學(xué)習(xí)者的性別、年齡、父母職業(yè)等。相關(guān)研究包括:Alyahyan等(Alyahyan, et al., 2020)通過綜述近五年的學(xué)習(xí)績效預(yù)測研究,發(fā)現(xiàn)使用較多的特征是人口統(tǒng)計變量(如學(xué)習(xí)者的性別、年齡、國籍等);Gardner等(Gardner & Brooks, 2018)針對MOOC學(xué)習(xí)環(huán)境進行了研究,發(fā)現(xiàn)學(xué)習(xí)者的年齡和父母職業(yè)等都是學(xué)習(xí)績效的重要預(yù)測因素;Espinoza等(Espinoza & Taut, 2020)著重考察了學(xué)習(xí)者的性別和學(xué)習(xí)績效的關(guān)系,發(fā)現(xiàn)性別可以作為預(yù)測學(xué)習(xí)績效的良好特征。但是,簡單基于人口背景信息的學(xué)習(xí)績效預(yù)測能力有限,通常與其他類型的特征進行組合,實現(xiàn)基于多維特征的學(xué)習(xí)績效預(yù)測。

        2. 行為頻數(shù)

        行為頻數(shù)是指從學(xué)習(xí)者學(xué)習(xí)過程中提取的行為類統(tǒng)計指標(biāo),如登錄次數(shù)、發(fā)帖數(shù)、作業(yè)數(shù)、測驗數(shù)等。Romero等(Romero, López, Luna, & Ventura, 2013)采用學(xué)習(xí)者發(fā)帖總數(shù)、發(fā)帖總句子數(shù)等特征進行學(xué)習(xí)績效預(yù)測,結(jié)果表明,發(fā)帖總數(shù)、發(fā)帖總句子數(shù)均是學(xué)習(xí)績效的良好預(yù)測因子,發(fā)帖數(shù)越多、句子數(shù)越多的學(xué)習(xí)者更愿意積極參與討論,并取得更好的成績;劉三女牙等(2017)和Li等(2018)等發(fā)現(xiàn)在學(xué)習(xí)者的在線活動日志中,如登錄次數(shù)、作業(yè)完成數(shù)、測驗完成數(shù)等是預(yù)測學(xué)習(xí)績效的強力指標(biāo);Cerezo等(Cerezo, Sánchez-Santillán, Paule- Ruiz, & Nú?ez, 2016)采用回歸分析發(fā)現(xiàn),學(xué)習(xí)者在論壇中的發(fā)帖總字?jǐn)?shù)也可作為預(yù)測學(xué)習(xí)績效的有力指標(biāo);左明章(2018)等采用定量方法從論壇數(shù)據(jù)中提取發(fā)布時間、文本字?jǐn)?shù)等信息,然后提出基于K-means的學(xué)習(xí)績效預(yù)測模型。行為頻數(shù)具有容易采集與量化、特征語義豐富、預(yù)測能力強、可解釋性好等優(yōu)勢,是學(xué)習(xí)績效預(yù)測研究使用最廣泛的一類特征。749A67E7-4AF0-4AD6-94CB-60315305E7B6

        3. 社會網(wǎng)絡(luò)

        社會網(wǎng)絡(luò)本義指社會行動者(Social Actor)以及彼此關(guān)系的集合,具體到教育領(lǐng)域是指學(xué)習(xí)者之間的關(guān)系集合。從學(xué)習(xí)者互動關(guān)系中提取社會網(wǎng)絡(luò)特征有多種方法,通常可分為兩類:一是根據(jù)學(xué)習(xí)者之間的回復(fù)關(guān)系進行社會網(wǎng)絡(luò)特征提取,如直接回復(fù);二是基于學(xué)習(xí)者在討論中的共同參與情況提取特定關(guān)系,如移動窗口(Fincham, Ga evi , & Pardo, 2018)。目前,已有大量研究根據(jù)學(xué)習(xí)者的回復(fù)關(guān)系定義社會網(wǎng)絡(luò),并從中提取特征,分析其對學(xué)習(xí)績效的預(yù)測能力。如De-Marcos、Gitinabard等采用傳統(tǒng)回復(fù)網(wǎng)絡(luò)對學(xué)習(xí)者討論數(shù)據(jù)進行分析,挖掘出中心度、出入度等指標(biāo),建立學(xué)習(xí)績效預(yù)測模型(De-Marcos, et al., 2016; Gitinabard, et al., 2019)。傳統(tǒng)研究多數(shù)集中于分析回復(fù)關(guān)系下的網(wǎng)絡(luò)特征對學(xué)習(xí)績效的預(yù)測能力,鮮有探討基于其他關(guān)系定義(如移動窗口)的網(wǎng)絡(luò)特征對學(xué)習(xí)績效預(yù)測的影響。近年來,有研究發(fā)現(xiàn)基于移動窗口定義下的社會網(wǎng)絡(luò)特征與學(xué)習(xí)績效的相關(guān)性較強(Fincham, et al., 2018; 劉三女牙, 等, 2020)。因此,有必要進一步探究基于移動窗口等非傳統(tǒng)網(wǎng)絡(luò)特征對學(xué)習(xí)績效的預(yù)測能力。

        4. 時間信息

        學(xué)習(xí)時間對于學(xué)習(xí)績效的重要性已得到研究者的關(guān)注和證明(Tangtao, Xingli, & Pei, 2018)。目前,在學(xué)習(xí)績效預(yù)測研究中對時間類特征的利用主要分為兩類:一是基于顯性時間特征,Xu等(Xu, Wang, Peng, & Wu, 2019)從4,000名學(xué)習(xí)者的在線學(xué)習(xí)數(shù)據(jù)中提取學(xué)習(xí)時長等特征,再利用決策樹、神經(jīng)網(wǎng)絡(luò)和支持向量機等機器學(xué)習(xí)算法預(yù)測學(xué)習(xí)績效;Gitinabard等(2019)從Pizza論壇中挖掘?qū)W習(xí)者的在線時間,探索其預(yù)測能力。二是挖掘基于時間的隱性特征,Boroujeni等(Boroujeni & Dillenbourg, 2019)采用時間序列方法分析學(xué)習(xí)者的學(xué)習(xí)模式如何隨時間變化,進而探索學(xué)習(xí)模式的變化對學(xué)習(xí)績效的影響。此外,Barbera等(2015)利用學(xué)習(xí)者首次參與討論的時間衡量學(xué)習(xí)的積極性,分析其對學(xué)習(xí)績效的預(yù)測能力,并對學(xué)習(xí)者傾向于何時參與學(xué)習(xí)討論進行了研究,發(fā)現(xiàn)每個學(xué)習(xí)者都有獨特的參與時間特點,對學(xué)習(xí)績效的預(yù)測也至關(guān)重要。時間信息中蘊涵了大量的隱性特征,為充分理解學(xué)習(xí)是如何隨時間推移而展開的,有必要從時間維度深入分析學(xué)習(xí)者的學(xué)習(xí)特征,挖掘出更多具有潛在價值的學(xué)習(xí)模式與規(guī)律,進一步提升學(xué)習(xí)績效的預(yù)測能力。

        三、研究設(shè)計

        (一)研究問題

        綜上所述,圍繞在線教學(xué)異步討論環(huán)境下的人口背景、行為頻數(shù)、社會網(wǎng)絡(luò)、時間信息等特征開展學(xué)習(xí)績效預(yù)測研究,已吸引了國內(nèi)外大量學(xué)者的研究興趣并取得積極進展,目前正進一步往特征的深層分析與組合建模方向發(fā)展。因此,本文重點針對社會網(wǎng)絡(luò)和時間信息兩類特征,以非傳統(tǒng)定義下的社會網(wǎng)絡(luò)特征與基于時間維度的隱性特征為核心,探索不同特征組合對學(xué)習(xí)績效預(yù)測模型的影響。主要研究問題如下:

        1. 采用移動窗口定義下的社會網(wǎng)絡(luò)特征和傳統(tǒng)回復(fù)網(wǎng)絡(luò)特征分別進行預(yù)測,對比兩者的預(yù)測能力是否存在差異?

        2. 在特征集合中引入基于時間維度的隱性特征是否可進一步提升預(yù)測效果?

        (二)研究對象和數(shù)據(jù)來源

        研究數(shù)據(jù)源于華中師范大學(xué)2018學(xué)年秋季在SPOC平臺上開設(shè)的一門“新生研討課”,該課程主要面向英語專業(yè)一年級新生,在教學(xué)過程中引入SPOC異步在線論壇進行線上教學(xué),學(xué)生通過發(fā)帖、回帖等方式開展各種協(xié)作性、研討性學(xué)習(xí)。經(jīng)統(tǒng)計,參與討論的師生總?cè)藬?shù)為164人,其中包括7名教師、24名大二學(xué)生和133名大一新生,帖子總數(shù)為9,798條,剔除重復(fù)帖、純標(biāo)點符號帖等無效數(shù)據(jù)后,剩余有效帖子數(shù)為9,779條。

        學(xué)習(xí)績效的計算綜合考慮了學(xué)生的平時表現(xiàn)和期末考核,其中平時表現(xiàn)占80%,期末考核占20%。平時表現(xiàn)的計分規(guī)則為:課程論壇提問和回答次數(shù)占平時成績的15%,論壇資源學(xué)習(xí)占平時成績的10%,線下課堂出勤、參與度、課堂筆記占平時成績的25%,課外作業(yè)占平時成績的50%。期末考核成績的組成為:課程論文占50%,課堂成果展示占50%。

        (三)研究方法

        按照學(xué)習(xí)分析或教育數(shù)據(jù)挖掘的一般流程,主要包括數(shù)據(jù)清洗、特征提取、模型構(gòu)建等環(huán)節(jié)。為提高數(shù)據(jù)處理和分析的效率,采用領(lǐng)域廣泛使用的機器學(xué)習(xí)套件——Scikit-learn作為研究工具,編程語言選擇Python。

        1. 數(shù)據(jù)清洗

        使用Scikit-learn庫的Pandas包對數(shù)據(jù)進行清洗,包括:①使用Dropna、Fillna等函數(shù)補齊或剔除有缺失值的帖子,保持?jǐn)?shù)據(jù)的完整性;②使用Drop_ duplicates函數(shù)去除重復(fù)帖,保持?jǐn)?shù)據(jù)的唯一性。

        2. 特征提取

        采用以人口背景、行為頻數(shù)、社會網(wǎng)絡(luò)、時間信息等為核心的特征分類框架,在此基礎(chǔ)上開展在線教學(xué)異步討論環(huán)境下學(xué)習(xí)績效影響因素的表征與量化。

        第一類是人口背景特征集,主要包括性別(男、女)特征。

        第二類是行為頻數(shù)特征集,主要包括發(fā)帖次數(shù)(學(xué)習(xí)者在論壇發(fā)帖的總次數(shù),利用回帖和發(fā)帖的總數(shù)目來衡量)和發(fā)帖長度(學(xué)習(xí)者在論壇發(fā)帖的總字?jǐn)?shù),利用每一條帖子的字?jǐn)?shù)之和來衡量)等特征。

        第三類是社會網(wǎng)絡(luò)特征集,分別對直接回復(fù)網(wǎng)絡(luò)和移動窗口網(wǎng)絡(luò)進行定義。一方面,根據(jù)學(xué)習(xí)者之間的回復(fù)層級來提取直接回復(fù)網(wǎng)絡(luò)特征,如圖1左邊所示,主題帖可表示為S,R1和R2表示主題帖S下的一級回復(fù)帖,故R1、R2與S之間存在連線,RR1、RR2和RR3表示R1的二級回復(fù)帖,故RR1、RR2、RR3與R1之間存在連線,以此類推。另一方面,根據(jù)學(xué)習(xí)者在論壇的共同參與情況來提取移動窗口網(wǎng)絡(luò)特征,如圖1右邊所示,當(dāng)一個主題S的帖子總數(shù)小于N時所有帖子相互連接,否則定義一個大小為N的窗口在主題S中移動,每一步窗口內(nèi)的所有帖子相互連接。例如,從第一個帖子開始,S、R1和R2存在連線,然后將窗口移動到第二個帖子,R1、R2和RR1存在連線,以此類推直至窗口遍歷完主題所有帖子。與直接回復(fù)網(wǎng)絡(luò)相比,移動窗口關(guān)系特征不受回復(fù)層級影響,更平均地關(guān)注了學(xué)習(xí)者的發(fā)帖信息。本文設(shè)置移動窗口長度為3,分別從兩類社會網(wǎng)絡(luò)定義特征,包括點出度(學(xué)習(xí)者給出的回復(fù)和反饋數(shù)量)、點入度(學(xué)習(xí)者收到的回復(fù)和反饋數(shù)量)、接近中心度(反映網(wǎng)絡(luò)中某一學(xué)習(xí)者與其他學(xué)習(xí)者之間的接近程度,可采用一個節(jié)點到其他所有節(jié)點的最短路徑距離累加之和的倒數(shù)來衡量)、中介中心度(反映學(xué)習(xí)者在網(wǎng)絡(luò)中作為交流媒介的能力,可利用經(jīng)過一個節(jié)點的最短路徑數(shù)目來衡量)、特征向量中心度(反映某一學(xué)習(xí)者在網(wǎng)絡(luò)中的重要性,可采用一個節(jié)點的鄰居節(jié)點數(shù)量及鄰居節(jié)點的重要性來衡量)。749A67E7-4AF0-4AD6-94CB-60315305E7B6

        圖1 兩類社會網(wǎng)絡(luò)特征定義示意圖

        第四類是時間信息特征集,分別從顯性和隱性時間兩個維度定義特征。一方面,顯性時間特征包括在線討論時長(學(xué)習(xí)者在線討論總時長,可利用相鄰兩個帖子之間的時間間隔來估算,如果時間差超過一定閾值則表明學(xué)習(xí)者可能處于非有效學(xué)習(xí)狀態(tài),不統(tǒng)計在內(nèi))和在線討論天數(shù)(學(xué)習(xí)者在線討論總天數(shù),利用學(xué)習(xí)者登錄情況計算)。另一方面,隱性時間特征包括積極性(學(xué)習(xí)者回復(fù)主題帖的速度,利用學(xué)習(xí)者在某一主題帖下首次回復(fù)的時間差來衡量,本質(zhì)是計算在所有主題帖下首次回復(fù)時間差的平均值)、規(guī)律性(每個討論主題下學(xué)習(xí)者首次參與回帖的縱向時間特征,利用學(xué)習(xí)者回復(fù)速度的方差來衡量,本質(zhì)是計算在所有主題帖下首次回復(fù)時間差的方差)等。其中,積極性與規(guī)律性的計算方法分別如公式(1)和公式(2)所示,n為主題貼總數(shù),i為第i條主題貼,mi表示第i條主題貼的發(fā)布時間,ti表示學(xué)習(xí)者關(guān)于第i條主題貼的首次回帖時間。

        [i=1nti-min] ? ?(1)

        [[(ti-mi)-i=1nti-min]2n] (2)

        綜上所述,在以人口背景、行為頻數(shù)、社會網(wǎng)絡(luò)、時間信息等為核心的分類框架下,通過對特征的進一步細(xì)分與定義得到的特征集合如表1所示。

        表1 學(xué)習(xí)者特征分類和細(xì)分指標(biāo)

        [特征類別 細(xì)分依據(jù) 具體指標(biāo) 人口背景 人口背景 性別 行為頻數(shù) 行為頻數(shù) 發(fā)帖次數(shù) 發(fā)帖長度 社會網(wǎng)絡(luò) 直接回復(fù)

        移動窗口 出度 入度 接近中心度 中介中心度 特征向量中心度 時間信息 顯性維度 在線討論總時長 在線討論總天數(shù) 隱性維度 積極性 規(guī)律性 ]

        3. 模型構(gòu)建

        首先,由于不同特征的量綱不同,為避免各類特征數(shù)值取值范圍的差異對分類預(yù)測的干擾,對所有數(shù)值屬性進行標(biāo)準(zhǔn)化(Z-Score)處理。其次,在滿足正態(tài)分布的標(biāo)準(zhǔn)下,依據(jù)學(xué)習(xí)者期末成績將其學(xué)習(xí)水平劃分為三個層次:80分以下為低水平(Low),80~94分為中等水平(Middle),94分以上為高水平(High)。最后,采用五種主流的機器學(xué)習(xí)算法(邏輯回歸、決策樹、多項式SVM、高斯核SVM和神經(jīng)網(wǎng)絡(luò)),分別構(gòu)建基于在線教學(xué)異步討論行為的學(xué)習(xí)績效預(yù)測模型。所有模型均使用Scikit-learn工具訓(xùn)練,并通過五折交叉驗證法進行參數(shù)優(yōu)化與性能評估,預(yù)測結(jié)果采用準(zhǔn)確率、F1值等指標(biāo)來綜合衡量。

        四、結(jié)果分析

        (一)移動窗口與傳統(tǒng)回復(fù)網(wǎng)絡(luò)定義下的特征預(yù)測能力是否存在顯著差異

        首先分別將兩類社會網(wǎng)絡(luò)中提取的特征與人口背景、行為頻數(shù)和顯性時間三類特征結(jié)合,構(gòu)成特征集A與B,然后分別采用上述五種機器學(xué)習(xí)算法在特征集A與B上構(gòu)建預(yù)測模型,相應(yīng)結(jié)果如圖2所示。

        圖2 基于社會網(wǎng)絡(luò)特征集A與B的預(yù)測性能對比

        從圖2可見,對于準(zhǔn)確率指標(biāo),基于特征集B構(gòu)建的五種預(yù)測模型的準(zhǔn)確率均顯著高于特征集A;對于F1值,基于特征集B的預(yù)測效果同樣普遍優(yōu)于特征集A。其中,尤其是對于多項式SVM模型,在準(zhǔn)確率和F1值上都取得高達7%的性能優(yōu)勢。因此,可以發(fā)現(xiàn)兩類社會網(wǎng)絡(luò)定義下的特征對于學(xué)習(xí)績效的預(yù)測能力存在較為明顯的差異,基于移動窗口網(wǎng)絡(luò)特征的預(yù)測能力要優(yōu)于傳統(tǒng)回復(fù)網(wǎng)絡(luò)。

        究其原因,一方面是相比直接回復(fù)網(wǎng)絡(luò),移動窗口關(guān)系定義方式不受回復(fù)層級影響,更平均地關(guān)注了論壇中學(xué)習(xí)者發(fā)布的帖子,最終提取的關(guān)系數(shù)量相對較多,從中挖掘的出入度等特征更具預(yù)測效力,這與Gitinabard等(2019)的研究結(jié)論一致;另一方面,從社會網(wǎng)絡(luò)結(jié)構(gòu)看,在直接回復(fù)網(wǎng)絡(luò)中學(xué)習(xí)者大多處于邊緣位置,教師處于中心位置,而在移動窗口網(wǎng)絡(luò)中則相反,這充分體現(xiàn)了學(xué)習(xí)者在學(xué)習(xí)過程中的主體地位。一般而言,處于中心位置的學(xué)習(xí)者更有可能獲得更高的學(xué)習(xí)績效(De-Marcos, et al., 2016)。

        由于特征集B為組合特征,包含了移動窗口社會網(wǎng)絡(luò)、人口信息、行為頻數(shù)、顯性時間等多維特征元素,其中可能存在與學(xué)習(xí)績效相關(guān)度不高或冗余的特征,有必要進行特征選擇,以進一步降低特征維數(shù),并提升模型的預(yù)測性能,為此本文采用卡方檢驗和互信息兩種方法進行特征選擇。

        1. 卡方檢驗(x2test)

        卡方檢驗(x2test)是一種典型的特征選擇方法,其本質(zhì)是通過計算兩個變量間的關(guān)聯(lián)性進行特征篩選,若特征與學(xué)習(xí)績效之間的x2顯著性水平較高,則表明該特征與學(xué)習(xí)績效相關(guān)性較強,適合被選作預(yù)測因子。本文使用Scikit-learn的Chi2包計算上述特征集B中10個特征元素的x2值,得到其卡方值及相應(yīng)的p值(顯著性水平),根據(jù)這兩個值衡量每一個特征對于學(xué)習(xí)績效預(yù)測的置信度,結(jié)果如表2所示。

        2. 互信息法

        對于分類問題,互信息法是用于衡量某個特征對于特定類別所貢獻的信息量,信息量越大,該特征與類別之間的相關(guān)性越高。本文使用Scikit-learn的Mutual_info_classif包分別計算特征集B中10個特征元素與學(xué)習(xí)績效之間的互信息值,根據(jù)其大小進行排序,結(jié)果如表3所示。

        從表2可見,在利用卡方檢驗進行篩選時,性別、接近中心度等特征的排序較為靠后,預(yù)測能力不佳,其次是在線討論天數(shù)、特征向量中心度,因此可考慮剔除這四個特征。但從表3可見,特征向量中心度的排序較高,故綜合考慮,保留特征向量中心度。這樣經(jīng)過兩類特征選擇后,特征集B中保留了7個更具預(yù)測效力的特征元素,構(gòu)成新的特征集C,然后再分別采用邏輯回歸、決策樹、多項式SVM、高斯核SVM和神經(jīng)網(wǎng)絡(luò)五種算法進行模型訓(xùn)練,得到的準(zhǔn)確率和F1值如圖3所示,五種模型的預(yù)測準(zhǔn)確率均有不同程度的提升,即用更少的特征取得了更好的預(yù)測效果,表明特征選擇的有效性。749A67E7-4AF0-4AD6-94CB-60315305E7B6

        在上述特征選擇過程中,性別、接近中心度和在線討論天數(shù)三項特征被剔除。究其原因:首先對于性別,同Alyahyan等(2020)和Li(2019)的研究結(jié)論一致,性別對學(xué)習(xí)績效的影響較小。其次對于接近中心度,與中介中心度和特征向量中心度等類似特征相比,其與學(xué)習(xí)績效的相關(guān)性最低,這和劉三女牙等(2020)的研究結(jié)論一致。接近中心度、中介中心度和特征向量中心度雖然都可以衡量學(xué)習(xí)者的中心地位,但接近中心度側(cè)重于利用學(xué)習(xí)者之間在討論交互中的親密程度來衡量學(xué)習(xí)者的中心度,而中介中心度和特征向量中心度側(cè)重于衡量學(xué)習(xí)者在學(xué)習(xí)互動中充當(dāng)“中介”的程度,描述了學(xué)習(xí)者調(diào)節(jié)社會交往的能力。與接近中心度相比,中介中心度和特征向量中心度更能衡量學(xué)習(xí)者的社會威望和影響力,學(xué)習(xí)者的威望越大,影響力越大,往往所取得的學(xué)習(xí)績效越高。最后對于在線討論天數(shù)特征,與此相似的是在線討論時長均可對學(xué)習(xí)者的在線討論時間進行衡量,但后者更精確地統(tǒng)計了學(xué)習(xí)者參與討論的有效時間,在線討論天數(shù)則主要反映了學(xué)習(xí)者登錄論壇的天數(shù)信息,其對學(xué)習(xí)績效的預(yù)測效力不如在線討論時長。

        此外,通過以上分析可以發(fā)現(xiàn),在四大類特征中僅有行為頻數(shù)特征未被剔除。有研究表明,在線討論頻數(shù)信息是預(yù)測學(xué)習(xí)績效的重要指標(biāo),由于較高的論壇交互頻次行為意味著學(xué)習(xí)者愿意花更多的時間和精力用于學(xué)習(xí),因此容易獲得較高的學(xué)業(yè)表現(xiàn)(武法提, 等, 2019; 范逸洲, 等, 2018)。本研究所使用的頻數(shù)特征包括發(fā)帖次數(shù)和發(fā)帖長度,次數(shù)越多通常代表學(xué)習(xí)者愿意投入更多的時間參與在線討論和交流,長度越長則往往意味著學(xué)習(xí)者有自己的分析和思考,主動且深度開展在線討論。

        (二)引入隱性時間特征是否可以獲得更好的預(yù)測效果

        將表1中定義的兩個隱性時間特征(積極性與規(guī)律性)引入篩選后的特征集C中,構(gòu)成新的特征集D,然后基于特征集D構(gòu)建預(yù)測模型,得到的預(yù)測結(jié)果如圖4所示。

        從圖4可見,在引入隱性時間特征之后,五種模型的預(yù)測結(jié)果均有了進一步的提升(與圖3相比),體現(xiàn)出隱性時間特征對學(xué)習(xí)績效預(yù)測的有效性。從準(zhǔn)確率上看,決策樹模型的預(yù)測性能提升幅度最大,高達5%;高斯核SVM模型的預(yù)測效果最好,準(zhǔn)確率達87.44%;預(yù)測準(zhǔn)確率最低的是邏輯回歸模型,但和高斯核SVM模型相比也僅存在1%左右的差距。從F1值來看,高斯核SVM模型不僅準(zhǔn)確率最高,而且也取得最高的F1值,這表明采用高斯核SVM算法構(gòu)建學(xué)習(xí)績效預(yù)測模型的有效性;F1值最低的是決策樹模型,但其準(zhǔn)確率并非最低,這也說明需采用多個指標(biāo)對模型性能進行綜合評估。

        以上表明,在特征集中引入積極性和規(guī)律性兩個特征后,五個模型的預(yù)測準(zhǔn)確度均高于85%,表明隱性時間特征對于提升學(xué)習(xí)績效預(yù)測的有效性。究其原因,積極性衡量學(xué)習(xí)者在討論中的整體參與情況,規(guī)律性代表學(xué)習(xí)者的縱向參與模式。積極性不高可能意味著學(xué)習(xí)者在討論中存在懈怠、拖延等狀況,體現(xiàn)出學(xué)習(xí)者學(xué)習(xí)動機不強或時間管理能力較差,從而導(dǎo)致學(xué)習(xí)質(zhì)量不高。規(guī)律性不強表示學(xué)習(xí)者難以長期保持積極參與討論的學(xué)習(xí)狀態(tài),學(xué)習(xí)投入起伏較大,學(xué)習(xí)表現(xiàn)也因此受到影響。相比積極性,規(guī)律性更能揭示學(xué)習(xí)者在參與討論時間上的細(xì)微變化。相關(guān)研究也表明,學(xué)習(xí)時間是學(xué)習(xí)者在學(xué)習(xí)過程中需要重點把握的因素,只有妥善管理好時間,才有可能取得更好的學(xué)習(xí)績效(Xu, et al., 2019)。

        (三)教學(xué)啟示

        綜上所述,融合多維異步討論行為特征有效提升了學(xué)習(xí)績效的預(yù)測能力,最高達87.44%,與已有研究(Wakelam, Jefferies, Davey, & Sun, 2020; Zohair, 2019)相比取得較大提升,表明本文所提出的特征提取、選擇以及模型構(gòu)建等方法的有效性。但需特別指出的是,學(xué)習(xí)績效預(yù)測研究并非簡單追求機器學(xué)習(xí)預(yù)測模型的高準(zhǔn)確率,更重要的是探索對提升學(xué)習(xí)者學(xué)習(xí)績效有顯著價值、對優(yōu)化教師教學(xué)過程有參考意義的可解釋、可信任的特征(劉三女牙, 等, 2021),以及時洞察和干預(yù)學(xué)習(xí)者的學(xué)習(xí)過程,反思和調(diào)整教師的教學(xué)過程,促進在線教學(xué)模式創(chuàng)新與質(zhì)量提升。具體啟示如下:

        1. 在社會網(wǎng)絡(luò)方面,由于移動窗口網(wǎng)絡(luò)特征的預(yù)測效果優(yōu)于傳統(tǒng)回復(fù)網(wǎng)絡(luò),因此要加大對交互分析過程中移動窗口的使用,重視移動窗口中學(xué)習(xí)者交互在提升學(xué)習(xí)績效中的重要價值。根據(jù)移動窗口社會網(wǎng)絡(luò)結(jié)構(gòu)下學(xué)習(xí)者在論壇中互動時的表現(xiàn)和社會地位,對核心成員進行適當(dāng)引導(dǎo)以建立更廣泛的社交關(guān)系,實現(xiàn)與更多班級成員進行雙向交流。同時,需要特別關(guān)注處于網(wǎng)絡(luò)邊緣的學(xué)習(xí)者,鼓勵他們積極投入學(xué)習(xí)并更多參與討論。

        2. 在學(xué)習(xí)時間方面,學(xué)習(xí)者在學(xué)習(xí)過程中會產(chǎn)生一系列顯性時間數(shù)據(jù),如在線討論時長、在線討論天數(shù)等,利用這些數(shù)據(jù)可以在一定程度上實現(xiàn)對學(xué)習(xí)績效的預(yù)測,教師也可以根據(jù)這些特征對學(xué)習(xí)者進行適當(dāng)干預(yù)。但由于每個學(xué)習(xí)者在學(xué)習(xí)過程中都有其獨特的學(xué)習(xí)模式,有必要從學(xué)習(xí)者的學(xué)習(xí)時間數(shù)據(jù)中深度挖掘其隱性學(xué)習(xí)模式,如分析學(xué)習(xí)者在不同時間段的學(xué)習(xí)積極性等隱性規(guī)律,對學(xué)習(xí)者的學(xué)習(xí)過程和狀態(tài)進行更深層次的剖析,使教師對學(xué)習(xí)者的學(xué)習(xí)特點有更精細(xì)化的洞察,以準(zhǔn)確把握學(xué)習(xí)者的真實需求(Peng & Xu, 2020),并進行有針對性的引導(dǎo)和幫助,進而提升其學(xué)習(xí)績效。

        五、總結(jié)展望

        本文面向當(dāng)前信息技術(shù)與教育教學(xué)融合創(chuàng)新發(fā)展的需求與趨勢,著重研究了在線教學(xué)場景下基于異步討論行為特征的學(xué)習(xí)績效預(yù)測問題,其核心在于如何從討論數(shù)據(jù)中挖掘出有教學(xué)指導(dǎo)意義和高預(yù)測效力的特征集。針對當(dāng)前研究在異步討論交互特征的多樣化、深層次信息挖掘方面存在的不足,以人口背景、行為頻數(shù)、顯性時間等基本特征信息為基礎(chǔ),重點從社會網(wǎng)絡(luò)視角引入移動窗口和傳統(tǒng)回復(fù)網(wǎng)絡(luò)特征,以及從時間信息維度提取積極性和規(guī)律性等隱性特征,不僅增加了異步討論行為特征的豐富性,得到更多對在線教學(xué)有意義的特征,而且有效提升了學(xué)習(xí)績效預(yù)測模型的性能。749A67E7-4AF0-4AD6-94CB-60315305E7B6

        未來可以進一步加大多學(xué)科交叉研究力度,利用各類新型傳感器采集在線教學(xué)環(huán)境下學(xué)習(xí)者的多模態(tài)數(shù)據(jù),如從生理、心理等多個層面對學(xué)習(xí)者的行為與特征進行關(guān)聯(lián)分析,從帖子內(nèi)容語義方面挖掘?qū)W習(xí)者的認(rèn)知風(fēng)格,提取深度融合帖子內(nèi)容語義信息的社會網(wǎng)絡(luò)特征等。同時,也可以結(jié)合智慧教室場景,引入學(xué)習(xí)者線下學(xué)習(xí)行為數(shù)據(jù),構(gòu)建線上線下多維特征融合的特征集,將在線行為拓展至混合教學(xué)情景,擴大學(xué)習(xí)行為分析空間,提升學(xué)習(xí)績效的預(yù)測能力。

        [參考文獻]

        范逸洲,汪瓊. 2018. 學(xué)業(yè)成就與學(xué)業(yè)風(fēng)險的預(yù)測——基于學(xué)習(xí)分析領(lǐng)域中預(yù)測指標(biāo)的文獻綜述[J]. 中國遠程教育(1):5-15.

        胡航,杜爽,梁佳柔,等. 2021. 學(xué)習(xí)績效預(yù)測模型構(gòu)建:源于學(xué)習(xí)行為大數(shù)據(jù)分析[J]. 中國遠程教育(4):8-20,76.

        劉三女牙,郭美伶,胡天慧,等. 2020. 不同關(guān)系定義下在線交互網(wǎng)絡(luò)特點及其與學(xué)習(xí)績效關(guān)系——以SPOC論壇為例[J]. 開放教育研究,26(3):80-90.

        劉三女牙,劉盛英杰,孫建文,等. 2021. 智能教育發(fā)展中的若干關(guān)鍵問題[J]. 中國遠程教育(4):1-7,76.

        劉三女牙,彭晛,劉智,等. 2017. 面向MOOC課程評論的學(xué)習(xí)者話題挖掘研究[J]. 電化教育研究,38(10):30-36.

        沈欣憶,劉美辰,吳健偉,等. 2020. MOOC學(xué)習(xí)者在線學(xué)習(xí)行為和學(xué)習(xí)績效評估模型研究[J]. 中國遠程教育(10):1-8,76.

        武法提,田浩. 2019. 挖掘有意義學(xué)習(xí)行為特征:學(xué)習(xí)結(jié)果預(yù)測框架[J]. 開放教育研究,25(6):75-82.

        左明章,趙蓉,王志鋒,等. 2018. 基于論壇文本的互動話語分析模式構(gòu)建與實踐[J]. 電化教育研究,39(9):51-58.

        Alyahyan, E., & Dü?teg?r, D. (2020). Predicting academic success in higher education: Literature review and best practices. International Journal of Educational Technology in Higher Education, 17(1), 1-21.

        Barbera, E., Gros, B., & Kirschner, P. A. (2015). Paradox of time in research on educational technology. Time & Society, 24(1), 96-108.

        Boroujeni, M. S., & Dillenbourg, P. (2019). Discovery and temporal analysis of MOOC study patterns. Journal of Learning Analytics, 6(1), 16-33.

        Busto, S., Dumbser, M., & Gaburro, E. (2021). A simple but efficient concept of blended teaching of mathematics for engineering students during the COVID-19 pandemic. Education Sciences, 11(2), 1-24.

        Chang, T. Y., Hsu, M. L., Kwon, J. S., Kusdhany, M. L. S., & Hong, G. (2021). Effect of online learning for dental education in asia during the pandemic of COVID-19. Journal of Dental Sciences, 16(4), 1095-1101.

        Cerezo, R., Sánchez-Santillán, M., Paule-Ruiz, M. P., & Nú?ez, J. C. (2016). Students LMS interaction patterns and their relationship with achievement: A case study in higher education. Computers & Education, 96, 42-54.

        De-Marcos, L., García-López, E., García-Cabot, A., Medina-Merodio, J. A., Domínguez, A., Martínez-Herráiz, J. J., et al. (2016). Social network analysis of a gamified e-learning course: Small-world phenomenon and network metrics as predictors of academic performance. Computers in Human Behavior, 60, 312-321.

        Espinoza, A. M., & Taut, S. (2020). Gender and psychological variables as key factors in mathematics learning: A study of seventh graders in Chile. International Journal of Educational Research, 103, 1-16.749A67E7-4AF0-4AD6-94CB-60315305E7B6

        Fincham, E., Ga?evi , D., & Pardo, A. (2018). From social ties to network processes: Do tie definitions matter? Journal of Learning Analytics, 5(2), 9-28.

        Galikyan, I., & Admiraal, W. (2019). Students engagement in asynchronous online discussion: The relationship between cognitive presence, learner prominence, and academic performance. The Internet and Higher Education, 43, 1-9.

        Gardner, J., & Brooks, C. (2018). Student success prediction in MOOCs. User Modeling and User-Adapted Interaction, 28(2), 127-203.

        Gitinabard, N., Xu, Y., Heckman, S., Barnes, T., & Lynch, C. F. (2019). How widely can prediction models be generalized? Performance prediction in blended courses. IEEE Transactions on Learning Technologies, 12(2), 184-197.

        Gray, C. C., & Perkins, D. (2019). Utilizing early engagement and machine learning to predict student outcomes. Computers & Education, 131, 22-32.

        Han, F., & Ellis, R. A. (2019). Identifying consistent patterns of quality learning discussions in blended learning. The Internet and Higher Education, 40, 12-19.

        Li, K. (2019). MOOC learners demographics, self-regulated learning strategy, perceived learning and satisfaction: A structural equation modeling approach. Computers & Education, 132, 16-30.

        Li, Q., & Baker, R. (2018). The different relationships between engagement and outcomes across participant subgroups in massive open online courses. Computers & Education, 127, 41-65.

        Peng, X., & Xu, Q. (2020). Investigating learners behaviors and discourse content in MOOC course reviews. Computers & Education, 143, 1-14.

        Romero, C., López, M. I., Luna, J. M., & Ventura, S. (2013). Predicting students final performance from participation in on-line discussion forums. Computers & Education, 68, 458-472.

        Soffer, T., & Cohen, A. (2019). Students engagement characteristics predict success and completion of online courses. Journal of Computer Assisted Learning, 35(3), 378-389.

        Tang, H., Xing, W., & Pei, B. (2019). Time really matters: Understanding the temporal dimension of online learning using educational data mining. Journal of Educational Computing Research, 57(5), 1326-1347.

        Wakelam, E., Jefferies, A., Davey, N., & Sun, Y. (2020). The potential for student performance prediction in small cohorts with minimal available attributes. British Journal of Educational Technology, 51(2), 347-370.

        Xu, X., Wang, J., Peng, H., & Wu, R. (2019). Prediction of academic performance associated with internet usage behaviors using machine learning algorithms. Computers in Human Behavior, 98, 166-173.

        Zohair, L. M. A. (2019). Prediction of students performance by modelling small dataset size. International Journal of Educational Technology in Higher Education, 16(1), 1-18.

        收稿日期:2021-08-22

        定稿日期:2021-11-03

        作者簡介:孫建文,博士,副教授,博士生導(dǎo)師;胡夢薇,碩士研究生;劉三女牙,博士,教授,博士生導(dǎo)師;李卿,博士,副教授,碩士生導(dǎo)師;沈筱譞,博士后,本文通訊作者。華中師范大學(xué)教育大數(shù)據(jù)應(yīng)用技術(shù)國家工程研究中心(430079)。

        基金項目:本文受教育部人文社會科學(xué)研究青年項目“面向啟發(fā)式教學(xué)的智能課堂編排模型與方法研究”(項目編號:20YJC880083)、國家自然科學(xué)基金面上項目“多傳感數(shù)據(jù)驅(qū)動的智能課堂共享調(diào)節(jié)機理與量化分析方法”(項目編號:62077021)、教育部-中國移動科研基金研發(fā)項目“在線教育發(fā)展現(xiàn)狀分析與政策研究”(項目編號:MCM20200406)和華中師范大學(xué)研究生教學(xué)改革研究項目“AI增強的智能課堂教學(xué)編排研究與實踐”(項目編號:2020JG14)資助。749A67E7-4AF0-4AD6-94CB-60315305E7B6

        猜你喜歡
        學(xué)習(xí)者預(yù)測特征
        無可預(yù)測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測卷(A卷)
        選修2-2期中考試預(yù)測卷(B卷)
        你是哪種類型的學(xué)習(xí)者
        十二星座是什么類型的學(xué)習(xí)者
        如何表達“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        不必預(yù)測未來,只需把握現(xiàn)在
        漢語學(xué)習(xí)自主學(xué)習(xí)者特征初探
        亚洲av日韩一卡二卡| 欧美乱人伦中文字幕在线不卡| 99久久久精品国产性黑人| 色婷婷精品午夜在线播放| 亚洲无线一二三四区手机| 国产人妻无码一区二区三区免费| 精品午夜一区二区三区久久| 日本老熟女一区二区三区| 无码专区人妻系列日韩精品| 艳妇臀荡乳欲伦交换在线播放| 亚洲VA中文字幕无码毛片春药| 女同视频网站一区二区| 99色网站| 国产人妖在线观看一区二区三区| 国产91会所女技师在线观看| 超级乱淫片国语对白免费视频| 狠狠综合久久av一区二区| 伊人网视频在线观看| 亚洲精品在线观看一区二区| 蜜桃一区二区三区视频网址| 美女无遮挡免费视频网站| 性饥渴艳妇性色生活片在线播放| 伊在人亚洲香蕉精品区麻豆| 国产av无毛无遮挡网站| 国产精品无码久久综合网| 久久精品99久久香蕉国产色戒| 国产资源精品一区二区免费| 亚洲伊人久久综合精品| 五月婷婷六月丁香久久综合| 亚洲人成电影在线播放| 一级毛片不卡在线播放免费| 成人性生交大片免费看i| 国产日产欧产精品精品蜜芽| 嫖妓丰满肥熟妇在线精品| 国产亚洲视频在线观看播放| 日本黄色特级一区二区三区| 国产情侣自拍在线视频| 真人作爱免费视频| 手机看片福利日韩国产| 午夜精品男人天堂av| 亚洲成a∨人片在线观看不卡|