作者/周利玲,武漢紡織大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院
從在線(xiàn)網(wǎng)絡(luò)課程的數(shù)據(jù),不難發(fā)現(xiàn)學(xué)習(xí)者參與在線(xiàn)論壇可以促進(jìn)學(xué)習(xí)者的學(xué)習(xí)效率,但更豐富的數(shù)據(jù)跟蹤仍有待挖掘,尤其是針對(duì)學(xué)習(xí)者論壇中互動(dòng)內(nèi)容的相關(guān)性詳細(xì)分析?;?dòng)內(nèi)容相關(guān)性的分析提供了潛在的檢測(cè)和監(jiān)控學(xué)生接觸的證據(jù),以及它如何與其他方面的行為相關(guān)聯(lián)。有數(shù)據(jù)表明,學(xué)習(xí)者在明確自己學(xué)習(xí)目標(biāo)和興趣時(shí)能更好的堅(jiān)持完成學(xué)習(xí)任務(wù)。在本文中,我們研究利用計(jì)算機(jī)語(yǔ)言模型來(lái)衡量學(xué)習(xí)者的動(dòng)機(jī)和認(rèn)知參與論壇帖子的文本。
很多變量,需要評(píng)估這些變量的預(yù)測(cè)效度,我們使用生存模型來(lái)驗(yàn)證我們的技術(shù),評(píng)估這些變量的預(yù)測(cè)效度與隨著時(shí)間推移而變化的磨損。我們結(jié)合不同類(lèi)型的MOOC課程來(lái)完成研究。之前的工作表明,參與論壇討論在所有的學(xué)生承諾是一個(gè)強(qiáng)有力的指標(biāo)。我們的方法使我們能夠更好的區(qū)分這些學(xué)生,并確定輟學(xué)可能性很大的學(xué)生,通過(guò)人口和課程的互動(dòng)提供有效的支持,給予積極的管理和支持,理論與實(shí)踐相結(jié)合。
我們的數(shù)據(jù)集來(lái)源MOOC平臺(tái)中的課程,包括三門(mén)課程:一門(mén)社會(huì)科學(xué)課程:1026個(gè)活躍用戶(hù),2107個(gè)論壇帖子;文學(xué)課程:711個(gè)活躍用戶(hù),3520個(gè)論壇帖子;編程課程:7739個(gè)活躍用戶(hù),10708個(gè)論壇帖子。所有三個(gè)課程課時(shí)都是七周,分別有七周的特定的子論壇和更多的獨(dú)立的總的講話(huà)課程討論。我們的分析僅限于討論中的行為論壇。
在MOOCS環(huán)境下對(duì)英語(yǔ)學(xué)習(xí)動(dòng)機(jī)的研究,大多數(shù)是基于調(diào)查和比較小的樣本的手工編碼的用戶(hù)確定的目標(biāo)或脫失原因。在MOOC研究中,動(dòng)機(jī)被確定為參與的重要決定因素。不同的課程設(shè)計(jì)不同的入學(xué)率鼓勵(lì)問(wèn)卷項(xiàng)目,是得難以推廣的結(jié)論成為必然。另一個(gè)缺點(diǎn)就是學(xué)習(xí)者的動(dòng)機(jī)是不穩(wěn)定的,特別是沒(méi)有明顯進(jìn)步的,學(xué)習(xí)者就可能失去興趣。重要的是檢測(cè)學(xué)習(xí)者的動(dòng)機(jī)以及它在多個(gè)星期中的變化。我們建議根據(jù)論壇帖子的語(yǔ)言提示自動(dòng)測(cè)量學(xué)習(xí)者的動(dòng)機(jī)。
在結(jié)合學(xué)生面對(duì)面課程和計(jì)算機(jī)中介通信的環(huán)境課程的研究中,發(fā)現(xiàn)涉及高階思維的認(rèn)知過(guò)程能更好的獲取知識(shí),達(dá)到更好的學(xué)習(xí)效果。在本文中,我們嘗試根據(jù)帖子中包含的個(gè)人解釋來(lái)衡量MOOC用戶(hù)的認(rèn)知參與度。
學(xué)生的動(dòng)機(jī)水平極大的影響了學(xué)生在課堂中的參與強(qiáng)度。以前的研究表明,有可能基于學(xué)生對(duì)計(jì)劃學(xué)習(xí)動(dòng)作的描述對(duì)學(xué)習(xí)者的動(dòng)機(jī)進(jìn)行分類(lèi),確定的動(dòng)機(jī)分類(lèi)與學(xué)習(xí)行為和學(xué)習(xí)成果有著很大的關(guān)系。由于較高的師生比,導(dǎo)師很難親自鑒定和考察缺乏學(xué)習(xí)動(dòng)機(jī)的學(xué)生。為了克服這些挑戰(zhàn),我們構(gòu)建機(jī)器學(xué)習(xí)模型,根據(jù)課程論壇的帖子自動(dòng)識(shí)別學(xué)習(xí)者動(dòng)機(jī)水平。我們以一般的方式驗(yàn)證我們的措施,不僅測(cè)試同一課程的數(shù)據(jù),還通過(guò)一門(mén)課程的學(xué)習(xí),然后測(cè)試另一個(gè)課程,一發(fā)現(xiàn)課程獨(dú)立的動(dòng)機(jī)線(xiàn)索。學(xué)習(xí)者動(dòng)機(jī)的語(yǔ)言學(xué)特征幫助我們理解和預(yù)測(cè)學(xué)習(xí)者動(dòng)機(jī)。
創(chuàng)建人機(jī)編碼數(shù)據(jù)集:MTurk
我們使用的Mechanical Turk(MTurk)來(lái)實(shí)現(xiàn)建立可靠的注釋語(yǔ)料庫(kù)用于開(kāi)發(fā)自動(dòng)測(cè)量學(xué)生動(dòng)機(jī)。MTurk是一個(gè)在線(xiàn)市場(chǎng)的眾包,它允許請(qǐng)求者發(fā)布工作和工作人員選擇他們想要完成的工作衡量語(yǔ)言抽象的程度,具體的話(huà)是我們可以直接看到的事情和屬性。抽象詞是指思想觀(guān)念原理即時(shí)感知,我們自動(dòng)計(jì)算一個(gè)數(shù)字評(píng)級(jí)從0(高度具體)到1(高度抽象),基于一個(gè)單詞的抽象關(guān)于從已經(jīng)找到該單詞的上下文生成的特征向量,通過(guò)添加抽象來(lái)計(jì)算每個(gè)帖子的平均級(jí)別。
關(guān)于討論帖子中課程材料的推理,認(rèn)知參與程度在解釋、分析和詮釋方面引起了人們的關(guān)注和注意。
我們使用生存分析,以驗(yàn)證參與者的測(cè)量水平較高的參與將保持活躍在論壇更長(zhǎng),控制其他論壇的行為,如有多少帖子用戶(hù)貢獻(xiàn)。我們應(yīng)用我們的語(yǔ)言措施,在第4節(jié)量化學(xué)生的參與度。我們使用的域?qū)W習(xí)動(dòng)機(jī)分類(lèi)與語(yǔ)言和單字的功能為責(zé)任的對(duì)話(huà)課和科學(xué)幻想小說(shuō)類(lèi)。我們使用的分類(lèi)培訓(xùn)的負(fù)責(zé)談話(huà)數(shù)據(jù)集分配動(dòng)機(jī)在學(xué)習(xí)課程的崗位無(wú)心標(biāo)簽。
生存模型可以被看作是一種回歸模型,捕捉的影響與時(shí)間相關(guān)的結(jié)果,例如是否發(fā)生事件。在我們的案件中,我們正在調(diào)查我們的參與措施對(duì)課程參與者退出課程論壇的影響。更具體地說(shuō),我們的目標(biāo)是了解我們是否自動(dòng)測(cè)量學(xué)生參與可以預(yù)測(cè)她參加課程論壇的時(shí)間。
對(duì)于我們的三門(mén)課程,我們包括所有積極的學(xué)生,即誰(shuí)貢獻(xiàn)了一個(gè)或更多的職位課程論壇。我們定義的時(shí)間間隔為學(xué)生參與周。我們考慮到每個(gè)學(xué)生的第一個(gè)帖子的時(shí)間戳作為該學(xué)生的起始日期參與課程討論論壇和最后一次會(huì)議的日期作為參與的結(jié)束除非是最后一周課程。
因變量:
在我們的模型中,依賴(lài)措施是輟學(xué),這是1上一個(gè)學(xué)生的最后一周活躍參與,除非它是最后一個(gè)課程周(即第七課程周),和其他0周。
控制變量:
cohort1:這是一個(gè)二元指標(biāo)描述用戶(hù)是否曾經(jīng)在上課程周(1)或否(第0)。參加早期課程的成員比其他人繼續(xù)參與討論論壇。
PostCountByUser:這是消息的帖子在論壇的成員一周數(shù),這是學(xué)生參與的一項(xiàng)基本努力。
commentcount:這是接受在論壇的評(píng)論用戶(hù)的帖子數(shù)在一周。因?yàn)檫@個(gè)變量是與PostCountByUser高度相關(guān)(r>0.70的所有三門(mén)課程)。在為了避免多重共線(xiàn)性問(wèn)題,我們只包括在最終的模型postcountbyuser。
獨(dú)立變量:
avgmotivation是一個(gè)人的職位的百分比在這周預(yù)測(cè)為“動(dòng)機(jī)”使用我們的模型與一元語(yǔ)法和語(yǔ)言特點(diǎn)。
avgcogengagement:這個(gè)變量措施后平均每一周性評(píng)分。
我們注意到,avgmotivation和avgcogengagement不與postcountByUser(所有三門(mén)課程中R<0.2)。因此,他們是正交的簡(jiǎn)單措施的學(xué)生,avgmotivation與avgabstractness不是(三個(gè)課程中R<0.10)。因此,可以將這些變量包括在同一模型中。
效果報(bào)告的輟學(xué)率(HR)是一個(gè)解釋的效果變量的風(fēng)險(xiǎn)或概率的參與者退出了課程論壇。因?yàn)樗械慕忉屪兞砍薱ohort1已經(jīng)標(biāo)準(zhǔn)化,這里的危險(xiǎn)率是預(yù)測(cè)從一個(gè)單位增加的課程論壇輟學(xué)概率的變化預(yù)測(cè)變量,即當(dāng)所有其他變量處于平均水平時(shí)cohort1從0到1或連續(xù)變量的增加變化的標(biāo)準(zhǔn)偏差。
表1 報(bào)告的生存模型的控制和獨(dú)立變量的預(yù)測(cè)進(jìn)入生存回歸
我們根據(jù)論壇帖子的語(yǔ)言分析,介紹如何衡量MOOC學(xué)生參與度的研究。我們確定了兩項(xiàng)新措施,量化參與并驗(yàn)證了三種不同內(nèi)容的Coursera課程的措施。我們會(huì)自動(dòng)識(shí)別課程論壇中哪些職位表達(dá)學(xué)習(xí)者動(dòng)機(jī)和認(rèn)知參與的程度。生存分析結(jié)果驗(yàn)證了學(xué)習(xí)者表達(dá)的動(dòng)機(jī)越多,輟學(xué)的風(fēng)險(xiǎn)就越低。同樣,參與者在其職位上顯示的個(gè)人解釋越多,課程論壇輟學(xué)率就越低。
從這項(xiàng)研究中,我們看到我們可以根據(jù)他們的論壇討論帖數(shù)量來(lái)衡量學(xué)生的參與度,改善參與度的一個(gè)重要方法就是讓學(xué)生組織學(xué)習(xí)者之間更深層次的界限,下一步可以更深入地定量探索MOOC虛擬團(tuán)隊(duì)參與者的協(xié)作行為。
* [1]David Adamson, Gregory Dyke, Hyeju Jang, and Carolyn Penstein Ros′e. Towards anagile approach to adapting dynamic collaboration support to student needs. International Journal of Artificial Intelligence in Education, 24(1)∶92—124, 2014. 4.5.3
* [2]Camiel J Beukeboom, Martin Tanis, and Ivar EVermeulen.The language of extraversion extraverted people talk more abs tractly, introverts are more concrete. Journal of Language and Social Psychology, 32(2)∶191—201, 2013. 4.4.2, 4.4.2
* [3]Stata Corp. Stata Statistical Software∶ Statistics; Data Manag ement; Graphics. Stata Press, 1997. 4.5.1
* [4]Lyn Corno and Ellen B Mandinach. The role of cognitive eng agement in classroom learning and motivation. Educational psychologist, 18(2)∶88—108, 1983. 4.3.2, 4.5.3
* [5]Diyi Yang, Tanmay Sinha, David Adamson, and Carolyn Pens tein Rose. Turn on, tune in, drop out∶ Anticipating student dro pouts in massive open online courses. In Workshop on Data Driven Education, Advances in Neural Information Processing Systems 2013, 2013. 2.1.1, 4.5.1