王文晶,閆俊伢
(山西工程科技職業(yè)大學(xué)信息工程學(xué)院,山西 太原 030619)
國際人工智能教育大會2020(AIED),大會主旨將人工智能與教育深度融合,實現(xiàn)“增強(qiáng)智能賦能教育”。Marbouti等(2016)通過挖掘本科生的課堂測驗、考試、作業(yè)等,使用樸素貝葉斯、人工神經(jīng)網(wǎng)絡(luò)等組合為一個模型,并對學(xué)習(xí)成績達(dá)到好的預(yù)測效果。Leah P.Macfadyen 等對在線生物課程數(shù)據(jù)進(jìn)行多元回歸分析、Logistic 分析以及社會網(wǎng)絡(luò)分析,開發(fā)預(yù)警系統(tǒng)。Lily Sun 構(gòu)建基于學(xué)習(xí)行為的模型,利用學(xué)習(xí)成績對學(xué)習(xí)的效果進(jìn)行驗證。維也納大學(xué)的學(xué)者通過搭建在線學(xué)習(xí)平臺,對平臺產(chǎn)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析后,對學(xué)生學(xué)習(xí)效果進(jìn)行評價。
隨著人工智能的快速發(fā)展,如何使用大數(shù)據(jù)技術(shù)對在線學(xué)習(xí)產(chǎn)生的海量數(shù)據(jù)進(jìn)行深度挖掘,對教學(xué)效果進(jìn)行精準(zhǔn)測試,是當(dāng)前智能教育研究的熱點。近幾年,我國將學(xué)習(xí)分析技術(shù)應(yīng)用于在線學(xué)習(xí)方面的論文數(shù)量呈現(xiàn)上升趨勢。數(shù)據(jù)挖掘技術(shù)采用的模型沒有固定模型,比較多樣化。如陳晉音利用神經(jīng)網(wǎng)絡(luò)的方法分析上線學(xué)習(xí)行為,對學(xué)生的成績進(jìn)行預(yù)測,分析學(xué)習(xí)行為,得出學(xué)習(xí)者的學(xué)習(xí)規(guī)律。牟智佳通過學(xué)生的學(xué)習(xí)行為和心理學(xué)、教學(xué)學(xué)理論,構(gòu)建基于學(xué)習(xí)行為序列的識別模型,將學(xué)習(xí)者分類,并進(jìn)行干預(yù)和提出學(xué)習(xí)策略。通過文獻(xiàn)對國內(nèi)外情況進(jìn)行研究對比,從文獻(xiàn)數(shù)量上看,2007年之前比較少,2015年以后論文數(shù)量逐漸快速增長,表明在線學(xué)習(xí)行為的研究,不斷受到關(guān)注和重視。從文獻(xiàn)學(xué)科分布,該學(xué)科作為一個交叉研究領(lǐng)域,基于數(shù)據(jù)挖掘的學(xué)習(xí)診斷研究受到了教育學(xué)、教育信息技術(shù)、計算機(jī)科學(xué)等不同學(xué)科的廣泛關(guān)注。從關(guān)鍵詞高頻度看,通過高頻詞看出“網(wǎng)絡(luò)學(xué)習(xí)行為”和“在線學(xué)習(xí)/網(wǎng)絡(luò)遠(yuǎn)程/教育”是學(xué)術(shù)界關(guān)注的焦點,同時反映出網(wǎng)絡(luò)學(xué)習(xí)行為主要研究慕課平臺的自主學(xué)習(xí)行為。
通過參閱文獻(xiàn),發(fā)現(xiàn)目前在線研究的落腳點基本都是與成績相關(guān)的學(xué)習(xí)行為的數(shù)據(jù)分析。例如,研究學(xué)習(xí)者參與線上教學(xué)活動地活躍度,相比之下,在線學(xué)習(xí)行為序列以及行為各要素之間的規(guī)律研究較少,并且行為序列更能反映學(xué)習(xí)者的認(rèn)知過程。同時,相關(guān)研究缺乏通用的框架,忽略學(xué)習(xí)行為投入的多層次和多維度特點。
本研究用數(shù)據(jù)挖掘方法探究以下兩個問題:①學(xué)習(xí)者在自主學(xué)習(xí)的過程中,分析哪些行為序列與成績?yōu)檎嚓P(guān),以期獲得與成績有顯著相關(guān)的關(guān)鍵序列。②通過對在線學(xué)習(xí)行為聚類分析,探究不同行為序列的學(xué)習(xí)者在學(xué)習(xí)效果上的差異。
收集268 名同學(xué)SPOC 平臺和MOOC 平臺中“智能信息處理”和“編譯技術(shù)”兩門課程的數(shù)據(jù),包括學(xué)習(xí)者產(chǎn)生或者發(fā)布的數(shù)據(jù)。利用數(shù)據(jù)處理流水線Logstash 工具,采集學(xué)生日常在兩個平臺生成的數(shù)據(jù)日志,例如課程數(shù)據(jù)、作業(yè)數(shù)據(jù)、考試數(shù)據(jù)、觀看教學(xué)視頻等,利用Elasticsearch 軟件,對數(shù)據(jù)進(jìn)行清洗、抽取。通過交互序列分析軟件GSEQ 工具進(jìn)行頻次矩陣統(tǒng)計,得到關(guān)于學(xué)習(xí)者數(shù)據(jù)的231 個行為序列。通過參閱文獻(xiàn)中學(xué)習(xí)行為分類的方法,同時結(jié)合在線學(xué)習(xí)的特點和學(xué)生學(xué)習(xí)行為的特征,本文將在線學(xué)習(xí)劃分為四種:訪問課程行為、參與討論行為、學(xué)習(xí)資源行為、測試學(xué)習(xí)效果行為。將231 個行為序列分別劃分到四類行為中,如表1所示。
表1 行為序列分類和編碼
通過分析工具SPSS20.0,得到18個課程訪問序列和成績之間的關(guān)聯(lián)表,具體如表2 所示。CJGW、LYCJ、CJTZ 與成績有顯著的關(guān)聯(lián),CJGW、LYCJ 相關(guān)系數(shù)分別0.567 和0.543,三個學(xué)習(xí)行為顯著概率均為0.000,表明這兩種行為序列轉(zhuǎn)換與課程成績有顯著的正相關(guān)關(guān)聯(lián)。學(xué)習(xí)者在關(guān)注自己學(xué)習(xí)進(jìn)度的情況下,會針對自己薄弱的環(huán)節(jié)進(jìn)行學(xué)習(xí),例如再次進(jìn)行課程學(xué)習(xí)和參與一些學(xué)習(xí)主題的討論,對提高學(xué)習(xí)成績有顯著的作用,學(xué)習(xí)者在教師授課前,主動對教學(xué)內(nèi)容預(yù)習(xí)、計劃,這些行為都是積極有效的。CJTZ 學(xué)習(xí)序列沒有與成績有顯著的關(guān)聯(lián),顯著性為0.002,相對查看學(xué)習(xí)進(jìn)度頁面后,再進(jìn)行課件學(xué)習(xí),對成績的促進(jìn)起更重要的作用。
表2 課程訪問行為與成績相關(guān)分析
由表3可得出,學(xué)習(xí)者通過網(wǎng)頁->查看課件資源,與成績的相關(guān)系數(shù)為0.823,顯著率為0.000,與成績有極高的相關(guān)度。通過數(shù)據(jù)顯示,學(xué)習(xí)者在課程資源上預(yù)習(xí),投入時間和精力,學(xué)習(xí)成績會更好學(xué)習(xí)者先查找網(wǎng)絡(luò)資源然后參與討論,此序列與成績相關(guān)系數(shù)為0.712,顯著率為0.000。學(xué)習(xí)者學(xué)習(xí)完教師的課件文檔轉(zhuǎn)至討論發(fā)帖,表明學(xué)習(xí)者對課程的掌握程度以及吸收、轉(zhuǎn)換知識的程度。CJBC 與課程成績相關(guān)系數(shù)為-0.415,顯著率為0.000,負(fù)相關(guān)表明學(xué)習(xí)者可能在觀看視頻中可能出現(xiàn)拖動進(jìn)度條或者學(xué)習(xí)頻次低,或者掛線。其他兩個行為序列與成績?yōu)榈投认嚓P(guān)(0.462和0.456),涉及到共享資源學(xué)習(xí)和其他序列之間的轉(zhuǎn)換,反映出學(xué)習(xí)者學(xué)習(xí)的多樣性,但學(xué)習(xí)成績較中等,說明學(xué)習(xí)者的行為為低層次投入的序列轉(zhuǎn)換。
表3 資源學(xué)習(xí)行為序列與成績相關(guān)分析
從表4 可看出,三個測試行為序列與學(xué)習(xí)者成績有低相關(guān)度,也反映出學(xué)習(xí)者在測試之前的行為序列蹤跡。LCBC 行為序列表明,學(xué)生在測試之前,通過課件文檔,復(fù)習(xí)所學(xué)內(nèi)容,然后進(jìn)行測試,學(xué)習(xí)效果會得到提升,符合學(xué)習(xí)者學(xué)習(xí)規(guī)律。BCCJ 行為序列表明學(xué)習(xí)者測試后對學(xué)習(xí)進(jìn)度進(jìn)行追溯,可看出學(xué)習(xí)者比較重視學(xué)習(xí)情況和知識點的掌握程度,間接與成績發(fā)生關(guān)聯(lián)。CJGW 行為序列表明學(xué)生在進(jìn)行測試完成后,發(fā)現(xiàn)問題,重新返回查看文檔,這個動作序列被不斷重復(fù),一方面,表明學(xué)習(xí)成績的導(dǎo)向性導(dǎo)致學(xué)習(xí)者不斷重復(fù)學(xué)習(xí)資料,另一方面,也表明課件是學(xué)習(xí)者學(xué)習(xí)課程的重要資料,也是測試的依據(jù)。
表4 學(xué)習(xí)行為序列與成績相關(guān)分析
表5 中可看出,新討論主題->上傳共享資源行為序列與成績相關(guān)性最高,說明學(xué)習(xí)者通過討論方式對知識有更好的理解,循循漸進(jìn)的學(xué)習(xí),對知識有更深的理解,從而進(jìn)一步發(fā)帖,表明對教學(xué)知識點的深入掌握,同時也表明對學(xué)習(xí)有高的積極性和學(xué)習(xí)動機(jī)。LTGW 行為序列與成績相關(guān)度為0.006,表明此序列轉(zhuǎn)換與成績沒有關(guān)聯(lián),同時反映出討論參與行為與學(xué)習(xí)效果是由強(qiáng)的關(guān)聯(lián)關(guān)系。通過研究LTGW 行為序列的學(xué)習(xí)者參與的討論和發(fā)表的主題,基本偏離主體內(nèi)容,可能是由于學(xué)習(xí)者缺乏知識的建構(gòu)和成績導(dǎo)向的引導(dǎo),導(dǎo)致學(xué)習(xí)者的參與度較低。
表5 參與行為序列與成績相關(guān)分析
由于單變量分析不一定能正確反映學(xué)習(xí)者的情況,故本文又采用多元線性回歸方法,探討行為序列對學(xué)習(xí)效果的影響。根據(jù)聚類分析結(jié)果得到,訪問課程行為參與數(shù)(C)、學(xué)習(xí)行為序列參與數(shù)(S)、參與行為序列參與數(shù)(I)、學(xué)習(xí)資源行為參與數(shù)(R)四類行為序列特征。通過聚類方法對行為序列特征進(jìn)行聚類分析,聚類結(jié)果為四類,如表6 所示。在聚類分析中,各個行為序列都有顯著性,都為0.000,同時可看出,聚類選取的變量比較合理,但是各個行為序列變量在不同類之間的顯著性有所差別。故在此基礎(chǔ)上,對四類行為序列的參與程度做相關(guān)分析,如圖1所示。
表6 聚類結(jié)果
圖1為四類學(xué)習(xí)者參與訪問課程、學(xué)習(xí)行為、參與行為序列、學(xué)習(xí)資源四種活動的參與數(shù)。學(xué)習(xí)者參與程度最高的是C活動,參與數(shù)最低的I活動,每一類學(xué)習(xí)者體現(xiàn)到不同的學(xué)習(xí)行為上的數(shù)據(jù)也不同,這就體現(xiàn)出學(xué)習(xí)者在線學(xué)習(xí)中的個性化、差異化,具體如下:
第一類,學(xué)習(xí)自主型,共計5人,占總?cè)藬?shù)3.9%,此類學(xué)習(xí)者人數(shù)占比是最低的,參加C1R1S1I1的均值均高于其他三類,活躍度較高,能夠充分利用在線學(xué)習(xí)提供的資源來重構(gòu)知識,主動學(xué)習(xí)者,有強(qiáng)的自主學(xué)習(xí)動力,較少依賴教師,有較好的學(xué)習(xí)習(xí)慣。
第二類,游離型,共51人,占總?cè)藬?shù)39.6%,此類學(xué)習(xí)者討論參與數(shù)高于第三類和第四類學(xué)習(xí)者,參與行為序列高于平均水平,參加討論活動的積極性較高,參與學(xué)習(xí)的時長也高于總體平均水平,但參與課程測試、訪問課程資源次數(shù)較低,不活躍,所以需要提供給此類學(xué)習(xí)者學(xué)習(xí)策略和有效的個性化學(xué)習(xí)路徑,從而提升學(xué)習(xí)動機(jī)和自身自控能力。
第三類,順應(yīng)型,學(xué)習(xí)者的重心放在測試、資源和課程學(xué)習(xí)上,共21 人,占總數(shù)16.1%,從圖1 可看出,此類學(xué)習(xí)者對資源和課程訪問的序列值相對高,有可能只是跟隨教師進(jìn)行淺層次的學(xué)習(xí),學(xué)習(xí)積極性較高,但是參與討論行為較少,對此類學(xué)習(xí)者,應(yīng)考慮推薦更優(yōu)質(zhì)的資源和個性化學(xué)習(xí)方案。
圖1 各類學(xué)習(xí)者參與行為序列活動數(shù)
第四類,低投入型,共178 人,占總?cè)藬?shù)40.4%,此類學(xué)習(xí)者比其他三個類別參與學(xué)習(xí)序列值低,在平臺中缺乏學(xué)習(xí)動力,不是很重視成績的高低,只是為了完成教師布置的任務(wù),由于此類人數(shù)占比大,所以教師更應(yīng)關(guān)注此類學(xué)習(xí)者,加強(qiáng)教學(xué)設(shè)計、注重情境教學(xué),激發(fā)其對知識的渴望和學(xué)習(xí)動力,并實時跟蹤其學(xué)習(xí)路徑,推薦有效的學(xué)習(xí)路徑和教學(xué)策略。
本文將在線學(xué)習(xí)行為投入理論與行為序列聚類結(jié)果相結(jié)合,研究基于學(xué)習(xí)序列與成績之間的關(guān)聯(lián),從而幫助學(xué)習(xí)者建立正確的學(xué)習(xí)行為模式,進(jìn)而提高學(xué)習(xí)效果。首先使用單一相關(guān)分析四類學(xué)習(xí)行為與成績之間的關(guān)聯(lián),然后用多元線性回歸方法,確定四類學(xué)習(xí)行為中影響學(xué)習(xí)效果的關(guān)鍵行為序列,并分析行為序列變量對學(xué)習(xí)效果的影響。由于本模型的實驗樣本是建立在兩門計算機(jī)專業(yè)課程的數(shù)據(jù)上,選取的學(xué)科樣本和年級有一定的局限性,所以收集的數(shù)據(jù)不能完全反映在線學(xué)習(xí)的全貌,下一步將增大樣本的數(shù)量,進(jìn)一步完善分析結(jié)果。同時采用多種學(xué)習(xí)分析技術(shù)進(jìn)行對比實驗,遵循個性化偏好和差異,給學(xué)習(xí)者量身定做有效的個性化學(xué)習(xí)路徑。