楊現(xiàn)民 袁萌 李康康
[摘? ?要] 大規(guī)模開(kāi)放協(xié)同環(huán)境給網(wǎng)絡(luò)學(xué)習(xí)資源的高效管理帶來(lái)了新挑戰(zhàn),基于瀏覽量與評(píng)分排名的傳統(tǒng)管理方法難以保證高質(zhì)量網(wǎng)絡(luò)學(xué)習(xí)資源的生成與持續(xù)進(jìn)化。如何建構(gòu)智能化的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警模型,是大數(shù)據(jù)時(shí)代破解網(wǎng)絡(luò)學(xué)習(xí)資源高效管理的核心問(wèn)題。該研究以網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警任務(wù)的實(shí)施流程為依據(jù),在探討資源進(jìn)化態(tài)表征、資源進(jìn)化要素項(xiàng)提取、資源進(jìn)化態(tài)標(biāo)注、資源進(jìn)化預(yù)警任務(wù)的數(shù)學(xué)定義等問(wèn)題的基礎(chǔ)上,構(gòu)建了網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警的技術(shù)模型。通過(guò)學(xué)習(xí)元平臺(tái)的兩個(gè)數(shù)據(jù)集實(shí)驗(yàn)驗(yàn)證表明,研究提出的預(yù)警模型在預(yù)測(cè)精準(zhǔn)率、F1和AUC等指標(biāo)方面表現(xiàn)優(yōu)于對(duì)比算法,能較好地完成網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警的任務(wù)。
[關(guān)鍵詞] 網(wǎng)絡(luò)學(xué)習(xí)資源; 學(xué)習(xí)資源進(jìn)化; 預(yù)警模型; 深度學(xué)習(xí); 卷積神經(jīng)網(wǎng)絡(luò)
[中圖分類(lèi)號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 楊現(xiàn)民(1982—),男,河北邢臺(tái)人。教授,博士,主要從事智慧教育、教育大數(shù)據(jù)、網(wǎng)絡(luò)學(xué)習(xí)資源研究。E-mail:yangxianmin8888@163.com。
一、引? ?言
新冠肺炎疫情對(duì)各級(jí)各類(lèi)教育系統(tǒng)都產(chǎn)生了巨大沖擊,凸顯出海量網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化不足導(dǎo)致的質(zhì)量不佳與個(gè)性化嚴(yán)重缺失的問(wèn)題,因此,網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化的研究變得尤為重要。當(dāng)前,雖然在學(xué)習(xí)資源進(jìn)化的概念模型、關(guān)鍵技術(shù)以及單模態(tài)資源進(jìn)化規(guī)律等方面的研究取得積極進(jìn)展,但在網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警的關(guān)鍵技術(shù)方面尚未取得突破,而預(yù)警機(jī)制的建設(shè)對(duì)于高效管理海量學(xué)習(xí)資源、持續(xù)提升資源品質(zhì),具有至關(guān)重要意義。當(dāng)前網(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域的預(yù)警技術(shù),主要以學(xué)習(xí)者為預(yù)警對(duì)象,通過(guò)傳統(tǒng)的機(jī)器學(xué)習(xí)算法建立預(yù)警技術(shù)模型,應(yīng)用于諸如課程成績(jī)預(yù)警、學(xué)業(yè)輟學(xué)預(yù)警等教學(xué)服務(wù)場(chǎng)景。由于網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化影響因素的復(fù)雜性與動(dòng)態(tài)變化特征,當(dāng)前以學(xué)習(xí)者為預(yù)警對(duì)象的傳統(tǒng)機(jī)器學(xué)習(xí)算法模型,難以實(shí)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化的精準(zhǔn)預(yù)測(cè)和預(yù)警信息的有效反饋?;诖?,本研究嘗試結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和Word2Vector技術(shù),構(gòu)建網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警模型,以期為教育信息化2.0時(shí)代下大規(guī)模網(wǎng)絡(luò)學(xué)習(xí)資源的質(zhì)量提升與智能管理提供技術(shù)支撐。
二、相關(guān)研究
(一)網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化研究現(xiàn)狀
學(xué)習(xí)資源進(jìn)化是指學(xué)習(xí)資源為滿(mǎn)足學(xué)習(xí)者各種動(dòng)態(tài)、個(gè)性化的學(xué)習(xí)需求而進(jìn)行自身內(nèi)容和結(jié)構(gòu)完善及調(diào)整的過(guò)程[1]。網(wǎng)絡(luò)學(xué)習(xí)資源包括開(kāi)放知識(shí)社區(qū)資源、網(wǎng)絡(luò)課程資源、學(xué)習(xí)軟件資源等多種形態(tài),每種資源的進(jìn)化方式和特點(diǎn)各不相同。典型的開(kāi)放知識(shí)社區(qū)資源如Wiki百科、學(xué)習(xí)元、百度詞條等,其進(jìn)化方式是由普通用戶(hù)對(duì)同一詞條進(jìn)行編輯修改以實(shí)現(xiàn)詞條內(nèi)容的不斷完善[2]。詞條內(nèi)容的潛在專(zhuān)業(yè)性要求促使具有相關(guān)領(lǐng)域知識(shí)的用戶(hù)群體協(xié)同維護(hù)同一內(nèi)容,保證了資源更新的及時(shí)性、前沿性和完善性。但因用戶(hù)群體的知識(shí)水平不平衡性和匿名性,開(kāi)放知識(shí)社區(qū)資源存在一定的質(zhì)量問(wèn)題和信任度問(wèn)題[3]。因此,部分學(xué)者提出通過(guò)資源內(nèi)容協(xié)同編輯和版本控制技術(shù)等方式改善詞條質(zhì)量[4-5]。網(wǎng)絡(luò)課程資源和學(xué)習(xí)軟件資源的進(jìn)化方式主要由專(zhuān)業(yè)團(tuán)隊(duì)設(shè)計(jì)、制作、發(fā)布和更新,故此類(lèi)型資源結(jié)構(gòu)都相對(duì)比較穩(wěn)定,但其進(jìn)化周期較長(zhǎng)、迭代成本較高[6]。
近年來(lái),圍繞學(xué)習(xí)資源進(jìn)化模型的研究主要從生態(tài)學(xué)視角探討資源的內(nèi)容進(jìn)化和資源的關(guān)聯(lián)進(jìn)化。從生態(tài)學(xué)角度看,學(xué)習(xí)資源類(lèi)似生命有機(jī)體,同樣具有生命周期, 主要呈現(xiàn)“產(chǎn)生—生長(zhǎng)—成熟—衰退—淘汰”的一般發(fā)展軌跡[7]。徐劉杰等[8]以后現(xiàn)代知識(shí)觀為指導(dǎo),建構(gòu)出泛在學(xué)習(xí)資源進(jìn)化的動(dòng)力模型,提出學(xué)習(xí)資源進(jìn)化動(dòng)力分為內(nèi)外兩種動(dòng)力,分別是由用戶(hù)選擇和環(huán)境選擇構(gòu)成的資源進(jìn)化外部動(dòng)力以及由資源之間的競(jìng)爭(zhēng)與協(xié)同(自組織行為)構(gòu)成的資源進(jìn)化內(nèi)部動(dòng)力。從資源進(jìn)化的內(nèi)容更新迭代來(lái)看,針對(duì)大規(guī)模開(kāi)放環(huán)境下學(xué)習(xí)資源內(nèi)容進(jìn)化質(zhì)量難以控制的問(wèn)題,有學(xué)者提出基于語(yǔ)義基因和信任評(píng)估的內(nèi)容進(jìn)化智能控制模型[9]、網(wǎng)絡(luò)信息資源利用與再生的一般模型[10]等研究,從版本控制技術(shù)和內(nèi)容參與方行為意向等方面改善資源內(nèi)容進(jìn)化。從資源關(guān)聯(lián)進(jìn)化來(lái)看,針對(duì)在資源關(guān)聯(lián)進(jìn)化中的靜態(tài)關(guān)系元數(shù)據(jù)無(wú)法有效描述語(yǔ)義層面關(guān)系的問(wèn)題,有學(xué)者提出利用語(yǔ)義本體[11-12]、關(guān)聯(lián)數(shù)據(jù)[13-14]、數(shù)據(jù)挖掘[15]、知識(shí)圖譜[16-17]等技術(shù)研究學(xué)習(xí)資源的關(guān)聯(lián)網(wǎng)絡(luò),以增強(qiáng)泛在學(xué)習(xí)資源進(jìn)化“健壯性”。
總體而言,當(dāng)前大多數(shù)的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化模型屬于概念性模型,缺乏進(jìn)化狀態(tài)的量化表征和統(tǒng)計(jì)數(shù)據(jù),亟須深入開(kāi)展網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警的實(shí)證研究,研發(fā)網(wǎng)絡(luò)學(xué)習(xí)資源的預(yù)警技術(shù)模型,提升大規(guī)模網(wǎng)絡(luò)學(xué)習(xí)資源的進(jìn)化質(zhì)量和管理效能。
(二)網(wǎng)絡(luò)學(xué)習(xí)中的預(yù)警技術(shù)研究
當(dāng)前國(guó)內(nèi)外教育領(lǐng)域有關(guān)預(yù)警技術(shù)的研究,主要集中于網(wǎng)絡(luò)學(xué)習(xí)方面,相關(guān)預(yù)警技術(shù)對(duì)于網(wǎng)絡(luò)學(xué)習(xí)資源預(yù)警模型的構(gòu)建具有借鑒意義。近年來(lái),為應(yīng)對(duì)網(wǎng)絡(luò)學(xué)習(xí)中課業(yè)完成率低等問(wèn)題,相關(guān)機(jī)構(gòu)已研發(fā)出一些學(xué)習(xí)預(yù)警產(chǎn)品,如Course Signals、Starfish Early Alert System等。當(dāng)前網(wǎng)絡(luò)學(xué)習(xí)預(yù)警研究主要采用數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn)。研究者們通過(guò)整合學(xué)習(xí)者的背景信息、學(xué)習(xí)成績(jī)歷史數(shù)據(jù)以及課程學(xué)習(xí)的過(guò)程性數(shù)據(jù),選擇適合的數(shù)據(jù)挖掘方法,比如預(yù)測(cè)/分類(lèi)、聚類(lèi)、關(guān)聯(lián)分析、時(shí)間序列分析等,構(gòu)建學(xué)習(xí)預(yù)警模型,以實(shí)現(xiàn)課程成績(jī)預(yù)警[18]、學(xué)業(yè)表現(xiàn)預(yù)警[19]與輟學(xué)預(yù)警[20]。在具體挖掘算法的選擇上,使用最多的是線(xiàn)性回歸、邏輯回歸、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)和支持向量機(jī)等算法。由于研究情境、面向?qū)ο笠约斑\(yùn)行平臺(tái)的差異,無(wú)法確切地判定哪一種數(shù)據(jù)挖掘算法是最佳的。因此,研究者們大多綜合比較多種算法來(lái)構(gòu)建學(xué)習(xí)預(yù)警模型,以期達(dá)到特定情境下的最優(yōu)預(yù)警效果。例如,Kotsiantis[21]通過(guò)比較 M5 樹(shù)模型、M5 規(guī)則樹(shù)模型、神經(jīng)網(wǎng)絡(luò)、線(xiàn)性回歸、局部加權(quán)線(xiàn)性回歸、支持向量機(jī)等六種技術(shù),發(fā)現(xiàn) M5 規(guī)則樹(shù)模型的成績(jī)預(yù)測(cè)準(zhǔn)確率最高,且可理解性最好;Hu等[22]搜集了一門(mén)本科課程所有的學(xué)習(xí)活動(dòng)數(shù)據(jù),比較C4.5、CART(Classification And Regression Tree)和邏輯回歸三種技術(shù)構(gòu)建預(yù)警模型的準(zhǔn)確性,最后發(fā)現(xiàn)集成了自適應(yīng)增強(qiáng)技術(shù)的 CART 模型效果最好。
隨著人工智能技術(shù)的快速發(fā)展及其在教育領(lǐng)域的拓展應(yīng)用,采用神經(jīng)網(wǎng)絡(luò)模型開(kāi)展在線(xiàn)學(xué)習(xí)成績(jī)預(yù)警的研究也日漸增多。例如,李景奇等[23]開(kāi)發(fā)了基于 BKT(Bayesian Knowledge Tracing)的網(wǎng)絡(luò)教學(xué)跟蹤評(píng)價(jià)模型,可以實(shí)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)的成績(jī)預(yù)測(cè)與預(yù)警;Yang 等[24]使用在線(xiàn)視頻學(xué)習(xí)行為數(shù)據(jù)訓(xùn)練了一個(gè)時(shí)間序列神經(jīng)網(wǎng)絡(luò),用來(lái)對(duì)MOOC學(xué)習(xí)者的成績(jī)進(jìn)行動(dòng)態(tài)預(yù)警;陳晉音等[25]基于在線(xiàn)學(xué)習(xí)行為特征數(shù)據(jù),提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)成績(jī)預(yù)測(cè)方法。除了研究在線(xiàn)學(xué)習(xí)成績(jī)預(yù)警外,有學(xué)者開(kāi)始關(guān)注網(wǎng)絡(luò)學(xué)習(xí)過(guò)程中的情緒與情感狀態(tài)監(jiān)測(cè)及其預(yù)警。例如,F(xiàn)ei等[26]以MOOC平臺(tái)中的課程論壇交互文本數(shù)據(jù)為樣本,融合Word2vec模型與機(jī)器學(xué)習(xí)算法構(gòu)建了學(xué)習(xí)者情感分類(lèi)器,用于預(yù)測(cè) MOOC 學(xué)習(xí)者的情感變化;Wang等[27]利用語(yǔ)義分析模型來(lái)跟蹤在線(xiàn)學(xué)習(xí)者的情感傾向,并通過(guò)情感量化機(jī)器學(xué)習(xí)方法構(gòu)建了學(xué)業(yè)預(yù)警模型,能夠及時(shí)發(fā)現(xiàn)無(wú)法正常完成學(xué)業(yè)的學(xué)生;還有學(xué)者[28]結(jié)合情感分析技術(shù),建立機(jī)器學(xué)習(xí)模型,識(shí)別在線(xiàn)學(xué)習(xí)者的抑郁、焦慮等心理狀態(tài),進(jìn)而開(kāi)展多層面的心理預(yù)警??傮w來(lái)看,網(wǎng)絡(luò)學(xué)習(xí)預(yù)警研究呈現(xiàn)出從認(rèn)知層面到非認(rèn)知層面、從經(jīng)典數(shù)據(jù)挖掘算法到神經(jīng)網(wǎng)絡(luò)算法不斷拓展和升級(jí)的趨勢(shì)。
綜上可知,當(dāng)前網(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域的預(yù)警研究主要以學(xué)習(xí)者為預(yù)警對(duì)象,通過(guò)多維度數(shù)據(jù)(如成績(jī)、行為、社會(huì)特征等)的挖掘,構(gòu)建課程成績(jī)預(yù)警模型、學(xué)業(yè)表現(xiàn)預(yù)警模型、學(xué)生輟學(xué)預(yù)警模型以及學(xué)生心理預(yù)警模型,對(duì)于改善網(wǎng)絡(luò)學(xué)習(xí)品質(zhì)起到了積極作用。然而,從預(yù)警技術(shù)來(lái)看,仍以傳統(tǒng)的機(jī)器學(xué)習(xí)算法為主,在前沿的深度學(xué)習(xí)算法研究與應(yīng)用上仍有很大發(fā)展空間。此外,學(xué)習(xí)資源也是網(wǎng)絡(luò)學(xué)習(xí)生態(tài)的關(guān)鍵要素,對(duì)資源的生成與進(jìn)化進(jìn)行動(dòng)態(tài)預(yù)警,是解決當(dāng)前教育信息化領(lǐng)域資源更新緩慢、應(yīng)用率偏低、管理效能低下等現(xiàn)實(shí)問(wèn)題的重要途徑,是一項(xiàng)極具挑戰(zhàn)性的新課題。
三、網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警模型構(gòu)建
為科學(xué)地構(gòu)建網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化的預(yù)警模型,本研究設(shè)計(jì)了完整的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警流程,如圖1所示。該流程主要涉及數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)聚類(lèi)、預(yù)警任務(wù)數(shù)學(xué)定義、深度學(xué)習(xí)模型、模型訓(xùn)練和實(shí)驗(yàn)、預(yù)警應(yīng)用七個(gè)步驟。在預(yù)警任務(wù)執(zhí)行中涉及幾個(gè)基礎(chǔ)性問(wèn)題需要明確,分別是資源進(jìn)化態(tài)如何表征、需要抽取哪些資源進(jìn)化要素項(xiàng)、資源進(jìn)化態(tài)如何標(biāo)注以及資源進(jìn)化預(yù)警任務(wù)如何進(jìn)行數(shù)學(xué)定義,最后才能構(gòu)建完整的資源進(jìn)化預(yù)警模型。
(一)進(jìn)化態(tài)表征
從生態(tài)學(xué)角度看,泛在學(xué)習(xí)資源生態(tài)中網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化包括內(nèi)容進(jìn)化和關(guān)聯(lián)進(jìn)化兩種模式。在進(jìn)化過(guò)程中,網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化過(guò)程類(lèi)似生命有機(jī)體的發(fā)展過(guò)程一般,同樣經(jīng)歷“初始、生長(zhǎng)、健壯、衰老和死亡”的生命周期, 呈現(xiàn)出“產(chǎn)生—生長(zhǎng)—成熟—衰退—淘汰”的一般發(fā)展軌跡。從網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化的動(dòng)力模型看,學(xué)習(xí)資源的進(jìn)化動(dòng)力來(lái)源于由用戶(hù)選擇和環(huán)境選擇構(gòu)成的資源進(jìn)化外部動(dòng)力以及由資源之間的競(jìng)爭(zhēng)與協(xié)同(自組織行為)構(gòu)成的資源進(jìn)化內(nèi)部動(dòng)力,這兩種動(dòng)力構(gòu)成學(xué)習(xí)資源進(jìn)化的生命力,促使學(xué)習(xí)資源不斷地進(jìn)化發(fā)展。學(xué)習(xí)資源在進(jìn)化過(guò)程中,受兩種動(dòng)力此消彼長(zhǎng)的影響,其發(fā)展軌跡相對(duì)于生命體的發(fā)展也更加復(fù)雜多變,但總體趨勢(shì)不會(huì)跳出一般的發(fā)展軌跡。
基于以上認(rèn)識(shí),我們將網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化的狀態(tài)劃分為:初始態(tài)、成長(zhǎng)態(tài)、穩(wěn)定態(tài)、衰退態(tài)、死亡態(tài)五種狀態(tài),分別編碼為yi={0,1,2,3,4}。如圖2所示,網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化過(guò)程大致可分為三種情況:一是學(xué)習(xí)資源自創(chuàng)建以來(lái),幾乎沒(méi)有內(nèi)容建設(shè)和更新,信息量始終處于較低的水平,如圖2類(lèi)別1曲線(xiàn);二是學(xué)習(xí)資源自創(chuàng)建以來(lái),一直處于建設(shè)、更新、被瀏覽和關(guān)注的狀態(tài),信息量由不斷增加到處于穩(wěn)定的狀態(tài),如圖2類(lèi)別2曲線(xiàn);三是學(xué)習(xí)資源經(jīng)歷了成長(zhǎng)態(tài)、衰退態(tài)和死亡態(tài)的過(guò)程,這是因?yàn)閷W(xué)習(xí)資源在一段時(shí)間內(nèi)關(guān)注度攀升,但隨著資源建設(shè)出現(xiàn)滯后、停滯,出現(xiàn)較大紕漏等問(wèn)題,使得用戶(hù)點(diǎn)踩數(shù)、負(fù)面評(píng)論逐漸增多,信息量呈現(xiàn)負(fù)增長(zhǎng)狀態(tài)直至死亡態(tài),如圖2類(lèi)別3曲線(xiàn)。歸納分析三種不同類(lèi)別的網(wǎng)絡(luò)學(xué)習(xí)資源的進(jìn)化進(jìn)程,總結(jié)各進(jìn)化態(tài)定義如下:(1)初始態(tài)表示網(wǎng)絡(luò)學(xué)習(xí)資源初始創(chuàng)建的狀態(tài),此時(shí)學(xué)習(xí)資源的各項(xiàng)指標(biāo)尚處于初步積累階段,由資源進(jìn)化相關(guān)的數(shù)據(jù)特征信息計(jì)算所得的信息量處于起始狀態(tài);(2)成長(zhǎng)態(tài)表示學(xué)習(xí)資源不斷被用戶(hù)選擇、使用、更新、評(píng)論,且呈現(xiàn)出信息量不斷增長(zhǎng)的狀態(tài),此時(shí)學(xué)習(xí)資源的各項(xiàng)指標(biāo)較為活躍;(3)穩(wěn)定態(tài)表示學(xué)習(xí)資源被用戶(hù)使用、更新的頻率處于平緩穩(wěn)定狀態(tài)階段,且與資源進(jìn)化相關(guān)的信息量持續(xù)處于較高的活躍期;(4)衰退態(tài)表示信息量不斷降低的狀態(tài)階段,此時(shí)因?qū)W習(xí)資源內(nèi)容過(guò)時(shí)或結(jié)構(gòu)不合理等原因,用戶(hù)的負(fù)面信息或整改意見(jiàn)不斷增加,而學(xué)習(xí)資源遲遲不進(jìn)行優(yōu)化,導(dǎo)致信息體量出現(xiàn)降低的現(xiàn)象;(5)死亡態(tài)表示學(xué)習(xí)資源基本沒(méi)有用戶(hù)選擇、使用、更新或評(píng)論的狀態(tài)階段。死亡態(tài)包括兩種情況:一種是學(xué)習(xí)資源信息體量由衰退態(tài)逐漸退化到信息量長(zhǎng)期處于較低的信息量階段;另一種是學(xué)習(xí)資源自創(chuàng)建以來(lái),始終處于極少量用戶(hù)選擇、使用、更新或評(píng)論的狀態(tài)階段,表現(xiàn)為信息量長(zhǎng)期處于低水平建設(shè)狀態(tài)。
(二)進(jìn)化要素項(xiàng)提取
網(wǎng)絡(luò)學(xué)習(xí)資源包含種類(lèi)繁多,各自媒體的表征形式與結(jié)構(gòu)復(fù)雜性都不相同,為深入聚焦某一種網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警技術(shù)的研發(fā),本研究表述的網(wǎng)絡(luò)學(xué)習(xí)資源特指開(kāi)放知識(shí)學(xué)習(xí)資源,例如維基百科、學(xué)習(xí)元等平臺(tái)產(chǎn)生的學(xué)習(xí)資源。在開(kāi)放知識(shí)學(xué)習(xí)資源方面,反映此類(lèi)學(xué)習(xí)資源進(jìn)化狀態(tài)的要素有很多,因此需要對(duì)共性要素指標(biāo)進(jìn)行總結(jié)分析,篩選影響學(xué)習(xí)資源進(jìn)化的要素組合成數(shù)據(jù)的特征空間。通過(guò)對(duì)學(xué)習(xí)資源概念模型、資源進(jìn)化模式以及資源進(jìn)化評(píng)價(jià)指標(biāo)的前期研究,本研究確定從七個(gè)方面的資源進(jìn)化要素項(xiàng)評(píng)估學(xué)習(xí)資源的進(jìn)化狀態(tài)。具體要素項(xiàng)見(jiàn)表1。這些資源進(jìn)化要素項(xiàng)包括:內(nèi)容更新信息、資源關(guān)聯(lián)信息、資源使用信息、資源批注信息、資源評(píng)分信息、資源受歡迎信息和資源時(shí)間信息。每一項(xiàng)進(jìn)化要素都有具體的細(xì)化項(xiàng)指標(biāo)與之對(duì)應(yīng)。因此,可依據(jù)該細(xì)化項(xiàng)指標(biāo)采集數(shù)據(jù),組成數(shù)據(jù)的輸入空間進(jìn)行特征提取和表征,通過(guò)構(gòu)建深度學(xué)習(xí)模型,預(yù)測(cè)網(wǎng)絡(luò)學(xué)習(xí)資源處于哪個(gè)階段的進(jìn)化狀態(tài),以實(shí)現(xiàn)衰退態(tài)或死亡態(tài)的及時(shí)預(yù)警。
(三)進(jìn)化態(tài)標(biāo)注
依據(jù)網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化要素細(xì)化項(xiàng)指標(biāo),在收集初步的數(shù)據(jù)之后,還需要對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、歸約和轉(zhuǎn)換等數(shù)據(jù)處理操作。數(shù)據(jù)清洗處理主要包括一致化處理、異常值處理和缺失值處理。一致化處理目的是解決數(shù)據(jù)采集過(guò)程中數(shù)據(jù)類(lèi)型不一致問(wèn)題。針對(duì)缺失值,本研究主要采取補(bǔ)0操作。通過(guò)數(shù)據(jù)分析所得的異常數(shù)據(jù),則采用舍棄的方法。數(shù)據(jù)歸約主要是通過(guò)維度歸約和數(shù)據(jù)抽樣的方法,降低數(shù)據(jù)的冗余,使數(shù)據(jù)更簡(jiǎn)潔。數(shù)據(jù)轉(zhuǎn)換則通過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化和規(guī)范化操作,將數(shù)據(jù)映射到較低取值范圍。例如,可以將資源評(píng)分信息標(biāo)準(zhǔn)化為[0,1]區(qū)間,將資源時(shí)間信息規(guī)范為以“周”為單位的整數(shù)時(shí)間間隔等操作。
在獲得統(tǒng)一、規(guī)范的數(shù)據(jù)之后,開(kāi)始標(biāo)注學(xué)習(xí)資源的進(jìn)化態(tài)。本研究以學(xué)習(xí)元平臺(tái)為依托,采集了開(kāi)放知識(shí)社區(qū)資源的相關(guān)數(shù)據(jù)。據(jù)數(shù)據(jù)統(tǒng)計(jì)分析顯示,目前已獲得約17萬(wàn)的數(shù)據(jù)可作為實(shí)驗(yàn)基礎(chǔ)數(shù)據(jù)。顯然,完全以人工標(biāo)注的方式評(píng)估學(xué)習(xí)資源的進(jìn)化態(tài)是不現(xiàn)實(shí)的。因此我們?cè)O(shè)計(jì)用無(wú)監(jiān)督學(xué)習(xí)之聚類(lèi)算法+專(zhuān)家抽檢審閱相結(jié)合的方法,對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,以減少人工標(biāo)記的工作量。具體流程如圖3所示:(1)確定中心。將數(shù)據(jù)分別通過(guò)K均值聚類(lèi)算法和層次聚類(lèi)算法獲得5類(lèi)簇群和簇群中心的信息。如圖3中不同顏色、形狀的數(shù)據(jù)點(diǎn)表示經(jīng)過(guò)聚類(lèi)算法智能分類(lèi)得到的不同類(lèi)別的數(shù)據(jù)和聚類(lèi)中心點(diǎn)。(2)設(shè)定半徑。為進(jìn)一步確定自動(dòng)分類(lèi)正確性,采取聚類(lèi)中心畫(huà)圓的方式進(jìn)行二次篩選確定。各簇以簇群中心和半徑r(人工設(shè)定)畫(huà)圓。(3)專(zhuān)家篩選。任意選取距離圓心由近及遠(yuǎn)的n條數(shù)據(jù)分別呈現(xiàn)給專(zhuān)家組,邀請(qǐng)專(zhuān)家依據(jù)各進(jìn)化態(tài)的定義,判定該圓內(nèi)數(shù)據(jù)的進(jìn)化態(tài)。若篩選過(guò)后的數(shù)據(jù)100%屬于某一進(jìn)化態(tài)類(lèi)別,就可將此半徑為r的圓內(nèi)數(shù)據(jù)分門(mén)別類(lèi)做標(biāo)注,否則縮小半徑值,重新選定數(shù)據(jù)。(4)設(shè)定圓環(huán)。為盡可能覆蓋正確分類(lèi)的范圍,采取圓環(huán)不斷拓寬、專(zhuān)家隨機(jī)挑選審核的方式進(jìn)行標(biāo)注。例如,任意選取半徑大于r且小于r+δ(人工設(shè)定)圓環(huán),隨機(jī)選取圓環(huán)內(nèi)距離圓心由近及遠(yuǎn)的n條數(shù)據(jù)分別呈現(xiàn)給專(zhuān)家組,由專(zhuān)家組判斷該圓環(huán)內(nèi)數(shù)據(jù)全部屬于半徑r圓內(nèi)數(shù)據(jù)同一類(lèi)別。若該圓環(huán)內(nèi)數(shù)據(jù)與半徑為r的圓內(nèi)數(shù)據(jù)類(lèi)別一致,繼續(xù)拓寬δ長(zhǎng)度的圓環(huán),判定新圓環(huán)內(nèi)數(shù)據(jù)類(lèi)別一致性;若圓環(huán)內(nèi)有數(shù)據(jù)與半徑為r的圓內(nèi)數(shù)據(jù)類(lèi)別不一致,可縮小圓環(huán)寬度,再次甄別,直至數(shù)據(jù)符合同一類(lèi)別要求。(5)分門(mén)別類(lèi)。將確定好的數(shù)據(jù)分門(mén)別類(lèi)進(jìn)行標(biāo)注,這樣每位專(zhuān)家都可形成一個(gè)包含五種類(lèi)別的數(shù)據(jù)集。(6)確定最終標(biāo)記數(shù)據(jù)。為確保每位專(zhuān)家標(biāo)記的數(shù)據(jù)符合統(tǒng)一的標(biāo)準(zhǔn),可將各專(zhuān)家篩選形成的數(shù)據(jù)集,在符合同一類(lèi)別的數(shù)據(jù)集基礎(chǔ)上求取交集,這樣就可去掉專(zhuān)家不同意見(jiàn)的數(shù)據(jù),保留相同劃分標(biāo)準(zhǔn)的數(shù)據(jù),作為最終訓(xùn)練和檢驗(yàn)深度學(xué)習(xí)模型的數(shù)據(jù)集。
(四)數(shù)學(xué)定義及模型設(shè)計(jì)
網(wǎng)絡(luò)學(xué)習(xí)資源預(yù)警任務(wù)的目標(biāo)是預(yù)測(cè)學(xué)習(xí)資源可能所處的進(jìn)化狀態(tài),當(dāng)學(xué)習(xí)資源有可能處于衰退態(tài)或死亡態(tài)時(shí),及時(shí)給予資源開(kāi)發(fā)方或維護(hù)方以預(yù)警信息。該任務(wù)數(shù)學(xué)定義如下:假設(shè)給定一個(gè)數(shù)據(jù)集D={(x1,y1),(x2,y2),...,(xp,yn)},其中xi∈Rn表示學(xué)習(xí)資源的特征值,這些特征包括內(nèi)容更新信息、資源關(guān)聯(lián)信息、資源使用信息、資源批注信息、資源評(píng)分信息、資源受歡迎信息和資源采樣時(shí)間間隔信息等內(nèi)容。yi∈{0,1,2,3,4}表示學(xué)習(xí)資源的進(jìn)化狀態(tài),0~5分別表示學(xué)習(xí)資源進(jìn)化的初始態(tài)、成長(zhǎng)態(tài)、穩(wěn)定態(tài)、衰退態(tài)、死亡態(tài)。通過(guò)對(duì)網(wǎng)絡(luò)學(xué)習(xí)資源的特征向量進(jìn)行數(shù)學(xué)建模,尋找一種合適的函數(shù)y=f(x),實(shí)現(xiàn)對(duì)學(xué)習(xí)資源的狀態(tài)進(jìn)行預(yù)測(cè)。
在大規(guī)模實(shí)踐應(yīng)用中,可以利用深度學(xué)習(xí)模型自動(dòng)提取數(shù)據(jù)特征的特性,完成對(duì)學(xué)習(xí)資源進(jìn)化態(tài)預(yù)測(cè),以實(shí)現(xiàn)學(xué)習(xí)資源預(yù)警的目的。為此,本研究設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)和Word2Vector結(jié)合的深度學(xué)習(xí)算法模型。通過(guò)卷積操作提取學(xué)習(xí)資源進(jìn)化態(tài)之間的隱含信息,并嘗試使用Word2Vector方法壓縮Id的維度信息和提取資源進(jìn)化過(guò)程的關(guān)聯(lián)信息作為特征表示。具體的模型設(shè)計(jì)如圖4所示,技術(shù)實(shí)現(xiàn)流程如下:
(1)將學(xué)習(xí)資源的Id,通過(guò)embedding的方式進(jìn)行編碼,這是為了降低傳統(tǒng)one-hot編碼帶來(lái)的維度災(zāi)難。本研究采用Word2Vector方式,將Id編碼轉(zhuǎn)換為稠密向量,再將該向量經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)的方法轉(zhuǎn)換為固定長(zhǎng)度的特征向量,作為學(xué)習(xí)元Id的特征表示。上述過(guò)程數(shù)學(xué)表達(dá)式為(3-1)至(3-3)。
其中,x'■表示學(xué)習(xí)元Id的隨機(jī)初始化embedding之后的編碼,Word2Vector()表示采用Word2Vector的方法,hi表示W(wǎng)ord2Vector后獲得向量,w1,w2,b1,b2表示神經(jīng)網(wǎng)絡(luò)超參數(shù),sigmod()表示sigmoid激活函數(shù),ui表示最終提取的學(xué)習(xí)元特征表示向量。
(2)將p條學(xué)習(xí)資源的進(jìn)化要素n維特征作為整體輸入,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)操作,提取學(xué)習(xí)資源進(jìn)化態(tài)特征之間的潛在關(guān)系信息,再將提取后的特征信息通過(guò)神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換為與ui相同維度的特征向量vi,學(xué)習(xí)資源進(jìn)化態(tài)預(yù)測(cè)由ui和vi內(nèi)積操作計(jì)算所得。上述過(guò)程數(shù)學(xué)表達(dá)式為(3-4)至(3-8)。
其中,x'■表示為輸入的特征空間向量,cij表示經(jīng)過(guò)第j個(gè)卷積核Wcj操作之后提取的特征,ws∈Rm×ws表示卷積窗大小,cj表示經(jīng)過(guò)多個(gè)卷積核操作之后所得特征表示,max(cj)表示最大池化操作,d表示經(jīng)過(guò)多個(gè)最大池化操作之后提取的特征,W1,W2,B1,B2表示神經(jīng)網(wǎng)絡(luò)超參數(shù),tanh()表示雙曲正切函數(shù),vj表示最終提取的學(xué)習(xí)元進(jìn)化要素的特征表示向量。
(3)進(jìn)化態(tài)預(yù)測(cè)表達(dá)式為:yi=ui·vj,通過(guò)進(jìn)化態(tài)預(yù)測(cè)值yi與真實(shí)值yi之間誤差函數(shù)計(jì)算誤差,不斷訓(xùn)練深度學(xué)習(xí)模型,以獲得最佳預(yù)測(cè)效果。
(4)誤差函數(shù)選取多分類(lèi)交叉熵?fù)p失函數(shù)計(jì)算誤差,具體表達(dá)式見(jiàn)(3-9)。
(5)模型訓(xùn)練方式采用Adam方式進(jìn)行反向傳播求解模型的超參數(shù)。
四、網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警模型實(shí)驗(yàn)
為了客觀地比較不同算法模型之間的性能,本研究主要從預(yù)測(cè)精確性角度比較不同模型的預(yù)測(cè)性能。研究挑選經(jīng)典機(jī)器學(xué)習(xí)算法模型,如多層感知機(jī)(Multi-layer Perceptron,簡(jiǎn)稱(chēng)MLP)模型、支持向量機(jī)(Support Vector Machines,簡(jiǎn)稱(chēng)SVM)模型、神經(jīng)網(wǎng)絡(luò)模型(Neural Network,簡(jiǎn)稱(chēng)NN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,簡(jiǎn)稱(chēng)CNN)作為對(duì)比算法,與本研究設(shè)計(jì)的算法模型CNN+Word2Vec進(jìn)行實(shí)驗(yàn)比對(duì)。
實(shí)驗(yàn)數(shù)據(jù)集為學(xué)習(xí)元平臺(tái)采集的learningcell-1k和learningcell-1M兩個(gè)數(shù)據(jù)集,其中l(wèi)earningcell-1k包含3979條數(shù)據(jù),該數(shù)據(jù)集屬于各進(jìn)化態(tài)類(lèi)別,數(shù)據(jù)分布較為平衡。learningcell-1M包含179392條數(shù)據(jù),該數(shù)據(jù)集屬于各進(jìn)化態(tài)類(lèi)別,數(shù)據(jù)分布較不平衡,其中穩(wěn)定態(tài)和衰退態(tài)數(shù)據(jù)占比較低。兩個(gè)數(shù)據(jù)集的特征維度均包括學(xué)習(xí)元的進(jìn)化要素項(xiàng):學(xué)習(xí)元Id、編輯數(shù)、版本數(shù)、瀏覽數(shù)、收藏?cái)?shù)、批注數(shù)、打分?jǐn)?shù)、準(zhǔn)確性評(píng)分、客觀性評(píng)分、完整性評(píng)分、規(guī)范性評(píng)分、及時(shí)性評(píng)分、點(diǎn)贊數(shù)、關(guān)聯(lián)學(xué)習(xí)元數(shù)、關(guān)聯(lián)知識(shí)群數(shù)、時(shí)間間隔(以周為單位)。且嚴(yán)格依據(jù)網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化態(tài)標(biāo)注流程與方法,對(duì)兩個(gè)數(shù)據(jù)集中的每條數(shù)據(jù)進(jìn)化態(tài)進(jìn)行了標(biāo)記,標(biāo)記值y∈{0,1,2,3,4}。
實(shí)驗(yàn)采用5折交叉驗(yàn)證法,其中80%數(shù)據(jù)用于模型訓(xùn)練,剩余20%用于模型測(cè)試,選取10次實(shí)驗(yàn)的平均值作為最終的實(shí)驗(yàn)結(jié)果,以保證實(shí)驗(yàn)的公平性。實(shí)驗(yàn)評(píng)價(jià)主要選取精準(zhǔn)率、F1得分和AUC(Area Under Curve)等三個(gè)評(píng)價(jià)指標(biāo),其中精確率主要反映預(yù)測(cè)為正樣本中預(yù)測(cè)準(zhǔn)確性占比,F(xiàn)1分?jǐn)?shù)則反映精確率和召回率的表現(xiàn)情況,AUC為ROC(Receiver Operating Characteristic Curve)曲線(xiàn)下的面積,用于反映分類(lèi)效果好壞。
表2和表3表明本研究設(shè)計(jì)的算法在預(yù)測(cè)精準(zhǔn)率、F1和AUC指標(biāo)方面表現(xiàn)優(yōu)于對(duì)比算法,說(shuō)明了CNN+Word2Vec的算法模型框架可有效提升網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化態(tài)預(yù)測(cè)的精準(zhǔn)性。對(duì)比CNN與CNN+Word2Vec算法性能表現(xiàn)可以發(fā)現(xiàn),雙方在兩個(gè)數(shù)據(jù)集的評(píng)價(jià)指標(biāo)表現(xiàn)相近,但CNN+Word2Vec的算法設(shè)計(jì)可以提取數(shù)據(jù)間的隱含信息,故該算法表現(xiàn)效果略?xún)?yōu)于CNN算法。從數(shù)據(jù)分布來(lái)看,learningcell-1M數(shù)據(jù)集存在分布不平衡現(xiàn)象,因此需要更多地結(jié)合精準(zhǔn)率、F1和AUC三個(gè)方面比較預(yù)測(cè)的精確性。
從精準(zhǔn)率方面分析發(fā)現(xiàn),CNN+Word2Vec算法對(duì)比其他算法有較大優(yōu)勢(shì),與神經(jīng)網(wǎng)絡(luò)算法相比,在learningcell-1k數(shù)據(jù)集,本研究設(shè)計(jì)的算法精確率提升2.48%,而在learningcell-1M數(shù)據(jù)集,精確率提升10.3%。首先,這是因?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)可以有效地提取輸入特征之間的潛在信息,相對(duì)于神經(jīng)網(wǎng)絡(luò)而言,能更高效地?cái)?shù)據(jù)化表示非線(xiàn)性關(guān)系。其次,不同數(shù)據(jù)及提升效果差異較大的原因是learningcell-1M數(shù)據(jù)分布不平衡現(xiàn)象相較于learningcell-1k嚴(yán)重,這也反映了本研究設(shè)計(jì)模型的抗干擾能力較強(qiáng),在數(shù)據(jù)分布不均衡時(shí),仍可以有效進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化態(tài)的預(yù)測(cè)。
從F1得分方面分析發(fā)現(xiàn),本研究設(shè)計(jì)的算法模型表現(xiàn)優(yōu)于對(duì)比算法,從綜合精確率和召回率兩方面看,CNN+Word2Vec算法在預(yù)測(cè)學(xué)習(xí)資源進(jìn)化態(tài)時(shí)更為有效,并且當(dāng)數(shù)據(jù)分布越均衡時(shí),算法模型的表現(xiàn)效果也越好。
從AUC方面分析發(fā)現(xiàn),CNN+Word2Vec算法對(duì)比CNN算法提升2%,這表明本研究設(shè)計(jì)的算法模型在預(yù)測(cè)全面性方面優(yōu)于對(duì)比算法,縱向?qū)Ρ萳earningcell-1k和learningcell-1M算法的AUC可以發(fā)現(xiàn),learningcell-1M的AUC表現(xiàn)較好,這是因?yàn)閘earningcell-1M的數(shù)據(jù)量較多于learningcell-1k的數(shù)據(jù)量,大部分?jǐn)?shù)據(jù)集中在初始態(tài)類(lèi)別中,模型能學(xué)習(xí)較多的數(shù)據(jù)信息,從而提升預(yù)測(cè)分類(lèi)的效果。
從圖5分析可以發(fā)現(xiàn),CNN+Word2Vec算法在數(shù)據(jù)集learningcell-1k和learningcell-1M收斂效果表現(xiàn)比CNN和NN算法的收斂效果更好。CNN+Word2Vec算法在數(shù)據(jù)集learningcell-1k和learningcell-1M的收斂速度比神經(jīng)網(wǎng)絡(luò)算法收斂更快,這樣有利于預(yù)警算法模型在數(shù)據(jù)集中快速找到最優(yōu)參數(shù),在實(shí)際應(yīng)用中也可快速地進(jìn)行模型的優(yōu)化。CNN+Word2Vec算法在兩個(gè)數(shù)據(jù)集的收斂平穩(wěn)性表現(xiàn)都優(yōu)于CNN和NN算法,這也表明算法在求解過(guò)程中較為穩(wěn)定,在實(shí)際應(yīng)用過(guò)程有利于網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警的穩(wěn)定性。
五、結(jié)? ?語(yǔ)
本研究以網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警模型構(gòu)建為核心,探討了資源進(jìn)化態(tài)表征、資源進(jìn)化要素項(xiàng)提取、資源進(jìn)化態(tài)標(biāo)注、資源進(jìn)化預(yù)警任務(wù)的數(shù)學(xué)定義等問(wèn)題,并以學(xué)習(xí)元平臺(tái)采集數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù)集,設(shè)計(jì)并實(shí)現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)+Word2Vec的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警算法模型。從與經(jīng)典算法對(duì)比實(shí)驗(yàn)效果來(lái)看,本研究設(shè)計(jì)的算法模型相較于經(jīng)典的機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,在預(yù)測(cè)精準(zhǔn)率、F1和AUC等指標(biāo)方面表現(xiàn)具有一定的優(yōu)勢(shì),且模型在訓(xùn)練過(guò)程中收斂態(tài)勢(shì)也優(yōu)于對(duì)比算法,相信在未來(lái)的實(shí)際應(yīng)用中能發(fā)揮更佳的預(yù)警效果。
網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警技術(shù)模型的設(shè)計(jì)與實(shí)現(xiàn),既是對(duì)網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警技術(shù)的新探索,也可幫助各地智慧教育云平臺(tái)提升海量網(wǎng)絡(luò)學(xué)習(xí)資源的管理效能。目前本研究還缺乏在實(shí)際平臺(tái)的應(yīng)用效果反饋,在預(yù)警算法層面還有諸多可改進(jìn)之處。例如,可以嘗試在預(yù)警模型中引入時(shí)間序列信息和評(píng)論數(shù)據(jù)信息,以實(shí)現(xiàn)更加精準(zhǔn)、科學(xué)的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警。也可嘗試借鑒前沿的可解釋性深度學(xué)習(xí)技術(shù),研發(fā)具有可解釋性的網(wǎng)絡(luò)學(xué)習(xí)資源進(jìn)化預(yù)警信息生成技術(shù)模型,實(shí)現(xiàn)在資源進(jìn)化預(yù)警的同時(shí),智能生成具體的預(yù)警內(nèi)容信息,輔助資源維護(hù)人員實(shí)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)資源的及時(shí)精準(zhǔn)優(yōu)化。
[參考文獻(xiàn)]
[1] 楊現(xiàn)民,余勝泉.泛在學(xué)習(xí)環(huán)境下的學(xué)習(xí)資源進(jìn)化模型構(gòu)建[J].中國(guó)電化教育,2011(9):80-86.
[2] YU S Q, YANG X M, CHENG G,etc. From learning object to learning cell: a resource organization model for ubiquitous learning[J]. Journal of educational technology & society, 2015, 18(2): 206-224.
[3] YANG X M, QIU Q, YU S Q, etc. Designing a trust evaluation model for open-knowledge communities[J]. British journal of educational technology, 2014, 45(5): 880-901.
[4] ATTIYA H, BURCKHARDT S, GOTSMAN A, etc. Specification and complexity of collaborative text editing[C]. In Proceedings of the 2016 ACM Symposium on Principles of Distributed Computing. Chicago, IL, USA, 2016: 259-268.
[5] SCERBAKOV N, KAPPE F, PAK V. Collaborative document authoring as an e-learning component[C].In EdMedia+ Innovate Learning, Association for the Advancement of Computing in Education (AACE). Las Vegas, NV, USA, 2018: 101-107.
[6] 余勝泉,陳敏.泛在學(xué)習(xí)資源建設(shè)的特征與趨勢(shì)——以學(xué)習(xí)元資源模型為例[J].現(xiàn)代遠(yuǎn)程教育研究,2011(6):14-22.
[7] 楊現(xiàn)民.泛在學(xué)習(xí)環(huán)境下的學(xué)習(xí)資源有序進(jìn)化研究[J].電化教育研究, 2015,36(1):62-68.
[8] 徐劉杰,余勝泉.泛在學(xué)習(xí)資源進(jìn)化的動(dòng)力模型構(gòu)建[J].電化教育研究, 2018,39(4):52-58.
[9] 楊現(xiàn)民,余勝泉.開(kāi)放環(huán)境下學(xué)習(xí)資源內(nèi)容進(jìn)化的智能控制研究[J].電化教育研究,2013,34(9): 83-88.
[10] 何向陽(yáng).用戶(hù)參與網(wǎng)絡(luò)信息資源再生影響因素的實(shí)證研究[J].遠(yuǎn)程教育雜志, 2015(5):90-98.
[11] LIU S, BREMER P T, THIAGARAJAN J J,etc. Visual exploration of semantic relationships in neural word embeddings[J].IEEE transactions on visualization and computer graphics, 2018, 24(1):553-562.
[12] HERMINIO G G, JOS?魪 E L, PAULE R M. Enhancing e-Learning content by using semantic web technologies[J]. IEEE transactions on learning technologies, 2017, 10(4):544-550.
[13] MUSTO C, NARDUCCI F, LOPS P, etc. Linked open data-based explanations for transparent recommender systems[J]. International journal of human-computer studies, 2019(121): 93-107.
[14] 楊現(xiàn)民,余勝泉,張芳.學(xué)習(xí)資源動(dòng)態(tài)語(yǔ)義關(guān)聯(lián)的設(shè)計(jì)與實(shí)現(xiàn)[J].中國(guó)電化教育,2013(1):70-75.
[15] GASPARETTI F, DE MEDIO C, LIMONGELLI C,etc. Prerequisites between learning objects: automatic extraction based on a machine learning approach[J]. Telematics and informatics, 2018, 35(3):595-610.
[16] SHEN Y, DING N, ZHENG H, LI Y, YANG M. Modeling relation paths for knowledge graph completion[J].IEEE transactions on knowledge and data engineering, 2021,33(11): 3607-3617.
[17] 王懷波,陳麗.網(wǎng)絡(luò)化知識(shí)的內(nèi)涵解析與表征模型構(gòu)建[J].中國(guó)遠(yuǎn)程教育,2020(5):10-17,76.
[18] MARBOUTI F, DIEFES-DUX H A, MADHAVAN K. Models for early prediction of at-risk students in a course using standards-based grading[J]. Computers & education, 2016(103): 1-15.
[19] DANIELE D M, MAREN S, HENDRIK D,etc. Learning pulse: a machine learning approach for predicting performance in self-regulated learning using multimodal data[C]. In Proceedings of the Seventh International Learning Analytics & Knowledge Conference, ACM, Vancouver British Columbia Canada, 2017: 188-197.
[20] MARQUEZ-VERA C, CANO A, ROMERO C,etc. Early dropout prediction using data mining: a case study with high school students[J]. Expert systems, 2016,33(1):107-124.
[21] KOTSIANTIS S B. Use of machine learning techniques for educational proposes: a decision support system for forecasting students' grades[J].Artificial intelligence review, 2012, 37(4): 331-344.
[22] HU Y H, LO C L, SHIH S P. Developing early warning systems to predict students' online learning performance[J]. Computers in human behavior, 2014(36):469-478.
[23] 李景奇,卞藝杰,方征.基于BKT模型的網(wǎng)絡(luò)教學(xué)跟蹤評(píng)價(jià)研究[J].現(xiàn)代遠(yuǎn)程教育研究, 2018(5):106-114.
[24] YANG T Y, BRINTON C G, JOE-WONG C, CHIANG M. Behavior-based grade prediction for MOOCs via time series neural networks[J]. IEEE journal of selected topics in signal processing, 2017, 11(5):716-728.
[25] 陳晉音,方航,林翔,等.基于在線(xiàn)學(xué)習(xí)行為分析的個(gè)性化學(xué)習(xí)推薦[J].計(jì)算機(jī)科學(xué), 2018(S2): 422-426.
[26] FEI H, LI H. The study of learners' emotional analysis based on MOOC[C]. In Proceedings of the 2018 IEEE International Conference on Cognitive Computing, San Francisco, USA, 2018: 170-178.
[27] WANG L, HU G, ZHOU T. Semantic analysis of learners' emotional tendencies on online MOOC education[J]. Sustainability, 2018, 10(6): 1921-1940.
[28] WANG X, ZHAO M, HUANG C, etc. Predicting students' mood level using multi-feature fusion joint sentiment-topic model in mobile Learning[C]. In the 21st ACM Conference on Computer Supported Cooperative Work and Social Computing, New York, USA, 2018: 316-330.