許桂芳 穆肅
摘要:基于數(shù)據(jù)智能分析的學(xué)習(xí)資源推送是精準(zhǔn)支持個(gè)性化學(xué)習(xí)的教學(xué)服務(wù)方式之一。隨著人工智能技術(shù)和學(xué)習(xí)分析技術(shù)的發(fā)展,通過對(duì)行為數(shù)據(jù)、測評(píng)數(shù)據(jù)和日志數(shù)據(jù)等的分析進(jìn)行資源推送雖已有較成功應(yīng)用,但未能實(shí)現(xiàn)學(xué)習(xí)者個(gè)人情感狀態(tài)為引導(dǎo)的資源推送。為此,該研究針對(duì)個(gè)性化學(xué)習(xí)資源推薦中情感價(jià)值、情感控制理論和實(shí)踐的缺失,以實(shí)現(xiàn)個(gè)性化學(xué)習(xí)多維度情感識(shí)別為目標(biāo),采用BERT模型和TextCNN構(gòu)建個(gè)性化學(xué)習(xí)資源推薦文本情感識(shí)別模型,并提出了基于學(xué)習(xí)者作業(yè)、論壇內(nèi)容等的文本情感識(shí)別模型實(shí)現(xiàn)過程。學(xué)習(xí)資源推薦文本情感識(shí)別模型和實(shí)現(xiàn)過程可為真實(shí)應(yīng)用提供方法支持和技術(shù)路線指引。
關(guān)鍵詞:學(xué)習(xí)資源推薦;文本情感識(shí)別;個(gè)性化學(xué)習(xí)
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
* 本文系國家自然科學(xué)基金2022年度重點(diǎn)項(xiàng)目“課堂流媒體跨模態(tài)知識(shí)元協(xié)同解析與評(píng)估方法”(項(xiàng)目編號(hào):62237001)研究成果。① 穆肅為本文通訊作者。
個(gè)性化學(xué)習(xí)資源推薦的目標(biāo)是用技術(shù)破解教育中長期存在的“不可能三角”,即優(yōu)質(zhì)、公平、效能三者兼顧的難題[1],將傳統(tǒng)供給驅(qū)動(dòng)的資源推薦方式轉(zhuǎn)變?yōu)樾枨篁?qū)動(dòng)的個(gè)性化資源推薦模式,實(shí)現(xiàn)以學(xué)生為主體的學(xué)習(xí)支持服務(wù),促進(jìn)學(xué)生個(gè)性化發(fā)展。人的學(xué)習(xí)過程中,認(rèn)知、情感、意志是內(nèi)在因素,行為是外在表現(xiàn),內(nèi)在因素通過外在行為映射到學(xué)習(xí)活動(dòng)上,對(duì)學(xué)習(xí)過程產(chǎn)生影響。及時(shí)、合理、有效的資源推薦服務(wù)需要建立在對(duì)學(xué)習(xí)者的全面了解的基礎(chǔ)上[2]。
目前,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等人工智能技術(shù)和數(shù)據(jù)挖掘技術(shù),被引入在線教育平臺(tái),通過對(duì)學(xué)習(xí)者的認(rèn)知特點(diǎn)、知識(shí)水平、學(xué)習(xí)偏好等進(jìn)行分析,形成學(xué)習(xí)者特征模型,從而有針對(duì)性地提供學(xué)習(xí)資源推薦服務(wù),個(gè)性化學(xué)習(xí)資源推薦研究已取得一定進(jìn)展和成果。個(gè)性化學(xué)習(xí)資源推薦現(xiàn)在主要有三條實(shí)施途徑:第一是學(xué)習(xí)者建模,也稱為“學(xué)習(xí)者畫像”,通過真實(shí)全面地采集并分析學(xué)習(xí)者的學(xué)習(xí)目標(biāo)、學(xué)習(xí)風(fēng)格、認(rèn)知水平等個(gè)性特征數(shù)據(jù),建立準(zhǔn)確的學(xué)習(xí)者模型并進(jìn)行資源推送;第二是學(xué)習(xí)資源建模,深入挖掘?qū)W習(xí)資源與學(xué)習(xí)者個(gè)性相關(guān)聯(lián)的數(shù)據(jù),以建立二者的相似關(guān)系實(shí)現(xiàn)推送;第三是推薦算法設(shè)計(jì),采用智能計(jì)算模式將學(xué)習(xí)者模型和學(xué)習(xí)資源模型匹配,并在適當(dāng)?shù)臅r(shí)機(jī)融入學(xué)習(xí)者的學(xué)習(xí)過程,從而提升學(xué)習(xí)效率[3]。對(duì)學(xué)習(xí)者特征的研究越來越全面、立體,推薦就越準(zhǔn)確。但無論是理論或是實(shí)證研究方面,學(xué)習(xí)者建模時(shí)提取知識(shí)和認(rèn)知方面的特征比較普遍,而結(jié)合學(xué)習(xí)者情感狀態(tài)進(jìn)行資源推薦的研究還相對(duì)較少,因此開展情感狀態(tài)識(shí)別和描述,以提升資源推送準(zhǔn)確度,成為資源推薦技術(shù)研究的新角度,也是本文研究提出的原因。
學(xué)習(xí)情感是學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生的情感體驗(yàn),具體表現(xiàn)形式為學(xué)習(xí)情緒的表達(dá)[4],對(duì)學(xué)習(xí)過程和狀態(tài)會(huì)產(chǎn)生影響。按照情感狀態(tài)的表示方式不同,情感可以分為離散狀態(tài)表示和連續(xù)狀態(tài)表示[5]。離散狀態(tài)表示基于基本情感理論,例如美國心理學(xué)家Ekman將人類的情感歸為高興、生氣、傷心、厭惡、驚訝、害怕六個(gè)類別之一,其他情感可以看做基本情感的組合[6]。連續(xù)狀態(tài)表示基于維度情感理論,認(rèn)為情感狀態(tài)并不是相互獨(dú)立的,假設(shè)將情感映射到多維連續(xù)空間,每一種情感相當(dāng)于多維連續(xù)空間中的一個(gè)點(diǎn),例如Mehrabian提出的“情感三維理論”采用“效價(jià)”(Valence)、“喚醒”(Arousal)和“支配”(Dominance)三個(gè)維度描述情感狀態(tài),分別表示情感的愉悅程度、強(qiáng)度和控制程度[7]。Faria等指出個(gè)人在線上學(xué)習(xí)環(huán)境中的行為會(huì)受到情緒的強(qiáng)烈影響[8],Cordero等也發(fā)現(xiàn)情緒和學(xué)生學(xué)習(xí)風(fēng)格和學(xué)業(yè)成績有顯著關(guān)系[9]。已有研究證據(jù)表明,一些情緒狀態(tài)能支持學(xué)習(xí)過程,另一些則抑制學(xué)習(xí)過程[10-12]。例如,困惑與學(xué)習(xí)資源的理解呈正相關(guān),但可能導(dǎo)致學(xué)習(xí)的非適應(yīng)性情感,比如當(dāng)學(xué)生無法理解時(shí)的沮喪[13]。在新興的學(xué)術(shù)研究中應(yīng)用情感視角,并將情感定位為學(xué)習(xí)的中心,正成為一種趨勢[14]。情感識(shí)別(或稱情感計(jì)算)指通過計(jì)算機(jī)實(shí)現(xiàn)人類情感的識(shí)別、解釋、建模和分析[15]。情感識(shí)別被用于調(diào)節(jié)教學(xué)策略、改善學(xué)習(xí)過程[16-18]。自動(dòng)情感識(shí)別算法可以幫助探索這種情感的作用,使對(duì)學(xué)習(xí)者情感狀態(tài)的評(píng)估比基于問卷的調(diào)查更加客觀。
在傳統(tǒng)課堂上,教師可以通過面部表情、眼部動(dòng)作、手勢、身體姿勢、說話聲音甚至一些生理信號(hào)等顯性表征的信息判斷學(xué)習(xí)者的情感狀態(tài),及時(shí)調(diào)整教學(xué)策略。而在線上個(gè)性化學(xué)習(xí)推薦環(huán)境中,由于師生處于“準(zhǔn)分離”狀態(tài),準(zhǔn)確識(shí)別學(xué)習(xí)者情感需要利用技術(shù)手段來實(shí)現(xiàn)。學(xué)習(xí)過程中用于進(jìn)行情感識(shí)別的數(shù)據(jù)包括:表情、手勢與身體姿態(tài)數(shù)據(jù),皮膚電數(shù)據(jù)、腦電數(shù)據(jù)、文本數(shù)據(jù)等多模態(tài)數(shù)據(jù)[19],研究者不斷探究學(xué)習(xí)者的情緒狀態(tài)和交互模式對(duì)學(xué)習(xí)的調(diào)節(jié)作用。多模態(tài)的學(xué)習(xí)情感識(shí)別研究正處于起步階段,這是今后的重要研究方向。情感識(shí)別數(shù)據(jù)的獲取和分析方法應(yīng)用于個(gè)性化學(xué)習(xí)推薦中具有一定的局限性。大部分研究需要配置額外的采集設(shè)備,情感數(shù)據(jù)高昂的采集和標(biāo)注成本、采集過程對(duì)學(xué)習(xí)過程造成的侵入性等問題限制情感識(shí)別在個(gè)性化學(xué)習(xí)推薦中的應(yīng)用。同時(shí),在線學(xué)習(xí)者的狀態(tài)是相對(duì)自由和隱蔽的,通過顯性特征提取學(xué)習(xí)者的情感特征存在數(shù)據(jù)稀疏的問題。而大多數(shù)的文本采集方式以調(diào)查問卷和學(xué)習(xí)量表為主,靜態(tài)的量表無法反映學(xué)習(xí)者實(shí)時(shí)的情感狀態(tài)。許多研究者開始關(guān)注于有限資源情況下的情感識(shí)別問題[20]。
學(xué)習(xí)者在線上學(xué)習(xí)過程中與同學(xué)間的討論、協(xié)作學(xué)習(xí)過程中的交互、與教師間的提問交流、對(duì)學(xué)習(xí)資源的評(píng)論、學(xué)習(xí)者提交的學(xué)習(xí)報(bào)告等文本,都蘊(yùn)含著豐富的情感信息。學(xué)習(xí)者這些文本中情感的表達(dá)是隱性的,通過文本情感識(shí)別技術(shù)可以分析、提取文本數(shù)據(jù)中的情感特征,自動(dòng)識(shí)別其中的學(xué)習(xí)者情感狀態(tài),以此調(diào)節(jié)學(xué)習(xí)資源推薦策略,為實(shí)現(xiàn)更精準(zhǔn)的個(gè)性化學(xué)習(xí)資源推薦提供了一種新的思路。情感識(shí)別在資源智能推送中可以發(fā)揮的作用有以下幾方面:
1.從多視角綜合理解學(xué)習(xí)者的行為、情感與認(rèn)知的關(guān)系,整合多維度數(shù)據(jù)的分析來發(fā)現(xiàn)更多影響學(xué)習(xí)者建模的個(gè)性化參數(shù),融入情感特征形成全面的分析模型。
2.從情感評(píng)價(jià)的角度提供學(xué)習(xí)資源表示的新框架,利用無監(jiān)督的深度技術(shù)對(duì)海量資源進(jìn)行屬性的情感描述,提高學(xué)習(xí)資源推薦的精準(zhǔn)度和適應(yīng)度,為同類研究提供了新的思路與方法。
3.通過深層特征提取挖掘?qū)W習(xí)者情感模型與學(xué)習(xí)資源模型潛在特征,來構(gòu)成能夠體現(xiàn)兩者的自適應(yīng)關(guān)聯(lián)的獨(dú)特性或相似性表示方式,為情感理論在個(gè)性化學(xué)習(xí)推薦的實(shí)現(xiàn)提供了新的理論支撐。
Pekrun最早提出學(xué)習(xí)情緒定義并描述成就情緒與學(xué)習(xí)者認(rèn)知之間的關(guān)系,將學(xué)習(xí)者的學(xué)習(xí)定義為結(jié)果/預(yù)期、結(jié)果/回顧和活動(dòng)不同階段,每個(gè)階段對(duì)應(yīng)控制和價(jià)值狀態(tài),并分別表達(dá)為不同的情感,包括愉快、希望、自豪、放松、憤怒、焦慮、羞愧等[21]。隨著近年來在線學(xué)習(xí)、混合學(xué)習(xí)的發(fā)展,研究者采集不同學(xué)習(xí)數(shù)據(jù)分析了不同學(xué)習(xí)者的在線學(xué)習(xí)情感類型。趙宏等人[22]將學(xué)習(xí)情感劃分為積極情感體驗(yàn)(包括驕傲、興奮、滿意等)和消極情感體驗(yàn)(包括孤獨(dú)感、挫敗感等)。李艷等[23]通過閱讀在線學(xué)習(xí)日志分析學(xué)習(xí)者的情感體驗(yàn)的內(nèi)容,發(fā)現(xiàn)學(xué)習(xí)者的情感體驗(yàn)主要表現(xiàn)為興奮、期待、壓力、緊迫感、逐漸適應(yīng)、信心、愉悅感、挫敗感和不舍9種類型。以上研究通過分析在線學(xué)習(xí)中學(xué)習(xí)者部分學(xué)習(xí)行為的記錄文本得出學(xué)習(xí)情感分類情況。研究表明,學(xué)習(xí)者在不同的學(xué)習(xí)情境的學(xué)習(xí)體驗(yàn)是不同的,線上學(xué)習(xí)中不同學(xué)習(xí)群體的情感體驗(yàn)較為個(gè)性化[24]。學(xué)習(xí)者的情感體驗(yàn)是動(dòng)態(tài)變化的,其情感體驗(yàn)在不同的學(xué)習(xí)過程、學(xué)習(xí)內(nèi)容、學(xué)習(xí)階段隨時(shí)間發(fā)生變化[25]。這種變化目前還未能找到統(tǒng)一的規(guī)律[26],通過文本情感識(shí)別技術(shù)對(duì)其進(jìn)行研究有助于準(zhǔn)確判斷學(xué)習(xí)者的情感。
(一)文本情感識(shí)別的方法和技術(shù)方案
1.文本情感識(shí)別已有的方法和技術(shù)方案
文本情感識(shí)別屬于自然語言處理(Natural Language Processing,NLP)中的一種技術(shù),自然語言在各個(gè)層面廣泛存在的歧義性和多義性使得自然語言處理存在較多困難。自2012年以來,自然語言處理研究領(lǐng)域嘗試直接通過深度學(xué)習(xí)建模,在許多任務(wù)上取得了明顯的質(zhì)量提升[27]。文本情感識(shí)別技術(shù)主要包括情感數(shù)據(jù)編碼、情感特征提取和情感分類等過程。按照情感數(shù)據(jù)編碼的技術(shù)可以分為:
(1)基于語料庫的方法:主要是利用語句之間的連接詞具有一定的情感極性,通過抽取連接詞進(jìn)行統(tǒng)計(jì)計(jì)算。戴敏等人[28]設(shè)計(jì)了一套中文情感信息抽取語料庫的標(biāo)注體系,可用于對(duì)常見的句子情感極性、情感詞和評(píng)價(jià)對(duì)象等信息的標(biāo)注。
(2)基于情感詞典的方法:早期研究主要使用標(biāo)注好情感傾向的情感詞典來判斷情感類別,如文獻(xiàn)[29]采用BonsonNLP情感詞典對(duì)MOOC平臺(tái)三門大學(xué)數(shù)學(xué)基礎(chǔ)課程共44243條課程評(píng)論數(shù)據(jù)進(jìn)行情感分類,提取和分析平臺(tái)學(xué)習(xí)者對(duì)在線課程的學(xué)習(xí)感受。但是基于情感詞典的方法對(duì)于網(wǎng)絡(luò)新詞的更新支持不足,不同情境下的同一情感詞存在詞語歧義,在跨領(lǐng)域的泛化能力不理想。
(3)基于傳統(tǒng)機(jī)器學(xué)習(xí)的技術(shù):人工提取文本特征后,以帶有情感標(biāo)注的數(shù)據(jù)集訓(xùn)練一個(gè)情感分類器,再用于預(yù)測待檢測文本的情感傾向。該分類器是通過傳統(tǒng)的機(jī)器學(xué)習(xí)方法(常用的有貝葉斯算法和支持向量機(jī))進(jìn)行訓(xùn)練?;趥鹘y(tǒng)機(jī)器學(xué)習(xí)的方法需要人工對(duì)文本特征進(jìn)行標(biāo)記,而且不能充分利用上下文文本的語境信息,準(zhǔn)確性受到影響。
(4)基于深度學(xué)習(xí)的方法。深度學(xué)習(xí)技術(shù)對(duì)字詞進(jìn)行基于上下文的稠密向量表示,通常稱為詞向量或詞嵌入(Word Embedding)。由于詞向量可以多維度、抽象化體現(xiàn)語言特征,詞義相近的詞的詞向量相對(duì)“更接近”,在自然語言表示中得到廣泛應(yīng)用。但詞向量表達(dá)特征的準(zhǔn)確程度依靠對(duì)包含大量句子或單詞的語料進(jìn)行訓(xùn)練即“學(xué)習(xí)”所得,語料數(shù)據(jù)收集會(huì)相對(duì)較難。但由于語言的規(guī)律是共通的,可以利用遷移性將別人已經(jīng)訓(xùn)練好的詞向量集用到自己的任務(wù)中。常見的開源的詞向量工具有Word2vec、Glove等,由巨量語料庫訓(xùn)練而成,泛化能力比較強(qiáng),可以直接用于特定的文本識(shí)別任務(wù)中。近年來出現(xiàn)的BERT等采用預(yù)訓(xùn)練的方法,可以使用未標(biāo)注的文本進(jìn)行編碼,減少了手工編碼的復(fù)雜和主觀性。
在特征提取方面,神經(jīng)網(wǎng)絡(luò)技術(shù)通過全連接層、隱藏層進(jìn)行多層計(jì)算,能較好抽取深層次、抽象化特征,如CNN(卷積神經(jīng)網(wǎng)絡(luò))和RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))等都有很好的表現(xiàn)。CNN對(duì)提取局部特征比較擅長,TextCNN在此基礎(chǔ)上針對(duì)語言處理的特點(diǎn)進(jìn)行優(yōu)化。而RNN原理相似,但其能將前一輸入信息帶入下一輸入的序列處理更加適合語言的按順序讀取的序列特性。但RNN無法處理長文本的上下文信息,加入長短時(shí)記憶機(jī)制的LSTM(長短期記憶網(wǎng)絡(luò))對(duì)RNN結(jié)構(gòu)進(jìn)行改進(jìn),能夠更好理解上下文的詞語關(guān)系,GRN(廣義回歸神經(jīng)網(wǎng)絡(luò))進(jìn)一步優(yōu)化,使這種結(jié)構(gòu)更簡單。但RNN無法支持并行計(jì)算,只能通過多層計(jì)算來提取特征,這會(huì)使神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)過于復(fù)雜。近年來,能夠支持并行計(jì)算的Transformer框架被提出來并且得到廣泛應(yīng)用,但這種大模型涉及參數(shù)非常多,對(duì)算力要求很高。利用語言的可遷移性,使用別人訓(xùn)練好參數(shù)的模型作為基礎(chǔ)再進(jìn)行優(yōu)化補(bǔ)充和參數(shù)微調(diào)來設(shè)計(jì)開發(fā)特定的任務(wù)成為普遍做法。BERT模型是基于Transformer框架的預(yù)訓(xùn)練語言模型,支持雙向特征的深層提取,能夠提取上下文的信息,只需要少量數(shù)據(jù)加上微調(diào),可以提高識(shí)別準(zhǔn)確率。
在情感分類方面,經(jīng)過模型訓(xùn)練輸出具有情感特征的數(shù)據(jù)再經(jīng)過分類算法,就可以輸出情感識(shí)別結(jié)果。分類算法比較簡單,采用傳統(tǒng)機(jī)器算法或CNN、TextCNN可以實(shí)現(xiàn)計(jì)算目標(biāo)。
2.擬采用的文本情感識(shí)別的方法和技術(shù)方案
靜態(tài)的情感描述和單一學(xué)習(xí)場景的文本數(shù)據(jù)是無法準(zhǔn)確捕捉學(xué)習(xí)者的情感變化軌跡,本研究嘗試采集個(gè)性化學(xué)習(xí)系統(tǒng)中的學(xué)習(xí)者的不同場景在線學(xué)習(xí)文本數(shù)據(jù),挖掘?qū)W習(xí)者深層次的動(dòng)態(tài)的情感特征,以更全面地識(shí)別學(xué)習(xí)者的學(xué)習(xí)情感,實(shí)現(xiàn)更精準(zhǔn)的個(gè)性化推薦,如下頁圖1所示。
(1)數(shù)據(jù)集。采集學(xué)習(xí)者的學(xué)習(xí)體驗(yàn)報(bào)告、學(xué)習(xí)資源評(píng)論數(shù)據(jù)、協(xié)作學(xué)習(xí)交互數(shù)據(jù)、師生答疑數(shù)據(jù),以句子為單位進(jìn)行情感標(biāo)注,自主構(gòu)建一個(gè)個(gè)性化學(xué)習(xí)領(lǐng)域的情感數(shù)據(jù)集;
(2)特征編碼。采用BERT預(yù)訓(xùn)練語言模型,運(yùn)用其自監(jiān)督機(jī)制和雙向注意力機(jī)制,將原始文本數(shù)據(jù)轉(zhuǎn)化為包含上下文信息的多維詞向量;
(3)特征提取和分類。采用TextCNN文本卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),設(shè)置多個(gè)卷積核對(duì)輸入的詞向量進(jìn)行多維特征提取,再通過全連接層分類輸出識(shí)別結(jié)果。
(4)通過文本情感識(shí)別形成學(xué)習(xí)者隱性情感特征、學(xué)習(xí)資源隱性特征,計(jì)算學(xué)習(xí)者和學(xué)習(xí)資源之間隱性情感特征的最大相似度,為每位學(xué)習(xí)者找到最感興趣的學(xué)習(xí)資源列表。
(二)現(xiàn)有文本情感識(shí)別在學(xué)習(xí)資源推薦系統(tǒng)中的應(yīng)用
目前,文本情感識(shí)別在個(gè)性化學(xué)習(xí)資源推薦中的應(yīng)用還處于起步階段。Camilo Salazar等[30]提出了一種學(xué)習(xí)資源中自動(dòng)情感分析的方法,還比較了學(xué)習(xí)資源中文本數(shù)據(jù)情感分析任務(wù)的各種特征提取策略和機(jī)器學(xué)習(xí)技術(shù)。其研究發(fā)現(xiàn)采用BERT進(jìn)行未標(biāo)注文本識(shí)別呈現(xiàn)出與標(biāo)注情感詞相似的分布,顯示出與真實(shí)標(biāo)注的良好一致性和極好的相似性,反映了該方法的可行性?;谠~頻、詞典、詞向量和BERT的特征集和特征提取用了傳統(tǒng)機(jī)器學(xué)習(xí)方式PLS和RF技術(shù),這些機(jī)器學(xué)習(xí)技術(shù)提取情緒的過程是非常領(lǐng)域敏感的,當(dāng)將學(xué)習(xí)到的模型應(yīng)用于其他領(lǐng)域時(shí),準(zhǔn)確率會(huì)大大下降。研究反映出模型的識(shí)別能力與訓(xùn)練它們的數(shù)據(jù)領(lǐng)域的緊密聯(lián)系,顯示出對(duì)其他領(lǐng)域的低泛化。通過比較該研究指出,傳統(tǒng)編碼標(biāo)注方法需要對(duì)學(xué)習(xí)資源進(jìn)行情感標(biāo)注,由于存在大量此類資源,這是一項(xiàng)非常艱巨的任務(wù)。
上述關(guān)于文本情感識(shí)別在個(gè)性化學(xué)習(xí)資源推薦中的研究證明采用文本情感識(shí)別方式進(jìn)行情感分析是可行的,但存在以下問題:一是采用傳統(tǒng)機(jī)器學(xué)習(xí)的特征提取方法在不同的領(lǐng)域泛化能力比較低,訓(xùn)練模型用于其他領(lǐng)域的情感識(shí)別效果不好;二是采用標(biāo)注情感數(shù)據(jù)集手工工作量大,且無法及時(shí)更新數(shù)據(jù)。因此,本研究從學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生文本數(shù)據(jù)分析的角度,利用BERT模型可以對(duì)未標(biāo)注的數(shù)據(jù)集進(jìn)行編碼的優(yōu)點(diǎn),采集個(gè)性化學(xué)習(xí)推薦中的學(xué)習(xí)者行為數(shù)據(jù)作為學(xué)習(xí)領(lǐng)域數(shù)據(jù)集的補(bǔ)充,采用深度學(xué)習(xí)技術(shù)TextCNN(文本卷積神經(jīng)網(wǎng)絡(luò))技術(shù)進(jìn)行情感特征提取的方式,構(gòu)建情感識(shí)別模型,以實(shí)現(xiàn)對(duì)文本情感識(shí)別下個(gè)性化資源推薦。
文本情感識(shí)別實(shí)質(zhì)是情感歸類問題,BERT預(yù)訓(xùn)練模型使用的語料雖然很豐富,對(duì)自然語言的語義聯(lián)系遷移效果比較好,但用于情感分析任務(wù)時(shí),為了體現(xiàn)領(lǐng)域特點(diǎn),還需要少量學(xué)習(xí)過程標(biāo)注的文本情感數(shù)據(jù),才能訓(xùn)練得到更加精準(zhǔn)的模型,得到理想的預(yù)測值。個(gè)性化學(xué)習(xí)推薦中有特有的學(xué)習(xí)者情感特征,比如對(duì)學(xué)習(xí)的困惑,學(xué)有所成的喜悅和遇到挫折的沮喪等情感,與一般的商業(yè)推薦不同。目前,專門用于學(xué)習(xí)者的學(xué)習(xí)情感數(shù)據(jù)集的相關(guān)研究比較少,且主要以英文為主,大部分機(jī)構(gòu)或單位不會(huì)開放學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù),需要自己建立分析數(shù)據(jù)集。因此,本研究提出構(gòu)建個(gè)性化學(xué)習(xí)推薦中學(xué)習(xí)者文本情感識(shí)別數(shù)據(jù)集的方法。
(一)文本數(shù)據(jù)指標(biāo)的篩選
個(gè)性化學(xué)習(xí)系統(tǒng)中學(xué)習(xí)者在學(xué)習(xí)過程產(chǎn)生的文本數(shù)據(jù)分為自主學(xué)習(xí)文本數(shù)據(jù)、協(xié)作學(xué)習(xí)文本數(shù)據(jù)[31]。自主學(xué)習(xí)文本數(shù)據(jù)是學(xué)習(xí)者與學(xué)習(xí)資源或?qū)W習(xí)平臺(tái)進(jìn)行交互產(chǎn)生的,如對(duì)學(xué)習(xí)資源的評(píng)價(jià)和分析,學(xué)習(xí)體驗(yàn)報(bào)告、系統(tǒng)的學(xué)習(xí)支持服務(wù)中的提問和答疑等文本數(shù)據(jù);協(xié)作學(xué)習(xí)文本數(shù)據(jù)是學(xué)習(xí)者與其他學(xué)習(xí)伙伴進(jìn)行協(xié)同知識(shí)建構(gòu)的過程,如交流討論、協(xié)作行為和問題解決行為等文本數(shù)據(jù)[32]。
衡量學(xué)習(xí)過程產(chǎn)生的文本數(shù)據(jù)能否作為學(xué)習(xí)情感特征數(shù)據(jù),需要判斷數(shù)據(jù)是否體現(xiàn)學(xué)習(xí)者的在線學(xué)習(xí)情感體驗(yàn)。在線學(xué)習(xí)情感體驗(yàn)可以劃分為正向和負(fù)向兩個(gè)維度,具有臨場性、交互性、變化性、社會(huì)性、技術(shù)支配性和具身性特征[33]?,F(xiàn)有研究中采用的學(xué)習(xí)情感體驗(yàn)反饋文本數(shù)據(jù)載體包括:(1) SPOC論壇帖子。劉智等[34]發(fā)現(xiàn)在SPOC論壇互動(dòng)過程中,學(xué)習(xí)者的主觀態(tài)度傾向于積極極性,且該課程中學(xué)習(xí)者的積極情緒密度普遍高于困惑及消極情緒密度;(2)課程反思文本。單迎杰等[35]在課程每單元最后設(shè)置話題為“學(xué)習(xí)體驗(yàn)與反思”,鼓勵(lì)學(xué)習(xí)者分享其在該單元學(xué)習(xí)過程中的體驗(yàn)與感受,并對(duì)反思文本進(jìn)行質(zhì)性分析;(3)學(xué)習(xí)活動(dòng)記錄。朱孝平[36]在實(shí)訓(xùn)過程中以及實(shí)訓(xùn)活動(dòng)結(jié)束后,讓學(xué)生記錄、總結(jié)實(shí)訓(xùn)活動(dòng)的體驗(yàn)與收獲,該記錄文本作為“互動(dòng)工具”“反思工具”,研究發(fā)現(xiàn)學(xué)習(xí)者的體驗(yàn)特別豐富,這些體驗(yàn)多指向情感態(tài)度領(lǐng)域;(4)在線交互數(shù)據(jù)。馬寧等[37]開展大規(guī)模教師在線培訓(xùn),圍繞每周的學(xué)習(xí)主題開展在線異步交互活動(dòng),生成了12576條交互文本被平臺(tái)自動(dòng)記錄;通過向量機(jī)挖掘?qū)W習(xí)者隱藏在交互文本中的情感狀態(tài)和認(rèn)知水平,為自動(dòng)反饋提供依據(jù);(5)學(xué)習(xí)資源評(píng)論數(shù)據(jù)。張娜等[38]爬取12種領(lǐng)域的學(xué)科課程的有效數(shù)據(jù)68367條,其中包含千余門課程信息和評(píng)價(jià),采用統(tǒng)計(jì)分析和文本分析的方法,分析顯示積極評(píng)論數(shù)量都高于消極的評(píng)論數(shù)量。
以上研究所采用學(xué)習(xí)文本數(shù)據(jù)具有數(shù)據(jù)可自動(dòng)獲取、情感特征可提取、數(shù)據(jù)獲取途徑可行的特點(diǎn)。參考既有的個(gè)性化學(xué)習(xí)行為數(shù)據(jù)和文本情感測量情況,本研究在綜合分析的基礎(chǔ)上,以某高校在線學(xué)習(xí)平臺(tái)自動(dòng)記錄的數(shù)據(jù)作為來源,精選三門課程三年來的學(xué)習(xí)體驗(yàn)報(bào)告、學(xué)習(xí)資源評(píng)論數(shù)據(jù)、協(xié)作學(xué)習(xí)交互數(shù)據(jù)、師生答疑數(shù)據(jù)作為文本的數(shù)據(jù)來源。
(二)文本數(shù)據(jù)的收集
本研究選擇的文本數(shù)據(jù)都是平臺(tái)自動(dòng)記錄,存放于系統(tǒng)的數(shù)據(jù)庫中,可以自動(dòng)導(dǎo)出相關(guān)字段內(nèi)容得到。數(shù)據(jù)導(dǎo)出時(shí)系統(tǒng)管理員將數(shù)據(jù)做脫敏處理,主要用于訓(xùn)練模型識(shí)別語義中的情感信息,不涉及個(gè)人信息。
1.學(xué)習(xí)體驗(yàn)報(bào)告數(shù)據(jù)。在每門課程結(jié)束時(shí),教師會(huì)設(shè)置一個(gè)“學(xué)習(xí)報(bào)告或體驗(yàn)”活動(dòng),讓學(xué)生在平臺(tái)上提交學(xué)習(xí)結(jié)束后的體驗(yàn)總結(jié)。學(xué)習(xí)報(bào)告主要分為學(xué)習(xí)內(nèi)容、學(xué)習(xí)效果評(píng)價(jià)以及對(duì)學(xué)習(xí)資源的改進(jìn)建議等。學(xué)習(xí)體驗(yàn)報(bào)告通常是長文本,其中包含不同方面不同極性的情感,可能一個(gè)文本中包含的情感有多種。為了方便處理,這類報(bào)告按不同的評(píng)價(jià)點(diǎn)切分成幾份的短文本。
2.學(xué)習(xí)資源評(píng)論數(shù)據(jù)。系統(tǒng)包含學(xué)習(xí)資源庫,按照資源的類別比如課件、課程、文本、語音等的存放學(xué)習(xí)資源文件,提供給學(xué)習(xí)者學(xué)習(xí)。學(xué)習(xí)者瀏覽的時(shí)候每個(gè)資源在播放頁面下設(shè)置有點(diǎn)贊和評(píng)論區(qū),設(shè)置打分功能,提供1、3、5三個(gè)不同的分值,分別對(duì)應(yīng)高、中、低的評(píng)價(jià),學(xué)習(xí)者在點(diǎn)贊或評(píng)論時(shí)如果配合打分,后期會(huì)減少進(jìn)行數(shù)據(jù)標(biāo)注的工作量。
3.協(xié)作學(xué)習(xí)交互數(shù)據(jù)。協(xié)作學(xué)習(xí)交互數(shù)據(jù)包括論壇區(qū)的發(fā)帖信息和小組討論信息。這部分內(nèi)容包含學(xué)生學(xué)習(xí)活動(dòng)中形成的觀點(diǎn)、提出的困惑、問題得到解答后的回復(fù)等信息。
4.答疑數(shù)據(jù)。包含學(xué)生和教師之間提問和解惑的交流文本,平臺(tái)提供的學(xué)習(xí)支持服務(wù)的答疑文本。
四種內(nèi)容的數(shù)據(jù)收集后歸于一個(gè)文檔,對(duì)于和情感無關(guān)的一些冗余信息進(jìn)行初步篩選,比如標(biāo)點(diǎn)符號(hào)、重復(fù)信息等,去除無關(guān)信息,留下以句子為單位的文本數(shù)據(jù)。
(三)情感類型定義
根據(jù)Pekrun關(guān)于成就情緒的控制價(jià)值理論對(duì)學(xué)習(xí)情感的分類[39],本研究按學(xué)習(xí)情感的產(chǎn)生情境,定義學(xué)習(xí)情感類型,并確定情感表達(dá)方式。
一級(jí)指標(biāo)里按照三種不同的學(xué)習(xí)情境,包括結(jié)果/預(yù)期、結(jié)果/回顧、活動(dòng),定義三個(gè)一級(jí)指標(biāo);二級(jí)指標(biāo)里對(duì)應(yīng)每個(gè)一級(jí)指標(biāo),按照愉悅度進(jìn)行區(qū)分情感狀態(tài)分為積極和消極兩種傾向,定義為二級(jí)指標(biāo);三級(jí)指標(biāo)里對(duì)應(yīng)每一種情感極性,根據(jù)情感的喚醒度/激活度,分別定義為高、中、低三類,其中在結(jié)果回顧中,我們以情感的優(yōu)勢度劃分,根據(jù)情感對(duì)他人和外界環(huán)境的控制力和影響力,將結(jié)果原因分為無關(guān)的、自我和其他三類,按照積極和消極情感的極性分別分為三類不同情感。
根據(jù)控制價(jià)值理論,對(duì)應(yīng)三級(jí)指標(biāo),確定情感類型,并進(jìn)行編碼。其中結(jié)果/預(yù)期包括期待、希望、無望、放松、焦慮、絕望6種情感;結(jié)果/回顧中包括快樂、驕傲、感激、悲傷、羞愧、憤怒6種情感;活動(dòng)中包括享受、生氣、挫折、無聊4種情感。一共細(xì)分為16種情感類型,按順序從0至15進(jìn)行編碼,形成情感類型編碼文件。如表1所示。
(四)文本數(shù)據(jù)的情感標(biāo)注
對(duì)收集到的學(xué)習(xí)者的多個(gè)來源的文本材料進(jìn)行分析,采用三級(jí)編碼技術(shù),對(duì)所有與學(xué)習(xí)者體驗(yàn)有關(guān)的句子進(jìn)行預(yù)處理,去除無關(guān)信息,然后進(jìn)行編碼。首先對(duì)文本中的情態(tài)進(jìn)行初步分類,主要分成學(xué)習(xí)前的結(jié)果/預(yù)期,學(xué)習(xí)后的結(jié)果/回顧,學(xué)習(xí)過程中的活動(dòng)三個(gè)階段。每個(gè)階段按情感傾向性分為積極的情感、消極的情感,進(jìn)而根據(jù)情感強(qiáng)度分成具體的情感類型,如表1所示。通過與師生訪談等手段,進(jìn)一步證實(shí)了這種分類結(jié)果的合理性。
已標(biāo)注的情感數(shù)據(jù)匯成一個(gè)數(shù)據(jù)集文件,每一個(gè)完整句子一行,標(biāo)注好情感編碼,編碼的數(shù)字與情感類型一一對(duì)應(yīng),形成數(shù)據(jù)集,如下頁圖2所示。
利用學(xué)習(xí)情感標(biāo)注數(shù)據(jù)集,借助預(yù)訓(xùn)練BERT模型進(jìn)行分詞和詞向量編碼,本研究提出以下個(gè)性化學(xué)習(xí)資源推薦的文本情感識(shí)別模型技術(shù)架構(gòu)。模型分為訓(xùn)練模型和識(shí)別模型。訓(xùn)練模型主要用于數(shù)據(jù)集預(yù)訓(xùn)練,識(shí)別模型用于預(yù)測學(xué)習(xí)者的文本情感。模型的技術(shù)架構(gòu)如圖3所示。
整個(gè)模型包括輸入層、預(yù)處理層、BERT層、TextCNN層和輸出層。
(一)輸入層
訓(xùn)練模型導(dǎo)入數(shù)據(jù)集文件,輸入的數(shù)據(jù)為標(biāo)注的情感數(shù)據(jù)。一般將數(shù)據(jù)集隨機(jī)分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集和測試數(shù)據(jù)集,存放在train.txt,vec. txt,test.txt文件中,分別用于訓(xùn)練、驗(yàn)證和測試環(huán)節(jié)。數(shù)據(jù)文件中還必須有一個(gè)class.txt文件,存放數(shù)據(jù)情感分類和編碼的對(duì)照表。
識(shí)別模型讀取待識(shí)別文本,每次提取一個(gè)句子進(jìn)行分析。識(shí)別模型輸入層通過API接口與個(gè)性化推薦系統(tǒng)其他項(xiàng)目對(duì)接,以接收待識(shí)別的文本數(shù)據(jù)。
(二)預(yù)處理層
預(yù)處理主要是對(duì)輸入層數(shù)據(jù)進(jìn)行分詞和編碼。本研究采用BERT中的BertTokenizer進(jìn)行分詞,所以加載BERT模型時(shí)將同名的BertTokenizer也一同加載。由于BERT是預(yù)訓(xùn)練大量語料生成的優(yōu)化模型,參數(shù)已經(jīng)調(diào)整到“最佳狀態(tài)”,所以使用BERT編碼的詞向量特征信息準(zhǔn)確率比較高。BERT的分詞方法是把文本的每個(gè)字作為一個(gè)單位,例如輸入一個(gè)句子,分詞后用encode方法進(jìn)行編碼,形成句子的詞向量。
以中文句子:“視頻講解清晰”為例,分詞的結(jié)果是:
[cls,視,頻,講,解,清,晰,sep]
執(zhí)行分詞并編碼,將文字轉(zhuǎn)成編碼ID。
BERT編碼時(shí)在句子的第一個(gè)字前面加了一個(gè)標(biāo)志變量[cls]編碼,編碼后初始值為[101],表示句子的開頭,在輸出層時(shí)情感分類的編碼信息會(huì)在這個(gè)編碼中。每個(gè)句子分隔會(huì)加上一個(gè)[sep]編碼,編碼值為[102]。類似的標(biāo)志向量還有[mask]。數(shù)據(jù)集中每一個(gè)句子的長度是不等的,為了批處理時(shí)統(tǒng)一調(diào)用,還需要定義每次處理句子的長度,不足長度用PAD值0補(bǔ)足,過長的句子進(jìn)行截取,丟棄后面的內(nèi)容。句子的長度需要根據(jù)數(shù)據(jù)集中的句子的長度而定,一般取容納大部分句子的長度。
(三)BERT層
對(duì)輸入的詞向量進(jìn)行讀取和雙向特征運(yùn)算,使輸出向量帶有上下文的情感信息。輸入由兩部分構(gòu)成,包括上一節(jié)編碼的詞向量和位置編碼相加。因?yàn)锽ERT的機(jī)制是所有字詞同時(shí)輸入,此處疊加位置編碼可以記住句子中字的順序。位置編碼是隨機(jī)產(chǎn)生的,BERT中對(duì)詞向量編碼會(huì)轉(zhuǎn)化為768維,編碼后每個(gè)句子輸出的實(shí)際上768維度的矩陣。
(四)TextCNN層
TextCNN層主要作用是對(duì)BERT輸出的向量進(jìn)行卷積計(jì)算,通過卷積,提取每個(gè)句子的不同維度的情感特征。每個(gè)卷積核代表一個(gè)維度特征,為了從多維度提取向量的特征,分別設(shè)置大小為2,3,4的卷積核,每種尺寸卷積操作設(shè)置為2個(gè)。運(yùn)算結(jié)果輸入池化層,池化選取每個(gè)詞向量中的最大值,取到最大值標(biāo)量,再將不同卷積核的值拼接,輸出特征向量。最后將特征向量送入全連接層進(jìn)行計(jì)算,輸出一個(gè)含有16類情感特征的向量。
(五)輸出層
訓(xùn)練模型主要為了學(xué)習(xí)到更優(yōu)化的參數(shù),輸出會(huì)與驗(yàn)證值進(jìn)行比較,通過反向傳播對(duì)模型參數(shù)進(jìn)行調(diào)整。通過訓(xùn)練后將形成的模型導(dǎo)出,作為識(shí)別模型。識(shí)別模型將輸出結(jié)果通過API接口與在線學(xué)習(xí)系統(tǒng)的用戶界面聯(lián)系,輸出情感識(shí)別的結(jié)果?;蜃鳛閷W(xué)習(xí)推薦的子模塊,成為輸入項(xiàng)。
(一)識(shí)別學(xué)習(xí)者的情感狀態(tài)以調(diào)整資源推薦策略
文本情感識(shí)別可用于自動(dòng)檢測學(xué)習(xí)者的情感狀態(tài)及其變化,輔助資源推薦決策,將學(xué)習(xí)者從抑制學(xué)習(xí)的消極狀態(tài)轉(zhuǎn)移到激發(fā)學(xué)習(xí)的積極狀態(tài),提高學(xué)習(xí)干預(yù)的精準(zhǔn)性和效率。相關(guān)研究[40]表明,促進(jìn)學(xué)生的積極情緒和幸福感與學(xué)習(xí)成功、進(jìn)步相關(guān)。已有實(shí)驗(yàn)證明根據(jù)對(duì)與學(xué)習(xí)相關(guān)的參與、沮喪、無聊的情感自動(dòng)識(shí)別來制定學(xué)習(xí)內(nèi)容推薦的策略,使學(xué)習(xí)者保持在最佳情感狀態(tài),確實(shí)可以增加學(xué)習(xí)者參與度,從而促進(jìn)學(xué)習(xí)。本研究構(gòu)建的文本情感識(shí)別模型基于多場景下學(xué)習(xí)者的文本數(shù)據(jù),較全面把握學(xué)習(xí)過程的變化,對(duì)學(xué)習(xí)者情感進(jìn)行細(xì)分,能夠識(shí)別學(xué)習(xí)者潛在的學(xué)習(xí)情感狀態(tài)。通過評(píng)估學(xué)習(xí)者對(duì)某一學(xué)習(xí)過程或在某段時(shí)間的情感狀態(tài),可以有針對(duì)性地建立對(duì)應(yīng)不同情感狀態(tài)的推薦策略庫,自動(dòng)計(jì)算推薦促進(jìn)學(xué)習(xí)者積極情感或增強(qiáng)學(xué)習(xí)參與度的學(xué)習(xí)資源。例如當(dāng)觀察到學(xué)習(xí)者情感狀態(tài)處于認(rèn)知負(fù)荷過載的消極狀態(tài)時(shí),學(xué)習(xí)推薦系統(tǒng)可以降低難度或在待推薦資源列表中選擇輕松風(fēng)格的學(xué)習(xí)資源來調(diào)節(jié)學(xué)習(xí)者情感,相反,當(dāng)學(xué)習(xí)者從消極狀態(tài)轉(zhuǎn)入積極狀態(tài)時(shí),可以適當(dāng)增加資源推薦。由于識(shí)別的準(zhǔn)確度很大程度受數(shù)據(jù)的影響,推薦系統(tǒng)設(shè)計(jì)時(shí)需要考慮對(duì)數(shù)據(jù)采集的支持。
(二)對(duì)學(xué)習(xí)資源的情感評(píng)價(jià)影響學(xué)習(xí)資源推薦路徑
在個(gè)性化學(xué)習(xí)資源推薦系統(tǒng)中,學(xué)習(xí)發(fā)生在學(xué)習(xí)者和學(xué)習(xí)資源的交互中,學(xué)習(xí)者和學(xué)習(xí)資源具有較大的規(guī)模,推薦算法利用學(xué)習(xí)者的認(rèn)知、知識(shí)等個(gè)性化參數(shù)和學(xué)習(xí)資源特征,通過相似度等計(jì)算產(chǎn)生學(xué)習(xí)資源推薦列表。常見的推薦方法有基于內(nèi)容、基于協(xié)同過濾、基于混合推薦、基于社交網(wǎng)絡(luò)、基于情景感知等,資源推薦順序主要依據(jù)評(píng)分。實(shí)際應(yīng)用中學(xué)習(xí)資源多源異構(gòu)、依賴人工評(píng)價(jià)的特點(diǎn)會(huì)制約資源特征表示的及時(shí)性,簡單的評(píng)分很難響應(yīng)真實(shí)的需求。文本情感識(shí)別對(duì)學(xué)習(xí)資源推薦路徑有兩方面作用:(1)增加情感指標(biāo)影響推薦列表排序。通過觀察學(xué)習(xí)者和學(xué)習(xí)資源互動(dòng)過程的情感狀態(tài),提取學(xué)習(xí)者對(duì)學(xué)習(xí)資源的文本評(píng)價(jià)來判斷學(xué)習(xí)者對(duì)資源的情感傾向,在原有的推薦上增加情感評(píng)價(jià)的考量,提高推薦精準(zhǔn)度。比如將待推薦學(xué)習(xí)資源列表中學(xué)習(xí)者評(píng)論積極情感較多的資源排序靠前等;(2)通過情感識(shí)別和情感歸因,了解學(xué)習(xí)資源本身存在的問題,加以增強(qiáng)或改進(jìn),提升學(xué)習(xí)資源的質(zhì)量。
(三)從情感維度完善學(xué)習(xí)資源推薦建模方法
對(duì)學(xué)習(xí)者的研究是學(xué)習(xí)支持服務(wù)最重要的研究熱點(diǎn)之一,從學(xué)習(xí)者畫像、學(xué)習(xí)智能體到數(shù)字孿生的構(gòu)建,對(duì)學(xué)習(xí)者多維度多模態(tài)數(shù)據(jù)挖掘的理論和技術(shù)不斷發(fā)展。包括學(xué)習(xí)資源推薦在內(nèi)的人機(jī)交互教學(xué)系統(tǒng),已不僅滿足傳授知識(shí)、培養(yǎng)技能的功能性追求,更重要的是構(gòu)建促進(jìn)學(xué)習(xí)者身心健康發(fā)展的智能化個(gè)性化學(xué)習(xí)生態(tài)。文本情感識(shí)別在學(xué)習(xí)資源推薦中侵入性小、可靠性高,是構(gòu)建多模態(tài)情感識(shí)別的重要通道,可以為學(xué)習(xí)者建模提供情感維度的個(gè)性化參數(shù),提高個(gè)性化學(xué)習(xí)推薦的精準(zhǔn)度。在后續(xù)的研究中,可以就融入文本情感識(shí)別的學(xué)習(xí)者推薦建模方向開展設(shè)計(jì)和實(shí)驗(yàn)。
參考文獻(xiàn):
[1] 祝智庭.教育數(shù)字化轉(zhuǎn)型新認(rèn)知[J].教育家,2023,360(4):13-15.
[2] 宗陽,鄭勤華等.中國MOOCs學(xué)習(xí)者價(jià)值研究——基于RFM模型的在線學(xué)習(xí)行為分析[J].現(xiàn)代遠(yuǎn)距離教育,2016,164(2):21-28.
[3] 吳正洋,湯庸等.個(gè)性化學(xué)習(xí)推薦研究綜述[J].計(jì)算機(jī)科學(xué)與探索,2022,16(1):21-40.
[4] 翟雪松,許家奇等.在線教育中的學(xué)習(xí)情感計(jì)算研究——基于多源數(shù)據(jù)融合視角[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2022,40(9):32-44.
[5] SCHERER K R.Psychological models of emotion [J].The Neuropsychology of Emotion,2000,137(3):137-162.
[6] ORTONY A,TURNER T J.Whats basic about basic emotions [J]. Psychological Review,1990,97(3):315.
[7] MEHRABIAN A.Pleasure-arousal-dominance:A general framework for describing and measuring individual differences in temperament [J]. Current Psychology,1996,14(4):261-292.
[8] Bahreini,K.,Nadolski,R.,et al.Towards multimodal emotion recognition in E-learning environments [J].Interactive LearnIng Environments,2016, 24(3):590-605.
[9] Cordero,J.,Aguilar,J.,et al.Intelligent approaches to identify student learning styles through emotions in a classroom [J].Revista Ibérica de Sistemas e Tecnologias de Informa o,2019,E17:703-716.
[10] Hudlicka E.To feel or not to feel:The role of affect in humancomputer interaction [J].International Journal of Human-Computer Studies,2003,59(1):1-32.
[11] Picard R.Affective computing:challenges [J].International Journal of Human-Computer Studies,2003,59(1):55-64.
[12] Sheng Z,Lin Z Y,et al.The model of E-learning based on affective computing [C].Chengdu:IEEE,2010.
[13] S DMello,Lehman B,et al.Confusion can be beneficial for learning [J]. Learning & Instruction,2014,29:153-170.
[14] Yadegaridehkordi E,Noor N,et al.Affective computing in education:A systematic review and future research [DB/OL].https://www. sciencedirect.com/science/article/pii/S0360131519302027,2019-09-09.
[15] 權(quán)學(xué)良,曾志剛等.基于生理信號(hào)的情感計(jì)算研究綜述[J].自動(dòng)化學(xué)報(bào),2021,47(8):1769-1784.
[16] Woolf,B.P.,Arroyo,I,et al.Affective Tutors:Automatic Detection of and Response to Student Emotion [C].Berlin:Springer,2010.207-227.
[17] Feng T,Gao P,et al.Recognizing and regulating e-learners emotions based on interactive Chinese texts in e-learning systems [J]. Knowledge-Based Systems,2014,55:148-164.
[18] Fatahi,S.An experimental study on an adaptive e-learning environment based on learners personality and emotion [J].Educ Inf Technol,2019,(24):2225-2241.
[19] 田元,周曉蕾等.學(xué)習(xí)情感分析方法研究綜述[J].中國教育信息化,2021,505(22):1-6.
[20]黃兆培,張峰源等.情感識(shí)別中的遷移學(xué)習(xí)問題綜述[EB/OL].http:// kns.cnki.net/kcms/detail/11.2406.TN.20230227.0856.002.html,2023-04-02.
[21][39] PEKRUN R,GOETZ T,et al.Academic Emotions in Students Self-Regulated Learning and Achievement:A Program of Qualitative and Quantitative Research [J].Educational Psychologist,2002,37(2):91-105.
[22][26] 趙宏,傅兆陽等.基于特征融合的中文文本情感分析方法[J].蘭州理工大學(xué)學(xué)報(bào),2022,48(3):94-102.
[23][25] 李艷,張慕華.高校學(xué)生慕課和翻轉(zhuǎn)課堂體驗(yàn)實(shí)證研究——基于231條在線學(xué)習(xí)日志分析[J].現(xiàn)代遠(yuǎn)程教育研究,2015,137(5):73-84+93.
[24] 鄒菊梅,胡夢荻等.線上、線下及混合學(xué)習(xí)情感體驗(yàn)的特征分析與比較[J].現(xiàn)代教育技術(shù),2022,32(4):50-60.
[27] 趙京勝,宋夢雪等.自然語言處理中的文本表示研究[J].軟件學(xué)報(bào),2022,33(1):102-128.
[28] 戴敏,朱珠等.面向中文文本的情感信息抽取語料庫構(gòu)建[J].中文信息學(xué)報(bào),2015,29(4):67-73.
[29] 劉娟,譚均翹等.基于MOOC平臺(tái)數(shù)學(xué)類課程情感詞典的文本分析研究[J].科教導(dǎo)刊,2021,451(19):78-80.
[30] Salazar,C.,Montoya-Múnera,E.,et al.Sentiment analysis in learning resources [EB/OL].https://doi.org/10.1007/s40692-022-00237-9,2022-09-05.
[31] 穆肅,崔萌等.全景透視多模態(tài)學(xué)習(xí)分析的數(shù)據(jù)整合方法[J].現(xiàn)代遠(yuǎn)程教育研究,2021,33(1):26-37+48.
[32] 馬志強(qiáng),蘇珊.學(xué)習(xí)分析視域下的學(xué)習(xí)者模型研究脈絡(luò)與進(jìn)展[J].現(xiàn)代遠(yuǎn)距離教育,2016,166(4):44-50.
[33] 李同同,譚多寧等.在線學(xué)習(xí)情感體驗(yàn)的維度、特征及其作用機(jī)制[J].成人教育,2022,42(10):63-70.
[34] 劉智,楊重陽等.SPOC論壇互動(dòng)中學(xué)習(xí)者情緒特征及其與學(xué)習(xí)效果的關(guān)系研究[J].中國電化教育,2018,(4):102-110.
[35] 單迎杰,傅鋼善等.基于反思文本的慕課學(xué)習(xí)情感體驗(yàn)特征分析[J].電化教育研究,2021,42(4):53-60+75.
[36] 朱孝平,鄒菊梅等.實(shí)訓(xùn)活動(dòng)體驗(yàn)的情態(tài)分析方法[J].職業(yè)技術(shù)教育,2014,35(13):31-35.
[37] 馬寧,張燕玲等.面向在線異步交互文本的情感—認(rèn)知自動(dòng)化分析模型研究——以大規(guī)模教師在線培訓(xùn)為例[J].現(xiàn)代教育技術(shù),2022,32(5):83-92.
[38] 張娜,喬德聰.基于深度學(xué)習(xí)的在線學(xué)習(xí)評(píng)論情感分析研究[J].河南城建學(xué)院學(xué)報(bào),2020,29(4):63-71+92.
[40] Hurley J M,Carter C K,et al.Examining the predictive relationship between personality and emotion traits and students agent-directed emotions:towards emotionally-adaptive agent-based learning environments [J].User Modeling and User-Adapted Interaction,2016, 26(2-3):177-219.
作者簡介:
許桂芳:高級(jí)實(shí)驗(yàn)師,在讀博士,研究方向?yàn)檫h(yuǎn)程教育、教育信息化。
穆肅:教授,博士生導(dǎo)師,研究方向?yàn)榻逃斯ぶ悄?、遠(yuǎn)程教育。
The Role of Text Sentiment Recognition in Personalized Learning Resource Recommendation and Key Technologies
Xu Guifang1, Mu Su2
(1.School of Information Technology in Education, South China Normal University, Guangzhou 510631, Guangdong; 2.Institution of AI in education, South China Normal University, Guangzhou 510631, Guangdong)
Abstract: Learning resource pushing based on data intelligence analysis is one of the teaching services that precisely support personalized learning. With the development of artificial intelligence technology and learning analytics, resource pushing through the analysis of behavioral data, assessment data and log data has been more successfully applied, but it fails to realize resource pushing guided by learners personal emotional state. Therefore, this study addresses the lack of theory and practice of emotion value and emotion control in personalized learning resource recommendation, and aims to achieve multidimensional emotion recognition for personalized learning, uses BERT model and TextCNN to build a text emotion recognition model for personalized learning resource recommendation, and proposes the process of implementing the text emotion recognition model based on learners homework and forum content. The learning resource recommendation text sentiment recognition model and the implementation process can provide methodological support and technical route guidance for real applications.
Keywords: recommendation of learning resources; text emotion recognition; personalized learning
責(zé)任編輯:李雅瑄