摘要:隨著大數(shù)據(jù)、人工智能等新一代信息技術(shù)的迅速發(fā)展,智慧教育從理念模式向落地實踐的方向轉(zhuǎn)變,并逐步規(guī)?;l(fā)展。由于目前國內(nèi)在線教育平臺未能充分利用已有的海量學習者學習數(shù)據(jù)和學習資源數(shù)據(jù),導(dǎo)致學習者無法充分了解自己的學習情況并對學習資源產(chǎn)生信息迷航。針對上述問題,文章提出一種基于學習者畫像的個性化習題資源推薦系統(tǒng),利用學習者學習過程的數(shù)據(jù)并結(jié)合學習者畫像,為學習者提供個性化的習題資源推薦。該系統(tǒng)首先采用二次K-means聚類算法構(gòu)建學習者多維學習能力分數(shù),畫出學習者多維能力雷達圖,用以構(gòu)建學習者畫像;其次融合學習者多維能力分數(shù),采用多種推薦系統(tǒng)模型實現(xiàn)對學習者的個性化習題資源推薦;最后對學習者畫像和習題資源推薦進行可視化展示。該研究為在線教育平臺充分利用海量學習數(shù)據(jù)提供了新思路。
關(guān)鍵詞:學習者畫像;習題資源推薦;可視化展示;在線教育;智慧教育
中圖分類號:TP311" " " " 文獻標識碼:A" " " 文章編號:1674-0688(2024)06-0103-04
0 引言
2017年7月,國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中明確提出,推動人工智能在教學、管理、資源建設(shè)等方面的全流程應(yīng)用,促進人才培養(yǎng)模式和教學方法改革,構(gòu)建新型教育體系[1]。在學術(shù)領(lǐng)域,“互聯(lián)網(wǎng)+教育”領(lǐng)域的學術(shù)研究共同體呼吁教學組織方式、學校形態(tài)、教育供給模式和在線教育新業(yè)態(tài)的發(fā)展和創(chuàng)新[2]。近年來,隨著互聯(lián)網(wǎng)的快速發(fā)展,在線教育平臺的用戶數(shù)據(jù)呈爆發(fā)式增長。目前,個性化推薦系統(tǒng)是解決學習者面臨“信息過載”問題的一種有效方法。為了實現(xiàn)智慧教育中對學習者學習能力評估精細化、智能化的目標,以及幫助學習者解決學習過程中產(chǎn)生的認知過載和定向障礙等問題,設(shè)計一套個性化習題資源推薦系統(tǒng)尤為迫切。
國內(nèi)許多研究團隊正聚焦于學習者畫像的構(gòu)建方法和個性化學習資源推薦模型開展研究。謝雨婷等[3]基于主成分分析法提出九維綜合素質(zhì)評價指標,并借助自組織映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Map,SOM)構(gòu)建學生群體分類模型,完成對學生群體綜合素質(zhì)的評價。ZHOU等[4]基于MOOC(大型開放式網(wǎng)絡(luò)課程)學習平臺,將學習者學習過程中產(chǎn)生的6項數(shù)據(jù)通過K-means聚類分析劃分3個類別,再使用SPSS軟件將6維數(shù)據(jù)降至2維數(shù)據(jù),即任務(wù)完成度和學習熱情度,以評估學習者的學習情況,并構(gòu)建3種學習者畫像:學習天才畫像、積極勤奮畫像、學習遲緩畫像。LI等[5]設(shè)計一種基于協(xié)同過濾算法的個性化在線教育平臺,通過對協(xié)同過濾算法進行改進,較大地提高了推薦的準確性和效率。唐小燕等[6]提出采用兩個半自動編碼器模型從學生的學習行為特征和學習資源特征中提取學習者與學習資源的相關(guān)特征,再與矩陣分解結(jié)合,將學生和學習資源的交互記錄映射到隱式向量,用于推薦學習資源。
上述文獻對學習者進行聚類分析,實現(xiàn)對學習者群體的分類評估,并且結(jié)合學習者學習過程數(shù)據(jù),通過推薦算法為學習者推薦學習資源。在前人研究的基礎(chǔ)上,本文設(shè)計一款基于學習者畫像的個性化習題資源推薦系統(tǒng),該系統(tǒng)首先通過二次K-means聚類算法對學習者學習過程數(shù)據(jù)進行聚類評估,獲取3組不同的能力評分,其次根據(jù)學習者學習過程數(shù)據(jù)和能力評分,采用多種推薦模型為學習者推薦個性化的習題資源,最后將以上兩個部分的內(nèi)容進行可視化展示。
1 系統(tǒng)總體設(shè)計
本系統(tǒng)包括學習者畫像構(gòu)建模型和個性化習題資源推薦模型兩大功能模塊。首先,系統(tǒng)使用二次K-means聚類算法對學習者學習過程數(shù)據(jù)進行聚類評估,解決傳統(tǒng)學習者能力評估中類內(nèi)無法再次評估和評估數(shù)據(jù)類型單一的問題;其次,結(jié)合學習者學習過程數(shù)據(jù)和習題資源數(shù)據(jù)訓練個性化推薦模型,為學習者推薦更具個性化的習題資源,以解決學習者學習過程中出現(xiàn)的認知過載和定向障礙的問題。
本系統(tǒng)以某在線教育平臺提供的學習者學習過程數(shù)據(jù)和習題資源數(shù)據(jù)為基礎(chǔ),構(gòu)建學習者多維學習能力雷達圖,為學習者提供個性化的習題資源推薦,并且展示推薦系統(tǒng)模型的各項評價指標值。系統(tǒng)運行流程圖見圖1。
本系統(tǒng)的整體架構(gòu)一共劃分為以下7個部分:基礎(chǔ)層、數(shù)據(jù)層、預(yù)處理層、支撐層、服務(wù)層、業(yè)務(wù)層、展示層。系統(tǒng)架構(gòu)設(shè)計圖見圖2。
(1)基礎(chǔ)層?;A(chǔ)層包括網(wǎng)絡(luò)、本地服務(wù)器、操作系統(tǒng)及中間件,為整個系統(tǒng)架構(gòu)提供軟、硬件支撐。
(2)數(shù)據(jù)層。數(shù)據(jù)層的功能主要是向業(yè)務(wù)層提供數(shù)據(jù)并保證數(shù)據(jù)的可靠性,當業(yè)務(wù)層需要數(shù)據(jù)時,數(shù)據(jù)層負責從數(shù)據(jù)庫讀取數(shù)據(jù)后提供給業(yè)務(wù)層。數(shù)據(jù)層中的主要數(shù)據(jù)來源于某在線教育平臺提供的學習者學習信息和習題資源信息,數(shù)據(jù)脫敏后同步到系統(tǒng)的數(shù)據(jù)庫中,該部分數(shù)據(jù)將作為系統(tǒng)前期個性化推薦系統(tǒng)計算模塊的數(shù)據(jù)支撐,系統(tǒng)后期支持教師和學習者上傳習題資源,用戶也可以使用。系統(tǒng)利用MySQL數(shù)據(jù)庫存儲習題資源信息、用戶數(shù)據(jù)和交互信息。
(3)預(yù)處理層。預(yù)處理層主要采用數(shù)據(jù)預(yù)處理功能對采集數(shù)據(jù)進行清理,過濾掉空的習題資源,并且完成學習者學習行為數(shù)據(jù)的標準化,作為學習者畫像構(gòu)建和個性化推薦模型訓練的數(shù)據(jù)支撐。
(4)支撐層。支撐層使用TensorFlow深度學習庫和Skearn機器學習庫為模型訓練、評估及預(yù)測提供服務(wù)。使用Django框架為用戶信息管理、習題資源管理和搜索排序提供數(shù)據(jù)服務(wù)和功能支持。
(5)服務(wù)層。服務(wù)層分為三大模塊,分別是學習者畫像構(gòu)建模塊、推薦模塊、信息管理模塊,為業(yè)務(wù)層提供數(shù)據(jù)處理支持。
(6)業(yè)務(wù)層。業(yè)務(wù)層是整個系統(tǒng)的核心,業(yè)務(wù)層將產(chǎn)生的數(shù)據(jù)通過數(shù)據(jù)層保存到數(shù)據(jù)庫,業(yè)務(wù)層具有五大業(yè)務(wù)模塊,分別是學習者畫像構(gòu)建業(yè)務(wù)、習題資源業(yè)務(wù)、用戶管理業(yè)務(wù)、搜索業(yè)務(wù)、推薦業(yè)務(wù),其中推薦業(yè)務(wù)模塊通過數(shù)據(jù)層提供的數(shù)據(jù),使用融合了多頭自注意力機制的xDeepFM模型訓練并計算得到用戶的推薦習題資源列表,結(jié)果經(jīng)業(yè)務(wù)層處理后提供給展示層,然后保存到數(shù)據(jù)庫。
(7)展示層。展示層主要使用Web前端技術(shù)Django框架為用戶提供瀏覽、操作功能,以及為管理者提供用戶和數(shù)據(jù)管理。當用戶打開瀏覽器訪問個性化習題資源推薦系統(tǒng)首頁時,用戶發(fā)出的請求將轉(zhuǎn)接到業(yè)務(wù)層,業(yè)務(wù)層通過計算,從數(shù)據(jù)層中的數(shù)據(jù)庫獲取推薦習題資源等數(shù)據(jù)后返回給展示層,展示層通過渲染前端UI(用戶界面)最終將數(shù)據(jù)呈現(xiàn)給用戶。該層采用的技術(shù)包括HTML5、CSS(層疊樣式表)、JavaScript等。
2 系統(tǒng)實現(xiàn)方式
2.1 學習者畫像構(gòu)建模型
學習者畫像構(gòu)建模型主要使用二次K-means聚類算法對學習者學習過程數(shù)據(jù)進行聚類評估。本研究通過分析某在線教育平臺提供的反映學習者學習行為的數(shù)據(jù)集,結(jié)合前人的研究和教育學相關(guān)知識,構(gòu)建出學習者的能力評估分數(shù)。首先從學生學習過程中抽取16個反映學習者學習情況的特征維度,將其進行整合,構(gòu)建新的特征表示學生學習能力評估維度;其次通過實訓題測評時長得分、實訓題測評次數(shù)得分、作業(yè)成績、視頻觀看次數(shù)、實訓題通過率、關(guān)卡通過率構(gòu)建知識技能分數(shù),測試完成率、簽到成績、測試打回次數(shù)、作業(yè)打回次數(shù)、視頻觀看率、作業(yè)完成率構(gòu)建學習態(tài)度分數(shù),以及討論次數(shù)、簽到次數(shù)、測驗完成次數(shù)、作業(yè)完成次數(shù)構(gòu)建課程興趣分數(shù)。
本系統(tǒng)首先采用第一次K-means聚類算法對學習者的學習行為特征進行多維度聚類,對每個類別求平均分后進行排序,以得到每位學習者的第一個能力評估得分;其次使用第二次K-means對每個類別進行聚類,對獲得的每個新類別求平均分后排序,以得到每位學習者的第二個能力評估得分,第一次聚類得分乘以10再與第二次聚類得分相加,即得到學習者的能力評估分數(shù)。K-means聚類算法步驟如下。
(1)隨機初始化簇的數(shù)目K和聚類中心,最大迭代數(shù)為N。
(2)根據(jù)公式(1)計算每個樣本到聚類中心之間的歐式距離d,將每個樣本合并到最近的聚類中心,使其成為該聚類中心的一個類。
(3)計算每個聚類中樣本的均值,更新聚類中心。
(4)重復(fù)“步驟(2)”和“步驟(3)”,直到聚類中心不再變化。
2.2 個性化習題資源推薦模型
個性化習題資源推薦模型主要使用學習者學習過程數(shù)據(jù)和習題資源數(shù)據(jù)訓練多種推薦算法模型,得出多種推薦算法模型的評價指標,將評價指標最佳的推薦模型作為學習者習題資源推薦模型。
本系統(tǒng)采用的數(shù)據(jù)集由學習者特征信息表、習題特征信息表和學習者對習題提出問題的交互記錄3個部分組成,包含34 832名學習者、7 734道習題和34 832條交互記錄。學習者特征為學生的性別、教育背景和本文“2.1”小節(jié)中構(gòu)建的16個學習者畫像特征,其中包括作業(yè)成績、測驗成績、知識技能分數(shù)、學習態(tài)度分數(shù)和課程興趣分數(shù)等。習題特征為習題ID、習題所屬章節(jié)ID、學生對習題的難度評價分數(shù)、學習人數(shù)、包含的題目數(shù)量等。習題資源均為計算機編程類習題,包括但不限于C語言、Java語言、數(shù)據(jù)結(jié)構(gòu)、人工智能算法與設(shè)計等課程。系統(tǒng)將上述數(shù)據(jù)集輸入推薦算法模型中,訓練多個推薦算法模型,推薦算法模型包括因子分解機算法、DSSM(Deep Structured Semantic Model)雙塔模型、YouTube DNN(Deep Neural Networks for YouTube Recommendations)模型、PNN(Product-based Neural Network)模型、xDeepFM模型、融合自注意力機制的xDeepFM模型(SA-xDee?pFM)、融合多頭自注意力的xDeepFM模型(MHAS-xDeepFM)。計算上述推薦算法和模型的評價指標,最終選擇評價指標最佳的模型作為個性化習題資源推薦模型,為學習者推薦習題資源。
2.3 可視化頁面展示
系統(tǒng)通過將前期某在線教育平臺提供的數(shù)據(jù)集上傳至數(shù)據(jù)庫,采用學習者畫像構(gòu)建方法畫出學習者多維學習能力雷達圖,并將此類數(shù)據(jù)展示在系統(tǒng)上。系統(tǒng)可對數(shù)據(jù)進行預(yù)處理和聚類分析,主要包括數(shù)據(jù)清洗、數(shù)據(jù)標準化、特征提取、K-means聚類等。對數(shù)據(jù)進行聚類分析,畫出學習者能力評估分數(shù)雷達圖(見圖3),以便更好地將學習過程數(shù)據(jù)展示給學習者。
系統(tǒng)構(gòu)建學習者畫像后,采用個性化習題資源推薦模型,為學習者提供習題資源推薦。推薦模型對全量數(shù)據(jù)集進行推薦召回,得到召回列表,再將召回列表中的習題展示在學習者的推薦頁面中(見圖4)。
3 系統(tǒng)運行結(jié)果及分析
系統(tǒng)由學習者畫像構(gòu)建模型和個性化習題資源推薦模型兩大功能模塊組成,學習者畫像構(gòu)建模型對學習者多維學習能力進行聚類評估,畫出學習者多維能力雷達圖;個性化習題資源推薦模型采用多個推薦模型進行實驗,然后對比評價指標,并采用評價指標最佳的推薦模型為學習者提供個性化的習題資源。推薦模型準確率對比頁面見圖5。
系統(tǒng)采用目前業(yè)界廣泛認可的聚類算法和人工智能推薦模型,旨在實現(xiàn)學習者畫像和習題資源推薦功能。通過使用通用接口進行定義,可以提高模型的魯棒性和可擴展性,從而便于新模型的開發(fā)和導(dǎo)入。
4 結(jié)語
在線教育平臺的用戶數(shù)據(jù)和學習資源數(shù)據(jù)快速增長,當前主流的在線教育平臺存在兩大挑戰(zhàn):一是在線教育平臺只提供各種學習資源給學習者,缺少對學習者的深入評估,無法根據(jù)學習者的學習過程推薦學習資源;二是學習者學習過程中產(chǎn)生的數(shù)據(jù)過多且存在不同的評價維度,由于缺少有效的個性化推薦方法,所以平臺無法準確地根據(jù)學習者的需求為學習者提供個性化的推薦。針對上述問題,本文通過某在線教育平臺提供的原始數(shù)據(jù)集,研究學習者畫像的構(gòu)建方法和個性化習題資源推薦模型,實現(xiàn)了學習者多維學習能力評估功能和個性化習題資源推薦功能。該系統(tǒng)采用的是聚類算法和多種推薦算法模型實現(xiàn)這兩大功能,具有良好的魯棒性和可擴展性,未來可加入新的算法模型進行二次開發(fā)設(shè)計。
5 參考文獻
[1]曹培杰.智慧教育:人工智能時代的教育變革[J].教育研究,2018,39(8):121-128.
[2]陳麗,徐亞倩.“互聯(lián)網(wǎng)+教育”研究的十大學術(shù)新命題[J].電化教育研究,2021,42(11):5-12.
[3]謝雨婷,代秀云,黃先莉,等.基于學生成績的學生綜合素質(zhì)量化評價研究[J].高等理科教育,2021(1):115-123.
[4]ZHOU Y,F(xiàn)AN H D.Research on construction of learner portrait based on learning analytics technology[C]//International Conference on Artificial Intelligence and Industrial Design(AIID 2022).SPIE,2023,12612:223-227.
[5]LI J,YE Z.Course recommendations in online education based on collaborative filtering recommendation algorithm[J].Complexity,2020:1-10.
[6]唐小燕,李斌,張承江,等.基于半自動編碼器的學習資源推薦[J].揚州大學學報(自然科學版),2023,26(1):74-78.
*湖南省重點實驗室項目“基礎(chǔ)教育信息化技術(shù)”(2015TP1017);教育部產(chǎn)學合作協(xié)同育人項目“工業(yè)互聯(lián)網(wǎng)人才培養(yǎng)的新工科專業(yè)建設(shè)”(230804978265939)。
【作者簡介】曾榮科,男,湖南常德人,在讀碩士研究生,研究方向:自然語言處理、推薦系統(tǒng);李倩倩,女,河南虞城人,碩士,講師,研究方向:大數(shù)據(jù)分析;周文健,男,湖南衡陽人,在讀本科,研究方向:大數(shù)據(jù)分析;李璐瑤,女,河南新鄉(xiāng)人,在讀碩士研究生,研究方向:推薦系統(tǒng);李睿,男,湖南郴州人,在讀碩士研究生,研究方向:大數(shù)據(jù)分析。
【引用本文】曾榮科,李倩倩,周文健,等.基于學習者畫像的個性化習題資源推薦系統(tǒng)設(shè)計與實現(xiàn)[J].企業(yè)科技與發(fā)展,2024(6):103-106.