摘要:為提升學(xué)習(xí)者的學(xué)習(xí)效率與個(gè)性化學(xué)習(xí)體驗(yàn),本文設(shè)計(jì)并實(shí)現(xiàn)了基于知識(shí)圖譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng)。采用知識(shí)圖譜構(gòu)建與用戶畫像技術(shù),通過分析學(xué)習(xí)者的學(xué)習(xí)行為、興趣偏好,實(shí)現(xiàn)智能化學(xué)習(xí)資源推薦。本文內(nèi)容主要涵蓋系統(tǒng)架構(gòu)設(shè)計(jì)、功能模塊開發(fā)、關(guān)鍵技術(shù)選型,并進(jìn)行了系統(tǒng)測(cè)試。結(jié)果表明,該系統(tǒng)能準(zhǔn)確構(gòu)建學(xué)習(xí)者的知識(shí)圖譜,推薦個(gè)性化學(xué)習(xí)路徑,在實(shí)際應(yīng)用中表現(xiàn)出較高的推薦精準(zhǔn)度與系統(tǒng)響應(yīng)速度,可為個(gè)性化教育發(fā)展提供技術(shù)支持。
關(guān)鍵詞:知識(shí)圖譜;用戶管理;個(gè)性化推薦
引言
隨著教育信息化、智能化發(fā)展,個(gè)性化學(xué)習(xí)成為提高學(xué)習(xí)效率、學(xué)習(xí)體驗(yàn)的關(guān)鍵途徑。傳統(tǒng)教學(xué)模式難以針對(duì)學(xué)生的個(gè)體差異、學(xué)習(xí)需求進(jìn)行個(gè)性化調(diào)整,造成學(xué)生學(xué)習(xí)效果參差不齊,學(xué)習(xí)興趣難以持續(xù)。知識(shí)圖譜作為能表示知識(shí)點(diǎn)關(guān)系的工具,為實(shí)現(xiàn)個(gè)性化學(xué)習(xí)提供了新的技術(shù)手段。通過構(gòu)建知識(shí)圖譜,可將不同學(xué)科的知識(shí)點(diǎn)以關(guān)聯(lián)方式組織起來,使學(xué)習(xí)者能直觀理解各知識(shí)點(diǎn)之間的聯(lián)系,基于當(dāng)前知識(shí)狀態(tài),動(dòng)態(tài)推薦適合的學(xué)習(xí)資源[1]。目前,已有部分關(guān)于個(gè)性化學(xué)習(xí)推薦系統(tǒng)基于知識(shí)圖譜展開的研究,但在準(zhǔn)確性、實(shí)時(shí)性、可擴(kuò)展性上仍存在不足,且在大規(guī)模應(yīng)用場(chǎng)景中,難以有效處理復(fù)雜的學(xué)習(xí)行為數(shù)據(jù),無法充分實(shí)現(xiàn)學(xué)習(xí)資源的精準(zhǔn)推薦?;谏鲜鰡栴},本研究設(shè)計(jì)并實(shí)現(xiàn)了基于知識(shí)圖譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng),旨在充分利用知識(shí)圖譜的優(yōu)勢(shì),通過構(gòu)建動(dòng)態(tài)的學(xué)習(xí)者知識(shí)模型與高效的推薦算法,可為學(xué)生提供個(gè)性化學(xué)習(xí)路徑與資源推薦。研究成果不僅為個(gè)性化教育提供了技術(shù)支持,也為知識(shí)圖譜在教育領(lǐng)域應(yīng)用拓展創(chuàng)造了新可能。
1. 基于知識(shí)圖譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng)設(shè)計(jì)需求分析
1.1 系統(tǒng)架構(gòu)設(shè)計(jì)
基于知識(shí)圖譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng)采用B/S(Browser/Server)架構(gòu)設(shè)計(jì),以簡(jiǎn)化用戶端部署,提高系統(tǒng)擴(kuò)展性。系統(tǒng)總體架構(gòu)設(shè)計(jì)主要由用戶層、應(yīng)用層、數(shù)據(jù)層三個(gè)核心部分組成,如表1所示。(1)用戶層是系統(tǒng)前端部分,用戶通過瀏覽器訪問系統(tǒng)Web界面,無須安裝額外軟件。該層實(shí)現(xiàn)了用戶注冊(cè)、登錄、學(xué)習(xí)資源訪問、個(gè)性化推薦等交互功能,通過HTTP/HTTPS通信協(xié)議與服務(wù)器進(jìn)行數(shù)據(jù)交互。(2)應(yīng)用層是系統(tǒng)的核心部分,部署在服務(wù)器端,包括系統(tǒng)軟件功能模塊,如用戶管理模塊、知識(shí)圖譜構(gòu)建模塊、推薦算法模塊、學(xué)習(xí)資源管理模塊、學(xué)習(xí)資源管理模塊,以及API接口等。(3)數(shù)據(jù)層主要包括關(guān)系型數(shù)據(jù)庫(MySQL)和圖形數(shù)據(jù)庫(Neo4j),負(fù)責(zé)系統(tǒng)數(shù)據(jù)的存儲(chǔ)與管理,包括用戶數(shù)據(jù)、知識(shí)圖譜數(shù)據(jù)、學(xué)習(xí)資源數(shù)據(jù)等。
1.2 系統(tǒng)軟件功能模塊設(shè)計(jì)
本系統(tǒng)軟件功能主要由用戶管理模塊、學(xué)習(xí)資源管理模塊、知識(shí)圖譜構(gòu)建與維護(hù)模塊、個(gè)性化推薦模塊四個(gè)核心模塊構(gòu)成,如圖1所示。各模塊相互獨(dú)立,通過API接口實(shí)現(xiàn)數(shù)據(jù)交互與協(xié)作,以此來確保系統(tǒng)整體功能高效運(yùn)行。
1.2.1 用戶管理模塊
用戶管理模塊主要負(fù)責(zé)管理用戶注冊(cè)、登錄、信息存儲(chǔ)、用戶畫像的構(gòu)建與更新。在用戶注冊(cè)與登錄過程中,模塊使用加密算法MD5對(duì)用戶密碼進(jìn)行加密存儲(chǔ),以此來確保用戶信息安全性,通過身份驗(yàn)證協(xié)議OAuth 2.0實(shí)現(xiàn)安全的用戶身份驗(yàn)證機(jī)制[2]。在用戶信息存儲(chǔ)方面,用戶管理模塊利用關(guān)系型數(shù)據(jù)庫MySQL存儲(chǔ)用戶的基本信息、學(xué)習(xí)行為數(shù)據(jù)、歷史學(xué)習(xí)記錄。為優(yōu)化數(shù)據(jù)訪問效率,模塊通過索引、緩存技術(shù)提升數(shù)據(jù)庫的查詢速度,確保在大規(guī)模用戶訪問時(shí)的響應(yīng)性能[3]。在用戶畫像構(gòu)建方面,該模塊采用數(shù)據(jù)挖掘與分析算法,從用戶學(xué)習(xí)行為數(shù)據(jù)(如學(xué)習(xí)時(shí)長(zhǎng)、瀏覽記錄、學(xué)習(xí)偏好等)中提取特征,建立用戶畫像模型[4]。
1.2.2 學(xué)習(xí)資源管理模塊
學(xué)習(xí)資源管理模塊負(fù)責(zé)對(duì)系統(tǒng)的學(xué)習(xí)資源進(jìn)行分類、存儲(chǔ)、標(biāo)注、檢索,以確保資源能根據(jù)用戶需求進(jìn)行精準(zhǔn)推薦、展示。該模塊采用層次分類算法對(duì)學(xué)習(xí)資源進(jìn)行自動(dòng)化分類,將資源按學(xué)科、難度、知識(shí)點(diǎn)關(guān)聯(lián)等維度進(jìn)行分層管理。分類后的資源通過標(biāo)簽系統(tǒng)進(jìn)行標(biāo)注,每個(gè)資源都被賦予多個(gè)相關(guān)標(biāo)簽(tag),如主題、難度等級(jí)、適用年級(jí)等,以便后續(xù)檢索、推薦使用[5]。在學(xué)習(xí)資源相關(guān)度計(jì)算中,該模塊采用TF-IDF(詞頻-逆文檔頻率)算法來衡量資源與搜索關(guān)鍵詞的匹配程度,可表示為
(1)
式中,Rij表示資源i與j標(biāo)簽之間的相關(guān)度;TFij為資源i中j標(biāo)簽出現(xiàn)的頻率;
IDFj為標(biāo)簽j的逆文檔頻率;TFik表示在學(xué)習(xí)資源i中,標(biāo)簽k出現(xiàn)的詞頻;IDFk表示標(biāo)簽k的逆文檔頻率;表示所有標(biāo)簽在資源i中的詞頻-逆文檔頻率(TF-IDF)平方和,用于對(duì)相關(guān)度值進(jìn)行歸一化處理,使其值介于0到1之間。
該公式通過計(jì)算標(biāo)簽的詞頻與逆文檔頻率來評(píng)估資源與標(biāo)簽的匹配度,從而實(shí)現(xiàn)對(duì)用戶輸入的關(guān)鍵詞的快速匹配和資源的精準(zhǔn)檢索[6]。
1.2.3 知識(shí)圖譜構(gòu)建與維護(hù)模塊
知識(shí)圖譜構(gòu)建與維護(hù)模塊的設(shè)計(jì)核心是從多源數(shù)據(jù)中抽取知識(shí)點(diǎn)關(guān)系,動(dòng)態(tài)更新、維護(hù)知識(shí)圖譜的完整性。該模塊采用命名實(shí)體識(shí)別(NER)技術(shù)從文本數(shù)據(jù)中識(shí)別出知識(shí)點(diǎn)(如概念、術(shù)語、人物、地點(diǎn)等),使用依存句法分析與關(guān)系抽取模型(如基于BERT的深度學(xué)習(xí)模型)來識(shí)別實(shí)體之間關(guān)系[7]。識(shí)別出的知識(shí)點(diǎn)、關(guān)系被結(jié)構(gòu)化存儲(chǔ)在圖數(shù)據(jù)庫Neo4j中,以實(shí)現(xiàn)高效的查詢管理。為計(jì)算知識(shí)點(diǎn)之間關(guān)聯(lián)度,該模塊采用協(xié)同頻率(Co-occurrence Frequency)算法,可表示為
(2)
式中,Sxy表示知識(shí)點(diǎn)x和y知識(shí)點(diǎn)之間的相似度(關(guān)聯(lián)度),用于衡量?jī)烧咴谥R(shí)圖譜中的關(guān)聯(lián)強(qiáng)度;Cxy表示知識(shí)點(diǎn)x和y在同一文檔或上下文中共同出現(xiàn)的次數(shù),即共現(xiàn)頻率;Cx和Cy分別表示知識(shí)點(diǎn)x和y的獨(dú)立出現(xiàn)次數(shù)。
該算法通過計(jì)算知識(shí)點(diǎn)在文檔中的共現(xiàn)頻率,判斷知識(shí)點(diǎn)之間的相關(guān)性,進(jìn)而在圖數(shù)據(jù)庫中建立節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系[8]。
1.2.4 個(gè)性化推薦模塊
個(gè)性化推薦模塊的核心是利用用戶畫像、知識(shí)圖譜數(shù)據(jù),通過協(xié)同過濾算法為每個(gè)用戶提供精準(zhǔn)的學(xué)習(xí)資源推薦。協(xié)同過濾算法可分為基于用戶的協(xié)同過濾、基于物品的協(xié)同過濾兩種方法。模塊采用基于用戶的協(xié)同過濾方法,通過計(jì)算用戶之間的相似度來預(yù)測(cè)用戶對(duì)未接觸資源的可能評(píng)分[9]。該模塊會(huì)從用戶管理模塊中獲取用戶畫像數(shù)據(jù),包括用戶學(xué)習(xí)行為、偏好和歷史學(xué)習(xí)記錄等,將這些數(shù)據(jù)與知識(shí)圖譜中關(guān)聯(lián)的知識(shí)點(diǎn)進(jìn)行整合,以構(gòu)建用戶-資源的評(píng)分矩陣[10]。模塊通過計(jì)算用戶之間的相似度來尋找相似用戶,根據(jù)相似用戶對(duì)目標(biāo)資源的評(píng)分來預(yù)測(cè)目標(biāo)用戶評(píng)分??杀硎緸?/p>
(3)
式中,Pui表示用戶u對(duì)資源i的預(yù)測(cè)評(píng)分,是系統(tǒng)用于評(píng)估用戶對(duì)該資源的興趣程度的數(shù)值。表示用戶u的平均評(píng)分,用于標(biāo)準(zhǔn)化用戶評(píng)分行為,以消除用戶間評(píng)分尺度差異影響。Rvi是用戶v對(duì)資源i的實(shí)際評(píng)分;是用戶v的平均評(píng)分,用于調(diào)整評(píng)分偏差;sim(u,v)表示用戶u與v用戶的相似度,通過余弦相似度或皮爾遜相關(guān)系數(shù)計(jì)算,以衡量用戶之間的相似程度。
該公式通過將相似用戶的評(píng)分加權(quán)平均,預(yù)測(cè)目標(biāo)用戶對(duì)某一資源的興趣程度。
2. 系統(tǒng)測(cè)試與性能評(píng)估
2.1 測(cè)試方法與測(cè)試環(huán)境
系統(tǒng)測(cè)試采用黑盒測(cè)試和白盒測(cè)試相結(jié)合的方法,以確保系統(tǒng)功能、性能的全面驗(yàn)證。測(cè)試環(huán)境配置為Ubuntu 20.04 LTS服務(wù)器,硬件采用戴爾PowerEdge R740xd服務(wù)器,配備2個(gè)Intel Xeon Gold 6248R處理器、256GB內(nèi)存、4TB NVMe SSD存儲(chǔ)。前端環(huán)境在谷歌Chrome瀏覽器(版本91.0)上進(jìn)行測(cè)試,后端服務(wù)通過Spring Boot框架搭建,部署在Tomcat 9.0應(yīng)用服務(wù)器上。測(cè)試工具使用JMeter進(jìn)行壓力測(cè)試,Postman用于API測(cè)試,Selenium用于自動(dòng)化功能測(cè)試,Grafana配合Prometheus進(jìn)行系統(tǒng)性能的監(jiān)控。測(cè)試指標(biāo)主要包括系統(tǒng)響應(yīng)時(shí)間、并發(fā)處理能力、內(nèi)存、CPU使用率、數(shù)據(jù)庫查詢性能等。壓力測(cè)試在100、500、1000、5000并發(fā)用戶場(chǎng)景下進(jìn)行。
2.2 測(cè)試結(jié)果分析
測(cè)試結(jié)果如表2所示,系統(tǒng)在功能性、穩(wěn)定性、性能上均達(dá)到了預(yù)期目標(biāo)。在系統(tǒng)響應(yīng)時(shí)間測(cè)試中,在100并發(fā)用戶時(shí),系統(tǒng)平均響應(yīng)時(shí)間為0.48秒;在500并發(fā)用戶時(shí)為0.75秒;在1000并發(fā)用戶時(shí)為0.98秒;在5000并發(fā)用戶時(shí)為2.45秒。與目標(biāo)值對(duì)比,系統(tǒng)在1000并發(fā)以下環(huán)境時(shí),響應(yīng)時(shí)間保持在1秒以內(nèi),性能優(yōu)良。在壓力測(cè)試過程中,CPU使用率最高達(dá)到78%,內(nèi)存使用率峰值為65%,均處于可接受范圍內(nèi),數(shù)據(jù)表明系統(tǒng)在高負(fù)載情況下能穩(wěn)定運(yùn)行。在數(shù)據(jù)庫性能測(cè)試上,MySQL查詢?cè)?000用戶并發(fā)時(shí)的平均查詢時(shí)間為150ms,Neo4j圖數(shù)據(jù)庫在查詢用戶知識(shí)點(diǎn)關(guān)系時(shí)的平均查詢時(shí)間為200ms,均符合系統(tǒng)性能要求。測(cè)試結(jié)果充分證明了本系統(tǒng)的高效性、穩(wěn)定性、準(zhǔn)確性。
結(jié)語
本文設(shè)計(jì)并實(shí)現(xiàn)了基于知識(shí)圖譜的個(gè)性化學(xué)習(xí)推薦系統(tǒng),從系統(tǒng)架構(gòu)、模塊設(shè)計(jì)、開發(fā)環(huán)境、實(shí)現(xiàn)過程、系統(tǒng)測(cè)試等方面進(jìn)行了探討。系統(tǒng)采用B/S架構(gòu),利用協(xié)同過濾、TF-IDF、共現(xiàn)頻率等算法,結(jié)合用戶畫像、知識(shí)圖譜,實(shí)現(xiàn)了個(gè)性化學(xué)習(xí)路徑與資源推薦。系統(tǒng)在真實(shí)環(huán)境下進(jìn)行了全面的功能測(cè)試,結(jié)果表明,在高并發(fā)條件下,系統(tǒng)保持著快速響應(yīng)和穩(wěn)定性,各項(xiàng)性能指標(biāo)均符合預(yù)期目標(biāo)。研究表明,本系統(tǒng)在提升個(gè)性化學(xué)習(xí)體驗(yàn)、學(xué)習(xí)效率方面展現(xiàn)出良好性能,為個(gè)性化教育系統(tǒng)開發(fā)與應(yīng)用提供了技術(shù)支持。
參考文獻(xiàn):
[1]劉超,余巖化.融合降噪策略與多視圖對(duì)比學(xué)習(xí)的知識(shí)感知推薦模型[EB/OL].[2024-11-20].http://kns.cnki.net/kcms/detail/51.1307.TP.20241107.1406.008.html.
[2]池亞平,吳冰,徐子涵.大語言模型在威脅情報(bào)生成方面的研究進(jìn)展[J].信息安全研究,2024,10(11):1028-1035.
[3]沙瀟,王建文,丁建川,等.融合層級(jí)知識(shí)圖譜嵌入與注意力機(jī)制的推薦方法[EB/OL].[2024-11-20].http://kns.cnki.net/kcms/detail/11.5602.tp.20241104.1833.004.html.
[4]劉亦凡,代萌,付峰.基于知識(shí)圖譜的資源推薦系統(tǒng)設(shè)計(jì)及其在醫(yī)用傳感器課程教學(xué)中的應(yīng)用[J].醫(yī)療衛(wèi)生裝備,2024,45(10):93-97.
[5]劉高.基于長(zhǎng)短期用戶行為序列的產(chǎn)品設(shè)計(jì)知識(shí)智能推薦方法研究[D].溫州:溫州大學(xué),2022.
[6]孫巖,周立新,孫連君,等.知識(shí)圖譜和大語言模型在航天測(cè)控問答系統(tǒng)中的融合應(yīng)用研究[J].上海航天(中英文),2024,41(5):178-184.
[7]王華珍,林海斌,林昕愉,等.大語言模型與知識(shí)圖譜協(xié)同下高校AI項(xiàng)目導(dǎo)師構(gòu)建研究——以“人工智能創(chuàng)新項(xiàng)目設(shè)計(jì)”為例[J].數(shù)字教育,2024,10(5):70-76.
[8]方霖楓,周仁杰.基于圖神經(jīng)網(wǎng)絡(luò)的挖掘潛在偏好圖推薦算法[J].軟件導(dǎo)刊,2024,23(10):129-138.
[9]張馨月.基于知識(shí)圖譜的推薦算法研究[D].成都:電子科技大學(xué),2024.
[10]東苗.基于學(xué)科知識(shí)圖譜的個(gè)性化學(xué)習(xí)路徑推薦策略[J].現(xiàn)代信息科技,2024,8(20):117-122.
作者簡(jiǎn)介:杭莉,本科,高級(jí)實(shí)驗(yàn)師,hangli820315@163.com,研究方向:計(jì)算機(jī)軟件。
課題項(xiàng)目:江蘇高校哲學(xué)社會(huì)科學(xué)研究項(xiàng)目——基于OBE導(dǎo)向的高職院校計(jì)算機(jī)類課程教學(xué)模式的改革探索(編號(hào):2024SJYB0627)。