中圖分類號:TP391 文獻標志碼:A
0 引言
基于電子商務的學科特性,網(wǎng)絡平臺上有著海量的學習資源。面對這些豐富的學習資源,學習者往往難以快速找到符合自己需求的學習資源。針對這一問題,領域內(nèi)很多研究人員提出了資源的個性化推薦方法。
唐小燕等1提出了基于深度學習的資源個性化推薦方法,利用深度學習技術(shù)集成資源的邊信息,建立多維度的資源推薦過程,并結(jié)合類別標簽,實現(xiàn)資源的個性化推薦。但該方法的動態(tài)性能較差,在用戶的行為和需求不斷變化的情況下,該方法難以實時捕捉這些變化,無法快速調(diào)整推薦策略,導致用戶滿意度下降。劉志中等2提出了基于知識圖譜的資源個性化推薦方法,將用戶的歷史交互信息與資源的屬性關(guān)聯(lián),以此建立資源的知識圖譜,通過節(jié)點影響力的計算,分析不同節(jié)點資源的評分,從而生成個性化的資源推薦列表。但在構(gòu)建知識圖譜時,可能會引入錯誤或冗余的信息,影響推薦算法的準確性。李春英等[3]提出了基于半自動編碼器的資源個性化推薦方法,通過引入輔助信息優(yōu)化數(shù)據(jù)的稀疏性,結(jié)合半自動編碼器的數(shù)據(jù)特征分析確定學習偏好,進而建立個性化的資源推薦模型。但由于半自動編碼器有多種變種和組合方式,如果選擇不當,會影響推薦效果??壮萚4提出了基于異質(zhì)信息網(wǎng)絡的資源個性化推薦方法,結(jié)合元路徑的游走與嵌人,建立資源數(shù)據(jù)的異質(zhì)信息網(wǎng)絡。結(jié)合圖神經(jīng)網(wǎng)絡,感知用戶的行為特征,以此通過矩陣分解評分實現(xiàn)個性化推薦。但由于異質(zhì)信息網(wǎng)絡包含多種類型的節(jié)點和邊,結(jié)構(gòu)復雜,該方法難以全面準確地捕捉所有相關(guān)信息,導致推薦的結(jié)果用戶滿意度不高。
考慮到上述研究所推薦的資源可能與用戶的實際需求存在較大的偏差,本研究在充分考慮用戶行為特征的情況下,提出了一種教學資源個性化推薦方法。該方法通過聚類挖掘的方法,充分解析用戶歷史數(shù)據(jù)中的行為特征,從而在協(xié)同過濾與權(quán)重排序處理下,生成最終的電子商務教學資源個性化推薦列表。
1電子商務教學資源個性化推薦方法設計
1.1用戶行為特征的聚類挖掘
為了能夠根據(jù)用戶的個性化需求完成推薦過程,本研究采用聚類挖掘的方法,在大量的歷史用戶數(shù)據(jù)中進行聚類挖掘,以此解析用戶的行為特征。
獲取到用戶的歷史數(shù)據(jù)后,經(jīng)過一定的預處理去除其中的劣質(zhì)數(shù)據(jù),包括異常數(shù)據(jù)和重復數(shù)據(jù)等,并通過標準化處理,消除數(shù)據(jù)的量綱差異[5-6]。在此基礎上,在數(shù)據(jù)空間中建立一個坐標系,對數(shù)據(jù)之間的距離進行度量,以此對用戶歷史數(shù)據(jù)進行聚類挖掘。這一過程中,本研究采用曼哈頓距離作為數(shù)據(jù)空間距離的計算方法,如公式(1)所示。
公式中, dxy 表示用戶歷史數(shù)據(jù) x,y 之間的空間距離, i 表示數(shù)據(jù)空間的維度, n 表示數(shù)據(jù)量, xi 和 yi 分別表示數(shù)據(jù)在該維度下的空間坐標。
通過數(shù)據(jù)空間距離這一參數(shù)的計算,能夠得知用戶歷史數(shù)據(jù)在數(shù)據(jù)空間中的分布關(guān)系?;诖?,采用K-means聚類算法進行用戶行為特征的聚類挖掘。在該數(shù)據(jù)空間中,隨機選取 k 個用戶歷史數(shù)據(jù),以此作為初始的聚類中心質(zhì)點,并根據(jù)上述的計算結(jié)果度量其他數(shù)據(jù)與該質(zhì)點之間的空間距離,選擇出每個數(shù)據(jù)的最近質(zhì)點,完成初步的聚類過程[7]。在聚類挖掘過程中,K-means算法對初始質(zhì)心的敏感性可能影響特征提取的穩(wěn)定性。為此,本研究通過輪廓系數(shù) s(i) 優(yōu)化聚類數(shù) K 的選擇。則利用輪廓系數(shù)選擇最優(yōu) K 值的步驟描述如下:
步驟1:確定 K 的可能取值范圍,計算每個 K 值的平均輪廓系數(shù)。對每個候選 K 值運行K-means算法,計算所有樣本的輪廓系數(shù)并取平均值。
步驟2:選擇最優(yōu) K 值。選擇使平均輪廓系數(shù)最大的K值,輪廓系數(shù)范圍為[-1,1],越接近1表示聚類效果越好。
在此基礎上,對算法的聚類中心質(zhì)點進行不斷更新,以此尋優(yōu)出最佳的聚類方式。這一過程中,中心質(zhì)點的更新方法如公式(2)所示。
公式中, j 表示數(shù)據(jù)聚類的中心質(zhì)點, μj 表示該中心質(zhì)點的更新點, cj 表示當前聚類中,以 j 為中心質(zhì)點的聚類簇。
通過對數(shù)據(jù)聚類中心質(zhì)點的不斷更新,得到最優(yōu)的數(shù)據(jù)聚類結(jié)果。在這一處理下,每個聚類簇均表征了一種用戶的行為特征,以此建立包含多維度特征的目標用戶畫像。
通過上述步驟,完成用戶歷史數(shù)據(jù)聚類挖掘分析下對用戶行為特征的多維度分析過程。
1.2電子商務教學資源的協(xié)同過濾
根據(jù)上述分析的包含多維度用戶行為特征的用戶畫像,本研究采用協(xié)同過濾算法,分析用戶對不同電子商務教學資源的喜好程度并根據(jù)不同教學資源之間的相似性,篩選出目標的資源信息。
根據(jù)用戶畫像中的行為特征,建立用戶與電子商務教學資源之間的評分矩陣。其表達式如公式(3)所示[8]
公式中, R(m,n) 表示教學資源的評分矩陣,R1,1 等均表示評價值, m 和 n 表示矩陣的行、列值,分別代表了用戶的數(shù)量和電子商務教學資源的數(shù)量。
根據(jù)該矩陣,對用戶的行為特征作為相應的隱式處理,以此確定不同類型教學資源在用戶方面的評分向量。定義在該矩陣的計算中,用戶對教學資源的評
分方法,如公式(4)所示。
公式中, Rpq 表示用戶 p 對教學資源 q 的評分, fpq 表示該評分的出現(xiàn)頻次, Nq 表示該類型教學資源的數(shù)量, N 表示教學資源的總數(shù)量, Cj 表示以 j 為中心質(zhì)點的聚類簇所在維度的用戶行為特征。
根據(jù)用戶對不同類型教學資源的評分,計算教學資源之間的相似度。具體的計算方法如公式(5)所示。
公式中, q1 和 q2 分別表示2個不同的電子商務教學資源, S(q1,q2) 表示兩者之間的相似度, Q 表示電子商務教學資源的數(shù)據(jù)庫, 和
分別表示所有目標用戶對對應教學資源的評分均值。
基于計算所得的教學資源相似度結(jié)果,在協(xié)同過濾的處理下,篩選教學資源數(shù)據(jù)庫,得出目標的資源數(shù)據(jù)信息,由此得到一個待推薦的子教學資源數(shù)據(jù)庫。
通過上述步驟,完成在考慮用戶行為特征的基礎上,對海量電子商務教學資源數(shù)據(jù)的協(xié)同過濾過程,得到用戶可能感興趣的資源數(shù)據(jù)。
1.3生成教學資源的個性化推薦列表
為了進一步優(yōu)化資源推薦結(jié)果的個性化程度,本研究進一步根據(jù)用戶對教學資源的行為特征,為待推薦的資源數(shù)據(jù)添加相應的權(quán)重,以此對其進行排序,生成最終的個性化推薦列表。
本研究采用特征向量中心度的計算結(jié)果來定義資源數(shù)據(jù)的權(quán)重,其計算方法如公式(6)所示。
公式中, Ea(q) 表示用戶行為特征對資源數(shù)據(jù) q 的特征向量中心度, Ψa 表示比例常數(shù), g 表示協(xié)同過濾算法篩選得到的子資源數(shù)據(jù)庫, Xq 表示重要性度量值。
基于這一參數(shù),對子資源數(shù)據(jù)庫中的電子商務教學資源數(shù)據(jù)進行賦權(quán),如公式(7)所示[9]
公式中, ω(q) 表示教學資源的個性化推薦權(quán)重。
根據(jù)不同教學資源所賦權(quán)值的大小,對子資源數(shù)據(jù)庫中的教學資源數(shù)據(jù)進行排序,從而生成用戶的教學資源個性化推薦列表。
在上述的分析處理下,充分對用戶的行為特征進行分析,確定出用戶對教學資源的偏好,從而生成最終的個性化推薦列表。
通過上述步驟,完成考慮用戶行為特征的電子商務教學資源個性化推薦方法的研究設計。
2 實踐測試分析
2.1實驗數(shù)據(jù)集
為了檢驗所提方法在實踐應用中的個性化推薦效果,開展本次實驗對推薦結(jié)果的用戶滿意度進行測試分析。
本次實驗依托于某學校所構(gòu)建的電子商務教學資源庫開展,該數(shù)據(jù)庫中包含專業(yè)知識、測試題庫以及教學素材等多種教學資源。
通過集成該資源庫中的數(shù)據(jù)信息,獲取用戶的行為數(shù)據(jù),包含的維度如表1所示。
表1用戶行為數(shù)據(jù)
基于上述維度,獲取本次實驗中的歷史用戶數(shù)據(jù)信息。
實驗時,將獲取的數(shù)據(jù)以用戶ID為基準,劃分為訓練集和測試集,每部分的數(shù)據(jù)占比約為 70% 和20% 。基于這些數(shù)據(jù),開展本次電子商務教學資源個性化推薦的實踐測試實驗。
2.2個性化推薦結(jié)果分析
利用訓練集中的數(shù)據(jù),對所提方法涉及的K-means聚類算法和協(xié)同過濾算法進行訓練后,測試所提方法的個性化推薦效果。
經(jīng)過用戶行為特征的分析,為其生成個性化的教學資源列表。以用戶013為例,根據(jù)資源推薦列表結(jié)果可知,所提方法為該用戶生成的電子商務教學資源推薦結(jié)果均以視頻形式呈現(xiàn),而歷史推薦偏好瀏覽視頻形式,與所提方法呈現(xiàn)形式一致。結(jié)合該用戶對這一推薦結(jié)果進行評價可得出,所提方法所生成的推薦列表在各個資源的排序上有效,與用戶實際的興趣程度一致,驗證了所提方法的實踐應用可信性。
為了進一步檢驗所提方法的性能水平,本次實驗以歸一化折損累積增益(NormalizedDiscountedCumulativeGain,NDCG)為指標,結(jié)合基于半自動編碼器以及異質(zhì)信息網(wǎng)絡2種資源個性化推薦方法作為對比方法,開展多輪次的用戶個性化推薦實驗。
經(jīng)過測試,得到不同方法下的推薦結(jié)果指標水平如圖1所示。
圖1各方法推薦結(jié)果指標水平對比
從圖1可以看出,與其他2種方法相比,所提方法的推薦結(jié)果在NDCG指標上不僅表現(xiàn)出了更高的指標水平,還有著更優(yōu)的穩(wěn)定性。這說明所提方法能夠穩(wěn)定地得到用戶滿意度更高的個性化推薦結(jié)果,為用戶推薦更為理想的電子商務教學資源。這一優(yōu)勢主要得益于所提方法通過對用戶行為特征的分析,充分利用該特征對電子商務教學資源進行了相似篩選,從而能夠得到滿意度更高的推薦結(jié)果。
為進一步驗證推薦結(jié)果的魯棒性,實驗增設冷啟動場景測試。隨機選取100名新用戶(無歷史行為數(shù)據(jù)),分為5組,通過混合協(xié)同過濾(HybridCF)策略緩解數(shù)據(jù)稀疏性問題,然后分別利用所提方法、基于半自動編碼器以及異質(zhì)信息網(wǎng)絡兩種資源個性化推薦方法展開電子商務教學資源個性化推薦,統(tǒng)計各方法的NDCG平均值結(jié)果,如表2所示。
表2冷啟動場景下各方法的NDCG結(jié)果
根據(jù)表2測試結(jié)果顯示,在所提方法應用下,冷啟動用戶NDCG均值達0.90及以上,高于基于半自動編碼器以及異質(zhì)信息網(wǎng)絡2種資源個性化推薦方法的NDCG均值。由此表明,所提方法可為電子商務教學資源個性化推薦提供有效的方案,具有較好的魯棒性。
3結(jié)語
本研究所設計的考慮用戶行為特征的電子商務教學資源個性化推薦方法,通過分析用戶的行為特征,在協(xié)同過濾的處理下,篩選并排序得到了用戶滿意度較高的個性化推薦結(jié)果。在所提方法的應用下,能夠精準匹配用戶的實際需求,減少了用戶在海量資源中篩選的時間,極大地提高了學習效率。同時,還能夠根據(jù)用戶的學習行為和反饋,優(yōu)化教學資源的配置,避免資源的浪費。
參考文獻
[1]唐小燕,李斌,張承江,等.基于半自動編碼器的學習資源推薦[J].揚州大學學報(自然科學版),2023(1) :74-78.
[2]劉志中,李林霞,孟令強.基于混合圖神經(jīng)網(wǎng)絡的個性化POI推薦方法研究[J].南京大學學報(自然科學),2023(3):373-387.
[3]李春英,武毓琦,湯志康,等.融合知識圖譜的學習者個性化學習資源推薦[J].小型微型計算機系統(tǒng),2024(2):285-292.
[4]孔超,陳家會,孟丹,等.面向MOOCs的個性化知識概念推薦[J].華東師范大學學報(自然科學版),2024(5) :32-44.
[5]蔡林沁,劉昱辰,任波,等.融合多知識點與群體特征的個性化知識推薦方法[J].重慶郵電大學學報(自然科學版),2024(5):1023-1031.
[6]謝澤長,劉宗遠.基于深度學習的計算機專業(yè)個性化教學資源推薦方法[J].無線互聯(lián)科技,2024(23):126-128.
[7]周晨曦,趙天馳,張玲玲.基于用戶畫像和鏈路預測的電影個性化推薦研究[J].系統(tǒng)科學與數(shù)學,2024(6) :1586-1607.
[8]呂艷霞,郝帥,喬廣通,等.一種基于圖神經(jīng)網(wǎng)絡的社會化推薦算法[J].東北大學學報(自然科學版),2024(1):10-17.
[9]楊懷珍,張靜,李雷.基于多重相似度和CatBoost的個性化推薦[J].計算機工程與設計,2023(9):2687-2693.
(編輯戴啟潤)
Personalized recommendation method of e-commerce teaching resources considering thecharacteristicsofuser behavior
JIANG Peipei (Zhengzhou Shengda University,Zhengzhou 451191,China)
Abstract:In the personalized recommendation processof e-commerce teaching resources,the recommendation process ofresourceatribute tags may be difcult to match theactual behavioral preferencesof users,resulting in low user satisfactionwith therecommendationresults.Therefore,this study proposes apersonalized recommendation method for e-commerce teaching resources that considersuser behavior characteristics.Basedon the user’s historical behavior data,the K-means clustering algorithm is used to mine user behavior characteristics andestablish a user portrait containing multi-dimensional user behavior features.By establishing a scoring matrix between user behavior characteristics ande-commerce teachingresources,acollaborative filtering algorithm isused to screen out recommended resource data,and a corrsponding sub resource database is established.Based on the calculation of resource weights,sortthe teaching resources in the database and generate the final personalized recommendation list of teaching resources.Theresults indicate that thismethod hasahigh level of NDCGrecommendation,high user satisfaction,and good practical application prospects in the field of e-commerce teaching.
Keywords:personalized recommendation;teaching resources;resource recommendation;userbehavior characteristics; teaching resources recommendation; e-commerce teaching