凌宇,單志龍
基于興趣增強(qiáng)的知識(shí)概念推薦系統(tǒng)
凌宇1,單志龍1,2*
(1.華南師范大學(xué) 計(jì)算機(jī)學(xué)院,廣州 510631; 2.華南師范大學(xué) 人工智能學(xué)院,廣東 佛山 528225)(?通信作者電子郵箱ZLshan@m.scnu.edu.cn)
現(xiàn)有的知識(shí)概念推薦系統(tǒng)并未考慮用戶(hù)的短期興趣。針對(duì)該問(wèn)題,提出一種基于興趣增強(qiáng)的知識(shí)概念推薦系統(tǒng)(KCRec-IE)。首先,根據(jù)用戶(hù)的知識(shí)概念點(diǎn)擊序列捕獲用戶(hù)的短期興趣,并利用側(cè)信息構(gòu)造一個(gè)異構(gòu)圖。其次,利用元路徑指導(dǎo)的圖卷積在異構(gòu)圖上進(jìn)行知識(shí)概念實(shí)體和用戶(hù)實(shí)體的表示學(xué)習(xí)。與知識(shí)概念實(shí)體的表示學(xué)習(xí)不同,學(xué)習(xí)用戶(hù)實(shí)體的表示時(shí),根據(jù)用戶(hù)的短期興趣可區(qū)分不同鄰居用戶(hù)對(duì)目標(biāo)用戶(hù)的貢獻(xiàn)。最后,根據(jù)知識(shí)概念實(shí)體、用戶(hù)實(shí)體和用戶(hù)的短期興趣進(jìn)行評(píng)分預(yù)測(cè)。在公開(kāi)數(shù)據(jù)集Xuetang X上的實(shí)驗(yàn)結(jié)果表明,相較于KCRec-SEIGNN,KCRec-IE在HR@5指標(biāo)上提升了3.60個(gè)百分點(diǎn);相較于KCRec-IEn,KCRec-IE在HR@10指標(biāo)上提升了1.02個(gè)百分點(diǎn);相較于KCRec-SEIGNN,KCRec-IE在NDGC@5和NDGC@10指標(biāo)上分別提升了1.60和1.18個(gè)百分點(diǎn),驗(yàn)證了所提方法的有效性。
圖神經(jīng)網(wǎng)絡(luò);序列推薦;用戶(hù)興趣;個(gè)性化推薦;教育大數(shù)據(jù)
隨著互聯(lián)網(wǎng)的普及,越來(lái)越多的人開(kāi)始進(jìn)行在線學(xué)習(xí)[1-3]。在線教育的出現(xiàn)加快了知識(shí)的傳播,不管是學(xué)生還是職場(chǎng)人士,不管身處何地都能享受優(yōu)質(zhì)的教育資源。與此同時(shí),越來(lái)越多的教師開(kāi)始將線上和線下教育結(jié)合起來(lái),在線教育成為學(xué)生進(jìn)行課程拓展學(xué)習(xí)的一種方式,未來(lái)在線教育將會(huì)在教學(xué)領(lǐng)域發(fā)揮重要的作用。
隨著在線教育規(guī)模的擴(kuò)大,一些問(wèn)題也開(kāi)始出現(xiàn):1)在線教育平臺(tái)中的很多課程,通常依賴(lài)某些先修課程的某些知識(shí)概念[4],學(xué)生不知道如何才能快速地掌握所需的先修知識(shí)概念,降低了學(xué)生對(duì)在線教育的熱情;2)在線教育平臺(tái)中存在很多同名或名稱(chēng)相似的課程,但是它們的側(cè)重點(diǎn)不同,所需的先修知識(shí)概念也不相同[5]。這些問(wèn)題加重了學(xué)生挑選合適課程的負(fù)擔(dān)。因此,為了更好地了解和獲取學(xué)生的興趣和知識(shí)點(diǎn)結(jié)構(gòu),為他們推薦更加合適的課程,知識(shí)概念推薦系統(tǒng)應(yīng)運(yùn)而生。
現(xiàn)有的知識(shí)概念推薦系統(tǒng)[5-10]主要是基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)[11-12]實(shí)現(xiàn),在基于元路徑[13]聚合目標(biāo)節(jié)點(diǎn)的鄰居節(jié)點(diǎn)信息以獲得目標(biāo)節(jié)點(diǎn)的嵌入表示時(shí),并沒(méi)有區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn)。此外,這些方法主要通過(guò)捕獲用戶(hù)的長(zhǎng)期偏好推薦知識(shí)概念,未考慮對(duì)用戶(hù)的短期偏好建模從而應(yīng)對(duì)用戶(hù)偏好的短期變化。
針對(duì)這些問(wèn)題,本文提出一種基于興趣增強(qiáng)的知識(shí)概念推薦系統(tǒng)(Knowledge Concept Recommendation system based on Interest Enhancement, KCRec-IE)。KCRec-IE主要從兩個(gè)方面對(duì)基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的方法進(jìn)行增強(qiáng):一方面,在學(xué)習(xí)用戶(hù)的嵌入表示時(shí),利用用戶(hù)的短期興趣區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn);另一方面,在進(jìn)行評(píng)分預(yù)測(cè)時(shí),不僅考慮用戶(hù)的長(zhǎng)期興趣,還考慮用戶(hù)的短期興趣。
目前,基于知識(shí)概念推薦模型主要可以分成3類(lèi):基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的方法[5-7]、在異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上利用強(qiáng)化學(xué)習(xí)增強(qiáng)的方法[8-9]、異構(gòu)圖神經(jīng)網(wǎng)絡(luò)和交互圖神經(jīng)網(wǎng)絡(luò)混合的方法[10]。
基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)是目前構(gòu)造知識(shí)概念推薦模型的主流方法。ACKRec(Attentional heterogeneous graph Convolutional deep Knowledge Recommender)[5]是一種基于分層注意力圖卷積的知識(shí)概念推薦模型,它采用注意力機(jī)制獲取實(shí)體在不同元路徑上的嵌入表示,并將同一實(shí)體在不同元路徑上得到的實(shí)體嵌入表示通過(guò)注意力機(jī)制進(jìn)行聚合,從而得到實(shí)體最終的嵌入表示;CERec-ME(Community Enhanced course concept Recommendation with Multiple Entities)[6]在基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦知識(shí)概念的基礎(chǔ)上,通過(guò)定義實(shí)體社區(qū)并對(duì)實(shí)體社區(qū)中節(jié)點(diǎn)的相似度進(jìn)行度量,最后將社區(qū)的結(jié)構(gòu)信息和節(jié)點(diǎn)的鄰域信息加入損失函數(shù),提升模型的推薦效果;MOOCIR(MOOC(Massive Open Online Course) Interest Recommender)模型[7]提出了兩種新的注意力機(jī)制用于聚合用戶(hù)和知識(shí)概念在不同元路徑上的嵌入表示,提升模型的推薦效果。
為了在異構(gòu)圖上獲得更好的嵌入表示,有學(xué)者提出了在異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上利用強(qiáng)化學(xué)習(xí)進(jìn)行增強(qiáng)的方法。Gong等[8]提出了一種名為AGMKRec(Automatic Generation of Meta-path graph for concept Recommendation)的模型,利用強(qiáng)化學(xué)習(xí)技術(shù)自動(dòng)發(fā)現(xiàn)有用的元路徑和多跳連接,以獲得更多有用的元路徑,并進(jìn)一步提升用戶(hù)和知識(shí)概念的嵌入表示質(zhì)量;Gong等[9]提出了一種名為HinCRec-RL(Concept Recommendation in MOOCs based on Heterogeneous information networks and Reinforcement Learning)的模型,采用了基于強(qiáng)化學(xué)習(xí)的方法,可以根據(jù)推薦結(jié)果動(dòng)態(tài)更新異構(gòu)圖神經(jīng)網(wǎng)絡(luò),適應(yīng)用戶(hù)偏好的變化,進(jìn)一步提升推薦效果。
此外,受到交互圖推薦模型的啟發(fā),研究人員提出了一種混合方法,將異構(gòu)圖神經(jīng)網(wǎng)絡(luò)和交互圖神經(jīng)網(wǎng)絡(luò)相結(jié)合,以進(jìn)一步提高推薦效果。KCRec-SEIGNN(Knowledge Concept Recommendation model based on a Structure-Enhanced Interactive Graph Neural Network)[10]是一種利用異構(gòu)圖和交互圖進(jìn)行知識(shí)概念推薦的方法。KCRec-SEIGNN首先利用所有用戶(hù)的知識(shí)概念點(diǎn)擊序列構(gòu)造一個(gè)全局知識(shí)概念交互圖;其次在該交互圖之上學(xué)習(xí)知識(shí)概念的實(shí)體嵌入,并保留交互圖中的結(jié)構(gòu)信息;接著在利用側(cè)信息生成的異構(gòu)圖上學(xué)習(xí)用戶(hù)的實(shí)體表示;最后利用得到的用戶(hù)和知識(shí)概念實(shí)體的嵌入表示進(jìn)行知識(shí)概念推薦。
本文提出的知識(shí)概念推薦系統(tǒng)的工作流程主要包括以下步驟:
1)實(shí)體特征提取和實(shí)體關(guān)系提取。
2)知識(shí)概念表示學(xué)習(xí)。
3)用戶(hù)短期興趣提取。
4)用戶(hù)表示學(xué)習(xí)。
5)基于矩陣分解進(jìn)行知識(shí)概念推薦。
2.3.1實(shí)體特征提取
1)知識(shí)概念實(shí)體特征提取。知識(shí)概念的名稱(chēng)通常是對(duì)它所涵蓋內(nèi)容的概括,如“向量?jī)?nèi)積”“定語(yǔ)從句”和“二叉樹(shù)”等。因此,可以借助詞嵌入技術(shù)生成知識(shí)概念實(shí)體特征,如Word2vector[14]就可以生成詞嵌入。
2)用戶(hù)實(shí)體特征提取。對(duì)于用戶(hù)實(shí)體特征,可以用One-hot編碼生成用戶(hù)的知識(shí)概念狀態(tài)作為它的特征。
2.3.2實(shí)體關(guān)系提取
圖1 實(shí)體關(guān)系提取
圖2 知識(shí)概念表示學(xué)習(xí)
對(duì)于基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的推薦模型[15-16],在學(xué)習(xí)用戶(hù)的實(shí)體表示時(shí),通常只關(guān)注用戶(hù)的長(zhǎng)期興趣,忽略了用戶(hù)的短期興趣。把用戶(hù)的短期興趣納入節(jié)點(diǎn)聚合過(guò)程中時(shí),這些短期興趣可用于區(qū)分不同鄰居節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的貢獻(xiàn),有效提升推薦效果。
如圖3所示,在通過(guò)聚合的鄰居節(jié)點(diǎn)的實(shí)體表示得到在特定元路徑上的實(shí)體表示時(shí),既考慮鄰居用戶(hù)自身的實(shí)體特征,也考慮鄰居用戶(hù)的短期興趣。
基于擴(kuò)展矩陣分解進(jìn)行評(píng)分預(yù)測(cè)時(shí),用戶(hù)對(duì)知識(shí)概念的評(píng)分為:
在函數(shù)中加入正則化項(xiàng),則最終的目標(biāo)函數(shù)為:
為了評(píng)估模型的性能,本文在Xuetang X數(shù)據(jù)集[5]和MOOCCube_lite數(shù)據(jù)集[18]上進(jìn)行了實(shí)驗(yàn)。
Xuetang X是一個(gè)公開(kāi)數(shù)據(jù)集,用于知識(shí)概念推薦任務(wù)。該數(shù)據(jù)集包含2 844門(mén)MOOC課程、803個(gè)視頻、937個(gè)課程概念、2 136名MOOC用戶(hù)和2 372名教師。此外,該數(shù)據(jù)集還包括用戶(hù)-知識(shí)概念、用戶(hù)-課程、用戶(hù)-教師和用戶(hù)-視頻這4種關(guān)系。
MOOCCube也是一個(gè)公開(kāi)數(shù)據(jù)集,由學(xué)堂在線MOOC平臺(tái)的真實(shí)數(shù)據(jù)構(gòu)成,經(jīng)過(guò)了自動(dòng)過(guò)濾、眾包標(biāo)注和專(zhuān)家標(biāo)注這3個(gè)階段的處理。由于MOOCCube中的數(shù)據(jù)量過(guò)大,模型所需要的計(jì)算資源遠(yuǎn)不能滿(mǎn)足,故本文從MOOCCube數(shù)據(jù)集中提取了一部分?jǐn)?shù)據(jù),構(gòu)建了MOOCCube_lite數(shù)據(jù)集用于實(shí)驗(yàn)。該數(shù)據(jù)集包含156門(mén)MOOC課程、1 915個(gè)視頻、4 850個(gè)課程概念、2 201名MOOC用戶(hù)、262名教師和26所學(xué)校。此外,該數(shù)據(jù)集還包括用戶(hù)-知識(shí)概念、視頻-知識(shí)概念、視頻-課程、課程-教師和教師-學(xué)校這5種關(guān)系。根據(jù)MOOCCube生成MOOCCube_lite的過(guò)程如下:
輸入 用戶(hù)-視頻觀看記錄集合,視頻-知識(shí)概念關(guān)系;
輸出 用戶(hù)-知識(shí)概念交互記錄集合。
步驟1 構(gòu)建候選知識(shí)概念集合。
步驟1.1 根據(jù)用戶(hù)-視頻觀看記錄集合和視頻-知識(shí)概念關(guān)系構(gòu)建用戶(hù)-知識(shí)概念交互記錄。
步驟1.2 根據(jù)用戶(hù)-知識(shí)概念交互記錄統(tǒng)計(jì)各個(gè)知識(shí)概念與用戶(hù)的交互次數(shù)。
步驟1.3 篩選前2 000個(gè)與用戶(hù)交互次數(shù)最多的知識(shí)概念,組成候選知識(shí)概念集合。
步驟2 遍歷每一個(gè)用戶(hù)-視頻觀看記錄,篩選該觀看記錄中的最長(zhǎng)連續(xù)子序列,該子序列中的每一個(gè)視頻對(duì)應(yīng)的知識(shí)概念都在候選知識(shí)概念集合中,然后將該最長(zhǎng)連續(xù)子序列作為整個(gè)序列的代替。
步驟3 針對(duì)每一個(gè)用戶(hù)-視頻觀看記錄,生成相應(yīng)的用戶(hù)-知識(shí)概念交互記錄。
用戶(hù)-知識(shí)概念交互記錄集合 = set()
for 用戶(hù)-視頻觀看記錄 in 用戶(hù)-視頻觀看記錄集合
用戶(hù)-知識(shí)概念觀看記錄 = list()
for 視頻 in 用戶(hù)視頻觀看記錄
根據(jù)視頻-知識(shí)概念關(guān)系獲取視頻對(duì)應(yīng)的知識(shí)概念集合
for 知識(shí)概念 in 視頻對(duì)應(yīng)的知識(shí)概念集合
用戶(hù)-知識(shí)概念觀看記錄.add(知識(shí)概念)
用戶(hù)-知識(shí)概念交互記錄集合.add(用戶(hù)-知識(shí)概念觀看記錄)
實(shí)驗(yàn)使用通用的評(píng)估指標(biāo)[19]評(píng)估所有模型,包括HR和NDCG。在進(jìn)行模型評(píng)估時(shí),將設(shè)置為5和10,并報(bào)告測(cè)試集中所有用戶(hù)的平均指標(biāo)。
為了探究不同序列長(zhǎng)度對(duì)模型推薦性能的影響,本文在兩個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),并在圖4中呈現(xiàn)了實(shí)驗(yàn)結(jié)果。
可以觀察到,隨著序列長(zhǎng)度的增加,推薦性能呈現(xiàn)先增加后遞減的現(xiàn)象。對(duì)于Xuetang X數(shù)據(jù)集,當(dāng)序列長(zhǎng)度為30時(shí),模型的性能最佳;對(duì)于MOOCCube_lite數(shù)據(jù)集,當(dāng)序列長(zhǎng)度為20時(shí),模型的性能最佳。
圖4 序列長(zhǎng)度對(duì)模型性能的影響
為了評(píng)估本文模型(KCRec-IE)的性能,實(shí)驗(yàn)選取的對(duì)比方法如下:
1)ACKRec[5]。一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的知識(shí)概念推薦方法。
2)CERec-ME[6]。一種基于社區(qū)增強(qiáng)的知識(shí)概念推薦方法。
3)MOOCIR[7]。一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的知識(shí)概念推薦方法。相較于ACKRec,它使用隱式反饋代替評(píng)分,并提出了兩種新的注意力機(jī)制用于聚合用戶(hù)和知識(shí)概念在不同元路徑上的嵌入表示。
4)ACKRec-H。使用HAN(Heterogeneous graph Attention Network)模型[16]分別學(xué)習(xí)用戶(hù)和知識(shí)概念的實(shí)體表示,然后采用與ACKRec中相同的方法,利用學(xué)習(xí)到的用戶(hù)和知識(shí)概念的實(shí)體表示進(jìn)行基于擴(kuò)展矩陣分解的知識(shí)概念推薦。其中HAN模型是一種高效的異構(gòu)圖神經(jīng)網(wǎng)絡(luò),與ACKRec模型相比,它可以獲得更好的實(shí)體表示。
5)KCRec-SEIGNN[10]。一種基于結(jié)構(gòu)增強(qiáng)交互圖神經(jīng)網(wǎng)絡(luò)的知識(shí)概念推薦方法。
6)SASRec[17]。一種序列推薦方法。
7)NAIS[20]。一種物品到物品的協(xié)同過(guò)濾算法,但使用一種注意機(jī)制方法區(qū)分不同在線學(xué)習(xí)行為的權(quán)重。
8)FISM[21]。一種物品到物品的協(xié)同過(guò)濾算法,它根據(jù)所有行為歷史的平均嵌入和目標(biāo)知識(shí)概念的嵌入進(jìn)行推薦。
9)KCRec-IEn。KCRec-IE的一個(gè)變種,在基于擴(kuò)展矩陣分解進(jìn)行評(píng)分預(yù)測(cè)時(shí),沒(méi)有考慮用戶(hù)的短期興趣。
在進(jìn)行實(shí)體表示學(xué)習(xí)時(shí),使用表1所示的元路徑集合,并將圖卷積的層數(shù)設(shè)置為3;將用戶(hù)實(shí)體和知識(shí)概念實(shí)體的向量維度設(shè)置為100。在進(jìn)行用戶(hù)短期興趣提取時(shí),針對(duì)Xuetang X數(shù)據(jù)集和MOOCCube_lite數(shù)據(jù)集,分別將序列長(zhǎng)度設(shè)為30和20。在基于擴(kuò)展矩陣分解的評(píng)級(jí)層中,將潛在因子數(shù)設(shè)置為30。
表1實(shí)驗(yàn)中采用的元路徑
Tab.1 Meta-paths used in experiments
將KCRec-IE與其他對(duì)比方法在知識(shí)概念推薦任務(wù)上進(jìn)行比較,比較結(jié)果如表2所示。從實(shí)驗(yàn)結(jié)果可以觀察到:
1)相較于基于協(xié)同過(guò)濾的方法,基于異構(gòu)圖表示學(xué)習(xí)的方法在兩個(gè)不同的數(shù)據(jù)集上,分別在HR@5和HR@10指標(biāo)上實(shí)現(xiàn)了顯著的性能提升。具體地,在數(shù)據(jù)集Xuetang X上,異構(gòu)圖學(xué)習(xí)方法中表現(xiàn)最好的KERec-IE相較基于協(xié)同過(guò)濾中最好的ACKRec提升了18.91和11.05個(gè)百分點(diǎn);在數(shù)據(jù)集MOOCCube_lite上,KERec-IE相較ACKRec提升了9.36和8.54個(gè)百分點(diǎn)。這是因?yàn)榛趨f(xié)同過(guò)濾的方法主要依賴(lài)用戶(hù)-物品交互數(shù)據(jù)進(jìn)行推薦,當(dāng)數(shù)據(jù)稀疏時(shí),很難準(zhǔn)確地推薦物品給用戶(hù);而基于異構(gòu)圖表示學(xué)習(xí)的方法可以將用戶(hù)、知識(shí)概念、課程、視頻等實(shí)體作為圖中的節(jié)點(diǎn),將它們之間的關(guān)系表示為邊,利用豐富的側(cè)信息對(duì)節(jié)點(diǎn)進(jìn)行表示學(xué)習(xí),從而可以充分利用實(shí)體之間的關(guān)系進(jìn)行推薦,緩解數(shù)據(jù)稀疏性問(wèn)題,并提高模型的性能。
2)對(duì)于Xuetang X數(shù)據(jù)集,與ACKRec、CERec-ME和MOOCIR方法相比,ACKRec-H、KCRec-IEn和KCRec-IE方法的HR@5和HR@10指標(biāo)分別提高了3.86~18.91和4.25~11.05個(gè)百分點(diǎn),KCRec-IE方法相較于KCRec-SEIGNN方法提高了3.60和2.76個(gè)百分點(diǎn)。對(duì)于數(shù)據(jù)集MOOCCube_lite,與ACKRec、CERec-ME和MOOCIR方法相比,ACKRec-H、KCRec-IEn和KCRec-IE方法的HR@5和HR@10指標(biāo)分別提高了1.16~9.36和2.75~8.54個(gè)百分點(diǎn),KCRec-IE方法相較于KCRec-SEIGNN方法提高了8.22~5.82個(gè)百分點(diǎn)。這主要是因?yàn)锳CKRec、CERec-ME、MOOCIR和KCRec-SEIGN在進(jìn)行用戶(hù)表示學(xué)習(xí)時(shí),采用的鄰居節(jié)點(diǎn)信息聚合方式無(wú)法有效區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn),導(dǎo)致對(duì)不同類(lèi)型的節(jié)點(diǎn)和邊采用相同的處理方式,這使得模型不能很好地適應(yīng)這些差異性,進(jìn)而影響了模型的性能表現(xiàn)。ACKRec-H、KCRec-IEn和KCRec-IE在基于鄰居節(jié)點(diǎn)進(jìn)行信息聚合時(shí)使用自注意力機(jī)制區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn),將更多的關(guān)注點(diǎn)放在與目標(biāo)節(jié)點(diǎn)相關(guān)的鄰居節(jié)點(diǎn)上,從而提高模型的性能。因此,基于鄰居節(jié)點(diǎn)進(jìn)行信息聚合時(shí),區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn)是非常重要的。
3)在Xuetang X數(shù)據(jù)集上,KCRec-IEn和KCRec-IE方法相較于ACKRec-H方法,在HR@5、HR@10指標(biāo)上分別提高了5.97和11.05、0.86和1.88個(gè)百分點(diǎn)。在MOOCCube_lite數(shù)據(jù)集上,KCRec-IEn和KCRec-IE方法相較于ACKRec-H方法,在HR@5、HR@10指標(biāo)上分別提高了3.86和7.22、1.98和4.13個(gè)百分點(diǎn)。這是因?yàn)橛脩?hù)的短期興趣通常隨著時(shí)間快速變化,即使是在長(zhǎng)期興趣相同的用戶(hù)之間,短期興趣也會(huì)存在較大的差異。在進(jìn)行用戶(hù)表示學(xué)習(xí)時(shí),將用戶(hù)的短期興趣加入鄰居節(jié)點(diǎn)的注意力值計(jì)算中,有助于模型更好地利用短期興趣信息區(qū)分不同鄰居節(jié)點(diǎn)的貢獻(xiàn),從而獲得更加準(zhǔn)確的用戶(hù)表示。
4)相較于KCRec-IEn方法,在Xuetang X數(shù)據(jù)集上,KCRec-IE方法在HR@5、HR@10指標(biāo)上分別提高了5.08和1.02個(gè)百分點(diǎn);在MOOCCube_lite數(shù)據(jù)集上,KCRec-IE方法在HR@5和HR@10指標(biāo)上分別提高了3.36和2.15個(gè)百分點(diǎn)。這是由于KCRec-IEn在評(píng)分預(yù)測(cè)時(shí)僅考慮了用戶(hù)的長(zhǎng)期興趣,而未能充分考慮用戶(hù)的短期興趣,這導(dǎo)致了在應(yīng)對(duì)快速變化的短期興趣時(shí)存在不足。KCRec-IE在評(píng)分預(yù)測(cè)時(shí)綜合考慮了用戶(hù)的長(zhǎng)期興趣和短期興趣,能夠更全面地反映用戶(hù)當(dāng)前的需求,從而提高了推薦系統(tǒng)的準(zhǔn)確性。
5)在Xuetang X數(shù)據(jù)集上,KCRec-IEn和KCRec-IE相較于SASRec和ACKRec-H,在HR@5、HR@10指標(biāo)上分別提高了5.97和29.22、0.86和5.95個(gè)百分點(diǎn)。在MOOCCube_lite數(shù)據(jù)集上,KCRec-IEn和KCRec-IE相較于SASRec和ACKRec-H,在HR@5和HR@10指標(biāo)上分別提高了3.86~8.54和1.98~7.22個(gè)百分點(diǎn)。這表明將序列推薦的方法和基于圖神經(jīng)網(wǎng)絡(luò)的方法結(jié)合,可以更好地綜合考慮用戶(hù)的長(zhǎng)期興趣和短期興趣,同時(shí)利用圖結(jié)構(gòu)中的側(cè)信息緩解數(shù)據(jù)稀疏性問(wèn)題,從而提高推薦系統(tǒng)的準(zhǔn)確性和可靠性。
表2 不同方法的性能比較
本文研究了MOOC平臺(tái)中的知識(shí)概念推薦問(wèn)題,提出了一種基于興趣增強(qiáng)的知識(shí)概念推薦系統(tǒng)。該系統(tǒng)將用戶(hù)的短期興趣加入鄰居用戶(hù)對(duì)目標(biāo)用戶(hù)的注意力值計(jì)算中,從而更好地區(qū)分不同鄰居節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的貢獻(xiàn)。此外,還將用戶(hù)的短期興趣加入評(píng)分預(yù)測(cè)中,從而進(jìn)一步提高推薦效果。在后續(xù)的研究中,計(jì)劃考慮如何結(jié)合社區(qū)發(fā)現(xiàn)[22]以有效地區(qū)分不同鄰居節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的貢獻(xiàn),進(jìn)而提升知識(shí)概念推薦系統(tǒng)的性能。
[1] KING C, ROBINSON A, VICKERS J. Targeted MOOC captivates students [J]. Nature, 2014, 505(7481): 26-26.
[2] ZHANG J. Can MOOCs be interesting to students? An experimental investigation from regulatory focus perspective[J]. Computers and Education, 2016, 95: 340-351.
[3] 董永峰,王雅琮,董瑤,等. 在線學(xué)習(xí)資源推薦綜述[J]. 計(jì)算機(jī)應(yīng)用, 2023, 43(6):1655-1663.(DONG Y F, WANG Y Z, DONG Y, et al. Survey of online learning resource recommendation [J]. Journal of Computer Applications, 2023, 43(6):1655-1663.)
[4] PAN L, LI C, LI J, et al. Prerequisite relation learning for concepts in MOOCs [C]// Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: ACL, 2017: 1447-1456.
[5] GONG J, WANG S, WANG J, et al. Attentional graph convolutional networks for knowledge concept recommendation in MOOCs in a heterogeneous view[C]// Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2020: 79-88.
[6] YE B, MAO S, HAO P, et al. Community enhanced course concept recommendation in MOOCs with multiple entities[C]// Proceedings of the 2021 International Conference on Knowledge Science, Engineering and Management, LNCS 12816. Cham: Springer, 2021: 279-293.
[7] PIAO G. Recommending knowledge concepts on MOOC platforms with meta-path-based representation learning [C/OL]// Proceedings of the 14th International Conference on Educational Data Mining [2022-09-19].https://parklize.github.io/publications/EDM2021.pdf.
[8] GONG J, WANG C, ZHAO Z, et al. Automatic generation of meta-path graph for concept recommendation in MOOCs [J]. Electronics, 2021, 10(4): No.1671.
[9] GONG J, WAN Y, LIU Y, et al. Reinforced MOOCs concept recommendation in heterogeneous information networks [J]. ACM Transactions on the Web, 2023, 17(3): No.22.
[10] LING Y, SHAN Z. Knowledge concept recommender based on structure enhanced interaction graph neural network[C]// Proceedings of the 2022 International Conference on Knowledge Science, Engineering and Management, LNCS 13368. Cham: Springer, 2022: 173-186.
[11] SHI C, HU B, ZHAO W X, et al. Heterogeneous information network embedding for recommendation [J]. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(2): 357-370.
[12] 周麗華,王家龍,王麗珍,等. 異質(zhì)信息網(wǎng)絡(luò)表征學(xué)習(xí)綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2022, 45(1):160-189.(ZHOU L H, WANG J L, WANG L Z, et al. Heterogeneous information network representation learning: a survey[J]. Chinese Journal of Computers, 2022, 45(1):160-189.)
[13] GORI M, MONFARDINI G, SCARSELLI F. A new model for learning in graph domains [C]// Proceedings of the 2005 IEEE International Joint Conference on Neural Networks — Volume 2. Piscataway: IEEE, 2005:729-734.
[14] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space [EB/OL]. (2013-09-07)[2022-11-22].https://arxiv.org/pdf/1301.3781.pdf.
[15] 葛堯,陳松燦. 面向推薦系統(tǒng)的圖卷積網(wǎng)絡(luò)[J]. 軟件學(xué)報(bào), 2020, 31(4):1101-1112.(GE Y, CHEN S C. Graph convolutional network for recommender systems[J]. Journal of Software, 2020, 31(4):1101-1112.)
[16] WANG X, JI H, SHI C, et al. Heterogeneous graph attention network[C]// Proceedings of the 2019 World Wide Web Conference. Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2019:2022-2032.
[17] KANG W C, McAULEY J. Self-attentive sequential recommendation [C]// Proceedings of the 2018 IEEE International Conference on Data Mining. Piscataway: IEEE, 2018: 197-206.
[18] YU J, LUO G, XIAO T, et al. MOOCCube: a large-scale data repository for NLP applications in MOOCs [C]// Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: ACL, 2020:3135-3142.
[19] KRICHENE W, RENDLE S. On sampled metrics for item recommendation[C]// Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2020: 1748-1757.
[20] HE X, HE Z, SONG J, et al. NAIS: neural attentive item similarity model for recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(12): 2354-2366.
[21] KABBUR S, NING X, KARYPIS G. FISM: factored item similarity models for top-recommender systems [C]// Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2013: 659-667.
[22] 寧懿昕,謝輝,姜火文. 圖神經(jīng)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究綜述[J]. 計(jì)算機(jī)科學(xué), 2021, 48(11A):11-16.(NING Y X, XIE H, JIANG H W. Survey of graph neural network in community detection[J]. Computer Science, 2021, 48(11A):11-16.)
Knowledge concept recommendation system based on interest enhancement
LING Yu1, SHAN Zhilong1,2*
(1,,510631,;2,,528225,)
The existing knowledge concept recommendation system does not consider the short-term interest of users. To solve the problem, a Knowledge Concept Recommendation system based on Interest Enhancement (KCRec-IE) was proposed. Firstly, users’ short-term interests were captured according to the users’ knowledge concept click sequences, and a heterogeneous graph was constructed by using the side information. Then, the representation learning of knowledge concept entities and user entities was carried out on heterogeneous graph by using meta-path-guided graph convolution. Different from the representation learning of knowledge concept entities, when learning the representation of user entities, the contributions of different neighbor users to target users were able to be distinguished according to the short-term interests of users. Finally, the score prediction was realized according to the knowledge concept entities, the user entities and the user’s short-term interests. Experimental results on public dataset Xuetang X show that compared with KCRec-SEIGNN, KCRec-IE is improved by 3.60 percentage points on HR@5; compared with KCRec-IEn, KCRec-IE is improved by 1.02 percentage points on HR@10; compared with KCRec-SEIGNN, KCRec-IE is improved by 1.60 and 1.18 percentage points respectively on NDGC@5 and NDGC@10 respectively, verifying the effectiveness of the proposed method.
graph neural network; sequential recommendation; user interest; personalized recommendation; educational big data
TP311
A
1001-9081(2023)12-3697-06
10.11772/j.issn.1001-9081.2022111786
2022?12?06;
2023?04?13;
2023?04?18。
凌宇(1996—),男,湖南衡陽(yáng)人,碩士研究生,主要研究方向:教育大數(shù)據(jù)、推薦系統(tǒng);單志龍(1976—),男,湖南衡陽(yáng)人,教授,博士,CCF會(huì)員,主要研究方向:教育數(shù)據(jù)挖掘、物聯(lián)網(wǎng)。
LING Yu, born in 1996, M. S. candidate. His research interests include educational big data, recommendation system.
SHAN Zhilong, born in 1976, Ph. D., professor. His research interests include educational data mining, internet of things.