摘 要:現(xiàn)有的多行為推薦模型忽略了不同行為之間存在的優(yōu)化不平衡問(wèn)題。為解決這一問(wèn)題,提出了一種融入自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型(multi-behavior recommendation integrating self-attention and contrastive learning,SACL)。首先,根據(jù)用戶與商品的交互行為類(lèi)型構(gòu)建獨(dú)立的交互視圖,通過(guò)圖神經(jīng)網(wǎng)絡(luò)挖掘用戶與物品之間的關(guān)聯(lián)關(guān)系,提取用戶的不同行為特征和興趣偏好特征。其次,在行為間與用戶間進(jìn)行對(duì)比學(xué)習(xí),捕捉不同行為下的相同用戶特征,增強(qiáng)輔助行為信息的利用率。然后,基于自注意力機(jī)制設(shè)計(jì)出一個(gè)多行為優(yōu)化模塊,根據(jù)用戶的多行為特征以及對(duì)比學(xué)習(xí)特征設(shè)計(jì)定義不同的編碼方式,生成具有行為依賴關(guān)系的元知識(shí);設(shè)計(jì)了一個(gè)自注意多行為損失權(quán)重網(wǎng)絡(luò),根據(jù)元知識(shí)平衡不同行為的訓(xùn)練損失權(quán)重,從而區(qū)分對(duì)目標(biāo)行為的影響差異并降低輔助行為噪聲。提出的模型在Tmall和IJCAI-Contest數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)表明,相較于最優(yōu)基線DPT,SACL的命中率(HR)平均提升了10%,歸一化折損率(NDCG)平均提升了14%,驗(yàn)證了SACL模型對(duì)平衡優(yōu)化多行為推薦任務(wù)的有效性。
關(guān)鍵詞: 多行為推薦; 自注意力; 對(duì)比學(xué)習(xí); 多行為特征; 元知識(shí)
中圖分類(lèi)號(hào): TP391 文獻(xiàn)標(biāo)志碼: A 文章編號(hào): 1001-3695(2025)02-009-0391-07
doi: 10.19734/j.issn.1001-3695.2024.07.0289
Multi-behavior recommendation integrating self-attention and contrastive learning
Zhang Zhiwei, Sun Fuzhen’, Sun Xiujuan, Li Pengcheng, Wang Shaoqing
(School of Computer Science amp; Technology, Shandong University of Technology, Zibo Shandong 255049, China)
Abstract:Existing multi-behavior recommendation models ignore the optimization imbalance problem that exists between different behaviors. To solve this problem, this paper proposed a multi-behavior recommendation model integrating self-attention and contrastive learning (SACL). Firstly, it constructed independent interaction views based on different types of user-item interaction behaviors, and explored correlation relationships between users and items through graph neural networks to extract different behavior characteristics and interest preference features of users. Secondly, it performed contrastive learning between behaviors and users to capture the same user characteristics under different behaviors and enhanced the utilization of auxiliary behavior information. Then, it designed a multi-behavior optimization module based on the self-attention mechanism which defined different encoding methods based on the multi-behavior features and contrastive learning features of users to generate meta-knowledge with behavior dependencies. It designed a self-attentive multi-behavior loss weighting network to balance the training loss weights of different behaviors based on meta-knowledge, thus distinguishing the differences in the impacts on target behavior and reducing the auxiliary behavior noises. Experiments on the Tmall dataset and the IJCAI-Contest dataset show that the proposed model improves the hit rate (HR) of SACL by an average of 10% and the normalized discount rate (NDCG) by an average of 14% compared to the optimal baseline DPT, which verifies the effectiveness of SACL model for balanced optimization of multi-behavior recommendation tasks.
Key words:multi-behavior recommendation; self-attention; contrastive learning; multi-behavior features; meta-knowledge
0 引言
伴隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,當(dāng)前網(wǎng)絡(luò)平臺(tái)呈現(xiàn)多樣化、個(gè)性化現(xiàn)象,比如電子商務(wù)平臺(tái)、音樂(lè)、新聞推薦平臺(tái)等,而網(wǎng)絡(luò)內(nèi)容的海量增長(zhǎng)和多樣性導(dǎo)致了信息過(guò)載的問(wèn)題。推薦系統(tǒng)[1, 2]可以根據(jù)用戶的個(gè)性化偏好推薦感興趣的物品,從而緩解信息過(guò)載的問(wèn)題[3]。協(xié)同過(guò)濾(CF)[4, 5]是當(dāng)今使用最廣泛的推薦架構(gòu),即根據(jù)用戶的歷史交互信息,分析用戶的目標(biāo)行為偏好,結(jié)合用戶之間的相似性和物品間的關(guān)系為用戶提供個(gè)性化的推薦服務(wù)。近年來(lái),基于圖神經(jīng)網(wǎng)絡(luò)的協(xié)同過(guò)濾推薦方法[6]取得了不錯(cuò)的效果。然而當(dāng)出現(xiàn)新用戶和新物品時(shí),由于其歷史交互信息非常稀疏,無(wú)法捕捉用戶的興趣偏好,導(dǎo)致無(wú)法為新用戶提供準(zhǔn)確的推薦服務(wù),產(chǎn)生了冷啟動(dòng)問(wèn)題[7, 8]。為解決冷啟動(dòng)問(wèn)題,多行為推薦成為研究熱點(diǎn),解決思路通常為從用戶的不同行為交互中挖掘輔助信息來(lái)學(xué)習(xí)新用戶與新物品的特征表示[9~11]。
為充分利用多行為信息,早期的多行為推薦研究工作主要通過(guò)改進(jìn)矩陣分解[12]或者調(diào)整采樣策略[13]的方法來(lái)利用輔助行為信息,但由于結(jié)構(gòu)相對(duì)簡(jiǎn)單,無(wú)法捕捉到不同行為交互間復(fù)雜的依賴關(guān)系?,F(xiàn)有的工作致力于設(shè)計(jì)不同的特征提取方案來(lái)學(xué)習(xí)不同類(lèi)型的行為嵌入,提高對(duì)用戶多行為交互信息的利用率,并通過(guò)設(shè)計(jì)不同方式對(duì)行為依賴關(guān)系進(jìn)行建模,以增強(qiáng)對(duì)用戶目標(biāo)行為的表示。例如,MGNN[14]在多個(gè)圖結(jié)構(gòu)中學(xué)習(xí)節(jié)點(diǎn)表示,通過(guò)聚合來(lái)自不同圖的多行為特征,增強(qiáng)模型的表達(dá)能力。NMTR[15]在神經(jīng)協(xié)同過(guò)濾(NCF)框架的基礎(chǔ)上通過(guò)級(jí)聯(lián)的方式將對(duì)每種行為類(lèi)型的預(yù)測(cè)聯(lián)系起來(lái)。MBGCN[16]基于圖卷積網(wǎng)絡(luò)模型設(shè)計(jì)了一種行為感知的嵌入傳播層來(lái)捕獲與高階鄰居不同行為交互中的多樣化信息。GHCF[17]通過(guò)構(gòu)建圖和超圖的結(jié)合結(jié)構(gòu),捕捉更復(fù)雜和高階的行為依賴關(guān)系。MBGMN[18]通過(guò)圖結(jié)構(gòu)和元學(xué)習(xí)方法整合并利用用戶多種行為數(shù)據(jù)。
為更好地聚合用戶多行為特征,進(jìn)一步提高所學(xué)習(xí)用戶特征的準(zhǔn)確度,學(xué)者們開(kāi)始將注意力機(jī)制融入用戶的行為特征提取過(guò)程中,通過(guò)注意力機(jī)制來(lái)建模不同行為類(lèi)型間的依賴關(guān)系。例如,MATN[19]開(kāi)發(fā)了一個(gè)基于Transformer的多行為依賴編碼器,采用自注意力機(jī)制對(duì)不同交互行為的復(fù)雜語(yǔ)義進(jìn)行建模。DIPN[20]提出了一種分層注意力機(jī)制,分別學(xué)習(xí)行為內(nèi)部以及行為間的依賴關(guān)系。KHGT[21]引入多頭注意力機(jī)制,通過(guò)計(jì)算不同頭的注意力分?jǐn)?shù),來(lái)捕捉節(jié)點(diǎn)之間的不同類(lèi)型的關(guān)系和特征。此外,最近的一項(xiàng)名為CML[22]的研究設(shè)計(jì)了一個(gè)多行為對(duì)比學(xué)習(xí)框架,通過(guò)構(gòu)建的對(duì)比損失來(lái)達(dá)成用戶特定類(lèi)型行為表征之間的一致性,進(jìn)一步增強(qiáng)對(duì)用戶的行為依賴建模。
綜上,當(dāng)前多行為推薦模型已在不同類(lèi)型的行為嵌入聚合方案以及行為依賴建模方面取得了進(jìn)展,但是仍存在兩方面問(wèn)題:a)現(xiàn)有的多行為推薦模型在訓(xùn)練過(guò)程中忽略了輔助行為與目標(biāo)行為之間權(quán)重分配不平衡的問(wèn)題,導(dǎo)致目標(biāo)推薦任務(wù)的推薦精準(zhǔn)度下降;b)不同類(lèi)型輔助行為對(duì)目標(biāo)行為的貢獻(xiàn)會(huì)依據(jù)不同用戶的行為偏好而存在差異,現(xiàn)有的研究沒(méi)有針對(duì)用戶個(gè)體進(jìn)行細(xì)粒度區(qū)分,導(dǎo)致用戶真實(shí)興趣漂移。
針對(duì)以上兩方面問(wèn)題,本文通過(guò)計(jì)算生成輔助行為和目標(biāo)行為的訓(xùn)練損失權(quán)重來(lái)區(qū)分主次關(guān)系,提高目標(biāo)推薦任務(wù)的推薦精度;通過(guò)將用戶的個(gè)性化行為特征編碼為元知識(shí)來(lái)捕捉不同用戶之間的偏好差異,訓(xùn)練學(xué)習(xí)用戶的真實(shí)興趣。本文提出了融入自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型(multi-behavior recommendation integrating self-attention and contrastive learning,SACL),將用戶的每種行為都定義為一種單獨(dú)類(lèi)型的交互視圖,在多層圖卷積網(wǎng)絡(luò)中學(xué)習(xí)每種行為視圖下的用戶特征表示,將同一用戶的不同行為特征進(jìn)行對(duì)比學(xué)習(xí),獲取用戶不同行為所反映的相同興趣偏好,建模用戶個(gè)性化偏好,訓(xùn)練生成不同行為任務(wù)的損失權(quán)重,優(yōu)化模型參數(shù)。
本文的主要貢獻(xiàn)總結(jié)如下:a)提出了融入自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型SACL,對(duì)于每種行為類(lèi)型構(gòu)建獨(dú)立的交互視圖,結(jié)合對(duì)比學(xué)習(xí)捕捉用戶的行為特征;b)針對(duì)權(quán)重分配不平衡的問(wèn)題,基于自注意力機(jī)制設(shè)計(jì)了一個(gè)多行為權(quán)重網(wǎng)絡(luò), 計(jì)算用戶不同行為模式的注意力得分,通過(guò)權(quán)重網(wǎng)絡(luò)生成不同訓(xùn)練任務(wù)的行為損失權(quán)重;c)針對(duì)用戶真實(shí)興趣漂移的問(wèn)題,將用戶的興趣特征及行為間的依賴關(guān)系編碼為元知識(shí),訓(xùn)練自注意多行為權(quán)重網(wǎng)絡(luò),細(xì)粒度建模用戶個(gè)性化偏好。
1 問(wèn)題定義及符號(hào)
在給定的數(shù)據(jù)集中,定義用戶集U={u1,u2,…,uM}和項(xiàng)目集I={i1,i2,…,iN},其中,M表示用戶的數(shù)量,N表示項(xiàng)目的數(shù)量。定義用戶-項(xiàng)目交互圖為G=(V,E),其中V表示節(jié)點(diǎn)集,包含用戶集U和項(xiàng)目集I,E表示所觀察到交互的邊集。在具有K種行為類(lèi)型的多行為交互圖中,交互圖G根據(jù)行為類(lèi)型定義為K個(gè)行為子圖{G1,G2,…,GK},并將各個(gè)行為子圖下的用戶-項(xiàng)目交互矩陣定義為{1,2,…,K},其中K表示行為類(lèi)型的數(shù)量。對(duì)于交互矩陣k,如果用戶u與項(xiàng)目i在第k種類(lèi)型的行為下存在交互,元素xku,i=1,反之,元素xku,i=0。
融入自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型的任務(wù)可形式化定義為給定用戶-項(xiàng)目交互矩陣{1,2,…,K},生成用戶嵌入eu和項(xiàng)目嵌入ei,在輔助行為k′和目標(biāo)行為k之間進(jìn)行對(duì)比學(xué)習(xí),生成對(duì)比損失Lk,1cl,…,Lk,k′cl,…,Lk,Kcl。自注意多行為權(quán)重網(wǎng)絡(luò)根據(jù)反映用戶個(gè)性化行為偏好的元知識(shí)編碼Zk,k′u生成行為損失權(quán)重ωk,k′u,結(jié)合對(duì)比損失Lcl與BPR損失Lbpr聯(lián)合訓(xùn)練優(yōu)化模型參數(shù),為用戶生成推薦列表。
2 SACL模型
為充分利用用戶-項(xiàng)目交互圖中蘊(yùn)涵的多行為交互信息,解決模型訓(xùn)練過(guò)程中目標(biāo)行為與輔助行為優(yōu)化不平衡的問(wèn)題,本文提出了融入自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型SACL。模型框架如圖1所示,由多行為圖卷積神經(jīng)網(wǎng)絡(luò)、多行為對(duì)比學(xué)習(xí)、自注意多行為優(yōu)化三個(gè)核心模塊組成。多行為圖卷積神經(jīng)網(wǎng)絡(luò)模塊依據(jù)行為類(lèi)型拆分出不同行為對(duì)應(yīng)的用戶-項(xiàng)目交互圖,從不同交互圖中提取用戶的行為特征。
多行為對(duì)比學(xué)習(xí)模塊通過(guò)在行為間與用戶間進(jìn)行對(duì)比學(xué)習(xí),選擇性地構(gòu)造樣本對(duì),將信息語(yǔ)義從輔助行為傳遞到目標(biāo)行為。自注意多行為優(yōu)化模塊將用戶特征編碼為元知識(shí),建模用戶的個(gè)性化行為偏好,通過(guò)多行為權(quán)重網(wǎng)絡(luò)為不同行為任務(wù)生成損失權(quán)重,與行為損失函數(shù)聯(lián)合訓(xùn)練優(yōu)化模型參數(shù)。
2.1 多行為圖卷積神經(jīng)網(wǎng)絡(luò)
為更加高效地利用輔助行為信息,提取用戶多行為特征,緩解目標(biāo)行為數(shù)據(jù)稀疏的問(wèn)題,本文設(shè)計(jì)了一個(gè)綜合上下文信息傳遞的多行為圖卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)通過(guò)挖掘不同行為子圖中用戶和項(xiàng)目的交互信息來(lái)學(xué)習(xí)用戶和項(xiàng)目的嵌入表示。
首先,為捕捉用戶的多行為交互信息,通過(guò)用戶項(xiàng)目之間的交互數(shù)據(jù)構(gòu)建出多行為用戶-項(xiàng)目交互圖,并根據(jù)行為類(lèi)型將其劃分為不同的行為交互子圖。根據(jù)行為子圖對(duì)應(yīng)的用戶-項(xiàng)目交互矩陣k得到鄰接矩陣Ak表示為
Ak=0k
Tk0(1)
然后根據(jù)GCN中的多層信息傳播方式,本文在輕量級(jí)的圖架構(gòu)上構(gòu)建了綜合多行為交互信息的傳遞方案來(lái)提取用戶行為特征信息,具體流程如圖2所示,可以表示為
X(l+1)k=σ(A^kX(l)kWk)(2)
A^k=D-12k(Ak+Ik)D-12k(3)
其中:A^k是一個(gè)具有自連接的歸一化鄰接矩陣;Dk是第k種行為的|U+I|×|U+I|對(duì)角矩陣,Dk中的每個(gè)條目表示第k種行為鄰接矩陣中第i行向量中非零項(xiàng)的個(gè)數(shù);Ik是一個(gè)|U+I|×|U+I|單位矩陣;X(l)k是卷積神經(jīng)網(wǎng)絡(luò)第l層中第k種行為下的節(jié)點(diǎn)嵌入矩陣;Wk代表模型訓(xùn)練所需要的參數(shù);σ指的是sigmoid非線性激活函數(shù)。
為了使距離較近的鄰居節(jié)點(diǎn)比距離較遠(yuǎn)的鄰居節(jié)點(diǎn)在生成節(jié)點(diǎn)嵌入時(shí)發(fā)揮更大的作用,通過(guò)函數(shù)f合并所有層的節(jié)點(diǎn)嵌入矩陣,并表示為
Xk=f(X(l)k)(4)
其中: f函數(shù)在神經(jīng)網(wǎng)絡(luò)模型中通常設(shè)計(jì)為僅應(yīng)用最后一層,級(jí)聯(lián)操作和對(duì)不同網(wǎng)絡(luò)層的節(jié)點(diǎn)嵌入進(jìn)行加權(quán)求和,本文采用的是對(duì)不同網(wǎng)絡(luò)層的節(jié)點(diǎn)嵌入進(jìn)行加權(quán)求和的方法;Xk表示第k種行為的節(jié)點(diǎn)嵌入矩陣。
然后,根據(jù)所得到的節(jié)點(diǎn)嵌入矩陣將所有行為子圖的用戶嵌入和項(xiàng)目嵌入進(jìn)行聚合,生成最終的用戶表示eu和項(xiàng)目表示ei:
eu=σ(W·∑Kk=1xukK)(5)
ei=σ(W·∑Kk=1xikK)(6)
其中:σ表示PReLU非線性激活函數(shù);W表示神經(jīng)網(wǎng)絡(luò)權(quán)重;xuk和xik分別表示第k個(gè)行為子圖中用戶u和項(xiàng)目i的嵌入表示。
2.2 多行為對(duì)比學(xué)習(xí)
為更好地利用多行為圖卷積神經(jīng)網(wǎng)絡(luò)所學(xué)習(xí)到的用戶的輔助行為特征來(lái)對(duì)用戶的目標(biāo)行為作出推薦,本文將不同行為視圖所生成的用戶特征嵌入進(jìn)行對(duì)比學(xué)習(xí),在輔助行為k′,k′∈{1,2,…,K-1}與目標(biāo)行為k=K之間進(jìn)行對(duì)比學(xué)習(xí)來(lái)捕捉該用戶不同行為之間的潛在聯(lián)系。盡管用戶通過(guò)不同行為與項(xiàng)目進(jìn)行交互,但都體現(xiàn)了相同的用戶興趣,在對(duì)比學(xué)習(xí)中將其視為正對(duì),表示為{(eku,ek′u)|u∈U}。反之,對(duì)于不同用戶的視圖,利用對(duì)比損失區(qū)分他們的行為嵌入,加強(qiáng)不同用戶興趣之間的區(qū)別,在對(duì)比學(xué)習(xí)中被視為負(fù)對(duì),表示為{(eku,ek′v)|u,v∈U,u≠v}。在所設(shè)計(jì)的多行為對(duì)比學(xué)習(xí)框架中,使用InfoNCE損失函數(shù)來(lái)衡量不同嵌入之間的距離,通過(guò)比較兩個(gè)樣本間的距離來(lái)測(cè)量它們之間的相關(guān)性。對(duì)所采集到的用戶交互信息,通過(guò)最大化對(duì)比采樣正對(duì)示例之間的一致性和增強(qiáng)區(qū)分負(fù)對(duì)示例之間的差異性,從而更好地捕捉數(shù)據(jù)中的相關(guān)性?;贗nfoNCE的對(duì)比損失函數(shù)表示如下:
Lk,k′cl=∑u∈U-logexp(?(eku,ek′u)/τ)∑v∈Uexp(?(eku,ek′v)/τ)(7)
其中:τ表示softmax函數(shù)中的溫度超參數(shù);?(·)用來(lái)計(jì)算兩個(gè)嵌入之間的內(nèi)積,以衡量不同嵌入之間的相似性。
通過(guò)式(7)計(jì)算得到的輔助行為k′和目標(biāo)行為k所構(gòu)成的行為對(duì)的對(duì)比損失Lk,k′cl加和得到總對(duì)比損失,表示如下:
Lcl=Lk,1cl+…+Lk,k′cl+…+Lk,Kcl(8)
2.3 自注意多行為優(yōu)化
為區(qū)分用戶不同類(lèi)型輔助行為對(duì)目標(biāo)行為造成的影響差異,限制輔助行為噪聲對(duì)目標(biāo)行為推薦產(chǎn)生的干擾。本文設(shè)計(jì)了一個(gè)自注意多行為優(yōu)化的功能模塊,包括元知識(shí)編碼器和自注意多行為權(quán)重網(wǎng)絡(luò)兩部分。首先使用元知識(shí)編碼器對(duì)用戶的行為特征進(jìn)行編碼,捕捉用戶的個(gè)性化行為特征。然后自注意多行為權(quán)重網(wǎng)絡(luò)通過(guò)元知識(shí)訓(xùn)練生成特定行為的損失權(quán)重,細(xì)粒度優(yōu)化用戶多行為損失。
2.3.1 元知識(shí)編碼器
為獲得用戶不同行為類(lèi)型之間的個(gè)性化依賴關(guān)系,本文根據(jù)用戶的興趣特征、行為特征以及行為間對(duì)比損失定義了兩種不同編碼方式的元知識(shí)編碼器來(lái)提取具有用戶特定行為偏好特征的元知識(shí),如式(9)(10)所示。
Zk,k′u,1=(d(Lk,k′cl)·γ)‖ek′u‖eu(9)
Zk,k′u,2=Lk,k′cl·(ek′u‖eu)(10)
其中:Zk,k′u,1和Zk,k′u,2表示通過(guò)編碼器編碼得到的元知識(shí);d(·)表示能生成與用戶嵌入eu和用戶輔助行為嵌入ek′u維度所對(duì)應(yīng)的值向量的函數(shù),這里定義為復(fù)制函數(shù);γ是用來(lái)放大值的比例因子;‖表示連接符。
2.3.2 自注意多行為權(quán)重網(wǎng)絡(luò)
針對(duì)平衡優(yōu)化輔助行為與目標(biāo)行為訓(xùn)練任務(wù),降低輔助行為噪聲,本文基于自注意力機(jī)制設(shè)計(jì)了一個(gè)用于區(qū)分用戶個(gè)性化行為偏好差異的權(quán)重網(wǎng)絡(luò),將通過(guò)編碼器編碼得到的反映用戶個(gè)性化偏好的元知識(shí)映射為損失權(quán)值。鑒于不同的行為之間會(huì)通過(guò)不同的方式相互交戶,并且行為之間的依賴關(guān)系因用戶不同而有差異,本文利用自注意力機(jī)制來(lái)建模用戶個(gè)性化行為偏好損失,對(duì)于不同用戶細(xì)粒度區(qū)分輔助行為對(duì)目標(biāo)任務(wù)造成的影響差異。
首先,設(shè)計(jì)一個(gè)注意力模塊通過(guò)所得到的元知識(shí)生成表現(xiàn)用戶特定行為模式的注意力得分??s放后的點(diǎn)積注意力定義為
Attention(Q,K,V)=softmax(QKTd)V(11)
其中:Q代表查詢;K代表鍵;V代表值;d表示用來(lái)進(jìn)行縮放的維數(shù),避免在維數(shù)較高的情況下查詢與鍵的內(nèi)積過(guò)大。
受最近一些研究提出的使用相同對(duì)象生成查詢、鍵和值的自注意方法[23]的影響,本文將編碼得到的元知識(shí)作為自注意力模塊的輸入,通過(guò)線性投影將其轉(zhuǎn)換為三個(gè)矩陣,再對(duì)它們進(jìn)行點(diǎn)積注意力的操作:
Su=SA (Zk,k′u)=Attention(Zk,k′uWQ,Zk,k′uWK,Zk,k′uWV)(12)
其中:WQ,WK,WV∈?d×d,表示用于線性投影的參數(shù)矩陣。這種投影方式可以使模型捕捉到不同行為之間的非對(duì)稱(chēng)交互(如〈查詢ki,鍵kj〉與〈查詢kj,鍵ki〉),更好地學(xué)習(xí)行為間的依賴關(guān)系。通過(guò)自注意力機(jī)制可以將所有行為類(lèi)型的元知識(shí)進(jìn)行自適應(yīng)聚合,但它仍然只是一個(gè)線性模型,因此進(jìn)一步設(shè)計(jì)了一個(gè)轉(zhuǎn)換層使其具有非線性性,并將權(quán)重函數(shù)定義為
F(Su)=PReLU (Su·WF+bF)(13)
其中:WF為d×d矩陣,表示投影層;bF為d維向量,表示偏置項(xiàng)。將該非線性層與PReLU函數(shù)結(jié)合得到具有用戶個(gè)性化行為偏好的多行為損失權(quán)重,可表示為
ωk,k′u=ωk,k′u,1+ωk,k′u,2=F(Su,1)+F(Su,2)(14)
其中:ωk,k′u表示對(duì)于用戶u的行為偏好,輔助行為k′對(duì)于目標(biāo)行為k的依賴關(guān)系權(quán)重。之后基于得到的多行為損失權(quán)重,設(shè)計(jì)生成了基于InfoNCE的自監(jiān)督損失和基于貝葉斯個(gè)性化推薦排名的目標(biāo)損失兩個(gè)損失權(quán)重列表。
2.4 模型訓(xùn)練與優(yōu)化
本文使用貝葉斯個(gè)性化損失[24]來(lái)學(xué)習(xí)模型參數(shù),將所觀察到的用戶與物品的行為交互視為正對(duì),將未觀察到的交互視為負(fù)對(duì),致力于正確地將觀察到交互過(guò)的物品排在未觀察到的物品之前。具體地,具有特定行為屬性的BPR損失被定義為
Lkbpr=∑(u,i+,i-)∈Ok-ln(sigmoid (xku,i+-xku,i-))+λ‖θ‖2(15)
其中:Ok表示用戶u在第k種行為類(lèi)型下的訓(xùn)練樣本對(duì);(u,i+)∈R+表示所觀察到的用戶u與物品i的交互;(u,i-)∈R-表示未被觀察到的交互;θ表示可以學(xué)習(xí)的模型參數(shù),并引用L2正則化來(lái)緩解過(guò)擬合的問(wèn)題。受文獻(xiàn)[25]所使用的模型訓(xùn)練策略的影響,本文使用了一種新的方式來(lái)對(duì)模型進(jìn)行訓(xùn)練優(yōu)化,通過(guò)三個(gè)階段訓(xùn)練更新多行為圖卷積神經(jīng)網(wǎng)絡(luò)與自注意多行為權(quán)重網(wǎng)絡(luò)的參數(shù),優(yōu)化過(guò)程表示為
θG=argminθ=Δ∑Kk=1 ∑Bb=1(W((Ltrain∪weightcl,k,X,Xk);θW)·Ltraincl,k+W((Ltrain∪weightbpr,k,X,Xk);θW)·Ltrainbpr,k)(16)
其中:θG表示多行為圖卷積神經(jīng)網(wǎng)絡(luò)的參數(shù);θW表示自注意多行為權(quán)重網(wǎng)絡(luò)的參數(shù);K表示用戶行為類(lèi)型數(shù)量;B表示訓(xùn)練批次大??;X表示用戶所學(xué)習(xí)到的交叉類(lèi)型的行為矩陣;Xk表示用戶所學(xué)習(xí)到的特定類(lèi)型的行為矩陣。在模型訓(xùn)練的第一階段,使用整個(gè)訓(xùn)練數(shù)據(jù)集對(duì)多行為圖卷積神經(jīng)網(wǎng)絡(luò)與自注意多行為權(quán)重網(wǎng)絡(luò)進(jìn)行聯(lián)合訓(xùn)練,學(xué)習(xí)初始的模型參數(shù)。在第二階段,使用元編碼器編碼得到的元知識(shí)數(shù)據(jù)對(duì)自注意多行為權(quán)重網(wǎng)絡(luò)進(jìn)行參數(shù)更新,生成多行為損失權(quán)重。最后,通過(guò)更新后的權(quán)重網(wǎng)絡(luò)參數(shù)結(jié)合多行為損失權(quán)重更新圖卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。通過(guò)上述三階段訓(xùn)練方式,加快參數(shù)更新速度,提高模型訓(xùn)練效率。
2.5 SACL算法偽代碼
算法1 SACL算法
輸入:K種行為類(lèi)型;用戶集U與項(xiàng)目集I之間K種類(lèi)型的行為交互矩陣{1,2,…,K};學(xué)習(xí)率lr;網(wǎng)絡(luò)層數(shù)l;網(wǎng)絡(luò)維度d。
輸出:經(jīng)過(guò)算法計(jì)算后得到的用戶u的top-k推薦。
a) 初始化模型,對(duì)數(shù)據(jù)進(jìn)行采樣
b) for i=1~k do //多行為圖卷積神經(jīng)網(wǎng)絡(luò)生成嵌入
for j=1~l do
根據(jù)式(1)~(3)計(jì)算當(dāng)前層第k種行為對(duì)應(yīng)的節(jié)點(diǎn)嵌入矩陣
end for
根據(jù)式(4)合并所有層的節(jié)點(diǎn)嵌入
end for
根據(jù)式(5)(6)聚合得到用戶嵌入eu和項(xiàng)目嵌入ei
c) for i=1~k do
獲取每個(gè)行為對(duì)應(yīng)的用戶嵌入和正負(fù)樣本嵌入
根據(jù)式(15)計(jì)算Lkbpr
end for
d) 根據(jù)式(7)(8)計(jì)算Lcl //多行為對(duì)比學(xué)習(xí)提取用戶特征
e) for u=1~m do //自注意多行為權(quán)重網(wǎng)絡(luò)分配損失權(quán)重
for i=1~k do
根據(jù)式(11)~(14)計(jì)算BPR行為損失權(quán)重和對(duì)比學(xué)習(xí)損失權(quán)重
將損失權(quán)重與Lkbpr和Lk,k′cl相結(jié)合
end for
end for
f) 三階段訓(xùn)練優(yōu)化模型參數(shù),生成eu與ei,計(jì)算生成推薦列表
2.6 復(fù)雜度分析
本文從模型主要功能模塊的角度進(jìn)行復(fù)雜度分析。SACL模型的復(fù)雜度主要表現(xiàn)在多行為圖卷積神經(jīng)網(wǎng)絡(luò)、對(duì)比學(xué)習(xí)模塊以及自注意多行為權(quán)重網(wǎng)絡(luò)三部分。其中多行為圖卷積神經(jīng)網(wǎng)絡(luò)部分的復(fù)雜度為O(K×|M+N|×d2×L),K表示行為類(lèi)型個(gè)數(shù),M表示用戶個(gè)數(shù),N表示項(xiàng)目個(gè)數(shù),d表示特征嵌入維度,L表示神經(jīng)網(wǎng)絡(luò)傳播層數(shù)。對(duì)比學(xué)習(xí)模塊通過(guò)基于InfoNCE的對(duì)比損失函數(shù)進(jìn)行優(yōu)化學(xué)習(xí),每個(gè)epoch的時(shí)間復(fù)雜度為O(K×|X+k|×S×d),|X+k|表示在第k類(lèi)行為下用戶-項(xiàng)目交互矩陣中的非零元素個(gè)數(shù),S為進(jìn)行對(duì)比學(xué)習(xí)的樣本數(shù)量,用于降低時(shí)間復(fù)雜度。自注意多行為權(quán)重網(wǎng)絡(luò)部分的時(shí)間復(fù)雜度為O(K×|X+k|×d2)。模型總體計(jì)算復(fù)雜度是上述三部分的代數(shù)和,與當(dāng)下多行為推薦算法(如MBGCN、KHGT、EHCF、CML)具有相當(dāng)?shù)臅r(shí)間復(fù)雜度。
3 實(shí)驗(yàn)與結(jié)果分析
3.1 數(shù)據(jù)集介紹
本文在Tmall和IJCAI-Contest兩個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),以評(píng)估模型性能,表1中給出了兩個(gè)數(shù)據(jù)集的數(shù)據(jù)信息。Tmall是一個(gè)廣泛用于電子商務(wù)研究的大規(guī)模數(shù)據(jù)集,包含四種類(lèi)型的行為信息,分別為瀏覽、收藏、添加到購(gòu)物車(chē)和購(gòu)買(mǎi)。IJCAI-Contest數(shù)據(jù)集由IJCAI15 Challenge提供,所收集的是零售系統(tǒng)中的用戶活動(dòng)信息,包含四種類(lèi)型的行為信息,即點(diǎn)擊、收藏、添加到購(gòu)物車(chē)和購(gòu)買(mǎi),與Tmall數(shù)據(jù)集具有相同的行為類(lèi)型,從不同角度反映用戶對(duì)商品的不同意圖。
3.2 指標(biāo)設(shè)置
對(duì)于模型的性能評(píng)估,選取推薦研究中的兩個(gè)代表性研究指標(biāo),即命中率(hit rate, HR)以及歸一化折損累計(jì)增益(normalized discounted cumulative gain, NDCG)。測(cè)試階段所報(bào)告評(píng)價(jià)結(jié)果均取自10次實(shí)驗(yàn)的平均值。
命中率用于衡量模型成功識(shí)別正例(true positive)的能力,即在所給出的推薦列表中,模型成功預(yù)測(cè)為正例的比例。
HR@N=1N∑Ni=1 hit(i)(17)
其中:hit()函數(shù)用來(lái)判斷模型是否成功識(shí)別正例,若為正例,則hit()的值為1,反之為0。歸一化折損累計(jì)增益用于衡量排序模型返回的結(jié)果在排名、相關(guān)性和多樣性方面的質(zhì)量。NDCG的值在0~1,其中1表示最佳性能,0表示最差性能。較高的NDCG表示模型在排序結(jié)果中更好地考慮了項(xiàng)目的相關(guān)性和排名。
NDCG@N=∑Ni=11log(ranki+1)(18)
其中:rank表示模型推薦的正例在推薦列表中的位置。
3.3 實(shí)驗(yàn)基線
本文將所提出的SACL模型與以下五組最先進(jìn)的模型進(jìn)行了比較:?jiǎn)涡袨橥扑]模型、異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦模型、多行為推薦模型、基于注意力的多行為推薦模型以及個(gè)性化多行為推薦模型。為了體現(xiàn)模型的先進(jìn)性,保證實(shí)驗(yàn)的有效性,均使用基線模型的默認(rèn)參數(shù)。
1)單行為推薦模型
NGCF[26]:該模型結(jié)合了協(xié)同過(guò)濾技術(shù)和圖神經(jīng)網(wǎng)絡(luò),通過(guò)顯示建模用戶與項(xiàng)目之間的高階連通關(guān)系來(lái)優(yōu)化消息傳遞,更好地捕捉用戶偏好。
LightGCN[27]:該模型是對(duì)圖卷積神經(jīng)網(wǎng)絡(luò)推薦模型進(jìn)行的一種輕量級(jí)簡(jiǎn)化推薦模型,去除了非線性激活函數(shù)以及特征變換操作。
2)異構(gòu)圖神經(jīng)網(wǎng)絡(luò)推薦模型
HGT[28]:該模型結(jié)合了圖神經(jīng)網(wǎng)絡(luò)和Transformer的優(yōu)勢(shì),基于元關(guān)系建模節(jié)點(diǎn)和邊的異構(gòu)性,并將時(shí)間信息加入到網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)。
HeCo[29]:該模型從網(wǎng)絡(luò)模式視圖和元路徑視圖對(duì)節(jié)點(diǎn)進(jìn)行編碼,創(chuàng)造性地引入了視圖掩碼機(jī)制,使這兩個(gè)視圖相互補(bǔ)充和監(jiān)督。
3)多行為推薦模型
NMTR[15]:該模型結(jié)合了多任務(wù)學(xué)習(xí)和協(xié)同過(guò)濾技術(shù),并通過(guò)預(yù)先設(shè)定的多行為級(jí)聯(lián)關(guān)系來(lái)學(xué)習(xí)用戶交互。
MBGCN[16]:該模型將圖卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于多行為用戶項(xiàng)目交互圖上,在信息傳播過(guò)程中學(xué)習(xí)各行為的權(quán)重,捕捉用戶的行為偏好。
4)基于注意力的多行為推薦模型
MATN[19]:該模型顯示地對(duì)多行為依賴關(guān)系進(jìn)行編碼,將跨類(lèi)型的用戶-項(xiàng)目交互的協(xié)作信號(hào)注入嵌入過(guò)程,并通過(guò)注意力機(jī)制發(fā)現(xiàn)特定類(lèi)型的行為語(yǔ)義。
KHGT[21]:該模型設(shè)計(jì)層級(jí)圖注意力網(wǎng)絡(luò),將時(shí)間信息融入到多行為建模中,并對(duì)跨類(lèi)型行為的層次依賴關(guān)系進(jìn)行編碼,區(qū)分特定類(lèi)型的貢獻(xiàn)。
5)個(gè)性化多行為推薦模型
EHCF[30]:該模型將每個(gè)行為的預(yù)測(cè)以一種遷移的方式關(guān)聯(lián)起來(lái),捕捉不同行為之間的復(fù)雜關(guān)系,不進(jìn)行采樣,從整個(gè)異質(zhì)數(shù)據(jù)中學(xué)習(xí)模型參數(shù)。
CML[22]:該模型將對(duì)比學(xué)習(xí)應(yīng)用于多行為推薦之中,通過(guò)有效利用輔助行為數(shù)據(jù)緩解目標(biāo)行為數(shù)據(jù)稀疏的問(wèn)題,并使用元學(xué)習(xí)建模用戶的個(gè)性化行為偏好。
DPT[31]:該模型通過(guò)三階段學(xué)習(xí)范式來(lái)減弱輔助行為對(duì)目標(biāo)行為推薦的負(fù)面影響,緩解目標(biāo)行為推薦中多類(lèi)型行為之間的語(yǔ)義差距。
3.4 參數(shù)設(shè)置
實(shí)驗(yàn)使用Xavier初始化模型參數(shù),使用Adam作為優(yōu)化器,結(jié)合周期學(xué)習(xí)率(CyclicLR)策略優(yōu)化模型參數(shù),驗(yàn)證集上HR和NDCG指標(biāo)在連續(xù)50個(gè)epoch內(nèi)沒(méi)有提升時(shí)停止訓(xùn)練,模型超參數(shù)的推薦效果在測(cè)試集上進(jìn)行驗(yàn)證。學(xué)習(xí)率在{0.6E-3,1E-3,2E-3,5E-3}中進(jìn)行測(cè)試,行為感知圖神經(jīng)網(wǎng)絡(luò)的消息傳播層數(shù)在{1,2,3,4}中調(diào)整,特征維度在{4,8,16,32,64,128}中調(diào)整,L2正則化權(quán)重在{1E-3,5E-3,1E-2}中調(diào)整。
3.5 對(duì)比實(shí)驗(yàn)性能分析
表2為本文方法在不同數(shù)據(jù)集上與其他模型的性能比較,其中本文模型結(jié)果用粗體表示,下畫(huà)線所表示的是最優(yōu)基線的結(jié)果。由表中數(shù)據(jù)可以發(fā)現(xiàn),SACL模型在不同數(shù)據(jù)集上始終優(yōu)于所有基線模型。具體地說(shuō),對(duì)于HR@10和NDCG@10兩個(gè)評(píng)價(jià)指標(biāo),在Tmall數(shù)據(jù)集上,本文的方法比基線中最優(yōu)的模型效果提升了6.3%和9.4%,在IJCAI-Contest數(shù)據(jù)集上,更是獲得了14.1%和18.7%的顯著提升?;诒碇械膶?shí)驗(yàn)數(shù)據(jù),將SACL模型與所給出的五組模型進(jìn)行對(duì)比分析:
a)多行為推薦模型(NMTR,MBGCN)在推薦任務(wù)上的性能優(yōu)于單行為推薦模型(NGCF,LightGCN),這表明綜合考慮用戶在多種場(chǎng)景下的不同行為,能夠克服單一行為推薦的局限性。通過(guò)有效利用多種行為信息,能夠減輕單一行為數(shù)據(jù)稀疏的問(wèn)題,并且能夠更細(xì)致地挖掘用戶的興趣模式和行為規(guī)律,從而提升推薦精度。
b)融合了注意力機(jī)制的多行為推薦模型(MATN,KHGT)又展現(xiàn)出了比多行為推薦模型更好的推薦性能,這表明注意力機(jī)制可以細(xì)化行為表示間的差異,能夠個(gè)性化建模用戶行為偏好,依據(jù)用戶偏好捕捉不同行為間的關(guān)聯(lián)關(guān)系,提高信息利用率,從而提升模型的推薦性能。
c)SACL模型在所有情況下的推薦性能都遠(yuǎn)超于異構(gòu)神經(jīng)網(wǎng)絡(luò)(HGT,HeCo),由此驗(yàn)證了SACL模型針對(duì)圖協(xié)同過(guò)濾框架異構(gòu)編碼的能力,也驗(yàn)證了根據(jù)多行為交互數(shù)據(jù)對(duì)用戶多行為特征建??梢载S富訓(xùn)練數(shù)據(jù)類(lèi)型,有效緩解數(shù)據(jù)稀疏問(wèn)題,提高模型的推薦精度。
d)與最近提出的個(gè)性化多行為推薦模型(EHCF、CML、DPT)相比,SACL依舊獲得了最好的推薦結(jié)果。這表明SACL能夠更準(zhǔn)確地捕捉用戶偏好,細(xì)粒度區(qū)分不同用戶之間的區(qū)別,為用戶提供更精準(zhǔn)的推薦。
綜上所述,SACL模型取得性能改進(jìn)的原因取決于以下兩點(diǎn):
a)本文通過(guò)多行為圖卷積神經(jīng)網(wǎng)絡(luò)從用戶的多行為交互中提取輔助信息來(lái)緩解目標(biāo)行為信息稀缺的情況,更加全面地捕捉學(xué)習(xí)用戶的特征偏好。通過(guò)對(duì)比學(xué)習(xí)挖掘不同行為間的潛在聯(lián)系,增強(qiáng)了多行為輔助信息的利用率。
b)元知識(shí)編碼有效建模了用戶的個(gè)性化行為特征,所設(shè)計(jì)的自注意多行為權(quán)重網(wǎng)絡(luò)根據(jù)元知識(shí)訓(xùn)練生成行為損失權(quán)重,細(xì)粒度區(qū)分了不同行為之間的差異,提高了模型捕捉用戶特征偏好的準(zhǔn)確度。
3.6 消融和有效性分析
為了進(jìn)一步探究闡明SACL模型的性能改進(jìn),驗(yàn)證模型的關(guān)鍵功能模塊對(duì)模型性能的影響,使用SACL模型的三個(gè)變體w/o MCL、w/o MKE、w/o AWN在Tmall和IJCAI-Contest數(shù)據(jù)集上進(jìn)行消融實(shí)驗(yàn)研究,變體模型如下:
w/o MCL:去除用戶目標(biāo)行為與輔助行為之間的對(duì)比學(xué)習(xí),僅通過(guò)圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)用戶特征。
w/o MKE:取消使用元編碼訓(xùn)練多行為權(quán)重網(wǎng)絡(luò)參數(shù),直接對(duì)行為損失進(jìn)行自注意權(quán)重分配。
w/o AWN:去除自注意多行為權(quán)重網(wǎng)絡(luò),通過(guò)統(tǒng)一對(duì)各種行為損失平均分配權(quán)重的方式來(lái)替代。
圖3給出了模塊消融后模型的對(duì)比效果。由圖中數(shù)據(jù)可以看出,SACL的三個(gè)變體相較于模型自身的推薦性能均有所降低,表明捕捉用戶多行為交互中的潛在依賴關(guān)系、用戶的個(gè)性化行為特征均能提高模型的推薦性能,并且通過(guò)自注意多行為權(quán)重網(wǎng)絡(luò)可以有效提高模型對(duì)用戶特征的學(xué)習(xí)能力以及降低輔助行為噪聲,優(yōu)化模型對(duì)于目標(biāo)行為推薦任務(wù)的能力。具體分析如下:
a)w/o MCL實(shí)驗(yàn)結(jié)果下降的原因在于模型僅通過(guò)圖神經(jīng)網(wǎng)絡(luò)來(lái)提取用戶特征,沒(méi)有學(xué)習(xí)不同行為之間的潛在聯(lián)系、捕獲其所反映的共同興趣偏好,不能有效地利用行為輔助信息。在目標(biāo)行為數(shù)據(jù)稀疏的情況下,容易受到輔助行為特征噪聲的影響,導(dǎo)致提取的用戶興趣特征不準(zhǔn)確。
b)w/o MKE實(shí)驗(yàn)結(jié)果下降的原因在于SACL模型自定義的用戶行為特征元知識(shí)編碼包含了用戶的不同行為特征偏好,使用元編碼訓(xùn)練多行為權(quán)重網(wǎng)絡(luò)可以使權(quán)重網(wǎng)絡(luò)細(xì)粒度區(qū)分不同用戶的個(gè)性化行為偏好,從而幫助多行為權(quán)重網(wǎng)絡(luò)更好地分配行為損失權(quán)重。
c)w/o AWN實(shí)驗(yàn)結(jié)果下降的原因在于沒(méi)有對(duì)不同行為的訓(xùn)練任務(wù)進(jìn)行區(qū)分,在目標(biāo)行為數(shù)據(jù)稀疏時(shí),容易導(dǎo)致輔助行為任務(wù)主導(dǎo)網(wǎng)絡(luò)權(quán)重,并且不同的輔助行為對(duì)目標(biāo)行為影響不同,需要區(qū)分不同輔助任務(wù)對(duì)目標(biāo)任務(wù)的貢獻(xiàn)。
3.7 圖神經(jīng)網(wǎng)絡(luò)層數(shù)分析
為了研究圖神經(jīng)網(wǎng)絡(luò)層數(shù)對(duì)于模型推薦性能的影響,本文在兩個(gè)數(shù)據(jù)集上進(jìn)行了不同網(wǎng)絡(luò)層數(shù)L的對(duì)比實(shí)驗(yàn)。圖4和5展示了Tmall和IJCAI-Contest數(shù)據(jù)集上不同超參數(shù)L對(duì)評(píng)價(jià)指標(biāo)HR@10和NDCG@10的影響。由數(shù)據(jù)結(jié)果可以看出,當(dāng)其他參數(shù)保持不變時(shí),圖傳播層數(shù)越多,模型性能越好,這表明模型傳播層數(shù)的增多可以有效捕獲高階鄰居的潛在依賴關(guān)系,當(dāng)圖神經(jīng)網(wǎng)絡(luò)層數(shù)為3時(shí),推薦性能最優(yōu)。當(dāng)傳播層數(shù)進(jìn)一步增加,可能會(huì)對(duì)所生成的特征嵌入表示引入噪聲,導(dǎo)致模型性能下降。
3.8 模型維度影響分析
適宜的模型維度能夠使模型更好地學(xué)習(xí)用戶特征與項(xiàng)目特征,為找到適合的模型維度,本文在兩個(gè)數(shù)據(jù)集上進(jìn)行了對(duì)于隱藏層嵌入向量維度D的參數(shù)實(shí)驗(yàn)。本文將不同的嵌入層設(shè)置為相同的維度,并在{4,8,16,32,64,128}范圍內(nèi)調(diào)整嵌入向量維度。實(shí)驗(yàn)結(jié)果如圖6和7所示,隨著隱藏層嵌入維度的增加,SACL模型能夠更細(xì)致地捕捉用戶不同行為之間的潛在聯(lián)系,提取用戶特征,并且基于注意力機(jī)制的多行為權(quán)重網(wǎng)絡(luò)能夠更好地區(qū)分不同行為之間的差異,降低輔助行為任務(wù)產(chǎn)生的噪聲,使推薦性能不斷提升。但隨著維度的升高,模型性能提升的幅度有所減緩,為綜合考慮推薦效率與推薦性能,本文將隱藏層的最優(yōu)嵌入維度設(shè)置為128。
3.9 案例分析
為了更直觀地理解本文所提模型的推薦方法,以用戶u為例,展示了SACL模型的推薦過(guò)程。如圖8所示,其中[i1,i2,…,i5]表示用戶u的歷史交互序列。圖8(a)為用戶u的完整交互序列[i1,…,i5,i3],將購(gòu)買(mǎi)作為目標(biāo)行為,瀏覽、喜愛(ài)以及添加到購(gòu)物車(chē)作為輔助行為,目標(biāo)推薦任務(wù)為給定歷史交互序列[i1,i2,…,i5],對(duì)下一個(gè)購(gòu)買(mǎi)物品i3作出預(yù)測(cè)推薦。圖8(b)為傳統(tǒng)推薦模型的推薦過(guò)程,傳統(tǒng)推薦模型大多為單行為推薦模型,只利用目標(biāo)行為交互數(shù)據(jù)訓(xùn)練模型,預(yù)測(cè)下一個(gè)交互物品。本案例中,僅對(duì)用戶u歷史交互序列中購(gòu)買(mǎi)的物品T恤衫、筆記本進(jìn)行了特征學(xué)習(xí),導(dǎo)致所學(xué)習(xí)到的用戶偏好不準(zhǔn)確,錯(cuò)誤預(yù)測(cè)了下一個(gè)交互物品。圖8(c)為SACL模型的推薦過(guò)程,針對(duì)用戶每種行為分配特定權(quán)重,同時(shí)利用輔助行為和目標(biāo)行為交互信息生成下一個(gè)物品的預(yù)測(cè)推薦。本案例中,依據(jù)用戶u的行為特征為瀏覽、喜愛(ài)、添加到購(gòu)物車(chē)、購(gòu)買(mǎi)分配特定的行為權(quán)重,結(jié)合權(quán)重對(duì)交互物品進(jìn)行綜合學(xué)習(xí),最終作出了正確推薦。由此可見(jiàn),SACL模型能夠更好地利用用戶歷史交互信息,捕獲用戶偏好,并更準(zhǔn)確地生成下一個(gè)項(xiàng)目的推薦預(yù)測(cè)。這有助于解決僅依靠目標(biāo)行為導(dǎo)致的推薦不準(zhǔn)確的問(wèn)題。
4 結(jié)束語(yǔ)
考慮到多行為推薦算法中存在多行為任務(wù)優(yōu)化不平衡和用戶真實(shí)興趣偏移的問(wèn)題,本文提出了一種基于自注意力和對(duì)比學(xué)習(xí)的多行為推薦模型SACL。該模型依據(jù)行為交互圖建立多行為圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)提高多行為信息傳遞的高階連通性。通過(guò)多視圖間的對(duì)比學(xué)習(xí)捕捉不同行為之間的潛在依賴關(guān)系,將用戶特征整合為元知識(shí),利用自注意多行為權(quán)重網(wǎng)絡(luò)來(lái)刻畫(huà)行為之間的差異,限制輔助行為噪聲,從而更準(zhǔn)確地捕捉用戶的個(gè)性化行為偏好。SACL的實(shí)驗(yàn)結(jié)果優(yōu)于所有基線模型,驗(yàn)證了所提模型的有效性。
圖8 案例分析Fig.8 Case study
下一步,為了更好地利用輔助信息優(yōu)化目標(biāo)任務(wù),考慮引用Transformer架構(gòu)細(xì)粒度建模多行為依賴關(guān)系,更精準(zhǔn)地捕獲用戶的目標(biāo)行為偏好,從而提升模型性能與泛化能力。
參考文獻(xiàn):
[1]嚴(yán)明時(shí), 程志勇, 孫靜, 等. 基于兩階段學(xué)習(xí)的多行為推薦 [J]. 軟件學(xué)報(bào), 2024, 35(5): 2446-2465. (Yan Mingshi, Cheng Zhiyong, Sun Jing, et al. Two-stage learning for multi-behavior recommendation [J]. Journal of Software, 2024, 35(5): 2446-2465.)
[2]Gao Chen, Zheng Yu, Li Nian, et al. A survey of graph neural networks for recommender systems: challenges, methods, and directions [J]. ACM Trans on Recommender Systems, 2023, 1(1): 1-51.
[3]汪春播, 溫繼文. 基于異構(gòu)信息網(wǎng)絡(luò)的推薦研究綜述 [J]. 計(jì)算機(jī)工程與科學(xué), 2023, 45(11): 2047-2059. (Wang Chunbo, Wen Jiwen. Review of recommendation based on heterogeneous information network [J]. Computer Engineering amp; Science, 2023, 45(11): 2047-2059.)
[4]Ren Xubin, Xia Lianghao, Zhao Jiashu, et al. Disentangled contrastive collaborative filtering [C]// Proc of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2023: 1137-1146.
[5]Wu Le, He Xiangnan, Wang Xiang, et al. A survey on accuracy-oriented neural recommendation: from collaborative filtering to information-rich recommendation [J]. IEEE Trans on Knowledge and Data Engineering, 2022, 35(5): 4425-4445.
[6]付峻宇, 朱小棟, 陳晨. 基于圖卷積的雙通道協(xié)同過(guò)濾推薦算法 [J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(1): 129-135. (Fu Junyu, Zhu Xiaodong, Chen Chen. Two-channel collaborative filtering recommendation algorithm based on graph convolution [J]. Application Research of Computers, 2023, 40(1): 129-135.)
[7]Zhu Yu, Lin Jinhao, He Shibi, et al. Addressing the item cold-start problem by attribute-driven active learning [J]. IEEE Trans on Knowledge and Data Engineering, 2019, 32(4): 631-644.
[8]Zhou Zhihui, Zhang Lilin, Yang Ning. Contrastive collaborative filtering for cold-start item recommendation [C]// Proc of ACM Web Conference. New York:ACM Press,2023: 928-937.
[9]方陽(yáng), 譚真, 陳子陽(yáng), 等. 用于冷啟動(dòng)推薦的異質(zhì)信息網(wǎng)絡(luò)對(duì)比元學(xué)習(xí) [J]. 軟件學(xué)報(bào), 2023, 34(10): 4548-4564. (Fang Yang, Tan Zhen, Chen Ziyang, et al. Contrastive meta-learning on heterogeneous information networks for cold-start recommendation [J]. Journal of Software, 2023, 34(10): 4548-4564.)
[10]沈?qū)W利, 張榮凱. 聯(lián)合自監(jiān)督學(xué)習(xí)強(qiáng)化的多行為多任務(wù)推薦算法 [J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(9): 2688-2693. (Shen Xueli, Zhang Rongkai. Multi-behavior multi-task recommendation algorithm integrating self-supervised learning enhancement [J]. Application Research of Computers, 2023, 40(9): 2688-2693.)
[11]Yan Mingshi, Cheng Zhiyong, Gao Chen, et al. Cascading residual graph convolutional network for multi-behavior recommendation [J]. ACM Trans on Information Systems, 2023, 42(1): 1-26.
[12]Tang Liang, Long Bo, Chen B C, et al. An empirical study on re-commendation with multiple types of feedback [C]// Proc of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Datamining. New York:ACM Press,2016: 283-292.
[13]Loni B, Pagano R, Larson M, et al. Bayesian personalized ranking with multi-channel user feedback [C]// Proc of the 10th ACM Confe-rence on Recommender Systems. New York:ACM Press,2016: 361-364.
[14]Gao Jianliang, Lyu Tengfei, Fan Xiong, et al. MGNN: a multimodal graph neural network for predicting the survival of cancer patients [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press, 2020: 1697-1700.
[15]Gao Chen, He Xiangnan, Gan Dahua, et al. Neural multi-task re-commendation from multi-behavior data [C]// Proc of the 35th IEEE International Conference on Data Engineering. Piscataway, NJ: IEEE Press, 2019: 1554-1557.
[16]Jin Bowen, Gao Chen, He Xiangnan, et al. Multi-behavior recommendation with graph convolutional networks [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 659-668.
[17]Chen Chong, Ma Weizhi, Zhang Min, et al. Graph heterogeneous multi-relational recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 3958-3966.
[18]Xia Lianghao, Xu Yong, Huang Chao, et al. Graph meta network for multi-behavior recommendation [C]// Proc of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2021: 757-766.
[19]Xia Lianghao, Huang Chao, Xu Yong, et al. Multiplex behavioral relation learning for recommendation via memory augmented transformer network [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 2397-2406.
[20]Guo Long, Hua Lifeng, Jia Rongfei, et al. Buying or browsing?: predicting real-time purchasing intent using attention-based deep network with multiple behavior [C]// Proc of the 25th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining. New York:ACM Press,2019: 1984-1992.
[21]Xia Lianghao, Huang Chao, Xu Yong, et al. Knowledge-enhanced hierarchical graph transformer network for multi-behavior recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2021: 4486-4493.
[22]Wei Wei, Huang Chao, Xia Lianghao, et al. Contrastive meta lear-ning with behavior multiplicity for recommendation [C]// Proc of the 15th ACM International Conference on Web Search and Data Mi-ning. New York:ACM Press,2022: 1120-1128.
[23]Chen Deli, Lin Yankai, Li Wei, et al. Measuring and relieving the over-smoothing problem for graph neural networks from the topological view [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2020: 3438-3445.
[24]Rendle S, Freudenthaler C, Gantner Z, et al. BPR: Bayesian personalized ranking from implicit feedback [EB/OL]. (2012-05-09). https://arxiv.org/abs/1205.2618.
[25]Shu Jun, Xie Qi, Yi Lixuan, et al. Meta-weight-net: learning an explicit mapping for sample weighting [EB/OL]. (2019-09-27). https://arxiv.org/abs/1902.07379.
[26]Wang Xiang, He Xiangnan, Wang Meng, et al. Neural graph collabo-rative filtering [C]// Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2019: 165-174.
[27]He Xiangnan, Deng Kuan, Wang Xiang, et al. LightGCN: simplifying and powering graph convolution network for recommendation [C]// Proc of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York:ACM Press,2020: 639-648.
[28]Hu Ziniu, Dong Yuxiao, Wang Kuansan, et al. Heterogeneous graph transformer [C]// Proc of Web Conference. New York:ACM Press,2020: 2704-2710.
[29]Wang Xiao, Liu Nian, Han Hui, et al. Self-supervised heterogeneous graph neural network with co-contrastive learning [C]// Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery amp; Data Mi-ning. New York:ACM Press,2021: 1726-1736.
[30]Chen Chong, Zhang Min, Zhang Yongfeng, et al. Efficient heterogeneous collaborative filtering without negative sampling for recommendation [C]// Proc of AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press,2020: 19-26.
[31]Zhang Chi, Chen Rui, Zhao Xiangyu, et al. Denoising and prompt-tuning for multi-behavior recommendation [C]// Proc of ACM Web Conference. New York:ACM Press,2023: 1355-1363.