宋召豪,陳亞軍*,萬(wàn) 偉
(西華師范大學(xué) 計(jì)算機(jī)學(xué)院,四川 南充 637009)
本文首次以協(xié)同過(guò)濾思想為基礎(chǔ),利用圖濾波器操作發(fā)揮相似節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的增益效果,很大程度上緩解了用戶-項(xiàng)目二部圖所具有的稀疏性.
用戶集表示為U,項(xiàng)目集表示為I,用戶和項(xiàng)目的數(shù)量表示為N=|U|+|I|.在協(xié)同過(guò)濾中,評(píng)級(jí)矩陣為R∈|U|×|I|,其中如果用戶i和項(xiàng)目j具有交互,則rij=1.考慮到用戶、項(xiàng)目和評(píng)級(jí)矩陣R,協(xié)同過(guò)濾方法旨在學(xué)習(xí)得分函數(shù)s(u,i,R),以對(duì)未來(lái)用戶可能感興趣的候選項(xiàng)目進(jìn)行排名.對(duì)于基于神經(jīng)網(wǎng)絡(luò)的協(xié)同過(guò)濾,通常將使用用戶和項(xiàng)目的可學(xué)習(xí)嵌入表,并用E(0)∈N×d表示.
為了利用基于圖的方法進(jìn)行協(xié)同過(guò)濾,通常需要基于R的用戶-項(xiàng)目二部圖的鄰接矩陣:
(1)
式中A∈N×N.為了確保訓(xùn)練的穩(wěn)定性,大多數(shù)方法采用歸一化鄰接矩陣式中D是對(duì)角矩陣,表示節(jié)點(diǎn)i的程度.每個(gè)用戶和每個(gè)項(xiàng)目都進(jìn)一步分配了與其唯一ID對(duì)應(yīng)的可學(xué)習(xí)嵌入和然后,基于圖神經(jīng)網(wǎng)絡(luò)的方法將通過(guò)相鄰節(jié)點(diǎn)上的傳播來(lái)合并高階信息,通常每一層的表示被連接為最終的節(jié)點(diǎn)表示[4].例如,代表性方法LightGCN[5]的傳播可以表述為:式中k表示第k層圖神經(jīng)網(wǎng)絡(luò),最終的節(jié)點(diǎn)嵌入是通過(guò)不同層中嵌入的加權(quán)平均值獲得:平滑的嵌入表E可以進(jìn)一步用于計(jì)算不同用戶-項(xiàng)目交互的推薦分?jǐn)?shù).
GCFG模型主要包含了嵌入初始化、基于Jacobi多項(xiàng)式的相似信息過(guò)濾、基于注意力的節(jié)點(diǎn)表示動(dòng)態(tài)自適應(yīng)融合和評(píng)分預(yù)測(cè)四個(gè)部分.單層GCFG模型結(jié)構(gòu)如圖1所示.
圖1 單層GCFG模型結(jié)構(gòu)
在GCFG模型中,初始化的過(guò)程是通過(guò)Xavier均勻初始化來(lái)完成的.Xavier均勻初始化是一種常用的權(quán)重初始化方法,用于避免神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中的梯度消失和梯度爆炸問(wèn)題.
鄉(xiāng)村的監(jiān)測(cè)預(yù)警設(shè)備配置按照“七個(gè)一”標(biāo)準(zhǔn)建設(shè),即:每個(gè)鄉(xiāng)鎮(zhèn)有1個(gè)自動(dòng)監(jiān)測(cè)站,每座?。?)型以上水庫(kù)有1個(gè)自動(dòng)水位雨量站,每座有防洪任務(wù)的?。?)型水庫(kù)有 1個(gè)自動(dòng)水位雨量站,每個(gè)村有1個(gè)簡(jiǎn)易雨量站和手搖報(bào)警器,每個(gè)山洪易發(fā)溪河兩岸的村有1個(gè)簡(jiǎn)易水位站,每個(gè)村有1套預(yù)警廣播和1個(gè)避災(zāi)點(diǎn)。另外,2012年福建省利用山洪災(zāi)害防治縣級(jí)非工程措施項(xiàng)目契機(jī),在全省所有自然村全面配置了6.8萬(wàn)面防汛預(yù)警銅鑼,并建立鑼長(zhǎng)制,專人鳴鑼。
為了解決傳統(tǒng)GNN方法只強(qiáng)調(diào)低頻信號(hào),沒(méi)有明顯抑制中頻信號(hào),同時(shí)不對(duì)高頻分量產(chǎn)生負(fù)響應(yīng)的局限性以及沒(méi)有充分利用節(jié)點(diǎn)的相似信息等問(wèn)題,考慮使用一種近似圖信號(hào)濾波器的替代方法.這種方法可以通過(guò)尋找一組正交的多項(xiàng)式基函數(shù)來(lái)實(shí)現(xiàn),在保證收斂性的同時(shí),在節(jié)點(diǎn)的表示中考慮相似性信息,提供足夠的表達(dá)能力以適應(yīng)不同用戶-項(xiàng)目圖的濾波需求,其中Jacobi多項(xiàng)式是一種常見(jiàn)的選擇[7].
低頻和高頻信號(hào)易于擬合,因此不使用任何激活函數(shù),節(jié)點(diǎn)表示是通過(guò)對(duì)不同階的嵌入進(jìn)行平均來(lái)獲得:
(2)
對(duì)于中頻分量,典型的設(shè)計(jì)是αI-UgK(Λ)UT,α是控制中頻信號(hào)影響的系數(shù).帶通濾波器的表示公式為:
(3)
最終的節(jié)點(diǎn)表示是它們的串聯(lián):
(4)
實(shí)驗(yàn)數(shù)據(jù)選取Gowalla(99.92%數(shù)據(jù)稀疏性)數(shù)據(jù)集和Alibaba-iFashion(99.99%數(shù)據(jù)稀疏性)數(shù)據(jù)集.實(shí)驗(yàn)中,隨機(jī)抽取每個(gè)用戶的80%交互進(jìn)行訓(xùn)練,10%的交互進(jìn)行驗(yàn)證,剩余的 10% 交互用于測(cè)試.同時(shí),為每個(gè)正實(shí)例采樣一個(gè)負(fù)項(xiàng)以形成訓(xùn)練集.
實(shí)驗(yàn)使用Recall@K和NDCG@K,這是協(xié)同過(guò)濾的兩個(gè)廣泛使用的指標(biāo)來(lái)評(píng)估頂級(jí)推薦的性能.設(shè)置K值為10、20、50,以K=20為標(biāo)準(zhǔn).更高的Recall@K和NDCG@K意味著更好的性能.取測(cè)試集中所有用戶的平均值為評(píng)價(jià)指標(biāo).
實(shí)驗(yàn)數(shù)據(jù)集的批量大小設(shè)置為4096,嵌入大小設(shè)置為64.使用耐心為5個(gè)epoch的提前停止來(lái)防止過(guò)度擬合.對(duì)于GCFG,a和b在[-1.0,2.0]中進(jìn)行了調(diào)整,步長(zhǎng)為 0.5,學(xué)習(xí)率固定為0.001,λ固定為1e-6.實(shí)驗(yàn)基于24GB RTX 4090 GPU.
為了驗(yàn)證模型的有效性,與其他模型,如BPR、NGCF[9]、DGCF[10]、LightGCN、GTN[11]進(jìn)行比較分析,在相同實(shí)驗(yàn)環(huán)境下,結(jié)果如表1所示.
表1 協(xié)同過(guò)濾方法實(shí)驗(yàn)對(duì)比結(jié)果
從表1可以看出,GCFG模型在更加稀疏的Alibaba-iFashion數(shù)據(jù)集上明顯比在Gowalla數(shù)據(jù)集上的表現(xiàn)突出,這表明該模型更加擅長(zhǎng)處理稀疏數(shù)據(jù).在現(xiàn)實(shí)世界用戶互動(dòng)較少的客觀情況下,該模型展現(xiàn)出了處理冷啟動(dòng)用戶的能力.
在兩個(gè)數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn)以探究模型的有效性,結(jié)果如表2所示.
表2 GCFG模型消融實(shí)驗(yàn)
實(shí)驗(yàn)研究了GCFG的兩種變體的性能:沒(méi)有相似節(jié)點(diǎn)的增益作用(GCFG/-s);沒(méi)有基于注意力機(jī)制的節(jié)點(diǎn)動(dòng)態(tài)自適應(yīng)融合(GCFG/-a).從表中可以看出兩個(gè)組件都是有效的,缺乏任何組件的GCFG將具有性能退化.
本文依據(jù)協(xié)同過(guò)濾思想,將相似信息嵌入節(jié)點(diǎn)表示中,充分發(fā)揮相似節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的增益作用,有效建模用戶偏好和項(xiàng)目吸引力,緩解圖的稀疏性問(wèn)題.同時(shí)引入注意力機(jī)制,自適應(yīng)地調(diào)整權(quán)重,動(dòng)態(tài)融合不同節(jié)點(diǎn)表示.實(shí)驗(yàn)證明了模型的有效性和緩解冷啟動(dòng)問(wèn)題的潛力.