劉 鑫,梅紅巖,王嘉豪,李曉會
遼寧工業(yè)大學 電子與信息工程學院,遼寧 錦州 121001
近年來,大數(shù)據(jù)逐漸成為現(xiàn)代社會基礎設施的一部分,人們在日常生活中潛移默化地受其影響。當今社會數(shù)據(jù)量呈直線趨勢增長,出現(xiàn)了前所未有的信息爆炸的現(xiàn)象,因此從海量的信息中挖掘出用戶所需信息變得尤為重要。推薦系統(tǒng)作為一種為人們提供所需信息的有效工具也隨著時間的推移不斷發(fā)展、完善。傳統(tǒng)的個性化推薦是為了滿足個體用戶的需求,例如根據(jù)個人喜好推薦電影、商品、新聞資訊、音樂等。群組推薦則是根據(jù)整個群體喜好進行推薦,其需要最大程度上滿足某一群體中絕大部分成員的需求,滿足少數(shù)服從多數(shù)的一種相對公平的原則,通過根據(jù)群組中大部分人的喜好進行推薦。群組推薦在事件組推薦[1]、電影組推薦[2]、旅游組推薦[3]、音樂組推薦[4]、餐飲組推薦[5]和移動組推薦[6]上均有廣泛的應用。但推薦中存在數(shù)據(jù)稀疏性、冷啟動、推薦準確率低、動態(tài)化信息處理和圖結構數(shù)據(jù)處理困難等問題,嚴重阻礙推薦系統(tǒng)的進一步發(fā)展。經(jīng)研究發(fā)現(xiàn),將圖神經(jīng)網(wǎng)絡與推薦相結合是一種有效的提高推薦系統(tǒng)性能的手段。圖神經(jīng)網(wǎng)絡可以在圖上對數(shù)據(jù)進行精準的特征提取和展示,是一種新型的、高效的、擴展性強的神經(jīng)網(wǎng)絡結構,其可以處理的層面覆蓋無向單元圖、無向二元圖、無向多元圖[7]。
圖神經(jīng)網(wǎng)絡已經(jīng)在物理學[8-9]、生物學[10-12]、知識圖譜[13]、圖像[14-18]、文本[19-21]、圖生成模型[22]和提取圖隱藏狀態(tài)[23]領域取得一定成果。本文在將近年來推薦系統(tǒng)的相關研究進行整理的基礎上,對圖神經(jīng)網(wǎng)絡推薦進行深入的研究,主要對圖神經(jīng)網(wǎng)絡在推薦領域的研究成果進行歸納分析,最后總結了推薦發(fā)展所面臨的挑戰(zhàn),并對未來的發(fā)展方向進行了展望。
首先,闡述了深度學習方法中比較有代表性的圖神經(jīng)網(wǎng)絡模型;其次,分別對個性化推薦和群組推薦進行了介紹說明。
圖神經(jīng)網(wǎng)絡(graph neural network,GNN)的概念在文獻[24]中提出,是一種直接在圖結構上運行的神經(jīng)網(wǎng)絡,其作為一種從圖嵌入思想啟發(fā)而來的新型拓展神經(jīng)網(wǎng)絡,可以在圖領域內對數(shù)據(jù)進行特征提取和表示,是一種高效、易擴展的新型的神經(jīng)網(wǎng)絡結構。圖神經(jīng)網(wǎng)絡的原理可以概括為通過構建的圖模型來反映實體及其之間的聯(lián)系,其通過利用特定的方法對節(jié)點進行描述,并經(jīng)過不斷的節(jié)點狀態(tài)更新,得到具有包含鄰居節(jié)點信息和圖形拓撲結構特點的狀態(tài),最終將這些節(jié)點通過特定方法進行輸出,得到所需的信息[7]。應用在圖上的深度學習方法有許多不同的類型,現(xiàn)有主流的方法分為以下五種,如圖1所示。圖神經(jīng)網(wǎng)絡相比傳統(tǒng)神經(jīng)網(wǎng)絡在處理圖結構信息時,所展現(xiàn)出來的性能通常要好得多,具體表現(xiàn)為在特征提取和表示上更加高效[25];更有效地挖掘相關信息,通過構建的圖模型來反映實體及其之間的聯(lián)系[26];使推薦的準確率更高[27];可伸縮性更強,能夠處理的數(shù)據(jù)規(guī)模更大[28]等。
圖1 圖深度學習模型Fig.1 Graph deep learning model
個性化推薦是推薦系統(tǒng)中應用領域最廣泛的,被廣泛應用在餐飲、視頻、商品、旅游和書籍等領域中,其共由三個模塊組成,分別為用戶模塊、推薦算法模塊和待推薦對象模塊。個性化推薦可以理解為給用戶在海量的數(shù)據(jù)中獲取到符合自身興趣偏好的信息。個性化推薦的過程分為根據(jù)用戶信息來獲取用戶偏好進行建模,選取相關的推薦算法來進行計算,最終為用戶形成推薦列表。另外個性化推薦可以根據(jù)不同的應用場景分為基于內容的推薦、基于協(xié)同過濾的推薦和基于混合方式的推薦。
由個性化推薦演變而來的群組推薦與個性化推薦的區(qū)別在于將用戶的個人推薦聚合為整個群組的推薦,也可以理解為通過利用單個用戶的興趣偏好建模,針對群組用戶興趣偏好產(chǎn)生推薦項的一種為群體用戶推薦的方法。群組推薦系統(tǒng)的生命周期可分為四個階段:獲取群組成員數(shù)據(jù)、從群組成員中提取偏好信息、生成群組推薦、推薦結果的評價和反饋。生命周期圖如圖2所示。
圖2 群組推薦系統(tǒng)的生命周期圖Fig.2 Life cycle diagram of group recommendation system
吳云昌等人[27]在眾多專家學者研究的基礎上對群組推薦的流程進行了總結,將群組推薦的步驟總結為以下三步,如圖3所示。
圖3 群組推薦步驟Fig.3 Group recommendation steps
(1)群組形成階段,將總的用戶根據(jù)每個用戶的興趣偏好劃分為多個用戶小組,每一個用戶小組中的成員都是具有相似興趣偏好的用戶。群組形成是進行群組推薦的前提條件,群組劃分得是否合理將直接影響到最終的預測推薦效果。
(2)群組建模階段的任務是偏好融合。偏好融合是指利用偏好融合策略在推薦前建模群組成員的共同興趣偏好,或在推薦后建模群組成員的共同推薦偏好。它可以分為兩部分偏好融合策略和偏好融合方法。
(3)群組預測是根據(jù)偏好融合后的群組興趣對相應的項目進行預測評分并且生成推薦結果,完成推薦。
首先,對基于圖神經(jīng)網(wǎng)絡的推薦方法進行說明,包括基于圖神經(jīng)網(wǎng)絡的推薦方法原理、推薦過程和發(fā)展歷程。其次,對圖神經(jīng)網(wǎng)絡在推薦中所用的不同方法及不同應用場景進行總結和歸納,闡明圖神經(jīng)網(wǎng)絡在實際推薦過程中發(fā)揮的作用。
推薦系統(tǒng)作為當今社會人們從數(shù)據(jù)中獲取到所需信息的一個重要工具,大數(shù)據(jù)時代的變革使得國內外研究學者高度關注推薦方面的相關研究。不管是在推薦領域的知識理論研究,還是在其領域的實踐應用都在不斷深入、發(fā)展。推薦所包含的研究領域和范疇也隨著時間的推移不斷拓寬,到目前為止已經(jīng)形成了較為完善的體系結構。推薦領域在歐式數(shù)據(jù)處理上已經(jīng)有了較深入的研究,例如在處理文本類數(shù)據(jù)、音頻類數(shù)據(jù)、視頻類數(shù)據(jù)等方面。但現(xiàn)實生活中很多數(shù)據(jù)是以圖或者網(wǎng)絡的非歐式數(shù)據(jù)形式存在,例如社交網(wǎng)絡、知識圖、相互作用網(wǎng)絡等,用傳統(tǒng)的推薦方式難以達到預期的效果。隨著深度學習熱度的持續(xù)升高,學者們將推薦與圖神經(jīng)網(wǎng)絡相結合來處理非歐式數(shù)據(jù)以提升推薦的準確性;在處理項目與項目、用戶與用戶、用戶與項目以及內容信息之間的關系時,基于圖神經(jīng)網(wǎng)絡的推薦系統(tǒng)能夠產(chǎn)生高質量的推薦結果。就目前的研究情況來看,圖神經(jīng)網(wǎng)絡憑借其在特征提取上所表現(xiàn)出的優(yōu)越性能,使得圖神經(jīng)網(wǎng)絡在推薦方面的應用成為發(fā)展的必然趨勢。
吳國棟等人在文獻[7]中對GNN模型進行深入研究的基礎上分析了GNN推薦過程,并從無向單元圖推薦、無向二元圖推薦、無向多元圖推薦三個層面進行了闡述。圖神經(jīng)網(wǎng)絡的推薦主要是通過提取用戶與項目之間的交互關系來反映雙方之間的聯(lián)系;通過對節(jié)點進行描述,并經(jīng)過不斷的節(jié)點狀態(tài)更新,得到具有包含鄰居節(jié)點信息和圖形拓撲結構特點的狀態(tài),最后以對應的方式對節(jié)點進行輸出,得到目標結果。圖神經(jīng)網(wǎng)絡推薦的流程如圖4所示。
圖4 圖神經(jīng)網(wǎng)絡推薦過程Fig.4 Recommendation process of graph neural network
2.2.1 基于圖自動編碼器的推薦方法
圖自動編碼器得益于其適合學習圖的節(jié)點表示被廣泛應用在無監(jiān)督學習中。自編碼器(auto-encoder,AE)和變分自編碼器(variational auto-encoder,VAE)廣泛應用于無監(jiān)督學習中,它們適用于學習無監(jiān)督信息的圖節(jié)點表示。GAN的基本思想是構建兩個相關聯(lián)的模型(判別器和生成器)。生成器的目的是通過產(chǎn)生假數(shù)據(jù)來“欺騙”判別器,判別器用于區(qū)分樣本是真實數(shù)據(jù)還是由生成器產(chǎn)生的假數(shù)據(jù)。然后,兩個模型通過不斷地博弈進行聯(lián)合訓練,從而從中受益。Berg等人[29]創(chuàng)新性地將圖自動編碼器與推薦相結合,提出了GC-MC(graph convolutional matrix completion)模型。該模型通過使用圖自動變編碼器的結構來組織推薦過程,將矩陣補全或推薦轉換為二分用戶-物品交互圖上的鏈接預測問題。其可以通過隨機小批量處理的方式在更大規(guī)模的數(shù)據(jù)集上進行訓練,提高推薦質量的同時擴大了推薦的適用范圍。
基于圖自動編碼器的GC-MC模型,首先通過圖卷積編碼器傳遞和轉換從用戶到項目節(jié)點的信息;其次使用雙線性譯碼器模型進行逆向處理;然后在訓練過程中利用損失函數(shù),最小化預測評級的負對數(shù)似然值;最后以標記邊的形式預測新的評級,生成基于用戶和項目嵌入對預測(重構)評級矩陣。與以往基于圖的推薦系統(tǒng)方法不同的是,該模型把GCN看作為編碼器,用來提取出用戶和電影的信息,然后通過解碼器對每一組用戶-電影進行計算匹配概率,為用戶推薦匹配度高的電影,GC-MC模型與目前最先進的協(xié)同過濾算法進行了比較,在MovieLens數(shù)據(jù)集上精準率和RMSE要優(yōu)于其他最先進的協(xié)同過濾算法,效果提高均在5%以上。GC-MC框架如圖5所示。
圖5 GC-MC模型示意圖Fig.5 Schematic diagram of GC-MC model
2.2.2 基于圖注意力神經(jīng)網(wǎng)絡的推薦方法
為了使圖神經(jīng)網(wǎng)絡更加有效地綜合用戶的興趣偏好,提高推薦的準確性,用圖注意力網(wǎng)絡對用戶進行加權是一種行之有效的方法。Song等人[30]提出基于動態(tài)圖推薦模型(dynamic graph recommendation,DGRec)。采用遞歸神經(jīng)網(wǎng)絡和上下文相關的社交網(wǎng)絡對用戶行為進行建模,使用圖注意力神經(jīng)網(wǎng)絡動態(tài)地推斷出基于用戶當前喜好的興趣。此方法首先通過建模用戶的當前興趣來學習單個用戶的表示;然后,圖注意力機制會根據(jù)用戶當前的興趣權衡對每個朋友的交互情況;最后,模型通過結合用戶當前的偏好和他的社交屬性來產(chǎn)生推薦。使用注意機制將朋友的短期偏好模型與長期偏好模型區(qū)分開來,給定用戶當前的興趣,每個朋友的影響。將圖注意力機制與傳播算法相結合,在保證準確率的前提下,改善了推薦系統(tǒng)的用戶體驗。
此外,為了拓寬圖注意力機制適用領域,Cui等人[31]在服裝推薦領域提出了基于圖注意力機制的NGNN(node-wise graph neural networks)模型。該模型能夠充分利用不同服裝之間復雜的關系,通過利用圖結構來捕捉各要素之間的復雜關系;利用文本特征提取和視覺特征提取雙通道,將各類服裝放入對應的節(jié)點之中形成子圖,構成了一個無向單元圖,借此來構造服裝圖;采用GNN推薦模型來學習節(jié)點表示,利用注意力機制來計算圖的輸出,預測兼容性得分,實現(xiàn)向用戶推薦合理的服裝搭配;并能充分利用服裝項目之間的復雜關系,增強了推薦的兼容性。
以上推薦方法都在利用圖神經(jīng)網(wǎng)絡進行推薦的過程中融入了圖注意力機制,其思想基本大同小異,可以總結為在利用圖神經(jīng)網(wǎng)絡進行信息學習后,融合圖注意力機制進一步有效地把握關鍵信息,能夠綜合考慮到不同權重的信息對最終結果的影響,打破了以往平均用戶特征的局限性。
2.2.3 基于分層圖神經(jīng)網(wǎng)絡的推薦方法
為了緩解用戶-項交互中隱藏的協(xié)作信號,在嵌入過程中沒有被編碼,所生成的嵌入可能不足以捕獲協(xié)同過濾效果的問題。Wang等人[32]設計出NGCF(neural graph collaborative filtering)模型。為了達到能夠獲取更多鄰居信息的目的,在利用NGCF進行節(jié)點提取嵌入式表示中使用銜接的方式進行聚合,將原先嵌入式表示的維度乘以聚合的層數(shù),將其作為更新后節(jié)點的嵌入式表示維度。利用嵌入傳播層,將用戶和項目的嵌入相互交互來獲取輔助信息。創(chuàng)造性地將信息進行分層后再利用信息分別進行聚合,結合輔助信息進行推薦。實踐證明此方法能夠更加全面地把握信息,在三個真實數(shù)據(jù)集上的實驗效果表示召回率和歸一化折損累計增益明顯提高。
Fan等人[33]為了更好地捕獲用戶間的社交關系和用戶與項目之間的關系,提出了一種新穎的社交推薦圖神經(jīng)網(wǎng)絡框架(GraphRec),聯(lián)合捕獲以上兩層關系,對兩個圖和異構強度進行了連貫的建模,將推薦過程劃分為用戶建模、物品建模和評級預測。該模型首先通過用戶建模來獲取用戶的潛在因素,此階段通過項目聚合和社交聚合兩種方式來獲取用戶與項目之間的交互信息和用戶與社交圖中用戶之間的關系信息,來學習用戶的潛在因素,進而利用與用戶建模類似的方式來捕獲學習項目空間的用戶潛在因子;最終,通過將用戶潛在因素和項目潛在因素進行連接,送入MLP進行評級預測。通過利用集成用戶和物品建模組件,來學習模型參數(shù)。GraphRec框架如圖6所示。經(jīng)實驗對比發(fā)現(xiàn),該方法在涉及社交關系的推薦中可以表現(xiàn)出優(yōu)秀的性能,在兩個真實數(shù)據(jù)集上GraphRec優(yōu)于最先進的基線方法,但無法將用戶與項目之間的其他屬性信息考慮在內,另外,也無法有效捕獲社交信息的動態(tài)變化。
圖6 用戶-項目聚合框架圖Fig.6 User-item aggregation framework diagram
以上兩種方法都是通過分層的方式,利用圖神經(jīng)網(wǎng)絡來獲取用戶-社交關系圖和用戶-物品圖來挖掘隱藏信息,然后根據(jù)獲取到的隱藏信息來輔助推薦,在增強了推薦的兼容性的同時,為用戶推薦與之興趣度匹配高的商品。NGCF模型將協(xié)作信號合并到CF的嵌入中,增強了推薦系統(tǒng)的魯棒性,但是其存在泛化和可解釋性差的缺點。GraphRec模型的可解釋性相比之下要優(yōu)于GCCF模型,要想進一步提高其性能必須突破捕獲社交信息的動態(tài)變化的瓶頸。
2.2.4 基于空域圖卷積神經(jīng)網(wǎng)絡的推薦方法
圖卷積神經(jīng)網(wǎng)絡(graph convolutional networks,GCN)可以對圖執(zhí)行卷積操作,并聚合來自所有鄰居的信息來更新節(jié)點嵌入,具有更強的特征提取能力和泛化能力。為了解決僅僅考慮用戶-服裝或服裝-服裝之間的關系,從而導致推薦效果不佳和限制推薦性能的問題,Li等人[34]提出了利用層級時尚圖神經(jīng)網(wǎng)絡(hierarchical fashion graph network,HFGN)模型來實現(xiàn)時尚兼容建模進行個性化服裝推薦。HFGN模型的處理流程如下:將用戶和服裝進行初始化嵌入;利用圖卷積神經(jīng)網(wǎng)絡來對服裝圖進行嵌入傳播機制,從而優(yōu)化嵌入。該階段分為三個步驟完成:首先,跨項目的信息傳播,通過整合兼容性模型對項目嵌入進行細化;其次,從商品到服裝的信息傳播,將商品語義聚合為服裝嵌入;最后,從服裝到用戶的信息傳播,集成歷史服裝作為用戶表示,進行層次圖卷積之后對個性化推薦輸出預測評分。分層時裝圖網(wǎng)絡整體框架如圖7所示。該模型對時裝圖使用嵌入傳播機制,利用圖卷積神經(jīng)網(wǎng)絡在保留良好兼容性的同時,也能夠滿足用戶的個人品味,使得推薦更加人性化,增強了推薦系統(tǒng)的用戶體驗。
圖7 HFGN三層模型Fig.7 HFGN three-tier model
此外,為了緩解圖規(guī)模過大的限制,Ying等人[26]開發(fā)了一個高效的GCN算法PinSage,在大規(guī)模的深度推薦引擎中,該模型結合了高效的隨機漫步和圖卷積來生成包含圖結構和節(jié)點特征信息的節(jié)點嵌入(即項目信息)。利用高度可伸縮的GCN算法,能夠學習包含數(shù)十億對象網(wǎng)絡規(guī)模圖中的節(jié)點嵌入,一定程度上減輕了在推薦過程中受圖規(guī)模過大的限制。該方法在原有基線方法的基礎上命中率提高了150%,MRR提高了60%。PinSage未來可以進一步擴展到解決大規(guī)模的其他圖表示學習問題上,包括知識圖推理和圖聚類。為了進一步擴大圖神經(jīng)網(wǎng)絡的應用范圍,Wang等人[35]提出了一種用于推薦的知識圖卷積神經(jīng)網(wǎng)絡模型(knowledge graph convolutional network,KGCN),所提出的KGCN模型通過有選擇地、有傾向性地聚合鄰域信息,將非光譜GCN方法擴展到知識圖中,能夠有效學習知識圖(knowledge graph,KG)上的結構信息和語義信息,通過挖掘KG上的相關屬性準確地捕獲項目間的相關關系以及用戶的潛在興趣,并以小批量的方式實現(xiàn)了該方法,它能夠在大數(shù)據(jù)集和知識圖上操作。知識圖卷積網(wǎng)絡,為推薦系統(tǒng)探索用戶知識圖偏好提供端到端框架,通過擴展KG中每個實體的接受域,KGCN能夠捕捉用戶的高階個性化興趣,進而按照用戶興趣進行推薦。實驗結果表明,通過結合KG的豐富場景信息能夠有效地緩解用戶-項交互的稀疏性和冷啟動問題,KGCN在電影、書籍和音樂推薦方面始終優(yōu)于最先進的基線方法。
以上研究表明圖卷積神經(jīng)網(wǎng)絡從起初的特征提取擴展到處理大規(guī)模數(shù)據(jù)集上,進一步應用在處理大規(guī)模數(shù)據(jù)集和知識圖上。其提高了推薦的準確度,使得推薦的可擴展性更強,由此可見圖卷積神經(jīng)網(wǎng)絡是促進推薦系統(tǒng)發(fā)展的推動力量。
2.2.5 基于譜域圖卷積神經(jīng)網(wǎng)絡的推薦方法
近年來,基于譜域圖卷積的推薦方法也取得了很大的成效,與空域圖卷積不同的是譜域圖卷積直接在譜域上進行譜卷積運算,該方法不僅可以揭示圖的近鄰性信息,而且還可以解釋圖中隱藏的連通性信息。Zheng等人[36]率先將譜卷積方法應用于推薦系統(tǒng),在節(jié)點和圖分類[37-38]方法的啟發(fā)下,提出了基于譜圖理論的方法——光譜協(xié)同過濾(spectral collaborative filtering,SpectralCF),其利用譜域中存在豐富的連接信息來協(xié)助SpectralCF更好地學習用戶和項目的潛在因素,借此來克服協(xié)同過濾中連接信息建模問題。通過使用一個多項式來近似逼近卷積核多項式,從而達到動態(tài)放大或衰減頻域的目的,緩解了協(xié)同過濾中冷啟動的問題。SpectralCF與四種最先進的基于CF的模型和兩種基于圖形的模型相比,在三個標準數(shù)據(jù)集上分別實現(xiàn)了Recall和MAP的20.1%和42.6%的提升。
為了緩解推薦系統(tǒng)中的數(shù)據(jù)冷啟動問題,解決忽略跨域推薦區(qū)域的高階連接信息存在域不兼容問題。Liu等人[39]提出了一種用于跨域的個性化推薦模型,并命名為聯(lián)合圖卷積神經(jīng)網(wǎng)絡模型(joint spectral convolutional network,JSCN)。該模型能夠同時對不同圖進行多層譜卷積,并通過域自適應用戶映射模塊[40],來學習域不變的用戶表示,通過譜卷積提取高階綜合聯(lián)通性信息,利用域不變用戶映射來實現(xiàn)信息跨域傳輸,域自適應用戶映射模塊可以幫助不兼容的域來傳遞知識。JSCN在跨領域推薦中的有效性與最先進的方法相比,召回率提高了9.2%,MAP提高了36.4%,并且有效降低了時間復雜度。圖8所示為將原始的二部圖通過譜卷積轉為頻譜圖。
圖8 譜圖卷積模型轉換圖Fig.8 Spectrum convolution model transformation diagram
以上兩種推薦方法都是在譜域上進行推薦,其基本的思想都是通過運用拉普拉斯矩陣,并將矩陣進行傅里葉變換,將這種變換的思想演化到圖上實現(xiàn)圖的傅里葉變換,通過優(yōu)化卷積核,近似卷積核多項式,從而實現(xiàn)快速計算。譜域圖卷積在空間域中將圖用鄰接矩陣來表示,用矩陣的特征值來代碼矩陣的譜。該方法試圖在譜域內進行卷積操作,將圖上的信號變換到譜域中,在譜域中完成卷積操作后,再經(jīng)過逆變換轉換到空間域中,實現(xiàn)節(jié)點信息學習。
現(xiàn)有的對譜圖卷積模型優(yōu)化的方法正在蓬勃發(fā)展,典型的方法有譜圖注意力網(wǎng)絡[41]、圖小波變換網(wǎng)絡[42]以及簡化譜圖卷積網(wǎng)絡[43]等,這些新方法都使譜卷積模型的性能有了很大的提高,未來如果將這些模型應用于推薦系統(tǒng),必然會有力地推動推薦系統(tǒng)的發(fā)展。
為了給出更直觀的比較,將本文所涉及的基于圖神經(jīng)網(wǎng)絡的推薦模型總結如表1所示。
表1 基于圖神經(jīng)網(wǎng)絡的推薦模型Table 1 Recommendation models based on graph neural network
群組推薦作為推薦中的一種方式,其需要考慮到群體中所有成員的興趣偏好,聚集群組中成員的偏好,根據(jù)所得的共同偏好對項目進行推薦。群組推薦的目的是解決群組成員興趣偏好沖突問題,從而使得最終的推薦結果能夠最大程度地滿足群組內所有成員的興趣偏好。
為了緩解現(xiàn)有群組發(fā)現(xiàn)方法中存在忽略用戶傾向具有時間遷移性和群組可重疊性問題,王海燕等人[44]提出了一種基于密度峰值聚類的動態(tài)群組發(fā)現(xiàn)方法。該方法通過動態(tài)泊松分解來獲取用戶的動態(tài)信息變化,然后通過高階奇異值分解來預測用戶隨時間所變化的興趣偏好,并根據(jù)計算所得的用戶傾向構建高相似度用戶集合,最后利用改進的基于密度峰值的聚類算法對用戶集合進行劃分,實現(xiàn)用戶動態(tài)變化的偏好。李鵬等人[45]為了更有效地把握用戶之間的聯(lián)系,采用權重增量及相似聚集的用戶行為分析算法,通過RFM(recentness,frequency,monetary amount)模型與Apriori算法相結合來挖掘關聯(lián)規(guī)則,使用相似向量矩陣計算用戶的相似度關系,最后利用協(xié)同過濾算法為用戶進行視頻推薦。為了更有效地把握群組中的用戶偏好,汪祥舜等人[46]創(chuàng)造性地提出了一種共識模型策略,融合了群組領袖影響因子和項目熱度影響因子,基于K近鄰為目標群組尋找鄰居群組,借鑒鄰居群組的偏好,設計了基于偏好融合的群組推薦算法。如何綜合群組成員之間的信任關系和社交關系等需要進一步地研究。宣鵬程等人[47]為了進一步提高群組推薦的準確率,通過引入項目類型占比因子的方式,來計算群組中不同類別興趣偏好和用戶類型偏好之間的相似度,來進一步改進偏好融合策略,從而達到提高群組推薦的準確率和群組成員的滿意度的目的。很多學者針對群組推薦領域的不同層面所存在的問題,對群組推薦進行了改進、優(yōu)化,在不同程度上提升了群組推薦的性能。
群組推薦能夠在很大程度上滿足群體中大部分成員的偏好需求,其根據(jù)群組中大部分人的興趣喜好進行推薦,可以有效地為實際生活中以群體為單位的活動進行推薦。上述研究表明,為了推動群組推薦的發(fā)展,學者運用不同方法來提高群組推薦性能,但群組推薦仍存在傳統(tǒng)推薦系統(tǒng)中的冷啟動和稀疏矩陣問題。此外,隨著群組推薦的深入研究越來越多的問題暴露出來,例如對靜態(tài)信息處理方面比較完善,但是在動態(tài)變化信息處理方面研究較少,推薦準確率低,群組推薦的用戶隱私與安全,群組推薦的可解釋性和可視化等,推薦系統(tǒng)要想不斷完善發(fā)展就必須跨越以上鴻溝。
3.2.1 圖神經(jīng)網(wǎng)絡在推薦應用層面的優(yōu)勢
本小節(jié)主要針對圖神經(jīng)網(wǎng)絡在推薦過程中處理信息上的優(yōu)勢進行了總結概述,主要有以下三方面:
(1)有效解決長距離的信息傳播問題。圖神經(jīng)網(wǎng)絡在長距離信息獲取方面與傳統(tǒng)方法相比性能有明顯的提高。針對解決長距離的信息傳播問題,Li等人[48]將門控機制與圖神經(jīng)網(wǎng)絡結合,提出了GG-NNs(gated graph sequence neural networks)模型對長期信息傳播進行更新,在一定程度上緩解了長距離的信息傳播效果不佳的問題。
(2)處理動態(tài)圖的不確定性。動態(tài)圖因其不固定性,計算難度較大,利用圖神經(jīng)網(wǎng)絡可以有效地降低處理難度。例如為用戶推薦感興趣的項目,要被用戶的興趣愛好所影響,然而隨著時間的推移和個人的成長,興趣愛好不會是一成不變的,如何在用戶漫長的興趣變化過程中實時地更新用戶的興趣愛好是一個難題。Song等人[30]使用圖注意神經(jīng)網(wǎng)絡,分別對用戶節(jié)點、朋友節(jié)點進行描述,并使用相關傳播算法更新用戶信息節(jié)點,可以動態(tài)地獲取用戶當前的興趣愛好,動態(tài)地把握用戶的信息變化。
(3)GNN計算復雜度低,計算代價小。為了達到提高準確度的目的,通常是通過增加神經(jīng)網(wǎng)絡層數(shù)來進行優(yōu)化,這無疑增加了處理過程中的計算量,并且還存在過擬合的風險。GNN的計算層數(shù)一般不超過3層。隨著GNN計算層數(shù)的增多會出現(xiàn)過擬合的問題,經(jīng)實驗發(fā)現(xiàn)一般GNN計算層數(shù)在達到3層時即可獲得較好的性能。Song等人[30]經(jīng)過經(jīng)實驗發(fā)現(xiàn)2層的社交興趣卷積網(wǎng)絡,比1層、3層所表現(xiàn)出的性能要更好。魏曉輝等人[49]在研究基于圖神經(jīng)網(wǎng)絡的興趣活動推薦算法時,通過實驗發(fā)現(xiàn)當鄰居層數(shù)為3時,在3個數(shù)據(jù)集上都呈現(xiàn)最好的效果。以上研究表明圖神經(jīng)網(wǎng)絡能夠利用相對更少的計算量,使得模型獲得更為優(yōu)秀的性能。
此外,在推薦系統(tǒng)中長距離的信息傳播、獲取動態(tài)信息以及模型計算復雜度都是其所需解決的問題,圖神經(jīng)網(wǎng)絡能夠在現(xiàn)有研究的基礎上有效地緩解推薦系統(tǒng)中的難題。
3.2.2 基于圖神經(jīng)網(wǎng)絡的群組推薦展望
本小節(jié)首先闡述了群組推薦研究的必要性,然后將圖神經(jīng)網(wǎng)絡與群組推薦相結合,進而對解決群組推薦目前所存在的缺陷進行了可行性分析。
圖神經(jīng)網(wǎng)絡在處理圖結構數(shù)據(jù)時有著得天獨厚的優(yōu)勢,可以直接應用在圖結構數(shù)據(jù)中,可以針對目前所存在的復雜圖結構數(shù)據(jù)進行處理,并且在挖掘用戶-項目之間、用戶-用戶之間隱性信息方面可以發(fā)揮更好的作用。另外,圖神經(jīng)網(wǎng)絡在處理動態(tài)信息方面也表現(xiàn)出良好的性能[50]:圖結構數(shù)據(jù)的另一種變體是動態(tài)圖,圖結構數(shù)據(jù)有靜態(tài)和動態(tài)兩種存在形式,都可以作為輸入信號。為了能夠完整地獲取以上兩種信息,文獻[51]提出的DCRN(diffusion convolutional recurrent neural network)模型和文獻[52]提出的STGCN(spatio-temporal graph convolutional networks)框架通過利用GNNs來收集空間信息,將獲取的信息嵌入到相應的模型中,從而提高模型的性能。在長期傳播問題中,文獻[48]提出了GG-NNs模型,該網(wǎng)絡在傳播步驟中使用門控遞歸單元(GRU),將遞歸單元展開到固定的步驟,并通過時間反向傳播來計算梯度,最終能夠有效地捕獲信息的長期動態(tài)變化。
基于圖神經(jīng)網(wǎng)絡的推薦已應用在眾多領域中,實驗表明其能夠提高推薦的準確程度,降低計算成本,提高工作效率。Zhang等人[53]針對團購的個性化推薦模型,解決社會化電子商務團購推薦問題,提出了一種推薦方法GBGCN(group buy graph convolutional network),將用戶的表示行為數(shù)據(jù)和社交網(wǎng)絡用有向異構圖表示出來,利用圖卷積網(wǎng)絡模型來提取復雜的高階圖結構,最終使用一個雙損失函數(shù)來提取偏好信息。雖然此研究是針對團購進行設計的,但是與群組推薦不同,在此社交電商團購推薦問題中,群體是由社交網(wǎng)絡動態(tài)形成的,其沒有預先定義的群體,在本質上與群組推薦有一定的差距。
根據(jù)上文可知,圖神經(jīng)網(wǎng)絡在許多實際推薦應用中已取得了成功,同時也在個性化推薦以及社會化推薦上展現(xiàn)出了令人滿意的效果,這也為群組推薦工作提供了充分條件。圖神經(jīng)網(wǎng)絡很大限度上利用了各節(jié)點間隱性關系對推薦結果的影響,降低了對圖數(shù)據(jù)的推薦復雜度,提高了推薦的準確性,從圖數(shù)據(jù)中有效地提取有用的信息,從而提高群組推薦領域在圖結構數(shù)據(jù)上的推薦水平,這也有助于以科學的方法進行推薦。
本文系統(tǒng)地梳理了國內外現(xiàn)有圖神經(jīng)網(wǎng)絡視角的推薦相關文獻,通過回顧整理發(fā)現(xiàn),過去圖神經(jīng)網(wǎng)絡對推薦的研究重點落在個性化推薦和社會化推薦層面,大都集中于歐式數(shù)據(jù)的特征關系提取來進行推薦,一定程度上忽略了用戶隱式關系對推薦層面的影響;同時,隨著團體活動場景的日益增多,群組推薦影響用戶決策方面的研究在當前及未來很長一段時間內都會處于研究的熱點和前沿,如何利用圖神經(jīng)網(wǎng)絡來進行群組推薦,后續(xù)還需要進行不斷探索。本文提出以下展望:
(1)可以從信息提取層面來研究用戶關系對推薦結果的影響;
(2)可以嘗試進一步降低圖神經(jīng)網(wǎng)絡的計算復雜度,來擴大其適用的范圍;
(3)可以從如何學習邊緣的隱藏狀態(tài),進一步更全面地考慮各種信息對推薦結果的影響;
(4)可以嘗試運用圖神經(jīng)網(wǎng)絡來進行用戶關系提取,將圖神經(jīng)網(wǎng)絡與群組推薦相結合,提高群組推薦性能。