錢玉婷
(桂林理工大學商學院 廣西桂林 541004)
關鍵字:推薦系統(tǒng);推薦多樣性;推薦方法
隨著大數據時代的到來[1],人們逐步從信息匱乏時代跨越到信息過載時代[2]。如今人們面臨的信息問題大多是由爆炸式增長的數據帶來的[3],比如難以在紛繁的數據中找到符合自己需求的信息。推薦系統(tǒng)由此孕育而生,其憑借信息過濾和信息篩選能力成為有效解決信息過載問題的工具。21世紀初,史密斯等人提出在推薦過程中引入多樣性概念。推薦多樣性通過增加推薦列表中物品之間的種類,使得推薦物品的覆蓋范圍和用戶興趣的偏好覆蓋范圍更加廣泛,但是目前推薦系統(tǒng)相關綜述類文章研究的側重點主要集中在提高推薦的準確性,缺乏對推薦多樣性的研究。所以,本文從推薦多樣性的角度出發(fā),對提高推薦多樣性的方法進行梳理和總結。
基于長尾效應的推薦多樣性方法的基本思想是通過增加推薦列表中長尾產品的數量實現推薦多樣性。研究表明,增加長尾物品的推薦會提高總體多樣性,多樣性強的推薦會給企業(yè)帶來好處[4]。在基于長尾效應的推薦多樣性方法中,根據長尾效應增加推薦多樣性方法的不同,又可分為多標準推薦多樣性方法和尾部聚類推薦多樣化方法。
多標準推薦多樣性方法是引入物品流行度、用戶偏好度或用戶間相似關系多個推薦標準對物品重新排序,從而調節(jié)長尾物品的推薦比例、提高長尾物品的推薦率,進而生成最終推薦列表的方法。謝修娟等(2019)[5]在預測評分時,使用物品流行度權重來恰當地協調長尾商品與流行商品,懲罰物品流行度對物品推薦期望的影響。劉業(yè)政等(2018)[6]提出一種推薦方法,用戶偏好相似度用余弦相似性來衡量,以達到優(yōu)化推薦多樣性算法的目的。鄧樂樂等(2021)[7]在結合熱門物品評分和物品流行度的基礎上,進一步優(yōu)化協同過濾算法,動態(tài)調整物品權重,綜合衡量了推薦結果的多樣性和覆蓋率問題。劉浩翰等[8]通過計算出的用戶間相關關系來計算長尾分布約束推薦的推薦權重,對長尾商品的推薦表現良好。
尾部聚類推薦多樣性方法[9]先將整個物品集分成頭部和尾部,再對尾部物品進行聚類,最后基于此進行多樣性推薦。史明哲等(2018)[10]通過分詞獲取長尾尾部物品信息,抽象出物品主題,再結合用戶的最終偏好主題進行相似度計算,并對相似度進行排名,可發(fā)現用戶的未來偏好趨勢,進而對尾部商品推薦??紤]到長尾商品大部分缺少評分數據這一特點,吳國棟(2020)[11]在選取分割點后,將形成的尾部運用Kmeans++進行聚類,在長尾推薦帶來多樣性的同時,以有效提高長尾物品推薦的準確性。徐小菁(2019)[12]以物品流行度作為標準進行長尾推薦是存在有偏性的問題,提出ITCC雙聚類和Kmeans聚類算法,在尾部聚類下用戶物品矩陣的稠密度得以提高,優(yōu)化長尾物品的推薦效果。Sinha等(2019)[13]表示通過尾部聚類的方法把相似的用戶聚類到同一個聚類中,可以克服協同過濾帶來的數據稀疏問題,從而提高推薦多樣性。
基于二部圖的推薦多樣性方法的基本思想是在二部圖的基礎上,結合物質擴散和熱傳導思想來提高推薦多樣性。在推薦方法中,二部圖可表示為G(U,O,E),U為用戶的集合={u,u,u,…,um},o是物品的集合={o,o,o,…,on},E是二部圖中的邊所構成的集合,其中用戶集合U和物品集合I是兩個互不相交的集合。塔赫基于二部圖推薦提出了著名的基于圖的推薦算法,能夠緩解冷啟動和數據稀疏問題,提高推薦結果的多樣性。鄧松等(2017)[14]在區(qū)分用戶高低評分的基礎上,改進二部圖中初始資源分配,從而解決推薦多樣性問題。蘇健民、郭付超(2018)[15]在調整兩次資源分配方式后,成功向用戶推薦更多符合用戶偏好的產品。王冉等(2018)[16]提出一種基于加權二部圖的斜坡算法推薦算法,在一定程度上增加推薦結果的多樣性。劉忠寶等(2018)[17]提出了一種基于二部圖的學習資源混合推薦模型,將熱傳導提高推薦多樣性的特點和物質擴散能提高推薦準確性的特點結合起來,并通過設定可調參數λ進行調整。黃繼婷等(2019)[18]提出融合偏好度和二部圖的推薦算法,降低熱門物品推薦概率和提高冷門物品推薦概率,從而達到提高推薦多樣性的目的。
基于行列式點過程的推薦多樣性方法[19]的基本思想是最大化抽取推薦給用戶的物品集的概率來實現推薦多樣性。DPP是一種用求解行列式來計算概率的方法。Hulu在2018年提出了基于行列式點過程的推薦多樣性提升算法,能同時衡量相關性和多樣性,并在提高推薦系統(tǒng)多樣性中表現良好。他將基于DPP的推薦多樣性問題轉化為MAP問題求解,從而達到提高推薦多樣性的目的。李金龍基于DPP在求解多目標問題時,雖然在核矩陣的定義上與Hulu不同,但其同樣可以綜合評價收斂性和多樣性。李金龍還在求解DPP問題過程中,將DPP轉化為k-DPP,借助矩陣的特征值分解降低其時間復雜程度。行列式點過程推薦多樣化方法,不僅能同時度量物品的多樣性和相關性,還能簡化計算,提高推薦效率和效果。
基于注意力機制的推薦多樣性方法的基本思想是利用注意力機制覆蓋更加全面的用戶興趣范圍,從而提高推薦多樣性。傳統(tǒng)的序列推薦模型重點關注用戶過去的偏好,所以預測結果偏向以往類似或補充的物品,在結果多樣性上表現不佳。基于注意力機制的推薦多樣性方法對用戶以往的歷史行為分配權重,更加全面和有針對性地抓取用戶的興趣點,消除一定程度的“頭部效應”,從而在多樣性上表現良好。Hu等(2021)提出了一個多目標LPR框架,使用卷積神經網絡捕捉學習者之間的動態(tài)交互,建立注意力機制來根據內容的特點調整交互行為的權重,優(yōu)化由交互強度、多樣性和新穎性三個相互沖突的指標組成的多目標函數。曲昕彤(2020)[20]在NeuMF的模型基礎上,對多層感知機部分進行改進。在權衡多樣性和有側重性的精準推薦前提下,新增注意力機制來實現局部激活單元。用戶歷史行為向量與物品嵌入向量的外積構成前饋神經網絡,從而輸出其激活權重,即
綜上所述,推薦多樣性可以提高推薦質量,并且提高推薦多樣性的方法主要基于長尾效應、二部圖、行列式點過程及注意力機制四個方面。本文從性能特點和局限性兩個方面對推薦多樣性方法進行比較和總結。(1)基于長尾效應的推薦多樣性方法能比較全面地覆蓋利基產品種類,但準確性表現不佳。(2)基于二部圖的推薦多樣性方法可在不考慮內容特征的前提下,達到緩解冷啟動和數據稀疏等問題,但存在大量信息浪費的缺點。(3)基于行列式點過程的推薦多樣性方法,用簡單的行列式計算替換復雜的概率計算,從而降低時間復雜度,但粗排序階段需要有相應的多樣性策略,否則無法保證其多樣性。(4)基于注意力機制的推薦多樣性方法,對用戶以往的歷史行為分配權重,更加全面和有針對性地抓取用戶的興趣點,消除一定程度的“頭部效應”,從而在多樣性上表現良好,但計算過程需要大量資源與儲存空間,增加多樣性推薦模型的復雜度。
大數據時代下,推薦多樣性逐步成為推薦領域的熱點,推薦多樣性彌補了以準確率為目標進行優(yōu)化的推薦算法所導致的“信息繭房”問題,對信息提供方、用戶和商家而言,都具有重要意義。本文經過論文梳理將推薦多樣性方法主要總結為以下四個:基于長尾效應的推薦多樣性方法、基于二部圖的推薦多樣性方法、基于行列式點過程的推薦多樣性方法和基于注意力機制的推薦多樣性方法,并對這四種推薦多樣性方法的性能特點和局限性做了詳細比較。但是,提高推薦多樣性的方法還存在不少挑戰(zhàn),例如推薦多樣性的感知是主觀的,相關性與多樣性之間的權衡等,這些都是提高推薦多樣性方法未來需要解決的難題。