葉佳鑫,熊回香,易 明,劉 明
(華中師范大學信息管理學院,武漢 430079)
目前,F(xiàn)acebook、Twitter、微博等社交網(wǎng)絡平臺已經(jīng)成為網(wǎng)絡用戶進行交流以及資源共享等活動的重要場地,平臺上用戶數(shù)量的維持與增長帶動了資源數(shù)量的增加,使個性化推薦技術的引入成為必然。區(qū)別于面向單個用戶的推薦場景,社交網(wǎng)絡平臺上常有一種更具價值的推薦場景即面向群體推薦。
就人的活動特征而言,絕大部分個體都傾向于進行群體活動,特別是很多互聯(lián)網(wǎng)活動,如團體購物、電影討論等。在這些場景中,推薦服務系統(tǒng)需要有面向群體提供決策支持的能力,以挖掘群體需求為基礎,將資源同時推薦給多個具有需求的用戶,以此來提升推薦效率[1]。雖然推薦服務系統(tǒng)已在互聯(lián)網(wǎng)各個領域中得到了廣泛的應用,但是當前的推薦服務系統(tǒng)主要還是針對單個用戶,群推薦的相關方法及理論亟待補充。
為了研究如何更好地面向社交網(wǎng)絡群體用戶進行推薦服務,本文著重分析了用戶之間的交互行為以及各用戶的影響力,將興趣傳播引入群推薦服務,構建了興趣傳播視角下結合用戶影響力的群推薦服務框架,即融合影響力傳播的群推薦服務。借助影響力傳播來模擬社交網(wǎng)絡平臺上用戶群體興趣的實時變化情況,并通過對不同用戶影響力的衡量來完善興趣傳播過程,從而達到提高群推薦效果的目的。
目前群推薦服務已在旅游、閱讀、電子商務與電影等領域得到了一定的應用。Ardissono 等[2]設計開發(fā)了面向群體用戶的旅游推薦系統(tǒng)(IN‐TRIGUE),該系統(tǒng)基于不同群體如老人、小孩的偏好特征來為其進行推薦服務;Kim 等[3]在使用協(xié)同過濾方法為群組生成推薦集的基礎上進一步從推薦集中刪除了不相關的項目,以提高個體成員偏好的滿意度;朱國瑋等[4]在計算群體對商品的評分時利用遺傳算法對未知評分進行預測,并考慮到了用戶影響力對群體評分的影響;李汶華等[5]基于多代理系統(tǒng)模擬用戶的協(xié)商過程,從而得到最后的群推薦結果。
影響群推薦的因素主要有社會選擇與社會影響;目前的群推薦策略大多基于社會選擇理論形成,并沒有對社會影響現(xiàn)象進行充分考慮[6-7]。社會選擇是同質(zhì)性的作用機理,即興趣特征相似的人更有可能建立關系,用戶依據(jù)自身的興趣來與其他用戶或項目產(chǎn)生聯(lián)系;表現(xiàn)在群推薦上則是基于各個用戶的歷史興趣來推斷其選擇不同項目的可能性,并綜合各個用戶的興趣值來得到整個群體對推薦項目的評分。與社會選擇不同,社會影響指人們的決策易受到外部環(huán)境或有交互關系的其他人的影響,即用戶在進行決策時會參考他人的意見,來自外部的因素會影響用戶最后做出的決策;表現(xiàn)在群推薦上則是群體中不同個體最后做出的決策會受到外部影響,需判斷來自外部的影響強度以及每個個體受到外部影響的程度,并綜合個體受到的影響來得到外部因素對整個群體造成的影響,最后將造成的影響與目標資源相關聯(lián)從而進行推薦。
社交網(wǎng)絡平臺上,用戶間的交互會使用戶興趣發(fā)生變化并帶動群體興趣發(fā)生變化;網(wǎng)絡中不同用戶對群體的影響大小存在差異,影響力較大的用戶影響其他用戶的范圍與程度也較大,更容易改變?nèi)后w的興趣[8]。目前,相關研究已指出,影響力不同的成員通常在群體的決策過程中發(fā)揮著不同的作用[9-10],用戶影響力的分析對社交網(wǎng)絡中的信息傳播、鏈路分析、突發(fā)事件檢測等問題的研究具有重要意義[11]。對群推薦任務而言,用戶影響力的分析更是有助于界定各成員在群決策過程中的作用,能有效推進相關工作的進展與優(yōu)化[12]。
興趣傳播可以理解為,每個用戶存在一個初始興趣,且用戶的興趣向量會在用戶關聯(lián)圖上進行隨機游走,其游走的過程在現(xiàn)實中可表示為用戶接觸其他用戶的行為(如用戶觀察其他用戶所發(fā)布的內(nèi)容、用戶與其他用戶的交流等),這種興趣的游走現(xiàn)象會使關聯(lián)圖上每個用戶的興趣不斷更新[13]。
用戶影響力會影響用戶所發(fā)布的消息在社交網(wǎng)絡中的傳播速度,以及覆蓋的范圍與深度;計算網(wǎng)絡中用戶的影響力并找出關鍵用戶,對分析網(wǎng)絡中信息的傳播機制具有重要作用[14]。同理,用戶影響力也會影響社交網(wǎng)絡中的興趣傳播過程,可以推斷出用戶影響力與興趣傳播的速度、范圍與大小具有很強的關系,很有必要在興趣傳播的過程中考慮到用戶影響力,即影響力傳播。
總體而言,目前群推薦已在多個領域得到了應用,具有較強的應用范圍及研究價值。在不考慮用戶之間相互交流的情況下,群推薦主要依托社會選擇因素進行,即依據(jù)群體中每個成員的興趣來得到待推薦的項目評分。然而,隨著社交網(wǎng)絡平臺的興起以及各種點評平臺的出現(xiàn),用戶在做決策時很容易受到群體中其他用戶或外部環(huán)境的影響,即群推薦的結果除了受到社會選擇因素影響之外還會受到社會影響因素的影響。目前的群推薦研究在以社交網(wǎng)絡中的群體用戶為研究對象時,對社會影響因素的考慮還存在一些不足,主要表現(xiàn)在以下兩個方面:第一,有些研究在進行群推薦時只考慮了社會選擇因素而沒有考慮社會影響因素,考慮了社會影響因素的研究在進行推薦時,大多僅簡單地依據(jù)群體中不同用戶的影響力來分配權重計算待推薦項目的評分,忽略了群成員之間的相互影響;第二,在群推薦中引入社會影響因素時缺少相應理論支撐,社會選擇與社會影響因素之間的關系有待辯證,即需要分析社會影響因素是如何作用于群推薦的整個過程,以及社會選擇因素與社會影響因素的作用區(qū)別。
為了解決以上問題,本文將興趣傳播與用戶影響力進行結合,并應用于社交網(wǎng)絡群推薦任務中,提出了基于影響力傳播的社交網(wǎng)絡群推薦方法,在推薦的過程中通過影響力傳播來體現(xiàn)社會影響因素對群推薦過程的影響,將其與社會選擇因素即用戶興趣相結合,更好地進行群推薦服務。此外,依據(jù)群體興趣的變化程度對比分析了社會選擇與社會影響因素的作用大小,厘清了兩種因素的相互關系。
社交網(wǎng)絡中存在大量以不同類型的事件或人物為中心形成的興趣團體,興趣團體內(nèi)各成員通常圍繞某一固定范圍內(nèi)的相關話題展開討論;依據(jù)個人影響力和參與討論的方式不同,各成員在話題討論中發(fā)揮著不同的作用。本文以社交網(wǎng)絡中的興趣團體為研究對象構建了融合影響力傳播的群推薦方法,如圖1 所示。
圖1 融合影響力傳播的群推薦方法架構
圖1 展示了本文的群推薦方法架構。從社交網(wǎng)絡上收集到博文數(shù)據(jù)后,先利用用戶歷史數(shù)據(jù)來計算用戶影響力,并找出影響力較高的核心用戶;隨后從用戶的文本中提取出相關信息來構建核心用戶與群體的興趣特征模型,結合核心用戶影響力及其興趣特征來預測資源在群體內(nèi)的傳播情況,得到基于影響力傳播的資源得分(社會影響作用),計算群體興趣與資源間的匹配程度,得到基于特征相似性分析的資源得分(社會選擇作用);最后進一步結合推薦群體的特性對得分進行整合,從而得到考慮影響力傳播的資源評分,選擇資源推薦給核心用戶,利用核心用戶來實現(xiàn)資源的擴散,資源的擴散會產(chǎn)生影響力傳播現(xiàn)象,使群體的興趣發(fā)生變化,其外在表現(xiàn)就是以資源為話題展開的發(fā)布、轉(zhuǎn)發(fā)、評論與點贊等行為。
粉絲數(shù)與博文數(shù)[15]、用戶活躍度[16]、轉(zhuǎn)發(fā)率與評論率[17]等都是以往學者在進行社交網(wǎng)絡用戶影響力評價時考慮的相關因素。為了對相關因素進行綜合考慮,本文借鑒h 指數(shù)的思想對社交網(wǎng)絡中用戶的影響力進行計算。
h 指數(shù)是一種綜合考慮學者論文的數(shù)量與質(zhì)量的學者評價指標[18]。目前已經(jīng)有學者將h 指數(shù)用于社交網(wǎng)絡用戶的影響力評價,以h 指數(shù)的思想分別構建了轉(zhuǎn)發(fā)h 指數(shù)(ht)、評論h 指數(shù)(hc)與點贊h 指數(shù) (hl)[19]。本文對 ht、hc 與 hl 指數(shù)進行了重要性衡量,為其分配權重并進行整合,用整合的值來評價社交網(wǎng)絡中用戶的影響力。用戶影響力計算公式為
其中,α、β、γ分別為 ht、hc、hl 指數(shù)的權重,其值取決于對社交網(wǎng)絡中用戶轉(zhuǎn)發(fā)、評論與點贊行為的分析。若某一種行為的發(fā)生頻率較低,則可理解為該行為的發(fā)生具有一定的難度,用戶需要花費較高的時間成本進行該行為;也可理解為用戶對該資源具有強烈的興趣才會產(chǎn)生該行為,因此,某一行為發(fā)生的頻率越低,本文賦予其權重越高。
在計算用戶影響力之后,選取影響力較大的部分用戶作為核心用戶。核心用戶通常在群體中發(fā)揮著較為重要的作用,從核心用戶出發(fā)來模擬影響力傳播的過程,能極大限度地還原傳播過程,且節(jié)省巨大的時間成本。在本文中,核心用戶需要具備較高的影響力,且其發(fā)布的文本數(shù)不能過低。
3.2.1 群體興趣模型
本文通過對熱度較高的博文進行挖掘來建立群體興趣特征。熱度較高的博文即群體內(nèi)用戶點贊、轉(zhuǎn)發(fā)與評論較多的博文,博文熱度P的計算參照用戶影響力的計算,即
其中,P為博文的熱度;t、c、l分別為博文的轉(zhuǎn)發(fā)數(shù)、評論數(shù)與點贊數(shù);α、β、γ分別為t、c、l的權重。
群體用戶的興趣可由興趣方向與興趣強度表示。本文在實證研究中選擇電影為推薦對象,在建立群體興趣模型時,通過與群體相關的電影信息來表示群體在電影類型與電影人物兩個方向的興趣強度,分為(電影類型, 強度)與(電影人物, 強度)。電影類型的強度即某一類型電影的出現(xiàn)頻次,電影人物的強度即電影中導演與演員的出現(xiàn)頻次。為了考慮時間因素,引入遺忘函數(shù)來調(diào)整模型,對興趣強度進行調(diào)整得到調(diào)整后的群體興趣[20]。調(diào)整后的興趣強度計算公式為
其中,X為調(diào)整前的群體興趣強度;k為興趣的衰減速率,本文中取k=1;t為間隔時間,表示博文發(fā)布時間與數(shù)據(jù)采集時間的間隔,以月度作為間隔時間,單位為天;Tmin為最小遺忘時間間隔,Tmax為最大遺忘時間間隔,兩者之差用于表示興趣的遺忘時間區(qū)間;X′為考慮時間衰減調(diào)整后的群體興趣強度。
3.2.2 核心用戶興趣模型
對于核心用戶的興趣,因本文選擇的為核心用戶最新發(fā)布的博文所涉及的電影,故未考慮興趣衰減而直接用詞的出現(xiàn)頻次表示興趣強度,即用電影信息表示核心用戶興趣,核心用戶興趣可表示為(電影類型, 強度)與(電影人物, 強度),電影類型與電影人物強度的取值分別取決于類型與人物信息在核心用戶電影信息中的出現(xiàn)頻次。
3.3.1 基于群體興趣的資源得分
在基于群體興趣的資源評分中,考慮到詞語出現(xiàn)的頻次與覆蓋率,用公式
來對推薦集進行評分。其中,Sp為基于群體興趣的資源得分;Sp1為電影類型得分,Sp2為電影人物得分;T1為電影中具有分值的類型詞語數(shù),T2為類型詞語總數(shù);T3為電影中具有分值的人物詞語數(shù),T4為人物詞語總數(shù)。
3.3.2 基于影響力傳播的資源得分
在基于影響力傳播的資源評分中,考慮到用戶的博文發(fā)布行為及其影響力提出以下設定:
(1)用戶對電影的興趣強度需達到一定閾值才會發(fā)布與電影相關的博文。
(2)用戶發(fā)布的與電影有關的博文數(shù)量、質(zhì)量與其對電影的興趣強度相關,即用戶對電影的興趣越大,其發(fā)布的與電影相關的博文數(shù)量就越多,質(zhì)量越高。
(3)博文的傳播范圍與強度受到博文數(shù)量、博文質(zhì)量與用戶影響力的綜合影響。
基于以上設定,設計公式
來計算基于影響力傳播的資源評分。其中,Sd為基于影響力傳播的資源得分;K為核心用戶對電影的興趣強度,K′為核心用戶對電影的興趣強度閾值,若K達到K′值,則用戶會傳播與該電影相關的博文,K超出K′值越多,則用戶發(fā)布的相關博文數(shù)量越多,質(zhì)量越高;I為用戶影響力。K的計算公式為
其中,K1為核心用戶關于電影類型的得分,考慮到類型詞的出現(xiàn)頻次,設置其出現(xiàn)頻次不小于2 時具有得分,從而控制詞出現(xiàn)的偶然性,當K1-1<0 時,設K1-1=0;K2為核心用戶關于電影人物的得分,當K2-1<0 時,設K2-1=0。
3.3.3 資源得分整合
得到基于群體興趣與影響力傳播的資源得分之后,需要按照群體的特征對得分進行整合,從而得到整合后的資源評分。評分整合的計算公式為
其中,Sp和Sd分別為歸一化處理后的基于群體興趣與影響力傳播的資源得分;α為調(diào)節(jié)系數(shù),通過分析群體特征來進行取值。此外,Sp為基于自身興趣的得分,主要受社會選擇因素的作用;Sd為基于影響力傳播的得分,主要受社會影響因素的作用。即興趣群體受社會選擇因素的作用越大,α取值越小;受社會影響因素的作用越大,α取值越大。本文通過衡量群體興趣的變化程度來衡量其受社會選擇與社會影響因素的作用大小。若群體興趣較為穩(wěn)定,則其更易受社會選擇作用;若群體興趣變化頻繁,則其更易受社會影響作用。
在所提群推薦方法架構的基礎上,本文從微博超話“電影”上采集了相關數(shù)據(jù)用于展示群推薦的具體流程。“超話”是新浪微博推出的一項功能,用于將興趣相似的人集合在一起。本文采集的數(shù)據(jù)來自超話中以“電影”為話題展開的興趣團體,該團體中成員日常發(fā)表與討論的話題大多與電影相關,且成員具有一定的固定性,也存在一些較為穩(wěn)定的核心用戶。采集數(shù)據(jù)的時間段為2019 年1 月1日至2019 年9 月11 日,共采集到用戶發(fā)布的博文10097 條,抓取了與每條博文相關的點贊數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)、發(fā)布時間以及發(fā)布用戶等相關信息,采集到的部分數(shù)據(jù)如表1 所示。
表1 “電影”博文數(shù)據(jù)集
采集數(shù)據(jù)后,為了更好地進行后續(xù)工作,需要對數(shù)據(jù)進行清洗、排序與匯總等預處理。在表1 所示數(shù)據(jù)中,用戶ID 為發(fā)文用戶的統(tǒng)一標識符且具有唯一性,對用戶ID 進行去重處理,共得到1310個不同用戶,將用戶的所有博文進行整合,并按照用戶發(fā)文數(shù)量對表1 中的數(shù)據(jù)進行排序,結果如表2 與圖 2 所示。
如表2 與圖2 所示,1310 名用戶的發(fā)文數(shù)分布在1~496。用戶“解憂電影局”的發(fā)文數(shù)為496,在1310 名用戶中最高;“左拇食指”等用戶發(fā)文數(shù)為1,在1310 名用戶中最低。1310 名用戶中有大量用戶發(fā)文數(shù)低于50。用戶的發(fā)文總數(shù)量與其在興趣群體中的影響力具有較為直接的關系,因此,在后續(xù)的群推薦中將主要以發(fā)文數(shù)量較多的用戶為切入點進行分析。
圖2 用戶-博文數(shù)散點圖
表2 清理后博文數(shù)據(jù)集
考慮到發(fā)文數(shù)量與用戶影響力的關系,本文選擇對表2 中發(fā)文數(shù)最多的50 名用戶進行影響力評價。在利用公式(1)計算用戶影響力之前,先統(tǒng)計該興趣團體內(nèi)博文的平均轉(zhuǎn)發(fā)數(shù)、平均評論數(shù)與平均點贊數(shù),其值分別為8.390、4.719 和37.780,即點贊行為發(fā)生率最高,轉(zhuǎn)發(fā)行為發(fā)生率次之,評論行為發(fā)生率最低,可以理解為用戶對博文的評論行為代表著其對博文具有最高的興趣,隨后是轉(zhuǎn)發(fā)與點贊行為。因此,α、β、γ分別取值為0.3、0.5、0.2。50 名用戶的影響力結果如表3 所示。
表3 顯示了基于影響力的用戶排序結果,50 名用戶的影響力分布在0.700~31.200。對比表2、表3的數(shù)據(jù)可以發(fā)現(xiàn),基于博文數(shù)與基于影響力的用戶排序結果存在一定差異,用戶“解憂電影局”按博文數(shù)排序第一,按影響力排序第七,說明其發(fā)文量大,但是具有影響力的博文數(shù)量少于其他用戶。借鑒h 指數(shù)的思想來計算用戶影響力,綜合考慮了用戶的發(fā)文數(shù)量與質(zhì)量,避免了僅考慮博文數(shù)與粉絲數(shù)計算用戶影響力而產(chǎn)生的偏差,可以較為合理地預測用戶在群體中的影響力。
表3 用戶影響力
在所選取的超話“電影”群體內(nèi),用戶的博文內(nèi)容通常由用戶對電影的簡短介紹、電影名與電影相關視頻組成,其中簡介與視頻通常不包含用戶的興趣特征,因此,本文僅從電影名來尋找電影的相關信息,對電影信息進行抽取從而提取用戶興趣特征。
電影的上映與下架存在周期性,圍繞電影而展開的話題討論也存在一定的動態(tài)性。本文將所收集到的博文以月為單位進行劃分,從2019 年4 月11 日至2019 年9 月11 日劃分為5 個集合,從每個集合內(nèi)分別選取1 部電影,共選取5 部。先利用公式(2)計算月度內(nèi)博文的熱度,隨后選取月度內(nèi)熱度最高的博文中涉及的電影來表示該月度的群體興趣。在選取相關電影后,從豆瓣電影上找到電影的類型、導演與演員信息來表示電影的特征(導演僅選取1位,演員僅選取排名前三的主要演員)。選取的5部電影信息如表4 所示。
在得到表4 中的群體電影信息后,先統(tǒng)計電影類型及導演、演員的出現(xiàn)頻次,得到電影類型及電影人物強度,隨后利用公式(3)得到調(diào)整后的興趣強度。對于Tmin與Tmax的取值,本文從表1 的數(shù)據(jù)中找出10 部用戶討論較多的電影,統(tǒng)計相關博文的發(fā)布時間,如表5 所示,參考10 部電影的時間跨度,Tmin取值 35,Tmax取值 234 (若t<Tmin,則認為興趣不會衰減)。
表4 興趣群體-電影相關信息
表5 電影討論時間跨度
具體地,以類型-劇情為例,調(diào)整前其強度為3,分別取自其在8—9、7—8、5—6 這3 個月度內(nèi)的出現(xiàn)頻次1;以公式(3)對其進行調(diào)整,則8—9、7—8、5—6 這3 個月度的出現(xiàn)頻次分別調(diào)整為1、1×0.882、1×0.652,調(diào)整后的強度為(劇情, 2.534),群體興趣如表6 所示。
表6 群體-興趣模型
用戶影響力大小對影響力傳播的范圍、強度具有較大影響。本文選取表3 中影響力最大的20 名用戶作為核心用戶來進行基于影響力傳播的資源評分,從其近期發(fā)布的博文中挖掘興趣特征。選取20名用戶最近發(fā)布的博文中涉及的5 部電影來表示用戶興趣,共選取100 部電影,相關信息如表7 所示。
在得到表7 中的核心用戶電影信息后,統(tǒng)計電影類型及導演、演員的出現(xiàn)頻次,即可得到核心用戶的興趣模型,如表8 所示。
表7 核心用戶-電影相關信息
表8 核心用戶-興趣模型
構建興趣模型后,從豆瓣電影上采集30 部近期熱度最高的電影作為推薦的資源集來描述本文的群推薦過程。從豆瓣電影上采集的電影為數(shù)據(jù)采集時間段內(nèi)國內(nèi)熱度較高的電影集合,與該超話群體內(nèi)用戶討論的電影具有一定的重合度,且同時包含群體用戶較為關注及不太關注的電影,在熱度接近的情況下,將該資源集作為推薦的測試集可以在盡可能地避免熱度影響的情況下衡量是否能為群體用戶推薦到其感興趣的資源,從而對推薦的效果進行準確評估。資源推薦集如表9 所示。
表9 資源推薦集相關信息
用公式(4)來對推薦集進行評分,如電影《續(xù)命之徒:絕命毒師電影》,其類型得分為劇情-2.534、驚悚-0、犯罪-0,人物得分為0,則該電影的評分為(2.534+0+0)×1/3+0。為了便于后續(xù)整合,對所有評分進行了歸一化處理,映射到[0,1]。30 部電影基于群體興趣的評分結果如表10 所示。
表10 基于群體興趣的資源得分
基于公式(5)與公式(6)計算每位核心用戶對推薦資源集的評分。如電影《續(xù)命之徒:絕命毒師電影》,用戶“花心彌漫”關于其類型得分為劇情-3、驚悚-0、犯罪-1,人物得分為0,則用戶“花心彌漫”對該電影的評分為(3-1+0+1-1)×1/3+0。為了便于后續(xù)整合,對所有評分進行了歸一化處理,映射到[0,1]。取興趣閾值K′=3,將核心用戶評分之和作為30部電影基于影響力傳播的評分,結果如表11所示。
表11 基于影響力傳播的資源得分
在進行評分整合前,需確定α的取值。以群體內(nèi)每個月度中熱度最高的博文涉及的電影類型來表示群體當月興趣,考慮到興趣衰減的程度,將當月興趣與前兩個月的興趣進行對比來衡量興趣變化程度。若當月所提及電影類型涉及的n個類型詞都在前兩個月出現(xiàn)過,則興趣變化程度為0;若有m個詞沒在前兩個月出現(xiàn)過,則興趣變化程度為m/n。分別比較 4—5、5—6、6—7、7—8、8—9 共 5 個月度的興趣變化程度,結果如表12 所示。
表12 群體興趣變化程度
如表12 所示,4—9 月內(nèi),該群體興趣變化程度的均值為0.500,因此,本文取α=0.500 來對資源推薦集的得分進行整合,整合后的結果如表13 所示。
表13 整合后的資源得分
在得到基于群體興趣、影響力傳播,以及整合群體興趣與影響力傳播這3 種資源評分后,按得分高低即可進行資源推薦。因本文在選擇測試集時,已對資源熱度進行控制,確保其熱度較為一致以避免影響推薦結果,故在評估推薦效果時可主要以推薦結果與群體興趣的一致程度來衡量。本文采用準確率來進行推薦效果評價,即
其中,A為準確率;TP 為群推薦列表和測試集的資源重合數(shù);L為推薦列表的長度。考慮到博文在微博中的擴散時間,本文依據(jù)2019 年8 月12 日—2019年10 月11 日提及電影的博文熱度來確定群推薦列表的順序,采用公式(2)計算博文的熱度,用與電影相關的博文中熱度最高的博文所對應的熱度來表示電影熱度,按熱度從大到小排序得到群推薦列表,如表14 所示。
表14 群推薦列表
考慮到推薦資源的總長度,分別比較推薦列表長度為總長度10%、20%、30%時的準確率,即比較長度為3、6、9 時3 種推薦方法的準確率,結果如表15 所示。
表15 準確率評估結果
從評估結果可以看出,當推薦的資源數(shù)較少時,整合群體興趣與影響力傳播的推薦方法具有最好的推薦效果;隨著推薦資源數(shù)量的提升,基于群體興趣的推薦效果會得到一定提升;基于影響力傳播的推薦效果一般,且受推薦資源數(shù)量的影響較低;但當推薦的資源數(shù)限定在一定范圍時,影響力傳播就能發(fā)揮較大作用,優(yōu)化了基于群體興趣的推薦結果。此外,通過對比表13、表10、表11 中的資源得分可以發(fā)現(xiàn),綜合社會選擇與社會影響因素得到的推薦結果相較于僅考慮單一因素具有更好的可解釋性。例如,整合群體興趣與影響力傳播后,排名第一的電影為《大偵探皮卡丘》,其在基于群體興趣與影響力傳播的評分中都有較好的評價,即其較為貼合群體的興趣偏好,且影響力較大的用戶也有較大可能發(fā)布與其相關的博文;排名第四的電影《銀河補習班》雖然在影響力傳播上具有較高的得分,但因其與群體興趣的匹配程度較低,故其影響力傳播造成的范圍與程度應適當降低,所以其整合后的推薦排序相較于影響力傳播排序有一些下降;排名第二的電影《X 戰(zhàn)警:黑鳳凰》在群體興趣上的得分僅為0.035,但其在影響力傳播上具有最高的得分,通過興趣的傳播,即使與群體興趣匹配程度較低的資源也有可能得到廣泛的關注;此外,《獅子王》等在影響力傳播上得分為0 的電影經(jīng)過整合后,也可能在推薦列表中排序靠前,這可能是由于除核心用戶外,也有部分其他用戶會基于興趣而發(fā)布博文,若資源與群體興趣的匹配程度較高,則其可能通過核心用戶之外的其他用戶得到傳播。
本文提出了一種基于影響力傳播的社交網(wǎng)絡群推薦方法,該方法在面向社交網(wǎng)絡群體用戶進行推薦時,分別從核心用戶對用戶群體的影響力以及用戶群體的整體興趣出發(fā),結合了社會影響及社會選擇作用對社交網(wǎng)絡群體用戶興趣的影響,進行群推薦服務。通過微博“超話”數(shù)據(jù)開展了實證研究,結果證實,本文方法具有較好的推薦效果與可解釋性。
群推薦服務是面向社交網(wǎng)絡平臺的極具研究價值的服務類型之一,其推薦方法及推薦效果仍具有較大的提升空間。本文提出的方法雖然綜合考慮了社會影響及社會選擇作用對社交網(wǎng)絡平臺上群推薦服務的影響,但在具體的實施過程中主要是從具有較大影響力的核心用戶出發(fā)來對群體興趣進行預測,對于非核心用戶的作用考慮不夠充分,在未來的研究中可對用戶群體交互過程進行更為系統(tǒng)的分析來改進推薦思路。