劉 宇 吳 斌 曾雪琳 張云雷 王 柏
?
一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
劉 宇*吳 斌 曾雪琳 張云雷 王 柏
(北京郵電大學(xué)智能通信軟件與多媒體北京市重點實驗室 北京 100876)
面向用戶群組的推薦主要面臨如何有意義地對群組進行定義并識別,以及向群組內(nèi)用戶進行有效推薦兩大問題。該文針對已有研究在用戶群組定義解釋性不強等存在的問題,提出一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架。該框架利用社交網(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)重疊網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)作為用戶群組,具有較強的可解釋性,并根據(jù)用戶與群組間的隸屬度制定了考慮用戶對群組貢獻與用戶從群組獲利的4種聚合與分配策略,以完成組推薦任務(wù)。通過在公開數(shù)據(jù)集上與已有方法的對比實驗,驗證了該框架在組推薦方面的有效性和準(zhǔn)確性。
社交網(wǎng)絡(luò);組推薦;重疊網(wǎng)絡(luò)社區(qū);非負(fù)矩陣分解
1 引言
隨著Web 2.0技術(shù)的快速發(fā)展,用戶接入互聯(lián)網(wǎng)后更傾向于在諸如Epinions, Ciao,豆瓣,大眾點評等針對商品、服務(wù)的在線評價網(wǎng)站尋求購買意見和建議,以幫助他們選擇適合的商品、服務(wù)等項目(如電影、音樂、餐廳等,下文的“項目”均指商品或服務(wù))。根據(jù)用戶以往對項目的評分和評價信息,針對個人的個性化推薦系統(tǒng)能夠為用戶提供他們所感興趣的項目。在現(xiàn)實世界中,個人因不同原因聚集而形成群組。盡管有大量面向個人的個性化推薦研究,但針對群體進行推薦的研究還較少。此外,針對用戶群組的組推薦也有其實際意義[1]。根據(jù)研究[2,3],組推薦主要面臨兩大問題:(1)如何定義“群組”的概念并確定群組;(2)如何根據(jù)每個用戶的個人偏好進行適當(dāng)?shù)木酆隙瓿上蛴脩羧航M推薦。
第1個問題可理解為對用戶的“分組策略”,現(xiàn)有方案大致可分為3種:(1)根據(jù)用戶的角色身份,形成固定用戶群組[2,4,5],如朋友、家人等,或組成臨時用戶群組[6,7],如在同一固定時間正在健身房運動的顧客等。(2)隨機形成的用戶群組[8,9],如收聽音樂直播的人,成員可隨意加入或退出群組。(3)根據(jù)一定規(guī)則確立的群組[10,11],如根據(jù)用戶對項目喜好形成的興趣群組。確定群組方法的不同,影響著對用戶組進行推薦的有效程度。當(dāng)前研究中的大多數(shù)分組策略,都或多或少存在著可解釋性差的問題。
第2個問題可理解為對群組內(nèi)用戶進行“推薦決策”?;谟脩羝?,即用戶對項目的評分,針對個人的個性化推薦方法有基于內(nèi)容的[12],基于協(xié)同過濾的[13,14],以及利用社交信息改進推薦效果的[15,16]等。而在組推薦中,同一群組中不同用戶對同一項目可能有不同的偏好[2]。因此,需要通過一種映射方法,將多個用戶的偏好信息映射為用戶群組偏好,即制定對群組內(nèi)用戶偏好的“聚合策略”。常用的聚合策略有平均策略、隨機策略、最小痛苦策略等[11]。此外,如前所述,不同的分組策略也會導(dǎo)致不同的聚合策略。
針對群組推薦中這兩個問題,本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架。框架將利用社交網(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)的重疊網(wǎng)絡(luò)社區(qū)確認(rèn)為用戶群組,并根據(jù)每個用戶在不同社區(qū)中的貢獻與獲利程度提出4種策略,最后由聚合策略和分配策略給出面向群組的推薦結(jié)果。
當(dāng)前,互聯(lián)網(wǎng)中很多在線評價網(wǎng)站都允許用戶間建立關(guān)系,如“關(guān)注”或“信任”?;谟脩絷P(guān)系,一些針對個人的個性化推薦系統(tǒng)利用社交信息達(dá)到較好的推薦效果[15,16]。根據(jù)用戶關(guān)系網(wǎng)絡(luò),連接緊密的用戶自然而然地聚集在一起形成用戶組,不同用戶組間連接稀疏,從而形成社區(qū)結(jié)構(gòu)[17]。這種由社交網(wǎng)絡(luò)關(guān)系形成的社區(qū)結(jié)構(gòu),是一種天然的分組方式,具有很好的可解釋性。因此,本文提出的采用社交網(wǎng)絡(luò)結(jié)構(gòu)信息發(fā)現(xiàn)的重疊網(wǎng)絡(luò)社區(qū)確認(rèn)為用戶群組的方法,具備較好的可解釋性;結(jié)合重疊分組的特性,可以為組推薦提供多種具有合理解釋的聚合及分配策略。實驗表明,本文提出的框架在用戶關(guān)系信息稠密的情況下,能達(dá)到更好的組推薦效果。本文第2節(jié)對組推薦問題進行定義;第3節(jié)提出一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架;第4節(jié)利用公開數(shù)據(jù)集進行了實驗并對實驗結(jié)果進行分析和討論;第5節(jié)進行總結(jié)和工作展望。
2 組推薦問題定義
在組推薦中,推薦系統(tǒng)需要完成兩方面的任務(wù),即有意義地完成用戶分組并向不同用戶群組有效地推薦項目。以往的組推薦研究僅利用了用戶對項目的評分去完成這兩個任務(wù)。值得注意的是,眾多在線評價網(wǎng)站引入了社交網(wǎng)絡(luò)模塊,允許用戶間建立關(guān)系。根據(jù)網(wǎng)絡(luò)社區(qū)理論[17],網(wǎng)絡(luò)社區(qū)是用戶在社交網(wǎng)絡(luò)中天然形成的群組,其中也蘊含著用戶與用戶間、用戶與社區(qū)間、社區(qū)與社區(qū)間的深層次互聯(lián)關(guān)系。
因此,在基于社交網(wǎng)絡(luò)的組推薦中,可利用的信息有用戶對項目的評分和用戶社交關(guān)系網(wǎng)絡(luò)。以和表示用戶數(shù)和項目數(shù)。用戶對項目的評分通常以評分矩陣表示,其中是用戶對項目的評分,表示缺失數(shù)據(jù)。用戶間關(guān)系網(wǎng)絡(luò)通常以鄰接矩陣表示,其中代表用戶和的關(guān)系。若用戶和是朋友關(guān)系,定義,否則。為簡化問題,本文僅考慮了對稱的用戶關(guān)系網(wǎng)絡(luò)。圖1展示了一個本文所研究的基于社交網(wǎng)絡(luò)的組推薦示例的用戶關(guān)系網(wǎng)絡(luò),其具有5個用戶;表1是其關(guān)系網(wǎng)絡(luò)的鄰接矩陣,表2是他們對5個項目的評分。這5個用戶形成2個重疊分組,分別是{用戶1,用戶2,用戶3}和{用戶2,用戶4,用戶5},用戶2同時歸屬于兩個社區(qū)分組。
圖1 基于社交網(wǎng)絡(luò)的組推薦示例的用戶關(guān)系網(wǎng)絡(luò)
表1圖1中用戶關(guān)系網(wǎng)絡(luò)的鄰接矩陣
表2圖1中用戶對項目的評分矩陣(采用了5分制)
3 基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
針對上一節(jié)提出的組推薦問題,本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架,包含以下3個部分:基于對評分矩陣分解的用戶偏好獲取,基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組,以及基于社區(qū)結(jié)構(gòu)的聚合和分配策略。其中前兩個部分均采用了非負(fù)矩陣分解作為基本方法,以將兩部分進行整合。
3.1基于對評分矩陣分解的用戶偏好獲取
用戶偏好直接體現(xiàn)在用戶對項目的評分上。但在真實數(shù)據(jù)中,評分矩陣存在大量的“零值”,即缺失了大量的評分?jǐn)?shù)據(jù),具有很高的稀疏性[18]。因此,采用評分矩陣作為用戶偏好的推薦結(jié)果效果并不好[10]。流行的推薦系統(tǒng)通常采用低秩矩陣分解(low- rank matrix factorization)將評分矩陣分解為兩個低秩矩陣和,通過這兩個矩陣的乘積作為評分矩陣的近似,以對缺失值進行估計[19]。
(2)
表3基于對評分矩陣分解的用戶偏好獲取算法
3.2 基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組
在可通用化的用戶定義分組研究中,文獻[10]采用-means將用戶偏好進行聚類而得到用戶分組;雖然這種分組可解釋為基于用戶興趣的社團,但具有一定的模糊性。文獻[21]采用由用戶相似性生成的網(wǎng)絡(luò)結(jié)構(gòu)發(fā)現(xiàn)興趣群組;但這種方法未考慮社交網(wǎng)絡(luò)中真實存在的用戶關(guān)系網(wǎng)絡(luò),因此其得到的分組意義仍不明確。如前所述,用戶在社交網(wǎng)絡(luò)中通過用戶關(guān)系天然聚集形成社區(qū),即分組。這種社區(qū)結(jié)構(gòu)可以認(rèn)為是一種具有良好解釋意義的分組。因此,本文所研究的基于社交網(wǎng)絡(luò)的組推薦,將社交網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)作為分組策略。
與基于對評分矩陣分解的用戶偏好獲取目的相似,本文采用了非負(fù)矩陣分解來發(fā)現(xiàn)重疊社區(qū)結(jié)構(gòu),這樣,非負(fù)矩陣分解技術(shù)有機地將本文提出的組推薦框架整合起來。這種方法發(fā)現(xiàn)的分組具有重疊結(jié)構(gòu)。即某個用戶可以同時歸屬于多個分組,這也與現(xiàn)實情況相同,即某個用戶擁有多種興趣或?qū)儆诙鄠€真實群體。
研究表明,非負(fù)矩陣分解在重疊社區(qū)發(fā)現(xiàn)任務(wù)上具有很好的準(zhǔn)確性[22]和良好的解釋性[23]。給定用戶關(guān)系鄰接矩陣,通過最小化以下目標(biāo)函數(shù)進行矩陣分解,可以得到一個網(wǎng)絡(luò)劃分(分組)結(jié)果。
(5)
表4基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組算法
3.3基于社區(qū)結(jié)構(gòu)的聚合和分配策略
已有研究中通常僅對用戶偏好進行聚合生成群組推薦結(jié)果,如采用平均策略、隨機策略等[11],如文獻[10]驗證了平均策略在組推薦中的效果?;谄涔ぷ?,本文提出了一些用于組推薦的聚合策略。
一般來說,社交網(wǎng)絡(luò)用戶在群組決策中具有不同的影響力。不僅不同用戶在同一群組中的影響力不同,同一用戶在不同群組中的影響程度也是不同的。并且,在考慮對用戶偏好進行聚合的同時,同樣應(yīng)考慮聚合結(jié)果對用戶選擇的最終影響。例如,一組基于朋友關(guān)系的用戶,經(jīng)討論決定選擇一部電影。其中,有的用戶是大多數(shù)人的朋友,對選擇結(jié)果影響很大,而有的用戶僅是少部分人的朋友,對最終選擇的影響很小。因此,本文提出采用分配策略,對聚合結(jié)果進行再分配,從而達(dá)到更好的組推薦效果。本文所提出的聚合及分配策略,均結(jié)合了重疊網(wǎng)絡(luò)社區(qū)分組信息中每個用戶與社區(qū)分組間的隸屬度。
采用非負(fù)矩陣分解作為用戶分組方法的一個重要原因是,如式(4)所示,矩陣可以表示用戶在重疊分組上的隸屬度:其列向量表示每個用戶對某分組貢獻的程度,行向量表示某個用戶從重疊分組獲利的程度。這種隸屬度可衡量一個用戶在其所屬群組中的“參與強度”(文獻[23]中稱為“participation strength”),可視作用戶對分組的貢獻和從分組的獲利。從重疊分組隸屬度的角度,本文給出了一組聚合與分配策略:
分組平均策略 在聚合時,對分組內(nèi)每個用戶的偏好進行平均;在分配時,將某用戶所屬的重疊群組偏好平均分配給該用戶。這種策略,平均看待每個分組內(nèi)的用戶對群組偏好的貢獻,并將每個用戶所屬的重疊分組的偏好平均地分配給該用戶。
分組貢獻策略 在聚合時,考慮分組內(nèi)每個用戶不同的貢獻程度;在分配時,將某用戶所屬的重疊群組偏好平均分配給該用戶。由于每個用戶屬于每個分組的隸屬度不同,“分組貢獻策略”以其作為權(quán)重,將每個分組內(nèi)的用戶偏好進行加權(quán)平均后作為該分組的群組偏好。
分組獲利策略 在聚合時,對分組內(nèi)每個用戶的偏好進行平均;在分配時,考慮用戶從一個或多個不同分組的獲利程度。與“分組貢獻策略”類似,“分組獲利策略”將每個用戶所屬的重疊分組的偏好進行加權(quán)平均后分配給該用戶。
分組權(quán)重策略 在聚合時,考慮分組內(nèi)每個用戶不同的貢獻程度;在分配時,考慮用戶從一個或多個不同分組的獲利程度。
3.4基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
基于前述3個部分,即基于對評分矩陣分解的用戶偏好獲取,基于重疊網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的用戶分組,以及基于社區(qū)結(jié)構(gòu)的聚合和分配策略,本文提出的基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架可通過表5所示的算法表示,下文以SocoGrec表示該框架。此外,本文所提出的框架也可以整合更多的聚合和分配策略。
表5基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架
4 實驗與結(jié)論
4.1數(shù)據(jù)集
本文選取了可公開獲取的數(shù)據(jù)集FilmTrust和CiaoDVD[24],均含有用戶關(guān)系網(wǎng)絡(luò)和用戶評分?jǐn)?shù)據(jù):
FilmTrust是一個允許用戶對電影進行評分,并可以與其他用戶建立信任關(guān)系的在線網(wǎng)站數(shù)據(jù)。用戶間的信任關(guān)系形成了社會信任網(wǎng)絡(luò),表示了用戶與用戶的關(guān)系。
CiaoDVD。Ciao是一個在線商品評價網(wǎng)站,也引入了社會信任關(guān)系網(wǎng)絡(luò)。其中,CiaoDVD是包含在“DVD”分類下的用戶評分,數(shù)據(jù)集中包含了用戶信任關(guān)系。
為了較為準(zhǔn)確地發(fā)現(xiàn)社區(qū)分組,實驗選取了公開數(shù)據(jù)集的子集。即所用數(shù)據(jù)集的用戶既擁有評分信息,也擁有社交網(wǎng)絡(luò)關(guān)系;沒有任何評分或沒有任何社交關(guān)系的用戶則被排除。數(shù)據(jù)集特征如表6所示。
表6數(shù)據(jù)集特征
4.2對比方法及實驗設(shè)置
LGM方法[10]通過對用戶隱式偏好采用-means方法進行聚類得到隱式分組,并將群組內(nèi)所有用戶偏好進行平均作為群組偏好。其應(yīng)用場景與本文類似,且都利用了用戶對項目的評分矩陣來提取信息,如用戶偏好。因此,實驗中將LGM方法與本文所提框架中的4種策略方法進行比較。
對比實驗采用了5-折交叉驗證方法,被隨機平均分為5份的數(shù)據(jù)中,4份作為訓(xùn)練集,1份作為測試集。由于隱因子數(shù)量一般不會對推薦效果產(chǎn)生較大影響,因此在實驗中,設(shè)置隱因子的數(shù)量為。以最小取1,最大取數(shù)據(jù)集內(nèi)用戶個數(shù),F(xiàn)ilmTrust數(shù)據(jù)集的分組數(shù)量分別設(shè)定為{1, 5, 10, 20, 100, 200, 427}, CiaoDVD數(shù)據(jù)集的分組數(shù)量設(shè)定為{1, 10, 20, 100, 200, 500, 733}。對于SocoGrec,設(shè)定,以保證分組發(fā)現(xiàn)結(jié)果是以最大程度重疊的。簡單起見,防止過擬合的規(guī)則化項參數(shù)和均設(shè)置為0.01。在實驗中,將本文提出的4種策略分別表示為SocoGrec-M, SocoGrec-C, SocoGrec-B和SocoGrec-W。
4.3評價指標(biāo)
本文選取了絕對平均誤差(Mean Absolute Error, MAE)作為評價指標(biāo),其定義如下:
4.4實驗結(jié)果與討論
4.4.1在數(shù)據(jù)集FilmTrust上的對比結(jié)果
在數(shù)據(jù)集FilmTrust上的對比結(jié)果如表7所示。從結(jié)果可以看出SocoGrec所提出的4種策略方法的評價指標(biāo)MAE隨著分組數(shù)量的增加而降低。SocoGrec-B和SocoGrec-W的效果總是比SocoGrec-M和SocoGrec-C要好。SocoGrec-B總是比SocoGrec-C效果好,在一些分組數(shù)量時比SocoGrec-W效果好。也就是說,在采用平均的聚合策略情況下,考慮用戶從一個或多個分組中的獲利程度更能提高推薦預(yù)測的效果;與SocoGrec-B相比,同時考慮了用戶對分組貢獻和從分組獲利的SocoGrec-W效果與其相近,也說明了在數(shù)據(jù)集FilmTrust上,與帶權(quán)重的聚合策略相比,采用帶權(quán)重的分配策略使推薦預(yù)測效果提升更多。對比方法LGM的評價指標(biāo)MAE則隨著分組數(shù)量的增加而上升,直到其效果變得比SocoGrec更差。值得注意的是,當(dāng)分組數(shù)量為1時,LGM僅對數(shù)據(jù)集中所有用戶的偏好進行平均,而SocoGrec仍然考慮了用戶與群組間的貢獻與獲利程度,具有較好的解釋性;盡管此時SocoGrec的評價指標(biāo)并不比LGM好。
表7在數(shù)據(jù)集FilmTrust上組推薦算法的MAE對比
4.4.2在數(shù)據(jù)集CiaoDVD上的對比結(jié)果
在數(shù)據(jù)集CiaoDVD上的對比結(jié)果如表8所示。與在FilmTrust數(shù)據(jù)集上的結(jié)果類似,隨著分組數(shù)量的增加,SocoGrec的預(yù)測效果變好,而LGM的預(yù)測效果則變差。然而與之不同的是,在CiaoDVD數(shù)據(jù)集上,SocoGrec提出的4種策略的MAE指標(biāo)總是優(yōu)于LGM方法;隨著分組數(shù)量的增加,策略SocoGrec-M和SocoGrec-B改善較大,而SocoGrec-C改善較小,SocoGrec-W的效果幾乎不變,而且SocoGrec-C總是優(yōu)于SocoGrec-B。即在CiaoDVD數(shù)據(jù)集上,與帶權(quán)重的分配策略相比,采用帶權(quán)重的聚合策略使推薦預(yù)測效果提升更多。在兩種數(shù)據(jù)集上產(chǎn)生不同效果的原因可能在于,盡管兩個數(shù)據(jù)集的評價稀疏度相近,但用戶關(guān)系網(wǎng)絡(luò)稠密程度相差了一個數(shù)量級(參考表6)。這也說明了用戶關(guān)系網(wǎng)絡(luò)的稠密程度對幾種SocoGrec策略的影響是不同的,關(guān)系網(wǎng)絡(luò)更稠密,本文所提出的組推薦框架能夠獲得更好的效果。
表8在數(shù)據(jù)集CiaoDVD上組推薦算法的MAE對比
4.4.3在數(shù)據(jù)集FilmTrust上重疊分組的影響
值得注意的是,由于分組可以重疊,本文所提出的框架允許分組數(shù)量多于用戶數(shù)量。從圖2中可以看出,在數(shù)據(jù)集FilmTrust上,重疊分組對組推薦影響是較大的。首先,一旦分組數(shù)量增加,對比方法LGM的效果迅速變差;SocoGrec策略則逐漸變好,分組數(shù)量升至約170至190后,其效果比LGM方法好。其次,SocoGrec-M與SocoGrec-C的效果相近,SocoGrec-B與SocoGrec-W效果相近,再次印證了前述對幾種策略效果的討論。最后,基于非負(fù)矩陣分解,本文所提出的框架可以發(fā)現(xiàn)重疊分組,具有一定的現(xiàn)實意義。
圖2 不同社區(qū)分組數(shù)量在數(shù)據(jù)集FilmTrust上的算法的MAE對比
5 結(jié)束語
本文提出了一種基于社交網(wǎng)絡(luò)社區(qū)的組推薦框架??蚣懿捎梅秦?fù)矩陣分解方法將用戶偏好獲取與用戶分組有機地整合起來,并利用用戶-分組隸屬度制定了相應(yīng)的偏好聚合與分配策略。與現(xiàn)有方法的對比實驗展示了該框架的優(yōu)越性和有效性。此外,該框架在獲取用戶偏好、確定分組以及聚合與分配策略方面具有良好的解釋性。并且,該框架可以發(fā)現(xiàn)重疊分組,對分組定義和組推薦都有一定的現(xiàn)實意義。
基于本文的研究,未來可以針對以下幾點進行擴展工作??蓪⒖蚣苓m配到有向網(wǎng)絡(luò)、雙向網(wǎng)絡(luò),使分組策略、聚合與分配策略可利用更豐富的用戶關(guān)系信息,進一步改善組推薦效果。其次,可引入其他聚合與分配策略。另外,本文使用乘法更新來進行非負(fù)矩陣分解,實際實現(xiàn)中包含大量耗時的矩陣乘法運算,因此可以采用其他算法時間復(fù)雜性較低的非負(fù)矩陣分解方法或?qū)⑺惴ú⑿谢蕴岣呖蚣芩惴ㄟ\行效率。
[1] MASTHOFF J. Recommender Systems Handbook[M]. Boston, MA: Springer US, ch. Group Recommender Systems: Combining Individual Models, 2011: 677-702.
[2] JAMESON A and SMYTH B. The Adaptive Web: Methods and Strategies of Web Personalization[M]. Berlin, Heidelberg: Springer Berlin Heidelberg, ch. Recommendation to Groups, 2007: 596-627.
[3] AMER-YAHIA S, ROY S, CHAWLAT A,. Group recommendation: Semantics and efficiency[J]., 2009, 2(1): 754-765. doi: 10.14778/ 1687627.1687713.
[4] O’CONNOR M, COSLEY D, KONSTAN J,. ECSCW 2001: Proceedings of the Seventh European Conference on Computer Supported Cooperative Work 16–20 September 2001[M]. Bonn, Germany. Dordrecht: Springer Netherlands, ch. PolyLens: A Recommender System for Groups of Users, 2001: 199-218.
[5] DE CAMPOS L M, FERNANDEZ-LUNA J M, HUETE J F,. Group recommending: a methodological approach based on bayesian networks[C]. IEEE 23rd International Conference on Data Engineering Workshop, Istanbul, Turkey, 2007: 835-844.
[6] O’HARA K, LIPSON M, JANSEN M,. Jukola: democratic music choice in a public space[C]. Proceedings of the 5th Conference on Designing Interactive Systems: Processes, Practices, Methods, and Techniques, New York, USA, 2004: 145-154.
[7] SPRAGUE D, WU F, and TORY M. Music selection using the partyvote democratic jukebox[C]. Proceedings of the Working Conference on Advanced Visual Interfaces, New York, USA, 2008: 433-436.
[8] CHAO D L, BALTHROP J, and FORREST S. Adaptive radio: achieving consensus using negative preferences[C]. Proceedings of the 2005 International ACM SIGGROUP Conference on Supporting Group Work, New York, USA, 2005: 120-123.
[9] MCCARTHY J F and ANAGNOST T D. Musicfx: An arbiter of group preferences for computer supported collaborative workouts[C]. Proceedings of the 1998 ACM Conference on Computer Supported Cooperative Work, New York, USA, 1998: 363-372.
[10] SHI J, WU B, and LIN X. A latent group model for group recommendation[C]. 2015 IEEE International Conference on Mobile Services, New York, USA, 2015: 233-238.
[11] BALTRUNAS L, MAKCINSKAS T, and RICCI F. Group recommendations with rank aggregation and collaborative filtering[C]. Proceedings of the Fourth ACM Conference on Recommender Systems, New York, USA, 2010: 119-126.
[12] PAZZANI M J and BILLSUS D. The Adaptive Web: Methods and Strategies of Web Personalization[M]. Berlin, Heidelberg: Springer Berlin Heidelberg, ch. Content-Based Recommendation Systems, 2007: 325-341.
[13] SHI Y, LARSON M, and HANJALIC A. Collaborative filtering beyond the user-item matrix: a survey of the state of the art and future challenges[J]., 2014, 47(1): 1-45. doi: 10.1145/2556270.
[14] 王玉斌, 孟祥武, 胡勛. 一種基于信息老化的協(xié)同過濾推薦算法[J]. 電子與信息學(xué)報, 2013, 35(10): 2391-2396. doi: 10.3724 /SP.J.1146.2012.01743.
WANG Y, MENG X, and HU X. Information aging-based collaborative filtering recommendation algorithm[J].&, 2013, 35(10): 2391-2396. doi: 10.3724/SP.J.1146.2012.01743.
[15] 邢星. 社交網(wǎng)絡(luò)個性化推薦方法研究[D]. [博士論文], 大連海事大學(xué), 2013.
XING X. Research on recommendation methods in social networks[D]. [Ph.D. dissertation], Dalian Maritime University, 2013.
[16] 涂丹丹, 舒承椿, 余海燕. 基于聯(lián)合概率矩陣分解的上下文廣告推薦算法[J]. 軟件學(xué)報, 2013, 24(3): 454-464. doi: 10.3724/ SP.J.1001.2013.04238.
TU D, SHU C, and YU H. Using unified probabilistic matrix factorization for contextual advertisement recommendation [J]., 2013, 24(3): 454-464. doi: 10.3724/ SP.J.1001.2013.04238.
[17] GIRVAN M and NEWMAN M E. Community structure in social and biological networks[J]., 2002, 99(12): 7821-7826. doi: 10.1073/ pnas.122653799.
[18] BORATTO L and CARTA S. Using collaborative filtering to overcome the curse of dimensionality when clustering users in a group recommender system[C]. Proceedings of 16th International Conference on Enterprise Information Systems, Lisbon, Portugal, 2014: 564-572.
[19] 方耀寧, 郭云飛, 丁雪濤, 等. 一種基于局部結(jié)構(gòu)的改進奇異值分解推薦算法[J]. 電子與信息學(xué)報, 2013, 35(6): 1284-1289. doi: 10.3724/SP.J.1146.2012.01299.
FANG Y, GUO Y, DING X,An improved singular value decomposition recommender algorithm based on local structures[J].&, 2013, 35(6): 1284-1289. doi: 10.3724/SP.J.1146. 2012.01299.
[20] DING C, LI T, and PENG W,. Orthogonal nonnegative matrix t-factorizations for clustering[C]. Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, NY, USA, 2006: 126-135.
[21] CANTADOR I, and CASTELLS P. Extracting multilayered communities of interest from semantic user profiles: application to group modeling and hybrid recommendations [J]., 2011, 27(4): 1321-1336. doi: 10.1016/j.chb.2010.07.027.
[22] SHI X, LU H, HE Y,Community detection in social network with pairwisely constrained symmetric non-negative matrix factorization[C]. Proceedings of the 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining, Paris, France, 2015: 541-546.
[23] PSORAKIS I, ROBERTS S, EDBEN M,. Overlapping community detection using Bayesian non-negative matrix factorization[J]., 2011, 83(6): 066114. doi: 10.1103/PhysRevE.83.066114.
[24] LibRec. Datasets[OL]. http://www.librec.net/datasets.html, 2016.
A Group Recommendation Framework Based on Social Network Community
LIU Yu WU Bin ZENG Xuelin ZHANG Yunlei WANG Bai
(Beijing Key Laboratory of Intelligence Telecommunication Software and Multimedia, Beijing University of Posts and Telecommunications, Beijing 100876, China)
Group recommendation confronts two major problems,.., unambiguous definition and identification of groups and efficient recommendation to users in groups. To tackle the two problems, a group recommendation framework based on social network community is proposed. The framework takes into account social network structural information to identify overlapping groups, which is well interpreted; and fulfills the task of recommending to groups by performing aggregation and allocation strategies using the membership of users related to groups, which considers how much users contribute to groups and benefit from groups. Experimental results on publicly open datasets demonstrate its efficiency and accuracy on the task of group recommendation.
Social network; Group recommendation; Overlapping network community; Non-negative matrix factorization
TP391; TP393
A
1009-5896(2016)09-2150-08
10.11999/JEIT160544
2016-05-27;
2016-07-18;
2016-08-09
國家重點基礎(chǔ)研究發(fā)展計劃(2013CB329606),北京市共建項目專項
The National Key Basic Research and Department Program of China (2013CB329606), Special Fund for Beijing Common Construction Project
劉宇 liuyu@bupt.edu.cn
劉 宇: 男,1986年生,博士生,研究方向為數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析.
吳 斌: 男,1969年生,教授,博士生導(dǎo)師,研究方向為復(fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘和智能信息處理、大數(shù)據(jù)分析.
曾雪琳: 女,1991年生,碩士生,研究方向為數(shù)據(jù)挖掘、社交網(wǎng)絡(luò)分析、推薦系統(tǒng).
張云雷: 男,1983年生,博士生,研究方向為數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)、社交網(wǎng)絡(luò)分析.
王 柏: 女,1962年生,教授,博士生導(dǎo)師,研究方向為電信系統(tǒng)軟件、分布式計算技術(shù)、數(shù)據(jù)挖掘和智能信息處理.