網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20150302.1106.007.html
融合上下文信息的社會網(wǎng)絡(luò)推薦系統(tǒng)
李慧1,2,馬小平1,胡云2,施珺2
(1.中國礦業(yè)大學(xué) 信電學(xué)院,江蘇 徐州 221008; 2. 淮海工學(xué)院 計算機工程學(xué)院,江蘇 連云港 222005)
摘要:上下文環(huán)境和社會網(wǎng)絡(luò)信息已經(jīng)成為推薦系統(tǒng)所需的重要信息來源,在推薦系統(tǒng)中融入這些信息將進一步改進推薦系統(tǒng)的精度和用戶滿意度。為了提高用戶對推薦系統(tǒng)的滿意度,提出一種融入上下文信息與社交網(wǎng)絡(luò)信息的個性化推薦系統(tǒng)CS。該算法應(yīng)用隨機決策樹劃分原始的用戶-商品評分矩陣來進行上下文信息的處理,使得具有相似上下文信息的評分被分為一組。隨后應(yīng)用矩陣因式分解來預(yù)測用戶對未評分項的預(yù)測。為了整合社交網(wǎng)絡(luò)信息,在考慮上下文信息的環(huán)境下提出了一種融入社會網(wǎng)絡(luò)關(guān)系的增強推薦模型,使用一種基于信任度的皮爾遜相關(guān)系數(shù)來衡量用戶的相似度。在真實的實驗數(shù)據(jù)集上進行驗證,表明CS系統(tǒng)推薦較傳統(tǒng)的基于上下文的和基于社會網(wǎng)絡(luò)的推薦算法在性能上和推薦性能上有了很大的改善。
關(guān)鍵詞:上下文;信息;社會網(wǎng)絡(luò);矩陣因式分解:推薦;協(xié)同過濾
DOI:10.3969/j.issn.1673-4785.201406017
中圖分類號:TP391文獻標志碼:A
收稿日期:2014-06-11. 網(wǎng)絡(luò)出版日期:2015-03-02.
基金項目:國家自然科學(xué)基金資助項目(61403156,61403155);江蘇省高校自然科學(xué)基金資助項目(13KJB520002,14KJB520005).
作者簡介:
中文引用格式:李慧,馬小平,胡云,等. 融合上下文信息的社會網(wǎng)絡(luò)推薦系統(tǒng)[J]. 智能系統(tǒng)學(xué)報, 2015, 10(2): 293-300.
英文引用格式:LI Hui, MA Xiaoping, HU Yun, et al. Social network recommendaton system mixing contex information[J]. CAAI Transactions on Intelligent Systems, 2015, 10(2): 293-300.
Social network recommendaton system mixing contex information
LI Hui1,2, MA Xiaoping1, HU Yun2, SHI Jun2
(1. School of Information & Electrical Engineering, China University of Mining & Technology, Xuzhou 221008, China; 2. Department of Computer Science, Huaihai Institute of Technology, Lianyungang 222005, China)
Abstract:Contexts and social network information is valuable information for building an accurate recommender system. The merging of such information could further improve accuracy of the system and user satisfaction. This paper proposes the context and social (CS) network, which is novel context-aware recommender system incorporating elaborately processed social network information, in order to increase the user satisfaction on the recommendation system. The contextual information happens by applying random decision trees to partition the original user-item-rating matrix such that the ratings with similar contexts are together. The matrix factorization functionality is to predict missing preference of a user for an item using the partitioned matrix. An enhanced recommendation model aided by social relationships considering the context information is proposed. A trust-based Pearson Correlation Coefficient is proposed to measure user similarity. Real datasets based experiments showed that CS enhances its performance compared with traditional recommendation algorithms based on context and social networks.
Keywords:context; information; social network; matrix factorization; recommendation; collaborative filtering
通信作者:李慧. E-mail:shufanzs@126.com.
社交網(wǎng)絡(luò)服務(wù)是 Web 2.0 應(yīng)用中的重要一類。這種系統(tǒng)幫助用戶在互聯(lián)網(wǎng)上與現(xiàn)實中的好友保持聯(lián)絡(luò)、分享內(nèi)容等。然而隨著社交網(wǎng)絡(luò)的使用人數(shù)增加,用戶分享的數(shù)據(jù)也不斷上升,信息過載的問題也隨之出現(xiàn)。另外,社交網(wǎng)絡(luò)第1次提供了豐富的真實世界中人們的社交信息,利用這些信息的研究在各個學(xué)科中也不斷出現(xiàn)。對于推薦系統(tǒng)來說,如何利用社交網(wǎng)絡(luò)所提供的這些信息,進行更精確地推薦,成為一個重要研究方向[1-2]。大部分推薦系統(tǒng)都采用協(xié)同過濾技術(shù),它通過分析用戶對相似項目以往的評分記錄或相似用戶對項目的評分模式來預(yù)測用戶對某未知項目的評分。雖然協(xié)同過濾技術(shù)已成為解決推薦問題的標準方法,但傳統(tǒng)的推薦系統(tǒng)只利用相關(guān)用戶或相關(guān)商品的評分數(shù)據(jù)進行推薦,而并未考慮任何其他的信息。但當(dāng)分析的信息量不斷增大時,傳統(tǒng)的推薦算法就會遇到諸多挑戰(zhàn),如數(shù)據(jù)稀疏問題、低質(zhì)量的推薦以及信息源的不均衡性。
推薦系統(tǒng)通過識別和預(yù)測用戶偏好,提供個性化服務(wù),是緩解“信息過載”問題的重要手段之一。上下文感知計算是指系統(tǒng)能發(fā)現(xiàn)并有效利用上下文信息進行計算的一種計算模式,已經(jīng)廣泛應(yīng)用于許多領(lǐng)域[3-4]。上下文感知推薦系統(tǒng)通過將上下文信息引入推薦系統(tǒng),成為一個剛剛興起的領(lǐng)域,還有許多問題等待解決,如上下文用戶偏好提取、高維數(shù)據(jù)稀疏性問題等[5]。
本文提出了一個新穎的融入上下文信息與社會網(wǎng)絡(luò)信息的推薦系統(tǒng)——CS推薦算法,該系統(tǒng)首先抽取出與用戶興趣相關(guān)的上下文信息,然后應(yīng)用隨機決策樹算法分解用戶—項目評分矩陣,最終生成的用戶—項目評分子矩陣(即決策樹的葉子節(jié)點)包含了相似的評分。在產(chǎn)生的子矩陣中應(yīng)用了矩陣因式分解技術(shù)進行用戶對某一缺失項的評分預(yù)測?;诰仃囈蚴椒纸饽P停疚倪€引進社會規(guī)范術(shù)語來改善推薦系統(tǒng)質(zhì)量。為了衡量用戶之間的相似程序,本文使用了上下文相關(guān)的皮爾遜相關(guān)系數(shù)來計算用戶相似度。最后通過在2個真實的數(shù)據(jù)集上驗證CS推薦系統(tǒng)的有效性。
1相關(guān)工作
目前,社會化推薦算法大都集中在如何利用用戶間的社會關(guān)系來提高推薦的準確率。Yang等在文獻[6]中認為用戶間的信任關(guān)系強度并不是唯一的,而是受到其所處的朋友圈的影響,在不同的朋友圈中,用戶間的信任關(guān)系也是不同的。他們通過給用戶的朋友賦予不同的權(quán)重來對用戶間的信任關(guān)系進行建模,并提出了一種基于朋友圈的社會化推薦算法。Noel等[7]針對社會化推薦算法在計算用戶相似性時沒有考慮到用戶本身的特征、不能直接對用戶間信息傳播建模,不能反映用戶間只有部分興趣相同的問題,給出了一種將多種目標函數(shù)融合在一起的方法,并在矩陣分解的框架下進行求解。
然而,目前大部分社會網(wǎng)絡(luò)推薦模型在度量2個用戶的相似性時,基本都忽視了上下文信息。比如,即使一個用戶和其朋友的品味極其相似,她對一部電影的評價可能還受其他因素影響(比如,她在看電影時候的情緒和陪她看電影的人)。因此近期的研究開始關(guān)注社交網(wǎng)絡(luò)中的上下文信息。文獻[8]提出了將用戶和項目進行群組的方法,在協(xié)同過濾算法中利用了這些子群信息(一種上下文信息)來提高用推薦系統(tǒng)的質(zhì)量。Liu等[9]利用推薦對象的屬性上下文信息來對它們之間的關(guān)聯(lián)關(guān)系進行度量,并通過估計出的關(guān)聯(lián)關(guān)系信息來改善推薦的效果。文獻[10]提出了將社會網(wǎng)絡(luò)上下文信息(個人表現(xiàn)和交際影響)整合到一個矩陣分解模型中。但是,這樣的上下文信息僅僅與社交關(guān)系有關(guān),大量的非社交的上下文信息卻被忽視了。相反,本文提出的CS算法運用機器學(xué)習(xí)技術(shù)和矩陣分解技術(shù),不僅包含了大量的上下文信息,而且對上下文信息沒有限定信息類型:上下文信息被顯式地應(yīng)用到矩陣劃分中?;谛湃味鹊钠栠d相關(guān)系數(shù)提高了計算用戶相似度的準確性。
2CS推薦系統(tǒng)
2.1預(yù)備知識
2.1.1相關(guān)概念
傳統(tǒng)的推薦系統(tǒng)通常只考慮用戶—項目評分矩陣來進行推薦。然而,在許多系統(tǒng)中,可以通過豐富的上下文信息來為推薦系統(tǒng)提供新的信息維度。本文把上下文信息分為2類:1)靜態(tài)上下文,它描述用戶的特性,例如年齡、性別、會員身份、角色等,或者是一種商品、種類、價錢、物理特性等;2)動態(tài)上下文,是一種與等級相關(guān)的即時信息(例如當(dāng)一個用戶評價一個產(chǎn)品時,他的心情和位置信息)。另一方面,在線社交網(wǎng)絡(luò)也帶來一些其他資源,通過分析這些資源一個用戶的喜好可以由與他有相同品味的朋友推斷出。因此,本文試圖系統(tǒng)地融合上下文信息和社交網(wǎng)絡(luò)信息來改善推薦性能。
圖1 用戶—項目評分矩陣分割過程 Fig.1 Illustration for division
在社會網(wǎng)絡(luò)中將用戶信息及用戶之間的關(guān)系可以抽象表示為有向帶權(quán)值的社會網(wǎng)絡(luò)圖的形式: G=(V,E,C) 。其中,V表示節(jié)點集合,每個節(jié)點代表網(wǎng)絡(luò)中的用戶個體; E 表示邊的集合,表示2個個體之間存在的關(guān)系;C={cuv}表示邊的權(quán)重值,此值越大表示信任程度越大,本文將其定義為用戶間的信任度。由于信任關(guān)系不是對稱的,所以圖中的邊是有向的,網(wǎng)絡(luò)圖為有向圖。
2.1.2矩陣因式分解
矩陣因式分解的目的是將一個矩陣分解成2個以上的矩陣,使得將矩陣因子相乘后可以重構(gòu)或者近似原始矩陣。在推薦問題中,一個矩陣因式分解模型是將用戶—項目評分矩陣R,R∈Rm×n(m是用戶數(shù)量,n是項目數(shù)量)分解成一個用戶特征矩陣U,U∈Rm×l和一個項目特征矩陣V,V∈Rl×n。
R≈UTV
(1)
為了計算R,考慮到用戶—項目評分矩陣的稀疏性,定義了以下的目標函數(shù),即使預(yù)測評分與用戶實際評分的誤差最小化:
(2)
式中:Ii,j為一個指示變量,即如果用戶i對商品j進行了打分,則Ii,j為1,否則為0。另外,為了避免過度擬合,在公式中加入了規(guī)范化系數(shù),即
(3)
式3可以通過2種方式解得:1)隨機梯度算法(SGD),通過迭代更新潛在用戶特征因子和潛在項目特征因子;2)交替最小二乘算法(ALS),通過修正矩陣U(或者V)以優(yōu)化V(或者U),并且輪轉(zhuǎn)迭代。
2.2上下文感知的推薦模型
本節(jié)首先介紹一下如何結(jié)合上下文信息來提高推薦系統(tǒng)的推薦準確度,在此暫不考慮社會關(guān)系。為了有效結(jié)合不同的上下文信息,使用一種具有較高學(xué)習(xí)精度的隨機決策樹算法。該算法的目標是對原始即用戶—項目評分矩陣R使用隨機劃分策略將相似用戶或相似項目的評分劃分到樹的同一結(jié)點中,即將具有相似上下文的評分劃分在一個組內(nèi)。由于是在相似的上下文中產(chǎn)生,因此在相同組里的評分將會比在原始評分矩陣中的評分具有更高的相關(guān)性,有助于提高推測缺失值的準確性。
對每個決策樹中的每一個結(jié)點,利用式(2)對評分矩陣R進行基本的矩陣因式分解。經(jīng)過分解之后,分別得到用戶潛在特征向量與項目潛在特征向量(如圖1(b))。用戶特征因子表明了用戶在一些潛在主題上的興趣分布,而項目特征因子代表了與這些主題相關(guān)的項目成員。為了劃分評分矩陣R,選擇了一個潛在特征(如圖1(b) U的第2列)和隨機選取了一個分割值(本例中假設(shè)選擇的分割值為0.4)。設(shè)定之后,則當(dāng)前的評分矩陣被劃分為2部分,如圖1(c)所示。在本例中,根據(jù)U中第2個潛在特征向量和隨機選定的分割值,評分矩陣被從第2行和第3行之間分割成了2部分。由于第1個和第2個用戶的潛在特征值比較相似,因此他們給出的評分被決策樹劃分到同一個結(jié)點中。
在為每個上下文信息構(gòu)建決策樹時,在樹的每一層,算法都會從上下文信息集合C中隨機選擇一個上下文信息cr來劃分評分矩陣(見圖2)。具體來說,評分矩陣是根據(jù)cr的值進行劃分的。例如,如果假設(shè)上下文信息cr是一周時間,則評分矩陣可以根據(jù)每一天(即從周一到周六,工作日或者周末)來進行有意義的劃分。另一方面,如果cr的值沒有任何語義信息,則首先要對每一個評分cr進行標準化到某一特定區(qū)間(如[0,1]),然后選擇一個隨機的閾值(如∈[0, 1])來劃分評分。一旦在樹中的某一層上完成了評分劃分,則隨機選取的上下文信息cr就會從上下文信息集合中被刪除:C=C/cr,從而保證了一個上下文信息在一條路徑上只被操作一次。
圖2 隨機決策樹劃分過程 Fig.2 Main partition flow of random decision tree
(4)
(5)
最終,將所有決策樹得到的預(yù)測組合起來就可以得到對Rm的最終預(yù)測得分。
(6)
式中:T為決策樹的數(shù)量。通過組合不同決策樹獲得的多個預(yù)測得分,所有上下文信息被完全整合,產(chǎn)生了個性化和準確的上下文感知推薦系統(tǒng)。此外通過刪除較少聯(lián)系的(考慮到上下文信息)評分,生成的子矩陣比原始的評分矩陣要小很多,這將在很大程度上減少算法的計算復(fù)雜度。影響算法復(fù)雜度的一個重要因素是決策樹的數(shù)量。在后續(xù)的實驗部分驗證了其實只要少部分樹就可以獲得高質(zhì)量的推薦,從而說明了本文所提出方法的實用性。
2.3融合社會網(wǎng)絡(luò)關(guān)系的增強模型
在2.2節(jié)提出的上下文感知推薦模型的基礎(chǔ)上,本節(jié)將社交網(wǎng)絡(luò)信息加入到推薦中以改善推薦質(zhì)量。這種模型的假設(shè)前提與現(xiàn)實非常相符:在現(xiàn)實生活中,當(dāng)用戶在決定是否購買一個產(chǎn)品時往往會參考與自己有相似品味與興趣的朋友所給出的建議。通過結(jié)合多個朋友的意見,用戶最終會做出明智的選擇。
盡管朋友能夠提供有用的信息來幫助推薦系統(tǒng)為用戶做出高質(zhì)量的推薦,但現(xiàn)有的研究大部分都是在利用社會網(wǎng)絡(luò)中所有的可用信息進行推薦,沒有對這些信息進行細致地過濾;或者并沒有深入地調(diào)查怎樣精確計算用戶之間的品味相似性。為了解決這些問題,本文引進一個新的社會規(guī)范化系數(shù)來對用戶和他朋友之間的品味差異進行約束。在真實生活中,一個用戶可能會有成百上千個朋友,因此同等對待朋友(或者朋友所給出的推薦信息)是沒有意義的,因為其中的一些朋友可能與用戶具有非常相似的品味,而與另一些朋友可能擁有完全不同的品味。為了解決這種社會網(wǎng)絡(luò)中品味差異性問題,本文引入了社會規(guī)范化系數(shù),在推薦系統(tǒng)中考慮了用戶與其朋友之間的品味相似性:
(7)
式中:α是控制社會規(guī)范化范圍的常量。S(j,f)表示基于以往評分模式計算出的用戶uj與朋友uf之間的品味相似性。相似性分值較高表明uj和uf有著非常相似的品味,分值越低表明uj和uf有不同品味。
從式(7)中可以看出,融合社交網(wǎng)絡(luò)信息的有效方法是通過研究用戶與朋友之間的相似性來精確衡量每個朋友的觀點,這種相似性可以通過他們以往的評分模式來推測,比如可以從他們共同評價過的商品的特性進行推測。現(xiàn)有許多相似性計算方法,其中皮爾遜相關(guān)系數(shù)已被證明比其他方法(如向量空間相似性)具有更高的精確性。因此本文也使用皮爾遜相關(guān)系數(shù)來衡量uj與其朋友uf的相似性。
(8)
(9)
經(jīng)典的相似性計算方法僅僅利用了評分的值,并未考慮用戶之間的信任關(guān)系。為了進一步改善相似性計算的精確度,本文使用一種基于信任度的皮爾遜相關(guān)系數(shù)來計算用戶之間的相似度:
(10)
(11)
(12)
(13)
式中:γ代表學(xué)習(xí)率。迭代的數(shù)量對推薦效率的影響將在實驗部分進行驗證。
3實驗評估
3.1實驗方法
3.1.1數(shù)據(jù)集
豆瓣網(wǎng)(www.douban.com)是中國最大的社交平臺之一,許多人在這里分享對書、電影、音樂的評價。每個用戶可以對書、電影、音樂進行評級(從一星到五星),表達他們對這些產(chǎn)品的喜好。在社交網(wǎng)絡(luò)中如果某用戶的評論被認為是有趣且有用的,則他就可能被其他用戶所跟隨。表1列出了數(shù)據(jù)集的統(tǒng)計數(shù)據(jù)。
表1 豆辨網(wǎng)的統(tǒng)計數(shù)據(jù)
選擇豆瓣的數(shù)據(jù)因為它不僅包含了相關(guān)的時間/數(shù)據(jù)和其他可推斷的上下文信息,而且還包含了社會網(wǎng)絡(luò)信息,因此非常適合用于評估應(yīng)用了多種類型信息的CS算法的性能。從豆瓣數(shù)據(jù)集中,隨機選擇80%的評價來訓(xùn)練推薦模型,使用剩下的20%比較它們的性能。
3.1.2比較對象
本文將CS推薦系統(tǒng)和目前主流的幾種推薦方法進行了對比實驗:傳統(tǒng)的基于上下文感知推薦系統(tǒng)RPMF[14]、基于社會網(wǎng)絡(luò)的推薦系統(tǒng)SoReg[11]、應(yīng)用基本的矩陣分解模型構(gòu)建的推薦系統(tǒng)BMF[12]。
與所有的上下文推薦系統(tǒng)相似,從數(shù)據(jù)集中可獲得的上下文化信息中選取了5種類型的上下文信息:1)小時信息,即用戶給出評分的時刻;2)日期信息,即用戶給出評分的日期;3)當(dāng)一個評價被給出的時候,對目標商品產(chǎn)生“期待”的數(shù)量;4)當(dāng)目標用戶評價一個特定商品時,其所給出評分的平均值;5)目標商品所屬的類別。
3.1.3 度量標準
實驗選取在推薦系統(tǒng)評價中經(jīng)常使用的2個度量標準來比較不同推薦模型的性能:平均絕對誤差(MAE)和均方根誤差(RMSE)。式(14)和(15)分別給出兩者的定義:
(14)
(15)
3.2實驗結(jié)論
首先使用豆瓣網(wǎng)數(shù)據(jù)集來說明CS算法中不同參數(shù)值的選取對推薦性能的影響。經(jīng)過交叉驗證之后得到規(guī)則化常量λ=0.1。圖3給出了當(dāng)數(shù)據(jù)集的不同子集(如書數(shù)據(jù)、電影數(shù)據(jù)、音樂數(shù)據(jù))被應(yīng)用時,CS推薦模型的性能如何隨著參數(shù)值α的變化而變化,參數(shù)α決定了有多少社會網(wǎng)絡(luò)信息量被整合進CS推薦模型中(見式11)。實驗中設(shè)置在求解矩陣因式分解模型中潛在特征向量的維數(shù)為10,迭代求解次數(shù)為20。后續(xù)實驗會給出這些變量的變化如何影響基于矩陣因式分解的推薦模型的性能。從圖3可以看出隨著α值的增大,MAE和RMSE的值首先減少,接下來當(dāng)?shù)竭_一定閾值時(大約在α=0.1處)其值變得相對穩(wěn)定(只是輕微下降)。因此可能得出社交網(wǎng)絡(luò)信息可以有效改善推薦質(zhì)量的結(jié)論,并且α=0.001是一個合適的閾值來很好地平衡用戶—項目評分矩陣和社交網(wǎng)絡(luò)信息。
(a) MAE實驗結(jié)果
(b) RMSE實驗結(jié)果 圖3 參數(shù)α的影響(λ=0.1,維數(shù)=10,迭代次數(shù)=20) Fig.3 Impact of α(λ=0.1, dimensionality=10,iteration=20)
接下來,驗證上下文信息數(shù)量對推薦性能的影響。這一點可以通過控制決策樹的高度來實現(xiàn)。也就是說,如果設(shè)樹的高度為1,則只有一種類型的上下文信息在樹的劃分時被使用;如果設(shè)樹的高度為4,表示所有的上下文信息都被應(yīng)用到推薦系統(tǒng)中來。圖4給出了不同數(shù)量上下文信息的實驗結(jié)果。
從圖4中可以看出在所有情況下,上下文信息越多則會產(chǎn)生越高的推薦精度,即MAE和RMSE的值越小。實驗結(jié)果表明上下文信息很大程度上改善了推薦系統(tǒng)的性能,另一方面,從實驗結(jié)果中可以看出本文所選取的上下文信息是非常有用的。
(a) MAE實驗結(jié)果
(b) RMSE實驗結(jié)果 圖4 上下文信息數(shù)量的影響(λ=0.1,維數(shù)=10,迭代次數(shù)=20) Fig.4 Impact of number of contextual information(λ=0.1,dimensionality=10,iteration=20)
最后,將CS推薦系統(tǒng)和其他推薦系統(tǒng)的性能在豆瓣網(wǎng)數(shù)據(jù)集上做對比實驗。在做對比實驗之前,需要決定2個重要的參數(shù)的取值,即潛在特征向量的維度和基于矩陣因式分解模型的迭代次數(shù)。首先固定迭代次數(shù)為10,觀察潛在特征向量在不同維度下的MAE取值,如表1所示。發(fā)現(xiàn)隨著維度的增加MAE的值在減少,這意味著隨著維度的增加將會產(chǎn)生更高的推薦。但是當(dāng)維度增加到大約10時,推薦質(zhì)量的改進甚小。因此在實驗中,為推薦算法的潛在特征向量維度設(shè)置為10。同理,本文為所有基于矩陣因式分解模型的迭代次數(shù)設(shè)置為20,因為更多的迭代次數(shù)并沒有降低MAE 的值,反而會產(chǎn)生更高的開銷。
參數(shù)一量確定,下面就分別使用書數(shù)據(jù)、電影數(shù)據(jù)、音樂數(shù)據(jù)和整個豆瓣網(wǎng)數(shù)據(jù)來比較不同推薦模型的推薦性能。表2給出了對比結(jié)果。從圖5可以看出, 本文提出的CS推薦模型所有的實驗數(shù)據(jù)中都比其他推薦模型更加精確。所有基于矩陣因式分解的推薦模型都明顯優(yōu)于傳統(tǒng)的基于項目和基于用戶的協(xié)同過濾算法,這表明了矩陣因式分解技術(shù)在推薦領(lǐng)域的優(yōu)勢。實驗結(jié)果也表明綜合考慮上下文信息和社會網(wǎng)絡(luò)信息比只考慮某一種信息類型的推薦模型(如SoReg 和RPMF)具有更高的推薦質(zhì)量。
表2 向量維度與迭代次數(shù)對推薦質(zhì)量的影響(MAE)
(a) MAE實驗結(jié)果
(b) RMSE實驗結(jié)果 圖5 不同推薦模型的性能比較 Fig.5 Performance comparison for various model
4結(jié)束語
本文提出的CS算法是一個將上下文信息和社交網(wǎng)絡(luò)信息相結(jié)合推薦算法,大大提高了推薦質(zhì)量。該算法首先使用隨機決策樹算法基于不同的上下文信息對原始用戶評分矩陣進行劃分。劃分后生成的子矩陣中包含相似上下文的評分,因此彼此間具有更大的影響。矩陣因式分解技術(shù)被應(yīng)用到子矩陣中用來預(yù)測缺失評分。為了有效聯(lián)合社會網(wǎng)絡(luò)信息,CS算法引進額外的社會規(guī)則術(shù)語通過學(xué)習(xí)他朋友的品味來推斷用戶對一個項目的喜好。為了識別有相似品味的朋友,提出了一個基于上下文信息的皮爾遜系數(shù)來衡量用戶與朋友的相似性。在2個真實數(shù)據(jù)集上進行的驗證,實驗結(jié)果表明CS推薦算法明顯優(yōu)于傳統(tǒng)的基于上下文信息和基于社交網(wǎng)絡(luò)的推薦模型。
參考文獻:
[1]ZHAO Du, FU Xiaolong. Scalable and explainable friend recommendation in campus social network system[J]. Frontier and Future Development of Information Technology in Medicine and Education, 2014, 269(1): 457-466.
[2]CHEN Cheng, MAO Chengjie, TANG Yong. Personalized recommendation based on implicit social network of researchers[J]. Pervasive Computing and the Networked World, 2013, 7719(10): 97-107.
[3]ZHONG Erheng, FAN Wei, YANG Qiang. Contextual collaborative filtering via hierarchical matrix factorization[C]//Proceedings of the Siam Internatiohnal Conference on Data Mining. Texas, USA , 2012: 744-755.
[4]RENDLE S, GANTNER Z, FREUDENTHALER C. Fast context-aware recommendations with factorization machines[C]//Proceedings of the 34th International ACM SIGIR Conference. Beijing, China, 2011: 230-241.
[5]BALTRUNAS L, LUDWIG B, RICCI F. Matrix factorization techniques for context aware recommendation[C]//Proceedings of the Fifth ACM Conference on Recommender Systems. Chicago, USA, 2011: 301-304.
[6]YANG Xiwang, STECK H, LIU Yong. Circle-based recommendation in online social networks[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Beijing, China, 2012: 1267-1275.
[7]NOEL J, SANNER S, TRAN K. New objective functions for social collaborative filtering[C]//Proceedings of the 21th International Conference on World Wide Web. Lyon, France, 2012: 859-868.
[8]XU Bin, BU Jiajun, CHEN Chun. An exploration of improving collaborative recommender systems via user-item subgroups[C]//Proceedings of the 21st International Conference on World Wide Web. Lyon, France, 2012: 21-31.
[9]LIU Qiang, WANG Chengwei, XU Congfu. A modified PMF model incorporating implicit item associations[C]//Proceedings of the International Conference on Tools with Artificial Intelligence. Athens, Greece, 2012: 7-9.
[10]JIANG Ming, CUI Peng, LIU Rui. Social contextual recommendation[C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management. Maui, USA, 2012: 566-578.
[11]MA Hao, ZHOU Dengyong, LIU Chao. Recommender systems with social regularization[C]//Proceedings of the Fourth ACM International Conference on Web Search And Data Mining. Hong Kong, China, 2011: 287-296.
[12]MA Hao, YANG Haixuan, LYU M R. Sorec: social recommendation using probabilistic matrix factorization[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management. [S.l.], USA, 2008: 931-940.
李慧,女,1979年生,講師,博士研究生,主要研究方向為智能信息處理、社會網(wǎng)絡(luò)分析、計算機技術(shù)及應(yīng)用。主持并完成江蘇省自然科學(xué)基金1項,參與國家自然科學(xué)基金2項,出版專著1部,發(fā)表學(xué)術(shù)論文20余篇。
馬小平,男,1961年生,教授,博士,主要研究方向為控制理論及應(yīng)用、計算機技術(shù)及應(yīng)用。主持并完成多項科研項目,其中國家“863”項目1項、國家自然科學(xué)基金項目2項、江蘇省自然科學(xué)基金項目3項、江蘇省高?;A(chǔ)研究項目2項、大型企業(yè)橫向科研項目20余項。
胡云,女,1978年生,副教授,主要研究方向為復(fù)雜網(wǎng)絡(luò)分析理論及應(yīng)用、數(shù)據(jù)挖掘、多Agent系統(tǒng)。主持并完成科研項目多項,其中國家自然科學(xué)基金項目1項,江蘇省自然科學(xué)基金項目1項,參與出版專著1部,發(fā)表學(xué)術(shù)論文10余篇。
2015中國計算機視覺大會(CCF CCCV)
CCF Chinese Conference on Computer Vision 2015
中國計算機視覺大會(CCF Chinese Conference on Computer Vision,CCF CCCV)是由中國計算機學(xué)會(CCF)主辦,CCF計算機視覺專業(yè)委員會協(xié)辦的計算機視覺領(lǐng)域盛會。該系列會議每2年舉行一次,是國內(nèi)計算機視覺領(lǐng)域最主要的學(xué)術(shù)活動,旨在為從事計算機視覺領(lǐng)域的學(xué)生、老師和工業(yè)界研究人員提供一個學(xué)科互動交流平臺,促進領(lǐng)域內(nèi)的學(xué)術(shù)交流以及學(xué)術(shù)界與工業(yè)界之間的交流,提高國內(nèi)視覺領(lǐng)域的研究水平。大會將邀請多位知名專家學(xué)者做主題報告,分享計算機視覺領(lǐng)域最新最熱的理論和方法,使與會者接觸到學(xué)科最前沿的研究工作和團隊,使得研究人員分享計算機視覺領(lǐng)域的研究成果、創(chuàng)新思想、最新研究進展。
2015年中國計算機學(xué)會中國計算機視覺大會(CCCV2015)將于2015年9月18~20日在陜西省西安市舉行,由西安電子科技大學(xué)計算機學(xué)院、電子工程學(xué)院和綜合業(yè)務(wù)網(wǎng)理論及關(guān)鍵技術(shù)國家重點實驗室聯(lián)合承辦。本次會議將匯聚從事計算機視覺理論與應(yīng)用研究的人員,廣泛開展學(xué)術(shù)交流,研討發(fā)展戰(zhàn)略,共同促進計算機視覺相關(guān)理論、技術(shù)及應(yīng)用的發(fā)展。
組織機構(gòu)
指導(dǎo)委員會
譚鐵牛 中科院自動化所查紅彬 北京大學(xué)
陳熙霖 中科院計算所賴劍煌 中山大學(xué)
王濤 愛奇藝公司王亮 中科院自動化所
大會主席
譚鐵牛 中科院自動化所高新波 西安電子科技大學(xué)
程序委員會主席
查紅彬 北京大學(xué)陳熙霖 中科院計算所
王亮 中科院自動化所苗啟廣 西安電子科技大學(xué)計算機學(xué)院