胡 云,李 慧,施 珺
(1.南京中醫(yī)藥大學(xué) 信息技術(shù)學(xué)院,南京 210023; 2.淮海工學(xué)院 計(jì)算機(jī)工程學(xué)院,江蘇 連云港 222001) (*通信作者電子郵箱shufamnzs@126.com)
結(jié)合評(píng)分和信任關(guān)系的社會(huì)化推薦算法
胡 云1,李 慧2*,施 珺2
(1.南京中醫(yī)藥大學(xué) 信息技術(shù)學(xué)院,南京 210023; 2.淮海工學(xué)院 計(jì)算機(jī)工程學(xué)院,江蘇 連云港 222001) (*通信作者電子郵箱shufamnzs@126.com)
針對(duì)推薦系統(tǒng)中普遍存在的數(shù)據(jù)稀疏和冷啟動(dòng)等問(wèn)題,提出一種綜合評(píng)分和信任關(guān)系的社會(huì)化推薦算法。首先對(duì)網(wǎng)絡(luò)中新用戶的初始信任值進(jìn)行合理賦值,有效地解決了新用戶的信任冷啟動(dòng)問(wèn)題。鑒于用戶的喜好會(huì)受其朋友的影響,推薦模型又利用朋友之間的信任矩陣對(duì)用戶自身的特征向量進(jìn)行修正,解決了用戶特征向量的精準(zhǔn)構(gòu)建及信任傳遞問(wèn)題。實(shí)驗(yàn)結(jié)果表明,所提算法較傳統(tǒng)的社會(huì)網(wǎng)絡(luò)推薦算法在性能上有顯著提高。
信任;推薦;傳遞;模型;矩陣分解
近年來(lái),隨著諸如Twitter、Facebook等社交媒體的興起,現(xiàn)實(shí)世界中人與人之間構(gòu)建起來(lái)的社交關(guān)系已經(jīng)慢慢遷移到了這些社交網(wǎng)站中。與現(xiàn)實(shí)生活相似,社會(huì)網(wǎng)絡(luò)中自己所信任的朋友推薦的物品更容易被人們所采納,這是因?yàn)橄嗷バ湃蔚呐笥阎g具有相似的興趣愛(ài)好?;谛湃侮P(guān)系進(jìn)行社會(huì)網(wǎng)絡(luò)推薦,可以有效解決傳統(tǒng)推薦系統(tǒng)中的數(shù)據(jù)稀疏問(wèn)題與用戶冷啟動(dòng)問(wèn)題等問(wèn)題,從而提高社會(huì)網(wǎng)絡(luò)推薦的精準(zhǔn)度。
目前,以信任關(guān)系為基礎(chǔ)來(lái)進(jìn)行社會(huì)網(wǎng)絡(luò)推薦的算法有很多,但多數(shù)側(cè)重于研究如何進(jìn)行準(zhǔn)確的信任度計(jì)算和信任模型的推理,如通過(guò)多種相似度度量方法的線性組合對(duì)用戶進(jìn)行推薦預(yù)測(cè)[1],通過(guò)對(duì)用戶信任關(guān)系矩陣和原始評(píng)分矩陣的概率分解提出基于受限關(guān)系和概率分解矩陣的推薦方法[2],在用戶興趣關(guān)系建模過(guò)程中通過(guò)進(jìn)一步識(shí)別出與目標(biāo)用戶存在共同愛(ài)好的朋友來(lái)優(yōu)化信任度求解的過(guò)程[3-4]、通過(guò)將多種目標(biāo)函數(shù)進(jìn)行整合,并在矩陣分解的框架下進(jìn)行求解[5-6]。
現(xiàn)有的信任網(wǎng)絡(luò)推薦技術(shù)多數(shù)是利用用戶間的社會(huì)信任關(guān)系進(jìn)行推薦,而忽略了社會(huì)網(wǎng)絡(luò)中的新用戶。由于新用戶缺乏歷史評(píng)分信息,因此無(wú)法為新用戶提供有效準(zhǔn)確的信息推薦。為了解決新用戶信任度計(jì)算問(wèn)題[7-10],本文首先提出一種面向新用戶的信任度計(jì)算方法,解決了信任網(wǎng)絡(luò)中的用戶信任傳遞問(wèn)題;隨后通過(guò)結(jié)合用戶評(píng)價(jià)與社會(huì)化網(wǎng)絡(luò)兩項(xiàng)要素,構(gòu)建一種全新的以信任關(guān)系為基礎(chǔ)的社會(huì)網(wǎng)絡(luò)推薦(Trust-based Social Recommendation, TSR)方法。該方法利用朋友的信任矩陣對(duì)用戶自身的特征向量進(jìn)行修正,解決了用戶特征向量的精準(zhǔn)構(gòu)建及信任傳遞問(wèn)題。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的協(xié)同推薦算法相比,本文提出的新型算法性能得到顯著提升,尤其在用戶評(píng)分不足甚至是缺乏評(píng)分的條件下,該算法仍然能取得較高的推薦性能。
1.1 信任網(wǎng)絡(luò)的形式化定義
定義1 信任網(wǎng)絡(luò)。由代表用戶的節(jié)點(diǎn)和節(jié)點(diǎn)之間的信任關(guān)系構(gòu)成的一個(gè)有向帶權(quán)圖G來(lái)形式化表示,記為G=(V,E,B)。其中:信任網(wǎng)絡(luò)的頂點(diǎn)集合用V代表,頂點(diǎn)之間的邊集合用E代表,節(jié)點(diǎn)之間的信任度集合用B代表。
在社會(huì)網(wǎng)絡(luò)這一環(huán)境下,信任網(wǎng)絡(luò)通常由用戶間復(fù)雜的信任關(guān)系構(gòu)成。信任度是信任網(wǎng)絡(luò)中的重要概念,合理和高效的信任度計(jì)算是建立準(zhǔn)確的信任網(wǎng)絡(luò)的前提條件,下面給出信任度的定義:
定義2 信任度。在信任網(wǎng)絡(luò)G這一環(huán)境里,節(jié)點(diǎn)i對(duì)節(jié)點(diǎn)j的信任程度的量化構(gòu)成了信任度,用符號(hào)B(i,j)表示。bi, j∈[0,1]表示用戶之間信任關(guān)系的強(qiáng)度:1表示完全信任,0表示完全不信任。
社會(huì)網(wǎng)絡(luò)環(huán)境中,用戶所信賴的朋友為其推薦的產(chǎn)品總是更容易被用戶所接受,并且用戶之間的信任關(guān)系越強(qiáng),受其朋友影響的可能性就越大。本文把這種方法稱為基于信任關(guān)系的社會(huì)化推薦,它實(shí)質(zhì)上是一種利用用戶之間信任關(guān)系而進(jìn)行推薦的方法。
定義3 基于信任關(guān)系的推薦。設(shè)用戶ui對(duì)uj的信任度用bij表示,且對(duì)商品vk評(píng)分為rik的概率表示為yui,uj,vk:=η(UiTQj,UiTVk),其中Ui、Vk、Qj分別表示用戶特征向量、商品特征向量和信任特征向量。用戶特征向量與信任特征向量的內(nèi)積UiTQj可以求得用戶信任權(quán)重,另外可以根據(jù)用戶特征向量與商品特征向量的內(nèi)積UiTVk從而求出用戶-項(xiàng)目評(píng)分rik;用戶信任關(guān)系矩陣和用戶商品矩陣的聯(lián)合函數(shù)用η(·)表示,則基于信任關(guān)系的推薦問(wèn)題可描述為用戶商品矩陣中的Top-N問(wèn)題:
(1)
1.2 信任關(guān)系的建模方法
本文通過(guò)概率矩陣分解(ProbabilisticMatrixFactorization,PMF)方法[11]對(duì)信任關(guān)系中的用戶特征進(jìn)行提煉,并在此基礎(chǔ)上對(duì)信任關(guān)系進(jìn)行建模。通過(guò)對(duì)信任關(guān)系應(yīng)用矩陣分解,求解出能夠表示用戶之間信任關(guān)系的主要因素,即生成一個(gè)低維的用戶潛在特征向量。
假設(shè)G=(V,E,B)表示信任關(guān)系網(wǎng)絡(luò),B={bij}表示用戶間信任關(guān)系矩陣(m×m)。U∈Rl×m表示應(yīng)用矩陣分解推導(dǎo)出來(lái)的用戶特征矩陣,與其對(duì)應(yīng)的潛在特征向量用列向量Ui來(lái)表示。由于PMF假設(shè)可觀測(cè)信任值是由概率線性模型UiUk和高斯觀測(cè)噪聲組成的,因此信任關(guān)系矩陣C的條件概率分布定義如下:
(2)
(3)
式(3)經(jīng)過(guò)貝葉斯推斷,可以得到:
(4)
式(4)給出的方法中,只通過(guò)用戶間的信任關(guān)系來(lái)估計(jì)用戶的特征。文獻(xiàn)[12]中提出了聯(lián)合用戶信任關(guān)系B與用戶-項(xiàng)目評(píng)分矩陣R的概率分解模型,即SocialMF方法,但該方法未全面考慮到不可信節(jié)點(diǎn)會(huì)極大影響推薦準(zhǔn)確性這一實(shí)際問(wèn)題。為了切實(shí)提高推薦系統(tǒng)的精度,必須對(duì)不可信節(jié)點(diǎn)進(jìn)行弱化或者消除,通過(guò)降低其權(quán)重的方面降低其對(duì)推薦系統(tǒng)的影響作用。
本文提出的系統(tǒng)優(yōu)化方法主要有以下工作:對(duì)網(wǎng)絡(luò)中的新用戶進(jìn)行初始信任的賦值,構(gòu)建新用戶的信任推薦模型;然后對(duì)用戶信任關(guān)系所構(gòu)成的矩陣進(jìn)行因式分解等科學(xué)處理,并借助社會(huì)正則化項(xiàng)引入到原始目標(biāo)函數(shù)中實(shí)現(xiàn)對(duì)誤差函數(shù)的約束,從而實(shí)現(xiàn)基于可信度的社會(huì)網(wǎng)絡(luò)推薦。
現(xiàn)有的基于二值信任網(wǎng)絡(luò)的推薦方法都是假定被同一用戶信任的不同朋友對(duì)其產(chǎn)生的影響是相同的;然而,現(xiàn)實(shí)世界中,人們之間建立起來(lái)的關(guān)系強(qiáng)度是不同的。有一些關(guān)系可能是強(qiáng)大的,如親密的朋友關(guān)系;而有些關(guān)系可能是微弱的,如熟人關(guān)系。因此,基于信任關(guān)系進(jìn)行推薦時(shí),就需要區(qū)別對(duì)待不同關(guān)系的影響作用。其次,進(jìn)行用戶關(guān)系模型構(gòu)建時(shí),現(xiàn)有的方法大多只考慮了顯性的社會(huì)信任信息,而忽視了其他社會(huì)網(wǎng)絡(luò)維度信息的影響,而一些其他類型的關(guān)系可以被利用,如用戶的標(biāo)簽信息、上下文信息等。
為了區(qū)分用戶之間的信任程度,對(duì)在信任評(píng)估中起關(guān)鍵作用的兩個(gè)因素進(jìn)行了定義:能力度與可信度,并使用這兩個(gè)維度進(jìn)行社會(huì)信任關(guān)系的評(píng)估:
能力度 指在多大程度上被信任者能被認(rèn)為有能力提供正確的推薦。它反映了被信任者的能力或?qū)I(yè)知識(shí)水平的高低程度。
受信度 指在多大程度上被信任者被其直接鄰居認(rèn)為是可信的親密朋友。
2.1 能力度
如果被信任者可以隨時(shí)提供準(zhǔn)確預(yù)測(cè)并表現(xiàn)出高度的靈活性,則可認(rèn)為他/她是一個(gè)具有較高能力度的人?;谶@一假設(shè),被信任者推薦產(chǎn)品的準(zhǔn)確率很大程度上決定了被信任者的推薦能力。
對(duì)于被信任者v,他/她給其信任者u的推薦用三元組〈u,v,i〉來(lái)表示,其中i表示由信任者u和被信任者v評(píng)分的項(xiàng)目,用RecSet(v)表示用戶v推薦給其所信任用戶的推薦集合,其定義如下:
(5)
其中Γ(u)表示用戶u的直接鄰居集合。文獻(xiàn)[7]中對(duì)正確的推薦給出了定義,即當(dāng)且僅當(dāng)用戶v對(duì)項(xiàng)目i的推薦評(píng)分rv,i非常接近目標(biāo)用戶u對(duì)項(xiàng)目i的實(shí)際評(píng)分ru,i時(shí)才是一個(gè)正確的推薦,因此采用如下的公式對(duì)其進(jìn)行定義:
(6)
其中實(shí)數(shù)ε表示閾值。用CorSet(v)表示由用戶v作出的正確的推薦集合,其定義如下:
(7)
另外,能力度不僅要考慮用戶的正確推薦能力,還要考慮其評(píng)價(jià)的次數(shù)。因?yàn)閷?duì)于那些評(píng)價(jià)過(guò)多次均能取得很高的準(zhǔn)確率的用戶應(yīng)該具有更高的能力度,因此為了防止那些只評(píng)價(jià)過(guò)一次就獲得很高能力度的情況,本文將引入一個(gè)評(píng)分活躍因子來(lái)權(quán)衡用戶以往評(píng)分的活躍程度。用Iv表示為由用戶v評(píng)定的項(xiàng)目數(shù)量,用avg表示推薦系統(tǒng)中所有用戶平均評(píng)分項(xiàng)數(shù)目。對(duì)于被信任者v,其評(píng)分活躍因子βv定義如下:
(8)
最終,用戶的推薦能力度Comp(v)計(jì)算公式為:
(9)
2.2 受信度
受信度是指被信任者在多大程度上被其直接鄰居認(rèn)為是可信的親密朋友。如同在學(xué)術(shù)文獻(xiàn)中的引用,如果某篇文章被引的次數(shù)非常多,可以直觀地認(rèn)為該文具有相對(duì)較高的質(zhì)量?;谶@樣的假設(shè),可以認(rèn)為在信任網(wǎng)絡(luò)中受到很多人信任的用戶會(huì)比被少數(shù)人所信任的用戶更值得信賴。信任者u對(duì)被信任者v的受信度TW(u,v)可用如下公式計(jì)算:
(10)
2.3 最終信任度
用戶的能力度與受信度計(jì)算完成之后,可以利用它們完成最終的信任值計(jì)算。社會(huì)信任網(wǎng)絡(luò)中,信任者u對(duì)被信任者v賦予的信任值為:
(11)
該值越大表明用戶之間具有越高的信任度。如果用戶被認(rèn)為是可信的但不專業(yè)(當(dāng)能力度為0,受信度不為0時(shí)),表示其給出的推薦精準(zhǔn)率不高,則其最終的信任值將被減弱,可以將其設(shè)置為受信度的一半。初始沒(méi)有鄰居用戶,也沒(méi)有與任何用戶產(chǎn)生信任交互,對(duì)于這些沒(méi)有添加用戶到其社會(huì)列表中的用戶,稱為冷啟動(dòng)用戶。這些用戶沒(méi)有歷史的評(píng)分信息,也沒(méi)有信任用戶的推薦信息,因此無(wú)法用傳統(tǒng)的推薦方法進(jìn)行解決。本文的具體做法是:選擇一些能力度較高的用戶作為冷啟動(dòng)用戶的初始鄰居集合。通過(guò)最終信任值的修正,不僅使社會(huì)網(wǎng)絡(luò)的信任關(guān)系更加合理與精準(zhǔn),更重要的是解決了新用戶的信任值計(jì)算問(wèn)題,大幅度提高了推薦系統(tǒng)的準(zhǔn)確度。
社會(huì)關(guān)系網(wǎng)絡(luò)中,鄰居節(jié)點(diǎn)Γ(u)常常會(huì)對(duì)用戶u的行為與喜好產(chǎn)生影響,因此來(lái)自用戶所信任好友的推薦則更容易被用戶所接受。也就是說(shuō),相鄰節(jié)點(diǎn)v∈Γ(u)會(huì)對(duì)用戶u的潛在特征向量產(chǎn)生特定影響。該影響作用可以用如下公式進(jìn)行表示:
(12)
(13)
這里雖然考慮了社會(huì)網(wǎng)絡(luò)中朋友的喜好可以影響用戶特征向量的構(gòu)建,但這并不會(huì)改變用戶-項(xiàng)目評(píng)分矩陣R的條件概率分布,并且用戶u的特征向量可以反映其所信任朋友特征向量的條件概率分布,即:
(14)
上式可以看作是兩個(gè)正態(tài)分布的乘積因此結(jié)果仍然符合正態(tài)分布,這樣即可以保證用戶特征向量不會(huì)太大并且與其鄰居節(jié)點(diǎn)的特征向量非常相近。
同樣為了防止過(guò)擬合,對(duì)于項(xiàng)目特征向量也假設(shè)服從均值為0的高斯分布,即:
(15)
運(yùn)用貝葉斯推理可知:
(16)
仍然假設(shè)B與低維矩陣U和V是相互獨(dú)立的,則上式可表示為:
(17)
給定上述推薦模型后,其對(duì)數(shù)聯(lián)合后驗(yàn)概率分布可以表示為:
(18)
其中:ε為與參數(shù)無(wú)關(guān)的常數(shù)。在參數(shù)U、V固定時(shí),求解上式對(duì)數(shù)后驗(yàn)概率的最大值問(wèn)題可以轉(zhuǎn)換為對(duì)以下帶二次正則項(xiàng)的誤差平方和函數(shù)求最小值問(wèn)題:
(19)
對(duì)于目標(biāo)函數(shù)E(式(20)所示)求解局部最小值,可以通過(guò)對(duì)所有用戶和項(xiàng)目在Ui和Vj上使用梯度下降法獲得局部極小值:
(20)
其中:g′(x)為函數(shù)g(x)的導(dǎo)數(shù),B(x)表示所有信任用戶ui的用戶集合。為了減少算法的復(fù)雜度,令λU=λV。
4.1 數(shù)據(jù)集與評(píng)價(jià)指標(biāo)
實(shí)驗(yàn)選擇兩個(gè)公開(kāi)的產(chǎn)品評(píng)論網(wǎng)站數(shù)據(jù)作為本次實(shí)驗(yàn)的數(shù)據(jù)集:Epinions和MovieLens數(shù)據(jù)集。這兩個(gè)網(wǎng)站中,用戶不僅可以對(duì)不同產(chǎn)品進(jìn)行打分,而且還可以寫(xiě)下有關(guān)商品的評(píng)論信息。此外,用戶還可以評(píng)價(jià)其他用戶發(fā)表的評(píng)論,并將其信任的用戶加入到其“信任列表”中。MovieLens數(shù)據(jù)集中包含了大量的社會(huì)標(biāo)簽信息,該數(shù)據(jù)集包含10 000 054條評(píng)分信息和95 580條標(biāo)記信息,是由71 567名用戶對(duì)10 681部電影標(biāo)注產(chǎn)生的。
實(shí)驗(yàn)選取的測(cè)試集比重分別為10%、30%、50%、80%。MovieLens10M/100M數(shù)據(jù)集中隨機(jī)選擇80%作為訓(xùn)練集,20%作為測(cè)試集。每次驗(yàn)證都被獨(dú)立執(zhí)行多次,最終取平均值。實(shí)驗(yàn)具體以平均絕對(duì)誤差(MeanAbsoluteError,MAE)、均方根誤差(RootMeanSquareError,RMSE)等為系統(tǒng)評(píng)估指標(biāo),對(duì)各個(gè)推薦系統(tǒng)的性能進(jìn)行對(duì)比。
MAE是所有單個(gè)觀測(cè)值與算術(shù)平均值的偏差的絕對(duì)值,該值越小,表明推薦算法的性能越好,其定義如下:
(21)
RMSE表示觀測(cè)值與真值偏差的平方與觀測(cè)次數(shù)N比值的平方根,該值越小,表明推薦算法的性能越好,其定義如下:
(22)
URMSE(User Root Mean Square Error)用來(lái)評(píng)估推薦算法對(duì)不同用戶的推薦效果,其定義如下:
(23)
4.2 參數(shù)影響實(shí)驗(yàn)
在TSR推薦模型中,參數(shù)λB是用于平衡來(lái)自用戶-項(xiàng)目評(píng)分矩陣和用戶信任關(guān)系的信息比例。如果λB取值為0,表示僅依靠用戶評(píng)分矩陣信息進(jìn)行推薦;反之,當(dāng)λB取無(wú)窮大時(shí),表示推薦模型在推薦時(shí)僅依賴于用戶的信任關(guān)系矩陣進(jìn)行用戶喜好的預(yù)測(cè)。顯然,只有聯(lián)合用戶自身的評(píng)分信息與信任關(guān)系信息才能使推薦效果達(dá)到最優(yōu)。下面通過(guò)實(shí)驗(yàn)驗(yàn)證參數(shù)λB的不同取值對(duì)推薦性能的產(chǎn)生影響。
實(shí)驗(yàn)中對(duì)用戶特征矩陣的維度L分別取5和10兩種取值,測(cè)試集比重分別為20%、50%、80%三種比例,使用MAE衡量λB對(duì)推薦效果的影響。表1給出了參數(shù)在用戶特征矩陣維度分別為5和10,及其在不同比例測(cè)試集下MAE的結(jié)果。
表1 不同維度與不同訓(xùn)練集比例下參數(shù)λB對(duì)MAE的影響
由表1中數(shù)據(jù)可知,參數(shù)λB對(duì)算法的推薦性能有著重要的影響,也驗(yàn)證了在推薦時(shí)綜合考慮用戶評(píng)分矩陣與信任關(guān)系可以大幅度提高推薦性能。隨著λB的增大,推薦的準(zhǔn)確度逐漸提高,但當(dāng)λB值繼續(xù)增大時(shí),推薦性能反而降低。由此可知,參數(shù)λB的取值為10的時(shí)候,MAE取值最低,算法推薦性能最好;并且對(duì)比用戶特征矩陣維度分別為5和10下的MAE結(jié)果可知,維度為10時(shí)的推薦效果更好。這是由于用戶特征矩陣越大則對(duì)應(yīng)的用戶特征分類越細(xì),從而算法的推薦性能越好,因此最終將參數(shù)λB的取值設(shè)為10,用戶特征矩陣的維度L設(shè)為10。
4.3 算法性能對(duì)比實(shí)驗(yàn)
為了驗(yàn)證TSNR算法的有效性,本文利用衡量推薦算法性能所常用的幾種算法進(jìn)行仿真測(cè)試,與以下幾種算法進(jìn)行對(duì)比,以驗(yàn)證本文所提模型的正確性:
1)UserMean。該方法利用每個(gè)用戶對(duì)項(xiàng)目評(píng)分的均值進(jìn)行用戶未評(píng)分項(xiàng)的預(yù)測(cè)。
2)ItemMean。該方法利用每個(gè)項(xiàng)目評(píng)分的平均值對(duì)評(píng)分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)。
3)PMF(ProbabilisticMatrixFactorization)[11]。該算法來(lái)自于Salakhutdinov等的研究成果。PMF具體以概率分布的矩陣因式分解為基礎(chǔ),利用用戶-項(xiàng)目評(píng)分矩陣開(kāi)展協(xié)同推薦計(jì)算。
4)NMF(Non-negativeMatrixFactorization)[12]。該方法是由Lee等提出的。NMF是也是一種僅利用評(píng)分矩陣信息進(jìn)行推薦的方法。
5)Trust[13]。該協(xié)同推薦算法具體以信任網(wǎng)絡(luò)為基礎(chǔ),但與本文提出的推薦算法的最大區(qū)別在于,該算法并未考慮新用戶的信任度計(jì)算問(wèn)題。
6)SocialMF[14]。該算法具體以用戶偏好傳播為基礎(chǔ)進(jìn)行模型構(gòu)建,并完成偏好推薦。這種由Jamali等提出的推薦模型也是本文的研究基礎(chǔ),但該算法對(duì)新用戶的信任度也沒(méi)有進(jìn)行初始化。
實(shí)驗(yàn)選取的測(cè)試集比重分別為10%、30%、50%、80%。算法中用到的參數(shù)設(shè)置如下:λB=10,用戶特征矩陣的維度L=10。λU=λV=0.1。數(shù)據(jù)稀疏性問(wèn)題是影響推薦系統(tǒng)有效性的最大因素,歷史評(píng)分?jǐn)?shù)據(jù)的缺乏,則直接影響和限制了推薦系統(tǒng)的性能與效率,因此,為了確定本文所提出的推薦模型在推薦性能上的改進(jìn),需要與其他推薦模型進(jìn)行對(duì)比實(shí)驗(yàn)驗(yàn)證。
表2給出了在不同測(cè)試集比例下本文所提TSR算法與其他各類推薦算法分別在MAE與RMSE上的對(duì)比結(jié)果。根據(jù)結(jié)果可知,TSR算法的性能在MAE與RMSE作為評(píng)估指標(biāo)下均要顯著高于SVD、NMF、PMF、SoRec等算法,特別是在訓(xùn)練數(shù)據(jù)較少的情況下。特別是在像MovieLens這樣冷啟動(dòng)用戶較多的數(shù)據(jù)集上本算法的優(yōu)勢(shì)更加明顯。通過(guò)實(shí)驗(yàn)結(jié)果表明TSR的推薦效果由于考慮了新用戶的信任冷啟動(dòng)問(wèn)題,對(duì)新用戶的初始信任度進(jìn)行了合理賦值,因此推薦質(zhì)量較其他推薦算法都有所提升。
表2 各種推薦算法在不同測(cè)試集比例下的MAE和RMSE性能
社會(huì)網(wǎng)絡(luò)分析的諸多應(yīng)用中,對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的可信度進(jìn)行評(píng)估是其中的一項(xiàng)關(guān)鍵技術(shù)[15-16]。從朋友推薦這一非常典型的社交網(wǎng)絡(luò)推薦關(guān)系出發(fā),提出一種將關(guān)系信任度與用戶-項(xiàng)目評(píng)分矩陣進(jìn)行聯(lián)合矩陣分解的社會(huì)化推薦方法,通過(guò)朋友的喜好對(duì)用戶特征向量的構(gòu)建進(jìn)行修正,實(shí)現(xiàn)了信任傳遞,從而解決了新用戶無(wú)信任值的冷啟動(dòng)問(wèn)題,提高了基于信任度推薦的準(zhǔn)確度。實(shí)驗(yàn)結(jié)果表明TSR方法由于考慮了新用戶的信任度初始化問(wèn)題及信任傳遞等問(wèn)題,其推薦質(zhì)量較其他推薦方法有大幅度的提高。
)
[1]BOBADILLAJ,ORTEGAF,HERNANDOA,etal.Acollaborativefilteringapproachtomitigatethenewusercoldstartproblem[J].Knowledge-BasedSystems, 2012, 26: 225-238.
[2] 印桂生,張亞楠,董宇欣,等.基于受限信任關(guān)系和概率分解矩陣的推薦[J].電子學(xué)報(bào),2013,42(5):904-911.(YINGS,ZHANGYN,DONGYX,etal.Acontrainedtrustrecommendationusingprobabilisticmatrixfactorization[J].ActaElectronicaSinica, 2014, 42(5): 904-911. )
[3] 郭磊,馬軍,陳竹敏.一種信任關(guān)系強(qiáng)度敏感的社會(huì)化推薦算法[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1805-1813.(GUOL,MAJ,CHENZM.Truststrenthawaresocialrecommendationmethod[J].JournalofComputerResearchandDevelopment, 2013, 50(9): 1805-1813.)
[4] 郭磊,馬軍,陳竹敏,等.一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):219-228.(GUOL,MAJ,CHENZM,etal.Incoratingitemrelationsforsocialrecommendaiton[J].ChineseJournalofComputers, 2014, 37(1): 219-228.)
[5]NOELJ,SANNERS,TRANKN,etal.Newobjectivefunctionsforsocialcollaborativefiltering[C]//WWW’12:Proceedingsofthe21stInternationalConferenceonWorldWideWeb.NewYork:ACM, 2012: 859-868.
[6]MASSAP,BHATTACHARJEEB.Usingtrustinrecommendersystems:anexperimentalanalysis[EB/OL]. [2016- 02- 04].https://static.aminer.org/pdf/PDF/000/458/209/using_trust_in_recommender_systems_an_experimental_analysis.pdf.
[7]WANGY,YING,CAIZ,etal.Atrust-basedprobabilisticrecommendationmodelforsocialnetworks[J].JournalofNetworkandComputerApplications, 2015, 55: 59-67.
[8]MORADIP,AHMADIANS,AKHLAGHIANF.Aneffectivetrust-basedrecommendationmethodusinganovelgraphclusteringalgorithm[J].PhysicaA:StatisticalMechanicsanditsApplications, 2015, 436: 462-481.
[9] 龔衛(wèi)華,郭偉鵬,裴小兵,等.信任網(wǎng)絡(luò)中基于節(jié)點(diǎn)重要性的層次化劃分方法[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2015,49(9):1609-1615.(GONGWH,GUOWP,PEIXB,etal.Hierarchicalclassificationmethodoftrustnetworksbasedonnodesimportance[J].JournalofZheJiangUniversity(EngineeringScience), 2015, 49(9): 1609-1615.)
[10]VERMAVK,SINGHS,PATHAKNP.Towardscomparativeevaluationoftrustandreputationmodelsoverstatic,dynamicandoscillatingwirelesssensornetworks.WirelessNetworks, 2017, 23(2): 335-343.
[11]SALAKHUTDINOVR,MNIHA.Probabilisticmatrixfactorization[EB/OL]. [2016- 01- 09].http://drona.csa.iisc.ernet.in/~shivani/Teaching/E0371/Papers/nips07-prob-matrix-factorization.pdf.
[12]LEEDD,SEUNGHS.Learningthepartsofobjectsbynon-negativematrixfactorization[J].Nature, 1999, 401(6755): 788-791.
[13]YAHYAOUIH,Al-MUTAIRIA.Afeature-basedtrustsequenceclassificationalgorithm[J].InformationSciences, 2016, 328(C): 455-484.
[14]JAMALIM,ESTERM.Amatrixfactorizationtechniquewithtrustpropagationforrecommendationinsocialnetworks[C]//RecSys’10:Proceedingsofthe4thACMConferenceonRecommenderSystems.NewYork:ACM, 2010: 135-142.
[15]YANGT,CUIY-D,JINY-H.BPR-UserRec:apersonalizeduserrecommendationmethodinsocialtaggingsystems[J].JournalofChinaUniversitiesofPostsandTelecommunications, 2013, 20(1): 122-128.
[16]PUGLISIS,PARRA-ARNAUJ,FORNEJ,etal.Oncontent-basedrecommendationanduserprivacyinsocial-taggingsystems[J].ComputerStandardsandInterfaces, 2015, 41: 17-27.
ThisworkispartiallysupportedbytheNationalNaturalScieneceFoundationofChina(61403156, 61403155),LianyungangScienceandTechnologyProject(SH1507,CXY1530,CG1315,CG1314).
HU Yun, born in 1978, Ph. D., associate professor. Her research interests include community discovery, socila network analysis.
LI Hui, boin in 1979, Ph. D., associate professor. Her research interests include personalized recommendation, socila network analysis.
SHI Jun, boin in 1963, M. S., professor. Her research interests include smart education.
Social recommendation algorithm combining rating and trust relation
HU Yun1, LI Hui2*, SHI Jun2
(1.CollegeofInformationTechnology,NanjingUniversityofChineseMedicine,NanjingJiangsu210023,China;
2.SchoolofComputerEngineering,HuaihaiInstituteofTechnology,LianyungangJiangsu222001,China)
To solve the problem of data sparsity and cold start which is prevalent in recommender system, a new social recommendation algorithm was proposed, which integrates rating and trust relation. Firstly, the initial trust value of the new user in the network was reasonably assigned, which solves the problem of cold start of the new user. Since the user’s preferences were affected by his friends, the user’s own feature vector was modified by the trust matrix between friends, which solves the problem of user’s feature vector construction and trust transition. The experimental results show that the proposed algorithm has a significant performance improvement over the traditional social network recommendation algorithm.
trust; recommendation; transition; model; matrix factorization
2016- 09- 26;
2016- 10- 11。
國(guó)家自然科學(xué)基金資助項(xiàng)目(61403156, 61403155);連云港市科技計(jì)劃項(xiàng)目(SH1507, CXY1530, CG1315, CG1413)。
胡云(1978—),女,江蘇連云港人,副教授,博士,主要研究方向:社區(qū)發(fā)現(xiàn)技術(shù)、社會(huì)網(wǎng)絡(luò)分析; 李慧(1979—),女,江蘇連云港人,副教授,博士,主要研究方向:個(gè)性化推薦、社會(huì)網(wǎng)絡(luò)分析; 施珺(1963—),女,安徽桐城人,教授,碩士,主要研究方向:智慧教育。
1001- 9081(2017)03- 0791- 05
10.11772/j.issn.1001- 9081.2017.03.791
TP393.07
A