亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于用戶信任和評分偏置的正則化推薦模型

2018-08-02 07:23:38朱愛云任曉軍

現(xiàn)代計算機(jī) 2018年15期

朱愛云,任曉軍

（濰坊科技學(xué)院計算機(jī)軟件學(xué)院，壽光 262700）

0 引言

隨著網(wǎng)絡(luò)和電子商務(wù)的快速增長，推薦系統(tǒng)椐據(jù)用戶購買或歷史評分信息，能夠快速自動地為用戶提供有用的信息，傳統(tǒng)上推薦系統(tǒng)已經(jīng)解決了系統(tǒng)對物品評分預(yù)測問題。但是，傳統(tǒng)的推薦技術(shù)僅僅使用用戶-項目評分信息，為了實現(xiàn)用戶更個性化的推薦結(jié)果，開發(fā)更智能化的推薦系統(tǒng)，隨著社交網(wǎng)絡(luò)的增長，整合社會網(wǎng)絡(luò)信息到推薦系統(tǒng)中已引起許多學(xué)者的廣泛關(guān)注。

傳統(tǒng)的推薦系統(tǒng)[1,2]總是忽視用戶間的社會關(guān)系，在現(xiàn)實世界中，人們的社會關(guān)系在很大程度上決定了他們的偏好，事實上，當(dāng)人們面臨多種選擇時，他們可能會通過最好的朋友提供建議，因此為了提供更準(zhǔn)確、更個性化的推薦結(jié)果，整合用戶間的社會關(guān)系到推薦系統(tǒng)中是合理的，基于以上觀點，多種基于信任的推薦系統(tǒng)開始提出,并由此提出了多種信任推薦方法[3-6]，這些方法都是利用單邊信任信息來進(jìn)一步提高推薦系統(tǒng)的性能，這些方法中顯而易見的弱點是單方面的“信任關(guān)系”問題。它不同于那種用戶之間相互合作的“社會關(guān)系”。另外，其他弱點也有不可行的假設(shè)和弱泛化能力，顯然，基于信任的推薦系統(tǒng)也不太合適。此外，社會網(wǎng)絡(luò)的整合從理論上是可以提高傳統(tǒng)推薦系統(tǒng)的性能。因為就預(yù)測的準(zhǔn)確性而言，朋友關(guān)系能夠提高對用戶評分的理解，并且朋友關(guān)系也表明在某些方面有共同之處，因此，能夠緩解冷啟動問題[3]。

為了解決以上問題，本文主要關(guān)注基于朋友的社會推薦，類似于文獻(xiàn)[8]提出的方法，在矩陣分解中增加用戶、物品偏置信息以及用戶的社會關(guān)系，構(gòu)成正則化推薦模型．通過實驗驗證了增加用戶、項目的評分偏置和用戶的社會關(guān)系能提高推薦的準(zhǔn)確度，并且也能應(yīng)用于現(xiàn)實生活中的大規(guī)模數(shù)據(jù)集中。因為在現(xiàn)實生活中，人們經(jīng)常在購買一種產(chǎn)品或消費一種服務(wù)前，借助于他們在社交網(wǎng)絡(luò)中的朋友的建議。從社會學(xué)和心理學(xué)研究發(fā)現(xiàn)也表明,人們傾向于結(jié)交跟自己的興趣相似的人，由于穩(wěn)定和持久的社會綁定,人們更愿意與他們的朋友分享他們的個人觀點,因此通常在陌生人、供應(yīng)商和朋友中首先會選擇他們朋友的推薦。

1 相關(guān)工作

傳統(tǒng)推薦方法主要有三類：協(xié)同過濾[2,9,10]、內(nèi)容過濾以及混合過濾[1]。其中協(xié)同過濾是最普遍和最成功的方法。

通常，協(xié)同過濾推薦方法分為基于模型[9]方法和基于內(nèi)存[2]方法，基于內(nèi)存的方法從評分矩陣中查找與當(dāng)前用戶偏好最相似的用戶，是一種啟發(fā)式的評分預(yù)測。基于模型的方法使用評分集合來學(xué)習(xí)，然后用來進(jìn)行評級預(yù)測。

傳統(tǒng)的推薦方法已發(fā)展的很成熟，但是它們都是假設(shè)用戶是獨立的，沒有考慮用戶間的朋友關(guān)系，基于以上考慮，許多研究者提出了許多信任推薦方法[4-7,11,14]并廣泛應(yīng)用在學(xué)術(shù)和工業(yè)領(lǐng)域。但是推薦進(jìn)程仍與真實世界的推薦過程不一致，因此,他們提出了另一種集成方法，在同一時間,通過考慮用戶的喜好和受信任的用戶的喜好來計算用戶的評分。實驗表明，該方法是可行的,能夠開發(fā)更好的推薦模型?；谛湃蔚耐扑]系統(tǒng)已被證明是有效的，并取得了巨大的進(jìn)步。然而,通過分析，它們也有幾個固有的局限性和弱點需要解決。

近年來，在工業(yè)界和學(xué)術(shù)界如何利用社會網(wǎng)絡(luò)信息已成為一個研究熱點。通過結(jié)合社會網(wǎng)絡(luò)信息能夠影響個人在網(wǎng)上的行為，如用戶間的互動、標(biāo)簽信息等能提高推薦系統(tǒng)的性能。文獻(xiàn)[12]提出了一個融合社會朋友信息的個性化推薦概率模型，并在真實數(shù)據(jù)集上驗證了用戶與他的朋友在許多方面有相似的偏好。文獻(xiàn)[8]提出了一種基于概率矩陣分解的社會正則化和因子分解法，該方法通過利用網(wǎng)絡(luò)信息提高了數(shù)據(jù)稀疏性問題和冷啟動問題。文獻(xiàn)[8,13]整合朋友關(guān)系來提高推薦系統(tǒng)的性能。并且很多社會推薦技術(shù)都是基于矩陣分解來解決評分預(yù)測問題[8,13,16],矩陣分解方法是是目前比較成功的推薦方法，它將評分/購買矩陣分解成低維的用戶矩陣和項目矩陣，用戶和項目特征向量的點積說明了給定用戶對項目的偏好程度。假定用戶u對物品i的評分用ru,i表示，用戶u對物品i的預(yù)測評分用r^u,i表示，其中r^u,i是由用戶特征向量 pu和項目特征向量qi的內(nèi)積得到。

即：

但是，在實際的推薦系統(tǒng)中，有的用戶往往熱衷于給用戶打分高，有的項目也給予了很高的評分，因此預(yù)測評分[15]為：

其中，bu為用戶u的偏置評分，bi為項目i的偏置評分，e為數(shù)據(jù)集中所有評分的平均評分。

因此，目標(biāo)函數(shù)為：

2 融合社會關(guān)系和評分偏置的正則化推薦模型

隨著社交媒體的日益普及，使得越來越多的在線用戶參與在線活動，從而產(chǎn)生了更為豐富的社會關(guān)系。在社會推薦系統(tǒng)中,除了用戶的評分信息外，還有用戶之間的社會關(guān)系，社會關(guān)系的有效性為推薦系統(tǒng)提供了一個獨立的資源，也為獨特的社會推薦的屬性帶來了新的機(jī)遇。本文將結(jié)合用戶的社會網(wǎng)絡(luò)關(guān)系來提高推薦系統(tǒng)性能，假設(shè)用戶有不同類型的社會關(guān)系（家人、朋友、同事、同學(xué)等），如果兩個人建立一種社會關(guān)系，那么就說他們存在一種社會關(guān)系。一種社會關(guān)系可能對稱也可能不對稱。需要從以下方面定義這種關(guān)系。因此，在這一部分描述了本文提出的方法。

定義1假定U={u1,u2,u3,…,un}是一個用戶集，I={i1,i2,i3,…,im}是一個項目集,則社會評分網(wǎng)絡(luò)SRN=＜U,I,?,φ＞是一個四元組,其中 φ∶U×I→R+∪{"*"}是一個評分函數(shù)，用一個真實的值關(guān)聯(lián)著一個用戶ux∈U和一個項目in∈I，即用戶u對項目i的評分為ru,i，否則用“*”表示。

φ∶U×U→{0,1}是一個社會函數(shù)，即一對用戶ux,uy∈U存在一種社會關(guān)系，則函數(shù)值為1，否則為0。這種社會關(guān)系對一些用戶對(ux,uy)通常是不對稱的，也就是 φ(ux,uy)≠φ(uy,ux)。

定義2 假定SRN=＜U,I,?,φ＞是一個社會評分網(wǎng)絡(luò)，且用戶ux∈U,用戶ux與他的鄰居Nx存在一種社會關(guān)系Nx={uy∈U∶φ(ux,uy)=1}。

在現(xiàn)實生活中,我們通常咨詢我們熟悉的朋友，因為他們熟悉我們的品味，所以來自社會信息的熟悉度和相似度證據(jù)表明包含評分信息的社會信息能夠潛在的提高推薦性能，因此，本文中在文獻(xiàn)[9,14]方法基礎(chǔ)上增加了用戶的直接朋友關(guān)系作為正則化條件構(gòu)建模型。猜想如果兩個用戶u,w是直接朋友關(guān)系，那么他們應(yīng)該在特征空間中會映射成一個非常接近的點，換言之假設(shè)有三個用戶u,w,x，分別映射到特征空間中的點為 pu,pw,px，但如果只有u,w是朋友，那么 pu,pw之間的距離可能要小于點 puk到點u的距離，事實上，如果一個用戶pu在潛在特征空間中很接近于他的直接朋友 pw，那么用戶 pu的觀點與他的朋友 pw的觀點將會是相似的，為此從數(shù)學(xué)的觀點考慮在潛在的特征空間中用戶u,w之間的距離為||pu-pw||，其中||·||是歐幾里德距離的范式，用N(u)表示用戶u的直接朋友的最近

鄰居，我們的目的是使盡可能的最小，因此公式（6）增加懲罰因子改為如下公式：

本文稱之為融合社會關(guān)系和評分偏置信息的正則化方法（簡稱 Social B-SVD）。其中，（ β,λ1,λ2,λ3均為＞0的常數(shù)）用于調(diào)整過擬合，sim(u,w)表示用戶u與他的直接朋友w的相似度，我們用皮爾遜相關(guān)系數(shù)（PCC）即可求出相似度：

其中，相似度sim(u,w)值越大，表明特征向量pu,pw之間的距離越小，也就表明他們之間有更加相似的偏好，反之，相似度越小，表明特征向量之間的距離越大。其中rˉu是用戶u的平均評分，從這個相似度公式中得到 sim(u,w)∈[-1,1]，為了約束它的范圍[0,1]，采用一個映射函數(shù) f(x)=(x+1)/2。

為了解決這個最優(yōu)化問題，首先需要對目標(biāo)函數(shù)中的參數(shù)puk,qik,bu,bi分別求偏導(dǎo)。

然后利用隨機(jī)梯度下降法，沿最速下降方向遞推得到如下公式：

其中，α為學(xué)習(xí)速率,并按每次迭代縮減為0.9倍的速度遞減。

下面是具體的算法：

算法：融合社會關(guān)系的矩陣分解（SocialB-SVD），用戶對項目的分rui,需要分解的特征維數(shù) k

輸入：用戶數(shù)m，項目數(shù)n，迭代次數(shù)為T。

輸出：潛在用戶特征矩陣 U和潛在項目特征矩陣V。

開始

隨機(jī)初始化：用戶特征矩陣 U，項目特征矩陣 V,每個用戶u的朋友特征矩陣 pw，每個用戶的偏置向量bu和每個項目i的偏置向量bi。

3 實驗結(jié)果

3.1 數(shù)據(jù)集和結(jié)果分析

在本文中，我們采用Flixster數(shù)據(jù)集作為此實驗數(shù)據(jù)集，此數(shù)據(jù)集包含了用戶間的社會網(wǎng)絡(luò)和用戶評分，用戶間的社會網(wǎng)絡(luò)是無向的，評分值介于[0.5,5.0]之間,且步長為0.5。

在實驗中，我們從數(shù)據(jù)集中隨機(jī)抽取了80%的評分?jǐn)?shù)據(jù)作為訓(xùn)練集，剩余20%作為測試集，并且從社交網(wǎng)絡(luò)關(guān)系數(shù)據(jù)中抽取了20000個朋友作為訓(xùn)練集，學(xué)習(xí)速率參數(shù)α與正則化參數(shù)λ1,λ2,λ3,β通過交叉驗證決定。本文采用α=0.0002,λ1=0.003，λ2=0.002，λ3=0.004,β=0.2進(jìn)行實驗。并且采用均方根誤差（RMSE）和平均絕對誤差（MAE）來評價預(yù)測準(zhǔn)確度。

取特征維數(shù)為k=10,和k=30，迭代次數(shù)為30時對比了以下這5種算法的預(yù)測準(zhǔn)確度。

（1）ItemMean:此方法使用每個項目的平均值來預(yù)測缺失值。

（2）SVD:是最傳統(tǒng)的矩陣分解推薦算法，已廣泛應(yīng)用于推薦系統(tǒng)中,但它忽視了用戶間的社會關(guān)系。

（3）Bias_SVD:是 Koren[16]提出的一種推薦方法，該方法使用戶的偏置信息、項目的偏置信息整合到推薦系統(tǒng)中，提高了推薦性能。

（4）Social_SVD:是Ma[8]提出的一種信任感知推薦方法，利用矩陣分解融合用戶和她朋友的品味構(gòu)建正則化模型。

（5）SVD++:這種方法是 Koren[15]提出的，他考慮了用戶和項目的偏見值對評分的影響，也融合了用戶評分的顯式和隱式影響。

本實驗中，特征維數(shù)設(shè)置為k=10和30，針對所有用戶做了實驗對比，實驗結(jié)果如表1所示，不論k=10,30，與表中其他的方法相比較，我們所提出的Social BSVD方法的性能是最好的（MAE或RMSE值最小），雖然相對提高的比例很小，但是也表明融合社會網(wǎng)絡(luò)信息的Social B-SVD方法會大大提高推薦系統(tǒng)的性能。

圖1 參數(shù)β的影響（k=10）

圖2 參數(shù)β的影響（k=10）

3.2 參數(shù)β的影響

在本文中參數(shù)β對預(yù)測準(zhǔn)確度起著重要的作用，它表示到底應(yīng)該結(jié)合多少社交網(wǎng)絡(luò)信息才能達(dá)到最佳狀態(tài)。在極端的情況下，如果我們用一個很小的β值，它表明僅僅使用用戶自己的品味來做出推薦，相反，我們?nèi)绻靡粋€很大的β值，那么社會網(wǎng)絡(luò)信息在學(xué)習(xí)過程中就占支配地位。但在許多情況下，我們都不想設(shè)置這些極端值，從圖1，圖2中我們看到不管用哪種數(shù)據(jù)集，隨著β值的增加MAE/RMSE值開始在減少，但當(dāng)達(dá)到某一個閾值（0.001在Flixster數(shù)據(jù)集上）時，隨著β值的繼續(xù)增加MAE/RMSE又開始增加，這個拐點的存在說明融合社交網(wǎng)絡(luò)信息到矩陣分解中進(jìn)行推薦遠(yuǎn)遠(yuǎn)好于單純使用用戶項目評分或單純使用社交網(wǎng)絡(luò)信息。

表1 Flixster數(shù)據(jù)集中預(yù)測準(zhǔn)確度的比較

圖3 特征維數(shù)k對RMSE的影響

圖4 特征維數(shù)k對MAE的影響

3.3 特征維數(shù)k 的影響

在本文中通過實驗驗證特征維數(shù)k對預(yù)測準(zhǔn)確度影響較大，我們選擇k=10,20,30,40,50,60,100進(jìn)行模型訓(xùn)練。從圖3、圖4可以看到，在我們提出的方法中，隨著特征維數(shù)k值的增加，MAE/RMSE值開始下降很快，但是隨著k值的增加MAE/RMSE下降速度變慢（由圖 3、圖 4得到 k值從 60到100，MAE值從 0.8451下降到0.7906，RMSE值從0.9842下降到0.9439），也從側(cè)面驗證了算法每次計算出的都是最顯著的特征向量。

4 結(jié)語

本文在傳統(tǒng)的奇異值（SVD）矩陣分解模型中融合了社交網(wǎng)絡(luò)中的直接朋友關(guān)系和用戶評分偏置信息作為輔助信息，設(shè)計了基于社交網(wǎng)絡(luò)信息的矩陣分解算法。實驗表明，本文提出的算法具有較好的預(yù)測效果，其性能明顯優(yōu)于相比較的相關(guān)算法。

[1]Adomavicius,G.,Tuzhilin,A..Toward the Next Generation of Recommender Systems:a Survey of the State-of-the-Art and Possible Extensions.IEEE Trans.Knowl.Data Eng，2005，17（6）：734-749

[2]Bellogin,A.,Castells,P.,Cantador,I..Improving Memory-Based Collaborative Filtering by Neighbour Selection Based on User Preference Overlap.In:Proceedings of the 10th Conference on Open Research Areas in Information Retrieval,Lisbon,Portugal,2013，May 15-17：145-148.

[3]Jamali,M.,Ester,M..A Matrix Factorization Technique with Trust Propagation for Recommendation in Social Networks.In:Proceedings of the 4th ACM Conference on Recommender Systems,Barcelona,Spain,2010，September 26-30：135-142.

[4]Ozsoy,M.G.,Polat,F..Trust Based Recommendation Systems.In:Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining（ASONAM'13）,Niagara,ON,Canada,2013，August 25-29：1267-1274.

[5]Massa,P.,Avesani,P..Trust metrics in recommender systems.Comput.Soc.Trust,2009:259-285.

[6]Nazemian,A.,Gholami,H.,Taghiyareh,F..An Improved Model of Trustaware Recommender Systems Using Distrust Metric.In:Proceedings of the IEEE/ACM International Conference on Advances in Social,2012.

[7]Ma,H.,Yang,H.,Lyu,M.R.,King,I..SoRec:Social Recommendation Using Probabilistic Matrix Factorization.In:Proceedings of the 17th ACM Conference on Information and Knowledge Management,Napa Valley,California,USA,2008，October 26-30：931-940.

[8]Ma H,Zhou D Y,Liu C.Recommender Systems Withsocial Regularization[C].In Proceedings of the 4th ACM International Conference on Web Search and Data Mining,2011,287-296.

[9]Bergner,Y.,Droschler,S.,Kortemeyer,G.,et al..Model-based Collaborative Filtering Analysis of Student Response Data:Machine-Learning Item Response In:Proceedings of the 5th International Conference on Educational Data Mining,Chania,Greece,,2012,June 19-21:95-102.

[10]Gunes,I.,Bilge,A.,Polat,H..Shilling Attacks Against Memory-based Privacy-Preserving Recommendation Algorithms.Internet Inf.Syst,2013,7（5）：1272-1290.

[11]Nazemian,A.,Gholami,H.,Taghiyareh,F..An Improved Model of Trustaware Recommender Systems Using Distrust Metric.In:Proceedings of the 2012 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining,Istanbul,Turkey,2012，August 26-29：1079-1084.

[12]He,J.,Chu,W.,PhD Dissertation.A Social Network-Based Recommender System（SNRS）.University of California at Los Angeles,CA,USA,2010.

[13]Wang,X.,Huang,W..Research on Social Regularization-Based Recommender Algorithm.Comput.Mod.,2014，1：77-80.

[14]王瑞琴，蔣云良，李一嘯.一種基于多元社交信任的協(xié)同過濾推薦算法[J].計算機(jī)研究與發(fā)展，2016,53（6）：1389-1399

[15]Koren Y,R BeII,C Volinsky.Matrix Factorization Techniques for Recommender Systems[J].Compute Socety,2009,42（8）:30-37.

[16]Koren Y.Factor in the neighbors Scalable and Accurate Collaborative Filtering[J].ACM Transactions on Knowledge Discovery from Data（TKDD）,2010,1（4）:1-11.