亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合社交信息的局部潛在空間推薦方法*

        2021-09-22 13:27:24魏云鶴馬慧芳姜彥斌
        關(guān)鍵詞:局部社交矩陣

        魏云鶴,馬慧芳,2,姜彥斌,宿 云

        (1.西北師范大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,甘肅 蘭州 730070; 2.桂林電子科技大學(xué)廣西可信軟件重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004)

        1 引言

        隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,信息資源飛速增長(zhǎng),面對(duì)嚴(yán)重過載的信息,用戶很難快速篩選出對(duì)自己有用的信息,從而要耗費(fèi)大量時(shí)間搜索自己需要的內(nèi)容,于是推薦系統(tǒng)應(yīng)運(yùn)而生[1,2]。推薦系統(tǒng)根據(jù)用戶的偏好信息或者某些約束信息預(yù)測(cè)用戶喜歡的項(xiàng)目,并為其給出適當(dāng)?shù)慕ㄗh。協(xié)同過濾推薦是運(yùn)用最廣泛的推薦方法,其理論依據(jù)是:目標(biāo)用戶的歷史行為與某些用戶有相似之處,那么該目標(biāo)用戶與這些相似用戶應(yīng)該有共同的偏好,協(xié)同過濾推薦通過分析用戶的歷史評(píng)分信息及反饋信息,預(yù)測(cè)用戶未來的偏好,是研究的主流方向[3]。

        近年來,研究人員提出了許多基于協(xié)同過濾的推薦算法,基于矩陣分解的協(xié)同過濾算法因其有較高的準(zhǔn)確性和可擴(kuò)展性而被廣泛應(yīng)用,其基本思想是將用戶和物品表示在低維隱空間上。例如,Cremonesi等人[4]提出了一種PureSVD(Pure Singular Value Decomposition)模型,該模型將丟失的條目視為零,使用矩陣的截?cái)郤VD分解來生成Top-N推薦。Christakopoulou等人[5]提出的sGLSVD(Global and Local Singular Value Decomposition with varying subsets)模型根據(jù)用戶的評(píng)分將用戶分配到不同的子集,通過截?cái)嗥娈愔捣纸夥椒▽?duì)用戶進(jìn)行低秩表示。然而這些方法沒有解決協(xié)同過濾算法存在的推薦性能低和冷啟動(dòng)等問題。因此,越來越多的推薦算法將社交信息融合到矩陣分解算法中, 以改善推薦性能[6,7]。融合社交信息的推薦算法一般假設(shè)社交網(wǎng)絡(luò)中用戶的偏好受到朋友的影響,并且同社區(qū)的用戶具有類似的興趣,首先將用戶和項(xiàng)目同時(shí)映射到低維特征空間,然后通過對(duì)評(píng)分和信任數(shù)據(jù)上的一些目標(biāo)函數(shù)進(jìn)行優(yōu)化來訓(xùn)練預(yù)測(cè)模型。SoRec(Social Recommendation using probabilistic matrix factorization)是一種基于矩陣分解的社交推薦模型[8],其在原有的概率矩陣分解模型中加入社交關(guān)系矩陣,同時(shí)分解評(píng)分矩陣和社交關(guān)系矩陣,通過共享的用戶潛在特征空間將這2種不同的信息連接起來,從而提高推薦的準(zhǔn)確性。Zhao等人[9]提出了一種社交貝葉斯個(gè)性化排序模型SBPR(Social Bayesian Personalized Ranking),該模型將社交關(guān)系作為一種額外信息來獲得更準(zhǔn)確的基于排序的方法,使用社交關(guān)系來更好地估計(jì)用戶對(duì)產(chǎn)品的偏好。Chaney等人[10]提出了社交泊松因子分解SPF(Social Poisson Factorization)模型,這是一種將社交網(wǎng)絡(luò)信息納入傳統(tǒng)因子分解方法的概率模型,將社交因素引入到推薦算法中,從而結(jié)合用戶對(duì)項(xiàng)目的潛在偏好和用戶朋友的潛在影響來提高推薦性能。但是,上述工作忽略了2個(gè)問題:一是沒有考慮到用戶可以屬于不同的社交維度,并且在不同社交維度關(guān)心的層面不同;二是用戶的偏好既包括全局因素也包括局部因素。

        為了解決以上問題,本文提出了一種融合社交信息的局部潛在空間推薦方法LSFS(Local latent Space recommendation method Fusing Social information)。首先,基于用戶的社交關(guān)系將用戶劃分到重疊社區(qū)中,而在不同的社區(qū)中用戶關(guān)注的層面不同,這種重疊社區(qū)的發(fā)現(xiàn)結(jié)果可以與用戶興趣的多樣化相對(duì)應(yīng)。然后,利用截?cái)嗥娈愔捣纸饧夹g(shù)構(gòu)建預(yù)測(cè)評(píng)分的全局模型和不同子集的局部模型,其中全局模型用來捕獲用戶共享的層面,而不同用戶子集的局部模型用來捕獲不同的用戶子集關(guān)心的特定層面,再將二者結(jié)合預(yù)測(cè)所有未評(píng)分項(xiàng)目的評(píng)分。圖1所示為本文方法的整體框架。

        Figure 1 Framework of local latent space recommendation method fusing social information圖1 融合社交信息的局部潛在空間推薦方法框架圖

        2 準(zhǔn)備知識(shí)

        2.1 符號(hào)介紹與問題定義

        為了方便描述,將本文所用的其他幾個(gè)重要符號(hào)總結(jié)在表1中。

        Table 1 Several important mathematical notations表1 幾個(gè)重要的數(shù)學(xué)符號(hào)

        2.2 基于社交信息的用戶重疊社區(qū)檢測(cè)

        在社交網(wǎng)絡(luò)中,用戶可以同時(shí)屬于多個(gè)社區(qū),使得社區(qū)結(jié)構(gòu)重疊?;诮?jīng)典BIGCLAM(CLuster Affiliation Model for BIG networks)[11]方法進(jìn)行用戶重疊社區(qū)檢測(cè)。具體地:給定F,用戶ui與uh之間以概率p(i,h)創(chuàng)建邊(i,h)來生成社交網(wǎng)絡(luò)G(U,E)。

        (1)

        G的似然函數(shù)l(F)=P(G|F)計(jì)算如下:

        (2)

        通過最大化G的對(duì)數(shù)似然函數(shù)來檢測(cè)d個(gè)社區(qū):

        (3)

        其中,F(xiàn)≥0表示矩陣F中所有元素都大于或等于0。

        2.3 截?cái)嗥娈愔捣纸夥椒?/h3>

        奇異值分解是將任意一個(gè)n×m的矩陣表示為3個(gè)矩陣乘積的形式,3個(gè)矩陣分別是n階正交矩陣、由降序排列的非負(fù)的對(duì)角線元素組成的n×m矩形對(duì)角矩陣和m階正交矩陣,矩陣的奇異值一定存在,但不唯一,奇異值分解可以看做是用因子分解的方式近似地表示原始矩陣的一種方法[12]。在奇異值分解中,只取最大的t個(gè)奇異值(t

        (4)

        其中,左奇異矩陣Ut是n×t矩陣,右奇異矩陣Vt是m×t的矩陣,奇異值矩陣Σt是t階對(duì)角矩陣;矩陣Ut由完全奇異值分解中U的前t列組成,矩陣Vt由V的前t列組成,矩陣Σt由Σ的前t個(gè)對(duì)角線元素得到。對(duì)角矩陣Σt的秩比原始矩陣A的秩低。

        3 融合社交信息的局部潛在空間推薦

        本節(jié)提出了一種融合社交信息的潛在空間推薦方法,通過對(duì)全局訓(xùn)練矩陣和局部訓(xùn)練矩陣的截?cái)嗥娈愔捣纸饨H钟脩魸撛谝蜃雍途植坑脩魸撛谝蜃?,從而預(yù)測(cè)用戶對(duì)未評(píng)分項(xiàng)目的評(píng)分,并給出推薦列表。

        3.1 全局和局部奇異值分解

        首先基于社交關(guān)系將用戶劃分到不同的社區(qū)中,每個(gè)用戶可以同時(shí)屬于不同的社區(qū),用戶在不同的社區(qū)中共享不同的偏好。然后在全局訓(xùn)練矩陣Rg上計(jì)算秩為fg的截?cái)嗥娈愔捣纸?,用來估?jì)全局用戶潛在因子:

        (5)

        (6)

        3.2 局部潛在空間推薦模型

        通過估計(jì)全局潛在空間模型和多個(gè)用戶社區(qū)特定潛在空間模型來預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分,用gi表示全局模型權(quán)重,(1-gi)表示局部模型權(quán)重,gi取值為[0,1],其中0表示僅使用局部模型,1表示僅使用全局模型。結(jié)合目標(biāo)用戶的全局偏好和其在不同社區(qū)的局部偏好預(yù)測(cè)用戶的最終偏好:

        (7)

        每個(gè)用戶ui在所有項(xiàng)目上的平方誤差為:

        (8)

        將平方誤差的導(dǎo)數(shù)設(shè)置為0后,計(jì)算權(quán)重gi:

        (9)

        本文方法的步驟如算法1所示。

        算法1融合社交信息的局部潛在空間推薦

        輸入:用戶項(xiàng)目隱式反饋矩陣R,用戶社交關(guān)系矩陣S。

        輸出:Top-N項(xiàng)目推薦列表。

        步驟1forallui∈UandCk∈C

        ifFik>0do

        Ck←ui

        步驟2構(gòu)建Rk,?k∈{1,…,d};

        步驟3在Rg上計(jì)算秩為fg的截?cái)郤VD分解;

        步驟4 forallRkdo

        計(jì)算秩為fk的截?cái)郤VD分解;

        步驟5利用式(7)構(gòu)建評(píng)分預(yù)測(cè)模型;

        步驟6 forallui∈Uandvj∈Vdo

        利用式(9)計(jì)算全局模型權(quán)重gi;

        步驟7利用式(7)計(jì)算用戶ui對(duì)項(xiàng)目vj的預(yù)測(cè)評(píng)分;

        步驟8將項(xiàng)目的預(yù)測(cè)評(píng)分從大到小進(jìn)行排序,選擇前N個(gè)項(xiàng)目為用戶ui產(chǎn)生的Top-N推薦列表。

        4 實(shí)驗(yàn)

        本節(jié)首先對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行描述,然后設(shè)計(jì)實(shí)驗(yàn)對(duì)本文所提方法進(jìn)行驗(yàn)證,并對(duì)實(shí)驗(yàn)結(jié)果做進(jìn)一步分析。實(shí)驗(yàn)環(huán)境采用Intel i7-8750H Core 2.67 GHz 處理器,16 GB內(nèi)存,64位 Windows 10操作系統(tǒng),實(shí)現(xiàn)語(yǔ)言為Python。

        4.1 實(shí)驗(yàn)數(shù)據(jù)集

        為了驗(yàn)證本文方法,選取FilmTrust[13]、Epinions[6]、Ciao[9]3個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。FilmTrust是一個(gè)電影評(píng)分?jǐn)?shù)據(jù)集,該數(shù)據(jù)集包括用戶之間的信任關(guān)系,用戶能夠?qū)﹄娪白龀鲈u(píng)分,同時(shí)還可以構(gòu)建信任關(guān)系。Epinions數(shù)據(jù)集中用戶可以給商品評(píng)分,同時(shí)還可以給其他人的評(píng)論進(jìn)行打分,標(biāo)記自己信任的用戶以構(gòu)建社交網(wǎng)絡(luò)。Ciao是從Ciao網(wǎng)站抓取的數(shù)據(jù)集,在Ciao上用戶不僅可以對(duì)不同項(xiàng)目進(jìn)行評(píng)分,還可以與其他用戶建立社交關(guān)系。表2描述了實(shí)驗(yàn)所用的數(shù)據(jù)集的統(tǒng)計(jì)信息,其中,Rdensity表示用戶-項(xiàng)目交互數(shù)據(jù)密度,Sdensity表示用戶社交關(guān)系密度。對(duì)于所有數(shù)據(jù)集,使用80%的數(shù)據(jù)作為訓(xùn)練集,剩余20%作為測(cè)試集。

        Table 2 Summary of the datasets 表2 實(shí)驗(yàn)數(shù)據(jù)集總結(jié)

        4.2 實(shí)驗(yàn)設(shè)置

        4.2.1 評(píng)價(jià)指標(biāo)

        為了衡量偏好預(yù)測(cè)的準(zhǔn)確度,本文采用3種常用的評(píng)價(jià)指標(biāo)衡量推薦的準(zhǔn)確度:精準(zhǔn)率(Precision)、召回率(Recall)和歸一化折損累積增益(NDCG),其值越大,推薦性能越好。

        (10)

        (11)

        其中,|U|表示用戶總數(shù),S(u)是用戶u的測(cè)試集,S(N;u)是用戶u的測(cè)試集中存在于推薦列表中的項(xiàng)目集合。

        (12)

        其中,i為命中項(xiàng)目的位置,如果命中,則reli=1,否則reli=0。

        NDCG是用戶的DCG值與理想DCG值IDCG值之比,IDCG是用戶的最佳項(xiàng)目排名值。

        (13)

        4.2.2 對(duì)比方法

        選取了2類方法進(jìn)行測(cè)評(píng):(1)PureSVD[4]和sGLSVD[5],這2種方法都只對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行奇異值分解,未考慮用戶的社交信息。選擇這2種方法的目的是驗(yàn)證本文方法引入社交信息對(duì)推薦性能的影響。(2)SBPR[9]和SPF[10],這2種方法與本文方法都是利用社交信息的推薦方法,但是這2種方法都沒有考慮用戶在不同社區(qū)內(nèi)的偏好不同。這2種方法的目的是驗(yàn)證用戶重疊社區(qū)檢測(cè)對(duì)推薦結(jié)果的影響。

        此外,還將本文的LSFS與其2種變體進(jìn)行比較:LSFS-Social和LSFS-Overlap。這2種變體定義如下:

        LSFS-Social:去掉用戶社交關(guān)系,在用戶社區(qū)檢測(cè)時(shí)不利用用戶社交關(guān)系,僅通過一般的聚類方法將用戶分成d個(gè)不同的子集。

        LSFS-Overlap:該變體在用戶社區(qū)檢測(cè)時(shí)只考慮每個(gè)用戶ui隸屬于單一社區(qū)Ck,不考慮用戶重疊社區(qū)檢測(cè)對(duì)推薦結(jié)果的影響。

        實(shí)驗(yàn)參數(shù)影響著方法的最終性能,PureSVD中嘗試的奇異值f的數(shù)量為:{10,15,20,…,95,100,150,200,…,1 000}。sGLSVD在以下值之間改變局部模型fc的值:{1,2,3,5,10,15,…,90,95,100}。SBPR中參數(shù)αu,αv,αb分別設(shè)置為0.015,0.025和0.01。SPF中潛在因子K設(shè)置為40。本文在沒有先驗(yàn)知識(shí)的情況下將社區(qū)數(shù)量大小設(shè)置為{5,10,15,…,45,50},在截?cái)嗥娈愔捣纸庵衅娈愔礷的大小設(shè)置為{1,2,3,5,10,15,…,90,95,100}。

        4.3 實(shí)驗(yàn)結(jié)果與相關(guān)分析

        4.3.1 參數(shù)對(duì)實(shí)驗(yàn)的影響

        本節(jié)將研究用戶社區(qū)數(shù)量d如何影響本文方法LSFS的推薦性能。經(jīng)過多次實(shí)驗(yàn)得到式(5)和式(6)中最佳截?cái)嗥娈愔荡笮。渲性贔ilmTrust數(shù)據(jù)集上fg和fk分別取30和10,在Epinions數(shù)據(jù)集上fg和fk分別取50和20,在Ciao數(shù)據(jù)集上fg和fk分別取45和25。將社區(qū)數(shù)量設(shè)置為{5,10,15,…,45,50},本文方法LSFS在3個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如圖2所示。

        Figure 2 Precision of LSFS with different user communities on the three datasets圖2 不同的用戶社區(qū)數(shù)量下 LSFS在3個(gè)數(shù)據(jù)集集上的Precision

        從圖2可以看出,社區(qū)的數(shù)量會(huì)影響推薦性能,并且LSFS在2個(gè)數(shù)據(jù)集上表現(xiàn)出不同的敏感性。對(duì)于FilmTrust數(shù)據(jù)集,隨著d從5增加到30,LSFS的性能提高,之后它的性能隨著d的增加而降低。對(duì)于Epinions數(shù)據(jù)集,隨著d從5增加到25,LSFS的性能提高,之后開始降低。對(duì)于Ciao數(shù)據(jù)集,隨著d從5增加到40,LSFS的性能提高,之后開始降低。因此,在集合{5,10,15,…,45,50}上LSFS在FilmTrust,Epinions和Ciao上嘗試的最優(yōu)社區(qū)d的值分別為30,25和40。

        4.3.2 模型分析

        為了驗(yàn)證社交信息與用戶重疊社區(qū)檢測(cè)對(duì)本文方法LSFS的影響,將本文方法與2個(gè)變體LSFS-Social、LSFS-Overlap進(jìn)行比較,圖3所示為在3個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果。

        Figure 3 Performance of social information and overlapping community detection圖3 社交信息和重疊社區(qū)檢測(cè)的性能

        社交信息可以提供關(guān)于用戶的額外信息,社交網(wǎng)絡(luò)中擁有社交關(guān)系的用戶往往具有相似的偏好并且互相影響,因此社交關(guān)系可以有效地提高推薦性能。如圖3所示,本文方法LSFS的性能優(yōu)于LSFS-Social,這是因?yàn)長(zhǎng)SFS考慮了用戶的社交信息,基于用戶間的社交關(guān)系進(jìn)行了用戶社區(qū)檢測(cè),而LSFS-Social在用戶社區(qū)檢測(cè)時(shí)沒有考慮社交信息,這表明了用戶社交信息有助于提高推薦性能。

        用戶的興趣是多樣的,用戶在不同的社區(qū)中對(duì)不同的物品感興趣,基于用戶社交信息將用戶劃分到不同的社區(qū)中,每個(gè)用戶可以同時(shí)屬于不同的社區(qū),用戶在不同的社區(qū)中關(guān)注不同的層面,因此用戶重疊社區(qū)檢測(cè)可以捕獲用戶不同的偏好。如圖3所示,本文方法LSFS的性能優(yōu)于LSFS-Overlap,這是因?yàn)長(zhǎng)SFS將用戶同時(shí)劃分到不同的社區(qū)中,而LSFS-Overlap只將用戶劃分到單一社區(qū)中,這表明了用戶重疊社區(qū)檢測(cè)可以有效提高推薦性能。

        4.3.3 與其它方法的比較

        將本文提出的方法LSFS與pureSVD、sGLSVD、SBPR和SPF 4種對(duì)比方法在FilmTrust、Epinions和Ciao 3個(gè)數(shù)據(jù)集上進(jìn)行比較,驗(yàn)證本文方法的性能。表3所示為實(shí)驗(yàn)結(jié)果,每種方法設(shè)置了最佳參數(shù),并顯示出最佳實(shí)驗(yàn)結(jié)果,粗體字表示5種方法的最佳性能。

        Table 3 Experimental results of different recommendation list length N on FilmTrust, Epinions and Ciao表3 在 FilmTrust、Epinions和Ciao上不同推薦列表長(zhǎng)度N的實(shí)驗(yàn)結(jié)果

        可以看出,對(duì)于所有方法,當(dāng)推薦列表的長(zhǎng)度N越大時(shí),推薦性能越好。當(dāng)N取相同的值時(shí)本文方法LSFS表現(xiàn)最佳。pureSVD和sGLSVD只通過奇異值分解建模用戶對(duì)項(xiàng)目的偏好,但未利用用戶的社交信息,而本文方法利用了用戶社交信息將用戶劃分到不同的子集中,進(jìn)一步表明社交信息可以提高推薦性能。SBPR和SPF雖然考慮了用戶的社交信息,但是未考慮用戶在重疊社區(qū)中的特定偏好,表明將用戶劃分到重疊社區(qū)中可以提高推薦性能。這意味著本文方法合理地融合社交信息并進(jìn)行重疊用戶社區(qū)檢測(cè)提高了推薦質(zhì)量。其次,SBPR和SPF的性能優(yōu)于pureSVD和sGLSVD是因?yàn)镾BPR和SPF利用了社交信息,而pureSVD和sGLSVD沒有利用社交信息,這進(jìn)一步表明用戶社交信息對(duì)提高推薦性能有很大的幫助。sGLSVD的性能優(yōu)于pureSVD是因?yàn)閟GLSVD同時(shí)考慮了用戶的全局偏好和局部偏好,而pureSVD沒有考慮用戶的局部偏好。

        5 結(jié)束語(yǔ)

        本文針對(duì)現(xiàn)有的推薦方法忽略了用戶在不同社交維度中偏好不同的問題,提出了一種融合社交信息的局部潛在空間推薦方法。用戶的偏好可以通過所有用戶共享的層面和用戶在不同用戶社區(qū)中特定的層面共同描述,首先利用社交信息將用戶劃分到重疊社區(qū)中捕獲用戶在不同社交維度中的特定偏好,然后通過截?cái)嗥娈愔捣纸饧夹g(shù)建模用戶的共享偏好和特定偏好,最后將二者結(jié)合預(yù)測(cè)用戶的最終偏好。通過在3種不同數(shù)據(jù)集上的實(shí)驗(yàn),驗(yàn)證了本文方法的有效性。

        猜你喜歡
        局部社交矩陣
        社交之城
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        局部分解 巧妙求值
        非局部AB-NLS方程的雙線性B?cklund和Darboux變換與非線性波
        社交距離
        你回避社交,真不是因?yàn)閮?nèi)向
        文苑(2018年17期)2018-11-09 01:29:28
        局部遮光器
        吳觀真漆畫作品選
        初等行變換與初等列變換并用求逆矩陣
        矩陣
        南都周刊(2015年4期)2015-09-10 07:22:44
        无码孕妇孕交在线观看| 麻豆成人久久精品二区三区91| 亚洲视频一区二区免费看| 无码无套少妇毛多18pxxxx| 999国内精品永久免费视频| 日韩精品一区二区三区四区| 91精品国产综合久久国产| 亚洲日韩成人无码| 水蜜桃无码视频在线观看| 自拍亚洲一区欧美另类| 国产一区二区杨幂在线观看性色 | 日本二区三区视频免费观看| 国产av精品麻豆网址| 免费操逼视频| 99ri国产在线观看| 蜜桃视频网站在线免费观看| 亚洲av天堂在线视频| 麻豆久久久9性大片| 婷婷色综合成人成人网小说| 美利坚亚洲天堂日韩精品| 欧美xxxx做受欧美88| 久久久久99精品成人片试看| 无码国产精品色午夜| 一级一片内射视频网址| 日本肥老妇色xxxxx日本老妇| 在线看片无码永久免费aⅴ| 日韩高清av一区二区| 99e99精选视频在线观看| 艳妇臀荡乳欲伦交换在线播放| 免费黄网站久久成人精品| 在线亚洲日本一区二区| 人人摸人人搞人人透| 水蜜桃久久| 最新国内视频免费自拍一区| 高清午夜福利电影在线| 精品久久久久久中文字幕大豆网| 亚洲人成无码网站十八禁| 久久久中文字幕日韩精品| 久久久久亚洲av片无码v| 亚洲一区二区自拍偷拍| 日韩av在线不卡一区二区|