亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于文本聚類的用戶聚類在推薦系統(tǒng)中的應(yīng)用

        2016-08-07 04:54:28劉源耿瑞煥
        大科技 2016年25期
        關(guān)鍵詞:鶴壁余弦相似性

        劉源 耿瑞煥

        (鶴壁汽車工程職業(yè)學(xué)院 鶴壁 458030)

        基于文本聚類的用戶聚類在推薦系統(tǒng)中的應(yīng)用

        劉源 耿瑞煥

        (鶴壁汽車工程職業(yè)學(xué)院 鶴壁 458030)

        協(xié)同過濾是推薦系統(tǒng)中最重要的技術(shù)之一。隨著電子商務(wù)用戶和商品數(shù)目的增加,在商品空間上用戶評分數(shù)據(jù)極端稀疏。本文提出一種基于文本聚類的用戶聚類方法,對用戶評論做文本聚類處理,再經(jīng)過余弦相似性度量,得到用戶聚類,最終做出推薦。實驗結(jié)果表明,該方法可以反映用戶的真實興趣,有效的解決了稀疏性問題。

        協(xié)同過濾;稀疏矩陣;文本聚類;用戶聚類

        目前,個性化推薦的應(yīng)用日益廣泛,已成為Web2.0時代的核心技術(shù)。本文提出一種基于文本聚類的用戶聚類方法,對用戶的評分做出預(yù)測,在一定的可靠性前提下解決了矩陣的稀疏性問題,提高推薦質(zhì)量。

        1 相關(guān)工作

        文本聚類根據(jù)文檔的某種聯(lián)系或相關(guān)性對文檔集合進行有效的組織、摘要和導(dǎo)航,方便人們從文檔集中發(fā)現(xiàn)相關(guān)的信息。

        協(xié)同過濾推薦算法基于這樣一個假設(shè):

        假設(shè)1:如果用戶對一些項目的評分比較相似,則他們對其他項目的評分也會比較相似。

        基于用戶的協(xié)同過濾算法整個過程可以分為以下三步:

        步驟1:找出目標(biāo)用戶的最近鄰居,首先采用用戶-項陣Rm,n表示用戶評分信息,其中m行表示m個用戶,n列表示n個項目,Ri,j表示用戶i對項目j的評分值。

        步驟2:計算用戶相似性,找出最近鄰居。

        相似性度量方法有余弦相似性、修正的余弦相似性和相關(guān)相似性3種,我們選擇相關(guān)相似性方法。

        相關(guān)相似性:設(shè)經(jīng)用戶i和用戶j共同評分的項目集合用Iij表示,相似度 sim(i,j)為:

        步驟3:根據(jù)相似用戶對同一商品評分相近的假設(shè)為目標(biāo)用戶做出推薦。

        2 基于文本聚類的用戶聚類方法

        本文本文提出一種基于文本聚類的用戶聚類評分預(yù)測算法,以填充稀疏矩陣Rm,n。整個算法分為兩部分。

        2.1 離線部分(用戶聚類)

        (1)選取聚類中心用戶i;

        (2)用余弦相似性度量計算得出同用戶i相似性最高的h-1個用戶與用戶i組成以i為中心,模為h的用戶簇NSi。

        2.2 在線部分(評分預(yù)測)

        若目標(biāo)用戶i已經(jīng)在離線階段生成用戶簇NSi,則只需將離線時獲得的用戶簇NSi中所有的h個用戶平均評分作為目標(biāo)用戶評分預(yù)測,填充矩陣 Rm,n。

        2.3 理論依據(jù)

        文本聚類將聚類在一個文本簇的評價的所有發(fā)出者(用戶)認為為一個用戶簇Cluster。用類似于用戶-項矩陣Rm,n的用戶-簇矩陣Sm,k來表示用戶與用戶簇簇的關(guān)系:

        表1

        當(dāng)目標(biāo)用戶i不同時,NSi也會不同,將個別用戶單獨為中心進行聚類有更高的精確程度。這種聚類可以理解為預(yù)處理運算,它的實質(zhì)是通過對文本聚類得到第一次用戶簇Cluster1~Clusterk,由于這個簇并不是我們需要的用戶簇NSi,所以我們需要進一步計算,以得到的用戶簇Cluster1~Clusterk作為維度進行余弦相似性的計算得到用戶簇NSi。

        3 實驗結(jié)果及分析

        3.1 數(shù)據(jù)集的選擇

        用戶簇-文本簇的關(guān)系同論文引用的關(guān)系非常相似:每篇引用者論文都可以考慮為一個用戶,每篇被引用論文都可以考慮為一個文本簇。最終選用了一份關(guān)于論文引用的數(shù)據(jù)集,數(shù)據(jù)集包括了629814篇論文和3021489個引用關(guān)系,由于數(shù)據(jù)集提供者已經(jīng)將外部引用關(guān)系刪除,所以這里所提到的引用,均指內(nèi)部引用。因此這個數(shù)據(jù)集可以抽象為一個圖,圖中論文作為一個頂點,引用作為一條邊。將入度最高的12596個頂點的作為被引用論文,將從這些頂點出發(fā)的邊全部刪除;剩下的50385個頂點作為引用者論文,將從進入這些頂點的邊全部刪除。若將這些邊看做無向的,則圖變成一個二部圖。它的關(guān)聯(lián)矩陣即為Sm,k矩陣。其中被引用論文為Cluster,引用者論文為User。

        3.2 驗證過程

        (1)記成功次數(shù) Ns=0,Nf=0。

        (2)隨機抽取值為1的項,將其置0。

        (3)根據(jù)矩陣 Sm,k求出用戶 i的用戶簇 NSi。

        (4)遍歷NSi中除了i以外的所有用戶,統(tǒng)計他們屬于Clusterj的數(shù)量,如果超過了NSi的規(guī)模h的一半,則Ns+1,否則Nf+1

        (5)反復(fù)進行步驟2-步驟4,進行k次。得到最終的Ns和Nf。成功率=

        3.3 驗證結(jié)果及分析

        由表2可以看出,當(dāng)h=15或20時,精度達到了0.61以上,可以認為本文提出的基于文本聚類的用戶聚類方法能夠可靠的反應(yīng)用戶的興趣聚類情況,當(dāng)抽樣次數(shù)k>5000次時,精度基本穩(wěn)定。

        表2

        4 結(jié)論

        本文提出了一種基于聚類的評分預(yù)測模型,通過聚類技術(shù)術(shù)將具有相似興趣愛好的用戶分配到相同的簇中,用戶簇NSi產(chǎn)生之后,根據(jù)簇中其他用戶對商品的評價預(yù)測目標(biāo)用戶對該商品的評價,從而填充稀疏矩陣Rm,n,提高了推薦的質(zhì)量。實驗表明,這種基于文本聚類的用戶聚類方法是比較可靠的。

        [1]姚清耘,劉功申.基于向量空間模型的文本聚類算法.計算機工程.2008,18:39~41

        [2]王輝,高利軍.個性化服務(wù)中基于用戶聚類的協(xié)同過濾推薦.計算機應(yīng)用,2007,5:1225~1227.

        [3]趙 亮,胡乃靜.個性化推薦算法設(shè)計.計算機研究與發(fā)展,2002,39(8):986~991.

        TP319

        A

        1004-7344(2016)25-0327-02

        2016-8-20

        劉源(1986-),男,漢族,河南鶴壁人,助教,碩士,主要從事網(wǎng)絡(luò)計算、物聯(lián)網(wǎng)方向的研究。

        猜你喜歡
        鶴壁余弦相似性
        一類上三角算子矩陣的相似性與酉相似性
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        新?lián)?dāng) 新作為 開創(chuàng)鶴壁人大工作新局面
        宣傳好鶴壁人大履職的鮮活實踐
        建設(shè)“法治鶴壁”人大全力以赴
        “四個推進”建設(shè)平安鶴壁
        兩個含余弦函數(shù)的三角母不等式及其推論
        低滲透黏土中氯離子彌散作用離心模擬相似性
        分數(shù)階余弦變換的卷積定理
        圖像壓縮感知在分數(shù)階Fourier域、分數(shù)階余弦域的性能比較
        成人大片免费视频播放一级| 本道无码一区二区久久激情| 久久精品国产一区二区涩涩| 日本一区二区三区光视频 | 大ji巴好深好爽又大又粗视频| 国产真人无码作爱视频免费 | 国产美女主播福利一区| 国产让女高潮的av毛片| 少妇下面好紧好多水真爽播放| 日韩区在线| 一二区视频免费在线观看| 亚洲黄色天堂网站在线观看禁18| 中文字幕一区二区三区乱码| 精品少妇爆乳无码aⅴ区| 国产亚洲av一线观看| 国产一区二区三区小说| 国精产品一品二品国在线| 亚洲日产国无码| 97超碰精品成人国产| 亚洲h在线播放在线观看h| 久久99精品久久久久久齐齐百度| 国产精品亚洲av一区二区三区| 亚洲av午夜精品无码专区| 韩国精品一区二区三区无码视频 | 日本高清视频xxxxx| 国产日韩欧美网站| 日本人妻三级在线观看| √天堂资源中文www| 亚洲日韩精品国产一区二区三区| 日本av一区二区播放| 亚洲高清三区二区一区| 在线不卡av片免费观看| 人妻精品久久中文字幕| 日韩av一区二区不卡在线| aa片在线观看视频在线播放| 精品欧美乱子伦一区二区三区| 一本大道加勒比东京热| 午夜爽爽爽男女免费观看影院| 欧美白人最猛性xxxxx| 国产精品亚洲一区二区三区正片 | 视频福利一区二区三区|