亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法

        2017-08-16 09:38:03萬瀟逸陶婭芝
        關(guān)鍵詞:中心點(diǎn)類別聚類

        王 永,萬瀟逸,陶婭芝,張 璞

        (1.重慶郵電大學(xué) 經(jīng)濟(jì)管理學(xué)院,重慶 400065;2.重慶郵電大學(xué) 計(jì)算機(jī)學(xué)院,重慶 400065)

        基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法

        王 永1,萬瀟逸1,陶婭芝1,張 璞2

        (1.重慶郵電大學(xué) 經(jīng)濟(jì)管理學(xué)院,重慶 400065;2.重慶郵電大學(xué) 計(jì)算機(jī)學(xué)院,重慶 400065)

        針對(duì)傳統(tǒng)協(xié)同過濾推薦算法通常針對(duì)整個(gè)評(píng)分矩陣進(jìn)行計(jì)算,存在效率不高的問題,提出一種基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法。該算法根據(jù)項(xiàng)目的類別屬性對(duì)項(xiàng)目進(jìn)行聚類,構(gòu)建用戶的偏好領(lǐng)域,使用用戶偏好領(lǐng)域內(nèi)的評(píng)分矩陣進(jìn)行用戶間相似度的計(jì)算,得到目標(biāo)用戶的最近鄰居集,并生成推薦結(jié)果。與常用的K-means聚類方法相比,采用K-medoids方法對(duì)項(xiàng)目類別屬性進(jìn)行聚類,不僅克服了評(píng)分聚類可靠性不高的問題,而且算法還具有更好的魯棒性。實(shí)驗(yàn)結(jié)果表明,該算法能有效提高推薦質(zhì)量。

        協(xié)同過濾;K-medoids聚類;用戶偏好;推薦算法

        0 引 言

        在互聯(lián)網(wǎng)技術(shù)的普及與推動(dòng)下,網(wǎng)絡(luò)資源呈現(xiàn)出爆炸增長的態(tài)勢(shì),人們逐步進(jìn)入了大數(shù)據(jù)時(shí)代。尤其在電子商務(wù)領(lǐng)域,當(dāng)用戶面對(duì)海量商品時(shí),往往難以做出準(zhǔn)確的判斷。如何在海量的商品中快速準(zhǔn)確地挑選出用戶需求的產(chǎn)品并智能地推薦給目標(biāo)用戶,成為電子商務(wù)企業(yè)亟待解決的問題。為此,個(gè)性化推薦系統(tǒng)[1]被引入到了該領(lǐng)域中。目前,國內(nèi)外幾乎所有的大型電子商務(wù)平臺(tái)都采用了自動(dòng)化的推薦系統(tǒng)來服務(wù)用戶。

        推薦算法作為推薦系統(tǒng)中最為核心的部分,關(guān)系著整個(gè)推薦系統(tǒng)性能的好壞。當(dāng)前推薦算法主要包括以下幾種:基于內(nèi)容的推薦,協(xié)同過濾推薦,基于網(wǎng)絡(luò)的推薦和混合推薦等。協(xié)同過濾算法是目前在電子商務(wù)領(lǐng)域中應(yīng)用最為廣泛的個(gè)性化推薦技術(shù),其基本假設(shè)是:如果用戶身邊的很多朋友都選購某種商品,那么用戶自己就會(huì)很大幾率地選擇該商品;或者用戶喜歡某類商品,當(dāng)看到和這類商品相似的商品具有很高的評(píng)價(jià)時(shí),則購買該商品的機(jī)率就會(huì)很高[2-4]。

        1 相關(guān)研究

        在電子商務(wù)的應(yīng)用領(lǐng)域,用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)具有數(shù)據(jù)覆蓋面廣,但稀疏性很大的特點(diǎn)。傳統(tǒng)的協(xié)同過濾推薦算法往往針對(duì)整個(gè)用戶評(píng)分矩陣進(jìn)行計(jì)算,這嚴(yán)重制約了算法的運(yùn)行效率和性能。為此,研究者們將聚類引入到推薦算法中,縮小了用戶或項(xiàng)目的最近鄰居搜索范圍,從而提高了推薦的效率[5]。鄧愛林等[6]根據(jù)用戶對(duì)項(xiàng)目評(píng)分的相似性進(jìn)行聚類,然后從與目標(biāo)項(xiàng)目最相似的若干個(gè)聚類中尋找到目標(biāo)項(xiàng)目最近鄰居,該算法能夠保證在盡量小的項(xiàng)目空間上查詢到目標(biāo)項(xiàng)目盡量多的最近鄰,從而提高推薦系統(tǒng)的實(shí)時(shí)響應(yīng)速度。孫輝等[7]提出了一種相似度改進(jìn)的用戶聚類協(xié)同過濾推薦算法,該算法提出相似可信度、用戶對(duì)項(xiàng)目類別喜愛度和用戶對(duì)項(xiàng)目類別關(guān)注度3個(gè)概念來優(yōu)化相似度計(jì)算,然后以該相似度為基礎(chǔ)進(jìn)行用戶聚類,最后依據(jù)同一類別中的用戶進(jìn)行推薦,從而提高推薦效率。王曉耘[8]提出了基于粗糙用戶聚類的協(xié)同過濾推薦模型,該模型將推薦過程分為離線和在線兩部分,離線時(shí),采用粗糙K-means用戶聚類算法將用戶分配到k個(gè)類的上、下近似中形成用戶的初始近鄰集;在線時(shí),從目標(biāo)用戶的初始近鄰集中搜索其最近鄰,預(yù)測(cè)項(xiàng)目評(píng)分并向其產(chǎn)生推薦。實(shí)驗(yàn)對(duì)比表明,該模型能有效提高推薦精度。許鵬遠(yuǎn)等[9]提出了一種基于聚類系數(shù)的推薦算法,該算法在標(biāo)準(zhǔn)二分圖網(wǎng)絡(luò)推薦算法的基礎(chǔ)上加入了對(duì)聚類系數(shù)因素的考慮,重新定義了商品之間相似度的計(jì)算公式,從而獲得了更加精確的推薦結(jié)果。

        現(xiàn)有的諸多基于聚類的協(xié)同過濾算法雖在一定程度上提升了推薦的實(shí)時(shí)性與準(zhǔn)確性,但同時(shí)仍然存在一些不足,主要表現(xiàn)為①僅對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)進(jìn)行聚類,沒有考慮項(xiàng)目本身屬性的相關(guān)性。電子商務(wù)領(lǐng)域內(nèi)的用戶評(píng)分值往往范圍較小,這會(huì)導(dǎo)致聚類效果不好;②沒有考慮用戶實(shí)際的購買偏好。通常,用戶只會(huì)對(duì)某個(gè)或某幾個(gè)領(lǐng)域內(nèi)的商品感興趣。用戶的歷史購買記錄則反映了用戶對(duì)該商品所在領(lǐng)域是存在購買偏好的,而已有算法對(duì)此信息的關(guān)注度不夠。針對(duì)上述問題,本文提出了一種基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法。根據(jù)項(xiàng)目的類別屬性來對(duì)項(xiàng)目進(jìn)行聚類,實(shí)現(xiàn)真正意義上的物以類聚,避免了使用評(píng)分?jǐn)?shù)據(jù)進(jìn)行聚類存在的缺陷。然后通過用戶的歷史購買記錄與項(xiàng)目聚類的結(jié)果相結(jié)合,構(gòu)建用戶的偏好領(lǐng)域,并在用戶的偏好領(lǐng)域內(nèi)進(jìn)行推薦。所以,本文的算法在提高算法執(zhí)行效率的同時(shí),也很好地保證了算法的推薦質(zhì)量,對(duì)推薦算法在電子商務(wù)領(lǐng)域中的實(shí)際應(yīng)用有著重要意義。

        2 基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法

        2.1 基于類別差異性的項(xiàng)目聚類

        2.1.1 項(xiàng)目的類別差異性度量

        在電子商務(wù)領(lǐng)域,項(xiàng)目往往擁有多個(gè)類別標(biāo)簽。假設(shè)項(xiàng)目所有的類別標(biāo)簽集合為T={t1,…,tp},那么項(xiàng)目A所屬的類別信息則可使用向量IA=(A1,A2,…,Ap)來表示

        (1)

        本文采用二元相異度來定義項(xiàng)目之間的類別差異性。設(shè)項(xiàng)目A和B的類別向量分別為(A1,A2,…,Ap)和(B1,B2,…,Bp),則項(xiàng)目A和B之間的類別差異性公式為

        (2)

        (2)式中:q表示Ai=Bi=1的變量的個(gè)數(shù);r表示Ai=1,Bi=0的變量的個(gè)數(shù);s表示Ai=0,Bi=1的變量的個(gè)數(shù);t表示Ai=Bi=0的變量的個(gè)數(shù)。

        2.1.2 基于K-medoids的項(xiàng)目聚類

        本文將項(xiàng)目的類別差異性作為判斷項(xiàng)目間距離遠(yuǎn)近的標(biāo)準(zhǔn),采用K-medoids方法[10]對(duì)項(xiàng)目進(jìn)行聚類。同時(shí),為了減少K-medoids方法迭代的次數(shù),我們改進(jìn)了初始點(diǎn)的選擇,從而提高了算法的效率。算法的具體處理過程如下。

        步驟1 選擇初始中心點(diǎn)

        1)根據(jù)(2)式計(jì)算所有項(xiàng)目之間的類別差異性;

        2)根據(jù)(3)式計(jì)算每個(gè)項(xiàng)目的Vj值;

        (3)

        3)將所有的Vj值按升序排序,選擇前k個(gè)Vj值對(duì)應(yīng)的項(xiàng)目作為初始中心點(diǎn),得到個(gè)聚類簇{C1,C2,…,Ck};

        4)計(jì)算非中心點(diǎn)與各中心點(diǎn)之間的類別差異性,并將非中心點(diǎn)項(xiàng)目分配到與之類別差異性最小的中心點(diǎn)所對(duì)應(yīng)的簇中;

        5)計(jì)算每個(gè)簇中所有項(xiàng)目與中心點(diǎn)項(xiàng)目之間的類別差異性之和,并將結(jié)果保存在變量Sum中。

        步驟2 更新中心點(diǎn)。在每個(gè)簇中尋找新的中心點(diǎn)項(xiàng)目,要求新的中心點(diǎn)項(xiàng)目與簇中其他項(xiàng)目間之間的類別差異性之和最小。

        步驟3 分配項(xiàng)目到各個(gè)簇中

        1)依據(jù)類別差異性最小的原則,重新劃分每個(gè)非中心點(diǎn)的項(xiàng)目。即將項(xiàng)目分配到與之類別差異性最小的中心點(diǎn)所在的簇中;

        2)再次計(jì)算簇中其他所有項(xiàng)目與中心點(diǎn)項(xiàng)目之間的類別差異性之和,如果新得到的結(jié)果和Sum值相同,則算法結(jié)束;否則,返回步驟2。

        2.2 用戶偏好集合的構(gòu)建

        在電子商務(wù)應(yīng)用領(lǐng)域,用戶通常只會(huì)對(duì)某個(gè)或某幾個(gè)領(lǐng)域內(nèi)的項(xiàng)目感興趣,因此,構(gòu)建良好的用戶偏好集合對(duì)最終的推薦結(jié)果有重要的影響。用戶對(duì)項(xiàng)目的歷史購買記錄往往可以作為構(gòu)建用戶偏好集的重要依據(jù)。

        假設(shè)項(xiàng)目的集合為I,根據(jù)2.1節(jié)提出的K-medoids聚類算法,得到項(xiàng)目聚類的簇集合為Cluster{C1,C2,…,Ck} 。對(duì)目標(biāo)用戶u,構(gòu)建他的偏好集合和對(duì)應(yīng)的評(píng)分矩陣過程如下。

        步驟1 獲取目標(biāo)用戶u已購買的項(xiàng)目集合,將其表示為Iu{Iu1,Iu2,…,Iux}。

        步驟2 搜索項(xiàng)目聚類空間Cluster,找到Iu中每一個(gè)項(xiàng)目所屬的簇集,將這些簇集合并到一起,即為用戶u的偏好集合。

        步驟3 根據(jù)用戶的偏好集合,從整體的評(píng)分矩陣中抽取對(duì)應(yīng)項(xiàng)目的評(píng)分,即得到該偏好集合對(duì)應(yīng)的評(píng)分矩陣。

        2.3 推薦算法

        本文提出的推薦算法的具體步驟如下。

        步驟1 項(xiàng)目聚類。首先根據(jù)2.1.1節(jié)的方法,計(jì)算項(xiàng)目之間的類別差異性;然后,根據(jù)2.1.2節(jié)的K-medoids聚類方法,完成對(duì)項(xiàng)目聚類操作,得到相應(yīng)的簇。

        步驟2 構(gòu)建目標(biāo)用戶評(píng)分矩陣。按照2.2節(jié)的方法,基于步驟1中得到的項(xiàng)目簇,得到目標(biāo)用戶的偏好集合。然后,以偏好集合為依據(jù),從整個(gè)用戶評(píng)分矩陣中劃分出針對(duì)目標(biāo)用戶的子評(píng)分矩陣。

        步驟3 計(jì)算用戶相似度。由于步驟2已經(jīng)將計(jì)算用戶相似度的數(shù)據(jù)空間從整個(gè)用戶評(píng)分矩陣縮減為了用戶偏好領(lǐng)域內(nèi)的評(píng)分矩陣,因此,利于提高推薦算法的執(zhí)行速度。本文使用修正余弦公式度量用戶的相似性,其公式為

        sim(i,j)=

        (4)

        步驟4 計(jì)算用戶相似度。由于步驟2已經(jīng)將計(jì)算用戶相似計(jì)算預(yù)測(cè)評(píng)分并產(chǎn)生推薦項(xiàng)目。根據(jù)步驟3中得到的用戶的相似度,從中選取TOP-N個(gè)最鄰近的用戶;然后,根據(jù)鄰近用戶的評(píng)分預(yù)測(cè)目標(biāo)用戶對(duì)項(xiàng)目的評(píng)分。假設(shè)目標(biāo)用戶為u,其最近鄰居集合為Nu,那么用戶u對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分Pu,i為

        (5)

        (5)式中:Rx,i表示用戶x對(duì)項(xiàng)目i的評(píng)分;Ci表示項(xiàng)目i所在的簇;N1和N2分別表示用戶u和x在Ci內(nèi)評(píng)分的項(xiàng)目總數(shù)。

        通過上述方法,對(duì)目標(biāo)用戶偏好領(lǐng)域內(nèi)的所有未評(píng)分的項(xiàng)目預(yù)測(cè)其評(píng)分,得到待推薦項(xiàng)目預(yù)測(cè)評(píng)分集合L。設(shè)定閾值α,將預(yù)測(cè)評(píng)分Pu,i大于α的項(xiàng)目推薦給目標(biāo)用戶,其余的項(xiàng)目則不推薦。

        3 實(shí)驗(yàn)結(jié)果與分析

        3.1 數(shù)據(jù)集

        采用美國Minnesota大學(xué)GroupLens項(xiàng)目組提供的MovieLens數(shù)據(jù)集[2]作為實(shí)驗(yàn)數(shù)據(jù)集。該數(shù)據(jù)集是目前協(xié)同過濾推薦領(lǐng)域使用最為廣泛的非商業(yè)性質(zhì)的數(shù)據(jù)集。MovieLens數(shù)據(jù)集中,每位用戶至少對(duì)20部電影進(jìn)行了評(píng)分,評(píng)分范圍為1到5的整數(shù)。MovieLens提供了多種規(guī)模的數(shù)據(jù)集,本文選用ml-100k數(shù)據(jù)集作為算法測(cè)試的對(duì)象,該數(shù)據(jù)集包括了943名用戶對(duì)1 682部電影的100 000個(gè)評(píng)分?jǐn)?shù)據(jù)。

        3.2 評(píng)估指標(biāo)

        目前,推薦系統(tǒng)主要使用統(tǒng)計(jì)精度度量和決策支持精度2大類方法來評(píng)價(jià)推薦算法的好壞。統(tǒng)計(jì)精度度量方法中最常用的評(píng)價(jià)指標(biāo)是平均絕對(duì)偏差(mean absolutely error ,MAE)。

        MAE通過比較用戶對(duì)項(xiàng)目的預(yù)測(cè)評(píng)分值與實(shí)際評(píng)分值之間的偏差來衡量預(yù)測(cè)結(jié)果的準(zhǔn)確性,MAE 越小,準(zhǔn)確性越高[11]。MAE的計(jì)算公式為

        (6)

        (6)式中:pi表示用戶對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分;qi表示用戶對(duì)項(xiàng)目i的實(shí)際評(píng)分;N表示總的評(píng)分?jǐn)?shù)目。

        決策支持精度度量方法中主要的評(píng)價(jià)指標(biāo)有召回率(Recall)、準(zhǔn)確率(Precision)等。召回率反映了待推薦的項(xiàng)目被推薦的比率,準(zhǔn)確率則反映了推薦的成功率,計(jì)算公式分別為

        (7)

        (8)

        (7)—(8)式中:PrecisionSet表示算法推薦的項(xiàng)目集合;ReferenceSet表示用戶實(shí)際進(jìn)行了評(píng)分的項(xiàng)目集合。

        由于準(zhǔn)確率與召回率之間存在負(fù)相關(guān)關(guān)聯(lián),為了綜合考慮這兩方面的性能,故而使用綜合值F在二者間找到最佳平衡點(diǎn),F(xiàn)的值越高,推薦效果越好,計(jì)算公式為

        (9)

        3.3 實(shí)驗(yàn)結(jié)果分析

        為了測(cè)試算法的推薦質(zhì)量,本文設(shè)計(jì)了2組實(shí)驗(yàn)來進(jìn)行檢驗(yàn)。第1組實(shí)驗(yàn)使用數(shù)據(jù)集提供的已劃分好的訓(xùn)練集與測(cè)試集來計(jì)算MAE并與其他算法進(jìn)行對(duì)比。參與對(duì)比的算法有基于用戶的協(xié)同過濾推薦[3]、一種相似度改進(jìn)的用戶聚類協(xié)同過濾推薦[7]和基于粗糙用戶聚類的協(xié)同過濾推薦[8]。第2組實(shí)驗(yàn)使用全部的用戶評(píng)分?jǐn)?shù)據(jù),然后采用隨機(jī)抽取的方法將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集,訓(xùn)練集與測(cè)試集所占的比例分別為80%和20%,該部分實(shí)驗(yàn)用來計(jì)算Recall,Precision和F,參與該組實(shí)驗(yàn)對(duì)比的算法有基于用戶的協(xié)同過濾推薦[3]、基于聚類系數(shù)的推薦算法[9]。

        第1組實(shí)驗(yàn),將目標(biāo)用戶的鄰居個(gè)數(shù)從10增加到30,間隔為5,查看鄰居集大小的改變對(duì)MAE值的影響。MAE值越小,預(yù)測(cè)評(píng)分與用戶的實(shí)際評(píng)分之間的偏差越小,推薦精度越高。實(shí)驗(yàn)對(duì)比結(jié)果如圖1所示??梢园l(fā)現(xiàn),在不同大小的鄰居用戶集條件下,本文算法的MAE值都明顯小于其他幾種算法,說明本文算法的推薦質(zhì)量是優(yōu)于其他幾種算法。

        圖1 MAE對(duì)比圖Fig.1 Comparison chart of MAE

        第2組實(shí)驗(yàn),考慮到實(shí)際推薦過程中不會(huì)將所有計(jì)算了預(yù)測(cè)評(píng)分的項(xiàng)目都推薦給目標(biāo)用戶,因此,設(shè)置閾值過濾預(yù)測(cè)評(píng)分過低的項(xiàng)目,實(shí)驗(yàn)結(jié)果如圖2所示。可以看到,隨著閾值的增大,召回率呈現(xiàn)大幅下降的趨勢(shì),準(zhǔn)確率呈現(xiàn)小幅上升趨勢(shì),F(xiàn)值則在閾值處于中間水平時(shí)保持較小幅度的波動(dòng),當(dāng)閾值過高時(shí),則會(huì)呈現(xiàn)出下降趨勢(shì)。

        表1列出了本文算法與基于用戶的協(xié)同過濾推薦[3]和基于聚類系數(shù)的推薦算法[9]的實(shí)驗(yàn)對(duì)比結(jié)果??梢钥闯?,本文算法的準(zhǔn)確率和F值相較于其他2種算法更高,說明本文算法的推薦效果更佳。

        本文使用項(xiàng)目類別屬性對(duì)項(xiàng)目進(jìn)行聚類,并依據(jù)聚類結(jié)果來構(gòu)建用戶的偏好領(lǐng)域,最終將整個(gè)數(shù)據(jù)集縮減為目標(biāo)用戶偏好領(lǐng)域內(nèi)的數(shù)據(jù)集。相較于傳統(tǒng)的協(xié)同過濾推薦算法,本文算法在效率上的提升主要體現(xiàn)在2個(gè)方面:①計(jì)算相似度時(shí),可以提高搜索效率,從而提高計(jì)算效率;②在選擇待推薦項(xiàng)目時(shí),只選擇用戶偏好領(lǐng)域內(nèi)的項(xiàng)目,可以減少無效項(xiàng)目的預(yù)測(cè)評(píng)分的計(jì)算,從而提升算法性能。

        圖2 決策精度實(shí)驗(yàn)結(jié)果Fig.2 Experimental results of decision accuracy

        RecallPrecisionF文獻(xiàn)[3]算法0.29090.13510.1970文獻(xiàn)[9]算法0.55320.08640.1495本文算法0.35450.13680.1975

        4 結(jié)束語

        針對(duì)傳統(tǒng)協(xié)同過濾推薦算法在整個(gè)評(píng)分矩陣上進(jìn)行計(jì)算存在效率不高以及未考慮用戶偏好導(dǎo)致推薦質(zhì)量不高的問題,本文提出了一種基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法。本算法首先根據(jù)項(xiàng)目的類別屬性對(duì)項(xiàng)目進(jìn)行類別差異性度量并以此為依據(jù)對(duì)項(xiàng)目進(jìn)行聚類處理,然后構(gòu)建目標(biāo)用戶偏好集合及對(duì)應(yīng)的用戶評(píng)分矩陣。一方面縮減了用戶評(píng)分矩陣,提升了算法的計(jì)算效率;另一方面,考慮了用戶偏好問題并在用戶偏好領(lǐng)域內(nèi)進(jìn)行推薦,提高了推薦質(zhì)量。實(shí)驗(yàn)結(jié)果表明,本文提出的基于K-medoids項(xiàng)目聚類的協(xié)同過濾推薦算法相較于文中對(duì)比的其他幾種推薦算法,在評(píng)測(cè)指標(biāo)上效果表現(xiàn)更好,說明本文提出的推薦算法是可行且有效的。

        [1] 許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362. XU Hailing,WU Xiao,LI Xiaodong,et al.Comparison Study of Internet Recommendation System[J].Journal of Software,2009,20(2):350-362.

        [2] 奉國和,梁曉婷.協(xié)同過濾推薦研究綜述[J].圖書情報(bào)工作,2011,55(16):126-130. FENG Guohe,LIANG Xiaoting.Review on collaborative filtering recommendation[J].Library and Information Service,2011,55(16):126-130.

        [3] YU Chuan,XU Jieping,DU Xiaoyong .Recommendation algorithm combining the user-based classified regression and the item-based filtering[C]// International Conference on Electronic Commerce: the New ECommerce-Innovations for Conquering Current Barriers,Obstacles and Limitations To Conducting Successful Business on the Internet,2006.Fredericton,New Brunswick,Canada:DBLP,2006:574-578.

        [4] KARYPIS G.Evaluation of Item-Based Top-N Recommendation Algorithms[C]//Tenth International Conference on Information and Knowledge Management. [s.l.]: ACM Press, 2000: 247-254.

        [5] 曹洪江,傅魁.協(xié)同過濾推薦系統(tǒng)中聚類搜索方法研究[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(5):16-20. CAO Hongjiang,F(xiàn)U Kui.Research on clustering search method in collaborative filtering recommendation system[J].Computer Engineering and Applications, 2014,50(5):16-20.

        [6] 鄧愛林,左子葉,朱揚(yáng)勇.基于項(xiàng)目聚類的協(xié)同過濾推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(9):1665-1670. DENG Ailin,ZUO Ziye,ZHU Yangyong.Col laborative Filtering Recommendation Algorithm Based on Item Clustering[J].Journal of Chinese Computer Systems,2004,25(9):1665-1770.

        [7] 孫輝,馬躍,楊海波,等.一種相似度改進(jìn)的用戶聚類協(xié)同過濾推薦算法[J].小型微型計(jì)算機(jī)系統(tǒng),2014,35(9):1967-1970. SUN Hui,MA Yue,YANG Haibo,et al.Collaborative filtering recommendation algorithm by optimizing similarity and clustering users[J].Journal of Chinese Computer Systems,2014,35(9):1967-1970.

        [8] 王曉耘,錢璐,黃時(shí)友.基于粗糙用戶聚類的協(xié)同過濾推薦模型[J].現(xiàn)代圖書情報(bào)技術(shù),2015,31(1):45-51. WANG Xiaoyun,QIAN Lu,HUANG Shiyou.Collaborative Filtering Recommendation Model Based on Rough User Clustering[J].New Technology of Library and Information Service,2015,31(1):45-51.

        [9] 許鵬遠(yuǎn),黨延忠.基于聚類系數(shù)的推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2016,33(3):654-656. XU Pengyuan,DANG Yanzhong.Modified recommendation algorithm based on clustering coefficient[J].Application Research of Computers,2016,33(3):654-656.

        [10] PARK H S,JUN C H.A simple and fast algorithm for K-medoids clustering[J].Expert Systems with Applications,2009,36(2):3336-3341.

        [11] 朱郁筱,呂琳媛.推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J].電子科技大學(xué)學(xué)報(bào),2012,41(2):163-175. ZHU Yuxiao,LV Linyuan.Evaluation metrics for recommender systems[J].Journal of University of Electronic Science and Technology of China,2012,41(2):163-175.

        萬瀟逸(1991-), 男, 湖北安陸人, 碩士研究生, 主要研究領(lǐng)域?yàn)閃eb數(shù)據(jù)挖掘, 管理信息系統(tǒng)等。

        陶婭芝(1991-), 女, 重慶人, 碩士研究生, 主要研究領(lǐng)域?yàn)橹R(shí)發(fā)現(xiàn), Web數(shù)據(jù)挖掘等。

        張 璞(1977-), 男, 重慶人, 副教授,博士, 主要研究領(lǐng)域?yàn)樽匀徽Z言處理, 語義分析和文本挖掘。

        (編輯:王敏琦)

        s:The National Science Foundation of China (61502066);The Chongqing frontier and applied basic research (general) (cstc2015jcyjA40025);The Social Science Planning Fund Program (2015SKZ09)

        In general, traditional collaborative filtering recommendation algorithms do the prediction computation based on the whole rating matrix, which leads to the low efficiency. To remedy this weakness, a collaborative filtering recommendation algorithm based on K-medoids item clustering is proposed. The proposed algorithm clustered the items according to the item category attributes, and then constructed the user preference domain. Only the rating matrix in the user preferences domain is used to calculate the user similarity and generates the nearest neighbor set of the target user and recommendation results. Different from the other K-means based clustering methods, the present K-medoids based clustering method focuses on the item category attributes, which overcomes the low reliability problem of using user ratings. Moreover, the present clustering method has better robustness. Experimental results show that the proposed algorithm improves the recommendation quality.

        collaborative filtering;K-medoids clustering;user preference;recommendation algorithm

        10.3979/j.issn.1673-825X.2017.04.015

        2017-01-10

        2017-05-22 通訊作者:王 永 wangyong1@cqupt.edu.cn

        國家自然科學(xué)基金(61502066);重慶市前沿與應(yīng)用基礎(chǔ)研究(一般)項(xiàng)目(cstc2015jcyjA40025);重慶市社會(huì)科學(xué)規(guī)劃管理項(xiàng)目(2015SKZ09)

        TP391

        A

        1673-825X(2017)04-0521-06

        Collaborative filtering recommendation algorithm based onK-medoids item clustering

        (1.School of Economics and Management, Chongqing University of Posts and Telecommunications, Chongqing 400065, P.R. China;2.School of Computer Science, Chongqing University of Posts and Telecommunications, Chongqing 400065,P.R. China)

        王 永(1977-), 男, 四川自貢人, 教授,博士,主要研究領(lǐng)域?yàn)閃eb數(shù)據(jù)挖掘, 知識(shí)發(fā)現(xiàn), 信息安全與信息管理。負(fù)責(zé)和參與國家和省部級(jí)項(xiàng)目10余項(xiàng),在國內(nèi)外重要學(xué)術(shù)刊物上發(fā)表學(xué)術(shù)論文30多篇,被SCI檢索10篇次,EI檢索10篇次。E-mail:wangyong1@cqupt.edu.cn。

        WANG Yong1,WAN Xiaoyi1,TAO Yazhi1,ZHANG Pu2

        猜你喜歡
        中心點(diǎn)類別聚類
        Scratch 3.9更新了什么?
        如何設(shè)置造型中心點(diǎn)?
        電腦報(bào)(2019年4期)2019-09-10 07:22:44
        基于DBSACN聚類算法的XML文檔聚類
        漢字藝術(shù)結(jié)構(gòu)解析(二)中心點(diǎn)處筆畫應(yīng)緊奏
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        基于改進(jìn)的遺傳算法的模糊聚類算法
        尋找視覺中心點(diǎn)
        大眾攝影(2015年9期)2015-09-06 17:05:41
        一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
        論類別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        亚洲av熟女一区二区三区站| 一级呦女专区毛片| 国产亚洲精选美女久久久久 | 久久国产亚洲高清观看5388| 国产乱老熟视频乱老熟女1| 亚洲最大中文字幕在线| 亚洲国产成人影院在线播放| 欧美黄色免费看| 91国语对白在线观看| 欧美最猛性xxxx| 亚洲国产精品日韩av专区| 全部免费国产潢色一级| 中文字幕亚洲中文第一| 欧美丰满少妇xxxx性| 亚洲永久无码7777kkk| 在线成人tv天堂中文字幕| 日韩精品中文字幕第二页| 夜夜躁狠狠躁日日躁2022| 国内精品久久久久久久久久影院 | 一本到亚洲av日韩av在线天堂| 日韩精品人妻中文字幕有码| 人与嘼交av免费| 第九色区Aⅴ天堂| 中文字幕色偷偷人妻久久一区| s级爆乳玩具酱国产vip皮裤 | 2020最新国产激情| 国产av剧情刺激对白| 国产精品无码久久久久久久久久| 综合色天天久久| 色婷婷一区二区三区久久亚洲| 国产欧美亚洲精品第一页| 久久香蕉免费国产天天看| 国产女人高潮的av毛片| 日本三级香港三级人妇99| 青草国产精品久久久久久| 亚洲国产成人久久综合三区| 9久久婷婷国产综合精品性色| 亚洲性爱视频| 911国产在线观看精品| 亚洲乱码一区二区av高潮偷拍的| 国产色在线 | 亚洲|