亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過(guò)濾算法

        2016-07-19 21:08:37楊家慧劉方愛(ài)
        計(jì)算機(jī)應(yīng)用 2016年7期
        關(guān)鍵詞:巴氏相似性度量

        楊家慧 劉方愛(ài)

        摘要:針對(duì)傳統(tǒng)基于鄰域的協(xié)同過(guò)濾推薦算法存在數(shù)據(jù)稀疏性及相似性度量只能利用用戶(hù)共同評(píng)分的問(wèn)題,提出一種基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過(guò)濾算法(CFBJ)。在項(xiàng)目相似性度量中,該算法引入巴氏系數(shù)和Jaccard系數(shù),巴氏系數(shù)利用用戶(hù)所有評(píng)分信息克服共同評(píng)分的限制,Jaccard系數(shù)可以增加相似性度量中共同評(píng)分項(xiàng)所占的比重。該算法通過(guò)提高項(xiàng)目相似度準(zhǔn)確率來(lái)選取最近鄰,優(yōu)化了對(duì)目標(biāo)用戶(hù)的偏好預(yù)測(cè)和個(gè)性化推薦。實(shí)驗(yàn)結(jié)果表明,該算法比平均值杰卡德差分(MJD)算法、皮爾森系數(shù)(PC)算法、杰卡德均方差(JMSD)算法、PIP算法誤差更小,分類(lèi)準(zhǔn)確率更高,有效緩解了用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏所帶來(lái)的問(wèn)題,提高了推薦系統(tǒng)的預(yù)測(cè)準(zhǔn)確率。

        關(guān)鍵詞:

        協(xié)同過(guò)濾;巴氏系數(shù);杰卡德系數(shù);相似性度量;矩陣稀疏性

        中圖分類(lèi)號(hào): TP301.6 文獻(xiàn)標(biāo)志碼:A

        0引言

        推薦系統(tǒng)[1]根據(jù)用戶(hù)的興趣特點(diǎn)和歷史記錄向用戶(hù)推薦感興趣的內(nèi)容,有效解決信息過(guò)載問(wèn)題,從而使用戶(hù)在海量數(shù)據(jù)中快速、準(zhǔn)確地找到有價(jià)值的信息。協(xié)同過(guò)濾推薦[2]是推薦系統(tǒng)中最基本的算法之一,分為基于用戶(hù)的協(xié)同過(guò)濾推薦[3]和基于項(xiàng)目的協(xié)同過(guò)濾推薦[4]。協(xié)同過(guò)濾算法的基本思想是計(jì)算用戶(hù)或項(xiàng)目間相似度,然后根據(jù)相似度預(yù)測(cè)目標(biāo)用戶(hù)對(duì)目標(biāo)項(xiàng)目的評(píng)分并產(chǎn)生推薦集。

        當(dāng)前協(xié)同過(guò)濾推薦算法存在數(shù)據(jù)稀疏性[5]問(wèn)題,當(dāng)數(shù)據(jù)集項(xiàng)目較多時(shí),用戶(hù)項(xiàng)目矩陣數(shù)據(jù)通常十分稀疏。傳統(tǒng)的相似性度量如皮爾森相關(guān)系數(shù)[6]和余弦相似性[7]等在計(jì)算用戶(hù)或項(xiàng)目間相似性時(shí)依賴(lài)于用戶(hù)對(duì)項(xiàng)目的共同評(píng)分。假設(shè)在評(píng)分矩陣中,用戶(hù)的評(píng)分?jǐn)?shù)量較少或者有共同評(píng)分的項(xiàng)目很少,那么相似性度量就存在一定偶然性[8],不適用于稀疏矩陣。為了解決數(shù)據(jù)稀疏性問(wèn)題,相關(guān)研究引入了不同的相似性度量。例如,Luo等[9]通過(guò)引入局部用戶(hù)相似性和全局用戶(hù)相似性來(lái)解決稀疏數(shù)據(jù)中的相似性問(wèn)題,利用每個(gè)用戶(hù)的奇異向量計(jì)算用戶(hù)之間的局部相似性,最后把局部近鄰和全局近鄰的預(yù)測(cè)進(jìn)行線(xiàn)性擬合。Ahn等[10]提出了PIP(ProximityImpactPopularity)度量模型,通過(guò)分析皮爾遜相似性度量和余弦相似性度量的缺點(diǎn),考慮用戶(hù)評(píng)分的三方面:接近、影響和普及,但這種相似性度量只考慮局部評(píng)分信息,不考慮用戶(hù)全局偏好。Herlocker等[11]提出加權(quán)Pearson相關(guān)系數(shù)解決傳統(tǒng)Pearson相關(guān)系數(shù)不考慮共同評(píng)分用戶(hù)規(guī)模的問(wèn)題,引入鄰居置信度,共同評(píng)分項(xiàng)越高則置信度越高。Jamali等[12]對(duì)用戶(hù)之間的信任關(guān)系進(jìn)行深度搜索,尋找更深層次的相似用戶(hù)來(lái)進(jìn)行推薦。Bobadilla等[13]提出了一種結(jié)合了Jaccard和平均平方差的矩陣,假定這兩項(xiàng)措施可以互補(bǔ)。這些方法在一定程度上減少了矩陣稀疏性[14]對(duì)推薦算法的影響,但沒(méi)有從根本上解決協(xié)同過(guò)濾推薦算法中相似性度量受共同評(píng)分限制的問(wèn)題。

        本文提出了一種基于巴氏系數(shù)和Jaccard系數(shù)的協(xié)同過(guò)濾算法(Collaborative Filtering algorithm based on Bhattacharyya coefficient and Jaccard coefficient, CFBJ)。該方法通過(guò)巴氏系數(shù)和Jaccard系數(shù)度量項(xiàng)目間相似性。巴氏系數(shù)利用用戶(hù)間所有的評(píng)分信息,克服了共同評(píng)分的限制。Jaccard系數(shù)可以增加相似性度量中共同評(píng)分項(xiàng)所占的比重,將評(píng)分項(xiàng)目進(jìn)行關(guān)聯(lián),計(jì)算無(wú)共同評(píng)分項(xiàng)的用戶(hù)間相似度,進(jìn)而預(yù)測(cè)目標(biāo)用戶(hù)對(duì)目標(biāo)項(xiàng)目的評(píng)分,為用戶(hù)進(jìn)行推薦。該算法擺脫了傳統(tǒng)協(xié)同過(guò)濾算法在計(jì)算用戶(hù)相似性時(shí)共同評(píng)分的限制,有效緩解用戶(hù)評(píng)分?jǐn)?shù)據(jù)極端稀疏情況下使用傳統(tǒng)度量方法帶來(lái)的問(wèn)題,提高推薦系統(tǒng)的推薦質(zhì)量。

        1相似性度量定義

        1.1巴氏系數(shù)相似度

        1.2Jaccard相似性度量

        Jaccard系數(shù)是兩個(gè)集合交集與并集的元素?cái)?shù)目之比,用于測(cè)量?jī)蓚€(gè)集合在共同項(xiàng)目上的重疊度。Jaccard系數(shù)計(jì)算符號(hào)度量或布爾值度量的個(gè)體間的相似度,不考慮用戶(hù)對(duì)項(xiàng)目的評(píng)分取值,僅關(guān)注用戶(hù)是否對(duì)該項(xiàng)目評(píng)過(guò)分。Jaccard系數(shù)值等于兩個(gè)用戶(hù)關(guān)聯(lián)項(xiàng)目數(shù)量的交集除于關(guān)聯(lián)項(xiàng)目數(shù)量的并集,形式化表示公式如下:

        1.3修正的余弦相似性

        通過(guò)向量間的余弦?jiàn)A角計(jì)算相似性度量,為了修正不同用戶(hù)存在不同評(píng)分尺度的偏差,在標(biāo)準(zhǔn)余弦相似性的基礎(chǔ)上,減去用戶(hù)對(duì)所有項(xiàng)目的平均評(píng)分來(lái)改善這一缺陷。計(jì)算式如下:

        2基于巴氏系數(shù)和Jaccard系數(shù)的本文協(xié)同過(guò)濾推薦算法

        傳統(tǒng)協(xié)同過(guò)濾推薦算法通過(guò)用戶(hù)或項(xiàng)目?jī)?nèi)個(gè)體間的相互作用,來(lái)尋找對(duì)當(dāng)前對(duì)象影響力最大的k個(gè)鄰居,為當(dāng)前對(duì)象屬性作出預(yù)測(cè)[8]。使用合適的相似性度量找到目標(biāo)用戶(hù)的鄰域是基于鄰域的協(xié)同過(guò)濾算法的最關(guān)鍵步驟。本文提出的相似性度量適于用戶(hù)評(píng)分?jǐn)?shù)目少或沒(méi)有共同評(píng)分的稀疏數(shù)據(jù)集,巴氏系數(shù)通過(guò)用戶(hù)間所有評(píng)分計(jì)算兩個(gè)項(xiàng)目間的相關(guān)性,且使用局部信息計(jì)算用戶(hù)評(píng)分相關(guān)性,利用Jaccard系數(shù)增加相似性度量中共同評(píng)分項(xiàng)所占的比重。

        2.1引入巴氏系數(shù)和Jaccard系數(shù)的相似性度量

        傳統(tǒng)基于用戶(hù)或者基于項(xiàng)目的協(xié)同過(guò)濾算法,如果評(píng)分?jǐn)?shù)據(jù)相當(dāng)稀疏,在計(jì)算用戶(hù)或項(xiàng)目間的相似性時(shí)會(huì)過(guò)多考慮用戶(hù)間共同評(píng)分,與實(shí)際相似度存在較大偏差,導(dǎo)致推薦效果不理想。對(duì)此本文將巴氏相似度和用戶(hù)局部相似度結(jié)合進(jìn)行改進(jìn)。令I(lǐng)Ua和IUb分別為用戶(hù)Ua和用戶(hù)Ub在所有項(xiàng)目上的評(píng)分集合,若用戶(hù)Ua和Ub之間無(wú)共同評(píng)分即IUa∩IUb=,用戶(hù)Ua和Ub之間的相似性度量定義為:

        當(dāng)用戶(hù)評(píng)分都在同一個(gè)項(xiàng)目上時(shí),SimBC(Ii,Ii)=1,此時(shí)用戶(hù)間的相似性度量由局部相似度決定;當(dāng)用戶(hù)評(píng)分在完全不相似的項(xiàng)目上時(shí),SimBC(Ii,Ij)=0,此時(shí)用戶(hù)間的相似性度由Jaccard相似度決定。巴氏系數(shù)利用用戶(hù)間所有的評(píng)分信息,提高了數(shù)據(jù)集中評(píng)分利用率;Jaccard系數(shù)彌補(bǔ)傳統(tǒng)相似性度量側(cè)重用戶(hù)對(duì)項(xiàng)目的評(píng)分而忽略項(xiàng)目類(lèi)別的不足,增加相似性度量中共同評(píng)分項(xiàng)所占的比重,優(yōu)化對(duì)目標(biāo)用戶(hù)的偏好預(yù)測(cè)和個(gè)性化推薦。該算法擺脫了傳統(tǒng)協(xié)同過(guò)濾算法在計(jì)算用戶(hù)相似性時(shí)共同評(píng)分的限制,有效緩解了用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏所帶來(lái)的問(wèn)題,提高了推薦系統(tǒng)的預(yù)測(cè)準(zhǔn)確率。

        2.2產(chǎn)生推薦

        通過(guò)本文提出的相似性度量得到目標(biāo)用戶(hù)的最近鄰居,下一步需要產(chǎn)生相應(yīng)的推薦。設(shè)用戶(hù)Ua的最近鄰居集合用N(a)表示,則目標(biāo)用戶(hù)Ua對(duì)項(xiàng)目Ii的預(yù)測(cè)評(píng)分Rai此處的ui,u是否應(yīng)該大寫(xiě),i作為u的下標(biāo)?請(qǐng)明確。感覺(jué)描述不太恰當(dāng),沒(méi)有看到關(guān)于i的定義。,可通過(guò)用戶(hù)Ua對(duì)最近鄰居集合N(a)中項(xiàng)目的評(píng)分得到,計(jì)算方法如下:

        Rai=Ua+[∑k∈N(a)Sim(Ua,Ub)*(Rki-ka)]/[∑k∈N(a)|Sim(Ua,Ub)|](9)

        其中:Ua表示用戶(hù)Ua對(duì)項(xiàng)目評(píng)分的平均值;Sim(Ua,Ub)表示用戶(hù)Ua和Ub之間的相似度取值;ka表示用戶(hù)Ua第k個(gè)近鄰評(píng)分的平均值,Rki表示第k個(gè)近鄰在i上的評(píng)分。

        2.3算法描述

        輸入:目標(biāo)用戶(hù)Ua,目標(biāo)項(xiàng)目Ii,用戶(hù)項(xiàng)目評(píng)分矩陣R(m×n)。

        輸出:對(duì)目標(biāo)項(xiàng)目的預(yù)測(cè)評(píng)分Rai。

        1)在矩陣R(m×n)中,尋找對(duì)目標(biāo)項(xiàng)目i評(píng)分的用戶(hù),并統(tǒng)計(jì)該用戶(hù)數(shù)量n(i)及每個(gè)評(píng)分分值為v的用戶(hù)數(shù)量n(v),根據(jù)式(2)、(7)分別計(jì)算用戶(hù)巴氏系數(shù)相似度SimBC(Ii,Ij)和局部相似度Simrate(Ua,Ub)。

        2)結(jié)合步驟1),根據(jù)式(5)計(jì)算用戶(hù)總體相似度Sim(Ua,Ub)。

        3)根據(jù)式(3)和(7)計(jì)算用戶(hù)Jaccard系數(shù)相似度Sim′(Ua,Ub)Jaccard。

        4)對(duì)用戶(hù)總體相似度進(jìn)行調(diào)整,加入Jaccard相似度,根據(jù)式(8)計(jì)算得到用戶(hù)Ua與其他用戶(hù)間的最終總體相似度Sim′(Ua,Ub)。

        5)根據(jù)最終的總體相似度,選取目標(biāo)用戶(hù)最近K個(gè)鄰居集合N(a)。

        6)根據(jù)式(9)計(jì)算目標(biāo)用戶(hù)對(duì)目標(biāo)項(xiàng)目的預(yù)測(cè)評(píng)分Rai。

        3實(shí)驗(yàn)設(shè)置

        實(shí)驗(yàn)數(shù)據(jù)集選用著名電影評(píng)分?jǐn)?shù)據(jù)集MovieLens,該數(shù)據(jù)集包含3708萬(wàn)條記錄,記錄了7000個(gè)用戶(hù)對(duì)3708部電影的評(píng)分,每個(gè)用戶(hù)至少對(duì)20部電影進(jìn)行了評(píng)分,評(píng)分范圍為1~5。為了形式化描述用戶(hù)通過(guò)對(duì)電影的不同評(píng)分表達(dá)自己的興趣程度,5表示“perfect”(非常好),1表示“poor”(差)。本文將MovieLens數(shù)據(jù)集隨機(jī)分為兩個(gè)子集MLa和MLb,其中:MLa子集上有312個(gè)用戶(hù)只有一個(gè)共同評(píng)分項(xiàng)目,12個(gè)用戶(hù)有兩個(gè)共同評(píng)分項(xiàng)目;MLb子集上有28個(gè)用戶(hù)只有一個(gè)共同評(píng)分項(xiàng)目。為了驗(yàn)證CFBJ的有效性,本文隨機(jī)搜索了5個(gè)相關(guān)項(xiàng)目作為用戶(hù)的目標(biāo)項(xiàng)目。

        為驗(yàn)證CFBJ有效性,采用4種協(xié)同過(guò)濾算法與提出的方法進(jìn)行實(shí)驗(yàn)對(duì)比。對(duì)比實(shí)驗(yàn)用到的算法如下:

        1)平均值杰卡德差分(Mean Jaccard Difference, MJD)算法。本文實(shí)現(xiàn)文獻(xiàn)[18]中基于均值杰卡德差分協(xié)同過(guò)濾推薦算法,該算法考慮共同評(píng)分項(xiàng)中不同評(píng)價(jià)尺度問(wèn)題。

        2)皮爾森系數(shù)(Pearson Correlation, PC)相似度算法。本文實(shí)現(xiàn)文獻(xiàn)[19]中利用PC系數(shù)計(jì)算不同用戶(hù)間項(xiàng)目相似度。

        3)杰卡德均方差(Jaccard and Mean Squared Difference, JMSD)算法。本文實(shí)現(xiàn)文獻(xiàn)[20]中基于Jaccard和平均平方差的協(xié)同過(guò)濾推薦算法,考慮Jaccard和平均平方差兩者之間互補(bǔ)的情況。

        4)PIP(ProximityImpactPopularity)。本文實(shí)現(xiàn)了文獻(xiàn)[10]中提出的接近、影響和普及度量模型,該算法分析皮爾遜相似性度量和余弦相似性度量的缺點(diǎn),考慮模型三方面要素。

        3.1評(píng)價(jià)指標(biāo)

        評(píng)價(jià)推薦系統(tǒng)推薦質(zhì)量的度量標(biāo)準(zhǔn)主要包括統(tǒng)計(jì)精度度量和決策支持精度度量?jī)深?lèi)。其中,統(tǒng)計(jì)精度度量包括均方根誤差(Root Mean Squared Error, RMSE)和平均絕對(duì)誤差(Mean Absolute Error, MAE),衡量評(píng)分預(yù)測(cè)準(zhǔn)確性的標(biāo)準(zhǔn),反映算法的預(yù)測(cè)評(píng)分與用戶(hù)實(shí)際評(píng)分的貼近程度,值越小,算法的推薦性能越好。MAE公式定義:

        MAE=1T∑Ua,i|Rai-rai|

        其中:rai表示用戶(hù)Ua對(duì)項(xiàng)目Ii的實(shí)際評(píng)分;Rai表示相應(yīng)的預(yù)測(cè)評(píng)分;T表示測(cè)試樣本的數(shù)量。同樣,RMSE計(jì)算式可以表示為:

        RMSE=1T∑Ua,i(Rai-rai)2

        決策支持精度度量包括準(zhǔn)確率(precision)和召回率(recall)反映推薦系統(tǒng)對(duì)分類(lèi)預(yù)測(cè)的準(zhǔn)確程度,適合具有明確二分喜好的推薦系統(tǒng)。precision和recall定義為:

        precision=|L∩L′|/|L|

        recall=|L∩L′|/|L′|

        其中:L表示推薦列表的長(zhǎng)度;L′表示推薦列表中用戶(hù)評(píng)分較高的項(xiàng)目的數(shù)量,但存在precision和recall兩者相互矛盾的情況,本文采用F1measure綜合指標(biāo)反映分類(lèi)預(yù)測(cè)的準(zhǔn)確程度。F1measure定義為:

        F1measure=(2×precision×recall)/(precision+recall)

        3.2實(shí)驗(yàn)結(jié)果和分析

        首先在MLa子集上比較不同協(xié)同過(guò)濾算法的MAE和RMSE值,查看算法的預(yù)測(cè)評(píng)分與用戶(hù)實(shí)際評(píng)分的貼近程度,相應(yīng)結(jié)果如圖1所示。由圖1可知,CFBJ、MJD、PC、JMSD和PIP算法隨著K最近鄰數(shù)量的變化,MAE和RMSE值隨之變化。其中,CFBJ在MAE和RMSE上的值一直比MJD、PC、JMSD和PIP算法的值都小,說(shuō)明CFBJ利用用戶(hù)間所有的評(píng)分信息后,預(yù)測(cè)評(píng)分與用戶(hù)實(shí)際評(píng)分更貼近,算法的推薦性能更好。其他算法尋找最近鄰時(shí)不能利用用戶(hù)所有的評(píng)分信息,僅使用一個(gè)共同評(píng)分項(xiàng),且目標(biāo)用戶(hù)的近鄰只有一個(gè),預(yù)測(cè)時(shí)錯(cuò)誤數(shù)量超過(guò)了近鄰的最大數(shù)(MAE>0.805,RMSE>1.02,K∈[40,400])。在預(yù)測(cè)精度方面,PIP算法的準(zhǔn)確率比較接近CFBJ;但CFBJ的準(zhǔn)確率更高(MAE>0.73,RMSE<1.00)。

        在MLa子集上比較不同協(xié)同過(guò)濾算法的F1measure值,相應(yīng)結(jié)果如圖2所示。由圖2可知,隨著最近鄰數(shù)目的遞增,每種協(xié)同過(guò)濾算法的F1measure都呈上升趨勢(shì),但CFBJ的F1measure值基本上大于等于其他基于鄰域的協(xié)同過(guò)濾算法。當(dāng)K=400時(shí),CFBJ的F1measure接近0.67,MJD的F1measure接近0.57。CFBJ推薦的準(zhǔn)確率比MJD高17%。PIP算法的表現(xiàn)與MJD算法相似,其他的協(xié)同過(guò)濾算法表現(xiàn)不佳。這也說(shuō)明了傳統(tǒng)的相似性度量不能正確檢索相關(guān)項(xiàng)目。

        接著在MLb子集上比較不同協(xié)同過(guò)濾算法的MAE和RMSE值變化,相應(yīng)結(jié)果如圖3所示。由圖3可知,PIP算法在MAE和RMSE的值小于MJD、PC、JMSD算法,這些算法的相似性度量取決于用戶(hù)共同評(píng)分項(xiàng),MLb子集上平均每16個(gè)用戶(hù)與目標(biāo)用戶(hù)只有一個(gè)共同評(píng)分項(xiàng),所以隨著最近鄰數(shù)量增加,這些協(xié)同過(guò)濾算法的精度不再提高。而CFBJ由于利用了用戶(hù)間所有的評(píng)分,不受共同評(píng)分項(xiàng)的影響,MAE和RMSE值隨著近鄰數(shù)目的增加而變化,且數(shù)值最低。說(shuō)明CFBJ在共同評(píng)分項(xiàng)稀疏的情況下,推薦的準(zhǔn)確性依然高于其他4個(gè)算法。

        在MLb子集上執(zhí)行不同協(xié)同過(guò)濾算法的F1measure情況,相應(yīng)結(jié)果如圖4所示。由圖4可以看出,CFBJ的值一直高于其他算法,隨著最近鄰數(shù)目的增加F1measure值也保持增長(zhǎng)。實(shí)驗(yàn)中MLb子集用戶(hù)的平均評(píng)分為5.1分,CFBJ的F1measure接近0.47此處正文描述錯(cuò)誤,應(yīng)該是0.370.37,而其他算法得到的F1measure值不足0.1,說(shuō)明CFBJ的推薦效果比其他算法準(zhǔn)確。這表明MJD、PC、JMSD和PIP算法的相似性度量方法在評(píng)分?jǐn)?shù)據(jù)稀疏且規(guī)定相關(guān)項(xiàng)目的情況下,對(duì)目標(biāo)用戶(hù)進(jìn)行推薦表現(xiàn)不佳。CFBJ能夠應(yīng)對(duì)高度稀疏的評(píng)分?jǐn)?shù)據(jù)集,為用戶(hù)提供更加準(zhǔn)確的推薦。

        4結(jié)語(yǔ)

        針對(duì)協(xié)同過(guò)濾算法存在的數(shù)據(jù)稀疏性問(wèn)題,本文提出的基于鄰域的CFBJ,在稀疏的評(píng)分?jǐn)?shù)據(jù)集上,巴氏系數(shù)利用用戶(hù)間所有的評(píng)分信息擺脫共同評(píng)分的限制,Jaccard系數(shù)彌補(bǔ)傳統(tǒng)相似性度量側(cè)重用戶(hù)對(duì)項(xiàng)目的評(píng)分而忽略項(xiàng)目類(lèi)別的不足,增加相似性度量中共同評(píng)分項(xiàng)所占的比重,為目標(biāo)用戶(hù)提供更加準(zhǔn)確有效的推薦。該算法最大的優(yōu)點(diǎn)是擺脫了傳統(tǒng)相似性度量中用戶(hù)共同評(píng)分的限制,提高了用戶(hù)評(píng)分?jǐn)?shù)據(jù)的利用率。實(shí)驗(yàn)對(duì)比表明,CFBJ可以在高度稀疏的評(píng)分?jǐn)?shù)據(jù)集上為用戶(hù)提供更準(zhǔn)確的推薦。由于推薦系統(tǒng)中數(shù)據(jù)量龐大,系統(tǒng)的可擴(kuò)展性問(wèn)題尤為突出,今后將致力于把協(xié)同過(guò)濾算法遷移部署到云計(jì)算平臺(tái)中改善推薦系統(tǒng)的實(shí)時(shí)性。

        參考文獻(xiàn):

        [1]

        HERLOCKER J L, KONSTAN J A, TERVEEN L G, et al. Evaluating collaborative filtering recommender systems [J]. ACM Transactions on Information Systems, 2004, 22(1): 5-53.

        [2]

        SARWAR B, KARYPIS G, KONSTAN J, et al. Itembased collaborative filtering recommendation algorithms [C]// Proceedings of the 10th International Conference on World Wide Web. New York: ACM, 2001: 285-295.

        [3]

        GONG S. A collaborative filtering recommendation algorithm based on user clustering and item clustering [J]. Journal of Software, 2010, 5(7): 745-752.

        [4]

        DESHPANDE M, KARYPIS G. Itembased topn recommendation algorithms [J]. ACM Transactions on Information Systems, 2004, 22(1): 143-177.

        [5]

        HUANG Z, CHEN H, ZENG D. Applying associative retrieval techniques to alleviate the sparsity problem in collaborative filtering [J]. ACM Transactions on Information Systems, 2004, 22(1): 116-142.

        [6]

        ADLER J, PARMRYD I. Quantifying colocalization by correlation: the Pearson correlation coefficient is superior to the Manders overlap coefficient [J]. Cytometry Part A, 2010, 77(8): 733-742.

        [7]

        ANAND S S, MOBASHER B. Intelligent techniques for Web personalization [C]// Proceedings of the 2003 International Conference on Intelligent Techniques for Web Personalization. Berlin: Springer, 2003: 1-36.

        [8]

        黃創(chuàng)光,印鑒,汪靜,等.不確定近鄰的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2010,33(8):1369-1377.(HUANG C G, YIN J, WANG J, et al. Uncertain neighbors collaborative filtering recommendation algorithm [J]. Chinese Journal of Computers, 2010, 33(8): 1369-1377.)

        [9]

        LUO H, NIU C, SHEN R, et al. A collaborative filtering framework based on both local user similarity and global user similarity [J]. Machine Learning, 2008, 72(3):231-245.

        [10]

        AHN H J. A new similarity measure for collaborative filtering to alleviate the new user coldstarting problem [J]. Information Sciences, 2008, 178(1):37-51.

        [11]

        HERLOCKER J L, KONSTAN J A, BORCHERS A, et al. An algorithmic framework for performing collaborative filtering [C]// Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 1999: 230-237.

        [12]

        JAMALI M, ESTER M. Trustwalker: a random walk model for combining trustbased and itembased recommendation [C]// Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2009: 397-406.

        [13]

        BOBADILLA J, ORTEGA F, HERNANDO A, et al. A similarity metric designed to speed up, using hardware, the recommender systems knearest neighbors algorithm [J]. KnowledgeBased Systems, 2013, 51: 27-34.

        [14]

        BOBADILLA J, ORTEGA F, HERNANDO A. A collaborative filtering similarity measure based on singularities [J]. Information Processing & Management, 2012, 48(2): 204-217.

        [15]

        PATRA B K, LAUNONEN R, OLLIKAINEN V, et al. Exploiting Bhattacharyya similarity measure to diminish user coldstart problem in sparse data [M]// Discovery Science. Berlin: Springer, 2014: 252-263.

        [16]

        KAILATH T. The divergence and Bhattacharyya distance measures in signal selection [J]. IEEE Transactions on Communication Technology, 1967, 15(1): 52-60.

        [17]

        JAIN A K. On an estimate of the Bhattacharyya distance [J]. IEEE Transactions on Systems Man & Cybernetics, 1976, SMC6(11): 763-766.

        [18]

        BOBADILLA J, ORTEGA F, HERNANDO A, et al. A collaborative filtering approach to mitigate the new user cold start problem [J]. KnowledgeBased Systems, 2012, 26: 225-238.

        [19]

        BREESE J S, HECKERMAN D, KADIE C. Empirical analysis of predictive algorithms for collaborative filtering [C]// Proceedings of the Conference on Uncertainty in Artificial Intelligence. San Francisco: Morgan Kaufmann, 1998: 43-52.

        [20]

        BOBADILLA J, SERRADILLA F, BERNAL J. A new collaborative filtering metric that improves the behavior of recommender systems [J]. KnowledgeBased Systems, 2010, 23(6):520-528.

        猜你喜歡
        巴氏相似性度量
        有趣的度量
        一類(lèi)上三角算子矩陣的相似性與酉相似性
        模糊度量空間的強(qiáng)嵌入
        釋放巴氏新小綏螨可滿(mǎn)足對(duì)蘋(píng)果全爪螨的防治需求
        淺析當(dāng)代中西方繪畫(huà)的相似性
        迷向表示分為6個(gè)不可約直和的旗流形上不變愛(ài)因斯坦度量
        巴氏殺菌水牛奶在不同儲(chǔ)存條件下微生物增長(zhǎng)規(guī)律的研究
        低滲透黏土中氯離子彌散作用離心模擬相似性
        巴氏醋桿菌核酸修復(fù)酶UvrA對(duì)大腸桿菌耐受性的影響
        地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
        国产精品二区一区二区aⅴ污介绍| 少妇特殊按摩高潮不断| 人妻av在线一区二区三区| 午夜精品久久久久久久久| 无码精品人妻一区二区三区人妻斩 | 91久久国产自产拍夜夜嗨| 久久精品成人一区二区三区| 美女视频在线观看网址大全| 日本在线中文字幕一区| 日韩精品视频高清在线| 国产精品亚洲综合色区| 一本色道久久99一综合| 亚洲精品久久久中文字| 亚洲精品有码日本久久久| 少妇性饥渴无码a区免费| 99视频一区| 亚洲天堂av大片暖暖| 凌辱人妻中文字幕一区| 亚洲伊人成综合网| 久久久国产精品福利免费| 福利视频黄| 亚洲精品国产精品av| 一区二区三区日韩亚洲中文视频| 久久久老熟女一区二区三区 | 婷婷久久精品国产色蜜蜜麻豆| 亚洲熟女乱综合一区二区| 国产91福利在线精品剧情尤物| 中文字幕人妻系列一区尤物视频| 少妇又紧又爽丰满在线视频| 色www永久免费视频| 国产精品麻豆成人AV电影艾秋 | 在线精品国产亚洲av麻豆| 免费无码一区二区三区蜜桃| 98在线视频噜噜噜国产| 日本av第一区第二区| 国产a级毛片久久久精品毛片| 久久亚洲中文字幕无码| 亚洲国产一区二区三区,| 国产av剧情一区二区三区| 久久久无码中文字幕久...| av草草久久久久久久久久久|