亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進用戶相似度的協(xié)同過濾推薦算法研究

        2019-07-25 08:03:26張利
        現(xiàn)代計算機 2019年17期
        關鍵詞:精確度用戶信息

        張利

        (安徽工業(yè)大學管理科學與工程學院,馬鞍山243032)

        0 引言

        互聯(lián)網的普及和快速發(fā)展,使其已經成為用戶獲取、處理、傳播、開發(fā)以及利用信息的一體化平臺,改變了人們傳統(tǒng)的生活方式。例如,現(xiàn)在用戶不僅足不出戶就可以通過淘寶網和京東商城等電商平臺購買生活所需要的產品,而且還可以通過Last.fm 和網易云音樂等音樂平臺收聽歌曲,以及通過Netflix 和YouTube 等網站觀看電影和視頻。然而,隨著網絡信息量的快速增長,用戶很難從網站和平臺發(fā)布的海量信息中搜索到自己感興趣的產品,運用傳統(tǒng)的搜索方法也只能得到與所有用戶一樣的搜索結果,無法根據每個用戶不同的興趣來推薦不同的搜索結果。因此,用戶在搜索符合自己產品需求的過程中就會消耗更多的時間和精力,而且很難能達到滿意的效果。而作為平臺和網站的信息發(fā)布者,也很難從眾多用戶中挖掘出滿足產品定位的更多潛在用戶,從而調整自身的服務來滿足更多不同的用戶?;ヂ?lián)網信息量的大幅度增長使得在面對大量信息時,用戶不能及時有效的獲取想要的那部分信息,這就出現(xiàn)了“信息過載”(Information Overlord)[1-3]問題。針對這種信息過載問題,通過幫助用戶過濾不相關信息并將相關信息傳遞給需要它的用戶的信息過濾技術應運而生。以個性化推薦系統(tǒng)(Recommender System,RS)[4-5]為代表的信息過濾技術,將用戶在系統(tǒng)中產生的歷史行為活動建立模型并分析用戶的真實需求,進而使用戶之前在系統(tǒng)中以搜索關鍵詞的方式變?yōu)橄到y(tǒng)主動通過學習用戶的興趣偏好來給用戶推薦相關的信息。因此,推薦系統(tǒng)在互聯(lián)網領域,特別是在電子商務網站和一些其他網絡平臺,如淘寶網、亞馬遜、蘇寧易購、豆瓣電影、YouTube[6]等得到了成功的應用;有效幫助緩解了“信息過載”問題,大大提高了用戶瀏覽網站的效率,使用戶能夠更快更準確地獲得自己想要的信息;同時,也為使用推薦系統(tǒng)的網站和平臺帶來了巨大的商業(yè)利潤。

        1 基于用戶的協(xié)同過濾推薦算法

        基于用戶的協(xié)同過濾推薦算法[7]的基本原理是:通過對目標用戶的興趣偏好分析,搜索與其擁有一樣(或者類似)喜好程度的相關用戶,并向其計算未看過項目的評分值以及產生推薦;也就是說,若目標用戶與其他用戶都對一些項目評過分,就說明他們之間存在共同的相似行為,那么目標用戶也就可能喜歡其他用戶看過的項目,因此就可以在其他用戶看過的所有項目中,從中計算其未看過但可能感興趣項目的評分值以及產生推薦?;谟脩舻膮f(xié)同過濾算法流程圖主要是由以下3 個步驟組成。

        步驟1:建立用戶關系數(shù)據模型

        將獲取的評分數(shù)據集處理為可以表示為如表1 所示的評分矩陣的形式,其中User 表示用戶,Item 為項目,n 表示為系統(tǒng)中用戶的數(shù)量,m 為系統(tǒng)中項目的數(shù)量,√為用戶對項目的評分值。

        表1 用戶-項目評分矩陣表

        步驟2:計算相似度值以及尋找最近鄰

        在基于用戶的協(xié)同過濾算法中,最重要的部分便是為用戶尋找近鄰集合,即為其尋找興趣偏好最為相似的鄰居集合。首先運用上一步處理后的數(shù)據矩陣來得到用戶間的相似度值;之后根據值的大小選取前k個鄰居,記為N(k)。獲取用戶間相似度的方式很多,其中基本的方法有皮爾遜相似度、Jaccard 相似度、余弦相似度等;也有其他研究者在相似度方面的改進,例如NHSM、JMSD 等相似度方法。

        步驟3:為用戶推薦項目

        通過步驟二,得到目標用戶的近鄰集合N(k),首先依據N(k)中的其他用戶看過的所有項目以及評分值,使用公式來計算其未看過的所有的項目預測值,生成項目集合,預測值公式如公式(1)和(2)所示。然后根據生成的項目集合為目標用戶推薦預測值最高的Top-N 項。

        公式(1)是通過將近鄰用戶與目標用戶的相似度值作為權值,然后將鄰居對項目i 的評分值與該鄰居用戶所有評分的平均值的差值進行加權取平均。公式(2)是將目標用戶的近鄰用戶的所有評分取平均值。通常在學術研究中使用公式(1),而在本文中同樣使用了該公式。

        2 協(xié)同過濾算法中的相似度度量

        在獲得用戶相似度值的過程中需要用到相似度公式。重要的是,在基于用戶協(xié)同過濾推薦算法中最為關鍵的部分是相似度值的獲得。相似度值代表了用戶與用戶之間的相似度的大小,即兩者之間興趣偏好的相似,相似度方法的選擇往往對下一步進行預測值計算以及推薦系統(tǒng)的推薦質量有著重要的影響作用。因此,在這部分中,主要介紹本文中用到的兩種相似度計算方法。

        (1)余弦相似度(Cosine Similarity,COS)

        余弦相似度是將向量空間中的兩個向量之間夾角的余弦值作為度量兩者間的差異[8-9];將得到的兩者之間的夾角來度量兩個向量間的相似度,角度越小說明相似度越高。例如在推薦系統(tǒng)中,將用戶的標簽看作是一個1×n 的n 維向量,如果有一標簽未被用戶使用過,那么值應為0;然后使用余弦相似度對每個用戶的向量進行計算,若計算出的值越大,這說明這兩個用戶之間的相似性就越高。其計算公式如(3)所示。

        (2)皮爾遜相關系數(shù)(Pearson Correlation Coefficient,PCC)

        皮爾森相關系數(shù)是用來度量兩個變量之間相似程度的統(tǒng)計量[7,10]。PCC 相似度的公式如(4)所示,可知PCC 相似度的取值范圍為[-1,1],當值為負時,用戶u和用戶v 之間的興趣偏好為負相關;當值為正時,為正相關;絕對值越大,則正/負相關的程度越大。

        式中,Iuv表示用戶u 和用戶v 之間的共同評分項目集合。

        3 改進的相似性度量方法

        在數(shù)據稀疏性情況下,為了提高給目標用戶推薦項目的精確度以及推薦質量,本文通過同時考慮不同用戶對于標簽信息以及項目評分偏好差異提出一種改進的相似度度量方法。該方法首先通過數(shù)據評分矩陣計算不同用戶間的評分差異相似度;然后通過利用標簽信息計算用戶間的標簽信息偏好相似度;最后通過加權獲得綜合考慮兩者的用戶相似度值。改進的新相似度計算公式如公式(5)所示。

        其中,sim(u,v)I為利用標簽數(shù)據根據公式(3)計算得出的用戶間相似度值;sim(u,v)T為利用評分數(shù)據根據公式(4)計算得出的用戶間相似度值;式中,參數(shù)α表示權重,且α∈[0,1],步長為0.1。其中,當取α=0 時,用戶相似度sim(u,v)為sim(u,v)T,當取α=1 時,用戶相似度sim(u,v)為sim(u,v)I。

        4 實驗設置以及結果分析

        4.1 實驗數(shù)據

        實驗所使用的數(shù)據集是MovieLens-latest-small,是由1996 年3 月29 日至2018 年9 月24 日期間的用戶組成的,且生成于2018 年9 月26 日,包括610 名用戶對9742 部電影的100836 條評分數(shù)據,以及3683 個標簽。在本實驗中,采用五折交叉實驗進行驗證。首先將MovieLens-latest-small 數(shù)據集分別隨機分成五份,每一份都是不相交的數(shù)據集;其次分別選取數(shù)據集中的一份數(shù)據集作為測試集,剩余的四份作為訓練集,對不同相似度方法的評價指標進行計算;最后將五次實驗的結果求取平均值進行對比。

        4.2 評價指標

        (1)精確度(Precision)

        精確度是指在給用戶推薦的項目中,用戶所感興趣的項目數(shù)與推薦項目數(shù)的比例值[11-12]。因此,精確度值越大,說明系統(tǒng)推薦的項目中用戶感興趣的項目越多,推薦性能越好;反之則表示推薦效果不好。精確度計算公式如下:

        式中,ls表示推薦系統(tǒng)中的用戶感興趣且出現(xiàn)在系統(tǒng)推薦項目列表N 中的項目數(shù)目。

        (2)召回率(Recall)

        召回率是指在給用戶推薦的項目中,用戶所感興趣的項目數(shù)目與系統(tǒng)中用戶所有感興趣的項目數(shù)目的比例值[11-12]。因此,召回率值越大,推薦性能越好;反之則不好。召回率計算公式如下:

        式中,NT表示在推薦系統(tǒng)中,用戶感興趣的項目總數(shù)。

        (3)F-Measure

        F-Measure 表示精確度和召回率兩個指標的加權調和平均值,當使用精確度和召回率產生相互矛盾的結果時通常會繪制F-Measure 曲線來綜合考慮它們之間的關系[12-13]。當F-Measure 值越高時,則說明系統(tǒng)的推薦性能越好。F-Measure 的計算公式如下:

        當參數(shù)a=1 時,就是通常使用的F1-Measure,其公式如下:

        4.3 實驗結果及分析

        (1)參數(shù)α的確定

        通過將公式(9)作為評價指標,測試參數(shù)α對公式(5)產生的影響。在本實驗中設置參Top-N 取[1,2,3,4,5,10,15,20,25,30]。那么綜合評價指標F1-Measure 的在參數(shù)α的變化下的計算結果如表2 所示,變化曲線如圖1 所示。

        表2 取不同參數(shù)α下的F1-Measure 值

        圖1 F1-Measure的變化曲線圖

        從表2 中可以看出,隨著參數(shù)α值的變化,F(xiàn)1-Measure 值也在不斷的變化,其中在α=0.7 時,F(xiàn)1-Measure取的最大值,值為0.05802。從圖1 能直觀地可以看出隨著參數(shù)α值的變化,評價指標F1-Measure 的變化趨勢。隨著參數(shù)α從0 到1 變化,F(xiàn)1-Measure 是先是曲線上升后到達最高值,然后曲線下降。當值F1-Measure越大表示推薦質量越好,因此,在本實驗中最優(yōu)參數(shù)α的值取為0.7 時,改進的推薦算法的F1-Measure 取得最大值。此時也說明sim(u,v)I計算的相似度值占用戶相似度的70%,而sim(u,v)T計算的相似度值占用戶相似度的30%。在此后的實驗中,改進推薦算法與傳統(tǒng)協(xié)同過濾算法做對比時,參數(shù)α的取值均為0.7。

        (2)結果及分析

        推薦項目個數(shù)Top-N 是影響精確度以及召回率最重要的因素,因此在本小節(jié)中,通過對比并分析三種不同的推薦算法分別在Top-N 值變化情況下的準確率和召回率均值的值的變化曲線如圖2 所示。

        從圖2 中可以看出,隨著Top-N 個數(shù)的增加,三種算法的精確度和召回值的均值都呈現(xiàn)下降的趨勢;這是因為隨著推薦項目的增加,有些可能用戶不喜歡的項目就會被推薦給目標用戶,因而造成精確度的降低。另外,改進的算法一直位于另外兩者曲線的上方,則說明通過添加標簽信息來計算用戶相似度能夠幫助目標用戶找到感興趣的項目,有助于提高推薦準確性。

        圖2 準確率和召回率的均值的變化曲線圖

        5 結語

        本文通過將標簽與用戶評分信息聯(lián)系起來,提出一種新改進的相似度度量方法。通過實驗在評價指標精確度和召回率的均值對比結果可知,新的相似度方法均在一定程度上優(yōu)于其他兩種相似度方法。另外,相比于其他兩種算法,改進的相似度方法算法更能區(qū)分用戶與用戶間的相似度,從而提高推薦系統(tǒng)的推薦質量。

        猜你喜歡
        精確度用戶信息
        研究核心素養(yǎng)呈現(xiàn)特征提高復習教學精確度
        “硬核”定位系統(tǒng)入駐兗礦集團,精確度以厘米計算
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        健康信息(九則)
        祝您健康(1987年2期)1987-12-30 09:52:28
        久久精品午夜免费看| 老妇女性较大毛片| 无码国产激情在线观看| 青青草视频网站免费观看| 天堂精品人妻一卡二卡| 国产精品视频亚洲二区| 国产二级一片内射视频插放| 亚洲综合AV在线在线播放| 日本在线一区二区三区观看| 中文字幕免费人成在线网站 | 久久婷婷综合色一区二区| 国产午夜片无码区在线播放| 国产suv精品一区二人妻| 国产欧美日韩在线观看一区二区三区| 国产午夜福利av在线麻豆| 日韩精品无码一区二区三区| 日本不卡一区二区三区在线| 久久国产精品老女人| 亚洲av高清一区三区三区| 蜜桃视频一区二区在线观看| 中文字幕无码不卡一区二区三区| 国产91一区二这在线播放| 男女搞基视频免费网站| 中文字幕日韩欧美一区二区三区| 亚洲av日韩av无码av| 国产亚洲曝欧美不卡精品| 婷婷色精品一区二区激情| 一进一出一爽又粗又大| 97视频在线观看免费| 丰满少妇又爽又紧又丰满动态视频| 国产精品一区二区久久国产| 午夜成人精品福利网站在线观看| 国产一区二区三区爆白浆| 日本高清一区二区不卡| 亚洲av精品一区二区三区| 国产亚洲日韩欧美一区二区三区| 女女同性av一区二区三区免费看| 精品人妻av区乱码色片| 福利体验试看120秒| 久久久精品免费国产四虎| 亚洲精品中字在线观看|