亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種改進(jìn)的協(xié)同過濾推薦算法

        2016-06-05 14:17:39黃粲
        經(jīng)濟(jì)研究導(dǎo)刊 2016年23期
        關(guān)鍵詞:用戶

        黃粲

        (對外經(jīng)濟(jì)貿(mào)易大學(xué)信息學(xué)院,北京100029)

        一種改進(jìn)的協(xié)同過濾推薦算法

        黃粲

        (對外經(jīng)濟(jì)貿(mào)易大學(xué)信息學(xué)院,北京100029)

        針對傳統(tǒng)推薦算法中忽略用戶興趣隨時間推移而轉(zhuǎn)移和熱門項目對刻畫用戶相似度的影響兩個問題,介紹了一種改進(jìn)的基于用戶的協(xié)同過濾算法。通過以MovieLens數(shù)據(jù)集為分析與示例對象,給出了用戶相似度、懲罰系數(shù)、時間衰減因子與評分預(yù)測函數(shù)的具體計算方法,對引入時間因子與懲罰系數(shù)的協(xié)同過濾算法進(jìn)行了說明,并進(jìn)行了算法步驟設(shè)計。

        協(xié)同過濾算法;時間因子;懲罰系數(shù)

        引言

        推薦算法可以有效地對用戶提出個性化推薦,以更好服務(wù)客戶。主要的推薦技術(shù)有基于內(nèi)容推薦、協(xié)同過濾推薦、基于關(guān)聯(lián)規(guī)則推薦、基于效用推薦、組合推薦等。

        1994年GroupLens提出了基于用戶的協(xié)同過濾算法,而后Amazon于2000年提出了基于物品的協(xié)同過濾算法,二者構(gòu)成了當(dāng)代協(xié)同過濾算法的基礎(chǔ)。傳統(tǒng)的協(xié)同過濾算法主要集中于分析項目及用戶的特征,從中歸納用戶興趣,借此向其推薦可能感興趣的項目。然而,用戶消費(fèi)的環(huán)境(如時間、地點、心情等)也會對用戶的消費(fèi)行為造成影響,這些影響很難單純從用戶和項目的特征中尋得,而往往集中于消費(fèi)行為信息中。此外,用戶的興趣與愛好很可能隨時間推移而發(fā)生變化,也經(jīng)常存在從眾心理。若將這些因素考慮在推薦算法當(dāng)中,就可以很好地提升推薦準(zhǔn)確度。

        一、算法描述

        基于用戶的協(xié)同過濾算法的核心是找到與目標(biāo)用戶興趣相近的用戶群體,基于此用戶集的消費(fèi)行為和項目評分,計算目標(biāo)用戶對某一相似群體感興趣但目標(biāo)用戶沒有購買過的項目的預(yù)估評分,再按評分高低排序得到推薦項目集。本算法在此基礎(chǔ)上,引入了時間因子與懲罰機(jī)制,旨在更加精確刻畫用戶最近興趣并降低熱門項目對用戶相似度的影響。

        本文在對算法進(jìn)行闡釋時使用了由GroupLens Research Project提供的MovieLens數(shù)據(jù)集。數(shù)據(jù)集記錄了7個月間943個用戶對1682個電影的10萬余個評分。評分?jǐn)?shù)據(jù)中包含了用戶編號,電影編號,評分(1—5分,整數(shù))和評分時間戳。數(shù)據(jù)集中還提供了對應(yīng)的電影數(shù)據(jù),包含了電影編號,電影名稱,上映時間及電影的分類信息(共19種分類)。其中,同一部電影可能擁有多個分類,即某部影片可能既是音樂劇,又是動畫片,同時還是部喜劇。

        1.用戶相似度

        認(rèn)為同目標(biāo)用戶消費(fèi)過相同項目的用戶便是與目標(biāo)用戶興趣相似的用戶,而所消費(fèi)的共同項目數(shù)量越多、對項目的評分越類似,相似度越大。然而,值得注意的是,有一些用戶傾向于給出更高的評分,而另一些用戶給分則偏低。在數(shù)據(jù)集中,用戶編號為181的用戶在所觀看的435所電影中,給了297部電影1分的評價,平均評分1.4977分;而編號373的用戶給341部電影的平均評分為3.5322分,其中僅有39部電影被評為1分。

        表1 用戶評分比較

        因此,評分的相對高低比絕對高低更能表示用戶對某一項目的偏好程度。常用的衡量用戶間的相似度的是Pearson相關(guān)相似性,通過用戶對某一項目的評分和用戶的平均給分之差來代表用戶對該項目的評價。Sab代表用戶a與用戶b所消費(fèi)過的項目的交集,rai代表用戶a對項目i的評分,ra表示用戶a的平均評分。則有

        2.懲罰系數(shù)

        現(xiàn)實中存在一些可能并非符合用戶以往消費(fèi)習(xí)慣,但是出于從眾心理等各類因素,用戶也消費(fèi)了的項目。很顯然,這些熱門項目的消費(fèi)行為會對刻畫用戶興趣和相似度有一定消極影響,而共同消費(fèi)了非熱門項目更能說明用戶之間具有相似性。

        使用編號為823的用戶進(jìn)行實例說明。通過對該用戶的觀影記錄進(jìn)行分析,可知該用戶尤其偏愛劇情片與喜劇片,這兩類電影在他所觀看的185部影片中占據(jù)了絕大部分(分別為68部和65部)。然而,該用戶只觀看過一部西部片,并給出了5分的滿分評價。數(shù)據(jù)集中這部編號為97的影片共有175條評分記錄,即大約每五名用戶中就有一人對該電影進(jìn)行評分。實際上,這部影片上映后引起了極大的轟動,并最終摘得七項奧斯卡獎項,是一部具有較高流行度的熱門影片。同時,用戶還觀看了一部編號為1267的喜劇片并給出了4分評價,而在所有評分記錄中,只有22個人觀看過這部非熱門影片。西部片并不符合823用戶的一致觀影偏好,但若使用經(jīng)典協(xié)同過濾算法,則與編號為1267的喜劇片在描繪用戶相似性時具有平等地位,甚至該部西部片由于評分更高,最終的刻畫影響甚至?xí)哂谟脩粢恢逼珢鄣南矂∑@就會在對用戶進(jìn)行畫像及推薦時造成一定偏差影響。

        因此,引入懲罰系數(shù)p,用于消除流行度大的熱門項目對相似性的偏差作用。消費(fèi)某項目的用戶數(shù)量越多,代表該項目流行度更大,因此在描繪相似度時權(quán)重應(yīng)越小。用N(i)代表所有購買過項目i的用戶集合,ni為該用戶集合的用戶數(shù)量,nc為總用戶數(shù)量,則懲罰系數(shù)計算公式為:

        3.時間衰減因子

        用戶對項目的喜好并非一成不變。隨時間的推移,用戶的價值觀與審美觀都可能有所調(diào)整。編號為506的用戶在1997年9月至次年1月間共給出了228個評分記錄。通過分析某月所觀看的特定類型電影占該月觀影總數(shù),繪制對比圖如圖1所示。從中可以看出,用戶的觀影習(xí)慣會發(fā)生改變,如9月份所觀看的影片中只有24%的電影是動作片,但1月份動作片已經(jīng)占據(jù)了該用戶觀影數(shù)量的75%。而9月份時用戶觀看了8%的恐怖片,但是后4個月間只看過一部恐怖片。從而,相比于恐怖片,2月份時用戶接受所推薦的動作片的可能性要更高。因此,對用戶興趣的追蹤十分重要,用戶最近的消費(fèi)行為更能充分并準(zhǔn)確地反映用戶當(dāng)前的興趣與需求。

        圖1 用戶觀影習(xí)慣隨時間推移變化圖

        4.評分預(yù)測函數(shù)

        二、算法步驟

        Step1輸入目標(biāo)用戶集合C,用戶-項目評分矩陣D,鄰居個數(shù)j,推薦項目數(shù)量n;

        Step5選取改進(jìn)后的Pearson客戶相似度最高的前j個鄰居用戶,生成鄰居集合J和對應(yīng)鄰居評分項目集合SJ;

        Step7根據(jù)計算得到的所有未評分項目的預(yù)測評分,選擇評分最高的n個項目推薦給用戶。

        三、總結(jié)

        推薦算法作為向用戶提供個性化服務(wù)的重要工具,其精確性的提升一直備受關(guān)注。本文針對應(yīng)用廣泛的基于用戶的協(xié)同過濾算法,通過引入時間因子來賦予最近購買商品更大權(quán)重,以更好估計用戶需求,且引入了懲罰系數(shù),來降低熱門物品的購買行為對用戶興趣刻畫的偏差影響。但本算法仍存在一定不足之處,如主要依靠經(jīng)驗確定時間衰減函數(shù)中常數(shù)項的取值會引入人為偏差。在日后研究中可引入機(jī)器學(xué)習(xí),提升準(zhǔn)確度。

        [1]楊強(qiáng),楊有,余春君.協(xié)同過濾推薦系統(tǒng)研究綜述[J].現(xiàn)代計算機(jī):專業(yè)版,2015,(9):3-6.

        [2]姚忠,魏佳,吳躍.基于高維稀疏數(shù)據(jù)聚類的協(xié)同過濾推薦算法[J].信息系統(tǒng)學(xué)報,2008,(2):78-96.

        [3]劉恒友.基于時間效應(yīng)的推薦算法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.

        [4]許斐.基于時間因子的動態(tài)推薦算法研究[D].武漢:中南民族大學(xué),2013.

        【責(zé)任編輯 杜 娟】

        F06

        A

        1673-291X(2016)23-0006-02

        2016-07-15

        黃粲(1995-),女,河北保定人,本科生,從事信息管理與信息系統(tǒng)研究。

        猜你喜歡
        用戶
        雅閣國內(nèi)用戶交付突破300萬輛
        車主之友(2022年4期)2022-08-27 00:58:26
        您撥打的用戶已戀愛,請稍后再哭
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年5期)2016-11-28 09:55:15
        兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        挖掘用戶需求尖端科技應(yīng)用
        Camera360:拍出5億用戶
        100萬用戶
        亚洲综合激情五月丁香六月| av一区二区三区高清在线看| 天堂久久一区二区三区| 成人丝袜激情一区二区| av潮喷大喷水系列无码| 亚洲欧美一区二区三区国产精| 一本久道视频无线视频试看 | 在线观看国产精品91| 久久精品天堂一区二区| 免费无码专区毛片高潮喷水| 欧美黑人又粗又硬xxxxx喷水| 天天狠天天透天干天天| 亚洲小少妇一区二区三区| 欧美疯狂性受xxxxx喷水| 亚洲av永久无码精品国产精品| 一区五码在线| 国产av一啪一区二区| 亚洲av无码电影在线播放| 亚洲中文字幕无码爆乳av| 少妇av免费在线播放| 很黄很色的女同视频一区二区| 亚瑟国产精品久久| 亚洲免费天堂| 国产三级视频在线观看国产| 亚洲s色大片在线观看| 最近中文字幕视频高清| 99在线无码精品秘 人口| 美女免费视频观看网址| 日射精情感性色视频| 热久久网站| 蜜桃视频成年人在线观看| 国产精品人人做人人爽人人添| 国产在线精品一区二区三区不卡 | 蜜臀av在线观看| 久久精品久久久久观看99水蜜桃| 91精品亚洲一区二区三区| 媚药丝袜美女高清一二区| 又粗又粗又黄又硬又深色的| 国产亚洲美女精品久久| 国产精品久久婷婷六月丁香| 国产偷久久久精品专区|