亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶的協(xié)同過濾推薦算法的研究及Python 實(shí)現(xiàn)

        2020-04-02 06:28:22
        魅力中國 2020年52期

        (佛山科學(xué)技術(shù)學(xué)院數(shù)學(xué)與大數(shù)據(jù)院系,廣東 佛山 528000)

        在5G 時代下,各種設(shè)備,各行各業(yè)都將不可避免地與互聯(lián)網(wǎng)相連,這帶來了生活的極大便利,但同時也將帶來比現(xiàn)階段更加海量的數(shù)據(jù),于是如何更加有效地處理數(shù)據(jù)便顯得更加重要。在這樣的背景之下,各種各樣的推薦技術(shù)便越發(fā)被人們所重視,如電子商務(wù)領(lǐng)域,推薦算法便是其不可或缺的一部分。

        通過對推薦系統(tǒng)相關(guān)論文的大量研讀,發(fā)現(xiàn)現(xiàn)在已有眾多基于不同原理的推薦算法,其中,協(xié)同過濾算法最具代表性,其大致可分為基于用戶、基于物品與基于模型三類。但隨著如今應(yīng)用系統(tǒng)結(jié)構(gòu)的復(fù)雜化,用戶的擴(kuò)增,數(shù)據(jù)的海量增加,協(xié)同過濾算法越來越面臨著挑戰(zhàn)。

        在上述背景下,本文展開對基于用戶的協(xié)同過濾算法的研究并利用Python 對算法進(jìn)行代碼的簡單實(shí)現(xiàn)。

        一、協(xié)同過濾推薦算法

        協(xié)同過濾算法一般通過輸入m 個用戶列表,n 個物品列表,每個用戶已評價的物品評分等數(shù)據(jù),構(gòu)建用戶-物品評分矩陣,并提取矩陣數(shù)據(jù)通過以下三步計(jì)算進(jìn)行推薦:

        1.相似度(similarity)計(jì)算,得出相似用戶(或物品)列表;

        2.吸引力(prediction)計(jì)算,得出目標(biāo)用戶對未購買物品的預(yù)測評分;

        3.推薦(recommendation)計(jì)算,得出對目標(biāo)用戶吸引力最大的前k 個物品,并向其推薦。

        其基本工作原理如圖一。

        二、用戶相似度計(jì)算

        用戶間的相似度計(jì)算是基于用戶的協(xié)同過濾推薦算法的關(guān)鍵步驟之一,其采用的計(jì)算方法影響算法的推薦精度。

        Similarity 計(jì)算: 提取矩陣中user1,user2,user3,user4 四個用戶對所有物品的評分,構(gòu)建四條評分向量,向量間的相似度就是用戶間的相似度。(計(jì)算向量間相似度時,兩個用戶之間評分物品必須相同)

        計(jì)算用戶相似度的公式如下:

        其中,Wuv 表示用戶u 與v 的相似度,i 表示用戶u 與用戶v 都高評分的物品集合,N(i)表示對i有高評分的用戶數(shù),N(u)、N(v)分別表示用戶u與用戶v高評分的物品集合。

        三、吸引力預(yù)測

        預(yù)測用戶未購買物品對其的吸引力,這也是算法的關(guān)鍵步驟之一。

        Prediction 計(jì)算:對用戶u,在用戶相似度中找到與其相似度最高的k 個用戶,遍歷他們高評分的物品,并計(jì)算出用戶u 對每個物品的感興趣程度。

        計(jì)算用戶u 對物品i 的興趣程度的公式如下:其中S(u,k),表示與用戶相似度最高的K 個用戶。

        四、評測指標(biāo)

        將用戶評分?jǐn)?shù)據(jù)均勻分布,隨機(jī)劃分成M 份,挑選一份作為測試集,將剩下M-1份作為訓(xùn)練集,為防止評測指標(biāo)過擬合,共進(jìn)行次M 實(shí)驗(yàn),每次使用不同的測試集,最后將M 次實(shí)驗(yàn)的評測指標(biāo)的平均值作為最終評測指標(biāo)。

        1.召回率:反映包含在最終推薦列表中用戶-物品記錄的比例。其計(jì)算公式如下。

        其中,R(u)表示向用戶u 推薦n 個物品,T(u)表示用戶u 在測試集上感興趣的物品集合。

        2.準(zhǔn)確率:反映最終推薦列表中發(fā)生過的用戶-物品評分記錄的比例。其計(jì)算公式如下。

        3.覆蓋率:反映算法發(fā)掘推薦物品的能力。其計(jì)算公式如下。

        其中,分子部分表示實(shí)驗(yàn)中所有能被推薦給用戶的物品數(shù)目(集合去重),分母表示數(shù)據(jù)集中所有物品的數(shù)目。

        五、算法代碼

        在以上關(guān)于基于用戶的協(xié)同過濾推薦算法原理研究下,我們通過Python 將算法進(jìn)行實(shí)現(xiàn),并代入數(shù)據(jù)進(jìn)行測試,進(jìn)一步證明本文算法原理的正確性,圖二,圖三為部分代碼展示:

        算法運(yùn)行結(jié)果如圖四:

        六、結(jié)語

        本文介紹了基于用戶的協(xié)同過濾推薦算法的原理,并給出了相應(yīng)的用戶相似度計(jì)算公式與吸引力預(yù)測公式,同時介紹了各評測指標(biāo)及計(jì)算公式,最后用Python 將算法進(jìn)行了代碼實(shí)現(xiàn)并代數(shù)據(jù)進(jìn)行了測試。通過這些推薦算法,可以有效分析大數(shù)據(jù)時代下的海量數(shù)據(jù),并將其應(yīng)用至電子商務(wù)、社交媒體、視頻網(wǎng)站、信息管理等各個領(lǐng)域。

        精品一区二区亚洲一二三区| 午夜亚洲av永久无码精品| 狠狠色狠狠色综合久久第一次| 国产亚洲日本人在线观看| 亚洲av高清一区二区| 国语自产精品视频在线看| 精品人妻少妇一区二区三区不卡 | 精品人妻少妇一区二区中文字幕 | 久久青草亚洲AV无码麻豆| 东京热加勒比国产精品| 成人免费无码大片a毛片抽搐色欲 日本动漫瀑乳h动漫啪啪免费 | 国产午夜影视大全免费观看| 国产人妖xxxx做受视频| 韩国一区二区三区黄色录像| 蜜桃日本免费观看mv| 天天爱天天做天天爽| 亚洲综合精品在线观看中文字幕 | 亚洲国产精品不卡av在线| 黑人巨大跨种族video| 亚洲两性视频一三区| 青青草成人免费播放视频| 天天做天天添av国产亚洲| 久久国产精久久精产国| 成人精品免费av不卡在线观看| 东京热加勒比视频一区| 玩弄丰满奶水的女邻居| 在线观看免费人成视频| 手机av在线观看视频| 人妻诱惑中文字幕在线视频| 天天做天天爱天天爽综合网| 中文字幕第一页亚洲观看| 亚洲一区二区三区在线最新| 国产精品久久久久9999吃药| 亚洲成人电影在线观看精品国产| 精品蜜桃av一区二区三区| 91成人自拍国语对白| 一本色道久久综合亚洲精品不卡| 精品国产性色av网站| 深夜一区二区三区视频在线观看| 风流老熟女一区二区三区| 日韩AV有码无码一区二区三区 |