亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種電影推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

        2019-11-19 06:24:42張博李昂松尹琛湖北大學(xué)
        數(shù)碼世界 2019年11期
        關(guān)鍵詞:皮爾森物品數(shù)量

        張博 李昂松 尹琛 湖北大學(xué)

        1 問(wèn)題背景與提出

        隨著網(wǎng)絡(luò)的發(fā)展及移動(dòng)端的普及,越來(lái)越多的人們接觸到了網(wǎng)絡(luò),截至2018 年6 月,我國(guó)網(wǎng)民人數(shù)已破8 億。用戶在海量的數(shù)據(jù)中想要查找到所需信息越來(lái)越難,推薦系統(tǒng)應(yīng)運(yùn)而生。它通過(guò)分析用戶的歷史行為, 向用戶推薦能夠滿足他們興趣和需求的信息, 建立平臺(tái)與用戶之間的密切關(guān)系, 提高用戶的滿意度。

        本文現(xiàn)根據(jù)600 個(gè)用戶對(duì)9000 部電影的10000 項(xiàng)評(píng)價(jià),包括電影信息、用戶對(duì)電影的評(píng)分等數(shù)據(jù),建立數(shù)學(xué)模型解決以下問(wèn)題:

        (1)建立數(shù)學(xué)模型,實(shí)現(xiàn)電影推薦系統(tǒng),以便對(duì)用戶進(jìn)行電影推薦。

        (2)建立合理的指標(biāo)體系評(píng)價(jià)你所建立的推薦系統(tǒng)。

        2 模型的建立與求解

        在求解前,為了合理簡(jiǎn)化模型,現(xiàn)做出假設(shè):

        (1)每個(gè)用戶的評(píng)分可以反映電影的優(yōu)劣程度,保證用戶評(píng)分的合理性;

        (2)用戶的喜好在一定時(shí)間范圍內(nèi)是不變的,此假設(shè)保證模型的可信性;

        2.1 問(wèn)題一

        2.1.1 簡(jiǎn)單數(shù)據(jù)分析

        已有數(shù)據(jù)中包含評(píng)分電影年份和評(píng)分提交時(shí)間等信息,本文從評(píng)分的出現(xiàn)頻數(shù)、電影發(fā)行情況與時(shí)間的關(guān)系以及評(píng)論時(shí)間的關(guān)系入手進(jìn)行簡(jiǎn)單分析.

        (1)電影數(shù)量與時(shí)間的關(guān)系

        利用EXCEL 統(tǒng)計(jì)出自1902 年開(kāi)始到2018 年每一年的電影數(shù)量,并對(duì)統(tǒng)計(jì)結(jié)果做透視分析。結(jié)果表明,全球電影數(shù)量自1973 年(65部)開(kāi)始增速加快,數(shù)量增長(zhǎng)趨勢(shì)成指數(shù)型,到2002 年時(shí)達(dá)到最大值,為324 部,此后增速放緩且每年電影數(shù)量整體上有下降的態(tài)勢(shì)但仍舊能夠保持每年160 部及以上的電影數(shù)量。

        (2)電影評(píng)價(jià)與年份的關(guān)系

        利用EXCEL 軟件,統(tǒng)計(jì)出自1970 年開(kāi)始到2018 年每一年的評(píng)價(jià)數(shù)量,并對(duì)統(tǒng)計(jì)結(jié)果做透視分析。結(jié)果表明,全球用戶對(duì)電影的評(píng)論數(shù)量由1980 年(879 條)開(kāi)始出現(xiàn)顯著增加,每年評(píng)論數(shù)量呈現(xiàn)指數(shù)式增長(zhǎng),這與上世紀(jì)八十年代開(kāi)始互聯(lián)網(wǎng)的普及與個(gè)人電腦PC 進(jìn)入尋常百姓家中有很大的關(guān)系;評(píng)論數(shù)量在1995 年達(dá)到最大值(6012條),此后開(kāi)始急劇跌落。結(jié)合兩次分析的結(jié)果可以發(fā)現(xiàn),1994 年至2015 年間電影數(shù)量相差不會(huì)很大。但在這21 年中,1994 年到2004年間的電影評(píng)論數(shù)遠(yuǎn)高于其他年份,說(shuō)明在這20 年間人們對(duì)電影的關(guān)注度非常高,且1994~1995 年可以視為電影的鼎盛時(shí)期,這與電影的“黃金年代”的時(shí)間大致符合。

        圖 年份-電影數(shù)量統(tǒng)計(jì)直方圖

        2.1.2 構(gòu)建基于協(xié)同過(guò)濾的電影推薦系統(tǒng)

        2.1.2.1 建立基于物品的協(xié)同過(guò)濾算法

        (1)協(xié)同過(guò)濾算法

        協(xié)同過(guò)濾算法分為基于用戶的協(xié)同過(guò)濾算法和基于物品的協(xié)同過(guò)濾算法。

        基于用戶的協(xié)同過(guò)濾算法(簡(jiǎn)稱UserCF),通過(guò)不同用戶對(duì)同一物品的評(píng)分來(lái)體現(xiàn)用戶之間的相似性。該算法適用于用戶較少的情況,其特征在于推薦的時(shí)那些和目標(biāo)用戶有共同興趣的其他用戶喜歡的物品,適合時(shí)效性強(qiáng)、社會(huì)化、用戶個(gè)性化興趣不太明顯的領(lǐng)域,如新聞推薦、微博話題等。

        基于物品的協(xié)同過(guò)濾算法(簡(jiǎn)稱ItemCF),它通過(guò)同一用戶對(duì)不同物品的評(píng)分來(lái)反映物品之間的相似性。該算法適用于物品數(shù)明顯小于用戶數(shù)的場(chǎng)合,其特征在于推薦那些和目標(biāo)用戶之前喜歡的物品類似的其他物品,適合個(gè)性化需求強(qiáng)烈的領(lǐng)域,如電子商務(wù)、電影等

        (2)模型的設(shè)計(jì)

        本文決定選用基于物品的協(xié)同過(guò)濾算法(ItemCF)來(lái)構(gòu)建電影推薦模型。該算法主要包括兩步:

        a.計(jì)算物品之間的相似度。本文選用相似度算法的皮爾森系數(shù)計(jì)算物品之間的相似度,皮爾森相似度計(jì)算公式如下所示。

        式中,U 表示用戶所有對(duì)i 和j 共同評(píng)估評(píng)級(jí)的用戶組成的組合;表示對(duì)i 和j 共同評(píng)估評(píng)級(jí)的用戶,他們對(duì)i 的評(píng)級(jí)的平均值。

        b.計(jì)算推薦評(píng)分。根據(jù)物品的相似度矩陣和用戶的歷史行為信息,求解推薦評(píng)分,然后根據(jù)推薦評(píng)分給用戶生成推薦列表。推薦評(píng)分公式如下圖所示。

        根據(jù)各電影平均分和評(píng)分人數(shù)情況,得到最高平均分電影,選該電影為例來(lái)運(yùn)行ItemCF 算法模型,得出推薦的另外5 部電影。

        (3) 模型的求解

        依據(jù)上述流程,得到電影Forrest Gump(1994)為典例電影,而后對(duì)該電影與其他電影間進(jìn)行皮爾森關(guān)聯(lián)度計(jì)算,并對(duì)其進(jìn)行奇異值分解,最后計(jì)算結(jié)果進(jìn)行降序排列。推薦電影分別為:Shawshank Redemption, The(1994)、Schindler's List(1993)、Silence of the Lambs, The(1991)、Apollo 13(1995)、Braveheart(1995)。

        2.2 問(wèn)題二

        2.2.1 評(píng)價(jià)指標(biāo)的選擇與體系建立

        本文選用精確率,召回率,覆蓋率和新穎度作為測(cè)評(píng)指標(biāo)。精確率描述最終的推薦列表中有多少比例是發(fā)生過(guò)的用戶;召回率描述有多少比例的用戶;覆蓋率反映了推薦算法發(fā)掘長(zhǎng)尾的能力;新穎度反映了推薦列表中物品的平均流行度。

        2.2.2 評(píng)價(jià)推薦模型

        對(duì)用戶 推薦N 個(gè)物品,記為R(u),令用戶u 在測(cè)試集中喜歡的物品集為T(mén)(u),那么各指標(biāo)公式如下,

        上述三式為問(wèn)題二評(píng)價(jià)推薦模型。評(píng)估模型的方式是對(duì)每個(gè)用戶進(jìn)行推薦,最后使用評(píng)估指標(biāo)進(jìn)行評(píng)測(cè)。經(jīng)過(guò)測(cè)評(píng)計(jì)算,精確率0.3767,召回率0.0759,覆蓋率0.3175,總體來(lái)看該模型效果良好。

        猜你喜歡
        皮爾森物品數(shù)量
        稱物品
        “雙十一”,你搶到了想要的物品嗎?
        誰(shuí)動(dòng)了凡·高的物品
        統(tǒng)一數(shù)量再比較
        頭發(fā)的數(shù)量
        找物品
        我國(guó)博物館數(shù)量達(dá)4510家
        數(shù)字翹楚皮爾森:忍過(guò)100多次整形的女軍人
        有夢(mèng)的青春不易“殘”
        国产精品白浆无码流出| 国产大屁股视频免费区| 日本无码欧美一区精品久久| 国产真人无码作爱视频免费| 乱人伦人妻中文字幕无码| 手机在线观看成年人视频| 色佬精品免费在线视频| av无码精品一区二区三区宅噜噜| 乱码一二区在线亚洲| 成人国产自拍在线播放| 国产一区二区三区在线大屁股| 国产国产人免费人成免费视频| 无码一区二区三区老色鬼| 久久久高清免费视频| 丝袜av乱码字幕三级人妻| 日本少妇浓毛bbwbbwbbw| 亚洲av有码在线天堂| 特一级熟女毛片免费观看| 成人一区二区三区国产| 色婷婷五月综合久久| 青青草国产成人99久久| 亚洲av伊人久久综合性色| 国产麻豆久久av入口| 性大毛片视频| 精品无码久久久久久久久粉色| 激情免费视频一区二区三区| 8x国产精品视频| 精品久久久久久中文字幕| 无码AV午夜福利一区| 亚洲天堂一区二区偷拍| 免费大黄网站| AV无码一区二区三区国产| 后入少妇免费在线观看| 亚洲中文字幕无码爆乳app| 亚洲欧美综合在线天堂| 国产杨幂AV在线播放| 在线精品首页中文字幕亚洲| 精品国产乱码久久久久久影片| 国产高清国内精品福利99久久| 干出白浆视频在线观看| 久久精品国产亚洲7777|