亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)預(yù)測評分矩陣的協(xié)同過濾算法

        2019-12-04 01:47:08楊歡王新房
        軟件導(dǎo)刊 2019年10期
        關(guān)鍵詞:協(xié)同過濾

        楊歡 王新房

        摘要:為解決傳統(tǒng)協(xié)同過濾推薦算法數(shù)據(jù)稀疏、可擴展性差等問題,采用改進(jìn)預(yù)測評分矩陣的協(xié)同過濾算法。首先使用基于線性回歸分析的加權(quán)Slope One算法,在傳統(tǒng)Slope One算法中加入可信度,提高共同評分基數(shù);然后采用網(wǎng)上標(biāo)準(zhǔn)數(shù)據(jù)集movielens作為測試數(shù)據(jù),結(jié)合協(xié)同過濾算法進(jìn)行top-N推薦。實驗結(jié)果表明,使用改進(jìn)預(yù)測評分矩陣的協(xié)同過濾算法的MEA較小,在近鄰數(shù)大于25時達(dá)到0.74,表明該算法改善了傳統(tǒng)協(xié)同過濾算法數(shù)據(jù)稀疏、擴展性差問題,降低了推薦誤差,提高了推薦系統(tǒng)準(zhǔn)確度。

        關(guān)鍵詞:協(xié)同過濾;線性回歸分析;SlopeOne算法;top-N推薦

        DOI:10.11907/rjdk.191026開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):

        中圖分類號:TP312文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2019)010-0090-04

        0引言

        隨著Web2.0時代的到來,海量信息涌現(xiàn)在互聯(lián)網(wǎng)上,消費者與商家都希望從大量數(shù)據(jù)中找到有用信息。推薦系統(tǒng)應(yīng)運而生,它根據(jù)用戶歷史數(shù)據(jù)信息構(gòu)建用戶興趣模型,從而向用戶推薦有用信息。近年來隨著各大網(wǎng)站的建立及APP的開發(fā),推薦系統(tǒng)被廣泛應(yīng)用于電子商務(wù)、電影視頻、音樂推薦等,亞馬遜、Facebook、京東、淘寶等網(wǎng)站均有屬于自己的個性化推薦系統(tǒng)。推薦算法的應(yīng)用也顯著提高了推薦系統(tǒng)準(zhǔn)確性。

        2005年Adomavicius等將主流推薦算法分為3個主要類別:基于內(nèi)容的推薦、基于協(xié)同過濾的推薦和各種組合推薦方法,其中應(yīng)用最廣的是協(xié)同過濾推薦算法。該算法又可分為基于用戶的協(xié)同過濾(UBCF)和基于項目的協(xié)同過濾(IBCF)。這兩種算法的主要特征是近鄰?fù)扑],根據(jù)目標(biāo)用戶最近鄰購買的商品預(yù)測其即將購買的商品。但是隨著時間的推移,商品和用戶數(shù)量不斷擴大,且很少用戶會對每個商品進(jìn)行評價,這就導(dǎo)致了近鄰?fù)扑]構(gòu)成的評分矩陣不是很完整,而且會越來越稀疏,最終導(dǎo)致推薦質(zhì)量變差,可擴展性下降。

        近些年也有很多研究聚焦于該問題。文獻(xiàn)[5]提出了基于高維稀疏數(shù)據(jù)聚類的協(xié)同過濾推薦算法,首先通過聚類處理原有高維稀疏數(shù)據(jù),再利用稀疏差異度和集合差異度量公式,在用戶一項目評分矩陣上進(jìn)行聚類,然后利用協(xié)同過濾算法推薦聚類后的矩陣,提高算法推薦精度;文獻(xiàn)[6]利用深度學(xué)習(xí)算法獲取神經(jīng)網(wǎng)絡(luò)訓(xùn)練商品的評分,降低數(shù)據(jù)稀疏性,提高了算法推薦質(zhì)量;文獻(xiàn)[7]把奇異值分解融合到基于項目的協(xié)同過濾中,降低用戶項目矩陣維度,有效緩解了數(shù)據(jù)稀疏的問題;文獻(xiàn)[8]提出一種有關(guān)用戶社交信任關(guān)系的改進(jìn)協(xié)同過濾算法,通過用戶關(guān)系社交填充評分?jǐn)?shù)據(jù),從而提高協(xié)同過濾的推薦性能。

        針對傳統(tǒng)推薦算法中數(shù)據(jù)稀疏、擴展性差等問題,本文提出一種改進(jìn)預(yù)測評分矩陣的協(xié)同過濾算法。首先在傳統(tǒng)基于線性回歸分析的Slope One算法基礎(chǔ)上提出加權(quán)Slope One算法,考慮到可信度的問題,以共同評價過項目的用戶數(shù)作為項目評分加權(quán)值,通過加權(quán)SlopeOne算法填充稀疏用戶項目評分矩陣,然后結(jié)合協(xié)同過濾進(jìn)行top-N推薦。

        1協(xié)同過濾算法

        1.1相似度計算

        相似度可衡量事物的相近程度,在本文算法中指兩個用戶對同一個項目的喜好程度(用戶相似度)或兩個項目被同一個用戶喜好的相似程度(項目相似度)。協(xié)同過濾推薦算法通常使用的相似度有3種:

        (1)余弦相似性。兩個用戶間相似程度可通過余弦夾角獲得,相似度越小,夾角越大;相似度越大,夾角越小。

        1.2協(xié)同過濾算法原理

        2Slope One算法

        2.1傳統(tǒng)基于線性回歸模型的Slope One算法

        2.2加權(quán)Slope One算法

        傳統(tǒng)Slope One算法僅根據(jù)式(7)求取待推薦用戶的歷史評分,以此推算出該用戶對項目j的評分,由于項目偏差沒有考慮到不參予的用戶基數(shù),因此用戶可信度不同。對于預(yù)測評分的項目,共同評分基數(shù)越大,則可信度越高。假設(shè)m個用戶同時評價項目j和k,而n個用戶同時評價項目j和l,當(dāng)m>n時,前者置信度大于后者。

        在表1的項目一評分矩陣中,“一”代表用戶2對項目1的評分未知或者沒有評分,用戶3對項目3的評分為需要預(yù)測的目標(biāo)用戶的評分,計算項目1與項目2的偏差為((2-1)+(4-2))/2=0.5,由該偏差計算出用戶2對項目1的評分為3+0.5=3.5,項目1與項目3的偏差為2-4=-2,則用戶2對項目1的評分為-2+5=3,由此計算出用戶2對項目1的評分為(3.5+3)/2=3.25,同理可求得用戶3對項目3的預(yù)測評分為2.19。由上可知項目1與項目2都評價的用戶數(shù)為2,因此權(quán)重為2;項目1和項目3都評價的用戶數(shù)為1,因此權(quán)重為1。

        3基于最近鄰的Sloope One智能推薦算法

        一般對推薦算法的要求包括:容易實現(xiàn)、便于維護,對新的評分要立即響應(yīng)、查詢速度快,對新的用戶也要能給出有用的推薦,精度上要有競爭力。

        協(xié)同過濾推薦算法在研究之初迅速成為信息推薦中一項很受歡迎的技術(shù),特別是IBCF,被廣泛應(yīng)用于各大網(wǎng)站。但隨著內(nèi)容復(fù)雜性不斷增加及用戶人數(shù)不斷增多,協(xié)同過濾算法的一些缺點逐漸顯露出來,主要有數(shù)據(jù)稀疏性、擴展性差、精確性不高等。

        傳統(tǒng)Slope One算法的優(yōu)點是實現(xiàn)簡單且易于維護、響應(yīng)即時,并且用戶新增評分對推薦數(shù)據(jù)的改變較小,因為在內(nèi)存中儲存的是物品間的平均差值,新增差值只需進(jìn)行累加,且范圍只是用戶評分過的產(chǎn)品,在一定程度上算法的準(zhǔn)確率也很高?;谝陨蟽煞N算法的優(yōu)缺點,本文提出一種新的基于最近鄰的Slope One智能推薦算法。

        3.1項目一評分矩陣構(gòu)成

        4實驗結(jié)果與分析

        基于用戶的協(xié)同過濾對測試集中458個用戶分別進(jìn)行預(yù)測評分實驗,采用3種不同的相似度計算方法,最近鄰居數(shù)范圍是5~60,得到的平均MAE結(jié)果如圖1所示。從中可知,采用不同相似度量對預(yù)測精度有一定影響,其中相關(guān)相似性精度最差,余弦相似度次之,精度最高的是修正的余弦相似度,所以本次實驗采用修正的余弦相似度。

        4種算法對比如圖5所示。從圖5可以看出,UBCF的MAE值會隨著近鄰數(shù)的增加而減小,但是當(dāng)近鄰數(shù)增加到35后,算法的MEA值趨于平穩(wěn),不會發(fā)生巨大波動。而傳統(tǒng)Slope One算法的MEA值幾乎不波動,但相對于前兩種算法精度有所提高。而經(jīng)由均值填充的算法在近鄰數(shù)小于10時算法的MEA值高于UBCF,雖然后期算法的MEA值明顯降低,但是相對于本文算法仍然較高。本文算法以加權(quán)Slope One算法填充UBCF評分矩陣為例,精度一直高于UBCF,雖然當(dāng)近鄰數(shù)小于13時精度小于Slope One算法,但是后期算法精度明顯提高。

        5結(jié)語

        本文將加權(quán)Slope One推薦算法融入到傳統(tǒng)協(xié)同過濾算法中,用線性回歸分析填充稀疏的評分矩陣,解決了傳統(tǒng)算法中數(shù)據(jù)稀疏、可擴展性不強等問題。實驗結(jié)果表明,本文算法與傳統(tǒng)協(xié)同過濾及Slope One算法相比,推薦精度更高,與平均值填充的協(xié)同過濾算法相比,精度也有所提高,更適用于推薦算法研究。

        在推薦系統(tǒng)中,推薦算法的研究還需不斷深入,可以加入用戶關(guān)系模型和時間戳以及地理位置等因素,提取更多隱含特征使推薦更準(zhǔn)確。

        猜你喜歡
        協(xié)同過濾
        基于用戶評分和項目類偏好的協(xié)同過濾推薦算法
        基于用戶相似度加權(quán)的Slope One算法
        軟件(2016年4期)2017-01-20 09:44:28
        圖書推薦算法綜述
        改進(jìn)的協(xié)同過濾推薦算法
        基于鏈?zhǔn)酱鎯Y(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
        基于相似傳播和情景聚類的網(wǎng)絡(luò)協(xié)同過濾推薦算法研究
        基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
        混合推薦算法在電影推薦中的研究與評述
        關(guān)于協(xié)同過濾推薦算法的研究文獻(xiàn)綜述
        商(2016年29期)2016-10-29 15:22:08
        基于混合信任模型的協(xié)同過濾推薦算法
        免费成人在线电影| 青青草绿色华人播放在线视频| 极品夫妻一区二区三区| 精人妻无码一区二区三区| 亚洲av无码之国产精品网址蜜芽| 国产成人久久综合热| 国产又色又爽无遮挡免费| 国产偷国产偷亚洲欧美高清| 国产精品亚洲av无人区二区| 不卡日韩av在线播放| 国产顶级熟妇高潮xxxxx| 国产精品毛片无码久久| 最新国产主播一区二区| 国产一区二区三区仙踪林| 日韩人妻无码精品久久免费一 | 国产成人av综合色| 国产精品亚洲一区二区三区在线看 | 91成人国产九色在线观看| 九九久久自然熟的香蕉图片| 国产精品无码日韩欧| 无码视频一区=区| 美女视频在线观看网址大全| 一边做一边喷17p亚洲乱妇50p | 欧美日本国产三级在线| 日韩精品高清不卡一区二区三区| 水野优香中文字幕av网站| 欧美国产精品久久久乱码| 人妻中出精品久久久一区二| 国产一区二区三区精品乱码不卡 | 亚洲乱码日产精品一二三| AV无码最在线播放| 综合久久青青草免费观看视频| 丝袜美腿av在线观看| 欧洲熟妇色xxxx欧美老妇多毛图片| 99久久超碰中文字幕伊人| 自拍偷拍韩国三级视频| 国产91人妻一区二区三区| 性欧美videofree高清精品| 亚洲无码a∨在线视频| 深夜日韩在线观看视频| 亚洲av无码专区在线观看成人|