亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于共同評分項和權(quán)重計算的推薦算法研究

        2016-03-01 08:59:38謝人強
        計算機技術(shù)與發(fā)展 2016年9期
        關(guān)鍵詞:相似性權(quán)重協(xié)同

        謝人強,陳 震

        (福州外語外貿(mào)學(xué)院信息系,福建福州 350202)

        基于共同評分項和權(quán)重計算的推薦算法研究

        謝人強,陳 震

        (福州外語外貿(mào)學(xué)院信息系,福建福州 350202)

        產(chǎn)生推薦列表是基于用戶的協(xié)同過濾推薦算法的重要步驟,也是最終的結(jié)果。針對在基于用戶的協(xié)同過濾推薦算法中,“產(chǎn)生推薦列表”環(huán)節(jié)的研究相對較少的這一現(xiàn)象,為了改進推薦算法的性能,通過權(quán)重計算和共同評分項方法來選定推薦項目,即首先將項目按照評分的近鄰用戶數(shù)量的多少進行排序,然后對排序的項目進行綜合權(quán)重計算,將其結(jié)果由高到低進行再次排序,從而產(chǎn)生推薦列表。該算法經(jīng)MovieLens數(shù)據(jù)集測試,在測試中使用“平均絕對誤差”作為實驗測評指標(biāo),結(jié)果表明,在目標(biāo)用戶的相似用戶數(shù)為60時,該算法相較于不考慮共同評分項或綜合權(quán)重計算因素的算法,有著更低的平均絕對誤差,其值為0.77。該算法能夠在一定程度上提高推薦系統(tǒng)的準(zhǔn)確度。

        協(xié)同過濾算法;評分項;綜合權(quán)重;準(zhǔn)確度

        1 概述

        隨著互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,以及網(wǎng)民數(shù)量的持續(xù)增加,使得互聯(lián)網(wǎng)的信息呈現(xiàn)爆炸式增長態(tài)勢,用戶正面臨著越來越嚴(yán)重的“信息過載”問題。目前,解決“信息過載”問題的方法主要有兩種:一是信息檢索技術(shù),該類技術(shù)以搜索引擎為代表;二是信息過濾技術(shù),該類技術(shù)以推薦系統(tǒng)為代表。兩類技術(shù)各有優(yōu)缺點,但當(dāng)用戶的需求不明確時,推薦系統(tǒng)能表現(xiàn)出更強的優(yōu)勢。在眾多推薦系統(tǒng)算法中,協(xié)同過濾技術(shù)應(yīng)用最為廣泛,且效果最好。所謂的協(xié)同過濾算法是通過分析、查找與目標(biāo)用戶相似的近鄰用戶或項目,根據(jù)近鄰用戶或項目的情況,為目標(biāo)用戶進行個性化推薦[1]。

        現(xiàn)有的協(xié)同過濾推薦算法主要分為基于模型與基于內(nèi)存兩類?;谀P偷耐扑]算法是建立評分模型進行推薦,具體算法包括:基于聚類的算法、基于分類的算法、基于關(guān)聯(lián)規(guī)則的算法等[2]?;趦?nèi)存的推薦算法包含基于用戶的推薦算法和基于項目的推薦算法,文中以基于用戶的推薦算法為例。

        基于用戶的協(xié)同過濾算法,大致包含以下幾個步驟:

        (1)建立用戶-項目評分矩陣;

        (2)計算用戶相似度;

        (3)選擇k近鄰;

        (4)產(chǎn)生推薦列表[3]。

        其中,常見的計算用戶間相似度的算法有余弦相似性、修正的余弦相似性、相關(guān)相似性等[4];選擇K近鄰主要有閾值法和Top-N法。

        近些年,協(xié)同過濾算法得到了廣泛研究,眾多的模型與算法被提出。文中在此基礎(chǔ)上,充分考慮共同對項目評分的近鄰用戶數(shù)量、項目的權(quán)重計算方法兩個影響因素,提出協(xié)同過濾的改進算法,并通過實驗驗證算法的性能。

        2 基于用戶的協(xié)同過濾推薦算法的相關(guān)研究

        為了提高推薦算法的性能,許多學(xué)者對該領(lǐng)域進行了深入研究。例如,Reinders等充分利用用戶-項目評分矩陣信息,結(jié)合用戶相似性和項目相似性,使用了近鄰用戶對近鄰項目的評分信息[5]。George等提出歸一化評分項目的方法,將每個評分項目都添加一個歸一化因子,從而降低活躍用戶評價過的項目的重要性[6]。David等提出以概率模式為基礎(chǔ)的相似性計算方法[7]。Herlocker等提出了項目-評分矩陣中的評分信息的改進方式,對那些與目標(biāo)用戶相似的近鄰用戶,如果沒有對目標(biāo)項目進行評分,可以使用近鄰用戶的平均評分來參與相似度計算[8]。Xue G R等提出利用目標(biāo)用戶的近鄰用戶集的平均分值作為近鄰用戶缺失的評分信息[9]。Larson等提出了“細粒度”的計算方法[10]。Zhao S等提出了整合與充分利用近鄰用戶和相似項目的信息來提高精度[11]。另外,李紅梅等利用精確歐氏局部敏感哈希算法對用戶評分?jǐn)?shù)據(jù)進行降維處理,然后構(gòu)建索引,從而快速獲取目標(biāo)用戶的近鄰用戶[12]。汪靜等提出基于共同評分和相似性權(quán)重的協(xié)同過濾推薦算法,使用共同評分?jǐn)?shù)據(jù)計算用戶的相似性,選擇被共同評分的數(shù)據(jù)計算項目的相似性,再結(jié)合相似性權(quán)重得出預(yù)測結(jié)果,該算法有效提高了推薦的準(zhǔn)確度[13]。

        綜上所述,協(xié)同過濾推薦算法的改進方法眾多,許多學(xué)者對改進推薦系統(tǒng)的性能做出了重大貢獻,但總體而言,在基于用戶的協(xié)同過濾推薦算法的各步驟中,“用戶相似度計算”環(huán)節(jié)的改進研究較多,而“產(chǎn)生推薦列表”環(huán)節(jié)的研究相對較少。文中將著眼于“產(chǎn)生推薦列表”環(huán)節(jié),提出基于共同評分項和綜合權(quán)重計算的協(xié)同過濾推薦算法。

        3 基于共同評分項和綜合權(quán)重計算的協(xié)同過濾推薦算法

        3.1 算法說明

        設(shè)計的算法包括以下幾個步驟,例如要給目標(biāo)用戶u推薦K個項目。

        (1)使用Pearson相關(guān)相似性算法計算u與其他所有用戶的相似度,并將相似度的值從高到低進行排列。Pearson相關(guān)相似性算法如式(1)所示[14-15]:

        其中,Ric表示用戶i對項目c的評分;Ri表示用戶i的平均評分;表示用戶j的平均評分;Rij表示用戶i和用戶j共同評分的項目集合。

        (2)選取相似度最高的前N個用戶數(shù)據(jù)放入集合A中。

        (3)將項目按集合A中用戶的共同評分?jǐn)?shù)量的多少進行排序,用戶共同評分多的項目排在前,共同評分少的項目排在后,排序后項目集合為B。

        (4)利用用戶間相似性的程度,計算集合B中各項目的權(quán)重,例如項目c的權(quán)重計算如下:

        其中,TWeight(c) 為 項 目 c的 總 權(quán) 重; Sumsim(c)為對項目c進行評價的,與目標(biāo)用戶u相似的所有用戶的相似值之和;Weight(c)為項目c的權(quán)重值;Ic為對項目c進行評價的用戶集合;j為Ic中的某個用戶;sim(u,j)表示目標(biāo)用戶u與用戶j的相似值。

        (5)將各項目的權(quán)重,按從大到小進行排序。

        (6)選擇權(quán)重最大的前K個項目推薦給用戶。

        3.2 算法分析

        該算法具有較強的實用性,同時也具有一定的優(yōu)越性,具體表現(xiàn)在:

        (1)步驟1和步驟2保證了參與計算的用戶都與目標(biāo)用戶有較高的相似度,從而保證了它們之間的相關(guān)性,因此獲得的推薦信息將會更準(zhǔn)確。

        (2)通過步驟3,可以在一定程度上保證權(quán)重高的項目優(yōu)先被推薦。因為共同評分多的項目,往往是因為相似用戶對該項目的興趣程度高。

        (3)通過步驟4準(zhǔn)確計算步驟3得出的各項目的權(quán)重,然后將前K個項目進行推薦,保證了推薦算法的準(zhǔn)確性。

        3.3 算法設(shè)計

        根據(jù)前文的分析,基于雙重選擇的協(xié)同過濾推薦算法設(shè)計如圖1所示。

        4 實驗分析

        4.1 實驗數(shù)據(jù)與測評指標(biāo)

        實驗數(shù)據(jù)來源于GroupLens提供的MovieLens數(shù)據(jù)集,該數(shù)據(jù)集是一個評分?jǐn)?shù)據(jù)集,是用戶對自己看過的電影進行評分,分值為1~5,不同的評分分值表達了用戶對某影片的不同喜好程度。MovieLens數(shù)據(jù)集包括三個大小不同的庫,評分?jǐn)?shù)據(jù)分別為10萬條、1百萬條、1千萬條。為了計算方便,文中選取小規(guī)模的數(shù)據(jù)集,它包含943個用戶對1 682部電影的10萬條評分?jǐn)?shù)據(jù)。

        在實驗過程中,將數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和測試集,在訓(xùn)練集上按3.1節(jié)的算法建立相應(yīng)的模型,在測試集上對目標(biāo)用戶行為進行預(yù)測。實驗測評指標(biāo)使用平均絕對誤差(Mean Absolute Error,MAE),它是一種統(tǒng)計度量方法。MAE通過計算目標(biāo)用戶在訓(xùn)練集上的評分與測試集上的評分之間的差值來度量算法及預(yù)測準(zhǔn)確性,見式(5)。

        其中,n為評分總數(shù);ric為用戶i對項目c的實際評分;r^ic為用戶i對項目c的預(yù)測評分;MAE數(shù)值與推薦的預(yù)測準(zhǔn)確性呈反比,MAE越小,推薦效果越好。

        為了比較文中所描述算法的性能,引入另外兩種算法進行比較,分別命名為UBCF-1、UBCF-2,文中算法命名為UBCF-3。三種算法的具體計算思路如表1所示。

        由表1可以看出,相比于UBCF-1,UBCF-2改進了項目權(quán)重的計算方法,UBCF-3相比UBCF-2,考慮了共同評分項的因素。

        4.2 測評結(jié)果

        對MovieLens數(shù)據(jù)集進行測評,當(dāng)使用UBCF-1時,與目標(biāo)用戶的相似用戶數(shù)選取值N發(fā)生變化時,得到如圖2所示的MAE變化圖。

        UBCF-2使用了文中介紹的權(quán)重計算公式(見式(2)~(4)),通過程序運行,得出了如圖3所示的MAE變化圖。

        從圖3可以看出,UBCF-2中MAE數(shù)值有了大幅降低,即推薦系統(tǒng)的準(zhǔn)確率得到了大幅提高。在UBCF-2的基礎(chǔ)上,UBCF-3考慮了項目共同評分的數(shù)量,該算法MAE變化圖如圖4所示。

        從圖4可以看出,UBCF-3的總體性能相對于UBCF-2又有了一定程度的提升,當(dāng)N=60,即目標(biāo)用戶的相似用戶數(shù)為60時,UBCF-3算法的MAE值最小。通過圖5,可以顯而易見地得到UBCF-3相對UBCF-1、UBCF-2有著更好的性能。

        圖4 UBCF-3的MAE變化圖

        UBCF-3算法給目標(biāo)用戶推薦的項目數(shù)不同,MAE值也會產(chǎn)生相應(yīng)的變化,如圖6所示。

        5 結(jié)束語

        文中提出了一種基于共同評分項和綜合權(quán)重計算的協(xié)同過濾推薦算法??紤]了共同評分用戶數(shù)對產(chǎn)生最終推薦列表的影響,一般情況下,共同評分越多的項目,往往是因為相似用戶對該項目的興趣程度越高,因而對它進行推薦,準(zhǔn)確度就越高;也考慮了綜合權(quán)重計算對推薦列表產(chǎn)生的影響,并提出了綜合權(quán)重的計算公式。在MovieLens數(shù)據(jù)集上的測試結(jié)果表明,基于共同評分項和綜合權(quán)重計算的協(xié)同過濾推薦算法能夠提高推薦系統(tǒng)的準(zhǔn)確度,獲得更好的推薦質(zhì)量。

        [1] 朱麗中,徐秀娟,劉 宇.基于項目和信任的協(xié)同過濾推薦算法[J].計算機工程,2013,39(1):58-62.

        [2] 劉宇軒.混合協(xié)同過濾算法研究[D].北京:北京郵電大學(xué),2013.

        [3] 碩良勛,柴變芳,張新東.基于改進最近鄰的協(xié)同過濾推薦算法[J].計算機工程與應(yīng)用,2015,51(5):137-141.

        [4] 馬宏偉,張光衛(wèi),李 鵬.協(xié)同過濾推薦算法綜述[J].小型微型計算機系統(tǒng),2009(7):1282-1288.

        [5] Wang Jun,Vries A P,Reinders M J T.Unifying user-based and item-based collaborative filtering approaches by similarity fusion[C]//Proceedings of ACM SIGIR’06.[s.l.]:ACM,2006:501-508.

        [6] Karypis G.Evaluation of item-based Top-N recommendation algorithms[C]//Proceedings of the tenth international conference on information and knowledge management.[s.l.]:[s. n.],2001:247-254.

        [7] Kits B,F(xiàn)reed D,Vrieze M.Cross-sell:a fast promotion-tunable customer-item recommendation method based on conditionally independent probabilities[C]//Proceeding of the sixth ACM SIGKDD international conference on knowledge discovery data mining.[s.l.]:ACM,2000:437-446.

        [8] Herlocker J L,Konstan J A,Borchers A,et al.An algorithmic framework for performing collaborative filtering[C]//Proceedings of ACM IGIR’99.[s.l.]:ACM Press,1999:230-237.

        [9] Xue G R,Lin C,Yang Q,et al.Scalable collaborative filtering using cluster-based smoothing[C]//Proceedings of SIGIR. [s.l.]:[s.n.],2005.

        [10] Shi Yue,Larson M,Hanjalic A.Exploiting user similarity based on rated-item pools for improved user-based collaborative filtering[C]//Proceedings of the third ACM conference on recommender systems.[s.l.]:ACM,2009:125-132.

        [11]Ding S,Zhao S,Yuan Q,et al.Boosting collaborative filtering based on statistical prediction errors[C]//Procedding of ACM conference on recommender systems.[s.l.]:ACM,2008:3-10.

        [12]李紅梅,郝文寧,陳 剛.基于精確歐氏局部敏感哈希的協(xié)同過濾推薦算法[J].計算機應(yīng)用,2014,34(12):3481-3486.

        [13]汪 靜,印 鑒,鄭利榮,等.基于共同評分和相似性權(quán)重的協(xié)同過濾推薦算法[J].計算機科學(xué),2010,37(2):99-104.

        [14]孫遠帥,陳 垚,劉向榮,等.基于項目層次相似性的推薦算法[J].山東大學(xué)學(xué)報:工學(xué)版,2014,44(3):8-14.

        [15]胡 勛,孟祥武,張玉潔,等.一種融合項目特征和移動用戶信任關(guān)系的推薦算法[J].軟件學(xué)報,2014,25(8):1817-1830.

        Research on Recommendation Algorithm Based on Co-rating and Weight Calculation

        XIE Ren-qiang,CHEN Zhen
        (Department of Information Technology,F(xiàn)uzhou University of International Studies and Trade,F(xiàn)uzhou 350202,China)

        The recommended list is an important step of the user-based collaborative filtering recommendation algorithm and is also the final result.According to the phenomenon of less research on the“generation of recommendation list”in collaborative filtering recommendation algorithm based on user,in order to improve the performance of it,the recommended items are selected by weight calculation and the method of co-rating number.Firstly the co-rating items is sorted by the number of nearest neighbor.Then,the ranking items are calculated by comprehensive weight,and the results are sorted by high to low,and the recommended list is generated.The algorithm is tested by MovieLens data set.It uses the“Mean Absolute Error”as the evaluation index in the test.The results show that when the target user’s similar user number is 60,the algorithm has a lower mean absolute error compare with those calculation algorithms which don’t consider the factors of common rating items or comprehensive weight,and the value is 0.77.The algorithm can improve the accuracy of the recommendation system to a certain extent.

        collaborative filtering algorithm;co-rating;comprehensive weight;accuracy

        TP391

        A

        1673-629X(2016)09-0069-04

        10.3969/j.issn.1673-629X.2016.09.016

        2015-08-12

        2015-12-10< class="emphasis_bold">網(wǎng)絡(luò)出版時間:

        時間:2016-08-23

        2014年福建省教育科技計劃項目(JB14129)

        謝人強(1982-),男,副教授,研究生,研究方向為電子商務(wù)、信息管理與信息系統(tǒng)。

        http://www.cnki.net/kcms/detail/61.1450.TP.20160823.1343.026.html

        猜你喜歡
        相似性權(quán)重協(xié)同
        一類上三角算子矩陣的相似性與酉相似性
        蜀道難:車與路的協(xié)同進化
        權(quán)重常思“浮名輕”
        淺析當(dāng)代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        為黨督政勤履職 代民行權(quán)重擔(dān)當(dāng)
        基于公約式權(quán)重的截短線性分組碼盲識別方法
        三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
        低滲透黏土中氯離子彌散作用離心模擬相似性
        協(xié)同進化
        生物進化(2014年2期)2014-04-16 04:36:26
        在线看亚洲一区二区三区| 日韩区在线| 亚洲日本国产乱码va在线观看| 一区二区三区一片黄理论片 | 精品日本一区二区视频| 亚洲女人的天堂网av| 精品国产麻豆免费人成网站| 精品亚洲天堂一区二区三区| 超级碰碰色偷偷免费视频| 中文字幕亚洲无线码在一区| 亚洲av成人一区二区三区色| 亚洲av成熟国产一区二区| 亚洲人成色7777在线观看不卡| 四虎精品视频| 久久婷婷国产五月综合色| 亚洲人成网站色在线入口口| 中文亚洲av片在线观看| 国产精品毛片无遮挡高清| 青春草在线观看免费视频| 国产精品一区二区三区在线免费| 国产精品久久久久久久久岛| 无码av免费永久免费永久专区 | 国产丝袜精品不卡| 久久综合九色综合久久久 | 国产乱妇无码大片在线观看| 久久久久亚洲av无码a片软件| 亚洲在战AV极品无码| 三级日韩视频在线观看| 日韩av东京社区男人的天堂| 国产99re在线观看只有精品| 成年女人午夜特黄特色毛片免| 免费a级毛片18禁网站免费| 天堂影院一区二区三区四区| 国内视频一区| 人妻夜夜爽天天爽三区麻豆av| 亚洲av日韩av在线观看| 国产精品久久无码不卡黑寡妇| 亚洲天堂线上免费av| 久久精品亚洲精品国产色婷| 国产精品v欧美精品v日韩精品| 亚洲av无码专区在线亚|