亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于物品的協(xié)同過濾算法對“寧波地鐵go”用戶個性化推薦系統(tǒng)研究

        2019-07-15 07:02:51曹夏琳周健勇
        物流科技 2019年6期
        關(guān)鍵詞:推薦系統(tǒng)數(shù)據(jù)挖掘

        曹夏琳 周健勇

        摘 ?要:隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,個性化推薦系統(tǒng)在各個領(lǐng)域已被廣泛應(yīng)用,電子商務(wù)平臺根據(jù)用戶的歷史數(shù)據(jù),向其推薦感興趣的商品,但如今也存在著推薦商品精確度低,特征提取能力有限,標(biāo)簽本身存在冗余問題等。文章通過基于物品的協(xié)同過濾算法,在用戶群中找到指定用戶的相似鄰居用戶,綜合這些鄰居用戶的行為數(shù)據(jù),再引入物品售價權(quán)重這一隱氏特征,避免熱門物品對推薦結(jié)果的惡意干擾,改進傳統(tǒng)算法,從而推薦更合適的商品。實驗表明該算法對推薦預(yù)測有較好的效果。

        關(guān)鍵詞:數(shù)據(jù)挖掘;推薦系統(tǒng);協(xié)同過濾算法;售價權(quán)重

        中圖分類號:F713.365.2 ? ?文獻標(biāo)識碼:A

        Abstract: With the continuous development of data mining technology, personalized recommendation system has been widely used in various fields. The E-commerce platform recommends products of interest according to the user's historical data, but now there are also problems of low accuracy in recommending commodities, the feature extraction capability is limited, and the tag itself has redundancy problems. Through the item-based collaborative filtering algorithm. This paper finds similar neighbor users of the specified users in the user group, integrates the behavior data of these neighbor users, and then introduces the hidden feature of the item price weight to avoid malicious interference of the popular items on the recommendation results. Improve traditional algorithms to recommend more suitable products. Experiment shows that the algorithm has a good effect on the recommended prediction.

        Key words: data mining; recommendation system; collaborative filtering algorithm; price weight

        0 ?引 ?言

        隨著信息化技術(shù)的快速發(fā)展,網(wǎng)絡(luò)已經(jīng)在人們學(xué)習(xí)、生活和工作中擔(dān)任著不可或缺的角色,而在信息過載的今天,如何在浩瀚的信息海洋中找到所需信息,已經(jīng)越來越引起人們的關(guān)注。因此,許多學(xué)者致力于研究個性化推薦系統(tǒng),好的個性化推薦系統(tǒng)能夠很好地提高用戶體驗,幫助減少馬太效應(yīng)和長尾效應(yīng),擴大產(chǎn)品的盈利。

        現(xiàn)代推薦系統(tǒng)中所使用的技術(shù)[1]主要有基于內(nèi)容推薦、基于關(guān)聯(lián)規(guī)則推薦、基于知識推薦、基于上下文推薦和基于深度學(xué)習(xí)推薦、混合推薦以及協(xié)同過濾。協(xié)同過濾算法是如今應(yīng)用最多、最廣泛的技術(shù),其核心思想是:在預(yù)測用戶喜好時,不僅考慮該用戶的歷史信息,還要結(jié)合其他用戶對該商品的行動,計算給定用戶(物品)之間的相似性,尋找目標(biāo)用戶(物品)的最近鄰居集合,利用最近鄰居集合中的評分情況來給目標(biāo)用戶推薦相關(guān)內(nèi)容。

        1992年,Xerox PARC研究中心開發(fā)了實驗系統(tǒng)Tapestry[2],該系統(tǒng)首次利用協(xié)同過濾技術(shù),幫助用戶過濾郵件,解決垃圾郵件問題,此后協(xié)同過濾技術(shù)開始被廣泛應(yīng)用。

        2001年,路海明、盧增祥等人[3]將協(xié)同過濾技術(shù)與內(nèi)容相結(jié)合,通過網(wǎng)絡(luò)Bookmark服務(wù),給出了該算法的一個實際應(yīng)用系統(tǒng),得到很好的反響。黃光球等人[4]結(jié)合了用戶興趣度和協(xié)同過濾技術(shù)對客戶的個人興趣進行評價,提出了客戶興趣度的商品推薦參考模型,并將此模型應(yīng)用于電子商務(wù)網(wǎng)站的商品推薦,得到了很好的反響。周珊丹等人[5]利用基于用戶的協(xié)同過濾算法,為用戶推薦個性化文物,提高用戶在博物館中的游覽體驗。王冠楠等人[6]使用多維興趣向量刻畫用戶的興趣,利用協(xié)同過濾技術(shù),提高了系統(tǒng)中新聞推薦的專業(yè)度。吳國芳[7]通過對用戶行為進行分析建立個性化Profile,在圖書館資源個性化推薦中得到了很好的應(yīng)用。

        本文基于協(xié)同過濾算法,分析“寧波地鐵go”用戶的歷史數(shù)據(jù),挖掘出用戶物品間的相關(guān)度,再引入用戶購買權(quán)重這一隱氏特征,綜合分析以此預(yù)測出用戶的消費偏好,并向其推送相應(yīng)的商品,此方法能夠很好地避免無關(guān)信息的干擾,解決用戶數(shù)據(jù)不足帶來的推薦不準(zhǔn)確等問題。

        1 ?協(xié)同過濾推薦算法

        協(xié)同過濾推薦算法一般有兩類:基于用戶的協(xié)同過濾推薦和基于物品的協(xié)同過濾推薦。

        1.1 ?基于用戶的協(xié)同過濾算法

        基于用戶的協(xié)同過濾算法的基本思想是以用戶為主體,注重社會屬性,利用用戶對物品的偏好度計算用戶的鄰居用戶,然后把鄰居用戶的偏好物品推薦給當(dāng)前用戶,算法步驟如下。

        (1)計算目標(biāo)用戶與其他用戶的相似度,可以使用反差表忽略一部分用戶;

        (2)將相似度從高到低進行排列,找到K個與目標(biāo)用戶最相似的鄰居用戶;

        (3)在鄰居用戶的偏好物品集中,計算出每一件物品的推薦度;

        (4)根據(jù)每一件物品推薦度的高低向目標(biāo)用戶進行推薦。

        這個算法實現(xiàn)起來比較簡單,但在實際應(yīng)用中也存在一些問題,比如當(dāng)前大多數(shù)人喜歡的物品對你來說卻毫無意義,或者一些實用性很強的物品,如新華字典、各種工具書等,在你想要買文學(xué)書的時候,可能沒有必要推薦給你,導(dǎo)致推薦物品的個性化較低。

        1.2 ?基于物品的協(xié)同過濾算法

        基于物品的協(xié)同過濾算法和基于用戶的協(xié)同過濾算法很相似,核心思想是給用戶推薦他們之前喜歡的物品的相似物品。從物品本身出發(fā),基于用戶的歷史行為數(shù)據(jù)找到某一物品的相似物品,然后利用最近鄰居物品來預(yù)測當(dāng)前用戶對鄰居物品的偏好程度,從而將偏好度高的物品推薦給目標(biāo)用戶。算法流程如圖1所示。

        這兩種算法各有優(yōu)勢,實際情況下,對于“寧波地鐵go”公眾號用戶來說,目前用戶的歷史數(shù)據(jù)量有限,相似用戶的可參考性價值不高,與其向用戶推薦毫無意義的物品,以物品內(nèi)在的聯(lián)系為原則的推薦更加適合現(xiàn)在的平臺情況。

        2 ?算法實現(xiàn)

        2.1 ?收集用戶歷史偏好

        在“寧波地鐵go”平臺的用戶歷史商城數(shù)據(jù)包括用戶ID、物品名稱、購買數(shù)量、物品售價,本文將物品售價作為對某種物品偏好程度的衡量依據(jù),根據(jù)用戶ID、物品名稱、購買數(shù)量這三種數(shù)據(jù)生成初始矩陣X,作為基于物品的協(xié)同過濾算法的初始輸入數(shù)據(jù)。建立好數(shù)據(jù)模型之后,對初始矩陣X進行矩陣相乘,用來對物品售價矩陣L賦權(quán),得到最終矩陣M。在平臺所獲取的用戶數(shù)據(jù)來看,各種物品的售價差距不小,根據(jù)大多數(shù)用戶的消費心理,售價小又實用的物品往往很受大家歡迎,而這類物品會對推薦結(jié)果產(chǎn)生很大的干擾,從而造成推薦結(jié)果不準(zhǔn)確,這時物品的售價會在一定程度上反映偏好程度,售價高的物品用戶仍然購買就說明對這一物品的喜愛程度很高,所以引入這一物品售價權(quán)重會使推薦結(jié)果更準(zhǔn)確。圖2為算法的流程圖。

        2.2 ?計算相似度

        基于物品的協(xié)同過濾算法首先要計算物品之間的相似度,傳統(tǒng)的方法有余弦相似度計算、皮爾遜相關(guān)系數(shù)計算等。

        (1)余弦相似度計算

        3.4 ?結(jié)果分析

        本文把傳統(tǒng)算法與引入售價權(quán)重后的改進算法進行對比,并使用MAE和APC評估其性能,首先售價權(quán)重對于整個系統(tǒng)的影響較大,因此需要事先確定一個最佳的售價權(quán)重以讓整個系統(tǒng)性能最佳,實驗結(jié)果如圖3所示。

        從圖3可看出,當(dāng)售價權(quán)重為0.4時的平均絕對誤差最小,因此以0.4為最佳售價權(quán)重,改進傳統(tǒng)的基于物品的協(xié)同過濾算法,得到的部分推薦結(jié)果如表4所示。

        在其他參數(shù)相同的情況下,把售價權(quán)重為0.4時的改進算法與傳統(tǒng)算法進行比較,所得推薦結(jié)果與實際興趣物品集比較,并用MAE與APC兩個指標(biāo)來衡量,結(jié)果如圖4、圖5所示。

        由圖4可知,隨著鄰居數(shù)量的增加,傳統(tǒng)基于物品的協(xié)同過濾算法與引入售價權(quán)重后的改進算法的MAE都逐漸減小到最小值后逐漸增加,并趨于平穩(wěn),當(dāng)鄰居數(shù)量為20時,兩種算法的MAE都達到最小值,此時推薦系統(tǒng)的準(zhǔn)確度最高,并且改進后的算法的MAE總體上都要小于傳統(tǒng)算法。從圖5可看出,改進后算法的平均覆蓋率要高于傳統(tǒng)算法,說明引入售價權(quán)重能夠提高整個系統(tǒng)預(yù)測的覆蓋率,從如今的消費者購物心理來看,售價這一變量確實在很大程度上能反應(yīng)某些物品的熱門度,單價低的物品銷量高說明其熱門度很高,但如果單價高的物品銷量仍然很高就更能說明用戶對其興趣度很高,若以此特性來對用戶進行精準(zhǔn)營銷,一定能增強用戶的粘性,挖掘長尾物品,提高平臺的利潤。

        4 ?結(jié)束語

        本文在傳統(tǒng)基于物品的協(xié)同過濾算法上引入售價權(quán)重這一隱氏特征,減少了熱門物品對推薦結(jié)果的惡意干擾,實驗結(jié)果表明改進后的算法的平均絕對誤差和平均預(yù)測覆蓋率均優(yōu)于傳統(tǒng)算法,在推薦精確度上有所提升。在實際應(yīng)用中,對于供應(yīng)商有很大意義,不僅對用戶的喜好有所了解,給用戶選擇購物商品時帶來方便,隨著積累的用戶數(shù)據(jù)量越來越大,可搭建類似DMP(Data Management Platform)數(shù)據(jù)管理平臺,把分散的多方數(shù)據(jù)進行整合納入統(tǒng)一的技術(shù)平臺,并對這些數(shù)據(jù)進行標(biāo)準(zhǔn)化和細分,結(jié)合用戶畫像,供應(yīng)商可以制定精準(zhǔn)的營銷方案,其經(jīng)濟利益將尤為可觀。

        參考文獻:

        [1] 孫光浩,劉丹青,李夢云. 個性化推薦算法綜述[J]. 軟件,2017,38(7):70-78.

        [2] ?GOLDBERG D, NICOLS D. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992,35(12):61-70.

        [3] 路海明,盧增祥,李衍達. 基于多Agent混合智能實現(xiàn)個性化信息推薦[J]. 高技術(shù)通訊,2001(4):28-31.

        [4] 黃光球,靳峰,彭緒友. 基于興趣度的協(xié)同過濾商品推薦系統(tǒng)模型[J]. 微電子學(xué)與計算機,2005,22(3):5-8.

        [5] 周珊丹,周興社,王海鵬,等. 智能博物館環(huán)境下的個性化推薦算法[J]. 計算機工程與應(yīng)用,2010(19):224-226.

        [6] 王冠楠,陳端兵,傅彥. 新聞推薦的多維興趣模型與傳播分析[J]. 計算機科學(xué),2013(11):126-130.

        [7] 吳國芳. 數(shù)字圖書館個性化知識服務(wù)研究[J]. 計算機應(yīng)用與軟件,2014,31(5):93-94,183.

        [8] 孫多. 基于興趣度的聚類協(xié)同過濾推薦系統(tǒng)的設(shè)計[J]. 安徽大學(xué)學(xué)報(自然科學(xué)版),2007(5):19-22.

        猜你喜歡
        推薦系統(tǒng)數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘在選課推薦中的研究
        軟件(2016年4期)2017-01-20 10:09:33
        基于用戶偏好的信任網(wǎng)絡(luò)隨機游走推薦模型
        基于個性化的協(xié)同過濾圖書推薦算法研究
        個性化推薦系統(tǒng)關(guān)鍵算法探討
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
        關(guān)于協(xié)同過濾推薦算法的研究文獻綜述
        商(2016年29期)2016-10-29 15:22:08
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        91精品国产91久久综合桃花| 亚洲一区 日韩精品 中文字幕| 免费看久久妇女高潮a| 精品中文字幕制服中文| 亚洲一本大道无码av天堂| 粉嫩少妇内射浓精videos| 久久丁香花综合狼人| 国产一区二区三区免费视| 久久精品国产亚洲av香蕉| 欧美三级乱人伦电影| 亚洲啪啪AⅤ一区二区三区| av是男人的天堂免费| 亚洲国产精品高清一区| 在线看片免费人成视频电影 | 97人人模人人爽人人少妇| 欧美国产亚洲日韩在线二区| 按摩师玩弄少妇到高潮hd| 女主播啪啪大秀免费观看| 粉嫩av国产一区二区三区| 国产va免费精品观看| 免费在线日韩| 精品日本一区二区三区| 曰韩无码av一区二区免费| 人妻少妇不满足中文字幕 | 在线涩涩免费观看国产精品| 久久综合成人网| 麻豆av在线免费观看精品| 国产一区二区三区在线男友| 少妇人妻在线无码天堂视频网| 热の国产AV| 亚洲高清av一区二区| 色翁荡息又大又硬又粗视频| 国产福利一区二区三区在线观看| 亚洲人成影院在线无码观看| 老熟女一区二区免费| 久久综合九色综合久久久| 国内嫩模自拍诱惑免费视频| 国产一区二区内射最近更新| 久热香蕉精品视频在线播放| 国产少妇高潮在线视频| 蜜臀性色av免费|