亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合位置相似性度量的快消品電商網(wǎng)站推薦算法

        2018-01-29 03:29:03王晨陽劉垣郭李華肖琳
        關(guān)鍵詞:消品余弦相似性

        王晨陽, 劉垣, 郭李華, 肖琳

        (福建工程學(xué)院 信息科學(xué)與工程學(xué)院, 福建 福州 350118)

        近年來,互聯(lián)網(wǎng)快消品市場迅速發(fā)展,涌現(xiàn)出一大批快消品電商網(wǎng)站,如阿里1688零售通、京東掌柜寶、掌合天下、惠民網(wǎng)、易酒批、便利寶、進(jìn)貨寶等??煜冯娚叹W(wǎng)站主要為廣大下游便利店提供一站式的采購進(jìn)貨服務(wù),所以它的用戶通常就是便利店。面對海量的信息,高效的推薦算法無疑將對快消品電商網(wǎng)站的成功起到至關(guān)重要的作用,它能夠在信息過載的環(huán)境中幫助用戶發(fā)現(xiàn)他們感興趣的物品[1]。協(xié)同過濾推薦系統(tǒng)是一個(gè)已經(jīng)在電子商務(wù)系統(tǒng)中廣泛應(yīng)用的一種個(gè)性化推薦算法[2]。該方法首先找到和目標(biāo)用戶興趣相似的用戶集合,然后根據(jù)這個(gè)集合的評分?jǐn)?shù)據(jù)向目標(biāo)用戶推薦商品。算法的關(guān)鍵是用戶的興趣相似性度量準(zhǔn)則。對用戶相似性度量準(zhǔn)則的研究有很多,如文獻(xiàn)[1-2]在計(jì)算用戶相似性度量中引入了位置信息,但是位置信息只是作為商品的一個(gè)屬性,對推薦的作用較弱;文獻(xiàn)[3]將位置信息聚類為位置簇,雖然強(qiáng)化了位置信息的推薦作用,但位置之間的距離所產(chǎn)生的推薦意義沒有融入到推薦模型中。在快消品電商領(lǐng)域,因?yàn)榭煜返牧魍ň哂袇^(qū)域的相似性,因此地理位置較近的便利店,他們的興趣相似度也會(huì)相應(yīng)更高。本文提出一種融合位置相似性度量的協(xié)同過濾推薦算法,根據(jù)用戶的位置以及位置之間的距離算出用戶的位置相似度,再與用戶的興趣相似性加權(quán)得到一個(gè)新的用戶相似度,最后在一個(gè)真實(shí)的快消品電商網(wǎng)站數(shù)據(jù)集上驗(yàn)證了該算法的可行性。

        1 傳統(tǒng)的用戶興趣相似性度量方法

        基于用戶的協(xié)同過濾推薦算法是推薦系統(tǒng)中最古老的算法,包括2個(gè)步驟:1)找到與目標(biāo)用戶興趣相似的最近鄰居集合;2)根據(jù)最近鄰居集合中用戶對商品的評分向目標(biāo)用戶進(jìn)行推薦。其中步驟1)的關(guān)鍵是用戶相似性的計(jì)算方法。最常用的有Jaccard相似性、余弦相似性、修正余弦相似性和相關(guān)相似性[4-6]。

        1.1 Jaccard相似性

        給定用戶u和v,令N(u)表示用戶u有過評分的商品集合,N(v)表示用戶v有過評分的商品集合。利用Jaccard公式計(jì)算用戶u和v之間的相似度,Jaccard系數(shù)定義為N(u)與N(v)交集的大小與N(u)、N(v)并集的大小比值,定義如下。

        (1)

        1.2 余弦相似性

        給定用戶u和v,令A(yù)和B表示用戶u和v對n個(gè)商品的評分向量。使用兩個(gè)向量之間夾角的余弦值度量用戶間的相似性。公式如下:

        (2)

        1.3 修正的余弦相似性

        余弦相似性度量未考慮到用戶評分尺度問題,如在評分區(qū)間[1-5]的情況下,對用戶i來說評分3以上就是自己喜歡的,而對于用戶j,評分4以上才是自己喜歡的。通過減去用戶對商品的平均評分,修正的余弦相似性改善了用戶評分尺度偏好問題。給定用戶u和v,令I(lǐng)表示所有商品的集合,Ru和Rv分別表示用戶u和v對商品的平均評分值,Ru,i和Rv,i分別表示用戶u和v對商品i的評分,如果用戶u對商品i沒有評分,則Ru,i=0。使用修正余弦相似性度量用戶u和用戶v之間的相似性,公式如下。

        (3)

        1.4 相關(guān)相似性

        (4)

        2 融合位置相似性度量的推薦模型設(shè)計(jì)

        2.1 模型概述

        融合位置相似性度量的協(xié)同過濾推薦算法(collaborative filtering recommendation algorithm with the fusion of location similarity measurement,CF-FLSM)的推薦流程如圖1。算法分為3步:第1步:根據(jù)目標(biāo)用戶的位置搜索出周邊的用戶集合near(N),即距離最近的用戶集合,以縮小用戶范圍;第2步:

        圖1 CF-FLSM的推薦流程Fig.1 Recommendation process of CF-FLSM

        在第1步中搜索出來的用戶集合near(N)中,結(jié)合用戶歷史行為利用余弦相似性計(jì)算出用戶之間的興趣相似性,結(jié)合用戶的位置信息算出用戶之間的位置相似性;第3步:按照適當(dāng)?shù)臋?quán)重將用戶之間的興趣相似性和位置相似性進(jìn)行合并處理,得到一個(gè)新的用戶相似性,用于產(chǎn)生最終的推薦結(jié)果。

        2.2 用戶位置相似性度量方法

        本文分析了某快消品電商網(wǎng)站在福州地區(qū)的注冊用戶(因?yàn)榭煜冯娚叹W(wǎng)站服務(wù)的對象是便利店,所以這里的用戶就是便利店)的歷史采購進(jìn)貨記錄。圖2是該地區(qū)注冊用戶的地理位置分布圖。

        隨機(jī)選定N(本文實(shí)驗(yàn)過程中N取100)個(gè)用戶,分別計(jì)算出與目標(biāo)用戶距離(單位:km)[0,1]、(1,2]、(2,3]、(3,5]、(5,8]、(8,10]內(nèi)的用戶有過共同評分商品的平均數(shù)量,得出的具有共同評分的商品數(shù)量與用戶之間距離的關(guān)系如圖3所示。

        圖2 注冊用戶的地理分布圖Fig.2 Geographic distribution map of registered users

        圖3 興趣相似性與距離的關(guān)系 Fig.3 Relationship between interest similarity and distance

        從圖3可知,用戶之間共同評分的商品數(shù)量與用戶之間的距離成反比。這說明在同一地區(qū)內(nèi),用戶之間的偏好相似度對用戶之間的距離是敏感的,這也符合快消品電商市場銷售的現(xiàn)狀。因此,本文提出如下度量方法計(jì)算用戶之間的位置相似性:

        (5)

        2.3 加權(quán)合并處理

        將用戶位置相似性度量融合到傳統(tǒng)的用戶興趣相似性度量,兩者進(jìn)行加權(quán)合并處理得出一個(gè)新的用戶相似性。

        (6)

        其中λ表示sim(u,v)dis的權(quán)重,可以根據(jù)實(shí)際情況適當(dāng)調(diào)整λ的值。

        2.4 推薦過程

        算出用戶之間的相似度后,可以根據(jù)與目標(biāo)用戶興趣最相似的K個(gè)用戶向目標(biāo)用戶推薦商品。首先可利用以下公式預(yù)測出目標(biāo)用戶對與目標(biāo)用戶最相似的K個(gè)用戶有過評分但目標(biāo)用戶未曾評分的商品的評分預(yù)測值。

        (7)

        其中,S(u,k)是根據(jù)公式(6)計(jì)算出的與目標(biāo)用戶u興趣最相似的K個(gè)用戶的集合,N(i)是對商品i有過評分的用戶集合,sim(u,v)為用戶u和用戶v的相似度;Rv,i為用戶v對物品i的評分。

        最后將評分預(yù)測值最高的前Top-N項(xiàng)商品向目標(biāo)用戶做推薦。

        3 實(shí)驗(yàn)

        3.1 實(shí)驗(yàn)數(shù)據(jù)

        選取某快消品電商網(wǎng)站在福州地區(qū)的2016年真實(shí)數(shù)據(jù)來驗(yàn)證上面提出的算法。該數(shù)據(jù)集在該地區(qū)的每個(gè)用戶都維護(hù)一個(gè)固定的地位經(jīng)緯度坐標(biāo),各項(xiàng)數(shù)據(jù)統(tǒng)計(jì)值如表1所示。

        表1 實(shí)驗(yàn)數(shù)據(jù)集Tab.1 Experimental dataset

        將數(shù)據(jù)集按照用戶對商品評分的時(shí)間倒序排序選取20%作為測試集,剩下的80%作為訓(xùn)練集。并隨機(jī)選擇test_U家用戶作為測試用戶,在訓(xùn)練集上計(jì)算用戶的相似性,最后在測試集上分別對每個(gè)測試用戶進(jìn)行商品推薦預(yù)測。

        3.2 評測指標(biāo)

        網(wǎng)站在做商品推薦時(shí),通常是為用戶提供一個(gè)個(gè)性化的推薦欄目,就是推薦系統(tǒng)里的Top-N推薦。對Top-N推薦結(jié)果進(jìn)行評測的指標(biāo)通常是采用準(zhǔn)確率和召回率。

        準(zhǔn)確率評測的是最終的推薦結(jié)果中有多少比例是正確推薦的。

        (8)

        召回率評測的是推薦正確的商品占實(shí)際用戶喜歡的商品集合的多少。

        (9)

        其中U為測試用戶集合,就是3.1節(jié)中隨機(jī)選擇的測試用戶數(shù)test_U;R(u)表示對測試用戶u在測試集上的推薦商品集合;T(u)為測試用戶u在測試集上實(shí)際喜歡的商品集合。

        3.3 實(shí)驗(yàn)結(jié)果

        在CF-FLSM和CF的實(shí)驗(yàn)過程中,測試用戶數(shù)test_U取值為50,用戶最近鄰的數(shù)目near_N取值為200,用戶之間的位置相似性度量權(quán)重λ取值為0.5,在推薦商品數(shù)目Top-N的不同取值下,分別算出測試用戶集的平均準(zhǔn)確率和召回率如表2、表3所示。

        表2 CF-FLSM的推薦結(jié)果Tab.2 Recommendation results of CF-FLSM

        表3 CF的推薦結(jié)果Tab.3 Recommendation results of CF

        兩者的實(shí)驗(yàn)結(jié)果的比較如圖4所示,本文提出的CF-FLSM相對于傳統(tǒng)的協(xié)同過濾算法,準(zhǔn)確率和召回率分別提高了3.74%和3.91%。

        圖4 CF-FLSM和CF的實(shí)驗(yàn)結(jié)果對比圖 Fig.4 Comparison of experimental results of CF-FLSM and CF

        4 結(jié)論

        調(diào)研國內(nèi)眾多知名快消品電商平臺(tái),其注冊用戶通常是便利店,而便利店都有一個(gè)固定的地理位置。本文提出的融合位置相似性度量的協(xié)同過濾(CF-FLSM)推薦算法,能夠有效利用位置以及位置之間的距離信息,從而提高快消品電商平臺(tái)商品推薦的準(zhǔn)確率和召回率。但是CF-FLSM在推薦的過程中并未考慮時(shí)間的因素,而快消品的流通活躍度通常和季節(jié)有關(guān),比如啤酒飲料在夏季會(huì)相對比較活躍,而白酒紅酒在冬季會(huì)相對比較活躍。在快消品電商網(wǎng)站推薦算法中加入時(shí)間維度,是將來的研究方向。

        [1] 申園園,余文.一種基于位置服務(wù)信息的移動(dòng)推薦模型[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(12):203-206.

        [2] 王付強(qiáng),彭甫镕,丁小煥,等.基于位置的非對稱相似度量的協(xié)同過濾推薦算法[J].計(jì)算機(jī)應(yīng)用,2016,36(1):171-174,180.

        [3] 鄭慧,李冰,陳冬林,等.基于位置簇的移動(dòng)生活服務(wù)個(gè)性化推薦技術(shù)[J].計(jì)算機(jī)應(yīng)用,2015,35(4):1148-1153.

        [4] 項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].北京:人民郵電出版社,2012:45-64.

        [5] 李春,朱珍民,高曉芳,等.基于鄰居決策的協(xié)同過濾推薦算法[J].計(jì)算機(jī)工程,2010,36(13):34-39.

        [6] 彭德巍,胡斌.一種基于用戶特征和時(shí)間的協(xié)同過濾算法[J].武漢理工大學(xué)學(xué)報(bào),2009,31(3):24-28.

        [7] 馬胡雙,石永革,高勝保.基于特征增益與多級(jí)優(yōu)化的協(xié)同過濾個(gè)性化推薦算法[J].科學(xué)技術(shù)與工程,2016,16(21):272-277.

        [8] 張春永,陳群.一種基于LBS的移動(dòng)個(gè)性化推薦系統(tǒng)[J].科學(xué)技術(shù)與工程,2011,11(30):7439-7442,7447.

        [9] Cacheda F, Formoso V, Femandez D, et al. Comparison of collaborative filtering algorithms: limitations of current techniques and proposals for scalable, high-performance recommender systems[J]. ACM Transactions on the Web,2011,5(1):1-33.

        [10] Liu H, Hu Z, Mian A, et al. A new user similarity model to improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(3):156-166.

        猜你喜歡
        消品余弦相似性
        一類上三角算子矩陣的相似性與酉相似性
        淺析當(dāng)代中西方繪畫的相似性
        讓圖片新聞不再是“快消品”
        傳媒評論(2019年6期)2019-10-14 00:59:18
        兩個(gè)含余弦函數(shù)的三角母不等式及其推論
        大潤發(fā)首超沃爾瑪成為快消品生產(chǎn)商心中最佳零售商
        生活用紙(2016年6期)2017-01-19 07:36:21
        低滲透黏土中氯離子彌散作用離心模擬相似性
        中國包裝聯(lián)合會(huì)成立快消品包裝委員會(huì)
        分?jǐn)?shù)階余弦變換的卷積定理
        圖像壓縮感知在分?jǐn)?shù)階Fourier域、分?jǐn)?shù)階余弦域的性能比較
        快消品電商機(jī)會(huì)在哪里
        99久久免费精品高清特色大片| 日本免费精品一区二区| 凌辱人妻中文字幕一区| 亚洲av永久精品爱情岛论坛 | y111111少妇影院无码| 乱色视频中文字幕在线看| 亚洲精品一区二区三区新线路| 精品亚洲成a人在线观看| 国产色秀视频在线播放| 91热久久免费精品99| 女同在线视频一区二区| 亚洲狠狠婷婷综合久久久久| 国产亚洲av综合人人澡精品| 99精品欧美一区二区三区美图| 日本中文字幕官网亚洲| 在厨房拨开内裤进入毛片| 一本一道久久a久久精品综合| 久久水蜜桃亚洲av无码精品麻豆 | 国产亚洲精品精品综合伦理| 人妻 日韩 欧美 综合 制服| 亚洲一区爱区精品无码| 天堂女人av一区二区| 精品女同一区二区三区| 国内露脸少妇精品视频| 一本大道久久精品 东京热| 蜜臀精品一区二区三区| 影音先锋久久久久av综合网成人| 亚洲av综合日韩| 男人天堂av在线成人av| 成人av一区二区三区四区| 国内精品久久久人妻中文字幕 | 97精品一区二区视频在线观看| 午夜性刺激免费视频| 青青草视全福视频在线| 高级会所技师自拍视频在线| 先锋影音av最新资源| 激情中文丁香激情综合| 国产一区二区三区在线男友| 手机看片久久国产免费| 在线播放国产女同闺蜜| 亚洲福利视频一区二区三区|