亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)協(xié)同過(guò)濾算法的推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

        2021-07-14 02:15:54白林鋒古險(xiǎn)峰
        關(guān)鍵詞:協(xié)同模塊算法

        白林鋒, 古險(xiǎn)峰

        (河南科技學(xué)院 信息工程學(xué)院, 河南 新鄉(xiāng) 453003)

        用戶的個(gè)性化需求以及商品的多樣性,導(dǎo)致信息過(guò)載,進(jìn)而出現(xiàn)“信息迷失”,使得用戶在選擇商品時(shí)不能很好地進(jìn)行比較[1]。推薦系統(tǒng)通過(guò)分析用戶對(duì)不同商品的歷史關(guān)注程度以及對(duì)項(xiàng)目的評(píng)價(jià),找出其中的關(guān)聯(lián)特征,從而在海量數(shù)據(jù)中將用戶感興趣的信息推薦出來(lái),使用戶能夠花費(fèi)較少的時(shí)間和精力,更加精準(zhǔn)地找到符合自己預(yù)期的產(chǎn)品,提升用戶滿意度,因此推薦系統(tǒng)對(duì)電商平臺(tái)以及用戶購(gòu)物體驗(yàn)都起著關(guān)鍵作用[2]。推薦算法作為推薦系統(tǒng)的核心,具有重要意義,可以基于內(nèi)容、情境感知、關(guān)聯(lián)規(guī)則、知識(shí)推薦和協(xié)同過(guò)濾等。傳統(tǒng)算法往往僅考慮相似用戶的興趣偏好進(jìn)行相似性計(jì)算,用戶模型單一,且沒(méi)有充分考慮時(shí)間因素以及項(xiàng)目屬性對(duì)用戶的影響,自身存在缺陷性,可擴(kuò)展性不足[3]。針對(duì)這一現(xiàn)象,提出了改進(jìn)協(xié)同濾波算法,在充分考慮項(xiàng)目屬性特征以及用戶興趣愛(ài)好的基礎(chǔ)上,引入自適應(yīng)平衡因子綜合考慮用戶的需求,從而實(shí)現(xiàn)對(duì)用戶興趣愛(ài)好更深入地挖掘,解決傳統(tǒng)算法規(guī)則提取困難、個(gè)性化程度低、數(shù)據(jù)稀疏的問(wèn)題[4]。

        1 推薦系統(tǒng)相關(guān)理論

        隨著信息化時(shí)代的到來(lái),大量數(shù)據(jù)方便人們生活的同時(shí),使得信息過(guò)載、海量數(shù)據(jù)不對(duì)等問(wèn)題也日益凸顯[5]。利用已知用戶的瀏覽歷史進(jìn)行情境分析,挖掘潛在的關(guān)聯(lián)規(guī)則,過(guò)濾掉大量無(wú)用信息,促成用戶購(gòu)買(mǎi)意愿,提高交叉銷(xiāo)售的同時(shí),提升用戶的粘連性和滿意度。因此,行為記錄模塊、規(guī)則分析模塊、推薦算法模塊構(gòu)成了一套完整的個(gè)性化推薦系統(tǒng)[6]。其中,協(xié)同過(guò)濾技術(shù)以類(lèi)聚群分原理,不需要對(duì)用戶進(jìn)行額外的跟蹤,僅僅利用用戶已有的瀏覽歷史、評(píng)價(jià)行為,進(jìn)行興趣偏好的相似性計(jì)算,繼而進(jìn)行個(gè)性化推薦[7]。隨著在線用戶的增加以及大型Web的興起,推薦系統(tǒng)也面臨著模型服務(wù)、可擴(kuò)展性、系統(tǒng)架構(gòu)、冷啟動(dòng)和強(qiáng)壯性等問(wèn)題的挑戰(zhàn)[8]。推薦系統(tǒng)框架如圖1所示。

        圖1 推薦系統(tǒng)框架圖

        1.1 推薦技術(shù)及評(píng)價(jià)指標(biāo)

        協(xié)同過(guò)濾推薦:有基于項(xiàng)目和基于用戶兩種形式,具有適應(yīng)性強(qiáng)、推薦資源范圍廣的特點(diǎn)?;谟脩舻乃惴鞒虨椋豪靡阎脩襞d趣數(shù)據(jù)挖掘與之匹配的相似度高的目標(biāo)用戶,進(jìn)而通過(guò)對(duì)比分析,根據(jù)物以類(lèi)聚人以群分現(xiàn)象,將商品推薦給疑似用戶[9]。數(shù)學(xué)表達(dá)式為:

        p(u,i)=∑v∈S(u,k)∩N(i)wuvrvi

        (1)

        式中:p(u,i)表示目標(biāo)用戶u對(duì)商品i的興趣度,k表示與已知用戶相似的用戶個(gè)數(shù),w表示用戶間的相似程度,v為相似用戶,r為隱反饋信息。得到用戶對(duì)商品的興趣度后,進(jìn)行降維選擇,從而挑選出興趣度最大的N個(gè)商品推薦給目標(biāo)用戶[10]。基于項(xiàng)目的過(guò)濾推薦原理和基于用戶的過(guò)濾推薦相似,都存在擴(kuò)展性差、冷啟動(dòng)以及數(shù)據(jù)稀疏性問(wèn)題[11]。

        關(guān)聯(lián)規(guī)則推薦:從大量數(shù)據(jù)中尋找未知項(xiàng)目間存在的關(guān)聯(lián)特征,進(jìn)而進(jìn)行推薦,從而得到意料之外情理之中的效果。數(shù)學(xué)表示為:假設(shè)存在商品數(shù)據(jù)庫(kù)D,每一次交易用T表示,A為數(shù)據(jù)庫(kù)D中的一個(gè)商品集合,商品集合A和商品集合B之間的關(guān)聯(lián)規(guī)則A?B的置信度和支持度為:

        (2)

        (3)

        通過(guò)式(2)和式(3)得出商品集合A和商品集合B之間的置信度和支持度函數(shù),如果大于設(shè)置的閾值,則得出關(guān)聯(lián)規(guī)則[12]。該算法需要重復(fù)掃描數(shù)據(jù)庫(kù),帶來(lái)數(shù)據(jù)的高維性和稀疏性,個(gè)性化程度低,關(guān)聯(lián)規(guī)則提取困難[13]。

        一個(gè)好的推薦系統(tǒng)在獲取用戶資源的同時(shí),能夠提升用戶的粘連性和滿意度。合適的評(píng)價(jià)指標(biāo)是評(píng)判推薦系統(tǒng)優(yōu)劣的關(guān)鍵[14],常用的評(píng)價(jià)指標(biāo)有:推薦準(zhǔn)確率、評(píng)分預(yù)測(cè)。

        推薦準(zhǔn)確率

        (4)

        式中:T(u)為測(cè)試商品,P(u)為推薦商品。

        評(píng)分預(yù)測(cè)

        (5)

        式中:rui為用戶u對(duì)商品i的真實(shí)評(píng)價(jià),lui為用戶u對(duì)商品i的預(yù)測(cè)評(píng)價(jià)。

        1.2 協(xié)同過(guò)濾算法的關(guān)鍵問(wèn)題

        傳統(tǒng)的協(xié)同過(guò)濾推薦利用相似性度量關(guān)聯(lián)近鄰用戶,然后通過(guò)最近鄰(KNN)加權(quán)預(yù)測(cè)目標(biāo)用戶興趣,最后進(jìn)行個(gè)性化推薦[15],具體流程如圖2所示。

        圖2 協(xié)同過(guò)濾推薦流程

        評(píng)分矩陣:假設(shè)數(shù)據(jù)庫(kù)中存在m個(gè)用戶,n個(gè)商品,評(píng)分矩陣用m×n表示,Rij表示第i個(gè)用戶u對(duì)第j個(gè)商品的評(píng)分,評(píng)分值通過(guò)1~5來(lái)表示用戶的喜好程度。評(píng)分矩陣如表1所示。

        表1 評(píng)分矩陣

        近鄰選擇:對(duì)目標(biāo)用戶預(yù)推薦進(jìn)行項(xiàng)目間相似度查找,或者查找與目標(biāo)用戶相似的近鄰用戶,然后根據(jù)相似性進(jìn)行排序,選取大于閾值的若干個(gè)組成最近鄰集合。常用的相似度度量有余弦相似度量,其數(shù)學(xué)表示為:

        (6)

        式中:用戶u、v對(duì)項(xiàng)目c的評(píng)分用R表示。皮爾遜相似度表示方式為:

        (7)

        (8)

        2 融合項(xiàng)目屬性與興趣信息的協(xié)同過(guò)濾推薦系統(tǒng)

        2.1 系統(tǒng)模塊設(shè)計(jì)

        在進(jìn)行模塊設(shè)計(jì)前需要進(jìn)行系統(tǒng)需求分析,由于推薦系統(tǒng)面向的用戶特征和實(shí)現(xiàn)的功能屬性并不一致,因此系統(tǒng)需求分析的優(yōu)劣決定了設(shè)計(jì)的質(zhì)量。本系統(tǒng)設(shè)計(jì)面向電商產(chǎn)品銷(xiāo)售,需求分析主要有兩部分組成,分別為功能性屬性和非功能性屬性。功能性屬性包括用戶管理、任務(wù)管理、數(shù)據(jù)分析、數(shù)據(jù)可視化,非功能性屬性包括可靠性、可擴(kuò)展性、便捷性。在系統(tǒng)需求的基礎(chǔ)上,進(jìn)行模塊設(shè)計(jì),融合項(xiàng)目屬性與興趣信息的協(xié)同過(guò)濾推薦系統(tǒng)主要有4個(gè)模塊:數(shù)據(jù)管理模塊、數(shù)據(jù)分析預(yù)測(cè)模塊、個(gè)性化推薦模塊以及結(jié)果顯示模塊。

        數(shù)據(jù)管理模塊主要進(jìn)行數(shù)據(jù)存儲(chǔ)以及商品數(shù)據(jù)和用戶數(shù)據(jù)的管理;數(shù)據(jù)分析預(yù)測(cè)模塊通過(guò)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,過(guò)濾掉無(wú)用信息以及異常數(shù)據(jù),對(duì)用戶的訪問(wèn)數(shù)據(jù)進(jìn)行清洗,為后續(xù)的個(gè)性化推薦模塊做準(zhǔn)備;個(gè)性化推薦模塊根據(jù)數(shù)據(jù)分析預(yù)測(cè)模塊得出的數(shù)據(jù)進(jìn)行評(píng)分矩陣,通過(guò)自適應(yīng)混合協(xié)同過(guò)濾,選擇合適的推薦算法,根據(jù)用戶的興趣愛(ài)好更新商品屬性特征,實(shí)現(xiàn)推薦結(jié)果的實(shí)時(shí)性和動(dòng)態(tài)性,提高推薦準(zhǔn)確率,最終在顯示模塊將商品推薦給用戶。

        2.2 融合項(xiàng)目屬性與用戶興趣相似度計(jì)算

        傳統(tǒng)的協(xié)同過(guò)濾算法,通過(guò)研究相似用戶的興趣偏好進(jìn)行相似性計(jì)算,忽略了時(shí)間因素以及項(xiàng)目屬性對(duì)用戶的影響,進(jìn)而造成數(shù)據(jù)的稀疏性;而且,當(dāng)引入新項(xiàng)目時(shí)無(wú)法及時(shí)的進(jìn)行推薦,導(dǎo)致冷啟動(dòng)問(wèn)題的產(chǎn)生,可擴(kuò)展性不足。本設(shè)計(jì)提出一個(gè)將用戶興趣和項(xiàng)目屬性混合進(jìn)而計(jì)算相似度的方法,通過(guò)利用權(quán)重系數(shù)綜合分析項(xiàng)目評(píng)分的相似性,其數(shù)學(xué)表示為:

        sim(p,q)=αsimrate(p,q)+(1-α)simattr(p,q)

        (8)

        式中:simattr(p,q)為項(xiàng)目屬性;simrate(p,q)為興趣偏好;α為平衡因子,取值在0和1之間,決定了相似度擬合的權(quán)重系數(shù)。通過(guò)調(diào)節(jié)平衡因子α可以實(shí)現(xiàn)推薦精度的改變,最終實(shí)現(xiàn)精準(zhǔn)的個(gè)性化推薦,α具體取值,通過(guò)實(shí)驗(yàn)仿真得出。但是現(xiàn)實(shí)中,這種相似度計(jì)算并不適用于所有情況,為了防止用戶共同評(píng)分項(xiàng)目過(guò)少而出現(xiàn)的相關(guān)系數(shù)過(guò)大,需要根據(jù)情況加入權(quán)值因子即懲罰因子,改進(jìn)后的相似度表示為:

        (9)

        式中:Npenalty為權(quán)值因子定值,大部分情況下取值50,Noverlap為目標(biāo)用戶與已知用戶一起評(píng)分項(xiàng)目數(shù)量。

        算法的具體步驟為:

        (1)輸入近鄰數(shù)k,商品集合以及用戶集合,并寫(xiě)出評(píng)分矩陣R;

        (2)選取合適的數(shù)據(jù)庫(kù),抽取其中85%作為訓(xùn)練樣本,15%作為測(cè)試樣本,并讀入訓(xùn)練樣本中生成用戶評(píng)分矩陣的數(shù)據(jù);

        (3)利用改進(jìn)后的相似度表示式(9),得到融合項(xiàng)目屬性與用戶興趣相似性,比較相似度結(jié)果,選取大于閾值的若干個(gè)組成最近鄰集合;

        (4)最后通過(guò)15%測(cè)試樣本,得出推薦準(zhǔn)確率P、均方根誤差R、絕對(duì)誤差,驗(yàn)證算法的有效性。

        3 實(shí)驗(yàn)與仿真

        首先搭建所需硬件平臺(tái),電腦采用8核CPU、Intel i7@3.4 GHz、32 G內(nèi)存、512 GB固態(tài)硬盤(pán),軟件配置為Microsoft Windows7操作系統(tǒng),編程語(yǔ)言為Java,開(kāi)發(fā)平臺(tái)為Myeclipse10。數(shù)據(jù)集采用美國(guó)Minnesota大學(xué)GroupLens項(xiàng)目組開(kāi)發(fā)并維護(hù)的數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含3個(gè)數(shù)據(jù)集,為了便于比較驗(yàn)證,選取其中的一個(gè)MovieLens 100k數(shù)據(jù)集,該數(shù)據(jù)集里面含有1 682部影片、943位用戶評(píng)價(jià)的100 000條評(píng)價(jià)。評(píng)分范圍值為1~5之間,抽取其中85%作為訓(xùn)練樣本,15%作為測(cè)試樣本。評(píng)價(jià)推薦系統(tǒng)性能優(yōu)劣的指標(biāo)有召回率(recall)、覆蓋率(coverage)、絕對(duì)誤差(MAE)以及均方根偏差(RMSE)。本設(shè)計(jì)通過(guò)比較傳統(tǒng)算法與改進(jìn)協(xié)同過(guò)濾算法在絕對(duì)誤差和均方根偏差的數(shù)值來(lái)驗(yàn)證算法的有效性。

        本設(shè)計(jì)中相似度融合了項(xiàng)目屬性與用戶興趣,平衡因子α決定了這兩部分的比值。通過(guò)仿真觀察得出平衡因子α與絕對(duì)誤差(MAE)間的關(guān)系,如圖3所示。

        圖3 絕對(duì)誤差與平衡因子變化曲線

        通過(guò)圖3可知,當(dāng)平衡因子α為0.4時(shí),絕對(duì)誤差最小,推薦精度達(dá)到最大值,所以后續(xù)仿真α采用0.4。在相同測(cè)試集以及數(shù)據(jù)稀疏度的環(huán)境下,通過(guò)與傳統(tǒng)的以評(píng)分差異度和以項(xiàng)目類(lèi)別偏好計(jì)算相似度的協(xié)同過(guò)濾算法進(jìn)行對(duì)比來(lái)驗(yàn)證本文算法的精確度;同時(shí)為了驗(yàn)證本文算法的普遍適用性,針對(duì)不同的情況最近鄰個(gè)數(shù)分別取10~60,實(shí)驗(yàn)結(jié)果如圖4所示。

        圖4 不同算法絕對(duì)誤差比較

        由圖4可知,基于改進(jìn)的協(xié)同過(guò)濾算法相對(duì)于傳統(tǒng)的協(xié)同過(guò)濾算法具有較高的精確度,且隨著最近鄰個(gè)數(shù)的增加,系統(tǒng)的精確度仍然優(yōu)于其他算法,說(shuō)明具有一定的魯棒性和普遍適用性。

        4 結(jié) 語(yǔ)

        在信息爆炸時(shí)代,用戶如何在大量冗余的信息中找到自己感興趣的數(shù)據(jù),電商網(wǎng)站如何推銷(xiāo)商品并提高客戶粘連度是近年來(lái)研究的重點(diǎn)。本文通過(guò)對(duì)推薦系統(tǒng)關(guān)鍵技術(shù)及評(píng)價(jià)指標(biāo)進(jìn)行分析,得出推薦系統(tǒng)的基礎(chǔ)架構(gòu)。在此基礎(chǔ)上對(duì)協(xié)同過(guò)濾算法進(jìn)行改進(jìn),通過(guò)引入權(quán)重因子以及懲罰函數(shù),將用戶興趣和項(xiàng)目屬性混合進(jìn)而計(jì)算相似度,最終實(shí)現(xiàn)精準(zhǔn)的個(gè)性化推薦,并通過(guò)實(shí)驗(yàn)仿真驗(yàn)證本設(shè)計(jì)具有一定的魯棒性和普遍適用性。

        猜你喜歡
        協(xié)同模塊算法
        28通道收發(fā)處理模塊設(shè)計(jì)
        “選修3—3”模塊的復(fù)習(xí)備考
        蜀道難:車(chē)與路的協(xié)同進(jìn)化
        基于MapReduce的改進(jìn)Eclat算法
        Travellng thg World Full—time for Rree
        “四化”協(xié)同才有出路
        進(jìn)位加法的兩種算法
        三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
        一種改進(jìn)的整周模糊度去相關(guān)算法
        選修6 第三模塊 International Relationships
        亚洲日韩精品久久久久久| 国产精品美女久久久久av福利 | 在线综合网| 中文字幕在线一区乱码| 精品国产三级a| 国产在线观看免费不卡视频| 又黄又刺激的网站久久| 亚洲av午夜福利精品一区二区| 国产精品美女| av中文码一区二区三区| 国产一品二品精品在线| 99精品国产在热久久无码 | 精品色老头老太国产精品| 91露脸半推半就老熟妇| 熟女少妇在线视频播放| 日日摸夜夜添夜夜添一区二区| 亚洲色图在线视频观看| 久久综合精品人妻一区二区三区| 国语对白嫖老妇胖老太| 精品一级毛片| 亚洲无av高清一区不卡| 在线麻豆精东9制片厂av影现网| 性一交一乱一伧国产女士spa| 国产精品人妻一区夜夜爱| 无码区a∨视频体验区30秒| 日本美女中文字幕第一区| 国产丝袜美女一区二区三区| 人妻去按摩店被黑人按中出| 国产在线一区二区视频免费观看| 给我看免费播放的视频在线观看| 久久99精品久久久久久9蜜桃| 久久久精品3d动漫一区二区三区 | 亚洲av有码在线天堂| 午夜一区二区三区在线视频| 国产自拍视频在线观看免费 | 熟女人妻中文字幕av| 亚洲av无码不卡久久| 在线无码精品秘 在线观看| 亚洲国产一区二区网站| …日韩人妻无码精品一专区| 亚洲国产综合精品 在线 一区 |