亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

        2017-04-24 10:40:38劉沛文陳華鋒
        關(guān)鍵詞:物品權(quán)重動(dòng)態(tài)

        劉沛文 陳華鋒

        (武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

        基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

        劉沛文 陳華鋒

        (武漢大學(xué)國(guó)家多媒體軟件工程技術(shù)研究中心 湖北 武漢 430072)(武漢大學(xué)計(jì)算機(jī)學(xué)院 湖北 武漢 430072)

        推薦系統(tǒng)可以為不同的用戶(hù)定制個(gè)性化的網(wǎng)絡(luò)服務(wù),如何提供準(zhǔn)確的推薦則成為其最大難點(diǎn)。針對(duì)傳統(tǒng)推薦算法的稀疏性問(wèn)題,提出基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法。通過(guò)對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計(jì)算出不同用戶(hù)對(duì)于不同物品的個(gè)性化行為特征指數(shù),并將其引入相似度的計(jì)算中。依據(jù)用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏性的差異計(jì)算出動(dòng)態(tài)權(quán)重,并依此將基于用戶(hù)內(nèi)容的推薦和協(xié)同過(guò)濾推薦進(jìn)行動(dòng)態(tài)混合。實(shí)驗(yàn)結(jié)果表明,該算法在稀疏數(shù)據(jù)集中能有效降低推薦誤差,提高推薦精度。

        行為特征 動(dòng)態(tài)權(quán)重 混合推薦算法

        0 引 言

        為了能夠提供更好的產(chǎn)品設(shè)計(jì)和用戶(hù)服務(wù),電子商務(wù)和社交網(wǎng)絡(luò)始終致力于提高對(duì)用戶(hù)興趣的理解和預(yù)測(cè)。2013年下半年,Twitter通過(guò)監(jiān)測(cè)用戶(hù)關(guān)注和轉(zhuǎn)發(fā)等操作,設(shè)計(jì)了一個(gè)向個(gè)人推薦推文和賬戶(hù)的新功能。推薦系統(tǒng)開(kāi)始大范圍的應(yīng)用于Amazon、Netflix和LinkedIn等網(wǎng)站。

        在推薦系統(tǒng)中,推薦算法是其核心。傳統(tǒng)的推薦算法主要包括基于內(nèi)容的過(guò)濾算法CBF(Content-based Filtering)、協(xié)同過(guò)濾算法CF(Collaborative Filtering)和混合過(guò)濾算法HR(Hybrid Recommendation)等[1]。

        基于內(nèi)容的過(guò)濾算法使用對(duì)象的自身信息來(lái)進(jìn)行推薦,核心思想是針對(duì)待推薦的目標(biāo)用戶(hù),其將來(lái)很可能對(duì)與該用戶(hù)相似的用戶(hù)以往感興趣的物品或在內(nèi)容上與該用戶(hù)以往感興趣的物品相似的物品仍然感興趣[2]。針對(duì)算法的計(jì)算對(duì)象,基于內(nèi)容的推薦算法可分為基于用戶(hù)內(nèi)容的過(guò)濾算法和基于項(xiàng)目?jī)?nèi)容的過(guò)濾算法[3]。兩種算法分別從用戶(hù)和物品的角度,分析目標(biāo)用戶(hù)或物品與其他用戶(hù)或物品之間因自身內(nèi)容或?qū)傩缘牟煌嬖诘膬?nèi)在聯(lián)系,例如用戶(hù)資料、物品描述等,利用相似度計(jì)算公式計(jì)算用戶(hù)或物品間的相似程度,最終加權(quán)計(jì)算出推薦預(yù)測(cè)值,并按預(yù)測(cè)值的大小來(lái)決定目標(biāo)用戶(hù)的推薦物品。

        協(xié)同過(guò)濾算法分為兩種,基于用戶(hù)的協(xié)同過(guò)濾算法UBCF(User-based Collaborative Filtering)和基于項(xiàng)目的協(xié)同過(guò)濾算法IBCF(Item-based Collaborative Filtering)[4],其依據(jù)用戶(hù)對(duì)物品的歷史評(píng)分,分別計(jì)算用戶(hù)或物品間的相似度,找到與目標(biāo)用戶(hù)或目標(biāo)物品相似的對(duì)象,并根據(jù)相似對(duì)象的歷史評(píng)分信息計(jì)算目標(biāo)用戶(hù)對(duì)目標(biāo)物品的推薦預(yù)測(cè)值,以此來(lái)進(jìn)行推薦。

        混合過(guò)濾算法是將上述提到了多種推薦算法進(jìn)行不同方式的融合,進(jìn)而衍生出的一種推薦算法[5]。大多是引入一個(gè)平衡因子,通過(guò)線性公式將推薦算法進(jìn)行混合,并通過(guò)在特定測(cè)試數(shù)據(jù)集上對(duì)特定用戶(hù)的反復(fù)實(shí)驗(yàn)來(lái)確定平衡因子的值。

        雖然以上推薦算法在目前的推薦系統(tǒng)中已經(jīng)得到了較為廣泛的應(yīng)用,但還存在以下幾個(gè)問(wèn)題:

        (1) 推薦效果強(qiáng)烈依賴(lài)于用戶(hù)和項(xiàng)目的歷史數(shù)據(jù),受數(shù)據(jù)集稀疏性的干擾[6];

        (2) 傳統(tǒng)的混合推薦算法不能靈活感知用戶(hù)在不同時(shí)期、不同用戶(hù)所產(chǎn)生的動(dòng)態(tài)的個(gè)性化偏好[7];

        (3) 在實(shí)際應(yīng)用中,混合推薦的固定權(quán)重不能適應(yīng)數(shù)據(jù)集中不同用戶(hù)數(shù)據(jù)稀疏性的個(gè)性化差異。

        針對(duì)上述問(wèn)題,本文提出一種基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法DWHR(Dynamic-Weighted Hybrid Recommendation),其核心思想是根據(jù)用戶(hù)在不同的時(shí)期所產(chǎn)生的行為操作,例如評(píng)分、瀏覽記錄等,自適應(yīng)地將多種推薦算法進(jìn)行動(dòng)態(tài)加權(quán),預(yù)測(cè)用戶(hù)對(duì)于該物品的喜好程度。在MovieLens公共電影評(píng)分?jǐn)?shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該算法可以針對(duì)不同用戶(hù)的個(gè)性化差異,有效提高在稀疏數(shù)據(jù)集下的推薦精度。

        1 本文提出的算法

        1.1 相關(guān)定義

        1.1.1 評(píng)分矩陣

        在推薦系統(tǒng)中,定義U={u1,u2,…,um}為系統(tǒng)中所有m個(gè)用戶(hù)的集合,I={i1,i2,…,in}為所有n個(gè)項(xiàng)目的集合。則評(píng)分矩陣R[m×n]可用表1表示。其中,用戶(hù)i對(duì)項(xiàng)目j的評(píng)分表示為rij。若rij=0,則表示用戶(hù)i對(duì)項(xiàng)目j未進(jìn)行評(píng)分。另外,針對(duì)MovieLens數(shù)據(jù)集,定義X={x1,x2,…,x19}為所有19種電影類(lèi)型,而每種電影類(lèi)型中又包含了多部電影,即xa={ii},ii∈I,xa∈X。

        表1 評(píng)分矩陣R[m×n]

        1.1.2 相似度定義

        (1)

        (2)

        (3)

        (4)其中,T={i|ui≠0∧vi≠0}。從以上公式中可以看出,相對(duì)于余弦相似度和皮爾遜相似度,歐氏距離強(qiáng)調(diào)在向量中每個(gè)維度在數(shù)值特征上的絕對(duì)差異;而余弦相似度關(guān)注的是向量每個(gè)維度間的相對(duì)差異;修正余弦相似度在余弦相似度的基礎(chǔ)上,修正了其可能在度量標(biāo)準(zhǔn)上存在的不統(tǒng)一的問(wèn)題;而皮爾遜相似度進(jìn)一步將向量的計(jì)算維度縮小至兩向量共有數(shù)據(jù)的維度上。

        針對(duì)MovieLens數(shù)據(jù)集,評(píng)分矩陣可以被看作是針對(duì)用戶(hù)的n維或是針對(duì)項(xiàng)目的m維向量,然后根據(jù)上述公式即可針對(duì)不同情況計(jì)算出用戶(hù)或物品之間的相似度。

        1.1.3 用戶(hù)行為特征定義及提取

        一些早期的推薦模型常常假定用戶(hù)的興趣愛(ài)好是固定的,以至于在任何情況下系統(tǒng)總是推薦同一類(lèi)型的項(xiàng)目給用戶(hù)。但事實(shí)上,用戶(hù)的興趣經(jīng)常隨著時(shí)間及周?chē)h(huán)境的影響而改變。比如,用戶(hù)在不同的季節(jié)或不同的年齡段喜歡穿不同款式的衣服,看不同類(lèi)型的電影等。所以,行為特征是用戶(hù)由外界環(huán)境影響所引發(fā)的一系列行為表現(xiàn)。

        為了量化行為特征,選取MovieLens數(shù)據(jù)集中用戶(hù)在不同時(shí)間和不同年齡段對(duì)不同類(lèi)型電影的評(píng)分情況作為量化指標(biāo)。在通常情況下,用戶(hù)如果喜歡一部電影,其評(píng)分往往會(huì)高于均分。由于MovieLens數(shù)據(jù)集的評(píng)分范圍是1~5,因此定義3分為用戶(hù)的評(píng)分喜好點(diǎn),即如果用戶(hù)對(duì)一部電影的評(píng)分大于等于3分,則說(shuō)明用戶(hù)是喜歡此部電影的。本文定義時(shí)間特征指數(shù)monthlike(m,xa)為用戶(hù)在m月對(duì)xa類(lèi)型電影的喜好程度;年齡特征指數(shù)agelike(i,xa)為用戶(hù)i所在的年齡段xa類(lèi)型電影的喜好程度,其中年齡段依據(jù)數(shù)據(jù)集中的標(biāo)示進(jìn)行劃分。二者的計(jì)算公式如下:

        (5)

        (6)

        其中,Lm,xa表示用戶(hù)在m月中喜歡xa類(lèi)型電影的評(píng)分?jǐn)?shù)據(jù)集合,Li,xa表示用戶(hù)i所對(duì)應(yīng)的年齡段喜歡xa類(lèi)型電影的評(píng)分?jǐn)?shù)據(jù)集合,Lxa表示評(píng)分?jǐn)?shù)據(jù)中所有喜歡xa類(lèi)型電影的評(píng)分集合。

        依據(jù)上述公式對(duì)MovieLens數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理,計(jì)算出每個(gè)月份和每個(gè)年齡段的用戶(hù)對(duì)不同類(lèi)型電影的特征指數(shù),結(jié)果如圖1和圖2所示。從圖1可看出,用戶(hù)隨著其年齡的增長(zhǎng),觀看電影的數(shù)量總體上呈先上升再下降的趨勢(shì)。而針對(duì)不同的年齡段的用戶(hù),其對(duì)不同類(lèi)型的電影也有著較為明顯的區(qū)別,例如25歲以下的用戶(hù)最喜愛(ài)動(dòng)畫(huà)片,而25~45歲的用戶(hù)喜歡紀(jì)錄片的居多。從圖2可看出,用戶(hù)在8月和11月最喜歡看電影。而在1月用戶(hù)最喜歡看紀(jì)錄片,在8月喜歡看恐怖片,最不喜歡看紀(jì)錄片。

        圖1 不同年齡段對(duì)不同類(lèi)型電影的喜好程度

        圖2 不同時(shí)間段對(duì)不同類(lèi)型電影的喜好程度

        因此,行為特征指數(shù)越大,則此用戶(hù)所代表的這類(lèi)人對(duì)該類(lèi)型的電影越感興趣,則其喜歡對(duì)應(yīng)類(lèi)型電影的可能性越大。

        1.1.4 動(dòng)態(tài)權(quán)重

        當(dāng)一個(gè)新用戶(hù)或新項(xiàng)目進(jìn)入到系統(tǒng)中時(shí),其必然會(huì)面對(duì)“冷啟動(dòng)”問(wèn)題[8-10]。在這種情況下,推薦系統(tǒng)無(wú)法利用協(xié)同過(guò)濾等基于歷史數(shù)據(jù)的推薦算法進(jìn)行推薦,只有利用基于內(nèi)容的過(guò)濾算法,根據(jù)用戶(hù)或項(xiàng)目自身特定的屬性和信息來(lái)進(jìn)行粗粒推薦;而當(dāng)用戶(hù)和項(xiàng)目的歷史數(shù)據(jù)積累到一定數(shù)量之后,基于內(nèi)容的過(guò)濾算法過(guò)于粗糙的弊端暴露,協(xié)同過(guò)濾算法依據(jù)歷史數(shù)據(jù)精確推薦的優(yōu)勢(shì)逐漸突出。所以,混合推薦將兩種算法進(jìn)行不同方式的融合,目的在于使單一的推薦算法在不同使用場(chǎng)景中能夠揚(yáng)長(zhǎng)避短,提升推薦精度。

        傳統(tǒng)的混合推薦算法大多引入一個(gè)平衡因子,通過(guò)線性公式將兩種或多種推薦算法混合而來(lái)[11-14]。其中,平衡因子的取值往往需要在特定的測(cè)試數(shù)據(jù)集上反復(fù)實(shí)驗(yàn),才能找到一個(gè)特定的值,來(lái)達(dá)到最好的推薦效果。然而,在實(shí)際應(yīng)用中,由于項(xiàng)目數(shù)量遠(yuǎn)大于用戶(hù)數(shù)量[15],評(píng)分?jǐn)?shù)據(jù)矩陣對(duì)總體而言十分稀疏,但對(duì)于不同的用戶(hù)和項(xiàng)目個(gè)體來(lái)說(shuō)其稀疏性差別巨大。所以,固定權(quán)重值的混合推薦算法只能針對(duì)特定的數(shù)據(jù)集在宏觀上平衡每個(gè)個(gè)體的推薦誤差,不能很好地滿(mǎn)足用戶(hù)的個(gè)性差異。

        為了解決上述問(wèn)題,針對(duì)不同用戶(hù)評(píng)分?jǐn)?shù)據(jù)稀疏性的個(gè)性化差異,將用戶(hù)已評(píng)分的物品數(shù)量占物品集總數(shù)量的比值作為動(dòng)態(tài)權(quán)重平衡因子引入進(jìn)混合推薦中,即依據(jù)用戶(hù)評(píng)分的多少來(lái)動(dòng)態(tài)決定權(quán)重大小,以此來(lái)動(dòng)態(tài)平衡混合推薦算法中兩種推薦算法所占比重,提出如下計(jì)算公式:

        (7)

        其中,λ為引入的線性因子,用來(lái)控制在一定物品數(shù)量下已評(píng)分物品數(shù)據(jù)量的線性增長(zhǎng)快慢對(duì)動(dòng)態(tài)權(quán)重影響的大?。籘r為用戶(hù)i已評(píng)分的項(xiàng)目集合,即Tr={r|rij≠0,1≤j≤n},I表示物品集。

        1.2 基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法

        基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法主要分為基于內(nèi)容的過(guò)濾算法和協(xié)同過(guò)濾兩大部分。

        首先是基于內(nèi)容過(guò)濾算法部分的計(jì)算。由上文可知,基于內(nèi)容的過(guò)濾算法分為基于用戶(hù)和項(xiàng)目?jī)煞N。但由于用戶(hù)社會(huì)網(wǎng)絡(luò)信息的豐富程度遠(yuǎn)高于物品,所以基于用戶(hù)內(nèi)容的推薦計(jì)算維度更廣,精確度更高。另一方面,在大部分?jǐn)?shù)據(jù)集中,物品數(shù)量極大于用戶(hù)數(shù)量,且物品增長(zhǎng)速度遠(yuǎn)高于用戶(hù)增長(zhǎng)速度,所以基于用戶(hù)內(nèi)容信息推薦的計(jì)算復(fù)雜度遠(yuǎn)低于基于項(xiàng)目信息內(nèi)容過(guò)濾算法。因此,基于內(nèi)容的過(guò)濾算法部分采用基于用戶(hù)內(nèi)容的推薦算法進(jìn)行計(jì)算,可分為以下3個(gè)步驟:

        1) 計(jì)算用戶(hù)內(nèi)容相似度并組成相似用戶(hù)數(shù)據(jù)集

        2) 計(jì)算用戶(hù)行為特征指數(shù)

        確定待推薦電影j的電影類(lèi)型為xj,并遍歷用戶(hù)集Ua中每一個(gè)用戶(hù)和其看過(guò)的所有xj類(lèi)型的電影,根據(jù)式(5)、式(6)分別計(jì)算出其對(duì)應(yīng)的時(shí)間特征指數(shù)monthlike(m,xj)和年齡特征指數(shù)agelike(i,xj)。

        3) 計(jì)算基于用戶(hù)內(nèi)容推薦預(yù)測(cè)值

        利用加權(quán)平均公式,計(jì)算出相似用戶(hù)對(duì)同類(lèi)型電影的評(píng)分和其特征指數(shù)的基于用戶(hù)內(nèi)容推薦的預(yù)測(cè)值,即:

        PDBR(i,j)=

        (8)

        其中Ui表示用戶(hù)i的基于用戶(hù)內(nèi)容推薦的相鄰用戶(hù)集,xj表示與電影j相同類(lèi)型的電影集合,rbk表示用戶(hù)b對(duì)電影k的評(píng)分。

        其次進(jìn)行協(xié)同過(guò)濾部分的算法計(jì)算。由于物品數(shù)量極大于用戶(hù)數(shù)量,所以計(jì)算物品之間相似度的準(zhǔn)確性會(huì)大大優(yōu)于計(jì)算用戶(hù)之間的。因此,協(xié)同過(guò)濾部分的算法采用基于項(xiàng)目的協(xié)同過(guò)濾算法。正如上文所述,基于評(píng)分矩陣計(jì)算相似度更加關(guān)注兩個(gè)向量在不同維度之間的相對(duì)差異。并且,在評(píng)分向量單個(gè)維度數(shù)據(jù)稀疏的情況下,皮爾遜相似度可以有效規(guī)避向量之間因線性獨(dú)立所帶來(lái)的計(jì)算誤差。因此本文采用皮爾遜相似度作為用戶(hù)相似度計(jì)算的主要方法,相似度計(jì)算公式可由式(4)轉(zhuǎn)變?yōu)椋?/p>

        PCC(i,j) =simPCC(i,j)

        (9)

        因此,協(xié)同過(guò)濾部分的算法概括為以下2個(gè)步驟:

        1) 計(jì)算物品之間的相似度并組成相似物品數(shù)據(jù)集

        根據(jù)式(9)計(jì)算出待推薦物品i與任意其他物品j之間的相似度集合SPCC。將SPCC中的相似度按大小進(jìn)行降序排列,并選取前θ個(gè)組成相鄰物品數(shù)據(jù)集IPCC。

        2) 計(jì)算協(xié)同過(guò)濾預(yù)測(cè)值

        針對(duì)目標(biāo)用戶(hù),利用IPCC中相似物品的評(píng)分?jǐn)?shù)據(jù)進(jìn)行加權(quán),計(jì)算出目標(biāo)用戶(hù)i對(duì)于待推薦物品j的基于項(xiàng)目的協(xié)同過(guò)濾的加權(quán)預(yù)測(cè)值,即:

        (10)

        最后,利用式(7)計(jì)算出的動(dòng)態(tài)權(quán)重,將上述基于用戶(hù)內(nèi)容的推薦和協(xié)同過(guò)濾的推薦算法分別計(jì)算出來(lái)的預(yù)測(cè)值進(jìn)行線性組合,計(jì)算出本文提出的基于用戶(hù)行為特征的動(dòng)態(tài)權(quán)重混合推薦算法的預(yù)測(cè)結(jié)果,即:

        P(i,j)=DynamicWeight(i)·PPCC(i,j)+

        (1-DynamicWeight(i))PDBR(i,j)

        (11)

        2 數(shù)據(jù)實(shí)驗(yàn)及結(jié)果分析

        2.1 實(shí)驗(yàn)設(shè)計(jì)

        實(shí)驗(yàn)采用平均絕對(duì)誤差MAN(MeanAbsoluteDifference)作為衡量算法準(zhǔn)確性的標(biāo)準(zhǔn),其通過(guò)統(tǒng)計(jì)算法計(jì)算出來(lái)的預(yù)測(cè)評(píng)分與用戶(hù)的實(shí)際評(píng)分之間的絕對(duì)距離的均值來(lái)實(shí)現(xiàn)精確性的度量。介于MAE的計(jì)算和實(shí)現(xiàn)都非常簡(jiǎn)單,所以其已經(jīng)成為絕大多數(shù)文獻(xiàn)中使用的標(biāo)準(zhǔn)[2]。對(duì)于n個(gè)用戶(hù)的實(shí)際評(píng)分R={r1,r2,…,rn},推薦算法計(jì)算出的預(yù)測(cè)評(píng)分P={p1,p2,…,pn},則MAE計(jì)算公式如下:

        (12)

        其中pi為預(yù)測(cè)評(píng)分,ri為實(shí)際評(píng)分。

        實(shí)驗(yàn)方案為10折交叉驗(yàn)證法(10-FoldCross-Validation)[2,3]。此方案將MovieLens數(shù)據(jù)集隨機(jī)分為10個(gè)互不相交的數(shù)據(jù)集,輪流選擇其中的一份作為測(cè)試數(shù)據(jù)集,其他9份作為訓(xùn)練集,重復(fù)執(zhí)行10次測(cè)試算法,保證每個(gè)子數(shù)據(jù)集有且僅有一次作為訓(xùn)練集,最后取十次計(jì)算結(jié)果的平均值作為實(shí)驗(yàn)的整體結(jié)果。

        2.2 實(shí)驗(yàn)結(jié)果及分析

        2.2.1 動(dòng)態(tài)權(quán)重線性因子λ的影響

        在式(7)中,動(dòng)態(tài)權(quán)重線性因子λ起著非常重要的作用,如果λ的取值不當(dāng),會(huì)造成動(dòng)態(tài)權(quán)重DynamicWeight(i)的值過(guò)大或者過(guò)小,進(jìn)而改變基于用戶(hù)內(nèi)容的推薦和協(xié)同過(guò)濾兩種推薦算法在混合推薦中所占比重大小,極大影響算法的推薦精度。所以,本次實(shí)驗(yàn)針對(duì)在不同線性因子λ下,對(duì)本文提出算法的推薦結(jié)果進(jìn)行測(cè)試,并對(duì)不同的相鄰用戶(hù)數(shù)量θ之間的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比,實(shí)驗(yàn)結(jié)果如圖3所示。

        圖3 不同線性因子λ的實(shí)驗(yàn)結(jié)果對(duì)比

        從式(7)中可以發(fā)現(xiàn),隨著λ的增加,在最終的預(yù)測(cè)評(píng)分中協(xié)同過(guò)濾部分所占比重增加。而從圖中的曲線變化可知,針對(duì)同一相鄰用戶(hù)數(shù)量,MAE總體呈下降趨勢(shì),說(shuō)明相對(duì)較大的λ值所提高的協(xié)同過(guò)濾比重可以在一定程度上提高推薦的準(zhǔn)確性。特別是當(dāng)λ=4時(shí),算法可以達(dá)到最佳的推薦質(zhì)量。但隨著λ繼續(xù)增大,MAE的數(shù)值并沒(méi)有顯著減小,反而略微開(kāi)始增加,這說(shuō)明此時(shí)協(xié)同過(guò)濾預(yù)測(cè)所帶來(lái)的誤差對(duì)結(jié)果的影響增大,而基于用戶(hù)內(nèi)容部分在稀疏數(shù)據(jù)中所展現(xiàn)出來(lái)的優(yōu)勢(shì)在低權(quán)值下無(wú)法對(duì)結(jié)果產(chǎn)生影響,從而降低了算法的推薦精度。

        2.2.2 常見(jiàn)推薦算法推薦效果對(duì)比

        為了驗(yàn)證本文算法在提高推薦預(yù)測(cè)準(zhǔn)確性方面的有效性,本次實(shí)驗(yàn)選用同是混合推薦算法但采用固定權(quán)重推薦的文獻(xiàn)[16]。優(yōu)化混合推薦算法作為主要對(duì)比算法。而在傳統(tǒng)的推薦算法中,相鄰用戶(hù)是目標(biāo)用戶(hù)預(yù)測(cè)評(píng)分的關(guān)鍵依據(jù),鄰居規(guī)模的大小都有可能影響推薦算法的準(zhǔn)確度。所以,本次實(shí)驗(yàn)分別對(duì)傳統(tǒng)的基于用戶(hù)的協(xié)同過(guò)濾、基于項(xiàng)目的協(xié)同過(guò)濾、優(yōu)化混合推薦算法[16]。以及本文提出的算法等四種算法在不同的相鄰用戶(hù)數(shù)量θ下的推薦精度進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果如圖4所示。

        圖4 不同相鄰用戶(hù)數(shù)量θ的實(shí)驗(yàn)結(jié)果對(duì)比

        由圖可知,不論是文獻(xiàn)[16]算法還是本文的算法,其核心都是將多種推薦算法進(jìn)行組合,減小傳統(tǒng)單一推薦算法在不同使用場(chǎng)景下的計(jì)算誤差,所以混合算法的推薦精度都遠(yuǎn)高于傳統(tǒng)單一推薦算法。而針對(duì)混合推薦算法,由于文獻(xiàn)[16]算法在計(jì)算相似度的過(guò)程中采用固定權(quán)重的方式將物品屬性相似性和修正余弦相似度線性組合,忽略了相鄰用戶(hù)個(gè)體評(píng)分?jǐn)?shù)據(jù)稀疏性差異以及用戶(hù)評(píng)分?jǐn)?shù)據(jù)受外界條件等因素的影響。因此,從實(shí)驗(yàn)結(jié)果可以看出,本文所提出的推薦算法在不同數(shù)量的相鄰用戶(hù)下其MAE均小于文獻(xiàn)[16]中的混合推薦算法,推薦效果一直處于較高的優(yōu)勢(shì),并隨著相鄰用戶(hù)數(shù)量的增加,優(yōu)勢(shì)也逐漸增加。就本文提出的算法而言,隨著相鄰用戶(hù)數(shù)量的增加,MAE總體呈下降趨勢(shì),特別是當(dāng)50<θ<60,即相鄰用戶(hù)數(shù)量取到所有訓(xùn)練集用戶(hù)數(shù)量的50%~60%時(shí),MAE值取最小,推薦效果最好。而當(dāng)相鄰用戶(hù)數(shù)量超過(guò)60%時(shí),由于過(guò)多的鄰居評(píng)分引入了更多相似度不高的噪聲數(shù)據(jù),從而降低了推薦精度,影響了算法的推薦效果。

        3 結(jié) 語(yǔ)

        本文對(duì)傳統(tǒng)的混合推薦算法進(jìn)行了優(yōu)化,將用戶(hù)行為特征進(jìn)行量化并引入到用戶(hù)相似度的計(jì)算中來(lái),并根據(jù)用戶(hù)數(shù)據(jù)稀疏性的個(gè)性化差異,自適應(yīng)地將多種推薦算法動(dòng)態(tài)連接并進(jìn)行推薦預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該算法從多方面縮小因單一推薦算法所帶來(lái)的推薦誤差,極大地提高了傳統(tǒng)單一推薦算法在稀疏數(shù)據(jù)集中推薦的準(zhǔn)確性。相較于其他的混合過(guò)濾算法,引入動(dòng)態(tài)權(quán)重的概念來(lái)調(diào)整不同推薦算法所占的比重,有效平衡因用戶(hù)歷史數(shù)據(jù)集稀疏性的個(gè)性差異所帶來(lái)的推薦誤差,提高推薦質(zhì)量。從實(shí)驗(yàn)中發(fā)現(xiàn),算法在相鄰用戶(hù)數(shù)量較低的情況下推薦精度下降,并且混合推薦自身存在的計(jì)算量大、耗時(shí)長(zhǎng)等問(wèn)題,下一步該算法還需在以上兩個(gè)方面進(jìn)行深入研究。

        [1]AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:Asurveyofthestate-of-the-artandpossibleextensions[J].IEEETransactionsonKnowledgeandDataEngineering,2005,17(6):734-749.

        [2] 任磊.推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:華東師范大學(xué),2012.

        [3] 朱文奇.推薦系統(tǒng)用戶(hù)相似度計(jì)算方法研究[D].重慶:重慶大學(xué),2014.

        [4]GuptaJ,GadgeJ.Performanceanalysisofrecommendationsystembasedoncollaborativefilteringanddemographics[C]//Communication,Information&ComputingTechnology(ICCICT),2015InternationalConferenceon.IEEE,2015:1-6.

        [5] 趙偉明.基于用戶(hù)行為分析和混合推薦策略的個(gè)性化推薦方法研究[D].北京:北京工業(yè)大學(xué),2014.

        [6]AbhishekK,KulkarniS,ArchanaVKN,etal.AReviewonPersonalizedInformationRecommendationSystemUsingCollaborativeFiltering[J].InternationalJournalofComputerScienceandInformationTechnologies(IJCSIT),2011,2(3):1272-1278.

        [7]ScheinAI,PopesculA,UngarLH,etal.Methodsandmetricsforcold-startrecommendations[C]//Proceedingsofthe25thAnnualInternationalACMSIGIRConferenceonResearchandDevelopmentinInformationRetrieval.ACM,2002:253-260.

        [8]BaoH,LiQ,LiaoSS,etal.AnewtemporalandsocialPMF-basedmethodtopredictusers’interestsinmicro-blogging[J].DecisionSupportSystems,2013,55(3):698-709.

        [9]LeeTQ,ParkY,ParkYT.Atime-basedapproachtoeffectiverecommendersystemsusingimplicitfeedback[J].ExpertSystemswithApplications,2008,34(4):3055-3062.

        [10]KoenigsteinN,DrorG,KorenY.Yahoo!musicrecommendations:modelingmusicratingswithtemporaldynamicsanditemtaxonomy[C]//ProceedingsoftheFifthACMConferenceonRecommenderSystems.ACM,2011:165-172.

        [11] 張騰季.個(gè)性化混合推薦算法的研究[D].杭州:浙江大學(xué),2013.

        [12] 張新猛,蔣盛益,李霞,等.基于網(wǎng)絡(luò)和標(biāo)簽的混合推薦算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(1):119-124.

        [13]PazzaniMJ,BillsusD.Content-basedrecommendationsystems[M]//TheAdaptiveWeb.Springer,2007:325-341.

        [14]ChenW,NiuZ,ZhaoX,etal.Ahybridrecommendationalgorithmadaptedine-learningenvironments[J].WorldWideWeb,2014,17(2):271-284.

        [15]TangX,ZhouJ.Dynamicpersonalizedrecommendationonsparsedata[J].IEEETransactionsonKnowledgeandDataEngineering,2013,25(12):2895-2899.

        [16] 李鵬飛,吳為民.基于混合模型推薦算法的優(yōu)化[J].計(jì)算機(jī)科學(xué),2014,41(2):68-71,98.

        A DYNAMIC-WEIGHTED HYBRID RECOMMENDATION ALGORITHM BASED ON USER BEHAVIOR CHARACTERISTICS

        Liu Peiwen Chen Huafeng

        (NationalEngineeringResearchCenterforMultimediaSoftware,WuhanUniversity,Wuhan430072,Hubei,China)(CollegeofComputer,WuhanUniversity,Wuhan430072,Hubei,China)

        A recommendation system can personalize website service for different users, and how to provide accurate recommendations has become the biggest difficulty. Aiming at the sparsity problem of traditional recommendation algorithm, dynamic-weighted hybrid recommendation algorithm based on user behavior characteristics is proposed. Through the data preprocessing in dataset, the personalized behavior characteristic index of different users for different items is calculated and introduced into the similarity calculation. The dynamic weight is calculated according to the difference of the user’s rate data sparseness, and the user’s content recommendation and collaborative filtering recommendation are dynamically mixed. Experimental results show that the proposed algorithm can reduce the recommendation error effectively and improve the recommendation accuracy in the sparse data set.

        User behavior characteristics Dynamic-weighted Hybrid recommendation algorithm

        2016-03-19。劉沛文,碩士生,主研領(lǐng)域:模式識(shí)別與智能系統(tǒng)。陳華鋒,博士生。

        TP301.6

        A

        10.3969/j.issn.1000-386x.2017.04.054

        猜你喜歡
        物品權(quán)重動(dòng)態(tài)
        國(guó)內(nèi)動(dòng)態(tài)
        稱(chēng)物品
        國(guó)內(nèi)動(dòng)態(tài)
        國(guó)內(nèi)動(dòng)態(tài)
        “雙十一”,你搶到了想要的物品嗎?
        權(quán)重常思“浮名輕”
        動(dòng)態(tài)
        誰(shuí)動(dòng)了凡·高的物品
        為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
        基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
        亚洲人成无码网www| 白丝美女扒开内露出内裤视频| 日韩精品有码中文字幕在线| 精品国产一区二区三区九一色| 丝袜美腿在线观看视频| 一区二区视频在线国产| 性色av一二三天美传媒| 日韩av无码中文无码电影| 亚洲av无码一区二区三区人| 天堂aⅴ无码一区二区三区| 亚洲精品无码av片| 亚洲一区二区免费日韩| 视频一区二区不中文字幕| 中文字幕亚洲中文第一| 手机免费高清在线观看av| 成人艳情一二三区| 性无码专区无码| 欧美日韩中文国产一区| 国产毛片A啊久久久久| 极品少妇在线观看视频| 一区二区三区日本视频| 成年美女黄网站色大免费视频| 国产播放隔着超薄丝袜进入| 丰满少妇三级全黄| 亚洲av无码片一区二区三区| 就国产av一区二区三区天堂| 国产自产在线视频一区| 黄色精品一区二区三区| 无码人妻品一区二区三区精99| 国产激情视频免费在线观看 | 国产精品美女久久久网站三级| 国产大屁股视频免费区| 2020年国产精品| 国产精品网站夜色| 无码AV午夜福利一区| 国产我不卡在线观看免费| 人妻少妇精品视频一区二区三区l| 欧美午夜理伦三级在线观看| 曰本大码熟中文字幕| 视频一区精品自拍| 色婷婷激情在线一区二区三区|