亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        結(jié)合用戶聚類與改進(jìn)用戶相似性的協(xié)同過濾推薦

        2020-11-18 09:15:04顧明星黃偉建張夢(mèng)甜
        關(guān)鍵詞:信任度相似性信任

        顧明星,黃偉建,黃 遠(yuǎn),生 龍,申 超,張夢(mèng)甜

        河北工程大學(xué) 信息與電氣工程學(xué)院,河北 邯鄲056038

        1 引言

        隨著互聯(lián)網(wǎng)和電子技術(shù)的快速發(fā)展,以用戶和商品為核心的信息生產(chǎn)模型使得網(wǎng)絡(luò)信息量呈現(xiàn)爆炸式增長(zhǎng),人類進(jìn)入了“信息過載”的時(shí)代。推薦算法作為解決“信息過載”的最有效手段之一,得到了廣泛的應(yīng)用[1-2]。但是隨著用戶和項(xiàng)目規(guī)模的擴(kuò)大,推薦算法面臨著嚴(yán)重的數(shù)據(jù)稀疏性問題[3]。以推薦系統(tǒng)在電子商務(wù)中的應(yīng)用為例,通常用戶購買的商品總量只占據(jù)網(wǎng)站商品總量的1%,并且用戶僅僅對(duì)其中的極少數(shù)項(xiàng)目進(jìn)行評(píng)分,用戶項(xiàng)目評(píng)分矩陣極其稀疏[4]。同時(shí),傳統(tǒng)的協(xié)同過濾算法在計(jì)算用戶間相似性時(shí)往往只強(qiáng)調(diào)用戶間的評(píng)分相似度,使得推薦算法在實(shí)際應(yīng)用中面臨著用戶相似性計(jì)算不準(zhǔn)確,商品推薦的實(shí)時(shí)性低的問題[5],嚴(yán)重影響了推薦算法預(yù)測(cè)準(zhǔn)確率。

        為了解決上述問題,國(guó)內(nèi)外的相關(guān)學(xué)者提出了多種改進(jìn)方案。首先為了解決數(shù)據(jù)矩陣的稀疏性問題,大量基于聚類的推薦算法被提出。文獻(xiàn)[6]采用譜聚類算法,利用譜聚類將興趣類似的用戶劃分為一簇,然后在簇內(nèi)為目標(biāo)用戶進(jìn)行項(xiàng)目推薦。文獻(xiàn)[7]首先采用Kmeans算法對(duì)用戶屬性特征進(jìn)行聚類,然后利用SlopeOne算法對(duì)矩陣進(jìn)行缺值填充,最后利用協(xié)同過濾思想進(jìn)行評(píng)分預(yù)測(cè)。文獻(xiàn)[8]采用吸引子傳播算法對(duì)用戶屬性進(jìn)行聚類,相比于一般聚類算法而言,該算法不需要提供聚類中心數(shù),因此聚類效果較好,但時(shí)間和內(nèi)存開銷過高。其次,為了改善推薦算法的預(yù)測(cè)準(zhǔn)確性和推薦物品的實(shí)時(shí)性,文獻(xiàn)[9]在傳統(tǒng)的皮爾遜相似度中引入懲罰因子和時(shí)間權(quán)重。文獻(xiàn)[10]先采用密度峰值聚類算法(Clustering by Fast search and find of Density Peaks,CFDP)對(duì)項(xiàng)目進(jìn)行聚類以降低數(shù)據(jù)稀疏性,然后在計(jì)算項(xiàng)目評(píng)分時(shí)引入時(shí)間權(quán)重,降低了用戶的興趣動(dòng)態(tài)變化的影響。文獻(xiàn)[11]引入了社交網(wǎng)絡(luò)中的用戶信任關(guān)系,將傳統(tǒng)的用戶評(píng)分相似度與用戶信任度進(jìn)行融合,從而獲得更加精確的用戶相似度計(jì)算方式。

        上述算法雖然在一定程度上提高了預(yù)測(cè)準(zhǔn)確性,但對(duì)用戶信息的挖掘仍然不夠充分。因此本文提出了一種結(jié)合用戶屬性聚類與改進(jìn)用戶相似性的協(xié)同過濾推薦算法。算法首先利用K-means++算法對(duì)用戶屬性進(jìn)行聚類,從而獲得目標(biāo)用戶所在的評(píng)分矩陣;其次對(duì)用戶的評(píng)分相似性引入時(shí)間因素,以增大用戶最近行為項(xiàng)目的協(xié)同推薦能力;然后引入用戶信任誤差,計(jì)算改進(jìn)后的用戶直接信任度和間接信任度;最后將基于時(shí)間因素的用戶評(píng)分相似性和改進(jìn)的用戶信任度合理地結(jié)合,從而改善用戶間的相似性。通過改進(jìn)后的用戶相似性公式,利用協(xié)同過濾思想對(duì)目標(biāo)用戶未評(píng)分項(xiàng)目進(jìn)行預(yù)測(cè)評(píng)分,產(chǎn)生推薦列表。

        2 傳統(tǒng)的協(xié)同過濾算法

        傳統(tǒng)的協(xié)同過濾算法基本步驟是:首先利用已有的用戶歷史行為數(shù)據(jù)信息,構(gòu)建用戶-項(xiàng)目評(píng)分矩陣;然后計(jì)算用戶之間的相似度并選取相似度較高的用戶作為目標(biāo)用戶的近鄰集;最終在進(jìn)行評(píng)分預(yù)測(cè)后按照Top-N原則對(duì)用戶進(jìn)行推薦[12]。該算法的流程如圖1所示。

        圖1 Item_CF算法流程圖

        2.1 構(gòu)建用戶-項(xiàng)目評(píng)分矩陣

        本文構(gòu)建用戶-項(xiàng)目評(píng)分矩陣Cm×n,users:{u1,u2,…,um}表示擁有m 個(gè)用戶的集合;items:{i1,i2,…,in}表示擁有n 個(gè)項(xiàng)目的集合;cij表示用戶i 對(duì)項(xiàng)目j 的實(shí)際評(píng)分,若用戶i 對(duì)項(xiàng)目j 未評(píng)分,則cij記0。評(píng)分矩陣C如下:

        2.2 用戶評(píng)分相似性的計(jì)算

        用戶評(píng)分相似性的計(jì)算是以用戶-評(píng)分矩陣為基礎(chǔ)的,將評(píng)分矩陣中的每一行作為用戶的評(píng)分向量來表示用戶的實(shí)際興趣。因此,計(jì)算用戶評(píng)分相似性的本質(zhì)就是計(jì)算用戶評(píng)分向量之間的距離。傳統(tǒng)的協(xié)同過濾算法中,計(jì)算相似度的方式有很多,主要包括余弦相似度、修正余弦相似度和皮爾遜相關(guān)系數(shù)[13]。本文采用最為常用且效果更好的皮爾遜相關(guān)系數(shù)作為用戶間相似度計(jì)算公式[14],如式(1)所示。

        其中,sim(a,b)表示用戶a 與b 的相似度,I 表示用戶a與用戶b 評(píng)分項(xiàng)目的交集,分別表示用戶a 與b的平均評(píng)分。

        2.3 預(yù)測(cè)評(píng)分

        在獲得用戶a 與所有用戶的相似度后,將相似度最高的前h 個(gè)用戶作為其近鄰集,并根據(jù)式(2)對(duì)a 未評(píng)分的項(xiàng)目預(yù)測(cè)評(píng)分。

        其中,pa,i表示用戶a 對(duì)項(xiàng)目i 的預(yù)測(cè)評(píng)分,G 表示用戶a 的近鄰集。

        3 本文算法

        3.1 基于K-means++的用戶屬性聚類

        為了降低用戶評(píng)分矩陣的稀疏性,本文首先對(duì)用戶屬性進(jìn)行聚類分析,將屬性相似的用戶劃分到同一簇內(nèi)。K-means++算法是一種基于質(zhì)心的聚類算法,是在K-means算法的基礎(chǔ)上優(yōu)化了初始質(zhì)心的選擇方式,使初始質(zhì)心相互間距離盡可能得遠(yuǎn)[15]。 K-means++算法具有算法高效率、易實(shí)現(xiàn)、適合挖掘大規(guī)模數(shù)據(jù)集的特點(diǎn)[16],因此本文選取K-means++算法作為聚類手段。

        在對(duì)用戶屬性進(jìn)行K-means++聚類前,首先需要對(duì)用戶的屬性信息進(jìn)行預(yù)處理,過程如下。

        步驟1 從數(shù)據(jù)集中獲取用戶的屬性信息:UserAttr={age,sex,job}。

        步驟2 對(duì)非數(shù)值的離散型數(shù)據(jù)進(jìn)行編碼,將文本特征進(jìn)行數(shù)值化。在用戶屬性中,根據(jù)埃里克森八階段理論[17],將年齡劃分為以下4個(gè)年齡段(數(shù)據(jù)集中用戶年齡最小為15歲):“15~18歲”編碼為“1”,“19~40歲”編碼為“2”,“41~65 歲”編碼為“3”,“66 歲以上”編碼為“4”;性別為“F”和“M”,編碼為“0”和“1”;職業(yè)屬性一共包含21種類別,因此構(gòu)建長(zhǎng)度為5的“01”編碼串(21 <25),并按照職業(yè)出現(xiàn)的順序進(jìn)行編碼。例如在本文選用的數(shù)據(jù)集中,首先出現(xiàn)“technician”職業(yè),則該職業(yè)編碼為“00001”,其次出現(xiàn)為“writer”,則該職業(yè)編碼為“00010”,然后出現(xiàn)“executive”,則該職業(yè)編碼為“00011”,其余職業(yè)的編碼以此類推。最后對(duì)用戶的屬性編碼進(jìn)行拼接。例如:用戶屬性為“age=42||sex=M||job=executive”,則該用戶的屬性編碼串為“3100011”。

        步驟3 對(duì)用戶屬性編碼進(jìn)行Embedding。Embedding通過將原稀疏向量與固定轉(zhuǎn)換矩陣做內(nèi)積變化,從而將高維稀疏特征向量向低維稠密特征向量轉(zhuǎn)換。

        步驟4 對(duì)用戶屬性進(jìn)行預(yù)測(cè)處理后,最后得到用戶屬性矩陣p。

        算法1 K-means++聚類算法

        輸入:用戶屬性矩陣p,聚類數(shù)目k。

        輸出:k 個(gè)聚類。

        步驟1 隨機(jī)選取一個(gè)樣本作為初始質(zhì)心center1;

        步驟2 選取p 中的每一個(gè)樣本點(diǎn)dx,計(jì)算該點(diǎn)與當(dāng)前最近一個(gè)質(zhì)心的距離dist(dx);

        步驟3 利用式(3)計(jì)算每一個(gè)樣本點(diǎn)dx作為下一個(gè)質(zhì)心的概率:

        步驟4 將概率最高的點(diǎn),作為下一個(gè)聚類質(zhì)心點(diǎn)centeri;

        步驟5 重復(fù)步驟2~步驟4直至找到預(yù)設(shè)的k 個(gè)質(zhì)心;

        步驟6 得到k 個(gè)用戶簇并輸出。

        采用K-means++算法對(duì)用戶屬性進(jìn)行聚類后,將目標(biāo)用戶所在的用戶簇對(duì)應(yīng)至用戶評(píng)分矩陣,從而得到縮小規(guī)模的用戶-項(xiàng)目評(píng)分矩陣。如果不經(jīng)過該預(yù)處理,則評(píng)分?jǐn)?shù)據(jù)會(huì)占用較大的內(nèi)存,且嚴(yán)重降低協(xié)同推薦算法的執(zhí)行效率和推薦準(zhǔn)確性。

        3.2 時(shí)間因素

        傳統(tǒng)的協(xié)同過濾算法計(jì)算用戶間的相似度時(shí)僅僅考慮用戶對(duì)項(xiàng)目的歷史評(píng)分記錄,忽略了用戶對(duì)項(xiàng)目興趣的動(dòng)態(tài)變化,在當(dāng)前各類的用戶行為數(shù)據(jù)集中,用戶行為的時(shí)間通常是被系統(tǒng)準(zhǔn)確記錄的,因此可以考慮用戶對(duì)某一項(xiàng)目的興趣程度會(huì)受到時(shí)間因素的影響。一般而言,用戶最近訪問的項(xiàng)目往往更能準(zhǔn)確反映用戶當(dāng)前的興趣特征。因此本文引入時(shí)間因素增大用戶最近訪問商品的協(xié)同推薦能力,相關(guān)定義如下。

        定義1 Tfirst:用戶第一次對(duì)商品進(jìn)行評(píng)分的時(shí)間。

        定義2 Ti:用戶對(duì)商品i 進(jìn)行評(píng)分的時(shí)間。

        定義3 Tall:用戶使用該系統(tǒng)的總時(shí)長(zhǎng)。

        根據(jù)分析,用戶對(duì)某一項(xiàng)目的興趣會(huì)隨著時(shí)間的推移逐漸弱化,并趨于一個(gè)穩(wěn)定值,即用戶興趣與時(shí)間呈現(xiàn)非線性負(fù)相關(guān)關(guān)系,這與心理學(xué)家艾賓浩斯發(fā)現(xiàn)的遺忘規(guī)律相似[18],因此本文采用遺忘規(guī)律來量化時(shí)間因素,則用戶u 對(duì)項(xiàng)目i 的時(shí)間因素權(quán)值的計(jì)算公式如下所示:

        然后將時(shí)間權(quán)重與皮爾遜相似度計(jì)算公式結(jié)合,公式如下所示:

        3.3 改進(jìn)用戶信任度

        傳統(tǒng)的用戶間信任關(guān)系中,用戶a 信任用戶b,則用戶b 也會(huì)信任用戶a,并且雙方的信任值是相同的。但結(jié)合實(shí)際,用戶a 與用戶b 之間的信任是不一定對(duì)等的。因?yàn)閮烧叩脑u(píng)分項(xiàng)目的數(shù)量不一定相同,用戶的評(píng)分尺度也不一定相同[19]。

        3.3.1 直接信任度的計(jì)算

        直接信任度是目標(biāo)用戶與其他用戶的直接信任關(guān)系,對(duì)于用戶a 與用戶b,用戶a 對(duì)用戶b 的直接信任度可由下列公式計(jì)算。

        其中,DTrust(a,b)表示用戶a 對(duì)用戶b 的直接信任度值。但是用戶之間的信任度僅從用戶共同評(píng)分項(xiàng)目的數(shù)量上來判斷是不準(zhǔn)確的,如表1所示。

        表1 極端評(píng)分?jǐn)?shù)據(jù)

        由式(6)可得DTrust(a,b)=1,即用戶a 與用戶b 是極其信任的。但實(shí)際情況是,用戶a 對(duì)列舉的4種物品評(píng)價(jià)極高,用戶b 則極低。說明單從用戶間共同評(píng)分項(xiàng)目的數(shù)量上計(jì)算用戶間的相似度是不準(zhǔn)確的。

        為了緩解用戶間對(duì)物品的實(shí)際評(píng)分存在的差異對(duì)用戶信任度的影響,本文定義信任誤差值,公式如下所示:

        其次,根據(jù)信任誤差值定義用戶交互響應(yīng)因子數(shù),公式如下所示:

        其中,t 表示正響應(yīng)因子數(shù),記錄用戶a 與用戶b 間的評(píng)分差異較小的次數(shù);f 表示負(fù)響應(yīng)因子數(shù),記錄兩者評(píng)分差異較大的次數(shù)。若兩者評(píng)分差異小,則t+1 →t,反之f+1 →f 。

        用戶間的信任是隨著正負(fù)響應(yīng)因子數(shù)呈非線性變化的量,用戶間正響應(yīng)因子數(shù)越多,相互信任程度越高,反之越低。因此,可以利用Logistic 函數(shù)將正負(fù)響應(yīng)因子數(shù)進(jìn)行恰當(dāng)融合。Logistic函數(shù)是一種”S”形函數(shù),在區(qū)間(0,1)變化,能充分抑制兩端的值,且對(duì)中間值變化敏感[20-21],公式如下所示:

        則改進(jìn)的直接用戶信任度公式如下:

        根據(jù)式(10)可以得出,用戶間信任度隨著正響應(yīng)因子數(shù)的增加而提高,隨著負(fù)響應(yīng)因子數(shù)的增加而降低。

        3.3.2 間接信任度的計(jì)算

        若用戶a 與用戶c 共同評(píng)分的項(xiàng)目交集為空集,則用戶a 與用戶c 之間不存在用戶直接信任度,此時(shí)可以采用信任傳遞的方式獲取兩位用戶的間接信任度:假設(shè)至少存在一個(gè)中間用戶群user={ub,ud,ue,…,uv},使得用戶a 與用戶ub存在直接信任關(guān)系,用戶群user 中相鄰的用戶存在直接信任關(guān)系,用戶uv與用戶c 存在直接信任關(guān)系,則可以推論出用戶a 與用戶c 之間存在間接信任度[22]。在計(jì)算用戶間的間接信任度時(shí),若存在多個(gè)用戶群,則選取傳遞人數(shù)最少的中間用戶群來計(jì)算間接信任度。用戶間接信任度計(jì)算公式如下所示:

        其中,| user|表示傳播路徑最短的中間用戶群的人數(shù)。

        同時(shí),根據(jù)“六度區(qū)隔”理論[23],設(shè)定| user|+1 ≤6,若大于6則PTrust*(a,c)=0。

        綜合了用戶直接信任與用戶間接信任,則用戶間的最終信任表達(dá)公式如式(12)所示:

        3.4 改進(jìn)的用戶相關(guān)性

        在利用式(5)獲得基于時(shí)間因素的用戶評(píng)分相似度與式(12)獲得改進(jìn)的用戶信任度后,本文將兩種影響推薦效果的因素相結(jié)合,得到最終的用戶間的相關(guān)性,公式如下:

        當(dāng)用戶間的評(píng)分相似度為0時(shí),則利用信任度表示用戶間相關(guān)性;當(dāng)用戶間沒有信任度時(shí),則用戶間不存在相關(guān)性;當(dāng)兩種因素均不為0 時(shí),則用戶間的相關(guān)性會(huì)隨著兩種因素的增加而提高。

        最后預(yù)測(cè)出用戶對(duì)項(xiàng)目的評(píng)分,公式如下所示:

        其中,G*表示與用戶a 相關(guān)性最高的前h 個(gè)近鄰用戶。

        3.5 本文算法流程

        算法2 結(jié)合用戶屬性聚類與改進(jìn)用戶相似性的協(xié)同過濾算法

        輸入:目標(biāo)用戶a,用戶-用戶評(píng)分矩陣C,用戶評(píng)分時(shí)間信息T 。

        輸出:目標(biāo)用戶a 的推薦列表。

        步驟1 利用算法1 的K -means++聚類算法獲得目標(biāo)用戶a 所在的用戶-用戶屬性簇S,并對(duì)應(yīng)到相應(yīng)的用戶-評(píng)分矩陣中得到簇S′。

        步驟2 在簇S′中,遍歷除了用戶a 外的用戶,利用式(5)計(jì)算與用戶a 的相似度。

        步驟3 在簇S′中,遍歷除了用戶a 外的用戶,利用式(12)計(jì)算與用戶a 的信任度。

        步驟4 在計(jì)算出其他用戶與用戶a 的相似度與信任度后,利用式(13)計(jì)算與用戶a 的相關(guān)性。

        步驟5 將與用戶a 相關(guān)性最高的前h 個(gè)用戶作為a 的近鄰集。

        步驟6 在用戶a 的近鄰集內(nèi),利用式(14)預(yù)測(cè)目標(biāo)用戶a 對(duì)未評(píng)分項(xiàng)目的評(píng)分。

        步驟7 將預(yù)測(cè)評(píng)分最高的項(xiàng)目由高到低排序,并將前Top-N 個(gè)項(xiàng)目作為目標(biāo)用戶a 的推薦項(xiàng)目集。

        4 實(shí)驗(yàn)與討論

        4.1 數(shù)據(jù)集

        本文選取MovieLens ml-100K 電影數(shù)據(jù)集[24],該數(shù)據(jù)集由明尼蘇達(dá)大學(xué)GroupLens學(xué)習(xí)組發(fā)布,用戶評(píng)分?jǐn)?shù)據(jù)集中包含943名用戶對(duì)1 682部電影的共約10萬條記錄,其中包括用戶ID、電影ID、用戶對(duì)項(xiàng)目的評(píng)分以及相應(yīng)評(píng)分的時(shí)間。用戶的評(píng)分區(qū)間為[1,5],評(píng)分越高,則評(píng)價(jià)越高。用戶屬性數(shù)據(jù)集包括用戶的ID、年齡、性別、職業(yè)。本文采用五折交叉實(shí)驗(yàn)法,將80%的數(shù)據(jù)用作訓(xùn)練樣本,20%的數(shù)據(jù)用作測(cè)試樣本。

        4.2 評(píng)價(jià)指標(biāo)

        本文采用推薦算法實(shí)驗(yàn)中最為廣泛的評(píng)價(jià)準(zhǔn)則——平均絕對(duì)誤差(Mean Absolute Error,MAE)作為實(shí)驗(yàn)的評(píng)分預(yù)測(cè)指標(biāo)[25],公式如下:

        4.3 實(shí)驗(yàn)結(jié)果與分析

        為了獲取最佳聚類數(shù)k,將目標(biāo)用戶的近鄰數(shù)從20變化到90,間隔為10。根據(jù)文獻(xiàn)[7]和文獻(xiàn)[26]的研究情況,本文將用戶劃分為k=5,6,7,8,9 個(gè)聚類,然后在對(duì)應(yīng)不同的聚類數(shù)下計(jì)算不同用戶近鄰數(shù)下的MAE 值,重復(fù)實(shí)驗(yàn)10 次,并取其結(jié)果的平均值作為最終結(jié)果。實(shí)驗(yàn)結(jié)果如圖2所示。

        圖2 不同聚類數(shù)下本文算法的MAE對(duì)比圖

        通過圖2 可以得出,當(dāng)聚類數(shù)目k=7 時(shí),本文算法的推薦準(zhǔn)確性更高。因此,本文實(shí)驗(yàn)聚類簇設(shè)定為7,聚類后每個(gè)簇中用戶的數(shù)量如表2所示。

        表2 不同類中的用戶量

        同時(shí)為了驗(yàn)證不同聚類數(shù)k 下K-means++算法的實(shí)際聚類效果,本文采用輪廓系數(shù)[27]作為評(píng)價(jià)聚類質(zhì)量的標(biāo)準(zhǔn)。不同聚類數(shù)k 下的輪廓系數(shù)值如表3所示。

        表3 不同聚類數(shù)下的輪廓系數(shù)

        由表3可知,當(dāng)聚類數(shù)k 為7時(shí),K-means++算法的輪廓系數(shù)最高,即聚類效果最佳。

        在確定了用戶聚類數(shù)為7后,對(duì)用戶相似性的分布進(jìn)行實(shí)驗(yàn)。本文分別將皮爾遜相關(guān)系數(shù)與改進(jìn)的用戶相關(guān)性作為協(xié)同過濾推薦算法的相似度計(jì)算公式,實(shí)驗(yàn)統(tǒng)計(jì)了這兩種方法得到不同相似度出現(xiàn)的次數(shù),分布如圖3所示。

        圖3 不同公式對(duì)應(yīng)的用戶相似性分布

        通過圖3可以看出,本文改進(jìn)的用戶相關(guān)性得到的相似性分布曲線沒有皮爾遜相關(guān)性得到的分布曲線平穩(wěn)和均勻,說明本文的相關(guān)性得到的用戶相似性更具有個(gè)性化。在相似度[0.1,1.0]的范圍內(nèi),皮爾遜相關(guān)系數(shù)得到相似度分布在[0.2,0.6]的次數(shù)占比69.8%,而本文改進(jìn)的用戶相關(guān)性僅占比63.5%。因?yàn)楦倪M(jìn)的用戶相關(guān)性通過增加用戶的評(píng)分時(shí)間信息和用戶信任度,降低了用戶評(píng)分尺度和評(píng)分時(shí)間的差異對(duì)用戶相似性的影響。

        為了驗(yàn)證本文提出的算法能有效提高協(xié)同過濾算法的推薦質(zhì)量,本文選取傳統(tǒng)的基于用戶的協(xié)同過濾算法(User-CF)、文獻(xiàn)[7]提出的CFUI-CF算法、文獻(xiàn)[10]提出的CFDP-CF算法、文獻(xiàn)[11]提出的UTLDA-CF算法作為對(duì)比算法,僅結(jié)合時(shí)間因素的本文算法以及僅結(jié)合改進(jìn)用戶信任的本文算法對(duì)比結(jié)果如圖4所示。

        圖4 不同算法的MAE值對(duì)比

        通過圖4可以看出,所有算法的MAE 值,均隨著目標(biāo)用戶近鄰數(shù)的增加而逐漸減少,直到趨于平緩。首先通過觀察可以發(fā)現(xiàn),僅結(jié)合時(shí)間因素的本文算法和僅結(jié)合改進(jìn)用戶信任的本文算法能有效改善推薦算法的預(yù)測(cè)效果,分別比User-CF 的準(zhǔn)確率高1.2%和2.9%,但預(yù)測(cè)效果不如將兩者結(jié)合的本文算法。在實(shí)驗(yàn)范圍內(nèi)的用戶近鄰數(shù)下,本文提出的算法能夠提高User-CF的準(zhǔn)確率達(dá)5.6%,且分別比CFDP-CF、CFUI-CF、UTLDA-CF、僅結(jié)合時(shí)間因素的本文算法和僅結(jié)合改進(jìn)用戶信任的本文算法的MAE 值低0.6%、1.4%、3.1%、4.6%和3.1%,說明本文算法能有效提高推薦系統(tǒng)預(yù)測(cè)質(zhì)量。

        5 結(jié)束語

        本文提出了結(jié)合用戶屬性聚類與改進(jìn)用戶相似性的協(xié)同過濾算法。首先利用K-means++對(duì)用戶特征信息進(jìn)行聚類,其次對(duì)皮爾遜相關(guān)系數(shù)引入用戶對(duì)項(xiàng)目的評(píng)分時(shí)間信息,然后改進(jìn)用戶之間的信任關(guān)系,最后將引入時(shí)間信息的皮爾遜相關(guān)系數(shù)與改進(jìn)的用戶信任關(guān)系進(jìn)行結(jié)合,最終得到改進(jìn)的用戶相關(guān)性。實(shí)驗(yàn)表明,本文提出的算法能有效提高推薦算法的預(yù)測(cè)準(zhǔn)確性,且有一定的實(shí)際意義。

        猜你喜歡
        信任度相似性信任
        一類上三角算子矩陣的相似性與酉相似性
        淺析當(dāng)代中西方繪畫的相似性
        表示信任
        全球民調(diào):中國(guó)民眾對(duì)政府信任度最高
        嚶嚶嚶,人與人的信任在哪里……
        桃之夭夭B(2017年2期)2017-02-24 17:32:43
        從生到死有多遠(yuǎn)
        低滲透黏土中氯離子彌散作用離心模擬相似性
        基于信任度評(píng)估的移動(dòng)自組織網(wǎng)絡(luò)路由協(xié)議
        信任
        2014,如何獲得信任
        国产超碰人人模人人爽人人喊| 亚洲av永久无码一区| 最新国产精品国产三级国产av| 久久国产人妻一区二区| 国产呦系列视频网站在线观看 | 欧洲熟妇乱xxxxx大屁股7| 蜜桃视频在线观看免费亚洲| AV人人操| 少妇高潮流白浆在线观看| 国内精品女同一区二区三区| 中文字幕影片免费在线观看| 国产精品国产三级国产a| 国产精品一区二区午夜久久| 最近日本免费观看高清视频| 区一区二区三区四视频在线观看 | 99在线精品视频在线观看| 国产精品av免费网站| 亚洲av无码乱码国产精品fc2| 色呦呦九九七七国产精品| 伊人色综合九久久天天蜜桃| 久久人人爽天天玩人人妻精品| 亚洲av日韩av女同同性| 亚洲日本国产乱码va在线观看 | 婷婷色精品一区二区激情| 久久99精品中文字幕在| 欧美精品videossex少妇| 国产实拍日韩精品av在线| 亚洲国产日韩欧美高清片a| 国产精品无码a∨精品影院| 精品亚洲一区二区三区四区五 | 淫片一区二区三区av| 日本护士一区二区三区高清热线| 最近中文字幕在线mv视频在线 | 欧美拍拍视频免费大全| 国产精品久久久精品三级18| 亚洲av之男人的天堂| 色视频综合无码一区二区三区| 91熟女av一区二区在线| 狠狠综合亚洲综合亚色| 精品四虎免费观看国产高清| 在线欧美中文字幕农村电影|