亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        修正評(píng)分的協(xié)同過(guò)濾算法

        2020-01-14 09:51:36賈俊杰余欽科
        關(guān)鍵詞:修正權(quán)重聚類(lèi)

        賈俊杰,余欽科

        1(西北師范大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,蘭州 730070)2(西北師范大學(xué),蘭州 730070)

        1 引 言

        隨著互聯(lián)網(wǎng)行業(yè)邁入大數(shù)據(jù)時(shí)代,網(wǎng)絡(luò)為人們提供了海量的信息資源,極大程度地滿(mǎn)足了用戶(hù)對(duì)各類(lèi)信息的需求.帶來(lái)巨大便利的同時(shí),網(wǎng)絡(luò)信息過(guò)載問(wèn)題也變得日益突出,用戶(hù)在海量信息中找到自身所需信息的需求變得更為迫切.

        在這樣的背景下,信息推薦技術(shù)[1]作為信息過(guò)濾的有效手段,逐漸成為計(jì)算機(jī)學(xué)術(shù)和應(yīng)用領(lǐng)域的熱門(mén)研究對(duì)象,在互聯(lián)網(wǎng)系統(tǒng)中被廣泛地使用.推薦系統(tǒng)針對(duì)在用戶(hù)沒(méi)有明確的需求場(chǎng)景的情況下,通過(guò)采集用戶(hù)歷史信息和商品的特性,分析其中的關(guān)聯(lián)特性,推測(cè)用戶(hù)對(duì)潛在物品的個(gè)性化偏好情況,進(jìn)而向用戶(hù)推薦最優(yōu)選擇,幫助用戶(hù)選擇所需要的商品,在極大方便網(wǎng)站用戶(hù)的同時(shí),也有效提高了網(wǎng)站的運(yùn)營(yíng)效果和服務(wù)質(zhì)量.

        在眾多推薦技術(shù)中,協(xié)同過(guò)濾算法[2]是當(dāng)前應(yīng)用較為成熟的一項(xiàng)技術(shù).協(xié)同過(guò)濾算法認(rèn)為有近似選擇偏好的用戶(hù)一般可能會(huì)喜歡相同的物品,具體可以分為基于用戶(hù)的、基于項(xiàng)目的、基于模型的三類(lèi)協(xié)同過(guò)濾算法[3].協(xié)同過(guò)濾算法的優(yōu)點(diǎn)首先是能夠過(guò)濾那些表達(dá)復(fù)雜的描述型內(nèi)容,從而解決了難以進(jìn)行自動(dòng)內(nèi)容分析信息過(guò)濾問(wèn)題,另外還具有推薦新信息的功能.然而,協(xié)同過(guò)濾算法在數(shù)據(jù)量不斷增大的情況下也有其問(wèn)題和局限性,典型的就是評(píng)分矩陣稀疏性問(wèn)題和冷啟動(dòng)問(wèn)題[4]圍繞這些問(wèn)題,近年來(lái)學(xué)術(shù)界進(jìn)行不斷深入研究,提出了很多有效的改進(jìn)方案.

        本文為提高個(gè)性化推薦算法推薦過(guò)程的推薦精度以及改良協(xié)同過(guò)濾推薦算法矩陣稀疏性問(wèn)題,選擇用戶(hù)聚類(lèi)解決矩陣稀疏性問(wèn)題.為了提高個(gè)性化推薦質(zhì)量的目的下.本文算法先計(jì)算出聚類(lèi)組中目標(biāo)用戶(hù)和其他用戶(hù)之間的皮爾斯相關(guān)系數(shù)[1],設(shè)定閾值過(guò)濾掉弱相關(guān)的記錄生成推薦組.當(dāng)推薦組中用戶(hù)再次發(fā)生購(gòu)買(mǎi)行為,算法計(jì)算推薦組中目標(biāo)用戶(hù)與其他用戶(hù)加權(quán)評(píng)分及置信度,用修正評(píng)分衡量推薦結(jié)果.經(jīng)過(guò)實(shí)驗(yàn),結(jié)果表明該方法可以提高推薦的精確度.

        2 協(xié)同過(guò)濾算法

        協(xié)同過(guò)濾算法根據(jù)用戶(hù)-項(xiàng)目評(píng)分矩陣中已有的購(gòu)買(mǎi)權(quán)重,利用用戶(hù)間或項(xiàng)目間的相關(guān)關(guān)系預(yù)測(cè)評(píng)分矩陣中缺失的評(píng)分,然后根據(jù)評(píng)分的高低衡量用戶(hù)對(duì)項(xiàng)目的偏好程度.其中最近鄰查詢(xún)的協(xié)同過(guò)濾算法是最基礎(chǔ)部分,聚類(lèi)查詢(xún)是在最近鄰查詢(xún)的基礎(chǔ)上采用聚類(lèi)尋找最近鄰來(lái)達(dá)到降低搜索空間,下面介紹最近鄰查詢(xún)和聚類(lèi)查詢(xún).

        假設(shè)推薦系統(tǒng)中有m個(gè)用戶(hù),用戶(hù)集合表示U{u1,u2,u3,…,um},購(gòu)買(mǎi)商品集合表示為I{i1,i2,i3,…,in},用戶(hù)—商品之間的權(quán)重矩陣為rm*n,rij(i

        表1 用戶(hù)-商品權(quán)重矩陣Table 1 User-commodity weight matrix

        2.1 最近鄰查詢(xún)

        基于鄰近關(guān)系的協(xié)同過(guò)濾推薦算法可分為基于用戶(hù)的協(xié)同過(guò)濾(User-based CF,UCF)算法和基于項(xiàng)目的協(xié)同過(guò)濾(Item-based CF,ICF)算法[5].前者的基本思想是,從用戶(hù)的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,相似的用戶(hù)有相似的行為偏好,因此向目標(biāo)用戶(hù)推薦項(xiàng)目時(shí),UCF算法查找與目標(biāo)用戶(hù)最相似的用戶(hù)集,根據(jù)不同行為反映用戶(hù)喜好的程度將它們進(jìn)行加權(quán),得到用戶(hù)對(duì)于物品的總體喜好.為預(yù)測(cè)目標(biāo)用戶(hù)的偏好程度,首先要找到用戶(hù)的相似鄰居集,計(jì)算用戶(hù)間相似度是協(xié)同過(guò)濾算法的關(guān)鍵.常用的相似性度量方法有余弦相似度[6]、Pearson 相關(guān)系數(shù)[7]和修正的余弦相似度[8].由于余弦相似度忽略了不同用戶(hù)之間的不同評(píng)分標(biāo)準(zhǔn),學(xué)者們又提出了修正的余弦相似度計(jì)算方法,將用戶(hù)評(píng)分減去該用戶(hù)的平均評(píng)分之后,再進(jìn)行相似度的計(jì)算,計(jì)算方法如公式(1):

        (1)

        再通過(guò)相似度計(jì)算得到目標(biāo)用戶(hù)的最近鄰居集NN,通過(guò)公式(2)預(yù)測(cè)用戶(hù)u對(duì)商品Ii的加權(quán)評(píng)分pu,i.

        (2)

        根據(jù)上述方法預(yù)測(cè)目標(biāo)用戶(hù)u對(duì)未評(píng)分項(xiàng)目的評(píng)分,并選取評(píng)分的前N個(gè)項(xiàng)目,將其推薦給目標(biāo)用戶(hù)u.

        2.2 聚類(lèi)查詢(xún)

        傳統(tǒng)基于鄰近關(guān)系的協(xié)同算法在進(jìn)行推薦時(shí),在所有用戶(hù)中查找與目標(biāo)用戶(hù)最相似的 k 個(gè)用戶(hù),算法的推薦效率隨著系統(tǒng)用戶(hù)數(shù)量的增加而降低,時(shí)間復(fù)雜度隨之升高.為此Sarwar等人提出基于用戶(hù)聚類(lèi)的協(xié)同過(guò)濾算法[9],算法將推薦系統(tǒng)的中的所有用戶(hù)劃分為多個(gè)不相交的集合{Ui|∪Ui=U;∩=Ui=φ;i=1,2,…,l} 使得每個(gè)集合內(nèi)用戶(hù)的關(guān)聯(lián)相似度盡可能高,而集合間的用戶(hù)的相似度盡可能低.僅需在目標(biāo)用戶(hù)所屬的集合中采用基于用戶(hù)的協(xié)同過(guò)濾算法進(jìn)行推薦,此舉縮小了用戶(hù)的查找范圍,提高了推薦系統(tǒng)的效率,時(shí)間復(fù)雜度降低.

        2.3 傳統(tǒng)算法不足分析

        1)在用戶(hù)數(shù)據(jù)量增大時(shí),基于最近鄰查詢(xún)搜索空間巨大,時(shí)間復(fù)雜度增加,矩陣稀疏,影響推薦精度.

        2)聚類(lèi)查詢(xún)降低了最近鄰查詢(xún)的時(shí)間復(fù)雜度,但同樣遺留了推薦精度不足問(wèn)題,傳統(tǒng)算法考慮了用戶(hù)與用戶(hù)之間的關(guān)聯(lián),卻忽略商品與商品關(guān)聯(lián),加權(quán)評(píng)分只考慮用戶(hù)與用戶(hù)間關(guān)聯(lián),導(dǎo)致推薦精度不夠.

        3)為保證推薦精度,推薦算法應(yīng)考慮商品與商品的關(guān)聯(lián),本文引入關(guān)聯(lián)規(guī)則中置信度概念.采用修正評(píng)分衡量推薦結(jié)果.

        3 修正評(píng)分的協(xié)同過(guò)濾算法

        為解決傳統(tǒng)推薦算法矩陣稀疏、推薦精度不足、用戶(hù)異常值問(wèn)題,本文提出結(jié)合聚類(lèi)和關(guān)聯(lián)規(guī)則協(xié)同過(guò)濾算法,采用修正評(píng)分代替加權(quán)評(píng)分衡量推薦結(jié)果.本文算法將用戶(hù)-商品購(gòu)買(mǎi)記錄的商品權(quán)重作為原始數(shù)據(jù),把整個(gè)推薦過(guò)程分為以下幾個(gè)步驟:

        1)數(shù)據(jù)預(yù)處理:對(duì)用戶(hù)的商品數(shù)據(jù)字符重編碼,并對(duì)應(yīng)用戶(hù)的商品權(quán)重.

        2)用戶(hù)聚類(lèi):利用k-means聚類(lèi)對(duì)用戶(hù)購(gòu)買(mǎi)行為數(shù)據(jù)進(jìn)行聚類(lèi),得到用戶(hù)聚類(lèi)組.

        表2 預(yù)處理后的數(shù)據(jù)
        Table 2 Preprocessed data

        用戶(hù)品牌分類(lèi)權(quán)重系數(shù)u1a1b2c4542u2a3b1c9321u3a3b1c9112u4a1b2c4515u5a7b5c6355u6a3b1c9314u7a1b2c4313u8a1b2c4241u9a7b5c6142u10a7b5c6453u11a1b2c4552u12a3b1c9345u13a3b1c9541u14a7b5c6122u15a1b2c4524

        3)協(xié)同過(guò)濾,計(jì)算聚類(lèi)組中目標(biāo)用戶(hù)和其他用戶(hù)之間的相關(guān)系數(shù),構(gòu)建推薦組.

        4)考慮商品—商品的關(guān)聯(lián),推薦組中計(jì)算目標(biāo)用戶(hù)對(duì)商品的加權(quán)評(píng)分以及商品—商品的置信度,用新的衡量指標(biāo):修正評(píng)分,對(duì)商品進(jìn)行推薦.

        5)產(chǎn)生推薦結(jié)果:對(duì)商品修正評(píng)分降序排列推薦給目標(biāo)用戶(hù).

        3.1 數(shù)據(jù)預(yù)處理

        用戶(hù)-商品數(shù)據(jù)按字符格式重編碼,字母u組合不同數(shù)字表示不同用戶(hù).字母a、b、c表示商品不同類(lèi)別,組合不同數(shù)字表示該類(lèi)別下不同商品,預(yù)處理后數(shù)據(jù)如表2所示.

        3.2 聚類(lèi)

        對(duì)用戶(hù)-商品數(shù)據(jù)進(jìn)行k-means[2]多維聚類(lèi),將用戶(hù)分為不同的聚類(lèi)組.表3為聚類(lèi)后的數(shù)據(jù)集,預(yù)處理后的數(shù)據(jù)聚類(lèi)為3個(gè)組,品牌分類(lèi)有3列表示3個(gè)維度用a、b、c表示.聚類(lèi)組如表3所示.

        表3 用戶(hù)聚類(lèi)組
        Table 3 U ser cluster group

        聚類(lèi)組1用戶(hù)品牌分類(lèi)權(quán)重系數(shù)u1a1b2c4542u4a1b2c4515u7a1b2c4313u8a1b2c4241u11a1b2c4552u15a1b2c4524聚類(lèi)組2用戶(hù)品牌分類(lèi)權(quán)重系數(shù)u2a3b1c9321u3a3b1c9112u6a3b1c9314u12a3b1c9345u13a3b1c9541聚類(lèi)組3用戶(hù)品牌分類(lèi)權(quán)重系數(shù)u5a7b5c6355u9a7b5c6142u10a7b5c6453u14a7b5c6122

        3.3 協(xié)同過(guò)濾

        為對(duì)目標(biāo)用戶(hù)做推薦預(yù)測(cè),需對(duì)聚類(lèi)后用戶(hù)更精細(xì)篩選構(gòu)建推薦組.由此需對(duì)目標(biāo)用戶(hù)協(xié)同過(guò)濾找到用戶(hù)的相似鄰居集.用戶(hù)間相似性的計(jì)算就成了協(xié)同過(guò)濾算法的關(guān)鍵之一.常用的相似性度量方法有余弦相似度、Pearson 相關(guān)系數(shù)和修正的余弦相似度.考慮到本文協(xié)同過(guò)濾需考慮用戶(hù)-商品數(shù)據(jù)權(quán)值,本文采用Pearson 相關(guān)系數(shù)對(duì)用戶(hù)協(xié)同過(guò)濾.皮爾斯相關(guān)系數(shù)如公式(3)所示:

        (3)

        其中:ui和uj表示的是兩個(gè)不同的用戶(hù),Sui,Suj是ui和uj的樣品標(biāo)準(zhǔn)偏差.uii和uji表示用戶(hù)ui和uj對(duì)商品ii的購(gòu)買(mǎi)權(quán)重.

        表3中聚類(lèi)組1經(jīng)協(xié)同過(guò)濾后所產(chǎn)生推薦組如表4所示.

        表4 用戶(hù)推薦組
        Table 4 User recommendation group

        用戶(hù)品牌分類(lèi)權(quán)重系數(shù)u1a1b2c4542u4a1b2c4515u8a1b2c4241u11a1b2c4552u15a1b2c4524

        3.4 商品組間關(guān)聯(lián)

        傳統(tǒng)算法由于只考慮了用戶(hù)間關(guān)聯(lián)而忽略商品間關(guān)聯(lián),考慮到商品組間的關(guān)聯(lián),本文采用關(guān)聯(lián)規(guī)則中的置信度來(lái)衡量推薦算法中商品之間的關(guān)聯(lián)作用.

        I{i1,i2,i3,…,in}是一個(gè)項(xiàng)目集合.T{t1,t2,t3,…,tn} 是一個(gè)事務(wù)集合每一個(gè)事務(wù)是用戶(hù)購(gòu)買(mǎi)商品記錄.

        由于本文用戶(hù)數(shù)據(jù)在經(jīng)過(guò)聚類(lèi)和協(xié)同過(guò)濾后,所構(gòu)建的用戶(hù)推薦組中出現(xiàn)以目標(biāo)用戶(hù)商品事務(wù)集頻繁的頻繁項(xiàng)集.例:目標(biāo)用戶(hù)商品事務(wù)集為T(mén){t1,t2,t3,t4},推薦組中會(huì)出現(xiàn)事務(wù)集合為T(mén){t1,t2,t3,t4}的頻繁項(xiàng)集.所以本文不需要采用算法求取頻繁項(xiàng)集.

        (4)

        公式(4)中,mun(X)表示項(xiàng)目X的支持計(jì)數(shù),數(shù)值為X在T出現(xiàn)的次數(shù).

        3.5 修正評(píng)分

        傳統(tǒng)協(xié)同過(guò)濾算法采用加權(quán)評(píng)分對(duì)用戶(hù)進(jìn)行產(chǎn)品推薦,但加權(quán)評(píng)分沒(méi)有考慮商品組間的關(guān)聯(lián),當(dāng)推薦組中用戶(hù)購(gòu)買(mǎi)商品出現(xiàn)異常值,例如:用戶(hù)u1購(gòu)買(mǎi)商品a1權(quán)重特別大,即使推薦組中其他用戶(hù)沒(méi)有購(gòu)買(mǎi)a1商品,也會(huì)使a1加權(quán)評(píng)分靠前,導(dǎo)致推薦.加權(quán)評(píng)分無(wú)法解決異常值問(wèn)題,考慮上述問(wèn)題,本文結(jié)合置信度和加權(quán)評(píng)分提出修正評(píng)分,當(dāng)推薦組中個(gè)別用戶(hù)再次出現(xiàn)某商品的異常值,該商品的置信度很小,置信度和加權(quán)評(píng)分的疊加使該商品修正評(píng)分靠后,不會(huì)被推薦.同時(shí)當(dāng)推薦組中不存在異常值,加權(quán)評(píng)分相近,置信度修正推薦優(yōu)先級(jí).經(jīng)實(shí)驗(yàn)驗(yàn)證修正評(píng)分可以更好的衡量推薦結(jié)果.

        用戶(hù)集合表示U{u1,u2,u3,…,um},用戶(hù)商品集合表示為I{i1,i2,i3,…,in},用戶(hù)商品權(quán)重集合R{r11,r12,r13,…,rmn}.

        如矩陣I和R所示,I為用戶(hù)—商品記錄矩陣,0表示無(wú)購(gòu)買(mǎi)記錄,1表示有購(gòu)買(mǎi)記錄.R為用戶(hù)—商品權(quán)值矩陣,數(shù)字表示購(gòu)買(mǎi)權(quán)值.

        定義2.修正評(píng)分:修正評(píng)分作為商品推薦最終指標(biāo),表示為推薦組中除目標(biāo)用戶(hù)外其他用戶(hù)對(duì)某商品的加權(quán)評(píng)分乘以推薦組中該商品組間置信度.置信度基于商品記錄矩陣I計(jì)算,表示某商品可能被購(gòu)買(mǎi)的概率,衡量加權(quán)評(píng)分可信度.兩者相乘為修正評(píng)分,公式為(5):

        (5)

        rec(ii)表示目標(biāo)用戶(hù)和推薦組中其他用戶(hù)對(duì)商品ii的修正評(píng)分.p(ui,uj) 表示用戶(hù)ui與uj的皮爾斯相關(guān)系數(shù),ui為目標(biāo)用戶(hù),uj為推薦組中其他用戶(hù),rji表示用戶(hù)uj對(duì)商品ii的購(gòu)買(mǎi)權(quán)重.X為不包含商品ii的商品集合,Y為X∪ii的商品集合.目標(biāo)用戶(hù)ui和商品ii無(wú)關(guān)聯(lián),ui是用戶(hù)組中第i個(gè)用戶(hù),ii為商品組中第i件商品,如果用戶(hù)ui購(gòu)買(mǎi)商品組中第i件商品,對(duì)應(yīng)權(quán)重則為rii,如表1所示.

        3.6 產(chǎn)生推薦

        產(chǎn)生推薦過(guò)程由表5所示.

        表5 推薦結(jié)果
        Table 5 Recommendation results

        相關(guān)系數(shù)u1u4u8u11u150.8570.7090.9120.851商品權(quán)重a1b2c4d1e1u1552413推薦值d1e1基于聚類(lèi)17.6913.47本文算法10.7112.04

        表5中目標(biāo)用戶(hù)u15購(gòu)買(mǎi)e1商品權(quán)重高于d1,基于聚類(lèi)的協(xié)同過(guò)濾算法優(yōu)先推薦d1,本文算法優(yōu)先推薦e1,可看出本文算法中采用修正評(píng)分衡量推薦結(jié)果更優(yōu)于基于聚類(lèi)協(xié)同過(guò)濾算法采用加權(quán)評(píng)分衡量推薦結(jié)果.

        3.7 算法描述

        本算法包括用戶(hù)聚類(lèi)、協(xié)同過(guò)濾、生成推薦三個(gè)步驟.

        1)用戶(hù)聚類(lèi)

        輸入:用戶(hù)集合U{u1,u2,u3,…,um}數(shù)據(jù).

        輸出:用戶(hù)聚類(lèi)組U′ 、U″ 、U″′.

        處理流程:

        a)用戶(hù)-商品數(shù)據(jù)重編碼,采用聚類(lèi)算法進(jìn)行聚類(lèi),得到不同的用戶(hù)聚類(lèi)組U′ 、U″ 、U″′.

        2)協(xié)同過(guò)濾

        輸入:用戶(hù)聚類(lèi)組U′

        處理流程:

        a)確定皮爾斯相關(guān)系數(shù)p(ui,uj)閾值為p′.

        3)生成推薦

        輸出:商品推薦序列I′{…ii…in…}.

        處理流程:

        b)結(jié)合矩陣I和R計(jì)算目標(biāo)用戶(hù)ui和推薦組中其他用戶(hù)對(duì)商品中I{i1,i2,i3,…,in} 可能被推薦商品的修正評(píng)分rec(…ii…in…).

        c)按修正評(píng)分rec(…ii…in…)降序排序得到商品推薦序列I′{…ii…in…}進(jìn)行商品推薦.

        4 實(shí)驗(yàn)分析

        為提高實(shí)驗(yàn)說(shuō)服力,本文實(shí)驗(yàn)數(shù)據(jù)來(lái)自明尼蘇達(dá)大學(xué) GroupLens 研究小組通過(guò)MovieLens 網(wǎng)站收集的MovieLens100K 數(shù)據(jù)集[10],該數(shù)據(jù)集包含了 943 位用戶(hù)對(duì)1682 部電影的 100000 條 1~5 的評(píng)分?jǐn)?shù)據(jù),每位用戶(hù)至少對(duì) 20 部電影進(jìn)行了評(píng)分.數(shù)據(jù)預(yù)處理后將數(shù)據(jù)隨機(jī)分為兩個(gè)部分,80%歸為訓(xùn)練集,20%歸為測(cè)試集.

        實(shí)驗(yàn)采用平均絕對(duì)誤差(Mean Absolute Error,MAE)[11]和時(shí)間復(fù)雜度兩種評(píng)價(jià)指標(biāo)來(lái)度量算法的推薦質(zhì)量.MAE 是一種常用的用于衡量統(tǒng)計(jì)的準(zhǔn)確性和比較的度量方法,能夠準(zhǔn)確地反應(yīng)推薦質(zhì)量的好壞.它用來(lái)衡量預(yù)測(cè)的用戶(hù)偏好與實(shí)際用戶(hù)偏好之間的誤差,MAE 值越小,推薦準(zhǔn)確度越高,假設(shè)系統(tǒng)預(yù)測(cè)的用戶(hù)興趣集合為(p1,p2,…,pn),用戶(hù)的實(shí)際興趣集合為(q1,q2,…,qn)計(jì)算方法如公式(6):

        (6)

        時(shí)間復(fù)雜度是推薦系統(tǒng)為目標(biāo)用戶(hù)推薦其感興趣項(xiàng)目所需要的時(shí)間,算法運(yùn)營(yíng)時(shí)間越短,時(shí)間復(fù)雜度越低,效果越好.

        相關(guān)系數(shù)選擇為測(cè)試目標(biāo)用戶(hù)與其他用戶(hù)形成推薦組時(shí),隨相關(guān)系數(shù)閾值的不同,MAE值得變化.相關(guān)系數(shù)取值范圍為0.3~0.9.實(shí)驗(yàn)如圖1所示為MAE值隨著皮爾遜相關(guān)系數(shù)的變化.

        圖1 MAE值隨pearson相關(guān)系數(shù)變化Fig.1 MAE value varies with pearson correlation coefficient

        圖1描述MAE值的變化曲線,初始MAE值隨pearson相關(guān)系數(shù)的增大而降低,當(dāng)pearson相關(guān)系數(shù)為0.6時(shí)MAE值達(dá)到最小,隨之增大,所以本文的pearson相關(guān)系數(shù)選擇為0.6.

        實(shí)驗(yàn)對(duì)比了在用戶(hù)數(shù)量逐漸增加時(shí),基于用戶(hù)的協(xié)同過(guò)濾算法[12]和基于logistic用戶(hù)特征[13]以及本文算法的平均絕對(duì)誤差(MAE)值的變化,同時(shí)通過(guò)三種算法時(shí)間復(fù)雜度的比較來(lái)確定算法的優(yōu)越性.

        圖2 不同用戶(hù)數(shù)量下的MAE值的變化Fig.2 Changes in MAE values for different user numbers

        圖2描述了三種推薦算法隨著用戶(hù)數(shù)量的變化,MAE值的變化情況,三種算法都是隨著用戶(hù)數(shù)量的逐漸增加MAE值逐漸降低M至趨于穩(wěn)定.由圖知本文算法在MAE上優(yōu)于上述兩種算法.

        圖3 不同用戶(hù)數(shù)量下的時(shí)間復(fù)雜度變化Fig.3 Time complexity changes under different user numbers

        圖3可知隨著用戶(hù)數(shù)量的逐漸增加三種推薦算法的運(yùn)行時(shí)間也隨之增加,當(dāng)用戶(hù)數(shù)量少三種算法的運(yùn)行時(shí)間沒(méi)有明顯差距.當(dāng)用戶(hù)數(shù)量逐漸增加時(shí)本文算法在算法運(yùn)行時(shí)間上優(yōu)于上述兩種算法.

        綜上實(shí)驗(yàn)結(jié)果表明,新算法相較文獻(xiàn)[12]算法和文獻(xiàn)[13]算法具有明顯的優(yōu)勢(shì),特別是樣本的數(shù)量增大后新算法的絕對(duì)平均誤差 MAE 值同等較小,時(shí)間復(fù)雜度同等較低.

        5 結(jié)束語(yǔ)

        推薦系統(tǒng)作為一個(gè)熱門(mén)的研究領(lǐng)域,本文從降低數(shù)據(jù)維度和減少計(jì)算量以及推薦的準(zhǔn)確性考慮,提出修正評(píng)分的協(xié)同過(guò)濾算法,算法先對(duì)用戶(hù)聚類(lèi)提高矩陣搜索空間效率,降低時(shí)間復(fù)雜度.修正評(píng)分代替加權(quán)評(píng)分解決異常值問(wèn)題,提高推薦算法的準(zhǔn)確性.該推薦算法因數(shù)據(jù)的特殊性,在數(shù)據(jù)預(yù)處理階段需要按照本文要求處理數(shù)據(jù)并對(duì)原始數(shù)據(jù)重編碼,降低推薦算法的計(jì)算量的同時(shí)也增加了預(yù)處理階段的工作量.下一步考慮的是如何更好的對(duì)原始數(shù)據(jù)進(jìn)行統(tǒng)一編碼,減少預(yù)處理過(guò)程的計(jì)算量.

        猜你喜歡
        修正權(quán)重聚類(lèi)
        Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
        修正這一天
        權(quán)重常思“浮名輕”
        合同解釋、合同補(bǔ)充與合同修正
        法律方法(2019年4期)2019-11-16 01:07:28
        為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
        基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
        軟件修正
        基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
        基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
        一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
        亚洲国产精品日韩av专区| 国产91在线精品观看| 色狠狠av老熟女| 国产最新进精品视频| 无码国产精品一区二区高潮| 荡女精品导航| 97人妻碰免费视频| 乱子真实露脸刺激对白| 国产精品久久久久久久久免费观看| 久久久久国产一级毛片高清版A| 一级无码啪啪| 国产一区二区精品av| 日韩一二三四区免费观看| 国产成人综合亚洲国产| 性色av一区二区三区密臀av| 日本高清成人一区二区三区 | 激烈的性高湖波多野结衣| 亚洲图片日本视频免费| 日日噜噜夜夜爽爽| 日本www一道久久久免费榴莲| 亚洲日本VA午夜在线电影| 国产三级在线观看性色av | 日韩亚洲在线一区二区| 都市激情亚洲综合一区| 国产精品一区二区熟女不卡| 蜜桃传媒网站在线观看| 亚洲毛片在线免费视频| 日本在线视频www色| 在线观看特色大片免费视频 | 精品天堂色吊丝一区二区| 特黄 做受又硬又粗又大视频| 久久精品国产99久久无毒不卡| 亚洲av日韩综合一区在线观看| 国产自偷亚洲精品页65页| 国产欧美va欧美va香蕉在线观| 91成人午夜性a一级毛片| 北岛玲精品一区二区三区| 国产在线精品观看一区二区三区 | 日韩精品久久中文字幕| 特黄 做受又硬又粗又大视频 | 日本最新一区二区三区视频观看|