亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于協(xié)同過(guò)濾和混合相似性模型的推薦算法

        2020-07-06 04:30:58丁家滿沈書琳賈連印游進(jìn)國(guó)李潤(rùn)鑫
        關(guān)鍵詞:冷啟動(dòng)標(biāo)簽權(quán)重

        丁家滿, 沈書琳, 賈連印, 游進(jìn)國(guó), 李潤(rùn)鑫

        (1. 昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,昆明 650500;2. 云南省人工智能重點(diǎn)實(shí)驗(yàn)室,昆明 650500)

        隨著大數(shù)據(jù)時(shí)代的到來(lái),信息與日俱增,使得信息消費(fèi)者難以從大量數(shù)據(jù)中獲取對(duì)自己有用的信息,而數(shù)據(jù)生產(chǎn)者也無(wú)法使自己的信息在眾多信息中得到用戶的關(guān)注,這就是信息過(guò)載問(wèn)題[1]。推薦系統(tǒng)通過(guò)收集用戶的愛好、行為習(xí)慣等信息并加以分析,幫助用戶快速準(zhǔn)確地找到自己想要的信息,被認(rèn)為是緩解信息過(guò)載問(wèn)題最有效的方法之一[2]。目前推薦系統(tǒng)所采用的推薦技術(shù)主要包括關(guān)聯(lián)規(guī)則(association rules)[3]、基于內(nèi)容的推薦(content-based recommendation)[4]、協(xié)同過(guò)濾(collaborative filtering, CF)、基于效用的推薦(utility-based recommendation)[5]和混合推薦(hybrid approach)[6-7]等。其中,協(xié)同過(guò)濾推薦算法是推薦系統(tǒng)中應(yīng)用最廣泛最成功的推薦技術(shù)之一[8],其目標(biāo)是根據(jù)已知的信息計(jì)算未知的評(píng)級(jí)[9]。主要包括基于用戶(user-based)的協(xié)同過(guò)濾算法[10]、基于項(xiàng)目(item-based)的協(xié)同過(guò)濾算法[11]、基于模型(model-based)的協(xié)同過(guò)濾算法[12-13],它們?cè)卺槍?duì)不同目標(biāo)時(shí)都取得了很好的推薦效果。

        但協(xié)同過(guò)濾算法仍存在著許多問(wèn)題,最主要的是數(shù)據(jù)稀疏問(wèn)題和冷啟動(dòng)問(wèn)題。現(xiàn)實(shí)生活中用戶的評(píng)分?jǐn)?shù)量較少,占總項(xiàng)目數(shù)的比例較低,導(dǎo)致提取的用戶偏好特征較少,推薦結(jié)果不準(zhǔn)確,這就是數(shù)據(jù)稀疏問(wèn)題。為了解決協(xié)同過(guò)濾算法中的數(shù)據(jù)稀疏問(wèn)題,文獻(xiàn)[14]從用戶偏好和全局角度提出了一種基于用戶偏好聚類的有效協(xié)同過(guò)濾算法,以減少數(shù)據(jù)稀疏的影響。文獻(xiàn)[15]提出了一種基于優(yōu)化用戶相似度的協(xié)同推薦算法。在傳統(tǒng)的余弦相似算法中加入了一個(gè)平衡因子,用于計(jì)算不同用戶之間的項(xiàng)目評(píng)價(jià)尺度差異。文獻(xiàn)[16]提出一種混合用戶相似性方法,該方法在特定領(lǐng)域取得了較好推薦結(jié)果,但仍然存在冷啟動(dòng)方面的問(wèn)題。為了有效解決冷啟動(dòng)問(wèn)題,文獻(xiàn)[17]提出了將主題模型與矩陣分解(MF)相結(jié)合的LDA_MF模型,并融合改進(jìn)的結(jié)合內(nèi)容與行為的LDA_CF,Item_CF算法形成混合算法,提高長(zhǎng)尾應(yīng)用的推薦率。文獻(xiàn)[18]提出了用戶時(shí)間權(quán)重信息概念,結(jié)合項(xiàng)目屬性信息解決完全新項(xiàng)目冷啟動(dòng)問(wèn)題,但過(guò)于依賴共同評(píng)分項(xiàng)目,在數(shù)據(jù)稀疏環(huán)境下,效果不佳。文獻(xiàn)[19]提出一種利用多群組智慧協(xié)同過(guò)濾算法,并結(jié)合用戶偏好模型,對(duì)于解決用戶冷啟動(dòng)問(wèn)題取得了較好的效果,但對(duì)于多群組數(shù)據(jù)缺失或者稀疏情況,推薦效果有待提高。

        以上文獻(xiàn)分別在解決數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題方面取得不錯(cuò)的成果,但如何有效地同時(shí)解決這兩個(gè)問(wèn)題有待改進(jìn)。為此,本文提出一種基于協(xié)同過(guò)濾和混合相似模型的推薦算法,利用PSS(proximity-significance-singularity)模型計(jì)算不同用戶在不同項(xiàng)目間的相似度,并將不同項(xiàng)目間的評(píng)分關(guān)系作為權(quán)重調(diào)整用戶相似度;接著,采用用戶-項(xiàng)目-特性和用戶-項(xiàng)目-標(biāo)簽的三分圖形式描述用戶、項(xiàng)目、特性、標(biāo)簽之間的關(guān)系,得到項(xiàng)目特性和項(xiàng)目標(biāo)簽的關(guān)系權(quán)重;同時(shí),設(shè)定用戶偏好因子和不對(duì)稱因子作為權(quán)重調(diào)整不同用戶間的評(píng)分偏好并提高模型的可靠性;最后,結(jié)合用戶時(shí)間權(quán)重信息,構(gòu)成基于協(xié)同過(guò)濾和混合相似模型的推薦算法。

        1 問(wèn)題定義

        定義1 用戶相似度

        假設(shè)兩個(gè)用戶u,v分別評(píng)價(jià)兩個(gè)項(xiàng)目i,j,評(píng)分等級(jí)分別為rui和rvj,項(xiàng)目評(píng)分權(quán)重為Sitem,則用戶相似度定義如式(1)所示。

        式中,函數(shù)S1(rui,rvj)代表僅基于用戶不同項(xiàng)評(píng)級(jí)的相似度,利用文獻(xiàn)[16]中調(diào)整后的PSS模型進(jìn)行計(jì)算。函數(shù)S1(rui,rvj)具體公式如式(2)所示。

        Proximity函數(shù)(見式(3))用于描述用戶間的評(píng)分絕對(duì)差值對(duì)相似度的影響;Significance(見式(4))函數(shù)描述用戶評(píng)分與評(píng)分域中值之間的關(guān)系;rmed表示評(píng)分域中值,如果用戶評(píng)級(jí)距離評(píng)分域中值較遠(yuǎn),則此評(píng)級(jí)更為重要;Singularity(見式(5))函數(shù)描述一個(gè)評(píng)級(jí)對(duì)的均值與這兩個(gè)項(xiàng)目的全局評(píng)分均值的絕對(duì)差值對(duì)相似度的影響,μi,μj表示項(xiàng)目i,j的平均評(píng)分值。

        S1函數(shù)采用的是不同用戶在不同項(xiàng)目間的相似度計(jì)算,為了使不同項(xiàng)目具有可比性,本文使用Sitem函數(shù)表示項(xiàng)目間的評(píng)分關(guān)系,并將此作為權(quán)重因子來(lái)調(diào)整用戶之間的相似度。為了使其能夠充分利用項(xiàng)目i,j的所有評(píng)分來(lái)解決共同評(píng)分的問(wèn)題,這里式(6)采用調(diào)整后的標(biāo)準(zhǔn)化歐式距離進(jìn)行計(jì)算。

        式中:rik,rjk表示某一用戶對(duì)項(xiàng)目i和項(xiàng)目j的評(píng)分值;sk表示用戶評(píng)分的標(biāo)準(zhǔn)差。這里考慮沒(méi)有評(píng)分的項(xiàng)以用戶評(píng)分均值代替。為了使項(xiàng)目間的相似權(quán)重更為準(zhǔn)確,將標(biāo)準(zhǔn)歐式距離進(jìn)行歸一化處理,使其結(jié)果在(0,1]之間,得到項(xiàng)目評(píng)分權(quán)重函數(shù)Sitem如式(7)所示。

        定義2項(xiàng)目特性信息

        設(shè)fui表示用戶u是否評(píng)價(jià)過(guò)項(xiàng)目i,fia表示項(xiàng)目i是否具有特性a,Ci表示項(xiàng)目i具有的特性個(gè)數(shù),Ca表示共同擁有特性a的項(xiàng)目個(gè)數(shù),則項(xiàng)目特性信息如式(8)所示。

        項(xiàng)目特性信息描述用戶、項(xiàng)目與特性之間的關(guān)系。如果用戶u評(píng)價(jià)過(guò)項(xiàng)目i,則fui=1,反之fui=0;同樣,如果項(xiàng)目i具有特性a,則fia=1,反之,fia=0。

        定義3項(xiàng)目標(biāo)簽信息

        設(shè)fui表示用戶u是否評(píng)價(jià)過(guò)項(xiàng)目i,fti表示標(biāo)簽t是否標(biāo)注過(guò)項(xiàng)目i,Ci表示項(xiàng)目i被標(biāo)注的標(biāo)簽個(gè)數(shù),Ct表示標(biāo)簽t標(biāo)記過(guò)的項(xiàng)目個(gè)數(shù),即擁有共同標(biāo)簽的項(xiàng)目個(gè)數(shù),則項(xiàng)目標(biāo)簽信息如式(9)所示。

        項(xiàng)目標(biāo)簽信息描述用戶、項(xiàng)目與標(biāo)簽之間的關(guān)系。如果項(xiàng)目i具有標(biāo)簽t,則fti=1,反之,fti=0。

        定義4不對(duì)稱因子

        設(shè)Iu為用戶u的所有評(píng)分項(xiàng)目數(shù)量,Iv為用戶v的所有評(píng)分項(xiàng)目數(shù)量,則不對(duì)稱因子定義如式(10)所示。

        不對(duì)稱因子S2通過(guò)描述兩個(gè)用戶的共同評(píng)分項(xiàng)目數(shù)量與目標(biāo)用戶評(píng)分項(xiàng)目數(shù)量的比例來(lái)強(qiáng)調(diào)用戶間的不對(duì)稱性。如果共同評(píng)分項(xiàng)目數(shù)量與用戶u的所有評(píng)分項(xiàng)目數(shù)量的比例大于其與用戶v的所有評(píng)分項(xiàng)目數(shù)量的比例,則表示共同評(píng)分項(xiàng)目對(duì)用戶u的影響要大于用戶v。

        定義5偏好因子

        設(shè)μu和μv表示用戶u和用戶v的評(píng)分均值,σu和σv表示用戶u和用戶v的評(píng)分標(biāo)準(zhǔn)差。偏好因子S3如式(11)所示。

        偏好因子S3通過(guò)描述用戶之間評(píng)分均值和標(biāo)準(zhǔn)方差的絕對(duì)差值乘積來(lái)調(diào)整用戶的偏好,減少偏好差異帶來(lái)的影響。

        定義6用戶時(shí)間權(quán)重

        在現(xiàn)實(shí)生活中,不同用戶有不同的評(píng)級(jí)偏好。一些用戶更喜歡追求新事物,這些用戶為“積極用戶”,其評(píng)論時(shí)間與項(xiàng)目發(fā)布時(shí)間間隔較短。相反,有些用戶更喜歡別人給出過(guò)評(píng)分的項(xiàng)目,這類用戶為“消極用戶”,其評(píng)論時(shí)間與項(xiàng)目發(fā)布時(shí)間間隔較長(zhǎng)。將用戶評(píng)論時(shí)間與項(xiàng)目發(fā)布時(shí)間間隔作為用戶時(shí)間權(quán)重信息,在推薦新項(xiàng)目時(shí),優(yōu)先推薦給積極用戶。用戶時(shí)間權(quán)重為用戶評(píng)價(jià)項(xiàng)目總數(shù)與用戶對(duì)項(xiàng)目的評(píng)價(jià)時(shí)間和項(xiàng)目發(fā)布時(shí)間的時(shí)間間隔總和的比值。設(shè)sum為用戶u評(píng)價(jià)項(xiàng)目總數(shù),timeui表示用戶u對(duì)項(xiàng)目i的評(píng)價(jià)時(shí)間,datei表示項(xiàng)目i的發(fā)布時(shí)間,則用戶u的時(shí)間權(quán)重如式(12)所示。

        可以看出,(timeui-datei)越小,用戶時(shí)間權(quán)重wu越大,說(shuō)明該用戶越喜愛新的事物,為積極用戶;反之,說(shuō)明該用戶為消極用戶。

        算例1為了更好理解,以用戶u1,u2,u3和項(xiàng)目i1,i2,i3,i4為例描述用戶時(shí)間權(quán)重信息,具體信息如表1所示。

        表 1 用戶評(píng)價(jià)時(shí)間表Tab.1 User appraisal schedule

        其中time代表用戶評(píng)價(jià)時(shí)間,date代表項(xiàng)目發(fā)布時(shí)間,根據(jù)式(12)可以得到用戶的時(shí)間權(quán)重信息如下:

        由例子可以看出,用戶u3的時(shí)間權(quán)重最高,即用戶u3較用戶u1和u2更喜歡體驗(yàn)新事物,為積極用戶,則優(yōu)先將新項(xiàng)目推薦給u3。

        定義7預(yù)測(cè)評(píng)分值

        為了得到用戶對(duì)未評(píng)級(jí)項(xiàng)的預(yù)測(cè)評(píng)分值,需要計(jì)算目標(biāo)用戶與其他用戶的相似度,篩選出與目標(biāo)用戶相似度最高的前K個(gè)鄰居用戶組成鄰近集,再根據(jù)預(yù)測(cè)評(píng)分公式進(jìn)行計(jì)算。設(shè)preui表示用戶u對(duì)未評(píng)級(jí)項(xiàng)目i的預(yù)測(cè)評(píng)分值,和分別表示用戶u和用戶v的平均評(píng)分值,rvi表示用戶v對(duì)項(xiàng)目i的評(píng)分,K表示用戶u的近鄰集合,S(u,v)表示用戶u和用戶v的相似度,則預(yù)測(cè)評(píng)分值如式(13)所示。

        2 基于協(xié)同過(guò)濾和混合相似模型的推薦算法

        傳統(tǒng)的相似性度量多采用用戶間的共同評(píng)分項(xiàng)進(jìn)行線性計(jì)算[20],但實(shí)際情況中,數(shù)據(jù)稀疏問(wèn)題使得共同評(píng)分項(xiàng)并不常見,變量之間通常也不存在線性關(guān)系,因此傳統(tǒng)推薦算法的準(zhǔn)確度也隨之降低。而為了解決共同評(píng)分項(xiàng)問(wèn)題,采用不同用戶在不同項(xiàng)之間的評(píng)分來(lái)進(jìn)行相似度計(jì)算。并且為了更好地適應(yīng)非線性情況,考慮累積所有可能的評(píng)分,并將不同項(xiàng)之間的評(píng)分關(guān)系作為權(quán)重因子調(diào)整用戶相似度。

        在考慮用戶評(píng)分的基礎(chǔ)上,還要考慮項(xiàng)目本身的特性,特別是新項(xiàng)目本身沒(méi)有用戶行為,因此更需要結(jié)合項(xiàng)目特性來(lái)解決項(xiàng)目冷啟動(dòng)問(wèn)題。同時(shí),標(biāo)簽既能表達(dá)用戶對(duì)項(xiàng)目的自我理解,也能體現(xiàn)出項(xiàng)目本身所具備的特征,因此結(jié)合標(biāo)簽信息進(jìn)行推薦更能體現(xiàn)用戶的興趣和項(xiàng)目特點(diǎn)。

        傳統(tǒng)的相似性度量在計(jì)算用戶相似度時(shí)通常將其看作對(duì)稱模式[21],即兩個(gè)用戶間的相似影響相同。但在實(shí)際情況中,兩個(gè)用戶的評(píng)分?jǐn)?shù)一般并不相同,相似影響也不相同。因此,設(shè)計(jì)一個(gè)不對(duì)稱因子,用以強(qiáng)調(diào)用戶間相互影響的不對(duì)稱性。同時(shí),考慮到用戶都有各自的評(píng)分偏好,有些用戶更喜歡評(píng)價(jià)高分,即使項(xiàng)目并不理想;也有些用戶更傾向于評(píng)價(jià)低分,哪怕項(xiàng)目很好也不會(huì)給很高的評(píng)分。為了平衡用戶偏好,使結(jié)果更為理想,設(shè)計(jì)偏好因子。

        綜上考慮,提出一種混合相似性模型如式(14)所示。

        即利用PSS模型計(jì)算用戶間的相似度S1,并使用項(xiàng)目間評(píng)分關(guān)系權(quán)重Sitem調(diào)整用戶相似度;接著,描述用戶、項(xiàng)目、特性、標(biāo)簽之間的關(guān)系,得到項(xiàng)目特性權(quán)重和項(xiàng)目標(biāo)簽權(quán)重;同時(shí),設(shè)定用戶不對(duì)稱因子S2和偏好因子S3作為權(quán)重調(diào)整不同用戶間的評(píng)分偏好并提高模型的可靠性,構(gòu)成混合相似性模型。式中:,代表信息偏好權(quán)重,即用戶對(duì)項(xiàng)目特性信息和標(biāo)簽信息的偏好比重,取值范圍為(0,1),且+=1;sumitem為項(xiàng)目總數(shù)。

        最后結(jié)合用戶時(shí)間權(quán)重信息,使用預(yù)測(cè)評(píng)分公式(14)得到目標(biāo)用戶對(duì)未評(píng)級(jí)項(xiàng)目的預(yù)測(cè)評(píng)分值,結(jié)合用戶時(shí)間權(quán)重信息式(12)組成式(15),實(shí)現(xiàn)推薦。

        算例2為了更好地理解以上公式,下面根據(jù)用戶-項(xiàng)目評(píng)分矩陣(表2),項(xiàng)目-特性矩陣(表3)以及項(xiàng)目-標(biāo)簽矩陣(表4)給出的例子進(jìn)行分步說(shuō)明。

        表2評(píng)分為1,2,3,4,5共5個(gè)等級(jí);表3表示如果項(xiàng)目具有某一屬性,則設(shè)值為1,否則設(shè)值為0;表4同理。首先以用戶u1為研究目標(biāo),根據(jù)表2給出的用戶評(píng)分矩陣,結(jié)合式(1)計(jì)算用戶u1分別與u2,u3的相似度。這里以u(píng)1,u3分別評(píng)價(jià)項(xiàng)目i1,i2為例,進(jìn)行具體公式計(jì)算如下:

        表 2 用戶-項(xiàng)目評(píng)分矩陣Tab.2 User-item rate matrix

        表 3 特性-項(xiàng)目矩陣Tab.3 Attribute-item matrix

        表 4 標(biāo)簽-項(xiàng)目矩陣Tab.4 Tag-item matrix

        為了更好地理解和計(jì)算項(xiàng)目特性權(quán)重信息和項(xiàng)目標(biāo)簽權(quán)重信息,以項(xiàng)目特性權(quán)重信息為例,將用戶-項(xiàng)目矩陣、項(xiàng)目-特性矩陣轉(zhuǎn)化為用戶-項(xiàng)目-特性三分圖形式,具體如圖1所示。

        圖1 用戶-項(xiàng)目-特性信息Fig. 1 User-item-attribute information

        圖1 中:u代表用戶;i代表項(xiàng)目;a代表特性。如果用戶u評(píng)價(jià)項(xiàng)目i,則使用一條直線連接用戶u和項(xiàng)目i;同理,如果項(xiàng)目i擁有特性a,則連接項(xiàng)目i和特性a。繼續(xù)以用戶u1為研究目標(biāo),根據(jù)圖1可知,項(xiàng)目i1擁有特性a1和a3,而有3個(gè)項(xiàng)目共同擁有特性a1,同樣有3個(gè)項(xiàng)目共同擁有a3,結(jié)合式(10)計(jì)算項(xiàng)目i1的項(xiàng)目特性權(quán)重為

        同理,使用式(9)計(jì)算項(xiàng)目i1的項(xiàng)目標(biāo)簽關(guān)系。然后,根據(jù)式(14)可以得到最終的用戶間的相似性,如表5所示。

        表 5 用戶相似值Tab.5 Values of the user similarity

        由表5可以看出,用戶u1和u2沒(méi)有共同評(píng)分項(xiàng),但仍能根據(jù)其他信息得到相似度,說(shuō)明本文方法并不依賴共同評(píng)分項(xiàng),并且用戶間的相似影響基本不同。最后,根據(jù)式(15)計(jì)算用戶對(duì)未評(píng)級(jí)項(xiàng)目的評(píng)分,若該項(xiàng)目是新項(xiàng)目,則直接采用用戶時(shí)間權(quán)重信息與新項(xiàng)目特性信息結(jié)合得到預(yù)測(cè)評(píng)分值。最后對(duì)用戶的項(xiàng)目評(píng)級(jí)進(jìn)行排序,完成Top-N推薦。

        基于協(xié)同過(guò)濾和混合相似性模型的推薦算法描述如表6所示。

        表 6 RCFHSM算法描述Tab.6 Description of RCFHSM algorithm

        3 實(shí)驗(yàn)結(jié)果和分析

        3.1 數(shù)據(jù)集預(yù)處理和度量標(biāo)準(zhǔn)

        本實(shí)驗(yàn)采用的數(shù)據(jù)集是由美國(guó)Minnesota大學(xué)的Grouplens研究小組創(chuàng)建并維護(hù)的MovieLens數(shù)據(jù)集[22],在預(yù)處理后,將其劃分為互不相交的訓(xùn)練集和測(cè)試集,訓(xùn)練集占80%,測(cè)試集占20%。

        3.2 實(shí)驗(yàn)結(jié)果和分析

        本文進(jìn)行兩類實(shí)驗(yàn),首先采用MAE,F(xiàn)1-measure方法進(jìn)行對(duì)照實(shí)驗(yàn),驗(yàn)證算法的有效性;然后對(duì)數(shù)據(jù)進(jìn)行再處理,采用新穎度指標(biāo)進(jìn)行對(duì)照實(shí)驗(yàn),驗(yàn)證推薦算法對(duì)解決新項(xiàng)目冷啟動(dòng)問(wèn)題的有效性。

        實(shí)驗(yàn)1推薦算法的準(zhǔn)確度。

        將參數(shù)α和β取多種不同的值進(jìn)行組合,分別進(jìn)行準(zhǔn)確度實(shí)驗(yàn)。由于推薦個(gè)數(shù)少時(shí)準(zhǔn)確率較高,因此,首先在推薦個(gè)數(shù)為5的情況下,計(jì)算不同參數(shù)取值組和近鄰集的K值影響,對(duì)K值進(jìn)行選擇,如圖2所示。

        由圖2可以看出,在不同的參數(shù)組情況下取K=20時(shí)準(zhǔn)確度最高,因此,限于篇幅,只列出K=20時(shí)一部分不同推薦個(gè)數(shù)的準(zhǔn)確度對(duì)比,如表7所示。

        圖2 不同K取值的準(zhǔn)確度Fig. 2 Accuracy of different K values

        表 7 參數(shù)取值Tab.7 Parameter values

        本文進(jìn)行多組實(shí)驗(yàn)后發(fā)現(xiàn),其實(shí)參數(shù)α,β對(duì)實(shí)驗(yàn)結(jié)果的影響并不大,說(shuō)明算法本身對(duì)參數(shù)取值依賴性不大,但仍選取α=0.4,β=0.6,此時(shí),算法在此數(shù)據(jù)集中準(zhǔn)確率相對(duì)較好。將本文算法(簡(jiǎn)稱 RCFHSM)與文獻(xiàn)[16]中的基于用戶推薦的UPCC算法、基于物品推薦的IPCC算法和混合用戶相似模型(以下簡(jiǎn)稱HUSM)算法進(jìn)行MAE,F(xiàn)1-measure對(duì)比,結(jié)果如圖3和圖4所示。

        觀察兩圖可知,本文提出的基于協(xié)同過(guò)濾和混合相似模型的推薦算法在評(píng)估方法MAE,F(xiàn)1-measure上都優(yōu)于其他推薦算法。這是因?yàn)橄啾绕渌惴?,本文在累積所有評(píng)分項(xiàng)來(lái)解決共同評(píng)分項(xiàng)較少所導(dǎo)致的數(shù)據(jù)稀疏問(wèn)題時(shí),同時(shí)加入了特性權(quán)重信息和標(biāo)簽權(quán)重信息,提高了推薦的效果。

        圖3 MAE對(duì)比Fig. 3 MAE for different algorithms

        圖4 F1-measure對(duì)比Fig. 4 F1-measure for different algorithms

        實(shí)驗(yàn)2 解決新項(xiàng)目冷啟動(dòng)問(wèn)題。

        原數(shù)據(jù)集中不存在新項(xiàng)目,即用戶未進(jìn)行評(píng)級(jí)的項(xiàng)目,因此對(duì)原數(shù)據(jù)集進(jìn)行再處理,在測(cè)試集中隨機(jī)抽取300,500,1 000個(gè)項(xiàng)目依次作為新項(xiàng)目,訓(xùn)練集中對(duì)應(yīng)的300,500,1 000個(gè)項(xiàng)目的評(píng)分信息及標(biāo)簽信息依次設(shè)為0。使用處理后的數(shù)據(jù)集對(duì)本文算法進(jìn)行準(zhǔn)確度和新穎度實(shí)驗(yàn),因?yàn)榍懊娴膸讉€(gè)算法更多基于評(píng)分計(jì)算,在解決項(xiàng)目冷啟動(dòng)方面效果并不好,為此加入文獻(xiàn)[18]的CUTATime推薦算法結(jié)果進(jìn)行對(duì)比。

        從表8和表9中可以看出,本文算法的新穎度優(yōu)于CUTATime算法。這是因?yàn)樵谟?jì)算新穎度時(shí)加入了用戶評(píng)分均值,從而提高了新項(xiàng)目的推薦比例,使新項(xiàng)目能夠得到更多的推薦。

        表 8 CUTATime算法準(zhǔn)確度和新穎度Tab.8 Accuracy and novelty of CUTATime algorithm

        表 9 RCFHSM算法準(zhǔn)確度和新穎度Tab.9 Accuracy and novelty of RCFHSM algorithm

        4 結(jié) 論

        針對(duì)推薦算法一直以來(lái)的數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題,提出一種基于協(xié)同過(guò)濾和混合相似性模型的推薦算法。該算法通過(guò)計(jì)算用戶在不同項(xiàng)目間的相似性來(lái)解決用戶間共同評(píng)分項(xiàng)較少所帶來(lái)的數(shù)據(jù)稀疏問(wèn)題;并將項(xiàng)目特性權(quán)重和用戶時(shí)間權(quán)重信息相結(jié)合用于解決新項(xiàng)目冷啟動(dòng)問(wèn)題。在此基礎(chǔ)上進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文提出的混合相似性模型合理可行,有較高的準(zhǔn)確度和新穎度,并能有效地解決數(shù)據(jù)稀疏和冷啟動(dòng)問(wèn)題。

        猜你喜歡
        冷啟動(dòng)標(biāo)簽權(quán)重
        輕型汽油車實(shí)際行駛排放試驗(yàn)中冷啟動(dòng)排放的評(píng)估
        基于學(xué)習(xí)興趣的冷啟動(dòng)推薦模型
        客聯(lián)(2021年2期)2021-09-10 07:22:44
        權(quán)重常思“浮名輕”
        無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
        車迷(2018年11期)2018-08-30 03:20:32
        為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
        不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
        海峽姐妹(2018年3期)2018-05-09 08:21:02
        基于公約式權(quán)重的截短線性分組碼盲識(shí)別方法
        標(biāo)簽化傷害了誰(shuí)
        基于多進(jìn)制查詢樹的多標(biāo)簽識(shí)別方法
        軍事技能“冷啟動(dòng)”式訓(xùn)練理念初探
        天下第二社区在线视频| 中文字幕人妻久久一区二区三区| 欧美日韩精品福利在线观看| 久久精品国产精品亚洲艾| 国产中文色婷婷久久久精品| 日日摸日日碰人妻无码 | 水蜜桃在线观看一区二区| 麻豆精品国产精华精华液好用吗| 日本国产视频| 最新国产av网址大全| 白浆高潮国产免费一区二区三区| 高清不卡av一区二区| 欧美最猛黑人xxxx黑人猛交| 精品久久久无码中文字幕| 亚洲第一区二区快射影院| 中文文精品字幕一区二区| 扒开腿狂躁女人爽出白浆| 久久久久国色av∨免费看| 亚洲24小时在线免费视频网站| 国产自拍偷拍视频免费在线观看 | 一区二区在线观看视频高清| 国产精品成人aaaaa网站| 色老头一区二区三区| 97自拍视频国产在线观看| 欧美拍拍视频免费大全| 在线亚洲午夜理论av大片| 狠狠亚洲婷婷综合色香五月| 丝袜美腿在线播放一区二区| 伊人久久精品无码二区麻豆| 欧美日韩不卡视频合集| 日本一区二区三区在线播放| 亚洲国产成人久久精品不卡| 少妇久久久久久被弄到高潮| 欧美 亚洲 国产 日韩 综AⅤ| 日产一区二区三区的精品| 超碰97人人射妻| 国产精品麻豆综合在线| 国产精品国产三级厂七| 久久亚洲av成人无码电影 | 日日摸日日碰人妻无码 | 岛国熟女一区二区三区|