亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于均衡接近度灰關(guān)聯(lián)的Slope One算法

        2021-05-14 06:28:18張岐山陳露露
        關(guān)鍵詞:關(guān)聯(lián)預(yù)測算法

        張岐山,陳露露

        福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福州350108

        協(xié)同過濾作為目前應(yīng)用最為廣泛的一種推薦方法[1],主要分為基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾。基于用戶的協(xié)同過濾方法通過計(jì)算用戶之間的相似度,找出與目標(biāo)用戶興趣相似的近鄰用戶集,從相似用戶感興趣的項(xiàng)目中對目標(biāo)用戶進(jìn)行推薦;基于項(xiàng)目的協(xié)同過濾指根據(jù)用戶的歷史偏好記錄計(jì)算項(xiàng)目之間的相似度,將相似項(xiàng)目推薦給當(dāng)前用戶[2]。由于協(xié)同過濾算法非常流行,研究人員嘗試了不同的方法來改進(jìn)它。一方面,一些學(xué)者設(shè)計(jì)了新的啟發(fā)式方法,如聚類、降維、加權(quán)預(yù)測等。另一方面,一些學(xué)者將統(tǒng)計(jì)模型、概率相關(guān)模型等與協(xié)同過濾結(jié)合起來,生成新的推薦算法。然而,這些算法也變得更加復(fù)雜或者難以實(shí)現(xiàn)。Slope One算法是那些有效且易于實(shí)現(xiàn)的算法之一。

        Slope One算法是由Lemire等[3]在2005年提出的一種基于項(xiàng)目的協(xié)同過濾算法,與其他推薦算法相比更加高效、容易執(zhí)行。作為一種有效的協(xié)同過濾算法,Slope One算法受到了研究者的廣泛關(guān)注并加以改進(jìn)。

        如Wang 等人[4]利用Slope One 算法對用戶項(xiàng)目評分矩陣填充,再引入用戶相似度,將新變量納入算法權(quán)重,提高用戶個(gè)性化推薦質(zhì)量;Zhang[5]利用Slope One算法來預(yù)測用戶尚未評級的項(xiàng)目,然后使用Pearson 相關(guān)系數(shù)度量目標(biāo)項(xiàng)目的鄰居最后產(chǎn)生推薦,提高了協(xié)同過濾推薦系統(tǒng)的準(zhǔn)確性;王毅等人[6]利用關(guān)鍵字之間的語義相似度度量項(xiàng)目之間的相似度提高了預(yù)測的準(zhǔn)確度;Song等人[7]考慮到用戶之間的關(guān)聯(lián)會(huì)對算法精度產(chǎn)生影響,以余弦相似度定義用戶相似度,將用戶相似度與Weighted Slope One結(jié)合,在不增加空間復(fù)雜度的前提下提高了推薦質(zhì)量;Sun 等人[8]根據(jù)用戶與目標(biāo)用戶的相似度,將不同的權(quán)重附加到不同用戶給出的分?jǐn)?shù)上,大大提高推薦精度;Zhao 等人[9]使用漢明距離進(jìn)行聚類,結(jié)合用戶相似性和Slope One算法對聚類中的項(xiàng)目評分進(jìn)行預(yù)測;Ni等人[10]采用Canopy-Kmeans算法對時(shí)間權(quán)重的評級矩陣進(jìn)行聚類,然后進(jìn)行填充來提高矩陣的密度,以減少由于數(shù)據(jù)稀疏性對推薦結(jié)果產(chǎn)生的影響;Hu等人[11]采用Salton系數(shù)來度量旅游景點(diǎn)之間的相似性關(guān)系和景點(diǎn)屬性相似性,與Slope One算法結(jié)合應(yīng)用到旅游景點(diǎn)推薦系統(tǒng)中,提高了推薦結(jié)果的新穎性;Sun等人[12]根據(jù)不確定的k 近鄰矩陣中的項(xiàng)目相似度和活躍度,動(dòng)態(tài)選擇每個(gè)項(xiàng)目的鄰居,僅從選定的相鄰項(xiàng)目生成項(xiàng)目之間的平均評級偏差;Cao 等人[13]將時(shí)間因素、地理因素和用戶偏好加權(quán)到Slope One 算法中,來研究時(shí)間和空間因素以及推薦系統(tǒng)中用戶興趣的變化對興趣點(diǎn)推薦的影響;Ye等人[14]結(jié)合Slope One算法和SVD算法來解決數(shù)據(jù)不平衡問題,將Slope One算法得到的預(yù)測數(shù)據(jù)附加到原始數(shù)據(jù)集中訓(xùn)練SVD 模型,提高算法的效率;王冉等人[15]將加權(quán)二部圖與Slope One算法結(jié)合,使推薦結(jié)果更加準(zhǔn)確多樣化;Zhao 等人[16]考慮到用戶之間以及項(xiàng)目之間的關(guān)聯(lián)都會(huì)對推薦結(jié)果產(chǎn)生影響,將用戶相似度和項(xiàng)目相似度加權(quán)到Slope One算法中,提高了推薦精度;Ye等人[17]還結(jié)合K 近鄰的思想,引入用戶標(biāo)簽信息,將Jaccard 方法和Pearson 方法加權(quán)融合到偏差公式中來提高預(yù)測精度;龔敏等人[18]使用Slope One算法對聚類之后的稀疏矩陣進(jìn)行填充,對協(xié)同過濾算法進(jìn)行優(yōu)化,有效提高了算法推薦質(zhì)量。

        上述改進(jìn)方法在一定程度上改善了推薦效果,但是目前有關(guān)相似度改進(jìn)方面通常采用傳統(tǒng)的相似度計(jì)算方法,容易受到個(gè)別異常點(diǎn)的影響,忽略了波幅較小元素,不能充分挖掘用戶和項(xiàng)目之間的信息,導(dǎo)致數(shù)據(jù)丟失和信息失真,影響推薦的準(zhǔn)確度。

        針對以上問題,本文提出將均衡接近度灰關(guān)聯(lián)方法與Slope One算法結(jié)合起來的改進(jìn)方案。具體的,本文創(chuàng)新主要體現(xiàn)在以下幾個(gè)方面:

        (1)在Slope One 算法中引入用戶相似度,在計(jì)算時(shí)考慮到用戶之間相關(guān)性高低對實(shí)驗(yàn)結(jié)果造成的影響,而不是粗略地將所有用戶一視同仁,避免大量無關(guān)用戶參與計(jì)算對預(yù)測評分產(chǎn)生干擾,提高推薦質(zhì)量。

        (2)采用均衡接近度灰關(guān)聯(lián)方法來度量用戶相似度。由于數(shù)據(jù)集稀疏性較大,如果利用傳統(tǒng)的相似度方法計(jì)算用戶相似度容易受到個(gè)別異常點(diǎn)的影響,導(dǎo)致數(shù)據(jù)丟失和信息失真。通過計(jì)算用戶之間均衡接近度,度量用戶整體的無差異性,不僅可以減弱局部點(diǎn)關(guān)聯(lián)傾向[19],還充分利用了點(diǎn)關(guān)聯(lián)系數(shù)提供的豐富信息考慮用戶偏好問題,有效挖掘用戶之間的潛在聯(lián)系。

        1 相關(guān)工作

        1.1 均衡接近度灰關(guān)聯(lián)方法

        均衡接近度灰關(guān)聯(lián)方法由張岐山教授[19]提出,在灰熵和灰關(guān)聯(lián)系數(shù)的基礎(chǔ)上,定義了基于均衡接近度的灰關(guān)聯(lián)分析方法,可以有效地應(yīng)用在貧信息系統(tǒng)分析和復(fù)雜系統(tǒng)中。

        設(shè)序列X=(x1,x2,…,xn),F(xiàn) 為數(shù)值映射集,稱χ為X 的像集灰關(guān)聯(lián)因子集。 F 為數(shù)值映射集,F(xiàn) ={初值化,平均值化,最大值化,最小值化,區(qū)間值化,正因字化}。 X0∈χ 為參考列,Xi∈χ 為比較列,i ∈I={1,2,…,m} ,Xo={xo(k) |k ∈K} ,Xi={xi(k) |k ∈k} ,K={1,2,…,n}。

        定義1灰關(guān)聯(lián)公式如下:

        其中,ζ 為分辨系數(shù),γ(x0(k),xi(k))為參考列X0與比較列Xi的灰關(guān)聯(lián)系數(shù),γ(X0,Xi)為參考列X0與比較列Xi的灰關(guān)聯(lián)度。

        定義2灰關(guān)聯(lián)系數(shù)分布映射:第i 個(gè)比較列的關(guān)聯(lián)系數(shù)列用Ri表示,Ri={|γ(x0(k),xi(k)) k ∈K},則稱映射:

        可得出X 的均衡度為:

        定義4均衡接近度:

        其中,Ba(X0,Xi)為參考列X0與比較列Xi的均衡接近度。均衡接近度是各比較列與參考列均衡接近程度的測度,均衡接近度越大,比較列與參考列的關(guān)聯(lián)性越強(qiáng)。

        1.2 Slope One算法

        Slope One 算法(Slope One algorithm,SO)的基本思想為根據(jù)用戶-項(xiàng)目評分矩陣中用戶對每個(gè)項(xiàng)目的評分?jǐn)?shù)據(jù),得到項(xiàng)目之間的評分差值,通過項(xiàng)目評分差值以及用戶的歷史評分記錄得到用戶對目標(biāo)項(xiàng)目的近似評分值。

        算法基本方法是運(yùn)用線性回歸模式f(x)=x+b來預(yù)測評分,其中x為用戶u對項(xiàng)目的預(yù)測評分Ru,b為項(xiàng)目i相對于項(xiàng)目評分j的平均偏差,表示為devj,i,最終得到用戶u對項(xiàng)目j的預(yù)測評分為Puj。計(jì)算公式如下:

        其中,χ為用戶集合,ui表示用戶u對項(xiàng)目i的評分,uj表示用戶u對項(xiàng)目j的評分,Sj,i(χ)表示同時(shí)對項(xiàng)目i,j有評分的用戶集合,Rj為用戶u的評分項(xiàng)目集合,(card)表示集合包含的元素?cái)?shù)量。

        例1 為了更加直觀表達(dá)Slope One 算法,下面舉個(gè)簡單的例子說明。表1為用戶-項(xiàng)目評分矩陣,顯示了u1、u2、u3、u4四個(gè)用戶對五個(gè)項(xiàng)目的評分情況,表中空格部分代表用戶對該項(xiàng)目沒有評分,預(yù)測u4對i5的評分。

        表1 用戶-項(xiàng)目評分矩陣

        根據(jù)式(8)分別計(jì)算i5相對i2和i3的評分偏差可得:

        1.3 Weighted Slope One算法

        Slope One 算法沒有考慮到用戶評分?jǐn)?shù)量的影響。在此基礎(chǔ)上Lemire 等[3]還提出了一種Weighted Slope One 算法(Weighted Slope One algorithm,WSO),該算法考慮了devj,i的可信度差異,計(jì)算用戶評分?jǐn)?shù)對計(jì)算項(xiàng)目評分偏差做出的貢獻(xiàn),其中Cji表示同時(shí)對項(xiàng)目i,j有評分的用戶數(shù)量,計(jì)算公式如下:

        2 基于均衡接近度灰關(guān)聯(lián)的Slope One算法

        2.1 相似性度量方法

        通過對SO、WSO 算法研究分析發(fā)現(xiàn),兩者都沒有考慮用戶相似度對算法推薦結(jié)果的影響,而在推薦系統(tǒng)中,相似性的度量至關(guān)重要,通過相似度來衡量近鄰用戶對推薦結(jié)果的貢獻(xiàn)使得協(xié)同作用更加精確[20]。

        推薦系統(tǒng)中,傳統(tǒng)用戶相似度計(jì)算方法包括余弦相似度、Pearson 相關(guān)系數(shù)以及常用的歐式距離等。余弦相似度方法計(jì)算過程簡便但沒有考慮到由于用戶個(gè)體差異導(dǎo)致評分會(huì)過高或者過低;相比余弦相似度,Pearson相關(guān)系數(shù)得到的結(jié)果更加準(zhǔn)確但沒有考慮到用戶共同評分項(xiàng)目數(shù)量對相似度結(jié)果產(chǎn)生影響。在數(shù)據(jù)稀疏時(shí),這兩種方法得到的預(yù)測準(zhǔn)確率都不高,而且由于評分之間的相關(guān)性導(dǎo)致推薦準(zhǔn)確率下降[21]?;跉W式距離的相似度計(jì)算方法簡單且在數(shù)據(jù)稀疏情況下更適用,但沒有考慮到局部特征的偏差影響,在度量過程中容易受到奇異值影響[22]。針對以上問題,一些學(xué)者將灰色系統(tǒng)引入到推薦算法中,相比與其他相似度測量方法,均衡接近度灰關(guān)聯(lián)方法在鄧聚龍教授[23]提出的灰關(guān)聯(lián)系數(shù)方法上加以改進(jìn),既保留了灰關(guān)聯(lián)分析的優(yōu)點(diǎn),同時(shí)又避免了局部異常點(diǎn)的影響,利用均衡接近度衡量數(shù)據(jù)點(diǎn)的相似程度,可以充分利用序列之間的信息,有效克服了參數(shù)敏感性對算法的影響,減少非近鄰數(shù)據(jù)的信息損失[22],緩解數(shù)據(jù)的稀疏性對推薦準(zhǔn)確率的影響,有效提高算法的推薦質(zhì)量[24]。

        通過以上分析,針對Slope One 算法未考慮用戶相似度以及協(xié)同過濾算法中傳統(tǒng)的相似性計(jì)算方法不準(zhǔn)確的問題[25],本文提出利用均衡接近度度量用戶相似度的新思路,來充分挖掘用戶之間的信息,使算法能夠在貧信息系統(tǒng)中有效緩解由于數(shù)據(jù)稀疏導(dǎo)致的推薦準(zhǔn)確度降低問題。

        2.2 均衡接近度計(jì)算

        不同用戶的評分在預(yù)測中具有不同的重要性,通過目標(biāo)用戶與相關(guān)用戶的均衡接近度度量用戶之間的相關(guān)性,均衡接近度越大,說明用戶關(guān)聯(lián)性越強(qiáng),代表他們對目標(biāo)項(xiàng)目有相同興趣的可能性越大。具體步驟如下:

        (1)對于目標(biāo)用戶u和相關(guān)用戶v,以及評分項(xiàng)目(i1,i2,…,in),根據(jù)公式(1)計(jì)算用戶u 與用戶v 在第i 個(gè)項(xiàng)目上的灰關(guān)聯(lián)因數(shù),通過公式(2)對各項(xiàng)目的灰關(guān)聯(lián)因數(shù)求均值得到用戶之間的灰關(guān)聯(lián)度。根據(jù)文獻(xiàn)[20],分辨系數(shù)ζ 為0.5 時(shí),關(guān)聯(lián)度可以更好地體現(xiàn)序列的整體性。因此本文ζ 取值為0.5。

        (2)對公式(1)和公式(2)得到的值,通過公式(3)得到用戶u、v 在各個(gè)項(xiàng)目上的灰關(guān)聯(lián)系數(shù)分布映射。

        (3)通過公式(4)和公式(5)計(jì)算得到用戶u、v 在各個(gè)項(xiàng)目上的灰關(guān)聯(lián)系數(shù)熵和灰熵的最大值。

        (4)通過公式(6)得到用戶u 和用戶v 的均衡度。

        (5)公式(7)使用公式(2)和公式(6)計(jì)算得到的均衡度和灰關(guān)聯(lián)度結(jié)果,最終得到用戶u 和用戶v 的均衡接近度。

        與傳統(tǒng)用戶相似度計(jì)算方法相比,均衡接近度灰關(guān)聯(lián)方法在計(jì)算灰關(guān)聯(lián)系數(shù)時(shí),采用兩級最大差與最小差能夠充分利用灰關(guān)聯(lián)因子序列間多個(gè)比較序列之間點(diǎn)的相關(guān)信息,同時(shí)分辨系數(shù)的選擇可以削弱比較序列中異常值對關(guān)聯(lián)空間的影響,使關(guān)聯(lián)度更好地體現(xiàn)了序列的整體性;此外,傳統(tǒng)的相似度方法計(jì)算用戶相似度時(shí)可分辨性不高,具體表現(xiàn)為對于不同用戶的評分向量與目標(biāo)用戶進(jìn)行相似度計(jì)算時(shí),可能得到相同的相似度,而灰關(guān)聯(lián)度是由離散的關(guān)聯(lián)系數(shù)平均值組成,所以在一定程度上可以提高用戶間相似度的可分辨性。

        2.3 基于均衡接近度灰關(guān)聯(lián)的Slope One算法

        為了防止因相似用戶較少而將均衡接近度為0 的用戶納入計(jì)算,本文在選擇相似用戶時(shí)對用戶相似性設(shè)置了閾值,只有當(dāng)目標(biāo)用戶的近鄰用戶大于這個(gè)閾值時(shí),才將其作為近鄰用戶參與計(jì)算。

        根據(jù)前面敘述的利用均衡接近度衡量用戶之間相關(guān)性,在Slope One 模型基礎(chǔ)上,將均衡接近度灰關(guān)聯(lián)的概念融入到Slope One 算法中,將公式(7)計(jì)算得到的用戶之間的均衡接近度結(jié)合到公式(9)中對預(yù)測公式進(jìn)行改進(jìn),得到改進(jìn)的基于均衡接近度灰關(guān)聯(lián)的Slope One推薦算法(Grey Based Slope One algorithm,GBSO),計(jì)算過程如式(11)所示。其中simuv為用戶u與共同評價(jià)過項(xiàng)目i,j 的前K 個(gè)相似用戶v 的均衡接近度值。

        2.4 算法描述

        基于均衡接近度灰關(guān)聯(lián)的Slope One 算法的具體步驟如下:

        算法基于均衡接近度灰關(guān)聯(lián)的Slope One 算法偽代碼

        輸入:目標(biāo)用戶u 及其評分項(xiàng)目集合I={i1,i2,…,in},待評分項(xiàng)目j ,用戶-項(xiàng)目評分矩陣Rm×n(分為訓(xùn)練集和測試集),鄰居用戶個(gè)數(shù)K 。

        輸出:目標(biāo)用戶u 對評分項(xiàng)目j 的預(yù)測評分Puj。

        用戶項(xiàng)目評分矩陣中,多個(gè)用戶對同一項(xiàng)目進(jìn)行評分,那么該項(xiàng)目的所有評分用戶之間會(huì)存在著關(guān)聯(lián)性,評分用戶之間必然存在某種關(guān)聯(lián)因素,這就形成了一種灰色系統(tǒng)?;谊P(guān)聯(lián)分析是對灰色系統(tǒng)進(jìn)行整體分析和預(yù)測的基礎(chǔ),利用均衡接近度灰關(guān)聯(lián)方法度量用戶相似度,可以根據(jù)灰色系統(tǒng)中各因子之間發(fā)展趨勢的相似程度,來衡量因子之間的近似程度,從而把系統(tǒng)內(nèi)部有關(guān)因子之間的各種關(guān)系都展現(xiàn)出來,將存在不確定性的推薦系統(tǒng)內(nèi)的不定因素加入考慮的范疇內(nèi),從而有效挖掘用戶之間的關(guān)系。

        此外,均衡接近度灰關(guān)聯(lián)方法既包含了灰關(guān)聯(lián)度對整體接近性的測度,又具有均衡度對序列均衡性測度的特點(diǎn),綜合考慮了熵關(guān)聯(lián)度和點(diǎn)關(guān)聯(lián)度,既包含了對序列間點(diǎn)的距離接近性的測度,又包含了對整體的無差異性接近的測試。將均衡接近度灰關(guān)聯(lián)方法與Slope One算法結(jié)合,可有效改善Slope One 算法存在的問題,使推薦結(jié)果更貼近實(shí)際情況,提高推薦質(zhì)量。

        3 實(shí)驗(yàn)結(jié)果及分析

        3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集

        實(shí)驗(yàn)環(huán)境:Window10系統(tǒng),硬件配置:CPU 2.60 GHz,RAM 8 GB,運(yùn)行環(huán)境:Python3.7。

        為了驗(yàn)證改進(jìn)算法的有效性,本文采用兩個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),分別為:

        (1)MovieLens 數(shù)據(jù)集。實(shí)驗(yàn)數(shù)據(jù)采用了由Group-Lens 小組提供的MovieLens 100k 標(biāo)準(zhǔn)數(shù)據(jù)集,其中包括了943 名用戶對1 682 部電影(項(xiàng)目)的100 000 條評分信息,評分區(qū)間為1~5,評分值越大代表用戶越喜歡該電影。該數(shù)據(jù)集的數(shù)據(jù)稀疏度為93.695%。

        (2)Epinions 數(shù)據(jù)集。該數(shù)據(jù)集包含了49 290 個(gè)用戶對139 738個(gè)項(xiàng)目的共664 824條評分信息,評分區(qū)間為1~5,評分值越大代表用戶對項(xiàng)目的喜愛程度越高。該數(shù)據(jù)集的數(shù)據(jù)稀疏度為99.99%。

        將實(shí)驗(yàn)數(shù)據(jù)隨機(jī)劃分為五組,選擇所有數(shù)據(jù)的80%作為訓(xùn)練集,20%作為測試集。實(shí)驗(yàn)采用五折交叉驗(yàn)證方法選擇測試集與訓(xùn)練集,以確保實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。

        3.2 測量指標(biāo)

        本實(shí)驗(yàn)采用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)來驗(yàn)證本文提出方法得到的預(yù)測結(jié)果。

        (1)MAE。采用絕對值計(jì)算誤差,可以直接反應(yīng)訓(xùn)練集的實(shí)際分?jǐn)?shù)與預(yù)測值的偏差情況。計(jì)算公式如下:

        其中,rui為用戶u對項(xiàng)目i的實(shí)際評分,preui為用戶u對項(xiàng)目i的評分預(yù)測值。N為測試集,| |N表示測試集中元素個(gè)數(shù),MAE 值越小,說明實(shí)際值與預(yù)測值越接近,預(yù)測結(jié)果越準(zhǔn)確。

        (2)RMSE。RMSE 對特別大或特別小的測量誤差反映敏感,能很好地反應(yīng)測量的精確性。計(jì)算公式如下:

        3.3 實(shí)驗(yàn)結(jié)果

        為驗(yàn)證在不同數(shù)據(jù)集下本文提出算法的推薦效果,在相同的實(shí)驗(yàn)環(huán)境下設(shè)計(jì)了3 組實(shí)驗(yàn),實(shí)驗(yàn)1 和實(shí)驗(yàn)2分別在MovieLens數(shù)據(jù)集和Epinions數(shù)據(jù)集上將提出的算法與SO 算法、WSO 算法以及文獻(xiàn)[6]提出的算法,即以余弦相似度定義用戶相似度,將用戶相似度與Weighted Slope One 結(jié)合得到的CSO 算法的實(shí)驗(yàn)結(jié)果進(jìn)行對比分析;實(shí)驗(yàn)3來進(jìn)一步分析所提出算法的時(shí)間性能。

        實(shí)驗(yàn)1 在MovieLens 100k標(biāo)準(zhǔn)數(shù)據(jù)集上分別按照各個(gè)算法進(jìn)行計(jì)算,得到評分預(yù)測值,將計(jì)算得到的CSO和GBSO兩種算法在不同K值下的MAE和RMSE值進(jìn)行比較分析,觀察其變化趨勢。其中,設(shè)當(dāng)前用戶的近鄰數(shù)為K=10,15,20,25,…,55。

        由于SO 算法和WSO 算法在計(jì)算時(shí)不考慮用戶之間的相似度,因此通過這兩種算法求得的MAE和RMSE為固定值,在折線圖上表現(xiàn)為一條直線,無變化趨勢。各算法實(shí)驗(yàn)結(jié)果見圖1、圖2。

        圖1 MovieLens數(shù)據(jù)集上各算法的MAE比較

        圖2 MovieLens數(shù)據(jù)集上各算法的RMSE比較

        從圖1、圖2可以觀察到,在近鄰數(shù)為[10,55]的取值區(qū)間內(nèi),隨著K值的增加,CSO模型和PSO模型的MAE值和RMSE值呈現(xiàn)下降趨勢,當(dāng)K>35 時(shí),通過CSO模型得到的MAE 值均低于SO 模型和WSO 模型,當(dāng)K>40 時(shí),通過CSO 模型得到的RMSE 值均低于SO 模型和WSO 模型,當(dāng)K>15 ,通過GBSO 模型得到的MAE 值和RMSE 值也均低于SO 模型和WSO 模型,這表明了相似用戶的選擇增加了預(yù)測的準(zhǔn)確度,考慮用戶相似度的算法得到MAE 值和RMSE 值優(yōu)于原始算法,這是由于原始算法未考慮用戶相似度問題,導(dǎo)致其在稀疏數(shù)據(jù)集中僅依靠用戶對項(xiàng)目的評分的有限信息進(jìn)行評分預(yù)測,實(shí)際情況中,相似的用戶的推薦采納度更高,引入用戶相似度能充分利用來自相關(guān)用戶的反饋信息,有效過濾掉不相關(guān)用戶對預(yù)測結(jié)果的影響,進(jìn)一步保證預(yù)測的可靠性,提高算法整體推薦質(zhì)量,且整體趨勢與推薦算法隨著近鄰數(shù)的增加,MAE 值和RMSE 值減小大體一致;此外,GBSO模型的MAE值和RMSE值隨著近鄰數(shù)的增加,其曲線呈現(xiàn)出先下降后緩慢上升的趨勢,說明如果選擇的相似用戶的比例太大或太小,會(huì)影響預(yù)測的準(zhǔn)確性。

        另外,通過比較圖1、圖2 還可以觀察到,在相同的最近鄰數(shù)目時(shí),隨著K值的增多,本文提出的利用均衡接近度灰關(guān)聯(lián)方法衡量用戶之間的相似性得到的MAE值和RMSE 值趨于穩(wěn)定的更早,即收斂速度更快,實(shí)驗(yàn)結(jié)果優(yōu)于CSO 模型,體現(xiàn)了均衡接近度灰關(guān)聯(lián)方法在貧信息系統(tǒng)中的優(yōu)勢,對提高推薦精度具有積極意義。

        實(shí)驗(yàn)2 在Epinions 數(shù)據(jù)集上,分別進(jìn)行MAE 和RMSE 值的計(jì)算,其中,設(shè)當(dāng)前用戶的近鄰數(shù)K=10,20,30,…,100。為了便于將實(shí)驗(yàn)結(jié)果與MovieLens 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果進(jìn)行對比,設(shè)置實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)1相同。SO 算法和WSO 算法在折線圖上也表現(xiàn)為一條直線,無變化趨勢。各算法實(shí)驗(yàn)結(jié)果見圖3、圖4。

        圖3 Epinions數(shù)據(jù)集上各算法的MAE比較

        圖4 Epinions數(shù)據(jù)集上各算法的RMSE比較

        通過圖3、圖4 可以看出,在Epinions 數(shù)據(jù)集上,隨著K值的增加,CSO 模型和PSO 模型的MAE 值和RMSE值都呈現(xiàn)下降趨勢,這兩種模型在該數(shù)據(jù)集上的下降趨勢要比在MovieLens數(shù)據(jù)集上的緩慢,但整體趨勢與MovieLens數(shù)據(jù)集是一致的。由于Epinions數(shù)據(jù)集更加稀疏,各算法計(jì)算得到的MAE 值和RMSE 值在相同最近鄰居數(shù)目時(shí)都比MovieLens數(shù)據(jù)集中的值要大,但是數(shù)據(jù)變化穩(wěn)定性卻優(yōu)于MovieLens數(shù)據(jù)集。

        此外,在該數(shù)據(jù)集上,CSO 模型得到的MAE 值和RMSE值均高于SO模型和WSO模型,實(shí)驗(yàn)結(jié)果誤差較大,推薦性能遠(yuǎn)遠(yuǎn)低于MovieLens 數(shù)據(jù)集,驗(yàn)證了在稀疏性較大的數(shù)據(jù)集上,通過余弦相似度來計(jì)算用戶相似度容易受到個(gè)別異常點(diǎn)的影響,數(shù)據(jù)丟失和信息失真情況更嚴(yán)重。而本文提出算法的MAE值和RMSE值在不同最近鄰數(shù)目時(shí),均低于其余三種算法,推薦效果更好,由此可知,本文提出的算法受數(shù)據(jù)稀疏性影響較小,在數(shù)據(jù)稀疏性較大的情況下也能得到較穩(wěn)定的推薦結(jié)果。另外,在Epinions數(shù)據(jù)集上所提出的算法的收斂速度也比MovieLens數(shù)據(jù)集快,再次說明在數(shù)據(jù)稀疏情況下所提出的算法可以獲得較好的穩(wěn)定性。

        實(shí)驗(yàn)3 以上兩組實(shí)驗(yàn)有效驗(yàn)證了所提出的算法可以在貧信息系統(tǒng)中有效提高算法推薦質(zhì)量,為了進(jìn)一步分析所提出算法的時(shí)間性能,在MovieLens數(shù)據(jù)集將其與原始Slope One 算法對用戶推薦的平均耗時(shí)進(jìn)行了對比分析,本文以25個(gè)近鄰用戶數(shù)量為準(zhǔn),實(shí)驗(yàn)結(jié)果如圖5所示。

        圖5 各算法平均耗時(shí)比較

        通過圖5可知,改進(jìn)算法的用戶推薦耗時(shí)在一定程度上略高于原始算法,主要是由于篩選用戶近鄰集合這一步驟增加了算法復(fù)雜度,但由于經(jīng)過近鄰集合過濾的相關(guān)用戶數(shù)遠(yuǎn)小于全局用戶數(shù),所以算法總體上的時(shí)間性能差別不大。

        以上三組實(shí)驗(yàn)結(jié)果表明,利用均衡接近度衡量用戶相關(guān)性得到的實(shí)驗(yàn)結(jié)果在推薦準(zhǔn)確度上都優(yōu)于原始SO、WSO 算法以及CSO 算法,雖然所提出算法的運(yùn)行時(shí)間相比原始算法偏高,但總體來說差別較小。而且本文提出的基于均衡接近度灰關(guān)聯(lián)的Slope One 算法受數(shù)據(jù)稀疏程度的影響較小,在K值較小的區(qū)間中MAE值和RMSE值也比其他算法小很多,且均低于其他算法的最低值,預(yù)測評分也更加準(zhǔn)確,具有明顯的特征,推薦質(zhì)量提高情況較好。

        4 結(jié)束語

        針對Slope One 算法沒有考慮用戶相似性而導(dǎo)致推薦準(zhǔn)確率不高的問題,本文提出了融合均衡接近度灰關(guān)聯(lián)的GBSO算法。最后的實(shí)驗(yàn)結(jié)果表明:通過計(jì)算用戶相似度,考慮近鄰用戶對預(yù)測結(jié)果的影響可以有效提高算法的推薦準(zhǔn)確率;均衡接近度灰關(guān)聯(lián)方法可以充分測量灰關(guān)聯(lián)因子序列間點(diǎn)的相關(guān)性,克服傳統(tǒng)相似度方法的缺點(diǎn),在貧信息系統(tǒng)中有效提高了推薦質(zhì)量。未來研究工作將進(jìn)一步考慮優(yōu)化模型離線處理用戶近鄰,提高算法運(yùn)算實(shí)時(shí)性,在提高推薦效果的同時(shí)更好地滿足用戶偏好。

        猜你喜歡
        關(guān)聯(lián)預(yù)測算法
        無可預(yù)測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        選修2-2期中考試預(yù)測卷(A卷)
        選修2-2期中考試預(yù)測卷(B卷)
        基于MapReduce的改進(jìn)Eclat算法
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        Travellng thg World Full—time for Rree
        進(jìn)位加法的兩種算法
        奇趣搭配
        不必預(yù)測未來,只需把握現(xiàn)在
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        亚洲精品久久区二区三区蜜桃臀 | 一本色道久久99一综合| 国产亚洲AV天天夜夜无码| 东京热日本道免费高清| 亚洲国产av自拍一区| 亚洲 自拍 另类小说综合图区| 在线观看av中文字幕不卡| 久久国产亚洲中文字幕| 日本中文字幕精品久久 | 中国农村妇女hdxxxx| 亚洲国产成人久久一区www妖精| 在线观看中文字幕一区二区三区| 亚洲精品在线视频一区二区| 国产亚洲精品精品精品| 99久久久无码国产aaa精品| 精品国产亚洲av麻豆尤物| 老女人下面毛茸茸的视频| 亚洲av无码精品国产成人| 亚洲影院天堂中文av色 | 中文字幕在线乱码一区| 亚洲日韩一区二区一无码| 欧美激情区| av二区三区在线观看| 日本精品视频免费观看| 国产精品国产三级国av在线观看| 久久免费区一区二区三波多野在| 日本一区二区高清在线观看| 妃光莉中文字幕一区二区| 国产精品久久久久影院嫩草| 国产精品一区二区三区精品| 国产又黄又湿又爽的免费视频| 久久久噜噜噜久久中文福利| 国产亚洲视频在线观看网址| 一区二区无码精油按摩| 国产一区二区三区在线大屁股| 亚洲国产精品无码专区影院| 狠狠色综合播放一区二区| 日本一二三区在线视频观看 | 亚洲不卡av一区二区三区四区| 国产激情综合在线观看| 狠狠色狠狠色综合|