亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        推薦系統(tǒng)中考慮流行程度差異的評分預(yù)測算法

        2021-11-28 11:55:48何光波陳唯一何遠濟
        軟件導刊 2021年11期
        關(guān)鍵詞:置信相似性準確度

        王 寧,張 巍,蘇 湛,何光波,陳唯一,何遠濟

        (上海理工大學光電信息與計算機工程學院,上海 200093)

        0 引言

        互聯(lián)網(wǎng)技術(shù)的不斷進步為人類帶來了極大便利,人們可以通過互聯(lián)網(wǎng)隨時隨地獲取各種信息,但海量的信息增加了人們獲取信息的復雜性,預(yù)測用戶個性化偏好并向用戶推薦過濾之后的信息是解決這一問題的重要手段。推薦系統(tǒng)就是通過預(yù)測來過濾掉用戶不感興趣的低評價信息或商品,并向用戶提供基于其偏好的個性化內(nèi)容來解決這個問題。因此,相關(guān)研究在領(lǐng)域內(nèi)廣泛開展,并在相關(guān)服務(wù)中廣泛應(yīng)用,這種方法極大提高了用戶的體驗感[1-2]。

        目前,推薦系統(tǒng)相關(guān)研究涉及電影推薦[3]、電子商務(wù)[4]、圖書[5]、市場應(yīng)用[6]、電視[7]、社交網(wǎng)絡(luò)[8]、網(wǎng)絡(luò)搜索[9]等領(lǐng)域。在推薦系統(tǒng)研究中,協(xié)同過濾算法(Collaborative Filtering,CF)是應(yīng)用最廣泛的一種方法。該方法基于用戶對物品的歷史評分來計算用戶兩兩之間的相似性,并尋找與目標用戶相似度高的鄰居,基于鄰居的評分來預(yù)測目標用戶的可能評分[10],其理論依據(jù)是:如果兩個用戶對相同物品的歷史評分相似,那么他們就擁有相似的“品味”或“偏好”,其中一個用戶對某個物品的未來評分就可以通過另一個用戶對該物品的歷史評分預(yù)測出來。

        協(xié)同過濾算法的基本方法是通過計算用戶之間[11](基于用戶)或者物品之間[12](基于物品)的相似性,基于用戶對物品評分的預(yù)測結(jié)果進行推薦[13]?;谙嗨菩缘膮f(xié)同過濾算法包括3 個步驟:①基于各種相似性算法生成用戶間相似度的相似矩陣;②選擇與目標用戶相似度最高的n個用戶作為該用戶的鄰居集合;③向目標用戶推薦預(yù)測評分高的物品。基于Pearson 相關(guān)系數(shù)的協(xié)同過濾算法和基于Cosine 相似性的協(xié)同過濾算法是常見的基于用戶相似性的協(xié)同過濾算法。為了使評分預(yù)測更加精確,也可基于用戶觀點傳播(User Opinion Spreading,UOS)等方法來計算用戶間的相似性。

        盡管計算相似性算法很多,但這些方法都沒有充分考慮流行度對預(yù)測結(jié)果的影響。針對這一現(xiàn)狀,本文針對以下兩個問題對推薦算法進行研究。

        (1)在用戶間計算相似性時,兩個用戶評分過的物品是相似性計算的基礎(chǔ),在相似性計算中他們共同評過分的物品數(shù)量過多或者過少一般都不予考慮。在這種情況下,本文研究在相似性計算過程中引入一個基于用戶間相同歷史評分數(shù)量的置信系數(shù)來調(diào)整這些歷史評分在相似性計算中所占的權(quán)重。

        (2)不同用戶或物品在推薦系統(tǒng)中的流行程度是不同的,如對于一個流行度高的物品會有大量用戶評分,無論用戶對其評分是高還是低,流行度高的物品比流行度低的物品在預(yù)測時更多地影響預(yù)測結(jié)果。因此,在預(yù)測用戶對物品評分時引入物品流行程度系數(shù),使預(yù)測評分更加接近于真實情況。本文主要研究置信系數(shù)和物品流行度的引入對預(yù)測準確度產(chǎn)生的影響。

        1 實驗內(nèi)容

        1.1 置信系數(shù)對相似度計算的影響

        現(xiàn)有研究表明,用于計算用戶相似性的兩用戶間共同歷史評分數(shù)目會對預(yù)測結(jié)果產(chǎn)生影響。為解決該問題,本文將置信系數(shù)引入相似性計算,以此改善評分數(shù)目對實驗帶來的影響。置信系數(shù)計算公式如下:

        式中,CC(tuv)表示u用戶與v用戶之間的置信系數(shù)結(jié)果,tuv表示u用戶與v用戶同時評過分的物品數(shù)目。

        當兩個用戶之間的共同評分數(shù)目tuv>5 時,CC(tuv)的值會按照對數(shù)函數(shù)單調(diào)增大;而當0

        1.2 物品流行度對相似性網(wǎng)絡(luò)的影響

        本文基于文獻[14]、[15]的研究結(jié)果來構(gòu)建物品與物品間的復雜網(wǎng)絡(luò),并用度值表示用戶的流行度,用此網(wǎng)絡(luò)研究流行度對預(yù)測用戶評分的影響。結(jié)果表明,流行度高的用戶在預(yù)測評分過程中其作用被高估,這對預(yù)測評分的準確度帶來很大影響。為解決這個問題,在評分預(yù)測公式計算中引入流行度數(shù)據(jù)以提高評分預(yù)測準確度。

        2 基于流行程度差異的推薦系統(tǒng)評分預(yù)測算法

        本文采用置信系數(shù)來改進Pearson 算法進行相似度計算,以提高相似性計算的準確性。

        本文進行相似度計算中考慮了評分數(shù)目對用戶偏好的影響,公式如下:

        其中是用戶u對物品i的評分,是用戶u的平均評分,CC(tuv)由公式(1)給出。

        基于公式(2)給出的用戶間相似性進行復雜網(wǎng)絡(luò)建模,以用戶為節(jié)點,以相似性為邊,構(gòu)建用戶—用戶復雜網(wǎng)絡(luò)。在此網(wǎng)絡(luò)中計算用戶節(jié)點的度值中心性,并根據(jù)相似性結(jié)果選擇一組合適的鄰居,由鄰居節(jié)點的度值權(quán)重、鄰居的評分數(shù)據(jù)以及目標用戶與鄰居用戶的相似性關(guān)系對目標用戶的評分進行預(yù)測?;诹餍谐潭炔町惖耐扑]系統(tǒng)評分預(yù)測算法簡記為PopularPearson 算法,算法步驟如下:①用置信系數(shù)對皮爾遜相似性計算公式進行改進,提高用戶間的相似性準確度;②按照得到的用戶間相似性與用戶節(jié)點構(gòu)建用戶—用戶復雜網(wǎng)絡(luò)模型;③根據(jù)此模型進行用戶節(jié)點的中心性計算;④每個預(yù)測目標用戶選擇一組合適的鄰居;⑤依據(jù)選擇的鄰居集、鄰居的評分、改進后得到的相似性和度值中心性對目標用戶進行預(yù)測評分。

        圖1 是PopularPearson 得到的相似性復雜網(wǎng)絡(luò)模型(彩圖掃OSID 碼可見,下同)。相似性網(wǎng)絡(luò)中的節(jié)點代表用戶,節(jié)點大小表示用戶度值的大小,節(jié)點與節(jié)點之間的鏈接為用戶間的相似性,鏈接的長度表示用戶間相似度的大小,不同顏色標記了用戶所屬的不同社團。

        Fig.1 An example of complex network modeling based on weighted similarity of confidence coefficients圖1 基于置信系數(shù)加權(quán)相似性的復雜網(wǎng)絡(luò)建模實例

        度值對于評分的預(yù)測有一定影響,如對于某個目標用戶u,通過相似性計算得到不同的鄰居v1,v2,v3,如果Suv1=Suv2=Suv3,即用戶u與3 個鄰居用戶的相似度一致時,可以根據(jù)文獻[16]的研究結(jié)果對鄰居賦予不同權(quán)重。對目標評分進行預(yù)測公式如下:

        式(3)中,表示對于目標用戶u的預(yù)測評分;表示用戶v的平均評分;rvi表示用戶v對i的評分;n表示選取的預(yù)測用戶總數(shù);Degree?(v)表示用戶v歸一化之后的度值。

        3 實驗設(shè)置

        3.1 數(shù)據(jù)集與參數(shù)

        為驗證本文算法的預(yù)測效果,選用了MovieLens 作為測試數(shù)據(jù)集。MovieLens 數(shù)據(jù)集中含有671 位用戶關(guān)于9 125 部電影的10 萬條評分數(shù)據(jù)。

        本文選擇折十驗證方法進行測試。將MovieLens 數(shù)據(jù)集隨機分為10 份,每份數(shù)據(jù)量差不多。首先選擇其中一組為測試集進行驗證,其余9 組均為訓練集,然后依次完成10次實驗,每次選擇不同的一組為測試集,另9 組為訓練集,這樣使每組數(shù)據(jù)都能被預(yù)測。對10 次測試結(jié)果取平均值檢查算法的準確度。

        3.2 算法比較

        采取多種算法分別進行實驗測試的方式比較其預(yù)測效果。選擇進行比較的算法有資源分配RA 算法、SlopeOne算法、用戶觀點傳播UOS-opt 算法、Cosine 協(xié)同過濾算法、多級協(xié)同過濾MLCF 算法等。

        3.3 評估標準

        在衡量預(yù)測結(jié)果好壞問題上選擇平均絕對誤差(MAE)、均方根誤差(RMSE)與排序性能指標半衰期(HLU)3 個度量標準。通過實驗將獲得的預(yù)測評分數(shù)據(jù)與測試集中用戶的實際評分進行比較,計算出對應(yīng)的MAE、RMSE 以及HLU 值,其中MAE、RMSE 的值越小,實驗預(yù)測評分準確度越高;(HLU)值越大,推薦列表中物品的排序越準確。

        MAE、RMSE、HLU 的計算公式如下:

        其中,n表示測試集中的用戶數(shù);rui表示用戶u對i的實際評分值表示實驗中預(yù)測的用戶u對i的評分值;d表示用戶的平均評分;N表示物品數(shù);h在本文實驗中設(shè)置為2。

        4 實驗結(jié)果與分析

        4.1 比較參數(shù)

        采用MAE、RMSE、HLU 三組參數(shù)比較各種算法的預(yù)測效果,由MAE、RMSE、HLU 的值得出各種算法在預(yù)測評分中的誤差程度與排序準確性,以探究本文基于物品流行程度改進的預(yù)測算法有效性。

        4.2 實驗過程

        對MovieLens 數(shù)據(jù)集采用折十驗證方法對算法進行實驗測試,實驗結(jié)果證明本文設(shè)計的基于流行程度差異的推薦系統(tǒng)評分預(yù)測算法在測試集中表現(xiàn)出很好的預(yù)測準確度,在評分準確度上比其它7 種算法提高很多,而且在達到最佳準確度時所需的鄰居更少。

        從圖2 可以很清楚地看到不同算法在不同鄰居數(shù)時平均絕對誤差(MAE)的變化情況。其中,PopularPearson 算法下的MAE 值最小,為0.636 9,第二名UOS-opt 算法為0.653 4,PopularPearson 算法比UOS-opt 算法在性能上提高了2.5%,平均提高了3.48%。

        圖3 表示不同算法在不同鄰居數(shù)量時對應(yīng)的均方根誤差(RMSE)變化趨勢,從圖中可以看出,基于PopularPearson算法的RMSE 值最小,約為0.837 5,UOS-opt 算法的RMSE值約為0.857 7,PopularPearson 算法比第二名在性能上提高了約2.4%,平均提高3.38%。

        圖4 為在選擇不同鄰居數(shù)時不同算法的排序性能指標(HLU)變化情況,可以清楚看到,PopularPearson 算法下的HLU 值最大,達到1.161 9,而第二名MLCF 算法下的HLU值只有1.126 6,最優(yōu)預(yù)測下PopularPearson 算法比MLCF 算法在排序準確性上提高了3.13%,平均提高了1.78%。

        Fig.2 Comparison of MAE results of various algorithms with different numbers of neighbors圖2 各種算法在不同鄰居數(shù)量下MAE 結(jié)果對比

        Fig.3 Comparison of RMSE results of various algorithms with different neighbor numbers圖3 各種算法在不同鄰居數(shù)量下RMSE 結(jié)果對比

        Fig.4 Comparison of HLU results of various algorithms with different numbers of neighbors圖4 在不同鄰居數(shù)目下各種算法的HLU 結(jié)果對比

        綜合3 個圖中的實驗結(jié)果數(shù)據(jù)可知,本文設(shè)計的Popu?larPearson 算法在預(yù)測準確度上高于其它幾種算法。

        5 結(jié)語

        本文研究了推薦系統(tǒng)相似性網(wǎng)絡(luò)模型中流行程度差異對預(yù)測準確性和推薦列表排序效果的影響,設(shè)計了一種新的推薦系統(tǒng)評分預(yù)測算法,利用用戶相似性網(wǎng)絡(luò)模型中不同用戶度值大小來表示其流行性差異,并基于流行性差異設(shè)計了預(yù)測方法。融合用戶流行度差異和用戶評分偏好特征對未知評分進行預(yù)測。

        在MoiveLens 數(shù)據(jù)集中的折十驗證實驗表明,本文方法的預(yù)測結(jié)果準確度比其它傳統(tǒng)算法相比有明顯改善,以MAE 和RMSE 指標度量,比算法UOS 的預(yù)測準確度提高了3%以上。

        研究結(jié)果表明,本文設(shè)計的算法在預(yù)測評分時性能優(yōu)越,并揭示了推薦系統(tǒng)中流行程度差異對評分預(yù)測結(jié)果有較大影響,合理利用這一信息可以有效提高推薦算法性能。

        猜你喜歡
        置信相似性準確度
        一類上三角算子矩陣的相似性與酉相似性
        急診住院醫(yī)師置信職業(yè)行為指標構(gòu)建及應(yīng)用初探
        基于置信職業(yè)行為的兒科住院醫(yī)師形成性評價體系的構(gòu)建探索
        基于模糊深度置信網(wǎng)絡(luò)的陶瓷梭式窯PID優(yōu)化控制
        陶瓷學報(2021年2期)2021-07-21 08:34:58
        淺析當代中西方繪畫的相似性
        河北畫報(2020年8期)2020-10-27 02:54:20
        幕墻用掛件安裝準確度控制技術(shù)
        建筑科技(2018年6期)2018-08-30 03:40:54
        動態(tài)汽車衡準確度等級的現(xiàn)實意義
        低滲透黏土中氯離子彌散作用離心模擬相似性
        基于CUDA和深度置信網(wǎng)絡(luò)的手寫字符識別
        高爐重量布料準確度的提高
        天津冶金(2014年4期)2014-02-28 16:52:58
        美女免费观看一区二区三区| 欧美视频第一页| 久久国产A∨一二三| 一卡二卡国产av熟女| 日韩一二三四区免费观看| 久久精品一区二区三区蜜桃| 亚洲香蕉成人av网站在线观看| 国产在线精品一区二区三区不卡| 亚洲色图在线观看视频| 激情综合五月天开心久久| 久久伊人精品色婷婷国产| 亚洲av成人片色在线观看高潮| 精品国产一区二区三区久久狼| 日韩精品永久免费播放平台 | 丝袜美腿诱惑区在线播放| 视频在线国产一区二区| 国产精品18久久久| 激情五月婷婷综合| 亚洲高清av一区二区| 人妻少妇偷人精品久久性色av| 玩弄放荡人妻少妇系列| 国产成人8x视频网站入口| 亚洲av网站在线免费观看| 久久久久久av无码免费网站下载| 国产又滑又嫩又白| 久久99精品波多结衣一区| 蜜桃成人精品一区二区三区| 亚洲精品无码久久久久y| 亚洲av无码不卡| 亚洲AV无码一区二区三区少妇av| 国产情侣自拍偷拍精品| 久久亚洲精品国产亚洲老地址| 性久久久久久久| 无码成年性午夜免费网站蜜蜂| 精品在线观看一区二区视频| 粗大的内捧猛烈进出视频| 在线播放国产女同闺蜜| 久久精品国产亚洲av沈先生| 久久亚洲日韩精品一区二区三区| 色94色欧美sute亚洲线路二| av在线免费播放网站|