亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA主題模型的矩陣分解推薦算法

        2020-12-04 05:24:16楊彥榮李亞雨
        數字通信世界 2020年11期
        關鍵詞:特征用戶方法

        楊彥榮,李亞雨

        (1.西北農林科技大學網絡與教育技術中心,陜西 楊凌 712100;2.西北農林科技大學信息工程學院,陜西 楊凌 712100)

        1 推薦算法

        隨著大數據時代的來臨,網絡信息資源呈現井噴式的增長,為人們提供了豐富的資源數據,但是網絡資源具有海量無序、異構和碎片化等特點,也給用戶帶來信息超載。在浩瀚的數據中,用戶搜尋自己所需資源愈發(fā)困難,為解決用戶高效的獲取所需資源的問題,推薦系統(tǒng)應運而出,并迅速得到廣泛應用。

        推薦算法可分為基于內容推薦、協(xié)同過濾推薦和混合推薦[1-3]?;趦热萃扑]選用特定的用戶或物品信息表征用戶喜好,進而篩選喜好相似度高的物品推薦給目標用戶。然而,基于內容的推薦方法依靠人工經驗選擇物品特征,然而人工選擇的特征往往無法全面、準確刻畫物品的內涵,同時也無法挖掘用戶的潛在興趣,推薦的都是差異不大的相似物品,導致推薦效果不佳。協(xié)同過濾算法是一種通過“近鄰”查找并進行預測目標用戶評分的方法,可分為用戶或是物品“近鄰”過濾。協(xié)同過濾推薦具有適應性強、易于實現和推薦結果可解釋性等優(yōu)點而被廣泛應用于不同領域。然而協(xié)同過濾推薦僅利用用戶評分數據,依據“近鄰”的評分預測目標用戶的評分,未考慮用戶和物品的屬性信息,然而在一個推薦系統(tǒng)中不是所有用戶都對物品進行評價反饋,相比于龐大的用戶和物品數量,有評分的數據是非常稀疏的,難以找到相似的用戶或是物品,導致相似度計算結果不夠準確,推薦效果也隨之下降。針對上述問題,本文提出一種潛在狄利克雷分布(LDA)的矩陣分解推薦方法,該方法使用 LDA主題模型學習項目潛在特征向量,然后將其融合到矩陣分解模型中,最后產生預測評分進行推薦。

        2 相關工作

        2.1 矩陣分解

        協(xié)同過濾推薦算法利用已有的用戶評分生成推薦,然而推薦系統(tǒng)中無論是用戶數量還是物品的數量都是非常龐大,在這種大級別數據量的情況下,依據生成的表征用戶或是物品的特征相量維度非常高,從而導致推薦的時間消耗呈現爆炸時增長,推薦的時效性受到限制。為解決該問題將矩陣分解應用到協(xié)同過濾推薦中,利用矩陣分解將評分矩陣拆解兩個低秩矩陣,再利用這兩個矩陣相乘還原評分矩陣,從而補全評分矩陣中不可觀察值[4-5]。具體為:首先利用用戶和物品交互數構建用戶-物品的評分矩陣,假定用戶-物品的評分數據為m個用戶對n個物品進行評分,一般評分為0至5分,0表示用戶為對該物品評分,1–5表示用戶對物品進行評分,并表示對該物品的喜愛程度,通過用戶為行和物品為列構建用戶評分矩陣R=[rij]∈Rmn;其次,在一個k維因子空間中,分別學習用戶和物品的潛在特征矩陣U∈Rmk,U∈Rnk,使得R≈UV,每一個物品j 都得到一個潛在特征向量qj∈Rk,每一個用戶i也得到一個向量pi∈Rk;最后,通過用戶和物品的潛在特征向量線性組合(內積)擬合用戶評分,由式(1)線性組合。

        為尋找最優(yōu)用戶特征U和物品特征V,通過構造并最小化目標函數來優(yōu)化分解模型,為防止模型過擬,引入正則化參數λ>0,目標函數為:

        式中,Rij表示真實評分,表示預測評分。

        2.2 LDA主題模型

        LDA是一種非監(jiān)督學習算法[6],包括文檔 -主題和主題 -詞語概率分布。基本思想認為寫一篇文檔時,先選定文檔主題,然后再依據選定的主題生成詞語。假定文檔集 D有M個文檔,一篇文檔包括 N個詞語,文檔集 D包括K個主題,利用θ和 φ分別表示文檔 -主題和主題 -詞語概率分布,則 LDA結構如圖1所示:

        圖1 LDA生成模型

        圖1中,α是一個K維向量,為θ的先驗分布參數;β為φ的先驗分布參數,α和β服從Dirichlet分布。LDA概率模型生成文檔的過程如下:

        第一步:為生成一篇文檔Di,首先在先驗分布α采樣得到生成文檔 -主題分布θi,θi是一個 K維向量,表示主題K與Di之間的分布,θi服從Dirichlet分布,即 θi~Dirichlet(α);

        第二步:從主題的多項式分布θi中取樣生成文檔i第n個詞的主題Zi,n;

        第三步:從在先驗分布β中采樣Zi,n對應的詞語分布 φk;

        第四步:從詞語的多項式分布 φk中取樣生成第 i個文檔的第 n個詞Wi,n,不斷重復第四步生成整個文檔。

        基于吉布斯采樣(Gibbs)和基于變分推斷 EM是主題模型學習參數的主要方法。

        3 基于LDA主題的矩陣分解推薦算法

        在個性化推薦中,矩陣分解模型能夠學習用戶和物品潛在特征,在學習潛在特征中對評分矩陣進行降維,在一定程度上緩解數據稀疏,從而推薦的效果有所提高。然而矩陣分解模型學習潛在特征時僅利用用戶評分數據,未考慮用戶和物品的屬性以及其他大量的其他輔助信息,如用戶性別、職業(yè)、年齡、物品名稱和標簽等。基于此本文提出結合 LDA主題模型和矩陣分解的推薦算法,充分利用用戶評分數據和物品的屬性信息提高推薦準確率。首先使用基于線性關系的 LDA主題模型對所有物品的屬性信息進行物品的潛在特性學習,一個物品的所有屬性信息相當于一篇文檔,使用項目在 K個主題上的分布表征物品的潛在特征θ;然后將物品潛在的主題特征作為約束向量融入到矩陣分解過程中。其結構如圖 3所示。

        圖2 基于LDA主題的矩陣分解模型結構

        圖2中,基于 LDA主題的矩陣分解模型結構分為兩部分,上半部分為 LDA模型,θ為物品的主題分布,通過θ約束物品的隱因子;下半部分為矩陣分解模型,R為評分,u和v分別為用戶特征和物品特征,用u和v的內積擬合用戶評分R。為優(yōu)化模型,構建最終目標函數為:

        4 實驗結果與分析

        4.1 實驗評價標準

        本文選用平均絕對偏差RMSE和均方根誤差MAE評估模型的性能。將目標用戶u對物品v的真實評分定義為ru,將推薦算法預測的目標用戶u對物品v的評分定義為preuv。RMSE和MAE能夠從不同的統(tǒng)計學角度衡量預測評分和實際評分之間的差距,其計算公式分別為(4)和(5)。

        4.2 實驗數據

        本文實驗數量采用MovieLen電影網站的數據集MovieLen(1M),該數據集是900多個用戶對1,600多部電影的10萬多條評分,評分范圍1–5,被廣泛用于電影推薦系統(tǒng)。在實驗中,將實驗按照8∶2的比例分為訓練集和測試集。

        4.3 結果分析

        為了評測不同推薦算法的性能,在本文的實驗中,選用常用的3種推薦算法作為實驗對比。在實驗中,選用不同的物品主題數K進行多次實驗,當LDA的主題數K采用5時,本文的方法的RMSE和MAE達到最小值,此時推薦效果最好,因而在后續(xù)的實驗中將LDA主題數K設置為5。表1為本文方法與其他3種方法推薦算的RMSE和MAE值。

        表1 本文方法與其他3種方法推薦算的RMSE和MAE值

        從表1中可以看出,本文方法的RMSE和MAE分別為0.8762和0.6809,均低于其他3種方法,尤其與基于內容推薦算法相比,RMSE和MAE分別降低了0.1388和0.2256,RMSE和MAE減小顯著。這表明本文提出的方法是有效的,結合LDA和矩陣分解推薦方法可以更加準確獲得項目特征表示,從而提升推薦算法的準確性。

        5 結束語

        本文提出一種基于LDA主題模型的矩陣分解推薦算法。該方法充分考慮物品屬性信息,通過LDA主題模型學習物品的主題特征向量,并將其應用到矩陣分解推薦中,預測用戶評分從而產生推薦列表,在一定程度上緩解了評分數據稀疏對推薦結果的影響。在MovieLen(1M)上的實驗結果表明,與基于內容推薦、基于用戶協(xié)同過濾和PMF方法相比,本文算法的RMSE和MAE值最小,與基于內容推薦算法相比,RMSE和MAE分別降低了0.1388和0.2256,RMSE和MAE減小顯著,表明本文方法的推薦效果最佳。然而本文僅考慮物品的輔助信息,未考慮用戶屬性信息,而且沒有對項目的隱含向量進行優(yōu)化,這將是下一步研究工作的重點。

        猜你喜歡
        特征用戶方法
        如何表達“特征”
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        抓住特征巧觀察
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        可能是方法不對
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        捕魚
        国产三级三级三级看三级日本| 成片免费观看视频大全| 欧美性群另类交| 天堂69亚洲精品中文字幕| 亚洲蜜臀av一区二区三区漫画| 国内精品免费一区二区三区| 在线视频一区二区国产| 日韩精品无码一区二区三区四区 | 久久久精品电影| 国产激情在线观看视频网址| 狠狠躁夜夜躁人人爽超碰97香蕉| 国产亚洲精品资源在线26u| 国产爆乳乱码女大生Av| 一区二区免费国产a在亚洲| 99久久国产精品网站| av一区二区三区人妻少妇| 国产亚洲精品日韩综合网| 国产精品一区二区三区三| 亚洲精品乱码久久久久久不卡| 久久精品人人做人人爽电影蜜月| 成人日韩av不卡在线观看| 一本色道久久88加勒比—综合| 久久久久亚洲av综合波多野结衣| 丰满人妻熟妇乱又伦精品视| 欧美性福利| 亚洲素人av在线观看| 亚洲乱码中文在线观看| 国产成人免费一区二区三区| 午夜福利不卡无码视频| 极品夫妻一区二区三区 | 午夜成人精品福利网站在线观看 | 国产av在线观看一区二区三区| 久久久久亚洲av成人网人人网站| 精品人无码一区二区三区| 一区二区日本影院在线观看| 免费a级毛片在线播放| 国产av一区二区精品久久凹凸| 国产成人福利在线视频不卡| 国产成人亚洲精品91专区高清| 亚洲av成人噜噜无码网站| 精品亚洲成a人7777在线观看|