亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        引入興趣穩(wěn)定性的時間敏感協(xié)同過濾算法

        2018-06-01 10:50:36孫福振
        計算機工程與應用 2018年11期
        關鍵詞:用戶實驗評價

        張 旭,孫福振,方 春,郭 蕊

        ZHANG Xu,SUN Fuzhen,FANG Chun,GUO Rui

        山東理工大學 計算機科學與技術學院,山東 淄博 255049

        College of Computer Science and Technology,Shandong University of Technology,Zibo,Shandong 255049,China

        1 引言

        《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示,截至2015年6月,中國互聯(lián)網(wǎng)網(wǎng)民規(guī)模達6.68億[1]。伴隨著信息技術飛速發(fā)展,信息量也發(fā)生著爆炸式的增長,信息過載問題也日益突出。在海量信息中用戶很難發(fā)現(xiàn)自己需要的,感興趣的部分。而推薦系統(tǒng)是在用戶沒有明確需求的情況下,通過分析用戶歷史行為數(shù)據(jù)給用戶進行興趣建模,然后將用戶可能感興趣的信息推薦給用戶。

        協(xié)同過濾推薦是迄今應用最成功、最成熟的技術之一,其主要分為兩類:基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾[2]?;谖锲返膮f(xié)同過濾推薦算法的思想是根據(jù)用戶的歷史行為數(shù)據(jù)分析計算得出用戶的行為偏好,據(jù)此用戶偏好給用戶做出推薦。其前提假設是,在未來的一段時間內用戶的興趣偏好是不變化的。而傳統(tǒng)的基于用戶的協(xié)同過濾推薦算法的思想是根據(jù)用戶A的行為數(shù)據(jù)計算出和用戶A具有相似偏好的鄰居用戶,然后將鄰居用戶感興趣的物品且用戶A還沒有發(fā)現(xiàn)的物品推薦給用戶A。雖然協(xié)同過濾取得了很大成功,但也存在時間動態(tài)性問題,物品流行偏執(zhí)等問題。

        針對協(xié)同過濾技術中的動態(tài)性問題,文獻[3]加權時間權重和資源相似度的數(shù)據(jù)權重,提出了適應用戶興趣的推薦算法,沒有考慮用戶短期興趣和長期興趣的穩(wěn)定性。文獻[4]提出了一種動態(tài)推薦技術,考慮了時間信息,并沒有涉及用戶興趣穩(wěn)定性。隨著移動設備蓬勃發(fā)展,文獻[5]提出了一種SUCM模型來學習細粒度的用戶偏好給用戶做推薦,沒有考慮時間敏感和用戶興趣穩(wěn)定性。本文從時間和興趣穩(wěn)定性角度出發(fā),考慮用戶興趣穩(wěn)定的情況下引入時間敏感因子,進而給用戶產生動態(tài)推薦,實驗表明,該模型降低了推薦誤差。

        針對物品流行偏執(zhí)問題,文獻[6-8]提出了運用近鄰度、影響力和普及性三方面綜合考慮用戶評分對用戶之間相似度的影響。文獻[9]提出了一種啟發(fā)式相似度計算模型,提高了用戶之間的相似度。文獻[10-12]通過使用自編碼方式來提高topN推薦質量。文獻[13]利用社交網(wǎng)絡,分析社交群體中的強弱關系,提出一種EM算法來提高推薦質量。文獻[14-15]不是從相似度計算模型而是通過改變推薦結果的流行度分布來緩解偏執(zhí)問題。而本文在相似度建模階段通過將所有物品流行度進行“裝箱化”,然后根據(jù)用戶實際評分映射“箱子”,映射生成三維的基于物品流行度的用戶興趣特征向量——“向量化”,進而計算用戶之間的相似度。

        綜上所述,針對協(xié)同過濾中的流行偏執(zhí)問題和時間動態(tài)性問題,本文考慮時間敏感的用戶興趣穩(wěn)定性,以及物品流行度因素對用戶之間相似度的影響,提出了一種引入興趣穩(wěn)定性的時間敏感協(xié)同過濾算法。實驗表明,該算法能夠有效降低推薦誤差,挖掘長尾物品,緩解物品流行偏執(zhí)現(xiàn)象。

        2 方法介紹

        2.1 基于物品流行度的用戶興趣特征相似度模型

        定義1(物品i的流行度定義)所有用戶對物品i的評價次數(shù)之和與物品總數(shù)的比值。公式如下:

        其中,counti表示有多少個用戶對物品i進行了評價,countI表示物品總數(shù)。

        算法描述:

        (1)取三個物品流行度區(qū)間[a1,a2),[b1,b2),[c1,c2)。

        (2)用公式 popularityi計算用戶u已經評價的所有物品的流行度。

        (3)將步驟(2)中用戶計算的所有物品的流行度先裝箱,然后映射到步驟(1)。

        裝箱偽代碼為:

        說明:a1,a2,b1,b2,c1,c2是根據(jù)實驗取得的閾值數(shù)據(jù)。

        映射偽代碼為:

        (4)將步驟(3)中生成的 featurevector用戶特征向量采用余弦相似度公式來計算用戶A和用戶B的基于物品流行度的用戶興趣特征相似度。公式描述如下:

        上述模型稱為Item_pop_sim模型,簡稱IPS模型。

        2.2 引入興趣穩(wěn)定性的時間敏感相似度模型

        在實際應用過程中,用戶的興趣通常具有易變性,不僅與用戶對物品評分數(shù)值有關,還與物品的流行度有關,這兩者加權構成了用戶的興趣度。用戶興趣度定義如下:

        定義2(用戶u的興趣度)是由用戶u對i個物品的興趣向量組成的向量集合Pu=(Pu1,Pu2,…,Pui)。

        定義3(用戶u的第i個物品興趣向量)用戶u評價的第i個物品的實際評分值與滿分值的比值再加權該物品的流行度。公式描述如下:

        其中,Pui表示用戶u對第i個項目的興趣程度,Rui表示用戶u對物品i的打分值,Rmax表示該物品的滿分值,popularityi表示公式(1)中定義的物品i的流行度,popularitymax表示所有物品的最大流行度,popularitymin表示所有物品的最小流行度。α,β表示參數(shù),且α+β=1,該參數(shù)可以通過實驗驗證得出。同樣,使用余弦相似度來計算用戶u和用戶v之間的興趣相似度,公式描述如下:

        該模型通過引入帶權值的物品流行度可以有效地緩解用戶打分偏置的問題。

        定義4(用戶u的興趣穩(wěn)定性)用戶u評價的所有物品評分數(shù)值的方差。公式描述如下:

        其中,ui表示用戶u評價的第i個物品的評分值,n為用戶u評價的所有物品的總數(shù),μ為用戶u評價的所有物品評分值的平均值。方差的大小來衡量用戶興趣的穩(wěn)定性,即方差越小用戶興趣越穩(wěn)定。

        現(xiàn)實中,用戶的興趣往往不是一成不變的,可能受自身因素的影響,周圍環(huán)境,興趣會隨著時間的流逝潛移默化,很早之前的興趣可能會逐漸淡忘或者消失。本文從影響用戶興趣的因素出發(fā),給出了時間敏感的表征。

        定義5(時間敏感)在兩個用戶興趣穩(wěn)定的基礎上,兩用戶對物品的評分時間越相近則用戶間的興趣相似度就越高,即用戶的興趣相似度對時間敏感。

        考慮到用戶興趣隨著時間的增長可能會發(fā)生變化,本文引入 e-φ| |tui-tvi為時間敏感因子,以天為單位且兩用戶評分時間越相近,表明用戶的區(qū)域時間段內興趣相似度就越高。

        為建模用戶興趣的時間敏感動態(tài)性,本文提出了一種時間敏感的用戶興趣穩(wěn)定性相似度計算模型。公式如下:

        其中,σu=σu-σmed,σv=σv-σmed,σu和 σv分別表示用戶u和用戶v分別去中心化后的評分方差,σmed是指評分方差的中值,通過統(tǒng)計分析可以得出,方差大部分在0.5到1.5之間,所以σmed=1,δ表示實驗取得的參數(shù),其中,δ∈(0,1)。Iu?Iv表示用戶u和用戶v共同評分的物品交集,tui和tvi分別表示用戶u和用戶v對物品i的評價時間。φ表示實驗取得的參數(shù),其中,φ∈(0,1)。∑X2和∑Y2表示用戶u和用戶v對物品評分值的平方和。上述公式(8)中的模型稱為Stability_Time_Sim模型,簡稱為STS模型。

        2.3 兩種相似度模型的融合

        上面介紹了兩種相似度模型各有各的優(yōu)點,其中基于物品流行度的用戶興趣特征相似度模型可以有效地緩解物品偏置問題,引入時間敏感的用戶興趣穩(wěn)定性的相似度模型可以實時抓住用戶興趣,挖掘長尾物品,提高推薦系統(tǒng)的新穎度。所以為了使推薦效果更好,不增加算法時間復雜度且易于實現(xiàn)起見,將兩種模型進行線性加權,提出了Item_Pop_Stability_Time_Sim函數(shù)模型。公式描述如下:

        其中,λ為實驗取得的參數(shù)且λ∈[0,1]。關于λ取值對于模型的影響,見本文3.3.3節(jié)詳細分析。

        上述模型簡稱IPSTS模型,IPSTS模型綜合考慮了用戶興趣的穩(wěn)定性、時間敏感情況,以及物品流行度等因素。綜合這些因素進行建模,實驗表明,加權后的相似度模型在推薦質量上有明顯提高。

        3 實驗設計及分析

        3.1 實驗數(shù)據(jù)集

        本文實驗所用的數(shù)據(jù)集是美國Minnesota大學GroupLens小組開發(fā)的MovieLens站點所提供的數(shù)據(jù)集。MovieLens建立于1997年,是一個基于Web的推薦系統(tǒng),目前,該站點提供三種不同數(shù)量級的數(shù)據(jù)集,分別為:943個用戶對1 682部電影的10萬條評分的數(shù)據(jù);6 040個用戶對3 900部電影評分的100萬條數(shù)據(jù);71 567個用戶對10 681部電影做出的1 000萬條評分數(shù)據(jù)。

        本文實驗采用了943個用戶對1 682部電影的10萬條評分數(shù)據(jù)集,其中每個用戶至少對20部電影進行了評價。該數(shù)據(jù)集的稀疏等級為1-100 000/(943×1 682)=0.937,本文將實驗數(shù)據(jù)集劃分為訓練集和測試集,其中訓練集占80%,測試集占20%。

        3.2 評價標準

        本文采用的推薦質量的評價標準分別是平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)[16]。平均絕對誤差(MAE)公式如下:

        均方根誤差(RMSE)公式如下:

        3.3 實驗結果

        實驗比較了IPSTS模型與Pearson(皮爾森)模型以及Euclide(歐幾里德)模型在推薦質量上的差異,第一步先考查當參數(shù)δ和參數(shù)λ固定時,隨著鄰居數(shù)量逐漸增多,三種模型在RMSE和MAE兩個評價標準上的效果。第二步固定鄰居數(shù)量,考查當參數(shù)δ和參數(shù)φ以及參數(shù)λ按照相應的步長逐漸增長時,三種模型在RMSE和MAE兩個評價標準上的效果。

        3.3.1 IPSTS模型實驗結果

        圖1顯示出取不同鄰居時,各個相似度計算模型對RMSE的影響。其中鄰居數(shù)量分別為10,20,30,40,50,60,70,80,90。分析得出,IPSTS模型計算的均方根誤差(RMSE)比Euclide和Pearson模型計算的均方根誤差(RMSE)都要低(例如:當鄰居數(shù)量為20時,本文提出的IPSTS模型比Pearson模型要低6%左右,比Euclide模型要低30%左右)。所以,降低了誤差,提高了推薦質量。

        圖1 IPSTS、Pearson、Euclide三種模型RMSE對比圖

        圖2 顯示出取不同鄰居時各個相似度計算模型對MAE的影響折線圖。其中鄰居數(shù)量分別為55,60,65,70,75,80,85,90。分析得出,IPSTS模型計算的平均絕對誤差(MAE)比Euclide和Pearson模型計算的平均絕對誤差(MAE)都要低(例如:當鄰居數(shù)量為80時,IPSTS模型比Pearson模型要低1%左右,比Euclide模型要低8%左右)。所以,提高了推薦質量。

        圖2 IPSTS、Pearson、Euclide三種模型MAE對比圖

        在實驗中,參數(shù)的選取是至關重要的,為了讓實驗達到滿意的效果,同時充分測試算法的健壯性和適用性,更為了優(yōu)化算法,本節(jié)對δ取值選取進行了實驗,為了盡可能地排除其他因素干擾,僅僅檢驗δ對IPSTS模型的影響,取鄰居數(shù)量為50,參數(shù)λ取0.2時,檢驗隨著δ的遞增,IPSTS模型在RMSE評價標準上的效果。如圖3所示。

        圖3 參數(shù)δ變化對IPSTS模型的影響

        3.3.3 參數(shù)λ對IPSTS模型的影響

        同時,為了檢驗權重參數(shù)λ對IPSTS模型的影響,結合上一節(jié)實驗結果取鄰居數(shù)量為50,參數(shù)δ取0.014時,檢查隨著λ的增長,IPSTS模型在RMSE評價標準上的效果。

        圖4顯示,從0.1開始,隨著λ的增長,RMSE是先減少后增長,然后增長到一定的數(shù)值后再下降,之后,隨著λ的增長,RMSE基本上趨于緩和。由圖4可知,當λ取0.2時,RMSE最小。所以,在IPSTS模型中,參數(shù)λ取0.2最優(yōu)。

        圖4 參數(shù)λ變化對IPSTS模型的影響

        3.3.4 參數(shù)φ對IPSTS模型的影響

        為了檢驗參數(shù)φ對IPSTS模型的影響,結合上一節(jié)實驗,鄰居數(shù)量固定為50,λ取0.2,δ取0.014。

        圖5顯示,當φ取1.0時,RMSE最小。因此,在IPSTS模型中,參數(shù)φ取1.0最優(yōu)。

        3.3.5 IPSTS模型對長尾物品的影響

        圖5 參數(shù)φ對IPSTS模型的影響

        由圖6可知,這些物品存在長尾現(xiàn)象。其中,物品ID越靠前,流行度越高,ItemID在1 000之后的為長尾物品。為檢驗IPSTS模型對長尾物品的挖掘能力,實驗如下:隨機選取3個用戶,對3個用戶分別進行top5(推薦前5個)推薦,用戶ID分別為80,800,888。userID為需要進行推薦的用戶編號,RecommenderSize=5為推薦列表大小,NeighborSize(鄰居數(shù)量)=90。Pearson模型中RMSE=0.335 60,IPSTS模型中RMSE=0.329 65。

        銀行業(yè)的發(fā)展離不開創(chuàng)新技術的支持,當前銀行業(yè)要想提升自身的競爭力,同樣需要借助新技術的支持與應用。但是,在應用新技術的時候需要能夠適應銀行的高風險、高收益、運轉周期長的特點,并形成一個新型的金融服務方式,以此來促使更多的資金支持技術創(chuàng)新。同時,銀行業(yè)還需要不斷的提升互聯(lián)網(wǎng)技術的更新,運用人工智能、云技術等現(xiàn)代化的科技來提升銀行業(yè)的服務效率,降低成本,以此來提升銀行業(yè)的服務實體經濟能力,促使銀行業(yè)更好的發(fā)展。

        圖6 物品ID與物品流行度散點圖

        表1(ItemID為推薦的物品編號)顯示,IPSTS模型在降低了RMSE的基礎上,提高了推薦質量的同時,能夠挖掘出物品編號為1 467,1 189的長尾物品給用戶進行推薦,對長尾現(xiàn)象起到了一定的緩解作用,可以給用戶帶來驚喜。

        表1 userID為80時Pearson模型與IPSTS模型推薦比較

        同樣,表2(ItemID為推薦的物品編號)顯示,采用IPSTS模型相比Pearson模型而言,挖掘出了1 159,1 121,1 103三個長尾物品推薦給用戶,能夠給用戶帶來新鮮感。

        表2 userID為800時Pearson模型與IPSTS模型推薦比較

        表3(ItemID為推薦的物品編號)顯示,在給編號為888的用戶進行推薦時,IPSTS模型在降低了RMSE的基礎上,給用戶做出的推薦策略為1 467,1 368,1 512,615,169。其中的前三個物品為長尾物品。但是,Pearson模型不僅均方根誤差比IPSTS模型要高,而且給出的推薦策略也沒有挖掘出長尾物品。因此,IPSTS模型對長尾現(xiàn)象有所緩解,能夠挖掘出長尾物品給用戶進行推薦。

        表3 userID為888時Pearson模型與IPSTS模型推薦比較

        4 結束語

        推薦系統(tǒng)是在用戶沒有明確需求的情況下,從海量的數(shù)據(jù)中幫助用戶尋找感興趣的信息,進而以合適的方式給用戶展現(xiàn)和推薦。本文圍繞降低預測評分誤差以及挖掘長尾物品問題,引入興趣穩(wěn)定性,同時關注時間敏感因子,構建了引入興趣穩(wěn)定性的時間敏感相似度融合模型。實驗表明該模型能夠實現(xiàn)用戶興趣的實時動態(tài)推薦,且進一步提高了推薦質量。然而,影響用戶興趣的因素還包括外部環(huán)境因素等其他關鍵因素,隨著移動設備的蓬勃發(fā)展和定位系統(tǒng)的成熟,可以將這些因素引入到模型中。其次,融合后的模型是線性加權的,下一步還可以考慮構建一個非線性模型進行推薦。

        參考文獻:

        [1]佚名.第36次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》[J].網(wǎng)絡傳播,2015(7):54-59.

        [2]Resnick P,Iacovou N,Suchak M,et al.GroupLens:An open architecture for collaborative filtering of netnews[C]//Acm Conf on Computer Supported Cooperative Work,1994:175-186.

        [3]邢春曉,高鳳榮,戰(zhàn)思南.適應用戶興趣變化的協(xié)同過濾推薦算法[J].計算機研究與發(fā)展,2007,44(2):296-301.

        [4]項亮.動態(tài)推薦系統(tǒng)關鍵技術研究[D].北京:中國科學院自動化研究所,2011.

        [5]Liu B,Wu Y,Gong N Z,et al.Structural analysis of user choices for mobile app recommendation[J].Acm Transactions on Knowledge Discovery from Data,2016,11(2):17.

        [6]Koren Y.Factorization meets the neighborhood:A multifaceted collaborative filtering model[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Las Vegas,Nevada,USA,August 2008:426-434.

        [7]Kim D,Yum B J.Collaborative filtering based on iterative principal component analysis[J].Expert Systems with Applications,2005,28(4):823-830.

        [8]Ahn H J.A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem[J].Information Sciences,2008,178(1):37-51.

        [9]Liu H,Hu Z,Mian A,et al.A new user similarity model to improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(3):156-166.

        [10]Li S,Kawale J,F(xiàn)u Y.Deep collaborative filtering via marginalized denoising auto-encoder[C]//Acm Int Conf on Information&Knowledge Management,2015:811-820.

        [11]Wu Y,Dubois C,Zheng A X,et al.Collaborative denoising auto-encoders for top-N recommender systems[C]//ACM International Conference on Web Search and Data Mining,2016:153-162.

        [12]Strub F,Mary J,Gaudel R.Hybrid recommender system based on autoencoders[C]//Workshop on Deep Learning for Recommender Systems,2016:11-16.

        [13]Wang X,Lu W,Ester M,et al.Social recommendation with strong and weak ties[C]//Acm Int Conf on Information&Knowledge Management,2016:5-14.

        [14]Vuurens J B P,Larson M,De Vries A P.Exploring deep space:Learning personalized ranking in a semantic space[C]//Workshop on Deep Learning for Recommender Systems,2016:23-28.

        [15]Adomavicius G,Kwon Y O.Improving aggregate recommendation diversity using ranking-based techniques[J].IEEE Transactions on Knowledge&Data Engineering,2012,24(5):896-911.

        [16]Herlocker J L.Evaluating collaborative filtering recommender systems[J].Acm Transactions on Information Systems,2004,22(1):5-53.

        猜你喜歡
        用戶實驗評價
        記一次有趣的實驗
        SBR改性瀝青的穩(wěn)定性評價
        石油瀝青(2021年4期)2021-10-14 08:50:44
        做個怪怪長實驗
        關注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        NO與NO2相互轉化實驗的改進
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        關注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        基于Moodle的學習評價
        如何獲取一億海外用戶
        精品国产av最大网站| 亚洲免费一区二区三区四区| 麻豆视频黄片在线免费观看| 蜜桃精品人妻一区二区三区| 亚洲熟妇av日韩熟妇在线| av在线色| 国产精品一区二区三区色| 男女视频在线观看一区二区| 成人av综合资源在线| 精品亚洲一区二区三区四区五区 | 久久熟女五十路| av最新版天堂在资源在线| 日韩高清不卡一区二区三区| 东北老女人高潮大喊舒服死了| 国产精品久久久久久52avav| 国产成人综合久久精品推| 国产精品视频免费的| 一本色道久久综合亚洲精品蜜臀 | 国产无吗一区二区三区在线欢| 亚洲av无码精品色午夜| 91久久青青草原线免费| 女女同性av一区二区三区免费看 | 久久精品99国产精品日本| 亚洲av日韩av在线观看| 国产乱人伦偷精品视频| 久久国产亚洲精品超碰热| 在线你懂| av天堂手机免费在线| 男人进去女人爽免费视频| 99热这里有免费国产精品| 精品少妇一区二区三区四区| 国产三级黄色大片在线免费看| 国产成人精品a视频| 最新国产乱视频伦在线| 亚洲中文字幕日产喷水| 美丽小蜜桃1一3在线观看| 国产成+人欧美+综合在线观看| 久久免费区一区二区三波多野在| 久久国产女同一区二区| 亚洲精品午夜久久久九九| 免费无码av一区二区三区|