亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于項目流行度的個性化重排序模型

        2023-12-01 03:44:12鄭馨怡張宇山
        軟件導刊 2023年11期
        關(guān)鍵詞:排序用戶模型

        鄭馨怡,張宇山

        (廣東財經(jīng)大學 統(tǒng)計與數(shù)學學院,廣東 廣州 510320)

        0 引言

        隨著智能手機等電子產(chǎn)品的普及,網(wǎng)絡用戶基數(shù)每年不斷擴大,在互聯(lián)網(wǎng)上為用戶推薦符合用戶偏好項目的推薦系統(tǒng)不在少數(shù)。推薦系統(tǒng)通過分析用戶的歷史數(shù)據(jù),為用戶推薦可能符合用戶個人喜好的項目。有研究指出,推薦多樣性和用戶滿意度之間有著顯著的相關(guān)性,推薦列表的多樣性對用戶感知有著積極且重要的影響[1]。由此,一個優(yōu)秀的推薦系統(tǒng)應該不僅關(guān)注推薦結(jié)果的準確性,還應該提供多樣的推薦選擇,以滿足用戶的個性化需求并提升用戶體驗。

        推薦多樣性可以體現(xiàn)在個體多樣性和整體多樣性兩個方面。個體多樣性從單個用戶的角度衡量推薦的多樣性,個體多樣性高意味著系統(tǒng)給用戶推薦一些彼此相似度很低但是符合用戶偏好的項目。整體多樣性則是從整個推薦系統(tǒng)角度衡量推薦的多樣性,整體多樣性高意味著所有用戶的推薦結(jié)果集合中會覆蓋更多不同的項目。有研究顯示,由于模型或者是數(shù)據(jù)的原因,導致推薦系統(tǒng)會放大項目流行度偏差,表現(xiàn)為推薦系統(tǒng)會將流行度高的項目優(yōu)先推薦給用戶[2]。整體多樣性偏低,就意味著推薦系統(tǒng)總是給用戶推薦更為流行的項目,而忽略長尾項目。當用戶的TOP-K 推薦列表里都占據(jù)著流行度高的項目時,用戶之間的推薦列表就會越來越相似,通過推薦反饋循環(huán)導致用戶行為同質(zhì)化,該循環(huán)會進一步被更多的循環(huán)放大。同質(zhì)化既發(fā)生在種群水平上(所有用戶的行為更相似),也發(fā)生在個體水平上(每個用戶的行為更像它最近的鄰居)[3]。這種同質(zhì)化不僅容易造成用戶的審美疲勞、瀏覽體驗感下降,而且還會導致模型泛化能力下降,推薦結(jié)果變得越來越不可靠。因此,推薦列表中總覆蓋率高并不意味著用戶個人推薦列表的多樣性也很豐富[4]。

        為了改善個性化推薦效果,本文受到Abdollahpouri等[5]研究的啟發(fā),從項目的流行度切入,提出一種重排序模型(Personalized Re-ranking,PR),目標在于提升用戶TOP-K推薦列表多樣性,并向用戶推薦更多的新穎性項目。該模型在基線推薦模型的基礎上,將項目按流行度降序排列,然后在用戶的候選項目集中引入項目流行度和用戶偏好組成的補償分數(shù)部分對項目重新排序,并通過調(diào)節(jié)補償分數(shù)的大小以控制用戶最終TOP-K推薦列表新穎項目的比例,達到提高用戶個性化推薦列表多樣性的效果。本文主要工作包括:①提出一種重排序模型PR:該模型旨在改善個性化推薦系統(tǒng)的效果,提升用戶的TOP-K推薦列表的多樣性,并向用戶推薦更多的新穎項目;②從項目流行度切入:PR 模型根據(jù)項目流行度進行重排序,通過降序排列項目流行度,提高低流行度項目被推薦的機會;③改進用戶推薦列表的多樣性:PR 模型通過調(diào)節(jié)補償分數(shù)以控制用戶最終TOP-K推薦列表中新穎項目的比例;④評估推薦結(jié)果的整體多樣性和個體多樣性,探討在提高用戶個性化多樣性的同時,對推薦系統(tǒng)整體多樣性的影響程度。

        1 相關(guān)工作

        推薦的多樣性可能對用戶產(chǎn)生長期影響。例如,在音樂項目的曝光量已經(jīng)被證明有能力減少用戶對未知或者不熟悉文化的刻板印象和偏見的前提下,Porcaro 等[6]使用縱向?qū)嶒灥贸鼋Y(jié)論:暴露于特定水平的音樂推薦多樣性可能會對聽眾的聽歌偏好產(chǎn)生長期影響,并且推薦多樣性對于用戶探究新穎項目的好奇心也會有一定影響。

        在整體多樣性研究方面,胡春華等[7]考慮用戶的實時性和多樣性需求,提出能夠有效挖掘用戶潛在興趣的實時多樣性推薦算法。有研究指出[8-10],提升整體多樣性也被稱為長尾推薦,其目標是通過增加長尾項目的推薦比例,提供更廣泛的選擇和個性化的推薦體驗,以滿足用戶的多樣性需求。然而,這些推薦方法都是優(yōu)先考慮整個推薦系統(tǒng)的多樣性,而忽略了評估用戶的個性化列表多樣性。為了提供更好的用戶體驗,推薦系統(tǒng)需要在追求整體多樣性的同時,確保個性化列表中的推薦項目能夠盡可能地滿足用戶的個性化需求和多樣性偏好[11]。

        在個體多樣性研究方面,Ziegler 等[12]使用最大邊際相關(guān)性(Maximal Marginal Relevance,MMR)重排序模型以優(yōu)化推薦結(jié)果,認為用戶滿意度優(yōu)先于推薦準確度,推薦準確度雖然是一個模型的重要度量標準,但是它們無法捕捉到用戶的滿意度特征。Adomavicius 等[13]提出將初始推薦列表與混合重排結(jié)果相結(jié)合的方法,該方法中的混合重排步驟將項目按照流行度從最低到最高進行排序,即推薦給用戶不那么受歡迎的項目,并且將預測評分從最低到最高對項目進行反向預測評分排序,即推薦給用戶非高度相關(guān)的預測項目。Ashkan 等[14]提出一種推薦列表多樣化方法(Diversity-Weighted Utility Maximization,DUM),該方法利用貪婪策略平衡準確性和多樣性,使得模型可以最大化項目效用。Liu 等[15]等提出一種公平感知的重排序算法(Fairness-Aware Re-Ranking,F(xiàn)AR)以平衡排名質(zhì)量和供應商的公平性,使得來自不同供應商的商品有公平的機會被推薦。Pei 等[16]提出一個個性化的重新排序模型,通過直接使用現(xiàn)有的排序特征向量優(yōu)化整個推薦列表。Gao等[17]將MMR 模型進行改進,通過在推薦過程中注入隨機性和多樣性以推廣用戶的興趣,并避免過度個性化。上述研究在多樣性評估和用戶滿意度等方面提供了不同的解決方案,但還未從項目流行度的角度切入去研究問題,本文提出的模型不僅能夠滿足用戶的個性化需求,還能夠兼顧項目的流行度。這種綜合考慮可以幫助推薦系統(tǒng)平衡個性化推薦和流行度推薦之間的權(quán)衡,既不會過于偏向熱門項目,也不會忽視用戶的興趣和偏好。

        2 個性化重排序模型構(gòu)建

        2.1 符號說明

        假設在一個推薦任務中,用戶集合為U={u1,u2,…,uN},|U| 為用戶集合大?。豁椖考蠟镮={i1,i2,…,iM},|I|為項目集合大??;populɑrity(i)為項目點擊數(shù)。

        通過基線模型得到的用戶u的初始推薦列表為Ru,用戶u對項目i的初始預測分數(shù)為Ru,i,Ru,i∈Ru;經(jīng)過重排以后用戶的推薦列表為R*u,用戶對項目的預測分數(shù)為。

        2.2 Binary xQuAD 模型

        本文將簡單介紹Abdollahpouri 等[8]提出的重排序模型。Binary xQuAD 模型不依賴于項目特征,只依賴于項目流行度。補償分數(shù)部分是根據(jù)每個用戶對長尾項目的歷史興趣以確定其大小。具體模型為:

        其中,λ∈[0,1),為超參數(shù),用來調(diào)節(jié)最終列表的多樣性補償分數(shù)大小。H表示熱門項目集合,L表示長尾項目集合,S是最終排序列表。p(d|u)是用戶歷史評分項目中屬于類別d的比率,用于衡量不同用戶對頭部或者長尾項目的偏好。p(i|d)為指示函數(shù):

        在使用Binary xQuAD 模型時,用戶偏好被進一步放大,推薦的項目都是滿足用戶興趣的頭部和長尾項目。這時,推薦的整體多樣性增加,但是用戶個人的推薦列表中都是相似類型的項目,意味著新穎性的增加可能沒有意義。例如,電子商務平臺的推薦任務總是會避免向一個用戶推薦與用戶已經(jīng)購買過的項目屬于同類型的項目。再例如,用戶在視頻網(wǎng)站上觀看了《復仇者聯(lián)盟》這部電影,進而網(wǎng)站推薦給用戶同樣受歡迎的《復仇者聯(lián)盟2》《復仇者聯(lián)盟3》等一系列同類電影。從推薦結(jié)果看,推薦準確度相對高,覆蓋項目也多,但是用戶不一定滿意這些推薦,即推薦列表中總覆蓋率高并不意味著用戶個人推薦列表的多樣性也很豐富[13]。相反,推薦給用戶符合其偏好,但流行度相對較低的電影可能會激發(fā)用戶好奇心,提升用戶的潛在點擊率。

        2.3 Personalized Re-ranking 模型

        根據(jù)上述Binary xQuAD 模型,本文同樣針對項目流行度提出一種新的個性化重排序(Personalized Re-ranking,PR)模型,旨在保證推薦精度的同時,降低用戶列表內(nèi)的項目相似度。

        首先將項目按照流行度進行劃分。如圖1 所示,將項目按照點擊數(shù)降序排列,并進一步劃分為熱門項目(Head item)、長尾項目(Longtail item)和冷啟動項目(Cold-start item)。由于冷啟動項目與用戶的交互記錄太少,模型的預測分數(shù)不能很好地代表用戶的潛在偏好,這些冷啟動項目更應該使用基于內(nèi)容和混合的推薦技術(shù)[5],于是模型只針對熱門和長尾項目進行優(yōu)化。

        Fig.1 Item popularity distribution圖1 項目流行度分布

        接著,PR 模型將按以下標準對項目初始得分進行重新排序:

        其中,p(i|u)為基線模型預測用戶u對項目i的偏好分數(shù),代表了推薦準確度,也代表用戶的潛在偏好。式(3)的后半部分代表多樣性補償。λ∈[0,1),為超參數(shù),用來調(diào)節(jié)最終列表的多樣性補償分數(shù)大小。參照Abdollahpouri等[8]的方法,p(i|d)同為指示函數(shù)。

        對于流行度相差較大的項目,例如第一個頭部項目和最后一個長尾項目,兩者的也會變得相差很大。為了縮小他們之間的流行度差距,將項目的放大:

        其中,ɑ滿足以下條件:。

        PR 模型的補償分數(shù)部分不僅考慮用戶偏好,還更多地考慮項目流行度。根據(jù)式(4),可以在每一次推薦中將不同的長尾項目同時推薦給不同的用戶,從而增加推薦的新穎性,給予用戶發(fā)掘新穎項目的機會。使得PR 模型能夠更全面地考慮用戶個性化需求和項目流行度,提供多樣化的推薦結(jié)果。

        2.4 實現(xiàn)步驟

        輸入:用戶u;項目集合I;項目流行度集合populɑrity(I);類別d;推薦列表長度K。

        輸出:目標用戶u的TOP-K推薦列表。

        Step1:根據(jù)式(4)計算項目i的,i∈I。

        Step2:使用基線模型預測用戶u在項目集合I中所有未評分項目的評分值,未評分項目的集合記為,評分值集合記為按照Ru降序排列。

        Step4:根據(jù)式(3)計算項目i更新后的預測評分,并按照評分值降序排列,取TOP-K個項目作為用戶u的最終推薦結(jié)果R*u。

        3 實驗與結(jié)果分析

        3.1 數(shù)據(jù)集分析

        本實驗選擇的第一個數(shù)據(jù)集是Movielens-1M 數(shù)據(jù)集[18],這是一個電影數(shù)據(jù)集。此數(shù)據(jù)集中包含用戶個人基礎信息、電影基礎信息以及用戶對電影的評分數(shù)據(jù)。數(shù)據(jù)集包含6 040 個用戶、3 952 部電影、1 000 209 條評分數(shù)據(jù),數(shù)據(jù)稠密度為4.47%。將評分數(shù)據(jù)中從未被用戶評分過的項目剔除,還剩下3 706 個項目。首先將數(shù)據(jù)集中評分次數(shù)小于20 次的項目劃分為冷啟動項目,其次按照帕累托原理,將占據(jù)剩余評分總數(shù)80%的項目劃分為熱門項目,剩下的項目歸類為長尾項目[5]。按照上述劃分方式,可以得到612 個熱門項目,評分次數(shù)均大于506;2 432 個長尾項目;931 個冷啟動項目。本實驗選擇的第二個數(shù)據(jù)集是FilmTrust 數(shù)據(jù)集[19],此數(shù)據(jù)集包含用戶對電影的評分數(shù)據(jù)和用戶之間的社交信息。在評分數(shù)據(jù)中,共有1 508 個用戶,2 071 個項目,35 497 條評分數(shù)據(jù),數(shù)據(jù)稠密度為1.14%。將此數(shù)據(jù)集與Movielens-1M 數(shù)據(jù)集進行同樣的劃分,得到36 個熱門項目,評分次數(shù)均大于448;50 個長尾項目;1 985個冷啟動項目。

        對數(shù)據(jù)進行8∶2 劃分,其中80%作為訓練集,20%作為測試集。實驗使用5 折交叉驗證,選擇ItemCF 作為基線模型,將本文提出的方法與MMR 進行比較。在MMR 中,候選項目集的大小為100,PR 和MMR 的最終的TOP-K列表長度為10。

        3.2 評估指標

        實驗采用歸一化折損累計增益(Normalized Discounted Cumulative Gain,NDCG)、列表內(nèi)多樣性(Intra-List Similarity,ILS)、推薦新穎度(Novelty)、整體多樣性(Aggregate Diversity,Agg_Div)4個指標對結(jié)果進行評估。

        3.2.1 NDCG

        該指標常用于評估推薦系統(tǒng)的TOP-K排序質(zhì)量[17],其值越大表示推薦結(jié)果越好。NDCG 來自一個排序列表內(nèi)所有項目的相關(guān)分數(shù)。CG 表示對列表TOP-K項目的相關(guān)性得分總和,計算公式為:

        其中,rel(i)表示為項目i的相關(guān)性得分。

        在此基礎上,若進一步考慮項目所處的排序位置,讓排名靠前的項目增益更高,排名靠后的項目得分進行折損,得到DCG:

        下一步,考慮理想化的項目排序位置得分信息時,即按照rel(i)進行降序排序的最好列表位置得分,可以得到IDCG:

        其中,|REL|表示理想化的項目排序得分信息,即當結(jié)果按相關(guān)性降序排序時,取TOP-K個結(jié)果所組成的集合。

        最后,NDCG 是將其歸一化處理,使得可以比較不同列表上的排名質(zhì)量。

        3.2.2 ILS

        該指標反映單個用戶推薦列表的多樣性程度[12,20-21]。列表內(nèi)的多樣性反映了單個用戶推薦列表的整體多樣性程度,當推薦列表中項目的類別越多樣化時,ILS 的值越小,即ILS的值越低,個體多樣性越好。ILS的計算公式為:

        其中,i和j是用戶u推薦列表R*u中的項目。

        3.2.3 Novelty

        該指標可以被分為基于流行度和基于距離兩種[22]。本實驗使用基于流行度(Popularity-Based Item Novelty)的計算方式,當Novelty 的值越低,說明新穎度越高,即列表中出現(xiàn)了越多用戶從未瀏覽過的項目。Novelty 的計算公式如下:

        其中,由于物品的流行度呈長尾分布,因而取對數(shù)使得平均值更穩(wěn)定。

        3.2.4 Agg_Div

        該指標用于衡量所有用戶的推薦列表中唯一推薦項的比例[8,12],其值越高,說明整體多樣性越好。Agg_Div 的計算公式為:

        3.3 結(jié)果與分析

        首先,觀察Movielens-1M 數(shù)據(jù)集和FilmTrust 數(shù)據(jù)集在不同λ取值下的NDCG 變化,實驗結(jié)果如圖2所示。

        Fig.2 Experimental results of NDCG indicators圖2 NDCG指標實驗結(jié)果

        根據(jù)不同的λ取值所得的推薦結(jié)果,在Movielens-1M 數(shù)據(jù)集中,PR 模型推薦質(zhì)量在λ=0.6 之后快速下降,MMR 模型的推薦質(zhì)量在λ=0.2 之后開始下降。為了確保推薦質(zhì)量的下降程度在可接受范圍內(nèi),同時提高推薦結(jié)果多樣性和新穎性,PR 模型選擇λ=0.6、MMR 模型選擇λ=0.2 進行下一步實驗。同理,F(xiàn)ilmTrust 數(shù)據(jù)集中PR模型選擇λ=0.7、MMR 模型選擇λ=0.7 進行下一步實驗。實驗結(jié)果見表1。

        Table 1 Experimental results表1 實驗結(jié)果

        表1 的實驗結(jié)果中,**表示其結(jié)果沒有通過顯著性檢驗,關(guān)于隨機性與基線算法的差異不具有統(tǒng)計學意義(Wilcoxon p < 0.05)。表中評價指標旁的向上箭頭表示較大的值更好,向下箭頭表示較小的值更好。

        在推薦系統(tǒng)中,提升個體多樣性可能會犧牲整體多樣性。原因在于,為了提供多樣的推薦結(jié)果,系統(tǒng)可能傾向于推薦一些流行度高的項目,而忽視了個體的特定興趣和偏好。本文提出的PR 模型目標在于提升個體多樣性,而其在Movielens-1M 數(shù)據(jù)集結(jié)果顯示,增加25.24%個體多樣性的同時會損壞1.85%的整體多樣性;在FilmTrust 數(shù)據(jù)集上的結(jié)果顯示,增加13.70%個體多樣性的同時會損壞1.70%的整體多樣性。以上結(jié)果表明,在損失少量整體多樣性的情況下,可以大幅度提高用戶推薦列表的個體多樣性,在列表中增加很多不同類型的項目,降低推薦列表中的項目與用戶歷史瀏覽項目的相似程度。

        在Movielens-1M 數(shù)據(jù)集中,PR 模型在NDCG 指標下降3.10%的情況下,ILS 和Novelty 指標分別降低了37.85%和1.08%,而MMR 模型的ILS 和Novelty 指標不降反增,個性化推薦效果沒有得到改善。同理,PR 模型在FilmTrust 數(shù)據(jù)集中,在NDCG 指標下降17.20%的情況下,ILS 和Novelty 指標分別降低13.70%和1.77%,兩個多樣性度量指標下降幅度均比MMR 模型大,在指標結(jié)果上具備明顯優(yōu)勢。說明本文提出的PR 模型能夠有效提高個體多樣性和推薦新穎性,在改善用戶個性化推薦列表的同時保持一定的推薦質(zhì)量,并有效降低推薦列表的流行度,改善熱門項目反復推薦給不同的用戶而導致推薦效果不顯著的問題。即想要增加推薦的個體多樣性和新穎性,PR 模型的表現(xiàn)均比MMR 模型好。

        綜上分析,本文提出的PR 模型對推薦結(jié)果的NDCG影響在可接受范圍內(nèi)時,能夠提高推薦結(jié)果的個體多樣性。因此,PR 模型可以運用于推薦同質(zhì)化的情況,有利于提升用戶個性化列表內(nèi)的多樣性,提升推薦效果。

        4 結(jié)語

        本文針對推薦系統(tǒng)的個性化多樣性問題,提出引入項目流行度,通過調(diào)節(jié)補償分數(shù)的大小控制用戶最終TOP-K推薦列表中新穎項目比例的重排序模型,并在公開數(shù)據(jù)集上通過實驗驗證了模型的有效性。在未來工作中,可以進一步完善該模型的理論驗證,并在更廣泛的數(shù)據(jù)集和場景中進行應用和推廣,不斷提升個性化推薦系統(tǒng)的效用,并持續(xù)優(yōu)化用戶體驗。

        猜你喜歡
        排序用戶模型
        一半模型
        排序不等式
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        恐怖排序
        節(jié)日排序
        刻舟求劍
        兒童繪本(2018年5期)2018-04-12 16:45:32
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        国产成人精品无码片区在线观看 | 欧美金发尤物大战黑人| 亚洲一区二区三区在线网站| 亚洲va中文字幕欧美不卡| 高潮精品熟妇一区二区三区| 国产av无码专区亚洲avjulia| 欧美俄罗斯乱妇| 亚洲无码中文字幕日韩无码| 日韩五码一区二区三区地址| 亚洲av首页在线| 粗一硬一长一进一爽一a级| 国产av无码专区亚洲aⅴ| 美女露出奶头扒开内裤的视频| 亚洲中文字幕一区精品自拍| 精品人妻伦九区久久AAA片69| 97成人精品在线视频| 久久久噜噜噜久久中文福利| 少妇内射高潮福利炮| 中文亚洲AV片在线观看无码| 亚洲乱码中文字幕一线区| 又色又爽又高潮免费视频国产| 麻豆AⅤ无码不卡| 久久一二三四区中文字幕| 操风骚人妻沉沦中文字幕| 女人扒开屁股爽桶30分钟| 国产伦精品一区二区三区四区| 在线看高清中文字幕一区| 97人伦影院a级毛片| 亚洲级αv无码毛片久久精品| 少妇一级aa一区二区三区片| 一本久道高清视频在线观看 | 成人久久久精品乱码一区二区三区 | 少妇久久久久久被弄高潮| 精品香蕉久久久爽爽| 亚洲av福利天堂在线观看| 亚洲一区二区三区精品| 西西人体444www大胆无码视频| 欧美色图50p| 亚洲国产精品自拍成人| 97在线观看播放| 人妻无码一区二区在线影院|