亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于新聞場景下的個性化推薦算法研究

        2023-02-28 16:10:30王君威
        智能計算機與應用 2023年11期
        關(guān)鍵詞:用戶

        王君威,余 粟

        (上海工程技術(shù)大學機械與汽車工程學院,上海 201620)

        0 引 言

        隨著網(wǎng)絡(luò)的發(fā)展和電子設(shè)備的普及,人們已經(jīng)不再只是通過電視的新報道和紙質(zhì)報刊了解當下正在發(fā)生的事情,利用電子設(shè)備獲取新聞消息成為當前的主流趨勢。 打開電子設(shè)備時,會看到太多對用戶無用的嘈雜信息。 對用戶而言,沒有好的推薦將很難獲取有用信息,若不能根據(jù)用戶個性化的需要加以篩選,信息過載的情況就難以避免。 用戶需求明確時,搜索能快速幫助用戶滿足需求。 當用戶需求不明確時,個性化新聞推薦成為了重要解決方案。

        隨著今日頭條、抖音等App 的飛速發(fā)展,推薦系統(tǒng)的價值已得到了業(yè)界的廣泛認可。 能夠向用戶提供有用信息,滿足用戶需求的新聞推薦也得到了相關(guān)學者的關(guān)注。 萬梅等學者[1]根據(jù)社交網(wǎng)絡(luò)不斷演化的特點,提出了一種基于神經(jīng)網(wǎng)絡(luò)嵌入和社交網(wǎng)絡(luò)動態(tài)演化的新聞推薦算法,基于神經(jīng)網(wǎng)絡(luò)嵌入模型來學習用戶在時間序列和社交網(wǎng)絡(luò)中的行為特征,再使用無監(jiān)督的隨機游走學習用戶的網(wǎng)絡(luò)拓撲結(jié)構(gòu),通過插值法將行為特征向量和網(wǎng)絡(luò)拓撲結(jié)構(gòu)匯總表示用戶向量,使用核函數(shù)將用戶的交互映射到低維的向量空間,從而提高了相似度計算的效率。 劉羽茜等學者[2]考慮到新聞的內(nèi)容特征和瀏覽新聞之間的關(guān)系、相應的時序變化,以及不同新聞對用戶的重要性等方面,提出了一種全面提取用戶和新聞特征的新聞推薦模型。 該模型基于深度學習,使用注入注意力機制的卷積神經(jīng)網(wǎng)絡(luò)深度提取新聞文本特征,通過對用戶的新聞瀏覽記錄進行時序處理,獲取用戶的興趣趨勢,使得注入注意力機制的深度特征融合新聞推薦模型角度更加全面。 張丹等學者[3]考慮可以基于用戶歷史瀏覽的時間序列來做推薦,使用隱馬爾可夫模型,并在其基礎(chǔ)上加入了狀態(tài)駐留的時間元素,將隱馬爾可夫模型的五元素擴展為六元素,以此來提高新聞推薦的準確度。袁仁進等學者[4]針對新聞推薦中的用戶畫像構(gòu)建與用戶興趣流動的問題,提出一種面向新聞推薦的用戶興趣模型構(gòu)建和更新方法,使用向量空間與bisecting K-means 一同構(gòu)建原始用戶興趣模型,然后使用艾賓浩斯遺忘曲線為基礎(chǔ)構(gòu)造遺忘函數(shù)來描述用戶的興趣變遷,更好地反映用戶的興趣變化。陶天一等學者[5]將知識圖譜中“實體-關(guān)系-實體”表示事物關(guān)系的形式引入到新聞推薦中來,提出KHA-CNN,基于卷積神經(jīng)網(wǎng)絡(luò)和層次注意力機制獲取的新聞報道的特征,根據(jù)用戶的交互來獲取用戶畫像,基于兩方特征實現(xiàn)推薦。 王利娥等學者[6]看到當前的推薦模型不能有效地平衡差分隱私的噪聲,提出了一種融合知識圖譜和隱私保護的新聞推薦方法,采用多通道卷積神經(jīng)網(wǎng)絡(luò)模型融合新聞標題、知識圖譜中實體和實體上下文等多維度的特征向量;其次,利用注意力機制為不同敏感程度的特征向量添加不同程度的噪聲,從而降低噪聲對數(shù)據(jù)分析的影響;然后,對加權(quán)的用戶特征向量添加統(tǒng)一的拉普拉斯噪聲,以保證用戶數(shù)據(jù)的安全性;利用兩階段的隱私保護機制來提高用戶的隱私保護和推薦效果。 朱文躍等學者[7]針對傳統(tǒng)推薦系統(tǒng)中存在的共性問題,冷啟動、數(shù)據(jù)稀疏、推薦精度較低等問題,提出了基于事件本體的推薦算法,結(jié)合新聞結(jié)構(gòu)和語義構(gòu)建事件本體,對用戶瀏覽的新聞抽取要素,構(gòu)建用戶興趣模型,綜合事件本體的相似度、用戶興趣相似度、非層次結(jié)構(gòu)相似度三個角度完成推薦。

        本文分析了用戶活躍度和新聞時效對新聞推薦的影響,針對新聞場景提出一種個性化推薦方式。通過新聞時效性和用戶活躍度的判斷,對item和user的協(xié)同過濾進行改進、并加上冷啟動進行新聞報道的召回,盡可能獲取包含用戶興趣點的所有新聞報道,基于目標用戶的評分進行排序,產(chǎn)生面向用戶的個性化推薦。

        1 相關(guān)工作

        1.1 場景描述

        新聞報道的推薦和傳統(tǒng)的物品推薦有些許不同,在物品推薦中,物品的數(shù)量和種類在相對長的一段時間里面會保持穩(wěn)定,不會發(fā)生較大的變化;而且短期內(nèi)用戶對物品的喜好也不會發(fā)生大的變動。 與之不同的是,世界上每天都會發(fā)布大量的新聞報道,新聞的數(shù)量隨著時間的推移也會越來越多。

        在新聞推薦中已經(jīng)報道的新聞,如果當時沒有及時推薦給感興趣的用戶,那么在相對較短的一段時間之后,不會再推薦對應的用戶。 對用戶來講,一般情況下也不會對過往的新聞報道感興趣。 物品推薦往往還存在用戶對推薦結(jié)果的顯式評價(包括點贊、關(guān)注、購買、評價等行為),而新聞報道的推薦只能根據(jù)用戶的歷史交互來判斷推薦結(jié)果。 除此之外,活躍度高的用戶交互記錄較為豐富,而活躍度低的用戶交互記錄相對稀疏,在判斷目標用戶的興趣相似集合時,往往會發(fā)現(xiàn)活躍度高的用戶與絕大部分用戶的興趣都相近,難以區(qū)分用戶的相似情況,這就對個性化新聞推薦提出了較高的要求。

        1.2 相關(guān)模型

        本文提出的個性化新聞推薦整體流程如圖1 所示。 在新聞平臺數(shù)據(jù)集的基礎(chǔ)上,對用戶交互、新聞報道等相關(guān)信息進行數(shù)據(jù)分析和處理,將數(shù)據(jù)集通過召回層,從ItemCF 和UserCF 以及冷啟動的角度對新聞進行召回,并基于相似用戶集合或新聞集合對召回新聞的評分進行排序,最后產(chǎn)生目標用戶的個性化新聞推薦。

        圖1 個性化新聞推薦模型Fig. 1 Personalized news recommendation model

        1.2.1 協(xié)同過濾

        協(xié)同過濾(Collaborative Filtering)是推薦領(lǐng)域中最重要的算法,實質(zhì)是根據(jù)用戶的交互歷史以及擁有類似興趣的用戶的交互記錄或曾經(jīng)感興趣的物品來給目標用戶進行物品推薦。 主要分為基于item的協(xié)同過濾和基于user 的協(xié)同過濾。 2 個算法的思想基本一致,核心在于類似用戶判定或喜好物品的相似物品判定,即物品或用戶相似度的計算。

        基于item 的協(xié)同過濾是根據(jù)用戶曾經(jīng)喜歡的物品,從數(shù)據(jù)集中找到相似的物品,推薦給用戶。 而基于User 的協(xié)同過濾是基于用戶的交互歷史,從用戶集合中找到與目前用戶的興趣較為接近的用戶子集,基于這些不同用戶的交互喜好,給目標產(chǎn)生新的推薦。

        協(xié)同過濾根據(jù)用戶與物品的歷史交互,將用戶點贊、收藏、轉(zhuǎn)發(fā)等不同的行為進行量化,將量化后的行為作為用戶對物品的評分,構(gòu)建成評分矩陣,評分大小表示用戶感興趣的程度。 無論基于item 的協(xié)同過濾、還是User 的協(xié)同過濾都是基于評分矩陣R找到與相似物品或相似用戶,基于同樣興趣愛好的人群或相似喜好物品的集合產(chǎn)生的個性化推薦。

        由于新聞推薦場景與物品推薦場景不同,在新聞場景下很少有用戶看過新聞后會基于對新聞的喜好進行點贊、收藏、轉(zhuǎn)發(fā),顯式行為數(shù)據(jù)的極度稀疏導致無法根據(jù)通用方式完成新聞評價,本文使用用戶對新聞的歷史交互點擊作為用戶對物品評分的依據(jù)。

        以基于User 的協(xié)同過濾算法為例,評分矩陣形式如下:

        其中,R表示評分矩陣;U表示用戶集合;I表示物品集合;m和n分別表示用戶和物品的個數(shù);使用u(i,j)表示第i個用戶對第j個商品的評分。

        協(xié)同過濾算法常用余弦相似度或皮爾遜相關(guān)系數(shù)來衡量用戶或物品的相似程度。

        余弦相似度公式如下所示:

        其中,u與v分別表示不同用戶的評分向量;i表示物品序號;rui為用戶u對第i個物品的評分;表示用戶u對物品集合中所有物品的評分集合中的第i個物品的評分向量。

        在現(xiàn)實情況下由于不同用戶對物品評分的偏好不同,有的習慣給高分、有的經(jīng)常給低分,會造成評價不統(tǒng)一,影響推薦的效果,為了平衡不同用戶對物品的評分偏差,皮爾遜相關(guān)系數(shù)以不同用戶的平均分為平衡點對評分進行修正,降低評分的偏差。

        皮爾遜相關(guān)系數(shù)計算方式如下:

        1.2.2 基于業(yè)務(wù)場景改進的協(xié)同過濾召回

        (1)基于時效性改進的ItemCF?;趇tem的協(xié)同過濾算法分析用戶對物品的交互記錄,找到目標用戶曾經(jīng)喜歡的item,用戶對物品的交互記錄獲取的評分作為item向量,而不是使用item本身特征,從物品集合中找出這個喜好item最相似的item,這個item將被認為是目標用戶的可能喜好,產(chǎn)生推薦。

        在新聞推薦場景下,時效性的要求要比普通的物品推薦高得多,為了滿足新聞推薦對時效性的需要,在傳統(tǒng)基于item 協(xié)同過濾推薦的基礎(chǔ)上,設(shè)定新聞報道時效的關(guān)聯(lián)規(guī)則,將當前時間戳與報道發(fā)布的時間戳做差值,當差值超過一定的限度,就不再將該新聞報道納入被推薦范圍內(nèi),差值越小,推薦的優(yōu)先度則越高。 為此,本文在相似度計算公式上做出改進,將時效性作為衡量新聞報道相似度的一部分。

        在本文中,將2 個新聞報道的發(fā)布時間戳差值的絕對值的倒數(shù)作為衡量2 個物品之間時效性的判斷依據(jù),為了防止報道發(fā)布時間過近,導致該時效性的值過大影響整個推薦效果,在分母處加1,防止倒數(shù)趨于無窮大。 時效性公式如下:

        其中,w表示時效性的權(quán)重;i、j分別表示報道集合中第i、j個報道的向量;it、jt分別表示第i、j個報道的發(fā)布時間戳。

        改進后的基于物品的相似度評判標準可用式(5)來描述:

        (2)基于用戶活躍度改進的UserCF。 基于User的協(xié)同過濾運用用戶交互構(gòu)建的評分矩陣,在計算求得用戶相似度后,篩選出與目標用戶興趣較一致的用戶集合,從這些用戶集合中,找出目標用戶之前未曾接觸過的可能感興趣的物品,生成推薦序列,推薦給目標用戶。

        用戶集合中有部分活躍用戶對新聞報道有較高的關(guān)注度,交互記錄比較豐富,在評分矩陣中該用戶的評分向量較為稠密。 活躍用戶評分向量的方差較大,覆蓋面較為廣泛。 而普通用戶因為個性和偏好的關(guān)系,評分矩陣的向量極為稀疏。 因此在評價用戶相似時,能夠發(fā)現(xiàn)大量普通用戶都與活躍用戶相似,不能很好區(qū)分用戶是否相似。

        為此,本文在用戶相似度評判上做出改進,將用戶間的活躍度作為比值,活躍度大的作為分母,活躍度較小的作為分子,構(gòu)建活躍度的判定公式。 計算公式如下:

        其中,u與v分別表示不同用戶,uh和vh分別表示2 個用戶的活躍度。 在新聞推薦的場景下,本文將用戶的活躍度設(shè)定為用戶點擊新聞的個數(shù)。

        將用戶活躍度帶入用戶相似度判定公式中,可得:

        (3)冷啟動召回。 冷啟動召回是在協(xié)同過濾召回外的補充,是基于用戶特征和物品特征,推斷出用戶可能感興趣的物品召回方式。 冷啟動問題主要分為用戶冷啟動(即沒有用戶的交互記錄)和新聞冷啟動(即新聞沒有被任何用戶點擊)。 本文針對冷啟動的問題,采用基于熱門新聞和地理位置的召回策略,作為額外的新聞?wù)倩匮a充方式。

        1.3 算法實現(xiàn)

        (1)獲取目標用戶在新聞平臺上的訪問日志,包括用戶ID、用戶點擊的新聞報道ID,用戶點擊的時間戳Click_timestamp、該用戶點擊報道時所在的區(qū)域Click_region等特征。

        (2)獲取用戶曾點擊過新聞報道的產(chǎn)生時間戳、以及該新聞報道的字數(shù)、新聞報道的類型。

        (3)根據(jù)用戶點擊時間戳,存儲用戶點擊新聞的交互記錄,構(gòu)建用戶-新聞-時間字典,將其轉(zhuǎn)換為用戶評分矩陣。

        (4)根據(jù)用戶評分矩陣,使用改進用戶活躍度的UserCF 查找相似用戶,召回新聞報道。

        (5)根據(jù)特定新聞的用戶點擊情況,構(gòu)建新聞報道-用戶-時間字典,存儲新聞報道的向量,轉(zhuǎn)換成新聞評分矩陣。

        (6)根據(jù)新聞評分矩陣,使用改進時效性的ItemCF 來查找相似物品,借此召回新聞報道。

        (7)根據(jù)用戶的點擊次數(shù)、用戶點擊報道的區(qū)域,進行冷啟動召回,召回相關(guān)的新聞報道。

        (8)匯總多路召回的新聞報道,從中選取評分最高的新聞,作為推薦結(jié)果。

        綜上所述,研究給出算法實現(xiàn)步驟流程如圖2所示。

        圖2 算法實現(xiàn)Fig. 2 Flowchart of the algorithm

        2 實驗及結(jié)果分析

        2.1 實驗設(shè)計

        為了驗證提出個性化新聞推薦的效果,本文數(shù)據(jù)集選自某新聞平臺的后臺用戶新聞交互訪問日志,包含近30 萬用戶、36 萬篇新聞文章、以及多達300 多萬的交互訪問記錄。

        仿真實驗隨機從交互數(shù)據(jù)集中篩選出2 萬用戶以及對應的新聞報道和歷史交互記錄作為數(shù)據(jù)集,數(shù)據(jù)集特征包括用戶id、用戶報道交互時間戳、字數(shù)、報道id、報道產(chǎn)生時間戳等特征。 構(gòu)建個性化新聞推薦,針對每個目標用戶使用基于用戶活躍度的userCF、基于新聞時效性的ItemCF 以及冷啟動召回等3 個角度進行召回,每個目標用戶將獲取個性化召回新聞報道。 計算出目標用戶對召回新聞的評價,取評價在TopX的新聞作為推薦結(jié)果,呈現(xiàn)給用戶。

        2.2 評價指標

        為了衡量個性化新聞推薦的推薦效果,本文選取了召回率(Recall,R)、準確率(Precision,P) 以及混合召回和準確率的F1指數(shù)作為性能指標。

        推薦結(jié)果的混淆矩陣見表1。

        表1 混淆矩陣Tab. 1 Confusion matrix

        選用指標中,Precision表示個性化新聞推薦的準確率,即推薦給用戶的新聞列表中,用戶點擊情況。 數(shù)學公式定義如下:

        Recall表示個性化新聞推薦的召回率,即所有用戶點擊的新聞列表中,推薦新聞情況。 數(shù)學計算公式定義如下:

        由于Precision和Recall兩個指標在某些情況下是相互沖突的、準確率高、召回率就會降低,召回率高、準確率會降低。 為了平衡2 個指數(shù)的沖突,更好地衡量個性化推薦的推薦效果,引入了F1指標。 數(shù)學公式定義如下:

        2.3 實驗結(jié)果與分析

        本次實驗從20 000 個用戶的數(shù)據(jù)集中隨機選取某用戶,分別以itemCF 和UserCF 以及個性化推薦這3 種方式針對該用戶從其最相鄰用戶集合中選出5、10、15、20、25、30、35、40 個鄰居,基于最近鄰居產(chǎn)生目標用戶的個性化推薦。

        表2 和表3 是個性化推薦算法與基于User 和Item協(xié)同過濾推薦算法的針對目標用戶產(chǎn)生推薦的實驗效果對比。F1-score的實驗對比結(jié)果見圖3。 從以上結(jié)果中可以看出,在協(xié)同過濾的基礎(chǔ)上加入用戶活躍度和新聞時效性的考量,使用冷啟動補充興趣點,在新聞場景下的推薦效果明顯優(yōu)于協(xié)同過濾。

        表2 準確率實驗對比Tab. 2 Comparison of accuracy experiments

        表3 召回率實驗對比Tab. 3 Comparison of recall experiments

        圖3 F1-score 實驗對比Fig. 3 F1-score experimental comparison

        3 結(jié)束語

        本文基于用戶活躍度和新聞時效性提出了一種個性化的新聞推薦算法,考慮到新聞推薦場景下,用戶對新聞時效性的需求以及不同活躍度用戶對推薦的影響,修改了新聞報道和不同活躍度用戶的相似度判定方式,基于協(xié)同過濾,從用戶、新聞報道和冷啟動召回的角度召回用戶可能感興趣的新聞報道。實驗證明,與傳統(tǒng)的協(xié)同過濾推薦相比,本文的個性化新聞推薦更為準確。 冷啟動召回的方式緩解了冷啟動,而改進后的召回排序獲取推薦提高了推薦精度。 下一步可以在新聞推薦中融合、更多模型算法更多覆蓋用戶的興趣點完成召回和排序,提高推薦效果。

        猜你喜歡
        用戶
        雅閣國內(nèi)用戶交付突破300萬輛
        車主之友(2022年4期)2022-08-27 00:58:26
        您撥打的用戶已戀愛,請稍后再哭
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年5期)2016-11-28 09:55:15
        兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        挖掘用戶需求尖端科技應用
        Camera360:拍出5億用戶
        100萬用戶
        小鲜肉自慰网站| 色婷婷一区二区三区久久亚洲| 黑丝美腿国产在线观看| 人妻丰满熟妇aⅴ无码| 亚洲精品无码av中文字幕| 免费jjzz在线播放国产| 日韩少妇高潮在线视频| 亚洲一区二区三区2021| 毛片免费视频在线观看| 尤物yw无码网站进入| 免费在线观看亚洲视频| 自由成熟女性性毛茸茸应用特色| 极品少妇小泬50pthepon| 精品乱码一区二区三区四区| 日本女优一区二区在线免费观看 | 国产成人亚洲精品| 久久99精品免费一区二区| 中文字幕日韩一区二区不卡| 中文字幕无码乱人伦| 成人片黄网站色大片免费观看cn| 人妻无码Aⅴ中文系列| 国产成人精品自拍在线观看| 老女老肥熟女一区二区| 国产亚洲精品久久久久婷婷瑜伽| 亚洲天堂av免费在线看| 国产蜜桃传媒在线观看| 国产精品9999久久久久仙踪林| 日韩精品成人一区二区三区| av中文字幕在线资源网| av一区二区三区在线| 国产精品国产午夜免费看福利| 久久精品国产72国产精福利 | 久久精品国产av麻豆五月丁| 天天色影网| 在线观看一区二区女同| 国产激情一区二区三区成人| 亚洲av久久久噜噜噜噜| 99热免费精品| 日韩视频午夜在线观看| 久久午夜羞羞影院免费观看| 最新69国产成人精品视频免费|