亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新聞推薦系統(tǒng)中的邊信息融合Transformer

        2023-05-30 06:27:37賀雋文邵偉衛(wèi)剛
        電腦知識(shí)與技術(shù) 2023年1期
        關(guān)鍵詞:多模態(tài)深度學(xué)習(xí)

        賀雋文 邵偉 衛(wèi)剛

        摘要:推薦系統(tǒng)中對(duì)多模態(tài)的數(shù)據(jù)處理方式是業(yè)界長(zhǎng)期關(guān)注的重點(diǎn),基于各類數(shù)據(jù)的特點(diǎn)設(shè)計(jì)模型,可以有效利用信息,從而提升推薦效率。文章針對(duì)新聞推薦系統(tǒng)提出SIA-Transformer結(jié)構(gòu),在傳統(tǒng)Transformer的基礎(chǔ)上結(jié)合了新聞的邊信息。通過(guò)多組內(nèi)積的形式,將單詞特征與邊信息特征在多頭注意力層中進(jìn)行交叉,提高了邊信息利用率的同時(shí),也豐富了文本特征提取的語(yǔ)義,使得基于SIA-Transformer的新聞文本特征提取方法獲取到更多信息,從而提高了推薦的效果。文章基于微軟MSN開(kāi)放的大型新聞數(shù)據(jù)集MIND進(jìn)行了實(shí)驗(yàn),驗(yàn)證了模型的效果。

        關(guān)鍵詞:新聞推薦系統(tǒng);邊信息;多模態(tài);深度學(xué)習(xí)

        中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1009-3044(2023)01-0004-03

        1 概述

        隨著消費(fèi)互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)的馬太效應(yīng)帶來(lái)了嚴(yán)重的信息過(guò)載問(wèn)題,推薦系統(tǒng)在互聯(lián)網(wǎng)平臺(tái)解決信息過(guò)載問(wèn)題的過(guò)程中發(fā)揮了巨大作用。以新聞推薦系統(tǒng)為例,通常需要基于新聞內(nèi)容、用戶信息以及用戶的歷史行為等特征,使用自然語(yǔ)言處理、統(tǒng)計(jì)機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)等技術(shù),精準(zhǔn)地將新聞推送給用戶。面對(duì)多模態(tài)的數(shù)據(jù),如離散型和連續(xù)型數(shù)據(jù)、文本和圖像數(shù)據(jù)、圖數(shù)據(jù)等,業(yè)界的常用做法是針對(duì)不同類型的數(shù)據(jù),分別獨(dú)立地提取數(shù)據(jù)特征。當(dāng)獨(dú)立處理各模態(tài)數(shù)據(jù)時(shí),缺乏各模態(tài)數(shù)據(jù)之間的交互與監(jiān)督,因此難以提取到各模態(tài)數(shù)據(jù)之間的關(guān)聯(lián),導(dǎo)致信息的損耗。

        個(gè)性化新聞推薦系統(tǒng)中通常包含新聞模型與用戶模型兩大模塊,前者是基于內(nèi)容理解技術(shù)提取新聞的內(nèi)容和特點(diǎn),后者則是基于用戶信息與歷史點(diǎn)擊行為來(lái)建模用戶的興趣愛(ài)好?;趨f(xié)同過(guò)濾的推薦算法主要是根據(jù)用戶與商品交互記錄來(lái)進(jìn)行推薦,本質(zhì)上是基于用戶/商品相似度的統(tǒng)計(jì)方法。在新聞推薦系統(tǒng)中,由于新聞商品往往具有較強(qiáng)的時(shí)效性,因此會(huì)面臨嚴(yán)重的商品冷啟動(dòng)問(wèn)題。對(duì)標(biāo)題、摘要等文本信息和主題、類別等邊信息的利用則是緩解商品冷啟動(dòng)問(wèn)題的主要辦法,也是新聞推薦系統(tǒng)中優(yōu)化文本特征提取的動(dòng)機(jī)。

        1.1 相關(guān)工作

        現(xiàn)有主流的基于深度學(xué)習(xí)的新聞推薦系統(tǒng)通常使用自動(dòng)編碼器、CNN[1](卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、Transformer來(lái)進(jìn)行文本特征的提取。

        Okura[2]等引入帶有弱監(jiān)督的自動(dòng)編碼器實(shí)現(xiàn)文本特征提取,Zhang等[3]進(jìn)一步使用改進(jìn)的自動(dòng)編碼器SDAE(stacked denoising auto-encoder) 作為文本特征提取器。An等[4]提出使用CNN網(wǎng)絡(luò)來(lái)提取新聞標(biāo)題及類別中的文本特征,并在用戶興趣建模中使用GRU(Gated Recurrent Unit) 處理用戶歷史點(diǎn)擊的新聞稿件特征,從而實(shí)現(xiàn)對(duì)用戶的長(zhǎng)短期興趣的建模。Lee[5]等則使用BIGRU(Bi-directional Gated Recurrent Unit) 來(lái)進(jìn)行文本特征提取。Wu等[6]在用戶興趣建模中引入注意力機(jī)制,從而更好地聚合用戶的歷史點(diǎn)擊新聞特征。Wu等[8]則使用Transformer作為文本的特征提取器。

        部分模型將邊信息引入了新聞商品的文本特征提取流程中,取得了更好的效果,如Wang等[7]在文本提取過(guò)程中引入邊信息,將新聞的類別特征也視作文本與標(biāo)題中的文本拼接后再輸入3D卷積網(wǎng)絡(luò)。但此方法融合邊信息的方式過(guò)于簡(jiǎn)單,且僅利用了文本類的邊信息。因此,面對(duì)不同類型的邊信息,對(duì)現(xiàn)有文本提取網(wǎng)絡(luò)進(jìn)行優(yōu)化改進(jìn),從而在文本特征提取過(guò)程中最大程度地發(fā)揮邊信息的約束與監(jiān)督作用,是本文的改進(jìn)重點(diǎn)。

        2 模型結(jié)構(gòu)

        2.1 SIA-Transformer框架

        如圖1所示,SIA-Transformer基于傳統(tǒng)Transformer網(wǎng)絡(luò)的編碼層,在其基礎(chǔ)上將邊信息引入到最核心的多頭注意力層中,邊信息類型可以包括文本信息(如用戶評(píng)論、新聞?lì)悇e),圖片信息(如新聞封面、知識(shí)圖譜等),統(tǒng)一以embedding的形式輸入到多頭注意力層中。

        2.2 邊信息融合

        2.3 邊信息注意力權(quán)重

        傳統(tǒng)Transformer認(rèn)為,每個(gè)單詞的特征表示由其他單詞的V向量根據(jù)注意力權(quán)重聚合而成,注意力權(quán)重則通過(guò)由目標(biāo)單詞的Q向量點(diǎn)乘其他單詞的K向量,再通過(guò)softmax歸一化后得到。

        考慮到在不同類別的新聞文本當(dāng)中,對(duì)相同單詞的關(guān)注程度是不相同的,因此本文將邊信息引入到多頭注意力層中注意力權(quán)重的計(jì)算過(guò)程中,改良后的注意力權(quán)重計(jì)算方式如圖2所示。

        2.4 邊信息融合特征

        3 實(shí)驗(yàn)結(jié)果與分析

        本文選用微軟MSN大規(guī)模數(shù)據(jù)集MIND,通過(guò)對(duì)比不同模型中分別使用傳統(tǒng)Transformer與SIA-Transformer作為文本特征提取器的效果,驗(yàn)證本文中方法的有效性。實(shí)驗(yàn)中使用新聞的一級(jí)與二級(jí)類別作為邊信息,選用AUC作為模型效果指標(biāo),以經(jīng)典新聞推薦模型NPA和LSTUR作為基線模型的對(duì)比結(jié)果,如表1所示。

        通過(guò)實(shí)驗(yàn)結(jié)果可以看到,在NPA及LSTUR中,相較于Transformer,以SIA-Transformer作為文本特征提取器,使得auc指標(biāo)在驗(yàn)證集上均取得了正向收益,說(shuō)明了模型的有效性。

        4 結(jié)束語(yǔ)

        本文中提出的SIA-Transformer作為新聞推薦系統(tǒng)中的文本特征提取器,通過(guò)引入邊信息到多頭注意力層中,使得邊信息能夠更充分地約束與指引文本特征的提取,使得提取的單詞特征向量具有更準(zhǔn)確與豐富的語(yǔ)義,在實(shí)驗(yàn)中取得了較好的效果。

        同時(shí),本文中的方法也存在一些問(wèn)題與待改進(jìn)的方向。首先,本文中只使用了新聞的一級(jí)與二級(jí)類別邊信息,還有待于擴(kuò)展到其他模態(tài)的邊信息,從而獲取到更多的信息增益,如圖像信息、知識(shí)圖譜實(shí)體映射關(guān)系等。另外,本文中邊信息作用于注意力權(quán)重及特征融合的方式較為簡(jiǎn)單,更復(fù)雜與精巧的設(shè)計(jì)可以在將來(lái)的研究中再進(jìn)一步探索。最后,提取文本特征的方法除了在Transformer的基礎(chǔ)上進(jìn)行改進(jìn)以外,還可以考慮自然語(yǔ)言處理領(lǐng)域的其他最新成果,如Bert模型,如何將其他自然語(yǔ)言處理領(lǐng)域的最新成果與新聞推薦的任務(wù)結(jié)合起來(lái)優(yōu)化模型,從而獲取到更好的推薦效果,也是未來(lái)的研究方向之一。

        參考文獻(xiàn):

        [1] Zhang Y, Wallace B C. A sensitivity analysis of (and practitioners guide to) convolutional neural networks for sentence classification[C]//Proceedings of the Eighth International Joint Conference on Natural Language Processing.Taipei:Asian Federation of Natural Language Processing,2017:253-263.

        [2] Okura S,Tagami Y,Ono S,et al.Embedding-based news recommendation for millions of users[C]// Halifax,NS,Canada:Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2017. New York:ACM,2017:1933-1942.

        [3] Zhang F Z,Yuan N J,Lian D F,et al.Collaborative knowledge base embedding for recommender systems[C]// San Francisco,California,USA:Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2016. New York:ACM,2016:353-362.

        [4] An Mingxiao,Wu Fangzhao,Wu Chuhan,et al.Neural News Recommendation with Long- and Short-term User Representations[J].ACL,2019(1):336-345.

        [5] Lee D,Oh B,Seo S,et al.News recommendation with topic-enriched knowledge graphs[C]// Virtual Event,Ireland:Proceedings of the 29th ACM International Conference on Information & Knowledge Management,2020. New York:ACM,2020:695-704.

        [6] Wu C H,Wu F Z,An M X,et al.Neural news recommendation with attentive multi-view learning[J].CoRR,2019,abs/1907.05576:3863-3869.

        [7] Wang H Y,Wu F Z,Liu Z,et al.Fine-grained interest matching for neural news recommendation[C]//Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.Online.Stroudsburg,PA,USA:Association for Computational Linguistics,2020:836-845.

        [8] Wu C H,Wu F Z,Huang Y F,et al.Neural news recommendation with negative feedback[J].CCF Transactions on Pervasive Computing and Interaction,2020,2(3):178-188.

        【通聯(lián)編輯:唐一東】

        猜你喜歡
        多模態(tài)深度學(xué)習(xí)
        有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
        電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
        多模態(tài)話語(yǔ)中的詹姆斯·卡梅隆電影
        MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
        英語(yǔ)閱讀教學(xué)中多模態(tài)識(shí)讀能力的培養(yǎng)
        大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
        網(wǎng)絡(luò)環(huán)境下大學(xué)英語(yǔ)多模態(tài)交互式閱讀教學(xué)模式研究
        戲劇之家(2016年22期)2016-11-30 18:20:43
        多模態(tài)理論視角下大學(xué)英語(yǔ)課堂的構(gòu)建
        深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
        新媒體環(huán)境下多模態(tài)商務(wù)英語(yǔ)課堂教師角色定位
        亚洲国产精品国自拍av| 91精品国产丝袜在线拍| 1234.com麻豆性爰爱影| 在线亚洲日本一区二区| 草色噜噜噜av在线观看香蕉| 国产人妻精品一区二区三区不卡| 精品一区二区三区免费爱| 午夜国产精品一区二区三区| 亚洲精品宾馆在线精品酒店| 天天天天躁天天爱天天碰| 免费va国产高清大片在线| 人妻人人澡人人添人人爽人人玩| 岛国视频在线无码| 日本a级黄片免费观看| 亚洲国产精品国自产拍av| 乱人伦中文无码视频在线观看| 国产成人精品无码播放 | 国产真实伦视频在线视频| 丰满少妇被爽的高潮喷水呻吟| 亚洲av无码专区亚洲av网站| 欧美精品免费观看二区| 亚洲国产一区二区三区,| 国产自产二区三区精品| 亚洲午夜福利在线视频| 国产精品久久久久久2021| 国产免费一区二区三区三| 深夜爽爽动态图无遮无挡| 亚洲欧洲中文日韩久久av乱码| 欧美亚洲另类国产18p| 中文字幕第一页人妻丝袜| 曰本无码人妻丰满熟妇啪啪| 天天躁日日躁狠狠躁一区| 国产精品自拍视频免费观看| 无码a级毛片免费视频内谢| 亚洲av之男人的天堂| 在线观看黄片在线播放视频| 亚洲精品粉嫩美女一区| 国产精品久久久| 色优网久久国产精品| 国产伦一区二区三区色一情| 国产精品爽黄69天堂a|