亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于傳播樹的微博推薦模型

        2023-12-31 00:00:00徐建民張釗源

        摘 要:針對(duì)目前微博推薦模型未考慮傳播特征的問題,提出一種基于傳播樹的微博推薦模型。首先利用樹結(jié)構(gòu)對(duì)微博傳播特征進(jìn)行表示,由內(nèi)容、時(shí)間和用戶三方面特征構(gòu)成樹的節(jié)點(diǎn),以微博的轉(zhuǎn)發(fā)和評(píng)論關(guān)系作為樹的邊;然后基于節(jié)點(diǎn)間關(guān)聯(lián)關(guān)系和層次關(guān)系分別計(jì)算待評(píng)估微博傳播樹與目標(biāo)用戶每棵微博傳播樹的傳播路徑相似度和傳播層相似度,以此量化兩棵傳播樹間的結(jié)構(gòu)相似度;最后根據(jù)相似度大小對(duì)所有待評(píng)估微博進(jìn)行排序,生成推薦列表,實(shí)現(xiàn)微博推薦。實(shí)驗(yàn)結(jié)果表明,與未考慮傳播特征的微博推薦模型相比,該模型在準(zhǔn)確率、召回率和F1值上分別提升13.0%、9.6%和10.7%,合理利用微博傳播特征可以提升推薦結(jié)果的可靠性,增強(qiáng)用戶體驗(yàn)感。

        關(guān)鍵詞:微博推薦;傳播特征;傳播樹;結(jié)構(gòu)相似度

        中圖分類號(hào):TP391.3 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2023)08-010-2304-07

        doi: 10.19734/j.issn.1001-3695.2022.12.0823

        Microblog recommendation model based on propagation trees

        Xu Jianmin Zhang Zhaoyuan

        (School of Cyberspace Security amp; Computer, Hebei University, Baoding Hebei 071000, China)

        Abstract:The paper proposed a new microblog recommendation model based on propagation trees to address the issue that the current microblog recommendation models had not considered the propagation feature. Firstly, it used the tree structure to represent the microblog propagation feature, with the content, time, and user features forming the nodes of the tree and the forward and comment relationships of the microblog as the edges of the tree. Then, it calculated the propagation path similarity and propagation layer similarity between the to-be-evaluated microblog propagation tree and each microblog propagation tree of the target user. Based on the association relation and hierarchical relation among nodes, it quantified the structural similarity between the two propagation trees. Finally, it sorted all the to-be-evaluated microblogs according to their similarity and generated recommendation lists to achieve microblog recommendations. The experimental results show that the model improves by 13.0%, 9.6%, and 10.7% in precision, recall, and F1-value, respectively, compared with the microblog recommendation model without considering the propagation feature. The reasonable use of the microblog propagation feature can improve the reliability of recommendation results and enhance the user experience.

        Key words:microblog recommendation; propagation feature; propagation tree; structural similarity

        0 引言

        微博具有內(nèi)容更新及時(shí)、信息傳播快速的特點(diǎn),已成為人們獲取信息的重要渠道之一[1]。以新浪微博為例,截至2021年3月底,月活躍用戶數(shù)達(dá)到5.3億,占所有網(wǎng)民數(shù)量的53.6%。微博服務(wù)為人們獲取信息帶來了便捷性,但也對(duì)用戶造成了“信息迷航”和“信息過載”的困擾。如何在海量信息中為用戶提供感興趣的內(nèi)容是一個(gè)亟需解決的問題[2],而合理的微博推薦是解決該問題的有效途徑。

        現(xiàn)有微博推薦研究多為提取用戶行為、博文內(nèi)容等特征來獲取用戶興趣偏好,從而挖掘與此偏好相近的微博,但當(dāng)用戶數(shù)據(jù)稀疏時(shí),容易出現(xiàn)推薦效果不理想的問題。事實(shí)上,微博平臺(tái)具有較強(qiáng)的傳播性,微博在傳播過程中形成了自身的傳播特征。內(nèi)容相似的微博通常會(huì)在同一類人群中廣泛傳播,因此微博傳播特征實(shí)際上蘊(yùn)涵了用戶間共同的興趣偏好,對(duì)其合理分析與利用有助于提升推薦質(zhì)量。

        考慮傳播特征有利于提升相似微博挖掘的準(zhǔn)確性,該理論在謠言檢測(cè)領(lǐng)域已得到充分證明。Ma等人[3]利用傳播樹對(duì)謠言信息的擴(kuò)散過程進(jìn)行建模,提出一種基于傳播樹核的核方法,通過評(píng)估傳播樹間的結(jié)構(gòu)相似度來區(qū)分四類更細(xì)粒度的謠言。Wu等人[4]通過構(gòu)建微博標(biāo)記傳播樹來捕獲主題和情感語義特征,將隨機(jī)游走圖核與RBF核結(jié)合,提出一種基于圖核的混合支持向量機(jī)分類器。徐建民等人[5]通過分析微博傳播樹中用戶影響力和情感反饋特征隨轉(zhuǎn)發(fā)和評(píng)論關(guān)系變化而變化的結(jié)構(gòu)問題,提出一種基于微博傳播樹的路徑樹核謠言檢測(cè)模型。上述研究通過分析傳播結(jié)構(gòu)的相似性對(duì)謠言與非謠言進(jìn)行識(shí)別,證明了相似的微博具有相近的傳播結(jié)構(gòu)。傳播特征在謠言檢測(cè)領(lǐng)域的應(yīng)用為微博推薦提供了新思路。

        綜上所述,本文提出一種基于傳播樹的微博推薦模型,主要貢獻(xiàn)如下:

        a)構(gòu)建了一種融合多維特征的微博傳播樹。每棵傳播樹代表一篇微博的傳播過程,樹中節(jié)點(diǎn)由用戶、內(nèi)容和時(shí)間特征組成,樹中邊表示節(jié)點(diǎn)間的轉(zhuǎn)發(fā)或評(píng)論關(guān)系。在節(jié)點(diǎn)表示中,為獲取較為全面的用戶特征,依據(jù)微博內(nèi)容和用戶關(guān)系對(duì)用戶興趣進(jìn)行擴(kuò)充,以更好地區(qū)分傳播樹間的相似性。

        b)提出一種基于傳播樹的微博推薦模型。構(gòu)建目標(biāo)用戶歷史微博和待評(píng)估微博列表中每篇微博的傳播樹;綜合考慮節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系與層次關(guān)系,基于傳播路徑和傳播層計(jì)算待評(píng)估微博和目標(biāo)用戶每篇微博的樹結(jié)構(gòu)相似度,對(duì)相似度結(jié)果求均值得到待評(píng)估微博與目標(biāo)用戶的相似度;依據(jù)相似度對(duì)待評(píng)估微博列表進(jìn)行排序,為目標(biāo)用戶推薦相似度較高的微博。

        1 相關(guān)工作

        1.1 基于用戶背景和內(nèi)容的微博推薦

        準(zhǔn)確把握用戶興趣偏好是提升推薦質(zhì)量的關(guān)鍵[6],不同微博用戶的背景存在差異性,但標(biāo)簽、職業(yè)類等信息均能較好地反映用戶興趣。用戶標(biāo)簽是微博用戶綜合自身職業(yè)和興趣愛好等因素總結(jié)形成的關(guān)鍵詞,具有短文本化和意義化的特點(diǎn)[7]。邢千里等人[8]通過分析用戶間的關(guān)注關(guān)系與標(biāo)簽、微博內(nèi)容的聯(lián)系,發(fā)現(xiàn)利用標(biāo)簽進(jìn)行關(guān)注關(guān)系預(yù)測(cè)的效果好于使用微博內(nèi)容進(jìn)行預(yù)測(cè)的效果,表明標(biāo)簽可以更準(zhǔn)確地描述用戶興趣,應(yīng)用于微博推薦中有利于提升推薦質(zhì)量。Li等人[9]使用由背景信息構(gòu)成的多維向量來表示用戶,提出改進(jìn)的K-means算法來挖掘用戶社區(qū),進(jìn)而獲取待推薦微博,并通過效用函數(shù)對(duì)待推薦微博進(jìn)行排序,實(shí)現(xiàn)推薦。然而,許多用戶未添加標(biāo)簽或標(biāo)簽數(shù)量較少,僅通過用戶標(biāo)簽難以全面反映用戶興趣。為此,一些學(xué)者將用戶標(biāo)簽與微博內(nèi)容結(jié)合,使推薦效果得到提升[10]。王艷茹等人[11]通過用戶發(fā)布微博內(nèi)容擴(kuò)充標(biāo)簽,基于標(biāo)簽對(duì)在用戶集中的概率分布挖掘標(biāo)簽對(duì)語義內(nèi)聯(lián)關(guān)系,利用共享熵衡量標(biāo)簽對(duì)在特定連接路徑上的關(guān)聯(lián)程度,從而獲取標(biāo)簽對(duì)語義外聯(lián)關(guān)系,綜合考慮兩者以更準(zhǔn)確地描述用戶興趣。劉宇東等人[12]基于word2vec技術(shù)得到用戶和微博的內(nèi)容相似度,結(jié)合微博受歡迎度等特征獲取最終的推薦微博,并且考慮用戶背景信息來挖掘新用戶和沉默用戶的相似用戶集,緩解冷啟動(dòng)問題。王戰(zhàn)平等人[13]利用發(fā)布、轉(zhuǎn)發(fā)微博內(nèi)容對(duì)用戶標(biāo)簽進(jìn)行擴(kuò)充,通過標(biāo)簽語義映射和語義相關(guān)性計(jì)算挖掘深層次用戶興趣,構(gòu)造排序函數(shù)實(shí)現(xiàn)微博推薦。事實(shí)上,微博平臺(tái)中存在許多不活躍用戶,其發(fā)博數(shù)量少且個(gè)人信息不完善,而上述微博推薦方法僅從用戶自身興趣角度出發(fā)實(shí)現(xiàn)推薦,難以有效挖掘該類用戶的興趣偏好。

        1.2 基于用戶社交關(guān)系的微博推薦

        為解決上述問題,相關(guān)學(xué)者開始考慮微博社交網(wǎng)絡(luò)中用戶間存在的各種聯(lián)系,利用社交關(guān)系提升推薦效果。李吉等人[14]在分析微博內(nèi)容相似度與用戶屬性相似度的同時(shí),通過用戶間共同關(guān)注和溝通頻率計(jì)算用戶信任度,提出一種融合相似度與信任度的微博推薦模型。Ma等人[15]采用標(biāo)簽檢索策略對(duì)用戶進(jìn)行加標(biāo),在挖掘標(biāo)簽間內(nèi)聯(lián)和外聯(lián)關(guān)系的同時(shí),通過用戶間關(guān)注和粉絲相似度來度量用戶間社交關(guān)系,提出一種融合標(biāo)簽關(guān)聯(lián)關(guān)系與用戶社交關(guān)系的微博推薦方法。Gao等人[16]提出一種混合推薦方法,根據(jù)擴(kuò)展的用戶興趣標(biāo)簽和用戶興趣主題構(gòu)建新的推薦策略,結(jié)合協(xié)同過濾獲得候選微博,提取微博質(zhì)量、用戶對(duì)發(fā)文者的興趣等異質(zhì)性特征描述候選微博,通過深度神經(jīng)網(wǎng)絡(luò)對(duì)微博進(jìn)行預(yù)測(cè)排名。單曉紅等人[17]依據(jù)用戶歷史微博內(nèi)容獲取用戶興趣偏好,根據(jù)微博和用戶信息計(jì)算話題重要度、信任度和新鮮度,通過修正余弦相似度計(jì)算相似用戶集,與話題多維特征結(jié)合形成混合推薦算法,預(yù)測(cè)并排序用戶對(duì)話題的偏好程度。上述方法取得了較好的推薦效果,但僅考慮了微博內(nèi)容等靜態(tài)特征,均忽略了微博傳播過程中蘊(yùn)涵的潛在特征,并未全面挖掘微博特征信息。

        參考上述研究,本文既考慮以往微博推薦中重點(diǎn)分析的內(nèi)容、標(biāo)簽等特征,又考慮微博在傳播時(shí)形成的結(jié)構(gòu)以及各要素間的相互關(guān)系,對(duì)兩者進(jìn)行了有效融合。

        2 微博傳播樹的構(gòu)建

        2.1 微博傳播樹拓?fù)浣Y(jié)構(gòu)

        2.2 微博傳播樹節(jié)點(diǎn)

        2.2.1 內(nèi)容特征

        2.2.2 時(shí)間特征

        在微博傳播過程中,源微博與其轉(zhuǎn)發(fā)微博、評(píng)論內(nèi)容均伴隨各自的發(fā)布時(shí)間,用戶對(duì)源微博的轉(zhuǎn)發(fā)或評(píng)論越及時(shí),越能說明用戶對(duì)源微博內(nèi)容的關(guān)注程度高,或與源微博發(fā)布用戶的關(guān)系更為緊密,考慮時(shí)間特征可對(duì)相關(guān)用戶進(jìn)行一定程度的區(qū)分。

        2.2.3 用戶特征

        2.2.4 重要關(guān)注用戶標(biāo)簽挖掘

        在用戶關(guān)注列表中,對(duì)用戶影響較強(qiáng)的關(guān)注用戶更能代表用戶興趣[24],可提取重要關(guān)注用戶的標(biāo)簽對(duì)目標(biāo)用戶興趣特征進(jìn)行補(bǔ)充。人們傾向于和自己相似的人形成關(guān)系,相似性與關(guān)系強(qiáng)度正相關(guān)[25],與目標(biāo)用戶關(guān)系越緊密的關(guān)注用戶,對(duì)目標(biāo)用戶造成的影響也越大?;诖耍疚耐ㄟ^用戶間關(guān)系強(qiáng)度挖掘目標(biāo)用戶關(guān)注列表中的重要用戶。用戶關(guān)系強(qiáng)度從目標(biāo)用戶對(duì)其關(guān)注用戶的交互強(qiáng)度和目標(biāo)用戶與其關(guān)注用戶的關(guān)注相似度兩方面得到。

        2.2.5 用戶興趣特征表示

        2.2.6 興趣特征詞擴(kuò)充

        對(duì)于自身添加標(biāo)簽的微博用戶,其標(biāo)簽數(shù)量一般為5、6個(gè)[27]。在微博平臺(tái)中,用戶自定義標(biāo)簽數(shù)量限制在10個(gè)以內(nèi),為獲取充足的興趣詞來表征用戶興趣,將擴(kuò)充后的興趣特征詞總數(shù)設(shè)為10,并依據(jù)權(quán)重大小進(jìn)行排序。部分用戶的興趣詞擴(kuò)充前后對(duì)比如表1所示。

        3 基于傳播樹的微博推薦模型

        3.1 傳播樹結(jié)構(gòu)相似度

        3.1.1 傳播路徑相似度

        3.1.2 傳播層相似度

        3.1.3 結(jié)構(gòu)相似度計(jì)算

        3.2 推薦得分計(jì)算

        在本文模型中,微博傳播樹的相似度計(jì)算是實(shí)現(xiàn)推薦的關(guān)鍵步驟,依據(jù)結(jié)構(gòu)相似度可以獲得每一篇待評(píng)估微博關(guān)于目標(biāo)用戶的推薦得分。在傳播樹的每條傳播路徑上,相應(yīng)用戶的發(fā)布內(nèi)容存在明顯的上下文關(guān)聯(lián)關(guān)系,例如“詹姆斯成為NBA歷史得分王”“恭喜!”“詹姆斯還是強(qiáng)”這條傳播路徑,包含了三位微博用戶的文本內(nèi)容,可以看出這些用戶的發(fā)布內(nèi)容在語義上聯(lián)系緊密。依次訪問傳播樹中從根節(jié)點(diǎn)到每個(gè)葉子節(jié)點(diǎn)的路徑上出現(xiàn)的節(jié)點(diǎn),可計(jì)算不同傳播樹間的傳播路徑相似度,體現(xiàn)了傳播樹深度上的相似性;在傳播樹的不同傳播層上,每層用戶對(duì)相鄰上層用戶的發(fā)布內(nèi)容進(jìn)行了直接反饋,其內(nèi)容主題較為接近,形成了水平方向的層次關(guān)系。例如在關(guān)于NBA球星利拉德獲得三分大賽冠軍的微博中,“三分賽一年比一年差”“懷念當(dāng)年水花一起的比賽”“NBA知道他的三分賽有多水”三條內(nèi)容均為源微博下的第一跳評(píng)論,內(nèi)容語義較為接近,且相關(guān)用戶均具有NBA鐵粉徽章,與源微博博主關(guān)系緊密,數(shù)據(jù)價(jià)值較高。依次訪問傳播樹中每一層上的各個(gè)節(jié)點(diǎn),可計(jì)算不同傳播樹間的傳播層相似度,體現(xiàn)了傳播樹廣度相似性。通過分析傳播樹間的深度相似性和廣度相似性,對(duì)傳播樹結(jié)構(gòu)相似度進(jìn)行有效計(jì)算,進(jìn)而獲取更為準(zhǔn)確的微博推薦得分,依據(jù)推薦得分進(jìn)行微博推薦。

        4 實(shí)驗(yàn)分析

        4.1 實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)所需數(shù)據(jù)通過Python爬蟲程序從新浪微博上爬取獲得,首先從美食、影視、游戲、科技和體育五個(gè)領(lǐng)域中篩選目標(biāo)用戶,獲取目標(biāo)用戶基本信息及其2021年6~9月的微博內(nèi)容;其次爬取與上述微博相關(guān)的評(píng)論、轉(zhuǎn)發(fā)內(nèi)容以及轉(zhuǎn)發(fā)、評(píng)論用戶的基本信息;最后爬取所有用戶的交互數(shù)據(jù)與關(guān)注數(shù)據(jù)。去重之后該數(shù)據(jù)集共包含9 406條用戶基本信息,184 067條微博數(shù)據(jù),145 733條點(diǎn)贊記錄,181 609條用戶關(guān)注信息等。將目標(biāo)用戶6~8月的微博內(nèi)容作為目標(biāo)用戶微博集,9月的微博內(nèi)容作為待評(píng)估微博集。

        4.2 評(píng)價(jià)指標(biāo)

        4.3 實(shí)驗(yàn)參數(shù)和閾值設(shè)定

        4.3.1 交互行為權(quán)重參數(shù)的確定

        利用層次分析法(analytic hierarchy process,AHP)中一致性檢驗(yàn)和成對(duì)比較矩陣方法[29]來確定轉(zhuǎn)發(fā)、評(píng)論和點(diǎn)贊三種交互行為的權(quán)重。對(duì)三種交互行為兩兩之間進(jìn)行比較,構(gòu)建交互行為判定矩陣,如表2所示。

        4.3.2 權(quán)重參數(shù)α的確定

        從圖4可知,α取值為0時(shí),即計(jì)算傳播樹節(jié)點(diǎn)相似度時(shí)僅考慮內(nèi)容特征,所得推薦效果最差;當(dāng)α取值為1時(shí),模型準(zhǔn)確率得到較大提升。說明相較于僅考慮內(nèi)容特征,用戶特征對(duì)推薦結(jié)果產(chǎn)生的影響更大。當(dāng)α取值為0.6時(shí),表示計(jì)算節(jié)點(diǎn)相似度時(shí)既考慮了內(nèi)容特征又考慮了用戶特征,模型的推薦效果達(dá)到最優(yōu),故將參數(shù)α的值設(shè)定為0.6。

        4.3.3 近義詞閾值θ的確定

        本文利用word2vec相關(guān)的API來計(jì)算興趣特征詞間的語義相似度,其中CBOW和skip-gram均為word2vec模型中對(duì)文本進(jìn)行向量表示的方法,鑒于skip-gram獲取到的詞向量更細(xì)致,適用于數(shù)據(jù)量較少的語料庫(kù),因此優(yōu)先學(xué)習(xí)skip-gram語言模型。通過對(duì)微博語料進(jìn)行整理訓(xùn)練,將詞映射到對(duì)應(yīng)的特征向量中,詞向量維數(shù)保持默認(rèn)值100,發(fā)現(xiàn)閾值θ在0.7及以上能較好地區(qū)分出是否為近義詞。表3展示了幾組興趣特征詞的相似度結(jié)果。

        從表3可知,相似度超過0.7的興趣詞組合同屬一個(gè)領(lǐng)域且聯(lián)系緊密。在相似度低于0.7的興趣詞組合中,美劇和電影都屬于影視作品,但在制作方式等方面相差較大,不能算做同類興趣詞;在華為和小米這組興趣詞組合中,基于語料的上下文語義識(shí)別出這組詞的關(guān)聯(lián)度較高,但仍存在一定差異,相似度結(jié)果略低于0.7;而攝影師、運(yùn)動(dòng)員與電影、游戲均屬于不同領(lǐng)域,詞義相差較大,不屬于同類興趣詞。實(shí)驗(yàn)結(jié)果表明,閾值θ設(shè)定為0.7及以上具有一定的合理性。

        4.4 對(duì)比實(shí)驗(yàn)

        為驗(yàn)證本文模型的有效性,選取其他四種推薦模型作為對(duì)比實(shí)驗(yàn),如表4所示。

        在表4中,CABMRM模型[13]從用戶背景和微博內(nèi)容兩方面綜合考慮用戶興趣偏好,依據(jù)待評(píng)估微博內(nèi)容與用戶興趣的相關(guān)性實(shí)現(xiàn)微博推薦。USMRM模型[15]采用標(biāo)簽擴(kuò)充方法對(duì)用戶進(jìn)行加標(biāo),綜合考慮標(biāo)簽間關(guān)聯(lián)關(guān)系和用戶社交關(guān)系。TRAUPM模型[30]綜合考慮微博主題和用戶信息(背景信息、偏好信息等)兩方面內(nèi)容,結(jié)合用戶主題影響力及用戶偏好實(shí)現(xiàn)微博推薦。為驗(yàn)證本文對(duì)微博傳播特征應(yīng)用的有效性,提出PFMRM模型,該模型依據(jù)微博轉(zhuǎn)發(fā)、評(píng)論過程中傳播節(jié)點(diǎn)間的相似度實(shí)現(xiàn)微博推薦,通過傳播節(jié)點(diǎn)來表示微博的傳播特征,但未考慮微博的傳播結(jié)構(gòu),節(jié)點(diǎn)間并不存在通路聯(lián)系,屬于本文模型的變式。PTMRM是本文提出的推薦模型,依據(jù)傳播樹結(jié)構(gòu)相似度實(shí)現(xiàn)微博推薦,實(shí)驗(yàn)結(jié)果如表5~7所示。

        從表5~7可以看出,與未考慮傳播特征的CABMRM、USMRM和TRAUPM相比,本文模型均取得了更好的實(shí)驗(yàn)效果。主要原因?yàn)椋篊ABMRM利用微博內(nèi)容對(duì)用戶標(biāo)簽進(jìn)行擴(kuò)充,并考慮了標(biāo)簽間的語義相似度,但當(dāng)微博內(nèi)容較為稀疏時(shí),會(huì)導(dǎo)致興趣特征挖掘不充分,從而影響推薦準(zhǔn)確率。USMRM在分析用戶自身數(shù)據(jù)的同時(shí),結(jié)合用戶社交關(guān)系來補(bǔ)充用戶興趣特征,從而更詳細(xì)地描述用戶興趣,該模型的實(shí)驗(yàn)性能總體也略好于CABMRM。TRAUPM利用主題模型計(jì)算微博社交網(wǎng)絡(luò)中用戶間的相似性,通過主題相關(guān)性得到更為準(zhǔn)確的用戶偏好表示,同時(shí)依據(jù)用戶社交關(guān)系和微博信息得到用戶主題影響力,結(jié)合主題影響力與用戶偏好進(jìn)行推薦,其推薦效果略好于USMRM,但對(duì)微博自身特征的挖掘不夠充分。本文模型通過引入傳播特征,極大緩解了數(shù)據(jù)稀少對(duì)推薦結(jié)果產(chǎn)生的不利影響,使推薦效果得到改善。

        本文模型的性能也優(yōu)于同樣考慮微博傳播特征的PFMRM。主要原因?yàn)椋篜FMRM忽略了微博傳播形成的內(nèi)部結(jié)構(gòu)和該結(jié)構(gòu)中節(jié)點(diǎn)間的差異,不同微博所屬的傳播節(jié)點(diǎn)兩兩之間進(jìn)行相似度計(jì)算,導(dǎo)致每個(gè)傳播節(jié)點(diǎn)都是等權(quán)重地參與相似度計(jì)算中。然而在微博的轉(zhuǎn)發(fā)和評(píng)論過程中存在一些干擾數(shù)據(jù),雖然其與源微博對(duì)應(yīng)同一主題,但在內(nèi)容上與源微博相差較大,若不分析微博的上下文關(guān)系和層次關(guān)系,很難將這些節(jié)點(diǎn)的內(nèi)容關(guān)聯(lián)到一起,對(duì)推薦結(jié)果造成誤差。并且,來自相同發(fā)布渠道的微博,在微博傳播過程中會(huì)存在相似的傳播通路,具有相似的結(jié)構(gòu)特征。本文提出的傳播樹相似度計(jì)算方法分別從路徑和層兩個(gè)角度進(jìn)行分析,使得最終的相似度計(jì)算中根節(jié)點(diǎn)和多分支節(jié)點(diǎn)的權(quán)重占比更高,這些節(jié)點(diǎn)與源微博的相關(guān)度更高,一定程度上削弱了無關(guān)節(jié)點(diǎn)的影響,相似度計(jì)算更為準(zhǔn)確。綜合上述因素,分析傳播樹的結(jié)構(gòu)特性有利于提升推薦效果。

        4.5 擴(kuò)充用戶興趣特征對(duì)模型的影響

        為驗(yàn)證擴(kuò)充用戶興趣詞后對(duì)模型的實(shí)驗(yàn)效果產(chǎn)生正面影響,設(shè)置沒有擴(kuò)展用戶興趣特征的對(duì)比模型(Ⅱ),實(shí)驗(yàn)結(jié)果如表8~10所示。

        從表8~10的實(shí)驗(yàn)數(shù)據(jù)可以看出,在未擴(kuò)充用戶興趣特征的情況下,相比原有模型的三項(xiàng)評(píng)價(jià)指標(biāo)均有較大下滑,尤其在準(zhǔn)確率方面性能下降得最多,證明了全面合理地考慮用戶興趣特征有助于提升微博推薦質(zhì)量。

        5 結(jié)束語

        本文從傳播特征的視角出發(fā)對(duì)微博推薦進(jìn)行研究,提出一種基于傳播樹的微博推薦模型。綜合考慮了用戶特征、內(nèi)容特征和時(shí)間特征,同時(shí)利用微博的轉(zhuǎn)發(fā)和評(píng)論關(guān)系構(gòu)建傳播樹,通過傳播路徑和傳播層得到傳播樹結(jié)構(gòu)相似度,依據(jù)結(jié)構(gòu)相似度的大小從待評(píng)估微博列表中篩選與目標(biāo)用戶微博最相近的微博進(jìn)行推薦。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有未考慮傳播特征的微博推薦模型相比,本文模型在推薦效果上有較大提升。然而本文模型也存在不足之處,不同微博的傳播過程差異較大,存在許多噪聲數(shù)據(jù),如何對(duì)微博適配最佳的傳播樹以及如何減少時(shí)間復(fù)雜度需要在后續(xù)工作中進(jìn)行有針對(duì)性的研究,以進(jìn)一步提升模型的準(zhǔn)確率。

        參考文獻(xiàn):

        [1]崔競(jìng)烽,鄭德俊,洪誠(chéng),等. 高參與度科普類微博知識(shí)內(nèi)容價(jià)值共創(chuàng)研究[J]. 圖書情報(bào)工作,2021,65(16): 14-24. (Cui Jingfeng,Zheng Dejun,Hong Cheng,et al. Research on knowledge content value co-creation in popular science microblogs with high engagement levels[J].Library and Information Service,2021,65(16):14-24.)

        [2]陳輝. 一種多維多粒度用戶興趣模型研究[J]. 小型微型計(jì)算機(jī)系統(tǒng),2017,38(12): 2785-2790. (Chen Hui. Study of user interest model at multiple dimensions and multiple granularities[J]. Journal of Chinese Computer Systems,2017,38(12): 2785-2790.)

        [3]Ma Jing,Gao Wei,Wong K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]// Proc of the 55th Annual Meeting of the Association for Computational Linguistics. Stroudsburg,PA: Association for Computational Linguistics,2017: 708-717.

        [4]Wu Ke,Yang Song,Zhu K Q. False rumors detection on Sina Weibo by propagation structures[C]// Proc of the 31st International Conference on Data Engineering. Piscataway,NJ: IEEE Press,2015: 651-662.

        [5]徐建民,孫朋,吳樹芳. 傳播路徑樹核學(xué)習(xí)的微博謠言檢測(cè)方法[J]. 計(jì)算機(jī)科學(xué),2022,49(6): 342-349. (Xu Jianmin,Sun Peng,Wu Shufang. Microblog rumor detection method based on propagation path kernel learning[J]. Computer Science,2022,49(6):342-349.)

        [6]郁友琴,李弼程. 基于多粒度文本特征表示的微博用戶興趣識(shí)別[J]. 計(jì)算機(jī)科學(xué),2021,48(12): 219-225. (Yu Youqin,Li Bicheng. Microblog user interest recognition based on multi-granularity text feature representation[J]. Computer Science,2021,48(12): 219-225.)

        [7]劉海鷗,孫晶晶,張亞明,等. 在線社交活動(dòng)中的用戶畫像及其信息傳播行為研究[J]. 情報(bào)科學(xué),2018,36(12): 17-21. (Liu Hai’ou,Sun Jingjing,Zhang Yaming,et al. Research on user portrayal and information dissemination behavior in online social activities[J]. Information Science,2018,36(12): 17-21.)

        [8]邢千里,劉列,劉奕群,等. 微博中用戶標(biāo)簽的研究[J]. 軟件學(xué)報(bào),2015,26(7): 1626-1637. (Xing Qianli,Liu Lie,Liu Yiqun,et al. Study on user tags in Weibo[J]. Journal of Software,2015,26(7): 1626-1637.)

        [9]Li Chaoyi,Zhang Yangsen. A personalized recommendation algorithm based on large-scale real micro-blog data[J]. Neural Computing and Applications,2020,32: 11245-11252.

        [10]王嶸冰,安維凱,馮勇,等. 基于標(biāo)簽和PageRank的重要微博用戶推薦算法[J]. 計(jì)算機(jī)科學(xué),2018,45(2): 276-279. (Wang Rongbing,An Weikai,F(xiàn)eng Yong,et al. Important micro-blog user recommendation algorithm based on label and PageRank[J]. Computer Science,2018,45(2): 276-279.)

        [11]王艷茹,馬慧芳,劉海姣,等. 基于多標(biāo)簽語義關(guān)聯(lián)關(guān)系的微博用戶興趣建模方法[J]. 計(jì)算機(jī)工程與科學(xué),2018,40(11): 2067-2073. (Wang Yanru,Ma Huifang,Liu Haijiao,et al. A microblog user interest modeling method based on multi-tag semantic correlation[J]. Computer Engineering amp; Science,2018,40(11): 2067-2073.)

        [12]劉宇東,孫豪,蔣運(yùn)承. 融合內(nèi)容相似度與多特征計(jì)算的個(gè)性化微博推薦模型[J]. 計(jì)算機(jī)科學(xué),2020,47(10): 97-101. (Liu Yudong,Sun Hao,Jiang Yuncheng. Personalized microblog recommendation model integrating content similarity and multi-feature computing[J]. Computer Science,2020,47(10): 97-101.)

        [13]王戰(zhàn)平,夏榕. 基于社會(huì)化標(biāo)簽挖掘的微博內(nèi)容推薦方法研究[J]. 情報(bào)科學(xué),2021,39(5): 91-96. (Wang Zhanping,Xia Rong. Micro-blog content recommendation method based on social tag mining[J]. Information Science,2021,39(5): 91-96.)

        [14]李吉,黃微,郭蘇琳. 一種基于相似度和信任度融合的微博內(nèi)容推薦方法[J]. 圖書情報(bào)工作,2018,62(11): 112-119. (Li Ji,Huang Wei,Guo Sulin. A method of micro-blog content recommendation based on the fusion of similarity and trust degree[J]. Library and Information Service,2018,62(11): 112-119.)

        [15]Ma Huifang,Jia Meihuizi,Zhang Di,et al. Combining tag correlation and user social relation for microblog recommendation[J]. Information Sciences,2017,385: 325-337.

        [16]Gao Jiameng,Zhang Chunxia,Xu Yanyan,et al. Hybrid microblog recommendation with heterogeneous features using deep neural network[J]. Expert Systems with Applications,2021,167: 114191.

        [17]單曉紅,崔鳳艷,劉曉燕. 融合話題多維特征和用戶興趣偏好的微博話題推薦研究[J]. 現(xiàn)代情報(bào),2022,42(5): 69-76,97. (Shan Xiaohong,Cui Fengyan,Liu Xiaoyan. Research on microblog topic recommendation integrating topic multidimensional features and user interest preferences[J]. Journal of Modern Information,2022,42(5): 69-76,97.)

        [18]仲兆滿,管燕,胡云,等. 基于背景和內(nèi)容的微博用戶興趣挖掘[J]. 軟件學(xué)報(bào),2017,28(2): 278-291. (Zhong Zhaoman,Guan Yan,Hu Yun,et al. Mining user interests on microblog based on profile and content[J]. Journal of Software,2017,28(2): 278-291.)

        [19]Tang Huanling,Zhu Hui,Wei Hongmin,et al. Representation of semantic word embeddings based on SLDA and word2vec model[J]. Chinese Journal of Electronics,2022,32(3): 647-654.

        [20]Duan Xulei,Zhang Yangsen,Sun Yizhuo. Research on sentence vector representation and similarity calculation method about microblog texts[J]. Computer Engineering,2017,43(5): 143-148.

        [21]鄧樂樂,黃俊,岳春擂. 融合項(xiàng)目流行度與用戶間多相似度的協(xié)同過濾算法[J]. 小型微型計(jì)算機(jī)系統(tǒng),2022,43(8): 1631-1637. (Deng Lele,Huang Jun,Yue Chunlei. Collaborative filtering algorithm integrating item popularity and multi-similarity among users[J].Journal of Chinese Computer Systems,2022,43(8):1631-1637.)

        [22]趙榮霞. 基于用戶畫像的WordPress博文推薦研究[D]. 北京: 北京交通大學(xué),2018.(Zhao Rongxia. Research on WordPress blog recommendation based on user profile[D]. Beijing: Beijing Jiaotong University,2018.)

        [23]Ma Yunfei,Zeng Yi,Ren Xu,et al. User interests modeling based on multi-source personal information fusion and semantic reasoning[C]// Proc of the 7th International Conference on Active Media Technology. Berlin: Springer-Verlag,2011: 195-205.

        [24]Deng Lu,Jia Yan,Zhou Bin,et al. User interest mining via tags and bidirectional interactions on Sina Weibo[J]. World Wide Web,2018,21(2): 515-536.

        [25]McPherson M,Smith-Lovin L,Cook J M.Birds of a feather:homophily in social networks[J]. Annual Review of Sociology,2001,27(1): 415-444.

        [26]徐建民,韓康康,何丹丹,等. 融合多種轉(zhuǎn)發(fā)習(xí)慣的微博轉(zhuǎn)發(fā)預(yù)測(cè)[J]. 情報(bào)雜志,2020,39(3): 123-129,155. (Xu Jianmin,Han Kangkang,He Dandan,et al. Microblog retweet prediction based on multiple retweet habits[J]. Journal of Intelligence,2020,39(3): 123-129,155.)

        [27]蔣武軒,易明,汪玲. 融合用戶興趣漂移特征的個(gè)性化推薦研究[J]. 情報(bào)理論與實(shí)踐,2022,45(1): 38-45,37. (Jiang Wuxuan,Yi Ming,Wang Ling. Research on personalized recommendation combining user interest drift[J]. Information Studies: Theory amp; Application,2022,45(1): 38-45,37.)

        [28]馬慧芳,張迪,趙衛(wèi)中,等. 基于超圖隨機(jī)游走標(biāo)簽擴(kuò)充的微博推薦方法[J]. 軟件學(xué)報(bào),2019,30(11): 3397-3412. (Ma Huifang,Zhang Di,Zhao Weizhong,et al. Microblog recommendation method based on hypergraph random walk tag extension[J]. Journal of Software,2019,30(11): 3397-3412.)

        [29]Ratiranjian J,Biswajeet P,Ghassan B,et al. Integrated model for earthquake risk assessment using neural network and analytic hierarchy process: Aceh province,Indonesia[J]. Geoscience Frontiers,2020,11(2): 613-634.

        [30]Bao Fuguang,Xu Wenqian,F(xiàn)eng Yao,et al. A topic-rank recommendation model based on microblog topic relevance amp; user preference analysis[J]. Human-Centric Computing and Information Sciences,2022,12(10): article No.10.

        国内揄拍国内精品少妇| 日本看片一区二区三区| 蜜桃成熟时日本一区二区| 极品人妻被黑人中出种子| 四虎国产精品免费久久| 国产免费一级高清淫日本片| 国产精品久久中文字幕亚洲| 亚洲精品av一区二区| 一本无码av中文出轨人妻| 欧美精品中文| 成人免费毛片在线播放| 精品国产迪丽热巴在线| 青青草免费在线视频久草| 夜夜爽日日澡人人添| 中文字幕无线码中文字幕| 91免费国产高清在线| 日本成人精品在线播放| 99国产精品自在自在久久| 波多野结衣一区| 亚洲黄色一插一抽动态图在线看| 国产高清一区二区三区四区色| 久久久久久国产精品mv| 日韩欧美国产丝袜视频| 亚洲AV无码日韩一区二区乱| 国产不卡视频在线观看| 少妇被粗大的猛烈进出69影院一| 色综合自拍| 中文字幕人妻一区色偷久久| 国内自拍情侣露脸高清在线| 人人妻人人澡人人爽久久av | 亚洲av日韩专区在线观看| 久久婷婷人人澡人人爽人人爱| 日本午夜精品理论片A级APP发布| 国内偷拍视频一区二区| 日韩精品 在线 国产 丝袜| 欧美日韩一区二区三区自拍| 久久er这里都是精品23| 极品尤物在线精品一区二区三区| 久久国产精品99精品国产| 精品久久久久久无码不卡| 日韩亚洲一区二区三区在线|